KR20220168554A

KR20220168554A - enCpf1 및 키메릭 DNA-RNA 가이드를 포함하는 유전체 교정 또는 발현 억제용 조성물

Info

Publication number: KR20220168554A
Application number: KR1020220064949A
Authority: KR
Inventors: 이승환; 김한섭; 이위재; 김선욱; 박영호
Original assignee: 한국생명공학연구원
Priority date: 2021-06-16
Filing date: 2022-05-26
Publication date: 2022-12-23

Abstract

본 발명은 enCpf1 및 키메릭 DNA-RNA 가이드를 포함하는 유전체 교정 또는 발현 억제용 조성물에 관한 것으로, 기존의 RNA 가이드 대비 인델 효율은 유사하면서도, RNA 가이드 대비 표적 특이성이 우수하므로, 안정성 및 높은 치료 효과를 요구하는 유전자 치료 등에 효과적으로 적용될 수 있다.

Description

enCpf1 및 키메릭 DNA-RNA 가이드를 포함하는 유전체 교정 또는 발현 억제용 조성물 {Composition for Genome Editing or Inhibiting Gene Expression comprising Cpf1 and Chimeric DNA-RNA Guide}

본 발명은 enCpf1 및 키메릭 DNA-RNA 가이드를 포함하는 유전체 교정 또는 발현 억제용 조성물에 관한 것이다.

CRISPR-Cas12a(이하, Cpf1)는 class II, type V에 속하는 CRISPR 시스템으로, Cas9 유전자 가위와 마찬가지로 뉴클레아제 도메인과 인식(recognition) 도메인의 bi-lobed 형식의 구조로 이루어져 있으며, 단일 가닥의 crRNA를 이용하여 표적 DNA 이중 나선에 DNA-RNA 하이브리드 듀플렉스(hybrid duplex)를 이루어 바인딩 하는 것으로 알려져 있다. 이러한 Cpf1은 Cas9의 발견 이후 PAM의 제한적인 부분을 보완할 우수한 유전자 가위로 주목받아 왔다. 또한, Cpf1 유전자 가위는 세포 내 유전자 좌의 구아닌(guanine, G)이 많은 영역 이외에 타이민(thymine, T)이 많은 부분을 PAM(TTTN 또는 TTN)으로 인식하여 특이적으로 DNA 이중나선 절단을 유도할 수 있기 때문에, 표적 특이적 유전자 가위로서도 널리 사용되고 있다.

현재까지 Cpf1은 구조적으로 24개 염기의 프로토스페이서(protospacer)를 인식하며, 이중 내부의 seed region이 대략 PAM 염기서열로부터 5 내지 10개 정도인 것으로 알려져 있다. 표적 DNA를 인식하는 과정에서 CRISPR-Cas9보다 미스매치(mismatch)에 민감하여 프로토스페이서 영역의 seed 부분에 미스매치 도입 시, 그 활성이 현저히 저하되는 효과를 보임으로써 표적 특이성이 우수한 유전자 가위로 알려져 왔다. 다만, seed 부분 이외에 생기는 미스매치에 대한 절단 가능성이 여전히 존재하기 때문에, 추후 활성이 더 증가된 Cpf1의 타겟 염기서열을 포함한 DNA 절단 과정에서, 이와 같은 오프-타겟(off-target) 절단(cleavage) 비검측 이슈가 더욱 부각될 수 있다.

한편, CRISPR Nickase는 비표적(타겟을 벗어나는) 유전자에 작용하는 가능성을 줄일 수 있는 매우 유연하고 효율적인 역할을 할 수 있어, 표적 유전자 특이성과 실험의 안전성과 유전자 교정 효율을 높인다고 알려져 있어 위와 관련된 대다수의 관련 시스템에서 보충적으로 이용되고 있다. 그러나, 부차적으로 사용되는 CRISPR nickase는 표적 특이적 교정에 필요한 원래 Cpf1 모듈 이외에 추가로 세포나 조직으로 전달해야 하는 단점이 존재하기 때문에 CRISPR nickase의 도움 없이도 효율적이고 정확한 유전자 교정이 가능한 Cpf1 모듈이 필요한 상황이다.

이에, 본 발명자들은 키메릭 DNA-RNA 가이드를 이용하고 엔지니어링되어 표적 DNA 인식이 향상된 CRISPR-Cas12a(enCpf1)을 이용하여 표적 특이성이 우수하면서도 인델 효율이 개선된 (특히, Nickase의 도움 없이도 인체 유래 세포주내 유전자 교정 효율이 유지됨과 동시에 비표적 특이성이 줄어듦) CRISPR-enCpf1 유전자 가위를 완성하였다.

본 발명의 하나의 목적은 enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 유전체 교정용 조성물을 제공하는 것이다.

본 발명의 다른 목적은 상기 유전체 교정용 조성물을 분리된 세포 또는 유기체에 도입하는 단계를 포함하는 형질 전환체의 제조 방법을 제공하는 것이다.

본 발명의 또 다른 목적은 상기 유전체 교정용 조성물을 표적 서열을 갖고 유전자 산물을 암호화하는 DNA 분자를 함유하고 발현하는 세포에 도입함을 포함하여, 유전자 산물의 발현을 변경시키는 방법을 제공하는 것이다.

본 발명의 또 다른 목적은 enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오타이드; 역전사 효소 단백질 또는 이를 암호화하는 폴리뉴클레오타이드; 및 상기 enCpf1 단백질과 복합체를 형성하는 프라임 에디팅(prime editing) 키메릭 DNA-RNA 가이드를 포함하는 유전체 교정용 조성물로서, 상기 prime editing 키메릭 DNA-RNA 가이드는 (i) primer binding site, (ii) edit template 및 (iii) homology arm 서열을 포함하는 것인, 유전자 교정용 조성물을 제공하는 것이다.

본 발명의 또 다른 목적은 enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오타이드; 디아미나제 단백질 또는 이를 암호화하는 폴리뉴클레오타이드; 및 베이스 에디팅(base editing) 키메릭 DNA-RNA 가이드를 포함하는 유전자 교정용 조성물을 제공하는 것이다.

본 발명의 또 다른 목적은 비활성 enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭 DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 유전자 발현 억제용 조성물을 제공하는 것이다.

본 발명의 또 다른 목적은 상기 유전체 교정용 조성물을 표적 서열을 갖고 유전자 산물을 암호화하는 DNA 분자를 함유하고 발현하는 세포에 도입함을 포함하여 유전자 산물의 발현을 변경시킴(여기서, DNA 분자는 돌연변이 서열을 포함한다)으로써, 대상체에서 돌연변이 또는 단일-뉴클레오티드 다형태(SNP)와 관련된 질환을 예방, 개선 또는 치료하는 방법을 제공하는 것이다.

본 발명의 또 다른 목적은 enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 약학적 조성물을 제공하는 것이다.

본 발명의 또 다른 목적은 enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 약학적 조성물을 이용한 의약 용도를 제공하는 것이다.

본 발명의 또 다른 목적은 enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 유전자 진단용 조성물을 이용한 진단 용도를 제공하는 것이다.

본 발명은 또한 상기 언급된 발명들에 대한 의약, 진단 용도 등을 제공하는 것이다.

본 발명의 일 양상은 enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 유전체 교정용 조성물을 제공한다.

본 발명에 따르면, CRISPR-Cas12a(Cpf1) 유전자 가위를 엔지니어링을 통해 표적 인식 효율성이 향상된 enCpf1를 키메릭 DNA-RNA 가이드와 함께 사용하여 표적 특이성의 향상된 장점을 더욱 증진시켜 유전체 교정에 우수한 효과를 나타낸다. 즉, 인델 효율이 개선되며 특히 Nickase의 도움 없이도 인체 유래 세포주 내 유전자 교정 효율이 유지됨과 동시에 비표적 특이성이 줄어든 장점을 가진 측면에서 우수한 효과가 인정될 수 있다.

Cpf1은 Cas9과 대비하여 아래와 같은 장점을 지닐 수 있다:

야생형 Streptococcus pyogenes Cas9에 비하여 인간 세포에 대해 상대적으로 더 큰 Genome-wide 특이성,

T-rich protospacer-adjacent motif (PAM) 서열에 대한 인식,

다중 부위의 동시 표적을 단순화하는 pre-crRNA 처리를 위한 endoribonuclease 활성,

5'-DNA overhang을 생성하는 DNA endonuclease 활성,

PAM으로부터 먼 말단에서 protospacer DNA의 절단,

이러한 장점에 더하여 enCpf1은 표적 범위를 확장할 뿐만 아니라 on-target 활성을 증진시킬 수 있다. 특히, 키메릭 DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드와의 사용은 on-target에 대한 특이도를 크게 증진시킴으로써 우수한 교정 효율을 나타낼 수 있다. 또한, multiplex nuclease targeting, epigenome editing, C-to-T, A-to-G base-editing, prime editing 및 Cpf1-mediated DNA detection 등에서도 키메릭 DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드와의 사용은 보다 더 우수한 효능을 나타낼 수 있다.

즉, Cpf1 단백질은 하나의 crRNA로 작동하기 때문에 Cas9의 경우와 같이 crRNA와 trans-activating crRNA (tracrRNA)를 동시에 사용하거나 인위적으로 tracrRNA와 crRNA를 합친 single guide RNA (sgRNA)를 제작할 필요가 없다. 또한 Cpf1 시스템은 Cas9과 다르게 PAM이 표적 서열의 5' 위치에 존재하고, 표적을 결정하는 guide RNA의 길이도 Cas9에 비해 짧다. 이러한 특징을 활용하면, Cpf1은 Cas9이 사용될 수 없는 표적 염기서열에도 유전체 교정이 가능하고, 가이드 RNA인 crRNA를 제작하는 것도 Cas9과 비교하여 상대적으로 쉽다는 이점을 갖는다. 또한, Cpf1은 표적 DNA가 절단된 위치에 blunt-end가 아닌 5' overhang (sticky end)이 발생시키므로, 보다 정확하고 다양한 유전자 교정이 가능하다는 이점을 갖는다. 본 명세서에서는 enCpf1 시스템을 이용한 보다 편리하면서 정확하고 효과적으로 표적 유전체를 교정하는 기술이 제공된다.

"en (엔지니어링된)"이란 용어는 자연계에 이미 존재하는 구성을 가진 물질, 분자 등과 구분하기 위해 사용하는 용어로, 상기 물질, 분자 등에 인위적인 변형이 가해진 것을 의미한다. 본 발명에 따른 "enCpf1"은 야생형과 대비하여 넓은 범위의 PAM을 인지하며 이로써 가이드된 뉴클레아제에 의해 표적될 수 있는 범위를 증가시킬 수 있다.

또한, TTTN PAM이 있는 대상 사이트 인식 및 교정에 우수한 효과를 나타낼 수 있다. 상기 N은 임의의 핵산이 올 수 있으나, 바람직하게는 TTTV (V=A, C 또는 G임)일 수 있다.

즉, genome editing, epigenome editing, prime editing, base editing, 및 in vitro DNA detection 측면에서 증가된 활성을 나타낼 수 있고, 키메릭 DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드와의 사용은 보다 더 우수한 효능을 나타낼 수 있다.

본 발명에 따른 "enCpf1"은 서열번호 1의 아미노산 서열로부터 T167, S170, E174, T539, S542, K548, N551, N552, M604 및 K607로 이루어진 군으로부터 선택되는 어느 하나 이상의 아미노산 치환을 포함하는 것일 수 있다.

상기 분리된 "enCpf1"은 Acidaminococcus sp. BV3L6 (AsCpf1)로부터 유래된 enAsCpf1일 수 있다. 즉, Cpf1 분자는 아시다미노콕쿠스 종(Acidaminococcus sp.) 균주 BV3L6 Cpf1 분자(AsCpf1)로부터 유래된 서열에 대한 변이 서열에 해당할 수 있다.

일부 실시양태에서, "enAsCpf1"은 Acidaminococcus sp. BV3L6 (AsCpf1)로부터 유래된 서열번호 1의 아미노산 서열로부터 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상 서열 상동성을 가지는 서열에 대하여 T167, S170, E174, T539, S542, K548, N551, N552, M604 및 K607로 이루어진 군으로부터 선택되는 어느 하나 이상의 아미노산 치환을 포함하는 것일 수 있다. 상기 상동성과 관련하여, 상기 아미노산 치환을 포함하는 "enAsCpf1"은 아생형의 활성을 가지고 있는 범주 내에서 보존적 치환을 포함하는 것일 수 있다.

일부 실시양태에서, "enAsCpf1"은 서열번호 1의 아미노산 서열로부터 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상 서열 상동성을 가지는 서열에 대하여 T167A, S170R, S170K, E174K, E174R, T539K, T539R, S542Q, S542K, S542R, K548R, K548V, N551R, N552R, M604A, K607Q, K607R, K607S, 및 K607H로 이루어진 군으로부터 선택되는 어느 하나 이상의 치환을 포함하는 것일 수 있다.

일부 실시양태에서, 서열번호 1의 아미노산 서열로부터 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상 서열 상동성을 가지는 서열에 대하여 S170R/E174R, E174R/K548R, S170R/K548R, E174R/S542R, S170R/S542R, E174R/S542R/K548R, E174R/N551R, S170R/N551R, S542R/K548R, S542R/N551R, S542R/N552R, K548R/N551R, S170R/S542R/K607R, E174R/S542R/K607R, E174R/S542R/K607H, E174R/S542R/K548R/N551R, S170R/S542R/K548V/N552R, E174R/S542R/K548V/N552R, S170R/S542R/K607R 및 E174R/S542R/K607R로 이루어진 군으로부터 선택되는 어느 하나의 치환을 포함하는 것일 수 있다.

본 발명에 따른 enCpf1 단백질은 필요에 따라 이종 기능적 도메인(heterologous functional domain)과 융합되어 제공될 수 있다. 보다 구체적으로, 융합 단백질의 활성에 영향을 미치지 않는 링커를 선택적으로 포함하여 enCpf1과 heterologous functional domain의 융합 단백질 형태로 제공될 수 있다.

이종 기능적 도메인은 전사 활성화 도메인이다. 일부 실시양태에서, 전사 활성화 도메인은 VP64 또는 NF-κB p65로부터의 것이다. 일부 실시양태에서, 이종 기능적 도메인은 전사 사일런서 또는 전사 저해 도메인이다. 일부 실시양태에서, 전사 저해 도메인은 크뤼펠-연관된 박스 (KRAB) 도메인, ERF 저해인자 도메인 (ERD), 또는 mSin3A 상호작용 도메인 (SID)이다. 일부 실시양태에서, 전사 사일런서는 이질염색질 단백질 1 (HP1), 예를 들어 HP1α 또는 HP1β이다. 일부 실시양태에서, 이종 기능적 도메인은 DNA의 메틸화 상태를 변형시키는 효소이다. 일부 실시양태에서, DNA의 메틸화 상태를 변형시키는 효소는 DNA 메틸트랜스퍼라제 (DNMT) 또는 TET 단백질이다. 일부 실시양태에서, TET 단백질은 TET1이다. 일부 실시양태에서, 이종 기능적 도메인은 히스톤 서브유닛을 변형시키는 효소이다. 일부 실시양태에서, 히스톤 서브유닛을 변형시키는 효소는 히스톤 아세틸트랜스퍼라제 (HAT), 히스톤 디아세틸라제 (HDAC), 히스톤 메틸트랜스퍼라제 (HMT), 또는 히스톤 데메틸라제이다. 일부 실시양태에서, 이종 기능적 도메인은 생물학적 테더이다. 일부 실시양태에서, 생물학적 테더는 MS2, Csy4 또는 람다 N 단백질이다. 일부 실시양태에서, 이종 기능적 도메인은 FokI이다.

일부 실시양태에서, 이종 기능성 도메인은 아데노신 DNA 염기를 변형하는 디아미나제이고, 예를 들어, 디아미나제는 아데노신 디아미나제, 또는 시토신 디아미나제이다. 보다 구체적으로, ADA1, ADA2, ADAR1, ADAR2, ADAR3, ADAT1, ADAT2, ADAT3 및 TadA로부터 선택되는 어느 하나 이상일 수 있다. 이러한 디아미나제와 융합을 통해 베이스 에디터로 기능할 수 있다.

일부 실시양태에서, 이종 기능성 도메인은 역전사 효소(reverse transcriptase)이고, 상기 역전사 효소는 Moloney Murine Leukemia Virus(M-MLV) 역전사 효소, 및/또는 그 변이체일 수 있다. 이때, 상기 역전사 효소가 융합된 경우 프라임 에디터로 기능할 수 있다.

또한, enCpf1 단백질 또는 이종 기능적 도메인(heterologous functional domain)과 융합된 융합 단백질을 암호화하는 DNA를 제공한다.

서열 일치도 또는 상동성은 종래 알려진 표준 기술을 이용하여 측정할 수 있다. 배열은 배열되는 서열에서 갭의 도입을 포함할 것이다. 또한, 여기에 개시된 단백질에 비해 더 많거나 적은 아미노산을 포함하는 서열에 대해, 상동성 비율은 전체 아미노산의 수와 비교하여 상동 아미노산의 수에 근거하여 측정될 것으로 이해된다. 결과적으로, 단백질의 변이체(해당 핵산에 의해 암호화되는 폴리펩타이드를 포함하여)는 서열번호 1의 단백질 서열과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99%의 서열 상동성을 가질 수 있다.

본 발명에서, "치환"은 야생형 핵산, DNA, RNA 또는 펩타이드와 비교하여 각각 다른 DNA, RNA 또는 펩타이드에 의해 하나 이상의 DNA, RNA 또는 펩타이드의 교체에서 비롯된다.

한편, 치환 위치에서 바람직한 아미노산 변이는 잔기의 극성, 전하, 용해성, 소수성, 친수성 및/또는 양친매성 특성의 유사성에 기반하여 수행되는 것일 수 있다. 예를 들어, 이에 한정되는 것은 아니나, 음으로 하전된(negatively charged) 아미노산으로서는 아스파르트산 및 글루타민산을 포함하며; 양으로 하전된(positively charged) 아미노산으로서는 리신 및 아르기닌을 포함하고; 그리고 유사한 친수성값을 가지는 비하전성 극성 헤드기를 가지는 아미노산으로서는 류신, 이소류신 및 발린; 글리신 및 알라닌; 아스파라긴 및 글루타민; 세린, 트레오닌, 페닐알라닌 및 티로신을 들 수 있다. 상기 변이는 보존적 치환을 포함할 수 있다. '보존적 치환'이란, 어느 아미노산이 유사한 특성을 가지는 다른 아미노산으로 치환되어 당업자라면 그 폴리펩타이드의 2차 구조 및 감수성질(hydropathic nature, 소수성 또는 친수성 성질)이 실질적으로 비변화되었다고 예측할 수 있는 치환이다. 일반적으로 하기 아미노산 군이 보존성 변화를 나타낸다: (1) ala, pro, gly, glu, asp, gln, asn, ser, thr; (2) cys, ser, tyr, thr; (3) val, ile, leu, met, ala, phe; (4) lys, arg, his; 및 (5) phe, tyr, trp, his.

상기 enCpf1 단백질 또는 이종 기능적 도메인(heterologous functional domain)과 융합된 융합 단백질은 재조합적 방법 또는 합성적 방법으로 비자연적 생산된 것(non-naturally occurring)일 수 있다.

상기 enCpf1 단백질 또는 융합 단백질은 진핵 세포의 핵 내 전달을 위하여 통상적으로 사용되는 요소 (예컨대, 핵위치신호 (nuclear localization signal; NLS) 등)를 추가로 포함하는 것일 수 있으나, 이에 제한되는 것은 아니다. 상기 enCpf1 단백질 또는 융합 단백질은 정제된 단백질 형태로 사용되거나, 이를 암호화하는 핵산(DNA/RNA), 또는 상기 DNA를 포함하는 재조합 벡터의 형태로 사용될 수 있다.

구체적으로, enCpf1 단백질 또는 융합 단백질은 진핵 세포의 핵 내 전달을 위하여 통상적으로 사용되는 요소(예를 들어, 핵위치신호(nuclear localization signal; NLS; 예를 들어, PKKKRKV (서열번호 60), KRPAATKKAGQAKKKK(서열번호 61), 또는 이를 암호화하는 핵산 분자) 등)를 N-말단 또는 C-말단(또는 이를 암호화하는 핵산 분자의 5' 말단 또는 3' 말단)에 추가로 포함하는 것일 수 있으나, 이에 한정되는 것은 아니다. 본 발명의 enCpf1 단백질 또는 융합 단백질은 정제된 단백질 형태로 사용되거나, 이를 암호화하는 핵산(DNA/RNA), 또는 상기 DNA를 포함하는 재조합 벡터의 형태로 사용될 수 있다.

enCpf1 단백질 또는 융합 단백질은 분리 및/또는 정제에 유리한 태그와 연결될 수 있다. 예를 들어, His 태그, Flag 태그, S 태그 등과 같은 작은 펩타이드 태그, 또는 GST(Glutathione S-transferase) 태그, MBP(Maltose binding protein) 태그 등이 목적에 따라 사용될 수 있으나, 이에 한정되는 것은 아니다.

본 발명에 따른 예시적인 enCpf1 단백질 서열 및 이의 DNA 서열을 하기 표 1에 나타내었다.

서열	단백질	DNA
WT	서열번호 1	서열번호 2
S170R/E174R	서열번호 3	서열번호 4
E174R/K548R	서열번호 5	서열번호 6
S170R/K548R	서열번호 7	서열번호 8
E174R/S542R	서열번호 9	서열번호 10
S170R/S542R	서열번호 11	서열번호 12
E174R/S542R/K548R	서열번호 13	서열번호 14
E174R/N551R	서열번호 15	서열번호 16
S170R/N551R	서열번호 17	서열번호 18
S542R/K548R	서열번호 19	서열번호 20

상기 서열은 enCpf1 서열에 대한 일 예시적인 서열에 불과하고, 위 기재된 서열로 본발명의 내용이 한정되는 것은 아니다.

상기 가이드 RNA와 복합체를 형성할 enCpf1 단백질은 필요 활성에 따라 상기 언급된 범위 내에서 적절히 선택될 수 있다. 바람직하게 enCpf1 단백질은 서열번호 1의 아미노산 서열로부터 E174R/S542R/K548R의 치환을 포함하는 것일 수 있다. 바람직하게 서열번호 13의 아미노산 서열을 가지며, 이를 코딩하는 서열은 서열번호 14의 DNA 서열을 가질 수 있다.

본 발명에서 사용되는 용어, "키메릭 DNA-RNA 가이드"는 표적 DNA에 특이적인 crRNA(crispr RNA)의 RNA 중 일부 RNA가 DNA로 치환된 것으로, 키메릭 DNA-RNA 가이드는 enCpf1 단백질과 복합체를 형성할 수 있고, enCpf1 단백질을 표적 DNA에 가져올 수 있다. 가이드 RNA의 DNA 치환은 가이드와 표적 DNA의 결합 에너지에 변화를 주어 오프-타겟(off-target) DNA 염기서열 절단을 줄일 수 있다. 그 외에도, 값싸게 합성할 수 있음은 물론, 실험실 자체 제작 시 필연적으로 생기는 5' 포스페이트(phosphate)의 이슈로부터 벗어날 수 있고, 면역 반응의 유도를 피할 수 있다는 점에서 고등동물 세포 내 유전체 교정을 위한 enCpf1 도입 시 보다 안전하게 사용될 수 있다. 또한, 수용액 내 화학적으로 불안정한 RNA 대비, DNA 형태의 가이드는 화학적 개질이 용이하고, 응용적인 접근이 쉽다는 장점이 있다.

이러한 키메릭 DNA-RNA 가이드에 있어서 상기 DNA는 상기 가이드의 3' 말단에서의 치환일 수 있다. 구체적으로, 상기 DNA는 3' 말단에서 약 4개 내지 16개 치환인 것이 바람직하다. 보다 구체적으로, 약 6 내지 12개의 치환인 것이 바람직하다. 보다 구체적으로, 약 6 내지 10개의 치환인 것이 바람직하다.

예를 들어, 상기 확인되는 서열에서의 3' 말단으로부터 약 4 내지 16개의 RNA가 바람직하게 DNA로 치환된 것일 수 있다. 보다 구체적으로, 약 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16개의 RNA가 DNA로 치환된 것일 수 있다. crRNA의 3' 말단부터 4 내지 16개의 RNA가 DNA로 치환된 키메릭 DNA-RNA 가이드는 높은 특이성 및 절단 활성을 나타내므로, crRNA의 치환은 crRNA의 3' 말단에서 이루어지는 것이 바람직하다.

crRNA의 3' 말단부터 4 내지 16개의 RNA가 DNA로 치환된 키메릭 DNA-RNA 가이드는 높은 특이성 및 절단 활성을 나타내므로, crRNA의 치환은 crRNA의 3' 말단에서 이루어지는 것이 바람직하다.

본 발명에서 사용되는 용어, "혼성화"는 하나 이상의 폴리뉴클레오티드가 반응하여, 복합체를 형성하고, 이 복합체는 뉴클레오티드 잔기의 염기 사이의 수소 결합을 통해 안정화되는 반응을 지칭한다.

본 명세서에서, 유전자 표적 부위와 혼성화 가능한 뉴클레오타이드 서열은 유전자 표적 부위의 뉴클레오타이드 서열 (표적 서열)과 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 95% 이상, 99% 이상, 또는 100%의 서열 상보성을 갖는 뉴클레오타이드 서열을 의미한다 (이하, 특별한 언급이 없는 한 동일한 의미로 사용되며, 상기 서열 상동성은 통상적인 서열 비교 수단 (예컨대 BLAST)를 사용하여 확인될 수 있다).

본 발명의 유전자 교정용 조성물은 enCpf1을 암호화하는 뉴클레오티드를 포함하는 재조합 벡터 및 키메릭 DNA-RNA 가이드를 암호화하는 뉴클레오티드를 포함하는 재조합 벡터, 또는 enCpf1을 암호화하는 뉴클레오티드 및 키메릭 DNA-RNA 가이드를 암호화하는 뉴클레오티드를 포함하는 재조합 벡터의 형태로 세포 또는 유기체에 도입되거나, enCpf1 단백질 및 키메릭 DNA-RNA를 포함하는 혼합물 또는 이들이 복합체를 이루는 리보핵산단백질 형태로 세포 또는 유기체에 도입될 수 있다.

본 발명의 키메릭 DNA-RNA 가이드는 표적 DNA와 혼성화될 수 있다.

본 발명의 유전자 교정용 조성물은 진핵 유기체에 적용될 수 있다. 상기 진핵 유기체는 진핵 세포(예를 들어, 효모 등의 균류, 진핵 동물 및/또는 진핵 식물 유래 세포(예를 들어, 배아세포, 줄기세포, 체세포, 생식세포 등) 등), 진핵 동물(예를 들어, 척추동물 또는 무척추동물, 보다 구체적으로, 인간, 원숭이 등의 영장류, 개, 돼지, 소, 양, 염소, 마우스, 래트 등을 포함하는 포유류 등), 및 진핵 식물(예를 들어, 녹조류 등의 조류, 옥수수, 콩, 밀, 벼 등의 단자엽 또는 쌍자엽 식물 등)로 이루어진 군에서 선택된 것일 수 있으나, 이에 한정되는 것은 아니다.

본 발명의 유전자 교정용 조성물은 enCpf1을 암호화하는 뉴클레오티드를 포함하는 재조합 벡터 및 키메릭 DNA-RNA 가이드를 암호화하는 뉴클레오티드를 포함하는 재조합 벡터, 또는 enCpf1을 암호화하는 뉴클레오티드 및 키메릭 DNA-RNA 가이드를 암호화하는 뉴클레오티드를 포함하는 재조합 벡터의 형태로 사용될 경우, 상기 재조합 벡터는 상기 뉴클레오티드에 작동 가능하게 연결된 프로모터를 포함할 수 있다.

본 발명에서 사용되는 용어, "프로모터"는 폴리머라아제와 결합되고, 다운스트림(3' 방향) 코딩 또는 비-코딩 서열의 전사를 개시할 수 있는 DNA 조절 영역이다.

본 발명에서 사용되는 용어, "작동 가능하게 연결된"은 유전자 발현 조절 서열과 다른 뉴클레오티드 서열사이의 기능적인 결합(cis)을 의미한다. 상기 유전자 발현 조절 서열은 복제원점(replication origin), 프로모터, 전사 종결 서열(terminator) 등으로 이루어진 군에서 선택된 1종 이상일 수 있다.

본 발명의 프로모터는 특정 유전자의 전사 개시를 조절하는 전사 조절 서열 중 하나로, 통상적으로 약 100bp 내지 약 2,500bp 길이의 폴리뉴클레오티드 단편일 수 있다.

상기 프로모터는 세포, 예를 들어, 진핵 세포(예를 들어, 식물 세포, 또는 동물 세포(예를 들어, 인간, 마우스 등의 포유류 세포 등) 등)에서 전사 개시를 조절할 수 있으면, 제한 없이 사용 가능하다. 예를 들어, 상기 프로모터는 CMV 프로모터(cytomegalovirus promoter;예를 들어, 인간 또는 마우스 CMV immediate-early 프로모터), U6 프로모터, EF1-alpha(elongation factor 1-a) 프로모터, EF1-alpha short(EFS) 프로모터, SV40 프로모터, 아데노바이러스 프로모터(major late promoter), pL λ 프로모터, trp 프로모터, lac 프로모터, tac 프로모터, T7 프로모터, 백시니아 바이러스 7.5K 프로모터, HSV의 tk 프로모터, SV40E1 프로모터, 호흡기 세포융합 바이러스(Respiratory syncytial virus; RSV) 프로모터, 메탈로티오닌 프로모터(metallothionin promoter), β-액틴 프로모터, 유비퀴틴 C 프로모터, 인간 IL-2(human interleukin-2) 유전자 프로모터, 인간 림포톡신(human lymphotoxin) 유전자 프로모터, 인간 GM-CSF(human granulocyte-macrophage colony stimulating factor) 유전자 프로모터 등으로 이루어진 군에서 선택된 1종 이상일 수 있으나, 이에 한정되는 것은 아니다. 일 예에서, 상기 프로모터는 CMV immediate-early 프로모터, U6 프로모터, EF1-alpha(elongation factor 1-a) 프로모터, EF1-alpha short(EFS) 프로모터 등으로 이루어진 군에서 선택된 것일 수 있다. 상기 전사 종결 서열은 폴리아데닐화 서열(pA) 등일 수 있다. 상기 복제 원점은 f1 복제원점, SV40 복제원점, pMB1 복제원점, 아데노 복제원점, AAV 복제원점, BBV 복제원점 등일 수 있다.

본 발명의 벡터는 플라스미드 벡터, 코즈미드 벡터 및 박테리오파아지 벡터, 아데노바이러스 벡터, 레트로바이러스 벡터 및 아데노-연관 바이러스 벡터와 같은 바이러스 벡터로 이루어진 군에서 선택된 것일 수 있다. 상기 재조합 벡터로 사용될 수 있는 벡터는 당업계에서 사용되는 플라스미드(예를 들면, pcDNA 시리즈, pSC101, pGV1106, pACYC177, ColE1, pKT230, pME290, pBR322, pUC8/9, pUC6, pBD9, pHC79, pIJ61, pLAFR1, pHV14, pGEX 시리즈, pET 시리즈, pUC19 등), 파지(예를 들면, λgt4λB, λ-Charon, λΔz1, M13 등) 또는 바이러스 벡터(예를 들면, 아데노-연관 바이러스(AAV) 벡터 등) 등을 기본으로 하여 제작될 수 있으나, 이에 한정되는 것은 아니다.

본 발명의 재조합 발현벡터의 제작은 당해 기술 분야에서 잘 알려진 유전자 재조합 기술을 이용하여 제조할 수 있으며, 부위-특이적 DNA 절단 및 연결은 당해 기술 분야에서 일반적으로 알려진 효소 등을 사용하여 수행될 수 있다.

본 발명의 일 구체예에 따르면, 상기 가이드는 3'-말단이 개질된 것일 수 있다. 본 발명의 키메릭 DNA-RNA 가이드는 3'-말단이 개질됨으로써, 세포 내에서 DNA 엑소뉴클레아제(exonuclease)에 의한 영향 없이 높은 표적 특이성 및 우수한 인델 효율을 나타낼 수 있다. 특히, enCfp1과 함께 사용하는 경우 비표적에 대한 인델이 크게 감소하면서도 표적에 대한 인델 효율이 크게 증가하여 NIckase의 사용 없이도 쉽게 유전자 교정을 수행할 수 있다.

구체적으로, 포스포네이트, 포스포로티오에이트 또는 포스포트리에스테르인 포스페이트로의 개질을 포함할 수 있다. 또한, LNA, HNA, CeNA, 2'-메톡시에틸, 2'-O-알킬, 2'-O-알릴, 2'-C-알릴, 2'-플루오로, 2'-데옥시, 2'-히드록실 및 그들의 조합으로 이루어진 그룹으로부터 선택되는 개질일 수 있다. 또한, 비오틴화 등을 통해 개질될 수 있다.

구체적으로, 포스포로티오에이트(phosphorothioate)로 개질(modification)된 것일 수 있다.

본 발명의 키메릭 DNA-RNA 가이드는 3'-말단이 포스포로티오에이트로 개질됨으로써, 세포내에서 3' DNA 엑소뉴클레아제(exonuclease)에 의한 영향 없이 높은 표적 특이성 및 우수한 인델 효율을 나타낼 수 있다.

본 발명의 일 구체예에 따르면, 상기 DNA는 상기 가이드의 3' 말단에 치환된 것일 수 있다.

본 발명의 일 구체예에 따르면, 상기 DNA는 4 내지 16개인 것일 수 있다.

crRNA의 5' 말단 또는 seed region의 RNA가 DNA로 치환된 키메릭 DNA-RNA 가이드의 경우, 절단 활성이 낮다. 반면, crRNA의 3' 말단부터 6 내지 10개의 RNA가 DNA로 치환된 키메릭 DNA-RNA 가이드는 높은 특이성 및 절단 활성을 나타내므로, crRNA의 치환은 crRNA의 3' 말단에서 이루어지는 것이 바람직하다.

특히, enCfp1 과 함께 사용하는 경우 비표적에 대한 인델이 크게 감소하면서도 표적에 대한 인델 효율이 크게 증가하여 NIckase의 사용 없이도 쉽게 유전자 교정을 수행할 수 있다.

본 발명에 따른 조성물은 SpCas9 닉카아제(nickase)(D10A) 또는 비활성(Dead) SpCas9(D10A, H840A) 없이도 우수한 표적 특이성 및 우수한 인델 효율을 나타낸다는 점에서 우수한 효과를 나타낸다. 즉, 부차적으로 사용되는 CRISPR nickase를 추가로 세포나 조직으로 전달해야 하는 기존 기술들의 단점을 극복하면서, 위와 같은 작용을 나타냈다는 점에서 우수한 효과가 인정될 수 있다.

다만, 선택적으로 상기 조성물은 SpCas9 닉카아제(nickase)(D10A) 또는 비활성(Dead) SpCas9(D10A, H840A)을 더 포함하거나 이와 혼용되어 사용될 수 있다. SpCas9 닉카아제(nickase)(D10A)는 D10A 돌연변이를 갖는 S. 피오게네스 Cas9 nickase를 의미한다. 비활성 SpCas9 (dead SpCas9)(D10A, H840A)는 D10A, H840A 돌연변이를 갖는 S. 피오게네스 Cas9을 의미한다.

SpCas9 닉카아제(D10A)은 세포내 존재하는 DNA 이중나선의 negative supercoil을 제거할 수 있으므로, 세포내에서 키메릭 DNA-RNA 가이드의 유전체 교정 효율을 제고할 수 있다.

본 명세서에서, 용어 '유전체 교정 (genome editing)'은, 특별한 언급이 없는 한, 표적 유전자의 표적 부위에서의 절단에 의한 핵산 분자 (하나 이상, 예컨대, 1-100,000bp, 1-10,000bp, 1-1000, 1-100bp, 1-70bp, 1-50bp, 1-30bp, 1-20bp, 또는 1-10bp)의 결실, 삽입, 치환 등에 의하여 유전자 기능을 상실, 변경, 및/또는 회복 (수정) 시키는 것을 의미하기 위하여 사용될 수 있다.

본 명세서 내 유전자 교정은 하기 내용을 포함할 수 있다.

바람직하게 유전자 교정의 결과로 표적 유전자 또는 표적 핵산에 인델이 발생할 수 있다. 이때, 상기 인델은 표적 서열 부분 및/또는 프로토스페이서 서열 부분의 내부 및/또는 외부에서 일어날 수 있다. 상기 인델은, 유전자 교정 전 핵산의 뉴클레오타이드 배열에서 일부 뉴클레오타이드가 중간에 결실되거나, 임의의 뉴클레오타이드가 삽입되거나, 및/또는 상기 삽입과 결실이 혼입된 변이를 일컫는다. 일반적으로, 표적 유전자 또는 표적 핵산 서열 내 인델이 일어나면, 해당 유전자 또는 핵산이 불활성화된다. 일 구현예로, 상기 유전자 교정 방법의 수행 결과, 표적 유전자 또는 표적 핵산 내 하나 이상의 뉴클레오타이드가 결실 및/또는 추가될 수 있다.

유전자 교정을 위해 적절 변형 범주 내에서 베이스 에디터, 및/또는 프라임 에디터 (역전사 효소(reverse transcriptase))가 포함될 수도 있다. 일 구현예로, 상기 베이스 에디터는 adenosine deaminase, 및/또는 cytosine deaminase일 수 있다. 일 구현예로, 상기 역전사 효소는 Moloney Murine Leukemia Virus(M-MLV) 역전사 효소, 및/또는 그 변이체일 수 있다.

이에 따라, 본 명세서 내 유전자 교정은 하기 내용을 포함할 수 있다.

본 명세서에서 제공하는 유전자 교정용 조성물 또는 방법의 수행 결과로, 표적 유전자 또는 표적 핵산 내 베이스 에디팅이 일어날 수 있다. 이는 표적 유전자 또는 표적 핵산 내 임의의 염기가 결실, 또는 추가되는 인델과는 달리, 핵산 내 하나 이상의 특정 염기를 의도한 대로 변경하는 것을 의미한다. 달리 표현하면, 표적 유전자 또는 표적 핵산 내 특정 위치에서, 미리 의도한 점 돌연변이(point mutation)를 일으키는 것이다. 일 구현예로, 상기 유전자 편집 방법의 수행 결과, 표적 유전자 또는 표적 핵산 내 하나 이상의 염기가 다른 염기로 치환될 수 있다.

본 명세서에서 제공하는 유전자 교정 방법의 수행 결과로, 표적 유전자 또는 표적 핵산 내 넉인이 발생할 수 있다. 상기 넉인은 표적 유전자 또는 표적 핵산 서열 내에 추가적인 핵산 서열을 삽입하는 것을 의미한다. 상기 넉인이 일어나려면, 추가적인 핵산 서열을 포함하는 도너가 더 필요할 수 있다. 세포 내에서 표적 유전자 또는 표적 핵산을 절단하는 경우, 상기 절단된 표적 유전자 또는 표적 핵산의 수복이 일어나게 된다. 이때, 상기 도너가 상기 수복 과정에 관여하여 상기 추가적인 핵산 서열이 표적 유전자 또는 표적 핵산 내에 삽입될 수 있도록 한다. 일 구현예로, 상기 유전자 교정 방법은 대상 세포 내로 도너를 전달하는 것을 추가적으로 포함할 수 있다. 이때, 상기 도너는 추가 대상 핵산을 포함하며, 상기 도너에 의해 상기 표적 유전자 또는 상기 표적 핵산 내 상기 추가 대상 핵산의 삽입이 유도된다. 이때, 상기 도너를 대상 세포 내로 전달할 때, 전술한 전달 형태 및/또는 전달 방법이 사용될 수 있다.

본 명세서에서 제공하는 유전자 교정 방법의 수행 결과로, 표적 유전자 또는 표적 핵산 서열의 전부 또는 일부를 제거할 수 있다. 상기 제거는 상기 표적 유전자 또는 상기 표적 핵산 내 일부 염기 서열을 제거하는 것을 의미한다. 일 구현예로, 상기 유전자 교정 방법은 enCpf1 단백질 또는 이를 암호화하는 핵산, 키메릭 가이드 DNA-RNA 또는 이를 암호화하는 핵산을 표적 유전자 또는 표적 핵산을 포함하는 세포내에 도입하는 것을 포함한다. 이로 인해, 상기 유전자 교정 결과 표적 유전자 또는 표적 핵산 내에 특정 서열 부분의 제거가 일어난다.

본 발명의 다른 양상은 상기 유전체 교정용 조성물을 분리된 세포 또는 유기체에 도입하는 단계를 포함하는 형질 전환체의 제조 방법을 제공한다. 여기서 상기 유기체는 인간을 제외할 수 있다.

본 발명의 유전체 교정용 조성물은 핵산 분자를 유기체, 세포, 조직 또는 기관에 도입하는 당 분야에서 공지된 방법에 의해 세포 또는 유기체에 도입될 수 있으며, 당 분야에서 공지된 바와 같이 숙주 세포에 따라 적합한 표준 기술을 선택하여 수행할 수 있다. 이런 방법에는 예를 들어, 전기천공법(electroporation), 인산칼슘(CaPO₄) 침전, 염화칼슘(CaCl₂) 침전, 미세주입법(microinjection), 폴리에틸렌글리콜(PEG)법, DEAE-덱스트란법, 양이온성 리포좀법, 및 초산 리튬-DMSO법 등이 포함될 수 있으나, 이에 한정되는 것은 아니다.

핵산 변경 이벤트를 겪은 세포(즉, "변경된" 세포)는 임의의 적합한 방법을 사용하여 단리될 수 있다. 수선 뉴클레오티드 분자는 선별 마커(selectable marker)를 암호화하는 핵산을 추가로 포함한다. 이러한 선별 마커는 당업계에 널리 공지되어 있으며 이들 마커를 암호화하는 핵산 서열은 상업적으로 이용 가능하다(예를 들면, 문헌[Sambrook et al., Molecular Cloning: A Laboratory Manual (Cold Spring Harbor Laboratory Press 1989] 참조). 형광에 의해 시각화될 수 있는 선별마커를 사용하는 방법은 형광 활성화 세포 분류(FACS) 기법을 사용하여 추가로 분류될 수 있다. 단리된 조작된 세포가 이식을 위한 세포주를 확립하는데 사용될 수 있다. 단리된 변경된 세포는 안정한 세포주를 생산하기 위해 임의의 적합한 방법을 사용하여 배양할 수 있다.

본 발명의 또 다른 목적은 상기 유전체 교정용 조성물을 표적 서열을 갖고 유전자 산물을 암호화하는 DNA 분자를 함유하고 발현하는 세포에 도입함을 포함하여 유전자 산물의 발현을 변경시킴으로써, 대상체에서 돌연변이 또는 단일-뉴클레오티드 다형태(SNP)와 관련된 질환을 예방, 개선 또는 치료하는 방법을 제공하는 것이다. 여기서 DNA 분자는 돌연변이 또는 SNP 돌연변이 서열을 포함한다.

DNA 분자는 적어도 하나, 둘, 셋, 넷 또는 그 이상의 SNP 또는 돌연변이 부위를 포함할 수 있고, 본원에 기술된 방법은 적어도 하나, 둘, 셋, 넷 또는 그 이상의 SNP 또는 돌연변이 부위와 관련된 유전자 산물의 발현을 변경시킨다. 즉, 다수의 SNP 부위 또는 선조 SNP에서 돌연변이 서열을 변경시킬 수 있다.

이러한 대상체에서 돌연변이 또는 단일-뉴클레오티드 다형태(SNP)와 관련된 질환을 예방, 개선 또는 치료를 위한 질환은 예를 들어 유전 질환, 비유전 질환, 바이러스 감염, 박테리아 감염, 암, 또는 자가 면역 질환을 포함한다.

여기서, "유전 질환"은 게놈에서 하나 이상의 이상, 특히 출생 시 존재하는 상태에 의해 부분적으로 또는 전적으로, 직접적으로 또는 간접적으로 유발되는 질환을 지칭한다. 이상은 돌연변이, 삽입 또는 결실일 수 있다. 이상은 유전자의 코딩 서열 또는 이의 조절 서열에 영향을 줄 수 있다. 유전 질환은 DMD, 혈우병, 낭포성 섬유증, 헌팅턴 무도병, 가족성 고콜레스테롤혈증 (LDL 수용체 결함), 간모세포종, 윌슨병(Wilson's disease), 선천성 간성 포르피린증, 간 대사의 유전성 장애, 레쉬 니한 증후군(Lesch Nyhan syndrome), 겸상 적혈구 빈혈, 지중해빈혈, 색소피부건조증, 판코니 빈혈(Fanconi's anemia), 망막색소변성증, 모세혈관확장성 실조증, 블룸 증후군(Bloom's syndrome), 망막모세포종 및 테이-삭스병(Tay-Sachs disease)일 수 있지만, 이에 제한되지는 않는다.

비유전 질환 타겟은 enCpf1을 이용, 변이된 유전자 이외 정상 유전자를 조절하여 질병을 치료하는 것으로, 대표적으로 노인성 황반 변성(AMD)일 수 있지만, 이에 제한되지는 않는다.

여기서, 바이러스, 박테리아 감염, 또는 이들에 의한 질환은 에이즈, 조류독감, 독감, CMV 감염질환, 결핵 또는 나병 등을 포함하며, 이에 제한되지 않는다.

여기서, 암은 방광암, 골암, 혈액암, 유방암, 흑색종양, 갑상선암, 부갑상선암, 골수암, 직장암, 인후암, 후두암, 폐암, 식도암, 췌장암, 대장암, 위암, 설암, 피부암, 뇌종양, 자궁암, 두부 또는 경부암, 담낭암, 구강암, 결장암, 항문 부근암, 중추신경계 종양, 간암 및 대장암으로 구성된 군으로부터 선택되는 어느 하나를 포함하며, 이에 제한되지 않는다.

여기서, 자가 면역 질환은 제1형 당뇨병, 류마티스 관절염, 셀리악 병(Celiac disease-sprue), IgA 결핍(IgA deficiency), 크론병(Crohn's disease), 다발성 경화증, 전신성 홍반성 낭창, 쇼그렌 증후군, 피부 경화증, 다발성 근염, 만성 활동성간염, 혼합 결체 조직 질환, 원발성 담즙성 간경변, 악성 빈혈, 자가면역 갑상선염, 특발성 에디슨 병, 백반, 글루텐 감수성 장병증, 그레이브병, 중증 근무력증, 자가면역성 호중구 감소증, 특발성 혈소판 감소 자반증, 간경변증, 심상성천포창, 자가면역 불임증, 구드패스츄어 증후군, 수포성 유천포창, 원판상 홍반 루푸스, 궤양성 대장염 또는 고밀도 침착병 등을 포함하며, 이에 제한되지 않는다.

상기 내용에 있어서, 치료는 질환 또는 병태에 대해 양성 치료 반응을 제공한다. "양성 치료 반응"이란 질환 또는 병태의 개선, 및/또는 질환 또는 병태와 관련된 증상의 개선으로 의도된다.

상기 증상의 개선은 유효량, 또는 치료학적 유효량의 유전체 교정용 조성물의 투여를 포함한다. "유효량" 또는 "치료학적 유효량"은 유리하거나 목적하는 결과를 가져오기에 충분한 제제의 양을 가리킨다. 치료학적 유효량은 다음 중의 하나 이상에 따라 달라질 수 있다: 대상체 및 치료되는 질환 상태, 대상체의 체중 및 연령, 질환 상태의 중증도, 투여 방식 등, 이것은 당업계의 통상의 숙련가에 의해 용이하게 결정될 수 있다.

발명의 약학적 조성물의 제형은 비경구용일 수 있다. 제제화할 경우에는 보통 사용하는 충진제, 증량제, 결합제, 습윤제, 붕해제, 계면활성제 등의 희석제 또는 부형제를 사용하여 조제된다. 특히, 비경구 투여를 위한 제제에는 멸균된 수용액, 비수성용제, 현탁제, 유제, 동결건조제제, 좌제가 포함된다. 비수성용제 및 현탁용제로는 프로필렌글리콜(propylene glycol), 폴리에틸렌 글리콜, 올리브 오일과 같은 식물성 기름, 에틸올레이트와 같은 주사 가능한 에스테르 등이 사용될 수 있다.

본 발명의 약학적 조성물은 비경구로 투여될 수 있으며, 종양내 투여, 정맥내, 근육내, 피내, 피하, 복강내, 소동맥내, 심실내, 병변내, 척추강내, 국소, 및 이들의 조합으로 구성된 군으로부터 선택되는 어느 하나의 경로로 투여될 수 있다.

본 발명의 약학적 조성물의 투여량은 환자의 체중, 연령, 성별, 건강상태, 식이, 투여시간, 투여방법, 배설율 및 질환의 중증도에 따라 그 범위가 다양하며, 당업자에 의해 적절하게 선택될 수 있다. 바람직한 효과를 위해서, 본 발명의 약학적 조성물을 1일 0.01 ug/kg 내지 100 mg/kg으로, 구체적으로는 1 ug/kg 내지 1 mg/kg으로 투여할 수 있다. 투여는 하루에 한번 투여할 수도 있고, 수회 나누어 투여할 수 있다. 따라서, 상기 투여량은 어떠한 면으로든 본 발명의 범위를 한정하는 것은 아니다.

여기서 상기 의약 용도는 대상체에서 돌연변이 또는 단일-뉴클레오티드 다형태(SNP)와 관련된 질환을 예방, 개선 또는 치료하기 위한 것일 수 있다. 보다 구체적으로, 유전 질환, 비유전 질환, 바이러스 감염, 박테리아 감염, 암, 또는 자가 면역 질환을 포함하는, 돌연변이 또는 단일-뉴클레오티드 다형태(SNP)와 관련된 질환에 대한 예방, 개선 또는 치료하기 위한 것일 수 있다.

본 발명의 또 다른 목적은 유전체 교정에 사용하기 위한, enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 조성물을 제공하는 것이다.

본 발명의 또 다른 목적은 유전 질환, 비유전 질환, 바이러스 감염, 박테리아 감염, 암, 또는 자가 면역 질환을 포함하는, 돌연변이 또는 단일-뉴클레오티드 다형태(SNP)와 관련된 질환의 예방 또는 치료에 사용하기 위한, enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 조성물을 제공하는 것이다.

본 발명의 또 다른 목적은 암이나 유전 질병, 바이러스에 의한 감염을 특정 DNA 혹은 RNA 상의 돌연변이를 표적하여 검출하는데 사용되는 것이다. 정상 유전자와 변이 유전자를 정확하게 구분하는 데 있어서 enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 유전자 진단용 조성물을 제공하는 것이다.

본 발명에 따른 유전자 진단용 조성물은 우수한 표적 특이성 및 신속성을 통하여 빠르고 정확하게 표적 유전자를 검출할 수 있다.

본 발명의 또 다른 목적은 enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및

표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 조성물의 유전체 교정 용도를 제공하는 것이다.

본 발명의 또 다른 목적은 돌연변이 또는 단일-뉴클레오티드 다형태(SNP)와 관련된 질환의 예방 또는 치료에 사용하기 위한 약제의 제조에 있어서,

enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 조성물의 용도를 제공하는 것이다.

본 발명의 또 다른 목적은 enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오타이드; 역전사 효소 단백질 또는 이를 암호화하는 폴리뉴클레오타이드; 및 상기 enCpf1 단백질과 복합체를 형성하는 프라임 에디팅(prime editing) 키메릭 DNA-RNA 가이드를 포함하는 유전체 교정용 조성물로서, 상기 프라임 에디팅 키메릭 DNA-RNA 가이드는 (i) a primer binding site, (ii) edit template 및 (iii) homology arm 서열을 포함하는 것인, 유전자 교정용 조성물을 제공하는 것이다.

상기 primer binding site는 표적 DNA의 가닥으로부터 형성된 프라이머 서열을 어닐링하는 extension arm의 일부를 의미한다.

상기 edit template는 역전사 효소에 의해 합성되는 단일 가닥 DNA 플랩 내 원하는 교정을 인코딩하는 extension arm의 일부를 나타낸다.

상기 homology arm은 endogenous strand의 대체에 의해 표적 DNA 위치로 통합될 생성된 역전사 효소-인코딩된 단일 가닥 DNA 플랩의 서열을 포함하는 extension arm의 일부를 지칭한다. homology arm에 의해 인코딩된 단일 가닥 DNA 플랩의 부분은 표적 DNA 서열의 교정되지 않은 가닥에 상보적이다. 프라임 에디팅에 관하여 WO2020/191153 A2의 기재가 본원 명세서 내 적절히 적용되고 통합될 수 있다.

본 발명의 또 다른 양상은 비활성 enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭 DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 유전자 발현 억제용 조성물을 제공한다.

본 발명의 유전자 발현 억제용 조성물에 있어서, 전술한 내용과 중복되는 부분은 전술한 의미와 동일한 의미로 사용될 수 있다.

비활성(deactivated) enCpf1 단백질은 키메릭 DNA-RNA 가이드에 의해 표적 유전자에 바인딩할 수 있으나, 뉴클레아제 활성을 나타내지 않으므로, 표적 유전자의 전사가 억제 또는 감소될 수 있으므로, 표적 유전자의 발현을 조절하는데 효과적으로 활용될 수 있다.

본 발명에서 사용되는 비활성 enCpf1 단백질은 당업계에서 알려진 enCpf1 단백질의 활성을 제거 또는 감소시키는 방법에 의해 제조된 것일 수 있다.

본 발명의 일 구체예에 따르면, 상기 가이드는 3'-말단이 포스포로티오에이트로 개질된 것일 수 있다.

본 발명의 일 구체예에 따르면, 상기 조성물은 SpCas9 닉카아제(nickase)(D10A)를 더 포함할 수 있다.

enCpf1 및 키메릭 DNA-RNA 가이드를 포함하는 유전체 교정 또는 발현 억제용 조성물에 따르면, 기존의 RNA 가이드 대비 인델 효율은 유사하면서도, RNA 가이드 대비 표적 특이성이 우수하므로, 안정성 및 높은 치료 효과를 요구하는 유전자 치료 등에 효과적으로 적용될 수 있다.

도 1은 키메릭 DNA-RNA 가이드 사용하는 AsCas12a 시스템과 enhanced- AsCas12a(enAsCas12a) 시스템의 표적 특이성 증진 메커니즘과 작동원리를 나타내는 도이다. 도 1의 A는 키메릭 DNA-RNA를 이용한 AsCpf1(파란색)의 유전자상 표적 염기서열에 대한 표적 특이성 제고 메커니즘을 나타낸다. on-target 상의 효율적인 작동을 위하여 표적 염기서열 근처의 nickase의 바인딩을 필요로 하며(노란색), 키메릭 DNA-RNA 가이드에 의해 off-target 절단을 목적하는 방식으로 작동될 수 있다. 도 1의 B는 본 발명에 따른 키메릭 DNA-RNA를 이용한 enAsCpf1(주황색)의 유전자상 표적 염기서열에 대한 표적 특이성 제고 메커니즘을 나타낸다. 표적 염기서열 근처의 nickase의 바인딩이 없어도 on-target 상에서 효과적인 유전자 교정이 가능하며, 키메릭 DNA-RNA 가이드에 의해 off-target 절단은 획기적으로 감소할 수 있다.
도 2는 키메릭 DNA-RNA 가이드 이용 표적 염기서열에 대한 AsCas12a 시스템과 enhanced-AsCas12a 시스템의 작동효율을 비교한 결과를 나타낸다. 구체적으로, 키메릭 DNA-RNA 가이드(붉은색: crRNA의 3'말단부터 다양한 길이의 연속된 DNA치환, D+N: 가이드 RNA 내에서 각각의 치환된 DNA 갯수)를 이용한 AsCpf1과 enAsCpf1의 DNMT1 유전자 염기서열 타겟 이중나선 절단 효율 비교이다. D+0은 WT-crRNA을 나타내며, NC는 negative control를 나타낸다.
도 3은 Nickase(nCas9)의 유무에 따른 표적 염기서열에 대한 키메릭 DNA-RNA 가이드 기반 AsCas12a 시스템과 enAsCas12a 시스템의 작동효율을 비교한 결과를 나타낸다. 구체적으로, 도 3의 A 및 B는 인체 유래 세포주 내 (HEK293FT) CCR5 표적 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(DNA+8) 사용 유전체 교정 유도 시, AsCpf1과 enAsCpf1의 nickase(nCas9) 의존성 비교 실험을 나타내며, 도 3의 C 및 D는 인체 유래 세포주 내 (HEK293FT) IL2A-AS1 표적 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(DNA+8) 사용 유전체 교정 유도 시, AsCpf1과 enAsCpf1의 nickase(nCas9) 의존성 비교 실험 결과를 나타낸다.
도 4는 AsCas12a 과 enAsCas12a 시스템의 키메릭 DNA-RNA 가이드 사용시 인체 유래 세포주내 유전자 상 표적 염기서열(AAVS1-1)에 대한 작동효율 및 표적 특이성을 비교한 결과를 나타낸다. 구체적으로, 도 4의 A 및 C는 인체유래 세포주내 (HEK293FT) 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(8DNA) 기반 AsCpf1 전달 시 AAVS1-1 표적/비표적 염기서열에 대한 각각의 교정 효율을 비교한 결과를 나타내며, 도 4의 B 및 D는 인체 유래 세포주 내 (HEK293FT) 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(8 DNA) 기반 enAsCpf1 전달 시 AAVS1-1 표적/비표적 염기서열에 대한 각각의 교정 효율 비교 결과를 나타낸다.
도 5는 상기 도 4의 정상 가이드 RNA(WT)와 키메릭 DNA-RNA(8DNA) 가이드 사용 AsCpf1과 enAsCpf1 전달 시, AAVS1-1 염기서열에 대한 각각의 표적 특이성을 비교한 결과를 나타낸다.
도 6은 키메릭 DNA-RNA 기반 enAsCas12a 시스템 사용을 통한 인체 유래 세포주 내 유전자상 표적 염기서열(CCR5)에 대한 작동효율 및 표적 특이성 검증 실험을 나타낸다. 도 6의 A 및 B는 인체유래 세포주내 (HEK293FT) 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(8DNA) 사용 enAsCpf1 전달시, 각 CCR5 표적(on-target)/비표적(off-target) 염기서열에 대한 교정 효율을 비교한 결과를 나타낸다. 도 6의 C는 정상 가이드 RNA(WT)와 키메릭 DNA-RNA(8DNA) 가이드 사용 enAsCpf1 전달시, CCR5 염기서열에 대한 표적 특이성 비교 결과를 나타낸다.
도 7은 키메릭 DNA-RNA 가이드 이용 표적 염기서열에 대한 AsCas12a 시스템과 enhanced-AsCas12a 시스템의 작동효율 비교한 결과를 나타낸다. 구체적으로, 키메릭 DNA-RNA 가이드(붉은색: crRNA의 3'말단부터 다양한 길이의 연속된 DNA치환, D+N: 가이드 RNA 내에서 각각의 치환된 DNA 갯수)를 이용한 AsCpf1과 enAsCpf1의 hDNMT1_site1 유전자 및 CCR5_site2 유전자 염기서열 타겟 이중나선 절단 효율 비교이다. D+0은 WT-crRNA을 나타내며, NC는 negative control를 나타낸다.
도 8은 키메릭 DNA-RNA 가이드 이용 표적 염기서열에 대한 AsCas12a 시스템과 enhanced-AsCas12a 시스템의 작동효율 비교한 결과를 나타낸다. 구체적으로, 키메릭 DNA-RNA 가이드를 이용한 AsCpf1과 enAsCpf1의 DNMT1_site1, IL12A-AS1 및 CCR5_site1 유전자 염기서열 타겟 이중나선 절단 효율 비교이다. D+0은 WT-crRNA을 나타내며, NC는 negative control를 나타낸다.
도 9는 인간 세포주(HEK293FT)에서 내인성 표적(DNMT1-site2)에 대한 wt-AsCas12a 시스템과 enhanced-AsCas12a 시스템의 작동효율 및 표적 특이성을 비교한 결과를 나타낸다. 구체적으로, 도 9의 A 및 B는 인체유래 세포주내 (HEK293FT) 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(8DNA) 기반 AsCpf1 전달 시 DNMT1-site2 표적/비표적 염기서열에 대한 각각의 교정 효율을 비교한 결과를 나타내며, 도 9의 C는 Nickase(nCas9)의 유무에 따른 DNMT1-site2 표적 염기서열에 대한 키메릭 DNA-RNA 가이드 기반 AsCas12a 시스템과 enAsCas12a 시스템의 작동효율을 비교한 결과를 나타내고, 도 9의 D는 정상 가이드 RNA(WT)와 키메릭 DNA-RNA(8DNA) 가이드 사용 AsCpf1과 enAsCpf1 전달 시, DNMT1-site2 염기서열에 대한 각각의 표적 특이성을 비교한 결과를 나타낸다.
도 10은 인간 세포주(HEK293FT)에서 내인성 표적(CCR5-site1)에 대한 wt-AsCas12a 시스템과 enhanced-AsCas12a 시스템의 작동효율 및 표적 특이성을 비교한 결과를 나타낸다. 구체적으로, 도 10의 A 및 B는 인체유래 세포주내 (HEK293FT) 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(8DNA) 기반 AsCpf1 전달 시 CCR5-site1 표적/비표적 염기서열에 대한 각각의 교정 효율을 비교한 결과를 나타내며, 도 10의 C는 Nickase(nCas9)의 유무에 따른 CCR5-site1 표적 염기서열에 대한 키메릭 DNA-RNA 가이드 기반 AsCas12a 시스템과 enAsCas12a 시스템의 작동효율을 비교한 결과를 나타내고, 도 10의 D는 정상 가이드 RNA(WT)와 키메릭 DNA-RNA(8DNA) 가이드 사용 AsCpf1과 enAsCpf1 전달 시, CCR5-site1 염기서열에 대한 각각의 표적 특이성을 비교한 결과를 나타낸다.
도 11은 AsCas12a과 enAsCas12a 시스템의 키메릭 DNA-RNA 가이드 사용시 인체 유래 세포주내 유전자 상 표적 염기서열(CCR5-site2)에 대한 작동효율 및 표적 특이성을 비교한 결과를 나타낸다. 구체적으로, 도 11의 A 내지 B는 인체 유래 세포주 내 (HEK293FT) CCR5-site2 표적 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(DNA+8) 사용 유전체 교정 유도 시, AsCpf1과 enAsCpf1의 nickase(nCas9) 의존성 비교 실험을 나타내며, 도 11의 C는 인체 유래 세포주 내 (HEK293FT) CCR5-site2 표적 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(DNA+8 내지 11) 사용 유전체 교정 유도 시, AsCpf1과 enAsCpf1의 nickase(nCas9) 의존성 비교 실험을 나타낸다. 또한, 도 11의 D 내지 E는 인체 유래 세포주 내 (HEK293FT) CCR5-site2 비표적 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(DNA+8) 사용 유전체 교정 유도 시, AsCpf1과 enAsCpf1의 nickase(nCas9) 의존성 비교 실험을 나타내며, 도 11의 F는 정상 가이드 RNA(WT)와 키메릭 DNA-RNA(8DNA) 가이드 사용 AsCpf1과 enAsCpf1 전달 시, CCR5-site2 염기서열에 대한 각각의 표적 특이성을 비교한 결과를 나타낸다.
도 12는 인간 세포주(HEK293FT)에서 내인성 표적(AAVS1)에 대한 wt-AsCas12a 시스템과 enhanced-AsCas12a 시스템의 작동효율 및 표적 특이성을 비교한 결과를 나타낸다. 구체적으로, 도 12의 A 및 B는 인체유래 세포주내 (HEK293FT) 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(8DNA) 기반 AsCpf1 전달 시 AAVS1 표적/비표적 염기서열에 대한 각각의 교정 효율을 비교한 결과를 나타내며, 도 12의 C는 Nickase(nCas9)의 유무에 따른 AAVS1 표적 염기서열에 대한 키메릭 DNA-RNA 가이드 기반 AsCas12a 시스템과 enAsCas12a 시스템의 작동효율을 비교한 결과를 나타내고, 도 12의 D는 정상 가이드 RNA(WT)와 키메릭 DNA-RNA(8DNA) 가이드 사용 AsCpf1과 enAsCpf1 전달 시, AAVS1 염기서열에 대한 각각의 표적 특이성을 비교한 결과를 나타낸다.
도 13은 AsCas12a과 enAsCas12a 시스템의 키메릭 DNA-RNA 가이드 사용시 인체 유래 세포주내 유전자 상 표적 염기서열(FANCF)에 대한 작동효율 및 표적 특이성을 비교한 결과를 나타낸다. 구체적으로, 도 13의 A 내지 B는 인체 유래 세포주 내 (HEK293FT) FANCF 표적 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(DNA+8) 사용 유전체 교정 유도 시, AsCpf1과 enAsCpf1의 nickase(nCas9) 의존성 비교 실험을 나타내며, 도 13의 C 내지 D는 인체 유래 세포주 내 (HEK293FT) FANCF 비표적 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(DNA+8) 사용 유전체 교정 유도 시, AsCpf1과 enAsCpf1의 nickase(nCas9) 의존성 비교 실험을 나타낸다.
도 14는 AsCas12a과 enAsCas12a 시스템의 키메릭 DNA-RNA 가이드 사용시 인체 유래 세포주내 유전자 상 표적/비표적 염기서열(AAVS1, CCR5_site1, CCR_site2, DNMT1_site1, DNMT1_site2, FANCF 및 IL12A_AS1)에 대한 작동효율을 비교한 결과를 나타낸다.
도 15는 인간 세포주(HeLa, K562)에서 내인성 표적(AAVS1)에 대한 wt-AsCas12a 시스템과 enhanced-AsCas12a 시스템의 작동효율 및 표적 특이성을 비교한 결과를 나타낸다. 구체적으로, 도 15의 A 및 C는 인체유래 세포주내 (HeLa, K562) 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(8DNA) 기반 AsCpf1 전달 시 AAVS1 표적/비표적 염기서열에 대한 각각의 교정 효율을 비교한 결과를 나타내며, 도 15의 B 및 D는 정상 가이드 RNA(WT)와 키메릭 DNA-RNA(8DNA) 가이드 사용 AsCpf1과 enAsCpf1 전달 시, AAVS1 염기서열에 대한 각각의 표적 특이성을 비교한 결과를 나타낸다.

이하 본 발명을 하나 이상의 실시예를 통하여 보다 상세하게 설명한다. 그러나, 이들 실시예는 본 발명을 예시적으로 설명하기 위한 것으로 본 발명의 범위가 이들 실시예에 한정되는 것은 아니다.

< 실시예 1> CRISPR - Cas12a ( AsCpf1 ), CRISPR - enAsCas12a ( enAsCpf1 ) 재조합 단백질의 정제와 키메릭 (Chimeric) DNA- RNA가이드의 합성

CRISPR-AsCas12a, CRISPR-enAsCas12a (E174R, S542R, K548R) 재조합 단백질 정제를 위하여 pET28a-AsCas12a(서열번호 62(아미노산서열) 및 서열번호 63(염기서열)), pET28a-enAsCas12a (E174R, S542R, K548R)(서열번호 64(아미노산서열) 및 서열번호 65(염기서열) 박테리아 발현 벡터를 E. coli BL21(DE3)종에 형질전환 진행한 후, OD=0.6까지 37℃에서 배양하였다. IPTG 접종 뒤 48시간 후에 박테리아 세포들을 침전하여 배양액을 제거하고, 남은 침전물을 buffer A[20mM Tris-HCl(pH 8.0), 300mM NaCl, 10mM β-mercaptoethanol, 1% TritonX-100, 1mM PMSF]로 재용해하였다. 이후 sonication을 통하여(ice, 3min) 박테리아 세포막을 부수고, 원심분리(5,000rpm, 10min)후 세포 lysate를 harvest하였다. 먼저 buffer B[20mM Tris-HCl(pH8.0), 300nM NaCl] 로 pre-washing 된 Ni-NTA resin과 초음파 파쇄된 세포내 용액을 섞어서 cold room(4℃)에서 1시간 30분 동안 교반하였다. 박테리아 세포 침전 이후 buffer B[20mM Tris-HCl(pH 8.0), 300nM NaCl]를 사용, 10배 volume으로 washing을 통해 non-specific binding component 들을 제거하고, buffer C[20mM Tris-HCl(pH8.0), 300nM NaCl, 200mM Imidazole]를 사용해 Cas12a 단백질을 용출하였다. 용출된 단백질은 buffer E[200mM NaCl, 50mM HEPES(pH7.5), 1mM DTT, 40% glycerol]로 centricon(Amicon Ultra)을 사용하여 교환해주고 -80℃에 분주하여 보관하였다. 결과적으로 고순도의 DNA 절단 활성이 있는 단백질을 정제하였다. Chimeric DNA-RNA 가이드는 각 목표 유전자 내 타겟으로 하는 염기서열에 맞추어 일괄 합성 주문 제작하였다(bioneer).

실험에 사용된 chimeric DNA-RNA 가이드 염기서열 정보를 하기 표 2에 나타내었다.

표적 유전자 위치	CRISPR-Cas12a(AsCpf1) 표적 염기서열	Chimeric DNA-RNA 염기서열 (5'-3')
hDNMT1 D +0	TTTC CTGATGGTCCATGTCTGTTACTCG (서열번호 21)	5'UAAUUUCUACUCUUGUAGAUCUGAUGGUCCAUGUCUGUUACUCG 3' (서열번호 22)
hDNMT1 D +4	TTTC CTGATGGTCCATGTCTGTTACTCG	5'UAAUUUCUACUCUUGUAGAUCUGAUGGUCCAUGUCUGUUA CTCG 3' (서열번호 23)
hDNMT1 D +8	TTTC CTGATGGTCCATGTCTGTTACTCG	5'UAAUUUCUACUCUUGUAGAUCUGAUGGUCCAUGUCU GTTACTCG 3' (서열번호 24)
hDNMT1 D +12	TTTC CTGATGGTCCATGTCTGTTACTCG	5'UAAUUUCUACUCUUGUAGAUCUGAUGGUCCAU GTCTGTTACTCG 3' (서열번호 25)
hDNMT1 D +16	TTTC CTGATGGTCCATGTCTGTTACTCG	5'UAAUUUCUACUCUUGUAGAUCUGAUGGU CCATGTCTGTTACTCG 3' (서열번호 26)
hDNMT1 D +20	TTTC CTGATGGTCCATGTCTGTTACTCG	5'UAAUUUCUACUCUUGUAGAUCUGA TGGTCCATGTCTGTTACTCG 3' (서열번호 27)
hDNMT1 D +24	TTTC CTGATGGTCCATGTCTGTTACTCG	5'UAAUUUCUACUCUUGUAGAU CTGATGGTCCATGTCTGTTACTCG 3' (서열번호 28)
hDNMT1 D +44	TTTC CTGATGGTCCATGTCTGTTACTCG	5' T AATTTCTACTCTTGTAGATCTGATGGTCCATGTCTGTTACTCG 3' (서열번호 29)
hCCR5 D +0	TTTG GTCGGCATGGCCCCATTCGCACGG(서열번호 30)	5'UAAUUUCUACUCUUGUAGAUGUGGGCAACAUGCUGGUCAUCCUC 3' (서열번호 31)
hCCR5 D +8	TTTG GTCGGCATGGCCCCATTCGCACGG	5'UAAUUUCUACUCUUGUAGAUGUGGGCAACAUGCUGG TCATCCTC 3' (서열번호 32)
hAAVS1 D +0	TTTG GTGCTCAATGAAAGGAGATAAGGT(서열번호 33)	5'UAAUUUCUACUCUUGUAGAUCUUACGAUGGAGCCAGAGAGGAUC 3' (서열번호 34)
hAAVS1 D +8	TTTG GTGCTCAATGAAAGGAGATAAGGT	5'UAAUUUCUACUCUUGUAGAUCUUACGAUGGAGCCAG AGAGGATC 3' (서열번호 35)

a) 타겟 DNA 유전자내의 PAM 염기서열(TTTN)은 굵은 글씨 및 밑줄로 표시되었음.

b) 키메릭 가이드의 RNA는 굵은 글씨로 DNA는 밑줄 및 기울임 글씨로 표시되었음.

< 실시예 2> 키메릭 DNA-RNA 가이드 이용 표적 염기서열에 대한 AsCas12a 시스템과 enhanced- AsCas12a 시스템의 절단 효율 비교

키메릭 DNA-RNA 가이드를 사용하는 AsCpf1 및 enAsCpf1 시스템의 절단 효율 비교를 위해서, DNMT1 유전자에서 다양한 키메릭 DNA-RNA 가이드를 사용하여 on target 절단 효율을 각각 측정하였다.

구체적으로, 각 유전자위(DNMT1)에 해당하는 DNA primer를 표 3과 같이 제조하였다.

유전자 위치 및 프라이머 방향	DNA 염기서열 (5' to 3')
hDNMT1 on-target F1	GTTGCACGTGTCAAGTGCTTA (서열번호 36)
hDNMT1 on-target R1	TTAAAATCCAGAATGCACAAAGTACT(서열번호 37)
hDNMT1 on-target F2	GTGAATTTGGCTCAGCAGGCA (서열번호 38)
hDNMT1 on-target R2	AAGCGAACCTCACACAACAGC (서열번호 39)

*목표 유전자를 증폭하기 위한 각각의 유전자에 대한 프라이머 염기서열 정 보임.

그리고 나서, genomic DNA(HEK293FT)로부터 PCR amplicon(DNMT1)을 얻었다. 정제된 재조합 Cas12a(AsCpf1)와 각 유전자위에 해당하는 synthesised chimeric crRNA-DNA(purchased from Bioneer) 혹은 정제된 crRNA를 premix하고, cleavage buffer(NEB3, 10㎕ volumn) 조건에서 37℃, 1hour incubation 하였다. 반응 이후, stop buffer(100mM EDTA, 1.2% SDS)를 넣어서 반응을 중지시키고, 2% agarose gel 전기영동으로 DNA 절단 여부를 확인하였다. DNA cleavage 효율은, 절단된 이미지 패턴을 imageJ software를 사용하여 측정된 band intensity profile 값을 공식(Intensity of the cleaved fragment/total sum of the fragment intensity * 100 =%)에 따라 계산하였다.

그 결과를 도 2에 나타내었다.

도 2에서는 키메릭 DNA-RNA 가이드와 관련하여 crRNA의 3'말단부터 다양한 길이의 연속된 DNA를 붉은색으로 기재하고, D+N은 가이드 RNA내에서 각각의 치환된 DNA 개수를 나타내도록 기재하였다(D+0: WT-crRNA, NC: negative control).

도 2에서 확인할 수 있는 바와 같이, 본 발명에 따른 enAsCpf1 시스템을 사용하는 경우, AsCpf1와 대비하여 보다 우수한 절단 효율을 나타내었다.

구체적으로, enAsCpf1 시스템을 사용하여 D+4부터 D+16까지 우수한 절단 효능을 나타내었다. 이러한 효과의 경우 AsCpf1와 대비하여 보다 높게 나타나는 것으로, 본원 발명에 따른 우수한 효과를 확인하였다.

< 실시예 3> AsCas12a와 enhanced- AsCas12a 시스템의 키메릭 DNA-RNA 가이드 사용 인체유래 세포주내 유전자상 표적 염기서열( CCR5 , AAVS1 )에 대한 작동효율 및 표적 특이성 비교

인체유래 세포주 내 (HEK293FT)에서, 키메릭 DNA-RNA 기반 AsCas12a 시스템과 enhanced-AsCas12a (E174R, S542R, K548R) 시스템 간의 표적/비표적 염기서열 교정 효율을 비교하기 위하여, CCR5 site 와 AAVS1 site에 절단을 유도한 뒤, 작동 효율을 비교하였다.

고등동물 세포(HEK293FT)에 가이드와 CRISPR-Cas12a 단백질의 복합체 형태로 전달하여 CCR5, AAVS1 유전자 염기서열 절단을 유도하였다.

HEK293FT 세포주(ATCC)를 DMEM media(DMEM(Gibco) with 10% FBS (Gibco))에서 48시간마다 37℃, 5% CO₂에서 계대 배양하면서 confluency 70%를 유지하였고, chimeric 세포 transfection시 electroporation kit (amaxa, V4XC-2032)을 이용하였고, 10⁵개의 세포를 사용하여 CMV-Cas12a vector, CMV-nCas9 vector와 crRNA, sgRNA를 각각 섞어준 이후 electroporation buffer(CMV-Cas12a: 500ng, CMV-nCas9: 100ng, crRNA: 100pmol, sgRNA: 15pmol) 조건에서 electric shock(program: CM-137)을 가하였다. 이후 37℃, 5% CO₂ 조건에서 30분간 pre incubation된 24well plate의 DMEM media solution(500㎕l)에 transfection된 세포들을 옮기고 같은 조건(37℃, 5% CO₂)에서 배양시켰다. crRNA와 CMV-AsCas12a vector 복합체(CMV-AsCas12a(서열번호 66(아미노산서열) 및 서열번호 67(염기서열)) 또는 CMV-enAsCas12a (E174R, S542R, K548R)(서열번호 68(아미노산서열) 및 서열번호 69(염기서열))를 세포(HEK293FT) 내부로 전달한 뒤 24시간 이후에 동일한 양의 crRNA와 sgRNA를 1.4㎕l의 Lipofectamine 3000 (ThermoFisher)과 1.0㎕의 P3000 시약을 이용하여 세포 내로 전달하였다. Electric shock 후, 72 시간 뒤 genomic DNA purification kit(Qiagen, DNeasy Blood & Tissue Kit)를 사용하여 genomic DNA를 분리하였다. In-silico(Cas-offinder) 방식으로 각각의 유전자 타겟 염기서열(on-target)에 대한 유사 염기서열(off-target)을 선정하였다.

목표 유전자의 교정 부위의 정확한 염기서열을 확인하기 위하여 표적/비표적 유전자위에 해당하는 DNA primer(표 4에 기재)를 이용하여 얻은 PCR amplicon(CCR5(On, OT1), AAVS1(On, OT1))에서 nested PCR(Denaturation: 98℃ - 30 sec, Primer Anealing: 58℃ - 30 sec, Elongation: 72℃ - 30 sec, 35 cycles)을 반복하여 adaptor와 index 시퀀스를 amplicon 양단에 삽입하였다((Denaturation: 98℃ - 30 sec, Primer Anealing: 62℃ - 15 sec, Elongation: 72℃ - 15 sec, 35 cycles). 이후 tagging된 amplicon mixture를 manufactor's guideline에 따라서 mini-SEQ analyzer(illumina MiniSeq system, SY-420-1001)에 로딩하고 targeted deep sequencing을 진행하였다. 저장된 Fastq file은 Cas-Analyzer 코드로 분석되었고 교정 효율(%)이 계산되었다.

유전자 위치 및 프라이머 방향	DNA 염기서열 (5' to 3')
hCCR5 on-target F1	TGAGATGGTGCTTTCATGAAT (서열번호 40)
hCCR5 on-target R1	GAAAATGAGAGCTGCAGGTG (서열번호 41)
hCCR5 off-target F1	GAAAATGGCTGTTGGGTAAATC (서열번호 42)
hCCR5 off-target R1	TAAGGGCCACAGACATAAAC (서열번호 43)
hAAVS1 on-target F1	CCTGGTGAACACCTAGGACG (서열번호 44)
hAAVS1 on-target R1	CTATGTCCACTTCAGGACAGC (서열번호 45)
hAAVS1 off-target1 F1	AGCAGGTTGGGTATCCTGTG (서열번호 46)
hAAVS1 off-target1 R1	AGGCTGTTTCTGCCTCCATA (서열번호 47)
hAAVS1 off-target2 F1	ATCCAGGGGGTTGGAATATC (서열번호 48)
hAAVS1 off-target2 R1	TGCCTGAGAGCAGGTCTTTT (서열번호 49)
hCCR5 on-target Adaptor_F	*ACACTCTTTCCCTACACGACGCTCTTCCGATCT* CCTGCCAAAAAATCAATGTGAAG (서열번호 50)
hCCR5 on-target Adaptor_R	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGAAGGGGACAGTAAGAAGGAA (서열번호 51)
hCCR5 off-target Adaptor_F	*ACACTCTTTCCCTACACGACGCTCTTCCGATCT* TCCCTGTCATAAATTTGACGTG (서열번호 52)
hCCR5 off-target Adaptor_R	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGAAAAAGCAGATCAGAGATGGC (서열번호 53)
hAAVS1 on-target Adaptor_F	*ACACTCTTTCCCTACACGACGCTCTTCCGATCT* CTTCCCTCCCACCCCCTG (서열번호 54)
hAAVS1 on-target Adaptor_R	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCCCCATCCTTAGGCCTCCT (서열번호 55)
hAAVS1 off-target1 Adaptor_F	*ACACTCTTTCCCTACACGACGCTCTTCCGATCT* CCATCTCCTGGTCTGCACAA (서열번호 56)
hAAVS1 off-target1 Adaptor_R	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCAAAGGGGCTATTCAGATGT (서열번호 57)
hAAVS1 off-target2 Adaptor_F	*ACACTCTTTCCCTACACGACGCTCTTCCGATCT* GGTTATCTGTTAATGATAGCCTG (서열번호 58)
hAAVS1 off-target2 Adaptor_R	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCACAAGCCCATGAAGACTGG (서열번호 59)

목표 유전자를 증폭하기 위한 각각의 유전자에 대한 프라이머 염기서열 정보를 표시하였다. 차세대 염기서열 분석에 사용된 정방향 어답터(forward adaptor 녹색), 역방향 어답터(reverse adaptor 파란색) 프라이머의 염기서열은 각각 기울임, 밑줄 및 굵은 글씨 표시; 밑줄 글씨 표시로 기재하였다.

Nickase(nCas9) 이용 유무와 함께 표적 염기서열에 대한 키메릭 DNA-RNA 가이드 기반 AsCas12a 시스템과 enAsCas12a 시스템의 작동효율 비교 결과를 도 3에 나타내었다.

도 3에서 확인할 수 있는 바와 같이, 키메릭 가이드 사용 AsCas12a 시스템에서는 표적 서열 근처의 nickase에 의해서만 on-target 절단이 효율적으로 일어나는 반면, enAsCas12a 시스템에서는 nickase의 바인딩 없이 효율적인 on-target 절단이 일어나는 것을 확인하였다.

구체적으로, 도 3의 A 및 B는 CCR5에 대한 AsCas12a 시스템과 enAsCas12a 시스템의 작동효율 비교 결과를 나타낸다. AsCas12a 시스템의 경우 D+8 키메릭에 대하여 Nickase의 도움이 없을 때 Indel 효율이 크게 떨어졌다. 반면, enAsCas12a 시스템은 D+8 키메릭 DNA-RNA에 대하여 Nickase의 도움이 없이도 우수한 On target 절단 효율을 나타내었다. 특히, D+8 키메릭 DNA-RNA 사용에 의하여 WT와 대비하여서도 On target 절단 효율이 증가된 것을 확인할 수 있다.

또한, 도 3의 C 및 D는 IL2A-AS1에 대한 AsCas12a 시스템과 enAsCas12a 시스템의 작동효율 비교 결과를 나타낸다. 해당 결과를 통해서도 AsCas12a 시스템의 경우 D+8 키메릭에 대하여 Nickase의 도움이 없을 때 Indel 효율이 크게 떨어지는 것을 확인할 수 있다. 반면, 본원 발명의 enAsCas12a 시스템은 D+8 키메릭 DNA-RNA에 대하여 Nickase의 도움이 없이도 우수한 On target 절단 효율을 나타내었다.

도 4 및 도 5는 AsCas12a 과 enAsCas12a 시스템의 키메릭 DNA-RNA 가이드 사용 인체유래 세포주내 유전자상 표적 염기서열(AAVS1-1)에 대한 작동효율 및 표적 특이성 비교 결과를 나타낸다.

키메릭 DNA-RNA(8DNA) 사용으로 비표적 염기서열에 대한 절단 효율이 감소하는 것을 enAsCas12a (E174R, S542R, K548R) 시스템에서 확인하였다.

도 4의 A 및 B에서 확인할 수 있는 바와 같이 AsCas12a 과 enAsCas12a 시스템을 비교할 때 enAsCas12a 시스템의 경우 on-Target에 대한 indel ratio가 크게 증가하였다. 이러한 증가는 필연적으로 Off-target에 대한 문제를 가져올 수밖에 없는데, 도 4의 C 및 D를 통해 확인할 수 있는 바와 같이, WT를 사용하여 enAsCas12a 시스템에서 나타나는 Off-target에 대한 절단 문제를 키메릭 DNA-RNA의 사용을 통해 해소하였음을 확인하였다.

상기 결과를 통해서, 본 발명에 따른 enAsCas12a을 적용한 키메릭 DNA-RNA의 사용이 On-target에 대한 절단 효율을 크게 증가시키면서 비표적 염기서열에 대한 절단 효율을 감소시킴을 확인하였다.

또한, 도 5에서 확인할 수 있는 바와 같이, 정상 가이드 RNA(WT)와 키메릭 DNA-RNA(8DNA) 가이드 사용 AsCpf1과 enAsCpf1 전달 시 AAVS1-1에 대한 작동효율 및 표적 특이성이 크게 증가한 것을 확인할 수 있었다. 특히, On-target/off-target 측면에 AsCpf1 사용 시스템은 키메릭 DNA-RNA 와 WT 간의 특이도(Specificity)에 큰 차이가 없었던 반면, enAsCpf1의 경우 키메릭 DNA-RNA 사용에 따라 특이도가 현저히 상승함을 확인하였다.

도 6은 키메릭 DNA-RNA 기반 enAsCas12a 시스템 사용 인체 유래 세포주내 유전자상 표적 염기서열(CCR5)에 대한 작동효율 및 표적 특이성 검증 결과를 나타낸다.

도 6을 통해 확인할 수 있는 바와 같이, enAsCpf1의 경우 키메릭 DNA-RNA 사용에 따라 Off-target에 대한 indel ratio를 크게 감소시킴으로써 특이도를 크게 증가시켰음을 확인하였다.

< 실시예 4> 키메릭 (Chimeric) DNA-RNA 가이드의 합성

더욱 다양한 표적 유전자 위치에 따른 키메릭 DNA-RNA 가이드 이용 표적 염기서열에 대한 AsCas12a 시스템과 enhanced- AsCas12a 시스템의 절단효율, 작동효율 및 표적 특이성을 확인하기 위하여, 상기 실시예 1과 동일한 방법을 이용하여 키메릭 DNA-RNA 가이드를 제작하였다.

실험에 사용된 chimeric DNA-RNA 가이드 염기서열 정보를 하기 표 5에 나타내었다.

표적 유전자 위치	CRISPR-Cas12a(AsCpf1) 표적 염기서열	Chimeric DNA-RNA 염기서열 (5'-3')
hDNMT1_site1 D +0	TTTC CTGATGGTCCATGTCTGTTACTCG (서열번호 21)	5'UAAUUUCUACUCUUGUAGAUCUGAUGGUCCAUGUCUGUUA CTCG 3' (서열번호 22)
hDNMT1_site1 D +4		5'UAAUUUCUACUCUUGUAGAUCUGAUGGUCCAUGUCUGUUA CTCG 3' (서열번호 23)
hDNMT1_site1 D +8		5'UAAUUUCUACUCUUGUAGAUCUGAUGGUCCAUGUCU GTTACTCG 3' (서열번호 24)
hDNMT1_site1 D +12		5'UAAUUUCUACUCUUGUAGAUCUGAUGGUCCAU GTCTGTTACTCG 3' (서열번호 25)
hDNMT1_site1 D +16		5'UAAUUUCUACUCUUGUAGAUCUGAUGGU CCATGTCTGTTACTCG 3' (서열번호 26)
hDNMT1_site1 D +20		5'UAAUUUCUACUCUUGUAGAUCUGA TGGTCCATGTCTGTTACTCG 3' (서열번호 27)
hDNMT1_site1 D +24		5'UAAUUUCUACUCUUGUAGAU CTGATGGTCCATGTCTGTTACTCG 3' (서열번호 28)
hDNMT1_site1 D +44		5' T AATTTCTACTCTTGTAGATCTGATGGTCCATGTCTGTTACTCG 3' (서열번호 29)
hDNMT1_site2 D +0	TTTG GCTCAGCAGGCACCTGCCTCAGCT (서열번호 70)	UAAUUUCUACUCUUGUAGAUGCUCAGCAGGCACCUGCCUCAGCU (서열번호 71)
hDNMT1_site2 D +8	TTTG GCTCAGCAGGCACCTGCCTCAGCT (서열번호 70)	UAAUUUCUACUCUUGUAGAUGCUCAGCAGGCACCUG CCTCAGCT (서열번호 72)
hCCR5_site1 D +0	TTTA TGCACAGGGTGGAACAAGATGGAT (서열번호 73)	UAAUUUCUACUCUUGUAGAUUGCACAGGGUGGAACAAGAUGGAU (서열번호 74)
hCCR5_site1 D +8		UAAUUUCUACUCUUGUAGAUUGCACAGGGUGGAACA AGATGGAT (서열번호 75)
hCCR5_site1 D +12		UAAUUUCUACUCUUGUAGAUUGCACAGGGUGG AACAAGATGGAT (서열번호 76)
hCCR5_site1 D +16		UAAUUUCUACUCUUGUAGAUUGCACAGG *GTGGAACAAGATGGAT* (서열번호 77)
hCCR5_site1 D +20		UAAUUUCUACUCUUGUAGAUUGCA CAGGGTGGAACAAGATGGAT (서열번호 78)
hCCR5_site1 D +24		UAAUUUCUACUCUUGUAGAU TGCACAGGGTGGAACAAGATGGAT (서열번호 79)
hCCR5_site1 D +44		TAATTTCTACTCTTGTAGATTGCACAGGGTGGAACAAGATGGAT (서열번호 80)
hCCR5_site2 D +0	TTTT GTGGGCAACATGCTGGTCATCCTC (서열번호 81)	UAAUUUCUACUCUUGUAGAUGUGGGCAACAUGCUGGUCAUCCUC (서열번호 82)
hCCR5_site2 D +8		UAAUUUCUACUCUUGUAGAUGUGGGCAACAUGCUGG TCATCCTC (서열번호 83)
hCCR5_site2 D +9		UAAUUUCUACUCUUGUAGAUGUGGGCAACAUGCUG GTCATCCTC (서열번호 84)
hCCR5_site2 D +10		UAAUUUCUACUCUUGUAGAUGUGGGCAACAUGCU GGTCATCCTC (서열번호 85)
hCCR5_site2 D +11		UAAUUUCUACUCUUGUAGAUGUGGGCAACAUGC TGGTCATCCTC (서열번호 86)
hCCR5_site2 D +12		UAAUUUCUACUCUUGUAGAUGUGGGCAACAUG CTGGTCATCCTC (서열번호 87)
hCCR5_site2 D + 16		UAAUUUCUACUCUUGUAGAUGUGGGCAA CATGCTGGTCATCCTC (서열번호 88)
hCCR5_site2 D +20		UAAUUUCUACUCUUGUAGAUGUGG GCAACATGCTGGTCATCCTC (서열번호 89)
hCCR5_site2 D +24		UAAUUUCUACUCUUGUAGAU GTGGGCAACATGCTGGTCATCCTC (서열번호 90)
hCCR5_site2 D +44		TAATTTCTACTCTTGTAGATGTGGGCAACATGCTGGTCATCCTC (서열번호 91)
hIL12A-AS1 D +0	TTTA GGATGCCACTAAAAGGGAAAGGGG (서열번호 92)	UAAUUUCUACUCUUGUAGAUGGAUGCCACUAAAAGGGAAAGGGG (서열번호 93)
hIL12A-AS1 D +8		UAAUUUCUACUCUUGUAGAUGGAUGCCACUAAAAGG GAAAGGGG (서열번호 94)
hIL12A-AS1 D +12		UAAUUUCUACUCUUGUAGAUGGAUGCCACUAA AAGGGAAAGGGG (서열번호 95)
hIL12A-AS1 D +16		UAAUUUCUACUCUUGUAGAUGGAUGCCA CTAAAAGGGAAAGGGG (서열번호 96)
hIL12A-AS1 D +20		UAAUUUCUACUCUUGUAGAUGGAU GCCACTAAAAGGGAAAGGGG (서열번호 97)
hIL12A-AS1 D +24		UAAUUUCUACUCUUGUAGAU GGATGCCACTAAAAGGGAAAGGGG (서열번호 98)
hIL12A-AS1 D +44		TAATTTCTACTCTTGTAGATGGATGCCACTAAAAGGGAAAGGGG (서열번호 99)
hAAVS1 D +0	TTTG CTTACGATGGAGCCAGAGAGGATC (서열번호 100)	UAAUUUCUACUCUUGUAGAUCUUACGAUGGAGCCAGAGAGGAUC (서열번호 101)
hAAVS1 D +8	TTTG CTTACGATGGAGCCAGAGAGGATC (서열번호 100)	UAAUUUCUACUCUUGUAGAUCUUACGAUGGAGCCAG AGAGGATC (서열번호 102)
hFANCF D +0	TTTG GGCGGGGTCCAGTTCCGGGATTAG (서열번호 103)	UAAUUUCUACUCUUGUAGAUGGCGGGGUCCAGUUCCGGGAUUAG (서열번호 104)
hFANCF D +8	TTTG GGCGGGGTCCAGTTCCGGGATTAG (서열번호 103)	UAAUUUCUACUCUUGUAGAUGGCGGGGUCCAGUUCC GGGATTAG (서열번호 105)

< 실시예 5> 키메릭 DNA-RNA 가이드 이용 표적 염기서열에 대한 AsCas12a 시스템과 enhanced- AsCas12a 시스템의 절단 효율 비교

키메릭 DNA-RNA 가이드를 사용하는 AsCpf1 및 enAsCpf1 시스템의 절단 효율 비교를 위해서, hDNMT1_site1 유전자 및 CCR5_site2 유전자에서 다양한 키메릭 DNA-RNA 가이드를 사용하여 on target 절단 효율을 각각 측정하였다.

구체적으로, 각 유전자위(hDNMT1_site1 및 CCR5_site2)에 해당하는 DNA primer를 표 6과 같이 제조하였다.

유전자 위치 및 프라이머 방향	DNA 염기서열 (5' to 3')
hDNMT1_site1_on-target F1	GGAGATCAAGCTTTGTATGTTG (서열번호 106)
hDNMT1_site1_on-target R1	CCAGAATGCACAAAGTACTGC (서열번호 107)
hDNMT1_site1_on-target F2	CTGTGAGGATTGAGTGAGTTG (서열번호 108)
hDNMT1_site1_on-target R2	CACACATGTGAACGGACAGA (서열번호 109)
hCCR5_site2_on-target F1	TGAGATGGTGCTTTCATGAAT (서열번호 110)
hCCR5_site2_on-target R1	GAAAATGAGAGCTGCAGGTG (서열번호 111)
hCCR5_site2_on-target F2	AAACTTCATTGCTTGGCCAA (서열번호 112)
hCCR5_site2_on-target R2	GAAGATTCCAGAGAAGAAGCC (서열번호 113)

*목표 유전자를 증폭하기 위한 각각의 유전자에 대한 프라이머 염기서열 정보임.

그리고 나서, genomic DNA(HEK293FT)로부터 PCR amplicon(hDNMT1_site1 및 CCR5_site2)을 얻었다. 정제된 재조합 Cas12a(AsCpf1)와 각 유전자위에 해당하는 synthesised chimeric crRNA-DNA(purchased from Bioneer) 혹은 정제된 crRNA를 premix하고, cleavage buffer(NEB3, 10㎕ volumn) 조건에서 37℃, 1hour incubation하였다. 반응 이후, stop buffer(100mM EDTA, 1.2% SDS)를 넣어서 반응을 중지시키고, 2% agarose gel 전기영동으로 DNA 절단 여부를 확인하였다. DNA cleavage 효율은, 절단된 이미지 패턴을 imageJ software를 사용하여 측정된 band intensity profile 값을 공식(Intensity of the cleaved fragment/total sum of the fragment intensity * 100 =%)에 따라 계산하였다.

그 결과를 도 7에 나타내었다.

도 7에서는 키메릭 DNA-RNA 가이드와 관련하여 crRNA의 3'말단부터 다양한 길이의 연속된 DNA를 붉은색으로 기재하고, D+N은 가이드 RNA내에서 각각의 치환된 DNA 개수를 나타내도록 기재하였다(D+0: WT-crRNA, NC: negative control).

도 7에서 확인할 수 있는 바와 같이, 본 발명에 따른 enAsCpf1 시스템을 사용하는 경우, AsCpf1와 대비하여 hDNMT1_site1 및 CCR5_site2 유전자에서 보다 우수한 절단 효율을 나타내었다.

구체적으로, enAsCpf1 시스템을 사용하여 D+4부터 D+16까지 우수한 절단 효능을 나타내었다. 이러한 효과의 경우 AsCpf1와 대비하여 hDNMT1_site1 및 CCR5_site2 유전자에서 보다 높게 나타나는 것으로, 본원 발명에 따른 우수한 효과를 확인하였다.

< 실시예 6> 키메릭 DNA-RNA 가이드 이용 표적 염기서열에 대한 AsCas12a 시스템과 enhanced- AsCas12a 시스템의 게놈 편집 활성 최적화

키메릭 DNA-RNA 가이드를 기반으로 조작된 enhanced-AsCas12a 이펙터가 인간 세포에서 표적 유전자 돌연변이를 효과적으로 유도할 수 있는지 확인하기 위하여, DNMT1_site1, IL12A-AS1 및 CCR5_site1 유전자에서 다양한 키메릭 DNA-RNA 가이드를 사용하여 on target 절단 효율을 각각 측정하였다.

구체적으로, 각 유전자위(DNMT1_site1, IL12A-AS1 및 CCR5_site1)에 해당하는 DNA primer를 표 7과 같이 제조하였다.

유전자 위치 및 프라이머 방향	DNA 염기서열 (5' to 3')
hDNMT1_site1_on-target F1	GGAGATCAAGCTTTGTATGTTG (서열번호 106)
hDNMT1_site1_on-target R1	CCAGAATGCACAAAGTACTGC (서열번호 107)
hDNMT1_site1_on-target F2	CTGTGAGGATTGAGTGAGTTG (서열번호 108)
hDNMT1_site1_on-target R2	CACACATGTGAACGGACAGA (서열번호 109)
hIL12A-AS1_on-target F	GCTTGCTGTATACACAAGGC (서열번호 114)
hIL12A-AS1_on-target R	CTGATCTTGAGAACAGAAGACC (서열번호 115)
hCCR5_site1_on-target F	ACCATGCTTGACCCAGTTTC (서열번호 116)
hCCR5_site1_on-target R	AAACACAGCATGGACGACAG (서열번호 117)

그 결과를 도 8에 나타내었다.

도 8에서 확인할 수 있는 바와 같이, 세포내 유전자좌를 표적으로 하는 유전자 돌연변이의 유도는 상기한 앰플리콘 절단과는 다른 경향을 보였다. 즉, 본 발명에 따른 enAsCpf1 시스템을 사용하는 경우, AsCpf1와 대비하여 DNMT1_site1, IL12A-AS1 및 CCR5_site1 유전자에서 보다 우수한 절단 효율을 나타내었다.

구체적으로, enAsCpf1 시스템을 사용하여 D+4부터 D+8까지 우수한 절단 효능을 나타내었다. 이러한 효과의 경우 AsCpf1와 대비하여 DNMT1_site1, IL12A-AS1 및 CCR5_site1 유전자에서 보다 높게 나타나는 것으로, 본원 발명에 따른 인간 세포 내에서의 우수한 효과를 확인하였다.

< 실시예 7> AsCas12a와 enhanced- AsCas12a 시스템의 키메릭 DNA-RNA 가이드 사용 인체유래 세포주내 유전자상 표적 염기서열( DNMT1 _ site2 , CCR5 _ site1 , CCR5_site2, AAVS1 및 FANCT )에 대한 작동효율 및 표적 특이성 비교

(1) HEK293FT 세포주 내에서 실험 수행

인체유래 세포주 내 (HEK293FT)에서, 키메릭 DNA-RNA 기반 AsCas12a 시스템과 enhanced-AsCas12a (E174R, S542R, K548R) 시스템 간의 표적/비표적 염기서열 교정 효율을 비교하기 위하여, DNMT1_site2, CCR5_site1, CCR5_site2, AAVS1 및 FANCT에 절단을 유도한 뒤, 상기 실시예 3의 방법과 동일한 방법을 이용하여 작동 효율 및 표적 특이성을 비교하였다.

목표 유전자의 교정 부위의 정확한 염기서열을 확인하기 위하여 표적/비표적 유전자위에 해당하는 DNA primer를 표 8과 같이 제조하였다.

유전자 위치 및 프라이머 방향	DNA 염기서열 (5' to 3')
hDNMT1_site1_on-target F1	GGAGATCAAGCTTTGTATGTTG (서열번호 106)
hDNMT1_site1_on-target R1	CCAGAATGCACAAAGTACTGC (서열번호 107)
hDNMT1_site1_on-target F2	CTGTGAGGATTGAGTGAGTTG (서열번호 108)
hDNMT1_site1_on-target R2	CACACATGTGAACGGACAGA (서열번호 109)
hDNMT1_site1_on-target Adaptor_F	*ACACTCTTTCCCTACACGACGCTCTTCCGATCT* GGAGTGTTCAGTCTCCGTGA (서열번호 118)
hDNMT1_site1_on-target Adaptor_R	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCCTTAGCAGCTTCCTCCTC (서열번호 119)
hDNMT1_site1_off-target F	CAGGGGTATTTTCCTTCAAGA (서열번호 120)
hDNMT1_site1_off-target R	TCAGGAATACCAACATGGAAAA (서열번호 121)
hDNMT1_site1_off-target Adaptor_F	*ACACTCTTTCCCTACACGACGCTCTTCCGATCT* TGTGTGTCTGCTGGAAGCTC (서열번호 122)
hDNMT1_site1_off-target Adaptor_R	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCAGCAGATAGGGTCTGTGCTC (서열번호 123)
hDNMT1_site2_on-target F	ACACAACAGCTTCATGTCAG (서열번호 124)
hDNMT1_site2_on-target R	TTGGCTTGGAGATCAAGCTT (서열번호 125)
hDNMT1_site2_on-target Adaptor_F	*ACACTCTTTCCCTACACGACGCTCTTCCGATCT* GCAGAGTGCTAAGGGAACGT (서열번호 126)
hDNMT1_site2_on-target Adaptor_R	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAAGTGCTTAGAGCAGGCGTG (서열번호 127)
hDNMT1_site2_off-target F1	CTGAGCTGGTATCCAAGATGC (서열번호 128)
hDNMT1_site2_off-target R1	GCATTGTCATTAGAACCACAAATC (서열번호 129)
hDNMT1_site2_off-target Adaptor_F1	*ACACTCTTTCCCTACACGACGCTCTTCCGATCT* GCAGAAGTGAGTCTTGCTGAG (서열번호 130)
hDNMT1_site2_off-target Adaptor_R1	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCAGAATCTGTGCACTCGGAG (서열번호 131)
hDNMT1_site2_off-target F2	GTTGCAGTGAGCCAAGATCA (서열번호 132)
hDNMT1_site2_off-target R2	TCTTGGAACCAATCCTCTGC (서열번호 133)
hDNMT1_site2_off-target Adaptor_F2	*ACACTCTTTCCCTACACGACGCTCTTCCGATCT* AAGCAGTGCTTCTCCATTGAG (서열번호 134)
hDNMT1_site2_off-target Adaptor_R2	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTTTACGCCATGGGTGATAGTG (서열번호 135)
hDNMT1_site2_off-target F3	GCAACCAGATTTTTCCTCCA (서열번호 136)
hDNMT1_site2_off-target R3	CCAAGCCGTTACAGATGGTT (서열번호 137)
hDNMT1_site2_off-target Adaptor_F3	*ACACTCTTTCCCTACACGACGCTCTTCCGATCT* GGCAATGGACTCTGGGATAG (서열번호 138)
hDNMT1_site2_off-target Adaptor_R3	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCGGGTTGTGAACAGGAAACT (서열번호 139)
hCCR5_site1_on-target F	ACCATGCTTGACCCAGTTTC (서열번호 116)
hCCR5_site1_on-target R	AAACACAGCATGGACGACAG (서열번호 117)
hCCR5_site1_on-target Adaptor_F	*ACACTCTTTCCCTACACGACGCTCTTCCGATCT* CAATGTAGACATCTATGTAGGCAA (서열번호 140)
hCCR5_site1_on-target Adaptor_R	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCTGCGATTTGCTTCACATTG (서열번호 141)
hCCR5_site1_off-target F1	CAAGCAATTCTTGTGCCTCA (서열번호 142)
hCCR5_site1_off-target R1	TCCAGGCCCTGTATACTTGC (서열번호 143)
hCCR5_site1_off-target Adaptor_F1	*ACACTCTTTCCCTACACGACGCTCTTCCGATCT* AGGGTCAACATTGCAAGGAG (서열번호 144)
hCCR5_site1_off-target Adaptor_R1	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTTCAAAGCCATTCTGGAAAAGA (서열번호 145)
hCCR5_site1_off-target F2	CATGGTGAAACCCCAACTCT (서열번호 146)
hCCR5_site1_off-target R2	CCAAATCCCACACTTTGCTT (서열번호 147)
hCCR5_site1_off-target Adaptor_F2	*ACACTCTTTCCCTACACGACGCTCTTCCGATCT* GCTCAACTGTATTGAGAGGAAGC (서열번호 148)
hCCR5_site1_off-target Adaptor_R2	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTTTCTGGTGGATAAGAAGGAATTTT (서열번호 149)
hCCR5_site2_on-target F1	TGAGATGGTGCTTTCATGAAT (서열번호 110)
hCCR5_site2_on-target R1	GAAAATGAGAGCTGCAGGTG 서열번호 111)
hCCR5_site2_on-target F2	AAACTTCATTGCTTGGCCAA (서열번호 112)
hCCR5_site2_on-target R2	GAAGATTCCAGAGAAGAAGCC (서열번호 113)
hCCR5_site2_on-target Adaptor_F	*ACACTCTTTCCCTACACGACGCTCTTCCGATCT* CCTGCCAAAAAATCAATGTGAAG (서열번호 150)
hCCR5_site2_on-target Adaptor_R	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGAAGGGGACAGTAAGAAGGAA (서열번호 151)
hCCR5_site2_off-target F	GAAAATGGCTGTTGGGTAAATC (서열번호 152)
hCCR5_site2_off-target R	TAAGGGCCACAGACATAAAC (서열번호 153)
hCCR5_site2_off-target Adaptor_F	*ACACTCTTTCCCTACACGACGCTCTTCCGATCT* TCCCTGTCATAAATTTGACGTG (서열번호 154)
hCCR5_site2_off-target Adaptor_R	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGAAAAAGCAGATCAGAGATGGC (서열번호 155)
hAAVS1_ on-target F	CCTGGTGAACACCTAGGACG (서열번호 156)
hAAVS1_ on-target R	CTATGTCCACTTCAGGACAGC (서열번호 157)
hAAVS1_ on-target Adaptor_F	*ACACTCTTTCCCTACACGACGCTCTTCCGATCT* CTTCCCTCCCACCCCCTG (서열번호 158)
hAAVS1_ on-target Adaptor_R	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCCCCATCCTTAGGCCTCCT (서열번호 159)
hAAVS1_ off-target F1	AGCAGGTTGGGTATCCTGTG (서열번호 160)
hAAVS1_ off-target R1	AGGCTGTTTCTGCCTCCATA (서열번호 161)
hAAVS1_ off-target Adaptor_F1	*ACACTCTTTCCCTACACGACGCTCTTCCGATCT* CCATCTCCTGGTCTGCACAA (서열번호 162)
hAAVS1_ off-target Adaptor_R1	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCAAAGGGGCTATTCAGATGT (서열번호 163)
hAAVS1_ off-target F2	ATCCAGGGGGTTGGAATATC (서열번호 164)
hAAVS1_ off-target R2	TGCCTGAGAGCAGGTCTTTT (서열번호 165)
hAAVS1_ off-target Adaptor_F2	*ACACTCTTTCCCTACACGACGCTCTTCCGATCT* GGTTATCTGTTAATGATAGCCTG (서열번호 166)
hAAVS1_ off-target Adaptor_R2	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCACAAGCCCATGAAGACTGG (서열번호 167)
hIL12A-AS1_on-target F	GCTTGCTGTATACACAAGGC (서열번호 114)
hIL12A-AS1_on-target R	CTGATCTTGAGAACAGAAGACC (서열번호 115)
hIL12A-AS1_on-target Adaptor_F	*ACACTCTTTCCCTACACGACGCTCTTCCGATCT* GAAAAGGTGTTGCTTATTGCCC (서열번호 168)
hIL12A-AS1_on-target Adaptor_R	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCAGCTCCTTCCATCTGGGTTTC (서열번호 169)
hIL12A-AS1_off-target F1	ATTCTGCCTCCTCTCCCACT (서열번호 170)
hIL12A-AS1_off-target R1	CAGGAGGAGCAAATTCCAGA (서열번호 171)
hIL12A-AS1_off-target Adaptor_F1	*ACACTCTTTCCCTACACGACGCTCTTCCGATCT* GGTCCTAACAGAGATTTACTTTCTC (서열번호 172)
hIL12A-AS1_off-target Adaptor_R1	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCTCCCTCTCTCCCTTCCTCTC (서열번호 173)
hIL12A-AS1_off-target F2	GCATCAACAAACTGGCTCATT (서열번호 174)
hIL12A-AS1_off-target R2	CCTTTGGGATGGTGTCATCT (서열번호 175)
hIL12A-AS1_off-target Adaptor_F2	*ACACTCTTTCCCTACACGACGCTCTTCCGATCT* GCCACTGCTAATGTTTAAAATTC (서열번호 176)
hIL12A-AS1_off-target Adaptor_R2	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCTTTAGGGCAGCATTTTGTAG (서열번호 177)
hFANCF_on-target F	CACGGATAAAGACGCTGGGA (서열번호 178)
hFANCF_on-target R	CACAGGCTGCTGAGAAACCT (서열번호 179)
hFANCF_on-target Adaptor_F	*ACACTCTTTCCCTACACGACGCTCTTCCGATCT* CACATCCATCGGCGCTTTG (서열번호 180)
hFANCF_on-target Adaptor_R	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGGTGGTAACGAGCTGCATCC (서열번호 181)
hFANCF_off-target F	TGGGAGGAAACCCTAAAGAG (서열번호 182)
hFANCF_off-target R	TGCAGGCCCAAGTATTTTGA (서열번호 183)
hFANCF_off-target Adaptor_F	*ACACTCTTTCCCTACACGACGCTCTTCCGATCT* CAGCTGACTCAGCTGAACTG (서열번호 184)
hFANCF_off-target Adaptor_R	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGTCTGGTGTGTTATGCCTGT (서열번호 185)
IVT_AsCas12a_hDNMT1_site1_sense	CGAGTAACAGACATGGACCATCAGATCTACAAGAGTAGAAATTACCCTATAGTGAGTCGTATTAATTTC (서열번호 186)
IVT_AsCas12a_hDNMT1_site2_sense	AGCTGAGGCAGGTGCCTGCTGAGCATCTACAAGAGTAGAAATTACCCTATAGTGAGTCGTATTAATTTC (서열번호 187)
IVT_AsCas12a_hCCR5_site1_sense	ATCCATCTTGTTCCACCCTGTGCAATCTACAAGAGTAGAAATTACCCTATAGTGAGTCGTATTAATTTC (서열번호 188)
IVT_AsCas12a_hCCR5_site2_sense	GAGGATGACCAGCATGTTGCCCACATCTACAAGAGTAGAAATTACCCTATAGTGAGTCGTATTAATTTC (서열번호 189)
IVT_AsCas12a_hAAVS1_sense	GATCCTCTCTGGCTCCATCGTAAGATCTACAAGAGTAGAAATTACCCTATAGTGAGTCGTATTAATTTC (서열번호 190)
IVT_AsCas12a_hIL12A-AS1_sense	CCCCTTTCCCTTTTAGTGGCATCCATCTACAAGAGTAGAAATTACCCTATAGTGAGTCGTATTAATTTC (서열번호 191)
IVT_AsCas12a_hFANCF_sense	CTAATCCCGGAACTGGACCCCGCCATCTACAAGAGTAGAAATTACCCTATAGTGAGTCGTATTAATTTC (서열번호 192)
IVT_AsCas12a_universial_antisense	GAAATTAATACGACTCACTATAGGG (서열번호 193)
IVT_SpCas9_hDNMT1_site1_sgRNA_sense	GAAATTAATACGACTCACTATAGGAGTGCTAAGGGAACGTTCAGTTTTAGAGCTAGAAATAGCAAG (서열번호 194)
IVT_SpCas9_hDNMT1_site2_sgRNA_sense	GAAATTAATACGACTCACTATAGCCAGCAGCCAACCTGACCAAGTTTTAGAGCTAGAAATAGCAAG (서열번호 195)
IVT_SpCas9_hCCR5_site1_sgRNA_sense	GAAATTAATACGACTCACTATAGTAATAATTGATGTCATAGATGTTTTAGAGCTAGAAATAGCAAG (서열번호 196)
IVT_SpCas9_hCCR5_site2_sgRNA_sense	GAAATTAATACGACTCACTATAGAACACCAGTGAGTAGAGCGGGTTTTAGAGCTAGAAATAGCAAG (서열번호 197)
IVT_SpCas9_hAAVS1_sgRNA_sense	GAAATTAATACGACTCACTATAGGCAAGGAGAGAGATGGCTCCGTTTTAGAGCTAGAAATAGCAAG (서열번호 198)
IVT_SpCas9_hIL12A-AS1_sgRNA_sense	GAAATTAATACGACTCACTATAGTTCTGGGGTCAACATCTTGGGTTTTAGAGCTAGAAATAGCAAG (서열번호 199)
IVT_SpCas9_hFANCF_sgRNA_sense	GAAATTAATACGACTCACTATAGCCGCTCCAGAGCCGTGCGAAGTTTTAGAGCTAGAAATAGCAAG (서열번호 200)
IVT_SpCas9_universial_antisense	AAAAAAGCACCGACTCGGTGCCACTTTTTCAAGTTGATAACGGACTAGCCTTATTTTAACTTGCTATTTCTAGCTCTAAAAC (서열번호 201)

도 9는 인간 세포주(HEK293FT)에서 내인성 표적(DNMT1-site2)에 대한 wt-AsCas12a 시스템과 enhanced-AsCas12a 시스템의 작동효율 및 표적 특이성을 비교한 결과를 나타낸다.

도 9에서 확인할 수 있는 바와 같이, DNMT1 -　site2는 Cas12a 시스템이 표적으로 하는　AAVS1 -　site1 유전자좌와 동일한 경향을 나타냈다. 구체적으로, 도 9의 A 및 B에서 확인할 수 있는 바와 같이,　3' 말단에 8nt DNA 치환을 갖는 키메라 DNA-RNA 가이드를 기반으로 하는 enAsCas12a 이펙터의 경우, 인델 비율(%)이 wt-AsCas12a에 비해 유의하게 증가(1.9배)되었다.　또한, 표적을 벗어난 뉴클레오티드 서열에 의해 유도된 돌연변이가 극적으로 감소하였다.

즉, AsCas12a과 enAsCas12a 시스템을 비교할 때 enAsCas12a 시스템의 경우 on-Target에 대한 indel ratio가 크게 증가하였다. 이러한 증가는 필연적으로 Off-target에 대한 문제를 가져올 수밖에 없는데, WT를 사용하여 enAsCas12a 시스템에서 나타나는 Off-target에 대한 절단 문제를 키메릭 DNA-RNA의 사용을 통해 해소하였음을 확인하였다.

또한, 도 9의 C에서 확인할 수 있는 바와 같이, 키메릭 가이드 사용 AsCas12a 시스템에서는 표적 서열 근처의 nickase에 의해서만 on-target 절단이 효율적으로 일어나는 반면, enAsCas12a 시스템에서는 nickase의 바인딩 없이 효율적인 on-target 절단이 일어나는 것을 확인하였다.

또한, 도 9의 D에서 확인할 수 있는 바와 같이, On-target/off-target 측면에 AsCpf1 사용 시스템은 키메릭 DNA-RNA와 WT 간의 특이도(Specificity)에 큰 차이가 없었던 반면, enAsCpf1의 경우 키메릭 DNA-RNA 사용에 따라 특이도가 현저히 상승함을 확인하였다. 즉, enAsCas12a 시스템에서 nickase의 사용에 관계없이 표적 특이성이 2배 증가하였음을 확인하였다.

도 10은 인간 세포주(HEK293FT)에서 내인성 표적(CCR5-site1)에 대한 wt-AsCas12a 시스템과 enhanced-AsCas12a 시스템의 작동효율 및 표적 특이성을 비교한 결과를 나타낸다.

구체적으로, 도 10의 A에서 확인할 수 있는 바와 같이, CCR5-site1의 wt-Cas12a 기반 표적화의 경우, 표적 돌연변이 유도 효율은 키메라 DNA-RNA의 사용에 의해 크게 감소하였다. 또한, 도 10의 B에서 확인할 수 있는 바와 같이,　nickase-dependent 방식으로 돌연변이 유도 효율이 회복된 wt-AsCas12a와 달리 en-AsCas12a의 경우 3' 말단이 8nt DNA로 치환된 chimeric DNA-RNA를 사용하여 표적 돌연변이 효율을 nickase-independent 방식으로 유지할 수 있었다.

또한, 도 10의 C에서 확인할 수 있는 바와 같이, enAsCas12a 시스템에서　nickase 의존도가 11.25배 감소함을 확인함으로써, 키메릭 가이드 사용 AsCas12a 시스템에서는 표적 서열 근처의 nickase에 의해서만 on-target 절단이 효율적으로 일어나는 반면, enAsCas12a 시스템에서는 nickase의 바인딩 없이 효율적인 on-target 절단이 일어나는 것을 확인하였다.

또한, 도 10의 D에서 확인할 수 있는 바와 같이, enAsCas12a를 사용하여　표적 특이성이 2.79배 증가하였고, 표적 염기서열 부근의 염색체 위상이 nickase를 사용하여 변경되었을 때 키메라 DNA-RNA를 사용한 표적 특이성은 wt-AsCas12a의 표적 특이성에 비해 3.45배 더 증가하였음을 확인하였다.

도 11은 AsCas12a과 enAsCas12a 시스템의 키메릭 DNA-RNA 가이드 사용시 인체 유래 세포주내 유전자 상 표적 염기서열(CCR5-site1)에 대한 작동효율 및 표적 특이성을 비교한 결과를 나타낸다.

도 12는 인간 세포주(HEK293FT)에서 내인성 표적(AAVS1)에 대한 wt-AsCas12a 시스템과 enhanced-AsCas12a 시스템의 작동효율 및 표적 특이성을 비교한 결과를 나타낸다. 구체적으로, 도 12의 A 및 B에서 확인할 수 있는 바와 같이, AAVS1-site1 서열을 표적화하기 위해 enAsCas12a 이펙터를 사용할 때,　인델 비율(%)은 wt-Cas12a보다 3.6배 더 높게 나타났다.

반면, 오프 타겟 시퀀스(off-target1)에는 의도하지 않은 돌연변이가 더 많이 있었다. 다만, 3' 말단이 8nt DNA로 치환된 키메라 DNA-RNA를 사용함으로써 off-target1 서열에서 유도된 돌연변이의 수를 유의하게 감소시킬 수 있었다.

또한, 도 12의 C에서 확인할 수 있는 바와 같이, AAVS1 _site1에서 키메라 DNA-RNA 가이드를 사용한 경우, enAsCas12a 및 wt-AsCas12a 이펙터 모두 nickase 의존성을 나타내지 않았다.

또한, 도 12의 D에서 확인할 수 있는 바와 같이, 키메라 DNA-RNA(8DNA) 가이드된 enAsCas12a를 사용하는 경우 전체 표적 특이성이 wt-AsCas12a에 비해 3.5배 증가하였다.

도 13은 AsCas12a과 enAsCas12a 시스템의 키메릭 DNA-RNA 가이드 사용시 인체 유래 세포주내 유전자 상 표적 염기서열(AAVS1)에 대한 작동효율 및 표적 특이성을 비교한 결과를 나타낸다.

한편, wt-AsCas12a 또는 enAsCas12a를 사용하여 다양한 유전자를 표적으로 하는 돌연변이 유도 효과를 한 눈에 보기 위해 데이터를 요약하여, 도 14에 나타내었다. 도 14는 AsCas12a과 enAsCas12a 시스템의 키메릭 DNA-RNA 가이드 사용시 인체 유래 세포주내 유전자 상 표적/비표적 염기서열(AAVS1, CCR5_site1, CCR_site2, DNMT1_site1, DNMT1_site2, FANCF 및 IL12A_AS1)에 대한 작동효율을 비교한 결과를 나타낸다.

구체적으로, 도 14에서 확인할 수 있는 바와 같이, chimeric DNA-RNA-guided en-AsCas12a를 이용하여 다중 유전자의 돌연변이를 유도함으로써 nickase의 도움 없이 표적 indel 비율(%)이 평균 2.6배 향상되었으며, 오프 타겟 돌연변이 유도 효율도 감소하였다. 이에 따라, 표적 특이성은 wt-AsCas12a에 비해 2.8배 향상되었다.

이러한 결과는, chimeric-crRNA 기반 en-AsCas12a를 이용하여 표적 DNA에 돌연변이를 유도할 경우, 상이한 세포주에서 다양한 유전자에 대한 표적 돌연변이 활성을 유지하면서 오프-타겟팅 효과를 감소시킬 수 있음을 의미하는 것이다.

(2) HeLa 및 K562 세포주 내에서 실험 수행

인체유래 세포주 내 (HeLa 및 K562)에서, 키메릭 DNA-RNA 기반 AsCas12a 시스템과 enhanced-AsCas12a (E174R, S542R, K548R) 시스템 간의 표적/비표적 염기서열 교정 효율을 비교하기 위하여, AAVS1에 절단을 유도한 뒤, 상기 실시예 3의 방법과 동일한 방법을 이용하여 작동 효율 및 표적 특이성을 비교하였다.

도 15는 인간 세포주(HeLa, K562)에서 내인성 표적(AAVS1)에 대한 wt-AsCas12a 시스템과 enhanced-AsCas12a 시스템의 작동효율 및 표적 특이성을 비교한 결과를 나타낸다.

구체적으로, 도 15의 A 및 C에서 확인할 수 있는 바와 같이, 3' 말단에 8nt DNA 치환을 갖는 키메라 DNA-RNA 가이드를 기반으로 하는 enAsCas12a 이펙터의 경우, 상기 HEK293FT 세포주에서와 동일하게 인델 비율(%)이 wt-AsCas12a에 비해 유의하게 증가되었다.　또한, 표적을 벗어난 뉴클레오티드 서열에 의해 유도된 돌연변이가 극적으로 감소하였다.

또한, 도 15의 B 및 D에서 확인할 수 있는 바와 같이, On-target/off-target 측면에 AsCpf1 사용 시스템은 상기 HEK293FT 세포주에서와 동일하게 키메릭 DNA-RNA와 WT 간의 특이도(Specificity)에 큰 차이가 없거나, 오히려 키메릭 DNA-RNA이용시 특이도가 현저히 감소하는 반면, enAsCpf1의 경우 키메릭 DNA-RNA 사용에 따라 특이도가 현저히 상승함을 확인하였다. 즉, enAsCas12a 시스템에서 nickase의 사용에 관계없이 표적 특이성이 2배 이상 증가하였음을 확인하였다.

이제까지 본 발명에 대하여 그 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.

<110> Korea Research Institute of Bioscience and Biotechnology <120> Composition for Genome Editing or Inhibiting Gene Expression comprising Cpf1 and Chimeric DNA-RNA Guide <130> P22021-KRIBB-PA <150> KR 10-2021-0078378 <151> 2021-06-17 <160> 201 <170> KoPatentIn 3.0 <210> 1 <211> 1307 <212> PRT <213> Artificial Sequence <220> <223> WT <400> 1 Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr 1 5 10 15 Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln 20 25 30 Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys 35 40 45 Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln 50 55 60 Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile 65 70 75 80 Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile 85 90 95 Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly 100 105 110 Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile 115 120 125 Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys 130 135 140 Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg 145 150 155 160 Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg 165 170 175 Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg 180 185 190 Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe 195 200 205 Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn 210 215 220 Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val 225 230 235 240 Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp 245 250 255 Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu 260 265 270 Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn 275 280 285 Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro 290 295 300 Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu 305 310 315 320 Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr 325 330 335 Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu 340 345 350 Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His 355 360 365 Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr 370 375 380 Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys 385 390 395 400 Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu 405 410 415 Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser 420 425 430 Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala 435 440 445 Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys 450 455 460 Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu 465 470 475 480 Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe 485 490 495 Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser 500 505 510 Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val 515 520 525 Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp 530 535 540 Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn 545 550 555 560 Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys 565 570 575 Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys 580 585 590 Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys 595 600 605 Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr 610 615 620 Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys 625 630 635 640 Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln 645 650 655 Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala 660 665 670 Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr 675 680 685 Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr 690 695 700 Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His 705 710 715 720 Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu 725 730 735 Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys 740 745 750 Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu 755 760 765 Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln 770 775 780 Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His 785 790 795 800 Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr 805 810 815 Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His 820 825 830 Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn 835 840 845 Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe 850 855 860 Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln 865 870 875 880 Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu 885 890 895 Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg 900 905 910 Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu 915 920 925 Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu 930 935 940 Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val 945 950 955 960 Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile 965 970 975 His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu 980 985 990 Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu 995 1000 1005 Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn 1010 1015 1020 Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu 1025 1030 1035 1040 Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly 1045 1050 1055 Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys 1060 1065 1070 Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile 1075 1080 1085 Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu 1090 1095 1100 His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn 1105 1110 1115 1120 Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp 1125 1130 1135 Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr 1140 1145 1150 Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His Arg 1155 1160 1165 Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala 1170 1175 1180 Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu 1185 1190 1195 1200 Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val 1205 1210 1215 Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr 1220 1225 1230 Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys 1235 1240 1245 Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala 1250 1255 1260 Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His 1265 1270 1275 1280 Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln 1285 1290 1295 Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn 1300 1305 <210> 2 <211> 3921 <212> DNA <213> Artificial Sequence <220> <223> WT <400> 2 atgacacagt tcgagggctt taccaacctg tatcaggtga gcaagacact gcggtttgag 60 ctgatcccac agggcaagac cctgaagcac atccaggagc agggcttcat cgaggaggac 120 aaggcccgca atgatcacta caaggagctg aagcccatca tcgatcggat ctacaagacc 180 tatgccgacc agtgcctgca gctggtgcag ctggattggg agaacctgag cgccgccatc 240 gactcctata gaaaggagaa aaccgaggag acaaggaacg ccctgatcga ggagcaggcc 300 acatatcgca atgccatcca cgactacttc atcggccgga cagacaacct gaccgatgcc 360 atcaataaga gacacgccga gatctacaag ggcctgttca aggccgagct gtttaatggc 420 aaggtgctga agcagctggg caccgtgacc acaaccgagc acgagaacgc cctgctgcgg 480 agcttcgaca agtttacaac ctacttctcc ggcttttatg agaacaggaa gaacgtgttc 540 agcgccgagg atatcagcac agccatccca caccgcatcg tgcaggacaa cttccccaag 600 tttaaggaga attgtcacat cttcacacgc ctgatcaccg ccgtgcccag cctgcgggag 660 cactttgaga acgtgaagaa ggccatcggc atcttcgtga gcacctccat cgaggaggtg 720 ttttccttcc ctttttataa ccagctgctg acacagaccc agatcgacct gtataaccag 780 ctgctgggag gaatctctcg ggaggcaggc accgagaaga tcaagggcct gaacgaggtg 840 ctgaatctgg ccatccagaa gaatgatgag acagcccaca tcatcgcctc cctgccacac 900 agattcatcc ccctgtttaa gcagatcctg tccgatagga acaccctgtc tttcatcctg 960 gaggagttta agagcgacga ggaagtgatc cagtccttct gcaagtacaa gacactgctg 1020 agaaacgaga acgtgctgga gacagccgag gccctgttta acgagctgaa cagcatcgac 1080 ctgacacaca tcttcatcag ccacaagaag ctggagacaa tcagcagcgc cctgtgcgac 1140 cactgggata cactgaggaa tgccctgtat gagcggagaa tctccgagct gacaggcaag 1200 atcaccaagt ctgccaagga gaaggtgcag cgcagcctga agcacgagga tatcaacctg 1260 caggagatca tctctgccgc aggcaaggag ctgagcgagg ccttcaagca gaaaaccagc 1320 gagatcctgt cccacgcaca cgccgccctg gatcagccac tgcctacaac cctgaagaag 1380 caggaggaga aggagatcct gaagtctcag ctggacagcc tgctgggcct gtaccacctg 1440 ctggactggt ttgccgtgga tgagtccaac gaggtggacc ccgagttctc tgcccggctg 1500 accggcatca agctggagat ggagccttct ctgagcttct acaacaaggc cagaaattat 1560 gccaccaaga agccctactc cgtggagaag ttcaagctga actttcagat gcctacactg 1620 gcctctggct gggacgtgaa taaggagaag aacaatggcg ccatcctgtt tgtgaagaac 1680 ggcctgtact atctgggcat catgccaaag cagaagggca ggtataaggc cctgagcttc 1740 gagcccacag agaaaaccag cgagggcttt gataagatgt actatgacta cttccctgat 1800 gccgccaaga tgatcccaaa gtgcagcacc cagctgaagg ccgtgacagc ccactttcag 1860 acccacacaa cccccatcct gctgtccaac aatttcatcg agcctctgga gatcacaaag 1920 gagatctacg acctgaacaa tcctgagaag gagccaaaga agtttcagac agcctacgcc 1980 aagaaaaccg gcgaccagaa gggctacaga gaggccctgt gcaagtggat cgacttcaca 2040 agggattttc tgtccaagta taccaagaca acctctatcg atctgtctag cctgcggcca 2100 tcctctcagt ataaggacct gggcgagtac tatgccgagc tgaatcccct gctgtaccac 2160 atcagcttcc agagaatcgc cgagaaggag atcatggatg ccgtggagac aggcaagctg 2220 tacctgttcc agatctataa caaggacttt gccaagggcc accacggcaa gcctaatctg 2280 cacacactgt attggaccgg cctgttttct ccagagaacc tggccaagac aagcatcaag 2340 ctgaatggcc aggccgagct gttctaccgc cctaagtcca ggatgaagag gatggcacac 2400 cggctgggag agaagatgct gaacaagaag ctgaaggatc agaaaacccc aatccccgac 2460 accctgtacc aggagctgta cgactatgtg aatcacagac tgtcccacga cctgtctgat 2520 gaggccaggg ccctgctgcc caacgtgatc accaaggagg tgtctcacga gatcatcaag 2580 gataggcgct ttaccagcga caagttcttt ttccacgtgc ctatcacact gaactatcag 2640 gccgccaatt ccccatctaa gttcaaccag agggtgaatg cctacctgaa ggagcacccc 2700 gagacaccta tcatcggcat cgatcggggc gagagaaacc tgatctatat cacagtgatc 2760 gactccaccg gcaagatcct ggagcagcgg agcctgaaca ccatccagca gtttgattac 2820 cagaagaagc tggacaacag ggagaaggag agggtggcag caaggcaggc ctggtctgtg 2880 gtgggcacaa tcaaggatct gaagcagggc tatctgagcc aggtcatcca cgagatcgtg 2940 gacctgatga tccactacca ggccgtggtg gtgctggaga acctgaattt cggctttaag 3000 agcaagagga ccggcatcgc cgagaaggcc gtgtaccagc agttcgagaa gatgctgatc 3060 gataagctga attgcctggt gctgaaggac tatccagcag agaaagtggg aggcgtgctg 3120 aacccatacc agctgacaga ccagttcacc tcctttgcca agatgggcac ccagtctggc 3180 ttcctgtttt acgtgcctgc cccatataca tctaagatcg atcccctgac cggcttcgtg 3240 gaccccttcg tgtggaaaac catcaagaat cacgagagcc gcaagcactt cctggagggc 3300 ttcgactttc tgcactacga cgtgaaaacc ggcgacttca tcctgcactt taagatgaac 3360 agaaatctgt ccttccagag gggcctgccc ggctttatgc ctgcatggga tatcgtgttc 3420 gagaagaacg agacacagtt tgacgccaag ggcacccctt tcatcgccgg caagagaatc 3480 gtgccagtga tcgagaatca cagattcacc ggcagatacc gggacctgta tcctgccaac 3540 gagctgatcg ccctgctgga ggagaagggc atcgtgttca gggatggctc caacatcctg 3600 ccaaagctgc tggagaatga cgattctcac gccatcgaca ccatggtggc cctgatccgc 3660 agcgtgctgc agatgcggaa ctccaatgcc gccacaggcg aggactatat caacagcccc 3720 gtgcgcgatc tgaatggcgt gtgcttcgac tcccggtttc agaacccaga gtggcccatg 3780 gacgccgatg ccaatggcgc ctaccacatc gccctgaagg gccagctgct gctgaatcac 3840 ctgaaggaga gcaaggatct gaagctgcag aacggcatct ccaatcagga ctggctggcc 3900 tacatccagg agctgcgcaa c 3921 <210> 3 <211> 1307 <212> PRT <213> Artificial Sequence <220> <223> S170R/E174R <400> 3 Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr 1 5 10 15 Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln 20 25 30 Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys 35 40 45 Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln 50 55 60 Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile 65 70 75 80 Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile 85 90 95 Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly 100 105 110 Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile 115 120 125 Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys 130 135 140 Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg 145 150 155 160 Ser Phe Asp Lys Phe Thr Thr Tyr Phe Arg Gly Phe Tyr Arg Asn Arg 165 170 175 Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg 180 185 190 Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe 195 200 205 Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn 210 215 220 Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val 225 230 235 240 Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp 245 250 255 Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu 260 265 270 Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn 275 280 285 Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro 290 295 300 Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu 305 310 315 320 Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr 325 330 335 Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu 340 345 350 Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His 355 360 365 Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr 370 375 380 Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys 385 390 395 400 Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu 405 410 415 Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser 420 425 430 Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala 435 440 445 Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys 450 455 460 Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu 465 470 475 480 Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe 485 490 495 Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser 500 505 510 Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val 515 520 525 Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Arg Gly Trp 530 535 540 Asp Val Asn Arg Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn 545 550 555 560 Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys 565 570 575 Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys 580 585 590 Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys 595 600 605 Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr 610 615 620 Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys 625 630 635 640 Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln 645 650 655 Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala 660 665 670 Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr 675 680 685 Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr 690 695 700 Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His 705 710 715 720 Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu 725 730 735 Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys 740 745 750 Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu 755 760 765 Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln 770 775 780 Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His 785 790 795 800 Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr 805 810 815 Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His 820 825 830 Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn 835 840 845 Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe 850 855 860 Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln 865 870 875 880 Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu 885 890 895 Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg 900 905 910 Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu 915 920 925 Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu 930 935 940 Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val 945 950 955 960 Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile 965 970 975 His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu 980 985 990 Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu 995 1000 1005 Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn 1010 1015 1020 Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu 1025 1030 1035 1040 Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly 1045 1050 1055 Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys 1060 1065 1070 Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile 1075 1080 1085 Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu 1090 1095 1100 His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn 1105 1110 1115 1120 Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp 1125 1130 1135 Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr 1140 1145 1150 Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His Arg 1155 1160 1165 Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala 1170 1175 1180 Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu 1185 1190 1195 1200 Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val 1205 1210 1215 Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr 1220 1225 1230 Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys 1235 1240 1245 Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala 1250 1255 1260 Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His 1265 1270 1275 1280 Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln 1285 1290 1295 Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn 1300 1305 <210> 4 <211> 3921 <212> DNA <213> Artificial Sequence <220> <223> S170R/E174R <400> 4 atgacacagt tcgagggctt taccaacctg tatcaggtga gcaagacact gcggtttgag 60 ctgatcccac agggcaagac cctgaagcac atccaggagc agggcttcat cgaggaggac 120 aaggcccgca atgatcacta caaggagctg aagcccatca tcgatcggat ctacaagacc 180 tatgccgacc agtgcctgca gctggtgcag ctggattggg agaacctgag cgccgccatc 240 gactcctata gaaaggagaa aaccgaggag acaaggaacg ccctgatcga ggagcaggcc 300 acatatcgca atgccatcca cgactacttc atcggccgga cagacaacct gaccgatgcc 360 atcaataaga gacacgccga gatctacaag ggcctgttca aggccgagct gtttaatggc 420 aaggtgctga agcagctggg caccgtgacc acaaccgagc acgagaacgc cctgctgcgg 480 agcttcgaca agtttacaac ctacttcagg ggcttttata ggaacaggaa gaacgtgttc 540 agcgccgagg atatcagcac agccatccca caccgcatcg tgcaggacaa cttccccaag 600 tttaaggaga attgtcacat cttcacacgc ctgatcaccg ccgtgcccag cctgcgggag 660 cactttgaga acgtgaagaa ggccatcggc atcttcgtga gcacctccat cgaggaggtg 720 ttttccttcc ctttttataa ccagctgctg acacagaccc agatcgacct gtataaccag 780 ctgctgggag gaatctctcg ggaggcaggc accgagaaga tcaagggcct gaacgaggtg 840 ctgaatctgg ccatccagaa gaatgatgag acagcccaca tcatcgcctc cctgccacac 900 agattcatcc ccctgtttaa gcagatcctg tccgatagga acaccctgtc tttcatcctg 960 gaggagttta agagcgacga ggaagtgatc cagtccttct gcaagtacaa gacactgctg 1020 agaaacgaga acgtgctgga gacagccgag gccctgttta acgagctgaa cagcatcgac 1080 ctgacacaca tcttcatcag ccacaagaag ctggagacaa tcagcagcgc cctgtgcgac 1140 cactgggata cactgaggaa tgccctgtat gagcggagaa tctccgagct gacaggcaag 1200 atcaccaagt ctgccaagga gaaggtgcag cgcagcctga agcacgagga tatcaacctg 1260 caggagatca tctctgccgc aggcaaggag ctgagcgagg ccttcaagca gaaaaccagc 1320 gagatcctgt cccacgcaca cgccgccctg gatcagccac tgcctacaac cctgaagaag 1380 caggaggaga aggagatcct gaagtctcag ctggacagcc tgctgggcct gtaccacctg 1440 ctggactggt ttgccgtgga tgagtccaac gaggtggacc ccgagttctc tgcccggctg 1500 accggcatca agctggagat ggagccttct ctgagcttct acaacaaggc cagaaattat 1560 gccaccaaga agccctactc cgtggagaag ttcaagctga actttcagat gcctacactg 1620 gcccggggct gggacgtgaa tcgggagaag aacaatggcg ccatcctgtt tgtgaagaac 1680 ggcctgtact atctgggcat catgccaaag cagaagggca ggtataaggc cctgagcttc 1740 gagcccacag agaaaaccag cgagggcttt gataagatgt actatgacta cttccctgat 1800 gccgccaaga tgatcccaaa gtgcagcacc cagctgaagg ccgtgacagc ccactttcag 1860 acccacacaa cccccatcct gctgtccaac aatttcatcg agcctctgga gatcacaaag 1920 gagatctacg acctgaacaa tcctgagaag gagccaaaga agtttcagac agcctacgcc 1980 aagaaaaccg gcgaccagaa gggctacaga gaggccctgt gcaagtggat cgacttcaca 2040 agggattttc tgtccaagta taccaagaca acctctatcg atctgtctag cctgcggcca 2100 tcctctcagt ataaggacct gggcgagtac tatgccgagc tgaatcccct gctgtaccac 2160 atcagcttcc agagaatcgc cgagaaggag atcatggatg ccgtggagac aggcaagctg 2220 tacctgttcc agatctataa caaggacttt gccaagggcc accacggcaa gcctaatctg 2280 cacacactgt attggaccgg cctgttttct ccagagaacc tggccaagac aagcatcaag 2340 ctgaatggcc aggccgagct gttctaccgc cctaagtcca ggatgaagag gatggcacac 2400 cggctgggag agaagatgct gaacaagaag ctgaaggatc agaaaacccc aatccccgac 2460 accctgtacc aggagctgta cgactatgtg aatcacagac tgtcccacga cctgtctgat 2520 gaggccaggg ccctgctgcc caacgtgatc accaaggagg tgtctcacga gatcatcaag 2580 gataggcgct ttaccagcga caagttcttt ttccacgtgc ctatcacact gaactatcag 2640 gccgccaatt ccccatctaa gttcaaccag agggtgaatg cctacctgaa ggagcacccc 2700 gagacaccta tcatcggcat cgatcggggc gagagaaacc tgatctatat cacagtgatc 2760 gactccaccg gcaagatcct ggagcagcgg agcctgaaca ccatccagca gtttgattac 2820 cagaagaagc tggacaacag ggagaaggag agggtggcag caaggcaggc ctggtctgtg 2880 gtgggcacaa tcaaggatct gaagcagggc tatctgagcc aggtcatcca cgagatcgtg 2940 gacctgatga tccactacca ggccgtggtg gtgctggaga acctgaattt cggctttaag 3000 agcaagagga ccggcatcgc cgagaaggcc gtgtaccagc agttcgagaa gatgctgatc 3060 gataagctga attgcctggt gctgaaggac tatccagcag agaaagtggg aggcgtgctg 3120 aacccatacc agctgacaga ccagttcacc tcctttgcca agatgggcac ccagtctggc 3180 ttcctgtttt acgtgcctgc cccatataca tctaagatcg atcccctgac cggcttcgtg 3240 gaccccttcg tgtggaaaac catcaagaat cacgagagcc gcaagcactt cctggagggc 3300 ttcgactttc tgcactacga cgtgaaaacc ggcgacttca tcctgcactt taagatgaac 3360 agaaatctgt ccttccagag gggcctgccc ggctttatgc ctgcatggga tatcgtgttc 3420 gagaagaacg agacacagtt tgacgccaag ggcacccctt tcatcgccgg caagagaatc 3480 gtgccagtga tcgagaatca cagattcacc ggcagatacc gggacctgta tcctgccaac 3540 gagctgatcg ccctgctgga ggagaagggc atcgtgttca gggatggctc caacatcctg 3600 ccaaagctgc tggagaatga cgattctcac gccatcgaca ccatggtggc cctgatccgc 3660 agcgtgctgc agatgcggaa ctccaatgcc gccacaggcg aggactatat caacagcccc 3720 gtgcgcgatc tgaatggcgt gtgcttcgac tcccggtttc agaacccaga gtggcccatg 3780 gacgccgatg ccaatggcgc ctaccacatc gccctgaagg gccagctgct gctgaatcac 3840 ctgaaggaga gcaaggatct gaagctgcag aacggcatct ccaatcagga ctggctggcc 3900 tacatccagg agctgcgcaa c 3921 <210> 5 <211> 1307 <212> PRT <213> Artificial Sequence <220> <223> E174R/K548R <400> 5 Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr 1 5 10 15 Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln 20 25 30 Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys 35 40 45 Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln 50 55 60 Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile 65 70 75 80 Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile 85 90 95 Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly 100 105 110 Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile 115 120 125 Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys 130 135 140 Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg 145 150 155 160 Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Arg Asn Arg 165 170 175 Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg 180 185 190 Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe 195 200 205 Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn 210 215 220 Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val 225 230 235 240 Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp 245 250 255 Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu 260 265 270 Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn 275 280 285 Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro 290 295 300 Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu 305 310 315 320 Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr 325 330 335 Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu 340 345 350 Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His 355 360 365 Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr 370 375 380 Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys 385 390 395 400 Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu 405 410 415 Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser 420 425 430 Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala 435 440 445 Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys 450 455 460 Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu 465 470 475 480 Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe 485 490 495 Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser 500 505 510 Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val 515 520 525 Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Arg Gly Trp 530 535 540 Asp Val Asn Arg Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn 545 550 555 560 Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys 565 570 575 Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys 580 585 590 Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys 595 600 605 Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr 610 615 620 Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys 625 630 635 640 Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln 645 650 655 Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala 660 665 670 Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr 675 680 685 Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr 690 695 700 Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His 705 710 715 720 Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu 725 730 735 Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys 740 745 750 Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu 755 760 765 Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln 770 775 780 Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His 785 790 795 800 Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr 805 810 815 Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His 820 825 830 Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn 835 840 845 Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe 850 855 860 Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln 865 870 875 880 Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu 885 890 895 Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg 900 905 910 Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu 915 920 925 Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu 930 935 940 Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val 945 950 955 960 Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile 965 970 975 His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu 980 985 990 Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu 995 1000 1005 Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn 1010 1015 1020 Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu 1025 1030 1035 1040 Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly 1045 1050 1055 Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys 1060 1065 1070 Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile 1075 1080 1085 Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu 1090 1095 1100 His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn 1105 1110 1115 1120 Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp 1125 1130 1135 Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr 1140 1145 1150 Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His Arg 1155 1160 1165 Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala 1170 1175 1180 Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu 1185 1190 1195 1200 Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val 1205 1210 1215 Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr 1220 1225 1230 Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys 1235 1240 1245 Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala 1250 1255 1260 Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His 1265 1270 1275 1280 Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln 1285 1290 1295 Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn 1300 1305 <210> 6 <211> 3921 <212> DNA <213> Artificial Sequence <220> <223> E174R/K548R <400> 6 atgacacagt tcgagggctt taccaacctg tatcaggtga gcaagacact gcggtttgag 60 ctgatcccac agggcaagac cctgaagcac atccaggagc agggcttcat cgaggaggac 120 aaggcccgca atgatcacta caaggagctg aagcccatca tcgatcggat ctacaagacc 180 tatgccgacc agtgcctgca gctggtgcag ctggattggg agaacctgag cgccgccatc 240 gactcctata gaaaggagaa aaccgaggag acaaggaacg ccctgatcga ggagcaggcc 300 acatatcgca atgccatcca cgactacttc atcggccgga cagacaacct gaccgatgcc 360 atcaataaga gacacgccga gatctacaag ggcctgttca aggccgagct gtttaatggc 420 aaggtgctga agcagctggg caccgtgacc acaaccgagc acgagaacgc cctgctgcgg 480 agcttcgaca agtttacaac ctacttctcc ggcttttata ggaacaggaa gaacgtgttc 540 agcgccgagg atatcagcac agccatccca caccgcatcg tgcaggacaa cttccccaag 600 tttaaggaga attgtcacat cttcacacgc ctgatcaccg ccgtgcccag cctgcgggag 660 cactttgaga acgtgaagaa ggccatcggc atcttcgtga gcacctccat cgaggaggtg 720 ttttccttcc ctttttataa ccagctgctg acacagaccc agatcgacct gtataaccag 780 ctgctgggag gaatctctcg ggaggcaggc accgagaaga tcaagggcct gaacgaggtg 840 ctgaatctgg ccatccagaa gaatgatgag acagcccaca tcatcgcctc cctgccacac 900 agattcatcc ccctgtttaa gcagatcctg tccgatagga acaccctgtc tttcatcctg 960 gaggagttta agagcgacga ggaagtgatc cagtccttct gcaagtacaa gacactgctg 1020 agaaacgaga acgtgctgga gacagccgag gccctgttta acgagctgaa cagcatcgac 1080 ctgacacaca tcttcatcag ccacaagaag ctggagacaa tcagcagcgc cctgtgcgac 1140 cactgggata cactgaggaa tgccctgtat gagcggagaa tctccgagct gacaggcaag 1200 atcaccaagt ctgccaagga gaaggtgcag cgcagcctga agcacgagga tatcaacctg 1260 caggagatca tctctgccgc aggcaaggag ctgagcgagg ccttcaagca gaaaaccagc 1320 gagatcctgt cccacgcaca cgccgccctg gatcagccac tgcctacaac cctgaagaag 1380 caggaggaga aggagatcct gaagtctcag ctggacagcc tgctgggcct gtaccacctg 1440 ctggactggt ttgccgtgga tgagtccaac gaggtggacc ccgagttctc tgcccggctg 1500 accggcatca agctggagat ggagccttct ctgagcttct acaacaaggc cagaaattat 1560 gccaccaaga agccctactc cgtggagaag ttcaagctga actttcagat gcctacactg 1620 gcccggggct gggacgtgaa tcgggagaag aacaatggcg ccatcctgtt tgtgaagaac 1680 ggcctgtact atctgggcat catgccaaag cagaagggca ggtataaggc cctgagcttc 1740 gagcccacag agaaaaccag cgagggcttt gataagatgt actatgacta cttccctgat 1800 gccgccaaga tgatcccaaa gtgcagcacc cagctgaagg ccgtgacagc ccactttcag 1860 acccacacaa cccccatcct gctgtccaac aatttcatcg agcctctgga gatcacaaag 1920 gagatctacg acctgaacaa tcctgagaag gagccaaaga agtttcagac agcctacgcc 1980 aagaaaaccg gcgaccagaa gggctacaga gaggccctgt gcaagtggat cgacttcaca 2040 agggattttc tgtccaagta taccaagaca acctctatcg atctgtctag cctgcggcca 2100 tcctctcagt ataaggacct gggcgagtac tatgccgagc tgaatcccct gctgtaccac 2160 atcagcttcc agagaatcgc cgagaaggag atcatggatg ccgtggagac aggcaagctg 2220 tacctgttcc agatctataa caaggacttt gccaagggcc accacggcaa gcctaatctg 2280 cacacactgt attggaccgg cctgttttct ccagagaacc tggccaagac aagcatcaag 2340 ctgaatggcc aggccgagct gttctaccgc cctaagtcca ggatgaagag gatggcacac 2400 cggctgggag agaagatgct gaacaagaag ctgaaggatc agaaaacccc aatccccgac 2460 accctgtacc aggagctgta cgactatgtg aatcacagac tgtcccacga cctgtctgat 2520 gaggccaggg ccctgctgcc caacgtgatc accaaggagg tgtctcacga gatcatcaag 2580 gataggcgct ttaccagcga caagttcttt ttccacgtgc ctatcacact gaactatcag 2640 gccgccaatt ccccatctaa gttcaaccag agggtgaatg cctacctgaa ggagcacccc 2700 gagacaccta tcatcggcat cgatcggggc gagagaaacc tgatctatat cacagtgatc 2760 gactccaccg gcaagatcct ggagcagcgg agcctgaaca ccatccagca gtttgattac 2820 cagaagaagc tggacaacag ggagaaggag agggtggcag caaggcaggc ctggtctgtg 2880 gtgggcacaa tcaaggatct gaagcagggc tatctgagcc aggtcatcca cgagatcgtg 2940 gacctgatga tccactacca ggccgtggtg gtgctggaga acctgaattt cggctttaag 3000 agcaagagga ccggcatcgc cgagaaggcc gtgtaccagc agttcgagaa gatgctgatc 3060 gataagctga attgcctggt gctgaaggac tatccagcag agaaagtggg aggcgtgctg 3120 aacccatacc agctgacaga ccagttcacc tcctttgcca agatgggcac ccagtctggc 3180 ttcctgtttt acgtgcctgc cccatataca tctaagatcg atcccctgac cggcttcgtg 3240 gaccccttcg tgtggaaaac catcaagaat cacgagagcc gcaagcactt cctggagggc 3300 ttcgactttc tgcactacga cgtgaaaacc ggcgacttca tcctgcactt taagatgaac 3360 agaaatctgt ccttccagag gggcctgccc ggctttatgc ctgcatggga tatcgtgttc 3420 gagaagaacg agacacagtt tgacgccaag ggcacccctt tcatcgccgg caagagaatc 3480 gtgccagtga tcgagaatca cagattcacc ggcagatacc gggacctgta tcctgccaac 3540 gagctgatcg ccctgctgga ggagaagggc atcgtgttca gggatggctc caacatcctg 3600 ccaaagctgc tggagaatga cgattctcac gccatcgaca ccatggtggc cctgatccgc 3660 agcgtgctgc agatgcggaa ctccaatgcc gccacaggcg aggactatat caacagcccc 3720 gtgcgcgatc tgaatggcgt gtgcttcgac tcccggtttc agaacccaga gtggcccatg 3780 gacgccgatg ccaatggcgc ctaccacatc gccctgaagg gccagctgct gctgaatcac 3840 ctgaaggaga gcaaggatct gaagctgcag aacggcatct ccaatcagga ctggctggcc 3900 tacatccagg agctgcgcaa c 3921 <210> 7 <211> 1307 <212> PRT <213> Artificial Sequence <220> <223> S170R/K548R <400> 7 Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr 1 5 10 15 Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln 20 25 30 Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys 35 40 45 Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln 50 55 60 Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile 65 70 75 80 Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile 85 90 95 Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly 100 105 110 Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile 115 120 125 Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys 130 135 140 Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg 145 150 155 160 Ser Phe Asp Lys Phe Thr Thr Tyr Phe Arg Gly Phe Tyr Arg Asn Arg 165 170 175 Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg 180 185 190 Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe 195 200 205 Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn 210 215 220 Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val 225 230 235 240 Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp 245 250 255 Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu 260 265 270 Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn 275 280 285 Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro 290 295 300 Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu 305 310 315 320 Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr 325 330 335 Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu 340 345 350 Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His 355 360 365 Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr 370 375 380 Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys 385 390 395 400 Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu 405 410 415 Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser 420 425 430 Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala 435 440 445 Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys 450 455 460 Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu 465 470 475 480 Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe 485 490 495 Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser 500 505 510 Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val 515 520 525 Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Arg Gly Trp 530 535 540 Asp Val Asn Arg Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn 545 550 555 560 Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys 565 570 575 Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys 580 585 590 Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys 595 600 605 Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr 610 615 620 Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys 625 630 635 640 Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln 645 650 655 Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala 660 665 670 Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr 675 680 685 Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr 690 695 700 Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His 705 710 715 720 Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu 725 730 735 Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys 740 745 750 Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu 755 760 765 Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln 770 775 780 Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His 785 790 795 800 Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr 805 810 815 Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His 820 825 830 Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn 835 840 845 Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe 850 855 860 Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln 865 870 875 880 Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu 885 890 895 Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg 900 905 910 Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu 915 920 925 Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu 930 935 940 Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val 945 950 955 960 Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile 965 970 975 His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu 980 985 990 Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu 995 1000 1005 Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn 1010 1015 1020 Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu 1025 1030 1035 1040 Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly 1045 1050 1055 Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys 1060 1065 1070 Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile 1075 1080 1085 Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu 1090 1095 1100 His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn 1105 1110 1115 1120 Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp 1125 1130 1135 Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr 1140 1145 1150 Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His Arg 1155 1160 1165 Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala 1170 1175 1180 Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu 1185 1190 1195 1200 Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val 1205 1210 1215 Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr 1220 1225 1230 Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys 1235 1240 1245 Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala 1250 1255 1260 Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His 1265 1270 1275 1280 Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln 1285 1290 1295 Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn 1300 1305 <210> 8 <211> 3921 <212> DNA <213> Artificial Sequence <220> <223> S170R/K548R <400> 8 atgacacagt tcgagggctt taccaacctg tatcaggtga gcaagacact gcggtttgag 60 ctgatcccac agggcaagac cctgaagcac atccaggagc agggcttcat cgaggaggac 120 aaggcccgca atgatcacta caaggagctg aagcccatca tcgatcggat ctacaagacc 180 tatgccgacc agtgcctgca gctggtgcag ctggattggg agaacctgag cgccgccatc 240 gactcctata gaaaggagaa aaccgaggag acaaggaacg ccctgatcga ggagcaggcc 300 acatatcgca atgccatcca cgactacttc atcggccgga cagacaacct gaccgatgcc 360 atcaataaga gacacgccga gatctacaag ggcctgttca aggccgagct gtttaatggc 420 aaggtgctga agcagctggg caccgtgacc acaaccgagc acgagaacgc cctgctgcgg 480 agcttcgaca agtttacaac ctacttcagg ggcttttata ggaacaggaa gaacgtgttc 540 agcgccgagg atatcagcac agccatccca caccgcatcg tgcaggacaa cttccccaag 600 tttaaggaga attgtcacat cttcacacgc ctgatcaccg ccgtgcccag cctgcgggag 660 cactttgaga acgtgaagaa ggccatcggc atcttcgtga gcacctccat cgaggaggtg 720 ttttccttcc ctttttataa ccagctgctg acacagaccc agatcgacct gtataaccag 780 ctgctgggag gaatctctcg ggaggcaggc accgagaaga tcaagggcct gaacgaggtg 840 ctgaatctgg ccatccagaa gaatgatgag acagcccaca tcatcgcctc cctgccacac 900 agattcatcc ccctgtttaa gcagatcctg tccgatagga acaccctgtc tttcatcctg 960 gaggagttta agagcgacga ggaagtgatc cagtccttct gcaagtacaa gacactgctg 1020 agaaacgaga acgtgctgga gacagccgag gccctgttta acgagctgaa cagcatcgac 1080 ctgacacaca tcttcatcag ccacaagaag ctggagacaa tcagcagcgc cctgtgcgac 1140 cactgggata cactgaggaa tgccctgtat gagcggagaa tctccgagct gacaggcaag 1200 atcaccaagt ctgccaagga gaaggtgcag cgcagcctga agcacgagga tatcaacctg 1260 caggagatca tctctgccgc aggcaaggag ctgagcgagg ccttcaagca gaaaaccagc 1320 gagatcctgt cccacgcaca cgccgccctg gatcagccac tgcctacaac cctgaagaag 1380 caggaggaga aggagatcct gaagtctcag ctggacagcc tgctgggcct gtaccacctg 1440 ctggactggt ttgccgtgga tgagtccaac gaggtggacc ccgagttctc tgcccggctg 1500 accggcatca agctggagat ggagccttct ctgagcttct acaacaaggc cagaaattat 1560 gccaccaaga agccctactc cgtggagaag ttcaagctga actttcagat gcctacactg 1620 gcccggggct gggacgtgaa tcgggagaag aacaatggcg ccatcctgtt tgtgaagaac 1680 ggcctgtact atctgggcat catgccaaag cagaagggca ggtataaggc cctgagcttc 1740 gagcccacag agaaaaccag cgagggcttt gataagatgt actatgacta cttccctgat 1800 gccgccaaga tgatcccaaa gtgcagcacc cagctgaagg ccgtgacagc ccactttcag 1860 acccacacaa cccccatcct gctgtccaac aatttcatcg agcctctgga gatcacaaag 1920 gagatctacg acctgaacaa tcctgagaag gagccaaaga agtttcagac agcctacgcc 1980 aagaaaaccg gcgaccagaa gggctacaga gaggccctgt gcaagtggat cgacttcaca 2040 agggattttc tgtccaagta taccaagaca acctctatcg atctgtctag cctgcggcca 2100 tcctctcagt ataaggacct gggcgagtac tatgccgagc tgaatcccct gctgtaccac 2160 atcagcttcc agagaatcgc cgagaaggag atcatggatg ccgtggagac aggcaagctg 2220 tacctgttcc agatctataa caaggacttt gccaagggcc accacggcaa gcctaatctg 2280 cacacactgt attggaccgg cctgttttct ccagagaacc tggccaagac aagcatcaag 2340 ctgaatggcc aggccgagct gttctaccgc cctaagtcca ggatgaagag gatggcacac 2400 cggctgggag agaagatgct gaacaagaag ctgaaggatc agaaaacccc aatccccgac 2460 accctgtacc aggagctgta cgactatgtg aatcacagac tgtcccacga cctgtctgat 2520 gaggccaggg ccctgctgcc caacgtgatc accaaggagg tgtctcacga gatcatcaag 2580 gataggcgct ttaccagcga caagttcttt ttccacgtgc ctatcacact gaactatcag 2640 gccgccaatt ccccatctaa gttcaaccag agggtgaatg cctacctgaa ggagcacccc 2700 gagacaccta tcatcggcat cgatcggggc gagagaaacc tgatctatat cacagtgatc 2760 gactccaccg gcaagatcct ggagcagcgg agcctgaaca ccatccagca gtttgattac 2820 cagaagaagc tggacaacag ggagaaggag agggtggcag caaggcaggc ctggtctgtg 2880 gtgggcacaa tcaaggatct gaagcagggc tatctgagcc aggtcatcca cgagatcgtg 2940 gacctgatga tccactacca ggccgtggtg gtgctggaga acctgaattt cggctttaag 3000 agcaagagga ccggcatcgc cgagaaggcc gtgtaccagc agttcgagaa gatgctgatc 3060 gataagctga attgcctggt gctgaaggac tatccagcag agaaagtggg aggcgtgctg 3120 aacccatacc agctgacaga ccagttcacc tcctttgcca agatgggcac ccagtctggc 3180 ttcctgtttt acgtgcctgc cccatataca tctaagatcg atcccctgac cggcttcgtg 3240 gaccccttcg tgtggaaaac catcaagaat cacgagagcc gcaagcactt cctggagggc 3300 ttcgactttc tgcactacga cgtgaaaacc ggcgacttca tcctgcactt taagatgaac 3360 agaaatctgt ccttccagag gggcctgccc ggctttatgc ctgcatggga tatcgtgttc 3420 gagaagaacg agacacagtt tgacgccaag ggcacccctt tcatcgccgg caagagaatc 3480 gtgccagtga tcgagaatca cagattcacc ggcagatacc gggacctgta tcctgccaac 3540 gagctgatcg ccctgctgga ggagaagggc atcgtgttca gggatggctc caacatcctg 3600 ccaaagctgc tggagaatga cgattctcac gccatcgaca ccatggtggc cctgatccgc 3660 agcgtgctgc agatgcggaa ctccaatgcc gccacaggcg aggactatat caacagcccc 3720 gtgcgcgatc tgaatggcgt gtgcttcgac tcccggtttc agaacccaga gtggcccatg 3780 gacgccgatg ccaatggcgc ctaccacatc gccctgaagg gccagctgct gctgaatcac 3840 ctgaaggaga gcaaggatct gaagctgcag aacggcatct ccaatcagga ctggctggcc 3900 tacatccagg agctgcgcaa c 3921 <210> 9 <211> 1307 <212> PRT <213> Artificial Sequence <220> <223> E174R/S542R <400> 9 Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr 1 5 10 15 Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln 20 25 30 Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys 35 40 45 Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln 50 55 60 Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile 65 70 75 80 Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile 85 90 95 Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly 100 105 110 Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile 115 120 125 Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys 130 135 140 Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg 145 150 155 160 Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Arg Asn Arg 165 170 175 Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg 180 185 190 Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe 195 200 205 Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn 210 215 220 Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val 225 230 235 240 Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp 245 250 255 Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu 260 265 270 Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn 275 280 285 Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro 290 295 300 Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu 305 310 315 320 Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr 325 330 335 Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu 340 345 350 Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His 355 360 365 Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr 370 375 380 Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys 385 390 395 400 Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu 405 410 415 Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser 420 425 430 Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala 435 440 445 Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys 450 455 460 Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu 465 470 475 480 Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe 485 490 495 Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser 500 505 510 Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val 515 520 525 Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Arg Gly Trp 530 535 540 Asp Val Asn Arg Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn 545 550 555 560 Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys 565 570 575 Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys 580 585 590 Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys 595 600 605 Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr 610 615 620 Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys 625 630 635 640 Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln 645 650 655 Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala 660 665 670 Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr 675 680 685 Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr 690 695 700 Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His 705 710 715 720 Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu 725 730 735 Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys 740 745 750 Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu 755 760 765 Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln 770 775 780 Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His 785 790 795 800 Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr 805 810 815 Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His 820 825 830 Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn 835 840 845 Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe 850 855 860 Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln 865 870 875 880 Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu 885 890 895 Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg 900 905 910 Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu 915 920 925 Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu 930 935 940 Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val 945 950 955 960 Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile 965 970 975 His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu 980 985 990 Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu 995 1000 1005 Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn 1010 1015 1020 Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu 1025 1030 1035 1040 Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly 1045 1050 1055 Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys 1060 1065 1070 Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile 1075 1080 1085 Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu 1090 1095 1100 His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn 1105 1110 1115 1120 Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp 1125 1130 1135 Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr 1140 1145 1150 Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His Arg 1155 1160 1165 Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala 1170 1175 1180 Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu 1185 1190 1195 1200 Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val 1205 1210 1215 Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr 1220 1225 1230 Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys 1235 1240 1245 Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala 1250 1255 1260 Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His 1265 1270 1275 1280 Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln 1285 1290 1295 Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn 1300 1305 <210> 10 <211> 3921 <212> DNA <213> Artificial Sequence <220> <223> E174R/S542R <400> 10 atgacacagt tcgagggctt taccaacctg tatcaggtga gcaagacact gcggtttgag 60 ctgatcccac agggcaagac cctgaagcac atccaggagc agggcttcat cgaggaggac 120 aaggcccgca atgatcacta caaggagctg aagcccatca tcgatcggat ctacaagacc 180 tatgccgacc agtgcctgca gctggtgcag ctggattggg agaacctgag cgccgccatc 240 gactcctata gaaaggagaa aaccgaggag acaaggaacg ccctgatcga ggagcaggcc 300 acatatcgca atgccatcca cgactacttc atcggccgga cagacaacct gaccgatgcc 360 atcaataaga gacacgccga gatctacaag ggcctgttca aggccgagct gtttaatggc 420 aaggtgctga agcagctggg caccgtgacc acaaccgagc acgagaacgc cctgctgcgg 480 agcttcgaca agtttacaac ctacttctcc ggcttttata ggaacaggaa gaacgtgttc 540 agcgccgagg atatcagcac agccatccca caccgcatcg tgcaggacaa cttccccaag 600 tttaaggaga attgtcacat cttcacacgc ctgatcaccg ccgtgcccag cctgcgggag 660 cactttgaga acgtgaagaa ggccatcggc atcttcgtga gcacctccat cgaggaggtg 720 ttttccttcc ctttttataa ccagctgctg acacagaccc agatcgacct gtataaccag 780 ctgctgggag gaatctctcg ggaggcaggc accgagaaga tcaagggcct gaacgaggtg 840 ctgaatctgg ccatccagaa gaatgatgag acagcccaca tcatcgcctc cctgccacac 900 agattcatcc ccctgtttaa gcagatcctg tccgatagga acaccctgtc tttcatcctg 960 gaggagttta agagcgacga ggaagtgatc cagtccttct gcaagtacaa gacactgctg 1020 agaaacgaga acgtgctgga gacagccgag gccctgttta acgagctgaa cagcatcgac 1080 ctgacacaca tcttcatcag ccacaagaag ctggagacaa tcagcagcgc cctgtgcgac 1140 cactgggata cactgaggaa tgccctgtat gagcggagaa tctccgagct gacaggcaag 1200 atcaccaagt ctgccaagga gaaggtgcag cgcagcctga agcacgagga tatcaacctg 1260 caggagatca tctctgccgc aggcaaggag ctgagcgagg ccttcaagca gaaaaccagc 1320 gagatcctgt cccacgcaca cgccgccctg gatcagccac tgcctacaac cctgaagaag 1380 caggaggaga aggagatcct gaagtctcag ctggacagcc tgctgggcct gtaccacctg 1440 ctggactggt ttgccgtgga tgagtccaac gaggtggacc ccgagttctc tgcccggctg 1500 accggcatca agctggagat ggagccttct ctgagcttct acaacaaggc cagaaattat 1560 gccaccaaga agccctactc cgtggagaag ttcaagctga actttcagat gcctacactg 1620 gcccggggct gggacgtgaa tcgggagaag aacaatggcg ccatcctgtt tgtgaagaac 1680 ggcctgtact atctgggcat catgccaaag cagaagggca ggtataaggc cctgagcttc 1740 gagcccacag agaaaaccag cgagggcttt gataagatgt actatgacta cttccctgat 1800 gccgccaaga tgatcccaaa gtgcagcacc cagctgaagg ccgtgacagc ccactttcag 1860 acccacacaa cccccatcct gctgtccaac aatttcatcg agcctctgga gatcacaaag 1920 gagatctacg acctgaacaa tcctgagaag gagccaaaga agtttcagac agcctacgcc 1980 aagaaaaccg gcgaccagaa gggctacaga gaggccctgt gcaagtggat cgacttcaca 2040 agggattttc tgtccaagta taccaagaca acctctatcg atctgtctag cctgcggcca 2100 tcctctcagt ataaggacct gggcgagtac tatgccgagc tgaatcccct gctgtaccac 2160 atcagcttcc agagaatcgc cgagaaggag atcatggatg ccgtggagac aggcaagctg 2220 tacctgttcc agatctataa caaggacttt gccaagggcc accacggcaa gcctaatctg 2280 cacacactgt attggaccgg cctgttttct ccagagaacc tggccaagac aagcatcaag 2340 ctgaatggcc aggccgagct gttctaccgc cctaagtcca ggatgaagag gatggcacac 2400 cggctgggag agaagatgct gaacaagaag ctgaaggatc agaaaacccc aatccccgac 2460 accctgtacc aggagctgta cgactatgtg aatcacagac tgtcccacga cctgtctgat 2520 gaggccaggg ccctgctgcc caacgtgatc accaaggagg tgtctcacga gatcatcaag 2580 gataggcgct ttaccagcga caagttcttt ttccacgtgc ctatcacact gaactatcag 2640 gccgccaatt ccccatctaa gttcaaccag agggtgaatg cctacctgaa ggagcacccc 2700 gagacaccta tcatcggcat cgatcggggc gagagaaacc tgatctatat cacagtgatc 2760 gactccaccg gcaagatcct ggagcagcgg agcctgaaca ccatccagca gtttgattac 2820 cagaagaagc tggacaacag ggagaaggag agggtggcag caaggcaggc ctggtctgtg 2880 gtgggcacaa tcaaggatct gaagcagggc tatctgagcc aggtcatcca cgagatcgtg 2940 gacctgatga tccactacca ggccgtggtg gtgctggaga acctgaattt cggctttaag 3000 agcaagagga ccggcatcgc cgagaaggcc gtgtaccagc agttcgagaa gatgctgatc 3060 gataagctga attgcctggt gctgaaggac tatccagcag agaaagtggg aggcgtgctg 3120 aacccatacc agctgacaga ccagttcacc tcctttgcca agatgggcac ccagtctggc 3180 ttcctgtttt acgtgcctgc cccatataca tctaagatcg atcccctgac cggcttcgtg 3240 gaccccttcg tgtggaaaac catcaagaat cacgagagcc gcaagcactt cctggagggc 3300 ttcgactttc tgcactacga cgtgaaaacc ggcgacttca tcctgcactt taagatgaac 3360 agaaatctgt ccttccagag gggcctgccc ggctttatgc ctgcatggga tatcgtgttc 3420 gagaagaacg agacacagtt tgacgccaag ggcacccctt tcatcgccgg caagagaatc 3480 gtgccagtga tcgagaatca cagattcacc ggcagatacc gggacctgta tcctgccaac 3540 gagctgatcg ccctgctgga ggagaagggc atcgtgttca gggatggctc caacatcctg 3600 ccaaagctgc tggagaatga cgattctcac gccatcgaca ccatggtggc cctgatccgc 3660 agcgtgctgc agatgcggaa ctccaatgcc gccacaggcg aggactatat caacagcccc 3720 gtgcgcgatc tgaatggcgt gtgcttcgac tcccggtttc agaacccaga gtggcccatg 3780 gacgccgatg ccaatggcgc ctaccacatc gccctgaagg gccagctgct gctgaatcac 3840 ctgaaggaga gcaaggatct gaagctgcag aacggcatct ccaatcagga ctggctggcc 3900 tacatccagg agctgcgcaa c 3921 <210> 11 <211> 1307 <212> PRT <213> Artificial Sequence <220> <223> S170R/S542R <400> 11 Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr 1 5 10 15 Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln 20 25 30 Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys 35 40 45 Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln 50 55 60 Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile 65 70 75 80 Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile 85 90 95 Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly 100 105 110 Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile 115 120 125 Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys 130 135 140 Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg 145 150 155 160 Ser Phe Asp Lys Phe Thr Thr Tyr Phe Arg Gly Phe Tyr Arg Asn Arg 165 170 175 Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg 180 185 190 Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe 195 200 205 Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn 210 215 220 Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val 225 230 235 240 Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp 245 250 255 Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu 260 265 270 Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn 275 280 285 Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro 290 295 300 Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu 305 310 315 320 Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr 325 330 335 Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu 340 345 350 Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His 355 360 365 Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr 370 375 380 Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys 385 390 395 400 Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu 405 410 415 Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser 420 425 430 Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala 435 440 445 Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys 450 455 460 Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu 465 470 475 480 Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe 485 490 495 Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser 500 505 510 Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val 515 520 525 Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Arg Gly Trp 530 535 540 Asp Val Asn Arg Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn 545 550 555 560 Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys 565 570 575 Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys 580 585 590 Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys 595 600 605 Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr 610 615 620 Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys 625 630 635 640 Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln 645 650 655 Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala 660 665 670 Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr 675 680 685 Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr 690 695 700 Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His 705 710 715 720 Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu 725 730 735 Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys 740 745 750 Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu 755 760 765 Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln 770 775 780 Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His 785 790 795 800 Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr 805 810 815 Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His 820 825 830 Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn 835 840 845 Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe 850 855 860 Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln 865 870 875 880 Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu 885 890 895 Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg 900 905 910 Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu 915 920 925 Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu 930 935 940 Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val 945 950 955 960 Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile 965 970 975 His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu 980 985 990 Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu 995 1000 1005 Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn 1010 1015 1020 Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu 1025 1030 1035 1040 Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly 1045 1050 1055 Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys 1060 1065 1070 Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile 1075 1080 1085 Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu 1090 1095 1100 His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn 1105 1110 1115 1120 Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp 1125 1130 1135 Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr 1140 1145 1150 Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His Arg 1155 1160 1165 Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala 1170 1175 1180 Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu 1185 1190 1195 1200 Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val 1205 1210 1215 Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr 1220 1225 1230 Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys 1235 1240 1245 Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala 1250 1255 1260 Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His 1265 1270 1275 1280 Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln 1285 1290 1295 Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn 1300 1305 <210> 12 <211> 3921 <212> DNA <213> Artificial Sequence <220> <223> S170R/S542R <400> 12 atgacacagt tcgagggctt taccaacctg tatcaggtga gcaagacact gcggtttgag 60 ctgatcccac agggcaagac cctgaagcac atccaggagc agggcttcat cgaggaggac 120 aaggcccgca atgatcacta caaggagctg aagcccatca tcgatcggat ctacaagacc 180 tatgccgacc agtgcctgca gctggtgcag ctggattggg agaacctgag cgccgccatc 240 gactcctata gaaaggagaa aaccgaggag acaaggaacg ccctgatcga ggagcaggcc 300 acatatcgca atgccatcca cgactacttc atcggccgga cagacaacct gaccgatgcc 360 atcaataaga gacacgccga gatctacaag ggcctgttca aggccgagct gtttaatggc 420 aaggtgctga agcagctggg caccgtgacc acaaccgagc acgagaacgc cctgctgcgg 480 agcttcgaca agtttacaac ctacttcagg ggcttttata ggaacaggaa gaacgtgttc 540 agcgccgagg atatcagcac agccatccca caccgcatcg tgcaggacaa cttccccaag 600 tttaaggaga attgtcacat cttcacacgc ctgatcaccg ccgtgcccag cctgcgggag 660 cactttgaga acgtgaagaa ggccatcggc atcttcgtga gcacctccat cgaggaggtg 720 ttttccttcc ctttttataa ccagctgctg acacagaccc agatcgacct gtataaccag 780 ctgctgggag gaatctctcg ggaggcaggc accgagaaga tcaagggcct gaacgaggtg 840 ctgaatctgg ccatccagaa gaatgatgag acagcccaca tcatcgcctc cctgccacac 900 agattcatcc ccctgtttaa gcagatcctg tccgatagga acaccctgtc tttcatcctg 960 gaggagttta agagcgacga ggaagtgatc cagtccttct gcaagtacaa gacactgctg 1020 agaaacgaga acgtgctgga gacagccgag gccctgttta acgagctgaa cagcatcgac 1080 ctgacacaca tcttcatcag ccacaagaag ctggagacaa tcagcagcgc cctgtgcgac 1140 cactgggata cactgaggaa tgccctgtat gagcggagaa tctccgagct gacaggcaag 1200 atcaccaagt ctgccaagga gaaggtgcag cgcagcctga agcacgagga tatcaacctg 1260 caggagatca tctctgccgc aggcaaggag ctgagcgagg ccttcaagca gaaaaccagc 1320 gagatcctgt cccacgcaca cgccgccctg gatcagccac tgcctacaac cctgaagaag 1380 caggaggaga aggagatcct gaagtctcag ctggacagcc tgctgggcct gtaccacctg 1440 ctggactggt ttgccgtgga tgagtccaac gaggtggacc ccgagttctc tgcccggctg 1500 accggcatca agctggagat ggagccttct ctgagcttct acaacaaggc cagaaattat 1560 gccaccaaga agccctactc cgtggagaag ttcaagctga actttcagat gcctacactg 1620 gcccggggct gggacgtgaa tcgggagaag aacaatggcg ccatcctgtt tgtgaagaac 1680 ggcctgtact atctgggcat catgccaaag cagaagggca ggtataaggc cctgagcttc 1740 gagcccacag agaaaaccag cgagggcttt gataagatgt actatgacta cttccctgat 1800 gccgccaaga tgatcccaaa gtgcagcacc cagctgaagg ccgtgacagc ccactttcag 1860 acccacacaa cccccatcct gctgtccaac aatttcatcg agcctctgga gatcacaaag 1920 gagatctacg acctgaacaa tcctgagaag gagccaaaga agtttcagac agcctacgcc 1980 aagaaaaccg gcgaccagaa gggctacaga gaggccctgt gcaagtggat cgacttcaca 2040 agggattttc tgtccaagta taccaagaca acctctatcg atctgtctag cctgcggcca 2100 tcctctcagt ataaggacct gggcgagtac tatgccgagc tgaatcccct gctgtaccac 2160 atcagcttcc agagaatcgc cgagaaggag atcatggatg ccgtggagac aggcaagctg 2220 tacctgttcc agatctataa caaggacttt gccaagggcc accacggcaa gcctaatctg 2280 cacacactgt attggaccgg cctgttttct ccagagaacc tggccaagac aagcatcaag 2340 ctgaatggcc aggccgagct gttctaccgc cctaagtcca ggatgaagag gatggcacac 2400 cggctgggag agaagatgct gaacaagaag ctgaaggatc agaaaacccc aatccccgac 2460 accctgtacc aggagctgta cgactatgtg aatcacagac tgtcccacga cctgtctgat 2520 gaggccaggg ccctgctgcc caacgtgatc accaaggagg tgtctcacga gatcatcaag 2580 gataggcgct ttaccagcga caagttcttt ttccacgtgc ctatcacact gaactatcag 2640 gccgccaatt ccccatctaa gttcaaccag agggtgaatg cctacctgaa ggagcacccc 2700 gagacaccta tcatcggcat cgatcggggc gagagaaacc tgatctatat cacagtgatc 2760 gactccaccg gcaagatcct ggagcagcgg agcctgaaca ccatccagca gtttgattac 2820 cagaagaagc tggacaacag ggagaaggag agggtggcag caaggcaggc ctggtctgtg 2880 gtgggcacaa tcaaggatct gaagcagggc tatctgagcc aggtcatcca cgagatcgtg 2940 gacctgatga tccactacca ggccgtggtg gtgctggaga acctgaattt cggctttaag 3000 agcaagagga ccggcatcgc cgagaaggcc gtgtaccagc agttcgagaa gatgctgatc 3060 gataagctga attgcctggt gctgaaggac tatccagcag agaaagtggg aggcgtgctg 3120 aacccatacc agctgacaga ccagttcacc tcctttgcca agatgggcac ccagtctggc 3180 ttcctgtttt acgtgcctgc cccatataca tctaagatcg atcccctgac cggcttcgtg 3240 gaccccttcg tgtggaaaac catcaagaat cacgagagcc gcaagcactt cctggagggc 3300 ttcgactttc tgcactacga cgtgaaaacc ggcgacttca tcctgcactt taagatgaac 3360 agaaatctgt ccttccagag gggcctgccc ggctttatgc ctgcatggga tatcgtgttc 3420 gagaagaacg agacacagtt tgacgccaag ggcacccctt tcatcgccgg caagagaatc 3480 gtgccagtga tcgagaatca cagattcacc ggcagatacc gggacctgta tcctgccaac 3540 gagctgatcg ccctgctgga ggagaagggc atcgtgttca gggatggctc caacatcctg 3600 ccaaagctgc tggagaatga cgattctcac gccatcgaca ccatggtggc cctgatccgc 3660 agcgtgctgc agatgcggaa ctccaatgcc gccacaggcg aggactatat caacagcccc 3720 gtgcgcgatc tgaatggcgt gtgcttcgac tcccggtttc agaacccaga gtggcccatg 3780 gacgccgatg ccaatggcgc ctaccacatc gccctgaagg gccagctgct gctgaatcac 3840 ctgaaggaga gcaaggatct gaagctgcag aacggcatct ccaatcagga ctggctggcc 3900 tacatccagg agctgcgcaa c 3921 <210> 13 <211> 1307 <212> PRT <213> Artificial Sequence <220> <223> E174R/S542R/K548R <400> 13 Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr 1 5 10 15 Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln 20 25 30 Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys 35 40 45 Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln 50 55 60 Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile 65 70 75 80 Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile 85 90 95 Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly 100 105 110 Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile 115 120 125 Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys 130 135 140 Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg 145 150 155 160 Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Arg Asn Arg 165 170 175 Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg 180 185 190 Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe 195 200 205 Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn 210 215 220 Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val 225 230 235 240 Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp 245 250 255 Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu 260 265 270 Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn 275 280 285 Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro 290 295 300 Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu 305 310 315 320 Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr 325 330 335 Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu 340 345 350 Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His 355 360 365 Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr 370 375 380 Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys 385 390 395 400 Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu 405 410 415 Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser 420 425 430 Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala 435 440 445 Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys 450 455 460 Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu 465 470 475 480 Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe 485 490 495 Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser 500 505 510 Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val 515 520 525 Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Arg Gly Trp 530 535 540 Asp Val Asn Arg Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn 545 550 555 560 Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys 565 570 575 Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys 580 585 590 Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys 595 600 605 Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr 610 615 620 Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys 625 630 635 640 Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln 645 650 655 Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala 660 665 670 Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr 675 680 685 Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr 690 695 700 Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His 705 710 715 720 Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu 725 730 735 Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys 740 745 750 Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu 755 760 765 Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln 770 775 780 Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His 785 790 795 800 Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr 805 810 815 Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His 820 825 830 Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn 835 840 845 Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe 850 855 860 Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln 865 870 875 880 Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu 885 890 895 Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg 900 905 910 Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu 915 920 925 Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu 930 935 940 Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val 945 950 955 960 Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile 965 970 975 His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu 980 985 990 Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu 995 1000 1005 Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn 1010 1015 1020 Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu 1025 1030 1035 1040 Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly 1045 1050 1055 Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys 1060 1065 1070 Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile 1075 1080 1085 Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu 1090 1095 1100 His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn 1105 1110 1115 1120 Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp 1125 1130 1135 Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr 1140 1145 1150 Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His Arg 1155 1160 1165 Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala 1170 1175 1180 Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu 1185 1190 1195 1200 Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val 1205 1210 1215 Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr 1220 1225 1230 Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys 1235 1240 1245 Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala 1250 1255 1260 Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His 1265 1270 1275 1280 Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln 1285 1290 1295 Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn 1300 1305 <210> 14 <211> 3921 <212> DNA <213> Artificial Sequence <220> <223> E174R/S542R/K548R <400> 14 atgacacagt tcgagggctt taccaacctg tatcaggtga gcaagacact gcggtttgag 60 ctgatcccac agggcaagac cctgaagcac atccaggagc agggcttcat cgaggaggac 120 aaggcccgca atgatcacta caaggagctg aagcccatca tcgatcggat ctacaagacc 180 tatgccgacc agtgcctgca gctggtgcag ctggattggg agaacctgag cgccgccatc 240 gactcctata gaaaggagaa aaccgaggag acaaggaacg ccctgatcga ggagcaggcc 300 acatatcgca atgccatcca cgactacttc atcggccgga cagacaacct gaccgatgcc 360 atcaataaga gacacgccga gatctacaag ggcctgttca aggccgagct gtttaatggc 420 aaggtgctga agcagctggg caccgtgacc acaaccgagc acgagaacgc cctgctgcgg 480 agcttcgaca agtttacaac ctacttctcc ggcttttata ggaacaggaa gaacgtgttc 540 agcgccgagg atatcagcac agccatccca caccgcatcg tgcaggacaa cttccccaag 600 tttaaggaga attgtcacat cttcacacgc ctgatcaccg ccgtgcccag cctgcgggag 660 cactttgaga acgtgaagaa ggccatcggc atcttcgtga gcacctccat cgaggaggtg 720 ttttccttcc ctttttataa ccagctgctg acacagaccc agatcgacct gtataaccag 780 ctgctgggag gaatctctcg ggaggcaggc accgagaaga tcaagggcct gaacgaggtg 840 ctgaatctgg ccatccagaa gaatgatgag acagcccaca tcatcgcctc cctgccacac 900 agattcatcc ccctgtttaa gcagatcctg tccgatagga acaccctgtc tttcatcctg 960 gaggagttta agagcgacga ggaagtgatc cagtccttct gcaagtacaa gacactgctg 1020 agaaacgaga acgtgctgga gacagccgag gccctgttta acgagctgaa cagcatcgac 1080 ctgacacaca tcttcatcag ccacaagaag ctggagacaa tcagcagcgc cctgtgcgac 1140 cactgggata cactgaggaa tgccctgtat gagcggagaa tctccgagct gacaggcaag 1200 atcaccaagt ctgccaagga gaaggtgcag cgcagcctga agcacgagga tatcaacctg 1260 caggagatca tctctgccgc aggcaaggag ctgagcgagg ccttcaagca gaaaaccagc 1320 gagatcctgt cccacgcaca cgccgccctg gatcagccac tgcctacaac cctgaagaag 1380 caggaggaga aggagatcct gaagtctcag ctggacagcc tgctgggcct gtaccacctg 1440 ctggactggt ttgccgtgga tgagtccaac gaggtggacc ccgagttctc tgcccggctg 1500 accggcatca agctggagat ggagccttct ctgagcttct acaacaaggc cagaaattat 1560 gccaccaaga agccctactc cgtggagaag ttcaagctga actttcagat gcctacactg 1620 gcccggggct gggacgtgaa tcgggagaag aacaatggcg ccatcctgtt tgtgaagaac 1680 ggcctgtact atctgggcat catgccaaag cagaagggca ggtataaggc cctgagcttc 1740 gagcccacag agaaaaccag cgagggcttt gataagatgt actatgacta cttccctgat 1800 gccgccaaga tgatcccaaa gtgcagcacc cagctgaagg ccgtgacagc ccactttcag 1860 acccacacaa cccccatcct gctgtccaac aatttcatcg agcctctgga gatcacaaag 1920 gagatctacg acctgaacaa tcctgagaag gagccaaaga agtttcagac agcctacgcc 1980 aagaaaaccg gcgaccagaa gggctacaga gaggccctgt gcaagtggat cgacttcaca 2040 agggattttc tgtccaagta taccaagaca acctctatcg atctgtctag cctgcggcca 2100 tcctctcagt ataaggacct gggcgagtac tatgccgagc tgaatcccct gctgtaccac 2160 atcagcttcc agagaatcgc cgagaaggag atcatggatg ccgtggagac aggcaagctg 2220 tacctgttcc agatctataa caaggacttt gccaagggcc accacggcaa gcctaatctg 2280 cacacactgt attggaccgg cctgttttct ccagagaacc tggccaagac aagcatcaag 2340 ctgaatggcc aggccgagct gttctaccgc cctaagtcca ggatgaagag gatggcacac 2400 cggctgggag agaagatgct gaacaagaag ctgaaggatc agaaaacccc aatccccgac 2460 accctgtacc aggagctgta cgactatgtg aatcacagac tgtcccacga cctgtctgat 2520 gaggccaggg ccctgctgcc caacgtgatc accaaggagg tgtctcacga gatcatcaag 2580 gataggcgct ttaccagcga caagttcttt ttccacgtgc ctatcacact gaactatcag 2640 gccgccaatt ccccatctaa gttcaaccag agggtgaatg cctacctgaa ggagcacccc 2700 gagacaccta tcatcggcat cgatcggggc gagagaaacc tgatctatat cacagtgatc 2760 gactccaccg gcaagatcct ggagcagcgg agcctgaaca ccatccagca gtttgattac 2820 cagaagaagc tggacaacag ggagaaggag agggtggcag caaggcaggc ctggtctgtg 2880 gtgggcacaa tcaaggatct gaagcagggc tatctgagcc aggtcatcca cgagatcgtg 2940 gacctgatga tccactacca ggccgtggtg gtgctggaga acctgaattt cggctttaag 3000 agcaagagga ccggcatcgc cgagaaggcc gtgtaccagc agttcgagaa gatgctgatc 3060 gataagctga attgcctggt gctgaaggac tatccagcag agaaagtggg aggcgtgctg 3120 aacccatacc agctgacaga ccagttcacc tcctttgcca agatgggcac ccagtctggc 3180 ttcctgtttt acgtgcctgc cccatataca tctaagatcg atcccctgac cggcttcgtg 3240 gaccccttcg tgtggaaaac catcaagaat cacgagagcc gcaagcactt cctggagggc 3300 ttcgactttc tgcactacga cgtgaaaacc ggcgacttca tcctgcactt taagatgaac 3360 agaaatctgt ccttccagag gggcctgccc ggctttatgc ctgcatggga tatcgtgttc 3420 gagaagaacg agacacagtt tgacgccaag ggcacccctt tcatcgccgg caagagaatc 3480 gtgccagtga tcgagaatca cagattcacc ggcagatacc gggacctgta tcctgccaac 3540 gagctgatcg ccctgctgga ggagaagggc atcgtgttca gggatggctc caacatcctg 3600 ccaaagctgc tggagaatga cgattctcac gccatcgaca ccatggtggc cctgatccgc 3660 agcgtgctgc agatgcggaa ctccaatgcc gccacaggcg aggactatat caacagcccc 3720 gtgcgcgatc tgaatggcgt gtgcttcgac tcccggtttc agaacccaga gtggcccatg 3780 gacgccgatg ccaatggcgc ctaccacatc gccctgaagg gccagctgct gctgaatcac 3840 ctgaaggaga gcaaggatct gaagctgcag aacggcatct ccaatcagga ctggctggcc 3900 tacatccagg agctgcgcaa c 3921 <210> 15 <211> 1307 <212> PRT <213> Artificial Sequence <220> <223> E174R/N551R <400> 15 Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr 1 5 10 15 Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln 20 25 30 Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys 35 40 45 Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln 50 55 60 Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile 65 70 75 80 Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile 85 90 95 Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly 100 105 110 Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile 115 120 125 Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys 130 135 140 Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg 145 150 155 160 Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Arg Asn Arg 165 170 175 Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg 180 185 190 Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe 195 200 205 Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn 210 215 220 Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val 225 230 235 240 Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp 245 250 255 Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu 260 265 270 Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn 275 280 285 Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro 290 295 300 Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu 305 310 315 320 Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr 325 330 335 Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu 340 345 350 Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His 355 360 365 Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr 370 375 380 Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys 385 390 395 400 Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu 405 410 415 Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser 420 425 430 Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala 435 440 445 Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys 450 455 460 Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu 465 470 475 480 Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe 485 490 495 Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser 500 505 510 Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val 515 520 525 Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Arg Gly Trp 530 535 540 Asp Val Asn Arg Glu Lys Arg Asn Gly Ala Ile Leu Phe Val Lys Asn 545 550 555 560 Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys 565 570 575 Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys 580 585 590 Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys 595 600 605 Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr 610 615 620 Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys 625 630 635 640 Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln 645 650 655 Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala 660 665 670 Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr 675 680 685 Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr 690 695 700 Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His 705 710 715 720 Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu 725 730 735 Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys 740 745 750 Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu 755 760 765 Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln 770 775 780 Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His 785 790 795 800 Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr 805 810 815 Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His 820 825 830 Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn 835 840 845 Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe 850 855 860 Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln 865 870 875 880 Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu 885 890 895 Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg 900 905 910 Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu 915 920 925 Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu 930 935 940 Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val 945 950 955 960 Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile 965 970 975 His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu 980 985 990 Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu 995 1000 1005 Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn 1010 1015 1020 Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu 1025 1030 1035 1040 Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly 1045 1050 1055 Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys 1060 1065 1070 Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile 1075 1080 1085 Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu 1090 1095 1100 His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn 1105 1110 1115 1120 Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp 1125 1130 1135 Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr 1140 1145 1150 Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His Arg 1155 1160 1165 Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala 1170 1175 1180 Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu 1185 1190 1195 1200 Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val 1205 1210 1215 Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr 1220 1225 1230 Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys 1235 1240 1245 Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala 1250 1255 1260 Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His 1265 1270 1275 1280 Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln 1285 1290 1295 Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn 1300 1305 <210> 16 <211> 3921 <212> DNA <213> Artificial Sequence <220> <223> E174R/N551R <400> 16 atgacacagt tcgagggctt taccaacctg tatcaggtga gcaagacact gcggtttgag 60 ctgatcccac agggcaagac cctgaagcac atccaggagc agggcttcat cgaggaggac 120 aaggcccgca atgatcacta caaggagctg aagcccatca tcgatcggat ctacaagacc 180 tatgccgacc agtgcctgca gctggtgcag ctggattggg agaacctgag cgccgccatc 240 gactcctata gaaaggagaa aaccgaggag acaaggaacg ccctgatcga ggagcaggcc 300 acatatcgca atgccatcca cgactacttc atcggccgga cagacaacct gaccgatgcc 360 atcaataaga gacacgccga gatctacaag ggcctgttca aggccgagct gtttaatggc 420 aaggtgctga agcagctggg caccgtgacc acaaccgagc acgagaacgc cctgctgcgg 480 agcttcgaca agtttacaac ctacttctcc ggcttttata ggaacaggaa gaacgtgttc 540 agcgccgagg atatcagcac agccatccca caccgcatcg tgcaggacaa cttccccaag 600 tttaaggaga attgtcacat cttcacacgc ctgatcaccg ccgtgcccag cctgcgggag 660 cactttgaga acgtgaagaa ggccatcggc atcttcgtga gcacctccat cgaggaggtg 720 ttttccttcc ctttttataa ccagctgctg acacagaccc agatcgacct gtataaccag 780 ctgctgggag gaatctctcg ggaggcaggc accgagaaga tcaagggcct gaacgaggtg 840 ctgaatctgg ccatccagaa gaatgatgag acagcccaca tcatcgcctc cctgccacac 900 agattcatcc ccctgtttaa gcagatcctg tccgatagga acaccctgtc tttcatcctg 960 gaggagttta agagcgacga ggaagtgatc cagtccttct gcaagtacaa gacactgctg 1020 agaaacgaga acgtgctgga gacagccgag gccctgttta acgagctgaa cagcatcgac 1080 ctgacacaca tcttcatcag ccacaagaag ctggagacaa tcagcagcgc cctgtgcgac 1140 cactgggata cactgaggaa tgccctgtat gagcggagaa tctccgagct gacaggcaag 1200 atcaccaagt ctgccaagga gaaggtgcag cgcagcctga agcacgagga tatcaacctg 1260 caggagatca tctctgccgc aggcaaggag ctgagcgagg ccttcaagca gaaaaccagc 1320 gagatcctgt cccacgcaca cgccgccctg gatcagccac tgcctacaac cctgaagaag 1380 caggaggaga aggagatcct gaagtctcag ctggacagcc tgctgggcct gtaccacctg 1440 ctggactggt ttgccgtgga tgagtccaac gaggtggacc ccgagttctc tgcccggctg 1500 accggcatca agctggagat ggagccttct ctgagcttct acaacaaggc cagaaattat 1560 gccaccaaga agccctactc cgtggagaag ttcaagctga actttcagat gcctacactg 1620 gcccggggct gggacgtgaa tcgggagaag aggaatggcg ccatcctgtt tgtgaagaac 1680 ggcctgtact atctgggcat catgccaaag cagaagggca ggtataaggc cctgagcttc 1740 gagcccacag agaaaaccag cgagggcttt gataagatgt actatgacta cttccctgat 1800 gccgccaaga tgatcccaaa gtgcagcacc cagctgaagg ccgtgacagc ccactttcag 1860 acccacacaa cccccatcct gctgtccaac aatttcatcg agcctctgga gatcacaaag 1920 gagatctacg acctgaacaa tcctgagaag gagccaaaga agtttcagac agcctacgcc 1980 aagaaaaccg gcgaccagaa gggctacaga gaggccctgt gcaagtggat cgacttcaca 2040 agggattttc tgtccaagta taccaagaca acctctatcg atctgtctag cctgcggcca 2100 tcctctcagt ataaggacct gggcgagtac tatgccgagc tgaatcccct gctgtaccac 2160 atcagcttcc agagaatcgc cgagaaggag atcatggatg ccgtggagac aggcaagctg 2220 tacctgttcc agatctataa caaggacttt gccaagggcc accacggcaa gcctaatctg 2280 cacacactgt attggaccgg cctgttttct ccagagaacc tggccaagac aagcatcaag 2340 ctgaatggcc aggccgagct gttctaccgc cctaagtcca ggatgaagag gatggcacac 2400 cggctgggag agaagatgct gaacaagaag ctgaaggatc agaaaacccc aatccccgac 2460 accctgtacc aggagctgta cgactatgtg aatcacagac tgtcccacga cctgtctgat 2520 gaggccaggg ccctgctgcc caacgtgatc accaaggagg tgtctcacga gatcatcaag 2580 gataggcgct ttaccagcga caagttcttt ttccacgtgc ctatcacact gaactatcag 2640 gccgccaatt ccccatctaa gttcaaccag agggtgaatg cctacctgaa ggagcacccc 2700 gagacaccta tcatcggcat cgatcggggc gagagaaacc tgatctatat cacagtgatc 2760 gactccaccg gcaagatcct ggagcagcgg agcctgaaca ccatccagca gtttgattac 2820 cagaagaagc tggacaacag ggagaaggag agggtggcag caaggcaggc ctggtctgtg 2880 gtgggcacaa tcaaggatct gaagcagggc tatctgagcc aggtcatcca cgagatcgtg 2940 gacctgatga tccactacca ggccgtggtg gtgctggaga acctgaattt cggctttaag 3000 agcaagagga ccggcatcgc cgagaaggcc gtgtaccagc agttcgagaa gatgctgatc 3060 gataagctga attgcctggt gctgaaggac tatccagcag agaaagtggg aggcgtgctg 3120 aacccatacc agctgacaga ccagttcacc tcctttgcca agatgggcac ccagtctggc 3180 ttcctgtttt acgtgcctgc cccatataca tctaagatcg atcccctgac cggcttcgtg 3240 gaccccttcg tgtggaaaac catcaagaat cacgagagcc gcaagcactt cctggagggc 3300 ttcgactttc tgcactacga cgtgaaaacc ggcgacttca tcctgcactt taagatgaac 3360 agaaatctgt ccttccagag gggcctgccc ggctttatgc ctgcatggga tatcgtgttc 3420 gagaagaacg agacacagtt tgacgccaag ggcacccctt tcatcgccgg caagagaatc 3480 gtgccagtga tcgagaatca cagattcacc ggcagatacc gggacctgta tcctgccaac 3540 gagctgatcg ccctgctgga ggagaagggc atcgtgttca gggatggctc caacatcctg 3600 ccaaagctgc tggagaatga cgattctcac gccatcgaca ccatggtggc cctgatccgc 3660 agcgtgctgc agatgcggaa ctccaatgcc gccacaggcg aggactatat caacagcccc 3720 gtgcgcgatc tgaatggcgt gtgcttcgac tcccggtttc agaacccaga gtggcccatg 3780 gacgccgatg ccaatggcgc ctaccacatc gccctgaagg gccagctgct gctgaatcac 3840 ctgaaggaga gcaaggatct gaagctgcag aacggcatct ccaatcagga ctggctggcc 3900 tacatccagg agctgcgcaa c 3921 <210> 17 <211> 1307 <212> PRT <213> Artificial Sequence <220> <223> S170R/N551R <400> 17 Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr 1 5 10 15 Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln 20 25 30 Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys 35 40 45 Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln 50 55 60 Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile 65 70 75 80 Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile 85 90 95 Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly 100 105 110 Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile 115 120 125 Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys 130 135 140 Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg 145 150 155 160 Ser Phe Asp Lys Phe Thr Thr Tyr Phe Arg Gly Phe Tyr Arg Asn Arg 165 170 175 Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg 180 185 190 Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe 195 200 205 Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn 210 215 220 Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val 225 230 235 240 Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp 245 250 255 Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu 260 265 270 Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn 275 280 285 Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro 290 295 300 Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu 305 310 315 320 Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr 325 330 335 Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu 340 345 350 Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His 355 360 365 Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr 370 375 380 Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys 385 390 395 400 Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu 405 410 415 Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser 420 425 430 Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala 435 440 445 Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys 450 455 460 Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu 465 470 475 480 Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe 485 490 495 Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser 500 505 510 Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val 515 520 525 Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Arg Gly Trp 530 535 540 Asp Val Asn Arg Glu Lys Arg Asn Gly Ala Ile Leu Phe Val Lys Asn 545 550 555 560 Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys 565 570 575 Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys 580 585 590 Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys 595 600 605 Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr 610 615 620 Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys 625 630 635 640 Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln 645 650 655 Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala 660 665 670 Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr 675 680 685 Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr 690 695 700 Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His 705 710 715 720 Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu 725 730 735 Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys 740 745 750 Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu 755 760 765 Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln 770 775 780 Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His 785 790 795 800 Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr 805 810 815 Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His 820 825 830 Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn 835 840 845 Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe 850 855 860 Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln 865 870 875 880 Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu 885 890 895 Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg 900 905 910 Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu 915 920 925 Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu 930 935 940 Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val 945 950 955 960 Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile 965 970 975 His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu 980 985 990 Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu 995 1000 1005 Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn 1010 1015 1020 Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu 1025 1030 1035 1040 Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly 1045 1050 1055 Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys 1060 1065 1070 Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile 1075 1080 1085 Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu 1090 1095 1100 His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn 1105 1110 1115 1120 Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp 1125 1130 1135 Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr 1140 1145 1150 Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His Arg 1155 1160 1165 Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala 1170 1175 1180 Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu 1185 1190 1195 1200 Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val 1205 1210 1215 Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr 1220 1225 1230 Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys 1235 1240 1245 Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala 1250 1255 1260 Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His 1265 1270 1275 1280 Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln 1285 1290 1295 Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn 1300 1305 <210> 18 <211> 3921 <212> DNA <213> Artificial Sequence <220> <223> S170R/N551R <400> 18 atgacacagt tcgagggctt taccaacctg tatcaggtga gcaagacact gcggtttgag 60 ctgatcccac agggcaagac cctgaagcac atccaggagc agggcttcat cgaggaggac 120 aaggcccgca atgatcacta caaggagctg aagcccatca tcgatcggat ctacaagacc 180 tatgccgacc agtgcctgca gctggtgcag ctggattggg agaacctgag cgccgccatc 240 gactcctata gaaaggagaa aaccgaggag acaaggaacg ccctgatcga ggagcaggcc 300 acatatcgca atgccatcca cgactacttc atcggccgga cagacaacct gaccgatgcc 360 atcaataaga gacacgccga gatctacaag ggcctgttca aggccgagct gtttaatggc 420 aaggtgctga agcagctggg caccgtgacc acaaccgagc acgagaacgc cctgctgcgg 480 agcttcgaca agtttacaac ctacttcagg ggcttttata ggaacaggaa gaacgtgttc 540 agcgccgagg atatcagcac agccatccca caccgcatcg tgcaggacaa cttccccaag 600 tttaaggaga attgtcacat cttcacacgc ctgatcaccg ccgtgcccag cctgcgggag 660 cactttgaga acgtgaagaa ggccatcggc atcttcgtga gcacctccat cgaggaggtg 720 ttttccttcc ctttttataa ccagctgctg acacagaccc agatcgacct gtataaccag 780 ctgctgggag gaatctctcg ggaggcaggc accgagaaga tcaagggcct gaacgaggtg 840 ctgaatctgg ccatccagaa gaatgatgag acagcccaca tcatcgcctc cctgccacac 900 agattcatcc ccctgtttaa gcagatcctg tccgatagga acaccctgtc tttcatcctg 960 gaggagttta agagcgacga ggaagtgatc cagtccttct gcaagtacaa gacactgctg 1020 agaaacgaga acgtgctgga gacagccgag gccctgttta acgagctgaa cagcatcgac 1080 ctgacacaca tcttcatcag ccacaagaag ctggagacaa tcagcagcgc cctgtgcgac 1140 cactgggata cactgaggaa tgccctgtat gagcggagaa tctccgagct gacaggcaag 1200 atcaccaagt ctgccaagga gaaggtgcag cgcagcctga agcacgagga tatcaacctg 1260 caggagatca tctctgccgc aggcaaggag ctgagcgagg ccttcaagca gaaaaccagc 1320 gagatcctgt cccacgcaca cgccgccctg gatcagccac tgcctacaac cctgaagaag 1380 caggaggaga aggagatcct gaagtctcag ctggacagcc tgctgggcct gtaccacctg 1440 ctggactggt ttgccgtgga tgagtccaac gaggtggacc ccgagttctc tgcccggctg 1500 accggcatca agctggagat ggagccttct ctgagcttct acaacaaggc cagaaattat 1560 gccaccaaga agccctactc cgtggagaag ttcaagctga actttcagat gcctacactg 1620 gcccggggct gggacgtgaa tcgggagaag aggaatggcg ccatcctgtt tgtgaagaac 1680 ggcctgtact atctgggcat catgccaaag cagaagggca ggtataaggc cctgagcttc 1740 gagcccacag agaaaaccag cgagggcttt gataagatgt actatgacta cttccctgat 1800 gccgccaaga tgatcccaaa gtgcagcacc cagctgaagg ccgtgacagc ccactttcag 1860 acccacacaa cccccatcct gctgtccaac aatttcatcg agcctctgga gatcacaaag 1920 gagatctacg acctgaacaa tcctgagaag gagccaaaga agtttcagac agcctacgcc 1980 aagaaaaccg gcgaccagaa gggctacaga gaggccctgt gcaagtggat cgacttcaca 2040 agggattttc tgtccaagta taccaagaca acctctatcg atctgtctag cctgcggcca 2100 tcctctcagt ataaggacct gggcgagtac tatgccgagc tgaatcccct gctgtaccac 2160 atcagcttcc agagaatcgc cgagaaggag atcatggatg ccgtggagac aggcaagctg 2220 tacctgttcc agatctataa caaggacttt gccaagggcc accacggcaa gcctaatctg 2280 cacacactgt attggaccgg cctgttttct ccagagaacc tggccaagac aagcatcaag 2340 ctgaatggcc aggccgagct gttctaccgc cctaagtcca ggatgaagag gatggcacac 2400 cggctgggag agaagatgct gaacaagaag ctgaaggatc agaaaacccc aatccccgac 2460 accctgtacc aggagctgta cgactatgtg aatcacagac tgtcccacga cctgtctgat 2520 gaggccaggg ccctgctgcc caacgtgatc accaaggagg tgtctcacga gatcatcaag 2580 gataggcgct ttaccagcga caagttcttt ttccacgtgc ctatcacact gaactatcag 2640 gccgccaatt ccccatctaa gttcaaccag agggtgaatg cctacctgaa ggagcacccc 2700 gagacaccta tcatcggcat cgatcggggc gagagaaacc tgatctatat cacagtgatc 2760 gactccaccg gcaagatcct ggagcagcgg agcctgaaca ccatccagca gtttgattac 2820 cagaagaagc tggacaacag ggagaaggag agggtggcag caaggcaggc ctggtctgtg 2880 gtgggcacaa tcaaggatct gaagcagggc tatctgagcc aggtcatcca cgagatcgtg 2940 gacctgatga tccactacca ggccgtggtg gtgctggaga acctgaattt cggctttaag 3000 agcaagagga ccggcatcgc cgagaaggcc gtgtaccagc agttcgagaa gatgctgatc 3060 gataagctga attgcctggt gctgaaggac tatccagcag agaaagtggg aggcgtgctg 3120 aacccatacc agctgacaga ccagttcacc tcctttgcca agatgggcac ccagtctggc 3180 ttcctgtttt acgtgcctgc cccatataca tctaagatcg atcccctgac cggcttcgtg 3240 gaccccttcg tgtggaaaac catcaagaat cacgagagcc gcaagcactt cctggagggc 3300 ttcgactttc tgcactacga cgtgaaaacc ggcgacttca tcctgcactt taagatgaac 3360 agaaatctgt ccttccagag gggcctgccc ggctttatgc ctgcatggga tatcgtgttc 3420 gagaagaacg agacacagtt tgacgccaag ggcacccctt tcatcgccgg caagagaatc 3480 gtgccagtga tcgagaatca cagattcacc ggcagatacc gggacctgta tcctgccaac 3540 gagctgatcg ccctgctgga ggagaagggc atcgtgttca gggatggctc caacatcctg 3600 ccaaagctgc tggagaatga cgattctcac gccatcgaca ccatggtggc cctgatccgc 3660 agcgtgctgc agatgcggaa ctccaatgcc gccacaggcg aggactatat caacagcccc 3720 gtgcgcgatc tgaatggcgt gtgcttcgac tcccggtttc agaacccaga gtggcccatg 3780 gacgccgatg ccaatggcgc ctaccacatc gccctgaagg gccagctgct gctgaatcac 3840 ctgaaggaga gcaaggatct gaagctgcag aacggcatct ccaatcagga ctggctggcc 3900 tacatccagg agctgcgcaa c 3921 <210> 19 <211> 1307 <212> PRT <213> Artificial Sequence <220> <223> S542R/K548R <400> 19 Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr 1 5 10 15 Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln 20 25 30 Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys 35 40 45 Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln 50 55 60 Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile 65 70 75 80 Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile 85 90 95 Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly 100 105 110 Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile 115 120 125 Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys 130 135 140 Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg 145 150 155 160 Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Arg Asn Arg 165 170 175 Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg 180 185 190 Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe 195 200 205 Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn 210 215 220 Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val 225 230 235 240 Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp 245 250 255 Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu 260 265 270 Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn 275 280 285 Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro 290 295 300 Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu 305 310 315 320 Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr 325 330 335 Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu 340 345 350 Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His 355 360 365 Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr 370 375 380 Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys 385 390 395 400 Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu 405 410 415 Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser 420 425 430 Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala 435 440 445 Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys 450 455 460 Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu 465 470 475 480 Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe 485 490 495 Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser 500 505 510 Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val 515 520 525 Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Arg Gly Trp 530 535 540 Asp Val Asn Arg Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn 545 550 555 560 Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys 565 570 575 Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys 580 585 590 Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys 595 600 605 Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr 610 615 620 Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys 625 630 635 640 Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln 645 650 655 Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala 660 665 670 Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr 675 680 685 Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr 690 695 700 Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His 705 710 715 720 Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu 725 730 735 Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys 740 745 750 Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu 755 760 765 Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln 770 775 780 Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His 785 790 795 800 Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr 805 810 815 Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His 820 825 830 Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn 835 840 845 Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe 850 855 860 Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln 865 870 875 880 Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu 885 890 895 Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg 900 905 910 Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu 915 920 925 Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu 930 935 940 Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val 945 950 955 960 Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile 965 970 975 His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu 980 985 990 Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu 995 1000 1005 Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn 1010 1015 1020 Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu 1025 1030 1035 1040 Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly 1045 1050 1055 Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys 1060 1065 1070 Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile 1075 1080 1085 Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu 1090 1095 1100 His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn 1105 1110 1115 1120 Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp 1125 1130 1135 Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr 1140 1145 1150 Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His Arg 1155 1160 1165 Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala 1170 1175 1180 Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu 1185 1190 1195 1200 Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val 1205 1210 1215 Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr 1220 1225 1230 Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys 1235 1240 1245 Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala 1250 1255 1260 Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His 1265 1270 1275 1280 Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln 1285 1290 1295 Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn 1300 1305 <210> 20 <211> 3921 <212> DNA <213> Artificial Sequence <220> <223> S542R/K548R <400> 20 atgacacagt tcgagggctt taccaacctg tatcaggtga gcaagacact gcggtttgag 60 ctgatcccac agggcaagac cctgaagcac atccaggagc agggcttcat cgaggaggac 120 aaggcccgca atgatcacta caaggagctg aagcccatca tcgatcggat ctacaagacc 180 tatgccgacc agtgcctgca gctggtgcag ctggattggg agaacctgag cgccgccatc 240 gactcctata gaaaggagaa aaccgaggag acaaggaacg ccctgatcga ggagcaggcc 300 acatatcgca atgccatcca cgactacttc atcggccgga cagacaacct gaccgatgcc 360 atcaataaga gacacgccga gatctacaag ggcctgttca aggccgagct gtttaatggc 420 aaggtgctga agcagctggg caccgtgacc acaaccgagc acgagaacgc cctgctgcgg 480 agcttcgaca agtttacaac ctacttctcc ggcttttata ggaacaggaa gaacgtgttc 540 agcgccgagg atatcagcac agccatccca caccgcatcg tgcaggacaa cttccccaag 600 tttaaggaga attgtcacat cttcacacgc ctgatcaccg ccgtgcccag cctgcgggag 660 cactttgaga acgtgaagaa ggccatcggc atcttcgtga gcacctccat cgaggaggtg 720 ttttccttcc ctttttataa ccagctgctg acacagaccc agatcgacct gtataaccag 780 ctgctgggag gaatctctcg ggaggcaggc accgagaaga tcaagggcct gaacgaggtg 840 ctgaatctgg ccatccagaa gaatgatgag acagcccaca tcatcgcctc cctgccacac 900 agattcatcc ccctgtttaa gcagatcctg tccgatagga acaccctgtc tttcatcctg 960 gaggagttta agagcgacga ggaagtgatc cagtccttct gcaagtacaa gacactgctg 1020 agaaacgaga acgtgctgga gacagccgag gccctgttta acgagctgaa cagcatcgac 1080 ctgacacaca tcttcatcag ccacaagaag ctggagacaa tcagcagcgc cctgtgcgac 1140 cactgggata cactgaggaa tgccctgtat gagcggagaa tctccgagct gacaggcaag 1200 atcaccaagt ctgccaagga gaaggtgcag cgcagcctga agcacgagga tatcaacctg 1260 caggagatca tctctgccgc aggcaaggag ctgagcgagg ccttcaagca gaaaaccagc 1320 gagatcctgt cccacgcaca cgccgccctg gatcagccac tgcctacaac cctgaagaag 1380 caggaggaga aggagatcct gaagtctcag ctggacagcc tgctgggcct gtaccacctg 1440 ctggactggt ttgccgtgga tgagtccaac gaggtggacc ccgagttctc tgcccggctg 1500 accggcatca agctggagat ggagccttct ctgagcttct acaacaaggc cagaaattat 1560 gccaccaaga agccctactc cgtggagaag ttcaagctga actttcagat gcctacactg 1620 gcccggggct gggacgtgaa tcgggagaag aacaatggcg ccatcctgtt tgtgaagaac 1680 ggcctgtact atctgggcat catgccaaag cagaagggca ggtataaggc cctgagcttc 1740 gagcccacag agaaaaccag cgagggcttt gataagatgt actatgacta cttccctgat 1800 gccgccaaga tgatcccaaa gtgcagcacc cagctgaagg ccgtgacagc ccactttcag 1860 acccacacaa cccccatcct gctgtccaac aatttcatcg agcctctgga gatcacaaag 1920 gagatctacg acctgaacaa tcctgagaag gagccaaaga agtttcagac agcctacgcc 1980 aagaaaaccg gcgaccagaa gggctacaga gaggccctgt gcaagtggat cgacttcaca 2040 agggattttc tgtccaagta taccaagaca acctctatcg atctgtctag cctgcggcca 2100 tcctctcagt ataaggacct gggcgagtac tatgccgagc tgaatcccct gctgtaccac 2160 atcagcttcc agagaatcgc cgagaaggag atcatggatg ccgtggagac aggcaagctg 2220 tacctgttcc agatctataa caaggacttt gccaagggcc accacggcaa gcctaatctg 2280 cacacactgt attggaccgg cctgttttct ccagagaacc tggccaagac aagcatcaag 2340 ctgaatggcc aggccgagct gttctaccgc cctaagtcca ggatgaagag gatggcacac 2400 cggctgggag agaagatgct gaacaagaag ctgaaggatc agaaaacccc aatccccgac 2460 accctgtacc aggagctgta cgactatgtg aatcacagac tgtcccacga cctgtctgat 2520 gaggccaggg ccctgctgcc caacgtgatc accaaggagg tgtctcacga gatcatcaag 2580 gataggcgct ttaccagcga caagttcttt ttccacgtgc ctatcacact gaactatcag 2640 gccgccaatt ccccatctaa gttcaaccag agggtgaatg cctacctgaa ggagcacccc 2700 gagacaccta tcatcggcat cgatcggggc gagagaaacc tgatctatat cacagtgatc 2760 gactccaccg gcaagatcct ggagcagcgg agcctgaaca ccatccagca gtttgattac 2820 cagaagaagc tggacaacag ggagaaggag agggtggcag caaggcaggc ctggtctgtg 2880 gtgggcacaa tcaaggatct gaagcagggc tatctgagcc aggtcatcca cgagatcgtg 2940 gacctgatga tccactacca ggccgtggtg gtgctggaga acctgaattt cggctttaag 3000 agcaagagga ccggcatcgc cgagaaggcc gtgtaccagc agttcgagaa gatgctgatc 3060 gataagctga attgcctggt gctgaaggac tatccagcag agaaagtggg aggcgtgctg 3120 aacccatacc agctgacaga ccagttcacc tcctttgcca agatgggcac ccagtctggc 3180 ttcctgtttt acgtgcctgc cccatataca tctaagatcg atcccctgac cggcttcgtg 3240 gaccccttcg tgtggaaaac catcaagaat cacgagagcc gcaagcactt cctggagggc 3300 ttcgactttc tgcactacga cgtgaaaacc ggcgacttca tcctgcactt taagatgaac 3360 agaaatctgt ccttccagag gggcctgccc ggctttatgc ctgcatggga tatcgtgttc 3420 gagaagaacg agacacagtt tgacgccaag ggcacccctt tcatcgccgg caagagaatc 3480 gtgccagtga tcgagaatca cagattcacc ggcagatacc gggacctgta tcctgccaac 3540 gagctgatcg ccctgctgga ggagaagggc atcgtgttca gggatggctc caacatcctg 3600 ccaaagctgc tggagaatga cgattctcac gccatcgaca ccatggtggc cctgatccgc 3660 agcgtgctgc agatgcggaa ctccaatgcc gccacaggcg aggactatat caacagcccc 3720 gtgcgcgatc tgaatggcgt gtgcttcgac tcccggtttc agaacccaga gtggcccatg 3780 gacgccgatg ccaatggcgc ctaccacatc gccctgaagg gccagctgct gctgaatcac 3840 ctgaaggaga gcaaggatct gaagctgcag aacggcatct ccaatcagga ctggctggcc 3900 tacatccagg agctgcgcaa c 3921 <210> 21 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1 target DNA <400> 21 tttcctgatg gtccatgtct gttactcg 28 <210> 22 <211> 44 <212> RNA <213> Artificial Sequence <220> <223> hDNMT1 D +0 <400> 22 uaauuucuac ucuuguagau cugauggucc augucuguua cucg 44 <210> 23 <211> 44 <212> DNA_RNA <213> Artificial Sequence <220> <223> hDNMT1 D +4 <220> <223> Chimeric DNA-RNA <400> 23 uaauuucuac ucuuguagau cugauggucc augucuguua ctcg 44 <210> 24 <211> 44 <212> DNA_RNA <213> Artificial Sequence <220> <223> hDNMT1 D +8 <220> <223> Chimeric DNA-RNA <400> 24 uaauuucuac ucuuguagau cugauggucc augucugtta ctcg 44 <210> 25 <211> 44 <212> DNA_RNA <213> Artificial Sequence <220> <223> hDNMT1 D +12 <220> <223> Chimeric DNA-RNA <400> 25 uaauuucuac ucuuguagau cugauggucc augtctgtta ctcg 44 <210> 26 <211> 44 <212> DNA_RNA <213> Artificial Sequence <220> <223> hDNMT1 D +16 <220> <223> Chimeric DNA-RNA <400> 26 uaauuucuac ucuuguagau cugauggucc atgtctgtta ctcg 44 <210> 27 <211> 44 <212> DNA_RNA <213> Artificial Sequence <220> <223> hDNMT1 D +20 <220> <223> Chimeric DNA-RNA <400> 27 uaauuucuac ucuuguagau cugatggtcc atgtctgtta ctcg 44 <210> 28 <211> 44 <212> DNA_RNA <213> Artificial Sequence <220> <223> hDNMT1 D +24 <220> <223> Chimeric DNA-RNA <400> 28 uaauuucuac ucuuguagau ctgatggtcc atgtctgtta ctcg 44 <210> 29 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1 D +44 <400> 29 taatttctac tcttgtagat ctgatggtcc atgtctgtta ctcg 44 <210> 30 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> hCCR5 target DNA <400> 30 tttggtcggc atggccccat tcgcacgg 28 <210> 31 <211> 44 <212> RNA <213> Artificial Sequence <220> <223> hCCR5 D +0 <400> 31 uaauuucuac ucuuguagau gugggcaaca ugcuggucau ccuc 44 <210> 32 <211> 44 <212> DNA_RNA <213> Artificial Sequence <220> <223> hCCR5 D +8 <220> <223> Chimeric DNA-RNA <400> 32 uaauuucuac ucuuguagau gugggcaaca ugcuggtcat cctc 44 <210> 33 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> hAAVS1 target DNA <400> 33 tttggtgctc aatgaaagga gataaggt 28 <210> 34 <211> 44 <212> RNA <213> Artificial Sequence <220> <223> hAAVS1 D +0 <400> 34 uaauuucuac ucuuguagau cuuacgaugg agccagagag gauc 44 <210> 35 <211> 44 <212> DNA_RNA <213> Artificial Sequence <220> <223> hAAVS1 D +8 <220> <223> Chimeric DNA-RNA <400> 35 uaauuucuac ucuuguagau cuuacgaugg agccagagag gatc 44 <210> 36 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1 on-target F1 <400> 36 gttgcacgtg tcaagtgctt a 21 <210> 37 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1 on-target R1 <400> 37 ttaaaatcca gaatgcacaa agtact 26 <210> 38 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1 on-target F2 <400> 38 gtgaatttgg ctcagcaggc a 21 <210> 39 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1 on-target R2 <400> 39 aagcgaacct cacacaacag c 21 <210> 40 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> hCCR5 on-target F1 <400> 40 tgagatggtg ctttcatgaa t 21 <210> 41 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hCCR5 on-target R1 <400> 41 gaaaatgaga gctgcaggtg 20 <210> 42 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> hCCR5 off-target F1 <400> 42 gaaaatggct gttgggtaaa tc 22 <210> 43 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hCCR5 off-target R1 <400> 43 taagggccac agacataaac 20 <210> 44 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hAAVS1 on-target F1 <400> 44 cctggtgaac acctaggacg 20 <210> 45 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> hAAVS1 on-target R1 <400> 45 ctatgtccac ttcaggacag c 21 <210> 46 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hAAVS1 off-target1 F1 <400> 46 agcaggttgg gtatcctgtg 20 <210> 47 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hAAVS1 off-target1 R1 <400> 47 aggctgtttc tgcctccata 20 <210> 48 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hAAVS1 off-target2 F1 <400> 48 atccaggggg ttggaatatc 20 <210> 49 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hAAVS1 off-target2 R1 <400> 49 tgcctgagag caggtctttt 20 <210> 50 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> hCCR5 on-target Adaptor_F <400> 50 acactctttc cctacacgac gctcttccga tctcctgcca aaaaatcaat gtgaag 56 <210> 51 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> hCCR5 on-target Adaptor_R <400> 51 gtgactggag ttcagacgtg tgctcttccg atctgaaggg gacagtaaga aggaa 55 <210> 52 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> hCCR5 off-target Adaptor_F <400> 52 acactctttc cctacacgac gctcttccga tcttccctgt cataaatttg acgtg 55 <210> 53 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> hCCR5 off-target Adaptor_R <400> 53 gtgactggag ttcagacgtg tgctcttccg atctgaaaaa gcagatcaga gatggc 56 <210> 54 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> hAAVS1 on-target Adaptor_F <400> 54 acactctttc cctacacgac gctcttccga tctcttccct cccaccccct g 51 <210> 55 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> hAAVS1 on-target Adaptor_R <400> 55 gtgactggag ttcagacgtg tgctcttccg atctccccat ccttaggcct cct 53 <210> 56 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> hAAVS1 off-target1 Adaptor_F <400> 56 acactctttc cctacacgac gctcttccga tctccatctc ctggtctgca caa 53 <210> 57 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> hAAVS1 off-target1 Adaptor_R <400> 57 gtgactggag ttcagacgtg tgctcttccg atctcaaagg ggctattcag atgt 54 <210> 58 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> hAAVS1 off-target2 Adaptor_F <400> 58 acactctttc cctacacgac gctcttccga tctggttatc tgttaatgat agcctg 56 <210> 59 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> hAAVS1 off-target2 Adaptor_R <400> 59 gtgactggag ttcagacgtg tgctcttccg atctcacaag cccatgaaga ctgg 54 <210> 60 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> NLS <400> 60 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 61 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> NLS <400> 61 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1 5 10 15 <210> 62 <211> 1355 <212> PRT <213> Artificial Sequence <220> <223> pET28-wt-AsCas12a <400> 62 His His His His His His Val Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 1 5 10 15 Glu Leu Pro Pro Lys Lys Lys Arg Lys Val Met Thr Gln Phe Glu Gly 20 25 30 Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr Leu Arg Phe Glu Leu Ile 35 40 45 Pro Gln Gly Lys Thr Leu Lys His Ile Gln Glu Gln Gly Phe Ile Glu 50 55 60 Glu Asp Lys Ala Arg Asn Asp His Tyr Lys Glu Leu Lys Pro Ile Ile 65 70 75 80 Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln Cys Leu Gln Leu Val Gln 85 90 95 Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile Asp Ser Tyr Arg Lys Glu 100 105 110 Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile Glu Glu Gln Ala Thr Tyr 115 120 125 Arg Asn Ala Ile His Asp Tyr Phe Ile Gly Arg Thr Asp Asn Leu Thr 130 135 140 Asp Ala Ile Asn Lys Arg His Ala Glu Ile Tyr Lys Gly Leu Phe Lys 145 150 155 160 Ala Glu Leu Phe Asn Gly Lys Val Leu Lys Gln Leu Gly Thr Val Thr 165 170 175 Thr Thr Glu His Glu Asn Ala Leu Leu Arg Ser Phe Asp Lys Phe Thr 180 185 190 Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg Lys Asn Val Phe Ser Ala 195 200 205 Glu Asp Ile Ser Thr Ala Ile Pro His Arg Ile Val Gln Asp Asn Phe 210 215 220 Pro Lys Phe Lys Glu Asn Cys His Ile Phe Thr Arg Leu Ile Thr Ala 225 230 235 240 Val Pro Ser Leu Arg Glu His Phe Glu Asn Val Lys Lys Ala Ile Gly 245 250 255 Ile Phe Val Ser Thr Ser Ile Glu Glu Val Phe Ser Phe Pro Phe Tyr 260 265 270 Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp Leu Tyr Asn Gln Leu Leu 275 280 285 Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu Lys Ile Lys Gly Leu Asn 290 295 300 Glu Val Leu Asn Leu Ala Ile Gln Lys Asn Asp Glu Thr Ala His Ile 305 310 315 320 Ile Ala Ser Leu Pro His Arg Phe Ile Pro Leu Phe Lys Gln Ile Leu 325 330 335 Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu Glu Glu Phe Lys Ser Asp 340 345 350 Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr Lys Thr Leu Leu Arg Asn 355 360 365 Glu Asn Val Leu Glu Thr Ala Glu Ala Leu Phe Asn Glu Leu Asn Ser 370 375 380 Ile Asp Leu Thr His Ile Phe Ile Ser His Lys Lys Leu Glu Thr Ile 385 390 395 400 Ser Ser Ala Leu Cys Asp His Trp Asp Thr Leu Arg Asn Ala Leu Tyr 405 410 415 Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys Ile Thr Lys Ser Ala Lys 420 425 430 Glu Lys Val Gln Arg Ser Leu Lys His Glu Asp Ile Asn Leu Gln Glu 435 440 445 Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser Glu Ala Phe Lys Gln Lys 450 455 460 Thr Ser Glu Ile Leu Ser His Ala His Ala Ala Leu Asp Gln Pro Leu 465 470 475 480 Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys Glu Ile Leu Lys Ser Gln 485 490 495 Leu Asp Ser Leu Leu Gly Leu Tyr His Leu Leu Asp Trp Phe Ala Val 500 505 510 Asp Glu Ser Asn Glu Val Asp Pro Glu Phe Ser Ala Arg Leu Thr Gly 515 520 525 Ile Lys Leu Glu Met Glu Pro Ser Leu Ser Phe Tyr Asn Lys Ala Arg 530 535 540 Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val Glu Lys Phe Lys Leu Asn 545 550 555 560 Phe Gln Met Pro Thr Leu Ala Ser Gly Trp Asp Val Asn Lys Glu Lys 565 570 575 Asn Asn Gly Ala Ile Leu Phe Val Lys Asn Gly Leu Tyr Tyr Leu Gly 580 585 590 Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys Ala Leu Ser Phe Glu Pro 595 600 605 Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys Met Tyr Tyr Asp Tyr Phe 610 615 620 Pro Asp Ala Ala Lys Met Ile Pro Lys Cys Ser Thr Gln Leu Lys Ala 625 630 635 640 Val Thr Ala His Phe Gln Thr His Thr Thr Pro Ile Leu Leu Ser Asn 645 650 655 Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys Glu Ile Tyr Asp Leu Asn 660 665 670 Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln Thr Ala Tyr Ala Lys Lys 675 680 685 Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala Leu Cys Lys Trp Ile Asp 690 695 700 Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr Lys Thr Thr Ser Ile Asp 705 710 715 720 Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr Lys Asp Leu Gly Glu Tyr 725 730 735 Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His Ile Ser Phe Gln Arg Ile 740 745 750 Ala Glu Lys Glu Ile Met Asp Ala Val Glu Thr Gly Lys Leu Tyr Leu 755 760 765 Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys Gly His His Gly Lys Pro 770 775 780 Asn Leu His Thr Leu Tyr Trp Thr Gly Leu Phe Ser Pro Glu Asn Leu 785 790 795 800 Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln Ala Glu Leu Phe Tyr Arg 805 810 815 Pro Lys Ser Arg Met Lys Arg Met Ala His Arg Leu Gly Glu Lys Met 820 825 830 Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr Pro Ile Pro Asp Thr Leu 835 840 845 Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His Arg Leu Ser His Asp Leu 850 855 860 Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn Val Ile Thr Lys Glu Val 865 870 875 880 Ser His Glu Ile Ile Lys Asp Arg Arg Phe Thr Ser Asp Lys Phe Phe 885 890 895 Phe His Val Pro Ile Thr Leu Asn Tyr Gln Ala Ala Asn Ser Pro Ser 900 905 910 Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu Lys Glu His Pro Glu Thr 915 920 925 Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Ile Tyr Ile Thr 930 935 940 Val Ile Asp Ser Thr Gly Lys Ile Leu Glu Gln Arg Ser Leu Asn Thr 945 950 955 960 Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu Asp Asn Arg Glu Lys Glu 965 970 975 Arg Val Ala Ala Arg Gln Ala Trp Ser Val Val Gly Thr Ile Lys Asp 980 985 990 Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile His Glu Ile Val Asp Leu 995 1000 1005 Met Ile His Tyr Gln Ala Val Val Val Leu Glu Asn Leu Asn Phe Gly 1010 1015 1020 Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu Lys Ala Val Tyr Gln Gln 1025 1030 1035 1040 Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Cys Leu Val Leu Lys Asp 1045 1050 1055 Tyr Pro Ala Glu Lys Val Gly Gly Val Leu Asn Pro Tyr Gln Leu Thr 1060 1065 1070 Asp Gln Phe Thr Ser Phe Ala Lys Met Gly Thr Gln Ser Gly Phe Leu 1075 1080 1085 Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly 1090 1095 1100 Phe Val Asp Pro Phe Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg 1105 1110 1115 1120 Lys His Phe Leu Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr 1125 1130 1135 Gly Asp Phe Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln 1140 1145 1150 Arg Gly Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys 1155 1160 1165 Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys 1170 1175 1180 Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr Arg 1185 1190 1195 1200 Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu Lys Gly 1205 1210 1215 Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu Leu Glu Asn 1220 1225 1230 Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu Ile Arg Ser Val 1235 1240 1245 Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly Glu Asp Tyr Ile Asn 1250 1255 1260 Ser Pro Val Arg Asp Leu Asn Gly Val Cys Phe Asp Ser Arg Phe Gln 1265 1270 1275 1280 Asn Pro Glu Trp Pro Met Asp Ala Asp Ala Asn Gly Ala Tyr His Ile 1285 1290 1295 Ala Leu Lys Gly Gln Leu Leu Leu Asn His Leu Lys Glu Ser Lys Asp 1300 1305 1310 Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln Asp Trp Leu Ala Tyr Ile 1315 1320 1325 Gln Glu Leu Arg Asn Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp 1330 1335 1340 His Asp Ile Asp Tyr Lys Asp Asp Asp Asp Lys 1345 1350 1355 <210> 63 <211> 4065 <212> DNA <213> Artificial Sequence <220> <223> pET28-wt-AsCas12a <400> 63 catcatcatc atcatcatgt gtacccctac gacgtgcccg actacgccga attgcctcca 60 aaaaagaaga gaaaggtaat gacacagttt gaaggcttca ccaatctcta ccaggtcagc 120 aagacgctac gttttgagct tatcccgcag ggaaaaaccc tgaaacacat tcaggaacag 180 gggttcatag aggaagataa ggcgcgtaac gaccattata aagaactgaa gcctataatc 240 gaccgtattt ataaaacgta cgcggatcag tgcctgcagc tggttcagct ggattgggag 300 aatctgtccg cggctattga tagctatcgc aaagagaaga ccgaggaaac ccgtaacgca 360 ctgattgaag agcaggcgac ctatcggaat gcgatccatg attacttcat cggccgcacc 420 gacaacctga ccgatgcaat taacaaacgt cacgcagaga tttacaaagg tctgtttaaa 480 gcagagttat tcaatggcaa ggttctgaaa cagctgggta cggtcaccac caccgaacac 540 gaaaacgcac tgctgaggag ctttgataaa tttaccacat atttcagcgg tttctatgaa 600 aatcgtaaga atgtatttag cgccgaagat atttccaccg caattcctca tcgtattgtg 660 caggataatt ttccgaagtt taaagaaaat tgtcatattt ttacccgtct gatcaccgcg 720 gtaccgagcc tgcgagagca ttttgaaaac gttaagaaag ccattggaat ttttgtcagt 780 accagcattg aagaagtgtt ttcgttcccg ttctataacc aactgctgac ccagacccag 840 attgatctgt acaatcagct gctggggggc ataagccgcg aggcaggtac cgaaaagata 900 aagggactca atgaggtgct gaatctggca attcagaaga atgatgagac ggctcatatc 960 attgctagcc tgccgcatcg tttcattccc ctgtttaagc aaatcctgag cgatcgcaat 1020 acactgagct ttatcctcga agagtttaaa tcggacgaag aagttatcca gagcttttgc 1080 aaatacaaaa ccctgctgcg gaacgaaaat gtgctggaga ccgctgaagc actgtttaat 1140 gaactgaact cgatcgacct cacccatatt tttatatccc acaaaaaact ggaaaccata 1200 agcagcgctc tgtgtgacca ttgggatacc ctgcgcaacg ccctgtatga acggcgtatc 1260 agcgagctga ccgggaaaat caccaaatcc gcaaaggaaa aagttcagcg tagtctgaaa 1320 cacgaggaca tcaacctgca agaaattatt agcgcagcag gtaaagagct gagcgaagca 1380 ttcaaacaga aaaccagcga aatcctgagc catgcccatg ctgcactgga tcagccgctg 1440 ccgaccaccc tgaaaaaaca ggaggaaaag gagattctga aaagccaact ggacagcctg 1500 ctgggcctgt atcacctgct ggactggttt gcagtcgatg agagcaacga ggttgatcct 1560 gagttctccg ctcgtctgac cggaatcaag ctggagatgg aaccgagtct gtcgttttac 1620 aataaagcgc gtaattacgc gaccaagaaa ccgtatagcg tggaaaaatt caaactgaac 1680 tttcagatgc cgacccttgc aagcggatgg gacgttaaca aagaaaaaaa caatggggca 1740 attctgtttg tgaaaaatgg cctctattat ctgggtatca tgccgaaaca gaaagggcgc 1800 tacaaagccc tgtcatttga gccgaccgag aaaacctcag agggtttcga caagatgtac 1860 tacgattatt tcccggatgc ggcaaaaatg atacccaaat gtagcaccca actgaaggca 1920 gttacagccc actttcagac ccataccacc ccgatcctgc tgtcgaacaa ttttatagag 1980 ccgctggaaa ttaccaaaga gatttatgat ctgaataatc cggaaaagga gcccaagaaa 2040 tttcagacgg cgtatgcaaa aaagaccggg gatcagaaag gttatcgtga agcgctgtgc 2100 aaatggattg actttacccg tgactttctg tcaaaatata ccaaaacgac gagcattgat 2160 ctgagcagcc tacgtccgag cagccaatat aaggatctgg gcgaatatta cgccgaactg 2220 aatccgctgc tctaccatat ttccttccaa cgaatcgctg aaaaagaaat aatggacgcc 2280 gttgaaaccg gcaaactgta tctgtttcaa atctacaaca aagatttcgc caaaggccat 2340 cacggtaagc cgaacctgca taccctgtat tggaccggtc tgtttagccc ggagaatctg 2400 gccaaaacca gcatcaagct gaacggacag gcagaactgt tttaccgccc caaaagccgt 2460 atgaaaagga tggcacaccg cctgggcgaa aaaatgctga ataagaaact caaagatcag 2520 aaaacgccga taccggatac cctttatcag gagctgtatg attatgttaa ccaccggctg 2580 agccatgacc tgagcgacga agcgcgtgca ctgctgccga acgtgattac caaggaagtc 2640 tcgcatgaaa ttattaaaga tcggcgcttc accagtgata aatttttctt ccatgtaccg 2700 atcaccctga attatcaagc cgcaaatagc ccttccaaat ttaatcaacg cgtgaatgcg 2760 tacctgaaag agcatccgga gaccccaatt attggcatag accgaggaga acgcaatctc 2820 atttatatca ccgtcattga tagcaccggt aagatcctgg aacagcgtag cctgaatacc 2880 attcagcagt ttgactacca gaaaaagctg gacaacagag aaaaggaacg tgtagccgcc 2940 cggcaggctt ggagtgtggt gggtactatc aaggatctga agcaggggta tctctcccaa 3000 gttatccatg aaattgtcga tctaatgatt cactatcaag cagtagtggt actggaaaat 3060 ctgaatttcg gtttcaaaag caaacgtaca gggatcgctg aaaaagccgt ttatcagcag 3120 ttcgagaaaa tgctgataga caagctgaat tgcctggttc tgaaagatta tccggcagag 3180 aaggtgggcg gtgtgctgaa cccgtaccag ctgactgatc aatttacgag ctttgcaaaa 3240 atgggaacgc agagcggttt cctgttctat gttccggcgc catataccag caagatagac 3300 ccgctgacag gtttcgtaga tccgtttgtc tggaaaacca ttaaaaatca tgaaagtcgc 3360 aaacattttc tggagggctt tgattttctg cactatgacg tgaaaaccgg cgacttcatt 3420 ctgcatttta aaatgaaccg taatctgtcc tttcagcgcg gcctgcctgg ctttatgccg 3480 gcgtgggaca ttgtttttga aaagaatgag acacagtttg atgccaaagg tacccccttt 3540 attgcgggga aacgcattgt gcccgttata gaaaatcacc gcttcaccgg acggtatagg 3600 gacttgtacc cggcaaatga attgatagcg ctgctggagg agaaaggtat tgtctttcgg 3660 gatggatcaa acatcctgcc gaagctgctg gagaacgatg acagccacgc aatagacacc 3720 atggtagcgc tgatccgaag cgtgctgcag atgcgtaaca gtaatgcggc tacgggggaa 3780 gactacatta atagcccggt ccgtgatctg aacggcgttt gtttcgatag cagatttcaa 3840 aatccggagt ggccgatgga tgccgatgcc aatggagctt accatatcgc tctcaaaggt 3900 cagctcctac tgaaccattt gaaagaatca aaagatctga aactgcagaa cggcatctcg 3960 aatcaggact ggctggccta cattcaagaa ctgagaaacg actacaaaga ccatgacggt 4020 gattataaag atcatgacat cgattacaag gatgacgatg acaag 4065 <210> 64 <211> 1355 <212> PRT <213> Artificial Sequence <220> <223> pET28-en-AsCas12a <400> 64 His His His His His His Val Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 1 5 10 15 Glu Leu Pro Pro Lys Lys Lys Arg Lys Val Met Thr Gln Phe Glu Gly 20 25 30 Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr Leu Arg Phe Glu Leu Ile 35 40 45 Pro Gln Gly Lys Thr Leu Lys His Ile Gln Glu Gln Gly Phe Ile Glu 50 55 60 Glu Asp Lys Ala Arg Asn Asp His Tyr Lys Glu Leu Lys Pro Ile Ile 65 70 75 80 Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln Cys Leu Gln Leu Val Gln 85 90 95 Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile Asp Ser Tyr Arg Lys Glu 100 105 110 Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile Glu Glu Gln Ala Thr Tyr 115 120 125 Arg Asn Ala Ile His Asp Tyr Phe Ile Gly Arg Thr Asp Asn Leu Thr 130 135 140 Asp Ala Ile Asn Lys Arg His Ala Glu Ile Tyr Lys Gly Leu Phe Lys 145 150 155 160 Ala Glu Leu Phe Asn Gly Lys Val Leu Lys Gln Leu Gly Thr Val Thr 165 170 175 Thr Thr Glu His Glu Asn Ala Leu Leu Arg Ser Phe Asp Lys Phe Thr 180 185 190 Thr Tyr Phe Ser Gly Phe Tyr Arg Asn Arg Lys Asn Val Phe Ser Ala 195 200 205 Glu Asp Ile Ser Thr Ala Ile Pro His Arg Ile Val Gln Asp Asn Phe 210 215 220 Pro Lys Phe Lys Glu Asn Cys His Ile Phe Thr Arg Leu Ile Thr Ala 225 230 235 240 Val Pro Ser Leu Arg Glu His Phe Glu Asn Val Lys Lys Ala Ile Gly 245 250 255 Ile Phe Val Ser Thr Ser Ile Glu Glu Val Phe Ser Phe Pro Phe Tyr 260 265 270 Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp Leu Tyr Asn Gln Leu Leu 275 280 285 Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu Lys Ile Lys Gly Leu Asn 290 295 300 Glu Val Leu Asn Leu Ala Ile Gln Lys Asn Asp Glu Thr Ala His Ile 305 310 315 320 Ile Ala Ser Leu Pro His Arg Phe Ile Pro Leu Phe Lys Gln Ile Leu 325 330 335 Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu Glu Glu Phe Lys Ser Asp 340 345 350 Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr Lys Thr Leu Leu Arg Asn 355 360 365 Glu Asn Val Leu Glu Thr Ala Glu Ala Leu Phe Asn Glu Leu Asn Ser 370 375 380 Ile Asp Leu Thr His Ile Phe Ile Ser His Lys Lys Leu Glu Thr Ile 385 390 395 400 Ser Ser Ala Leu Cys Asp His Trp Asp Thr Leu Arg Asn Ala Leu Tyr 405 410 415 Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys Ile Thr Lys Ser Ala Lys 420 425 430 Glu Lys Val Gln Arg Ser Leu Lys His Glu Asp Ile Asn Leu Gln Glu 435 440 445 Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser Glu Ala Phe Lys Gln Lys 450 455 460 Thr Ser Glu Ile Leu Ser His Ala His Ala Ala Leu Asp Gln Pro Leu 465 470 475 480 Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys Glu Ile Leu Lys Ser Gln 485 490 495 Leu Asp Ser Leu Leu Gly Leu Tyr His Leu Leu Asp Trp Phe Ala Val 500 505 510 Asp Glu Ser Asn Glu Val Asp Pro Glu Phe Ser Ala Arg Leu Thr Gly 515 520 525 Ile Lys Leu Glu Met Glu Pro Ser Leu Ser Phe Tyr Asn Lys Ala Arg 530 535 540 Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val Glu Lys Phe Lys Leu Asn 545 550 555 560 Phe Gln Met Pro Thr Leu Ala Arg Gly Trp Asp Val Asn Arg Glu Lys 565 570 575 Asn Asn Gly Ala Ile Leu Phe Val Lys Asn Gly Leu Tyr Tyr Leu Gly 580 585 590 Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys Ala Leu Ser Phe Glu Pro 595 600 605 Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys Met Tyr Tyr Asp Tyr Phe 610 615 620 Pro Asp Ala Ala Lys Met Ile Pro Lys Cys Ser Thr Gln Leu Lys Ala 625 630 635 640 Val Thr Ala His Phe Gln Thr His Thr Thr Pro Ile Leu Leu Ser Asn 645 650 655 Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys Glu Ile Tyr Asp Leu Asn 660 665 670 Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln Thr Ala Tyr Ala Lys Lys 675 680 685 Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala Leu Cys Lys Trp Ile Asp 690 695 700 Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr Lys Thr Thr Ser Ile Asp 705 710 715 720 Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr Lys Asp Leu Gly Glu Tyr 725 730 735 Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His Ile Ser Phe Gln Arg Ile 740 745 750 Ala Glu Lys Glu Ile Met Asp Ala Val Glu Thr Gly Lys Leu Tyr Leu 755 760 765 Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys Gly His His Gly Lys Pro 770 775 780 Asn Leu His Thr Leu Tyr Trp Thr Gly Leu Phe Ser Pro Glu Asn Leu 785 790 795 800 Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln Ala Glu Leu Phe Tyr Arg 805 810 815 Pro Lys Ser Arg Met Lys Arg Met Ala His Arg Leu Gly Glu Lys Met 820 825 830 Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr Pro Ile Pro Asp Thr Leu 835 840 845 Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His Arg Leu Ser His Asp Leu 850 855 860 Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn Val Ile Thr Lys Glu Val 865 870 875 880 Ser His Glu Ile Ile Lys Asp Arg Arg Phe Thr Ser Asp Lys Phe Phe 885 890 895 Phe His Val Pro Ile Thr Leu Asn Tyr Gln Ala Ala Asn Ser Pro Ser 900 905 910 Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu Lys Glu His Pro Glu Thr 915 920 925 Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Ile Tyr Ile Thr 930 935 940 Val Ile Asp Ser Thr Gly Lys Ile Leu Glu Gln Arg Ser Leu Asn Thr 945 950 955 960 Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu Asp Asn Arg Glu Lys Glu 965 970 975 Arg Val Ala Ala Arg Gln Ala Trp Ser Val Val Gly Thr Ile Lys Asp 980 985 990 Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile His Glu Ile Val Asp Leu 995 1000 1005 Met Ile His Tyr Gln Ala Val Val Val Leu Glu Asn Leu Asn Phe Gly 1010 1015 1020 Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu Lys Ala Val Tyr Gln Gln 1025 1030 1035 1040 Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Cys Leu Val Leu Lys Asp 1045 1050 1055 Tyr Pro Ala Glu Lys Val Gly Gly Val Leu Asn Pro Tyr Gln Leu Thr 1060 1065 1070 Asp Gln Phe Thr Ser Phe Ala Lys Met Gly Thr Gln Ser Gly Phe Leu 1075 1080 1085 Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly 1090 1095 1100 Phe Val Asp Pro Phe Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg 1105 1110 1115 1120 Lys His Phe Leu Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr 1125 1130 1135 Gly Asp Phe Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln 1140 1145 1150 Arg Gly Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys 1155 1160 1165 Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys 1170 1175 1180 Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr Arg 1185 1190 1195 1200 Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu Lys Gly 1205 1210 1215 Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu Leu Glu Asn 1220 1225 1230 Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu Ile Arg Ser Val 1235 1240 1245 Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly Glu Asp Tyr Ile Asn 1250 1255 1260 Ser Pro Val Arg Asp Leu Asn Gly Val Cys Phe Asp Ser Arg Phe Gln 1265 1270 1275 1280 Asn Pro Glu Trp Pro Met Asp Ala Asp Ala Asn Gly Ala Tyr His Ile 1285 1290 1295 Ala Leu Lys Gly Gln Leu Leu Leu Asn His Leu Lys Glu Ser Lys Asp 1300 1305 1310 Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln Asp Trp Leu Ala Tyr Ile 1315 1320 1325 Gln Glu Leu Arg Asn Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp 1330 1335 1340 His Asp Ile Asp Tyr Lys Asp Asp Asp Asp Lys 1345 1350 1355 <210> 65 <211> 4065 <212> DNA <213> Artificial Sequence <220> <223> pET28-en-AsCas12a <400> 65 catcatcatc atcatcatgt gtacccctac gacgtgcccg actacgccga attgcctcca 60 aaaaagaaga gaaaggtaat gacacagttt gaaggcttca ccaatctcta ccaggtcagc 120 aagacgctac gttttgagct tatcccgcag ggaaaaaccc tgaaacacat tcaggaacag 180 gggttcatag aggaagataa ggcgcgtaac gaccattata aagaactgaa gcctataatc 240 gaccgtattt ataaaacgta cgcggatcag tgcctgcagc tggttcagct ggattgggag 300 aatctgtccg cggctattga tagctatcgc aaagagaaga ccgaggaaac ccgtaacgca 360 ctgattgaag agcaggcgac ctatcggaat gcgatccatg attacttcat cggccgcacc 420 gacaacctga ccgatgcaat taacaaacgt cacgcagaga tttacaaagg tctgtttaaa 480 gcagagttat tcaatggcaa ggttctgaaa cagctgggta cggtcaccac caccgaacac 540 gaaaacgcac tgctgaggag ctttgataaa tttaccacat atttcagcgg tttctatcgt 600 aatcgtaaga atgtatttag cgccgaagat atttccaccg caattcctca tcgtattgtg 660 caggataatt ttccgaagtt taaagaaaat tgtcatattt ttacccgtct gatcaccgcg 720 gtaccgagcc tgcgagagca ttttgaaaac gttaagaaag ccattggaat ttttgtcagt 780 accagcattg aagaagtgtt ttcgttcccg ttctataacc aactgctgac ccagacccag 840 attgatctgt acaatcagct gctggggggc ataagccgcg aggcaggtac cgaaaagata 900 aagggactca atgaggtgct gaatctggca attcagaaga atgatgaaac ggctcatatc 960 attgctagcc tgccgcatcg tttcattccc ctgtttaagc aaatcctgag cgatcgcaat 1020 acactgagct ttatcctcga agagtttaaa tcggacgaag aagttatcca gagcttttgc 1080 aaatacaaaa ccctgctgcg gaacgaaaat gtgctggaga ccgctgaagc actgtttaat 1140 gaactgaact cgatcgacct cacccatatt tttatatccc acaaaaaact ggaaaccata 1200 agcagcgctc tgtgtgacca ttgggatacc ctgcgcaacg ccctgtatga acggcgtatc 1260 agcgagctga ccgggaaaat caccaaatcc gcaaaggaaa aagttcagcg tagtctgaaa 1320 cacgaggaca tcaacctgca agaaattatt agcgcagcag gtaaagagct gagcgaagca 1380 ttcaaacaga aaaccagcga aatcctgagc catgcccatg ctgcactgga tcagccgctg 1440 ccgaccaccc tgaaaaaaca ggaggaaaag gagattctga aaagccaact ggacagcctg 1500 ctgggcctgt atcacctgct ggactggttt gcagtcgatg agagcaacga ggttgatcct 1560 gagttctccg ctcgtctgac cggaatcaag ctggagatgg aaccgagtct gtcgttttac 1620 aacaaagcgc gtaattacgc gaccaagaaa ccgtatagcg tggaaaaatt caaactgaac 1680 tttcagatgc cgacccttgc acgtggatgg gacgttaacc gtgaaaaaaa caatggggca 1740 attctgtttg tgaaaaatgg cctctattat ctgggtatca tgccgaaaca gaaagggcgc 1800 tacaaagccc tgtcatttga gccgaccgag aaaacctcag agggtttcga caagatgtac 1860 tacgattatt tcccggatgc ggcaaaaatg atacccaaat gtagcaccca actgaaggca 1920 gttacagccc actttcagac ccataccacc ccgatcctgc tgtcgaacaa ttttatagag 1980 ccgctggaaa ttaccaaaga gatttatgat ctgaataatc cggaaaagga gcccaagaaa 2040 tttcagacgg cgtatgcaaa aaagaccggg gatcagaaag gttatcgtga agcgctgtgc 2100 aaatggattg actttacccg tgactttctg tcaaaatata ccaaaacgac gagcattgat 2160 ctgagcagcc tacgtccgag cagccaatat aaggatctgg gcgaatatta cgccgaactg 2220 aatccgctgc tctaccatat ttccttccaa cgaatcgctg aaaaagaaat aatggacgcc 2280 gttgaaaccg gcaaactgta tctgtttcaa atctacaaca aagatttcgc caaaggccat 2340 cacggtaagc cgaacctgca taccctgtat tggaccggtc tgtttagccc ggagaatctg 2400 gccaaaacca gcatcaagct gaacggacag gcagaactgt tttaccgccc caaaagccgt 2460 atgaaaagga tggcacaccg cctgggcgaa aaaatgctga ataagaaact caaagatcag 2520 aaaacgccga taccggatac cctttatcag gagctgtatg attatgttaa ccaccggctg 2580 agccatgacc tgagcgacga agcgcgtgca ctgctgccga acgtgattac caaggaagtc 2640 tcgcatgaaa ttattaaaga tcggcgcttc accagtgata aatttttctt ccatgtaccg 2700 atcaccctga attatcaagc cgcaaatagc ccttccaaat ttaatcaacg cgtgaatgcg 2760 tacctgaaag agcatccgga gaccccaatt attggcatag accgaggaga acgcaatctc 2820 atttatatca ccgtcattga tagcaccggt aagatcctgg aacagcgtag cctgaatacc 2880 attcagcagt ttgactacca gaaaaagctg gacaacagag aaaaggaacg tgtagccgcc 2940 cggcaggctt ggagtgtggt gggtactatc aaggatctga agcaggggta tctctcccaa 3000 gttatccatg aaattgtcga tctaatgatt cactatcaag cagtagtggt actggaaaat 3060 ctgaatttcg gtttcaaaag caaacgtaca gggatcgctg aaaaagccgt ttatcagcag 3120 ttcgagaaaa tgctgataga caagctgaat tgcctggttc tgaaagatta tccggcagag 3180 aaggtgggcg gtgtgctgaa cccgtaccag ctgactgatc aatttacgag ctttgcaaaa 3240 atgggaacgc agagcggttt cctgttctat gttccggcgc catataccag caagatagac 3300 ccgctgacag gtttcgtaga tccgtttgtc tggaaaacca ttaaaaatca tgaaagtcgc 3360 aaacattttc tggagggctt tgattttctg cactatgacg tgaaaaccgg cgacttcatt 3420 ctgcatttta aaatgaaccg taatctgtcc tttcagcgcg gcctgcctgg ctttatgccg 3480 gcgtgggaca ttgtttttga aaagaatgag acacagtttg atgccaaagg tacccccttt 3540 attgcgggga aacgcattgt gcccgttata gaaaatcacc gcttcaccgg acggtatagg 3600 gacttgtacc cggcaaatga attgatagcg ctgctggagg agaaaggtat tgtctttcgg 3660 gatggatcaa acatcctgcc gaagctgctg gagaacgatg acagccacgc aatagacacc 3720 atggtagcgc tgatccgaag cgtgctgcag atgcgtaaca gtaatgcggc tacgggggaa 3780 gactacatta atagcccggt ccgtgatctg aacggcgttt gtttcgatag cagatttcaa 3840 aatccggagt ggccgatgga tgccgatgcc aatggagctt accatatcgc tctcaaaggt 3900 cagctcctac tgaaccattt gaaagaatca aaagatctga aactgcagaa cggcatctcg 3960 aatcaggact ggctggccta cattcaagaa ctgagaaacg actacaaaga ccatgacggt 4020 gattataaag atcatgacat cgattacaag gatgacgatg acaag 4065 <210> 66 <211> 1352 <212> PRT <213> Artificial Sequence <220> <223> CMV-wt-AsCas12a <400> 66 Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr 1 5 10 15 Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln 20 25 30 Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys 35 40 45 Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln 50 55 60 Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile 65 70 75 80 Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile 85 90 95 Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly 100 105 110 Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile 115 120 125 Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys 130 135 140 Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg 145 150 155 160 Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg 165 170 175 Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg 180 185 190 Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe 195 200 205 Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn 210 215 220 Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val 225 230 235 240 Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp 245 250 255 Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu 260 265 270 Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn 275 280 285 Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro 290 295 300 Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu 305 310 315 320 Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr 325 330 335 Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu 340 345 350 Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His 355 360 365 Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr 370 375 380 Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys 385 390 395 400 Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu 405 410 415 Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser 420 425 430 Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala 435 440 445 Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys 450 455 460 Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu 465 470 475 480 Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe 485 490 495 Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser 500 505 510 Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val 515 520 525 Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp 530 535 540 Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn 545 550 555 560 Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys 565 570 575 Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys 580 585 590 Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys 595 600 605 Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr 610 615 620 Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys 625 630 635 640 Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln 645 650 655 Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala 660 665 670 Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr 675 680 685 Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr 690 695 700 Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His 705 710 715 720 Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu 725 730 735 Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys 740 745 750 Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu 755 760 765 Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln 770 775 780 Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His 785 790 795 800 Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr 805 810 815 Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His 820 825 830 Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn 835 840 845 Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe 850 855 860 Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln 865 870 875 880 Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu 885 890 895 Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg 900 905 910 Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu 915 920 925 Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu 930 935 940 Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val 945 950 955 960 Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile 965 970 975 His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu 980 985 990 Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu 995 1000 1005 Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn 1010 1015 1020 Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu 1025 1030 1035 1040 Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly 1045 1050 1055 Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys 1060 1065 1070 Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile 1075 1080 1085 Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu 1090 1095 1100 His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn 1105 1110 1115 1120 Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp 1125 1130 1135 Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr 1140 1145 1150 Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His Arg 1155 1160 1165 Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala 1170 1175 1180 Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu 1185 1190 1195 1200 Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val 1205 1210 1215 Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr 1220 1225 1230 Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys 1235 1240 1245 Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala 1250 1255 1260 Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His 1265 1270 1275 1280 Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln 1285 1290 1295 Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn Lys Arg Pro Ala Ala 1300 1305 1310 Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr 1315 1320 1325 Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr 1330 1335 1340 Pro Tyr Asp Val Pro Asp Tyr Ala 1345 1350 <210> 67 <211> 4056 <212> DNA <213> Artificial Sequence <220> <223> CMV-wt-AsCas12a <400> 67 atgacacagt tcgagggctt taccaacctg tatcaggtga gcaagacact gcggtttgag 60 ctgatcccac agggcaagac cctgaagcac atccaggagc agggcttcat cgaggaggac 120 aaggcccgca atgatcacta caaggagctg aagcccatca tcgatcggat ctacaagacc 180 tatgccgacc agtgcctgca gctggtgcag ctggattggg agaacctgag cgccgccatc 240 gactcctata gaaaggagaa aaccgaggag acaaggaacg ccctgatcga ggagcaggcc 300 acatatcgca atgccatcca cgactacttc atcggccgga cagacaacct gaccgatgcc 360 atcaataaga gacacgccga gatctacaag ggcctgttca aggccgagct gtttaatggc 420 aaggtgctga agcagctggg caccgtgacc acaaccgagc acgagaacgc cctgctgcgg 480 agcttcgaca agtttacaac ctacttctcc ggcttttatg agaacaggaa gaacgtgttc 540 agcgccgagg atatcagcac agccatccca caccgcatcg tgcaggacaa cttccccaag 600 tttaaggaga attgtcacat cttcacacgc ctgatcaccg ccgtgcccag cctgcgggag 660 cactttgaga acgtgaagaa ggccatcggc atcttcgtga gcacctccat cgaggaggtg 720 ttttccttcc ctttttataa ccagctgctg acacagaccc agatcgacct gtataaccag 780 ctgctgggag gaatctctcg ggaggcaggc accgagaaga tcaagggcct gaacgaggtg 840 ctgaatctgg ccatccagaa gaatgatgag acagcccaca tcatcgcctc cctgccacac 900 agattcatcc ccctgtttaa gcagatcctg tccgatagga acaccctgtc tttcatcctg 960 gaggagttta agagcgacga ggaagtgatc cagtccttct gcaagtacaa gacactgctg 1020 agaaacgaga acgtgctgga gacagccgag gccctgttta acgagctgaa cagcatcgac 1080 ctgacacaca tcttcatcag ccacaagaag ctggagacaa tcagcagcgc cctgtgcgac 1140 cactgggata cactgaggaa tgccctgtat gagcggagaa tctccgagct gacaggcaag 1200 atcaccaagt ctgccaagga gaaggtgcag cgcagcctga agcacgagga tatcaacctg 1260 caggagatca tctctgccgc aggcaaggag ctgagcgagg ccttcaagca gaaaaccagc 1320 gagatcctgt cccacgcaca cgccgccctg gatcagccac tgcctacaac cctgaagaag 1380 caggaggaga aggagatcct gaagtctcag ctggacagcc tgctgggcct gtaccacctg 1440 ctggactggt ttgccgtgga tgagtccaac gaggtggacc ccgagttctc tgcccggctg 1500 accggcatca agctggagat ggagccttct ctgagcttct acaacaaggc cagaaattat 1560 gccaccaaga agccctactc cgtggagaag ttcaagctga actttcagat gcctacactg 1620 gcctctggct gggacgtgaa taaggagaag aacaatggcg ccatcctgtt tgtgaagaac 1680 ggcctgtact atctgggcat catgccaaag cagaagggca ggtataaggc cctgagcttc 1740 gagcccacag agaaaaccag cgagggcttt gataagatgt actatgacta cttccctgat 1800 gccgccaaga tgatcccaaa gtgcagcacc cagctgaagg ccgtgacagc ccactttcag 1860 acccacacaa cccccatcct gctgtccaac aatttcatcg agcctctgga gatcacaaag 1920 gagatctacg acctgaacaa tcctgagaag gagccaaaga agtttcagac agcctacgcc 1980 aagaaaaccg gcgaccagaa gggctacaga gaggccctgt gcaagtggat cgacttcaca 2040 agggattttc tgtccaagta taccaagaca acctctatcg atctgtctag cctgcggcca 2100 tcctctcagt ataaggacct gggcgagtac tatgccgagc tgaatcccct gctgtaccac 2160 atcagcttcc agagaatcgc cgagaaggag atcatggatg ccgtggagac aggcaagctg 2220 tacctgttcc agatctataa caaggacttt gccaagggcc accacggcaa gcctaatctg 2280 cacacactgt attggaccgg cctgttttct ccagagaacc tggccaagac aagcatcaag 2340 ctgaatggcc aggccgagct gttctaccgc cctaagtcca ggatgaagag gatggcacac 2400 cggctgggag agaagatgct gaacaagaag ctgaaggatc agaaaacccc aatccccgac 2460 accctgtacc aggagctgta cgactatgtg aatcacagac tgtcccacga cctgtctgat 2520 gaggccaggg ccctgctgcc caacgtgatc accaaggagg tgtctcacga gatcatcaag 2580 gataggcgct ttaccagcga caagttcttt ttccacgtgc ctatcacact gaactatcag 2640 gccgccaatt ccccatctaa gttcaaccag agggtgaatg cctacctgaa ggagcacccc 2700 gagacaccta tcatcggcat cgatcggggc gagagaaacc tgatctatat cacagtgatc 2760 gactccaccg gcaagatcct ggagcagcgg agcctgaaca ccatccagca gtttgattac 2820 cagaagaagc tggacaacag ggagaaggag agggtggcag caaggcaggc ctggtctgtg 2880 gtgggcacaa tcaaggatct gaagcagggc tatctgagcc aggtcatcca cgagatcgtg 2940 gacctgatga tccactacca ggccgtggtg gtgctggaga acctgaattt cggctttaag 3000 agcaagagga ccggcatcgc cgagaaggcc gtgtaccagc agttcgagaa gatgctgatc 3060 gataagctga attgcctggt gctgaaggac tatccagcag agaaagtggg aggcgtgctg 3120 aacccatacc agctgacaga ccagttcacc tcctttgcca agatgggcac ccagtctggc 3180 ttcctgtttt acgtgcctgc cccatataca tctaagatcg atcccctgac cggcttcgtg 3240 gaccccttcg tgtggaaaac catcaagaat cacgagagcc gcaagcactt cctggagggc 3300 ttcgactttc tgcactacga cgtgaaaacc ggcgacttca tcctgcactt taagatgaac 3360 agaaatctgt ccttccagag gggcctgccc ggctttatgc ctgcatggga tatcgtgttc 3420 gagaagaacg agacacagtt tgacgccaag ggcacccctt tcatcgccgg caagagaatc 3480 gtgccagtga tcgagaatca cagattcacc ggcagatacc gggacctgta tcctgccaac 3540 gagctgatcg ccctgctgga ggagaagggc atcgtgttca gggatggctc caacatcctg 3600 ccaaagctgc tggagaatga cgattctcac gccatcgaca ccatggtggc cctgatccgc 3660 agcgtgctgc agatgcggaa ctccaatgcc gccacaggcg aggactatat caacagcccc 3720 gtgcgcgatc tgaatggcgt gtgcttcgac tcccggtttc agaacccaga gtggcccatg 3780 gacgccgatg ccaatggcgc ctaccacatc gccctgaagg gccagctgct gctgaatcac 3840 ctgaaggaga gcaaggatct gaagctgcag aacggcatct ccaatcagga ctggctggcc 3900 tacatccagg agctgcgcaa caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa 3960 aagaaaaagg gatcctaccc atacgatgtt ccagattacg cttatcccta cgacgtgcct 4020 gattatgcat acccatatga tgtccccgac tatgcc 4056 <210> 68 <211> 1352 <212> PRT <213> Artificial Sequence <220> <223> CMV-en-AsCas12a <400> 68 Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr 1 5 10 15 Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln 20 25 30 Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys 35 40 45 Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln 50 55 60 Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile 65 70 75 80 Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile 85 90 95 Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly 100 105 110 Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile 115 120 125 Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys 130 135 140 Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg 145 150 155 160 Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Arg Asn Arg 165 170 175 Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg 180 185 190 Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe 195 200 205 Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn 210 215 220 Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val 225 230 235 240 Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp 245 250 255 Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu 260 265 270 Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn 275 280 285 Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro 290 295 300 Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu 305 310 315 320 Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr 325 330 335 Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu 340 345 350 Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His 355 360 365 Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr 370 375 380 Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys 385 390 395 400 Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu 405 410 415 Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser 420 425 430 Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala 435 440 445 Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys 450 455 460 Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu 465 470 475 480 Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe 485 490 495 Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser 500 505 510 Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val 515 520 525 Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Arg Gly Trp 530 535 540 Asp Val Asn Arg Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn 545 550 555 560 Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys 565 570 575 Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys 580 585 590 Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys 595 600 605 Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr 610 615 620 Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys 625 630 635 640 Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln 645 650 655 Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala 660 665 670 Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr 675 680 685 Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr 690 695 700 Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His 705 710 715 720 Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu 725 730 735 Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys 740 745 750 Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu 755 760 765 Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln 770 775 780 Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His 785 790 795 800 Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr 805 810 815 Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His 820 825 830 Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn 835 840 845 Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe 850 855 860 Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln 865 870 875 880 Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu 885 890 895 Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg 900 905 910 Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu 915 920 925 Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu 930 935 940 Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val 945 950 955 960 Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile 965 970 975 His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu 980 985 990 Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu 995 1000 1005 Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn 1010 1015 1020 Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu 1025 1030 1035 1040 Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly 1045 1050 1055 Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys 1060 1065 1070 Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile 1075 1080 1085 Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu 1090 1095 1100 His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn 1105 1110 1115 1120 Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp 1125 1130 1135 Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr 1140 1145 1150 Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His Arg 1155 1160 1165 Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala 1170 1175 1180 Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu 1185 1190 1195 1200 Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val 1205 1210 1215 Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr 1220 1225 1230 Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys 1235 1240 1245 Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala 1250 1255 1260 Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His 1265 1270 1275 1280 Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln 1285 1290 1295 Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn Lys Arg Pro Ala Ala 1300 1305 1310 Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr 1315 1320 1325 Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr 1330 1335 1340 Pro Tyr Asp Val Pro Asp Tyr Ala 1345 1350 <210> 69 <211> 4056 <212> DNA <213> Artificial Sequence <220> <223> CMV-en-AsCas12a <400> 69 atgacacagt tcgagggctt taccaacctg tatcaggtga gcaagacact gcggtttgag 60 ctgatcccac agggcaagac cctgaagcac atccaggagc agggcttcat cgaggaggac 120 aaggcccgca atgatcacta caaggagctg aagcccatca tcgatcggat ctacaagacc 180 tatgccgacc agtgcctgca gctggtgcag ctggattggg agaacctgag cgccgccatc 240 gactcctata gaaaggagaa aaccgaggag acaaggaacg ccctgatcga ggagcaggcc 300 acatatcgca atgccatcca cgactacttc atcggccgga cagacaacct gaccgatgcc 360 atcaataaga gacacgccga gatctacaag ggcctgttca aggccgagct gtttaatggc 420 aaggtgctga agcagctggg caccgtgacc acaaccgagc acgagaacgc cctgctgcgg 480 agcttcgaca agtttacaac ctacttctcc ggcttttata ggaacaggaa gaacgtgttc 540 agcgccgagg atatcagcac agccatccca caccgcatcg tgcaggacaa cttccccaag 600 tttaaggaga attgtcacat cttcacacgc ctgatcaccg ccgtgcccag cctgcgggag 660 cactttgaga acgtgaagaa ggccatcggc atcttcgtga gcacctccat cgaggaggtg 720 ttttccttcc ctttttataa ccagctgctg acacagaccc agatcgacct gtataaccag 780 ctgctgggag gaatctctcg ggaggcaggc accgagaaga tcaagggcct gaacgaggtg 840 ctgaatctgg ccatccagaa gaatgatgag acagcccaca tcatcgcctc cctgccacac 900 agattcatcc ccctgtttaa gcagatcctg tccgatagga acaccctgtc tttcatcctg 960 gaggagttta agagcgacga ggaagtgatc cagtccttct gcaagtacaa gacactgctg 1020 agaaacgaga acgtgctgga gacagccgag gccctgttta acgagctgaa cagcatcgac 1080 ctgacacaca tcttcatcag ccacaagaag ctggagacaa tcagcagcgc cctgtgcgac 1140 cactgggata cactgaggaa tgccctgtat gagcggagaa tctccgagct gacaggcaag 1200 atcaccaagt ctgccaagga gaaggtgcag cgcagcctga agcacgagga tatcaacctg 1260 caggagatca tctctgccgc aggcaaggag ctgagcgagg ccttcaagca gaaaaccagc 1320 gagatcctgt cccacgcaca cgccgccctg gatcagccac tgcctacaac cctgaagaag 1380 caggaggaga aggagatcct gaagtctcag ctggacagcc tgctgggcct gtaccacctg 1440 ctggactggt ttgccgtgga tgagtccaac gaggtggacc ccgagttctc tgcccggctg 1500 accggcatca agctggagat ggagccttct ctgagcttct acaacaaggc cagaaattat 1560 gccaccaaga agccctactc cgtggagaag ttcaagctga actttcagat gcctacactg 1620 gcccggggct gggacgtgaa tcgggagaag aacaatggcg ccatcctgtt tgtgaagaac 1680 ggcctgtact atctgggcat catgccaaag cagaagggca ggtataaggc cctgagcttc 1740 gagcccacag agaaaaccag cgagggcttt gataagatgt actatgacta cttccctgat 1800 gccgccaaga tgatcccaaa gtgcagcacc cagctgaagg ccgtgacagc ccactttcag 1860 acccacacaa cccccatcct gctgtccaac aatttcatcg agcctctgga gatcacaaag 1920 gagatctacg acctgaacaa tcctgagaag gagccaaaga agtttcagac agcctacgcc 1980 aagaaaaccg gcgaccagaa gggctacaga gaggccctgt gcaagtggat cgacttcaca 2040 agggattttc tgtccaagta taccaagaca acctctatcg atctgtctag cctgcggcca 2100 tcctctcagt ataaggacct gggcgagtac tatgccgagc tgaatcccct gctgtaccac 2160 atcagcttcc agagaatcgc cgagaaggag atcatggatg ccgtggagac aggcaagctg 2220 tacctgttcc agatctataa caaggacttt gccaagggcc accacggcaa gcctaatctg 2280 cacacactgt attggaccgg cctgttttct ccagagaacc tggccaagac aagcatcaag 2340 ctgaatggcc aggccgagct gttctaccgc cctaagtcca ggatgaagag gatggcacac 2400 cggctgggag agaagatgct gaacaagaag ctgaaggatc agaaaacccc aatccccgac 2460 accctgtacc aggagctgta cgactatgtg aatcacagac tgtcccacga cctgtctgat 2520 gaggccaggg ccctgctgcc caacgtgatc accaaggagg tgtctcacga gatcatcaag 2580 gataggcgct ttaccagcga caagttcttt ttccacgtgc ctatcacact gaactatcag 2640 gccgccaatt ccccatctaa gttcaaccag agggtgaatg cctacctgaa ggagcacccc 2700 gagacaccta tcatcggcat cgatcggggc gagagaaacc tgatctatat cacagtgatc 2760 gactccaccg gcaagatcct ggagcagcgg agcctgaaca ccatccagca gtttgattac 2820 cagaagaagc tggacaacag ggagaaggag agggtggcag caaggcaggc ctggtctgtg 2880 gtgggcacaa tcaaggatct gaagcagggc tatctgagcc aggtcatcca cgagatcgtg 2940 gacctgatga tccactacca ggccgtggtg gtgctggaga acctgaattt cggctttaag 3000 agcaagagga ccggcatcgc cgagaaggcc gtgtaccagc agttcgagaa gatgctgatc 3060 gataagctga attgcctggt gctgaaggac tatccagcag agaaagtggg aggcgtgctg 3120 aacccatacc agctgacaga ccagttcacc tcctttgcca agatgggcac ccagtctggc 3180 ttcctgtttt acgtgcctgc cccatataca tctaagatcg atcccctgac cggcttcgtg 3240 gaccccttcg tgtggaaaac catcaagaat cacgagagcc gcaagcactt cctggagggc 3300 ttcgactttc tgcactacga cgtgaaaacc ggcgacttca tcctgcactt taagatgaac 3360 agaaatctgt ccttccagag gggcctgccc ggctttatgc ctgcatggga tatcgtgttc 3420 gagaagaacg agacacagtt tgacgccaag ggcacccctt tcatcgccgg caagagaatc 3480 gtgccagtga tcgagaatca cagattcacc ggcagatacc gggacctgta tcctgccaac 3540 gagctgatcg ccctgctgga ggagaagggc atcgtgttca gggatggctc caacatcctg 3600 ccaaagctgc tggagaatga cgattctcac gccatcgaca ccatggtggc cctgatccgc 3660 agcgtgctgc agatgcggaa ctccaatgcc gccacaggcg aggactatat caacagcccc 3720 gtgcgcgatc tgaatggcgt gtgcttcgac tcccggtttc agaacccaga gtggcccatg 3780 gacgccgatg ccaatggcgc ctaccacatc gccctgaagg gccagctgct gctgaatcac 3840 ctgaaggaga gcaaggatct gaagctgcag aacggcatct ccaatcagga ctggctggcc 3900 tacatccagg agctgcgcaa caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa 3960 aagaaaaagg gatcctaccc atacgatgtt ccagattacg cttatcccta cgacgtgcct 4020 gattatgcat acccatatga tgtccccgac tatgcc 4056 <210> 70 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1_site2 target DNA <400> 70 tttggctcag caggcacctg cctcagct 28 <210> 71 <211> 44 <212> RNA <213> Artificial Sequence <220> <223> hDNMT1_site2 D +0 <400> 71 uaauuucuac ucuuguagau gcucagcagg caccugccuc agcu 44 <210> 72 <211> 44 <212> DNA_RNA <213> Artificial Sequence <220> <223> hDNMT1_site2 D +8 <220> <223> Chimeric DNA-RNA <400> 72 uaauuucuac ucuuguagau gcucagcagg caccugcctc agct 44 <210> 73 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> hCCR5_site1 target DNA <400> 73 tttatgcaca gggtggaaca agatggat 28 <210> 74 <211> 44 <212> RNA <213> Artificial Sequence <220> <223> hCCR5_site1 D +0 <400> 74 uaauuucuac ucuuguagau ugcacagggu ggaacaagau ggau 44 <210> 75 <211> 44 <212> DNA_RNA <213> Artificial Sequence <220> <223> hCCR5_site1 D +8 <220> <223> Chimeric DNA-RNA <400> 75 uaauuucuac ucuuguagau ugcacagggu ggaacaagat ggat 44 <210> 76 <211> 44 <212> DNA_RNA <213> Artificial Sequence <220> <223> hCCR5_site1 D +12 <220> <223> Chimeric DNA-RNA <400> 76 uaauuucuac ucuuguagau ugcacagggu ggaacaagat ggat 44 <210> 77 <211> 44 <212> DNA_RNA <213> Artificial Sequence <220> <223> hCCR5_site1 D +16 <220> <223> Chimeric DNA-RNA <400> 77 uaauuucuac ucuuguagau ugcacagggt ggaacaagat ggat 44 <210> 78 <211> 44 <212> DNA_RNA <213> Artificial Sequence <220> <223> hCCR5_site1 D +20 <220> <223> Chimeric DNA-RNA <400> 78 uaauuucuac ucuuguagau ugcacagggt ggaacaagat ggat 44 <210> 79 <211> 44 <212> DNA_RNA <213> Artificial Sequence <220> <223> hCCR5_site1 D +24 <220> <223> Chimeric DNA-RNA <400> 79 uaauuucuac ucuuguagau tgcacagggt ggaacaagat ggat 44 <210> 80 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> hCCR5_site1 D +44 <400> 80 taatttctac tcttgtagat tgcacagggt ggaacaagat ggat 44 <210> 81 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> hCCR5_site2 target DNA <400> 81 ttttgtgggc aacatgctgg tcatcctc 28 <210> 82 <211> 44 <212> RNA <213> Artificial Sequence <220> <223> hCCR5_site2 D +0 <400> 82 uaauuucuac ucuuguagau gugggcaaca ugcuggucau ccuc 44 <210> 83 <211> 44 <212> DNA_RNA <213> Artificial Sequence <220> <223> hCCR5_site2 D +8 <220> <223> Chimeric DNA-RNA <400> 83 uaauuucuac ucuuguagau gugggcaaca ugcuggtcat cctc 44 <210> 84 <211> 44 <212> DNA_RNA <213> Artificial Sequence <220> <223> hCCR5_site2 D +9 <220> <223> Chimeric DNA-RNA <400> 84 uaauuucuac ucuuguagau gugggcaaca ugcuggtcat cctc 44 <210> 85 <211> 44 <212> DNA_RNA <213> Artificial Sequence <220> <223> hCCR5_site2 D +10 <220> <223> Chimeric DNA-RNA <400> 85 uaauuucuac ucuuguagau gugggcaaca ugcuggtcat cctc 44 <210> 86 <211> 44 <212> DNA_RNA <213> Artificial Sequence <220> <223> hCCR5_site2 D +11 <220> <223> Chimeric DNA-RNA <400> 86 uaauuucuac ucuuguagau gugggcaaca ugctggtcat cctc 44 <210> 87 <211> 44 <212> DNA_RNA <213> Artificial Sequence <220> <223> hCCR5_site2 D +12 <220> <223> Chimeric DNA-RNA <400> 87 uaauuucuac ucuuguagau gugggcaaca ugctggtcat cctc 44 <210> 88 <211> 44 <212> DNA_RNA <213> Artificial Sequence <220> <223> hCCR5_site2 D + 16 <220> <223> Chimeric DNA-RNA <400> 88 uaauuucuac ucuuguagau gugggcaaca tgctggtcat cctc 44 <210> 89 <211> 44 <212> DNA_RNA <213> Artificial Sequence <220> <223> hCCR5_site2 D +20 <220> <223> Chimeric DNA-RNA <400> 89 uaauuucuac ucuuguagau gugggcaaca tgctggtcat cctc 44 <210> 90 <211> 44 <212> DNA_RNA <213> Artificial Sequence <220> <223> hCCR5_site2 D +24 <220> <223> Chimeric DNA-RNA <400> 90 uaauuucuac ucuuguagau gtgggcaaca tgctggtcat cctc 44 <210> 91 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> hCCR5_site2 D +44 <400> 91 taatttctac tcttgtagat gtgggcaaca tgctggtcat cctc 44 <210> 92 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> hIL12A-AS1 target DNA <400> 92 tttaggatgc cactaaaagg gaaagggg 28 <210> 93 <211> 44 <212> RNA <213> Artificial Sequence <220> <223> hIL12A-AS1 D +0 <400> 93 uaauuucuac ucuuguagau ggaugccacu aaaagggaaa gggg 44 <210> 94 <211> 44 <212> DNA_RNA <213> Artificial Sequence <220> <223> hIL12A-AS1 D +8 <220> <223> Chimeric DNA-RNA <400> 94 uaauuucuac ucuuguagau ggaugccacu aaaagggaaa gggg 44 <210> 95 <211> 44 <212> DNA_RNA <213> Artificial Sequence <220> <223> hIL12A-AS1 D +12 <220> <223> Chimeric DNA-RNA <400> 95 uaauuucuac ucuuguagau ggaugccacu aaaagggaaa gggg 44 <210> 96 <211> 44 <212> DNA_RNA <213> Artificial Sequence <220> <223> hIL12A-AS1 D +16 <220> <223> Chimeric DNA-RNA <400> 96 uaauuucuac ucuuguagau ggaugccact aaaagggaaa gggg 44 <210> 97 <211> 44 <212> DNA_RNA <213> Artificial Sequence <220> <223> hIL12A-AS1 D +20 <220> <223> Chimeric DNA-RNA <400> 97 uaauuucuac ucuuguagau ggaugccact aaaagggaaa gggg 44 <210> 98 <211> 44 <212> DNA_RNA <213> Artificial Sequence <220> <223> hIL12A-AS1 D +24 <220> <223> Chimeric DNA-RNA <400> 98 uaauuucuac ucuuguagau ggatgccact aaaagggaaa gggg 44 <210> 99 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> hIL12A-AS1 D +44 <400> 99 taatttctac tcttgtagat ggatgccact aaaagggaaa gggg 44 <210> 100 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> hAAVS1 target DNA <400> 100 tttgcttacg atggagccag agaggatc 28 <210> 101 <211> 44 <212> RNA <213> Artificial Sequence <220> <223> hAAVS1 D +0 <400> 101 uaauuucuac ucuuguagau cuuacgaugg agccagagag gauc 44 <210> 102 <211> 44 <212> DNA_RNA <213> Artificial Sequence <220> <223> hAAVS1 D +8 <220> <223> Chimeric DNA-RNA <400> 102 uaauuucuac ucuuguagau cuuacgaugg agccagagag gatc 44 <210> 103 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> hFANCF target DNA <400> 103 tttgggcggg gtccagttcc gggattag 28 <210> 104 <211> 44 <212> RNA <213> Artificial Sequence <220> <223> hFANCF D +0 <400> 104 uaauuucuac ucuuguagau ggcggggucc aguuccggga uuag 44 <210> 105 <211> 44 <212> DNA_RNA <213> Artificial Sequence <220> <223> hFANCF D +8 <220> <223> Chimeric DNA-RNA <400> 105 uaauuucuac ucuuguagau ggcggggucc aguuccggga ttag 44 <210> 106 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1_site1_on-target F1 <400> 106 ggagatcaag ctttgtatgt tg 22 <210> 107 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1_site1_on-target R1 <400> 107 ccagaatgca caaagtactg c 21 <210> 108 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1_site1_on-target F2 <400> 108 ctgtgaggat tgagtgagtt g 21 <210> 109 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1_site1_on-target R2 <400> 109 cacacatgtg aacggacaga 20 <210> 110 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> hCCR5_site2_on-target F1 <400> 110 tgagatggtg ctttcatgaa t 21 <210> 111 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hCCR5_site2_on-target R1 <400> 111 gaaaatgaga gctgcaggtg 20 <210> 112 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hCCR5_site2_on-target F2 <400> 112 aaacttcatt gcttggccaa 20 <210> 113 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> hCCR5_site2_on-target R2 <400> 113 gaagattcca gagaagaagc c 21 <210> 114 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hIL12A-AS1_on-target F <400> 114 gcttgctgta tacacaaggc 20 <210> 115 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> hIL12A-AS1_on-target R <400> 115 ctgatcttga gaacagaaga cc 22 <210> 116 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hCCR5_site1_on-target F <400> 116 accatgcttg acccagtttc 20 <210> 117 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hCCR5_site1_on-target R <400> 117 aaacacagca tggacgacag 20 <210> 118 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1_site1_on-target Adaptor_F <400> 118 acactctttc cctacacgac gctcttccga tctggagtgt tcagtctccg tga 53 <210> 119 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1_site1_on-target Adaptor_R <400> 119 gtgactggag ttcagacgtg tgctcttccg atctccttag cagcttcctc ctc 53 <210> 120 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1_site1_off-target F <400> 120 caggggtatt ttccttcaag a 21 <210> 121 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1_site1_off-target R <400> 121 tcaggaatac caacatggaa aa 22 <210> 122 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1_site1_off-target Adaptor_F <400> 122 acactctttc cctacacgac gctcttccga tcttgtgtgt ctgctggaag ctc 53 <210> 123 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1_site1_off-target Adaptor_R <400> 123 gtgactggag ttcagacgtg tgctcttccg atctcagcag atagggtctg tgctc 55 <210> 124 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1_site2_on-target F <400> 124 acacaacagc ttcatgtcag 20 <210> 125 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1_site2_on-target R <400> 125 ttggcttgga gatcaagctt 20 <210> 126 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1_site2_on-target Adaptor_F <400> 126 acactctttc cctacacgac gctcttccga tctgcagagt gctaagggaa cgt 53 <210> 127 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1_site2_on-target Adaptor_R <400> 127 gtgactggag ttcagacgtg tgctcttccg atctaagtgc ttagagcagg cgtg 54 <210> 128 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1_site2_off-target F1 <400> 128 ctgagctggt atccaagatg c 21 <210> 129 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1_site2_off-target R1 <400> 129 gcattgtcat tagaaccaca aatc 24 <210> 130 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1_site2_off-target Adaptor_F1 <400> 130 acactctttc cctacacgac gctcttccga tctgcagaag tgagtcttgc tgag 54 <210> 131 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1_site2_off-target Adaptor_R1 <400> 131 gtgactggag ttcagacgtg tgctcttccg atctcagaat ctgtgcactc ggag 54 <210> 132 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1_site2_off-target F2 <400> 132 gttgcagtga gccaagatca 20 <210> 133 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1_site2_off-target R2 <400> 133 tcttggaacc aatcctctgc 20 <210> 134 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1_site2_off-target Adaptor_F2 <400> 134 acactctttc cctacacgac gctcttccga tctaagcagt gcttctccat tgag 54 <210> 135 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1_site2_off-target Adaptor_R2 <400> 135 gtgactggag ttcagacgtg tgctcttccg atctttacgc catgggtgat agtg 54 <210> 136 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1_site2_off-target F3 <400> 136 gcaaccagat ttttcctcca 20 <210> 137 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1_site2_off-target R3 <400> 137 ccaagccgtt acagatggtt 20 <210> 138 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1_site2_off-target Adaptor_F3 <400> 138 acactctttc cctacacgac gctcttccga tctggcaatg gactctggga tag 53 <210> 139 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> hDNMT1_site2_off-target Adaptor_R3 <400> 139 gtgactggag ttcagacgtg tgctcttccg atctcgggtt gtgaacagga aact 54 <210> 140 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> hCCR5_site1_on-target Adaptor_F <400> 140 acactctttc cctacacgac gctcttccga tctcaatgta gacatctatg taggcaa 57 <210> 141 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> hCCR5_site1_on-target Adaptor_R <400> 141 gtgactggag ttcagacgtg tgctcttccg atctctgcga tttgcttcac attg 54 <210> 142 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hCCR5_site1_off-target F1 <400> 142 caagcaattc ttgtgcctca 20 <210> 143 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hCCR5_site1_off-target R1 <400> 143 tccaggccct gtatacttgc 20 <210> 144 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> hCCR5_site1_off-target Adaptor_F1 <400> 144 acactctttc cctacacgac gctcttccga tctagggtca acattgcaag gag 53 <210> 145 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> hCCR5_site1_off-target Adaptor_R1 <400> 145 gtgactggag ttcagacgtg tgctcttccg atcttcaaag ccattctgga aaaga 55 <210> 146 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hCCR5_site1_off-target F2 <400> 146 catggtgaaa ccccaactct 20 <210> 147 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hCCR5_site1_off-target R2 <400> 147 ccaaatccca cactttgctt 20 <210> 148 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> hCCR5_site1_off-target Adaptor_F2 <400> 148 acactctttc cctacacgac gctcttccga tctgctcaac tgtattgaga ggaagc 56 <210> 149 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> hCCR5_site1_off-target Adaptor_R2 <400> 149 gtgactggag ttcagacgtg tgctcttccg atctttctgg tggataagaa ggaatttt 58 <210> 150 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> hCCR5_site2_on-target Adaptor_F <400> 150 acactctttc cctacacgac gctcttccga tctcctgcca aaaaatcaat gtgaag 56 <210> 151 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> hCCR5_site2_on-target Adaptor_R <400> 151 gtgactggag ttcagacgtg tgctcttccg atctgaaggg gacagtaaga aggaa 55 <210> 152 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> hCCR5_site2_off-target F <400> 152 gaaaatggct gttgggtaaa tc 22 <210> 153 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hCCR5_site2_off-target R <400> 153 taagggccac agacataaac 20 <210> 154 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> hCCR5_site2_off-target Adaptor_F <400> 154 acactctttc cctacacgac gctcttccga tcttccctgt cataaatttg acgtg 55 <210> 155 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> hCCR5_site2_off-target Adaptor_R <400> 155 gtgactggag ttcagacgtg tgctcttccg atctgaaaaa gcagatcaga gatggc 56 <210> 156 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hAAVS1_ on-target F <400> 156 cctggtgaac acctaggacg 20 <210> 157 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> hAAVS1_ on-target R <400> 157 ctatgtccac ttcaggacag c 21 <210> 158 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> hAAVS1_ on-target Adaptor_F <400> 158 acactctttc cctacacgac gctcttccga tctcttccct cccaccccct g 51 <210> 159 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> hAAVS1_ on-target Adaptor_R <400> 159 gtgactggag ttcagacgtg tgctcttccg atctccccat ccttaggcct cct 53 <210> 160 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hAAVS1_ off-target F1 <400> 160 agcaggttgg gtatcctgtg 20 <210> 161 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hAAVS1_ off-target R1 <400> 161 aggctgtttc tgcctccata 20 <210> 162 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> hAAVS1_ off-target Adaptor_F1 <400> 162 acactctttc cctacacgac gctcttccga tctccatctc ctggtctgca caa 53 <210> 163 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> hAAVS1_ off-target Adaptor_R1 <400> 163 gtgactggag ttcagacgtg tgctcttccg atctcaaagg ggctattcag atgt 54 <210> 164 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hAAVS1_ off-target F2 <400> 164 atccaggggg ttggaatatc 20 <210> 165 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hAAVS1_ off-target R2 <400> 165 tgcctgagag caggtctttt 20 <210> 166 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> hAAVS1_ off-target Adaptor_F2 <400> 166 acactctttc cctacacgac gctcttccga tctggttatc tgttaatgat agcctg 56 <210> 167 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> hAAVS1_ off-target Adaptor_R2 <400> 167 gtgactggag ttcagacgtg tgctcttccg atctcacaag cccatgaaga ctgg 54 <210> 168 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> hIL12A-AS1_on-target Adaptor_F <400> 168 acactctttc cctacacgac gctcttccga tctgaaaagg tgttgcttat tgccc 55 <210> 169 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> hIL12A-AS1_on-target Adaptor_R <400> 169 gtgactggag ttcagacgtg tgctcttccg atctcagctc cttccatctg ggtttc 56 <210> 170 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hIL12A-AS1_off-target F1 <400> 170 attctgcctc ctctcccact 20 <210> 171 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hIL12A-AS1_off-target R1 <400> 171 caggaggagc aaattccaga 20 <210> 172 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> hIL12A-AS1_off-target Adaptor_F1 <400> 172 acactctttc cctacacgac gctcttccga tctggtccta acagagattt actttctc 58 <210> 173 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> hIL12A-AS1_off-target Adaptor_R1 <400> 173 gtgactggag ttcagacgtg tgctcttccg atctctccct ctctcccttc ctctc 55 <210> 174 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> hIL12A-AS1_off-target F2 <400> 174 gcatcaacaa actggctcat t 21 <210> 175 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hIL12A-AS1_off-target R2 <400> 175 cctttgggat ggtgtcatct 20 <210> 176 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> hIL12A-AS1_off-target Adaptor_F2 <400> 176 acactctttc cctacacgac gctcttccga tctgccactg ctaatgttta aaattc 56 <210> 177 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> hIL12A-AS1_off-target Adaptor_R2 <400> 177 gtgactggag ttcagacgtg tgctcttccg atctctttag ggcagcattt tgtag 55 <210> 178 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hFANCF_on-target F <400> 178 cacggataaa gacgctggga 20 <210> 179 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hFANCF_on-target R <400> 179 cacaggctgc tgagaaacct 20 <210> 180 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> hFANCF_on-target Adaptor_F <400> 180 acactctttc cctacacgac gctcttccga tctcacatcc atcggcgctt tg 52 <210> 181 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> hFANCF_on-target Adaptor_R <400> 181 gtgactggag ttcagacgtg tgctcttccg atctggtggt aacgagctgc atcc 54 <210> 182 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hFANCF_off-target F <400> 182 tgggaggaaa ccctaaagag 20 <210> 183 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hFANCF_off-target R <400> 183 tgcaggccca agtattttga 20 <210> 184 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> hFANCF_off-target Adaptor_F <400> 184 acactctttc cctacacgac gctcttccga tctcagctga ctcagctgaa ctg 53 <210> 185 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> hFANCF_off-target Adaptor_R <400> 185 gtgactggag ttcagacgtg tgctcttccg atctgtctgg tgtgttatgc ctgt 54 <210> 186 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> IVT_AsCas12a_hDNMT1_site1_sense <400> 186 cgagtaacag acatggacca tcagatctac aagagtagaa attaccctat agtgagtcgt 60 attaatttc 69 <210> 187 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> IVT_AsCas12a_hDNMT1_site2_sense <400> 187 agctgaggca ggtgcctgct gagcatctac aagagtagaa attaccctat agtgagtcgt 60 attaatttc 69 <210> 188 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> IVT_AsCas12a_hCCR5_site1_sense <400> 188 atccatcttg ttccaccctg tgcaatctac aagagtagaa attaccctat agtgagtcgt 60 attaatttc 69 <210> 189 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> IVT_AsCas12a_hCCR5_site2_sense <400> 189 gaggatgacc agcatgttgc ccacatctac aagagtagaa attaccctat agtgagtcgt 60 attaatttc 69 <210> 190 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> IVT_AsCas12a_hAAVS1_sense <400> 190 gatcctctct ggctccatcg taagatctac aagagtagaa attaccctat agtgagtcgt 60 attaatttc 69 <210> 191 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> IVT_AsCas12a_hIL12A-AS1_sense <400> 191 cccctttccc ttttagtggc atccatctac aagagtagaa attaccctat agtgagtcgt 60 attaatttc 69 <210> 192 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> IVT_AsCas12a_hFANCF_sense <400> 192 ctaatcccgg aactggaccc cgccatctac aagagtagaa attaccctat agtgagtcgt 60 attaatttc 69 <210> 193 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> IVT_AsCas12a_universial_antisense <400> 193 gaaattaata cgactcacta taggg 25 <210> 194 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> IVT_SpCas9_hDNMT1_site1_sgRNA_sense <400> 194 gaaattaata cgactcacta taggagtgct aagggaacgt tcagttttag agctagaaat 60 agcaag 66 <210> 195 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> IVT_SpCas9_hDNMT1_site2_sgRNA_sense <400> 195 gaaattaata cgactcacta tagccagcag ccaacctgac caagttttag agctagaaat 60 agcaag 66 <210> 196 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> IVT_SpCas9_hCCR5_site1_sgRNA_sense <400> 196 gaaattaata cgactcacta tagtaataat tgatgtcata gatgttttag agctagaaat 60 agcaag 66 <210> 197 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> IVT_SpCas9_hCCR5_site2_sgRNA_sense <400> 197 gaaattaata cgactcacta tagaacacca gtgagtagag cgggttttag agctagaaat 60 agcaag 66 <210> 198 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> IVT_SpCas9_hAAVS1_sgRNA_sense <400> 198 gaaattaata cgactcacta taggcaagga gagagatggc tccgttttag agctagaaat 60 agcaag 66 <210> 199 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> IVT_SpCas9_hIL12A-AS1_sgRNA_sense <400> 199 gaaattaata cgactcacta tagttctggg gtcaacatct tgggttttag agctagaaat 60 agcaag 66 <210> 200 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> IVT_SpCas9_hFANCF_sgRNA_sense <400> 200 gaaattaata cgactcacta tagccgctcc agagccgtgc gaagttttag agctagaaat 60 agcaag 66 <210> 201 <211> 82 <212> DNA <213> Artificial Sequence <220> <223> IVT_SpCas9_universial_antisense <400> 201 aaaaaagcac cgactcggtg ccactttttc aagttgataa cggactagcc ttattttaac 60 ttgctatttc tagctctaaa ac 82

Claims

enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및
표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 유전체 교정용 조성물.
제1항에 있어서, 상기 가이드는 3'-말단이 포스포네이트, 스포로티오에이트 또는 포스포트리에스테르인 포스페이트로의 개질; 비오틴화에 의한 개질; 또는 LNA, HNA, CeNA, 2'-메톡시에틸, 2'-O-알킬, 2'-O-알릴, 2'-C-알릴, 2'-플루오로, 2'-데옥시, 2'-히드록실 및 그들의 조합으로 이루어진 그룹으로부터 선택되는 어느 하나에 의한 개질에 의해 개질(modification)된 것인 유전체 교정용 조성물.
제1항에 있어서, 상기 DNA는 상기 가이드의 3' 말단에 치환된 것인 유전체 교정용 조성물.
제3항에 있어서, 상기 DNA는 4 내지 16개인 것인 유전체 교정용 조성물.
제1항에 있어서, enCpf1 단백질은 서열번호 1의 아미노산 서열에 대하여 T167, S170, E174, T539, S542, K548, N551, N552, M604 및 K607로 이루어진 군으로부터 선택되는 어느 하나 이상의 아미노산 치환을 포함하는 것인 유전체 교정용 조성물.
제5항에 있어서, 상기 서열번호 1의 아미노산 서열은 아시다미노콕쿠스 종(Acidaminococcus sp.) 균주 BV3L6 Cpf1 분자(AsCpf1)로부터 유래된 서열인 유전체 교정용 조성물.
제5항에 있어서, 상기 서열번호 1의 아미노산 서열에 대하여 T167A, S170R, S170K, E174K, E174R, T539K, T539R, S542Q, S542K, S542R, K548R, K548V, N551R, N552R, M604A, K607Q, K607R, K607S, 및 K607H로 이루어진 군으로부터 선택되는 어느 하나 이상의 치환을 포함하는 것인 유전체 교정용 조성물.
제7항에 있어서, 상기 서열번호 1의 아미노산 서열에 대하여 S170R/E174R, E174R/K548R, S170R/K548R, E174R/S542R, S170R/S542R, E174R/S542R/K548R, E174R/N551R, S170R/N551R, S542R/K548R, S542R/N551R, S542R/N552R, K548R/N551R, S170R/S542R/K607R, E174R/S542R/K607R, E174R/S542R/K607H, E174R/S542R/K548R/N551R, S170R/S542R/K548V/N552R, E174R/S542R/K548V/N552R, S170R/S542R/K607R 및 E174R/S542R/K607R로 이루어진 군으로부터 선택되는 어느 하나의 치환을 포함하는 것인 유전체 교정용 조성물.
제8항에 있어서, 상기 서열번호 1의 아미노산 서열에 대하여 E174R/S542R/K548R의 치환을 포함하는 것인 유전체 교정용 조성물.
제1항에 있어서, 상기 조성물은 10번 위치의 아스파르탐산이 알라닌으로 치환된 SpCas9 닉카아제(nickase) 또는 10번 위치의 아스파르탐산이 알라닌으로 치환되거나 840번 위치의 히스티딘이 알라닌으로 치환된 비활성(Dead) SpCas9를 더 포함하는 것인 유전체 교정용 조성물.
제1항의 유전체 교정용 조성물을 분리된 세포 또는 인간을 제외한 유기체에 도입하는 단계를 포함하는 형질 전환체의 제조 방법.
enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 약학적 조성물.
enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 유전 질환, 비유전 질환, 바이러스 감염, 박테리아 감염, 암, 또는 자가 면역 질환의 예방 또는 치료용 약학적 조성물.
enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 유전체 교정용 조성물을,
표적 서열을 갖고 유전자 산물을 암호화하는 DNA 분자를 함유하고 발현하는 세포에 도입함을 포함하여, 유전자 산물의 발현을 변경시키는 방법.
enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및
표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 유전자 진단용 조성물.