KR20200018364A

KR20200018364A - 신규한 crispr 연관 단백질 및 이의 용도

Info

Publication number: KR20200018364A
Application number: KR1020190169918A
Authority: KR
Inventors: 최성화; 김한성; 김동욱; 박종진; 윤지영
Original assignee: (주)지플러스 생명과학; 서울대학교산학협력단
Priority date: 2018-08-09
Filing date: 2019-12-18
Publication date: 2020-02-19
Also published as: MX2021001578A; EA202190454A1; BR112021002476A2; AU2019319377A1; WO2020032711A1; JP2021532819A; EP3835418A1; US20210292722A1; KR20200018345A; ZA202101250B; KR102096604B1; IL280631A; CN112567031A; SG11202101227TA; CA3109105A1; PH12021550256A1; KR102096592B1; EP3835418A4

Abstract

본 발명은 신규한 CRISPR 연관 단백질 및 이의 용도에 관한 것이다. 본 발명에 따른 서열번호 1 또는 서열번호 3의 아미노산 서열로 표시되는 단백질은 가이드 RNA와 결합된 세포 내 핵산 서열을 인식하여 절단하는 엔도뉴클레아제 활성을 가진다. 따라서, 본 발명의 신규한 CRISPR 연관 단백질은 CRISPR-Cas 시스템에서 유전체를 교정하는 또 다른 뉴클레아제로서 사용될 수 있다.

Description

신규한 CRISPR 연관 단백질 및 이의 용도{NOVEL CRISPR ASSOCIATED PROTEIN AND USE THEREOF}

본 발명은 신규한 CRISPR 연관 단백질 및 이의 용도에 관한 것이다.

유전체 교정(Genome Editing)이란 생명체의 유전정보를 자유롭게 교정하는 기술이다. 생명과학분야의 진보와 유전체 서열 분석 기술의 발전을 통해 우리는 다양한 유전정보에 대해 폭넓게 이해할 수 있게 되었다. 예를 들어 동식물의 번식, 질병과 성장, 다양한 인간 유전질병을 일으키는 유전자 변이, 바이오연료의 생산 등을 위한 유전자에 대한 이해는 이미 확보된 상황이지만 이를 직접적으로 활용하여 생명체를 개선하고, 인간 질병을 치료하는 수준에까지 이르기 위해서는 그 이상의 기술 진보가 필수적이다.

유전체 교정 기술은 인간을 포함하여 동물, 식물, 미생물의 유전정보를 변화시켜 그 활용범위를 획기적으로 확장시킬 수 있다. 유전자가위는 원하는 유전정보를 정확히 자를 수 있도록 설계되어 만들어지는 분자 도구로 유전체 교정 기술에서 핵심역할을 하고 있다. 유전자 서열분석 분야를 한 차원 발전시켰던 차세대시퀀싱(Next generation sequencing) 기술과 같이, 유전자가위는 유전정보 활용의 속도와 그 범위를 확장시키고 새로운 산업분야를 창출해 내는 핵심 기술이 되고 있다.

지금까지 개발된 유전자 가위는 그 순서에 따라 3세대로 나눌 수 있다. 1세대 유전자 가위는 ZFN(Zinc Finger Nuclease), 2세대 유전자 가위는 TALEN(Transcription Activator-Like Effector Nuclease), 가장 최근에 연구된 CRISPR(Clustered regularly interspaced short palindromic repeat)-Cas(CRISPR-associated)9은 3세대 유전자 가위다

CRISPRs는 유전자 서열이 밝혀진 박테리아의 대략 40% 및 유전자 서열이 밝혀진 고세균의 90%의 유전체에서 발견되는 여러 짧은 직접 반복을 포함하는 좌위이다. Cas 단백질은 CRISPR RNA(crRNA) 및 trans-activating crRNA(tracrRNA)로 명명된 두 개의 RNA와 복합체를 형성했을 때, 활성 엔도뉴클레아제(endonuclease)를 형성하고, 그렇게 함으로써 파지 또는 플라스미드의 침입에서 외부 유전적 요소를 묵살하여 숙주 세포를 보호한다. crRNA는 전달에 외부 침입자로부터 점유되었던 숙주 유전체의 CRISPR 요소로부터 전사된다.

이러한 CRISPR-Cas 시스템 유래의 RNA-가이드 뉴클레아제(RNA-guided nuclease)는 유전체를 교정할 수 있는 수단을 제공해준다. 특히, 단일 가이드 RNA(sgRNA)와 Cas 단백질을 이용하여 세포 및 기관의 유전체를 편집할 수 있는 기술과 관련된 연구들이 활발히 진행되어왔다. 최근, Cpf1 단백질(Prevotella 및 Francisella 1 유래)이 CRISPR-Cas 시스템의 또 다른 뉴클레아제 단백질로서 보고되었고(B. Zetsche, et al., 2015), 이에 따라 유전체 교정에 있어서 선택의 폭이 넓어졌다.

B. Zetsche, et al., Cpf1 is a single RNA-guided endonuclease of a class 2 CRISPR-Cas system, Cell, 2015, 163, 759-771.

본 발명자들은 유전체 교정에 있어서 기존에 알려진 뉴클레아제보다 더 효과적인 단백질을 개발하기 위하여 지속적으로 연구한 결과, 표적 핵산 서열을 인식하여 절단하는 신규한 CRISPR 연관 단백질을 발견하여 본 발명을 완성하였다.

따라서, 본 발명의 목적은 표적 핵산 서열을 인식하여 절단하는 신규한 CRISPR 연관 단백질을 제공하는 것이다.

상기 목적을 달성하기 위해, 본 발명은 서열번호 1의 아미노산 서열을 갖는 Cas12a 단백질을 제공한다.

또한, 본 발명은 서열번호 1의 아미노산 서열 중 925번째 위치의 라이신(Lys)이 다른 아미노산으로 치환된 Cas12a 단백질을 제공한다.

또한, 본 발명은 서열번호 3의 아미노산 서열을 갖는 Cas12a 단백질을 제공한다.

또한, 본 발명은 서열번호 3의 아미노산 서열 중 930번째 위치의 라이신(Lys)이 다른 아미노산으로 치환된 Cas12a 단백질을 제공한다.

또한, 본 발명은 서열번호 1의 아미노산 서열 중 877번째 위치의 아스파르트산(Asp)이 다른 아미노산으로 치환된 Cas12a 단백질을 제공한다.

또한, 본 발명은 서열번호 3의 아미노산 서열 중 873번째 위치의 아스파르트산(Asp)이 다른 아미노산으로 치환된 Cas12a 단백질을 제공한다.

또한, 본 발명은 mgCas12a; 및 암세포에 특이적으로 존재하는 핵산 서열을 타겟팅하는 crRNA를 유효성분으로 포함하는 암 치료용 약학적 조성물을 제공한다.

본 발명에 따른 서열번호 1 또는 서열번호 3의 아미노산 서열로 표시되는 단백질은 가이드 RNA와 결합된 세포 내 핵산 서열을 인식하여 절단하는 엔도뉴클레아제 활성을 가진다. 따라서, 본 발명의 신규한 CRISPR 연관 단백질은 CRISPR-Cas 시스템에서 유전체를 교정하는 또 다른 뉴클레아제로서 사용될 수 있다.

도 1은 메타지놈으로부터 Cas12a를 발굴하는 과정을 도식화한 것이다.
도 2a는 발굴된 Cas12a의 계통수를 나타낸 것이다.
도 2b는 신규 Cas12a와 AsCas12a의 구조도를 나타낸 것이다.
도 3 내지 도 8은 ESPript 프로그램을 이용하여 정렬한 기존의 Cas12a 및 본 발명의 mgCas12a의 아미노산 서열을 나타낸 것이다.
도 9a 및 9b는 Cas12a 및 본 발명의 mgCas12a의 서열 정보를 비교 및 정리하여 표로 나타낸 것이다.
도 10 내지 도 12는 pH에 따른 본 발명에 따른 mgCas12a의 활성을 확인한 것이다. 한편, 도 10의 crRNA #1은 서열번호 25의 염기서열을 가지고, 도 11의 crRNA #2는 서열번호 26의 염기서열을 가진다.
도 13은 표적 핵산 서열 및 crRNA가 결합하는 위치를 표시하여 나타낸 것이다.
도 14는 CCR5 및 DNMT1 각 유전자의 crRNA를 이용한 유전자 편집 효율을 단백질별(mock, mgCas12a-1 및 mgCas12a-2)로 나타낸 것이다.
도 15는 FucT14-1 및 FucT14-2 각 유전자의 두 가지 crRNA를 이용한 유전자 편집 효율을 단백질별(FnCpf1, mgCas12a-1 및 mgCas12a-2)로 확인하여 나타낸 것이다.
도 16a 및 도 16b는 FnCas12a, WT mgCas12a-1 또는 WT mgCas12a-2 단백질의 DNA 절단 활성을 확인한 것이다.
도 17은 기존 Cas12a(AsCas12a, FnCas12a 또는 LbCas12a)와 신규 Cas12a(WT mgCas12a-1, d_mgCas12a-1, WTmgCas12a-2 또는 d_mgCas12a-2)의 비특이적인 DNase 기능을 확인한 것이다.
도 18a 및 도 18b는 crRNA 없이 FnCas12a, WT mgCas12a-1 또는 WT mgCas12a-2 단백질이 비특이적인 DNase 기능을 가지는지를 확인한 것이다.
도 19는 mgCas12a가 기존 Cas12a의 5' handle을 이용하여 DNA 절단이 가능한지를 확인한 것이다.
도 20a 및 도 20b는 이가이온들에서 FnCas12a, mgCas12a-1 또는 mgCas12a-2 단백질의 DNA 절단 활성을 나타낸 것이다.

본 발명은 일 측면으로, 메타지놈에서 수득한 신규한 Cas12a 단백질을 제공한다.

본 명세서에서 사용한 용어 “Cas12a”는 CRISPR 연관 단백질로서, Cpf1로도 지칭될 수 있다. 또한, Cpf1은 type V CRISPR 시스템 단백질이다. Cas12a는 단일 단백질로서, crRNA과 결합하여 표적 유전자를 절단한다는 점은 type II CRISPR 시스템 단백질인 Cas9와 유사하다. 다만, 그 작동 방식에서 차이가 있다. Cas12a 단백질은 하나의 crRNA로 작동한다. 따라서, Cas9의 경우와 같이 crRNA와 trans-activating crRNA(tracrRNA)를 동시에 사용하거나, 인위적으로 tracrRNA와 crRNA를 합친 single guide RNA(sgRNA)를 제작할 필요가 없다.

또한, Cas12a 시스템은 Cas9와 달리 PAM이 표적 서열의 5' 위치에 존재한다. 또한, Cas12a 시스템은 표적을 결정하는 guide RNA의 길이도 Cas9에 비해 짧다. 또한, Cas12a는 표적 DNA가 절단된 위치에 blunt-end가 아닌 5' overhang(sticky end)을 발생시키므로, 보다 정확하고 다양한 유전자 교정이 가능하다는 이점을 갖는다.

종래에 Cas12a 단백질은 캔디다투스(Candidatus) 속, 라치노스피라(Lachnospira) 속, 뷰티리비브리오(Butyrivibrio) 속, 페레그리니박테리아(Peregrinibacteria), 액시도미노코쿠스(Acidominococcus) 속, 포르파이로모나스(Porphyromonas) 속, 프레보텔라(Prevotella) 속, 프란시셀라(Francisella) 속, 캔디다투스 메타노플라스마(Candidatus Methanoplasma), 또는 유박테리움(Eubacterium) 속 유래의 것일 수 있다. 구체적으로, PbCas12a는 Parcubacteria bacterium GWC2011_GWC2_44_17에서 유래한 단백질이며, PeCas12a는 Peregrinibacteria Bacterium GW2011_GWA_33_10에서 유래한 단백질이며, AsCas12a는 Acidaminococcus sp. BVBLG에서 유래한 단백질이며, PmCas12a는 Porphyromonas macacae에서 유래한 단백질이며, LbCas12a는 Lachnospiraceae bacterium ND2006에서 유래한 단백질이며, PcCas12a는 Porphyromonas crevioricanis에서 유래한 단백질이며, PdCas12a는 Prevotella disiens에서 유래한 단백질이며, FnCas12a는 Francisella novicida U112에서 유래한 단백질이다. 다만, Cas12a 단백질은 유래된 미생물에 따라 다른 활성을 가질 수 있다.

본 발명은 메타지놈의 유전자들을 분석하여 새로운 Cas12a를 규명한 것이다. 이하, 메타지놈에서 유래한 Cas12a를 mgCas12a로 지칭할 수 있다. 본 발명의 mgCas12a도 AsCas12a와 같이, WED, REC, PI, RuvC, BH 및 NUC 도메인을 포함한다(도 2). 또한, 본 발명의 mgCas12a 단백질은 종래에 알려진 Cas12a 단백질과 동일하게, crRNA 및 5’-handle을 포함한 gRNA로 유전자를 절단할 수 있음을 확인하였다. mgCas12a는 FnCas12a와 동일한 서열을 가지는 5’-handle RNA를 이용함을 확인하였다. 구체적으로, 5’-handle RNA의 서열은 AAUUUCUACUGUUGUAGAU(서열번호 12)일 수 있다. 다만, AsCas12a 및 LbCas12a의 5’-handle RNA에도 작동함을 확인하였다(도 19).

상기 mgCas12a는 분리 정제를 위해 Tag를 추가적으로 포함할 수 있다. Tag는 mgCas12a의 N 말단 또는 C 말단에 결합될 수 있다. 또한, Tag는 mgCas12a의 N 말단 및 C 말단에 동시에 결합될 수 있다. 상기 Tag의 일 구체예로는 6XHis Tag일 수 있다.

mgCas12a의 일 구체예로 서열번호 1의 아미노산 서열을 갖는 단백질을 제공한다. 또한, 상기 mgCas12a의 활성이 변하지 않는 한, 일부 아미노산을 결실, 치환 시킬 수 있다. 구체적으로, 서열번호 1의 아미노산 서열 중 925번째 위치의 라이신(Lys)이 다른 아미노산으로 치환된 단백질 일 수 있다. 이때, 다른 아미노산은 아르기닌(Arg), 히스티딘(His), 아스파르트산(Asp), 글루탐산(Glu), 세린(Ser), 트레오닌(Thr), 아스파라긴(Asn), 글루타민(Gln), 티로신(Tyr), 알라닌(Ala), 이소류신(Ile), 류신(Leu), 발린(Val), 페닐알라닌(Phe), 메티오닌(Met), 트립토판(Trp), 글리신(Gly), 프롤린(Pro), 및 시스테인(Cys)으로 구성된 군에서 선택되는 어느 하나일 수 있다. 구체적으로, 상기 단백질은 서열번호 1의 아미노산 서열의 925번째 위치의 라이신이 글루타민으로 치환된 것일 수 있으며, 서열번호 5의 아미노산 서열을 가질 수 있다.

또한, 서열번호 1의 아미노산 서열을 갖는 단백질을 코딩하는 유전자는 서열번호 2의 염기 서열을 갖는 폴리뉴클레오티드일 수 있다. 또한, 본 발명에 따른 서열번호 1의 아미노산 서열을 갖는 mgCas12a는 pH 7.0 내지 pH 7.9에서 최적의 활성을 가질 수 있다.

mgCpf1의 또 다른 구체예로, 서열번호 3의 아미노산 서열을 갖는 단백질을 제공한다. 또한, 상기 mgCpf1의 활성이 변하지 않는 한, 일부 아미노산을 결실, 치환 시킬 수 있다. 구체적으로, 서열번호 3의 아미노산 서열 중 930번째 위치의 라이신(Lys)이 다른 아미노산으로 치환된 단백질 일 수 있다. 이때, 다른 아미노산은 아르기닌(Arg), 히스티딘(His), 아스파르트산(Asp), 글루탐산(Glu), 세린(Ser), 트레오닌(Thr), 아스파라긴(Asn), 글루타민(Gln), 티로신(Tyr), 알라닌(Ala), 이소류신(Ile), 류신(Leu), 발린(Val), 페닐알라닌(Phe), 메티오닌(Met), 트립토판(Trp), 글리신(Gly), 프롤린(Pro), 및 시스테인(Cys)으로 구성된 군에서 선택되는 어느 하나일 수 있다. 구체적으로, 상기 단백질은 서열번호 3의 아미노산 서열의 930번째 위치의 라이신이 글루타민으로 치환된 것일 수 있으며, 서열번호 6의 아미노산 서열을 가질 수 있다.

상기 서열번호 3의 아미노산 서열을 갖는 단백질을 코딩하는 유전자는 서열번호 4의 염기 서열을 갖는 폴리뉴클레오티드일 수 있다.

또한, 본 발명에 따른 서열번호 3의 아미노산 서열을 갖는 mgCas12a는 pH 7.0 내지 pH 7.9에서 최적의 활성을 가질 수 있다.

본 발명의 또 다른 측면으로는, mgCas12a에서 엔도뉴클레아제 활성이 감소된 단백질을 제공한다. 일 구체예로, 서열번호 1의 아미노산 서열을 가지는 mgCas12a의 877번째 아스파르트산(Asp)이 다른 아미노산으로 치환된 형태일 수 있다. 이때, 다른 아미노산은 아르기닌(Arg), 히스티딘(His), 글루탐산(Glu), 세린(Ser), 트레오닌(Thr), 아스파라긴(Asn), 글루타민(Gln), 티로신(Tyr), 알라닌(Ala), 라이신(Lys), 이소류신(Ile), 류신(Leu), 발린(Val), 페닐알라닌(Phe), 메티오닌(Met), 트립토판(Trp), 글리신(Gly), 프롤린(Pro), 및 시스테인(Cys)으로 구성된 군에서 선택되는 어느 하나일 수 있다. 구체적으로, 상기 아스파르트산(Asp)이 알라닌(Ala)으로 치환된 단백질일 수 있다.

또 다른 구체예로, 서열번호 3의 아미노산 서열을 가지는 mgCas12a의 873번째 아스파르트산(Asp)이 다른 아미노산으로 치환된 형태일 수 있다. 이때, 다른 아미노산은 아르기닌(Arg), 히스티딘(His), 글루탐산(Glu), 세린(Ser), 트레오닌(Thr), 아스파라긴(Asn), 글루타민(Gln), 티로신(Tyr), 알라닌(Ala), 라이신(Lys), 이소류신(Ile), 류신(Leu), 발린(Val), 페닐알라닌(Phe), 메티오닌(Met), 트립토판(Trp), 글리신(Gly), 프롤린(Pro), 및 시스테인(Cys)으로 구성된 군에서 선택되는 어느 하나일 수 있다. 구체적으로, 상기 아스파르트산(Asp)이 알라닌(Ala)으로 치환된 단백질일 수 있다. 이때, 엔도뉴클레아제 활성이 감소된 mgCas12a를 dead mgCas12a 또는 d_mgCas12a로 지칭할 수 있다. 상기 d_mgCas12a는 서열번호 13 또는 서열번호 14의 아미노산 서열을 가질 수 있다.

또한, 본 발명의 또 다른 측면으로, mgCas12a; 및 암세포에 특이적으로 존재하는 핵산 서열을 타겟팅하는 crRNA를 유효성분으로 포함하는 암 치료용 약학적 조성물을 제공한다. 이때, 상기 mgCas12a는 서열번호 1, 서열번호 3, 서열번호 5 및 서열번호 6으로 이루어진 군에서 선택되는 어느 하나의 아미노산 서열을 가질 수 있다. 본 명세서에서 사용된 용어, “암세포에 특이적으로 존재하는 핵산 서열”은 정상세포에는 존재하지 않으나 암세포에만 존재하는 핵산 서열을 의미한다. 즉, 정상 세포와 상이한 서열을 의미하며, 적어도 1개의 핵산이 상이할 수 있다. 또한, 유전자의 일부가 치환, 결실된 것일 수 있다. 일 구체예로 암세포에 특이적으로 존재하는 서열은 암세포에 존재하는 SNP일 수 있다. 상기 서열을 갖는 암세포 내에 존재하는 타겟 DNA와 타겟 RNA에 상보적인 서열을 갖는 가이드 RNA는 서로 특이적으로 결합한다.

특히, 암세포에 특이적으로 존재하는 핵산 서열은 여러 암조직의 유전체 서열분석으로부터 암세포에만 존재하는 특이적 SNP를 찾아서 이를 이용해서 crRNA를 제작할 수 있다. 따라서, 암세포 특이적 독성을 나타내는 방식이므로, 환자 맞춤형 항암치료제 개발이 가능할 수 있다. 뿐만 아니라, 암세포에 특이적으로 존재하는 핵산 서열은 정상세포와 달리 암세포에서 높은 CNV(copy number variation)를 가지는 유전자 일 수 있다.

상기 암의 일 구체예는 방광암, 골암, 혈액암, 유방암, 흑색종양, 갑상선암, 부갑상선암, 골수암, 직장암, 인후암, 후두암, 폐암, 식도암, 췌장암, 대장암, 위암, 설암, 피부암, 뇌종양, 자궁암, 두부 또는 경부암, 담낭암, 구강암, 결장암, 항문 부근암, 중추신경계 종양, 간암 및 대장암으로 구성된 군으로부터 선택되는 어느 하나일 수 있다. 특히, 우리나라 5대 암으로 알려진 위암, 대장암, 간암, 폐암, 유방암일 수 있다.

이때, 상기 암세포에 특이적으로 존재하는 핵산 서열을 타겟팅하는 crRNA는 하나 이상의 gRNA 서열을 포함할 수 있다. 예를 들어, 난소암 또는 유방암에 존재하는 BRCA1의 엑손 10 또는 11을 동시에 타겟팅할 수 있는 gRNA를 사용할 수 있다. 또한, BRCA1의 엑손 11을 타겟팅 하는 두개 이상의 gRNA를 사용할 수 있다. 이와 같이 gRNA의 조합은 암 치료 목적 및 암의 종류에 따라 적합하게 선택될 수 있다. 즉, 서로 다른 gRNA를 선택하여 사용할 수 있다.

이하, 본 발명을 하기 실시예에 의하여 더욱 상세하게 설명한다. 단, 하기 실시예는 본 발명을 예시하기 위한 것일 뿐, 본 발명의 범위가 이들만으로 한정되는 것은 아니다.

실시예 1. 메타지놈 유래의 Cas12a 단백질 발굴

NCBI Genbank BLAST 데이터베이스에서 메타지놈 염기서열을 다운로드하고 로컬 BLASTp 데이터베이스로 구축하였다. 또한, 16개의 Cas12a과 다양한 CRISPR 관련 단백질(Cas1) 아미노산 서열을 Uniprot 데이터베이스에서 다운로드하였다. MetaCRT 프로그램을 이용하여 메타지놈에서 CRISPR 리피트(repeat)와 스페이서(spacer) 서열을 발견하였다. 그리고, CRISPR 서열을 갖는 메타지놈 서열만 추출하여 Prodigal 프로그램을 이용하여 유전자를 예측하였다.

상기 예측된 유전자 중, CRISPR 서열의 상하위 10 kb 범위 안에 있는 것을 추출하였고, Cas12a 아미노산 서열을 이용하여 해당 유전자 중 Cas12a의 호몰로그(homolog)를 예측하였다. Cas1 유전자를 이용하여 Cas12a 호몰로그의 상하위에 Cas1 호몰로그가 있는지 예측하였고, Cas1을 주위에 갖는 800 aa 내지 1,500 aa 범위의 Cas12a 유전자들을 선별하였다. 이들을 대상으로 NCBI Genbank non-redundant 데이터베이스에서 BLASTp를 이용하여, 이미 보고된 바 있는 유전자인지, 또한 전혀 CRISPR와 관계 없는 유전자는 아닌지 판별하였다.

메티오닌(Met)으로 시작하지 않는 조각난 Cas12a를 제외한 후, 이들을 MAFFT(multiple alignment using fast fourier transform) 프로그램을 이용하여 정렬하였다. 그 후, MEGA7을 이용하여 Neighbor-joining(100x부트스트랩(bootstrap))으로 계통수를 그렸다. 기존에 알려진 Cas12a 유전자와 단계통군을 이루는 유전자를 선별하여, 기존의 Cas12a 아미노산 서열과 함께 MEGA7, 최대공산(maximum-likelihood), 1000x 부트스트랩(bootstrap)으로 계통수를 그려 진화적 유연관계를 살폈다. 이때, 상기 메타지놈으로부터의 Cas12a 발굴과정을 도 1에 도식화하여 나타내다. 또한, Cas12a의 계통수를 도 2a에 나타내었다. 이때, 서열번호 1의 아미노산 서열을 가지는 신규한 단백질을 WT mgCas12a-1 이라고 명명하였다. 또한, 서열번호 3의 아미노산 서열을 가지는 신규한 단백질을 WT mgCas12a-2라고 명명하였다. 또한, 이때, AsCas12a와 mgCas12a-1 및 mgCas12a-2의 구조도를 도 2b에 나타내었다.

실시예 2. mgCas12a의 변이체 제작

ESPript 프로그램을 이용하여 Cas12a 후보군을 AsCas12a 및 LbCas12a의 구조를 기반으로 하여 정렬하였다. 상기 WT mgCas12a-1 및 WT mgCas12a-2에서 엔도뉴클레아제의 활성을 높이기 위해서 일부 아미노산을 치환하였다. WT mgCas12a-1의 925번째 아미노산인 Lys(K)를 Glu(Q)으로 치환한 것을 mgCas12a-1로 명명하였다. 또한, WT mgCas12a-2의 930번째 아미노산인 Lys(K)를 Glu(Q)으로 치환한 것을 mgCas12a-2로 명명하였다. 인간과 애기장대, 대장균의 코돈 사용빈도(codon usage)를 고려하여, 코돈 최적화(codon optimization)를 진행한 후 Bionics에 유전자 합성을 의뢰하였다. 이때, 인간 코돈 최적화된 mgCas12a-1 및 mgCas12a-2의 염기서열을 각각 서열번호 7 및 서열번호 8에 나타내었다. 또한, 상기 ESPript 프로그램을 이용하여 정렬한 기존의 Cas12a(AsCas12a(서열번호 9), LbCas12a(서열번호 10), FnCas12a(서열번호 11)) 및 Cas12a 후보군(mgCas12a-1 및 mgCas12a-2)의 아미노산 서열을 도 3 내지 도 8에 나타내었으며, 이들의 서열 정보를 비교 정리하여 도 9a 및 도 9b에 나타내었다.

그리고, pUC57 벡터에 클로닝된 WT mgCas12a-1, WT mgCas12a-2, mgCas12a-1 및 mgCas12a-2 유전자를 다시 pET28a-KanR-6xHis-BPNLS 벡터에 삽입한 후 클로닝하였다. 클로닝된 벡터는 대장균 DH5a와 로제타(Rosetta) 균주에 각각 형질전환하였다. crRNA의 5'-핸들 서열을 메타지놈 CRISPR 반복 서열에서 추출하였다. 추출된 RNA를 DNA 올리고로 합성하였다. DNA 올리고머를 MEGAshortscript T7 RNA 전사효소 키트를 이용하여 전사하였고, 전사된 5'-핸들의 농도를 FLUOstar Omega로 확인하였다.

실시예 3. 단백질 발현과 정제

하룻밤 동안 배양한 로제타(DE3) 대장균 5 ml를 100 mg/ml의 카나마이신 항생제를 추가한 500 ml의 액체 TB 배지에 접종하였다. 배지는 37℃ 배양기에서 0.6 OD600이 될 때까지 배양하였다. 단백질 발현을 위해 0.4 uM의 IPTG(Isopropyl β- D-1-thiogalactopyranoside)를 처리한 뒤, 22℃에서 16 내지 18시간 더 배양하였다. 원심분리 후 수득한 세포를 10 ml의 용해 버퍼(20 mM HEPES pH 7.5, 100 mM KCl, 20 mM 이미다졸, 10% 글리세롤 및 EDTA-프리 프로테아제 인히비터 칵테일)와 혼합한 후, 초음파를 처리하여 세포를 분쇄하였다. 분쇄물을 6,000 rpm에서 20분간 세 번 원심분리한 후 0.22 마이크론 필터로 여과하였다.

이후, 니켈 컬럼(HisTrap FF 5 ml) 및 300 mM 이미다졸 버퍼를 이용하여 세척 및 용출하였고 친화-크로마토그래피로 단백질을 정제하였다. SDS-PAGE 전기영동으로 단백질의 크기를 확인하였고, 투석 버퍼(20 mM HEPES pH 7.5, 100 mM KCl, 1 mM DTT, 10% 글리세롤)로 하룻밤 동안 투석하였다. 이후, 단백질 크기에 맞춰 선택적으로 여과 및 농축(Amicon Ultra Centrifugal Filter 100,000 MWCO)하였다. 브래드포드 정량법으로 농도를 측정한 후, -80℃에 보관 및 사용하였다.

실시예 4. 클리비지 분석을 통한 mgCas12a에 적합한 pH 범위 확인

상추(Lactuca sativa)의 자일로실트랜스퍼레이즈(xylosyltransferase)를 PCR로 증폭하여 PAM(protospacer adjacent motif)을 예측하였고, 가이드 RNA(gRNA)를 디자인하였다. mgCas12a-1 및 mgCas12a-2의 RNP(ribonucleoprotein) 복합체를 mgCas12a 단백질 및 gRNA가 1:1.25의 분자비가 되도록 하여 상온에서 20분간 혼합하여, RNP 복합체를 제작하였다. 정제된 자일로실트랜스퍼레이즈 PCR 프로덕트를 다양한 농도로 RNP에 처리한 후, NEBuffer 1.1(1X Buffer Components, 10 mM Bis-Tris-Propane-HCl, 10 mM MgCl₂및 100 ㎍/ml BSA), NEBuffer 2.1(1X Buffer Components, 50 mM NaCl, 10 mM Tris-HCl, 10 mM MgCl₂ 및 100 ㎍/ml BSA) 및 NEBuffer 3.1(1X Buffer Components, 100 mM NaCl, 50 mM Tris-HCl, 10 mM MgCl₂ 및 100 ㎍/ml BSA)로 농도를 맞추어 37℃에서 in vitro 클리비지(cleavage) 분석을 실시하였다. 이때, NEBuffer 1.1, NEBuffer 2.1 및 NEBuffer 3.1는 25℃에서 각각 pH 7.0, pH 7.9 및 pH 7.9 값을 갖는다. 각 반응이 완료된 후 65℃에서 10분간 인큐베이션하여 반응을 정지하였으며, 완료된 반응을 1.5% 아가로스 겔 전기영동을 통해 확인하였다. 그 결과를 도 10 내지 도 12에 나타내었다. 도 10 내지 도 12에서 mgCas12a-1 및 mgCas12a-2를 hemgCas12a-1 및 hemgCas12a-2로 표기하였다. 또한, 상기 자일로실트랜스퍼레이즈에서 표적 핵산 서열 및 crRNA가 결합하는 위치를 표시하여 도 13에 나타내었다.

도 10 내지 도 12에 나타난 바와 같이, mgCas12a-1 및 crRNA 복합체에 NEBuffer 1.1을 처리한 경우 표적 dsDNA가 절단되었다. 또한, mgCas12a-2 및 crRNA 복합체에 NEBuffer 1.1을 처리한 경우 표적 dsDNA가 절단되었다. 이를 통해, mgCas12a-1 및 mgCas12a-2는 pH 7.0에서 활성이 활발해짐을 알 수 있었다.

실시예 5. 동물세포에서 mgCas12a의 유전자 편집 효율 분석

실시예 5.1. CCR5 및 DNMT1의 유전자 편집을 위한 mgCas12a-1 및 mgCas12a-2를 포함한 RNP 제작

HEK 293T 세포를 10% 태아 소혈청인 FBS와 P/S(penicillin-streptomycin)가 함유된 DMEM 배지에서 37℃의 온도로 5% CO₂ 배양기에서 배양하였다. 각각 100 pmole의 mgCas12a-1 단백질 및 mgCas12a-2 단백질과 200 pmole의 CCR5 및 DNMT1를 타겟팅하는 crRNA를 상온에서 20분간 배양하여 RNP를 제작하였다. 이때, 상기 CCR5 및 DNMT1의 crRNA 서열은 IDT(Integrated DNA Technologies)로부터 합성하였고, 이를 하기 표 1에 나타내었다.

Genes	crRNA sequence (5'-3')
CCR5	CACCGAAUUUCUACUGUUGUAGAUGGAGUGAAGGGAGAGUUUGUCAAUUUUUUG (서열번호 12)
DNMT1	GGUCAAUUUCUACUGUUGUAGAUGCUCAGCAGGCACCUGCCUCUUUU (서열번호 13)

상기 배양된 HEK293T 세포 2x10⁵개를 20 μl의 뉴클레오펙션(nucleofection) 시약과 혼합한 후, 이를 10 μl의 RNP 복합체와 혼합하였다. 이후, 형질감염을 위해 4D-Nucleofector 기기(Lonza)를 사용하였다. 형질감염한지 48시간 및 72시간이 지났을 때, PureLink^TM Genomic DNA Mini Kit(invitrogen)를 사용하여 상기 세포로부터 genomic DNA를 추출하였다.

실시예 5.2. 표적 부위에 대한 염기서열 분석

상기 실시예 5.1에서 추출한 genomic DNA를 하기 표 2에 나타낸 CCR5와 DNMT1의 어댑터 프라이머(primer)를 이용하여 증폭시켰다.

Genes	Adapter primer sequence (5'-3')
CCR5	TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGGGTATTTCTGTTCAGATCAC (서열번호 15)
CCR5	GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGGCCCATCAATTATAGAAAGCC (서열번호 16)
DNMT1	TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGCTGCACACAGCAGGCCTTTG (서열번호 17)
DNMT1	GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGCCCAATAAGTGGCAGAGTGC (서열번호 18)

이후, 일루미나(Illumina)의 프로토콜대로 정제 과정 및 시퀀싱 라이브러리를 제조한 후, MiniSeq 장비를 이용하여 표적 부위에 대한 deep sequencing 분석을 진행하였다. mgCas12a-1와 mgCas12a-2 단백질에 의한 유전자 편집 효율을 도 14에 나타내었고, 표적 부위에 대한 시퀀싱 분석 결과를 하기 표 3에 나타내었다. 도 14에 나타난 바와 같이, mock 단백질보다 mgCas12a-1와 mgCas12a-2 단백질에 의한 유전자 편집 효율이 더 높게 나타났다

실시예 6. 식물세포에서 mgCas12a 의 유전자 편집 효율 분석

실시예 6.1. 식물 원형질체 분리

담배 종자를 50% Clorox로 1분간 처리하여 종자를 멸균하였다. 멸균된 종자를 종자파종 배지에 올려 일주일간 배양한 후, 배양에 사용되는 마젠타 박스(magenta box)에 옮겨 3주 동안 키웠다. 배양 빛 조건은 광배양 16시간 및 암배양 8시간이며, 25℃ 내지 28℃의 온도에서 키웠다. 식물은 4주 내지 6주 자란 잎을 사용하였고, 상기 잎을 유리판에 올려 잎병과 잎끝 부분을 자른 후 잎 안쪽부분만을 사용하였다. 이때, 0.5 mm 이하로 잘랐다. 자른 잎은 Enzyme 용액 10 mL에 올려 상온에서 암 상태로 3시간 내지 4시간 동안 orbital shaker(50 rpm) 위에서 배양하였다.

배양 후, W5 용액 10 mL을 첨가하고 조심스럽게 잘 섞어주었다. Cell strainer(70 μm)를 이용하여 Enzyme 용액 내에 존재하는 원형질체를 걸러주었다. 상기 걸러진 원형질체를 100 xg로 6분 동안 원심분리 하였다. 상층액을 버리고 MMG 용액을 첨가하여 조심스럽게 원형질체 펠렛을 풀어준 후, 아이스에서 10분 내지 30분 정도 두었다. 이 중 일부를 계수판인 Hem cytometer와 현미경을 이용하여 원형질체의 수를 계수하였다. 이후, MMG 용액을 더 첨가하여 원형질체의 농도가 2 X 10⁶ 세포/mL가 되도록 희석하였다. 상기 enzyme 용액, MMG 용액 및 PEG 용액의 구성을 하기 표 4에 나타내었다.

Enzyme 용액	20 mL
1.0% Cellulase R10	200 mg
0.5% Macerozyme R10	100 mg
0.4 M Mannitol	10 mL (0.8 M Mannitol Stock solution)
20 mM MES, pH 5.7	4 mL (100 mM MES Stock solution, pH 5.7)
20 mM KCl	200 μL (2 M KCl Stock solution)
위 시약들 조합한 후 60도에서 10분간 배양한 후 아래 시약을 조합한다.
10 mM CaCl₂·2H₂O	200 μL (1 M CaCl₂·2H₂O Stock solution)
0.1 % BSA	200 μL (10% BSA Stock solution)
MMG 용액	10 mL
0.4 M Mannitol	5 mL (0.8 M Mannitol Stock solution)
4 mM MES, pH 5.7	400 μL (0.1 M MES Stock solution, pH5.7)
15 mM MgCl₂	150 μL (1 M MgCl₂ Stock solution)
Nuclease-free water	4.45 mL
PEG 용액	5 mL
0.2 M Mannitol	1.25 mL (0.8 M Mannitol Stock solution)
40%W/V PEG-4000	2 g (Polyethylene glycol 4000)
100 mM CaCl₂·2H₂O	500 μL (1 M CaCl₂·2H₂O Stock solution)
Nuclease-free water	1.5 mL
W5 용액	50 mL
154 mM NaCl	3.85 mL (2 M NaCl Stock solution)
125 mM CaCl₂·2H₂O	6.25 mL (1 M CaCl₂·2H₂O Stock solution)
5 mM KCI	125 μL (2 M KCl Stock solution)
2 mM MES, pH 5.7	500 μL (0.1 M MES Stock solution)
Nuclease-free water	39.275 mL

실시예 6.2. 표적 부위에 대한 염기서열 분석 및 편집 효율 확인

2 mL e-tube에 crRNA, mgCas12a 단백질 및 NEB buffer 1.1을 최종 volume 20 μL가 되게한 후 상온에서 10분 동안 반응시켰다. 상기 실시예 6.1에서 수득한 원형질체 200 μL(5 X 10⁵ 세포)와 반응시킨 crRNA 및 mgCas12 단백질(볼륨 20 μL)을 E-tube(2 mL)에 넣고 잘 섞은 후, 클린 벤치(Clean bench)에서 10분간 배양하였다. 이후, 상기 배양한 볼륨과 동일한 PEG 용액 220 μL를 넣고 조심스럽게 섞어주었다. 상온에서 15분간 배양한 후, W5 용액 840 μL을 첨가하여 잘 섞어주었다. 100 xg에서 2분간 원심 분리한 후, 상등액을 제거하였다. 그리고, W5 용액에서 이틀간 배양한 후 세포를 수거하여 DNA를 추출하였다.

상기 추출한 DNA를 이용하여 타겟 부분에 PCR을 수행한 후, NGS(Next-Generation Sequencing)로 타겟 유전자 편집 효율을 확인하였다. 이를 하기 표 5에 나타내었다. 표 5에 나타난 바와 같이, FnCpf1에 비해 mgCas12a-1 단백질에 의한 유전자 편집 효율이 1.8배 높게 나타났다.

Target gene	crRNA	Nuclease	Total Sequences	With both indicator sequences	More than minimum frequency	Insertions	Deletions	Indel frequency
FucT14-1	2	none	161551	161421	160896	4	180	184 (0.1%)
		mgCas12a-1	124361	124255	123844	3	168	171 (0.1%)
		mgCas12a-2	99154	99053	98734	0	131	131 (0.1%)
		FnCpf1	50060	50022	49808	0	63	63 (0.1%)
	4	none	161551	161411	160899	4	178	182 (0.1%)
		mgCas12a-1	106782	106706	106330	0	1877	1877 (1.8%)
		mgCas12a-2	126665	126544	126057	79	885	964 (0.8%)
		FnCpf1	64554	64501	64272	15	470	485 (0.8%)
FucT14-2	2	none	49459	49422	49192	2	49	51 (0.1%)
		mgCas12a-1	81191	81101	80738	0	90	90 (0.1%)
		mgCas12a-2	83694	83614	83286	0	99	99 (0.1%)
		FnCpf1	108803	108682	108260	0	112	112 (0.1%)
	4	none	49459	49427	49199	2	49	51 (0.1%)
		mgCas12a-1	54918	54854	54532	6	689	695 (1.3%)
		mgCas12a-2	127825	127691	127213	2	143	145 (0.1%)
		FnCpf1	64265	64168	63882	0	162	162 (0.3%)

또한, 담배 FucT14 유전자의 두 가지 crRNA를 이용한 유전자 편집 효율을 단백질별로 확인하여 도 15에 나타내었다. 도 15에 나타난 바와 같이, FnCpf1보다 mgCas12a-1 단백질에 의한 유전자 편집이 두 배 높게 나타났다. 이때, 상기 타겟 유전자 NbFucT14_1 및 NbFucT14_2의 crRNA 및 프라이머 서열을 하기 표 6 및 표 7에 나타내었다.

Target Gene	crRNA (primer name)	crRNA sequence(PAM site)
NbFucT14_1 NbFucT14_2	NbFTa14_1/2-2	TTTGGATAATTTGTACTCTTGTCGATGT (서열번호 19)
NbFucT14_1 NbFucT14_2	NbFTa14_1/2-4	TTTAGTCCACAAACAGCTAAGCCCACAT (서열번호 20)

Target gene	Primer name	Sequence	Size (bp)
NbFucT14_1	NGS NbFTa14_1_F	TGAGCTGAAGATGGATTATG (서열번호 21)	216
NbFucT14_1	NGS NbFTa14_1_R	TCATGCTTAAGATAAAAGAG (서열번호 22)	216
NbFucT14_2	NGS NbFTa14_2_F	TCATGAGCTTAAGATGGATC (서열번호 23)	217
NbFucT14_2	NGS NbFTa14_2_R	GTTTAAGCTAAAAGAACTAC (서열번호 24)	217

실시예 7. FnCas12a와 mgCas12a의 유전자 편집 효율 비교

FnCas12a, WT mgCas12a-1 또는 WT mgCas12a-2 단백질, 및 crRNA로 구성된 리보핵단백질(RNP) 복합체를 형성하기 위해, FnCas12a, WT mgCas12a-1 또는 WT mgCas12a-2 단백질 6 pmol과 crRNA 7.5 pmol을 NEB1.1 버퍼 및 1X 증류수와 함께 상온에서 30분간 혼합하였다. crRNA 의존적인 Cas12a(FnCas12a, WT mgCas12a-1 또는 WT mgCas12a-2)를 이용하여 dsDNA 절단 활성을 확인하기 위하여, 0.3 pmol의 타겟 dsDNA(선형, 원형)를 첨가한 후 37℃에서 2시간 동안 반응시켰다. 이때, DNA로는 HsCCR5, HsDNMT1 및 HsEMX1를 사용하였다. 또한, 실험에 사용된 선형 DNA(서열번호 27 내지 서열번호 29)는 PCR 정제산물이고, 원형 DNA(서열번호 30 내지 서열번호 32)는 정제된 플라스미드이다. SDS와 EDTA(Gel loading dye, NEB)를 첨가한 후 -20℃에서 10분간 보관하여 상기 반응을 멈추었다. 각각의 DNA를 1% 아가로즈 겔에 로딩한 후 전기영동하여 FnCas12a, WT mgCas12a-1 또는 WT mgCas12a-2에 의한 DNA 절단 활성을 확인하였다. 그 결과를 도 16a(선형 DNA) 및 도 16b(원형 DNA)에 나타내었다. 상기 도 16a 및 도 16b에서 S는 기질(substrate)를 의미하고, 겔 아래 기재된 각 숫자들은 기질 DNA 밴드의 짙은 정도를 의미한다.

실시예 8. mgCas12a의 비특이적인 DNase 활성 확인

Cas12a(AsCas12a, FnCas12a 또는 LbCas12a)와 mgCas12a(WT mgCas12a-1, d_mgCas12a-1, WTmgCas12a-2 또는 d_mgCas12a-2)의 무작위한 DNase 기능을 확인하기 위하여, 상기 실시에 7과 동일한 방법으로 실험을 수행하였다. 이때, 상기 d-mgCas12a-1 및 d_mgCas12a-2는 WT mgCas12a-1 및 WT mgCas12a-2의 877번 및 873번의 Asp를 Ala으로 치환시킨 단백질을 의미한다.

구체적으로, 상기 7 종류의 Cas12a와 crRNA로 구성된 리보핵단백질(RNP) 복합체를 형성하기 위해, 각각의 Cas12a 단백질 6 pmol과 crRNA 7.5 pmol을 NEB1.1 버퍼 및 1X 증류수와 함께 상온에서 30분간 작용시켰다. 이후, 0.3 pmol의 타겟 dsDNA를 첨가한 후 37℃에서 12시간 및 24시간 동안 반응시켰다. 이때, DNA로는 HsCCR5, HsDNMT1 및 HsEMX1를 사용하였다. SDS와 EDTA(Gel loading dye, NEB)를 첨가한 후 -20℃에서 10분간 보관하여 상기 반응을 멈추었다. 각각의 DNA를 1% 아가로즈 겔에 로딩한 후 전기영동하여 상기 7 종류의 Cas12a에 의한 DNA 절단 활성을 확인하였다. 그 결과를 도 17에 나타내었다. 상기 도 17에서 S는 기질(substrate)를 의미하고, 겔 아래 기재된 각 숫자들은 기질 DNA 밴드의 짙은 정도를 의미한다.

도 17에 나타난 바와 같이, 기존 Cas12a인 AsCas12a, FnCas12a 또는 LbCas12a와 crRNA로 구성된 리보핵단백질 복합체보다 신규 Cas12a인 WT mgCas12a-1, d_mgCas12a-1, WTmgCas12a-2 또는 d_mgCas12a-2와 crRNA로 구성된 리보핵단백질 복합체가 약한 비특이적인 DNase 기능을 나타내었다. 또한, 전반적으로 Cas12a RNP와 DNA를 반응시킬 경우 비특이적인 DNase 기능이 발생하는 것을 추측할 수 있었다.

실시예 9. crRNA 없는 조건에서 Cas12a의 비특이적인 DNase 기능 확인

crRNA 없이도 Cas12a가 무작위한 DNase 기능을 갖는지를 확인하기 위하여, FnCas12a, WT mgCas12a-1 또는 WT mgCas12a-2 단백질을 crRNA 없는 조건에서 시간을 달리하여 상기 실시예 7과 동일한 방법으로 실험을 수행하였다. 그 결과를 도 18a 및 도 18b에 나타내었다. 도 18a 및 도 18b에 나타난 바와 같이, crRNA 없이도 FnCas12a, WT mgCas12a-1 또는 WT mgCas12a-2 단백질이 무작위한 DNase 기능을 가졌고, FnCas12a 단백질의 무작위한 DNase 기능이 가장 먼저 발생되었다.

실시예 10. 기존 Cas12a의 handle을 사용한 mgCas12a의 DNA 절단 기능 확인

신규 Cas12a(d_mgCas12a 또는 WT mgCas12a)가 기존 Cas12a(AsCas12a, FnCas12a 또는 LbCas12a) 서열의 5' 말단에 존재하는 handle을 이용하여 DNA 절단이 가능한지를 확인하기 위해, AsCas12a, FnCas12a 또는 LbCas12a 각각의 handle과 반응시간을 달리하여 상기 실시예 7과 동일한 방법으로 실험을 수행하였다. 그 결과를 도 19에 나타내었다.

도 19에 나타난 바와 같이, AsCas12a, FnCas12a 또는 LbCas12a의 handle을 이용하여 d_mgCas12a 또는 WT mgCas12a 단백질로 DNA를 절단한 결과, 상기 각 handle에 따라 DNA 절단 효율이 조금씩 달랐지만 세 종류의 handle을 이용한 d_mgCas12a 또는 WT mgCas12a 단백질에서 모두 DNA를 절단 기능이 있었다. 이를 통해, DNA 절단을 위해 mgCas12a가 AsCas12a, FnCas12a 또는 LbCas12a의 handle을 이용할 수 있음을 알 수 있었다.

실시예 11. 이가이온에 의한 FnCas12a 또는 mgCas12a의 활성 확인

또한, 이가이온들(CaCl₂, CoCl₂, CuSO₄, FeCl₂, MnSO₄, NiSO₄ 또는 ZnSO₄)에 의한 FnCas12a, mgCas12a-1 또는 mgCas12a-2 단백질의 DNA 절단 활성을 확인하기 위하여, NEBuffer 1.1 대신 정해진 양의 이가이온들을 대신 사용하여 상기 실시예 4와 동일한 방법으로 실험을 수행하였다. 그 결과를 도 20a 및 도 20b에 나타내었다. 도 20a 및 도 20b에 나타난 바와 같이, FnCas12a, mgCas12a-1 또는 mgCas12a-2 단백질이 같은 이가이온에서 비슷한 DNA 절단 활성을 나타내었다.

<110> g+flas life sciences Seoul National University R&DB Foundation <120> NOVEL CRISPR ASSOCIATED PROTEIN AND USE THEREOF <130> FPD-201912-0008 <150> KR 10-2018-0093336 <151> 2018-08-09 <160> 32 <170> KoPatentIn 3.0 <210> 1 <211> 1263 <212> PRT <213> Artificial Sequence <220> <223> mgCas12a-1 <400> 1 Met Asn Asn Gly Thr Asn Asn Phe Gln Asn Phe Ile Gly Ile Ser Ser 1 5 10 15 Leu Gln Lys Thr Leu Arg Asn Ala Leu Ile Pro Thr Glu Thr Thr Gln 20 25 30 Gln Phe Ile Val Lys Asn Gly Ile Ile Lys Glu Asp Glu Leu Arg Gly 35 40 45 Glu Asn Arg Gln Ile Leu Lys Asp Ile Met Asp Asp Tyr Tyr Arg Gly 50 55 60 Phe Ile Ser Glu Thr Leu Ser Ser Ile Asp Asp Ile Asp Trp Thr Ser 65 70 75 80 Leu Phe Glu Lys Met Glu Ile Gln Leu Lys Asn Gly Asp Asn Lys Asp 85 90 95 Thr Leu Ile Lys Glu Gln Ala Glu Lys Arg Lys Ala Ile Tyr Lys Lys 100 105 110 Phe Ala Asp Asp Asp Arg Phe Lys Asn Met Phe Ser Ala Lys Leu Ile 115 120 125 Ser Asp Ile Leu Pro Glu Phe Val Ile His Asn Asn Asn Tyr Ser Ala 130 135 140 Ser Glu Lys Glu Glu Lys Thr Gln Val Ile Lys Leu Phe Ser Arg Phe 145 150 155 160 Ala Thr Ser Phe Lys Asp Tyr Phe Lys Asn Arg Ala Asn Cys Phe Ser 165 170 175 Ala Asp Asp Ile Ser Ser Ser Ser Cys His Arg Ile Val Asn Asp Asn 180 185 190 Ala Glu Ile Phe Phe Ser Asn Ala Leu Val Tyr Arg Arg Ile Val Lys 195 200 205 Asn Leu Ser Asn Asp Asp Ile Asn Lys Ile Ser Gly Asp Ile Lys Asp 210 215 220 Ser Leu Lys Glu Met Ser Leu Glu Glu Ile Tyr Ser Tyr Glu Lys Tyr 225 230 235 240 Gly Glu Phe Ile Thr Gln Glu Gly Ile Ser Phe Tyr Asn Asp Ile Cys 245 250 255 Gly Lys Val Asn Ser Phe Met Asn Leu Tyr Cys Gln Lys Asn Lys Glu 260 265 270 Asn Lys Asn Leu Tyr Lys Leu Arg Lys Leu His Lys Gln Ile Leu Cys 275 280 285 Ile Ala Asp Thr Ser Tyr Glu Val Pro Tyr Lys Phe Glu Ser Asp Glu 290 295 300 Glu Val Tyr Gln Ser Val Asn Gly Phe Leu Asp Asn Ile Ser Ser Lys 305 310 315 320 His Ile Val Glu Arg Leu Arg Lys Ile Gly Asp Asn Tyr Asn Gly Tyr 325 330 335 Asn Leu Asp Lys Ile Tyr Ile Val Ser Lys Phe Tyr Glu Ser Val Ser 340 345 350 Gln Lys Thr Tyr Arg Asp Trp Glu Thr Ile Asn Thr Ala Leu Glu Ile 355 360 365 His Tyr Asn Asn Ile Leu Pro Gly Asn Gly Lys Ser Lys Ala Asp Lys 370 375 380 Val Lys Lys Ala Val Lys Asn Asp Leu Gln Lys Ser Ile Thr Glu Ile 385 390 395 400 Asn Glu Leu Val Ser Asn Tyr Lys Leu Cys Pro Asp Asp Asn Ile Lys 405 410 415 Ala Glu Thr Tyr Ile His Glu Ile Ser His Ile Leu Asn Asn Phe Glu 420 425 430 Ala Gln Glu Leu Lys Tyr Asn Pro Glu Ile His Leu Val Glu Ser Glu 435 440 445 Leu Lys Ala Ser Glu Leu Lys Asn Val Leu Asp Val Ile Met Asn Ala 450 455 460 Phe His Trp Cys Ser Val Phe Met Thr Glu Glu Leu Val Asp Lys Asp 465 470 475 480 Asn Asn Phe Tyr Ala Glu Leu Glu Glu Ile Tyr Asp Glu Ile Tyr Thr 485 490 495 Val Ile Ser Leu Tyr Asn Leu Val Arg Asn Tyr Val Thr Gln Lys Pro 500 505 510 Tyr Ser Thr Lys Lys Ile Lys Leu Asn Phe Gly Ile Pro Thr Leu Ala 515 520 525 Asp Gly Trp Ser Lys Ser Lys Glu Tyr Ser Asn Asn Ala Ile Ile Leu 530 535 540 Met Arg Asp Asn Leu Tyr Tyr Leu Gly Ile Phe Asn Ala Lys Asn Lys 545 550 555 560 Pro Asp Lys Lys Ile Ile Glu Gly Asn Thr Ser Glu Asn Lys Gly Asp 565 570 575 Tyr Lys Lys Met Ile Tyr Asn Leu Leu Pro Gly Pro Asn Lys Met Ile 580 585 590 Pro Lys Val Phe Leu Ser Ser Lys Thr Gly Val Glu Thr Tyr Lys Pro 595 600 605 Ser Ala Tyr Ile Leu Glu Gly Tyr Lys Gln Asn Lys His Leu Lys Ser 610 615 620 Ser Lys Asp Phe Asp Ile Thr Phe Cys His Asp Leu Ile Asp Tyr Phe 625 630 635 640 Lys Asn Cys Ile Ala Ile His Pro Glu Trp Lys Asn Phe Gly Phe Asp 645 650 655 Phe Ser Asp Thr Ser Thr Tyr Glu Asp Ile Ser Gly Phe Tyr Arg Glu 660 665 670 Val Glu Leu Gln Gly Tyr Lys Ile Asp Trp Thr Tyr Ile Ser Glu Lys 675 680 685 Asp Ile Asp Leu Leu Gln Glu Lys Gly Gln Leu Tyr Leu Phe Gln Ile 690 695 700 Tyr Asn Lys Asp Phe Ser Lys Lys Ser Thr Gly Asn Asp Asn Leu His 705 710 715 720 Thr Met Tyr Leu Lys Asn Leu Phe Ser Glu Glu Asn Leu Lys Asp Ile 725 730 735 Val Leu Lys Leu Asn Gly Glu Ala Glu Ile Phe Phe Arg Lys Ser Ser 740 745 750 Ile Lys Asn Pro Ile Ile His Lys Lys Gly Ser Ile Leu Val Asn Arg 755 760 765 Thr Tyr Glu Ala Glu Glu Lys Asp Gln Phe Gly Asn Ile Gln Ile Val 770 775 780 Arg Lys Thr Ile Pro Glu Asn Ile Tyr Gln Glu Leu Tyr Lys Tyr Phe 785 790 795 800 Asn Asp Lys Ser Asp Lys Glu Leu Ser Asp Glu Ala Ala Lys Leu Lys 805 810 815 Asn Val Val Gly His His Glu Ala Ala Thr Asn Ile Val Lys Asp Tyr 820 825 830 Arg Tyr Thr Tyr Asp Lys Tyr Phe Leu His Met Pro Ile Thr Ile Asn 835 840 845 Phe Lys Ala Asn Lys Thr Ser Phe Ile Asn Asp Arg Ile Leu Gln Tyr 850 855 860 Ile Ala Lys Glu Lys Asn Leu His Val Ile Gly Ile Asp Arg Gly Glu 865 870 875 880 Arg Asn Leu Ile Tyr Val Ser Val Ile Asp Thr Cys Gly Asn Ile Val 885 890 895 Glu Gln Lys Ser Phe Asn Ile Val Asn Gly Tyr Asp Tyr Gln Ile Lys 900 905 910 Leu Lys Gln Gln Glu Gly Ala Arg Gln Ile Ala Arg Lys Glu Trp Lys 915 920 925 Glu Ile Gly Lys Ile Lys Glu Ile Lys Glu Gly Tyr Leu Ser Leu Val 930 935 940 Ile His Glu Ile Ser Lys Met Val Ile Lys Tyr Asn Ala Ile Ile Ala 945 950 955 960 Met Glu Asp Leu Ser Tyr Gly Phe Lys Lys Gly Arg Phe Lys Val Glu 965 970 975 Arg Gln Val Tyr Gln Lys Phe Glu Thr Met Leu Ile Asn Lys Leu Asn 980 985 990 Tyr Leu Val Phe Lys Asp Ile Ser Ile Thr Glu Asn Gly Gly Leu Leu 995 1000 1005 Lys Gly Tyr Gln Leu Thr Tyr Ile Pro Asp Lys Leu Lys Asn Val Gly 1010 1015 1020 His Gln Cys Gly Cys Ile Phe Tyr Val Pro Ala Ala Tyr Thr Ser Lys 1025 1030 1035 1040 Ile Asp Pro Thr Thr Gly Phe Val Asn Ile Phe Lys Phe Lys Asp Leu 1045 1050 1055 Thr Val Asp Ala Lys Arg Glu Phe Ile Lys Lys Phe Asp Ser Ile Arg 1060 1065 1070 Tyr Asp Ser Glu Lys Lys Leu Phe Cys Phe Thr Phe Asp Tyr Asn Asn 1075 1080 1085 Phe Ile Thr Gln Asn Thr Val Met Ser Lys Ser Ser Trp Ser Val Tyr 1090 1095 1100 Thr Tyr Gly Val Arg Ile Lys Arg Arg Phe Val Asn Gly Arg Phe Ser 1105 1110 1115 1120 Asn Glu Ser Asp Thr Ile Asp Ile Thr Lys Asp Met Glu Lys Thr Leu 1125 1130 1135 Glu Met Thr Asp Ile Asn Trp Arg Asp Gly His Asp Leu Arg Gln Asp 1140 1145 1150 Ile Ile Asp Tyr Glu Ile Val Gln His Ile Phe Glu Ile Phe Arg Leu 1155 1160 1165 Thr Val Gln Met Arg Asn Ser Leu Ser Glu Leu Glu Asp Arg Asp Tyr 1170 1175 1180 Asp Arg Leu Ile Ser Pro Val Leu Asn Glu Asn Asn Ile Phe Tyr Asp 1185 1190 1195 1200 Ser Ala Lys Ala Gly Asp Ala Leu Pro Lys Asp Ala Asp Ala Asn Gly 1205 1210 1215 Ala Tyr Cys Ile Ala Leu Lys Gly Leu Tyr Glu Ile Lys Gln Ile Thr 1220 1225 1230 Glu Asn Trp Lys Glu Asp Gly Lys Phe Ser Arg Asp Lys Leu Lys Ile 1235 1240 1245 Ser Asn Lys Asp Trp Phe Asp Phe Ile Gln Asn Lys Arg Tyr Leu 1250 1255 1260 <210> 2 <211> 3792 <212> DNA <213> Artificial Sequence <220> <223> mgCas12a-1 <400> 2 atgaataacg gaacaaataa ctttcagaac tttatcggaa tttcttcttt gcagaagact 60 cttaggaatg ctctcattcc aacagaaaca acacagcaat ttattgttaa aaatggaata 120 attaaagaag atgaactcag aggagaaaat cgtcagatac ttaaagatat catggatgat 180 tattacagag gtttcatttc agaaacttta tcgtcaattg atgatattga ctggacctct 240 ttatttgaga aaatggaaat tcagttaaaa aatggagata ataaagacac tcttataaaa 300 gaacaggctg aaaaacgtaa ggcaatctat aaaaaatttg cagatgatga tagatttaaa 360 aatatgttca gtgcaaaatt aatctcagat attcttcctg aatttgtcat tcataacaat 420 aattattctg catcagaaaa ggaagaaaaa acacaggtaa ttaaattatt ttccagattt 480 gcaacatcat tcaaggacta ttttaaaaac agggctaatt gtttttctgc tgatgatata 540 tcttcttctt cttgtcatag aatagttaat gataatgcag aaatattttt tagtaatgca 600 ttggtgtata ggagaattgt aaaaaatctt tcaaatgatg atataaataa aatatccgga 660 gatattaagg attcattaaa ggaaatgtct ctggaggaaa tttattctta tgaaaaatat 720 ggggaattta ttacacagga aggtatatct ttttataatg atatatgcgg taaagtaaat 780 tcatttatga atttatattg ccagaaaaat aaagaaaaca aaaatctcta taagctgcga 840 aagcttcata aacagatact gtgcatagca gatacttctt atgaggtgcc gtataaattt 900 gaatcagatg aagaggttta tcaatcagtg aatggatttt tggacaatat tagttcaaaa 960 catatcgttg aaagattgcg taagattgga gacaactata acggctacaa tcttgataag 1020 atttatattg ttagtaaatt ctatgaatca gtttcacaaa agacatatag agattgggaa 1080 acaataaata ctgcattaga aattcattac aacaatatat tacccggaaa tggtaaatct 1140 aaagctgaca aggtaaaaaa agcggtaaag aatgatctgc aaaaaagcat tactgaaatc 1200 aatgagcttg ttagcaatta taaattatgt ccggatgata atattaaagc agagacatat 1260 atacatgaaa tatcacatat tttgaataat tttgaagcac aggagcttaa gtataatcct 1320 gaaattcatc tggtggaaag tgaattgaaa gcatctgaat taaaaaatgt tctcgatgta 1380 ataatgaatg cttttcattg gtgttcggtt ttcatgacag aggagctggt agataaagat 1440 aataattttt atgcggagtt agaagagata tatgacgaaa tatatacggt aatttcattg 1500 tataatcttg tgcgtaatta tgtaacgcag aagccatata gtacaaaaaa aattaaattg 1560 aattttggta ttcctacact agcggatgga tggagtaaaa gtaaagaata tagtaataat 1620 gcaattattc tcatgcgtga taatttgtac tatttaggaa tatttaatgc aaaaaataag 1680 cctgacaaaa agataattga aggtaataca tcagaaaata aaggggatta taagaagatg 1740 atttataatc ttctgccagg accaaataaa atgatcccca aggtattcct ctcttcaaaa 1800 accggagtgg aaacatataa gccgtctgcc tatatattgg agggctataa acaaaacaag 1860 catcttaaat cctctaagga ttttgatata acgttttgtc acgatttgat tgattatttt 1920 aagaactgta tagcaataca tcctgaatgg aagaattttg gctttgattt ttctgacacc 1980 tccacatatg aagatatcag cggattttac agagaagtcg aattgcaagg ttataaaatt 2040 gactggacat atatcagcga aaaggatatt gatttgttgc aggaaaaagg acagttatat 2100 ttatttcaaa tatataacaa agatttttcc aagaaaagta ccggaaatga taatcttcat 2160 actatgtatt tgaagaattt gtttagcgaa gagaatttaa aggatattgt actgaaatta 2220 aacggtgagg cggaaatctt ctttagaaaa tcaagcataa agaatccaat aattcataaa 2280 aaaggctcta ttcttgttaa tagaacatat gaagcagagg aaaaagatca atttggaaat 2340 atccagatag tcagaaaaac cataccggaa aatatatatc aggagcttta taaatatttc 2400 aatgataaaa gtgataaaga actttcggat gaagcagcta agcttaagaa tgtagtaggt 2460 catcatgagg ctgctacaaa catagtaaaa gattatagat atacatatga taaatatttt 2520 cttcatatgc ctattacaat caattttaaa gccaataaga caagctttat taatgacaga 2580 atattacaat atattgctaa agaaaagaat ttgcatgtaa taggcattga tcgtggtgaa 2640 agaaacctga tatatgtttc agtaattgat acttgtggaa atattgttga acaaaaatcg 2700 tttaacattg ttaatggata tgattatcag attaagctca agcagcagga gggggcgcga 2760 caaatcgcac gaaaagaatg gaaagaaatc ggcaaaataa aagaaattaa agaaggctat 2820 ttatctcttg taattcatga aatttcaaag atggttatta aatataatgc cataattgca 2880 atggaggatt taagctacgg atttaaaaaa ggtcgtttca aggttgagcg acaggtttac 2940 cagaagtttg agacaatgct tatcaacaaa ctcaactatc tggtatttaa agatatatcc 3000 ataactgaaa acggtggtct tctaaaggga tatcagctta catatattcc agataaactg 3060 aaaaatgtgg gtcatcaatg tggttgtata ttttacgtac ctgctgccta tacatcaaaa 3120 atagatccta caaccggatt tgtaaatata ttcaaattta aagatttaac agttgatgca 3180 aagagagaat ttataaaaaa atttgacagt atcagatatg attcagaaaa aaaactgttt 3240 tgttttacat ttgattataa taactttatt acgcaaaata ctgttatgtc aaagtcaagc 3300 tggagtgtat atacgtacgg agttaggata aaaagaagat ttgtcaatgg caggttctca 3360 aatgaatcgg atacaattga tataacaaaa gatatggaaa aaaccctcga aatgacagat 3420 ataaattgga gagatggtca tgatctgagg caggatatta ttgattatga aatcgtacaa 3480 cacatatttg agatttttag attgactgta caaatgagaa acagtttaag tgaattagaa 3540 gacagggatt atgaccgttt gatttctccg gtgctcaatg aaaataatat attttatgat 3600 tcagctaaag caggagatgc gttacctaaa gacgcagatg ctaatggtgc atattgtata 3660 gctctaaaag gcttgtatga aatcaaacaa attacagaga attggaaaga agacggtaag 3720 ttttcaagag ataaacttaa aatttccaat aaggactggt ttgactttat tcaaaataaa 3780 aggtatttat aa 3792 <210> 3 <211> 1275 <212> PRT <213> Artificial Sequence <220> <223> mgCas12a-2 <400> 3 Met Gly Lys Asn Gln Asn Phe Gln Glu Phe Ile Gly Val Ser Pro Leu 1 5 10 15 Gln Lys Thr Leu Arg Asn Glu Leu Ile Pro Thr Glu Thr Thr Lys Lys 20 25 30 Asn Ile Thr Gln Leu Asp Leu Leu Thr Glu Asp Glu Ile Arg Ala Gln 35 40 45 Asn Arg Glu Lys Leu Lys Glu Met Met Asp Asp Tyr Tyr Arg Asn Val 50 55 60 Ile Asp Ser Thr Leu His Val Gly Ile Ala Val Asp Trp Ser Tyr Leu 65 70 75 80 Phe Ser Cys Met Arg Asn His Leu Arg Glu Asn Ser Lys Glu Ser Lys 85 90 95 Arg Glu Leu Glu Arg Thr Gln Asp Ser Ile Arg Ser Gln Ile His Asn 100 105 110 Lys Phe Ala Glu Arg Ala Asp Phe Lys Asp Met Phe Gly Ala Ser Ile 115 120 125 Ile Thr Lys Leu Leu Pro Thr Tyr Ile Lys Gln Asn Ser Glu Tyr Ser 130 135 140 Glu Arg Tyr Asp Glu Ser Met Glu Ile Leu Lys Leu Tyr Gly Lys Phe 145 150 155 160 Thr Thr Ser Leu Thr Asp Tyr Phe Glu Thr Arg Lys Asn Ile Phe Ser 165 170 175 Lys Glu Lys Ile Ser Ser Ala Val Gly Tyr Arg Ile Val Glu Glu Asn 180 185 190 Ala Glu Ile Phe Leu Gln Asn Gln Asn Ala Tyr Asp Arg Ile Cys Lys 195 200 205 Ile Ala Gly Leu Asp Leu His Gly Leu Asp Asn Glu Ile Thr Ala Tyr 210 215 220 Val Asp Gly Lys Thr Leu Lys Glu Val Cys Ser Asp Glu Gly Phe Ala 225 230 235 240 Lys Ala Ile Thr Gln Glu Gly Ile Asp Arg Tyr Asn Glu Ala Ile Gly 245 250 255 Ala Val Asn Gln Tyr Met Asn Leu Leu Cys Gln Lys Asn Lys Ala Leu 260 265 270 Lys Pro Gly Gln Phe Lys Met Lys Arg Leu His Lys Gln Ile Leu Cys 275 280 285 Lys Gly Thr Thr Ser Phe Asp Ile Pro Lys Lys Phe Glu Asn Asp Lys 290 295 300 Gln Val Tyr Asp Ala Val Asn Ser Phe Thr Glu Ile Val Thr Lys Asn 305 310 315 320 Asn Asp Leu Lys Arg Leu Leu Asn Ile Thr Gln Asn Ala Asn Asp Tyr 325 330 335 Asp Met Asn Lys Ile Tyr Val Val Ala Asp Ala Tyr Ser Met Ile Ser 340 345 350 Gln Phe Ile Ser Lys Lys Trp Asn Leu Ile Glu Glu Cys Leu Leu Asp 355 360 365 Tyr Tyr Ser Asp Asn Leu Pro Gly Lys Gly Asn Ala Lys Glu Asn Lys 370 375 380 Val Lys Lys Ala Val Lys Glu Glu Thr Tyr Arg Ser Val Ser Gln Leu 385 390 395 400 Asn Glu Val Ile Glu Lys Tyr Tyr Val Glu Lys Thr Gly Gln Ser Val 405 410 415 Trp Lys Val Glu Ser Tyr Ile Ser Ser Leu Ala Glu Met Ile Lys Leu 420 425 430 Glu Leu Cys His Glu Ile Asp Asn Asp Glu Lys His Asn Leu Ile Glu 435 440 445 Asp Asp Glu Lys Ile Ser Glu Ile Lys Glu Leu Leu Asp Met Tyr Met 450 455 460 Asp Val Phe His Ile Ile Lys Val Phe Arg Val Asn Glu Val Leu Asn 465 470 475 480 Phe Asp Glu Thr Phe Tyr Ser Glu Met Asp Glu Ile Tyr Gln Asp Met 485 490 495 Gln Glu Ile Val Pro Leu Tyr Asn His Val Arg Asn Tyr Val Thr Gln 500 505 510 Lys Pro Tyr Lys Gln Glu Lys Tyr Arg Leu Tyr Phe His Thr Pro Thr 515 520 525 Leu Ala Asn Gly Trp Ser Lys Ser Lys Glu Tyr Asp Asn Asn Ala Ile 530 535 540 Ile Leu Val Arg Glu Asp Lys Tyr Tyr Leu Gly Ile Leu Asn Ala Lys 545 550 555 560 Lys Lys Pro Ser Lys Glu Ile Met Ala Gly Lys Glu Asp Cys Ser Glu 565 570 575 His Ala Tyr Ala Lys Met Asn Tyr Tyr Leu Leu Pro Gly Ala Asn Lys 580 585 590 Met Leu Pro Lys Val Phe Leu Ser Lys Lys Gly Ile Gln Asp Tyr His 595 600 605 Pro Ser Ser Tyr Ile Val Glu Gly Tyr Asn Glu Lys Lys His Ile Lys 610 615 620 Gly Ser Lys Asn Phe Asp Ile Arg Phe Cys Arg Asp Leu Ile Asp Tyr 625 630 635 640 Phe Lys Glu Cys Ile Lys Lys His Pro Asp Trp Asn Lys Phe Asn Phe 645 650 655 Glu Phe Ser Ala Thr Glu Thr Tyr Glu Asp Ile Ser Val Phe Tyr Arg 660 665 670 Glu Val Glu Lys Gln Gly Tyr Arg Val Glu Trp Thr Tyr Ile Asn Ser 675 680 685 Glu Asp Ile Gln Lys Leu Glu Glu Asp Gly Gln Leu Phe Leu Phe Gln 690 695 700 Ile Tyr Asn Lys Asp Phe Ala Val Gly Ser Thr Gly Lys Pro Asn Leu 705 710 715 720 His Thr Leu Tyr Leu Lys Asn Leu Phe Ser Glu Glu Asn Leu Arg Asp 725 730 735 Ile Val Leu Lys Leu Asn Gly Glu Ala Glu Ile Phe Phe Arg Lys Ser 740 745 750 Ser Val Gln Lys Pro Val Ile His Lys Cys Gly Ser Ile Leu Val Asn 755 760 765 Arg Thr Tyr Glu Ile Thr Glu Ser Gly Thr Thr Arg Val Gln Ser Ile 770 775 780 Pro Glu Ser Glu Tyr Met Glu Leu Tyr Arg Tyr Phe Asn Ser Glu Lys 785 790 795 800 Gln Ile Glu Leu Ser Asp Glu Ala Lys Lys Tyr Leu Asp Lys Val Gln 805 810 815 Cys Asn Lys Ala Lys Thr Asp Ile Val Lys Asp Tyr Arg Tyr Thr Met 820 825 830 Asp Lys Phe Phe Ile His Leu Pro Ile Thr Ile Asn Phe Lys Val Asp 835 840 845 Lys Gly Asn Asn Val Asn Ala Ile Ala Gln Gln Tyr Ile Ala Gly Arg 850 855 860 Lys Asp Leu His Val Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Ile 865 870 875 880 Tyr Val Ser Val Ile Asp Met Tyr Gly Arg Ile Leu Glu Gln Lys Ser 885 890 895 Phe Asn Leu Val Glu Gln Val Ser Ser Gln Gly Thr Lys Arg Tyr Tyr 900 905 910 Asp Tyr Lys Glu Lys Leu Gln Asn Arg Glu Glu Glu Arg Asp Lys Ala 915 920 925 Arg Lys Ser Trp Lys Thr Ile Gly Lys Ile Lys Glu Leu Lys Glu Gly 930 935 940 Tyr Leu Ser Ser Val Ile His Glu Ile Ala Gln Met Val Val Lys Tyr 945 950 955 960 Asn Ala Ile Ile Ala Met Glu Asp Leu Asn Tyr Gly Phe Lys Arg Gly 965 970 975 Arg Phe Lys Val Glu Arg Gln Val Tyr Gln Lys Phe Glu Thr Met Leu 980 985 990 Ile Ser Lys Leu Asn Tyr Leu Ala Asp Lys Ser Gln Ala Val Asp Glu 995 1000 1005 Pro Gly Gly Ile Leu Arg Gly Tyr Gln Met Thr Tyr Val Pro Asp Asn 1010 1015 1020 Ile Lys Asn Val Gly Arg Gln Cys Gly Ile Ile Phe Tyr Val Pro Ala 1025 1030 1035 1040 Ala Tyr Thr Ser Lys Ile Asp Pro Thr Thr Gly Phe Ile Asn Ala Phe 1045 1050 1055 Lys Arg Asp Val Val Ser Thr Asn Asp Ala Lys Glu Asn Phe Leu Met 1060 1065 1070 Lys Phe Asp Ser Ile Gln Tyr Asp Ile Glu Lys Gly Leu Phe Lys Phe 1075 1080 1085 Ser Phe Asp Tyr Lys Asn Phe Ala Thr His Lys Leu Thr Leu Ala Lys 1090 1095 1100 Thr Lys Trp Asp Val Tyr Thr Asn Gly Thr Arg Ile Gln Asn Met Lys 1105 1110 1115 1120 Val Glu Gly His Trp Leu Ser Met Glu Val Glu Leu Thr Thr Lys Met 1125 1130 1135 Lys Glu Leu Leu Asp Asp Ser His Ile Pro Tyr Glu Glu Gly Gln Asn 1140 1145 1150 Ile Leu Asp Asp Leu Arg Glu Met Lys Asp Ile Thr Thr Ile Val Asn 1155 1160 1165 Gly Ile Leu Glu Ile Phe Trp Leu Thr Val Gln Leu Arg Asn Ser Arg 1170 1175 1180 Ile Asp Asn Pro Asp Tyr Asp Arg Ile Ile Ser Pro Val Leu Asn Lys 1185 1190 1195 1200 Asn Gly Glu Phe Phe Asp Ser Asp Glu Tyr Asn Ser Tyr Ile Asp Ala 1205 1210 1215 Gln Lys Ala Pro Leu Pro Ile Asp Ala Asp Ala Asn Gly Ala Phe Cys 1220 1225 1230 Ile Ala Leu Lys Gly Met Tyr Thr Ala Asn Gln Ile Lys Glu Asn Trp 1235 1240 1245 Val Glu Gly Glu Lys Leu Pro Ala Asp Cys Leu Lys Ile Glu His Ala 1250 1255 1260 Ser Trp Leu Ala Phe Met Gln Gly Glu Arg Gly 1265 1270 1275 <210> 4 <211> 3828 <212> DNA <213> Artificial Sequence <220> <223> mgCas12a-2 <400> 4 atgggtaaaa atcaaaattt tcaggaattt attggggtat caccacttca aaagacttta 60 agaaacgaat taatcccaac agaaacaaca aaaaagaata ttactcagct tgatcttttg 120 actgaggatg aaatccgcgc gcaaaatcga gagaagctga aagagatgat ggatgactac 180 taccggaatg tgattgatag cactttgcat gtgggtatag ctgttgattg gagctattta 240 ttttcgtgta tgcgaaatca tctaagggag aattccaaag agtcaaagcg ggaattggaa 300 cgaacacagg attctattcg ttcacaaatc cataataagt ttgctgaacg agcggatttt 360 aaggatatgt ttggagcatc gataataaca aaattacttc cgacatatat aaaacagaat 420 tcagaatatt ccgagcggta tgacgagagc atggaaattt tgaaactgta tggaaaattc 480 acaacatcgt tgaccgatta ctttgagaca agaaagaata tcttttctaa agagaaaata 540 tcttctgccg ttggatatcg aatcgtagag gaaaatgctg agatcttctt gcagaatcag 600 aatgcttacg acagaatctg taagatagcg ggactggatt tacatggatt ggataatgaa 660 ataacagcat atgttgatgg aaaaacatta aaagaagtat gttcggatga aggatttgca 720 aaggctatta cacaagaagg gattgatcgc tacaacgagg caatcggtgc agtaaatcaa 780 tatatgaatc tgttatgcca gaagaataag gcattaaaac cgggacaatt taagatgaag 840 cggctacata aacagattct ttgcaaagga acaacctctt tcgatattcc aaagaagttt 900 gaaaatgata aacaggtgta tgacgcagtt aattctttta cagagatagt aacgaagaat 960 aatgatttga agcgactgtt aaatattaca cagaatgcaa atgattatga catgaataaa 1020 atctatgtag tagccgatgc atatagtatg atttcacagt ttatcagtaa aaaatggaat 1080 ctgattgaag aatgcttgct ggattattat agcgataatt tgccgggaaa aggaaatgcg 1140 aaagaaaaca aagttaaaaa ggcggtaaag gaagaaacgt atcgcagtgt ttcacagttg 1200 aatgaagtta ttgagaaata ttatgtggaa aagaccggac agtcagtatg gaaagtggaa 1260 agttatattt ctagtctggc agaaatgatt aagctggaat tgtgccacga gatagataac 1320 gatgagaagc ataatctgat tgaagatgat gagaagatat ccgagattaa ggaactgttg 1380 gatatgtaca tggatgtatt tcatattata aaagtgttcc gggtgaatga agtattgaat 1440 ttcgatgaaa ccttttattc ggagatggat gagatctatc aggatatgca ggaaatcgtt 1500 ccattataca atcatgttcg aaactatgtt acacagaaac catataagca ggagaaatat 1560 cgtttatatt tccacactcc aacattggca aatggctggt ccaagagtaa ggaatatgac 1620 aacaacgcaa ttatattggt gcgagaagat aaatattatt taggtattct gaatgcgaaa 1680 aagaaaccat cgaaagaaat tatggcgggc aaagaggatt gttcagaaca tgcatatgca 1740 aagatgaatt attatttgtt gccgggcgcg aacaagatgc ttccaaaagt atttttatct 1800 aagaaaggaa tacaggacta tcacccatca tcatatattg ttgaaggata taatgaaaag 1860 aaacatatta aaggttccaa gaattttgat atccggtttt gtagggattt gattgactac 1920 ttcaaggaat gcattaaaaa acatccggat tggaataagt ttaactttga attttctgcg 1980 acagaaacat atgaggatat cagtgtcttt tatcgcgaag ttgaaaagca aggatatcgc 2040 gtagagtgga cgtatatcaa tagtgaagat attcagaaac tggaagaaga tggacagttg 2100 tttttatttc agatatataa caaagatttt gctgtgggaa gtacaggtaa accaaatctt 2160 catacattgt atctgaaaaa tctgttcagc gaagaaaatt tgcgggacat tgtattaaaa 2220 ctaaatgggg aagcagaaat attcttccgt aaatcaagtg ttcaaaaacc ggtgattcat 2280 aagtgcggca gtattttagt caatcgtacc tatgagatta ccgagagtgg aacaacacgg 2340 gtacaatcaa ttccggaaag tgaatacatg gaattatatc gctactttaa tagtgaaaag 2400 cagatagaat tatcagatga ggcaaaaaaa tatttggaca aggtgcaatg taataaggca 2460 aagacagata ttgtgaaaga ctaccgatac accatggaca agttttttat tcatcttccg 2520 attacgatta attttaaggt tgataagggt aacaatgtta atgccattgc acagcaatat 2580 attgcagggc ggaaagattt acatgtgata ggaattgatc gaggagaacg gaatctgatt 2640 tacgtttctg taattgacat gtatggtaga attttagagc agaaatcctt taaccttgtg 2700 gaacaggtat cgtcgcaggg aacgaagcga tattacgatt acaaagaaaa attacagaac 2760 cgggaagagg aacgggataa agcaagaaag agttggaaga caatcggcaa gattaaggaa 2820 ttaaaagagg ggtatctgtc gtcagtaatt catgagattg cacagatggt cgtaaagtat 2880 aacgcaatca ttgcaatgga agatttgaat tatggattta agcggggaag attcaaagta 2940 gagcgccagg tatatcagaa atttgaaacg atgttgatca gtaagttgaa ttatctggca 3000 gataaatctc aggctgtgga tgaaccggga ggtatattac ggggatatca gatgacttat 3060 gtgccggata atattaagaa tgttggaaga caatgtggaa taatctttta tgtgccggca 3120 gcatatacct ccaagattga tccgacaacc ggatttatca atgcatttaa gcgggatgtg 3180 gtatcaacaa atgatgcaaa agagaatttc ctgatgaagt ttgattctat tcagtacgat 3240 atagaaaaag gcttatttaa gttttcattt gattacaaaa attttgccac acataaactt 3300 acacttgcga agacaaaatg ggacgtatat acaaatggaa ctcgaataca aaacatgaaa 3360 gttgaaggac attggctttc aatggaagtt gaacttacaa cgaaaatgaa agagttgctg 3420 gatgactcgc atattccata tgaagaagga cagaatatat tggatgattt gcgggagatg 3480 aaagatataa caaccattgt gaatggtata ttggaaatct tctggttgac agtccagctt 3540 cggaatagca ggatagataa tccggattac gatagaatta tctcaccggt attgaataaa 3600 aatggagaat tttttgattc tgatgaatat aattcatata ttgatgcgca aaaggcaccg 3660 ttaccgatag atgccgatgc aaatggcgca ttttgcattg cattaaaagg aatgtatact 3720 gccaatcaga tcaaagaaaa ctgggttgaa ggggagaaac ttccggcgga ttgcttgaag 3780 atcgaacatg cgagttggtt agcatttatg caaggagaaa ggggatag 3828 <210> 5 <211> 1263 <212> PRT <213> Artificial Sequence <220> <223> engineered mgCas12a-1(K925Q) <400> 5 Met Asn Asn Gly Thr Asn Asn Phe Gln Asn Phe Ile Gly Ile Ser Ser 1 5 10 15 Leu Gln Lys Thr Leu Arg Asn Ala Leu Ile Pro Thr Glu Thr Thr Gln 20 25 30 Gln Phe Ile Val Lys Asn Gly Ile Ile Lys Glu Asp Glu Leu Arg Gly 35 40 45 Glu Asn Arg Gln Ile Leu Lys Asp Ile Met Asp Asp Tyr Tyr Arg Gly 50 55 60 Phe Ile Ser Glu Thr Leu Ser Ser Ile Asp Asp Ile Asp Trp Thr Ser 65 70 75 80 Leu Phe Glu Lys Met Glu Ile Gln Leu Lys Asn Gly Asp Asn Lys Asp 85 90 95 Thr Leu Ile Lys Glu Gln Ala Glu Lys Arg Lys Ala Ile Tyr Lys Lys 100 105 110 Phe Ala Asp Asp Asp Arg Phe Lys Asn Met Phe Ser Ala Lys Leu Ile 115 120 125 Ser Asp Ile Leu Pro Glu Phe Val Ile His Asn Asn Asn Tyr Ser Ala 130 135 140 Ser Glu Lys Glu Glu Lys Thr Gln Val Ile Lys Leu Phe Ser Arg Phe 145 150 155 160 Ala Thr Ser Phe Lys Asp Tyr Phe Lys Asn Arg Ala Asn Cys Phe Ser 165 170 175 Ala Asp Asp Ile Ser Ser Ser Ser Cys His Arg Ile Val Asn Asp Asn 180 185 190 Ala Glu Ile Phe Phe Ser Asn Ala Leu Val Tyr Arg Arg Ile Val Lys 195 200 205 Asn Leu Ser Asn Asp Asp Ile Asn Lys Ile Ser Gly Asp Ile Lys Asp 210 215 220 Ser Leu Lys Glu Met Ser Leu Glu Glu Ile Tyr Ser Tyr Glu Lys Tyr 225 230 235 240 Gly Glu Phe Ile Thr Gln Glu Gly Ile Ser Phe Tyr Asn Asp Ile Cys 245 250 255 Gly Lys Val Asn Ser Phe Met Asn Leu Tyr Cys Gln Lys Asn Lys Glu 260 265 270 Asn Lys Asn Leu Tyr Lys Leu Arg Lys Leu His Lys Gln Ile Leu Cys 275 280 285 Ile Ala Asp Thr Ser Tyr Glu Val Pro Tyr Lys Phe Glu Ser Asp Glu 290 295 300 Glu Val Tyr Gln Ser Val Asn Gly Phe Leu Asp Asn Ile Ser Ser Lys 305 310 315 320 His Ile Val Glu Arg Leu Arg Lys Ile Gly Asp Asn Tyr Asn Gly Tyr 325 330 335 Asn Leu Asp Lys Ile Tyr Ile Val Ser Lys Phe Tyr Glu Ser Val Ser 340 345 350 Gln Lys Thr Tyr Arg Asp Trp Glu Thr Ile Asn Thr Ala Leu Glu Ile 355 360 365 His Tyr Asn Asn Ile Leu Pro Gly Asn Gly Lys Ser Lys Ala Asp Lys 370 375 380 Val Lys Lys Ala Val Lys Asn Asp Leu Gln Lys Ser Ile Thr Glu Ile 385 390 395 400 Asn Glu Leu Val Ser Asn Tyr Lys Leu Cys Pro Asp Asp Asn Ile Lys 405 410 415 Ala Glu Thr Tyr Ile His Glu Ile Ser His Ile Leu Asn Asn Phe Glu 420 425 430 Ala Gln Glu Leu Lys Tyr Asn Pro Glu Ile His Leu Val Glu Ser Glu 435 440 445 Leu Lys Ala Ser Glu Leu Lys Asn Val Leu Asp Val Ile Met Asn Ala 450 455 460 Phe His Trp Cys Ser Val Phe Met Thr Glu Glu Leu Val Asp Lys Asp 465 470 475 480 Asn Asn Phe Tyr Ala Glu Leu Glu Glu Ile Tyr Asp Glu Ile Tyr Thr 485 490 495 Val Ile Ser Leu Tyr Asn Leu Val Arg Asn Tyr Val Thr Gln Lys Pro 500 505 510 Tyr Ser Thr Lys Lys Ile Lys Leu Asn Phe Gly Ile Pro Thr Leu Ala 515 520 525 Asp Gly Trp Ser Lys Ser Lys Glu Tyr Ser Asn Asn Ala Ile Ile Leu 530 535 540 Met Arg Asp Asn Leu Tyr Tyr Leu Gly Ile Phe Asn Ala Lys Asn Lys 545 550 555 560 Pro Asp Lys Lys Ile Ile Glu Gly Asn Thr Ser Glu Asn Lys Gly Asp 565 570 575 Tyr Lys Lys Met Ile Tyr Asn Leu Leu Pro Gly Pro Asn Lys Met Ile 580 585 590 Pro Lys Val Phe Leu Ser Ser Lys Thr Gly Val Glu Thr Tyr Lys Pro 595 600 605 Ser Ala Tyr Ile Leu Glu Gly Tyr Lys Gln Asn Lys His Leu Lys Ser 610 615 620 Ser Lys Asp Phe Asp Ile Thr Phe Cys His Asp Leu Ile Asp Tyr Phe 625 630 635 640 Lys Asn Cys Ile Ala Ile His Pro Glu Trp Lys Asn Phe Gly Phe Asp 645 650 655 Phe Ser Asp Thr Ser Thr Tyr Glu Asp Ile Ser Gly Phe Tyr Arg Glu 660 665 670 Val Glu Leu Gln Gly Tyr Lys Ile Asp Trp Thr Tyr Ile Ser Glu Lys 675 680 685 Asp Ile Asp Leu Leu Gln Glu Lys Gly Gln Leu Tyr Leu Phe Gln Ile 690 695 700 Tyr Asn Lys Asp Phe Ser Lys Lys Ser Thr Gly Asn Asp Asn Leu His 705 710 715 720 Thr Met Tyr Leu Lys Asn Leu Phe Ser Glu Glu Asn Leu Lys Asp Ile 725 730 735 Val Leu Lys Leu Asn Gly Glu Ala Glu Ile Phe Phe Arg Lys Ser Ser 740 745 750 Ile Lys Asn Pro Ile Ile His Lys Lys Gly Ser Ile Leu Val Asn Arg 755 760 765 Thr Tyr Glu Ala Glu Glu Lys Asp Gln Phe Gly Asn Ile Gln Ile Val 770 775 780 Arg Lys Thr Ile Pro Glu Asn Ile Tyr Gln Glu Leu Tyr Lys Tyr Phe 785 790 795 800 Asn Asp Lys Ser Asp Lys Glu Leu Ser Asp Glu Ala Ala Lys Leu Lys 805 810 815 Asn Val Val Gly His His Glu Ala Ala Thr Asn Ile Val Lys Asp Tyr 820 825 830 Arg Tyr Thr Tyr Asp Lys Tyr Phe Leu His Met Pro Ile Thr Ile Asn 835 840 845 Phe Lys Ala Asn Lys Thr Ser Phe Ile Asn Asp Arg Ile Leu Gln Tyr 850 855 860 Ile Ala Lys Glu Lys Asn Leu His Val Ile Gly Ile Asp Arg Gly Glu 865 870 875 880 Arg Asn Leu Ile Tyr Val Ser Val Ile Asp Thr Cys Gly Asn Ile Val 885 890 895 Glu Gln Lys Ser Phe Asn Ile Val Asn Gly Tyr Asp Tyr Gln Ile Lys 900 905 910 Leu Lys Gln Gln Glu Gly Ala Arg Gln Ile Ala Arg Gln Glu Trp Lys 915 920 925 Glu Ile Gly Lys Ile Lys Glu Ile Lys Glu Gly Tyr Leu Ser Leu Val 930 935 940 Ile His Glu Ile Ser Lys Met Val Ile Lys Tyr Asn Ala Ile Ile Ala 945 950 955 960 Met Glu Asp Leu Ser Tyr Gly Phe Lys Lys Gly Arg Phe Lys Val Glu 965 970 975 Arg Gln Val Tyr Gln Lys Phe Glu Thr Met Leu Ile Asn Lys Leu Asn 980 985 990 Tyr Leu Val Phe Lys Asp Ile Ser Ile Thr Glu Asn Gly Gly Leu Leu 995 1000 1005 Lys Gly Tyr Gln Leu Thr Tyr Ile Pro Asp Lys Leu Lys Asn Val Gly 1010 1015 1020 His Gln Cys Gly Cys Ile Phe Tyr Val Pro Ala Ala Tyr Thr Ser Lys 1025 1030 1035 1040 Ile Asp Pro Thr Thr Gly Phe Val Asn Ile Phe Lys Phe Lys Asp Leu 1045 1050 1055 Thr Val Asp Ala Lys Arg Glu Phe Ile Lys Lys Phe Asp Ser Ile Arg 1060 1065 1070 Tyr Asp Ser Glu Lys Lys Leu Phe Cys Phe Thr Phe Asp Tyr Asn Asn 1075 1080 1085 Phe Ile Thr Gln Asn Thr Val Met Ser Lys Ser Ser Trp Ser Val Tyr 1090 1095 1100 Thr Tyr Gly Val Arg Ile Lys Arg Arg Phe Val Asn Gly Arg Phe Ser 1105 1110 1115 1120 Asn Glu Ser Asp Thr Ile Asp Ile Thr Lys Asp Met Glu Lys Thr Leu 1125 1130 1135 Glu Met Thr Asp Ile Asn Trp Arg Asp Gly His Asp Leu Arg Gln Asp 1140 1145 1150 Ile Ile Asp Tyr Glu Ile Val Gln His Ile Phe Glu Ile Phe Arg Leu 1155 1160 1165 Thr Val Gln Met Arg Asn Ser Leu Ser Glu Leu Glu Asp Arg Asp Tyr 1170 1175 1180 Asp Arg Leu Ile Ser Pro Val Leu Asn Glu Asn Asn Ile Phe Tyr Asp 1185 1190 1195 1200 Ser Ala Lys Ala Gly Asp Ala Leu Pro Lys Asp Ala Asp Ala Asn Gly 1205 1210 1215 Ala Tyr Cys Ile Ala Leu Lys Gly Leu Tyr Glu Ile Lys Gln Ile Thr 1220 1225 1230 Glu Asn Trp Lys Glu Asp Gly Lys Phe Ser Arg Asp Lys Leu Lys Ile 1235 1240 1245 Ser Asn Lys Asp Trp Phe Asp Phe Ile Gln Asn Lys Arg Tyr Leu 1250 1255 1260 <210> 6 <211> 1275 <212> PRT <213> Artificial Sequence <220> <223> engineered mgCas12a-2(K930Q) <400> 6 Met Gly Lys Asn Gln Asn Phe Gln Glu Phe Ile Gly Val Ser Pro Leu 1 5 10 15 Gln Lys Thr Leu Arg Asn Glu Leu Ile Pro Thr Glu Thr Thr Lys Lys 20 25 30 Asn Ile Thr Gln Leu Asp Leu Leu Thr Glu Asp Glu Ile Arg Ala Gln 35 40 45 Asn Arg Glu Lys Leu Lys Glu Met Met Asp Asp Tyr Tyr Arg Asn Val 50 55 60 Ile Asp Ser Thr Leu His Val Gly Ile Ala Val Asp Trp Ser Tyr Leu 65 70 75 80 Phe Ser Cys Met Arg Asn His Leu Arg Glu Asn Ser Lys Glu Ser Lys 85 90 95 Arg Glu Leu Glu Arg Thr Gln Asp Ser Ile Arg Ser Gln Ile His Asn 100 105 110 Lys Phe Ala Glu Arg Ala Asp Phe Lys Asp Met Phe Gly Ala Ser Ile 115 120 125 Ile Thr Lys Leu Leu Pro Thr Tyr Ile Lys Gln Asn Ser Glu Tyr Ser 130 135 140 Glu Arg Tyr Asp Glu Ser Met Glu Ile Leu Lys Leu Tyr Gly Lys Phe 145 150 155 160 Thr Thr Ser Leu Thr Asp Tyr Phe Glu Thr Arg Lys Asn Ile Phe Ser 165 170 175 Lys Glu Lys Ile Ser Ser Ala Val Gly Tyr Arg Ile Val Glu Glu Asn 180 185 190 Ala Glu Ile Phe Leu Gln Asn Gln Asn Ala Tyr Asp Arg Ile Cys Lys 195 200 205 Ile Ala Gly Leu Asp Leu His Gly Leu Asp Asn Glu Ile Thr Ala Tyr 210 215 220 Val Asp Gly Lys Thr Leu Lys Glu Val Cys Ser Asp Glu Gly Phe Ala 225 230 235 240 Lys Ala Ile Thr Gln Glu Gly Ile Asp Arg Tyr Asn Glu Ala Ile Gly 245 250 255 Ala Val Asn Gln Tyr Met Asn Leu Leu Cys Gln Lys Asn Lys Ala Leu 260 265 270 Lys Pro Gly Gln Phe Lys Met Lys Arg Leu His Lys Gln Ile Leu Cys 275 280 285 Lys Gly Thr Thr Ser Phe Asp Ile Pro Lys Lys Phe Glu Asn Asp Lys 290 295 300 Gln Val Tyr Asp Ala Val Asn Ser Phe Thr Glu Ile Val Thr Lys Asn 305 310 315 320 Asn Asp Leu Lys Arg Leu Leu Asn Ile Thr Gln Asn Ala Asn Asp Tyr 325 330 335 Asp Met Asn Lys Ile Tyr Val Val Ala Asp Ala Tyr Ser Met Ile Ser 340 345 350 Gln Phe Ile Ser Lys Lys Trp Asn Leu Ile Glu Glu Cys Leu Leu Asp 355 360 365 Tyr Tyr Ser Asp Asn Leu Pro Gly Lys Gly Asn Ala Lys Glu Asn Lys 370 375 380 Val Lys Lys Ala Val Lys Glu Glu Thr Tyr Arg Ser Val Ser Gln Leu 385 390 395 400 Asn Glu Val Ile Glu Lys Tyr Tyr Val Glu Lys Thr Gly Gln Ser Val 405 410 415 Trp Lys Val Glu Ser Tyr Ile Ser Ser Leu Ala Glu Met Ile Lys Leu 420 425 430 Glu Leu Cys His Glu Ile Asp Asn Asp Glu Lys His Asn Leu Ile Glu 435 440 445 Asp Asp Glu Lys Ile Ser Glu Ile Lys Glu Leu Leu Asp Met Tyr Met 450 455 460 Asp Val Phe His Ile Ile Lys Val Phe Arg Val Asn Glu Val Leu Asn 465 470 475 480 Phe Asp Glu Thr Phe Tyr Ser Glu Met Asp Glu Ile Tyr Gln Asp Met 485 490 495 Gln Glu Ile Val Pro Leu Tyr Asn His Val Arg Asn Tyr Val Thr Gln 500 505 510 Lys Pro Tyr Lys Gln Glu Lys Tyr Arg Leu Tyr Phe His Thr Pro Thr 515 520 525 Leu Ala Asn Gly Trp Ser Lys Ser Lys Glu Tyr Asp Asn Asn Ala Ile 530 535 540 Ile Leu Val Arg Glu Asp Lys Tyr Tyr Leu Gly Ile Leu Asn Ala Lys 545 550 555 560 Lys Lys Pro Ser Lys Glu Ile Met Ala Gly Lys Glu Asp Cys Ser Glu 565 570 575 His Ala Tyr Ala Lys Met Asn Tyr Tyr Leu Leu Pro Gly Ala Asn Lys 580 585 590 Met Leu Pro Lys Val Phe Leu Ser Lys Lys Gly Ile Gln Asp Tyr His 595 600 605 Pro Ser Ser Tyr Ile Val Glu Gly Tyr Asn Glu Lys Lys His Ile Lys 610 615 620 Gly Ser Lys Asn Phe Asp Ile Arg Phe Cys Arg Asp Leu Ile Asp Tyr 625 630 635 640 Phe Lys Glu Cys Ile Lys Lys His Pro Asp Trp Asn Lys Phe Asn Phe 645 650 655 Glu Phe Ser Ala Thr Glu Thr Tyr Glu Asp Ile Ser Val Phe Tyr Arg 660 665 670 Glu Val Glu Lys Gln Gly Tyr Arg Val Glu Trp Thr Tyr Ile Asn Ser 675 680 685 Glu Asp Ile Gln Lys Leu Glu Glu Asp Gly Gln Leu Phe Leu Phe Gln 690 695 700 Ile Tyr Asn Lys Asp Phe Ala Val Gly Ser Thr Gly Lys Pro Asn Leu 705 710 715 720 His Thr Leu Tyr Leu Lys Asn Leu Phe Ser Glu Glu Asn Leu Arg Asp 725 730 735 Ile Val Leu Lys Leu Asn Gly Glu Ala Glu Ile Phe Phe Arg Lys Ser 740 745 750 Ser Val Gln Lys Pro Val Ile His Lys Cys Gly Ser Ile Leu Val Asn 755 760 765 Arg Thr Tyr Glu Ile Thr Glu Ser Gly Thr Thr Arg Val Gln Ser Ile 770 775 780 Pro Glu Ser Glu Tyr Met Glu Leu Tyr Arg Tyr Phe Asn Ser Glu Lys 785 790 795 800 Gln Ile Glu Leu Ser Asp Glu Ala Lys Lys Tyr Leu Asp Lys Val Gln 805 810 815 Cys Asn Lys Ala Lys Thr Asp Ile Val Lys Asp Tyr Arg Tyr Thr Met 820 825 830 Asp Lys Phe Phe Ile His Leu Pro Ile Thr Ile Asn Phe Lys Val Asp 835 840 845 Lys Gly Asn Asn Val Asn Ala Ile Ala Gln Gln Tyr Ile Ala Gly Arg 850 855 860 Lys Asp Leu His Val Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Ile 865 870 875 880 Tyr Val Ser Val Ile Asp Met Tyr Gly Arg Ile Leu Glu Gln Lys Ser 885 890 895 Phe Asn Leu Val Glu Gln Val Ser Ser Gln Gly Thr Lys Arg Tyr Tyr 900 905 910 Asp Tyr Lys Glu Lys Leu Gln Asn Arg Glu Glu Glu Arg Asp Lys Ala 915 920 925 Arg Gln Ser Trp Lys Thr Ile Gly Lys Ile Lys Glu Leu Lys Glu Gly 930 935 940 Tyr Leu Ser Ser Val Ile His Glu Ile Ala Gln Met Val Val Lys Tyr 945 950 955 960 Asn Ala Ile Ile Ala Met Glu Asp Leu Asn Tyr Gly Phe Lys Arg Gly 965 970 975 Arg Phe Lys Val Glu Arg Gln Val Tyr Gln Lys Phe Glu Thr Met Leu 980 985 990 Ile Ser Lys Leu Asn Tyr Leu Ala Asp Lys Ser Gln Ala Val Asp Glu 995 1000 1005 Pro Gly Gly Ile Leu Arg Gly Tyr Gln Met Thr Tyr Val Pro Asp Asn 1010 1015 1020 Ile Lys Asn Val Gly Arg Gln Cys Gly Ile Ile Phe Tyr Val Pro Ala 1025 1030 1035 1040 Ala Tyr Thr Ser Lys Ile Asp Pro Thr Thr Gly Phe Ile Asn Ala Phe 1045 1050 1055 Lys Arg Asp Val Val Ser Thr Asn Asp Ala Lys Glu Asn Phe Leu Met 1060 1065 1070 Lys Phe Asp Ser Ile Gln Tyr Asp Ile Glu Lys Gly Leu Phe Lys Phe 1075 1080 1085 Ser Phe Asp Tyr Lys Asn Phe Ala Thr His Lys Leu Thr Leu Ala Lys 1090 1095 1100 Thr Lys Trp Asp Val Tyr Thr Asn Gly Thr Arg Ile Gln Asn Met Lys 1105 1110 1115 1120 Val Glu Gly His Trp Leu Ser Met Glu Val Glu Leu Thr Thr Lys Met 1125 1130 1135 Lys Glu Leu Leu Asp Asp Ser His Ile Pro Tyr Glu Glu Gly Gln Asn 1140 1145 1150 Ile Leu Asp Asp Leu Arg Glu Met Lys Asp Ile Thr Thr Ile Val Asn 1155 1160 1165 Gly Ile Leu Glu Ile Phe Trp Leu Thr Val Gln Leu Arg Asn Ser Arg 1170 1175 1180 Ile Asp Asn Pro Asp Tyr Asp Arg Ile Ile Ser Pro Val Leu Asn Lys 1185 1190 1195 1200 Asn Gly Glu Phe Phe Asp Ser Asp Glu Tyr Asn Ser Tyr Ile Asp Ala 1205 1210 1215 Gln Lys Ala Pro Leu Pro Ile Asp Ala Asp Ala Asn Gly Ala Phe Cys 1220 1225 1230 Ile Ala Leu Lys Gly Met Tyr Thr Ala Asn Gln Ile Lys Glu Asn Trp 1235 1240 1245 Val Glu Gly Glu Lys Leu Pro Ala Asp Cys Leu Lys Ile Glu His Ala 1250 1255 1260 Ser Trp Leu Ala Phe Met Gln Gly Glu Arg Gly 1265 1270 1275 <210> 7 <211> 3789 <212> DNA <213> Artificial Sequence <220> <223> human codon optimized engineered mgCas12a-1 <400> 7 atgaacaatg gcaccaacaa tttccagaac tttatcggaa ttagcagtct gcaaaagact 60 ctccggaatg cccttatacc caccgagaca acccagcagt tcatcgtgaa aaacgggatt 120 atcaaggaag acgagctgcg cggcgaaaat cggcaaattt tgaaagatat aatggacgat 180 tattaccgcg gttttatctc tgagactctg agctccattg acgatatcga ctggacctca 240 ctcttcgaaa agatggagat tcagcttaaa aacggcgata ataaggacac actgataaaa 300 gaacaggctg agaagcggaa agccatctat aagaaatttg cagatgacga tcgcttcaag 360 aacatgttta gcgccaaatt gattagtgac atcctgccgg aattcgttat tcacaataac 420 aattactctg ctagcgagaa ggaagagaaa acccaagtca taaagctctt ttcccggttc 480 gccacttcat ttaaagatta tttcaagaac cgcgcaaatt gctttagcgc cgacgatatc 540 agttctagct cctgtcatcg gattgtgaac gacaatgctg aaatcttctt ttcaaacgcc 600 cttgtatacc gccggattgt gaaaaatctg agcaacgatg acataaataa gatcagtgga 660 gatattaaag actctttgaa ggagatgagc ctggaagaga tctattccta cgaaaaatat 720 ggggagttca ttacccagga aggcatatca ttttacaacg atatctgcgg taaggttaat 780 agcttcatga acctctattg tcagaaaaat aaggagaaca aaaatcttta caagctgcgc 840 aaattgcaca agcaaattct gtgcatcgca gacacaagtt atgaagtccc ttacaaattt 900 gagtctgatg aagaggtgta tcagagcgta aacggcttcc tcgacaatat ttcctcaaag 960 catatagtgg aacggcttcg caaaatcgga gataactaca atgggtataa cctggacaag 1020 atttacatcg ttagcaaatt ttatgagagt gtctctcaga agacctaccg ggattgggaa 1080 actattaata ccgccttgga gatacactat aacaatatcc tgcccggcaa cggtaaaagc 1140 aaggctgaca aagtgaagaa agccgtaaag aatgatctcc aaaaatccat tacagaaatc 1200 aacgagcttg tgtcaaatta caagctgtgt ccggacgata acattaaagc agaaacctat 1260 atacatgaga tcagccacat tttgaataac ttcgaagccc aggagctgaa gtacaatcca 1320 gaaatccatc tcgttgagag tgaacttaaa gcttctgagc tgaagaacgt cttggacgtg 1380 attatgaatg cctttcactg gtgcagcgta ttcatgactg aagagctggt ggataaagac 1440 aacaattttt atgcagaact cgaggaaata tacgatgaga tctataccgt tatttccctt 1500 tacaacctgg tccgcaatta tgtgacacag aagccctact caaccaaaaa gatcaaattg 1560 aacttcggca ttccgactct ggccgacgga tggagcaaga gtaaagaata ttctaataac 1620 gctataatcc tcatgcggga taatctttac tatctgggga tttttaacgc caagaataaa 1680 cctgacaaga aaatcattga gggcaacacc agcgaaaata agggtgatta caaaaagatg 1740 atatataact tgctgcccgg cccgaataaa atgatcccaa aggtattcct ctcctcaaaa 1800 acaggagtgg agacctacaa gcccagcgca tatattcttg aagggtacaa acaaaacaag 1860 catctgaaaa gttctaagga ctttgatatc actttctgtc acgacttgat tgattatttt 1920 aaaaattgca tagccatcca tccggagtgg aagaacttcg gctttgactt cagcgatacc 1980 tccacatacg aagacatttc aggtttttat cgcgaggttg aactgcaggg ctacaaaatc 2040 gattggacct atattagcga gaaggacata gatctccttc aggaaaaagg acaactgtac 2100 ttgttccaga tctataataa ggactttagt aaaaagtcta ctgggaacga taatctgcac 2160 accatgtacc tcaaaaacct tttcagcgag gaaaatctga aggacattgt cttgaaactg 2220 aacggcgagg ctgaaatctt tttccggaag tcctcaatta aaaatcctat aatccataag 2280 aaaggtagca ttctcgtgaa ccgcacatat gaggccgaag agaaggatca gtttggcaat 2340 atccaaattg tacggaaaac catacccgaa aacatctacc aggagcttta taagtacttc 2400 aatgacaaaa gtgataagga actgtctgac gaggcagcca aattgaagaa cgtggttgga 2460 caccatgaag ctgccactaa tattgtcaaa gattatcgct acacctatga caagtacttt 2520 ctgcacatgc cgatcacaat taacttcaaa gcaaataaga ccagctttat aaacgatcgg 2580 attctccagt atattgccaa agagaagaat cttcatgtga tcgggattga ccgcggcgaa 2640 cggaacctga tatacgtatc cgtgatcgat acttgtggta atattgttga gcaaaaatca 2700 ttcaacatcg tcaatggcta tgactaccag attaagttga aacagcaaga aggagctcgc 2760 cagatagccc ggcaggagtg gaaggaaatc gggaaaatta aggagatcaa agaaggctat 2820 ctgagcctcg tgattcacga gataagtaag atggtaatca aatacaacgc aattatcgcc 2880 atggaagatc tttcttatgg ttttaagaaa ggccgcttca aggtggagcg gcaagtttac 2940 cagaaatttg aaaccatgct gattaataag ttgaactatc tggtcttcaa agacataagc 3000 atcacagaga atggagggct ccttaagggc taccagctga cctatattcc agataaattg 3060 aagaacgtgg gtcatcaatg cggctgtatc ttttacgtac ccgctgccta tacttccaaa 3120 attgacccga ccacaggatt cgtgaatata tttaagttca aagatctgac cgttgacgca 3180 aagcgcgaat ttatcaaaaa gttcgattca attcggtacg acagcgagaa aaagctcttt 3240 tgcttcactt ttgattataa caatttcatc acccagaaca cagtcatgag taaatctagc 3300 tggtccgtgt acacctatgg ggtacgcatt aagcggcgct ttgtgaatgg ccggttctca 3360 aacgaaagcg acactataga tatcaccaaa gacatggaga agacacttga aatgaccgat 3420 attaattggc gcgacggtca cgatctgcgg caggacatca ttgattacga gatagttcaa 3480 catatctttg aaattttccg cttgactgtc cagatgcgga acagtctgtc tgagctcgaa 3540 gaccgcgatt atgaccggct tatcagccct gtgctgaatg agaacaatat tttttacgat 3600 tccgccaaag ctggcgacgc cttgcccaag gatgcagacg ccaacggagc ttattgtata 3660 gccctgaaag ggctctacga aatcaagcag attaccgaga attggaaaga agatggcaag 3720 ttctcacgcg acaaacttaa gatcagcaac aaagattggt ttgacttcat tcaaaataag 3780 cggtatctg 3789 <210> 8 <211> 3825 <212> DNA <213> Artificial Sequence <220> <223> human codon optimized engineered mgCas12a-2 <400> 8 atgggcaaaa accaaaattt ccaagaattt atcggagtga gccccctgca gaagaccctc 60 cggaacgagc ttattccgac tgagaccaca aagaaaaata taacccagct ggacttgctg 120 actgaagatg agatccgcgc ccagaaccgg gaaaagctca aagagatgat ggacgattat 180 taccgcaatg ttattgacag tacccttcac gtcgggatcg ctgtggattg gtcttatctg 240 ttcagctgca tgcggaacca tttgcgcgaa aattccaagg agtcaaaacg ggaactggag 300 cgcacacagg acagcattcg gagtcagata cacaacaagt ttgccgaacg cgcagatttc 360 aaagacatgt ttggcgcctc tatcattacc aagctccttc ctacttacat caaacaaaat 420 agcgagtatt ccgaacggta cgatgagtca atggaaattc tgaagttgta tggtaaattc 480 accacaagcc tgaccgacta ctttgagact cgcaagaaca tattcagtaa agaaaagatc 540 tctagcgctg taggctatcg gattgtggag gaaaatgccg agatctttct ccagaaccag 600 aatgcatacg atcgcatttg taaaatagcc ggacttgacc tgcatgggtt ggataacgaa 660 atcaccgctt atgttgacgg caagacactg aaagaggtct gctccgatga aggtttcgcc 720 aaggcaatta cccaagaggg catcgaccgg tacaatgaag ccattggagc tgtgaaccag 780 tatatgaatc tcctttgtca gaaaaacaag gccctgaaac ccgggcaatt taagatgaaa 840 cgcttgcaca agcagatact gtgcaaaggc actacctcat tcgatatccc gaagaaattt 900 gagaatgaca agcaggtata cgatgcagtg aacagcttca cagaaattgt taccaaaaat 960 aacgacctca agcggcttct gaatatcact caaaacgcca atgattatga catgaacaaa 1020 atttacgtcg tggctgatgc ctatagtatg atatctcagt ttatcagcaa gaaatggaat 1080 ttgattgagg aatgtctgct cgactactat tccgataacc ttccaggtaa gggcaatgca 1140 aaagagaaca aggtaaaaaa ggccgtgaaa gaagagacct accgctcagt tagccagctg 1200 aatgaagtca tcgagaagta ttacgtggaa aaaacaggac aaagtgtatg gaaggtggag 1260 tcttatatta gctccttggc tgaaatgata aaactggagc tctgccatga aatcgacaac 1320 gatgagaagc acaatcttat tgaagacgat gagaaaatct cagaaattaa ggagctgttg 1380 gacatgtaca tggatgtttt ccatataatc aaagtctttc gggtgaacga agtactgaat 1440 ttcgacgaga ccttttatag cgaaatggat gagatttacc aggacatgca ggaaatcgtg 1500 cccctctata accacgttcg caattacgtc actcaaaagc cgtataaaca ggagaagtac 1560 cggctttatt tccatacccc tacactggcc aacgggtgga gtaaatctaa ggaatacgat 1620 aataacgcaa ttatattggt gcgcgaggac aaatattacc tgggcatcct caatgccaag 1680 aaaaagccca gcaaagaaat tatggctggt aaggaggatt gttccgaaca cgcctatgca 1740 aaaatgaact actatcttct gccgggcgcc aataagatgt tgccaaaagt atttctgtca 1800 aagaaaggaa tccaggacta ccatcccagc agttatattg tggaggggta caacgaaaag 1860 aaacacataa agggctctaa aaatttcgat atccggtttt gccgcgacct cattgattat 1920 ttcaaggagt gtatcaaaaa gcatccggac tggaacaaat ttaatttcga atttagcgct 1980 accgagactt acgaagatat ttccgttttc tatcgggagg tcgaaaagca aggttaccgc 2040 gtggagtgga cctatataaa ctcagaagac atccagaaac ttgaggaaga tggccagctg 2100 tttttgttcc aaatttacaa taaggacttt gccgtaggaa gcacagggaa acctaacctg 2160 cacaccctct atcttaagaa tctgttcagt gaggaaaact tgcgggatat cgtgctgaaa 2220 ctcaatggcg aggcagaaat ttttttccgc aagtctagcg ttcagaaacc cgtcatacat 2280 aagtgcggtt ccatccttgt gaaccggact tacgagatta ccgaatcagg cacaacccgc 2340 gtacagagca tcccggagag tgaatatatg gagctgtacc ggtattttaa ttctgaaaaa 2400 caaattgagt tgagcgacga agccaagaaa tacctggata aggtgcagtg taacaaagct 2460 aagactgaca tagttaaaga ttatcgctac accatggaca agttctttat ccacctccca 2520 attacaatca atttcaaagt cgataaggga aacaatgtga acgccattgc acagcaatat 2580 atagccgggc ggaaagacct tcatgtaatc ggcattgatc gcggtgagcg gaatctgatc 2640 tacgtgtccg ttattgacat gtatggccgc atattggaac agaagtcatt taacctggtc 2700 gagcaggtga gcagtcaagg aaccaaacgg tactatgatt acaaggaaaa actccagaat 2760 cgcgaggaag agcgggacaa ggctcgccag tcttggaaaa ctatcgggaa gattaaagaa 2820 cttaaggagg gctatctgag ctccgtaatc cacgaaattg cccaaatggt ggttaaatac 2880 aacgcaataa tcgccatgga ggatttgaat tatggtttca agcggggccg ctttaaagtc 2940 gaacggcagg tgtaccagaa gttcgagacc atgctgattt caaaactcaa ctatcttgct 3000 gacaagagcc aagccgtaga tgaacccgga gggattctgc gcggctacca gatgacatat 3060 gtgccggaca atattaaaaa cgttggtcgg cagtgcggca taatctttta cgtccctgca 3120 gcctatacca gtaagattga tcccactacc ggattcatca atgcttttaa acgcgacgtg 3180 gtatctacaa acgatgccaa ggagaatttc ttgatgaaat ttgacagcat tcaatacgat 3240 atagaaaagg ggctgttcaa attttccttc gactataaga actttgcaac ccataaactc 3300 actcttgcca agaccaaatg ggatgtgtac acaaatggca cccggattca gaacatgaag 3360 gttgagggtc actggctgtc aatggaagtc gagttgacta ccaaaatgaa ggaactgctc 3420 gacgatagcc atattccgta tgaggaaggc cagaatatcc ttgacgatct gcgcgagatg 3480 aaagacatta caaccatagt gaacggaatc ttggaaattt tctggctgac tgtacaactc 3540 cggaatagtc gcatcgataa cccagactac gatcggatta tatctcccgt gcttaataag 3600 aacggggagt ttttcgacag cgatgaatat aattcctaca tcgacgctca gaaagccccg 3660 ctgcctattg atgcagacgc caacggcgct ttttgtatcg ccttgaaggg tatgtatacc 3720 gcaaatcaga ttaaagagaa ctgggttgaa ggcgagaagc tgcccgccga ttgcctcaaa 3780 atagaacacg cttcatggct tgccttcatg caaggagagc gcggg 3825 <210> 9 <211> 1307 <212> PRT <213> Artificial Sequence <220> <223> AsCas12a <400> 9 Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr 1 5 10 15 Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln 20 25 30 Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys 35 40 45 Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln 50 55 60 Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile 65 70 75 80 Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile 85 90 95 Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly 100 105 110 Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile 115 120 125 Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys 130 135 140 Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg 145 150 155 160 Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg 165 170 175 Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg 180 185 190 Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe 195 200 205 Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn 210 215 220 Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val 225 230 235 240 Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp 245 250 255 Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu 260 265 270 Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn 275 280 285 Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro 290 295 300 Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu 305 310 315 320 Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr 325 330 335 Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu 340 345 350 Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His 355 360 365 Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr 370 375 380 Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys 385 390 395 400 Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu 405 410 415 Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser 420 425 430 Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala 435 440 445 Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys 450 455 460 Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu 465 470 475 480 Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe 485 490 495 Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser 500 505 510 Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val 515 520 525 Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp 530 535 540 Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn 545 550 555 560 Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys 565 570 575 Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys 580 585 590 Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys 595 600 605 Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr 610 615 620 Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys 625 630 635 640 Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln 645 650 655 Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala 660 665 670 Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr 675 680 685 Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr 690 695 700 Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His 705 710 715 720 Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu 725 730 735 Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys 740 745 750 Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu 755 760 765 Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln 770 775 780 Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His 785 790 795 800 Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr 805 810 815 Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His 820 825 830 Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn 835 840 845 Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe 850 855 860 Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln 865 870 875 880 Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu 885 890 895 Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg 900 905 910 Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu 915 920 925 Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu 930 935 940 Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val 945 950 955 960 Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile 965 970 975 His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu 980 985 990 Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu 995 1000 1005 Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn 1010 1015 1020 Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu 1025 1030 1035 1040 Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly 1045 1050 1055 Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys 1060 1065 1070 Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile 1075 1080 1085 Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu 1090 1095 1100 His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn 1105 1110 1115 1120 Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp 1125 1130 1135 Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr 1140 1145 1150 Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His Arg 1155 1160 1165 Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala 1170 1175 1180 Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu 1185 1190 1195 1200 Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val 1205 1210 1215 Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr 1220 1225 1230 Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys 1235 1240 1245 Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala 1250 1255 1260 Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His 1265 1270 1275 1280 Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln 1285 1290 1295 Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn 1300 1305 <210> 10 <211> 1228 <212> PRT <213> Artificial Sequence <220> <223> LbCas12a <400> 10 Ala Ala Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys 1 5 10 15 Thr Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile 20 25 30 Asp Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr 35 40 45 Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn 50 55 60 Asp Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser 65 70 75 80 Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu 85 90 95 Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly 100 105 110 Ala Ala Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile 115 120 125 Leu Pro Glu Ala Ala Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser 130 135 140 Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu 145 150 155 160 Asn Xaa Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys 165 170 175 Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Xaa Asp Ile Phe Glu 180 185 190 Lys Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu 195 200 205 Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu 210 215 220 Phe Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala 225 230 235 240 Ile Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu 245 250 255 Asn Glu Tyr Ile Asn Leu Tyr Asn Ala Lys Thr Lys Gln Ala Leu Pro 260 265 270 Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu 275 280 285 Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val 290 295 300 Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys 305 310 315 320 Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly 325 330 335 Ile Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile 340 345 350 Phe Gly Glu Trp Asn Leu Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp 355 360 365 Asp Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp 370 375 380 Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln 385 390 395 400 Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys 405 410 415 Glu Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser 420 425 430 Ser Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys 435 440 445 Lys Asn Asp Ala Val Val Ala Ile Xaa Lys Asp Leu Leu Asp Ser Val 450 455 460 Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu 465 470 475 480 Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp 485 490 495 Ile Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val 500 505 510 Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn 515 520 525 Pro Gln Phe Xaa Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg 530 535 540 Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Xaa Asp 545 550 555 560 Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn 565 570 575 Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys 580 585 590 Xaa Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Xaa Ala Tyr Tyr Asn 595 600 605 Pro Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys 610 615 620 Gly Asp Xaa Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe 625 630 635 640 Lys Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe 645 650 655 Asn Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg 660 665 670 Glu Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys 675 680 685 Lys Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Xaa Phe Gln 690 695 700 Ile Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu 705 710 715 720 His Thr Xaa Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln 725 730 735 Ile Arg Leu Ser Gly Gly Ala Glu Leu Phe Xaa Arg Arg Ala Ser Leu 740 745 750 Lys Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn 755 760 765 Lys Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val 770 775 780 Tyr Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro 785 790 795 800 Ile Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu 805 810 815 Val Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile 820 825 830 Asp Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys 835 840 845 Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe 850 855 860 Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys 865 870 875 880 Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn 885 890 895 Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile 900 905 910 Cys Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Glu Asp Leu 915 920 925 Asn Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr 930 935 940 Gln Lys Phe Glu Lys Xaa Leu Ile Asp Lys Leu Asn Tyr Xaa Val Asp 945 950 955 960 Lys Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln 965 970 975 Ile Thr Asn Lys Phe Glu Ser Phe Lys Ser Xaa Ser Thr Gln Asn Gly 980 985 990 Phe Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser 995 1000 1005 Thr Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp 1010 1015 1020 Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Xaa Tyr Val Pro Glu 1025 1030 1035 1040 Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr 1045 1050 1055 Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn Arg 1060 1065 1070 Ile Arg Ile Phe Ala Ala Ala Lys Lys Asn Asn Val Phe Ala Trp Glu 1075 1080 1085 Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn Lys Tyr Gly 1090 1095 1100 Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu Cys Glu Gln Ser 1105 1110 1115 1120 Asp Lys Ala Phe Tyr Ser Ser Phe Xaa Ala Leu Xaa Ser Leu Xaa Leu 1125 1130 1135 Gln Xaa Arg Asn Ser Ile Thr Gly Arg Thr Asp Val Asp Phe Leu Ile 1140 1145 1150 Ser Pro Val Lys Asn Ser Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr 1155 1160 1165 Glu Ala Gln Glu Asn Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly 1170 1175 1180 Ala Tyr Asn Ile Ala Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys 1185 1190 1195 1200 Lys Ala Glu Asp Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn 1205 1210 1215 Lys Glu Trp Leu Glu Tyr Ala Gln Thr Ser Val Lys 1220 1225 <210> 11 <211> 1300 <212> PRT <213> Artificial Sequence <220> <223> FnCas12a <400> 11 Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr 1 5 10 15 Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys 20 25 30 Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys 35 40 45 Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu 50 55 60 Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser 65 70 75 80 Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys 85 90 95 Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr 100 105 110 Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile 115 120 125 Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln 130 135 140 Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr 145 150 155 160 Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr 165 170 175 Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser 180 185 190 Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu 195 200 205 Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys 210 215 220 Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu 225 230 235 240 Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg 245 250 255 Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr 260 265 270 Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys 275 280 285 Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile 290 295 300 Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys 305 310 315 320 Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser 325 330 335 Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met 340 345 350 Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys 355 360 365 Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln 370 375 380 Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr 385 390 395 400 Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala 405 410 415 Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn 420 425 430 Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala 435 440 445 Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn 450 455 460 Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala 465 470 475 480 Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys 485 490 495 Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys 500 505 510 Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp 515 520 525 Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His 530 535 540 Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His 545 550 555 560 Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val 565 570 575 Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser 580 585 590 Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly 595 600 605 Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys 610 615 620 Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile 625 630 635 640 Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys 645 650 655 Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val 660 665 670 Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile 675 680 685 Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln 690 695 700 Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe 705 710 715 720 Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp 725 730 735 Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu 740 745 750 Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn 755 760 765 Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr 770 775 780 Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg 785 790 795 800 Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn 805 810 815 Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr 820 825 830 Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala 835 840 845 Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu 850 855 860 Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe 865 870 875 880 His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe 885 890 895 Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His 900 905 910 Ile Leu Ser Ile Asp Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu 915 920 925 Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile 930 935 940 Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile 945 950 955 960 Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn 965 970 975 Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile 980 985 990 Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu 995 1000 1005 Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val Tyr 1010 1015 1020 Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu Val Phe 1025 1030 1035 1040 Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg Ala Tyr Gln 1045 1050 1055 Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly Lys Gln Thr Gly 1060 1065 1070 Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser Lys Ile Cys Pro Val 1075 1080 1085 Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys Tyr Glu Ser Val Ser Lys 1090 1095 1100 Ser Gln Glu Phe Phe Ser Lys Phe Asp Lys Ile Cys Tyr Asn Leu Asp 1105 1110 1115 1120 Lys Gly Tyr Phe Glu Phe Ser Phe Asp Tyr Lys Asn Phe Gly Asp Lys 1125 1130 1135 Ala Ala Lys Gly Lys Trp Thr Ile Ala Ser Phe Gly Ser Arg Leu Ile 1140 1145 1150 Asn Phe Arg Asn Ser Asp Lys Asn His Asn Trp Asp Thr Arg Glu Val 1155 1160 1165 Tyr Pro Thr Lys Glu Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu 1170 1175 1180 Tyr Gly His Gly Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp 1185 1190 1195 1200 Lys Lys Phe Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln 1205 1210 1215 Met Arg Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro 1220 1225 1230 Val Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys 1235 1240 1245 Asn Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly Leu 1250 1255 1260 Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu Gly Lys 1265 1270 1275 1280 Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu Phe Val Gln 1285 1290 1295 Asn Arg Asn Asn 1300 <210> 12 <211> 19 <212> RNA <213> Artificial Sequence <220> <223> 5'-handle RNA <400> 12 aauuucuacu guuguagau 19 <210> 13 <211> 1263 <212> PRT <213> Artificial Sequence <220> <223> d_mgCas12a-1 <400> 13 Met Asn Asn Gly Thr Asn Asn Phe Gln Asn Phe Ile Gly Ile Ser Ser 1 5 10 15 Leu Gln Lys Thr Leu Arg Asn Ala Leu Ile Pro Thr Glu Thr Thr Gln 20 25 30 Gln Phe Ile Val Lys Asn Gly Ile Ile Lys Glu Asp Glu Leu Arg Gly 35 40 45 Glu Asn Arg Gln Ile Leu Lys Asp Ile Met Asp Asp Tyr Tyr Arg Gly 50 55 60 Phe Ile Ser Glu Thr Leu Ser Ser Ile Asp Asp Ile Asp Trp Thr Ser 65 70 75 80 Leu Phe Glu Lys Met Glu Ile Gln Leu Lys Asn Gly Asp Asn Lys Asp 85 90 95 Thr Leu Ile Lys Glu Gln Ala Glu Lys Arg Lys Ala Ile Tyr Lys Lys 100 105 110 Phe Ala Asp Asp Asp Arg Phe Lys Asn Met Phe Ser Ala Lys Leu Ile 115 120 125 Ser Asp Ile Leu Pro Glu Phe Val Ile His Asn Asn Asn Tyr Ser Ala 130 135 140 Ser Glu Lys Glu Glu Lys Thr Gln Val Ile Lys Leu Phe Ser Arg Phe 145 150 155 160 Ala Thr Ser Phe Lys Asp Tyr Phe Lys Asn Arg Ala Asn Cys Phe Ser 165 170 175 Ala Asp Asp Ile Ser Ser Ser Ser Cys His Arg Ile Val Asn Asp Asn 180 185 190 Ala Glu Ile Phe Phe Ser Asn Ala Leu Val Tyr Arg Arg Ile Val Lys 195 200 205 Asn Leu Ser Asn Asp Asp Ile Asn Lys Ile Ser Gly Asp Ile Lys Asp 210 215 220 Ser Leu Lys Glu Met Ser Leu Glu Glu Ile Tyr Ser Tyr Glu Lys Tyr 225 230 235 240 Gly Glu Phe Ile Thr Gln Glu Gly Ile Ser Phe Tyr Asn Asp Ile Cys 245 250 255 Gly Lys Val Asn Ser Phe Met Asn Leu Tyr Cys Gln Lys Asn Lys Glu 260 265 270 Asn Lys Asn Leu Tyr Lys Leu Arg Lys Leu His Lys Gln Ile Leu Cys 275 280 285 Ile Ala Asp Thr Ser Tyr Glu Val Pro Tyr Lys Phe Glu Ser Asp Glu 290 295 300 Glu Val Tyr Gln Ser Val Asn Gly Phe Leu Asp Asn Ile Ser Ser Lys 305 310 315 320 His Ile Val Glu Arg Leu Arg Lys Ile Gly Asp Asn Tyr Asn Gly Tyr 325 330 335 Asn Leu Asp Lys Ile Tyr Ile Val Ser Lys Phe Tyr Glu Ser Val Ser 340 345 350 Gln Lys Thr Tyr Arg Asp Trp Glu Thr Ile Asn Thr Ala Leu Glu Ile 355 360 365 His Tyr Asn Asn Ile Leu Pro Gly Asn Gly Lys Ser Lys Ala Asp Lys 370 375 380 Val Lys Lys Ala Val Lys Asn Asp Leu Gln Lys Ser Ile Thr Glu Ile 385 390 395 400 Asn Glu Leu Val Ser Asn Tyr Lys Leu Cys Pro Asp Asp Asn Ile Lys 405 410 415 Ala Glu Thr Tyr Ile His Glu Ile Ser His Ile Leu Asn Asn Phe Glu 420 425 430 Ala Gln Glu Leu Lys Tyr Asn Pro Glu Ile His Leu Val Glu Ser Glu 435 440 445 Leu Lys Ala Ser Glu Leu Lys Asn Val Leu Asp Val Ile Met Asn Ala 450 455 460 Phe His Trp Cys Ser Val Phe Met Thr Glu Glu Leu Val Asp Lys Asp 465 470 475 480 Asn Asn Phe Tyr Ala Glu Leu Glu Glu Ile Tyr Asp Glu Ile Tyr Thr 485 490 495 Val Ile Ser Leu Tyr Asn Leu Val Arg Asn Tyr Val Thr Gln Lys Pro 500 505 510 Tyr Ser Thr Lys Lys Ile Lys Leu Asn Phe Gly Ile Pro Thr Leu Ala 515 520 525 Asp Gly Trp Ser Lys Ser Lys Glu Tyr Ser Asn Asn Ala Ile Ile Leu 530 535 540 Met Arg Asp Asn Leu Tyr Tyr Leu Gly Ile Phe Asn Ala Lys Asn Lys 545 550 555 560 Pro Asp Lys Lys Ile Ile Glu Gly Asn Thr Ser Glu Asn Lys Gly Asp 565 570 575 Tyr Lys Lys Met Ile Tyr Asn Leu Leu Pro Gly Pro Asn Lys Met Ile 580 585 590 Pro Lys Val Phe Leu Ser Ser Lys Thr Gly Val Glu Thr Tyr Lys Pro 595 600 605 Ser Ala Tyr Ile Leu Glu Gly Tyr Lys Gln Asn Lys His Leu Lys Ser 610 615 620 Ser Lys Asp Phe Asp Ile Thr Phe Cys His Asp Leu Ile Asp Tyr Phe 625 630 635 640 Lys Asn Cys Ile Ala Ile His Pro Glu Trp Lys Asn Phe Gly Phe Asp 645 650 655 Phe Ser Asp Thr Ser Thr Tyr Glu Asp Ile Ser Gly Phe Tyr Arg Glu 660 665 670 Val Glu Leu Gln Gly Tyr Lys Ile Asp Trp Thr Tyr Ile Ser Glu Lys 675 680 685 Asp Ile Asp Leu Leu Gln Glu Lys Gly Gln Leu Tyr Leu Phe Gln Ile 690 695 700 Tyr Asn Lys Asp Phe Ser Lys Lys Ser Thr Gly Asn Asp Asn Leu His 705 710 715 720 Thr Met Tyr Leu Lys Asn Leu Phe Ser Glu Glu Asn Leu Lys Asp Ile 725 730 735 Val Leu Lys Leu Asn Gly Glu Ala Glu Ile Phe Phe Arg Lys Ser Ser 740 745 750 Ile Lys Asn Pro Ile Ile His Lys Lys Gly Ser Ile Leu Val Asn Arg 755 760 765 Thr Tyr Glu Ala Glu Glu Lys Asp Gln Phe Gly Asn Ile Gln Ile Val 770 775 780 Arg Lys Thr Ile Pro Glu Asn Ile Tyr Gln Glu Leu Tyr Lys Tyr Phe 785 790 795 800 Asn Asp Lys Ser Asp Lys Glu Leu Ser Asp Glu Ala Ala Lys Leu Lys 805 810 815 Asn Val Val Gly His His Glu Ala Ala Thr Asn Ile Val Lys Asp Tyr 820 825 830 Arg Tyr Thr Tyr Asp Lys Tyr Phe Leu His Met Pro Ile Thr Ile Asn 835 840 845 Phe Lys Ala Asn Lys Thr Ser Phe Ile Asn Asp Arg Ile Leu Gln Tyr 850 855 860 Ile Ala Lys Glu Lys Asn Leu His Val Ile Gly Ile Ala Arg Gly Glu 865 870 875 880 Arg Asn Leu Ile Tyr Val Ser Val Ile Asp Thr Cys Gly Asn Ile Val 885 890 895 Glu Gln Lys Ser Phe Asn Ile Val Asn Gly Tyr Asp Tyr Gln Ile Lys 900 905 910 Leu Lys Gln Gln Glu Gly Ala Arg Gln Ile Ala Arg Lys Glu Trp Lys 915 920 925 Glu Ile Gly Lys Ile Lys Glu Ile Lys Glu Gly Tyr Leu Ser Leu Val 930 935 940 Ile His Glu Ile Ser Lys Met Val Ile Lys Tyr Asn Ala Ile Ile Ala 945 950 955 960 Met Glu Asp Leu Ser Tyr Gly Phe Lys Lys Gly Arg Phe Lys Val Glu 965 970 975 Arg Gln Val Tyr Gln Lys Phe Glu Thr Met Leu Ile Asn Lys Leu Asn 980 985 990 Tyr Leu Val Phe Lys Asp Ile Ser Ile Thr Glu Asn Gly Gly Leu Leu 995 1000 1005 Lys Gly Tyr Gln Leu Thr Tyr Ile Pro Asp Lys Leu Lys Asn Val Gly 1010 1015 1020 His Gln Cys Gly Cys Ile Phe Tyr Val Pro Ala Ala Tyr Thr Ser Lys 1025 1030 1035 1040 Ile Asp Pro Thr Thr Gly Phe Val Asn Ile Phe Lys Phe Lys Asp Leu 1045 1050 1055 Thr Val Asp Ala Lys Arg Glu Phe Ile Lys Lys Phe Asp Ser Ile Arg 1060 1065 1070 Tyr Asp Ser Glu Lys Lys Leu Phe Cys Phe Thr Phe Asp Tyr Asn Asn 1075 1080 1085 Phe Ile Thr Gln Asn Thr Val Met Ser Lys Ser Ser Trp Ser Val Tyr 1090 1095 1100 Thr Tyr Gly Val Arg Ile Lys Arg Arg Phe Val Asn Gly Arg Phe Ser 1105 1110 1115 1120 Asn Glu Ser Asp Thr Ile Asp Ile Thr Lys Asp Met Glu Lys Thr Leu 1125 1130 1135 Glu Met Thr Asp Ile Asn Trp Arg Asp Gly His Asp Leu Arg Gln Asp 1140 1145 1150 Ile Ile Asp Tyr Glu Ile Val Gln His Ile Phe Glu Ile Phe Arg Leu 1155 1160 1165 Thr Val Gln Met Arg Asn Ser Leu Ser Glu Leu Glu Asp Arg Asp Tyr 1170 1175 1180 Asp Arg Leu Ile Ser Pro Val Leu Asn Glu Asn Asn Ile Phe Tyr Asp 1185 1190 1195 1200 Ser Ala Lys Ala Gly Asp Ala Leu Pro Lys Asp Ala Asp Ala Asn Gly 1205 1210 1215 Ala Tyr Cys Ile Ala Leu Lys Gly Leu Tyr Glu Ile Lys Gln Ile Thr 1220 1225 1230 Glu Asn Trp Lys Glu Asp Gly Lys Phe Ser Arg Asp Lys Leu Lys Ile 1235 1240 1245 Ser Asn Lys Asp Trp Phe Asp Phe Ile Gln Asn Lys Arg Tyr Leu 1250 1255 1260 <210> 14 <211> 1275 <212> PRT <213> Artificial Sequence <220> <223> d_mgCas12a-2 <400> 14 Met Gly Lys Asn Gln Asn Phe Gln Glu Phe Ile Gly Val Ser Pro Leu 1 5 10 15 Gln Lys Thr Leu Arg Asn Glu Leu Ile Pro Thr Glu Thr Thr Lys Lys 20 25 30 Asn Ile Thr Gln Leu Asp Leu Leu Thr Glu Asp Glu Ile Arg Ala Gln 35 40 45 Asn Arg Glu Lys Leu Lys Glu Met Met Asp Asp Tyr Tyr Arg Asn Val 50 55 60 Ile Asp Ser Thr Leu His Val Gly Ile Ala Val Asp Trp Ser Tyr Leu 65 70 75 80 Phe Ser Cys Met Arg Asn His Leu Arg Glu Asn Ser Lys Glu Ser Lys 85 90 95 Arg Glu Leu Glu Arg Thr Gln Asp Ser Ile Arg Ser Gln Ile His Asn 100 105 110 Lys Phe Ala Glu Arg Ala Asp Phe Lys Asp Met Phe Gly Ala Ser Ile 115 120 125 Ile Thr Lys Leu Leu Pro Thr Tyr Ile Lys Gln Asn Ser Glu Tyr Ser 130 135 140 Glu Arg Tyr Asp Glu Ser Met Glu Ile Leu Lys Leu Tyr Gly Lys Phe 145 150 155 160 Thr Thr Ser Leu Thr Asp Tyr Phe Glu Thr Arg Lys Asn Ile Phe Ser 165 170 175 Lys Glu Lys Ile Ser Ser Ala Val Gly Tyr Arg Ile Val Glu Glu Asn 180 185 190 Ala Glu Ile Phe Leu Gln Asn Gln Asn Ala Tyr Asp Arg Ile Cys Lys 195 200 205 Ile Ala Gly Leu Asp Leu His Gly Leu Asp Asn Glu Ile Thr Ala Tyr 210 215 220 Val Asp Gly Lys Thr Leu Lys Glu Val Cys Ser Asp Glu Gly Phe Ala 225 230 235 240 Lys Ala Ile Thr Gln Glu Gly Ile Asp Arg Tyr Asn Glu Ala Ile Gly 245 250 255 Ala Val Asn Gln Tyr Met Asn Leu Leu Cys Gln Lys Asn Lys Ala Leu 260 265 270 Lys Pro Gly Gln Phe Lys Met Lys Arg Leu His Lys Gln Ile Leu Cys 275 280 285 Lys Gly Thr Thr Ser Phe Asp Ile Pro Lys Lys Phe Glu Asn Asp Lys 290 295 300 Gln Val Tyr Asp Ala Val Asn Ser Phe Thr Glu Ile Val Thr Lys Asn 305 310 315 320 Asn Asp Leu Lys Arg Leu Leu Asn Ile Thr Gln Asn Ala Asn Asp Tyr 325 330 335 Asp Met Asn Lys Ile Tyr Val Val Ala Asp Ala Tyr Ser Met Ile Ser 340 345 350 Gln Phe Ile Ser Lys Lys Trp Asn Leu Ile Glu Glu Cys Leu Leu Asp 355 360 365 Tyr Tyr Ser Asp Asn Leu Pro Gly Lys Gly Asn Ala Lys Glu Asn Lys 370 375 380 Val Lys Lys Ala Val Lys Glu Glu Thr Tyr Arg Ser Val Ser Gln Leu 385 390 395 400 Asn Glu Val Ile Glu Lys Tyr Tyr Val Glu Lys Thr Gly Gln Ser Val 405 410 415 Trp Lys Val Glu Ser Tyr Ile Ser Ser Leu Ala Glu Met Ile Lys Leu 420 425 430 Glu Leu Cys His Glu Ile Asp Asn Asp Glu Lys His Asn Leu Ile Glu 435 440 445 Asp Asp Glu Lys Ile Ser Glu Ile Lys Glu Leu Leu Asp Met Tyr Met 450 455 460 Asp Val Phe His Ile Ile Lys Val Phe Arg Val Asn Glu Val Leu Asn 465 470 475 480 Phe Asp Glu Thr Phe Tyr Ser Glu Met Asp Glu Ile Tyr Gln Asp Met 485 490 495 Gln Glu Ile Val Pro Leu Tyr Asn His Val Arg Asn Tyr Val Thr Gln 500 505 510 Lys Pro Tyr Lys Gln Glu Lys Tyr Arg Leu Tyr Phe His Thr Pro Thr 515 520 525 Leu Ala Asn Gly Trp Ser Lys Ser Lys Glu Tyr Asp Asn Asn Ala Ile 530 535 540 Ile Leu Val Arg Glu Asp Lys Tyr Tyr Leu Gly Ile Leu Asn Ala Lys 545 550 555 560 Lys Lys Pro Ser Lys Glu Ile Met Ala Gly Lys Glu Asp Cys Ser Glu 565 570 575 His Ala Tyr Ala Lys Met Asn Tyr Tyr Leu Leu Pro Gly Ala Asn Lys 580 585 590 Met Leu Pro Lys Val Phe Leu Ser Lys Lys Gly Ile Gln Asp Tyr His 595 600 605 Pro Ser Ser Tyr Ile Val Glu Gly Tyr Asn Glu Lys Lys His Ile Lys 610 615 620 Gly Ser Lys Asn Phe Asp Ile Arg Phe Cys Arg Asp Leu Ile Asp Tyr 625 630 635 640 Phe Lys Glu Cys Ile Lys Lys His Pro Asp Trp Asn Lys Phe Asn Phe 645 650 655 Glu Phe Ser Ala Thr Glu Thr Tyr Glu Asp Ile Ser Val Phe Tyr Arg 660 665 670 Glu Val Glu Lys Gln Gly Tyr Arg Val Glu Trp Thr Tyr Ile Asn Ser 675 680 685 Glu Asp Ile Gln Lys Leu Glu Glu Asp Gly Gln Leu Phe Leu Phe Gln 690 695 700 Ile Tyr Asn Lys Asp Phe Ala Val Gly Ser Thr Gly Lys Pro Asn Leu 705 710 715 720 His Thr Leu Tyr Leu Lys Asn Leu Phe Ser Glu Glu Asn Leu Arg Asp 725 730 735 Ile Val Leu Lys Leu Asn Gly Glu Ala Glu Ile Phe Phe Arg Lys Ser 740 745 750 Ser Val Gln Lys Pro Val Ile His Lys Cys Gly Ser Ile Leu Val Asn 755 760 765 Arg Thr Tyr Glu Ile Thr Glu Ser Gly Thr Thr Arg Val Gln Ser Ile 770 775 780 Pro Glu Ser Glu Tyr Met Glu Leu Tyr Arg Tyr Phe Asn Ser Glu Lys 785 790 795 800 Gln Ile Glu Leu Ser Asp Glu Ala Lys Lys Tyr Leu Asp Lys Val Gln 805 810 815 Cys Asn Lys Ala Lys Thr Asp Ile Val Lys Asp Tyr Arg Tyr Thr Met 820 825 830 Asp Lys Phe Phe Ile His Leu Pro Ile Thr Ile Asn Phe Lys Val Asp 835 840 845 Lys Gly Asn Asn Val Asn Ala Ile Ala Gln Gln Tyr Ile Ala Gly Arg 850 855 860 Lys Asp Leu His Val Ile Gly Ile Ala Arg Gly Glu Arg Asn Leu Ile 865 870 875 880 Tyr Val Ser Val Ile Asp Met Tyr Gly Arg Ile Leu Glu Gln Lys Ser 885 890 895 Phe Asn Leu Val Glu Gln Val Ser Ser Gln Gly Thr Lys Arg Tyr Tyr 900 905 910 Asp Tyr Lys Glu Lys Leu Gln Asn Arg Glu Glu Glu Arg Asp Lys Ala 915 920 925 Arg Lys Ser Trp Lys Thr Ile Gly Lys Ile Lys Glu Leu Lys Glu Gly 930 935 940 Tyr Leu Ser Ser Val Ile His Glu Ile Ala Gln Met Val Val Lys Tyr 945 950 955 960 Asn Ala Ile Ile Ala Met Glu Asp Leu Asn Tyr Gly Phe Lys Arg Gly 965 970 975 Arg Phe Lys Val Glu Arg Gln Val Tyr Gln Lys Phe Glu Thr Met Leu 980 985 990 Ile Ser Lys Leu Asn Tyr Leu Ala Asp Lys Ser Gln Ala Val Asp Glu 995 1000 1005 Pro Gly Gly Ile Leu Arg Gly Tyr Gln Met Thr Tyr Val Pro Asp Asn 1010 1015 1020 Ile Lys Asn Val Gly Arg Gln Cys Gly Ile Ile Phe Tyr Val Pro Ala 1025 1030 1035 1040 Ala Tyr Thr Ser Lys Ile Asp Pro Thr Thr Gly Phe Ile Asn Ala Phe 1045 1050 1055 Lys Arg Asp Val Val Ser Thr Asn Asp Ala Lys Glu Asn Phe Leu Met 1060 1065 1070 Lys Phe Asp Ser Ile Gln Tyr Asp Ile Glu Lys Gly Leu Phe Lys Phe 1075 1080 1085 Ser Phe Asp Tyr Lys Asn Phe Ala Thr His Lys Leu Thr Leu Ala Lys 1090 1095 1100 Thr Lys Trp Asp Val Tyr Thr Asn Gly Thr Arg Ile Gln Asn Met Lys 1105 1110 1115 1120 Val Glu Gly His Trp Leu Ser Met Glu Val Glu Leu Thr Thr Lys Met 1125 1130 1135 Lys Glu Leu Leu Asp Asp Ser His Ile Pro Tyr Glu Glu Gly Gln Asn 1140 1145 1150 Ile Leu Asp Asp Leu Arg Glu Met Lys Asp Ile Thr Thr Ile Val Asn 1155 1160 1165 Gly Ile Leu Glu Ile Phe Trp Leu Thr Val Gln Leu Arg Asn Ser Arg 1170 1175 1180 Ile Asp Asn Pro Asp Tyr Asp Arg Ile Ile Ser Pro Val Leu Asn Lys 1185 1190 1195 1200 Asn Gly Glu Phe Phe Asp Ser Asp Glu Tyr Asn Ser Tyr Ile Asp Ala 1205 1210 1215 Gln Lys Ala Pro Leu Pro Ile Asp Ala Asp Ala Asn Gly Ala Phe Cys 1220 1225 1230 Ile Ala Leu Lys Gly Met Tyr Thr Ala Asn Gln Ile Lys Glu Asn Trp 1235 1240 1245 Val Glu Gly Glu Lys Leu Pro Ala Asp Cys Leu Lys Ile Glu His Ala 1250 1255 1260 Ser Trp Leu Ala Phe Met Gln Gly Glu Arg Gly 1265 1270 1275 <210> 15 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> CCR5 Adapter primer sequence (5'-3') <400> 15 tcgtcggcag cgtcagatgt gtataagaga cagggtattt ctgttcagat cac 53 <210> 16 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> CCR5 Adapter primer sequence (5'-3') <400> 16 gtctcgtggg ctcggagatg tgtataagag acaggcccat caattataga aagcc 55 <210> 17 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> DNMT1 Adapter primer sequence (5'-3') <400> 17 tcgtcggcag cgtcagatgt gtataagaga cagctgcaca cagcaggcct ttg 53 <210> 18 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> DNMT1 Adapter primer sequence (5'-3') <400> 18 gtctcgtggg ctcggagatg tgtataagag acagcccaat aagtggcaga gtgc 54 <210> 19 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> NbFTa14_1/2-2 crRNA sequence(PAM site) <400> 19 tttggataat ttgtactctt gtcgatgt 28 <210> 20 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> NbFTa14_1/2-4 crRNA sequence(PAM site) <400> 20 tttagtccac aaacagctaa gcccacat 28 <210> 21 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> NGS NbFTa14_1 Forward primer <400> 21 tgagctgaag atggattatg 20 <210> 22 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> NGS NbFTa14_1 Reverse primer <400> 22 tcatgcttaa gataaaagag 20 <210> 23 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> NGS NbFTa14_2 Forward primer <400> 23 tcatgagctt aagatggatc 20 <210> 24 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> NGS NbFTa14_2 Reverse primer <400> 24 gtttaagcta aaagaactac 20 <210> 25 <211> 43 <212> RNA <213> Artificial Sequence <220> <223> LsXTb12 crRNA #1 <400> 25 aatttctact aagtgtagat tcttcatcct caattccatc acc 43 <210> 26 <211> 43 <212> RNA <213> Artificial Sequence <220> <223> LsXTb12 crRNA #2 <400> 26 aatttctact aagtgtagat gcaagcctgt aactctggaa gac 43 <210> 27 <211> 1504 <212> DNA <213> Artificial Sequence <220> <223> HsCCR5 Linear DNA <400> 27 ggtggtggct gtgtttgcgt ctctcccagg aatcatcttt accagatctc aaaaagaagg 60 tcttcattac acctgcagct ctcattttcc atacagtcag tatcaattct ggaagaattt 120 ccagacatta aagatagtca tcttggggct ggtcctgccg ctgcttgtca tggtcatctg 180 ctactcggga atcctaaaaa ctctgcttcg gtgtcgaaat gagaagaaga ggcacagggc 240 tgtgaggctt atcttcacca tcatgattgt ttattttctc ttctgggctc cctacaacat 300 tgtccttctc ctgaacacct tccaggaatt ctttggcctg aataattgca gtagctctaa 360 caggttggac caagctatgc aggtgacaga gactcttggg atgacgcact gctgcatcaa 420 ccccatcatc tatgcctttg tcggggagaa gttcagaaac tacctcttag tcttcttcca 480 aaagcacatt gccaaacgct tctgcaaatg ctgttctatt ttccagcaag aggctcccga 540 gcgagcaagc tcagtttaca cccgatccac tggggagcag gaaatatctg tgggcttgtg 600 acacggactc aagtgggctg gtgacccagt cagagttgtg cacatggctt agttttcata 660 cacagcctgg gctgggggtg gggtgggaga ggtctttttt aaaaggaagt tactgttata 720 gagggtctaa gattcatcca tttatttggc atctgtttaa agtagattag atcttttaag 780 cccatcaatt atagaaagcc aaatcaaaat atgttgatga aaaatagcaa cctttttatc 840 tccccttcac atgcatcaag ttattgacaa actctccctt cactccgaaa gttccttatg 900 tatatttaaa agaaagcctc agagaattgc tgattcttga gtttagtgat ctgaacagaa 960 ataccaaaat tatttcagaa atgtacaact ttttacctag tacaaggcaa catataggtt 1020 gtaaatgtgt ttaaaacagg tctttgtctt gctatgggga gaaaagacat gaatatgatt 1080 agtaaagaaa tgacactttt catgtgtgat ttcccctcca aggtatggtt aataagtttc 1140 actgacttag aaccaggcga gagacttgtg gcctgggaga gctggggaag cttcttaaat 1200 gagaaggaat ttgagttgga tcatctattg ctggcaaaga cagaagcctc actgcaagca 1260 ctgcatgggc aagcttggct gtagaaggag acagagctgg ttgggaagac atggggagga 1320 aggacaaggc tagatcatga agaaccttga cggcattgct ccgtctaagt catgagctga 1380 gcagggagat cctggttggt gttgcagaag gtttactctg tggccaaagg agggtcagga 1440 aggatgagca tttagggcaa ggagaccacc aacagccctc aggtcagggt gaggatggcc 1500 tctg 1504 <210> 28 <211> 1119 <212> DNA <213> Artificial Sequence <220> <223> HsDNMT1 Linear DNA <400> 28 gctgctctcg aactcctggc ctcaactaat ccacctgcct tggcctccca aagtgctggg 60 attacaggcg tgagccactg ctcccagccc cacgtgtctt tgtctcaagt ctttctgaag 120 ctcttcaaag gcccagtgac ttgtggctgt ggggcgggat gatgggccag ttggagggtc 180 caaggatctt gtgctggaag ggttttgggc ccatgtgagc aggaccagaa cccttcccca 240 aggggtgcaa tgcccaggtt gtcctccatc tgagcagggg ctggcagtac acctgccccc 300 gggccttggg cctgggtgtc cacatcaggc attgcccttc tcccctcctg caggtgggca 360 atgccgtgcc accgcccctg gccaaagcca ttggcttgga gatcaagctt tgtatgttgg 420 ccaaagcccg agagagtgcc tcaggtatgg tggggtgggc caggcttcct ctggggcctg 480 actgccctct gggggtacat gtgggggcag ttgctggcca ccgttttggg ctctgggact 540 caggcgggtc acctacccac gttcgtggcc ccatctttct caaggggctg ctgtgaggat 600 tgagtgagtt gcacgtgtca agtgcttaga gcaggcgtgc tgcacacagc aggcctttgg 660 tcaggttggc tgctgggctg gccctggggc cgtttccctc actcctgctc ggtgaatttg 720 gctcagcagg cacctgcctc agctgctcac ttgagcctct gggtctagaa ccctctgggg 780 accgtttgag gagtgttcag tctccgtgaa cgttccctta gcactctgcc acttattggg 840 tcagctgtta acatcagtac gttaatgttt cctgatggtc catgtctgtt actcgcctgt 900 caagtggcgt gacaccgggc gtgttcccca gagtgacttt tccttttatt tcccttcagc 960 taaaataaag gaggaggaag ctgctaagga ctagttctgc cctcccgtca cccctgtttc 1020 tggcaccagg aatccccaac atgcactgat gttgtgtttt taacatgtca atctgtccgt 1080 tcacatgtgt ggtacatggt gtttgtggcc ttggctgac 1119 <210> 29 <211> 1460 <212> DNA <213> Artificial Sequence <220> <223> HsEMX1 Linear DNA <400> 29 gtggggacag aaggtctgga gctgcccgtg aagggcagaa tgctgccctc agacccgctt 60 cctccctgtc cttgtctgtc caaggagaat gaggtctcac tggtggattt cggactaccc 120 tgaggagctg gcacctgagg gacaaggccc cccacctgcc cagctccagc ctctgatgag 180 gggtgggaga gagctacatg aggttgctaa gaaagcctcc cctgaaggag accacacagt 240 gtgtgaggtt ggagtctcta gcagcgggtt ctgtgccccc agggatagtc tggctgtcca 300 ggcactgctc ttgatataaa caccacctcc tagttatgaa accatgccca ttctgcctct 360 ctgtatggaa aagagcatgg ggctggcccg tggggtggtg tccactttag gccctgtggg 420 agatcatggg aacccacgca gtgggtcata ggctctctca tttactactc acatccactc 480 tgtgaagaag cgattatgat ctctcctcta gaaactcgta gagtcccatg tctgccggct 540 tccagagcct gcactcctcc accttggctt ggctttgctg gggctagagg agctaggatg 600 cacagcagct ctgtgaccct ttgtttgaga ggaacaggaa aaccaccctt ctctctggcc 660 cactgtgtcc tcttcctgcc ctgccatccc cttctgtgaa tgttagaccc atgggagcag 720 ctggtcagag gggaccccgg cctggggccc ctaaccctat gtagcctcag tcttcccatc 780 aggctctcag ctcagcctga gtgttgaggc cccagtggct gctctggggg cctcctgagt 840 ttctcatctg tgcccctccc tccctggccc aggtgaaggt gtggttccag aaccggagga 900 caaagtacaa acggcagaag ctggaggagg aagggcctga gtccgagcag aagaagaagg 960 gctcccatca catcaaccgg tggcgcattg ccacgaagca ggccaatggg gaggacatcg 1020 atgtcacctc caatgactag ggtgggcaac cacaaaccca cgagggcaga gtgctgcttg 1080 ctgctggcca ggcccctgcg tgggcccaag ctggactctg gccactccct ggccaggctt 1140 tggggaggcc tggagtcatg gccccacagg gcttgaagcc cggggccgcc attgacagag 1200 ggacaagcaa tgggctggct gaggcctggg accacttggc cttctcctcg gagagcctgc 1260 ctgcctgggc gggcccgccc gccaccgcag cctcccagct gctctccgtg tctccaatct 1320 cccttttgtt ttgatgcatt tctgttttaa tttattttcc aggcaccact gtagtttagt 1380 gatccccagt gtcccccttc cctatgggaa taataaaagt ctctctctta atgacacggg 1440 catccagctc cagccccaga 1460 <210> 30 <211> 5311 <212> DNA <213> Artificial Sequence <220> <223> All-in-one vector(HsCCR5) <400> 30 cttccgcttc ctcgctcact gattcgctgc gctcggtcgt tcggctgcgg cgagcggtat 60 cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga 120 acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt 180 ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt 240 ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc 300 gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa 360 gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct 420 ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta 480 actatcgtct tgaatccaac ccggtaagac acgacttatc gccactggca gcagccactg 540 gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc 600 ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta 660 ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg 720 gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt 780 tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg 840 tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta 900 aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg 960 aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctgg ctccccgtcg 1020 tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc 1080 gagacccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg 1140 agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg 1200 aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag 1260 gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat 1320 caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc 1380 cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc 1440 ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa 1500 ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac 1560 gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt 1620 cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc 1680 gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa 1740 caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca 1800 tactcttcct ttttcaattc agaagaactc gtcaagaagg cgatagaagg cgatgcgctg 1860 cgaatcggga gcggcgatac cgtaaagcac gaggaagcgg tcagcccatt cgccgccaag 1920 ctcttcagca atatcacggg tagccaacgc tatgtcctga tagcggtccg ccacacccag 1980 ccggccacag tcgatgaatc cagaaaagcg gccattttcc accatgatat tcggcaagca 2040 ggcatcgcca tgggtcacga cgagatcctc gccgtcgggc atgctcgcct tgagcctggc 2100 gaacagttcg gctggcgcga gcccctgatg ctcttcgtcc agatcatcct gatcgacaag 2160 accggcttcc atccgagtac gtgctcgctc gatgcgatgt ttcgcttggt ggtcgaatgg 2220 gcaggtagcc ggatcaagcg tatgcagccg ccgcattgca tcagccatga tggatacttt 2280 ctcggcagga gcaaggtgag atgacaggag atcctgcccc ggcacttcgc ccaatagcag 2340 ccagtccctt cccgcttcag tgacaacgtc gagcacagct gcgcaaggaa cgcccgtcgt 2400 ggccagccac gatagccgcg ctgcctcgtc ttgcagttca ttcagggcac cggacaggtc 2460 ggtcttgaca aaaagaaccg ggcgcccctg cgctgacagc cggaacacgg cggcatcaga 2520 gcagccgatt gtctgttgtg cccagtcata gccgaatagc ctctccaccc aagcggccgg 2580 agaacctgcg tgcaatccat cttgttcaat catgcgaaac gatcctcatc ctgtctcttg 2640 atcagagctt gatcccctgc gccatcagat ccttggcggc aagaaagcca tccagtttac 2700 tttgcagggc ttcccaacct taccagaggg cgccccagct ggcaattccg gttcgcttgc 2760 tgtccataaa accgcccagt ctagctatcg ccatgtaagc ccactgcaag ctacctgctt 2820 tctctttgcg cttgcgtttt cccttgtcca gatagcccag tagctgacat tcatccgggg 2880 tcagcaccgt ttctgcggac tggctttcta cgtgaaaagg atctaggtga agatcctttt 2940 tgataatctc atgcctgaca tttatattcc ccagaacatc aggttaatgg cgtttttgat 3000 gtcattttcg cggtggctga gatcagccac ttcttccccg ataacggaga ccggcacact 3060 ggccatatcg gtggtcatca tgcgccagct ttcatccccg atatgcacca ccgggtaaag 3120 ttcacgggag actttatctg acagcagacg tgcactggcc agggggatca ccatccgtcg 3180 ccccggcgtg tcaataatat cactctgtac atccacaaac agacgataac ggctctctct 3240 tttataggtg taaaccttaa actgccgtac gtataggctg cgcaactgtt gggaagggcg 3300 atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg 3360 attaagttgg gtaacgccag ggttttccca gtcacgacgt tgtaaaacga cggccagtga 3420 attgtaatac gattcactat agggcgaatt gggccctcta gatgcatgct cgagcggccg 3480 ccagtgtgat ggatatctgc agaattcgcc cttggtggtg gctgtgtttg cgtctctccc 3540 aggaatcatc tttaccagat ctcaaaaaga aggtcttcat tacacctgca gctctcattt 3600 tccatacagt cagtatcaat tctggaagaa tttccagaca ttaaagatag tcatcttggg 3660 gctggtcctg ccgctgcttg tcatggtcat ctgctactcg ggaatcctaa aaactctgct 3720 tcggtgtcga aatgagaaga agaggcacag ggctgtgagg cttatcttca ccatcatgat 3780 tgtttatttt ctcttctggg ctccctacaa cattgtcctt ctcctgaaca ccttccagga 3840 attctttggc ctgaataatt gcagtagctc taacaggttg gaccaagcta tgcaggtgac 3900 agagactctt gggatgacgc actgctgcat caaccccatc atctatgcct ttgtcgggga 3960 gaagttcaga aactacctct tagtcttctt ccaaaagcac attgccaaac gcttctgcaa 4020 atgctgttct attttccagc aagaggctcc cgagcgagca agctcagttt acacccgatc 4080 cactggggag caggaaatat ctgtgggctt gtgacacgga ctcaagtggg ctggtgaccc 4140 agtcagagtt gtgcacatgg cttagttttc atacacagcc tgggctgggg gtggggtggg 4200 agaggtcttt tttaaaagga agttactgtt atagagggtc taagattcat ccatttattt 4260 ggcatctgtt taaagtagat tagatctttt aagcccatca attatagaaa gccaaatcaa 4320 aatatgttga tgaaaaatag caaccttttt atctcccctt cacatgcatc aagttattga 4380 caaactctcc cttcactccg aaagttcctt atgtatattt aaaagaaagc ctcagagaat 4440 tgctgattct tgagtttagt gatctgaaca gaaataccaa aattatttca gaaatgtaca 4500 actttttacc tagtacaagg caacatatag gttgtaaatg tgtttaaaac aggtctttgt 4560 cttgctatgg ggagaaaaga catgaatatg attagtaaag aaatgacact tttcatgtgt 4620 gatttcccct ccaaggtatg gttaataagt ttcactgact tagaaccagg cgagagactt 4680 gtggcctggg agagctgggg aagcttctta aatgagaagg aatttgagtt ggatcatcta 4740 ttgctggcaa agacagaagc ctcactgcaa gcactgcatg ggcaagcttg gctgtagaag 4800 gagacagagc tggttgggaa gacatgggga ggaaggacaa ggctagatca tgaagaacct 4860 tgacggcatt gctccgtcta agtcatgagc tgagcaggga gatcctggtt ggtgttgcag 4920 aaggtttact ctgtggccaa aggagggtca ggaaggatga gcatttaggg caaggagacc 4980 accaacagcc ctcaggtcag ggtgaggatg gcctctgaag ggcgaattcc agcacactgg 5040 cggccgttac tagtggatcc gagctcggta ccaagcttgg cgtaatcatg gtcatagctg 5100 tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata 5160 aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca 5220 ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc 5280 gcggggagag gcggtttgcg tattgggcgc t 5311 <210> 31 <211> 4926 <212> DNA <213> Artificial Sequence <220> <223> All-in-one vector(HsDNMT1) <400> 31 cttccgcttc ctcgctcact gattcgctgc gctcggtcgt tcggctgcgg cgagcggtat 60 cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga 120 acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt 180 ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt 240 ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc 300 gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa 360 gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct 420 ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta 480 actatcgtct tgaatccaac ccggtaagac acgacttatc gccactggca gcagccactg 540 gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc 600 ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta 660 ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg 720 gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt 780 tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg 840 tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta 900 aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg 960 aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctgg ctccccgtcg 1020 tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc 1080 gagacccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg 1140 agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg 1200 aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag 1260 gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat 1320 caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc 1380 cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc 1440 ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa 1500 ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac 1560 gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt 1620 cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc 1680 gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa 1740 caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca 1800 tactcttcct ttttcaattc agaagaactc gtcaagaagg cgatagaagg cgatgcgctg 1860 cgaatcggga gcggcgatac cgtaaagcac gaggaagcgg tcagcccatt cgccgccaag 1920 ctcttcagca atatcacggg tagccaacgc tatgtcctga tagcggtccg ccacacccag 1980 ccggccacag tcgatgaatc cagaaaagcg gccattttcc accatgatat tcggcaagca 2040 ggcatcgcca tgggtcacga cgagatcctc gccgtcgggc atgctcgcct tgagcctggc 2100 gaacagttcg gctggcgcga gcccctgatg ctcttcgtcc agatcatcct gatcgacaag 2160 accggcttcc atccgagtac gtgctcgctc gatgcgatgt ttcgcttggt ggtcgaatgg 2220 gcaggtagcc ggatcaagcg tatgcagccg ccgcattgca tcagccatga tggatacttt 2280 ctcggcagga gcaaggtgag atgacaggag atcctgcccc ggcacttcgc ccaatagcag 2340 ccagtccctt cccgcttcag tgacaacgtc gagcacagct gcgcaaggaa cgcccgtcgt 2400 ggccagccac gatagccgcg ctgcctcgtc ttgcagttca ttcagggcac cggacaggtc 2460 ggtcttgaca aaaagaaccg ggcgcccctg cgctgacagc cggaacacgg cggcatcaga 2520 gcagccgatt gtctgttgtg cccagtcata gccgaatagc ctctccaccc aagcggccgg 2580 agaacctgcg tgcaatccat cttgttcaat catgcgaaac gatcctcatc ctgtctcttg 2640 atcagagctt gatcccctgc gccatcagat ccttggcggc aagaaagcca tccagtttac 2700 tttgcagggc ttcccaacct taccagaggg cgccccagct ggcaattccg gttcgcttgc 2760 tgtccataaa accgcccagt ctagctatcg ccatgtaagc ccactgcaag ctacctgctt 2820 tctctttgcg cttgcgtttt cccttgtcca gatagcccag tagctgacat tcatccgggg 2880 tcagcaccgt ttctgcggac tggctttcta cgtgaaaagg atctaggtga agatcctttt 2940 tgataatctc atgcctgaca tttatattcc ccagaacatc aggttaatgg cgtttttgat 3000 gtcattttcg cggtggctga gatcagccac ttcttccccg ataacggaga ccggcacact 3060 ggccatatcg gtggtcatca tgcgccagct ttcatccccg atatgcacca ccgggtaaag 3120 ttcacgggag actttatctg acagcagacg tgcactggcc agggggatca ccatccgtcg 3180 ccccggcgtg tcaataatat cactctgtac atccacaaac agacgataac ggctctctct 3240 tttataggtg taaaccttaa actgccgtac gtataggctg cgcaactgtt gggaagggcg 3300 atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg 3360 attaagttgg gtaacgccag ggttttccca gtcacgacgt tgtaaaacga cggccagtga 3420 attgtaatac gattcactat agggcgaatt gggccctcta gatgcatgct cgagcggccg 3480 ccagtgtgat ggatatctgc agaattcgcc cttgctgctc tcgaactcct ggcctcaact 3540 aatccacctg ccttggcctc ccaaagtgct gggattacag gcgtgagcca ctgctcccag 3600 ccccacgtgt ctttgtctca agtctttctg aagctcttca aaggcccagt gacttgtggc 3660 tgtggggcgg gatgatgggc cagttggagg gtccaaggat cttgtgctgg aagggttttg 3720 ggcccatgtg agcaggacca gaacccttcc ccaaggggtg caatgcccag gttgtcctcc 3780 atctgagcag gggctggcag tacacctgcc cccgggcctt gggcctgggt gtccacatca 3840 ggcattgccc ttctcccctc ctgcaggtgg gcaatgccgt gccaccgccc ctggccaaag 3900 ccattggctt ggagatcaag ctttgtatgt tggccaaagc ccgagagagt gcctcaggta 3960 tggtggggtg ggccaggctt cctctggggc ctgactgccc tctgggggta catgtggggg 4020 cagttgctgg ccaccgtttt gggctctggg actcaggcgg gtcacctacc cacgttcgtg 4080 gccccatctt tctcaagggg ctgctgtgag gattgagtga gttgcacgtg tcaagtgctt 4140 agagcaggcg tgctgcacac agcaggcctt tggtcaggtt ggctgctggg ctggccctgg 4200 ggccgtttcc ctcactcctg ctcggtgaat ttggctcagc aggcacctgc ctcagctgct 4260 cacttgagcc tctgggtcta gaaccctctg gggaccgttt gaggagtgtt cagtctccgt 4320 gaacgttccc ttagcactct gccacttatt gggtcagctg ttaacatcag tacgttaatg 4380 tttcctgatg gtccatgtct gttactcgcc tgtcaagtgg cgtgacaccg ggcgtgttcc 4440 ccagagtgac ttttcctttt atttcccttc agctaaaata aaggaggagg aagctgctaa 4500 ggactagttc tgccctcccg tcacccctgt ttctggcacc aggaatcccc aacatgcact 4560 gatgttgtgt ttttaacatg tcaatctgtc cgttcacatg tgtggtacat ggtgtttgtg 4620 gccttggctg acaagggcga attccagcac actggcggcc gttactagtg gatccgagct 4680 cggtaccaag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc 4740 tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat 4800 gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 4860 tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg 4920 ggcgct 4926 <210> 32 <211> 5267 <212> DNA <213> Artificial Sequence <220> <223> All-in-one vector(HsEMX1) <400> 32 cttccgcttc ctcgctcact gattcgctgc gctcggtcgt tcggctgcgg cgagcggtat 60 cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga 120 acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt 180 ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt 240 ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc 300 gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa 360 gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct 420 ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta 480 actatcgtct tgaatccaac ccggtaagac acgacttatc gccactggca gcagccactg 540 gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc 600 ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta 660 ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg 720 gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt 780 tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg 840 tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta 900 aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg 960 aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctgg ctccccgtcg 1020 tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc 1080 gagacccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg 1140 agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg 1200 aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag 1260 gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat 1320 caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc 1380 cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc 1440 ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa 1500 ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac 1560 gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt 1620 cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc 1680 gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa 1740 caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca 1800 tactcttcct ttttcaattc agaagaactc gtcaagaagg cgatagaagg cgatgcgctg 1860 cgaatcggga gcggcgatac cgtaaagcac gaggaagcgg tcagcccatt cgccgccaag 1920 ctcttcagca atatcacggg tagccaacgc tatgtcctga tagcggtccg ccacacccag 1980 ccggccacag tcgatgaatc cagaaaagcg gccattttcc accatgatat tcggcaagca 2040 ggcatcgcca tgggtcacga cgagatcctc gccgtcgggc atgctcgcct tgagcctggc 2100 gaacagttcg gctggcgcga gcccctgatg ctcttcgtcc agatcatcct gatcgacaag 2160 accggcttcc atccgagtac gtgctcgctc gatgcgatgt ttcgcttggt ggtcgaatgg 2220 gcaggtagcc ggatcaagcg tatgcagccg ccgcattgca tcagccatga tggatacttt 2280 ctcggcagga gcaaggtgag atgacaggag atcctgcccc ggcacttcgc ccaatagcag 2340 ccagtccctt cccgcttcag tgacaacgtc gagcacagct gcgcaaggaa cgcccgtcgt 2400 ggccagccac gatagccgcg ctgcctcgtc ttgcagttca ttcagggcac cggacaggtc 2460 ggtcttgaca aaaagaaccg ggcgcccctg cgctgacagc cggaacacgg cggcatcaga 2520 gcagccgatt gtctgttgtg cccagtcata gccgaatagc ctctccaccc aagcggccgg 2580 agaacctgcg tgcaatccat cttgttcaat catgcgaaac gatcctcatc ctgtctcttg 2640 atcagagctt gatcccctgc gccatcagat ccttggcggc aagaaagcca tccagtttac 2700 tttgcagggc ttcccaacct taccagaggg cgccccagct ggcaattccg gttcgcttgc 2760 tgtccataaa accgcccagt ctagctatcg ccatgtaagc ccactgcaag ctacctgctt 2820 tctctttgcg cttgcgtttt cccttgtcca gatagcccag tagctgacat tcatccgggg 2880 tcagcaccgt ttctgcggac tggctttcta cgtgaaaagg atctaggtga agatcctttt 2940 tgataatctc atgcctgaca tttatattcc ccagaacatc aggttaatgg cgtttttgat 3000 gtcattttcg cggtggctga gatcagccac ttcttccccg ataacggaga ccggcacact 3060 ggccatatcg gtggtcatca tgcgccagct ttcatccccg atatgcacca ccgggtaaag 3120 ttcacgggag actttatctg acagcagacg tgcactggcc agggggatca ccatccgtcg 3180 ccccggcgtg tcaataatat cactctgtac atccacaaac agacgataac ggctctctct 3240 tttataggtg taaaccttaa actgccgtac gtataggctg cgcaactgtt gggaagggcg 3300 atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg 3360 attaagttgg gtaacgccag ggttttccca gtcacgacgt tgtaaaacga cggccagtga 3420 attgtaatac gattcactat agggcgaatt gggccctcta gatgcatgct cgagcggccg 3480 ccagtgtgat ggatatctgc agaattcgcc cttgtgggga cagaaggtct ggagctgccc 3540 gtgaagggca gaatgctgcc ctcagacccg cttcctccct gtccttgtct gtccaaggag 3600 aatgaggtct cactggtgga tttcggacta ccctgaggag ctggcacctg agggacaagg 3660 ccccccacct gcccagctcc agcctctgat gaggggtggg agagagctac atgaggttgc 3720 taagaaagcc tcccctgaag gagaccacac agtgtgtgag gttggagtct ctagcagcgg 3780 gttctgtgcc cccagggata gtctggctgt ccaggcactg ctcttgatat aaacaccacc 3840 tcctagttat gaaaccatgc ccattctgcc tctctgtatg gaaaagagca tggggctggc 3900 ccgtggggtg gtgtccactt taggccctgt gggagatcat gggaacccac gcagtgggtc 3960 ataggctctc tcatttacta ctcacatcca ctctgtgaag aagcgattat gatctctcct 4020 ctagaaactc gtagagtccc atgtctgccg gcttccagag cctgcactcc tccaccttgg 4080 cttggctttg ctggggctag aggagctagg atgcacagca gctctgtgac cctttgtttg 4140 agaggaacag gaaaaccacc cttctctctg gcccactgtg tcctcttcct gccctgccat 4200 ccccttctgt gaatgttaga cccatgggag cagctggtca gaggggaccc cggcctgggg 4260 cccctaaccc tatgtagcct cagtcttccc atcaggctct cagctcagcc tgagtgttga 4320 ggccccagtg gctgctctgg gggcctcctg agtttctcat ctgtgcccct ccctccctgg 4380 cccaggtgaa ggtgtggttc cagaaccgga ggacaaagta caaacggcag aagctggagg 4440 aggaagggcc tgagtccgag cagaagaaga agggctccca tcacatcaac cggtggcgca 4500 ttgccacgaa gcaggccaat ggggaggaca tcgatgtcac ctccaatgac tagggtgggc 4560 aaccacaaac ccacgagggc agagtgctgc ttgctgctgg ccaggcccct gcgtgggccc 4620 aagctggact ctggccactc cctggccagg ctttggggag gcctggagtc atggccccac 4680 agggcttgaa gcccggggcc gccattgaca gagggacaag caatgggctg gctgaggcct 4740 gggaccactt ggccttctcc tcggagagcc tgcctgcctg ggcgggcccg cccgccaccg 4800 cagcctccca gctgctctcc gtgtctccaa tctccctttt gttttgatgc atttctgttt 4860 taatttattt tccaggcacc actgtagttt agtgatcccc agtgtccccc ttccctatgg 4920 gaataataaa agtctctctc ttaatgacac gggcatccag ctccagcccc agaaagggcg 4980 aattccagca cactggcggc cgttactagt ggatccgagc tcggtaccaa gcttggcgta 5040 atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 5100 acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 5160 aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 5220 atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgct 5267

Claims

서열번호 3의 아미노산 서열로 이루어진 Cas12a 단백질.
제1항에 있어서,
상기 서열번호 3의 아미노산 서열로 이루어진 Cas12a 단백질은 서열번호 4의 염기서열에 의해 코딩되는 것인, Cas12a 단백질.
제1항에 있어서,
상기 단백질이 엔도뉴클레아제 활성을 갖는 것을 특징으로 하는, Cas12a 단백질.
제1항에 있어서,
상기 서열번호 3의 아미노산 서열로 이루어진 Cas12a 단백질은 pH 7.0 내지 pH 7.9에서 최적의 활성을 갖는 것을 특징으로 하는, Cas12a 단백질.
서열번호 3의 아미노산 서열 중 930번째 위치의 라이신(Lys)이 다른 아미노산으로 치환된 Cas12a 단백질.
제5항에 있어서,
상기 다른 아미노산은 아르기닌(Arg), 히스티딘(His), 아스파르트산(Asp), 글루탐산(Glu), 세린(Ser), 트레오닌(Thr), 아스파라긴(Asn), 글루타민(Gln), 티로신(Tyr), 알라닌(Ala), 이소류신(Ile), 류신(Leu), 발린(Val), 페닐알라닌(Phe), 메티오닌(Met), 트립토판(Trp), 글리신(Gly), 프롤린(Pro), 및 시스테인(Cys)으로 구성된 군에서 선택되는 어느 하나인, Cas12a 단백질.
서열번호 3의 아미노산 서열 중 873번째 위치의 아스파르트산(Asp)이 다른 아미노산으로 치환된 Cas12a 단백질.
제7항에 있어서,
상기 다른 아미노산은 아르기닌(Arg), 히스티딘(His), 글루탐산(Glu), 세린(Ser), 트레오닌(Thr), 아스파라긴(Asn), 글루타민(Gln), 티로신(Tyr), 알라닌(Ala), 라이신(Lys), 이소류신(Ile), 류신(Leu), 발린(Val), 페닐알라닌(Phe), 메티오닌(Met), 트립토판(Trp), 글리신(Gly), 프롤린(Pro), 및 시스테인(Cys)으로 구성된 군에서 선택되는 어느 하나인, Cas12a 단백질.
제7항에 있어서,
상기 단백질이 엔도뉴클레아제 활성이 감소된 것인, Cas12a 단백질.
제1항 또는 제5항에 기재된 Cas12a 단백질; 및 암세포에 특이적으로 존재하는 핵산 서열을 타겟팅하는 crRNA를 유효성분으로 포함하는 암 치료용 약학적 조성물.
제10항에 있어서,
상기 Cas12a 단백질은 서열번호 3 또는 서열번호 6의 아미노산 서열로 이루어진 것인, 약학적 조성물.