KR20200018364A - 신규한 crispr 연관 단백질 및 이의 용도 - Google Patents
신규한 crispr 연관 단백질 및 이의 용도 Download PDFInfo
- Publication number
- KR20200018364A KR20200018364A KR1020190169918A KR20190169918A KR20200018364A KR 20200018364 A KR20200018364 A KR 20200018364A KR 1020190169918 A KR1020190169918 A KR 1020190169918A KR 20190169918 A KR20190169918 A KR 20190169918A KR 20200018364 A KR20200018364 A KR 20200018364A
- Authority
- KR
- South Korea
- Prior art keywords
- lys
- ile
- leu
- glu
- asn
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
- A61K31/7105—Natural ribonucleic acids, i.e. containing only riboses attached to adenine, guanine, cytosine or uracil and having 3'-5' phosphodiester links
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/43—Enzymes; Proenzymes; Derivatives thereof
- A61K38/46—Hydrolases (3)
- A61K38/465—Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Medicinal Chemistry (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Biochemistry (AREA)
- Epidemiology (AREA)
- Microbiology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Immunology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Gastroenterology & Hepatology (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
본 발명은 신규한 CRISPR 연관 단백질 및 이의 용도에 관한 것이다. 본 발명에 따른 서열번호 1 또는 서열번호 3의 아미노산 서열로 표시되는 단백질은 가이드 RNA와 결합된 세포 내 핵산 서열을 인식하여 절단하는 엔도뉴클레아제 활성을 가진다. 따라서, 본 발명의 신규한 CRISPR 연관 단백질은 CRISPR-Cas 시스템에서 유전체를 교정하는 또 다른 뉴클레아제로서 사용될 수 있다.
Description
본 발명은 신규한 CRISPR 연관 단백질 및 이의 용도에 관한 것이다.
유전체 교정(Genome Editing)이란 생명체의 유전정보를 자유롭게 교정하는 기술이다. 생명과학분야의 진보와 유전체 서열 분석 기술의 발전을 통해 우리는 다양한 유전정보에 대해 폭넓게 이해할 수 있게 되었다. 예를 들어 동식물의 번식, 질병과 성장, 다양한 인간 유전질병을 일으키는 유전자 변이, 바이오연료의 생산 등을 위한 유전자에 대한 이해는 이미 확보된 상황이지만 이를 직접적으로 활용하여 생명체를 개선하고, 인간 질병을 치료하는 수준에까지 이르기 위해서는 그 이상의 기술 진보가 필수적이다.
유전체 교정 기술은 인간을 포함하여 동물, 식물, 미생물의 유전정보를 변화시켜 그 활용범위를 획기적으로 확장시킬 수 있다. 유전자가위는 원하는 유전정보를 정확히 자를 수 있도록 설계되어 만들어지는 분자 도구로 유전체 교정 기술에서 핵심역할을 하고 있다. 유전자 서열분석 분야를 한 차원 발전시켰던 차세대시퀀싱(Next generation sequencing) 기술과 같이, 유전자가위는 유전정보 활용의 속도와 그 범위를 확장시키고 새로운 산업분야를 창출해 내는 핵심 기술이 되고 있다.
지금까지 개발된 유전자 가위는 그 순서에 따라 3세대로 나눌 수 있다. 1세대 유전자 가위는 ZFN(Zinc Finger Nuclease), 2세대 유전자 가위는 TALEN(Transcription Activator-Like Effector Nuclease), 가장 최근에 연구된 CRISPR(Clustered regularly interspaced short palindromic repeat)-Cas(CRISPR-associated)9은 3세대 유전자 가위다
CRISPRs는 유전자 서열이 밝혀진 박테리아의 대략 40% 및 유전자 서열이 밝혀진 고세균의 90%의 유전체에서 발견되는 여러 짧은 직접 반복을 포함하는 좌위이다. Cas 단백질은 CRISPR RNA(crRNA) 및 trans-activating crRNA(tracrRNA)로 명명된 두 개의 RNA와 복합체를 형성했을 때, 활성 엔도뉴클레아제(endonuclease)를 형성하고, 그렇게 함으로써 파지 또는 플라스미드의 침입에서 외부 유전적 요소를 묵살하여 숙주 세포를 보호한다. crRNA는 전달에 외부 침입자로부터 점유되었던 숙주 유전체의 CRISPR 요소로부터 전사된다.
이러한 CRISPR-Cas 시스템 유래의 RNA-가이드 뉴클레아제(RNA-guided nuclease)는 유전체를 교정할 수 있는 수단을 제공해준다. 특히, 단일 가이드 RNA(sgRNA)와 Cas 단백질을 이용하여 세포 및 기관의 유전체를 편집할 수 있는 기술과 관련된 연구들이 활발히 진행되어왔다. 최근, Cpf1 단백질(Prevotella 및 Francisella 1 유래)이 CRISPR-Cas 시스템의 또 다른 뉴클레아제 단백질로서 보고되었고(B. Zetsche, et al., 2015), 이에 따라 유전체 교정에 있어서 선택의 폭이 넓어졌다.
B. Zetsche, et al., Cpf1 is a single RNA-guided endonuclease of a class 2 CRISPR-Cas system, Cell, 2015, 163, 759-771.
본 발명자들은 유전체 교정에 있어서 기존에 알려진 뉴클레아제보다 더 효과적인 단백질을 개발하기 위하여 지속적으로 연구한 결과, 표적 핵산 서열을 인식하여 절단하는 신규한 CRISPR 연관 단백질을 발견하여 본 발명을 완성하였다.
따라서, 본 발명의 목적은 표적 핵산 서열을 인식하여 절단하는 신규한 CRISPR 연관 단백질을 제공하는 것이다.
상기 목적을 달성하기 위해, 본 발명은 서열번호 1의 아미노산 서열을 갖는 Cas12a 단백질을 제공한다.
또한, 본 발명은 서열번호 1의 아미노산 서열 중 925번째 위치의 라이신(Lys)이 다른 아미노산으로 치환된 Cas12a 단백질을 제공한다.
또한, 본 발명은 서열번호 3의 아미노산 서열을 갖는 Cas12a 단백질을 제공한다.
또한, 본 발명은 서열번호 3의 아미노산 서열 중 930번째 위치의 라이신(Lys)이 다른 아미노산으로 치환된 Cas12a 단백질을 제공한다.
또한, 본 발명은 서열번호 1의 아미노산 서열 중 877번째 위치의 아스파르트산(Asp)이 다른 아미노산으로 치환된 Cas12a 단백질을 제공한다.
또한, 본 발명은 서열번호 3의 아미노산 서열 중 873번째 위치의 아스파르트산(Asp)이 다른 아미노산으로 치환된 Cas12a 단백질을 제공한다.
또한, 본 발명은 mgCas12a; 및 암세포에 특이적으로 존재하는 핵산 서열을 타겟팅하는 crRNA를 유효성분으로 포함하는 암 치료용 약학적 조성물을 제공한다.
본 발명에 따른 서열번호 1 또는 서열번호 3의 아미노산 서열로 표시되는 단백질은 가이드 RNA와 결합된 세포 내 핵산 서열을 인식하여 절단하는 엔도뉴클레아제 활성을 가진다. 따라서, 본 발명의 신규한 CRISPR 연관 단백질은 CRISPR-Cas 시스템에서 유전체를 교정하는 또 다른 뉴클레아제로서 사용될 수 있다.
도 1은 메타지놈으로부터 Cas12a를 발굴하는 과정을 도식화한 것이다.
도 2a는 발굴된 Cas12a의 계통수를 나타낸 것이다.
도 2b는 신규 Cas12a와 AsCas12a의 구조도를 나타낸 것이다.
도 3 내지 도 8은 ESPript 프로그램을 이용하여 정렬한 기존의 Cas12a 및 본 발명의 mgCas12a의 아미노산 서열을 나타낸 것이다.
도 9a 및 9b는 Cas12a 및 본 발명의 mgCas12a의 서열 정보를 비교 및 정리하여 표로 나타낸 것이다.
도 10 내지 도 12는 pH에 따른 본 발명에 따른 mgCas12a의 활성을 확인한 것이다. 한편, 도 10의 crRNA #1은 서열번호 25의 염기서열을 가지고, 도 11의 crRNA #2는 서열번호 26의 염기서열을 가진다.
도 13은 표적 핵산 서열 및 crRNA가 결합하는 위치를 표시하여 나타낸 것이다.
도 14는 CCR5 및 DNMT1 각 유전자의 crRNA를 이용한 유전자 편집 효율을 단백질별(mock, mgCas12a-1 및 mgCas12a-2)로 나타낸 것이다.
도 15는 FucT14-1 및 FucT14-2 각 유전자의 두 가지 crRNA를 이용한 유전자 편집 효율을 단백질별(FnCpf1, mgCas12a-1 및 mgCas12a-2)로 확인하여 나타낸 것이다.
도 16a 및 도 16b는 FnCas12a, WT mgCas12a-1 또는 WT mgCas12a-2 단백질의 DNA 절단 활성을 확인한 것이다.
도 17은 기존 Cas12a(AsCas12a, FnCas12a 또는 LbCas12a)와 신규 Cas12a(WT mgCas12a-1, d_mgCas12a-1, WTmgCas12a-2 또는 d_mgCas12a-2)의 비특이적인 DNase 기능을 확인한 것이다.
도 18a 및 도 18b는 crRNA 없이 FnCas12a, WT mgCas12a-1 또는 WT mgCas12a-2 단백질이 비특이적인 DNase 기능을 가지는지를 확인한 것이다.
도 19는 mgCas12a가 기존 Cas12a의 5' handle을 이용하여 DNA 절단이 가능한지를 확인한 것이다.
도 20a 및 도 20b는 이가이온들에서 FnCas12a, mgCas12a-1 또는 mgCas12a-2 단백질의 DNA 절단 활성을 나타낸 것이다.
도 2a는 발굴된 Cas12a의 계통수를 나타낸 것이다.
도 2b는 신규 Cas12a와 AsCas12a의 구조도를 나타낸 것이다.
도 3 내지 도 8은 ESPript 프로그램을 이용하여 정렬한 기존의 Cas12a 및 본 발명의 mgCas12a의 아미노산 서열을 나타낸 것이다.
도 9a 및 9b는 Cas12a 및 본 발명의 mgCas12a의 서열 정보를 비교 및 정리하여 표로 나타낸 것이다.
도 10 내지 도 12는 pH에 따른 본 발명에 따른 mgCas12a의 활성을 확인한 것이다. 한편, 도 10의 crRNA #1은 서열번호 25의 염기서열을 가지고, 도 11의 crRNA #2는 서열번호 26의 염기서열을 가진다.
도 13은 표적 핵산 서열 및 crRNA가 결합하는 위치를 표시하여 나타낸 것이다.
도 14는 CCR5 및 DNMT1 각 유전자의 crRNA를 이용한 유전자 편집 효율을 단백질별(mock, mgCas12a-1 및 mgCas12a-2)로 나타낸 것이다.
도 15는 FucT14-1 및 FucT14-2 각 유전자의 두 가지 crRNA를 이용한 유전자 편집 효율을 단백질별(FnCpf1, mgCas12a-1 및 mgCas12a-2)로 확인하여 나타낸 것이다.
도 16a 및 도 16b는 FnCas12a, WT mgCas12a-1 또는 WT mgCas12a-2 단백질의 DNA 절단 활성을 확인한 것이다.
도 17은 기존 Cas12a(AsCas12a, FnCas12a 또는 LbCas12a)와 신규 Cas12a(WT mgCas12a-1, d_mgCas12a-1, WTmgCas12a-2 또는 d_mgCas12a-2)의 비특이적인 DNase 기능을 확인한 것이다.
도 18a 및 도 18b는 crRNA 없이 FnCas12a, WT mgCas12a-1 또는 WT mgCas12a-2 단백질이 비특이적인 DNase 기능을 가지는지를 확인한 것이다.
도 19는 mgCas12a가 기존 Cas12a의 5' handle을 이용하여 DNA 절단이 가능한지를 확인한 것이다.
도 20a 및 도 20b는 이가이온들에서 FnCas12a, mgCas12a-1 또는 mgCas12a-2 단백질의 DNA 절단 활성을 나타낸 것이다.
본 발명은 일 측면으로, 메타지놈에서 수득한 신규한 Cas12a 단백질을 제공한다.
본 명세서에서 사용한 용어 “Cas12a”는 CRISPR 연관 단백질로서, Cpf1로도 지칭될 수 있다. 또한, Cpf1은 type V CRISPR 시스템 단백질이다. Cas12a는 단일 단백질로서, crRNA과 결합하여 표적 유전자를 절단한다는 점은 type II CRISPR 시스템 단백질인 Cas9와 유사하다. 다만, 그 작동 방식에서 차이가 있다. Cas12a 단백질은 하나의 crRNA로 작동한다. 따라서, Cas9의 경우와 같이 crRNA와 trans-activating crRNA(tracrRNA)를 동시에 사용하거나, 인위적으로 tracrRNA와 crRNA를 합친 single guide RNA(sgRNA)를 제작할 필요가 없다.
또한, Cas12a 시스템은 Cas9와 달리 PAM이 표적 서열의 5' 위치에 존재한다. 또한, Cas12a 시스템은 표적을 결정하는 guide RNA의 길이도 Cas9에 비해 짧다. 또한, Cas12a는 표적 DNA가 절단된 위치에 blunt-end가 아닌 5' overhang(sticky end)을 발생시키므로, 보다 정확하고 다양한 유전자 교정이 가능하다는 이점을 갖는다.
종래에 Cas12a 단백질은 캔디다투스(Candidatus) 속, 라치노스피라(Lachnospira) 속, 뷰티리비브리오(Butyrivibrio) 속, 페레그리니박테리아(Peregrinibacteria), 액시도미노코쿠스(Acidominococcus) 속, 포르파이로모나스(Porphyromonas) 속, 프레보텔라(Prevotella) 속, 프란시셀라(Francisella) 속, 캔디다투스 메타노플라스마(Candidatus Methanoplasma), 또는 유박테리움(Eubacterium) 속 유래의 것일 수 있다. 구체적으로, PbCas12a는 Parcubacteria bacterium GWC2011_GWC2_44_17에서 유래한 단백질이며, PeCas12a는 Peregrinibacteria Bacterium GW2011_GWA_33_10에서 유래한 단백질이며, AsCas12a는 Acidaminococcus sp. BVBLG에서 유래한 단백질이며, PmCas12a는 Porphyromonas macacae에서 유래한 단백질이며, LbCas12a는 Lachnospiraceae bacterium ND2006에서 유래한 단백질이며, PcCas12a는 Porphyromonas crevioricanis에서 유래한 단백질이며, PdCas12a는 Prevotella disiens에서 유래한 단백질이며, FnCas12a는 Francisella novicida U112에서 유래한 단백질이다. 다만, Cas12a 단백질은 유래된 미생물에 따라 다른 활성을 가질 수 있다.
본 발명은 메타지놈의 유전자들을 분석하여 새로운 Cas12a를 규명한 것이다. 이하, 메타지놈에서 유래한 Cas12a를 mgCas12a로 지칭할 수 있다. 본 발명의 mgCas12a도 AsCas12a와 같이, WED, REC, PI, RuvC, BH 및 NUC 도메인을 포함한다(도 2). 또한, 본 발명의 mgCas12a 단백질은 종래에 알려진 Cas12a 단백질과 동일하게, crRNA 및 5’-handle을 포함한 gRNA로 유전자를 절단할 수 있음을 확인하였다. mgCas12a는 FnCas12a와 동일한 서열을 가지는 5’-handle RNA를 이용함을 확인하였다. 구체적으로, 5’-handle RNA의 서열은 AAUUUCUACUGUUGUAGAU(서열번호 12)일 수 있다. 다만, AsCas12a 및 LbCas12a의 5’-handle RNA에도 작동함을 확인하였다(도 19).
상기 mgCas12a는 분리 정제를 위해 Tag를 추가적으로 포함할 수 있다. Tag는 mgCas12a의 N 말단 또는 C 말단에 결합될 수 있다. 또한, Tag는 mgCas12a의 N 말단 및 C 말단에 동시에 결합될 수 있다. 상기 Tag의 일 구체예로는 6XHis Tag일 수 있다.
mgCas12a의 일 구체예로 서열번호 1의 아미노산 서열을 갖는 단백질을 제공한다. 또한, 상기 mgCas12a의 활성이 변하지 않는 한, 일부 아미노산을 결실, 치환 시킬 수 있다. 구체적으로, 서열번호 1의 아미노산 서열 중 925번째 위치의 라이신(Lys)이 다른 아미노산으로 치환된 단백질 일 수 있다. 이때, 다른 아미노산은 아르기닌(Arg), 히스티딘(His), 아스파르트산(Asp), 글루탐산(Glu), 세린(Ser), 트레오닌(Thr), 아스파라긴(Asn), 글루타민(Gln), 티로신(Tyr), 알라닌(Ala), 이소류신(Ile), 류신(Leu), 발린(Val), 페닐알라닌(Phe), 메티오닌(Met), 트립토판(Trp), 글리신(Gly), 프롤린(Pro), 및 시스테인(Cys)으로 구성된 군에서 선택되는 어느 하나일 수 있다. 구체적으로, 상기 단백질은 서열번호 1의 아미노산 서열의 925번째 위치의 라이신이 글루타민으로 치환된 것일 수 있으며, 서열번호 5의 아미노산 서열을 가질 수 있다.
또한, 서열번호 1의 아미노산 서열을 갖는 단백질을 코딩하는 유전자는 서열번호 2의 염기 서열을 갖는 폴리뉴클레오티드일 수 있다. 또한, 본 발명에 따른 서열번호 1의 아미노산 서열을 갖는 mgCas12a는 pH 7.0 내지 pH 7.9에서 최적의 활성을 가질 수 있다.
mgCpf1의 또 다른 구체예로, 서열번호 3의 아미노산 서열을 갖는 단백질을 제공한다. 또한, 상기 mgCpf1의 활성이 변하지 않는 한, 일부 아미노산을 결실, 치환 시킬 수 있다. 구체적으로, 서열번호 3의 아미노산 서열 중 930번째 위치의 라이신(Lys)이 다른 아미노산으로 치환된 단백질 일 수 있다. 이때, 다른 아미노산은 아르기닌(Arg), 히스티딘(His), 아스파르트산(Asp), 글루탐산(Glu), 세린(Ser), 트레오닌(Thr), 아스파라긴(Asn), 글루타민(Gln), 티로신(Tyr), 알라닌(Ala), 이소류신(Ile), 류신(Leu), 발린(Val), 페닐알라닌(Phe), 메티오닌(Met), 트립토판(Trp), 글리신(Gly), 프롤린(Pro), 및 시스테인(Cys)으로 구성된 군에서 선택되는 어느 하나일 수 있다. 구체적으로, 상기 단백질은 서열번호 3의 아미노산 서열의 930번째 위치의 라이신이 글루타민으로 치환된 것일 수 있으며, 서열번호 6의 아미노산 서열을 가질 수 있다.
상기 서열번호 3의 아미노산 서열을 갖는 단백질을 코딩하는 유전자는 서열번호 4의 염기 서열을 갖는 폴리뉴클레오티드일 수 있다.
또한, 본 발명에 따른 서열번호 3의 아미노산 서열을 갖는 mgCas12a는 pH 7.0 내지 pH 7.9에서 최적의 활성을 가질 수 있다.
본 발명의 또 다른 측면으로는, mgCas12a에서 엔도뉴클레아제 활성이 감소된 단백질을 제공한다. 일 구체예로, 서열번호 1의 아미노산 서열을 가지는 mgCas12a의 877번째 아스파르트산(Asp)이 다른 아미노산으로 치환된 형태일 수 있다. 이때, 다른 아미노산은 아르기닌(Arg), 히스티딘(His), 글루탐산(Glu), 세린(Ser), 트레오닌(Thr), 아스파라긴(Asn), 글루타민(Gln), 티로신(Tyr), 알라닌(Ala), 라이신(Lys), 이소류신(Ile), 류신(Leu), 발린(Val), 페닐알라닌(Phe), 메티오닌(Met), 트립토판(Trp), 글리신(Gly), 프롤린(Pro), 및 시스테인(Cys)으로 구성된 군에서 선택되는 어느 하나일 수 있다. 구체적으로, 상기 아스파르트산(Asp)이 알라닌(Ala)으로 치환된 단백질일 수 있다.
또 다른 구체예로, 서열번호 3의 아미노산 서열을 가지는 mgCas12a의 873번째 아스파르트산(Asp)이 다른 아미노산으로 치환된 형태일 수 있다. 이때, 다른 아미노산은 아르기닌(Arg), 히스티딘(His), 글루탐산(Glu), 세린(Ser), 트레오닌(Thr), 아스파라긴(Asn), 글루타민(Gln), 티로신(Tyr), 알라닌(Ala), 라이신(Lys), 이소류신(Ile), 류신(Leu), 발린(Val), 페닐알라닌(Phe), 메티오닌(Met), 트립토판(Trp), 글리신(Gly), 프롤린(Pro), 및 시스테인(Cys)으로 구성된 군에서 선택되는 어느 하나일 수 있다. 구체적으로, 상기 아스파르트산(Asp)이 알라닌(Ala)으로 치환된 단백질일 수 있다. 이때, 엔도뉴클레아제 활성이 감소된 mgCas12a를 dead mgCas12a 또는 d_mgCas12a로 지칭할 수 있다. 상기 d_mgCas12a는 서열번호 13 또는 서열번호 14의 아미노산 서열을 가질 수 있다.
또한, 본 발명의 또 다른 측면으로, mgCas12a; 및 암세포에 특이적으로 존재하는 핵산 서열을 타겟팅하는 crRNA를 유효성분으로 포함하는 암 치료용 약학적 조성물을 제공한다. 이때, 상기 mgCas12a는 서열번호 1, 서열번호 3, 서열번호 5 및 서열번호 6으로 이루어진 군에서 선택되는 어느 하나의 아미노산 서열을 가질 수 있다. 본 명세서에서 사용된 용어, “암세포에 특이적으로 존재하는 핵산 서열”은 정상세포에는 존재하지 않으나 암세포에만 존재하는 핵산 서열을 의미한다. 즉, 정상 세포와 상이한 서열을 의미하며, 적어도 1개의 핵산이 상이할 수 있다. 또한, 유전자의 일부가 치환, 결실된 것일 수 있다. 일 구체예로 암세포에 특이적으로 존재하는 서열은 암세포에 존재하는 SNP일 수 있다. 상기 서열을 갖는 암세포 내에 존재하는 타겟 DNA와 타겟 RNA에 상보적인 서열을 갖는 가이드 RNA는 서로 특이적으로 결합한다.
특히, 암세포에 특이적으로 존재하는 핵산 서열은 여러 암조직의 유전체 서열분석으로부터 암세포에만 존재하는 특이적 SNP를 찾아서 이를 이용해서 crRNA를 제작할 수 있다. 따라서, 암세포 특이적 독성을 나타내는 방식이므로, 환자 맞춤형 항암치료제 개발이 가능할 수 있다. 뿐만 아니라, 암세포에 특이적으로 존재하는 핵산 서열은 정상세포와 달리 암세포에서 높은 CNV(copy number variation)를 가지는 유전자 일 수 있다.
상기 암의 일 구체예는 방광암, 골암, 혈액암, 유방암, 흑색종양, 갑상선암, 부갑상선암, 골수암, 직장암, 인후암, 후두암, 폐암, 식도암, 췌장암, 대장암, 위암, 설암, 피부암, 뇌종양, 자궁암, 두부 또는 경부암, 담낭암, 구강암, 결장암, 항문 부근암, 중추신경계 종양, 간암 및 대장암으로 구성된 군으로부터 선택되는 어느 하나일 수 있다. 특히, 우리나라 5대 암으로 알려진 위암, 대장암, 간암, 폐암, 유방암일 수 있다.
이때, 상기 암세포에 특이적으로 존재하는 핵산 서열을 타겟팅하는 crRNA는 하나 이상의 gRNA 서열을 포함할 수 있다. 예를 들어, 난소암 또는 유방암에 존재하는 BRCA1의 엑손 10 또는 11을 동시에 타겟팅할 수 있는 gRNA를 사용할 수 있다. 또한, BRCA1의 엑손 11을 타겟팅 하는 두개 이상의 gRNA를 사용할 수 있다. 이와 같이 gRNA의 조합은 암 치료 목적 및 암의 종류에 따라 적합하게 선택될 수 있다. 즉, 서로 다른 gRNA를 선택하여 사용할 수 있다.
이하, 본 발명을 하기 실시예에 의하여 더욱 상세하게 설명한다. 단, 하기 실시예는 본 발명을 예시하기 위한 것일 뿐, 본 발명의 범위가 이들만으로 한정되는 것은 아니다.
실시예 1. 메타지놈 유래의 Cas12a 단백질 발굴
NCBI Genbank BLAST 데이터베이스에서 메타지놈 염기서열을 다운로드하고 로컬 BLASTp 데이터베이스로 구축하였다. 또한, 16개의 Cas12a과 다양한 CRISPR 관련 단백질(Cas1) 아미노산 서열을 Uniprot 데이터베이스에서 다운로드하였다. MetaCRT 프로그램을 이용하여 메타지놈에서 CRISPR 리피트(repeat)와 스페이서(spacer) 서열을 발견하였다. 그리고, CRISPR 서열을 갖는 메타지놈 서열만 추출하여 Prodigal 프로그램을 이용하여 유전자를 예측하였다.
상기 예측된 유전자 중, CRISPR 서열의 상하위 10 kb 범위 안에 있는 것을 추출하였고, Cas12a 아미노산 서열을 이용하여 해당 유전자 중 Cas12a의 호몰로그(homolog)를 예측하였다. Cas1 유전자를 이용하여 Cas12a 호몰로그의 상하위에 Cas1 호몰로그가 있는지 예측하였고, Cas1을 주위에 갖는 800 aa 내지 1,500 aa 범위의 Cas12a 유전자들을 선별하였다. 이들을 대상으로 NCBI Genbank non-redundant 데이터베이스에서 BLASTp를 이용하여, 이미 보고된 바 있는 유전자인지, 또한 전혀 CRISPR와 관계 없는 유전자는 아닌지 판별하였다.
메티오닌(Met)으로 시작하지 않는 조각난 Cas12a를 제외한 후, 이들을 MAFFT(multiple alignment using fast fourier transform) 프로그램을 이용하여 정렬하였다. 그 후, MEGA7을 이용하여 Neighbor-joining(100x부트스트랩(bootstrap))으로 계통수를 그렸다. 기존에 알려진 Cas12a 유전자와 단계통군을 이루는 유전자를 선별하여, 기존의 Cas12a 아미노산 서열과 함께 MEGA7, 최대공산(maximum-likelihood), 1000x 부트스트랩(bootstrap)으로 계통수를 그려 진화적 유연관계를 살폈다. 이때, 상기 메타지놈으로부터의 Cas12a 발굴과정을 도 1에 도식화하여 나타내다. 또한, Cas12a의 계통수를 도 2a에 나타내었다. 이때, 서열번호 1의 아미노산 서열을 가지는 신규한 단백질을 WT mgCas12a-1 이라고 명명하였다. 또한, 서열번호 3의 아미노산 서열을 가지는 신규한 단백질을 WT mgCas12a-2라고 명명하였다. 또한, 이때, AsCas12a와 mgCas12a-1 및 mgCas12a-2의 구조도를 도 2b에 나타내었다.
실시예 2. mgCas12a의 변이체 제작
ESPript 프로그램을 이용하여 Cas12a 후보군을 AsCas12a 및 LbCas12a의 구조를 기반으로 하여 정렬하였다. 상기 WT mgCas12a-1 및 WT mgCas12a-2에서 엔도뉴클레아제의 활성을 높이기 위해서 일부 아미노산을 치환하였다. WT mgCas12a-1의 925번째 아미노산인 Lys(K)를 Glu(Q)으로 치환한 것을 mgCas12a-1로 명명하였다. 또한, WT mgCas12a-2의 930번째 아미노산인 Lys(K)를 Glu(Q)으로 치환한 것을 mgCas12a-2로 명명하였다. 인간과 애기장대, 대장균의 코돈 사용빈도(codon usage)를 고려하여, 코돈 최적화(codon optimization)를 진행한 후 Bionics에 유전자 합성을 의뢰하였다. 이때, 인간 코돈 최적화된 mgCas12a-1 및 mgCas12a-2의 염기서열을 각각 서열번호 7 및 서열번호 8에 나타내었다. 또한, 상기 ESPript 프로그램을 이용하여 정렬한 기존의 Cas12a(AsCas12a(서열번호 9), LbCas12a(서열번호 10), FnCas12a(서열번호 11)) 및 Cas12a 후보군(mgCas12a-1 및 mgCas12a-2)의 아미노산 서열을 도 3 내지 도 8에 나타내었으며, 이들의 서열 정보를 비교 정리하여 도 9a 및 도 9b에 나타내었다.
그리고, pUC57 벡터에 클로닝된 WT mgCas12a-1, WT mgCas12a-2, mgCas12a-1 및 mgCas12a-2 유전자를 다시 pET28a-KanR-6xHis-BPNLS 벡터에 삽입한 후 클로닝하였다. 클로닝된 벡터는 대장균 DH5a와 로제타(Rosetta) 균주에 각각 형질전환하였다. crRNA의 5'-핸들 서열을 메타지놈 CRISPR 반복 서열에서 추출하였다. 추출된 RNA를 DNA 올리고로 합성하였다. DNA 올리고머를 MEGAshortscript T7 RNA 전사효소 키트를 이용하여 전사하였고, 전사된 5'-핸들의 농도를 FLUOstar Omega로 확인하였다.
실시예 3. 단백질 발현과 정제
하룻밤 동안 배양한 로제타(DE3) 대장균 5 ml를 100 mg/ml의 카나마이신 항생제를 추가한 500 ml의 액체 TB 배지에 접종하였다. 배지는 37℃ 배양기에서 0.6 OD600이 될 때까지 배양하였다. 단백질 발현을 위해 0.4 uM의 IPTG(Isopropyl β- D-1-thiogalactopyranoside)를 처리한 뒤, 22℃에서 16 내지 18시간 더 배양하였다. 원심분리 후 수득한 세포를 10 ml의 용해 버퍼(20 mM HEPES pH 7.5, 100 mM KCl, 20 mM 이미다졸, 10% 글리세롤 및 EDTA-프리 프로테아제 인히비터 칵테일)와 혼합한 후, 초음파를 처리하여 세포를 분쇄하였다. 분쇄물을 6,000 rpm에서 20분간 세 번 원심분리한 후 0.22 마이크론 필터로 여과하였다.
이후, 니켈 컬럼(HisTrap FF 5 ml) 및 300 mM 이미다졸 버퍼를 이용하여 세척 및 용출하였고 친화-크로마토그래피로 단백질을 정제하였다. SDS-PAGE 전기영동으로 단백질의 크기를 확인하였고, 투석 버퍼(20 mM HEPES pH 7.5, 100 mM KCl, 1 mM DTT, 10% 글리세롤)로 하룻밤 동안 투석하였다. 이후, 단백질 크기에 맞춰 선택적으로 여과 및 농축(Amicon Ultra Centrifugal Filter 100,000 MWCO)하였다. 브래드포드 정량법으로 농도를 측정한 후, -80℃에 보관 및 사용하였다.
실시예 4. 클리비지 분석을 통한 mgCas12a에 적합한 pH 범위 확인
상추(Lactuca sativa)의 자일로실트랜스퍼레이즈(xylosyltransferase)를 PCR로 증폭하여 PAM(protospacer adjacent motif)을 예측하였고, 가이드 RNA(gRNA)를 디자인하였다. mgCas12a-1 및 mgCas12a-2의 RNP(ribonucleoprotein) 복합체를 mgCas12a 단백질 및 gRNA가 1:1.25의 분자비가 되도록 하여 상온에서 20분간 혼합하여, RNP 복합체를 제작하였다. 정제된 자일로실트랜스퍼레이즈 PCR 프로덕트를 다양한 농도로 RNP에 처리한 후, NEBuffer 1.1(1X Buffer Components, 10 mM Bis-Tris-Propane-HCl, 10 mM MgCl2 및 100 ㎍/ml BSA), NEBuffer 2.1(1X Buffer Components, 50 mM NaCl, 10 mM Tris-HCl, 10 mM MgCl2 및 100 ㎍/ml BSA) 및 NEBuffer 3.1(1X Buffer Components, 100 mM NaCl, 50 mM Tris-HCl, 10 mM MgCl2 및 100 ㎍/ml BSA)로 농도를 맞추어 37℃에서 in vitro 클리비지(cleavage) 분석을 실시하였다. 이때, NEBuffer 1.1, NEBuffer 2.1 및 NEBuffer 3.1는 25℃에서 각각 pH 7.0, pH 7.9 및 pH 7.9 값을 갖는다. 각 반응이 완료된 후 65℃에서 10분간 인큐베이션하여 반응을 정지하였으며, 완료된 반응을 1.5% 아가로스 겔 전기영동을 통해 확인하였다. 그 결과를 도 10 내지 도 12에 나타내었다. 도 10 내지 도 12에서 mgCas12a-1 및 mgCas12a-2를 hemgCas12a-1 및 hemgCas12a-2로 표기하였다. 또한, 상기 자일로실트랜스퍼레이즈에서 표적 핵산 서열 및 crRNA가 결합하는 위치를 표시하여 도 13에 나타내었다.
도 10 내지 도 12에 나타난 바와 같이, mgCas12a-1 및 crRNA 복합체에 NEBuffer 1.1을 처리한 경우 표적 dsDNA가 절단되었다. 또한, mgCas12a-2 및 crRNA 복합체에 NEBuffer 1.1을 처리한 경우 표적 dsDNA가 절단되었다. 이를 통해, mgCas12a-1 및 mgCas12a-2는 pH 7.0에서 활성이 활발해짐을 알 수 있었다.
실시예 5. 동물세포에서 mgCas12a의 유전자 편집 효율 분석
실시예 5.1. CCR5 및 DNMT1의 유전자 편집을 위한 mgCas12a-1 및 mgCas12a-2를 포함한 RNP 제작
HEK 293T 세포를 10% 태아 소혈청인 FBS와 P/S(penicillin-streptomycin)가 함유된 DMEM 배지에서 37℃의 온도로 5% CO2 배양기에서 배양하였다. 각각 100 pmole의 mgCas12a-1 단백질 및 mgCas12a-2 단백질과 200 pmole의 CCR5 및 DNMT1를 타겟팅하는 crRNA를 상온에서 20분간 배양하여 RNP를 제작하였다. 이때, 상기 CCR5 및 DNMT1의 crRNA 서열은 IDT(Integrated DNA Technologies)로부터 합성하였고, 이를 하기 표 1에 나타내었다.
Genes | crRNA sequence (5'-3') |
CCR5 | CACCGAAUUUCUACUGUUGUAGAUGGAGUGAAGGGAGAGUUUGUCAAUUUUUUG (서열번호 12) |
DNMT1 | GGUCAAUUUCUACUGUUGUAGAUGCUCAGCAGGCACCUGCCUCUUUU (서열번호 13) |
상기 배양된 HEK293T 세포 2x105개를 20 μl의 뉴클레오펙션(nucleofection) 시약과 혼합한 후, 이를 10 μl의 RNP 복합체와 혼합하였다. 이후, 형질감염을 위해 4D-Nucleofector 기기(Lonza)를 사용하였다. 형질감염한지 48시간 및 72시간이 지났을 때, PureLinkTM Genomic DNA Mini Kit(invitrogen)를 사용하여 상기 세포로부터 genomic DNA를 추출하였다.
실시예 5.2. 표적 부위에 대한 염기서열 분석
상기 실시예 5.1에서 추출한 genomic DNA를 하기 표 2에 나타낸 CCR5와 DNMT1의 어댑터 프라이머(primer)를 이용하여 증폭시켰다.
Genes | Adapter primer sequence (5'-3') |
CCR5 | TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGGGTATTTCTGTTCAGATCAC (서열번호 15) |
GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGGCCCATCAATTATAGAAAGCC (서열번호 16) | |
DNMT1 | TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGCTGCACACAGCAGGCCTTTG (서열번호 17) |
GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGCCCAATAAGTGGCAGAGTGC (서열번호 18) |
이후, 일루미나(Illumina)의 프로토콜대로 정제 과정 및 시퀀싱 라이브러리를 제조한 후, MiniSeq 장비를 이용하여 표적 부위에 대한 deep sequencing 분석을 진행하였다. mgCas12a-1와 mgCas12a-2 단백질에 의한 유전자 편집 효율을 도 14에 나타내었고, 표적 부위에 대한 시퀀싱 분석 결과를 하기 표 3에 나타내었다. 도 14에 나타난 바와 같이, mock 단백질보다 mgCas12a-1와 mgCas12a-2 단백질에 의한 유전자 편집 효율이 더 높게 나타났다
실시예 6. 식물세포에서 mgCas12a 의 유전자 편집 효율 분석
실시예 6.1. 식물 원형질체 분리
담배 종자를 50% Clorox로 1분간 처리하여 종자를 멸균하였다. 멸균된 종자를 종자파종 배지에 올려 일주일간 배양한 후, 배양에 사용되는 마젠타 박스(magenta box)에 옮겨 3주 동안 키웠다. 배양 빛 조건은 광배양 16시간 및 암배양 8시간이며, 25℃ 내지 28℃의 온도에서 키웠다. 식물은 4주 내지 6주 자란 잎을 사용하였고, 상기 잎을 유리판에 올려 잎병과 잎끝 부분을 자른 후 잎 안쪽부분만을 사용하였다. 이때, 0.5 mm 이하로 잘랐다. 자른 잎은 Enzyme 용액 10 mL에 올려 상온에서 암 상태로 3시간 내지 4시간 동안 orbital shaker(50 rpm) 위에서 배양하였다.
배양 후, W5 용액 10 mL을 첨가하고 조심스럽게 잘 섞어주었다. Cell strainer(70 μm)를 이용하여 Enzyme 용액 내에 존재하는 원형질체를 걸러주었다. 상기 걸러진 원형질체를 100 xg로 6분 동안 원심분리 하였다. 상층액을 버리고 MMG 용액을 첨가하여 조심스럽게 원형질체 펠렛을 풀어준 후, 아이스에서 10분 내지 30분 정도 두었다. 이 중 일부를 계수판인 Hem cytometer와 현미경을 이용하여 원형질체의 수를 계수하였다. 이후, MMG 용액을 더 첨가하여 원형질체의 농도가 2 X 106 세포/mL가 되도록 희석하였다. 상기 enzyme 용액, MMG 용액 및 PEG 용액의 구성을 하기 표 4에 나타내었다.
Enzyme 용액 | 20 mL |
1.0% Cellulase R10 | 200 mg |
0.5% Macerozyme R10 | 100 mg |
0.4 M Mannitol | 10 mL (0.8 M Mannitol Stock solution) |
20 mM MES, pH 5.7 | 4 mL (100 mM MES Stock solution, pH 5.7) |
20 mM KCl | 200 μL (2 M KCl Stock solution) |
위 시약들 조합한 후 60도에서 10분간 배양한 후 아래 시약을 조합한다. | |
10 mM CaCl2·2H2O | 200 μL (1 M CaCl2·2H2O Stock solution) |
0.1 % BSA | 200 μL (10% BSA Stock solution) |
MMG 용액 | 10 mL |
0.4 M Mannitol | 5 mL (0.8 M Mannitol Stock solution) |
4 mM MES, pH 5.7 | 400 μL (0.1 M MES Stock solution, pH5.7) |
15 mM MgCl2 | 150 μL (1 M MgCl2 Stock solution) |
Nuclease-free water | 4.45 mL |
PEG 용액 | 5 mL |
0.2 M Mannitol | 1.25 mL (0.8 M Mannitol Stock solution) |
40%W/V PEG-4000 | 2 g (Polyethylene glycol 4000) |
100 mM CaCl2·2H2O | 500 μL (1 M CaCl2·2H2O Stock solution) |
Nuclease-free water | 1.5 mL |
W5 용액 | 50 mL |
154 mM NaCl | 3.85 mL (2 M NaCl Stock solution) |
125 mM CaCl2·2H2O | 6.25 mL (1 M CaCl2·2H2O Stock solution) |
5 mM KCI | 125 μL (2 M KCl Stock solution) |
2 mM MES, pH 5.7 | 500 μL (0.1 M MES Stock solution) |
Nuclease-free water | 39.275 mL |
실시예 6.2. 표적 부위에 대한 염기서열 분석 및 편집 효율 확인
2 mL e-tube에 crRNA, mgCas12a 단백질 및 NEB buffer 1.1을 최종 volume 20 μL가 되게한 후 상온에서 10분 동안 반응시켰다. 상기 실시예 6.1에서 수득한 원형질체 200 μL(5 X 105 세포)와 반응시킨 crRNA 및 mgCas12 단백질(볼륨 20 μL)을 E-tube(2 mL)에 넣고 잘 섞은 후, 클린 벤치(Clean bench)에서 10분간 배양하였다. 이후, 상기 배양한 볼륨과 동일한 PEG 용액 220 μL를 넣고 조심스럽게 섞어주었다. 상온에서 15분간 배양한 후, W5 용액 840 μL을 첨가하여 잘 섞어주었다. 100 xg에서 2분간 원심 분리한 후, 상등액을 제거하였다. 그리고, W5 용액에서 이틀간 배양한 후 세포를 수거하여 DNA를 추출하였다.
상기 추출한 DNA를 이용하여 타겟 부분에 PCR을 수행한 후, NGS(Next-Generation Sequencing)로 타겟 유전자 편집 효율을 확인하였다. 이를 하기 표 5에 나타내었다. 표 5에 나타난 바와 같이, FnCpf1에 비해 mgCas12a-1 단백질에 의한 유전자 편집 효율이 1.8배 높게 나타났다.
Target gene |
crRNA | Nuclease | Total Sequences |
With both indicator sequences |
More than minimum frequency |
Insertions | Deletions | Indel frequency |
FucT14-1 | 2 | none | 161551 | 161421 | 160896 | 4 | 180 | 184 (0.1%) |
mgCas12a-1 | 124361 | 124255 | 123844 | 3 | 168 | 171 (0.1%) | ||
mgCas12a-2 | 99154 | 99053 | 98734 | 0 | 131 | 131 (0.1%) | ||
FnCpf1 | 50060 | 50022 | 49808 | 0 | 63 | 63 (0.1%) | ||
4 | none | 161551 | 161411 | 160899 | 4 | 178 | 182 (0.1%) | |
mgCas12a-1 | 106782 | 106706 | 106330 | 0 | 1877 | 1877 (1.8%) | ||
mgCas12a-2 | 126665 | 126544 | 126057 | 79 | 885 | 964 (0.8%) | ||
FnCpf1 | 64554 | 64501 | 64272 | 15 | 470 | 485 (0.8%) | ||
FucT14-2 | 2 | none | 49459 | 49422 | 49192 | 2 | 49 | 51 (0.1%) |
mgCas12a-1 | 81191 | 81101 | 80738 | 0 | 90 | 90 (0.1%) | ||
mgCas12a-2 | 83694 | 83614 | 83286 | 0 | 99 | 99 (0.1%) | ||
FnCpf1 | 108803 | 108682 | 108260 | 0 | 112 | 112 (0.1%) | ||
4 | none | 49459 | 49427 | 49199 | 2 | 49 | 51 (0.1%) | |
mgCas12a-1 | 54918 | 54854 | 54532 | 6 | 689 | 695 (1.3%) | ||
mgCas12a-2 | 127825 | 127691 | 127213 | 2 | 143 | 145 (0.1%) | ||
FnCpf1 | 64265 | 64168 | 63882 | 0 | 162 | 162 (0.3%) |
또한, 담배 FucT14 유전자의 두 가지 crRNA를 이용한 유전자 편집 효율을 단백질별로 확인하여 도 15에 나타내었다. 도 15에 나타난 바와 같이, FnCpf1보다 mgCas12a-1 단백질에 의한 유전자 편집이 두 배 높게 나타났다. 이때, 상기 타겟 유전자 NbFucT14_1 및 NbFucT14_2의 crRNA 및 프라이머 서열을 하기 표 6 및 표 7에 나타내었다.
Target Gene | crRNA (primer name) |
crRNA sequence(PAM site) |
NbFucT14_1
NbFucT14_2 |
NbFTa14_1/2-2 | TTTGGATAATTTGTACTCTTGTCGATGT (서열번호 19) |
NbFTa14_1/2-4 | TTTAGTCCACAAACAGCTAAGCCCACAT (서열번호 20) |
Target gene | Primer name | Sequence | Size (bp) |
NbFucT14_1 | NGS NbFTa14_1_F | TGAGCTGAAGATGGATTATG (서열번호 21) |
216 |
NGS NbFTa14_1_R | TCATGCTTAAGATAAAAGAG (서열번호 22) |
||
NbFucT14_2 | NGS NbFTa14_2_F | TCATGAGCTTAAGATGGATC (서열번호 23) |
217 |
NGS NbFTa14_2_R | GTTTAAGCTAAAAGAACTAC (서열번호 24) |
실시예 7. FnCas12a와 mgCas12a의 유전자 편집 효율 비교
FnCas12a, WT mgCas12a-1 또는 WT mgCas12a-2 단백질, 및 crRNA로 구성된 리보핵단백질(RNP) 복합체를 형성하기 위해, FnCas12a, WT mgCas12a-1 또는 WT mgCas12a-2 단백질 6 pmol과 crRNA 7.5 pmol을 NEB1.1 버퍼 및 1X 증류수와 함께 상온에서 30분간 혼합하였다. crRNA 의존적인 Cas12a(FnCas12a, WT mgCas12a-1 또는 WT mgCas12a-2)를 이용하여 dsDNA 절단 활성을 확인하기 위하여, 0.3 pmol의 타겟 dsDNA(선형, 원형)를 첨가한 후 37℃에서 2시간 동안 반응시켰다. 이때, DNA로는 HsCCR5, HsDNMT1 및 HsEMX1를 사용하였다. 또한, 실험에 사용된 선형 DNA(서열번호 27 내지 서열번호 29)는 PCR 정제산물이고, 원형 DNA(서열번호 30 내지 서열번호 32)는 정제된 플라스미드이다. SDS와 EDTA(Gel loading dye, NEB)를 첨가한 후 -20℃에서 10분간 보관하여 상기 반응을 멈추었다. 각각의 DNA를 1% 아가로즈 겔에 로딩한 후 전기영동하여 FnCas12a, WT mgCas12a-1 또는 WT mgCas12a-2에 의한 DNA 절단 활성을 확인하였다. 그 결과를 도 16a(선형 DNA) 및 도 16b(원형 DNA)에 나타내었다. 상기 도 16a 및 도 16b에서 S는 기질(substrate)를 의미하고, 겔 아래 기재된 각 숫자들은 기질 DNA 밴드의 짙은 정도를 의미한다.
실시예 8. mgCas12a의 비특이적인 DNase 활성 확인
Cas12a(AsCas12a, FnCas12a 또는 LbCas12a)와 mgCas12a(WT mgCas12a-1, d_mgCas12a-1, WTmgCas12a-2 또는 d_mgCas12a-2)의 무작위한 DNase 기능을 확인하기 위하여, 상기 실시에 7과 동일한 방법으로 실험을 수행하였다. 이때, 상기 d-mgCas12a-1 및 d_mgCas12a-2는 WT mgCas12a-1 및 WT mgCas12a-2의 877번 및 873번의 Asp를 Ala으로 치환시킨 단백질을 의미한다.
구체적으로, 상기 7 종류의 Cas12a와 crRNA로 구성된 리보핵단백질(RNP) 복합체를 형성하기 위해, 각각의 Cas12a 단백질 6 pmol과 crRNA 7.5 pmol을 NEB1.1 버퍼 및 1X 증류수와 함께 상온에서 30분간 작용시켰다. 이후, 0.3 pmol의 타겟 dsDNA를 첨가한 후 37℃에서 12시간 및 24시간 동안 반응시켰다. 이때, DNA로는 HsCCR5, HsDNMT1 및 HsEMX1를 사용하였다. SDS와 EDTA(Gel loading dye, NEB)를 첨가한 후 -20℃에서 10분간 보관하여 상기 반응을 멈추었다. 각각의 DNA를 1% 아가로즈 겔에 로딩한 후 전기영동하여 상기 7 종류의 Cas12a에 의한 DNA 절단 활성을 확인하였다. 그 결과를 도 17에 나타내었다. 상기 도 17에서 S는 기질(substrate)를 의미하고, 겔 아래 기재된 각 숫자들은 기질 DNA 밴드의 짙은 정도를 의미한다.
도 17에 나타난 바와 같이, 기존 Cas12a인 AsCas12a, FnCas12a 또는 LbCas12a와 crRNA로 구성된 리보핵단백질 복합체보다 신규 Cas12a인 WT mgCas12a-1, d_mgCas12a-1, WTmgCas12a-2 또는 d_mgCas12a-2와 crRNA로 구성된 리보핵단백질 복합체가 약한 비특이적인 DNase 기능을 나타내었다. 또한, 전반적으로 Cas12a RNP와 DNA를 반응시킬 경우 비특이적인 DNase 기능이 발생하는 것을 추측할 수 있었다.
실시예 9. crRNA 없는 조건에서 Cas12a의 비특이적인 DNase 기능 확인
crRNA 없이도 Cas12a가 무작위한 DNase 기능을 갖는지를 확인하기 위하여, FnCas12a, WT mgCas12a-1 또는 WT mgCas12a-2 단백질을 crRNA 없는 조건에서 시간을 달리하여 상기 실시예 7과 동일한 방법으로 실험을 수행하였다. 그 결과를 도 18a 및 도 18b에 나타내었다. 도 18a 및 도 18b에 나타난 바와 같이, crRNA 없이도 FnCas12a, WT mgCas12a-1 또는 WT mgCas12a-2 단백질이 무작위한 DNase 기능을 가졌고, FnCas12a 단백질의 무작위한 DNase 기능이 가장 먼저 발생되었다.
실시예 10. 기존 Cas12a의 handle을 사용한 mgCas12a의 DNA 절단 기능 확인
신규 Cas12a(d_mgCas12a 또는 WT mgCas12a)가 기존 Cas12a(AsCas12a, FnCas12a 또는 LbCas12a) 서열의 5' 말단에 존재하는 handle을 이용하여 DNA 절단이 가능한지를 확인하기 위해, AsCas12a, FnCas12a 또는 LbCas12a 각각의 handle과 반응시간을 달리하여 상기 실시예 7과 동일한 방법으로 실험을 수행하였다. 그 결과를 도 19에 나타내었다.
도 19에 나타난 바와 같이, AsCas12a, FnCas12a 또는 LbCas12a의 handle을 이용하여 d_mgCas12a 또는 WT mgCas12a 단백질로 DNA를 절단한 결과, 상기 각 handle에 따라 DNA 절단 효율이 조금씩 달랐지만 세 종류의 handle을 이용한 d_mgCas12a 또는 WT mgCas12a 단백질에서 모두 DNA를 절단 기능이 있었다. 이를 통해, DNA 절단을 위해 mgCas12a가 AsCas12a, FnCas12a 또는 LbCas12a의 handle을 이용할 수 있음을 알 수 있었다.
실시예 11. 이가이온에 의한 FnCas12a 또는 mgCas12a의 활성 확인
또한, 이가이온들(CaCl2, CoCl2, CuSO4, FeCl2, MnSO4, NiSO4 또는 ZnSO4)에 의한 FnCas12a, mgCas12a-1 또는 mgCas12a-2 단백질의 DNA 절단 활성을 확인하기 위하여, NEBuffer 1.1 대신 정해진 양의 이가이온들을 대신 사용하여 상기 실시예 4와 동일한 방법으로 실험을 수행하였다. 그 결과를 도 20a 및 도 20b에 나타내었다. 도 20a 및 도 20b에 나타난 바와 같이, FnCas12a, mgCas12a-1 또는 mgCas12a-2 단백질이 같은 이가이온에서 비슷한 DNA 절단 활성을 나타내었다.
<110> g+flas life sciences
Seoul National University R&DB Foundation
<120> NOVEL CRISPR ASSOCIATED PROTEIN AND USE THEREOF
<130> FPD-201912-0008
<150> KR 10-2018-0093336
<151> 2018-08-09
<160> 32
<170> KoPatentIn 3.0
<210> 1
<211> 1263
<212> PRT
<213> Artificial Sequence
<220>
<223> mgCas12a-1
<400> 1
Met Asn Asn Gly Thr Asn Asn Phe Gln Asn Phe Ile Gly Ile Ser Ser
1 5 10 15
Leu Gln Lys Thr Leu Arg Asn Ala Leu Ile Pro Thr Glu Thr Thr Gln
20 25 30
Gln Phe Ile Val Lys Asn Gly Ile Ile Lys Glu Asp Glu Leu Arg Gly
35 40 45
Glu Asn Arg Gln Ile Leu Lys Asp Ile Met Asp Asp Tyr Tyr Arg Gly
50 55 60
Phe Ile Ser Glu Thr Leu Ser Ser Ile Asp Asp Ile Asp Trp Thr Ser
65 70 75 80
Leu Phe Glu Lys Met Glu Ile Gln Leu Lys Asn Gly Asp Asn Lys Asp
85 90 95
Thr Leu Ile Lys Glu Gln Ala Glu Lys Arg Lys Ala Ile Tyr Lys Lys
100 105 110
Phe Ala Asp Asp Asp Arg Phe Lys Asn Met Phe Ser Ala Lys Leu Ile
115 120 125
Ser Asp Ile Leu Pro Glu Phe Val Ile His Asn Asn Asn Tyr Ser Ala
130 135 140
Ser Glu Lys Glu Glu Lys Thr Gln Val Ile Lys Leu Phe Ser Arg Phe
145 150 155 160
Ala Thr Ser Phe Lys Asp Tyr Phe Lys Asn Arg Ala Asn Cys Phe Ser
165 170 175
Ala Asp Asp Ile Ser Ser Ser Ser Cys His Arg Ile Val Asn Asp Asn
180 185 190
Ala Glu Ile Phe Phe Ser Asn Ala Leu Val Tyr Arg Arg Ile Val Lys
195 200 205
Asn Leu Ser Asn Asp Asp Ile Asn Lys Ile Ser Gly Asp Ile Lys Asp
210 215 220
Ser Leu Lys Glu Met Ser Leu Glu Glu Ile Tyr Ser Tyr Glu Lys Tyr
225 230 235 240
Gly Glu Phe Ile Thr Gln Glu Gly Ile Ser Phe Tyr Asn Asp Ile Cys
245 250 255
Gly Lys Val Asn Ser Phe Met Asn Leu Tyr Cys Gln Lys Asn Lys Glu
260 265 270
Asn Lys Asn Leu Tyr Lys Leu Arg Lys Leu His Lys Gln Ile Leu Cys
275 280 285
Ile Ala Asp Thr Ser Tyr Glu Val Pro Tyr Lys Phe Glu Ser Asp Glu
290 295 300
Glu Val Tyr Gln Ser Val Asn Gly Phe Leu Asp Asn Ile Ser Ser Lys
305 310 315 320
His Ile Val Glu Arg Leu Arg Lys Ile Gly Asp Asn Tyr Asn Gly Tyr
325 330 335
Asn Leu Asp Lys Ile Tyr Ile Val Ser Lys Phe Tyr Glu Ser Val Ser
340 345 350
Gln Lys Thr Tyr Arg Asp Trp Glu Thr Ile Asn Thr Ala Leu Glu Ile
355 360 365
His Tyr Asn Asn Ile Leu Pro Gly Asn Gly Lys Ser Lys Ala Asp Lys
370 375 380
Val Lys Lys Ala Val Lys Asn Asp Leu Gln Lys Ser Ile Thr Glu Ile
385 390 395 400
Asn Glu Leu Val Ser Asn Tyr Lys Leu Cys Pro Asp Asp Asn Ile Lys
405 410 415
Ala Glu Thr Tyr Ile His Glu Ile Ser His Ile Leu Asn Asn Phe Glu
420 425 430
Ala Gln Glu Leu Lys Tyr Asn Pro Glu Ile His Leu Val Glu Ser Glu
435 440 445
Leu Lys Ala Ser Glu Leu Lys Asn Val Leu Asp Val Ile Met Asn Ala
450 455 460
Phe His Trp Cys Ser Val Phe Met Thr Glu Glu Leu Val Asp Lys Asp
465 470 475 480
Asn Asn Phe Tyr Ala Glu Leu Glu Glu Ile Tyr Asp Glu Ile Tyr Thr
485 490 495
Val Ile Ser Leu Tyr Asn Leu Val Arg Asn Tyr Val Thr Gln Lys Pro
500 505 510
Tyr Ser Thr Lys Lys Ile Lys Leu Asn Phe Gly Ile Pro Thr Leu Ala
515 520 525
Asp Gly Trp Ser Lys Ser Lys Glu Tyr Ser Asn Asn Ala Ile Ile Leu
530 535 540
Met Arg Asp Asn Leu Tyr Tyr Leu Gly Ile Phe Asn Ala Lys Asn Lys
545 550 555 560
Pro Asp Lys Lys Ile Ile Glu Gly Asn Thr Ser Glu Asn Lys Gly Asp
565 570 575
Tyr Lys Lys Met Ile Tyr Asn Leu Leu Pro Gly Pro Asn Lys Met Ile
580 585 590
Pro Lys Val Phe Leu Ser Ser Lys Thr Gly Val Glu Thr Tyr Lys Pro
595 600 605
Ser Ala Tyr Ile Leu Glu Gly Tyr Lys Gln Asn Lys His Leu Lys Ser
610 615 620
Ser Lys Asp Phe Asp Ile Thr Phe Cys His Asp Leu Ile Asp Tyr Phe
625 630 635 640
Lys Asn Cys Ile Ala Ile His Pro Glu Trp Lys Asn Phe Gly Phe Asp
645 650 655
Phe Ser Asp Thr Ser Thr Tyr Glu Asp Ile Ser Gly Phe Tyr Arg Glu
660 665 670
Val Glu Leu Gln Gly Tyr Lys Ile Asp Trp Thr Tyr Ile Ser Glu Lys
675 680 685
Asp Ile Asp Leu Leu Gln Glu Lys Gly Gln Leu Tyr Leu Phe Gln Ile
690 695 700
Tyr Asn Lys Asp Phe Ser Lys Lys Ser Thr Gly Asn Asp Asn Leu His
705 710 715 720
Thr Met Tyr Leu Lys Asn Leu Phe Ser Glu Glu Asn Leu Lys Asp Ile
725 730 735
Val Leu Lys Leu Asn Gly Glu Ala Glu Ile Phe Phe Arg Lys Ser Ser
740 745 750
Ile Lys Asn Pro Ile Ile His Lys Lys Gly Ser Ile Leu Val Asn Arg
755 760 765
Thr Tyr Glu Ala Glu Glu Lys Asp Gln Phe Gly Asn Ile Gln Ile Val
770 775 780
Arg Lys Thr Ile Pro Glu Asn Ile Tyr Gln Glu Leu Tyr Lys Tyr Phe
785 790 795 800
Asn Asp Lys Ser Asp Lys Glu Leu Ser Asp Glu Ala Ala Lys Leu Lys
805 810 815
Asn Val Val Gly His His Glu Ala Ala Thr Asn Ile Val Lys Asp Tyr
820 825 830
Arg Tyr Thr Tyr Asp Lys Tyr Phe Leu His Met Pro Ile Thr Ile Asn
835 840 845
Phe Lys Ala Asn Lys Thr Ser Phe Ile Asn Asp Arg Ile Leu Gln Tyr
850 855 860
Ile Ala Lys Glu Lys Asn Leu His Val Ile Gly Ile Asp Arg Gly Glu
865 870 875 880
Arg Asn Leu Ile Tyr Val Ser Val Ile Asp Thr Cys Gly Asn Ile Val
885 890 895
Glu Gln Lys Ser Phe Asn Ile Val Asn Gly Tyr Asp Tyr Gln Ile Lys
900 905 910
Leu Lys Gln Gln Glu Gly Ala Arg Gln Ile Ala Arg Lys Glu Trp Lys
915 920 925
Glu Ile Gly Lys Ile Lys Glu Ile Lys Glu Gly Tyr Leu Ser Leu Val
930 935 940
Ile His Glu Ile Ser Lys Met Val Ile Lys Tyr Asn Ala Ile Ile Ala
945 950 955 960
Met Glu Asp Leu Ser Tyr Gly Phe Lys Lys Gly Arg Phe Lys Val Glu
965 970 975
Arg Gln Val Tyr Gln Lys Phe Glu Thr Met Leu Ile Asn Lys Leu Asn
980 985 990
Tyr Leu Val Phe Lys Asp Ile Ser Ile Thr Glu Asn Gly Gly Leu Leu
995 1000 1005
Lys Gly Tyr Gln Leu Thr Tyr Ile Pro Asp Lys Leu Lys Asn Val Gly
1010 1015 1020
His Gln Cys Gly Cys Ile Phe Tyr Val Pro Ala Ala Tyr Thr Ser Lys
1025 1030 1035 1040
Ile Asp Pro Thr Thr Gly Phe Val Asn Ile Phe Lys Phe Lys Asp Leu
1045 1050 1055
Thr Val Asp Ala Lys Arg Glu Phe Ile Lys Lys Phe Asp Ser Ile Arg
1060 1065 1070
Tyr Asp Ser Glu Lys Lys Leu Phe Cys Phe Thr Phe Asp Tyr Asn Asn
1075 1080 1085
Phe Ile Thr Gln Asn Thr Val Met Ser Lys Ser Ser Trp Ser Val Tyr
1090 1095 1100
Thr Tyr Gly Val Arg Ile Lys Arg Arg Phe Val Asn Gly Arg Phe Ser
1105 1110 1115 1120
Asn Glu Ser Asp Thr Ile Asp Ile Thr Lys Asp Met Glu Lys Thr Leu
1125 1130 1135
Glu Met Thr Asp Ile Asn Trp Arg Asp Gly His Asp Leu Arg Gln Asp
1140 1145 1150
Ile Ile Asp Tyr Glu Ile Val Gln His Ile Phe Glu Ile Phe Arg Leu
1155 1160 1165
Thr Val Gln Met Arg Asn Ser Leu Ser Glu Leu Glu Asp Arg Asp Tyr
1170 1175 1180
Asp Arg Leu Ile Ser Pro Val Leu Asn Glu Asn Asn Ile Phe Tyr Asp
1185 1190 1195 1200
Ser Ala Lys Ala Gly Asp Ala Leu Pro Lys Asp Ala Asp Ala Asn Gly
1205 1210 1215
Ala Tyr Cys Ile Ala Leu Lys Gly Leu Tyr Glu Ile Lys Gln Ile Thr
1220 1225 1230
Glu Asn Trp Lys Glu Asp Gly Lys Phe Ser Arg Asp Lys Leu Lys Ile
1235 1240 1245
Ser Asn Lys Asp Trp Phe Asp Phe Ile Gln Asn Lys Arg Tyr Leu
1250 1255 1260
<210> 2
<211> 3792
<212> DNA
<213> Artificial Sequence
<220>
<223> mgCas12a-1
<400> 2
atgaataacg gaacaaataa ctttcagaac tttatcggaa tttcttcttt gcagaagact 60
cttaggaatg ctctcattcc aacagaaaca acacagcaat ttattgttaa aaatggaata 120
attaaagaag atgaactcag aggagaaaat cgtcagatac ttaaagatat catggatgat 180
tattacagag gtttcatttc agaaacttta tcgtcaattg atgatattga ctggacctct 240
ttatttgaga aaatggaaat tcagttaaaa aatggagata ataaagacac tcttataaaa 300
gaacaggctg aaaaacgtaa ggcaatctat aaaaaatttg cagatgatga tagatttaaa 360
aatatgttca gtgcaaaatt aatctcagat attcttcctg aatttgtcat tcataacaat 420
aattattctg catcagaaaa ggaagaaaaa acacaggtaa ttaaattatt ttccagattt 480
gcaacatcat tcaaggacta ttttaaaaac agggctaatt gtttttctgc tgatgatata 540
tcttcttctt cttgtcatag aatagttaat gataatgcag aaatattttt tagtaatgca 600
ttggtgtata ggagaattgt aaaaaatctt tcaaatgatg atataaataa aatatccgga 660
gatattaagg attcattaaa ggaaatgtct ctggaggaaa tttattctta tgaaaaatat 720
ggggaattta ttacacagga aggtatatct ttttataatg atatatgcgg taaagtaaat 780
tcatttatga atttatattg ccagaaaaat aaagaaaaca aaaatctcta taagctgcga 840
aagcttcata aacagatact gtgcatagca gatacttctt atgaggtgcc gtataaattt 900
gaatcagatg aagaggttta tcaatcagtg aatggatttt tggacaatat tagttcaaaa 960
catatcgttg aaagattgcg taagattgga gacaactata acggctacaa tcttgataag 1020
atttatattg ttagtaaatt ctatgaatca gtttcacaaa agacatatag agattgggaa 1080
acaataaata ctgcattaga aattcattac aacaatatat tacccggaaa tggtaaatct 1140
aaagctgaca aggtaaaaaa agcggtaaag aatgatctgc aaaaaagcat tactgaaatc 1200
aatgagcttg ttagcaatta taaattatgt ccggatgata atattaaagc agagacatat 1260
atacatgaaa tatcacatat tttgaataat tttgaagcac aggagcttaa gtataatcct 1320
gaaattcatc tggtggaaag tgaattgaaa gcatctgaat taaaaaatgt tctcgatgta 1380
ataatgaatg cttttcattg gtgttcggtt ttcatgacag aggagctggt agataaagat 1440
aataattttt atgcggagtt agaagagata tatgacgaaa tatatacggt aatttcattg 1500
tataatcttg tgcgtaatta tgtaacgcag aagccatata gtacaaaaaa aattaaattg 1560
aattttggta ttcctacact agcggatgga tggagtaaaa gtaaagaata tagtaataat 1620
gcaattattc tcatgcgtga taatttgtac tatttaggaa tatttaatgc aaaaaataag 1680
cctgacaaaa agataattga aggtaataca tcagaaaata aaggggatta taagaagatg 1740
atttataatc ttctgccagg accaaataaa atgatcccca aggtattcct ctcttcaaaa 1800
accggagtgg aaacatataa gccgtctgcc tatatattgg agggctataa acaaaacaag 1860
catcttaaat cctctaagga ttttgatata acgttttgtc acgatttgat tgattatttt 1920
aagaactgta tagcaataca tcctgaatgg aagaattttg gctttgattt ttctgacacc 1980
tccacatatg aagatatcag cggattttac agagaagtcg aattgcaagg ttataaaatt 2040
gactggacat atatcagcga aaaggatatt gatttgttgc aggaaaaagg acagttatat 2100
ttatttcaaa tatataacaa agatttttcc aagaaaagta ccggaaatga taatcttcat 2160
actatgtatt tgaagaattt gtttagcgaa gagaatttaa aggatattgt actgaaatta 2220
aacggtgagg cggaaatctt ctttagaaaa tcaagcataa agaatccaat aattcataaa 2280
aaaggctcta ttcttgttaa tagaacatat gaagcagagg aaaaagatca atttggaaat 2340
atccagatag tcagaaaaac cataccggaa aatatatatc aggagcttta taaatatttc 2400
aatgataaaa gtgataaaga actttcggat gaagcagcta agcttaagaa tgtagtaggt 2460
catcatgagg ctgctacaaa catagtaaaa gattatagat atacatatga taaatatttt 2520
cttcatatgc ctattacaat caattttaaa gccaataaga caagctttat taatgacaga 2580
atattacaat atattgctaa agaaaagaat ttgcatgtaa taggcattga tcgtggtgaa 2640
agaaacctga tatatgtttc agtaattgat acttgtggaa atattgttga acaaaaatcg 2700
tttaacattg ttaatggata tgattatcag attaagctca agcagcagga gggggcgcga 2760
caaatcgcac gaaaagaatg gaaagaaatc ggcaaaataa aagaaattaa agaaggctat 2820
ttatctcttg taattcatga aatttcaaag atggttatta aatataatgc cataattgca 2880
atggaggatt taagctacgg atttaaaaaa ggtcgtttca aggttgagcg acaggtttac 2940
cagaagtttg agacaatgct tatcaacaaa ctcaactatc tggtatttaa agatatatcc 3000
ataactgaaa acggtggtct tctaaaggga tatcagctta catatattcc agataaactg 3060
aaaaatgtgg gtcatcaatg tggttgtata ttttacgtac ctgctgccta tacatcaaaa 3120
atagatccta caaccggatt tgtaaatata ttcaaattta aagatttaac agttgatgca 3180
aagagagaat ttataaaaaa atttgacagt atcagatatg attcagaaaa aaaactgttt 3240
tgttttacat ttgattataa taactttatt acgcaaaata ctgttatgtc aaagtcaagc 3300
tggagtgtat atacgtacgg agttaggata aaaagaagat ttgtcaatgg caggttctca 3360
aatgaatcgg atacaattga tataacaaaa gatatggaaa aaaccctcga aatgacagat 3420
ataaattgga gagatggtca tgatctgagg caggatatta ttgattatga aatcgtacaa 3480
cacatatttg agatttttag attgactgta caaatgagaa acagtttaag tgaattagaa 3540
gacagggatt atgaccgttt gatttctccg gtgctcaatg aaaataatat attttatgat 3600
tcagctaaag caggagatgc gttacctaaa gacgcagatg ctaatggtgc atattgtata 3660
gctctaaaag gcttgtatga aatcaaacaa attacagaga attggaaaga agacggtaag 3720
ttttcaagag ataaacttaa aatttccaat aaggactggt ttgactttat tcaaaataaa 3780
aggtatttat aa 3792
<210> 3
<211> 1275
<212> PRT
<213> Artificial Sequence
<220>
<223> mgCas12a-2
<400> 3
Met Gly Lys Asn Gln Asn Phe Gln Glu Phe Ile Gly Val Ser Pro Leu
1 5 10 15
Gln Lys Thr Leu Arg Asn Glu Leu Ile Pro Thr Glu Thr Thr Lys Lys
20 25 30
Asn Ile Thr Gln Leu Asp Leu Leu Thr Glu Asp Glu Ile Arg Ala Gln
35 40 45
Asn Arg Glu Lys Leu Lys Glu Met Met Asp Asp Tyr Tyr Arg Asn Val
50 55 60
Ile Asp Ser Thr Leu His Val Gly Ile Ala Val Asp Trp Ser Tyr Leu
65 70 75 80
Phe Ser Cys Met Arg Asn His Leu Arg Glu Asn Ser Lys Glu Ser Lys
85 90 95
Arg Glu Leu Glu Arg Thr Gln Asp Ser Ile Arg Ser Gln Ile His Asn
100 105 110
Lys Phe Ala Glu Arg Ala Asp Phe Lys Asp Met Phe Gly Ala Ser Ile
115 120 125
Ile Thr Lys Leu Leu Pro Thr Tyr Ile Lys Gln Asn Ser Glu Tyr Ser
130 135 140
Glu Arg Tyr Asp Glu Ser Met Glu Ile Leu Lys Leu Tyr Gly Lys Phe
145 150 155 160
Thr Thr Ser Leu Thr Asp Tyr Phe Glu Thr Arg Lys Asn Ile Phe Ser
165 170 175
Lys Glu Lys Ile Ser Ser Ala Val Gly Tyr Arg Ile Val Glu Glu Asn
180 185 190
Ala Glu Ile Phe Leu Gln Asn Gln Asn Ala Tyr Asp Arg Ile Cys Lys
195 200 205
Ile Ala Gly Leu Asp Leu His Gly Leu Asp Asn Glu Ile Thr Ala Tyr
210 215 220
Val Asp Gly Lys Thr Leu Lys Glu Val Cys Ser Asp Glu Gly Phe Ala
225 230 235 240
Lys Ala Ile Thr Gln Glu Gly Ile Asp Arg Tyr Asn Glu Ala Ile Gly
245 250 255
Ala Val Asn Gln Tyr Met Asn Leu Leu Cys Gln Lys Asn Lys Ala Leu
260 265 270
Lys Pro Gly Gln Phe Lys Met Lys Arg Leu His Lys Gln Ile Leu Cys
275 280 285
Lys Gly Thr Thr Ser Phe Asp Ile Pro Lys Lys Phe Glu Asn Asp Lys
290 295 300
Gln Val Tyr Asp Ala Val Asn Ser Phe Thr Glu Ile Val Thr Lys Asn
305 310 315 320
Asn Asp Leu Lys Arg Leu Leu Asn Ile Thr Gln Asn Ala Asn Asp Tyr
325 330 335
Asp Met Asn Lys Ile Tyr Val Val Ala Asp Ala Tyr Ser Met Ile Ser
340 345 350
Gln Phe Ile Ser Lys Lys Trp Asn Leu Ile Glu Glu Cys Leu Leu Asp
355 360 365
Tyr Tyr Ser Asp Asn Leu Pro Gly Lys Gly Asn Ala Lys Glu Asn Lys
370 375 380
Val Lys Lys Ala Val Lys Glu Glu Thr Tyr Arg Ser Val Ser Gln Leu
385 390 395 400
Asn Glu Val Ile Glu Lys Tyr Tyr Val Glu Lys Thr Gly Gln Ser Val
405 410 415
Trp Lys Val Glu Ser Tyr Ile Ser Ser Leu Ala Glu Met Ile Lys Leu
420 425 430
Glu Leu Cys His Glu Ile Asp Asn Asp Glu Lys His Asn Leu Ile Glu
435 440 445
Asp Asp Glu Lys Ile Ser Glu Ile Lys Glu Leu Leu Asp Met Tyr Met
450 455 460
Asp Val Phe His Ile Ile Lys Val Phe Arg Val Asn Glu Val Leu Asn
465 470 475 480
Phe Asp Glu Thr Phe Tyr Ser Glu Met Asp Glu Ile Tyr Gln Asp Met
485 490 495
Gln Glu Ile Val Pro Leu Tyr Asn His Val Arg Asn Tyr Val Thr Gln
500 505 510
Lys Pro Tyr Lys Gln Glu Lys Tyr Arg Leu Tyr Phe His Thr Pro Thr
515 520 525
Leu Ala Asn Gly Trp Ser Lys Ser Lys Glu Tyr Asp Asn Asn Ala Ile
530 535 540
Ile Leu Val Arg Glu Asp Lys Tyr Tyr Leu Gly Ile Leu Asn Ala Lys
545 550 555 560
Lys Lys Pro Ser Lys Glu Ile Met Ala Gly Lys Glu Asp Cys Ser Glu
565 570 575
His Ala Tyr Ala Lys Met Asn Tyr Tyr Leu Leu Pro Gly Ala Asn Lys
580 585 590
Met Leu Pro Lys Val Phe Leu Ser Lys Lys Gly Ile Gln Asp Tyr His
595 600 605
Pro Ser Ser Tyr Ile Val Glu Gly Tyr Asn Glu Lys Lys His Ile Lys
610 615 620
Gly Ser Lys Asn Phe Asp Ile Arg Phe Cys Arg Asp Leu Ile Asp Tyr
625 630 635 640
Phe Lys Glu Cys Ile Lys Lys His Pro Asp Trp Asn Lys Phe Asn Phe
645 650 655
Glu Phe Ser Ala Thr Glu Thr Tyr Glu Asp Ile Ser Val Phe Tyr Arg
660 665 670
Glu Val Glu Lys Gln Gly Tyr Arg Val Glu Trp Thr Tyr Ile Asn Ser
675 680 685
Glu Asp Ile Gln Lys Leu Glu Glu Asp Gly Gln Leu Phe Leu Phe Gln
690 695 700
Ile Tyr Asn Lys Asp Phe Ala Val Gly Ser Thr Gly Lys Pro Asn Leu
705 710 715 720
His Thr Leu Tyr Leu Lys Asn Leu Phe Ser Glu Glu Asn Leu Arg Asp
725 730 735
Ile Val Leu Lys Leu Asn Gly Glu Ala Glu Ile Phe Phe Arg Lys Ser
740 745 750
Ser Val Gln Lys Pro Val Ile His Lys Cys Gly Ser Ile Leu Val Asn
755 760 765
Arg Thr Tyr Glu Ile Thr Glu Ser Gly Thr Thr Arg Val Gln Ser Ile
770 775 780
Pro Glu Ser Glu Tyr Met Glu Leu Tyr Arg Tyr Phe Asn Ser Glu Lys
785 790 795 800
Gln Ile Glu Leu Ser Asp Glu Ala Lys Lys Tyr Leu Asp Lys Val Gln
805 810 815
Cys Asn Lys Ala Lys Thr Asp Ile Val Lys Asp Tyr Arg Tyr Thr Met
820 825 830
Asp Lys Phe Phe Ile His Leu Pro Ile Thr Ile Asn Phe Lys Val Asp
835 840 845
Lys Gly Asn Asn Val Asn Ala Ile Ala Gln Gln Tyr Ile Ala Gly Arg
850 855 860
Lys Asp Leu His Val Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Ile
865 870 875 880
Tyr Val Ser Val Ile Asp Met Tyr Gly Arg Ile Leu Glu Gln Lys Ser
885 890 895
Phe Asn Leu Val Glu Gln Val Ser Ser Gln Gly Thr Lys Arg Tyr Tyr
900 905 910
Asp Tyr Lys Glu Lys Leu Gln Asn Arg Glu Glu Glu Arg Asp Lys Ala
915 920 925
Arg Lys Ser Trp Lys Thr Ile Gly Lys Ile Lys Glu Leu Lys Glu Gly
930 935 940
Tyr Leu Ser Ser Val Ile His Glu Ile Ala Gln Met Val Val Lys Tyr
945 950 955 960
Asn Ala Ile Ile Ala Met Glu Asp Leu Asn Tyr Gly Phe Lys Arg Gly
965 970 975
Arg Phe Lys Val Glu Arg Gln Val Tyr Gln Lys Phe Glu Thr Met Leu
980 985 990
Ile Ser Lys Leu Asn Tyr Leu Ala Asp Lys Ser Gln Ala Val Asp Glu
995 1000 1005
Pro Gly Gly Ile Leu Arg Gly Tyr Gln Met Thr Tyr Val Pro Asp Asn
1010 1015 1020
Ile Lys Asn Val Gly Arg Gln Cys Gly Ile Ile Phe Tyr Val Pro Ala
1025 1030 1035 1040
Ala Tyr Thr Ser Lys Ile Asp Pro Thr Thr Gly Phe Ile Asn Ala Phe
1045 1050 1055
Lys Arg Asp Val Val Ser Thr Asn Asp Ala Lys Glu Asn Phe Leu Met
1060 1065 1070
Lys Phe Asp Ser Ile Gln Tyr Asp Ile Glu Lys Gly Leu Phe Lys Phe
1075 1080 1085
Ser Phe Asp Tyr Lys Asn Phe Ala Thr His Lys Leu Thr Leu Ala Lys
1090 1095 1100
Thr Lys Trp Asp Val Tyr Thr Asn Gly Thr Arg Ile Gln Asn Met Lys
1105 1110 1115 1120
Val Glu Gly His Trp Leu Ser Met Glu Val Glu Leu Thr Thr Lys Met
1125 1130 1135
Lys Glu Leu Leu Asp Asp Ser His Ile Pro Tyr Glu Glu Gly Gln Asn
1140 1145 1150
Ile Leu Asp Asp Leu Arg Glu Met Lys Asp Ile Thr Thr Ile Val Asn
1155 1160 1165
Gly Ile Leu Glu Ile Phe Trp Leu Thr Val Gln Leu Arg Asn Ser Arg
1170 1175 1180
Ile Asp Asn Pro Asp Tyr Asp Arg Ile Ile Ser Pro Val Leu Asn Lys
1185 1190 1195 1200
Asn Gly Glu Phe Phe Asp Ser Asp Glu Tyr Asn Ser Tyr Ile Asp Ala
1205 1210 1215
Gln Lys Ala Pro Leu Pro Ile Asp Ala Asp Ala Asn Gly Ala Phe Cys
1220 1225 1230
Ile Ala Leu Lys Gly Met Tyr Thr Ala Asn Gln Ile Lys Glu Asn Trp
1235 1240 1245
Val Glu Gly Glu Lys Leu Pro Ala Asp Cys Leu Lys Ile Glu His Ala
1250 1255 1260
Ser Trp Leu Ala Phe Met Gln Gly Glu Arg Gly
1265 1270 1275
<210> 4
<211> 3828
<212> DNA
<213> Artificial Sequence
<220>
<223> mgCas12a-2
<400> 4
atgggtaaaa atcaaaattt tcaggaattt attggggtat caccacttca aaagacttta 60
agaaacgaat taatcccaac agaaacaaca aaaaagaata ttactcagct tgatcttttg 120
actgaggatg aaatccgcgc gcaaaatcga gagaagctga aagagatgat ggatgactac 180
taccggaatg tgattgatag cactttgcat gtgggtatag ctgttgattg gagctattta 240
ttttcgtgta tgcgaaatca tctaagggag aattccaaag agtcaaagcg ggaattggaa 300
cgaacacagg attctattcg ttcacaaatc cataataagt ttgctgaacg agcggatttt 360
aaggatatgt ttggagcatc gataataaca aaattacttc cgacatatat aaaacagaat 420
tcagaatatt ccgagcggta tgacgagagc atggaaattt tgaaactgta tggaaaattc 480
acaacatcgt tgaccgatta ctttgagaca agaaagaata tcttttctaa agagaaaata 540
tcttctgccg ttggatatcg aatcgtagag gaaaatgctg agatcttctt gcagaatcag 600
aatgcttacg acagaatctg taagatagcg ggactggatt tacatggatt ggataatgaa 660
ataacagcat atgttgatgg aaaaacatta aaagaagtat gttcggatga aggatttgca 720
aaggctatta cacaagaagg gattgatcgc tacaacgagg caatcggtgc agtaaatcaa 780
tatatgaatc tgttatgcca gaagaataag gcattaaaac cgggacaatt taagatgaag 840
cggctacata aacagattct ttgcaaagga acaacctctt tcgatattcc aaagaagttt 900
gaaaatgata aacaggtgta tgacgcagtt aattctttta cagagatagt aacgaagaat 960
aatgatttga agcgactgtt aaatattaca cagaatgcaa atgattatga catgaataaa 1020
atctatgtag tagccgatgc atatagtatg atttcacagt ttatcagtaa aaaatggaat 1080
ctgattgaag aatgcttgct ggattattat agcgataatt tgccgggaaa aggaaatgcg 1140
aaagaaaaca aagttaaaaa ggcggtaaag gaagaaacgt atcgcagtgt ttcacagttg 1200
aatgaagtta ttgagaaata ttatgtggaa aagaccggac agtcagtatg gaaagtggaa 1260
agttatattt ctagtctggc agaaatgatt aagctggaat tgtgccacga gatagataac 1320
gatgagaagc ataatctgat tgaagatgat gagaagatat ccgagattaa ggaactgttg 1380
gatatgtaca tggatgtatt tcatattata aaagtgttcc gggtgaatga agtattgaat 1440
ttcgatgaaa ccttttattc ggagatggat gagatctatc aggatatgca ggaaatcgtt 1500
ccattataca atcatgttcg aaactatgtt acacagaaac catataagca ggagaaatat 1560
cgtttatatt tccacactcc aacattggca aatggctggt ccaagagtaa ggaatatgac 1620
aacaacgcaa ttatattggt gcgagaagat aaatattatt taggtattct gaatgcgaaa 1680
aagaaaccat cgaaagaaat tatggcgggc aaagaggatt gttcagaaca tgcatatgca 1740
aagatgaatt attatttgtt gccgggcgcg aacaagatgc ttccaaaagt atttttatct 1800
aagaaaggaa tacaggacta tcacccatca tcatatattg ttgaaggata taatgaaaag 1860
aaacatatta aaggttccaa gaattttgat atccggtttt gtagggattt gattgactac 1920
ttcaaggaat gcattaaaaa acatccggat tggaataagt ttaactttga attttctgcg 1980
acagaaacat atgaggatat cagtgtcttt tatcgcgaag ttgaaaagca aggatatcgc 2040
gtagagtgga cgtatatcaa tagtgaagat attcagaaac tggaagaaga tggacagttg 2100
tttttatttc agatatataa caaagatttt gctgtgggaa gtacaggtaa accaaatctt 2160
catacattgt atctgaaaaa tctgttcagc gaagaaaatt tgcgggacat tgtattaaaa 2220
ctaaatgggg aagcagaaat attcttccgt aaatcaagtg ttcaaaaacc ggtgattcat 2280
aagtgcggca gtattttagt caatcgtacc tatgagatta ccgagagtgg aacaacacgg 2340
gtacaatcaa ttccggaaag tgaatacatg gaattatatc gctactttaa tagtgaaaag 2400
cagatagaat tatcagatga ggcaaaaaaa tatttggaca aggtgcaatg taataaggca 2460
aagacagata ttgtgaaaga ctaccgatac accatggaca agttttttat tcatcttccg 2520
attacgatta attttaaggt tgataagggt aacaatgtta atgccattgc acagcaatat 2580
attgcagggc ggaaagattt acatgtgata ggaattgatc gaggagaacg gaatctgatt 2640
tacgtttctg taattgacat gtatggtaga attttagagc agaaatcctt taaccttgtg 2700
gaacaggtat cgtcgcaggg aacgaagcga tattacgatt acaaagaaaa attacagaac 2760
cgggaagagg aacgggataa agcaagaaag agttggaaga caatcggcaa gattaaggaa 2820
ttaaaagagg ggtatctgtc gtcagtaatt catgagattg cacagatggt cgtaaagtat 2880
aacgcaatca ttgcaatgga agatttgaat tatggattta agcggggaag attcaaagta 2940
gagcgccagg tatatcagaa atttgaaacg atgttgatca gtaagttgaa ttatctggca 3000
gataaatctc aggctgtgga tgaaccggga ggtatattac ggggatatca gatgacttat 3060
gtgccggata atattaagaa tgttggaaga caatgtggaa taatctttta tgtgccggca 3120
gcatatacct ccaagattga tccgacaacc ggatttatca atgcatttaa gcgggatgtg 3180
gtatcaacaa atgatgcaaa agagaatttc ctgatgaagt ttgattctat tcagtacgat 3240
atagaaaaag gcttatttaa gttttcattt gattacaaaa attttgccac acataaactt 3300
acacttgcga agacaaaatg ggacgtatat acaaatggaa ctcgaataca aaacatgaaa 3360
gttgaaggac attggctttc aatggaagtt gaacttacaa cgaaaatgaa agagttgctg 3420
gatgactcgc atattccata tgaagaagga cagaatatat tggatgattt gcgggagatg 3480
aaagatataa caaccattgt gaatggtata ttggaaatct tctggttgac agtccagctt 3540
cggaatagca ggatagataa tccggattac gatagaatta tctcaccggt attgaataaa 3600
aatggagaat tttttgattc tgatgaatat aattcatata ttgatgcgca aaaggcaccg 3660
ttaccgatag atgccgatgc aaatggcgca ttttgcattg cattaaaagg aatgtatact 3720
gccaatcaga tcaaagaaaa ctgggttgaa ggggagaaac ttccggcgga ttgcttgaag 3780
atcgaacatg cgagttggtt agcatttatg caaggagaaa ggggatag 3828
<210> 5
<211> 1263
<212> PRT
<213> Artificial Sequence
<220>
<223> engineered mgCas12a-1(K925Q)
<400> 5
Met Asn Asn Gly Thr Asn Asn Phe Gln Asn Phe Ile Gly Ile Ser Ser
1 5 10 15
Leu Gln Lys Thr Leu Arg Asn Ala Leu Ile Pro Thr Glu Thr Thr Gln
20 25 30
Gln Phe Ile Val Lys Asn Gly Ile Ile Lys Glu Asp Glu Leu Arg Gly
35 40 45
Glu Asn Arg Gln Ile Leu Lys Asp Ile Met Asp Asp Tyr Tyr Arg Gly
50 55 60
Phe Ile Ser Glu Thr Leu Ser Ser Ile Asp Asp Ile Asp Trp Thr Ser
65 70 75 80
Leu Phe Glu Lys Met Glu Ile Gln Leu Lys Asn Gly Asp Asn Lys Asp
85 90 95
Thr Leu Ile Lys Glu Gln Ala Glu Lys Arg Lys Ala Ile Tyr Lys Lys
100 105 110
Phe Ala Asp Asp Asp Arg Phe Lys Asn Met Phe Ser Ala Lys Leu Ile
115 120 125
Ser Asp Ile Leu Pro Glu Phe Val Ile His Asn Asn Asn Tyr Ser Ala
130 135 140
Ser Glu Lys Glu Glu Lys Thr Gln Val Ile Lys Leu Phe Ser Arg Phe
145 150 155 160
Ala Thr Ser Phe Lys Asp Tyr Phe Lys Asn Arg Ala Asn Cys Phe Ser
165 170 175
Ala Asp Asp Ile Ser Ser Ser Ser Cys His Arg Ile Val Asn Asp Asn
180 185 190
Ala Glu Ile Phe Phe Ser Asn Ala Leu Val Tyr Arg Arg Ile Val Lys
195 200 205
Asn Leu Ser Asn Asp Asp Ile Asn Lys Ile Ser Gly Asp Ile Lys Asp
210 215 220
Ser Leu Lys Glu Met Ser Leu Glu Glu Ile Tyr Ser Tyr Glu Lys Tyr
225 230 235 240
Gly Glu Phe Ile Thr Gln Glu Gly Ile Ser Phe Tyr Asn Asp Ile Cys
245 250 255
Gly Lys Val Asn Ser Phe Met Asn Leu Tyr Cys Gln Lys Asn Lys Glu
260 265 270
Asn Lys Asn Leu Tyr Lys Leu Arg Lys Leu His Lys Gln Ile Leu Cys
275 280 285
Ile Ala Asp Thr Ser Tyr Glu Val Pro Tyr Lys Phe Glu Ser Asp Glu
290 295 300
Glu Val Tyr Gln Ser Val Asn Gly Phe Leu Asp Asn Ile Ser Ser Lys
305 310 315 320
His Ile Val Glu Arg Leu Arg Lys Ile Gly Asp Asn Tyr Asn Gly Tyr
325 330 335
Asn Leu Asp Lys Ile Tyr Ile Val Ser Lys Phe Tyr Glu Ser Val Ser
340 345 350
Gln Lys Thr Tyr Arg Asp Trp Glu Thr Ile Asn Thr Ala Leu Glu Ile
355 360 365
His Tyr Asn Asn Ile Leu Pro Gly Asn Gly Lys Ser Lys Ala Asp Lys
370 375 380
Val Lys Lys Ala Val Lys Asn Asp Leu Gln Lys Ser Ile Thr Glu Ile
385 390 395 400
Asn Glu Leu Val Ser Asn Tyr Lys Leu Cys Pro Asp Asp Asn Ile Lys
405 410 415
Ala Glu Thr Tyr Ile His Glu Ile Ser His Ile Leu Asn Asn Phe Glu
420 425 430
Ala Gln Glu Leu Lys Tyr Asn Pro Glu Ile His Leu Val Glu Ser Glu
435 440 445
Leu Lys Ala Ser Glu Leu Lys Asn Val Leu Asp Val Ile Met Asn Ala
450 455 460
Phe His Trp Cys Ser Val Phe Met Thr Glu Glu Leu Val Asp Lys Asp
465 470 475 480
Asn Asn Phe Tyr Ala Glu Leu Glu Glu Ile Tyr Asp Glu Ile Tyr Thr
485 490 495
Val Ile Ser Leu Tyr Asn Leu Val Arg Asn Tyr Val Thr Gln Lys Pro
500 505 510
Tyr Ser Thr Lys Lys Ile Lys Leu Asn Phe Gly Ile Pro Thr Leu Ala
515 520 525
Asp Gly Trp Ser Lys Ser Lys Glu Tyr Ser Asn Asn Ala Ile Ile Leu
530 535 540
Met Arg Asp Asn Leu Tyr Tyr Leu Gly Ile Phe Asn Ala Lys Asn Lys
545 550 555 560
Pro Asp Lys Lys Ile Ile Glu Gly Asn Thr Ser Glu Asn Lys Gly Asp
565 570 575
Tyr Lys Lys Met Ile Tyr Asn Leu Leu Pro Gly Pro Asn Lys Met Ile
580 585 590
Pro Lys Val Phe Leu Ser Ser Lys Thr Gly Val Glu Thr Tyr Lys Pro
595 600 605
Ser Ala Tyr Ile Leu Glu Gly Tyr Lys Gln Asn Lys His Leu Lys Ser
610 615 620
Ser Lys Asp Phe Asp Ile Thr Phe Cys His Asp Leu Ile Asp Tyr Phe
625 630 635 640
Lys Asn Cys Ile Ala Ile His Pro Glu Trp Lys Asn Phe Gly Phe Asp
645 650 655
Phe Ser Asp Thr Ser Thr Tyr Glu Asp Ile Ser Gly Phe Tyr Arg Glu
660 665 670
Val Glu Leu Gln Gly Tyr Lys Ile Asp Trp Thr Tyr Ile Ser Glu Lys
675 680 685
Asp Ile Asp Leu Leu Gln Glu Lys Gly Gln Leu Tyr Leu Phe Gln Ile
690 695 700
Tyr Asn Lys Asp Phe Ser Lys Lys Ser Thr Gly Asn Asp Asn Leu His
705 710 715 720
Thr Met Tyr Leu Lys Asn Leu Phe Ser Glu Glu Asn Leu Lys Asp Ile
725 730 735
Val Leu Lys Leu Asn Gly Glu Ala Glu Ile Phe Phe Arg Lys Ser Ser
740 745 750
Ile Lys Asn Pro Ile Ile His Lys Lys Gly Ser Ile Leu Val Asn Arg
755 760 765
Thr Tyr Glu Ala Glu Glu Lys Asp Gln Phe Gly Asn Ile Gln Ile Val
770 775 780
Arg Lys Thr Ile Pro Glu Asn Ile Tyr Gln Glu Leu Tyr Lys Tyr Phe
785 790 795 800
Asn Asp Lys Ser Asp Lys Glu Leu Ser Asp Glu Ala Ala Lys Leu Lys
805 810 815
Asn Val Val Gly His His Glu Ala Ala Thr Asn Ile Val Lys Asp Tyr
820 825 830
Arg Tyr Thr Tyr Asp Lys Tyr Phe Leu His Met Pro Ile Thr Ile Asn
835 840 845
Phe Lys Ala Asn Lys Thr Ser Phe Ile Asn Asp Arg Ile Leu Gln Tyr
850 855 860
Ile Ala Lys Glu Lys Asn Leu His Val Ile Gly Ile Asp Arg Gly Glu
865 870 875 880
Arg Asn Leu Ile Tyr Val Ser Val Ile Asp Thr Cys Gly Asn Ile Val
885 890 895
Glu Gln Lys Ser Phe Asn Ile Val Asn Gly Tyr Asp Tyr Gln Ile Lys
900 905 910
Leu Lys Gln Gln Glu Gly Ala Arg Gln Ile Ala Arg Gln Glu Trp Lys
915 920 925
Glu Ile Gly Lys Ile Lys Glu Ile Lys Glu Gly Tyr Leu Ser Leu Val
930 935 940
Ile His Glu Ile Ser Lys Met Val Ile Lys Tyr Asn Ala Ile Ile Ala
945 950 955 960
Met Glu Asp Leu Ser Tyr Gly Phe Lys Lys Gly Arg Phe Lys Val Glu
965 970 975
Arg Gln Val Tyr Gln Lys Phe Glu Thr Met Leu Ile Asn Lys Leu Asn
980 985 990
Tyr Leu Val Phe Lys Asp Ile Ser Ile Thr Glu Asn Gly Gly Leu Leu
995 1000 1005
Lys Gly Tyr Gln Leu Thr Tyr Ile Pro Asp Lys Leu Lys Asn Val Gly
1010 1015 1020
His Gln Cys Gly Cys Ile Phe Tyr Val Pro Ala Ala Tyr Thr Ser Lys
1025 1030 1035 1040
Ile Asp Pro Thr Thr Gly Phe Val Asn Ile Phe Lys Phe Lys Asp Leu
1045 1050 1055
Thr Val Asp Ala Lys Arg Glu Phe Ile Lys Lys Phe Asp Ser Ile Arg
1060 1065 1070
Tyr Asp Ser Glu Lys Lys Leu Phe Cys Phe Thr Phe Asp Tyr Asn Asn
1075 1080 1085
Phe Ile Thr Gln Asn Thr Val Met Ser Lys Ser Ser Trp Ser Val Tyr
1090 1095 1100
Thr Tyr Gly Val Arg Ile Lys Arg Arg Phe Val Asn Gly Arg Phe Ser
1105 1110 1115 1120
Asn Glu Ser Asp Thr Ile Asp Ile Thr Lys Asp Met Glu Lys Thr Leu
1125 1130 1135
Glu Met Thr Asp Ile Asn Trp Arg Asp Gly His Asp Leu Arg Gln Asp
1140 1145 1150
Ile Ile Asp Tyr Glu Ile Val Gln His Ile Phe Glu Ile Phe Arg Leu
1155 1160 1165
Thr Val Gln Met Arg Asn Ser Leu Ser Glu Leu Glu Asp Arg Asp Tyr
1170 1175 1180
Asp Arg Leu Ile Ser Pro Val Leu Asn Glu Asn Asn Ile Phe Tyr Asp
1185 1190 1195 1200
Ser Ala Lys Ala Gly Asp Ala Leu Pro Lys Asp Ala Asp Ala Asn Gly
1205 1210 1215
Ala Tyr Cys Ile Ala Leu Lys Gly Leu Tyr Glu Ile Lys Gln Ile Thr
1220 1225 1230
Glu Asn Trp Lys Glu Asp Gly Lys Phe Ser Arg Asp Lys Leu Lys Ile
1235 1240 1245
Ser Asn Lys Asp Trp Phe Asp Phe Ile Gln Asn Lys Arg Tyr Leu
1250 1255 1260
<210> 6
<211> 1275
<212> PRT
<213> Artificial Sequence
<220>
<223> engineered mgCas12a-2(K930Q)
<400> 6
Met Gly Lys Asn Gln Asn Phe Gln Glu Phe Ile Gly Val Ser Pro Leu
1 5 10 15
Gln Lys Thr Leu Arg Asn Glu Leu Ile Pro Thr Glu Thr Thr Lys Lys
20 25 30
Asn Ile Thr Gln Leu Asp Leu Leu Thr Glu Asp Glu Ile Arg Ala Gln
35 40 45
Asn Arg Glu Lys Leu Lys Glu Met Met Asp Asp Tyr Tyr Arg Asn Val
50 55 60
Ile Asp Ser Thr Leu His Val Gly Ile Ala Val Asp Trp Ser Tyr Leu
65 70 75 80
Phe Ser Cys Met Arg Asn His Leu Arg Glu Asn Ser Lys Glu Ser Lys
85 90 95
Arg Glu Leu Glu Arg Thr Gln Asp Ser Ile Arg Ser Gln Ile His Asn
100 105 110
Lys Phe Ala Glu Arg Ala Asp Phe Lys Asp Met Phe Gly Ala Ser Ile
115 120 125
Ile Thr Lys Leu Leu Pro Thr Tyr Ile Lys Gln Asn Ser Glu Tyr Ser
130 135 140
Glu Arg Tyr Asp Glu Ser Met Glu Ile Leu Lys Leu Tyr Gly Lys Phe
145 150 155 160
Thr Thr Ser Leu Thr Asp Tyr Phe Glu Thr Arg Lys Asn Ile Phe Ser
165 170 175
Lys Glu Lys Ile Ser Ser Ala Val Gly Tyr Arg Ile Val Glu Glu Asn
180 185 190
Ala Glu Ile Phe Leu Gln Asn Gln Asn Ala Tyr Asp Arg Ile Cys Lys
195 200 205
Ile Ala Gly Leu Asp Leu His Gly Leu Asp Asn Glu Ile Thr Ala Tyr
210 215 220
Val Asp Gly Lys Thr Leu Lys Glu Val Cys Ser Asp Glu Gly Phe Ala
225 230 235 240
Lys Ala Ile Thr Gln Glu Gly Ile Asp Arg Tyr Asn Glu Ala Ile Gly
245 250 255
Ala Val Asn Gln Tyr Met Asn Leu Leu Cys Gln Lys Asn Lys Ala Leu
260 265 270
Lys Pro Gly Gln Phe Lys Met Lys Arg Leu His Lys Gln Ile Leu Cys
275 280 285
Lys Gly Thr Thr Ser Phe Asp Ile Pro Lys Lys Phe Glu Asn Asp Lys
290 295 300
Gln Val Tyr Asp Ala Val Asn Ser Phe Thr Glu Ile Val Thr Lys Asn
305 310 315 320
Asn Asp Leu Lys Arg Leu Leu Asn Ile Thr Gln Asn Ala Asn Asp Tyr
325 330 335
Asp Met Asn Lys Ile Tyr Val Val Ala Asp Ala Tyr Ser Met Ile Ser
340 345 350
Gln Phe Ile Ser Lys Lys Trp Asn Leu Ile Glu Glu Cys Leu Leu Asp
355 360 365
Tyr Tyr Ser Asp Asn Leu Pro Gly Lys Gly Asn Ala Lys Glu Asn Lys
370 375 380
Val Lys Lys Ala Val Lys Glu Glu Thr Tyr Arg Ser Val Ser Gln Leu
385 390 395 400
Asn Glu Val Ile Glu Lys Tyr Tyr Val Glu Lys Thr Gly Gln Ser Val
405 410 415
Trp Lys Val Glu Ser Tyr Ile Ser Ser Leu Ala Glu Met Ile Lys Leu
420 425 430
Glu Leu Cys His Glu Ile Asp Asn Asp Glu Lys His Asn Leu Ile Glu
435 440 445
Asp Asp Glu Lys Ile Ser Glu Ile Lys Glu Leu Leu Asp Met Tyr Met
450 455 460
Asp Val Phe His Ile Ile Lys Val Phe Arg Val Asn Glu Val Leu Asn
465 470 475 480
Phe Asp Glu Thr Phe Tyr Ser Glu Met Asp Glu Ile Tyr Gln Asp Met
485 490 495
Gln Glu Ile Val Pro Leu Tyr Asn His Val Arg Asn Tyr Val Thr Gln
500 505 510
Lys Pro Tyr Lys Gln Glu Lys Tyr Arg Leu Tyr Phe His Thr Pro Thr
515 520 525
Leu Ala Asn Gly Trp Ser Lys Ser Lys Glu Tyr Asp Asn Asn Ala Ile
530 535 540
Ile Leu Val Arg Glu Asp Lys Tyr Tyr Leu Gly Ile Leu Asn Ala Lys
545 550 555 560
Lys Lys Pro Ser Lys Glu Ile Met Ala Gly Lys Glu Asp Cys Ser Glu
565 570 575
His Ala Tyr Ala Lys Met Asn Tyr Tyr Leu Leu Pro Gly Ala Asn Lys
580 585 590
Met Leu Pro Lys Val Phe Leu Ser Lys Lys Gly Ile Gln Asp Tyr His
595 600 605
Pro Ser Ser Tyr Ile Val Glu Gly Tyr Asn Glu Lys Lys His Ile Lys
610 615 620
Gly Ser Lys Asn Phe Asp Ile Arg Phe Cys Arg Asp Leu Ile Asp Tyr
625 630 635 640
Phe Lys Glu Cys Ile Lys Lys His Pro Asp Trp Asn Lys Phe Asn Phe
645 650 655
Glu Phe Ser Ala Thr Glu Thr Tyr Glu Asp Ile Ser Val Phe Tyr Arg
660 665 670
Glu Val Glu Lys Gln Gly Tyr Arg Val Glu Trp Thr Tyr Ile Asn Ser
675 680 685
Glu Asp Ile Gln Lys Leu Glu Glu Asp Gly Gln Leu Phe Leu Phe Gln
690 695 700
Ile Tyr Asn Lys Asp Phe Ala Val Gly Ser Thr Gly Lys Pro Asn Leu
705 710 715 720
His Thr Leu Tyr Leu Lys Asn Leu Phe Ser Glu Glu Asn Leu Arg Asp
725 730 735
Ile Val Leu Lys Leu Asn Gly Glu Ala Glu Ile Phe Phe Arg Lys Ser
740 745 750
Ser Val Gln Lys Pro Val Ile His Lys Cys Gly Ser Ile Leu Val Asn
755 760 765
Arg Thr Tyr Glu Ile Thr Glu Ser Gly Thr Thr Arg Val Gln Ser Ile
770 775 780
Pro Glu Ser Glu Tyr Met Glu Leu Tyr Arg Tyr Phe Asn Ser Glu Lys
785 790 795 800
Gln Ile Glu Leu Ser Asp Glu Ala Lys Lys Tyr Leu Asp Lys Val Gln
805 810 815
Cys Asn Lys Ala Lys Thr Asp Ile Val Lys Asp Tyr Arg Tyr Thr Met
820 825 830
Asp Lys Phe Phe Ile His Leu Pro Ile Thr Ile Asn Phe Lys Val Asp
835 840 845
Lys Gly Asn Asn Val Asn Ala Ile Ala Gln Gln Tyr Ile Ala Gly Arg
850 855 860
Lys Asp Leu His Val Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Ile
865 870 875 880
Tyr Val Ser Val Ile Asp Met Tyr Gly Arg Ile Leu Glu Gln Lys Ser
885 890 895
Phe Asn Leu Val Glu Gln Val Ser Ser Gln Gly Thr Lys Arg Tyr Tyr
900 905 910
Asp Tyr Lys Glu Lys Leu Gln Asn Arg Glu Glu Glu Arg Asp Lys Ala
915 920 925
Arg Gln Ser Trp Lys Thr Ile Gly Lys Ile Lys Glu Leu Lys Glu Gly
930 935 940
Tyr Leu Ser Ser Val Ile His Glu Ile Ala Gln Met Val Val Lys Tyr
945 950 955 960
Asn Ala Ile Ile Ala Met Glu Asp Leu Asn Tyr Gly Phe Lys Arg Gly
965 970 975
Arg Phe Lys Val Glu Arg Gln Val Tyr Gln Lys Phe Glu Thr Met Leu
980 985 990
Ile Ser Lys Leu Asn Tyr Leu Ala Asp Lys Ser Gln Ala Val Asp Glu
995 1000 1005
Pro Gly Gly Ile Leu Arg Gly Tyr Gln Met Thr Tyr Val Pro Asp Asn
1010 1015 1020
Ile Lys Asn Val Gly Arg Gln Cys Gly Ile Ile Phe Tyr Val Pro Ala
1025 1030 1035 1040
Ala Tyr Thr Ser Lys Ile Asp Pro Thr Thr Gly Phe Ile Asn Ala Phe
1045 1050 1055
Lys Arg Asp Val Val Ser Thr Asn Asp Ala Lys Glu Asn Phe Leu Met
1060 1065 1070
Lys Phe Asp Ser Ile Gln Tyr Asp Ile Glu Lys Gly Leu Phe Lys Phe
1075 1080 1085
Ser Phe Asp Tyr Lys Asn Phe Ala Thr His Lys Leu Thr Leu Ala Lys
1090 1095 1100
Thr Lys Trp Asp Val Tyr Thr Asn Gly Thr Arg Ile Gln Asn Met Lys
1105 1110 1115 1120
Val Glu Gly His Trp Leu Ser Met Glu Val Glu Leu Thr Thr Lys Met
1125 1130 1135
Lys Glu Leu Leu Asp Asp Ser His Ile Pro Tyr Glu Glu Gly Gln Asn
1140 1145 1150
Ile Leu Asp Asp Leu Arg Glu Met Lys Asp Ile Thr Thr Ile Val Asn
1155 1160 1165
Gly Ile Leu Glu Ile Phe Trp Leu Thr Val Gln Leu Arg Asn Ser Arg
1170 1175 1180
Ile Asp Asn Pro Asp Tyr Asp Arg Ile Ile Ser Pro Val Leu Asn Lys
1185 1190 1195 1200
Asn Gly Glu Phe Phe Asp Ser Asp Glu Tyr Asn Ser Tyr Ile Asp Ala
1205 1210 1215
Gln Lys Ala Pro Leu Pro Ile Asp Ala Asp Ala Asn Gly Ala Phe Cys
1220 1225 1230
Ile Ala Leu Lys Gly Met Tyr Thr Ala Asn Gln Ile Lys Glu Asn Trp
1235 1240 1245
Val Glu Gly Glu Lys Leu Pro Ala Asp Cys Leu Lys Ile Glu His Ala
1250 1255 1260
Ser Trp Leu Ala Phe Met Gln Gly Glu Arg Gly
1265 1270 1275
<210> 7
<211> 3789
<212> DNA
<213> Artificial Sequence
<220>
<223> human codon optimized engineered mgCas12a-1
<400> 7
atgaacaatg gcaccaacaa tttccagaac tttatcggaa ttagcagtct gcaaaagact 60
ctccggaatg cccttatacc caccgagaca acccagcagt tcatcgtgaa aaacgggatt 120
atcaaggaag acgagctgcg cggcgaaaat cggcaaattt tgaaagatat aatggacgat 180
tattaccgcg gttttatctc tgagactctg agctccattg acgatatcga ctggacctca 240
ctcttcgaaa agatggagat tcagcttaaa aacggcgata ataaggacac actgataaaa 300
gaacaggctg agaagcggaa agccatctat aagaaatttg cagatgacga tcgcttcaag 360
aacatgttta gcgccaaatt gattagtgac atcctgccgg aattcgttat tcacaataac 420
aattactctg ctagcgagaa ggaagagaaa acccaagtca taaagctctt ttcccggttc 480
gccacttcat ttaaagatta tttcaagaac cgcgcaaatt gctttagcgc cgacgatatc 540
agttctagct cctgtcatcg gattgtgaac gacaatgctg aaatcttctt ttcaaacgcc 600
cttgtatacc gccggattgt gaaaaatctg agcaacgatg acataaataa gatcagtgga 660
gatattaaag actctttgaa ggagatgagc ctggaagaga tctattccta cgaaaaatat 720
ggggagttca ttacccagga aggcatatca ttttacaacg atatctgcgg taaggttaat 780
agcttcatga acctctattg tcagaaaaat aaggagaaca aaaatcttta caagctgcgc 840
aaattgcaca agcaaattct gtgcatcgca gacacaagtt atgaagtccc ttacaaattt 900
gagtctgatg aagaggtgta tcagagcgta aacggcttcc tcgacaatat ttcctcaaag 960
catatagtgg aacggcttcg caaaatcgga gataactaca atgggtataa cctggacaag 1020
atttacatcg ttagcaaatt ttatgagagt gtctctcaga agacctaccg ggattgggaa 1080
actattaata ccgccttgga gatacactat aacaatatcc tgcccggcaa cggtaaaagc 1140
aaggctgaca aagtgaagaa agccgtaaag aatgatctcc aaaaatccat tacagaaatc 1200
aacgagcttg tgtcaaatta caagctgtgt ccggacgata acattaaagc agaaacctat 1260
atacatgaga tcagccacat tttgaataac ttcgaagccc aggagctgaa gtacaatcca 1320
gaaatccatc tcgttgagag tgaacttaaa gcttctgagc tgaagaacgt cttggacgtg 1380
attatgaatg cctttcactg gtgcagcgta ttcatgactg aagagctggt ggataaagac 1440
aacaattttt atgcagaact cgaggaaata tacgatgaga tctataccgt tatttccctt 1500
tacaacctgg tccgcaatta tgtgacacag aagccctact caaccaaaaa gatcaaattg 1560
aacttcggca ttccgactct ggccgacgga tggagcaaga gtaaagaata ttctaataac 1620
gctataatcc tcatgcggga taatctttac tatctgggga tttttaacgc caagaataaa 1680
cctgacaaga aaatcattga gggcaacacc agcgaaaata agggtgatta caaaaagatg 1740
atatataact tgctgcccgg cccgaataaa atgatcccaa aggtattcct ctcctcaaaa 1800
acaggagtgg agacctacaa gcccagcgca tatattcttg aagggtacaa acaaaacaag 1860
catctgaaaa gttctaagga ctttgatatc actttctgtc acgacttgat tgattatttt 1920
aaaaattgca tagccatcca tccggagtgg aagaacttcg gctttgactt cagcgatacc 1980
tccacatacg aagacatttc aggtttttat cgcgaggttg aactgcaggg ctacaaaatc 2040
gattggacct atattagcga gaaggacata gatctccttc aggaaaaagg acaactgtac 2100
ttgttccaga tctataataa ggactttagt aaaaagtcta ctgggaacga taatctgcac 2160
accatgtacc tcaaaaacct tttcagcgag gaaaatctga aggacattgt cttgaaactg 2220
aacggcgagg ctgaaatctt tttccggaag tcctcaatta aaaatcctat aatccataag 2280
aaaggtagca ttctcgtgaa ccgcacatat gaggccgaag agaaggatca gtttggcaat 2340
atccaaattg tacggaaaac catacccgaa aacatctacc aggagcttta taagtacttc 2400
aatgacaaaa gtgataagga actgtctgac gaggcagcca aattgaagaa cgtggttgga 2460
caccatgaag ctgccactaa tattgtcaaa gattatcgct acacctatga caagtacttt 2520
ctgcacatgc cgatcacaat taacttcaaa gcaaataaga ccagctttat aaacgatcgg 2580
attctccagt atattgccaa agagaagaat cttcatgtga tcgggattga ccgcggcgaa 2640
cggaacctga tatacgtatc cgtgatcgat acttgtggta atattgttga gcaaaaatca 2700
ttcaacatcg tcaatggcta tgactaccag attaagttga aacagcaaga aggagctcgc 2760
cagatagccc ggcaggagtg gaaggaaatc gggaaaatta aggagatcaa agaaggctat 2820
ctgagcctcg tgattcacga gataagtaag atggtaatca aatacaacgc aattatcgcc 2880
atggaagatc tttcttatgg ttttaagaaa ggccgcttca aggtggagcg gcaagtttac 2940
cagaaatttg aaaccatgct gattaataag ttgaactatc tggtcttcaa agacataagc 3000
atcacagaga atggagggct ccttaagggc taccagctga cctatattcc agataaattg 3060
aagaacgtgg gtcatcaatg cggctgtatc ttttacgtac ccgctgccta tacttccaaa 3120
attgacccga ccacaggatt cgtgaatata tttaagttca aagatctgac cgttgacgca 3180
aagcgcgaat ttatcaaaaa gttcgattca attcggtacg acagcgagaa aaagctcttt 3240
tgcttcactt ttgattataa caatttcatc acccagaaca cagtcatgag taaatctagc 3300
tggtccgtgt acacctatgg ggtacgcatt aagcggcgct ttgtgaatgg ccggttctca 3360
aacgaaagcg acactataga tatcaccaaa gacatggaga agacacttga aatgaccgat 3420
attaattggc gcgacggtca cgatctgcgg caggacatca ttgattacga gatagttcaa 3480
catatctttg aaattttccg cttgactgtc cagatgcgga acagtctgtc tgagctcgaa 3540
gaccgcgatt atgaccggct tatcagccct gtgctgaatg agaacaatat tttttacgat 3600
tccgccaaag ctggcgacgc cttgcccaag gatgcagacg ccaacggagc ttattgtata 3660
gccctgaaag ggctctacga aatcaagcag attaccgaga attggaaaga agatggcaag 3720
ttctcacgcg acaaacttaa gatcagcaac aaagattggt ttgacttcat tcaaaataag 3780
cggtatctg 3789
<210> 8
<211> 3825
<212> DNA
<213> Artificial Sequence
<220>
<223> human codon optimized engineered mgCas12a-2
<400> 8
atgggcaaaa accaaaattt ccaagaattt atcggagtga gccccctgca gaagaccctc 60
cggaacgagc ttattccgac tgagaccaca aagaaaaata taacccagct ggacttgctg 120
actgaagatg agatccgcgc ccagaaccgg gaaaagctca aagagatgat ggacgattat 180
taccgcaatg ttattgacag tacccttcac gtcgggatcg ctgtggattg gtcttatctg 240
ttcagctgca tgcggaacca tttgcgcgaa aattccaagg agtcaaaacg ggaactggag 300
cgcacacagg acagcattcg gagtcagata cacaacaagt ttgccgaacg cgcagatttc 360
aaagacatgt ttggcgcctc tatcattacc aagctccttc ctacttacat caaacaaaat 420
agcgagtatt ccgaacggta cgatgagtca atggaaattc tgaagttgta tggtaaattc 480
accacaagcc tgaccgacta ctttgagact cgcaagaaca tattcagtaa agaaaagatc 540
tctagcgctg taggctatcg gattgtggag gaaaatgccg agatctttct ccagaaccag 600
aatgcatacg atcgcatttg taaaatagcc ggacttgacc tgcatgggtt ggataacgaa 660
atcaccgctt atgttgacgg caagacactg aaagaggtct gctccgatga aggtttcgcc 720
aaggcaatta cccaagaggg catcgaccgg tacaatgaag ccattggagc tgtgaaccag 780
tatatgaatc tcctttgtca gaaaaacaag gccctgaaac ccgggcaatt taagatgaaa 840
cgcttgcaca agcagatact gtgcaaaggc actacctcat tcgatatccc gaagaaattt 900
gagaatgaca agcaggtata cgatgcagtg aacagcttca cagaaattgt taccaaaaat 960
aacgacctca agcggcttct gaatatcact caaaacgcca atgattatga catgaacaaa 1020
atttacgtcg tggctgatgc ctatagtatg atatctcagt ttatcagcaa gaaatggaat 1080
ttgattgagg aatgtctgct cgactactat tccgataacc ttccaggtaa gggcaatgca 1140
aaagagaaca aggtaaaaaa ggccgtgaaa gaagagacct accgctcagt tagccagctg 1200
aatgaagtca tcgagaagta ttacgtggaa aaaacaggac aaagtgtatg gaaggtggag 1260
tcttatatta gctccttggc tgaaatgata aaactggagc tctgccatga aatcgacaac 1320
gatgagaagc acaatcttat tgaagacgat gagaaaatct cagaaattaa ggagctgttg 1380
gacatgtaca tggatgtttt ccatataatc aaagtctttc gggtgaacga agtactgaat 1440
ttcgacgaga ccttttatag cgaaatggat gagatttacc aggacatgca ggaaatcgtg 1500
cccctctata accacgttcg caattacgtc actcaaaagc cgtataaaca ggagaagtac 1560
cggctttatt tccatacccc tacactggcc aacgggtgga gtaaatctaa ggaatacgat 1620
aataacgcaa ttatattggt gcgcgaggac aaatattacc tgggcatcct caatgccaag 1680
aaaaagccca gcaaagaaat tatggctggt aaggaggatt gttccgaaca cgcctatgca 1740
aaaatgaact actatcttct gccgggcgcc aataagatgt tgccaaaagt atttctgtca 1800
aagaaaggaa tccaggacta ccatcccagc agttatattg tggaggggta caacgaaaag 1860
aaacacataa agggctctaa aaatttcgat atccggtttt gccgcgacct cattgattat 1920
ttcaaggagt gtatcaaaaa gcatccggac tggaacaaat ttaatttcga atttagcgct 1980
accgagactt acgaagatat ttccgttttc tatcgggagg tcgaaaagca aggttaccgc 2040
gtggagtgga cctatataaa ctcagaagac atccagaaac ttgaggaaga tggccagctg 2100
tttttgttcc aaatttacaa taaggacttt gccgtaggaa gcacagggaa acctaacctg 2160
cacaccctct atcttaagaa tctgttcagt gaggaaaact tgcgggatat cgtgctgaaa 2220
ctcaatggcg aggcagaaat ttttttccgc aagtctagcg ttcagaaacc cgtcatacat 2280
aagtgcggtt ccatccttgt gaaccggact tacgagatta ccgaatcagg cacaacccgc 2340
gtacagagca tcccggagag tgaatatatg gagctgtacc ggtattttaa ttctgaaaaa 2400
caaattgagt tgagcgacga agccaagaaa tacctggata aggtgcagtg taacaaagct 2460
aagactgaca tagttaaaga ttatcgctac accatggaca agttctttat ccacctccca 2520
attacaatca atttcaaagt cgataaggga aacaatgtga acgccattgc acagcaatat 2580
atagccgggc ggaaagacct tcatgtaatc ggcattgatc gcggtgagcg gaatctgatc 2640
tacgtgtccg ttattgacat gtatggccgc atattggaac agaagtcatt taacctggtc 2700
gagcaggtga gcagtcaagg aaccaaacgg tactatgatt acaaggaaaa actccagaat 2760
cgcgaggaag agcgggacaa ggctcgccag tcttggaaaa ctatcgggaa gattaaagaa 2820
cttaaggagg gctatctgag ctccgtaatc cacgaaattg cccaaatggt ggttaaatac 2880
aacgcaataa tcgccatgga ggatttgaat tatggtttca agcggggccg ctttaaagtc 2940
gaacggcagg tgtaccagaa gttcgagacc atgctgattt caaaactcaa ctatcttgct 3000
gacaagagcc aagccgtaga tgaacccgga gggattctgc gcggctacca gatgacatat 3060
gtgccggaca atattaaaaa cgttggtcgg cagtgcggca taatctttta cgtccctgca 3120
gcctatacca gtaagattga tcccactacc ggattcatca atgcttttaa acgcgacgtg 3180
gtatctacaa acgatgccaa ggagaatttc ttgatgaaat ttgacagcat tcaatacgat 3240
atagaaaagg ggctgttcaa attttccttc gactataaga actttgcaac ccataaactc 3300
actcttgcca agaccaaatg ggatgtgtac acaaatggca cccggattca gaacatgaag 3360
gttgagggtc actggctgtc aatggaagtc gagttgacta ccaaaatgaa ggaactgctc 3420
gacgatagcc atattccgta tgaggaaggc cagaatatcc ttgacgatct gcgcgagatg 3480
aaagacatta caaccatagt gaacggaatc ttggaaattt tctggctgac tgtacaactc 3540
cggaatagtc gcatcgataa cccagactac gatcggatta tatctcccgt gcttaataag 3600
aacggggagt ttttcgacag cgatgaatat aattcctaca tcgacgctca gaaagccccg 3660
ctgcctattg atgcagacgc caacggcgct ttttgtatcg ccttgaaggg tatgtatacc 3720
gcaaatcaga ttaaagagaa ctgggttgaa ggcgagaagc tgcccgccga ttgcctcaaa 3780
atagaacacg cttcatggct tgccttcatg caaggagagc gcggg 3825
<210> 9
<211> 1307
<212> PRT
<213> Artificial Sequence
<220>
<223> AsCas12a
<400> 9
Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln
20 25 30
Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys
35 40 45
Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln
50 55 60
Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile
65 70 75 80
Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile
85 90 95
Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly
100 105 110
Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile
115 120 125
Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys
130 135 140
Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg
145 150 155 160
Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg
165 170 175
Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg
180 185 190
Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe
195 200 205
Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn
210 215 220
Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val
225 230 235 240
Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp
245 250 255
Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu
260 265 270
Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn
275 280 285
Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro
290 295 300
Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu
305 310 315 320
Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr
325 330 335
Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu
340 345 350
Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His
355 360 365
Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr
370 375 380
Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys
385 390 395 400
Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu
405 410 415
Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser
420 425 430
Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala
435 440 445
Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys
450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp
530 535 540
Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655
Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala
660 665 670
Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr
675 680 685
Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr
690 695 700
Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His
705 710 715 720
Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu
725 730 735
Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys
740 745 750
Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu
755 760 765
Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln
770 775 780
Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His
785 790 795 800
Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr
805 810 815
Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His
820 825 830
Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn
835 840 845
Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe
850 855 860
Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln
865 870 875 880
Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu
885 890 895
Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg
900 905 910
Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu
915 920 925
Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu
930 935 940
Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val
945 950 955 960
Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile
965 970 975
His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu
980 985 990
Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu
995 1000 1005
Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn
1010 1015 1020
Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu
1025 1030 1035 1040
Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly
1045 1050 1055
Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys
1060 1065 1070
Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile
1075 1080 1085
Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu
1090 1095 1100
His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn
1105 1110 1115 1120
Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp
1125 1130 1135
Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr
1140 1145 1150
Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His Arg
1155 1160 1165
Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala
1170 1175 1180
Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu
1185 1190 1195 1200
Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val
1205 1210 1215
Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr
1220 1225 1230
Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys
1235 1240 1245
Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala
1250 1255 1260
Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His
1265 1270 1275 1280
Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln
1285 1290 1295
Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1300 1305
<210> 10
<211> 1228
<212> PRT
<213> Artificial Sequence
<220>
<223> LbCas12a
<400> 10
Ala Ala Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys
1 5 10 15
Thr Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile
20 25 30
Asp Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr
35 40 45
Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn
50 55 60
Asp Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser
65 70 75 80
Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu
85 90 95
Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly
100 105 110
Ala Ala Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile
115 120 125
Leu Pro Glu Ala Ala Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser
130 135 140
Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu
145 150 155 160
Asn Xaa Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys
165 170 175
Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Xaa Asp Ile Phe Glu
180 185 190
Lys Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu
195 200 205
Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu
210 215 220
Phe Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala
225 230 235 240
Ile Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu
245 250 255
Asn Glu Tyr Ile Asn Leu Tyr Asn Ala Lys Thr Lys Gln Ala Leu Pro
260 265 270
Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu
275 280 285
Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val
290 295 300
Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys
305 310 315 320
Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly
325 330 335
Ile Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile
340 345 350
Phe Gly Glu Trp Asn Leu Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp
355 360 365
Asp Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp
370 375 380
Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln
385 390 395 400
Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys
405 410 415
Glu Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser
420 425 430
Ser Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys
435 440 445
Lys Asn Asp Ala Val Val Ala Ile Xaa Lys Asp Leu Leu Asp Ser Val
450 455 460
Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu
465 470 475 480
Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp
485 490 495
Ile Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val
500 505 510
Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn
515 520 525
Pro Gln Phe Xaa Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg
530 535 540
Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Xaa Asp
545 550 555 560
Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn
565 570 575
Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys
580 585 590
Xaa Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Xaa Ala Tyr Tyr Asn
595 600 605
Pro Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys
610 615 620
Gly Asp Xaa Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe
625 630 635 640
Lys Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe
645 650 655
Asn Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg
660 665 670
Glu Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys
675 680 685
Lys Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Xaa Phe Gln
690 695 700
Ile Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu
705 710 715 720
His Thr Xaa Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln
725 730 735
Ile Arg Leu Ser Gly Gly Ala Glu Leu Phe Xaa Arg Arg Ala Ser Leu
740 745 750
Lys Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn
755 760 765
Lys Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val
770 775 780
Tyr Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro
785 790 795 800
Ile Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu
805 810 815
Val Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile
820 825 830
Asp Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys
835 840 845
Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe
850 855 860
Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys
865 870 875 880
Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn
885 890 895
Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile
900 905 910
Cys Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Glu Asp Leu
915 920 925
Asn Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr
930 935 940
Gln Lys Phe Glu Lys Xaa Leu Ile Asp Lys Leu Asn Tyr Xaa Val Asp
945 950 955 960
Lys Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln
965 970 975
Ile Thr Asn Lys Phe Glu Ser Phe Lys Ser Xaa Ser Thr Gln Asn Gly
980 985 990
Phe Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser
995 1000 1005
Thr Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp
1010 1015 1020
Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Xaa Tyr Val Pro Glu
1025 1030 1035 1040
Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr
1045 1050 1055
Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn Arg
1060 1065 1070
Ile Arg Ile Phe Ala Ala Ala Lys Lys Asn Asn Val Phe Ala Trp Glu
1075 1080 1085
Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn Lys Tyr Gly
1090 1095 1100
Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu Cys Glu Gln Ser
1105 1110 1115 1120
Asp Lys Ala Phe Tyr Ser Ser Phe Xaa Ala Leu Xaa Ser Leu Xaa Leu
1125 1130 1135
Gln Xaa Arg Asn Ser Ile Thr Gly Arg Thr Asp Val Asp Phe Leu Ile
1140 1145 1150
Ser Pro Val Lys Asn Ser Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr
1155 1160 1165
Glu Ala Gln Glu Asn Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly
1170 1175 1180
Ala Tyr Asn Ile Ala Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys
1185 1190 1195 1200
Lys Ala Glu Asp Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn
1205 1210 1215
Lys Glu Trp Leu Glu Tyr Ala Gln Thr Ser Val Lys
1220 1225
<210> 11
<211> 1300
<212> PRT
<213> Artificial Sequence
<220>
<223> FnCas12a
<400> 11
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Asp Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val Tyr
1010 1015 1020
Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu Val Phe
1025 1030 1035 1040
Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg Ala Tyr Gln
1045 1050 1055
Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly Lys Gln Thr Gly
1060 1065 1070
Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser Lys Ile Cys Pro Val
1075 1080 1085
Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys Tyr Glu Ser Val Ser Lys
1090 1095 1100
Ser Gln Glu Phe Phe Ser Lys Phe Asp Lys Ile Cys Tyr Asn Leu Asp
1105 1110 1115 1120
Lys Gly Tyr Phe Glu Phe Ser Phe Asp Tyr Lys Asn Phe Gly Asp Lys
1125 1130 1135
Ala Ala Lys Gly Lys Trp Thr Ile Ala Ser Phe Gly Ser Arg Leu Ile
1140 1145 1150
Asn Phe Arg Asn Ser Asp Lys Asn His Asn Trp Asp Thr Arg Glu Val
1155 1160 1165
Tyr Pro Thr Lys Glu Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu
1170 1175 1180
Tyr Gly His Gly Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp
1185 1190 1195 1200
Lys Lys Phe Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln
1205 1210 1215
Met Arg Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro
1220 1225 1230
Val Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly Leu
1250 1255 1260
Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu Gly Lys
1265 1270 1275 1280
Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu Phe Val Gln
1285 1290 1295
Asn Arg Asn Asn
1300
<210> 12
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> 5'-handle RNA
<400> 12
aauuucuacu guuguagau 19
<210> 13
<211> 1263
<212> PRT
<213> Artificial Sequence
<220>
<223> d_mgCas12a-1
<400> 13
Met Asn Asn Gly Thr Asn Asn Phe Gln Asn Phe Ile Gly Ile Ser Ser
1 5 10 15
Leu Gln Lys Thr Leu Arg Asn Ala Leu Ile Pro Thr Glu Thr Thr Gln
20 25 30
Gln Phe Ile Val Lys Asn Gly Ile Ile Lys Glu Asp Glu Leu Arg Gly
35 40 45
Glu Asn Arg Gln Ile Leu Lys Asp Ile Met Asp Asp Tyr Tyr Arg Gly
50 55 60
Phe Ile Ser Glu Thr Leu Ser Ser Ile Asp Asp Ile Asp Trp Thr Ser
65 70 75 80
Leu Phe Glu Lys Met Glu Ile Gln Leu Lys Asn Gly Asp Asn Lys Asp
85 90 95
Thr Leu Ile Lys Glu Gln Ala Glu Lys Arg Lys Ala Ile Tyr Lys Lys
100 105 110
Phe Ala Asp Asp Asp Arg Phe Lys Asn Met Phe Ser Ala Lys Leu Ile
115 120 125
Ser Asp Ile Leu Pro Glu Phe Val Ile His Asn Asn Asn Tyr Ser Ala
130 135 140
Ser Glu Lys Glu Glu Lys Thr Gln Val Ile Lys Leu Phe Ser Arg Phe
145 150 155 160
Ala Thr Ser Phe Lys Asp Tyr Phe Lys Asn Arg Ala Asn Cys Phe Ser
165 170 175
Ala Asp Asp Ile Ser Ser Ser Ser Cys His Arg Ile Val Asn Asp Asn
180 185 190
Ala Glu Ile Phe Phe Ser Asn Ala Leu Val Tyr Arg Arg Ile Val Lys
195 200 205
Asn Leu Ser Asn Asp Asp Ile Asn Lys Ile Ser Gly Asp Ile Lys Asp
210 215 220
Ser Leu Lys Glu Met Ser Leu Glu Glu Ile Tyr Ser Tyr Glu Lys Tyr
225 230 235 240
Gly Glu Phe Ile Thr Gln Glu Gly Ile Ser Phe Tyr Asn Asp Ile Cys
245 250 255
Gly Lys Val Asn Ser Phe Met Asn Leu Tyr Cys Gln Lys Asn Lys Glu
260 265 270
Asn Lys Asn Leu Tyr Lys Leu Arg Lys Leu His Lys Gln Ile Leu Cys
275 280 285
Ile Ala Asp Thr Ser Tyr Glu Val Pro Tyr Lys Phe Glu Ser Asp Glu
290 295 300
Glu Val Tyr Gln Ser Val Asn Gly Phe Leu Asp Asn Ile Ser Ser Lys
305 310 315 320
His Ile Val Glu Arg Leu Arg Lys Ile Gly Asp Asn Tyr Asn Gly Tyr
325 330 335
Asn Leu Asp Lys Ile Tyr Ile Val Ser Lys Phe Tyr Glu Ser Val Ser
340 345 350
Gln Lys Thr Tyr Arg Asp Trp Glu Thr Ile Asn Thr Ala Leu Glu Ile
355 360 365
His Tyr Asn Asn Ile Leu Pro Gly Asn Gly Lys Ser Lys Ala Asp Lys
370 375 380
Val Lys Lys Ala Val Lys Asn Asp Leu Gln Lys Ser Ile Thr Glu Ile
385 390 395 400
Asn Glu Leu Val Ser Asn Tyr Lys Leu Cys Pro Asp Asp Asn Ile Lys
405 410 415
Ala Glu Thr Tyr Ile His Glu Ile Ser His Ile Leu Asn Asn Phe Glu
420 425 430
Ala Gln Glu Leu Lys Tyr Asn Pro Glu Ile His Leu Val Glu Ser Glu
435 440 445
Leu Lys Ala Ser Glu Leu Lys Asn Val Leu Asp Val Ile Met Asn Ala
450 455 460
Phe His Trp Cys Ser Val Phe Met Thr Glu Glu Leu Val Asp Lys Asp
465 470 475 480
Asn Asn Phe Tyr Ala Glu Leu Glu Glu Ile Tyr Asp Glu Ile Tyr Thr
485 490 495
Val Ile Ser Leu Tyr Asn Leu Val Arg Asn Tyr Val Thr Gln Lys Pro
500 505 510
Tyr Ser Thr Lys Lys Ile Lys Leu Asn Phe Gly Ile Pro Thr Leu Ala
515 520 525
Asp Gly Trp Ser Lys Ser Lys Glu Tyr Ser Asn Asn Ala Ile Ile Leu
530 535 540
Met Arg Asp Asn Leu Tyr Tyr Leu Gly Ile Phe Asn Ala Lys Asn Lys
545 550 555 560
Pro Asp Lys Lys Ile Ile Glu Gly Asn Thr Ser Glu Asn Lys Gly Asp
565 570 575
Tyr Lys Lys Met Ile Tyr Asn Leu Leu Pro Gly Pro Asn Lys Met Ile
580 585 590
Pro Lys Val Phe Leu Ser Ser Lys Thr Gly Val Glu Thr Tyr Lys Pro
595 600 605
Ser Ala Tyr Ile Leu Glu Gly Tyr Lys Gln Asn Lys His Leu Lys Ser
610 615 620
Ser Lys Asp Phe Asp Ile Thr Phe Cys His Asp Leu Ile Asp Tyr Phe
625 630 635 640
Lys Asn Cys Ile Ala Ile His Pro Glu Trp Lys Asn Phe Gly Phe Asp
645 650 655
Phe Ser Asp Thr Ser Thr Tyr Glu Asp Ile Ser Gly Phe Tyr Arg Glu
660 665 670
Val Glu Leu Gln Gly Tyr Lys Ile Asp Trp Thr Tyr Ile Ser Glu Lys
675 680 685
Asp Ile Asp Leu Leu Gln Glu Lys Gly Gln Leu Tyr Leu Phe Gln Ile
690 695 700
Tyr Asn Lys Asp Phe Ser Lys Lys Ser Thr Gly Asn Asp Asn Leu His
705 710 715 720
Thr Met Tyr Leu Lys Asn Leu Phe Ser Glu Glu Asn Leu Lys Asp Ile
725 730 735
Val Leu Lys Leu Asn Gly Glu Ala Glu Ile Phe Phe Arg Lys Ser Ser
740 745 750
Ile Lys Asn Pro Ile Ile His Lys Lys Gly Ser Ile Leu Val Asn Arg
755 760 765
Thr Tyr Glu Ala Glu Glu Lys Asp Gln Phe Gly Asn Ile Gln Ile Val
770 775 780
Arg Lys Thr Ile Pro Glu Asn Ile Tyr Gln Glu Leu Tyr Lys Tyr Phe
785 790 795 800
Asn Asp Lys Ser Asp Lys Glu Leu Ser Asp Glu Ala Ala Lys Leu Lys
805 810 815
Asn Val Val Gly His His Glu Ala Ala Thr Asn Ile Val Lys Asp Tyr
820 825 830
Arg Tyr Thr Tyr Asp Lys Tyr Phe Leu His Met Pro Ile Thr Ile Asn
835 840 845
Phe Lys Ala Asn Lys Thr Ser Phe Ile Asn Asp Arg Ile Leu Gln Tyr
850 855 860
Ile Ala Lys Glu Lys Asn Leu His Val Ile Gly Ile Ala Arg Gly Glu
865 870 875 880
Arg Asn Leu Ile Tyr Val Ser Val Ile Asp Thr Cys Gly Asn Ile Val
885 890 895
Glu Gln Lys Ser Phe Asn Ile Val Asn Gly Tyr Asp Tyr Gln Ile Lys
900 905 910
Leu Lys Gln Gln Glu Gly Ala Arg Gln Ile Ala Arg Lys Glu Trp Lys
915 920 925
Glu Ile Gly Lys Ile Lys Glu Ile Lys Glu Gly Tyr Leu Ser Leu Val
930 935 940
Ile His Glu Ile Ser Lys Met Val Ile Lys Tyr Asn Ala Ile Ile Ala
945 950 955 960
Met Glu Asp Leu Ser Tyr Gly Phe Lys Lys Gly Arg Phe Lys Val Glu
965 970 975
Arg Gln Val Tyr Gln Lys Phe Glu Thr Met Leu Ile Asn Lys Leu Asn
980 985 990
Tyr Leu Val Phe Lys Asp Ile Ser Ile Thr Glu Asn Gly Gly Leu Leu
995 1000 1005
Lys Gly Tyr Gln Leu Thr Tyr Ile Pro Asp Lys Leu Lys Asn Val Gly
1010 1015 1020
His Gln Cys Gly Cys Ile Phe Tyr Val Pro Ala Ala Tyr Thr Ser Lys
1025 1030 1035 1040
Ile Asp Pro Thr Thr Gly Phe Val Asn Ile Phe Lys Phe Lys Asp Leu
1045 1050 1055
Thr Val Asp Ala Lys Arg Glu Phe Ile Lys Lys Phe Asp Ser Ile Arg
1060 1065 1070
Tyr Asp Ser Glu Lys Lys Leu Phe Cys Phe Thr Phe Asp Tyr Asn Asn
1075 1080 1085
Phe Ile Thr Gln Asn Thr Val Met Ser Lys Ser Ser Trp Ser Val Tyr
1090 1095 1100
Thr Tyr Gly Val Arg Ile Lys Arg Arg Phe Val Asn Gly Arg Phe Ser
1105 1110 1115 1120
Asn Glu Ser Asp Thr Ile Asp Ile Thr Lys Asp Met Glu Lys Thr Leu
1125 1130 1135
Glu Met Thr Asp Ile Asn Trp Arg Asp Gly His Asp Leu Arg Gln Asp
1140 1145 1150
Ile Ile Asp Tyr Glu Ile Val Gln His Ile Phe Glu Ile Phe Arg Leu
1155 1160 1165
Thr Val Gln Met Arg Asn Ser Leu Ser Glu Leu Glu Asp Arg Asp Tyr
1170 1175 1180
Asp Arg Leu Ile Ser Pro Val Leu Asn Glu Asn Asn Ile Phe Tyr Asp
1185 1190 1195 1200
Ser Ala Lys Ala Gly Asp Ala Leu Pro Lys Asp Ala Asp Ala Asn Gly
1205 1210 1215
Ala Tyr Cys Ile Ala Leu Lys Gly Leu Tyr Glu Ile Lys Gln Ile Thr
1220 1225 1230
Glu Asn Trp Lys Glu Asp Gly Lys Phe Ser Arg Asp Lys Leu Lys Ile
1235 1240 1245
Ser Asn Lys Asp Trp Phe Asp Phe Ile Gln Asn Lys Arg Tyr Leu
1250 1255 1260
<210> 14
<211> 1275
<212> PRT
<213> Artificial Sequence
<220>
<223> d_mgCas12a-2
<400> 14
Met Gly Lys Asn Gln Asn Phe Gln Glu Phe Ile Gly Val Ser Pro Leu
1 5 10 15
Gln Lys Thr Leu Arg Asn Glu Leu Ile Pro Thr Glu Thr Thr Lys Lys
20 25 30
Asn Ile Thr Gln Leu Asp Leu Leu Thr Glu Asp Glu Ile Arg Ala Gln
35 40 45
Asn Arg Glu Lys Leu Lys Glu Met Met Asp Asp Tyr Tyr Arg Asn Val
50 55 60
Ile Asp Ser Thr Leu His Val Gly Ile Ala Val Asp Trp Ser Tyr Leu
65 70 75 80
Phe Ser Cys Met Arg Asn His Leu Arg Glu Asn Ser Lys Glu Ser Lys
85 90 95
Arg Glu Leu Glu Arg Thr Gln Asp Ser Ile Arg Ser Gln Ile His Asn
100 105 110
Lys Phe Ala Glu Arg Ala Asp Phe Lys Asp Met Phe Gly Ala Ser Ile
115 120 125
Ile Thr Lys Leu Leu Pro Thr Tyr Ile Lys Gln Asn Ser Glu Tyr Ser
130 135 140
Glu Arg Tyr Asp Glu Ser Met Glu Ile Leu Lys Leu Tyr Gly Lys Phe
145 150 155 160
Thr Thr Ser Leu Thr Asp Tyr Phe Glu Thr Arg Lys Asn Ile Phe Ser
165 170 175
Lys Glu Lys Ile Ser Ser Ala Val Gly Tyr Arg Ile Val Glu Glu Asn
180 185 190
Ala Glu Ile Phe Leu Gln Asn Gln Asn Ala Tyr Asp Arg Ile Cys Lys
195 200 205
Ile Ala Gly Leu Asp Leu His Gly Leu Asp Asn Glu Ile Thr Ala Tyr
210 215 220
Val Asp Gly Lys Thr Leu Lys Glu Val Cys Ser Asp Glu Gly Phe Ala
225 230 235 240
Lys Ala Ile Thr Gln Glu Gly Ile Asp Arg Tyr Asn Glu Ala Ile Gly
245 250 255
Ala Val Asn Gln Tyr Met Asn Leu Leu Cys Gln Lys Asn Lys Ala Leu
260 265 270
Lys Pro Gly Gln Phe Lys Met Lys Arg Leu His Lys Gln Ile Leu Cys
275 280 285
Lys Gly Thr Thr Ser Phe Asp Ile Pro Lys Lys Phe Glu Asn Asp Lys
290 295 300
Gln Val Tyr Asp Ala Val Asn Ser Phe Thr Glu Ile Val Thr Lys Asn
305 310 315 320
Asn Asp Leu Lys Arg Leu Leu Asn Ile Thr Gln Asn Ala Asn Asp Tyr
325 330 335
Asp Met Asn Lys Ile Tyr Val Val Ala Asp Ala Tyr Ser Met Ile Ser
340 345 350
Gln Phe Ile Ser Lys Lys Trp Asn Leu Ile Glu Glu Cys Leu Leu Asp
355 360 365
Tyr Tyr Ser Asp Asn Leu Pro Gly Lys Gly Asn Ala Lys Glu Asn Lys
370 375 380
Val Lys Lys Ala Val Lys Glu Glu Thr Tyr Arg Ser Val Ser Gln Leu
385 390 395 400
Asn Glu Val Ile Glu Lys Tyr Tyr Val Glu Lys Thr Gly Gln Ser Val
405 410 415
Trp Lys Val Glu Ser Tyr Ile Ser Ser Leu Ala Glu Met Ile Lys Leu
420 425 430
Glu Leu Cys His Glu Ile Asp Asn Asp Glu Lys His Asn Leu Ile Glu
435 440 445
Asp Asp Glu Lys Ile Ser Glu Ile Lys Glu Leu Leu Asp Met Tyr Met
450 455 460
Asp Val Phe His Ile Ile Lys Val Phe Arg Val Asn Glu Val Leu Asn
465 470 475 480
Phe Asp Glu Thr Phe Tyr Ser Glu Met Asp Glu Ile Tyr Gln Asp Met
485 490 495
Gln Glu Ile Val Pro Leu Tyr Asn His Val Arg Asn Tyr Val Thr Gln
500 505 510
Lys Pro Tyr Lys Gln Glu Lys Tyr Arg Leu Tyr Phe His Thr Pro Thr
515 520 525
Leu Ala Asn Gly Trp Ser Lys Ser Lys Glu Tyr Asp Asn Asn Ala Ile
530 535 540
Ile Leu Val Arg Glu Asp Lys Tyr Tyr Leu Gly Ile Leu Asn Ala Lys
545 550 555 560
Lys Lys Pro Ser Lys Glu Ile Met Ala Gly Lys Glu Asp Cys Ser Glu
565 570 575
His Ala Tyr Ala Lys Met Asn Tyr Tyr Leu Leu Pro Gly Ala Asn Lys
580 585 590
Met Leu Pro Lys Val Phe Leu Ser Lys Lys Gly Ile Gln Asp Tyr His
595 600 605
Pro Ser Ser Tyr Ile Val Glu Gly Tyr Asn Glu Lys Lys His Ile Lys
610 615 620
Gly Ser Lys Asn Phe Asp Ile Arg Phe Cys Arg Asp Leu Ile Asp Tyr
625 630 635 640
Phe Lys Glu Cys Ile Lys Lys His Pro Asp Trp Asn Lys Phe Asn Phe
645 650 655
Glu Phe Ser Ala Thr Glu Thr Tyr Glu Asp Ile Ser Val Phe Tyr Arg
660 665 670
Glu Val Glu Lys Gln Gly Tyr Arg Val Glu Trp Thr Tyr Ile Asn Ser
675 680 685
Glu Asp Ile Gln Lys Leu Glu Glu Asp Gly Gln Leu Phe Leu Phe Gln
690 695 700
Ile Tyr Asn Lys Asp Phe Ala Val Gly Ser Thr Gly Lys Pro Asn Leu
705 710 715 720
His Thr Leu Tyr Leu Lys Asn Leu Phe Ser Glu Glu Asn Leu Arg Asp
725 730 735
Ile Val Leu Lys Leu Asn Gly Glu Ala Glu Ile Phe Phe Arg Lys Ser
740 745 750
Ser Val Gln Lys Pro Val Ile His Lys Cys Gly Ser Ile Leu Val Asn
755 760 765
Arg Thr Tyr Glu Ile Thr Glu Ser Gly Thr Thr Arg Val Gln Ser Ile
770 775 780
Pro Glu Ser Glu Tyr Met Glu Leu Tyr Arg Tyr Phe Asn Ser Glu Lys
785 790 795 800
Gln Ile Glu Leu Ser Asp Glu Ala Lys Lys Tyr Leu Asp Lys Val Gln
805 810 815
Cys Asn Lys Ala Lys Thr Asp Ile Val Lys Asp Tyr Arg Tyr Thr Met
820 825 830
Asp Lys Phe Phe Ile His Leu Pro Ile Thr Ile Asn Phe Lys Val Asp
835 840 845
Lys Gly Asn Asn Val Asn Ala Ile Ala Gln Gln Tyr Ile Ala Gly Arg
850 855 860
Lys Asp Leu His Val Ile Gly Ile Ala Arg Gly Glu Arg Asn Leu Ile
865 870 875 880
Tyr Val Ser Val Ile Asp Met Tyr Gly Arg Ile Leu Glu Gln Lys Ser
885 890 895
Phe Asn Leu Val Glu Gln Val Ser Ser Gln Gly Thr Lys Arg Tyr Tyr
900 905 910
Asp Tyr Lys Glu Lys Leu Gln Asn Arg Glu Glu Glu Arg Asp Lys Ala
915 920 925
Arg Lys Ser Trp Lys Thr Ile Gly Lys Ile Lys Glu Leu Lys Glu Gly
930 935 940
Tyr Leu Ser Ser Val Ile His Glu Ile Ala Gln Met Val Val Lys Tyr
945 950 955 960
Asn Ala Ile Ile Ala Met Glu Asp Leu Asn Tyr Gly Phe Lys Arg Gly
965 970 975
Arg Phe Lys Val Glu Arg Gln Val Tyr Gln Lys Phe Glu Thr Met Leu
980 985 990
Ile Ser Lys Leu Asn Tyr Leu Ala Asp Lys Ser Gln Ala Val Asp Glu
995 1000 1005
Pro Gly Gly Ile Leu Arg Gly Tyr Gln Met Thr Tyr Val Pro Asp Asn
1010 1015 1020
Ile Lys Asn Val Gly Arg Gln Cys Gly Ile Ile Phe Tyr Val Pro Ala
1025 1030 1035 1040
Ala Tyr Thr Ser Lys Ile Asp Pro Thr Thr Gly Phe Ile Asn Ala Phe
1045 1050 1055
Lys Arg Asp Val Val Ser Thr Asn Asp Ala Lys Glu Asn Phe Leu Met
1060 1065 1070
Lys Phe Asp Ser Ile Gln Tyr Asp Ile Glu Lys Gly Leu Phe Lys Phe
1075 1080 1085
Ser Phe Asp Tyr Lys Asn Phe Ala Thr His Lys Leu Thr Leu Ala Lys
1090 1095 1100
Thr Lys Trp Asp Val Tyr Thr Asn Gly Thr Arg Ile Gln Asn Met Lys
1105 1110 1115 1120
Val Glu Gly His Trp Leu Ser Met Glu Val Glu Leu Thr Thr Lys Met
1125 1130 1135
Lys Glu Leu Leu Asp Asp Ser His Ile Pro Tyr Glu Glu Gly Gln Asn
1140 1145 1150
Ile Leu Asp Asp Leu Arg Glu Met Lys Asp Ile Thr Thr Ile Val Asn
1155 1160 1165
Gly Ile Leu Glu Ile Phe Trp Leu Thr Val Gln Leu Arg Asn Ser Arg
1170 1175 1180
Ile Asp Asn Pro Asp Tyr Asp Arg Ile Ile Ser Pro Val Leu Asn Lys
1185 1190 1195 1200
Asn Gly Glu Phe Phe Asp Ser Asp Glu Tyr Asn Ser Tyr Ile Asp Ala
1205 1210 1215
Gln Lys Ala Pro Leu Pro Ile Asp Ala Asp Ala Asn Gly Ala Phe Cys
1220 1225 1230
Ile Ala Leu Lys Gly Met Tyr Thr Ala Asn Gln Ile Lys Glu Asn Trp
1235 1240 1245
Val Glu Gly Glu Lys Leu Pro Ala Asp Cys Leu Lys Ile Glu His Ala
1250 1255 1260
Ser Trp Leu Ala Phe Met Gln Gly Glu Arg Gly
1265 1270 1275
<210> 15
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> CCR5 Adapter primer sequence (5'-3')
<400> 15
tcgtcggcag cgtcagatgt gtataagaga cagggtattt ctgttcagat cac 53
<210> 16
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> CCR5 Adapter primer sequence (5'-3')
<400> 16
gtctcgtggg ctcggagatg tgtataagag acaggcccat caattataga aagcc 55
<210> 17
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> DNMT1 Adapter primer sequence (5'-3')
<400> 17
tcgtcggcag cgtcagatgt gtataagaga cagctgcaca cagcaggcct ttg 53
<210> 18
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> DNMT1 Adapter primer sequence (5'-3')
<400> 18
gtctcgtggg ctcggagatg tgtataagag acagcccaat aagtggcaga gtgc 54
<210> 19
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> NbFTa14_1/2-2 crRNA sequence(PAM site)
<400> 19
tttggataat ttgtactctt gtcgatgt 28
<210> 20
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> NbFTa14_1/2-4 crRNA sequence(PAM site)
<400> 20
tttagtccac aaacagctaa gcccacat 28
<210> 21
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> NGS NbFTa14_1 Forward primer
<400> 21
tgagctgaag atggattatg 20
<210> 22
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> NGS NbFTa14_1 Reverse primer
<400> 22
tcatgcttaa gataaaagag 20
<210> 23
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> NGS NbFTa14_2 Forward primer
<400> 23
tcatgagctt aagatggatc 20
<210> 24
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> NGS NbFTa14_2 Reverse primer
<400> 24
gtttaagcta aaagaactac 20
<210> 25
<211> 43
<212> RNA
<213> Artificial Sequence
<220>
<223> LsXTb12 crRNA #1
<400> 25
aatttctact aagtgtagat tcttcatcct caattccatc acc 43
<210> 26
<211> 43
<212> RNA
<213> Artificial Sequence
<220>
<223> LsXTb12 crRNA #2
<400> 26
aatttctact aagtgtagat gcaagcctgt aactctggaa gac 43
<210> 27
<211> 1504
<212> DNA
<213> Artificial Sequence
<220>
<223> HsCCR5 Linear DNA
<400> 27
ggtggtggct gtgtttgcgt ctctcccagg aatcatcttt accagatctc aaaaagaagg 60
tcttcattac acctgcagct ctcattttcc atacagtcag tatcaattct ggaagaattt 120
ccagacatta aagatagtca tcttggggct ggtcctgccg ctgcttgtca tggtcatctg 180
ctactcggga atcctaaaaa ctctgcttcg gtgtcgaaat gagaagaaga ggcacagggc 240
tgtgaggctt atcttcacca tcatgattgt ttattttctc ttctgggctc cctacaacat 300
tgtccttctc ctgaacacct tccaggaatt ctttggcctg aataattgca gtagctctaa 360
caggttggac caagctatgc aggtgacaga gactcttggg atgacgcact gctgcatcaa 420
ccccatcatc tatgcctttg tcggggagaa gttcagaaac tacctcttag tcttcttcca 480
aaagcacatt gccaaacgct tctgcaaatg ctgttctatt ttccagcaag aggctcccga 540
gcgagcaagc tcagtttaca cccgatccac tggggagcag gaaatatctg tgggcttgtg 600
acacggactc aagtgggctg gtgacccagt cagagttgtg cacatggctt agttttcata 660
cacagcctgg gctgggggtg gggtgggaga ggtctttttt aaaaggaagt tactgttata 720
gagggtctaa gattcatcca tttatttggc atctgtttaa agtagattag atcttttaag 780
cccatcaatt atagaaagcc aaatcaaaat atgttgatga aaaatagcaa cctttttatc 840
tccccttcac atgcatcaag ttattgacaa actctccctt cactccgaaa gttccttatg 900
tatatttaaa agaaagcctc agagaattgc tgattcttga gtttagtgat ctgaacagaa 960
ataccaaaat tatttcagaa atgtacaact ttttacctag tacaaggcaa catataggtt 1020
gtaaatgtgt ttaaaacagg tctttgtctt gctatgggga gaaaagacat gaatatgatt 1080
agtaaagaaa tgacactttt catgtgtgat ttcccctcca aggtatggtt aataagtttc 1140
actgacttag aaccaggcga gagacttgtg gcctgggaga gctggggaag cttcttaaat 1200
gagaaggaat ttgagttgga tcatctattg ctggcaaaga cagaagcctc actgcaagca 1260
ctgcatgggc aagcttggct gtagaaggag acagagctgg ttgggaagac atggggagga 1320
aggacaaggc tagatcatga agaaccttga cggcattgct ccgtctaagt catgagctga 1380
gcagggagat cctggttggt gttgcagaag gtttactctg tggccaaagg agggtcagga 1440
aggatgagca tttagggcaa ggagaccacc aacagccctc aggtcagggt gaggatggcc 1500
tctg 1504
<210> 28
<211> 1119
<212> DNA
<213> Artificial Sequence
<220>
<223> HsDNMT1 Linear DNA
<400> 28
gctgctctcg aactcctggc ctcaactaat ccacctgcct tggcctccca aagtgctggg 60
attacaggcg tgagccactg ctcccagccc cacgtgtctt tgtctcaagt ctttctgaag 120
ctcttcaaag gcccagtgac ttgtggctgt ggggcgggat gatgggccag ttggagggtc 180
caaggatctt gtgctggaag ggttttgggc ccatgtgagc aggaccagaa cccttcccca 240
aggggtgcaa tgcccaggtt gtcctccatc tgagcagggg ctggcagtac acctgccccc 300
gggccttggg cctgggtgtc cacatcaggc attgcccttc tcccctcctg caggtgggca 360
atgccgtgcc accgcccctg gccaaagcca ttggcttgga gatcaagctt tgtatgttgg 420
ccaaagcccg agagagtgcc tcaggtatgg tggggtgggc caggcttcct ctggggcctg 480
actgccctct gggggtacat gtgggggcag ttgctggcca ccgttttggg ctctgggact 540
caggcgggtc acctacccac gttcgtggcc ccatctttct caaggggctg ctgtgaggat 600
tgagtgagtt gcacgtgtca agtgcttaga gcaggcgtgc tgcacacagc aggcctttgg 660
tcaggttggc tgctgggctg gccctggggc cgtttccctc actcctgctc ggtgaatttg 720
gctcagcagg cacctgcctc agctgctcac ttgagcctct gggtctagaa ccctctgggg 780
accgtttgag gagtgttcag tctccgtgaa cgttccctta gcactctgcc acttattggg 840
tcagctgtta acatcagtac gttaatgttt cctgatggtc catgtctgtt actcgcctgt 900
caagtggcgt gacaccgggc gtgttcccca gagtgacttt tccttttatt tcccttcagc 960
taaaataaag gaggaggaag ctgctaagga ctagttctgc cctcccgtca cccctgtttc 1020
tggcaccagg aatccccaac atgcactgat gttgtgtttt taacatgtca atctgtccgt 1080
tcacatgtgt ggtacatggt gtttgtggcc ttggctgac 1119
<210> 29
<211> 1460
<212> DNA
<213> Artificial Sequence
<220>
<223> HsEMX1 Linear DNA
<400> 29
gtggggacag aaggtctgga gctgcccgtg aagggcagaa tgctgccctc agacccgctt 60
cctccctgtc cttgtctgtc caaggagaat gaggtctcac tggtggattt cggactaccc 120
tgaggagctg gcacctgagg gacaaggccc cccacctgcc cagctccagc ctctgatgag 180
gggtgggaga gagctacatg aggttgctaa gaaagcctcc cctgaaggag accacacagt 240
gtgtgaggtt ggagtctcta gcagcgggtt ctgtgccccc agggatagtc tggctgtcca 300
ggcactgctc ttgatataaa caccacctcc tagttatgaa accatgccca ttctgcctct 360
ctgtatggaa aagagcatgg ggctggcccg tggggtggtg tccactttag gccctgtggg 420
agatcatggg aacccacgca gtgggtcata ggctctctca tttactactc acatccactc 480
tgtgaagaag cgattatgat ctctcctcta gaaactcgta gagtcccatg tctgccggct 540
tccagagcct gcactcctcc accttggctt ggctttgctg gggctagagg agctaggatg 600
cacagcagct ctgtgaccct ttgtttgaga ggaacaggaa aaccaccctt ctctctggcc 660
cactgtgtcc tcttcctgcc ctgccatccc cttctgtgaa tgttagaccc atgggagcag 720
ctggtcagag gggaccccgg cctggggccc ctaaccctat gtagcctcag tcttcccatc 780
aggctctcag ctcagcctga gtgttgaggc cccagtggct gctctggggg cctcctgagt 840
ttctcatctg tgcccctccc tccctggccc aggtgaaggt gtggttccag aaccggagga 900
caaagtacaa acggcagaag ctggaggagg aagggcctga gtccgagcag aagaagaagg 960
gctcccatca catcaaccgg tggcgcattg ccacgaagca ggccaatggg gaggacatcg 1020
atgtcacctc caatgactag ggtgggcaac cacaaaccca cgagggcaga gtgctgcttg 1080
ctgctggcca ggcccctgcg tgggcccaag ctggactctg gccactccct ggccaggctt 1140
tggggaggcc tggagtcatg gccccacagg gcttgaagcc cggggccgcc attgacagag 1200
ggacaagcaa tgggctggct gaggcctggg accacttggc cttctcctcg gagagcctgc 1260
ctgcctgggc gggcccgccc gccaccgcag cctcccagct gctctccgtg tctccaatct 1320
cccttttgtt ttgatgcatt tctgttttaa tttattttcc aggcaccact gtagtttagt 1380
gatccccagt gtcccccttc cctatgggaa taataaaagt ctctctctta atgacacggg 1440
catccagctc cagccccaga 1460
<210> 30
<211> 5311
<212> DNA
<213> Artificial Sequence
<220>
<223> All-in-one vector(HsCCR5)
<400> 30
cttccgcttc ctcgctcact gattcgctgc gctcggtcgt tcggctgcgg cgagcggtat 60
cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga 120
acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt 180
ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt 240
ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc 300
gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa 360
gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct 420
ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta 480
actatcgtct tgaatccaac ccggtaagac acgacttatc gccactggca gcagccactg 540
gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc 600
ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta 660
ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg 720
gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt 780
tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg 840
tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta 900
aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg 960
aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctgg ctccccgtcg 1020
tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc 1080
gagacccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg 1140
agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg 1200
aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag 1260
gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat 1320
caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc 1380
cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc 1440
ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa 1500
ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac 1560
gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt 1620
cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc 1680
gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa 1740
caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca 1800
tactcttcct ttttcaattc agaagaactc gtcaagaagg cgatagaagg cgatgcgctg 1860
cgaatcggga gcggcgatac cgtaaagcac gaggaagcgg tcagcccatt cgccgccaag 1920
ctcttcagca atatcacggg tagccaacgc tatgtcctga tagcggtccg ccacacccag 1980
ccggccacag tcgatgaatc cagaaaagcg gccattttcc accatgatat tcggcaagca 2040
ggcatcgcca tgggtcacga cgagatcctc gccgtcgggc atgctcgcct tgagcctggc 2100
gaacagttcg gctggcgcga gcccctgatg ctcttcgtcc agatcatcct gatcgacaag 2160
accggcttcc atccgagtac gtgctcgctc gatgcgatgt ttcgcttggt ggtcgaatgg 2220
gcaggtagcc ggatcaagcg tatgcagccg ccgcattgca tcagccatga tggatacttt 2280
ctcggcagga gcaaggtgag atgacaggag atcctgcccc ggcacttcgc ccaatagcag 2340
ccagtccctt cccgcttcag tgacaacgtc gagcacagct gcgcaaggaa cgcccgtcgt 2400
ggccagccac gatagccgcg ctgcctcgtc ttgcagttca ttcagggcac cggacaggtc 2460
ggtcttgaca aaaagaaccg ggcgcccctg cgctgacagc cggaacacgg cggcatcaga 2520
gcagccgatt gtctgttgtg cccagtcata gccgaatagc ctctccaccc aagcggccgg 2580
agaacctgcg tgcaatccat cttgttcaat catgcgaaac gatcctcatc ctgtctcttg 2640
atcagagctt gatcccctgc gccatcagat ccttggcggc aagaaagcca tccagtttac 2700
tttgcagggc ttcccaacct taccagaggg cgccccagct ggcaattccg gttcgcttgc 2760
tgtccataaa accgcccagt ctagctatcg ccatgtaagc ccactgcaag ctacctgctt 2820
tctctttgcg cttgcgtttt cccttgtcca gatagcccag tagctgacat tcatccgggg 2880
tcagcaccgt ttctgcggac tggctttcta cgtgaaaagg atctaggtga agatcctttt 2940
tgataatctc atgcctgaca tttatattcc ccagaacatc aggttaatgg cgtttttgat 3000
gtcattttcg cggtggctga gatcagccac ttcttccccg ataacggaga ccggcacact 3060
ggccatatcg gtggtcatca tgcgccagct ttcatccccg atatgcacca ccgggtaaag 3120
ttcacgggag actttatctg acagcagacg tgcactggcc agggggatca ccatccgtcg 3180
ccccggcgtg tcaataatat cactctgtac atccacaaac agacgataac ggctctctct 3240
tttataggtg taaaccttaa actgccgtac gtataggctg cgcaactgtt gggaagggcg 3300
atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg 3360
attaagttgg gtaacgccag ggttttccca gtcacgacgt tgtaaaacga cggccagtga 3420
attgtaatac gattcactat agggcgaatt gggccctcta gatgcatgct cgagcggccg 3480
ccagtgtgat ggatatctgc agaattcgcc cttggtggtg gctgtgtttg cgtctctccc 3540
aggaatcatc tttaccagat ctcaaaaaga aggtcttcat tacacctgca gctctcattt 3600
tccatacagt cagtatcaat tctggaagaa tttccagaca ttaaagatag tcatcttggg 3660
gctggtcctg ccgctgcttg tcatggtcat ctgctactcg ggaatcctaa aaactctgct 3720
tcggtgtcga aatgagaaga agaggcacag ggctgtgagg cttatcttca ccatcatgat 3780
tgtttatttt ctcttctggg ctccctacaa cattgtcctt ctcctgaaca ccttccagga 3840
attctttggc ctgaataatt gcagtagctc taacaggttg gaccaagcta tgcaggtgac 3900
agagactctt gggatgacgc actgctgcat caaccccatc atctatgcct ttgtcgggga 3960
gaagttcaga aactacctct tagtcttctt ccaaaagcac attgccaaac gcttctgcaa 4020
atgctgttct attttccagc aagaggctcc cgagcgagca agctcagttt acacccgatc 4080
cactggggag caggaaatat ctgtgggctt gtgacacgga ctcaagtggg ctggtgaccc 4140
agtcagagtt gtgcacatgg cttagttttc atacacagcc tgggctgggg gtggggtggg 4200
agaggtcttt tttaaaagga agttactgtt atagagggtc taagattcat ccatttattt 4260
ggcatctgtt taaagtagat tagatctttt aagcccatca attatagaaa gccaaatcaa 4320
aatatgttga tgaaaaatag caaccttttt atctcccctt cacatgcatc aagttattga 4380
caaactctcc cttcactccg aaagttcctt atgtatattt aaaagaaagc ctcagagaat 4440
tgctgattct tgagtttagt gatctgaaca gaaataccaa aattatttca gaaatgtaca 4500
actttttacc tagtacaagg caacatatag gttgtaaatg tgtttaaaac aggtctttgt 4560
cttgctatgg ggagaaaaga catgaatatg attagtaaag aaatgacact tttcatgtgt 4620
gatttcccct ccaaggtatg gttaataagt ttcactgact tagaaccagg cgagagactt 4680
gtggcctggg agagctgggg aagcttctta aatgagaagg aatttgagtt ggatcatcta 4740
ttgctggcaa agacagaagc ctcactgcaa gcactgcatg ggcaagcttg gctgtagaag 4800
gagacagagc tggttgggaa gacatgggga ggaaggacaa ggctagatca tgaagaacct 4860
tgacggcatt gctccgtcta agtcatgagc tgagcaggga gatcctggtt ggtgttgcag 4920
aaggtttact ctgtggccaa aggagggtca ggaaggatga gcatttaggg caaggagacc 4980
accaacagcc ctcaggtcag ggtgaggatg gcctctgaag ggcgaattcc agcacactgg 5040
cggccgttac tagtggatcc gagctcggta ccaagcttgg cgtaatcatg gtcatagctg 5100
tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata 5160
aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca 5220
ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc 5280
gcggggagag gcggtttgcg tattgggcgc t 5311
<210> 31
<211> 4926
<212> DNA
<213> Artificial Sequence
<220>
<223> All-in-one vector(HsDNMT1)
<400> 31
cttccgcttc ctcgctcact gattcgctgc gctcggtcgt tcggctgcgg cgagcggtat 60
cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga 120
acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt 180
ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt 240
ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc 300
gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa 360
gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct 420
ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta 480
actatcgtct tgaatccaac ccggtaagac acgacttatc gccactggca gcagccactg 540
gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc 600
ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta 660
ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg 720
gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt 780
tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg 840
tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta 900
aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg 960
aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctgg ctccccgtcg 1020
tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc 1080
gagacccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg 1140
agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg 1200
aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag 1260
gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat 1320
caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc 1380
cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc 1440
ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa 1500
ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac 1560
gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt 1620
cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc 1680
gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa 1740
caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca 1800
tactcttcct ttttcaattc agaagaactc gtcaagaagg cgatagaagg cgatgcgctg 1860
cgaatcggga gcggcgatac cgtaaagcac gaggaagcgg tcagcccatt cgccgccaag 1920
ctcttcagca atatcacggg tagccaacgc tatgtcctga tagcggtccg ccacacccag 1980
ccggccacag tcgatgaatc cagaaaagcg gccattttcc accatgatat tcggcaagca 2040
ggcatcgcca tgggtcacga cgagatcctc gccgtcgggc atgctcgcct tgagcctggc 2100
gaacagttcg gctggcgcga gcccctgatg ctcttcgtcc agatcatcct gatcgacaag 2160
accggcttcc atccgagtac gtgctcgctc gatgcgatgt ttcgcttggt ggtcgaatgg 2220
gcaggtagcc ggatcaagcg tatgcagccg ccgcattgca tcagccatga tggatacttt 2280
ctcggcagga gcaaggtgag atgacaggag atcctgcccc ggcacttcgc ccaatagcag 2340
ccagtccctt cccgcttcag tgacaacgtc gagcacagct gcgcaaggaa cgcccgtcgt 2400
ggccagccac gatagccgcg ctgcctcgtc ttgcagttca ttcagggcac cggacaggtc 2460
ggtcttgaca aaaagaaccg ggcgcccctg cgctgacagc cggaacacgg cggcatcaga 2520
gcagccgatt gtctgttgtg cccagtcata gccgaatagc ctctccaccc aagcggccgg 2580
agaacctgcg tgcaatccat cttgttcaat catgcgaaac gatcctcatc ctgtctcttg 2640
atcagagctt gatcccctgc gccatcagat ccttggcggc aagaaagcca tccagtttac 2700
tttgcagggc ttcccaacct taccagaggg cgccccagct ggcaattccg gttcgcttgc 2760
tgtccataaa accgcccagt ctagctatcg ccatgtaagc ccactgcaag ctacctgctt 2820
tctctttgcg cttgcgtttt cccttgtcca gatagcccag tagctgacat tcatccgggg 2880
tcagcaccgt ttctgcggac tggctttcta cgtgaaaagg atctaggtga agatcctttt 2940
tgataatctc atgcctgaca tttatattcc ccagaacatc aggttaatgg cgtttttgat 3000
gtcattttcg cggtggctga gatcagccac ttcttccccg ataacggaga ccggcacact 3060
ggccatatcg gtggtcatca tgcgccagct ttcatccccg atatgcacca ccgggtaaag 3120
ttcacgggag actttatctg acagcagacg tgcactggcc agggggatca ccatccgtcg 3180
ccccggcgtg tcaataatat cactctgtac atccacaaac agacgataac ggctctctct 3240
tttataggtg taaaccttaa actgccgtac gtataggctg cgcaactgtt gggaagggcg 3300
atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg 3360
attaagttgg gtaacgccag ggttttccca gtcacgacgt tgtaaaacga cggccagtga 3420
attgtaatac gattcactat agggcgaatt gggccctcta gatgcatgct cgagcggccg 3480
ccagtgtgat ggatatctgc agaattcgcc cttgctgctc tcgaactcct ggcctcaact 3540
aatccacctg ccttggcctc ccaaagtgct gggattacag gcgtgagcca ctgctcccag 3600
ccccacgtgt ctttgtctca agtctttctg aagctcttca aaggcccagt gacttgtggc 3660
tgtggggcgg gatgatgggc cagttggagg gtccaaggat cttgtgctgg aagggttttg 3720
ggcccatgtg agcaggacca gaacccttcc ccaaggggtg caatgcccag gttgtcctcc 3780
atctgagcag gggctggcag tacacctgcc cccgggcctt gggcctgggt gtccacatca 3840
ggcattgccc ttctcccctc ctgcaggtgg gcaatgccgt gccaccgccc ctggccaaag 3900
ccattggctt ggagatcaag ctttgtatgt tggccaaagc ccgagagagt gcctcaggta 3960
tggtggggtg ggccaggctt cctctggggc ctgactgccc tctgggggta catgtggggg 4020
cagttgctgg ccaccgtttt gggctctggg actcaggcgg gtcacctacc cacgttcgtg 4080
gccccatctt tctcaagggg ctgctgtgag gattgagtga gttgcacgtg tcaagtgctt 4140
agagcaggcg tgctgcacac agcaggcctt tggtcaggtt ggctgctggg ctggccctgg 4200
ggccgtttcc ctcactcctg ctcggtgaat ttggctcagc aggcacctgc ctcagctgct 4260
cacttgagcc tctgggtcta gaaccctctg gggaccgttt gaggagtgtt cagtctccgt 4320
gaacgttccc ttagcactct gccacttatt gggtcagctg ttaacatcag tacgttaatg 4380
tttcctgatg gtccatgtct gttactcgcc tgtcaagtgg cgtgacaccg ggcgtgttcc 4440
ccagagtgac ttttcctttt atttcccttc agctaaaata aaggaggagg aagctgctaa 4500
ggactagttc tgccctcccg tcacccctgt ttctggcacc aggaatcccc aacatgcact 4560
gatgttgtgt ttttaacatg tcaatctgtc cgttcacatg tgtggtacat ggtgtttgtg 4620
gccttggctg acaagggcga attccagcac actggcggcc gttactagtg gatccgagct 4680
cggtaccaag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc 4740
tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat 4800
gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 4860
tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg 4920
ggcgct 4926
<210> 32
<211> 5267
<212> DNA
<213> Artificial Sequence
<220>
<223> All-in-one vector(HsEMX1)
<400> 32
cttccgcttc ctcgctcact gattcgctgc gctcggtcgt tcggctgcgg cgagcggtat 60
cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga 120
acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt 180
ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt 240
ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc 300
gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa 360
gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct 420
ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta 480
actatcgtct tgaatccaac ccggtaagac acgacttatc gccactggca gcagccactg 540
gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc 600
ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta 660
ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg 720
gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt 780
tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg 840
tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta 900
aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg 960
aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctgg ctccccgtcg 1020
tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc 1080
gagacccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg 1140
agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg 1200
aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag 1260
gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat 1320
caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc 1380
cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc 1440
ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa 1500
ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac 1560
gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt 1620
cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc 1680
gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa 1740
caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca 1800
tactcttcct ttttcaattc agaagaactc gtcaagaagg cgatagaagg cgatgcgctg 1860
cgaatcggga gcggcgatac cgtaaagcac gaggaagcgg tcagcccatt cgccgccaag 1920
ctcttcagca atatcacggg tagccaacgc tatgtcctga tagcggtccg ccacacccag 1980
ccggccacag tcgatgaatc cagaaaagcg gccattttcc accatgatat tcggcaagca 2040
ggcatcgcca tgggtcacga cgagatcctc gccgtcgggc atgctcgcct tgagcctggc 2100
gaacagttcg gctggcgcga gcccctgatg ctcttcgtcc agatcatcct gatcgacaag 2160
accggcttcc atccgagtac gtgctcgctc gatgcgatgt ttcgcttggt ggtcgaatgg 2220
gcaggtagcc ggatcaagcg tatgcagccg ccgcattgca tcagccatga tggatacttt 2280
ctcggcagga gcaaggtgag atgacaggag atcctgcccc ggcacttcgc ccaatagcag 2340
ccagtccctt cccgcttcag tgacaacgtc gagcacagct gcgcaaggaa cgcccgtcgt 2400
ggccagccac gatagccgcg ctgcctcgtc ttgcagttca ttcagggcac cggacaggtc 2460
ggtcttgaca aaaagaaccg ggcgcccctg cgctgacagc cggaacacgg cggcatcaga 2520
gcagccgatt gtctgttgtg cccagtcata gccgaatagc ctctccaccc aagcggccgg 2580
agaacctgcg tgcaatccat cttgttcaat catgcgaaac gatcctcatc ctgtctcttg 2640
atcagagctt gatcccctgc gccatcagat ccttggcggc aagaaagcca tccagtttac 2700
tttgcagggc ttcccaacct taccagaggg cgccccagct ggcaattccg gttcgcttgc 2760
tgtccataaa accgcccagt ctagctatcg ccatgtaagc ccactgcaag ctacctgctt 2820
tctctttgcg cttgcgtttt cccttgtcca gatagcccag tagctgacat tcatccgggg 2880
tcagcaccgt ttctgcggac tggctttcta cgtgaaaagg atctaggtga agatcctttt 2940
tgataatctc atgcctgaca tttatattcc ccagaacatc aggttaatgg cgtttttgat 3000
gtcattttcg cggtggctga gatcagccac ttcttccccg ataacggaga ccggcacact 3060
ggccatatcg gtggtcatca tgcgccagct ttcatccccg atatgcacca ccgggtaaag 3120
ttcacgggag actttatctg acagcagacg tgcactggcc agggggatca ccatccgtcg 3180
ccccggcgtg tcaataatat cactctgtac atccacaaac agacgataac ggctctctct 3240
tttataggtg taaaccttaa actgccgtac gtataggctg cgcaactgtt gggaagggcg 3300
atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg 3360
attaagttgg gtaacgccag ggttttccca gtcacgacgt tgtaaaacga cggccagtga 3420
attgtaatac gattcactat agggcgaatt gggccctcta gatgcatgct cgagcggccg 3480
ccagtgtgat ggatatctgc agaattcgcc cttgtgggga cagaaggtct ggagctgccc 3540
gtgaagggca gaatgctgcc ctcagacccg cttcctccct gtccttgtct gtccaaggag 3600
aatgaggtct cactggtgga tttcggacta ccctgaggag ctggcacctg agggacaagg 3660
ccccccacct gcccagctcc agcctctgat gaggggtggg agagagctac atgaggttgc 3720
taagaaagcc tcccctgaag gagaccacac agtgtgtgag gttggagtct ctagcagcgg 3780
gttctgtgcc cccagggata gtctggctgt ccaggcactg ctcttgatat aaacaccacc 3840
tcctagttat gaaaccatgc ccattctgcc tctctgtatg gaaaagagca tggggctggc 3900
ccgtggggtg gtgtccactt taggccctgt gggagatcat gggaacccac gcagtgggtc 3960
ataggctctc tcatttacta ctcacatcca ctctgtgaag aagcgattat gatctctcct 4020
ctagaaactc gtagagtccc atgtctgccg gcttccagag cctgcactcc tccaccttgg 4080
cttggctttg ctggggctag aggagctagg atgcacagca gctctgtgac cctttgtttg 4140
agaggaacag gaaaaccacc cttctctctg gcccactgtg tcctcttcct gccctgccat 4200
ccccttctgt gaatgttaga cccatgggag cagctggtca gaggggaccc cggcctgggg 4260
cccctaaccc tatgtagcct cagtcttccc atcaggctct cagctcagcc tgagtgttga 4320
ggccccagtg gctgctctgg gggcctcctg agtttctcat ctgtgcccct ccctccctgg 4380
cccaggtgaa ggtgtggttc cagaaccgga ggacaaagta caaacggcag aagctggagg 4440
aggaagggcc tgagtccgag cagaagaaga agggctccca tcacatcaac cggtggcgca 4500
ttgccacgaa gcaggccaat ggggaggaca tcgatgtcac ctccaatgac tagggtgggc 4560
aaccacaaac ccacgagggc agagtgctgc ttgctgctgg ccaggcccct gcgtgggccc 4620
aagctggact ctggccactc cctggccagg ctttggggag gcctggagtc atggccccac 4680
agggcttgaa gcccggggcc gccattgaca gagggacaag caatgggctg gctgaggcct 4740
gggaccactt ggccttctcc tcggagagcc tgcctgcctg ggcgggcccg cccgccaccg 4800
cagcctccca gctgctctcc gtgtctccaa tctccctttt gttttgatgc atttctgttt 4860
taatttattt tccaggcacc actgtagttt agtgatcccc agtgtccccc ttccctatgg 4920
gaataataaa agtctctctc ttaatgacac gggcatccag ctccagcccc agaaagggcg 4980
aattccagca cactggcggc cgttactagt ggatccgagc tcggtaccaa gcttggcgta 5040
atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 5100
acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 5160
aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 5220
atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgct 5267
Claims (11)
- 서열번호 3의 아미노산 서열로 이루어진 Cas12a 단백질.
- 제1항에 있어서,
상기 서열번호 3의 아미노산 서열로 이루어진 Cas12a 단백질은 서열번호 4의 염기서열에 의해 코딩되는 것인, Cas12a 단백질. - 제1항에 있어서,
상기 단백질이 엔도뉴클레아제 활성을 갖는 것을 특징으로 하는, Cas12a 단백질. - 제1항에 있어서,
상기 서열번호 3의 아미노산 서열로 이루어진 Cas12a 단백질은 pH 7.0 내지 pH 7.9에서 최적의 활성을 갖는 것을 특징으로 하는, Cas12a 단백질. - 서열번호 3의 아미노산 서열 중 930번째 위치의 라이신(Lys)이 다른 아미노산으로 치환된 Cas12a 단백질.
- 제5항에 있어서,
상기 다른 아미노산은 아르기닌(Arg), 히스티딘(His), 아스파르트산(Asp), 글루탐산(Glu), 세린(Ser), 트레오닌(Thr), 아스파라긴(Asn), 글루타민(Gln), 티로신(Tyr), 알라닌(Ala), 이소류신(Ile), 류신(Leu), 발린(Val), 페닐알라닌(Phe), 메티오닌(Met), 트립토판(Trp), 글리신(Gly), 프롤린(Pro), 및 시스테인(Cys)으로 구성된 군에서 선택되는 어느 하나인, Cas12a 단백질. - 서열번호 3의 아미노산 서열 중 873번째 위치의 아스파르트산(Asp)이 다른 아미노산으로 치환된 Cas12a 단백질.
- 제7항에 있어서,
상기 다른 아미노산은 아르기닌(Arg), 히스티딘(His), 글루탐산(Glu), 세린(Ser), 트레오닌(Thr), 아스파라긴(Asn), 글루타민(Gln), 티로신(Tyr), 알라닌(Ala), 라이신(Lys), 이소류신(Ile), 류신(Leu), 발린(Val), 페닐알라닌(Phe), 메티오닌(Met), 트립토판(Trp), 글리신(Gly), 프롤린(Pro), 및 시스테인(Cys)으로 구성된 군에서 선택되는 어느 하나인, Cas12a 단백질. - 제7항에 있어서,
상기 단백질이 엔도뉴클레아제 활성이 감소된 것인, Cas12a 단백질. - 제1항 또는 제5항에 기재된 Cas12a 단백질; 및 암세포에 특이적으로 존재하는 핵산 서열을 타겟팅하는 crRNA를 유효성분으로 포함하는 암 치료용 약학적 조성물.
- 제10항에 있어서,
상기 Cas12a 단백질은 서열번호 3 또는 서열번호 6의 아미노산 서열로 이루어진 것인, 약학적 조성물.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180093336 | 2018-08-09 | ||
KR20180093336 | 2018-08-09 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190097531A Division KR102096592B1 (ko) | 2018-08-09 | 2019-08-09 | 신규한 crispr 연관 단백질 및 이의 용도 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200018364A true KR20200018364A (ko) | 2020-02-19 |
KR102096604B1 KR102096604B1 (ko) | 2020-04-02 |
Family
ID=69415629
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190097531A KR102096592B1 (ko) | 2018-08-09 | 2019-08-09 | 신규한 crispr 연관 단백질 및 이의 용도 |
KR1020190169918A KR102096604B1 (ko) | 2018-08-09 | 2019-12-18 | 신규한 crispr 연관 단백질 및 이의 용도 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190097531A KR102096592B1 (ko) | 2018-08-09 | 2019-08-09 | 신규한 crispr 연관 단백질 및 이의 용도 |
Country Status (15)
Country | Link |
---|---|
US (1) | US20210292722A1 (ko) |
EP (1) | EP3835418A4 (ko) |
JP (1) | JP2021532819A (ko) |
KR (2) | KR102096592B1 (ko) |
CN (1) | CN112567031A (ko) |
AU (1) | AU2019319377A1 (ko) |
BR (1) | BR112021002476A2 (ko) |
CA (1) | CA3109105A1 (ko) |
EA (1) | EA202190454A1 (ko) |
IL (1) | IL280631A (ko) |
MX (1) | MX2021001578A (ko) |
PH (1) | PH12021550256A1 (ko) |
SG (1) | SG11202101227TA (ko) |
WO (1) | WO2020032711A1 (ko) |
ZA (1) | ZA202101250B (ko) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3652312A1 (en) | 2017-07-14 | 2020-05-20 | Editas Medicine, Inc. | Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites |
CA3109083A1 (en) | 2018-08-09 | 2020-02-13 | G+Flas Life Sciences | Compositions and methods for genome engineering with cas12a proteins |
KR102497690B1 (ko) * | 2020-09-22 | 2023-02-10 | (주)지플러스생명과학 | 신규한 crispr 연관 단백질 및 이의 용도 |
US20230374478A1 (en) * | 2020-09-22 | 2023-11-23 | G Flas Life Sciences | Modified cas12a protein and use thereof |
WO2024062138A1 (en) | 2022-09-23 | 2024-03-28 | Mnemo Therapeutics | Immune cells comprising a modified suv39h1 gene |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160208243A1 (en) * | 2015-06-18 | 2016-07-21 | The Broad Institute, Inc. | Novel crispr enzymes and systems |
WO2017127807A1 (en) * | 2016-01-22 | 2017-07-27 | The Broad Institute Inc. | Crystal structure of crispr cpf1 |
US20170233756A1 (en) * | 2016-02-15 | 2017-08-17 | Benson Hill Biosystems, Inc. | Compositions and methods for modifying genomes |
WO2018013990A1 (en) * | 2016-07-15 | 2018-01-18 | Zymergen Inc. | Scarless dna assembly and genome editing using crispr/cpf1 and dna ligase |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3325622B1 (en) * | 2015-07-25 | 2023-06-07 | Frost, Habib | A system, device and a method for providing a therapy or a cure for cancer and other pathological states |
EP3374494A4 (en) * | 2015-11-11 | 2019-05-01 | Coda Biotherapeutics, Inc. | CRISPR COMPOSITIONS AND METHODS OF USE FOR GENE THERAPY |
KR102093570B1 (ko) * | 2015-12-04 | 2020-03-25 | 카리부 바이오사이언시스 인코포레이티드 | 조작된 핵산 표적화 핵산 |
WO2017099494A1 (ko) * | 2015-12-08 | 2017-06-15 | 기초과학연구원 | Cpf1을 포함하는 유전체 교정용 조성물 및 그 용도 |
CA3026112A1 (en) * | 2016-04-19 | 2017-10-26 | The Broad Institute, Inc. | Cpf1 complexes with reduced indel activity |
EP3526326A4 (en) * | 2016-10-12 | 2020-07-29 | The Regents of The University of Colorado, A Body Corporate | NEW MODIFIED AND CHEMERICAL NUCLEASES |
KR20180018466A (ko) * | 2017-11-10 | 2018-02-21 | 주식회사 툴젠 | 면역세포의 면역조절 유전자의 활성 조절을 위한 조성물 및 그 용도 |
-
2019
- 2019-08-09 KR KR1020190097531A patent/KR102096592B1/ko active IP Right Grant
- 2019-08-09 US US17/266,882 patent/US20210292722A1/en active Pending
- 2019-08-09 CN CN201980053705.0A patent/CN112567031A/zh active Pending
- 2019-08-09 EP EP19846625.2A patent/EP3835418A4/en active Pending
- 2019-08-09 BR BR112021002476-0A patent/BR112021002476A2/pt not_active Application Discontinuation
- 2019-08-09 EA EA202190454A patent/EA202190454A1/ru unknown
- 2019-08-09 CA CA3109105A patent/CA3109105A1/en active Pending
- 2019-08-09 JP JP2021506585A patent/JP2021532819A/ja active Pending
- 2019-08-09 SG SG11202101227TA patent/SG11202101227TA/en unknown
- 2019-08-09 AU AU2019319377A patent/AU2019319377A1/en active Pending
- 2019-08-09 MX MX2021001578A patent/MX2021001578A/es unknown
- 2019-08-09 WO PCT/KR2019/010110 patent/WO2020032711A1/ko unknown
- 2019-12-18 KR KR1020190169918A patent/KR102096604B1/ko active IP Right Grant
-
2021
- 2021-02-03 PH PH12021550256A patent/PH12021550256A1/en unknown
- 2021-02-03 IL IL280631A patent/IL280631A/en unknown
- 2021-02-24 ZA ZA2021/01250A patent/ZA202101250B/en unknown
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160208243A1 (en) * | 2015-06-18 | 2016-07-21 | The Broad Institute, Inc. | Novel crispr enzymes and systems |
WO2017127807A1 (en) * | 2016-01-22 | 2017-07-27 | The Broad Institute Inc. | Crystal structure of crispr cpf1 |
US20170233756A1 (en) * | 2016-02-15 | 2017-08-17 | Benson Hill Biosystems, Inc. | Compositions and methods for modifying genomes |
WO2017141173A2 (en) * | 2016-02-15 | 2017-08-24 | Benson Hill Biosystems, Inc. | Compositions and methods for modifying genomes |
US9896696B2 (en) * | 2016-02-15 | 2018-02-20 | Benson Hill Biosystems, Inc. | Compositions and methods for modifying genomes |
WO2018013990A1 (en) * | 2016-07-15 | 2018-01-18 | Zymergen Inc. | Scarless dna assembly and genome editing using crispr/cpf1 and dna ligase |
Non-Patent Citations (1)
Title |
---|
B. Zetsche, et al., Cpf1 is a single RNA-guided endonuclease of a class 2 CRISPR-Cas system, Cell, 2015, 163, 759-771. |
Also Published As
Publication number | Publication date |
---|---|
MX2021001578A (es) | 2021-06-15 |
EA202190454A1 (ru) | 2021-04-22 |
BR112021002476A2 (pt) | 2021-07-27 |
AU2019319377A1 (en) | 2021-03-11 |
WO2020032711A1 (ko) | 2020-02-13 |
JP2021532819A (ja) | 2021-12-02 |
EP3835418A1 (en) | 2021-06-16 |
US20210292722A1 (en) | 2021-09-23 |
KR20200018345A (ko) | 2020-02-19 |
ZA202101250B (en) | 2022-09-28 |
KR102096604B1 (ko) | 2020-04-02 |
IL280631A (en) | 2021-03-25 |
CN112567031A (zh) | 2021-03-26 |
SG11202101227TA (en) | 2021-03-30 |
CA3109105A1 (en) | 2020-02-13 |
PH12021550256A1 (en) | 2021-11-03 |
KR102096592B1 (ko) | 2020-04-02 |
EP3835418A4 (en) | 2022-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102096604B1 (ko) | 신규한 crispr 연관 단백질 및 이의 용도 | |
DK2140006T3 (en) | DELTA-5 desaturases AND USE THEREOF FOR THE PRODUCTION OF polyunsaturated fatty acids | |
DK2718431T3 (en) | dsRNA endoribonucleases. | |
KR20220047623A (ko) | 세포 유형 운명 특정화의 조절인자를 확인하기 위한 조성물 및 방법 | |
CN111171132B (zh) | 乌鳢抗菌肽 | |
CN110540989A (zh) | 基于pcr技术克隆已知区域旁邻的未知dna序列的引物及方法 | |
CN105176936B (zh) | 复制耐受型的西门利克森林病毒的亚克隆及制备方法和应用 | |
CN113302303A (zh) | 经修饰的丝状真菌宿主细胞 | |
CN113061626B (zh) | 一种组织特异性敲除斑马鱼基因的方法及应用 | |
CN110734480B (zh) | 大肠杆菌分子伴侣GroEL/ES在协助合成植物Rubisco中的应用 | |
CN101693901A (zh) | 一种大肠杆菌-棒状杆菌穿梭型诱导表达载体pDXW-8及其构建方法 | |
PT698106E (pt) | Marcador genetico | |
CN114874332B (zh) | 经修饰的rnf112作为治疗als药物的应用 | |
KR101891603B1 (ko) | 구제역 a형 한국발생주 및 백신표준주 a22형의 방어항원이 동시에 발현되는 재조합 바이러스 | |
CN110004131A (zh) | 一种提高赖氨酸脱羧酶活性和稳定性的分子改造方法 | |
KR101683302B1 (ko) | 박테리아 세포 내 로커스 증폭 방법 | |
KR20230110271A (ko) | 식물성 칸나비노이드들의 생산에 사용하기 위한 개선된 활성을 갖는 올리베톨산 시클라아제 변이체들 | |
KR20150030951A (ko) | 구제역 아시아1 혈청형의 표준백신 바이러스의 방어항원을 발현하는 재조합 구제역 바이러스 및 이의 제조 방법 | |
CN102241763A (zh) | 一种鱼类持续激活生长激素受体基因及制备方法和用途 | |
CN110747216A (zh) | 一种多基因共表达成套载体及其应用 | |
US20100304461A1 (en) | Portable, Temperature and Chemically Inducible Expression Vector for High Cell Density Expression of Heterologous Genes in Escherichia Coli | |
CN101717787A (zh) | 肝组织特异性表达rtTA的载体及其应用 | |
CN113373163B (zh) | 一种密码子优化的沙眼衣原体ctl0286基因及其应用 | |
CN113710268A (zh) | 药物递送组合物 | |
KR102108190B1 (ko) | 자일로스 이용능을 갖는 효모 균주 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right |