CN110106173A

CN110106173A - 改进的基因组编辑方法

Info

Publication number: CN110106173A
Application number: CN201910102572.3A
Authority: CN
Inventors: 高彩霞; 张华伟; 靳帅
Original assignee: Institute of Genetics and Developmental Biology of CAS
Current assignee: Institute of Genetics and Developmental Biology of CAS
Priority date: 2018-02-01
Filing date: 2019-02-01
Publication date: 2019-08-09
Also published as: CA3089914A1; WO2019149239A1; US20210047639A1; BR112020014989A2; EP3746549A1; EP3746549A4; US11739322B2; AR114956A1

Abstract

本发明涉及基因工程领域。具体而言，本发明涉及一种改进的基因组编辑系统和方法，其具有高特异性，并且能获得稳定的突变类型。

Description

改进的基因组编辑方法

技术领域

背景技术

基因组编辑技术是基于特异性核酸酶对基因组进行靶向修饰的基因工程技术，在农业和医学研究中发挥着越来越强大的作用。成簇的规律间隔的短回文重复序列及其相关系统(Clustered regularly interspaced short palindromic repeats/CRISPRassociated)是目前使用最广泛的基因组编辑工具，因其高效率、使用简单，在全球范围内引起了基因编辑领域的革命。

CRISPR/Cas9系统虽然有较高的基因定点修饰效率，但是由于同源重组效率较低，基因组单碱基的突变效率仍然较低。哈佛大学David Liu团队的Komor等将CRISPR/Cas9和胞嘧啶脱氨酶结合，创造了单碱基编辑系统，该系统可以实现定点C至T的高效替换^[1]。此后，各种基于脱氨酶的单碱基编辑系统也层出不穷，常兴等人建立的TAM(targeted AID-mediated mutagenesis)利用人源胞嘧啶脱氨酶融合dCas9(dCas9-AIDx)，也可以达到单碱基编辑的目的^[2]。Keiji Nishida等将来源于七鳃鳗的胞嘧啶脱氨酶与Cas9蛋白和UGI融合，在哺乳动物细胞中实现了约15％～55％的靶向突变^[3]。斯坦福大学的科学家将胞嘧啶脱氨酶融合到MS2蛋白上，创造了CRISPR-X系统，也可以得到较高的单碱基突变效率^[4]。

基于CRISPR的单碱基编辑系统，其可以在特定的靶序列处导致少至一个碱基的替换，但是靶序列长度并不发生改变，即，靶序列突变后与突变前长度相同，仅存在一个或多个碱基的差异。由于CRISPR系统自身存在脱靶的可能，CRISPR核酸酶可以结合与gRNA存在一定差异的靶位点，并产生编辑。所以，在原有的gRNA协助下，单碱基编辑系统仍有可能识别发生碱基替换之后的靶位点，并进一步实施碱基替换。这带来的潜在风险是突变类型不能稳定存在。这样的风险在其它基因组编辑系统中同样存在。

因此，本领域仍需要新的基因组编辑系统和方法，其具有高特异性，并且能获得稳定的突变类型。

发明简述

在一方面，本发明提供一种用于对细胞基因组中的至少一个基因组靶序列进行定点修饰的基因组编辑系统，其包含：

1)包含gRNA的编码序列的表达构建体，所述gRNA靶向所述至少一个基因组靶序列；

2)包含CRISPR核酸酶编码序列的表达构建体；和

3)包含gRNA编码序列的表达构建体，所述gRNA靶向所述CRISPR核酸酶编码序列中的靶序列，

其中在导入细胞后，靶向所述至少一个基因组靶序列的gRNA指导所述CRISPR核酸酶靶向所述至少一个靶序列并导致所述靶序列中的一个或多个突变，靶向所述CRISPR核酸酶编码序列中的靶序列的gRNA指导所述CRISPR核酸酶靶向所述CRISPR核酸酶编码序列中的靶序列并导致所述CRISPR核酸酶的失活突变。

在另一方面，本发明提供了一种修饰细胞基因组中至少一个基因组靶序列的方法，包括将本发明的基因组编辑系统导入所述细胞。

在另一方面，本发明还提一种产生经遗传修饰的细胞的方法，包括将本发明的基因组编辑系统导入细胞中。

在另一方面，本发明还提供经遗传修饰的生物体，其包含通过本发明的方法产生的经遗传修饰的细胞或其后代。

在仍另一方面，本发明还包括用于本发明的方法的试剂盒，该试剂盒包括本发明的基因组编辑系统，以及使用说明。

附图描述

图1：水稻OsWxb基因单碱基突变体的遗传分析。

图2：pSU-PBE的工作原理。

图3：APOBEC1-nCas9蛋白的表达分析。

发明详述

在本发明中，除非另有说明，否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且，本文中所用的蛋白质和核酸化学、分子生物学、细胞和组织培养、微生物学、免疫学相关术语和实验室操作步骤均为相应领域内广泛使用的术语和常规步骤。例如，本发明中使用的标准重组DNA和分子克隆技术为本领域技术人员熟知，并且在如下文献中有更全面的描述：Sambrook，J.，Fritsch，E.F.和Maniatis，T.，MolecularCloning：A Laboratory Manual；Cold Spring Harbor Laboratory Press：Cold SpringHarbor，1989(下文称为“Sambrook”)。

在一方面，本发明提供了一种用于对细胞基因组中的至少一个基因组靶序列进行定点修饰的基因组编辑系统，其包含：

2)包含CRISPR核酸酶编码序列的表达构建体；和

其中在导入细胞后，靶向所述至少一个基因组靶序列的gRNA指导所述CRISPR核酸酶靶向所述至少一个靶序列并导致所述靶序列中的一个或多个突变，靶向所述CRISPR核酸酶编码序列中的靶序列的gRNA指导所述CRISPR核酸酶靶向所述CRISPR核酸酶编码序列中的靶序列并导致所述CRISPR核酸酶的失活突变。例如，所述失活突变是使所述CRISPR核酸酶翻译提前终止的突变。

本发明人发现，将基于CRISPR核酸酶的基因组编辑系统导入细胞中并实现靶序列中的突变之后，如果该基因组编辑系统在细胞中仍然具有活性(例如CRISPR核酸酶或gRNA的编码序列整合进基因组并持续表达)，其仍会对已经突变的靶序列进行进一步的编辑，从而改变靶序列的突变类型，造成所获得细胞或生物体的突变类型不稳定；或者，由于基因组编辑系统的持续活性，脱靶的可能性大大增加。

特别是对于基于CRISPR的单碱基编辑系统，其可以在特定的靶序列处导致少至一个碱基的替换，但是靶序列长度并不发生改变，即，靶序列突变后与突变前长度相同，仅存在一个或多个碱基的差异。由于CRISPR系统自身存在脱靶的可能，CRISPR核酸酶可以结合与gRNA存在一定差异的靶位点，并产生编辑。所以，在原有的gRNA协助下，单碱基编辑系统仍有可能识别发生碱基替换之后的靶位点，并进一步实施碱基替换。这带来的潜在风险是：突变类型不能稳定存在。

然而，本发明人令人惊奇地发现，通过在基因组编辑系统中添加靶向所述CRISPR核酸酶编码序列的gRNA，使细胞中的CRISPR核酸酶在编辑靶序列之后还靶向自身编码序列，造成自身的失活(不再表达或表达无编辑活性的版本)，可以防止已经突变的靶序列的进一步编辑，同时提高编辑的特异性。

如本文所用，术语“CRISPR核酸酶”通常指在天然存在的CRISPR系统中存在的核酸酶，以及其修饰形式、其突变体(包括切口酶突变体、失活突变体)、其催化活性片段或它们与其它功能性蛋白的融合物。CRISPR核酸酶可以通过与crRNA和任选的tracrRNA或与人工gRNA一起相互作用来识别和/或切割靶核酸结构。该术语涵盖基于CRISPR系统的能够在细胞内实现基因组编辑(包括碱基编辑)的任何核酸酶。

在一些实施方式中，所述CRISPR核酸酶包括Cas9核酸酶或其变体。所述Cas9核酸酶可以是来自不同物种的Cas9核酸酶，例如来自化脓链球菌(S.pyogenes)的spCas9。

在一些实施方式中，所述Cas9核酸酶变体包括Cas9核酸酶的高特异性变体，例如Feng Zhang等人的Cas9核酸酶变体eSpCas9(1.0)(K810A/K1003A/R1060A)、eSpCas9(1.1)(K848A/K1003A/R1060A)，以及J.Keith Joung等人开发的Cas9核酸酶变体SpCas9-HF1(N497A/R661A/Q695A/Q926A)。

在一些实施方式中，所述Cas9核酸酶变体包括Cas9切口酶(nCas9)，其中Cas9核酸酶的DNA切割结构域中的两个亚结构域(HNH核酸酶亚结构域和RuvC亚结构域)之一被失活而形成切口酶。

在一些实施方式中，所述CRISPR核酸酶包括Cpf1核酸酶或其变体例如高特异性变体。所述Cpf1核酸酶可以是来自不同物种的Cpf1核酸酶，例如来自Francisella novicidaU112、Acidaminococcus sp.BV3L6和Lachnospiraceae bacterium ND2006的Cpf1核酸酶。

在一些实施方式中，所述CRISPR核酸酶还包括缺失DNA切割活性的CRISPR核酸酶和脱氨酶的融合蛋白，本文也称为“单碱基编辑CRISPR核酸酶”。

如本发明所用，“缺失DNA切割活性的CRISPR核酸酶”包括但不限于Cas9切口核酸酶(nCas9)、核酸酶死亡的Cas9核酸酶(dCas9)或核酸酶死亡的Cpf1核酸酶(dCpf1)。核酸酶死亡的Cas9核酸酶(dCas9)或核酸酶死亡的Cpf1核酸酶(dCpf1)完全缺失DNA切割活性。本领域已知多种缺失DNA切割活性的CRISPR核酸酶。

如本发明所用，“脱氨酶”是指催化脱氨基反应的酶。在本发明一些实施方式中，所述脱氨酶指的是胞嘧啶脱氨酶，其能够接受单链DNA作为底物并能够催化胞苷或脱氧胞苷分别脱氨化为尿嘧啶或脱氧尿嘧啶。在本发明一些实施方式中，所述脱氨酶指的是腺嘌呤脱氨酶，其能够接受单链DNA作为底物并能够催化腺苷或脱氧腺苷(A)形成肌苷(I)。通过使用缺失DNA切割活性的CRISPR核酸酶与脱氨酶的融合蛋白(“单碱基编辑CRISPR核酸酶”)，可以实现靶DNA序列中的碱基编辑，例如C至T的转换或A至G的转换。本领域已知多种合适的接受单链DNA作为底物的胞嘧啶脱氨酶或腺嘌呤脱氨酶，例如APOBEC1脱氨酶、激活诱导的胞苷脱氨酶(AID)、APOBEC3G、CDA1，或者例如Nicloe M.Gaudelli等人，doi：10.1038/nature24644，2017所公开的DNA依赖型腺嘌呤脱氨酶。

如本文所用，“gRNA”和“向导RNA”可互换使用，指的是能够与CRISPR核酸酶形成复合物并由于与靶序列具有一定互补性而能够将所述复合物靶向靶序列的RNA分子。例如，在基于Cas9的基因编辑系统中，gRNA通常由部分互补形成复合物的crRNA和tracrRNA分子构成，其中crRNA包含与靶序列具有足够互补性以便与该靶序列杂交并且指导CRISPR复合物(Cas9+crRNA+tracrRNA)与该靶序列序列特异性地结合的序列。然而，本领域已知可以设计单向导RNA(sgRNA)，其同时包含crRNA和tracrRNA的特征。而在基于Cpf1的基因组编辑系统中，gRNA通常仅由成熟crRNA分子构成，其中crRNA包含的序列与靶序列具有足够相同性以便与靶序列的互补序列杂交并且指导复合物(Cpf1+crRNA)与该靶序列序列特异性结合。基于所使用的CRISPR核酸酶和待编辑的靶序列设计合适的gRNA属于本领域技术人员的能力范围内。

在本发明一具体实施方式中，所述CRISPR核酸酶是APOBEC1-nCas9，其是APOBEC1脱氨酶和Cas9切口酶(nCas9)的融合蛋白。在一些实施方式中，所述APOBEC1-nCas9具有SEQID NO:1的氨基酸序列。

在一些实施方式中，为了适于设计合适的gRNA，所述CRISPR核酸酶的编码序列在不改变表达产物的情况下被修饰以引入PAM序列和/或待突变位点，所述待突变位点被突变后能够造成所述CRISPR核酸酶的失活。例如，可以在“单碱基编辑CRISPR核酸酶”的编码序列中包含一或多个C，在使得当其中一或多个C被单碱基编辑为T时，能够形成一个或多个终止密码子，使此单碱基编辑CRISPR核酸酶的翻译发生终止，从而阻止继续产生有功能的单碱基编辑CRISPR核酸酶。

例如，在一些具体实施方式中，所述APOBEC1-nCas9的编码核苷酸序列示于SEQ IDNO:2。相应地，针对所述APOBEC1-nCas9编码序列的gRNA识别(靶向)SEQ ID NO:3所示序列。

“基因组”如本文所用不仅涵盖存在于细胞核中的染色体DNA，而且还包括存在于细胞的亚细胞组分(如线粒体、质体)中的细胞器DNA。

如本发明所用，“表达构建体”是指适于感兴趣的核苷酸序列在细胞或生物体中表达的载体如重组载体。“表达”指功能产物的产生。例如，核苷酸序列的表达可指核苷酸序列的转录(如转录生成mRNA或功能RNA)和/或RNA翻译成前体或成熟蛋白质。本发明的“表达构建体”可以是线性的核酸片段、环状质粒、病毒载体。本发明的“表达构建体”可包含不同来源的调控序列和感兴趣的核苷酸序列，或相同来源但以不同于通常天然存在的方式排列的调控序列和感兴趣的核苷酸序列。“调控序列”和“调控元件”可互换使用，指位于编码序列的上游(5'非编码序列)、中间或下游(3'非编码序列)，并且影响相关编码序列的转录、RNA加工或稳定性或者翻译的核苷酸序列。调控序列可包括但不限于启动子、翻译前导序列、内含子和多腺苷酸化识别序列。

本发明可使用的启动子的实例包括但不限于聚合酶(pol)I、pol II或pol III启动子。pol I启动子的实例包括鸡RNA pol I启动子。pol II启动子的实例包括但不限于巨细胞病毒立即早期(CMV)启动子、劳斯肉瘤病毒长末端重复(RSV-LTR)启动子和猿猴病毒40(SV40)立即早期启动子。pol III启动子的实例包括U6和H1启动子。可以使用诱导型启动子如金属硫蛋白启动子。启动子的其他实例包括T7噬菌体启动子、T3噬菌体启动子、β-半乳糖苷酶启动子和Sp6噬菌体启动子。当用于植物时，启动子可以是花椰菜花叶病毒35S启动子、玉米Ubi-1启动子、小麦U6启动子、水稻U3启动子、玉米U3启动子、水稻肌动蛋白启动子。

本发明的“表达构建体”还可以包含用于对转化的细胞或生物体进行筛选的可选择标记，例如抗生素抗性标记、除草剂抗性标记等。

在本发明中，针对所述至少一个基因组靶序列的gRNA的编码序列、所述CRISPR核酸酶的编码序列和针对所述CRISPR核酸酶的gRNA的编码序列可以各自构建于单独的表达构建体中，或者可以任意组合地构建于同一构建体中。例如，如果存在多个待编辑的基因组靶序列，针对这些靶序列的gRNA编码序列可以构建于同一个表达构建体。或者，例如针对基因组靶序列的gRNA编码序列可以和针对CRISPR核酸酶的gRNA的编码序列构建于同一个表达构建体中。构建用于表达多个gRNA的表达构建体的方法是本领域已知的。

可通过本发明的系统进行基因组编辑的细胞优选是真核生物细胞，包括但不限于，哺乳动物细胞如人、小鼠、大鼠、猴、犬、猪、羊、牛、猫；家禽如鸡、鸭、鹅的细胞；植物细胞包括单子叶植物细胞和双子叶植物细胞，例如水稻、玉米、小麦、高粱、大麦、大豆、花生、拟南芥等的细胞。在本发明的一些优选实施方案中，所述细胞是植物细胞。

将本发明的基因组编辑系统的表达构建体“导入”细胞是指用所述构建体转化细胞，使得所述构建体在细胞中能够发挥功能(如表达CRSPR核酸酶和/或转录生成gRNA)。本发明所用的“转化”优选指的是稳定转化。“稳定转化”指将外源核苷酸序列导入基因组中，导致外源基因稳定遗传。一旦稳定转化，外源核酸序列稳定地整合进所述生物体和其任何连续世代的基因组中。在一些实施方案中，通过表达构建体上的可选择标记筛选稳定转化的细胞。

可用于将本发明的基因组编辑系统导入细胞的方法包括但不限于：磷酸钙转染、原生质融合、电穿孔、脂质体转染、微注射、病毒感染(如杆状病毒、痘苗病毒、腺病毒、腺相关病毒、慢病毒和其他病毒)、基因枪法、PEG介导的原生质体转化、土壤农杆菌介导的转化。

在本发明中，细胞基因组中的所述靶序列可以位于基因组的任何位置，例如位于功能基因如蛋白编码基因内，或者例如可以位于基因表达调控区如启动子区或增强子区，从而实现对所述基因功能修饰或对基因表达的修饰。可以通过T7EI、PCR/RE或测序方法检测所述细胞基因组靶序列中的突变。所述突变例如是一或多个核苷酸的取代、缺失和添加。

如本文所用，“经遗传修饰的生物体”或“经遗传修饰的细胞”意指在其基因组内包含外源多核苷酸或修饰的基因或表达调控序列的生物体或细胞。例如外源多核苷酸能够稳定地整合进生物体或细胞的基因组中，并遗传连续的世代。外源多核苷酸可单独地或作为重组DNA构建体的部分整合进基因组中。修饰的基因或表达调控序列为在生物体或细胞基因组中所述序列包含单个或多个脱氧核苷酸取代、缺失和添加。针对序列而言的“外源”意指来自外来物种的序列，或者如果来自相同物种，则指通过蓄意的人为干预而从其天然形式发生了组成和/或基因座的显著改变的序列。

如本文所用，“生物体”包括适于基因组编辑的任何生物体，优选真核生物。生物体的实例包括但不限于，哺乳动物如人、小鼠、大鼠、猴、犬、猪、羊、牛、猫；家禽如鸡、鸭、鹅；植物包括单子叶植物和双子叶植物，例如水稻、玉米、小麦、高粱、大麦、大豆、花生、拟南芥等。

在植物的基因组编辑操作中，优选将表达用于基因组编辑的各组分的构建体整合进基因组中，便于通过构建体的可选择标记对转化的植物进行筛选，提高获得基因组编辑植物的效率。然而，由于CRSPR核酸酶和/或gRNA的编码序列整合进植物基因组，其将在后续世代中均具有持续活性，存在对已经编辑(特别是单碱基编辑)的靶序列再进一步编辑的风险，以及具有较高的脱靶效应。因此，本发明的系统和方法特别适合于对植物进行遗传修饰(例如基因组编辑)，因为CRSPR核酸酶在完成对靶序列的编辑之后将被失活。因此，在本发明的一些优选实施方案中，所述细胞是植物细胞。在本发明的一些优选实施方案中，所述生物体是植物。

在仍另一方面，本发明还包括用于本发明的方法的试剂盒，该试剂盒包括本发明的基因组编辑系统，以及使用说明。试剂盒一般包括表明试剂盒内容物的预期用途和/或使用方法的标签。术语标签包括在试剂盒上或与试剂盒一起提供的或以其他方式随试剂盒提供的任何书面的或记录的材料。

实施例

下面将通过实施例的方式进一步说明本发明，但并不因此将本发明限制在所描述的实施例范围中。

实施例1、APOBEC1-nCas9能够靶向已发生单碱基突变的位点，并再次导致单碱基编辑

本发明人通过设计单个sgRNA，对水稻的Wxb基因上的靶位点进行单碱基编辑(见图1)。单碱基编辑利用APOBEC1-nCas9(SEQ ID NO:1)进行。其中sgRNA编码序列和APOBEC1-nCas9编码序列(SEQ ID NO:4所示)整合进水稻基因组中。

T0植物中鉴定发现一株突变体T0-4，在Wxb的两个等位基因座上，均发生突变：其中一个等位基因座在靶位点第三位的C突变为T；另一等位基因座在靶位点第三位和第五位的两个C均突变为T。

然而，对该突变体的T1植株进行基因型鉴定，令人惊奇地发现一些植株的突变类型发生了改变。例如，在其中一株植物T1-4中发现一个等位基因座处，三个C突变为T，而且未检测出T0代中单个C被突变的类型。说明，在传代过程中，原有的sgRNA仍能够介导APOBEC1-nCas9作用于已发生碱基替换的位点。

实施例2、不完全匹配的sgRNA能够指导APOBEC1-nCas9完成碱基编辑

为了进一步证明编辑后的靶位点，仍可能被原有的sgRNA识别并发生单碱基编辑，发明人设计了一套预测为错配的sgRNA进行验证。

水稻OsALS2基因的一段靶序列中存在多个串联的C。发明人设计了多个sgRNA，每个sgRNA中均有一个碱基不能与基因组靶序列的对应位点配对。利用农杆菌转化法将APOBEC1-nCas9表达构建体和各sgRNA的表达构建体共转化入植物，并通过可选择标记对植物进行筛选。结果在筛选出的T0代依然存在很高的突变效率。这说明，错配的sgRNA依然能够指导APOBEC1-nCas9进行单碱基编辑。

表1：非精确sgRNA介导的单碱基编辑效率

实施例3、新型单碱基编辑体系的建立

首先APOBEC1-nCas9融合蛋白在DNA水平上做了重编码(SEQ ID NO:2)：将三个精氨酸密码子都设定为CGA；将之后的一个精氨酸密码子设定为AGG，创造出一个PAM位点。设计一个sgRNA，识别图2中所示的靶序列(SEQ ID NO:3)。任意一个CGA密码子中的C突变为T都能终止nCas9蛋白的翻译，使其不能产生有功能的融合蛋白。我们将这套载体(包括改造的APOBEC1-nCas9载体和对应的sgRNA载体)命名为pSU-PBE。pSU-PBE的工作原理见图2。其中黑框标识的是PAM位点，下划线标识的是nCas9基因上sgRNA所针对的靶序列。

实施例4、新型单碱基编辑系统能够得到基因组靶位点发生编辑并且BE3完全失活的植株

利用pSU-PBE系统加上基因特异性sgRNA表达载体编辑水稻OsALS2基因和OsNRT1.1B。突变效率如表2所示。当APOBEC1-nCas9突变纯合，并且靶位点有突变时，即可获得在T1代中突变类型稳定遗传的植物，在两个基因位点的突变效率均较高，分别是13.79％、15.7％。

按照常规操作选择三株SU系统得到的转基因植物提取植物蛋白，使用abcam公司的Cas9蛋白抗体Anti-CRISPR-Cas9antibody(ab204448)进行western blot实验。内参为Actin。如图3所示，第一及第三株植物中APOBEC1-nCas9没有发生突变(第一、三泳道)，第二株植物为APOBEC1-nCas9点突变纯合体(第二泳道)，其中APOBEC1-nCas9蛋白不表达。

表2：pSU-PBE系统的编辑效率

参考文献

[1]Komor AC,Kim YB,Packer MS,Zuris JA,Liu DR.Programmable editing ofa target base in genomic DNA without double-stranded DNA cleavage.Nature,2016,533(7603):420–424。

[2]Ma YQ,Zhang JY,Yin WJ,Zhang ZC,Song Y,Chang X.Targeted AID-mediated mutagenesis(TAM)enables efficient genomic diversification inmammalian cells.Nat Methods,2016,13(12):1029–1035。

[3]Nishida K,Arazoe T,Yachie N,Banno S,Kakimoto M,Tabata M,MochizukiM,Miyabe A,Araki M,Hara KY,Shimatani Z,Kondo A.Targeted nucleotide editingusing hybrid prokaryotic and vertebrate adaptive immune systems.Science,2016,353(6305):aaf8729。

[4]Hess GT,Frésard L,Han K,Lee CH,Li A,Cimprich KA,Montgomery SB,Bassik MC.Directed evolution usingdCas9-targeted somatic hypermutation inmammalian cells.Nat Methods,2016:13(12):1036–1042。

序列表

<110> 中国科学院遗传与发育生物学研究所

<120> 改进的基因组编辑方法

<130> 150428

<150> CN201810101165.6

<151> 2018-02-01

<160> 4

<170> PatentIn version 3.5

<210> 1

<211> 1736

<212> PRT

<213> Artificial Sequence

<220>

<223> APOBEC1-nCas9

<400> 1

Pro Lys Lys Lys Arg Lys Val Ser Ser Glu Thr Gly Pro Val Ala Val

1 5 10 15

Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu Val Phe

20 25 30

Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile

35 40 45

Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln Asn Thr

50 55 60

Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg

65 70 75 80

Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp

85 90 95

Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg

100 105 110

Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr His His

115 120 125

Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly

130 135 140

Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg

145 150 155 160

Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro Arg Tyr

165 170 175

Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile

180 185 190

Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln

195 200 205

Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg Leu

210 215 220

Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Ser Gly Ser Glu Thr

225 230 235 240

Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Leu Lys Asp Lys Lys Tyr

245 250 255

Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile

260 265 270

Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn

275 280 285

Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe

290 295 300

Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg

305 310 315 320

Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile

325 330 335

Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu

340 345 350

Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro

355 360 365

Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro

370 375 380

Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala

385 390 395 400

Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg

405 410 415

Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val

420 425 430

Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu

435 440 445

Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser

450 455 460

Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu

465 470 475 480

Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser

485 490 495

Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp

500 505 510

Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn

515 520 525

Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala

530 535 540

Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn

545 550 555 560

Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr

565 570 575

Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln

580 585 590

Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn

595 600 605

Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr

610 615 620

Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu

625 630 635 640

Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe

645 650 655

Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala

660 665 670

Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg

675 680 685

Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly

690 695 700

Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser

705 710 715 720

Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly

725 730 735

Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn

740 745 750

Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr

755 760 765

Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly

770 775 780

Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val

785 790 795 800

Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys

805 810 815

Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser

820 825 830

Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu

835 840 845

Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu

850 855 860

Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg

865 870 875 880

Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp

885 890 895

Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg

900 905 910

Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys

915 920 925

Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe

930 935 940

Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln

945 950 955 960

Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala

965 970 975

Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val

980 985 990

Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu

995 1000 1005

Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys

1010 1015 1020

Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly

1025 1030 1035

Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu

1040 1045 1050

Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln

1055 1060 1065

Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

1070 1075 1080

Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu

1085 1090 1095

Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys

1100 1105 1110

Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys

1115 1120 1125

Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile

1130 1135 1140

Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly

1145 1150 1155

Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val

1160 1165 1170

Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser

1175 1180 1185

Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu

1190 1195 1200

Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg

1205 1210 1215

Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His

1220 1225 1230

His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu

1235 1240 1245

Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp

1250 1255 1260

Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln

1265 1270 1275

Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile

1280 1285 1290

Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile

1295 1300 1305

Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile

1310 1315 1320

Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu

1325 1330 1335

Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr

1340 1345 1350

Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp

1355 1360 1365

Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly

1370 1375 1380

Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala

1385 1390 1395

Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu

1400 1405 1410

Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn

1415 1420 1425

Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys

1430 1435 1440

Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu

1445 1450 1455

Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys

1460 1465 1470

Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr

1475 1480 1485

Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn

1490 1495 1500

Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp

1505 1510 1515

Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu

1520 1525 1530

Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His

1535 1540 1545

Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu

1550 1555 1560

Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe

1565 1570 1575

Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val

1580 1585 1590

Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu

1595 1600 1605

Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala

1610 1615 1620

Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Thr Arg Asp

1625 1630 1635

Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr

1640 1645 1650

Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu

1655 1660 1665

Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu

1670 1675 1680

Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu

1685 1690 1695

Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile

1700 1705 1710

Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly

1715 1720 1725

Ser Pro Lys Lys Lys Arg Lys Val

1730 1735

<210> 2

<211> 5211

<212> DNA

<213> Artificial Sequence

<220>

<223> APOBEC1-nCas9 encoding sequence variant

<400> 2

atgccgaaga agaagcgcaa ggtgtccagc gagacgggcc cagtggctgt cgacccaacg 60

ctgcgcaggc gcatcgagcc gcacgagttc gaggtcttct tcgaccccag ggagctgcgc 120

aaggagacgt gcctcctgta cgagatcaac tggggcggca ggcactccat ctggaggcac 180

accagccaga acacgaacaa gcacgtggag gtcaacttca tcgagaagtt caccacggag 240

aggtacttct gcccgaacac ccgctgctcc atcacgtggt tcctgtcctg gagcccctgc 300

ggcgagtgct ccagggcgat caccgagttc ctcagccgct acccgcacgt gacgctgttc 360

atctacatcg ctaggctcta ccaccacgct gaccccagga acaggcaggg cctccgcgac 420

ctgatctcca gcggcgtgac catccagatc atgacggagc aggagtccgg ctactgctgg 480

aggaacttcg tcaactactc cccaagcaac gaggctcact ggccgaggta cccacacctc 540

tgggtgcgcc tctacgtgct cgagctgtac tgcatcatcc tcggcctgcc gccctgcctc 600

aacatcctga ggcgcaagca gccccagctg accttcttca cgatcgccct ccagagctgc 660

cactaccaga ggctcccacc acacatcctg tgggcgaccg gcctcaagtc cggcagcgag 720

acgccaggca cgtccgagag cgctacgcca gagctgaagg acaagaagta ctcgatcggc 780

ctcgccattg ggactaactc tgttggctgg gccgtgatca ccgacgagta caaggtgccc 840

tcaaagaagt tcaaggtcct gggcaacacc gatcggcatt ccatcaagaa gaatctcatt 900

ggcgctctcc tgttcgacag cggcgagacg gctgaggcta cgcggctcaa gcgcaccgct 960

cgacgacgat atacgagaag gaagaatcgc atctgctacc tgcaggagat tttctccaac 1020

gagatggcga aggttgacga ttctttcttc cacaggctgg aggagtcatt cctcgtggag 1080

gaggataaga agcacgagcg gcatccaatc ttcggcaaca ttgtcgacga ggttgcctac 1140

cacgagaagt accctacgat ctaccatctg cggaagaagc tcgtggactc cacagataag 1200

gcggacctcc gcctgatcta cctcgctctg gcccacatga ttaagttcag gggccatttc 1260

ctgatcgagg gggatctcaa cccggacaat agcgatgttg acaagctgtt catccagctc 1320

gtgcagacgt acaaccagct cttcgaggag aaccccatta atgcgtcagg cgtcgacgcg 1380

aaggctatcc tgtccgctag gctctcgaag tctcggcgcc tcgagaacct gatcgcccag 1440

ctgccgggcg agaagaagaa cggcctgttc gggaatctca ttgcgctcag cctggggctc 1500

acgcccaact tcaagtcgaa tttcgatctc gctgaggacg ccaagctgca gctctccaag 1560

gacacatacg acgatgacct ggataacctc ctggcccaga tcggcgatca gtacgcggac 1620

ctgttcctcg ctgccaagaa tctgtcggac gccatcctcc tgtctgatat tctcagggtg 1680

aacaccgaga ttacgaaggc tccgctctca gcctccatga tcaagcgcta cgacgagcac 1740

catcaggatc tgaccctcct gaaggcgctg gtcaggcagc agctccccga gaagtacaag 1800

gagatcttct tcgatcagtc gaagaacggc tacgctgggt acattgacgg cggggcctct 1860

caggaggagt tctacaagtt catcaagccg attctggaga agatggacgg cacggaggag 1920

ctgctggtga agctcaatcg cgaggacctc ctgaggaagc agcggacatt cgataacggc 1980

agcatcccac accagattca tctcggggag ctgcacgcta tcctgaggag gcaggaggac 2040

ttctaccctt tcctcaagga taaccgcgag aagatcgaga agattctgac tttcaggatc 2100

ccgtactacg tcggcccact cgctaggggc aactcccgct tcgcttggat gacccgcaag 2160

tcagaggaga cgatcacgcc gtggaacttc gaggaggtgg tcgacaaggg cgctagcgct 2220

cagtcgttca tcgagaggat gacgaatttc gacaagaacc tgccaaatga gaaggtgctc 2280

cctaagcact cgctcctgta cgagtacttc acagtctaca acgagctgac taaggtgaag 2340

tatgtgaccg agggcatgag gaagccggct ttcctgtctg gggagcagaa gaaggccatc 2400

gtggacctcc tgttcaagac caaccggaag gtcacggtta agcagctcaa ggaggactac 2460

ttcaagaaga ttgagtgctt cgattcggtc gagatctctg gcgttgagga ccgcttcaac 2520

gcctccctgg ggacctacca cgatctcctg aagatcatta aggataagga cttcctggac 2580

aacgaggaga atgaggatat cctcgaggac attgtgctga cactcactct gttcgaggac 2640

cgggagatga tcgaggagcg cctgaagact tacgcccatc tcttcgatga caaggtcatg 2700

aagcagctca agaggaggag gtacaccggc tgggggaggc tgagcaggaa gctcatcaac 2760

ggcattcggg acaagcagtc cgggaagacg atcctcgact tcctgaagag cgatggcttc 2820

gcgaaccgca atttcatgca gctgattcac gatgacagcc tcacattcaa ggaggatatc 2880

cagaaggctc aggtgagcgg ccagggggac tcgctgcacg agcatatcgc gaacctcgct 2940

ggctcgccag ctatcaagaa ggggattctg cagaccgtga aggttgtgga cgagctggtg 3000

aaggtcatgg gcaggcacaa gcctgagaac atcgtcattg agatggcccg ggagaatcag 3060

accacgcaga agggccagaa gaactcacgc gagaggatga agaggatcga ggagggcatt 3120

aaggagctgg ggtcccagat cctcaaggag cacccggtgg agaacacgca gctgcagaat 3180

gagaagctct acctgtacta cctccagaat ggccgcgata tgtatgtgga ccaggagctg 3240

gatattaaca ggctcagcga ttacgacgtc gatcatatcg ttccacagtc attcctgaag 3300

gatgactcca ttgacaacaa ggtcctcacc aggtcggaca agaaccgggg caagtctgat 3360

aatgttcctt cagaggaggt cgttaagaag atgaagaact actggcgcca gctcctgaat 3420

gccaagctga tcacgcagcg gaagttcgat aacctcacaa aggctgagag gggcgggctc 3480

tctgagctgg acaaggcggg cttcatcaag aggcagctgg tcgagacacg gcagatcact 3540

aagcacgttg cgcagattct cgactcacgg atgaacacta agtacgatga gaatgacaag 3600

ctgatccgcg aggtgaaggt catcaccctg aagtcaaagc tcgtctccga cttcaggaag 3660

gatttccagt tctacaaggt tcgggagatc aacaattacc accatgccca tgacgcgtac 3720

ctgaacgcgg tggtcggcac agctctgatc aagaagtacc caaagctcga gagcgagttc 3780

gtgtacgggg actacaaggt ttacgatgtg aggaagatga tcgccaagtc ggagcaggag 3840

attggcaagg ctaccgccaa gtacttcttc tactctaaca ttatgaattt cttcaagaca 3900

gagatcactc tggccaatgg cgagatccgg aagcgccccc tcatcgagac gaacggcgag 3960

acgggggaga tcgtgtggga caagggcagg gatttcgcga ccgtcaggaa ggttctctcc 4020

atgccacaag tgaatatcgt caagaagaca gaggtccaga ctggcgggtt ctctaaggag 4080

tcaattctgc ctaagcggaa cagcgacaag ctcatcgccc gcaagaagga ctgggatccg 4140

aagaagtacg gcgggttcga cagccccact gtggcctact cggtcctggt tgtggcgaag 4200

gttgagaagg gcaagtccaa gaagctcaag agcgtgaagg agctgctggg gatcacgatt 4260

atggagcgct ccagcttcga gaagaacccg atcgatttcc tggaggcgaa gggctacaag 4320

gaggtgaaga aggacctgat cattaagctc cccaagtact cactcttcga gctggagaac 4380

ggcaggaagc ggatgctggc ttccgctggc gagctgcaga aggggaacga gctggctctg 4440

ccgtccaagt atgtgaactt cctctacctg gcctcccact acgagaagct caagggcagc 4500

cccgaggaca acgagcagaa gcagctgttc gtcgagcagc acaagcatta cctcgacgag 4560

atcattgagc agatttccga gttctccaag cgcgtgatcc tggccgacgc gaatctggat 4620

aaggtcctct ccgcgtacaa caagcaccgc gacaagccaa tcagggagca ggctgagaat 4680

atcattcatc tcttcaccct gacgaacctc ggcgcccctg ctgctttcaa gtacttcgac 4740

acaactatcg atcgcaagag gtacacaagc actaaggagg tcctggacgc gaccctcatc 4800

caccagtcga ttaccggcct ctacgagacg cgcatcgacc tgtctcagct cgggggcgac 4860

aagcggccag cggcgacgaa gaaggcgggg caggcgaaga agaagaagac ccgcgactcc 4920

ggcggcagca cgaacctctc cgacatcatc gagaaggaga cgggcaagca gctcgtgatc 4980

caggagagca tcctcatgct gccggaggag gtggaggagg tcatcggcaa caagcccgag 5040

tccgacatcc tcgtgcacac cgcctacgac gagtccacgg acgagaacgt catgctcctg 5100

acgagcgacg ctccagagta caagccatgg gctctcgtga tccaggacag caacggcgag 5160

aacaagatca agatgctgtc cggcggctcc ccgaagaaga agcgcaaggt c 5211

<210> 3

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<223> target sequence

<400> 3

ctcgacgacg atatacgaga agg 23

<210> 4

<211> 4764

<212> DNA

<213> Artificial Sequence

<220>

<223> APOBEC1-nCas9 encoding sequence

<400> 4

atgacggagc aggagtccgg ctactgctgg aggaacttcg tcaactactc cccaagcaac 60

gaggctcact ggccgaggta cccacacctc tgggtgcgcc tctacgtgct cgagctgtac 120

tgcatcatcc tcggcctgcc gccctgcctc aacatcctga ggcgcaagca gccccagctg 180

accttcttca cgatcgccct ccagagctgc cactaccaga ggctcccacc acacatcctg 240

tgggcgaccg gcctcaagtc cggcagcgag acgccaggca cgtccgagag cgctacgcca 300

gagctgaagg acaagaagta ctcgatcggc ctcgccattg ggactaactc tgttggctgg 360

gccgtgatca ccgacgagta caaggtgccc tcaaagaagt tcaaggtcct gggcaacacc 420

gatcggcatt ccatcaagaa gaatctcatt ggcgctctcc tgttcgacag cggcgagacg 480

gctgaggcta cgcggctcaa gcgcaccgcc cgcaggcggt acacgcgcag gaagaatcgc 540

atctgctacc tgcaggagat tttctccaac gagatggcga aggttgacga ttctttcttc 600

cacaggctgg aggagtcatt cctcgtggag gaggataaga agcacgagcg gcatccaatc 660

ttcggcaaca ttgtcgacga ggttgcctac cacgagaagt accctacgat ctaccatctg 720

cggaagaagc tcgtggactc cacagataag gcggacctcc gcctgatcta cctcgctctg 780

gcccacatga ttaagttcag gggccatttc ctgatcgagg gggatctcaa cccggacaat 840

agcgatgttg acaagctgtt catccagctc gtgcagacgt acaaccagct cttcgaggag 900

aaccccatta atgcgtcagg cgtcgacgcg aaggctatcc tgtccgctag gctctcgaag 960

tctcggcgcc tcgagaacct gatcgcccag ctgccgggcg agaagaagaa cggcctgttc 1020

gggaatctca ttgcgctcag cctggggctc acgcccaact tcaagtcgaa tttcgatctc 1080

gctgaggacg ccaagctgca gctctccaag gacacatacg acgatgacct ggataacctc 1140

ctggcccaga tcggcgatca gtacgcggac ctgttcctcg ctgccaagaa tctgtcggac 1200

gccatcctcc tgtctgatat tctcagggtg aacaccgaga ttacgaaggc tccgctctca 1260

gcctccatga tcaagcgcta cgacgagcac catcaggatc tgaccctcct gaaggcgctg 1320

gtcaggcagc agctccccga gaagtacaag gagatcttct tcgatcagtc gaagaacggc 1380

tacgctgggt acattgacgg cggggcctct caggaggagt tctacaagtt catcaagccg 1440

attctggaga agatggacgg cacggaggag ctgctggtga agctcaatcg cgaggacctc 1500

ctgaggaagc agcggacatt cgataacggc agcatcccac accagattca tctcggggag 1560

ctgcacgcta tcctgaggag gcaggaggac ttctaccctt tcctcaagga taaccgcgag 1620

aagatcgaga agattctgac tttcaggatc ccgtactacg tcggcccact cgctaggggc 1680

aactcccgct tcgcttggat gacccgcaag tcagaggaga cgatcacgcc gtggaacttc 1740

gaggaggtgg tcgacaaggg cgctagcgct cagtcgttca tcgagaggat gacgaatttc 1800

gacaagaacc tgccaaatga gaaggtgctc cctaagcact cgctcctgta cgagtacttc 1860

acagtctaca acgagctgac taaggtgaag tatgtgaccg agggcatgag gaagccggct 1920

ttcctgtctg gggagcagaa gaaggccatc gtggacctcc tgttcaagac caaccggaag 1980

gtcacggtta agcagctcaa ggaggactac ttcaagaaga ttgagtgctt cgattcggtc 2040

gagatctctg gcgttgagga ccgcttcaac gcctccctgg ggacctacca cgatctcctg 2100

aagatcatta aggataagga cttcctggac aacgaggaga atgaggatat cctcgaggac 2160

attgtgctga cactcactct gttcgaggac cgggagatga tcgaggagcg cctgaagact 2220

tacgcccatc tcttcgatga caaggtcatg aagcagctca agaggaggag gtacaccggc 2280

tgggggaggc tgagcaggaa gctcatcaac ggcattcggg acaagcagtc cgggaagacg 2340

atcctcgact tcctgaagag cgatggcttc gcgaaccgca atttcatgca gctgattcac 2400

gatgacagcc tcacattcaa ggaggatatc cagaaggctc aggtgagcgg ccagggggac 2460

tcgctgcacg agcatatcgc gaacctcgct ggctcgccag ctatcaagaa ggggattctg 2520

cagaccgtga aggttgtgga cgagctggtg aaggtcatgg gcaggcacaa gcctgagaac 2580

atcgtcattg agatggcccg ggagaatcag accacgcaga agggccagaa gaactcacgc 2640

gagaggatga agaggatcga ggagggcatt aaggagctgg ggtcccagat cctcaaggag 2700

cacccggtgg agaacacgca gctgcagaat gagaagctct acctgtacta cctccagaat 2760

ggccgcgata tgtatgtgga ccaggagctg gatattaaca ggctcagcga ttacgacgtc 2820

gatcatatcg ttccacagtc attcctgaag gatgactcca ttgacaacaa ggtcctcacc 2880

aggtcggaca agaaccgggg caagtctgat aatgttcctt cagaggaggt cgttaagaag 2940

atgaagaact actggcgcca gctcctgaat gccaagctga tcacgcagcg gaagttcgat 3000

aacctcacaa aggctgagag gggcgggctc tctgagctgg acaaggcggg cttcatcaag 3060

aggcagctgg tcgagacacg gcagatcact aagcacgttg cgcagattct cgactcacgg 3120

atgaacacta agtacgatga gaatgacaag ctgatccgcg aggtgaaggt catcaccctg 3180

aagtcaaagc tcgtctccga cttcaggaag gatttccagt tctacaaggt tcgggagatc 3240

aacaattacc accatgccca tgacgcgtac ctgaacgcgg tggtcggcac agctctgatc 3300

aagaagtacc caaagctcga gagcgagttc gtgtacgggg actacaaggt ttacgatgtg 3360

aggaagatga tcgccaagtc ggagcaggag attggcaagg ctaccgccaa gtacttcttc 3420

tactctaaca ttatgaattt cttcaagaca gagatcactc tggccaatgg cgagatccgg 3480

aagcgccccc tcatcgagac gaacggcgag acgggggaga tcgtgtggga caagggcagg 3540

gatttcgcga ccgtcaggaa ggttctctcc atgccacaag tgaatatcgt caagaagaca 3600

gaggtccaga ctggcgggtt ctctaaggag tcaattctgc ctaagcggaa cagcgacaag 3660

ctcatcgccc gcaagaagga ctgggatccg aagaagtacg gcgggttcga cagccccact 3720

gtggcctact cggtcctggt tgtggcgaag gttgagaagg gcaagtccaa gaagctcaag 3780

agcgtgaagg agctgctggg gatcacgatt atggagcgct ccagcttcga gaagaacccg 3840

atcgatttcc tggaggcgaa gggctacaag gaggtgaaga aggacctgat cattaagctc 3900

cccaagtact cactcttcga gctggagaac ggcaggaagc ggatgctggc ttccgctggc 3960

gagctgcaga aggggaacga gctggctctg ccgtccaagt atgtgaactt cctctacctg 4020

gcctcccact acgagaagct caagggcagc cccgaggaca acgagcagaa gcagctgttc 4080

gtcgagcagc acaagcatta cctcgacgag atcattgagc agatttccga gttctccaag 4140

cgcgtgatcc tggccgacgc gaatctggat aaggtcctct ccgcgtacaa caagcaccgc 4200

gacaagccaa tcagggagca ggctgagaat atcattcatc tcttcaccct gacgaacctc 4260

ggcgcccctg ctgctttcaa gtacttcgac acaactatcg atcgcaagag gtacacaagc 4320

actaaggagg tcctggacgc gaccctcatc caccagtcga ttaccggcct ctacgagacg 4380

cgcatcgacc tgtctcagct cgggggcgac aagcggccag cggcgacgaa gaaggcgggg 4440

caggcgaaga agaagaagac ccgcgactcc ggcggcagca cgaacctctc cgacatcatc 4500

gagaaggaga cgggcaagca gctcgtgatc caggagagca tcctcatgct gccggaggag 4560

gtggaggagg tcatcggcaa caagcccgag tccgacatcc tcgtgcacac cgcctacgac 4620

gagtccacgg acgagaacgt catgctcctg acgagcgacg ctccagagta caagccatgg 4680

gctctcgtga tccaggacag caacggcgag aacaagatca agatgctgtc cggcggctcc 4740

ccgaagaaga agcgcaaggt ctga 4764

Claims

1.一种用于对细胞基因组中的至少一个靶序列进行定点修饰的基因组编辑系统，其包含：

2)包含CRISPR核酸酶编码序列的表达构建体；和

2.权利要求1的基因组编辑系统，其中所述CRISPR核酸酶选自Cas9核酸酶或其变体、Cpf1核酸酶或其变体以及单碱基编辑CRISPR核酸酶。

3.权利要求2的基因组编辑系统，其中所述Cas9核酸酶的变体选自eSpCas9(1.0)、eSpCas9(1.1)、SpCas9-HF1或Cas9切口酶。

4.权利要求2的基因组编辑系统，其中所述单碱基编辑CRISPR核酸酶是缺失DNA切割活性的CRISPR核酸酶和脱氨酶的融合蛋白，所述缺失DNA切割活性的CRISPR核酸酶选自Cas9切口核酸酶、核酸酶死亡的Cas9核酸酶或核酸酶死亡的Cpf1核酸酶，所述脱氨酶选自接受单链DNA作为底物的胞嘧啶脱氨酶或腺嘌呤脱氨酶。

5.权利要求4的基因组编辑系统，其中所述单碱基编辑CRISPR核酸酶是APOBEC1脱氨酶和Cas9切口酶的融合蛋白。

6.权利要求5的基因组编辑系统，其中所述单碱基编辑CRISPR核酸酶包含SEQ ID NO:1所示的氨基酸序列。

7.权利要求6的基因组编辑系统，其中所述单碱基编辑CRISPR核酸酶的编码核苷酸序列示于SEQ ID NO:2。

8.权利要求7的基因组编辑系统，所述CRISPR核酸酶编码序列中的靶序列示于SEQ IDNO:3。

9.一种对细胞基因组中的靶序列进行定点修饰的方法，包括将权利要求1-8中任一项的系统导入细胞中。

10.权利要求9的方法，其中所述细胞来自哺乳动物如人、小鼠、大鼠、猴、犬、猪、羊、牛、猫；家禽如鸡、鸭、鹅；植物，包括单子叶植物和双子叶植物，例如水稻、玉米、小麦、高粱、大麦、大豆、花生、拟南芥等。

11.权利要求9-10中任一项的方法，其中所述系统通过选自以下的方法导入所述细胞：磷酸钙转染、原生质融合、电穿孔、脂质体转染、微注射、病毒感染(如杆状病毒、痘苗病毒、腺病毒、腺相关病毒、慢病毒和其他病毒)、基因枪法、PEG介导的原生质体转化、土壤农杆菌介导的转化。

12.一种产生经遗传修饰的细胞的方法，包括将权利要求1-8中任一项的系统导入细胞中。

13.权利要求12的方法，其中所述细胞来自哺乳动物如人、小鼠、大鼠、猴、犬、猪、羊、牛、猫；家禽如鸡、鸭、鹅；植物，包括单子叶植物和双子叶植物，例如水稻、玉米、小麦、高粱、大麦、大豆、花生、拟南芥等。

14.权利要求12-13中任一项的方法，其中所述系统通过选自以下的方法导入所述细胞：磷酸钙转染、原生质融合、电穿孔、脂质体转染、微注射、病毒感染(如杆状病毒、痘苗病毒、腺病毒、腺相关病毒、慢病毒和其他病毒)、基因枪法、PEG介导的原生质体转化、土壤农杆菌介导的转化。

15.一种经遗传修饰的生物体，其包含通过权利要求12-14中任一项的方法产生的经遗传修饰的细胞或其后代。

16.试剂盒，其包括权利要求1-8中任一项的基因组编辑系统，以及使用说明。