CN112979822B

CN112979822B - 一种疾病动物模型的构建方法及融合蛋白

Info

Publication number: CN112979822B
Application number: CN201911312537.0A
Authority: CN
Inventors: 李大力; 陈亮; 张晓辉; 刘明耀
Original assignee: East China Normal University; Bioray Laboratories Inc
Current assignee: East China Normal University; Bioray Laboratories Inc
Priority date: 2019-12-18
Filing date: 2019-12-18
Publication date: 2022-11-15
Anticipated expiration: 2039-12-18
Also published as: CN112979822A

Abstract

本申请公开了一种疾病动物模型的构建方法及融合蛋白。所述融合蛋白包括Rad51的DNA结合结构域、胞嘧啶脱氨酶APOBEC3A和核酸酶。所述方法包括利用所述融合蛋白和sgRNA引入动物细胞、对目的基因进行基因编辑的步骤。本发明提供了一个新型的高效产生疾病动物模型的平台，将极大地促进不同动物模型制作进程。

Description

一种疾病动物模型的构建方法及融合蛋白

技术领域

本发明涉及基因工程技术领域，具体涉及一种疾病动物模型的构建方法及融合蛋白。

背景技术

自2013年以来，以CRISPR/Cas9为代表的新一代基因编辑技术进入生物学领域的各个实验，改变了传统的基因操作手段。2016年4月，David Liu实验室首次报导单碱基基因编辑技术，之后，基于胞嘧啶脱氨酶原理的其它类型的单碱基基因编辑技术(如来源于七鳃鳗和人的胞嘧啶脱氨酶以不同方式与dCas9或Cas9n融合)也相继被报道。它以CRISPR/Cas9中来源于酿脓链球菌(Streptococcus pyogenes)spCas9以NGG作为PAM(间隔序列前体临近基序)并识别和特异结合DNA在NGG上游实现C到T或G到A的单碱基突变。

单碱基基因编辑技术，已被报导可用于高效地进行基因组的基因突变或修复、疾病动物模型制作、基因治疗。目前，已发现的单碱基基因编辑工具中，以BE3(碱基编辑器3)应用最为广泛。BE3以最高达37％的碱基替换效率，远远高于利用同源重组实现的效率，同时保持较低的脱靶效应，展现出其在用于基因组的单碱基突变修饰或单碱基突变治疗的巨大潜力。随着研究的深入，发现引入额外两个或者更多拷贝的UGI(尿嘧啶糖苷酶抑制剂)到BE3可进一步增强其编辑效率及产物纯度。引入双分型NLS(核定位信号)和密码子化即BE4max，其编辑效率被一步提高。这些方法均一定程度提高其效率，但都比较有限。

现有基因编辑技术利用CRISPR/Cas9介导的同源重组制备因碱基替代而产生动物模型的效率还比较低。新型的单碱基基因编辑技术以100％的效率产生疾病动物模型而备受关注，然而现有单碱基基因编辑技术通常是C3-C8，靶向靠近PAM区C不是很有效。

发明内容

针对现有技术中存在的缺陷，本发明的目的在于提供一种疾病动物模型的构建方法及蛋白。

一方面，本发明提供一种提高基因编辑效率的融合蛋白，所述融合蛋白包括Rad51的DNA结合结构域、胞嘧啶脱氨酶APOBEC3A和核酸酶。

在上述融合蛋白中，所述融合蛋白的连接顺序为：所述胞嘧啶脱氨酶APOBEC3A位于所述核酸酶的N端或C端，所述Rad51的DNA结合结构域位于所述胞嘧啶脱氨酶APOBEC3A和所述核酸酶的N端、C端和/或所述胞嘧啶脱氨酶APOBEC3A和所述核酸酶之间；

优选的，所述胞嘧啶脱氨酶APOBEC3A位于所述核酸酶的N端；

更优选的，所述Rad51的DNA结合结构域位于所述胞嘧啶脱氨酶APOBEC3A和所述核酸酶之间。

在上述融合蛋白中，所述Rad51的DNA结合结构域的氨基酸序列包括SEQ ID No.1所示序列，更优选的，所述Rad51的DNA结合结构域的编码序列包括SEQ ID No.2所示序列；

所述胞嘧啶脱氨酶APOBEC3A来源于人，优选的，所述胞嘧啶脱氨酶APOBEC3A的氨基酸序列包括SEQ ID No.3所示序列，更优选的，所述胞嘧啶脱氨酶APOBEC3A的编码序列包括SEQ ID No.4所示序列；

所述核酸酶选自Cas9、Cas3、Cas8a、Cas8b、Cas10d、Cse1、Csy1、Csn2、Cas4、Cas10、Csm2、Cmr5、Fok1、Cpf1中的一种或任意几种；优选的，所述核酸酶为Cas9；更优选的，所述Cas9选自来源于肺炎链球菌、金黄色葡萄球菌、酿脓链球菌或嗜热链球菌的Cas9，更优选的，所述Cas9选自Cas9突变体VQR-spCas9、VRER-spCas9、spCas9n，更优选，spCas9n，更优选的，所述spCas9n的氨基酸序列包括SEQ ID No.5所示序列，更优选的，所述spCas9n的编码序列包括SEQ ID No.6所示序列；

所述融合蛋白还包括NLS，优选的，所述NLS位于所述融合蛋白的至少一端；更优选的，所述NLS的氨基酸序列包括SEQ ID No.7所示序列，更优选的，所述NLS的编码序列包括SEQ ID No.8所示序列；

所述融合蛋白还包括UGI，优选的，所述UGI位于所述融合蛋白的至少一端；更优选的，所述UGI的氨基酸序列包括SEQ ID No.9所示序列，更优选的，所述UGI的编码序列包括SEQ ID No.10所示序列，更优选的，所述UGI为两个以上拷贝。

另一方面，本发明还提供了如下A)-C)生物材料中的任一种：

A)一种基因，编码以上任一所述融合蛋白；所述基因为DNA或RNA(如mRNA)；

B)一种重组载体，含有A)所述基因；

C)一种重组细胞或重组菌，含有以上任一所述的融合蛋白，或含有A)所述基因。

另一方面，本发明还提供了一种对细胞内目的基因进行基因编辑的sgRNA，所述sgRNA的靶序列包括SEQ ID No.11-19中至少一种。

其中，靶序列为SEQ ID No.12、15、16、19的所述sgRNA为本申请首次设计并筛选获得的，具有较优的编辑效果。

因此，本发明保护如下sgRNA：

所述sgRNA的靶序列包括SEQ ID No.12、15、16、或19；

所述sgRNA的靶序列包括SEQ ID No.11-19中任意两种、任意三种、任意四种、任意五种、任意六种、任意七种、任意八种或全部九种；

如，所述SEQ ID No.11-19中任两种为SEQ ID No.11和12、SEQ ID No.11和13、SEQID No.11和14、SEQ ID No.11和15、SEQ ID No.11和16、SEQ ID No.11和17、SEQ ID No.11和18、SEQ ID No.11和19、SEQ ID No.12和13、SEQ ID No.12和14、SEQ ID No.12和15、SEQID No.12和16、SEQ ID No.12和17、SEQ ID No.12和18、SEQ ID No.12和19、SEQ ID No.13和14、SEQ ID No.13和15、SEQ ID No.13和16、SEQ ID No.13和17、SEQ ID No.13和18、SEQID No.13和19、SEQ ID No.14和15、SEQ ID No.14和16、SEQ ID No.14和17、SEQ ID No.14和18、SEQ ID No.14和19、SEQ ID No.15和16、SEQ ID No.15和17、SEQ ID No.15和18、SEQID No.15和19、SEQ ID No.16和17、SEQ ID No.16和18、SEQ ID No.16和19、SEQ ID No.17和18、SEQ ID No.17和19、或SEQ ID No.18和19，共36种组合；所述任意三种、任意四种、任意五种、任意六种、任意七种、任意八种的组合按此类推。

另一方面，本发明还提供了一种单碱基基因编辑系统，所述系统包括以上任一所述的融合蛋白、和/或所述的生物材料和sgRNA，所述sgRNA引导所述融合蛋白对目的细胞中的目的基因进行单碱基基因编辑；

优选的，所述sgRNA的靶序列包括SEQ ID No.11-19中的至少一种。

另一方面，本发明保护以上任一所述融合蛋白、所述生物材料、所述sgRNA或所述单碱基基因编辑系统在制备基因编辑产品、疾病治疗和/或预防产品、动物模型或植物新品种中的应用。

另一方面，本发明还提供了一种提高单碱基基因编辑效率的方法，包括利用以上任一所述的融合蛋白和sgRNA引入细胞、对目的基因进行基因编辑的步骤，所述sgRNA引导所述融合蛋白对所述目的基因进行单碱基基因编辑；

优选的，所述sgRNA的靶序列包括SEQ ID No.11-19中的至少一种。

另一方面，本发明还提供了一种疾病动物模型的构建方法，包括利用以上任一所述的融合蛋白和sgRNA引入动物细胞、对目的基因进行基因编辑的步骤；

优选的，所述sgRNA的靶序列包括SEQ ID No.11-19中的至少一种；更优选的，所述sgRNA的靶序列包括SEQ ID No.19所示序列，所述目的基因包括DMD基因；

优选的，所述动物为哺乳动物，更优选的，所述哺乳动物为大鼠或小鼠，更优选小鼠；

优选的，所述细胞为胚胎细胞；

优选的，所述引入的方式为载体转化、显微注射、转染、脂质转染、热休克、电穿孔、转导、基因枪、DEAE-葡聚糖介导的转移中的一种或任几种组合，更优选，显微注射；

优选的，所述引入使用权利要求1-3中任一所述的融合蛋白的mRNA和所述sgRNA进行，

更优选的，所述引入使用的权利要求1-3中任一所述的融合蛋白的mRNA的浓度为1-1000ng/μL，更优选，10-600ng/μL，更优选，50-150ng/μL，更优选，100ng/μL，所述引入使用的所述sgRNA的浓度为1-1000ng/μL，更优选，10-600ng/μL，更优选，150-250ng/μL，更优选，200ng/μL，

更优选的，所述引入使用的权利要求1-3中任一所述融合蛋白的mRNA与所述引入使用的所述sgRNA的浓度比为1:(5-1)，更优选，1:(4-1.5)，更优选，1:(3-1.8)，更优选，1:2。

本发明保护所述方法得到的动物模型在药物筛选、疾病治疗效果评价或疾病治病机理研究中的应用。

本发明有益效果如下：

我们通过将Rad51单链结合功能域与现在广泛使用的A3A-BE4max进行融合，得到超高活性hyA3A-BE4max。相对于A3A-BE4max，hyA3A-BE4max的高活性窗口从原来C3-C11，拓展到C3-C15；其中，在远离PAM区的C3-C11，hyA3A-BE4max对单个碱基C到T的编辑效率是A3A-BE4max的1.1-2.3倍，在靠近PAM区的C12-C15，hyA3A-BE4max对单个碱基C到T的编辑效率是A3A-BE4max的3.1-4.1倍，即在靠近PAM区的C12-C15，hyA3A-BE4max对单个碱基C到T的编辑效率提高更为明显，且hyA3A-BE4max同时维持较低的indels。

我们进一步将hyA3A-BE4max运用到制作小鼠疾病动物模型中，相对于A3A-BE4max，hyA3A-BE4max靶向靠近PAM区的C到T的突变产生疾病动物模型更加有效，因此本发明提供了的一个新型的高效产生疾病动物模型制作的平台，将极大地促进不同动物模型的生产进程。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为融合蛋白A3A-BE4max和hyA3A-BE4max的结构示意图。其中，NLS为核定位信号(其氨基酸序列如SEQ ID No.7所示，编码序列如SEQ ID No.8所示)，hA3A为来源于人的胞苷脱氨酶APOBEC3A(其氨基酸序列如SEQ ID No.3所示，编码序列如SEQ ID No.4所示)，spCas9n为源于酿脓链球菌(Streptococcus pyogenes)的Cas9n(其氨基酸序列如SEQ IDNo.5所示，编码序列如SEQ ID No.6所示)，UGI为尿嘧啶糖苷酶抑制剂(其氨基酸序列如SEQID No.9所示，编码序列如SEQ ID No.10所示)。

图2为hyA3A-BE4max与A3A-BE4max在293T上8个内源性靶点实现的C到T碱基编辑效率(即纵坐标，单位为％)的对比。

图3为hyA3A-BE4max与A3A-BE4max在293T上8个内源性靶点实现的C到T碱基编辑效率(即纵坐标，单位为％)的平均值对比。

图4为hyA3A-BE4max与A3A-BE4max在293T上8个内源性靶点产生的indels的碱基编辑效率(即纵坐标，单位为％)对比。

图5为hyA3A-BE4max靶向杜氏肌营养不良(DMD)基因的动物模型构建示意图。

图6为A3A-BE4max和hyA3A-BE4max显微注射后产生F0高通量测序结果的比对。

图7为A3A-BE4max和hyA3A-BE4max注射产生F0中的含有TAA终止密码子的Reads平均比率。

图8为将产生的F0小鼠进行免疫荧光染色检测抗肌萎缩蛋白(Dystrophin)的表达。

图9为DMD突变小鼠的生殖系遗传(F0→F1)。

图10为hyA3A-BE4max与DMD-sg3的预测脱靶位点组合在F0代上的脱靶分析。

其中，图2和3中横坐标的C及其后面的数字代表被编辑为T的C在相应靶点序列上的位置，如C5代表自相应靶点序列5’端的第5位C被编辑为T的效率；“stop”代表终止密码子。

具体实施方式

结合以下具体实施例和附图，对本发明作进一步的详细说明，本发明的保护内容不局限于以下实施例。在不背离发明构思的精神和范围下，本领域技术人员能够想到的变化和优点都被包括在本发明中，并且以所附的权利要求书为保护范围。实施本发明的过程、条件、试剂、实验方法等，除以下专门提及的内容之外，均为本领域的普遍知识和公知常识，本发明没有特别限制内容。如按照Sambrook等人，分子克隆，实验室手册(New York:ColdSpring Harbor Laboratory Press,1989)所记载，或按照厂商的建议条件。

一、融合蛋白hyA3A-BE4max工作特性

1.1、质粒设计及构建

1.1.1、设计Rad51-DBD按照表1中编码序列进行合成，之后进行无缝克隆组装至表达蛋白A3A-BE4max(图1)的质粒pCMV-A3A-BE4max中hA3A和spCas9n之间，构建表达融合蛋白hyA3A-BE4max(图1)的重组质粒pA。

1.1.2、按表2依次合成前8种人的内源性靶点，分别连接至sgRNA表达质粒pU6-sgRNA-EF1α-GFP的BbsⅠ位点处(用于表达相应靶点的sgRNA)，得到重组质粒pB1、pB2、……pB8。

1.1.3、将1.1.1与1.1.2中构建的质粒经sanger测序，确保完全正确。

表1、单链DNA结合蛋白功能域Rad51-DBD的序列

表2、所用靶点及序列

靶点名称	序列(5’-3’)	SEQ ID No.
			EMX1 site1	GAGTCCGAGCAGAAGAAGAAGGG	11
Tim3-sg1	TTCTACACCCCAGCCGCCCCAGG	12
			VEGFA site2	GACCCCCTCCACCCCGCCTCCGG	13
FANCF site1	GGAATCCCTTCTGCAGCACCTGG	14
			EGFR-sg5	GTGCTGGGCTCCGGTGCGTTCGG	15
EGFR-sg21	CAAAGCAGAAACTCACATCGAGG	16
			EMX1-sg2p	GACATCGATGTCCTCCCCATTGG	17
Nme1-sg1	AGGGATCGTCTTTCAAGGCGAGG	18
			DMD-sg3	ACATCTCATCAAGGACTTGTTGG	19

1.2、细胞转染

将5×10⁵个HEK293T细胞铺24孔板，待细胞长至70％-80％时，按pA(或质粒pCMV-A3A-BE4max):pB1(或pB2、pB3、……pB8)＝750ng:250ng进行质粒组合的转染，每种质粒组合转染设3孔重复，每孔2×10⁵个细胞。同时设不转染任何质粒的空白对照。

1.3、基因组提取及扩增子文库的准备

转染后72h，用天根细胞基因组提取试剂盒(DP304)提取细胞基因组DNA。之后用Hitom试剂盒的操作流程，设计相对应的鉴定引物(表3)，即在正向鉴定引物5’端加上搭桥序列5’-ggagtgagtacggtgtgc-3’，反向鉴定引物5’端加上搭桥序列5’-gagttggatgctggatgg-3’，即得到一轮PCR产物，之后利用一轮PCR产物作为模板，进行二轮PCR，后混在一起进行切胶回收纯化后进行送公司进行深度测序。

表3、所用靶点的鉴定引物

1.4、深度测序结果分析与统计

利用BE-analyzer网站分析深度测序结果，即统计C到T、Indels的比率。并用graphpad prism 8.0进行统计作图。

结果表明：相对于蛋白A3A-BE4max，融合蛋白hyA3A-BE4max对各靶点不同位置(C3-C15)单个碱基C到T的编辑效率均明显提高(图2)。相对于A3A-BE4max，hyA3A-BE4max的高活性窗口从原来C3-C11，拓展到C3-C15；其中，在远离PAM区的C3-C11，hyA3A-BE4max对单个碱基C到T的编辑效率是A3A-BE4max的1.1-2.3倍，在靠近PAM区的C12-C15，hyA3A-BE4max对单个碱基C到T的编辑效率是A3A-BE4max的3.1-4.1倍，即在靠近PAM区的C12-C15，hyA3A-BE4max对单个碱基C到T的编辑效率提高更为明显(图3)。且hyA3A-BE4max同时维持较低的indels(图4)。

二、应用融合蛋白hyA3A-BE4max构建DMD疾病动物模型

以下所用小鼠为C57/BL6小鼠。

2.1、工作系统mRNA与靶点sgRNA转录模板的构建

在NCBI上下载小鼠相关基因序列，如图5所示，在目标位点(抗肌萎缩蛋白基因即DMD基因第12个外显子中矩形框处的位点)设计sgRNA(其靶序列见表2中的DMD-sg3靶点序列)，并订购Oligo引物，将通过退火形成的sgRNA克隆到T7载体骨架中，使用引物对IVT-PCR-F和IVT-PCR-R(表4)体外转录法(IVT)扩增含有T7启动子的DMD-sg3模板，使用引物对IVT-T7-hyA3A-BE4max-F和IVT-T7-hyA3A-BE4max-R(表4)将T7启动子通过PCR引入hyA3A-BE4max或者A3A-BE4max的mRNA模板。

表4、IVT所用PCR引物

2.2、sgRNA(DMD-sg3)体外转录

利用普通DNA产物纯化试剂盒对2.1中PCR产物进行纯化，以纯化后的PCR产物为线性化DNA模板，利用T7体外转录试剂盒(MEGAshortscriptTM Kit)进行体外转录，利用氯化锂沉淀法对转录的sgRNA进行纯化。

2.3、工作系统mRNA(A3A-BE4max和hyA3A-BE4max)的转录

利用体外RNA转录试剂盒(mMESSAGE

T7 Ultra Kit)对A3A-BE4max和hyA3A-BE4max的T7模板分别进行体外转录得到工作系统mRNA，并对其进行纯化。

2.4、显微注射混合物的制备

用无核酸酶的水配置注射混合物，获得总体积为20μL，终浓度为100ng/μL的工作系统mRNA(含有A3A-BE4max的mRNA或含有hyA3A-BE4max的mRNA)与终浓度为200ng/μL的sgRNA(DMD-sg3)的混合液。

2.5、一细胞期胚胎的收集

(1)第一天：于下午1-2点间向6-8周龄的供体母鼠腹腔注射100μL(5IU)的PMSG工作液。

(2)第三天：于下午2-4点间向注射过PMSG的母鼠腹腔注射100μL(5IU)的hCG工作液，注射后，将经激素处理后的母鼠与10-14周齡的公鼠一对一合笼。同时，将处于发情期未经激素处理的雌鼠与输卵管结扎的雄鼠在下午4点左右交配用于假孕母鼠的准备。

(3)第四天：早上9点前，检查与结扎公鼠合笼的受体母鼠是否有孕栓，将有孕栓的母鼠集中于新的笼子内用于下午的胚胎移植实验。

(4)通过二氧化碳窒息法将超排卵的供体母鼠处死取出输卵管，放置于平皿中，平皿中加入预热的M2培养基。

(5)将输卵管放置于另一个新的平皿中，平皿内加入预热的M2培养基与透明质酸，M2培养基与透明质酸的体积比为9:1。在体式显微镜下，用摄子拉扯输卵管壶腹部，使胚胎从输卵管释放至平皿中。把胚胎一直孵育在有透明质酸的M2培养基中直到卵丘细胞掉落。在去除卵丘细胞后，将胚胎转移至一个新的平皿中，平皿内加入无透明质酸的M2培养基，反复用M2培养基冲洗胚胎使透明质酸和卵丘细胞均被冲洗干净。

(6)将冲洗干净的胚胎转移至一个新的平皿中，平皿内先分散加入几滴KSOM培养基，然后再缓慢向平皿加入矿物油，使KSOM培养基被矿物油隔开与覆盖。一般来说，在一个35毫米的平皿中，可加6个点的KSOM培养基，每个点为50μL。将50个胚胎作为一组首先放于中间的KSOM培养基点进行漂洗，然后转移至一个新的培养基点。在显微注射前，把取出的胚胎孵育在细胞培养箱的M2培养基中。

2.6、显微注射与胚胎移植

(1)准备固定针，注射针以及硅化的玻璃载玻片，往载玻片中间滴一滴被矿物油覆盖的M2培养基。

(2)使注射针依靠毛细管作用自动吸入并充满步骤2.4制备的显微注射混合液，将注射针装载至显微注射仪的固定柄上。

(3)转移50个胚胎至载玻片的M2培养基内，移动固定针靠近胚胎，使胚胎依靠负压作用被固定在固定针上。胚胎被固定后在高倍镜下找到细胞质，推动注射针的尖端穿过透明带，细胞膜，将混合液注射到胚胎的细胞质中。

(4)将注射过的胚胎细胞转移至新的M2培养基点中。重复步骤(3)和(4)直至所有的胚胎被注射完。注射完一组实验组后，将胚胎转移至新的KSOM培养基中，将胚胎放置于细胞培养箱中培养1-2小时或过夜。待所有胚胎均被注射后，排除因机械力损伤致死的胚胎，将健康的胚胎转移至新的KSOM培养基中。

(5)向假孕母鼠腹腔注射600μL阿佛丁，将假孕母鼠麻醉。使用剃毛器将母鼠背部的毛剔除。使用70％乙醇擦拭刹剃毛后的皮肤。

(6)在卵巢位置处剪开一个小口，使用钝头镊子牵拉着卵巢的脂肪垫从而将卵巢拉出，并同时用止血钳将卵巢固定于外侧，使用钝头镊子找到位于卵巢囊下侧的输卵管漏斗状口。

(7)使转移针依次吸入M2培养基，两个小气泡，约15个胚胎，气泡是为了便于观察胚胎在转移针中的位置。

(8)轻轻地剖开卵巢的囊，用辕子定位输卵管的漏斗状口，将转移针伸向卵巢的开口处，然后将转移针内的胚胎打出，轻轻地将转移针撤回。

(9)释放固定卵巢脂肪垫的止血钳，将卵巢放回原来的腔洞，用缝合线分别缝合肌肉开口处与皮肤开口处。

(10)将手术后的小鼠放置于恒温37度的保温台上，待小鼠恢复知觉后，将其转移至饲养笼具中饲养，等待胚胎发育直至分娩。一般来说，移植成功的母鼠在3周后生出小鼠。

2.7、小鼠基因组鉴定

取步骤2.6小鼠出生10-15天左右，剪其脚趾进行基因组的鉴定，具体步骤如下：

2.7.1基因组提取

①剪其脚趾装入1.5mL离心管中，每管加入500μL按蛋白酶K：组织裂解液＝1：500的比例配制的脚趾消化液，55℃水浴过夜；

②取出过夜消化的脚趾，室温放置10-15分钟，充分颠倒混匀，13000rpm离心15分钟。

③每管吸出400μL上清，加入等体积氯仿，充分混匀待DNA析出后，12000rpm离心10分钟。

④每管加入提前在-20℃冰箱预冷的75％酒精200μL，轻柔地混匀，12000rpm 4℃离心5min，弃上清，在洁净工作台中晾干。

⑤根据DNA量加入50-100μL去离子超纯水，55℃溶解2小时即可作为PCR模板。

2.7.2基因组的鉴定

按照1.3方法及表3中靶点DMA-sg3的引物对F/R获得含有靶点的DNA片段，先通过一代测序确认有双峰出现，后续再进行高通量深度测序得出编辑效率。根据高通量结果显示，hyA3A-BE4max处理组产生突变的10只F0中，有6只纯合的从CAA到TAA的终止无义突变(图6下图中编号为#BD03、#BD05、#BD07、#BD12、#BD15、#BD16的小鼠)，而A3A-BE4max处理组F0中未发现从CAA到TAA的终止无义突变(图6上图)。与A3A-BE4max处理组相比，hyA3A-BE4max处理组小鼠经过纯合的突变中含有终止密码子TAA的Reads(高通量测序片段)数目占总Reads的比率高(图7)。

2.8、DMD基因的表型鉴定

取来自5周大的野生型小鼠(空白对照)以及2.7.2鉴定的DMD基因突变小鼠，按如下方法进行免疫组织化学检测：

取小鼠的胫骨前肌，用酒精、PBS漂洗干净。将其放入铺有OTC胶的小正方体盒中，置于异戊烷烧杯，在液氮中冷冻，约30s取出，放入-20℃保存，之后进行冰冻切片。将制备好的切片用PBST洗3次/5min，对准组织位置画油圈，加入封闭液进行封闭，封闭1h后，分别用层粘连蛋白(Laminin)一抗或抗肌萎缩蛋白(Dystrophin)一抗(用1：500稀释后的一抗兔多克隆抗体(Abcam，ab11575)或一抗兔多克隆抗体(Abcam，ab15277))进行过夜孵育。用PBST洗3次/5min，然后以1：1000的抗兔稀释液二抗孵育2h，PBST洗3次/5min后，加入以1:100稀释的DAPI孵育10min，PBST洗3次/5min，滴加防猝灭剂，加盖玻片，指甲油封片，最后用荧光显微镜观察切片的荧光。

结果表明：与WT(+/+)和A3A-BE4max处理组小鼠(如#AD26)相比，只有hyA3A-BE4max处理组小鼠中引起DMA-sg3靶点序列第10位C到T纯合无义突变的6只F0代小鼠(如图8中的#BD03)中的DMD未得到蛋白表达(图8)，这也证明DMD动物疾病模型构建成功。

根据荧光观察结果，同时获得hyA3A-BE4max和A3A-BE4max编辑后产生的F0代小鼠总结，如表5所示。

表5、hyA3A-BE4max和A3A-BE4max编辑后产生的F0突变结果对比

2.9、DMD突变小鼠的生殖系遗传分析(F0F1)

取雌性纯合的具有DMD表型的#BD12(F0)与雄性野生型小鼠进行交配，获得8只纯合的F1，对出生的F1进行基因型鉴定，sanger测序结果发现，每只F1产生无义突变的Reads频率均超过96％，即这种无义突变可以稳定遗传到F1代(图9)。

2.10、脱靶检测

利用CRISPR RGEN Tools网站(http://www.rgenome.net)的Cas-OFFinder功能设计脱靶引物(表6)：首先选择所测试工具的PAM的类型以及被测试的物种类型(如小鼠为Musmusculus(mm10)-Mouse)，然后将所设计的sgRNA序列除去PAM部分填写在Query Sequences的方框内，选择错配碱基在3个以内，形成的DNA Bulge Size为在1以内，然后提交后获得相应的脱靶引物。

使用上述脱靶引物分别对经hyA3A-BE4max编辑的F0小鼠基因组DNA(以WT为空白对照)进行PCR后对产物进行高通量深度测序，获得脱靶效率结果(图10)。

表6、DMD-sg3脱靶位点及PCR引物

图10结果表明，与空白对照相比，融合蛋白hyA3A-BE4max及DMD-sg3对表6中15个与DMD-sg3靶点相似的位点(即脱靶位点)基本不发生C到T的编辑，即本申请的融合蛋白hyA3A-BE4max及DMD-sg3基本不产生脱靶效应。

本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

序列表

<110> 华东师范大学上海邦耀生物科技有限公司

<120> 一种疾病动物模型的构建方法及融合蛋白

<130> JH-CNP191781

<160> 19

<170> PatentIn version 3.5

<210> 1

<211> 114

<212> PRT

<213> 人（Homo sapiens）

<400> 1

Met Ala Met Gln Met Gln Leu Glu Ala Asn Ala Asp Thr Ser Val Glu

1 5 10 15

Glu Glu Ser Phe Gly Pro Gln Pro Ile Ser Arg Leu Glu Gln Cys Gly

20 25 30

Ile Asn Ala Asn Asp Val Lys Lys Leu Glu Glu Ala Gly Phe His Thr

35 40 45

Val Glu Ala Val Ala Tyr Ala Pro Lys Lys Glu Leu Ile Asn Ile Lys

50 55 60

Gly Ile Ser Glu Ala Lys Ala Asp Lys Ile Leu Ala Glu Ala Ala Lys

65 70 75 80

Leu Val Pro Met Gly Phe Thr Thr Ala Thr Glu Phe His Gln Arg Arg

85 90 95

Ser Glu Ile Ile Gln Ile Thr Thr Gly Ser Lys Glu Leu Asp Lys Leu

100 105 110

Leu Gln

<210> 2

<211> 342

<212> DNA

<213> 人（Homo sapiens）

<400> 2

atggcaatgc agatgcagct tgaagcaaat gcagatactt cagtggaaga agaaagcttt 60

ggcccacaac ccatttcacg gttagagcag tgtggcataa atgccaacga tgtgaagaaa 120

ttggaagaag ctggattcca tactgtggag gctgttgcct atgcgccaaa gaaggagcta 180

ataaatatta agggaattag tgaagccaaa gctgataaaa ttctggctga ggcagctaaa 240

ttagttccaa tgggtttcac cactgcaact gaattccacc aaaggcggtc agagatcata 300

cagattacta ctggctccaa agagcttgac aaactacttc aa 342

<210> 3

<211> 198

<212> PRT

<213> 人（Homo sapiens）

<400> 3

Glu Ala Ser Pro Ala Ser Gly Pro Arg His Leu Met Asp Pro His Ile

1 5 10 15

Phe Thr Ser Asn Phe Asn Asn Gly Ile Gly Arg His Lys Thr Tyr Leu

20 25 30

Cys Tyr Glu Val Glu Arg Leu Asp Asn Gly Thr Ser Val Lys Met Asp

35 40 45

Gln His Arg Gly Phe Leu His Asn Gln Ala Lys Asn Leu Leu Cys Gly

50 55 60

Phe Tyr Gly Arg His Ala Glu Leu Arg Phe Leu Asp Leu Val Pro Ser

65 70 75 80

Leu Gln Leu Asp Pro Ala Gln Ile Tyr Arg Val Thr Trp Phe Ile Ser

85 90 95

Trp Ser Pro Cys Phe Ser Trp Gly Cys Ala Gly Glu Val Arg Ala Phe

100 105 110

Leu Gln Glu Asn Thr His Val Arg Leu Arg Ile Phe Ala Ala Arg Ile

115 120 125

Tyr Asp Tyr Asp Pro Leu Tyr Lys Glu Ala Leu Gln Met Leu Arg Asp

130 135 140

Ala Gly Ala Gln Val Ser Ile Met Thr Tyr Asp Glu Phe Lys His Cys

145 150 155 160

Trp Asp Thr Phe Val Asp His Gln Gly Cys Pro Phe Gln Pro Trp Asp

165 170 175

Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg Ala Ile

180 185 190

Leu Gln Asn Gln Gly Asn

195

<210> 4

<211> 594

<212> DNA

<213> 人（Homo sapiens）

<400> 4

gaggcatctc cagcaagcgg accaaggcac ctgatggacc cccacatctt cacctctaac 60

tttaacaatg gcatcggcag gcacaagaca tacctgtgct atgaggtgga gcgcctggac 120

aacggcacca gcgtgaagat ggatcagcac agaggcttcc tgcacaacca ggccaagaat 180

ctgctgtgcg gcttctacgg ccggcacgca gagctgagat ttctggacct ggtgcctagc 240

ctgcagctgg atccagccca gatctatagg gtgacctggt tcatcagctg gtccccatgc 300

ttttcctggg gatgtgcagg agaggtgcgc gccttcctgc aggagaatac acacgtgcgg 360

ctgagaatct ttgccgcccg gatctacgac tatgatcctc tgtacaagga ggccctgcag 420

atgctgagag acgcaggagc ccaggtgtcc atcatgacct atgatgagtt caagcactgc 480

tgggacacat ttgtggatca ccagggctgt ccctttcagc cttgggacgg actggatgag 540

cactcccagg ccctgtctgg caggctgagg gccatcctgc agaaccaggg caat 594

<210> 5

<211> 1367

<212> PRT

<213> 酿脓链球菌（Streptococcus pyogenes）

<400> 5

Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly

1 5 10 15

Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys

20 25 30

Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly

35 40 45

Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys

50 55 60

Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr

65 70 75 80

Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe

85 90 95

Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His

100 105 110

Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His

115 120 125

Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser

130 135 140

Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met

145 150 155 160

Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp

165 170 175

Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn

180 185 190

Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys

195 200 205

Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu

210 215 220

Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu

225 230 235 240

Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp

245 250 255

Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp

260 265 270

Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu

275 280 285

Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile

290 295 300

Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met

305 310 315 320

Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala

325 330 335

Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp

340 345 350

Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln

355 360 365

Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly

370 375 380

Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys

385 390 395 400

Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly

405 410 415

Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu

420 425 430

Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro

435 440 445

Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met

450 455 460

Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val

465 470 475 480

Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn

485 490 495

Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu

500 505 510

Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr

515 520 525

Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys

530 535 540

Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val

545 550 555 560

Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser

565 570 575

Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr

580 585 590

Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn

595 600 605

Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu

610 615 620

Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His

625 630 635 640

Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr

645 650 655

Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys

660 665 670

Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala

675 680 685

Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys

690 695 700

Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His

705 710 715 720

Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile

725 730 735

Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg

740 745 750

His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr

755 760 765

Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu

770 775 780

Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val

785 790 795 800

Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln

805 810 815

Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu

820 825 830

Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp

835 840 845

Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly

850 855 860

Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn

865 870 875 880

Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe

885 890 895

Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys

900 905 910

Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys

915 920 925

His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu

930 935 940

Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys

945 950 955 960

Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu

965 970 975

Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val

980 985 990

Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val

995 1000 1005

Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys

1010 1015 1020

Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr

1025 1030 1035

Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn

1040 1045 1050

Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr

1055 1060 1065

Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg

1070 1075 1080

Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu

1085 1090 1095

Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg

1100 1105 1110

Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys

1115 1120 1125

Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu

1130 1135 1140

Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser

1145 1150 1155

Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe

1160 1165 1170

Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu

1175 1180 1185

Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe

1190 1195 1200

Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu

1205 1210 1215

Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn

1220 1225 1230

Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro

1235 1240 1245

Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His

1250 1255 1260

Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg

1265 1270 1275

Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr

1280 1285 1290

Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile

1295 1300 1305

Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe

1310 1315 1320

Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr

1325 1330 1335

Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly

1340 1345 1350

Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp

1355 1360 1365

<210> 6

<211> 4101

<212> DNA

<213> 酿脓链球菌（Streptococcus pyogenes）

<400> 6

gacaagaagt acagcatcgg cctggccatc ggcaccaact ctgtgggctg ggccgtgatc 60

accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac 120

agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc 180

acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat 240

ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg 300

gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac 360

atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa 420

ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg 480

atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 540

gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc 600

aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg 660

ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg 720

attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat 780

gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 840

atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 900

ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 960

atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag 1020

cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc 1080

tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa 1140

aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag 1200

cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc 1260

attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag 1320

aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga 1380

ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg 1440

gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac 1500

ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat 1560

aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc 1620

ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg 1680

aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc 1740

ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc 1800

aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg 1860

accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac 1920

ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg 1980

ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat 2040

ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc 2100

ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac 2160

gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg 2220

aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc 2280

gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2340

aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2400

gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat 2460

atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc 2520

gtgcctcaga gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac 2580

aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2640

tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc 2700

aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg 2760

gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2820

aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag 2880

ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac 2940

caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3000

cctaagctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3060

atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3120

atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct 3180

ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3240

accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3300

acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 3360

agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 3420

tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3480

gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3540

ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3600

tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 3660

aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3720

tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3780

cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 3840

ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 3900

atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 3960

gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4020

gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4080

ctgtctcagc tgggaggtga c 4101

<210> 7

<211> 18

<212> PRT

<213> 人工序列

<400> 7

Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys Arg

1 5 10 15

Lys Val

<210> 8

<211> 54

<212> DNA

<213> 人工序列

<400> 8

aaacggacag ccgacggaag cgagttcgag tcaccaaaga agaagcggaa agtc 54

<210> 9

<211> 176

<212> PRT

<213> 枯草芽孢杆菌（Bacillus subtilis）噬菌体

<400> 9

Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val

1 5 10 15

Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile

20 25 30

Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu

35 40 45

Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr

50 55 60

Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile

65 70 75 80

Lys Met Leu Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Thr Asn Leu

85 90 95

Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu

100 105 110

Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys

115 120 125

Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp

130 135 140

Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp

145 150 155 160

Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu

165 170 175

<210> 10

<211> 528

<212> DNA

<213> 枯草芽孢杆菌（Bacillus subtilis）噬菌体

<400> 10

actaatctga gcgacatcat tgagaaggag actgggaaac agctggtcat tcaggagtcc 60

atcctgatgc tgcctgagga ggtggaggaa gtgatcggca acaagccaga gtctgacatc 120

ctggtgcaca ccgcctacga cgagtccaca gatgagaatg tgatgctgct gacctctgac 180

gcccccgagt ataagccttg ggccctggtc atccaggatt ctaacggcga gaataagatc 240

aagatgctga gcggaggatc cggaggatct ggaggcagca ccaacctgtc tgacatcatc 300

gagaaggaga caggcaagca gctggtcatc caggagagca tcctgatgct gcccgaagaa 360

gtcgaagaag tgatcggaaa caagcctgag agcgatatcc tggtccatac cgcctacgac 420

gagagtaccg acgaaaatgt gatgctgctg acatccgacg ccccagagta taagccctgg 480

gctctggtca tccaggattc caacggagag aacaaaatca aaatgctg 528

<210> 11

<211> 23

<212> DNA

<213> 人（Homo sapiens）

<400> 11

gagtccgagc agaagaagaa ggg 23

<210> 12

<211> 23

<212> DNA

<213> 人（Homo sapiens）

<400> 12

ttctacaccc cagccgcccc agg 23

<210> 13

<211> 23

<212> DNA

<213> 人（Homo sapiens）

<400> 13

gaccccctcc accccgcctc cgg 23

<210> 14

<211> 23

<212> DNA

<213> 人（Homo sapiens）

<400> 14

ggaatccctt ctgcagcacc tgg 23

<210> 15

<211> 23

<212> DNA

<213> 人（Homo sapiens）

<400> 15

gtgctgggct ccggtgcgtt cgg 23

<210> 16

<211> 23

<212> DNA

<213> 人（Homo sapiens）

<400> 16

caaagcagaa actcacatcg agg 23

<210> 17

<211> 23

<212> DNA

<213> 人（Homo sapiens）

<400> 17

gacatcgatg tcctccccat tgg 23

<210> 18

<211> 23

<212> DNA

<213> 人（Homo sapiens）

<400> 18

agggatcgtc tttcaaggcg agg 23

<210> 19

<211> 23

<212> DNA

<213> 小鼠（Mus musculus）

<400> 19

acatctcatc aaggacttgt tgg 23

Claims

1.一种提高基因编辑效率的融合蛋白，其特征在于，所述融合蛋白包括Rad51的DNA结合结构域、胞嘧啶脱氨酶APOBEC3A和核酸酶；

所述融合蛋白的连接顺序为：所述胞嘧啶脱氨酶APOBEC3A位于所述核酸酶的N端；

所述Rad51的DNA结合结构域位于所述胞嘧啶脱氨酶APOBEC3A和所述核酸酶之间；

所述Rad51的DNA结合结构域的氨基酸序列如SEQ ID No.1所示；

所述胞嘧啶脱氨酶APOBEC3A来源于人，所述胞嘧啶脱氨酶APOBEC3A的氨基酸序列如SEQ ID No.3所示；

所述核酸酶为spCas9n，所述spCas9n的氨基酸序列如SEQ ID No.5所示；

所述融合蛋白还包括NLS，所述NLS位于所述融合蛋白的至少一端；

所述融合蛋白还包括UGI，所述UGI位于所述融合蛋白的至少一端；

所述UGI为两个以上拷贝。

2.根据权利要求1所述的融合蛋白，其特征在于所述NLS的氨基酸序列如SEQ ID No.7所示。

3.根据权利要求1所述的融合蛋白，其特征在于，所述UGI的氨基酸序列如SEQ ID No.9所示。

4.如下A）-C）生物材料中的任一种：

A）一种基因，编码权利要求1-3中任一所述融合蛋白；

B）一种重组载体，含有A）所述基因；

C）一种非植物重组细胞或重组菌，含有权利要求1-3中任一所述的融合蛋白，或含有A）所述基因。

5.一种单碱基基因编辑系统，其特征在于，所述系统包括权利要求1-3中任一所述的融合蛋白、和/或权利要求4所述的生物材料和sgRNA，所述sgRNA引导所述融合蛋白对目的细胞中的目的基因进行单碱基基因编辑。

6.根据权利要求5所述的系统，其特征在于，所述sgRNA的靶序列为SEQ ID No.11-19中的至少一种。

7.权利要求1-3中任一所述融合蛋白、权利要求4所述的生物材料或权利要求5或6所述的单碱基基因编辑系统在制备基因编辑产品、疾病治疗和/或预防产品、动物模型或植物新品种中的应用。

8.一种提高单碱基基因编辑效率的方法，其特征在于，所述方法包括利用权利要求1-3中任一所述的融合蛋白和sgRNA引入细胞、对目的基因进行基因编辑的步骤，所述sgRNA引导所述融合蛋白对所述目的基因进行单碱基基因编辑。

9.根据权利要求8所述的方法，其特征在于，所述sgRNA的靶序列为SEQ ID No.11-19中的至少一种。

10.一种疾病动物模型的构建方法，其特征在于：所述方法包括利用权利要求1-3中任一所述的融合蛋白和sgRNA引入动物细胞、对目的基因进行基因编辑的步骤。

11.根据权利要求10所述的方法，其特征在于，所述sgRNA的靶序列为SEQ ID No.11-19中的至少一种。

12.根据权利要求11所述的方法，其特征在于，所述sgRNA的靶序列如SEQ ID No.19所示，所述目的基因包括DMD基因。

13.根据权利要求10所述的方法，其特征在于，所述动物为哺乳动物。

14.根据权利要求13所述的方法，其特征在于，所述哺乳动物为大鼠或小鼠。

15.根据权利要求14所述的方法，其特征在于，所述哺乳动物为小鼠。

16.根据权利要求10所述的方法，其特征在于，所述细胞为胚胎细胞。

17.根据权利要求10所述的方法，其特征在于，所述引入的方式为载体转化、显微注射、转染、热休克、电穿孔、转导、基因枪、DEAE-葡聚糖介导的转移中的一种或任几种组合。

18.根据权利要求17所述的方法，其特征在于，所述引入的方式为显微注射。

19.根据权利要求10所述的方法，其特征在于，所述引入使用权利要求1-3中任一所述的融合蛋白的mRNA和所述sgRNA进行。

20.根据权利要求19所述的方法，其特征在于，所述引入使用的权利要求1-3中任一所述的融合蛋白的mRNA的浓度为1-1000ng/μL。

21.根据权利要求20所述的方法，其特征在于，所述引入使用的权利要求1-3中任一所述的融合蛋白的mRNA的浓度为10-600ng/μL。

22.根据权利要求21所述的方法，其特征在于，所述引入使用的权利要求1-3中任一所述的融合蛋白的mRNA的浓度为50-150ng/μL。

23.根据权利要求22所述的方法，其特征在于，所述引入使用的权利要求1-3中任一所述的融合蛋白的mRNA的浓度为100ng/μL。

24.根据权利要求10所述的方法，其特征在于，所述引入使用的所述sgRNA的浓度为1-1000ng/μL。

25.根据权利要求24所述的方法，其特征在于，所述引入使用的所述sgRNA的浓度为10-600ng/μL。

26.根据权利要求25所述的方法，其特征在于，所述引入使用的所述sgRNA的浓度为150-250ng/μL。

27.根据权利要求26所述的方法，其特征在于，所述引入使用的所述sgRNA的浓度为200ng/μL。

28.根据权利要求10所述的方法，其特征在于，所述引入使用的权利要求1-3中任一所述融合蛋白的mRNA与所述引入使用的所述sgRNA的浓度比为1:（5-1）。

29.根据权利要求28所述的方法，其特征在于，所述引入使用的权利要求1-3中任一所述融合蛋白的mRNA与所述引入使用的所述sgRNA的浓度比为1:（4-1.5）。

30.根据权利要求29所述的方法，其特征在于，所述引入使用的权利要求1-3中任一所述融合蛋白的mRNA与所述引入使用的所述sgRNA的浓度比为1:（3-1.8）。

31.根据权利要求30所述的方法，其特征在于，所述引入使用的权利要求1-3中任一所述融合蛋白的mRNA与所述引入使用的所述sgRNA的浓度比为1:2。