CN115161335A

CN115161335A - 用于构建tardbp基因突变的als模型猪核移植供体细胞的基因编辑系统及其应用

Info

Publication number: CN115161335A
Application number: CN202110361873.5A
Authority: CN
Inventors: 牛冬; 汪滔; 陶裴裴; 曾为俊; 刘瑜; 王磊; 程锐; 赵泽英; 马翔; 黄彩云; 段星; 刘璐
Original assignee: Nanjing Qizhen Genetic Engineering Co Ltd
Current assignee: Nanjing Qizhen Genetic Engineering Co Ltd
Priority date: 2021-04-02
Filing date: 2021-04-02
Publication date: 2022-10-11
Anticipated expiration: 2041-04-02
Also published as: CN115161335B

Abstract

本发明公开了用于构建TARDBP基因突变的ALS模型猪核移植供体细胞的基因编辑系统及其应用。该基因编辑系统包含按照本发明所述方法制备的Cas9蛋白，针对TARDBP基因的gRNA以及含有TARDBP突变位点的单链Donor DNA。采用本发明构建并表达的Cas9高效蛋白联合体外转录的gRNA进行基因编辑，并对Cas9和gRNA的最佳用量配比进行了优化，配合合成的ssODN作为Donor DNA，最终获得靶标位点精确点突变的单细胞克隆比率高达22.5％，远高于常规的点突变效率(<5％)。所构建的TARDBP基因突变猪细胞可用于进行体细胞克隆，生产肌萎缩侧索硬化症模型猪。

Description

用于构建TARDBP基因突变的ALS模型猪核移植供体细胞的基因编辑系统及其应用

技术领域

本发明属于基因编辑技术领域，具体涉及CRISPR/Cas9系统及ssODN同源重组技术在构建TARDBP基因突变的肌萎缩侧索硬化症模型猪核移植供体细胞中的应用。

背景技术：

肌萎缩性脊髓侧索硬化症，又名肌萎缩侧索硬化症(Amyotrophic LateralSclerosis，ALS)，是运动神经元疾病(Motor Neuron Disease，MND)的主要类型，俗称“渐冻人症”，其特征是脑和脊髓中的运动神经细胞(神经元)进行性退化。运动神经元控制着人体运动、说话、吞咽和呼吸时的肌肉活动，若其功能发生障碍，肌肉将逐渐萎缩退化，表现为肌肉逐渐无力以至瘫痪，说话、吞咽和呼吸功能减退，直至呼吸衰竭死亡。此病症未侵犯人体的感觉神经，所以并不影响患者的智力、记忆或感觉。病情的发展一般较迅速，从出现症状开始，平均寿命为3-5年，但因个体异质性波动较大。“渐冻人症”被世界卫生组织列为与艾滋病、癌症等并列的5大绝症之一，发病率大约为十万分之三，属于世界罕见病。

“渐冻人”协会国际联盟在2000年于丹麦举行的国际病友大会上确定每年的6月21日为“世界渐冻人日”，各地在这一天举行各类认识运动神经元疾病的相关活动，希望通过这种活动，引起人们对患有这种可怕疾病患者的重视和社会关爱。目前，ALS的病理生理机制尚不完全清楚，国内也尚无准确的ALS发病率的流行病学报道，但有关ALS的遗传因素影响已经得到广泛认可。约90％以上的ALS病例为散发性(sporadic ALS，SALS)，余下病例为家族遗传性(familial ALS，FALS)，已经确定超过30种基因和FALS有关。其中，最常见和研究最多的基因为ALS1(SOD1)、ALS10(TARDBP)、ALS6(FUS)、FTDALS1(C9orf72)等，它们和ALS的某些特定临床特征包括起病年龄、部位及生存期有关。

TDP-43是一个多功能的DNA和RNA结合蛋白，由TARDBP基因编码，在细胞内的RNA转录、选择性剪接及mRNA稳定性调节等过程中发挥功能。正常情况下，TDP-43在细胞应激环境下能参与形成应激颗粒，以应对细胞环境变化。应激颗粒是通过可逆的液液相分离聚集成的无膜结构，但是错误的聚集会导致不可逆的淀粉样蛋白沉淀。TDP-43蛋白在ALS和FTLD(frontotemporal lobar degeneration，额颞叶变性运动神经元疾病)患者细胞如神经元和神经胶质细胞内以淀粉样形式存在，已成为此两种疾病的主要病理标志性蛋白之一，另外在20-50％的阿尔茨海默病(Alzheimer’s disease，AD)患者中也发现了该蛋白的异常变化。已有研究发现在ALS病例中，约4％的FALS和1.5％的SALS是由TARDBP基因突变引起的，已鉴定出40多个TARDBP基因的突变，它们多集中于该蛋白C端的甘氨酸富集区，然而关于TDP-43蛋白如何造成神经元细胞死亡及其引起神经退行性疾病的细胞和分子机制尚不清楚。

研究由TARDBP突变导致ALS或其他神经退行性疾病发生发展的细胞和分子机制及研发相应的药物均需要在动物模型的基础上进行，目前常用的动物模型为小鼠模型，然而小鼠不论从体型、器官大小、生理、病理等方面都与人相差巨大，不能真实地模拟人类正常的生理、病理状态。而猪作为大动物，是人类长期以来主要的肉食供应动物，其体型大小和生理功能与人类近似，易于大规模繁殖饲养，而且在伦理道德及动物保护等方面要求较低，是理想的人类疾病模型动物。

基因编辑是近年来不断取得重大发展的一种生物技术，其包括从基于同源重组的基因编辑到基于核酸酶的ZFN、TALEN、CRISPR/Cas9等编辑技术，其中CRISPR/Cas9技术是当前最先进的基因编辑技术。目前，基因编辑技术被越来越多地应用到动物模型的制作上。

同源重组(HDR)是通过序列同源性交换DNA序列信息：即修复模板中包含所需插入片段，修复模板的两端则是与插入位点附近具有序列同源性的重组臂。过去通常使用双链DNA(dsDNA)作为修复模板，但最近的研究揭示了单链寡核苷酸脱氧核苷酸(ssODN)作为HDR供体模板的优越性。首先，ssODN作为供体模板比dsDNA模板的插入位点特异性高，dsDNA模板容易产生随机插入。其次，ssODN对同源重组臂的长度要求比dsDNA模板更短，单侧30～60个碱基的重组臂设计可以获得高效且稳定的HDR，相比类似的dsDNA模板，其提供的插入效率更高。第三，dsDNA容易被NHEJ修复途径合并，从而导致同源臂的复制或者dsDNA模板的部分整合，而ssODN就不易产生这种现象。另外，dsDNAs对培养的细胞是有害的，线型或者质粒dsDNAs的转染效率较低，并使细胞产生不良反应，而ssODN模板在这些方面就更有优势。

因此，本发明采用CRISPR/Cas9技术联合ssODN同源重组技术进行了TARDBP基因的点突变基因编辑，模拟ALS的自然发病遗传特征，并获得了TARDBP基因精确点突变的单细胞克隆，为后期通过体细胞核移植动物克隆技术培育ALS疾病模型猪奠定了基础。该模型猪将为研究ALS的发病机制及药物研发提供有力的实验工具。

发明内容

本发明的目的是提供一种原核Ca9高效表达载体pKG-GE4及其构建方法和应用。

本发明的另一目的是提供一种用于构建TARDBP基因突变的ALS模型猪核移植供体细胞的基因编辑系统及其应用。

本发明的又一目的是提供一种重组细胞及其应用。

本发明的目的可通过以下技术方案实现：

一种原核Ca9高效表达载体pKG-GE4，序列如SEQ ID NO.1所示。

具体的，质粒pKG-GE4的主要元件有：

T7启动子(T7 Promoter)，Lac操纵子(Lac Operatore)，核糖体结合位点(RBS)，碱性磷酸酶(phoA)信号肽(phoA:SP)，硫氧还原蛋白(TrxA)，His标签蛋白，肠激酶酶切位点(EK),核定位信号(SV40NLS),Cas9蛋白(spCas9)，核定位信号(nucleoplasmin NLS)，T7终止子(T7 terminator)，载体骨架(包括Amp抗性元件、ori复制起始子及LacI组成型表达元件等)。

质粒pKG-GE4中，具有特异融合基因；所述特异融合基因编码特异融合蛋白；

所述特异融合蛋白自N端至C端依次包括如下元件：碱性磷酸酶(phoA)信号肽(phoA:SP)，硫氧还原蛋白(TrxA)，His标签蛋白，肠激酶酶切位点(EK),核定位信号(SV40NLS),Cas9蛋白(spCas9)，核定位信号(nucleoplasmin NLS)。

质粒pKG-GE4中，由T7启动子启动所述特异融合基因的表达；

质粒pKG-GE4中，由Lac操纵子控制所述特异融合基因的诱导表达。

质粒pKG-GE4中，所述特异融合基因下游具有T7终止子序列元件。

质粒pKG-GE4中，依次具有如下元件：T7启动子(T7 Promoter)，Lac操纵子(LacOperator)，核糖体结合位点(RBS)、所述特异融合基因、T7终止子序列元件。

所述特异融合基因表达特异融合蛋白。

所述特异融合蛋白中，用于目的蛋白分泌表达的信号肽可选自大肠杆菌碱性磷酸酶(phoA)信号肽、金黄色葡萄球菌蛋白A信号肽、大肠杆菌外膜蛋白(ompa)信号肽或任何其他原核基因的信号肽，优选为碱性磷酸酶(phoA)信号肽。

所述特异融合蛋白中，增加目的蛋白可溶性的分子伴侣融合蛋白可为任何帮助形成二硫键的蛋白，进一步优选为硫氧还原蛋白。

所述特异融合蛋白中，用于去除融合标签，从融合蛋白中获取天然形式Cas9蛋白的内切蛋白酶识别位点可选自肠激酶(Enterokinase)、因子Xa(Factor Xa)，凝血酶(Thrombin)、TEV蛋白酶(TEV protease)、HRV 3C蛋白酶(HRV 3C protease)、WELQut蛋白酶或任何其他内切蛋白酶的识别位点，进一步优选为肠激酶识别位点。

所述特异融合蛋白中，便于目的蛋白纯化的蛋白标签可选自His标签、GST标签、Flag标签、HA标签、c-Myc标签或其他任何蛋白标签，进一步优选为His蛋白标签。

所述特异融合蛋白中，引导Cas9蛋白进入细胞核的核定位信号可为任何核定位信号，进一步优选为SV40核定位信号和/或nucleoplasmin核定位信号。

所述特异融合蛋白中，cas蛋白可选自Casl、CaslB、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas9、CaslO、Csyl、Csy2、Csy3、Csy4、Csel、Cse2、Cse3、Cse4、Cse5e、Cscl、Csc2、Csa5、Csnl、Csn2、Csml、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csx17、Csx14、CsxlO、Csx16、CsaX、Csx3、Csxl、CsxlS、Csfl、Csf2、CsO、Csf4、Csdl、Csd2、Cstl、Cst2、Cshl、Csh2、Csal、Csa2、Csa3、Csa4、Csa5、C2cl、C2c2、C2c3、Cpfl、CARF、DinG、其同源物或其修饰形式，优选为Cas9，进一步优选为spCas9。

特异融合基因具体如SEQ ID NO.1中第5209-9849位核苷酸所示。

T7启动子如SEQ ID NO.1中第5121-5139位核苷酸所示。

Lac操纵子如SEQ ID NO.1中第5140-5164位核苷酸所示。

RBS如SEQ ID NO.1中第5178-5201位核苷酸所示

T7终止子如SEQ ID NO.1第9902-9949位核苷酸所示。

经过上述各项优化设计及改造，pKG-GE4载体所表达得到的Cas9蛋白活性比商品Cas9蛋白有了极显著的提高。

本发明所述的原核Ca9高效表达载体在制备Ca9蛋白中的应用。

含有本发明所述的原核Ca9高效表达载体pKG-GE4的基因工程菌。

本发明所述的基因工程菌在制备Ca9蛋白中的应用。

一种制备Ca9蛋白的方法，包含以下步骤：

(1)培养本发明所述的基因工程菌，加入IPTG，在低于前期培养温度5℃的温度下诱导所述的基因工程菌表达目的蛋白，并收集菌体沉淀；

(2)粗提融合蛋白，采用Ni-NTA琼脂糖柱进行融合蛋白的纯化；

(3)用带his标签的重组牛肠激酶酶切融合蛋白，并用Ni-NTA树脂纯化得到酶切后去除TrxA-His的NLS-spCas9-NLS目的蛋白。

一种用于构建TARDBP基因突变的ALS模型猪核移植供体细胞的基因编辑系统，包含按照本发明所述方法制备的Ca9蛋白，针对TARDBP基因的gRNA以及含有TARDBP突变位点的单链Donor DNA。

作为本发明的一种优选，所述的针对TARDBP基因的gRNA的靶点选自SEQ ID NO.15所示的TARDBP-E6-gRNA2和SEQ ID NO.16所示的TARDBP-E6-gRNA3。

作为本发明的一种优选，所述的针对TARDBP基因的TARDBP-T7-gRNA2，其转录模板如SEQ ID NO.25所示；针对TARDBP基因的TARDBP-T7-gRNA3，其转录模板如SEQ ID NO.26所示。

作为本发明的一种优选，所述的含有TARDBP突变位点的单链Donor DNA序列如SEQID NO.27所示。

作为本发明的进一步优选，所述的基因编辑系统，Ca9蛋白：TARDBP-T7-gRNA2：TARDBP-T7-gRNA3：单链Donor DNA的质量比为1:1:4:2。

本发明所述的基因编辑系统在构建TARDBP基因突变的猪重组细胞中的应用。

一种重组细胞，由本发明所述的基因编辑系统共转染猪原代成纤维细胞经验证后所得。

本发明所述的基因编辑系统、所述的重组细胞在构建TARDBP基因突变的肌萎缩侧索硬化症模型猪中的应用。

与现有技术相比，本发明至少具有如下有益效果：

(1)本发明研究对象(猪)比其他动物(大小鼠、灵长类)具有更好的应用性。

大小鼠等啮齿类动物不论从体型、器官大小、生理、病理等方面都与人相差巨大，无法真实地模拟人类正常的生理、病理状态。研究表明，95％以上在大小鼠中验证有效的药物在人类临床试验中是无效的。就大动物而言，灵长类是与人亲缘关系最近的动物，但其体型小、性成熟晚(6-7岁开始交配)，且为单胎动物，群体扩繁速度极慢，饲养成本很高。另外，灵长类动物克隆效率低、难度大、成本高。

而猪作为模型动物就没有上述缺点，猪是除灵长类外与人亲缘关系最近的动物，其体型、体重、器官大小等与人相近，在解剖学、生理学、免疫学、营养代谢、疾病发病机制等方面与人类极为相似。同时，猪的性成熟早(4-6个月)，繁殖力高，一胎多仔，在2-3年内即可形成一个较大群体。另外，猪的克隆技术非常成熟，克隆及饲养成本也较灵长类低得多。因此猪是非常适合作为人类疾病模型的动物。

(2)本发明所构建的pET32a-T7lac-phoA:SP-TrxA-His-EK-NLS-spCas9-NLS-T7ter(简称pKG-GE4)载体，使用了能够高效表达目的蛋白的强启动子T7lac来进行目的蛋白的表达，用细菌周质蛋白碱性磷酸酶(phoA)的信号肽来引导目的蛋白分泌表达至细菌周质腔中，从而与细菌胞内蛋白分离，且分泌到细菌周质腔中的目的蛋白为可溶性表达。同时还采用硫氧还原蛋白TrxA与Cas9蛋白融合表达，TrxA能帮助所共表达的目的蛋白形成二硫键，提高蛋白的稳定性、折叠的正确性，增加目的蛋白的溶解性及活性。为了方便目的蛋白的纯化，设计了His标签，可以通过一步法Ni柱亲和层析纯化目的蛋白，极大地简化了目的蛋白的纯化流程。同时在His标签后设计了一个肠激酶酶切位点，便于切除所融合的TrxA-His多肽片段，得到天然形式的Cas9蛋白。利用带His标签的肠激酶酶切融合蛋白后，可通过一次亲和层析除去TrxA-His多肽片段及带His标签的肠激酶，得到天然形式的Cas9蛋白，避免了多次纯化透析对目的蛋白的伤害和损耗。同时，本发明也在Cas9的N端及C端分别设计了一个NLS位点，使Cas9能更有效地进入细胞核进行基因编辑。另外，本发明选择了E.coliBL21(DE3)菌株为目的蛋白表达菌株，该菌株可高效表达克隆于含有噬菌体T7启动子的表达载体(如pET-32a)的外源基因。同时，对于Cas9蛋白的密码子，本发明进行了密码子优化，使之完全适应表达菌株的密码子偏好，从而提高目的蛋白的表达水平。另外，本发明在细菌生长至一定数量后，再用IPTG在低温下诱导目的蛋白的表达，可避免目的蛋白过早表达对宿主菌生长的影响，低温下诱导表达也显著提高所表达的目的蛋白的可溶性。经过上述各项优化设计及实验实施，所得到的Cas9蛋白活性比商品Cas9蛋白有了极显著的提高。

(3)采用本发明构建并表达的Cas9高效蛋白联合体外转录的gRNA进行基因编辑，并对Cas9和gRNA的最佳用量配比进行了优化，配合合成的ssODN作为Donor DNA，最终获得靶标位点精确点突变的单细胞克隆比率高达22.5％，远高于常规的点突变效率(<5％)。

(4)利用本发明所得到的靶基因点突变单细胞克隆株进行体细胞核移植动物克隆可直接得到含靶标基因点突变的克隆猪，并且该突变可稳定遗传。

在小鼠模型制作中采用的受精卵显微注射基因编辑材料后再进行胚胎移植的方法，因其直接获得点突变后代的概率非常低(低于1％)，需要进行后代的杂交选育，这不太适用于妊娠期较长的大动物(如猪)模型制作。因此，本发明采用技术难度大、挑战性高的原代细胞体外编辑并筛选阳性编辑单细胞克隆的方法，后期再通过体细胞核移植动物克隆技术直接获得相应疾病模型猪，可大大缩短模型猪制作周期并节省人力、物力、财力。

本发明为通过基因编辑手段获得类似人ALS疾病发展进程的TARDBP点突变模型猪奠定了坚实的基础，将有助于研究并揭示由TARDBP突变导致ALS的发病机制，并可用于进行药物筛选、药效检测、基因及细胞治疗等研究，能够为进一步的临床应用提供有效的实验数据，进而为预防和治疗人类ALS提供有力的实验手段。本发明对人类ALS疾病治疗药物的研发及临床前实验具有重大应用价值。

附图说明

图1为质粒pET-32a的结构示意图。

图2为质粒pKG-GE4的结构示意图。

图3为实施例3中步骤3.3.3的电泳图。

图4为实施例3中步骤3.4.3的电泳图。

图5为实施例4中步骤4.2.3的电泳图。

图6为实施例4中步骤4.2.4的电泳图。

图7为实施例4中步骤4.6.4的电泳图。

图8为实施例5中步骤5.1.3的电泳图。

图9为实施例5中步骤5.6.3的电泳图。

图10为实施例5中步骤5.6.4判定为野生型的示例性测序峰图。

图11为实施例5中步骤5.6.4判定为杂合突变型的示例性测序峰图。

图12为实施例5中步骤5.6.4判定为双等位基因不同变异的纯合突变型示例性测序峰图。

图13为实施例5中步骤5.6.4判定为双等位基因相同变异的纯合突变型示例性测序峰图。

图14为实施例5中步骤5.6.4判定为靶标位点点突变的杂合突变型示例性测序峰图。

图15为实施例5中步骤5.6.4判定为靶标位点点突变的纯合突变型示例性测序峰图。

具体实施方式

实施例1原核Ca9高效表达载体(简称pKG-GE4)的构建

质粒pET32a-T7lac-phoA:SP-TrxA-His-EK-NLS-spCas9-NLS-T7ter(简称pKG-GE4，质粒图谱如图2)是以质粒pET-32a(结构示意图见图1)作为骨架进行改造而来，主要改造如下：①保留了TrxA蛋白的编码区域，可以帮助所表达的目的蛋白形成二硫键，增加目的蛋白溶解性及活性，但是在此序列之前加入碱性磷酸酶(phoA)的信号肽(SP)序列，该SP可以引导所表达的目的蛋白分泌至细菌的膜周质腔中，并可被原核周质信号肽酶酶切；②在TrxA蛋白编码序列之后增加His-Tag标签基团，可用于所表达的目的蛋白的富集；③在His-Tag标签下游增加肠激酶(EK)酶切位点DDDDK(Asp-Asp-Asp-Asp-Lys)，纯化出的蛋白将在肠激酶作用下去除His-Tag标签和上游所融合的TrxA蛋白。④插入密码子优化后的适宜大肠杆菌BL21(DE3)菌株表达的Cas9蛋白的编码序列，同时在该基因的上游和下游均增加核定位信号编码序列(NLS)，增加后期纯化出的Cas9蛋白的核定位能力。

pKG-GE4载体构建方法如下：

(1)骨架载体的制备

质粒pET-32a用XbaI、XhoI酶切，回收载体片段(约5329bp左右)。

(2)全基因合成插入序列

全基因合成如SEQ ID NO.2所示序列，依次包含前述的phoA signal peptide序列、TrxA蛋白编码序列、His-Tag标签基团、EK酶切位点、spCas9蛋白编码序列及其两端的NLS序列，在全基因合成的N端和C端分别包含与骨架载体序列同源的25个碱基对。

(3)全基因合成片段与骨架载体连接

将步骤(1)回收的骨架载体和步骤(2)全基因合成的序列重组得到质粒pKG-GE4，核苷酸序列见SEQ ID NO.1。SEQ ID NO.1中，第5121-5139位核苷酸组成T7启动子，第5140-5164位核苷酸编码Lac操纵子(lac operator)，第5178-5201位核苷酸编码核糖体结合位点(RBS),第5209-5271位核苷酸编码phoA(碱性磷酸酶)信号肽(signal peptide，SP),第5272-5598位核苷酸编码TrxA蛋白，第5620-5637位核苷酸编码His-Tag标签，第5638-5652位核苷酸编码肠激酶酶切位点，第5656-5670位核苷酸编码SV40核定位信号(NLS)，第5701-9801位核苷酸编码spCas9蛋白(其密码子已优化为适宜在大肠杆菌BL21(DE3)菌株中进行表达)，第9802-9849位核苷酸编码nucleoplasmin核定位信号(NLS)，第9902-9949位核苷酸编码T7终止子。

实施例2 pKG-GE4融合蛋白TrxA-His-EK-NLS-spCas9-NLS的诱导表达、纯化、酶切及pKG-GE4-Cas9蛋白的纯化

2.1 pKG-GE4融合蛋白TrxA-His-EK-NLS-spCas9-NLS的诱导表达

将鉴定正确的pKG-GE4质粒转化入大肠杆菌表达菌株BL21(DE3)(武汉灵淼生物公司)中，涂氨苄抗性(Amp^R)平板，培养过夜后，挑选单菌落，接种到含100μg/ml氨苄青霉素的LB液体培养基中，在37℃、200转/min条件下培养过夜，然后将过夜培养的菌液接种到500mLLB培养基中，接种比例为1:200，30℃、230转/min条件下培养至OD600达到1.0左右，加入终浓度为0.5mM的异丙基硫代半乳糖苷(IPTG)诱导BL21(DE3)菌株表达目的蛋白，然后25℃培养12小时进行目的蛋白的低温诱导可溶性表达。4℃，10000g离心15分钟收集菌体，用PBS洗涤菌体并离心收集菌体沉淀。

2.2 pKG-GE4融合蛋白TrxA-His-EK-NLS-spCas9-NLS的纯化

2.2.1融合蛋白的粗提

粗提缓冲液为20mM Tris-HCl pH 8.0，0.5M NaCl，5mM Imidazole，1mM PMSF。粗提方法：按每克湿菌加入10ml上述缓冲液，悬浮细菌，均质机破碎，1000par循环三次。然后4℃，15000g离心细菌悬液30min，收集上清，经0.22μm滤膜过滤用于下一步的亲和层析蛋白纯化。

2.2.2融合蛋白的纯化

采用Ni-NTA琼脂糖柱(金斯瑞，L00250/L00250-C)进行融合蛋白的纯化。首先用平衡液(20mM Tris-HCl pH 8.0，0.5M NaCl，5mM Imidazole)对Ni柱进行平衡，然后将上述过滤后的菌液上清上样到平衡后的Ni柱，再用平衡液洗涤Ni柱，然后用缓冲液(20mM Tris-HCl pH 8.0，0.5M NaCl，50mM Imidazole)洗去杂蛋白，最后用洗脱液(20mM Tris-HCl pH8.0，0.5M NaCl，500mM Imidazole)洗脱目的蛋白。

2.3 pKG-GE4融合蛋白(TrxA-His-EK-NLS-spCas9-NLS)的酶切与pKG-GE4-Cas9蛋白的纯化

使用Amicon超滤管(Sigma,UFC9100)将上述Ni柱纯化后的融合蛋白溶液浓缩至200μl并用25mM Tris-HCl pH 8.0稀释至1ml。然后将商品来源的带his标签的重组牛肠激酶(生工生物，C620031)加入到25mM Tris-HCl pH 8.0稀释后的融合蛋白液中，进行酶切反应。酶切用量为每50μg融合蛋白用肠激酶2个单位，酶切缓冲体系为25mM Tris-HCl pH8.0，酶切温度25℃，酶切时间16小时。

酶切结束后，将酶切后溶液与80μl的Ni-NTA树脂混匀，在室温下剧烈搅拌15min，然后7000g离心3min，上清与树脂分离，取上清即为酶切后去除TrxA-His的NLS-spCas9-NLS目的蛋白。酶切后的TrxA-His多肽片段及带His标签的肠激酶EK均结合在Ni-NTA树脂上，从而将上清中的Cas9蛋白分离纯化。最后将纯化后的Cas9蛋白(命名为pKG-GE4-Cas9蛋白)浓缩后用50％的甘油于-80℃保存。

实施例3 pKG-GE4-Cas9与gRNA最佳用量配比优化及与商品Cas9蛋白的切割效率比较

3.1 TTN基因靶点gRNA设计及转录

3.1.1使用Benchling对TTN基因进行gRNA靶点设计，经预筛确定选用以下两条gRNA靶点序列：

TTN-gRNA1：AGAGCACAGTCAGCCTGGCG(SEQ ID NO.3)

TTN-gRNA2：CTTCCAGAATTGGATCTCCG(SEQ ID NO.4)

3.1.2设计并合成gRNA分子不同区段序列(由基因合成公司合成)

T7-gRNA1：GGCTTGTCGGACTCTTCGCTATTACGCCAGCTGGCGAAGGGGGAT

T7-gRNA2：TGGGAAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAGCACATCCCCCTTCGCCAGCT7-gRNA3：ACGCCAGGGTTTTCCCAGTCACGACGTTAGGAAATTAATACGACTCACTATAGG

TTN-g1T7-gRNA4：TTCTAGCTCTAAAACCGCCAGGCTGACTGTGCTCTCCTATAGTGAGTCGTATTAATTTC

TTN-g1T7-gRNA5：CCTGGCGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTT

TTN-g2T7-gRNA4：TTCTAGCTCTAAAACCGGAGATCCAATTCTGGAAGCCTATAGTGAGTCGTATTAATTTC

TTN-g2T7-gRNA5：ATCTCCGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTT

T7-gRNA6：AAAAGCACCGACTCGGTGCCACTTTTTCAAGTTGATAACGGACTAGCCTTAT

3.1.3设计用于鉴定包含TTN gRNA靶点片段的引物

TTN-F55：TACGGAATTGGGGAGCCAGCGGA(SEQ ID NO.5)

TTN-R560：CAAAGTTAACTCTCTGTGTCT(SEQ ID NO.6)

3.1.4转录模板的扩增

TTN-T7-gRNA1转录模板序列如SEQ ID NO.7所示，是使用T7-gRNA1、T7-gRNA2、T7-gRNA3、TTN-g1T7-gRNA4、TTN-g1T7-gRNA5、T7-gRNA6共计6条合成引物采用重叠延伸PCR扩增技术制作的，该序列中含有T7启动子，可启动相关序列的转录。扩增后将目的条带切胶后按照FastPure Gel DNA Extraction Mini Kit(Vazyme，DC301)说明书进行操作，回收产物作为转录模板。

TTN-T7-gRNA2转录模板序列如SEQ ID NO.8所示，是使用T7-gRNA1、T7-gRNA2、T7-gRNA3、TTN-g2T7-gRNA4、TTN-g2T7-gRNA5、T7-gRNA6共计6条合成引物采用重叠延伸PCR扩增技术制作的，该序列中含有T7启动子，可启动相关序列的转录。扩增后将目的条带切胶后按照FastPure Gel DNA Extraction Mini Kit(Vazyme，DC301)说明书进行操作，回收产物作为转录模板。

3.1.5gRNA的转录

以步骤3.1.4制备的转录模板用Transcript Aid T7High Yield TranscriptionKit(Fermentas，K0441)进行体外gRNA的转录，然后用MEGA clearTMTranscription Clean-UpKit(Thermo，AM1908)进行所转录的gRNA的回收纯化，操作步骤按说明书进行，所获产物即为可用于细胞电转的gRNA。

3.2猪原代成纤维细胞制备

3.2.1取刚出生从江香猪耳组织0.5g，去除毛发及骨组织，75﹪酒精浸泡30-40s；

3.2.2用含5％P/S(Gibco Penicillin-Streptomycin)的PBS洗涤5次，不含P/S的PBS洗一次；

其中5％P/S的PBS配方为：5％P/S(Gibco Penicillin-Streptomycin)+95％PBS，5％、95％为体积百分比。

3.2.3用剪刀将组织剪碎，加入5mL 0.1％的胶原酶(Sigma)溶液，37℃摇床消化1h；

3.2.4 500g离心5min，去上清，将沉淀用1mL完全培养基重悬，铺入含10mL完全培养基并已用0.2％明胶(VWR)封盘的10cm细胞培养皿中。

其中，细胞完全培养基的配方为：15％胎牛血清(Gibco)+83％DMEM培养基(Gibco)+1％P/S(Gibco Penicillin-Streptomycin)+1％HEPES(Solarbio)，15％、83％、1％、1％为体积百分比。

3.2.5置于37℃，5％CO2(体积百分比)、5％O2(体积百分比)的恒温培养箱中进行培养；

3.2.6将细胞培养至长满皿底60％左右时使用0.25％(Gibco)的胰蛋白酶将细胞消化下来，然后加入完全培养基终止消化，将细胞悬液转入15mL离心管中，400g离心4min，弃去上清，得到细胞沉淀，以备下一步的细胞转染实验。

3.3gRNA与pKG-GE4-Cas9用量配比优化

3.3.1共转染分组情况

第一组：将转录的TTN-T7-gRNA1、TTN-T7-gRNA2和pKG-GE4-Cas9蛋白共转染猪原代成纤维细胞。配比：约10万个猪原代成纤维细胞：0.5μg TTN-T7-gRNA1：0.5μg TTN-T7-gRNA2：4μg pKG-GE4-Cas9。

第二组：将转录的TTN-T7-gRNA1、TTN-T7-gRNA2和pKG-GE4-Cas9蛋白共转染猪原代成纤维细胞。配比：约10万个猪原代成纤维细胞：0.75μg TTN-T7-gRNA1：0.75μg TTN-T7-gRNA2：4μg pKG-GE4-Cas9。

第三组：将转录的TTN-T7-gRNA1、TTN-T7-gRNA2和pKG-GE4-Cas9蛋白共转染猪原代成纤维细胞。配比：约10万个猪原代成纤维细胞：1μg TTN-T7-gRNA1：1μg TTN-T7-gRNA2：4μg pKG-GE4-Cas9。

第四组：将转录的TTN-T7-gRNA1、TTN-T7-gRNA2和pKG-GE4-Cas9蛋白共转染猪原代成纤维细胞。配比：约10万个猪原代成纤维细胞：1.25μg TTN-T7-gRNA1：1.25μg TTN-T7-gRNA2：4μg pKG-GE4-Cas9。

第五组：将转录的TTN-T7-gRNA1、TTN-T7-gRNA2共转染猪原代成纤维细胞。配比：约10万个猪原代成纤维细胞：1μg TTN-T7-gRNA1：1μg TTN-T7-gRNA2。

3.3.2共转染操作方法

使用哺乳动物细胞转染试剂盒(Neon kit)与Neon TM transfection system电转仪进行转染实验。

1)按照上述分组配制电转DNA，混匀过程中注意切勿产生气泡；

2)将3.2.6制备得到的细胞沉淀使用1ml PBS缓冲液(Solarbio)清洗，并转移到1.5ml离心管中，600g离心6min，弃去上清，使用11μL电转基本溶液Opti-MEM重悬细胞，重悬过程中要避免气泡的产生；

3)吸取10μL细胞悬液，加入至步骤1)中的电转DNA液中混匀，混匀过程中注意切勿产生气泡；

4)将试剂盒带有的电转杯放置于Neon TM transfection system电转仪杯槽内，加入3mLBuffer E；

5)用电转枪吸取10μL步骤3)得到的混合液，插入电击杯内，选择电转程序(1450V10ms 3 pulse)，电击转染后立即将电转枪中混合液转入到6孔板中，每孔含3mL的完全培养液(15％胎牛血清(Gibco)+83％DMEM培养基(Gibco)+1％P/S(Gibco Penicillin-Streptomycin)+1％HEPES(Solarbio))；

6)混匀后放置于37℃，5％CO2、5％O2的恒温培养箱中进行培养；

7)电转后12-18h换液，36-48h用0.25％(Gibco)的胰蛋白酶消化并收集细胞于1.5mL离心管中。

3.3.3基因编辑效率分析

提取3.3.2中收集的细胞基因组DNA，采用TTN-F55和TTN-R560组成的引物对进行PCR扩增，然后进行1％琼脂糖凝胶电泳(见图3)。505bp条带为野生型条带(WT)，254bp左右(条带505bp理论缺失251bp)为缺失突变条带(MT)。

基因缺失突变效率＝(MT灰度/MT条带bp数)/(WT灰度/WT条带bp数+MT灰度/MT条带bp数)×100％。据此计算，第一组基因缺失突变效率为19.9％，第二组基因缺失突变效率为39.9％，第三组基因缺失突变效率为79.9％，第四组基因缺失突变效率为44.3％。

结果表明，当两个gRNA与pKG-GE4-Cas9蛋白的质量比为1：1：4，实际用量为1μg：1μg：4μg时基因编辑效率最高，确定两个gRNA与pKG-GE4-Cas9蛋白的最适用量为1μg：1μg：4μg。

3.4 pKG-GE4-Cas9蛋白和商品Cas9蛋白的基因编辑效率对比

3.4.1共转染分组情况

Cas9-A组：将转录的TTN-T7-gRNA1、TTN-T7-gRNA2和商品Cas9-A蛋白共转染猪原代成纤维细胞。配比：约10万个猪原代成纤维细胞：1μg TTN-T7-gRNA1：1μg TTN-T7-gRNA2：4μg Cas9-A。

pKG-GE4组：将转录的TTN-T7-gRNA1、TTN-T7-gRNA2和pKG-GE4-Cas9蛋白共转染猪原代成纤维细胞。配比：约10万个猪原代成纤维细胞：1μg TTN-T7-gRNA1：1μg TTN-T7-gRNA2：4μg pKG-GE4-Cas9。

Cas9-B组：将转录的TTN-T7-gRNA1、TTN-T7-gRNA2和商品Cas9-B蛋白共转染猪原代成纤维细胞。配比：约10万个猪原代成纤维细胞：1μg TTN-T7-gRNA1：1μg TTN-T7-gRNA2：4μg Cas9-B。

Control组：将转录的TTN-T7-gRNA1、TTN-T7-gRNA2共转染猪原代成纤维细胞。配比：约10万个猪原代成纤维细胞：1μg TTN-T7-gRNA1：1μg TTN-T7-gRNA2。

3.4.2共转染操作方法

同本实施例中步骤3.3.2。

3.4.3基因编辑效率分析

提取3.4.2中收集的细胞基因组DNA，采用TTN-F55和TTN-R560组成的引物对进行PCR扩增，然后进行1％琼脂糖凝胶电泳(见图4)。505bp条带为野生型条带(WT)，254bp左右(条带505bp理论缺失251bp)为缺失突变条带(MT)。

基因缺失突变效率＝(MT灰度/MT条带bp数)/(WT灰度/WT条带bp数+MT灰度/MT条带bp数)×100％。据此计算，采用商品Cas9-A蛋白的基因缺失突变效率为28.5％，采用pKG-GE4-Cas9蛋白的基因缺失突变效率为85.6％，采用商品Cas9-B蛋白的基因缺失突变效率为16.6％。

结果表明，与采用商品的Cas9蛋白相比，采用本发明制备的pKG-GE4-Cas9蛋白使得基因编辑效率显著提高。

实施例4 TARDBP基因高效gRNA靶点的筛选

4.1基因组DNA的提取

使用Vazyme公司FastPure Cell/Tissue DNA Isolation Mini Kit(VazymeCat.DC102-01)分别进行18只猪(雄性A、B、C、D、E、F、G、H雌性1、2、3、4、5、6、7、8、9、10)耳组织的基因组DNA的柱式提取，使用NanoDrop进行定量，-20℃保存备用。

4.2 TARDBP基因预设点突变位点及邻近基因组序列保守性分析

4.2.1猪TARDBP基因信息

编码反式反应DNA结合蛋白43(TDP-43)；位于6号染色体；GeneID为100739753，Susscrofa。猪TARDBP基因编码的TDP-43蛋白氨基酸序列如SEQ ID NO.9所示。基因组DNA中，猪TARDBP基因具有6个外显子，而与人类DCM相关的TARDBP突变研究中Q331K和M337V均对应猪第6外显子(猪TARDBP基因第5至第6外显子，含第5内含子和部分3’UTR序列如SEQ ID NO.10所示)。

4.2.2 TARDBP基因预设点突变位点外显子及邻近基因组序列PCR扩增引物设计

根据查到的猪TARDBP基因组序列

(https://www.ncbi.nlm.nih.gov/nuccore/NC_010448.4？report＝genbank& from＝71213584&to＝71227707)，设计引物扩增前述18只猪基因组样品TARDBP基因外显子6的位点。

使用Oligo7进行引物设计，设计结果如下：

TARDBP-E6g-JDF53：CAGCGTACATATATCCAATGC(SEQ ID NO.11)

TARDBP-E6g-JDR541：TCTACATTCCCCAGCCCGAAG(SEQ ID NO.12)

TARDBP-E6g-JDF100：AGTTAGAAAGAAGTGGAAGAT(SEQ ID NO.13)

TARDBP-E6g-JDR488：CATTAAAACCACTGCCTGACCCT(SEQ ID NO.14)

4.2.3 TARDBP基因组PCR扩增引物筛选

使用猪(雌性1#)耳朵组织提取的基因组为模板，使用设计的两条上游引物和两条下游引物组合，Max酶(Vazyme公司货号：P505)进行PCR，产物进行1％琼脂糖凝胶电泳以筛选好的扩增引物，结果如图5，组1：TARDBP-E6g-JDF100/TARDBP-E6g-JDR488；组2：TARDBP-E6g-JDF53/TARDBP-E6g-JDR541；组3：TARDBP-E6g-JDF53/TARDBP-E6g-JDR488；组4：TARDBP-E6g-JDF100/TARDBP-E6g-JDR541，优选TARDBP-E6g-JDF53/TARDBP-E6g-JDR541引物对进行目的片段扩增。

4.2.4 18只猪TARDBP基因片段PCR扩增

分别以18只猪的基因组DNA为模板(雄性A、B、C、D、E、F、G、H雌性1、2、3、4、5、6、7、8、9、10)，采用引物TARDBP-E6g-JDF53/TARDBP-E6g-JDR541及Max酶进行TARDBP基因组片段的扩增，产物进行1％琼脂糖凝胶电泳，结果如图6。

4.2.5 TARDBP基因序列保守性分析

将上述PCR扩增产物使用扩增引物进行测序(通用生物公司测序)，将测序结果与公共数据库中的TARDBP基因序列进行比对分析，选择18只猪中共有的保守区进行gRNA靶点的设计。

4.3 gRNA靶点设计及表达载体构建

4.3.1使用Benchling进行靶点gRNA设计

设计靶点已避开可能的突变位点，使用Benchling(https://benchling.com/)进行靶点gRNA设计。

TARDBP基因敲除gRNA靶点设计如下：

TARDBP-E6-gRNA1：GATGATGGCTGCAGCCCAGG

TARDBP-E6-gRNA2：GCGGCTCTGCAGAGCAGCTG(SEQ ID NO15)

TARDBP-E6-gRNA3：GCCAGTCAGCAGAACCAGTC(SEQ ID NO.16)

TARDBP-E6-gRNA4：TATTACCCGATGGGCCTGAC

TARDBP-E6-gRNA5：CAGAGCAGCTGGGGTATGAT

TARDBP-E6-gRNA6：GCCTGACTGGTTCTGCTGAC

合成的TARDBP基因共6个靶点的插入序列互补DNA Oligo如下：

TARDBP-E6-gRNA1-S：caccGATGATGGCTGCAGCCCAGG

TARDBP-E6-gRNA1-A：aaacCCTGGGCTGCAGCCATCATC

TARDBP-E6-gRNA2-S：caccGCGGCTCTGCAGAGCAGCTG(SEQ ID NO.17)

TARDBP-E6-gRNA2-A：aaacCAGCTGCTCTGCAGAGCCGC(SEQ ID NO.18)

TARDBP-E6-gRNA3-S：caccGCCAGTCAGCAGAACCAGTC(SEQ ID NO.19)

TARDBP-E6-gRNA3-A：aaacGACTGGTTCTGCTGACTGGC(SEQ ID NO.20)

TARDBP-E6-gRNA4-S：caccgTATTACCCGATGGGCCTGAC

TARDBP-E6-gRNA4-A：aaacGTCAGGCCCATCGGGTAATAc

TARDBP-E6-gRNA5-S：caccgCAGAGCAGCTGGGGTATGAT

TARDBP-E6-gRNA5-A：aaacATCATACCCCAGCTGCTCTGc

TARDBP-E6-gRNA6-S：caccGCCTGACTGGTTCTGCTGAC

TARDBP-E6-gRNA6-A：aaacGTCAGCAGAACCAGTCAGGC

TARDBP-E6-gRNA1-S、TARDBP-E6-gRNA1-A、TARDBP-E6-gRNA2-S、TARDBP-E6-gRNA2-A、TARDBP-E6-gRNA3-S、TARDBP-E6-gRNA3-A、TARDBP-E6-gRNA4-S、TARDBP-E6-gRNA4-A、TARDBP-E6-gRNA5-S、TARDBP-E6-gRNA5-A、TARDBP-E6-gRNA6-S、TARDBP-E6-gRNA6-A均为单链DNA分子。

4.3.2gRNA载体构建

1)将合成的TARDBP-E6-gRNA1-S和TARDBP-E6-gRNA1-A混合并进行退火，得到具有粘性末端的双链DNA分子。将具有粘性末端的双链DNA分子和载体骨架pKG-U6gRNA(构建方法详见CN112442515A具体实施方式1.2构建MSTN和FNDC5基因gRNA靶点载体来检测所改造的cas9载体的效率)连接，得到质粒pKG-U6gRNA(TARDBP-E6-gRNA1)。该质粒将会在所转染的细胞中转录出与TARDBP-E6-gRNA1序列所对应的gRNA。

2)将合成的TARDBP-E6-gRNA2-S和TARDBP-E6-gRNA2-A混合并进行退火，得到具有粘性末端的双链DNA分子。将具有粘性末端的双链DNA分子和载体骨架pKG-U6gRNA连接，得到质粒pKG-U6gRNA(TARDBP-E6-gRNA2)。该质粒将会在所转染的细胞中转录出与TARDBP-E6-gRNA2序列所对应的的gRNA。

3)将合成的TARDBP-E6-gRNA3-S和TARDBP-E6-gRNA3-A混合并进行退火，得到具有粘性末端的双链DNA分子。将具有粘性末端的双链DNA分子和载体骨架pKG-U6gRNA连接，得到质粒pKG-U6gRNA(TARDBP-E6-gRNA3)。该质粒将会在所转染的细胞中转录出与TARDBP-E6-gRNA3序列所对应的gRNA。

4)将合成的TARDBP-E6-gRNA4-S和TARDBP-E6-gRNA4-A混合并进行退火，得到具有粘性末端的双链DNA分子。将具有粘性末端的双链DNA分子和载体骨架pKG-U6gRNA连接，得到质粒pKG-U6gRNA(TARDBP-E6-gRNA4)。该质粒将会在所转染的细胞中转录出与TARDBP-E6-gRNA4序列所对应的gRNA。

5)将合成的TARDBP-E6-gRNA5-S和TARDBP-E6-gRNA5-A混合并进行退火，得到具有粘性末端的双链DNA分子。将具有粘性末端的双链DNA分子和载体骨架pKG-U6gRNA连接，得到质粒pKG-U6gRNA(TARDBP-E6-gRNA5)。该质粒将会在所转染的细胞中转录出与TARDBP-E6-gRNA5序列所对应的gRNA。

6)将合成的TARDBP-E6-gRNA6-S和TARDBP-E6-gRNA6-A混合并进行退火，得到具有粘性末端的双链DNA分子。将具有粘性末端的双链DNA分子和载体骨架pKG-U6gRNA连接，得到质粒pKG-U6gRNA(TARDBP-E6-gRNA6)。该质粒将会在所转染的细胞中转录出与TARDBP-E6-gRNA6序列所对应的gRNA。

4.3.3 gRNA载体鉴定

从LB平板上挑取单克隆置入加有相应抗生素的LB培养液内，37℃恒温摇床内培养12-16h后小提质粒送通用公司测序，经序列比对确认pKG-U6gRNA(TARDBP-E6-gRNA1)、pKG-U6gRNA(TARDBP-E6-gRNA2)、pKG-U6gRNA(TARDBP-E6-gRNA3)、pKG-U6gRNA(TARDBP-E6-gRNA4)、pKG-U6gRNA(TARDBP-E6-gRNA5)和pKG-U6gRNA(TARDBP-E6-gRNA6)载体均构建成功。

4.4猪原代成纤维细胞制备

同实施例3中3.2。

4.5使用构建好的gRNA质粒、Cas9质粒(pKG-GE3)共转染猪原代成纤维细胞。

4.5.1共转染分组情况

第一组：将质粒pKG-U6gRNA(TARDBP-E6-gRNA1)、质粒pKG-GE3(构建方法见CN112442515A中具体实施方式1.1Cas9高效表达载体的构建)共转染猪原代成纤维细胞。配比：约20万个猪原代成纤维细胞：0.92μg质粒pKG-U6gRNA(TARDBP-E6-gRNA1)：1.08μg质粒pKG-GE3。

第二组：将质粒pKG-U6gRNA(TARDBP-E6-gRNA2)、质粒pKG-GE3共转染猪原代成纤维细胞。配比：约20万个猪原代成纤维细胞：0.92μg质粒pKG-U6gRNA(TARDBP-E6-gRNA2)：1.08μg质粒pKG-GE3。

第三组：将质粒pKG-U6gRNA(TARDBP-E6-gRNA3)、质粒pKG-GE3共转染猪原代成纤维细胞。配比：约20万个猪原代成纤维细胞：0.92μg质粒pKG-U6gRNA(TARDBP-E6-gRNA3)：1.08μg质粒pKG-GE3。

第四组：将质粒pKG-U6gRNA(TARDBP-E6-gRNA4)、质粒pKG-GE3共转染猪原代成纤维细胞。配比：约20万个猪原代成纤维细胞：0.92μg质粒pKG-U6gRNA(TARDBP-E6-gRNA4)：1.08μg质粒pKG-GE3。

第五组：将质粒pKG-U6gRNA(TARDBP-E6-gRNA5)、质粒pKG-GE3共转染猪原代成纤维细胞。配比：约20万个猪原代成纤维细胞：0.92μg质粒pKG-U6gRNA(TARDBP-E6-gRNA5)：1.08μg质粒pKG-GE3。

第六组：将质粒pKG-U6gRNA(TARDBP-E6-gRNA6)、质粒pKG-GE3共转染猪原代成纤维细胞。配比：约20万个猪原代成纤维细胞：0.92μg质粒pKG-U6gRNA(TARDBP-E6-gRNA6)：1.08μg质粒pKG-GE3。

第七组：猪原代成纤维细胞，同等电转参数不加质粒进行电转操作。

4.5.2共转染操作方法

同实施例3中3.3.2。

4.6 TARDBP基因不同靶点的编辑效率分析

4.6.1分别向步骤4.5.2中收集在1.5mL离心管中的5组细胞加入10μL KAPA2G裂解液裂解细胞，得到释放出基因组DNA的细胞裂解液

KAPA2G裂解液配制体系如下：

10×extract Buffer 1μL

Enzyme 0.2μL

ddH2O 8.8μL

75℃15min—95℃5min—4℃，反应结束后细胞裂解液于-20℃保存；

4.6.2采用前述针对TARDBP基因E4的引物对TARDBP-E6g-JDF53/TARDBP-E6g-JDR541，并以上述细胞裂解液为DNA模板，进行PCR扩增TARDBP基因靶点区域，检测细胞靶基因突变情况，目的PCR产物长度为488bp；

4.6.3使用常规PCR反应扩增TARDBP靶点基因；

4.6.4TARDBP基因不同靶点的编辑效率分析

将PCR反应产物进行1％琼脂糖凝胶电泳，如图7，将目的产物切胶回收后送测序公司进行测序，然后将测序结果利用网页版Synthego ICE工具分析测序峰图得出TARDBP-E6-gRNA1、TARDBP-E6-gRNA2、TARDBP-E6-gRNA3、TARDBP-E6-gRNA4、TARDBP-E6-gRNA5、TARDBP-E6-gRNA6不同靶点的编辑效率依次为30％、63％、55％、9％、3％、15％。结果表明，TARDBP-E6-gRNA2和TARDBP-E6-gRNA3编辑效率较高。

实施例5制备TARDBP基因点突变的从江香猪单细胞克隆

5.1 TARDBP基因高效gRNA靶点模板制备及转录

5.1.1选用实施例4中筛到的两个高效gRNA靶点

TARDBP-E6-gRNA2：GCGGCTCTGCAGAGCAGCTG(SEQ ID NO.15)

TARDBP-E6-gRNA3：GCCAGTCAGCAGAACCAGTC(SEQ ID NO.16)

5.1.2设计并合成靶点gRNA转录模板的不同区段序列(由基因合成公司合成)

T7-gRNA1、T7-gRNA2、T7-gRNA3、T7-gRNA6序列同实施例3中步骤3.1.2；

TARDBP-g2T7-gRNA4：

TTCTAGCTCTAAAACCAGCTGCTCTGCAGAGCCGCCCTATAGTGAGTCGTATTAATTTC(SEQ IDNO.21)

TARDBP-g2T7-gRNA5：

GCAGCTGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTT(SEQ IDNO.22)

TARDBP-g3T7-gRNA4：

TTCTAGCTCTAAAACGACTGGTTCTGCTGACTGGCCCTATAGTGAGTCGTATTAATTTC(SEQ IDNO.23)

TARDBP-g3T7-gRNA5：

ACCAGTCGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTT(SEQ IDNO.24)

5.1.3转录模板的扩增

TARDBP-T7-gRNA2转录模板序列如SEQ ID NO.25所示，是使用T7-gRNA1、T7-gRNA2、T7-gRNA3、TARDBP-g2T7-gRNA4、TARDBP-g2T7-gRNA5、T7-gRNA6共计6条合成引物采用重叠延伸PCR扩增技术制作的，该序列中含有T7启动子，可启动相关序列的转录。扩增结果如图8所示，将目的条带切胶后按照Fast Pure Gel DNA Extraction Mini Kit(Vazyme，DC301)说明书进行操作，回收产物作为转录模板。

TARDBP-T7-gRNA3转录模板序列如SEQ ID NO.26所示，是使用T7-gRNA1、T7-gRNA2、T7-gRNA3、TARDBP-g3T7-gRNA4、TARDBP-g3T7-gRNA5、T7-gRNA6共计6条合成引物采用重叠延伸PCR扩增技术制作的，该序列中含有T7启动子，可启动相关序列的转录。扩增结果如图8所示，将目的条带切胶后按照Fast Pure Gel DNA Extraction Mini Kit(Vazyme，DC301)说明书进行操作，回收产物作为转录模板。

5.1.4高效gRNA的转录

以步骤5.1.3制备的转录模板用Transcript Aid T7High Yield TranscriptionKit(Fermentas，K0441)进行体外gRNA的转录，然后用MEGA clear^TM Transcription Clean-Up Kit(Thermo，AM1908)进行所转录的gRNA的回收纯化，操作步骤按说明书进行，所获产物即为可用于细胞电转的gRNA。

5.2合成含有TARDBP突变位点的单链Donor DNA

合成对应人TARDBP Q331K和M337V氨基酸突变的单链DNA作为Donor DNA，该单链DNA除靶位点突变外还含有TARDBP-E6-gRNA2和TARDBP-E6-gRNA3靶点PAM邻近的3’端序列同义突变，命名为TARDBP-mutant-ss189，序列如SEQ ID NO.27所示。

5.3制备猪原代成纤维细胞

同实施例3中3.2。

5.4转染猪原代成纤维细胞

使用转录的TARDBP-T7-gRNA2和TARDBP-T7-gRNA3、pKG-GE4-Cas9蛋白、TARDBP-mutant-ss189 Donor DNA共转染猪原代成纤维细胞。配比：约10万个猪原代成纤维细胞：1μg TARDBP-T7-gRNA2：1μg TARDBP-E6-gRNA3：4μg pKG-GE4-Cas9蛋白：2μgTARDBP-mutant-ss189。共转染操作方法同实施例3中3.3.2。

5.5筛选TARDBP-mutant-ss189 Donor DNA发生同源重组(HDR)的单细胞克隆株

5.5.1将步骤5.4所得电转48h的群体细胞，使用胰蛋白酶进行消化，完全培养基中和，500g离心5min，去上清，将沉淀用200μL完全培养基重悬，并适当稀释，用口吸管挑取单细胞转移到每孔含100μL完全培养基的96孔板中，每孔放置一个细胞。

5.5.2 37℃、5％CO2、5％O2的恒温培养箱中进行培养，每2～3天换一次细胞培养基，期间用显微镜观察每孔细胞生长情况，排除无细胞及非单细胞克隆的孔；

5.5.3待96孔板的孔中细胞长满孔底，使用胰蛋白酶消化并收集细胞，其中2/3细胞接种到含有完全培养基的6孔板中，剩余的1/3细胞收集在1.5mL离心管中备后续基因型测定；

5.5.4待6孔板长至80％汇合度时使用0.25％(Gibco)的胰蛋白酶消化并收集细胞，使用细胞冻存液(90％完全培养基+10％DMSO，体积比)将细胞冻存。

5.6单细胞克隆的基因型鉴定

5.6.1在步骤5.5.3收集在1.5mL离心管中得到的细胞中加入10μL KAPA2G裂解液裂解细胞，得到释放出基因组DNA的细胞裂解液。

KAPA2G裂解液配制体系如下：

10×extract Buffer 1μL

Enzyme 0.2μL

ddH2O 8.8μL

5.6.2采用前述针对TARDBP基因E6的引物对TARDBP-E6g-JDF53/TARDBP-E6g-JDR541，并以上述细胞裂解液为DNA模板，进行PCR扩增TARDBP基因靶点区域，检测单细胞克隆的靶基因突变情况，目的PCR产物长度为488bp；

5.6.3将PCR产物进行电泳，电泳结果如图9，泳道编号与单细胞克隆编号一致。回收PCR扩增产物并测序。

5.6.4将测序结果与TARDBP靶标位点突变序列信息进行比对，从而判断该单细胞克隆株是否为靶标位点成功突变株。

编号为1、5、16、26、33、39的单细胞克隆的基因型为野生型。编号为2、7、11、12、14、17、19、23、24、27、29、30、32、34、36、37、40的单细胞克隆的基因型为杂合突变型。编号为4、6、8、13、18、20、21、28、35、38的单细胞克隆的基因型为双等位基因不同变异的纯合突变型。编号为3、9、10、15、22、25、31的单细胞克隆的基因型为双等位基因相同变异的纯合突变型。其中，12、14、19、32的单细胞克隆为靶标位点点突变的杂合突变型，3、10、31的单细胞克隆为靶标位点点突变的纯合突变型。得到TARDBP基因编辑单细胞克隆的比率为85％，得到靶标位点点突变的单细胞克隆的比率为22.5％。

示例性的测序比对结果如图10至图15，其中图10是克隆号为TARDBP-ss189-1的正向测序与靶标位点突变序列的比对结果，判定为野生型；图11是克隆号为TARDBP-ss189-2的正向测序与靶标位点突变序列的比对结果，判定为杂合突变型；图12是克隆号为TARDBP-ss189-6的正向测序和反向测序同时与靶标位点突变序列的比对结果，为双等位基因不同变异的纯合突变型；图13是克隆号为TARDBP-ss189-9的正向测序与靶标位点突变序列的比对结果，为双等位基因相同变异的纯合突变型；图14是克隆号为TARDBP-ss189-12的正向测序与靶标位点突变序列的比对结果，为靶标位点点突变的杂合突变型；图15是克隆号为TARDBP-ss189-3的正向测序与靶标位点突变序列的比对结果，为靶标位点点突变的纯合突变型。

通过具体序列的分析，TARDBP各单细胞克隆基因型如表1：

表1 TARDBP基因点突变单细胞克隆的基因型测定结果

以上对本发明进行了详述。对于本领域技术人员来说，在不脱离本发明的宗旨和范围，以及无需进行不必要的实验情况下，可在等同参数、浓度和条件下，在较宽范围内实施本发明。虽然本发明给出了特殊的实施例，应该理解为，可以对本发明作进一步的改进。总之，按本发明的原理，本申请欲包括任何变更、用途或对本发明的改进，包括脱离了本申请中已公开范围，而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围，可以进行一些基本特征的应用。

序列表

<110> 南京启真基因工程有限公司

<120> 用于构建TARDBP基因突变的ALS模型猪核移植供体细胞的基因编辑系统及其应用

<160> 27

<170> SIPOSequenceListing 1.0

<210> 1

<211> 9974

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60

cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120

ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180

gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240

acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300

ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360

ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420

acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480

tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540

tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat 600

gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt 660

ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg 720

agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga 780

agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg 840

tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt 900

tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg 960

cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg 1020

aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga 1080

tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc 1140

tgcagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc 1200

ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc 1260

ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg 1320

cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac 1380

gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc 1440

actgattaag cattggtaac tgtcagacca agtttactca tatatacttt agattgattt 1500

aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac 1560

caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa 1620

aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc 1680

accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt 1740

aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg 1800

ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc 1860

agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt 1920

accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga 1980

gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct 2040

tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg 2100

cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca 2160

cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa 2220

cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt 2280

ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga 2340

taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga 2400

gcgcctgatg cggtattttc tccttacgca tctgtgcggt atttcacacc gcatatatgg 2460

tgcactctca gtacaatctg ctctgatgcc gcatagttaa gccagtatac actccgctat 2520

cgctacgtga ctgggtcatg gctgcgcccc gacacccgcc aacacccgct gacgcgccct 2580

gacgggcttg tctgctcccg gcatccgctt acagacaagc tgtgaccgtc tccgggagct 2640

gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc gaggcagctg cggtaaagct 2700

catcagcgtg gtcgtgaagc gattcacaga tgtctgcctg ttcatccgcg tccagctcgt 2760

tgagtttctc cagaagcgtt aatgtctggc ttctgataaa gcgggccatg ttaagggcgg 2820

ttttttcctg tttggtcact gatgcctccg tgtaaggggg atttctgttc atgggggtaa 2880

tgataccgat gaaacgagag aggatgctca cgatacgggt tactgatgat gaacatgccc 2940

ggttactgga acgttgtgag ggtaaacaac tggcggtatg gatgcggcgg gaccagagaa 3000

aaatcactca gggtcaatgc cagcgcttcg ttaatacaga tgtaggtgtt ccacagggta 3060

gccagcagca tcctgcgatg cagatccgga acataatggt gcagggcgct gacttccgcg 3120

tttccagact ttacgaaaca cggaaaccga agaccattca tgttgttgct caggtcgcag 3180

acgttttgca gcagcagtcg cttcacgttc gctcgcgtat cggtgattca ttctgctaac 3240

cagtaaggca accccgccag cctagccggg tcctcaacga caggagcacg atcatgcgca 3300

cccgtggggc cgccatgccg gcgataatgg cctgcttctc gccgaaacgt ttggtggcgg 3360

gaccagtgac gaaggcttga gcgagggcgt gcaagattcc gaataccgca agcgacaggc 3420

cgatcatcgt cgcgctccag cgaaagcggt cctcgccgaa aatgacccag agcgctgccg 3480

gcacctgtcc tacgagttgc atgataaaga agacagtcat aagtgcggcg acgatagtca 3540

tgccccgcgc ccaccggaag gagctgactg ggttgaaggc tctcaagggc atcggtcgag 3600

atcccggtgc ctaatgagtg agctaactta cattaattgc gttgcgctca ctgcccgctt 3660

tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag 3720

gcggtttgcg tattgggcgc cagggtggtt tttcttttca ccagtgagac gggcaacagc 3780

tgattgccct tcaccgcctg gccctgagag agttgcagca agcggtccac gctggtttgc 3840

cccagcaggc gaaaatcctg tttgatggtg gttaacggcg ggatataaca tgagctgtct 3900

tcggtatcgt cgtatcccac taccgagatg tccgcaccaa cgcgcagccc ggactcggta 3960

atggcgcgca ttgcgcccag cgccatctga tcgttggcaa ccagcatcgc agtgggaacg 4020

atgccctcat tcagcatttg catggtttgt tgaaaaccgg acatggcact ccagtcgcct 4080

tcccgttccg ctatcggctg aatttgattg cgagtgagat atttatgcca gccagccaga 4140

cgcagacgcg ccgagacaga acttaatggg cccgctaaca gcgcgatttg ctggtgaccc 4200

aatgcgacca gatgctccac gcccagtcgc gtaccgtctt catgggagaa aataatactg 4260

ttgatgggtg tctggtcaga gacatcaaga aataacgccg gaacattagt gcaggcagct 4320

tccacagcaa tggcatcctg gtcatccagc ggatagttaa tgatcagccc actgacgcgt 4380

tgcgcgagaa gattgtgcac cgccgcttta caggcttcga cgccgcttcg ttctaccatc 4440

gacaccacca cgctggcacc cagttgatcg gcgcgagatt taatcgccgc gacaatttgc 4500

gacggcgcgt gcagggccag actggaggtg gcaacgccaa tcagcaacga ctgtttgccc 4560

gccagttgtt gtgccacgcg gttgggaatg taattcagct ccgccatcgc cgcttccact 4620

ttttcccgcg ttttcgcaga aacgtggctg gcctggttca ccacgcggga aacggtctga 4680

taagagacac cggcatactc tgcgacatcg tataacgtta ctggtttcac attcaccacc 4740

ctgaattgac tctcttccgg gcgctatcat gccataccgc gaaaggtttt gcgccattcg 4800

atggtgtccg ggatctcgac gctctccctt atgcgactcc tgcattagga agcagcccag 4860

tagtaggttg aggccgttga gcaccgccgc cgcaaggaat ggtgcatgca aggagatggc 4920

gcccaacagt cccccggcca cggggcctgc caccataccc acgccgaaac aagcgctcat 4980

gagcccgaag tggcgagccc gatcttcccc atcggtgatg tcggcgatat aggcgccagc 5040

aaccgcacct gtggcgccgg tgatgccggc cacgatgcgt ccggcgtaga ggatcgagat 5100

cgatctcgat cccgcgaaat taatacgact cactataggg gaattgtgag cggataacaa 5160

ttcccctcta gaaataattt tgtttaactt taagaaggag atatacatgt gaaacaaagc 5220

actattgcac tggcactctt accgttactg tttacccctg tgacaaaagc catgagcgat 5280

aaaattattc acctgactga cgacagtttt gacacggatg tactcaaagc ggacggggcg 5340

atcctcgtcg atttctgggc agagtggtgc ggtccgtgca aaatgatcgc cccgattctg 5400

gatgaaatcg ctgacgaata tcagggcaaa ctgaccgttg caaaactgaa catcgatcaa 5460

aaccctggca ctgcgccgaa atatggcatc cgtggtatcc cgactctgct gctgttcaaa 5520

aacggtgaag tggcggcaac caaagtgggt gcactgtcta aaggtcagtt gaaagagttc 5580

ctcgacgcta acctggccgg ttctggttct ggccatatgc accatcatca tcatcatgac 5640

gatgacgata agatgcccaa aaagaaacga aaggtgggta tccacggagt cccagcagcc 5700

gacaaaaaat atagcatcgg cctggacatc ggtaccaaca gcgttggctg ggcagtgatc 5760

actgatgaat acaaagttcc atccaaaaaa tttaaagtac tgggcaacac cgaccgtcac 5820

tctatcaaaa aaaacctgat tggtgctctg ctgtttgaca gcggcgaaac tgctgaggct 5880

acccgtctga aacgtacggc tcgccgtcgc tacactcgtc gtaaaaaccg catctgttat 5940

ctgcaggaaa ttttctctaa cgaaatggca aaagttgatg atagcttctt tcatcgtctg 6000

gaagagagct tcctggtgga agaagataaa aaacacgaac gtcacccgat tttcggtaac 6060

attgtggatg aggttgccta ccacgagaaa tatccgacca tctaccatct gcgtaaaaaa 6120

ctggttgata gcactgacaa agcggatctg cgtctgatct acctggctct ggcacacatg 6180

atcaaattcc gtggtcactt cctgatcgaa ggtgatctga accctgataa ctccgacgtg 6240

gacaaactgt tcattcagct ggttcagacc tataaccagc tgttcgaaga aaacccgatc 6300

aacgcgtccg gtgtagacgc taaggcaatt ctgtctgcgc gtctgtctaa gtctcgtcgt 6360

ctggaaaacc tgattgcgca actgccaggt gaaaagaaaa acggcctgtt cggcaatctg 6420

atcgccctgt ccctgggtct gactccgaac tttaaatcca actttgacct ggcggaagat 6480

gccaagctgc agctgagcaa agatacctat gacgatgacc tggataacct gctggcacag 6540

atcggtgatc agtatgccga tctgttcctg gccgcgaaaa acctgtctga tgcgattctg 6600

ctgtctgata tcctgcgcgt taacactgaa attactaaag cgccgctgag cgcatccatg 6660

attaaacgtt acgatgaaca ccaccaggat ctgaccctgc tgaaagcgct ggtgcgtcag 6720

cagctgccgg aaaaatacaa ggagatcttc ttcgaccaga gcaaaaacgg ttacgcgggc 6780

tacattgatg gtggtgcatc tcaggaggaa ttctacaaat tcattaaacc gatcctggaa 6840

aaaatggatg gtactgaaga gctgctggtt aaactgaatc gtgaagatct gctgcgcaaa 6900

cagcgtacct tcgataacgg ttccatcccg catcagattc atctgggcga actgcacgct 6960

atcctgcgcc gtcaggaaga cttttatccg ttcctgaaag acaaccgtga gaaaattgaa 7020

aaaatcctga ccttccgtat tccgtactat gtaggtccgc tggcgcgtgg taactcccgt 7080

ttcgcttgga tgacccgcaa aagcgaagaa accatcaccc cgtggaattt cgaagaagtc 7140

gttgacaaag gcgcgtccgc gcagtctttc atcgaacgca tgacgaactt cgacaaaaac 7200

ctgccgaacg agaaagtgct gccgaaacac tctctgctgt acgagtactt cactgtgtac 7260

aacgaactga ccaaagtgaa atacgtcacc gaaggtatgc gtaaaccggc attcctgtcc 7320

ggtgagcaaa aaaaagcaat cgtggatctg ctgttcaaaa ccaaccgtaa agtaaccgtg 7380

aaacagctga aggaagacta tttcaagaaa atcgaatgtt ttgattctgt tgaaatctcc 7440

ggcgtggaag atcgcttcaa tgcgtccctg ggtacgtatc acgacctgct gaaaattatc 7500

aaagacaaag attttctgga caacgaggaa aacgaagaca tcctggagga tattgtactg 7560

accctgaccc tgttcgaaga ccgtgagatg atcgaagaac gcctgaaaac ctacgcccac 7620

ctgttcgatg acaaggtaat gaagcagctg aaacgtcgtc gttataccgg ctggggtcgt 7680

ctgtcccgta aactgatcaa tggcatccgt gataaacagt ctggcaaaac catcctggac 7740

ttcctgaaat ccgacggttt cgcgaatcgt aacttcatgc aactgattca tgacgattct 7800

ctgactttca aagaagacat ccagaaagca caggtttccg gccagggtga ctctctgcac 7860

gagcacattg ccaatctggc tggttctccg gctattaaaa agggtattct gcagactgtg 7920

aaagtagttg atgagctggt caaagtaatg ggccgtcaca agccggaaaa cattgtgatc 7980

gaaatggcac gtgaaaacca gacgacccag aaaggtcaga aaaactctcg tgaacgcatg 8040

aaacgtatcg aagaaggcat caaagaactg ggctctcaga tcctgaagga acaccctgta 8100

gaaaataccc agctgcagaa cgaaaagctg tatctgtatt acctgcagaa cggccgcgat 8160

atgtatgtgg accaggaact ggatatcaac cgcctgtccg attacgatgt agatcacatc 8220

gtgccgcaaa gcttcctgaa agacgacagc attgacaaca aagtactgac ccgttctgat 8280

aagaaccgtg gcaaatccga taacgtcccg tctgaagaag ttgttaaaaa aatgaaaaac 8340

tattggcgtc agctgctgaa cgcgaaactg atcacccagc gtaagttcga caatctgact 8400

aaagctgagc gcggtggtct gtccgaactg gataaagcgg gttttatcaa acgccagctg 8460

gttgaaaccc gtcagatcac gaagcacgtt gcgcagattc tggactctcg tatgaacacc 8520

aaatacgacg aaaacgacaa actgatccgc gaggttaagg ttatcaccct gaaaagcaaa 8580

ctggtatccg attttcgtaa agactttcag ttctacaaag tgcgcgaaat taacaactat 8640

caccacgctc acgatgcata tctgaatgca gttgttggca cggcgctgat caaaaagtat 8700

ccgaaactgg aatctgaatt cgtatacggc gattacaaag tgtatgacgt tcgtaagatg 8760

atcgcaaaat ccgagcagga aattggtaag gcgacggcga aatacttctt ttattccaat 8820

attatgaact ttttcaaaac cgaaatcacc ctggcgaatg gtgaaattcg taaacgcccg 8880

ctgatcgaaa ccaacggtga aactggtgaa atcgtttggg acaaaggccg cgacttcgcg 8940

accgtgcgta aagttctgtc tatgccgcaa gtgaacatcg tcaagaagac cgaagtacaa 9000

accggcggtt ttagcaaaga gagcattctg ccaaaacgta actccgacaa actgatcgcg 9060

cgcaagaaag actgggatcc gaaaaaatac ggtggtttcg attctccaac cgttgcttat 9120

tccgttctgg tggtagccaa agttgagaaa ggtaaaagca aaaaactgaa atccgtaaag 9180

gaactgctgg gtattactat catggagcgt agctccttcg aaaaaaaccc gatcgatttt 9240

ctggaagcga aaggctataa agaagtcaaa aaggacctga tcatcaaact gccaaaatac 9300

agcctgttcg agctggaaaa cggccgtaaa cgtatgctgg catctgcggg cgaactgcag 9360

aaaggcaacg agctggctct gccgtccaaa tacgtgaact ttctgtacct ggcctctcac 9420

tacgaaaaac tgaaaggttc cccggaagac aacgaacaga aacagctgtt cgtagagcag 9480

cacaaacact acctggacga gatcatcgaa cagatttctg aattttctaa acgtgtgatt 9540

ctggctgatg cgaatctgga taaagttctg tctgcctata acaagcatcg tgacaaaccg 9600

atccgcgaac aggctgagaa catcatccac ctgttcactc tgactaacct gggcgcgcca 9660

gcggctttca agtactttga taccaccatt gaccgcaagc gttacacctc cactaaagaa 9720

gtgctggacg cgactctgat ccaccagtcc atcaccggtc tgtacgagac ccgtatcgat 9780

ctgagccagc tgggcggtga caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa 9840

aagaaaaagt gacaaagccc gaaaggaagc tgagttggct gctgccaccg ctgagcaata 9900

actagcataa ccccttgggg cctctaaacg ggtcttgagg ggttttttgc tgaaaggagg 9960

aactatatcc ggat 9974

<210> 2

<211> 4694

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

ttaactttaa gaaggagata tacatgtgaa acaaagcact attgcactgg cactcttacc 60

gttactgttt acccctgtga caaaagccat gagcgataaa attattcacc tgactgacga 120

cagttttgac acggatgtac tcaaagcgga cggggcgatc ctcgtcgatt tctgggcaga 180

gtggtgcggt ccgtgcaaaa tgatcgcccc gattctggat gaaatcgctg acgaatatca 240

gggcaaactg accgttgcaa aactgaacat cgatcaaaac cctggcactg cgccgaaata 300

tggcatccgt ggtatcccga ctctgctgct gttcaaaaac ggtgaagtgg cggcaaccaa 360

agtgggtgca ctgtctaaag gtcagttgaa agagttcctc gacgctaacc tggccggttc 420

tggttctggc catatgcacc atcatcatca tcatgacgat gacgataaga tgcccaaaaa 480

gaaacgaaag gtgggtatcc acggagtccc agcagccgac aaaaaatata gcatcggcct 540

ggacatcggt accaacagcg ttggctgggc agtgatcact gatgaataca aagttccatc 600

caaaaaattt aaagtactgg gcaacaccga ccgtcactct atcaaaaaaa acctgattgg 660

tgctctgctg tttgacagcg gcgaaactgc tgaggctacc cgtctgaaac gtacggctcg 720

ccgtcgctac actcgtcgta aaaaccgcat ctgttatctg caggaaattt tctctaacga 780

aatggcaaaa gttgatgata gcttctttca tcgtctggaa gagagcttcc tggtggaaga 840

agataaaaaa cacgaacgtc acccgatttt cggtaacatt gtggatgagg ttgcctacca 900

cgagaaatat ccgaccatct accatctgcg taaaaaactg gttgatagca ctgacaaagc 960

ggatctgcgt ctgatctacc tggctctggc acacatgatc aaattccgtg gtcacttcct 1020

gatcgaaggt gatctgaacc ctgataactc cgacgtggac aaactgttca ttcagctggt 1080

tcagacctat aaccagctgt tcgaagaaaa cccgatcaac gcgtccggtg tagacgctaa 1140

ggcaattctg tctgcgcgtc tgtctaagtc tcgtcgtctg gaaaacctga ttgcgcaact 1200

gccaggtgaa aagaaaaacg gcctgttcgg caatctgatc gccctgtccc tgggtctgac 1260

tccgaacttt aaatccaact ttgacctggc ggaagatgcc aagctgcagc tgagcaaaga 1320

tacctatgac gatgacctgg ataacctgct ggcacagatc ggtgatcagt atgccgatct 1380

gttcctggcc gcgaaaaacc tgtctgatgc gattctgctg tctgatatcc tgcgcgttaa 1440

cactgaaatt actaaagcgc cgctgagcgc atccatgatt aaacgttacg atgaacacca 1500

ccaggatctg accctgctga aagcgctggt gcgtcagcag ctgccggaaa aatacaagga 1560

gatcttcttc gaccagagca aaaacggtta cgcgggctac attgatggtg gtgcatctca 1620

ggaggaattc tacaaattca ttaaaccgat cctggaaaaa atggatggta ctgaagagct 1680

gctggttaaa ctgaatcgtg aagatctgct gcgcaaacag cgtaccttcg ataacggttc 1740

catcccgcat cagattcatc tgggcgaact gcacgctatc ctgcgccgtc aggaagactt 1800

ttatccgttc ctgaaagaca accgtgagaa aattgaaaaa atcctgacct tccgtattcc 1860

gtactatgta ggtccgctgg cgcgtggtaa ctcccgtttc gcttggatga cccgcaaaag 1920

cgaagaaacc atcaccccgt ggaatttcga agaagtcgtt gacaaaggcg cgtccgcgca 1980

gtctttcatc gaacgcatga cgaacttcga caaaaacctg ccgaacgaga aagtgctgcc 2040

gaaacactct ctgctgtacg agtacttcac tgtgtacaac gaactgacca aagtgaaata 2100

cgtcaccgaa ggtatgcgta aaccggcatt cctgtccggt gagcaaaaaa aagcaatcgt 2160

ggatctgctg ttcaaaacca accgtaaagt aaccgtgaaa cagctgaagg aagactattt 2220

caagaaaatc gaatgttttg attctgttga aatctccggc gtggaagatc gcttcaatgc 2280

gtccctgggt acgtatcacg acctgctgaa aattatcaaa gacaaagatt ttctggacaa 2340

cgaggaaaac gaagacatcc tggaggatat tgtactgacc ctgaccctgt tcgaagaccg 2400

tgagatgatc gaagaacgcc tgaaaaccta cgcccacctg ttcgatgaca aggtaatgaa 2460

gcagctgaaa cgtcgtcgtt ataccggctg gggtcgtctg tcccgtaaac tgatcaatgg 2520

catccgtgat aaacagtctg gcaaaaccat cctggacttc ctgaaatccg acggtttcgc 2580

gaatcgtaac ttcatgcaac tgattcatga cgattctctg actttcaaag aagacatcca 2640

gaaagcacag gtttccggcc agggtgactc tctgcacgag cacattgcca atctggctgg 2700

ttctccggct attaaaaagg gtattctgca gactgtgaaa gtagttgatg agctggtcaa 2760

agtaatgggc cgtcacaagc cggaaaacat tgtgatcgaa atggcacgtg aaaaccagac 2820

gacccagaaa ggtcagaaaa actctcgtga acgcatgaaa cgtatcgaag aaggcatcaa 2880

agaactgggc tctcagatcc tgaaggaaca ccctgtagaa aatacccagc tgcagaacga 2940

aaagctgtat ctgtattacc tgcagaacgg ccgcgatatg tatgtggacc aggaactgga 3000

tatcaaccgc ctgtccgatt acgatgtaga tcacatcgtg ccgcaaagct tcctgaaaga 3060

cgacagcatt gacaacaaag tactgacccg ttctgataag aaccgtggca aatccgataa 3120

cgtcccgtct gaagaagttg ttaaaaaaat gaaaaactat tggcgtcagc tgctgaacgc 3180

gaaactgatc acccagcgta agttcgacaa tctgactaaa gctgagcgcg gtggtctgtc 3240

cgaactggat aaagcgggtt ttatcaaacg ccagctggtt gaaacccgtc agatcacgaa 3300

gcacgttgcg cagattctgg actctcgtat gaacaccaaa tacgacgaaa acgacaaact 3360

gatccgcgag gttaaggtta tcaccctgaa aagcaaactg gtatccgatt ttcgtaaaga 3420

ctttcagttc tacaaagtgc gcgaaattaa caactatcac cacgctcacg atgcatatct 3480

gaatgcagtt gttggcacgg cgctgatcaa aaagtatccg aaactggaat ctgaattcgt 3540

atacggcgat tacaaagtgt atgacgttcg taagatgatc gcaaaatccg agcaggaaat 3600

tggtaaggcg acggcgaaat acttctttta ttccaatatt atgaactttt tcaaaaccga 3660

aatcaccctg gcgaatggtg aaattcgtaa acgcccgctg atcgaaacca acggtgaaac 3720

tggtgaaatc gtttgggaca aaggccgcga cttcgcgacc gtgcgtaaag ttctgtctat 3780

gccgcaagtg aacatcgtca agaagaccga agtacaaacc ggcggtttta gcaaagagag 3840

cattctgcca aaacgtaact ccgacaaact gatcgcgcgc aagaaagact gggatccgaa 3900

aaaatacggt ggtttcgatt ctccaaccgt tgcttattcc gttctggtgg tagccaaagt 3960

tgagaaaggt aaaagcaaaa aactgaaatc cgtaaaggaa ctgctgggta ttactatcat 4020

ggagcgtagc tccttcgaaa aaaacccgat cgattttctg gaagcgaaag gctataaaga 4080

agtcaaaaag gacctgatca tcaaactgcc aaaatacagc ctgttcgagc tggaaaacgg 4140

ccgtaaacgt atgctggcat ctgcgggcga actgcagaaa ggcaacgagc tggctctgcc 4200

gtccaaatac gtgaactttc tgtacctggc ctctcactac gaaaaactga aaggttcccc 4260

ggaagacaac gaacagaaac agctgttcgt agagcagcac aaacactacc tggacgagat 4320

catcgaacag atttctgaat tttctaaacg tgtgattctg gctgatgcga atctggataa 4380

agttctgtct gcctataaca agcatcgtga caaaccgatc cgcgaacagg ctgagaacat 4440

catccacctg ttcactctga ctaacctggg cgcgccagcg gctttcaagt actttgatac 4500

caccattgac cgcaagcgtt acacctccac taaagaagtg ctggacgcga ctctgatcca 4560

ccagtccatc accggtctgt acgagacccg tatcgatctg agccagctgg gcggtgacaa 4620

aaggccggcg gccacgaaaa aggccggcca ggcaaaaaag aaaaagtgac aaagcccgaa 4680

aggaagctga gttg 4694

<210> 3

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

agagcacagt cagcctggcg 20

<210> 4

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

cttccagaat tggatctccg 20

<210> 5

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

tacggaattg gggagccagc gga 23

<210> 6

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

caaagttaac tctctgtgtc t 21

<210> 7

<211> 225

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

ggcttgtcgg actcttcgct attacgccag ctggcgaagg gggatgtgct gcaaggcgat 60

taagttgggt aacgccaggg ttttcccagt cacgacgtta ggaaattaat acgactcact 120

ataggagagc acagtcagcc tggcggtttt agagctagaa atagcaagtt aaaataaggc 180

tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg ctttt 225

<210> 8

<211> 225

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

ggcttgtcgg actcttcgct attacgccag ctggcgaagg gggatgtgct gcaaggcgat 60

taagttgggt aacgccaggg ttttcccagt cacgacgtta ggaaattaat acgactcact 120

ataggcttcc agaattggat ctccggtttt agagctagaa atagcaagtt aaaataaggc 180

tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg ctttt 225

<210> 9

<211> 414

<212> PRT

<213> 猪(Sus scrofa)

<400> 9

Met Ser Glu Tyr Ile Arg Val Thr Glu Asp Glu Asn Asp Glu Pro Ile

1 5 10 15

Glu Ile Pro Ser Glu Asp Asp Gly Thr Val Leu Leu Ser Thr Val Thr

20 25 30

Ala Gln Phe Pro Gly Ala Cys Gly Leu Arg Tyr Arg Asn Pro Val Ser

35 40 45

Gln Cys Met Arg Gly Val Arg Leu Val Glu Gly Ile Leu His Ala Pro

50 55 60

Asp Ala Gly Trp Gly Asn Leu Val Tyr Val Val Asn Tyr Pro Lys Asp

65 70 75 80

Asn Lys Arg Lys Met Asp Glu Thr Asp Ala Ser Ser Ala Val Lys Val

85 90 95

Lys Arg Ala Val Gln Lys Thr Ser Asp Leu Ile Val Leu Gly Leu Pro

100 105 110

Trp Lys Thr Thr Glu Gln Asp Leu Lys Glu Tyr Phe Ser Thr Phe Gly

115 120 125

Glu Val Leu Met Val Gln Val Lys Lys Asp Ile Lys Thr Gly His Ser

130 135 140

Lys Gly Phe Gly Phe Val Arg Phe Thr Glu Tyr Glu Thr Gln Val Lys

145 150 155 160

Val Met Ser Gln Arg His Met Ile Asp Gly Arg Trp Cys Asp Cys Lys

165 170 175

Leu Pro Asn Ser Lys Gln Ser Pro Asp Glu Pro Leu Arg Ser Arg Lys

180 185 190

Val Phe Val Gly Arg Cys Thr Glu Asp Met Thr Ala Asp Glu Leu Gln

195 200 205

Gln Phe Phe Cys Gln Tyr Gly Glu Val Val Asp Val Phe Ile Pro Lys

210 215 220

Pro Phe Arg Ala Phe Ala Phe Val Thr Phe Ala Asp Asp Gln Val Ala

225 230 235 240

Gln Ser Leu Cys Gly Glu Asp Leu Ile Ile Lys Gly Ile Ser Val His

245 250 255

Ile Ser Asn Ala Glu Pro Lys His Asn Ser Asn Arg Gln Leu Glu Arg

260 265 270

Ser Gly Arg Phe Gly Gly Asn Pro Gly Gly Phe Gly Asn Gln Gly Gly

275 280 285

Phe Gly Asn Ser Arg Gly Gly Gly Ala Gly Leu Gly Asn Asn Gln Gly

290 295 300

Ser Asn Met Gly Gly Gly Met Asn Phe Gly Ala Phe Ser Ile Asn Pro

305 310 315 320

Ala Met Met Ala Ala Ala Gln Ala Ala Leu Gln Ser Ser Trp Gly Met

325 330 335

Met Gly Met Leu Ala Ser Gln Gln Asn Gln Ser Gly Pro Ser Gly Asn

340 345 350

Asn Gln Ser Gln Gly Asn Met Gln Arg Glu Pro Asn Gln Ala Phe Gly

355 360 365

Ser Gly Asn Asn Ser Tyr Ser Gly Ser Asn Ser Gly Ala Ala Ile Gly

370 375 380

Trp Gly Ser Ala Ser Asn Ala Gly Ser Gly Ser Gly Phe Asn Gly Gly

385 390 395 400

Phe Gly Ser Ser Met Asp Ser Lys Ser Ser Gly Trp Gly Met

405 410

<210> 10

<211> 1600

<212> DNA

<213> 猪(Sus scrofa)

<400> 10

caaagcccag atgagccttt gagaagcaga aaggtgtttg ttgggcgctg tacagaggac 60

atgactgctg atgagctgca gcagttcttt tgccagtacg gagaagtggt agatgtcttc 120

attcccaaac cattcagggc ttttgccttt gttacatttg cagatgatca ggtatttttc 180

tcttcctaat tttgtctcag ctaattaggt aatttctgtt gaactttttg cccttccata 240

tcagctaagc tctctgacct tataagctgt ggtgtatcgg ggcctagata tttgtggtaa 300

actccttagg ttattttttt agtatgcgac atttaagtgg acgtgttaaa tatcctttga 360

aaatgaacta aaatccctgt ttctgttact aaagtgaaag gctattttat gggtttaaat 420

gaaatgtgtt cattgcttat ttttcctcta gatagaggct tgtagatagt ggcctgaaat 480

ctaagtttta tcactatttt gatgtatgag tcaatggttt aatctttatt tacatccctt 540

atttcttata ggtcgcccag tctctttgtg gagaggactt gatcattaaa ggaatcagcg 600

tacatatatc caatgctgaa cctaaacaca atagcaatag acagttagaa agaagtggaa 660

gatttggtgg taatccaggt ggctttggga atcagggtgg ctttggtaac agtagagggg 720

gtggagctgg tttggggaac aatcaaggta gtaacatggg tggagggatg aactttggtg 780

ctttcagcat caatccagcg atgatggctg cagcccaggc ggctctgcag agcagctggg 840

gtatgatggg catgttagcc agtcagcaga accagtcagg cccatcgggt aataaccaaa 900

gccaaggcaa catgcaaaga gagccaaacc aggcctttgg ttctggaaat aactcgtata 960

gtggttctaa ttcaggggca gcgattggtt ggggatcagc atcaaatgca gggtcaggca 1020

gtggttttaa tggaggcttt ggctcaagca tggattccaa atcttcgggc tggggaatgt 1080

agacgttggg ttatggttgg ttggtataga ctggtgggaa ttcaaatttt tctaaactca 1140

tggtaagtat attgtaaaat acatatgtac taagaatttt caaaattggt ttgttcggtg 1200

tggagtatat tcagcagtat ttttgacatt tttctttaga aaaaggaaga gctaaaggaa 1260

ttttataagt tttgttacat aaagggttga aatattgagt gtttgaaagt gaactgctgt 1320

ttgcctgatt ggtaaaccaa cacactacaa ttgatatcaa aaggtttctc ctgtaatatt 1380

ttatccctgg acttgtcaag tgaattcttt gcatgttcaa aatggaaacc attgattaga 1440

actacattct tttctccttg ttttaatttg aaccccacca tatggatttt tcccttagga 1500

aaatctcctt tttggagatc atggtgtcac agtgttcttt cgttttcgtt tttgtttttt 1560

taacacttgt ctcccttcat atacaaaagt acaatatgaa 1600

<210> 11

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

cagcgtacat atatccaatg c 21

<210> 12

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

tctacattcc ccagcccgaa g 21

<210> 13

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

agttagaaag aagtggaaga t 21

<210> 14

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

cattaaaacc actgcctgac cct 23

<210> 15

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 15

gcggctctgc agagcagctg 20

<210> 16

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 16

gccagtcagc agaaccagtc 20

<210> 17

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 17

caccgcggct ctgcagagca gctg 24

<210> 18

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 18

aaaccagctg ctctgcagag ccgc 24

<210> 19

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 19

caccgccagt cagcagaacc agtc 24

<210> 20

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 20

aaacgactgg ttctgctgac tggc 24

<210> 21

<211> 59

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 21

ttctagctct aaaaccagct gctctgcaga gccgccctat agtgagtcgt attaatttc 59

<210> 22

<211> 59

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 22

gcagctggtt ttagagctag aaatagcaag ttaaaataag gctagtccgt tatcaactt 59

<210> 23

<211> 59

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 23

ttctagctct aaaacgactg gttctgctga ctggccctat agtgagtcgt attaatttc 59

<210> 24

<211> 59

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 24

accagtcgtt ttagagctag aaatagcaag ttaaaataag gctagtccgt tatcaactt 59

<210> 25

<211> 225

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 25

ggcttgtcgg actcttcgct attacgccag ctggcgaagg gggatgtgct gcaaggcgat 60

taagttgggt aacgccaggg ttttcccagt cacgacgtta ggaaattaat acgactcact 120

atagggcggc tctgcagagc agctggtttt agagctagaa atagcaagtt aaaataaggc 180

tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg ctttt 225

<210> 26

<211> 225

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 26

ggcttgtcgg actcttcgct attacgccag ctggcgaagg gggatgtgct gcaaggcgat 60

taagttgggt aacgccaggg ttttcccagt cacgacgtta ggaaattaat acgactcact 120

atagggccag tcagcagaac cagtcgtttt agagctagaa atagcaagtt aaaataaggc 180

tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg ctttt 225

<210> 27

<211> 189

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 27

gtttggggaa caatcaaggt agtaacatgg gtggagggat gaactttggt gctttcagca 60

tcaatccagc gatgatggct gcagcccagg cggctctgaa atcatcatgg ggtatggtgg 120

gcatgttagc cagtcagcag aaccaaagcg gcccatcggg taataaccaa agccaaggca 180

acatgcaaa 189

Claims

1.一种原核Ca9高效表达载体pKG-GE4，其特征在于序列如SEQ ID NO.1所示。

2.权利要求1所述的原核Ca9高效表达载体在制备Ca9蛋白中的应用。

3.含有权利要求1所述的原核Ca9高效表达载体pKG-GE4的基因工程菌。

4.权利要求3所述的基因工程菌在制备Ca9蛋白中的应用。

5.一种制备Ca9蛋白的方法，其特征在于包含以下步骤：

(1)培养权利要求3所述的基因工程菌，加入IPTG，在低于前期培养温度5℃的温度下诱导所述的基因工程菌表达目的蛋白，并收集菌体沉淀；

(2)粗提融合蛋白，采用Ni-NTA琼脂糖柱进行融合蛋白的纯化；

6.一种用于构建TARDBP基因突变的ALS模型猪核移植供体细胞的基因编辑系统，其特征在于包含按照权利要求5所述方法制备的Ca9蛋白，针对TARDBP基因的gRNA以及含有TARDBP突变位点的单链Donor DNA。

7.根据权利要求6所述的基因编辑系统，其特征在于所述的针对TARDBP基因的gRNA的靶点选自SEQ ID NO.15所示的TARDBP-E6-gRNA2和SEQ ID NO.16所示的TARDBP-E6-gRNA3。

8.根据权利要求6所述的基因编辑系统，其特征在于所述的针对TARDBP基因的TARDBP-T7-gRNA2，其转录模板如SEQ ID NO.25所示；针对TARDBP基因的TARDBP-T7-gRNA3，其转录模板如SEQ ID NO.26所示。

9.根据权利要求6所述的基因编辑系统，其特征在于所述的含有TARDBP突变位点的单链Donor DNA序列如SEQ ID NO.27所示。

10.根据权利要求6-9中任意一项所述的基因编辑系统，其特征在于Ca9蛋白：TARDBP-T7-gRNA2：TARDBP-T7-gRNA3：单链Donor DNA的质量比为1:1:4:2。

11.权利要求6-9中任一项所述的基因编辑系统在构建TARDBP基因突变的猪重组细胞中的应用。

12.一种重组细胞，其特征在于由权利要求6-9中任一项所述的基因编辑系统共转染猪原代成纤维细胞经验证后所得。

13.权利要求6-9中任一项所述的基因编辑系统、权利要求12所述的重组细胞在构建TARDBP基因突变的肌萎缩侧索硬化症模型猪中的应用。