CN117487778A

CN117487778A - 一种全新的基于CRISPR-Cas12b的碱基编辑器的构建及其应用

Info

Publication number: CN117487778A
Application number: CN202311435035.3A
Authority: CN
Inventors: 周哲敏; 郝文亮; 崔文璟; 韩来闯; 程中一; 刘中美
Original assignee: Jiangnan University
Current assignee: Jiangnan University
Priority date: 2023-10-31
Filing date: 2023-10-31
Publication date: 2024-02-02

Abstract

本发明公开了一种全新的基于CRISPR‑Cas12b的碱基编辑器的构建及其应用，属于基因工程技术领域。本发明通过对BhCas12b进行失活突变，获得了失活版本的dBhCas12b。本发明基于dBhCas12b，在微生物中构建了具有拓展编辑窗口的碱基编辑器，编辑窗口在大肠杆菌中最高可达63nt，是目前微生物细胞中编辑窗口最宽的CBE系统。最终，本发明将该系统用于基因表达的多样化以及蛋白质的原位进化中，并且获得了一系列梯度表达的构建体以及高版本底盘细胞。本发明提供了一种超宽编辑窗口的新型BE系统，该系统能够在代谢工程、蛋白质工程以及基因工程的各个方面体现出巨大的应用价值。

Description

一种全新的基于CRISPR-Cas12b的碱基编辑器的构建及其应用

技术领域

本发明涉及一种全新的基于CRISPR-Cas12b的碱基编辑器的构建及其应用，属于基因工程技术领域。

背景技术

碱基编辑器(Base Editor，BE)作为CRISPR-Cas作为第三代基因编辑技术的应用，能够在不依赖于双联DNA断裂(DSBs)的情况下，通过脱氨酶的脱氨基作用能够直接诱导C到T或者A到G的转换，在动植物细胞中被广泛应用。

但是，目前的BE方案，在应用中存在编辑窗口短的问题，现存BE的编辑窗口大约为5～6nt(Highly efficient DSB-free base editing forstreptomycetes with CRISPR-BEST；MACBETH:Multiplex automated Corynebacterium glutamicum baseeditingmethod；Programmable editing of atarget base in genomicDNA withoutdouble-stranded DNA cleavage；Targeted nucleotide editing using hybridprokaryotic andvertebrate adaptive immune systems)，这也就意味着，至多能产生2～3个氨基酸的突变。为了拓宽BE编辑窗口，Zong等(Efficient C-to-T base editing inplants using a fusion of nCas9 and human APOBEC3A)通过将人源APOBEC3A与Cas9结合，在植物中使得BE的编辑窗口从5nt拓展到了17nt。Banno等(Deaminase-mediatedmultiplex genome editing in Escherichia coli)在大肠杆菌中通过构建4个sgRNA，实现了对41个位点的同时编辑，但其BE窗口只有5nt。专利CN 116685684 A披露了将BhCas12b失活突变，在动物细胞内构建了BE系统。现有技术中尚无在微生物中构建具有拓宽的BE窗口的研究。

发明内容

为了解决上述技术问题，本发明构建了基于dBhCas12b的BE系统，这些系统在枯草芽孢杆菌Bacillussubtilis和大肠杆菌Escherichiacoli中均能工作并且具有扩展的编辑窗口，该系统能够在代谢工程、蛋白质工程以及基因工程的各个方面体现出巨大的应用价值。

本发明的第一个目的是提供一种融合蛋白，所述融合蛋白包括脱氨酶和Cas蛋白突变体dBhCas12b；所述脱氨酶位于所述Cas蛋白突变体dBhCas12b的N端；

所述dBhCas12b相较于原始序列，发生了包括以下位点的突变：第574位天冬氨酸、第828位谷氨酸E和第952位天冬氨酸突变为了丙氨酸A；所述原始序列的氨基酸序列如SEQID NO.3所示；

所述脱氨酶包括胞苷脱氨酶CDA或腺苷碱基编辑器ABE8e。

在本发明的一种实施方式中，所述胞苷脱氨酶CDA的氨基酸序列如SEQ ID NO.1所示。

在本发明的一种实施方式中，所述腺苷碱基编辑器ABE8e的氨基酸序列如SEQ IDNO.2所示。

在本发明的一种实施方式中，所述融合蛋白还包含了尿嘧啶糖基化酶抑制剂结构域UGI。

在本发明的一种实施方式中，所述尿嘧啶糖基化酶抑制剂结构域UGI位于所述Cas蛋白突变体dBhCas12b的C端。

在本发明的一种实施方式中，所述尿嘧啶糖基化酶抑制剂结构域UGI的氨基酸序列如SEQ ID NO.4所示。

在本发明的一种实施方式中，所述胞苷脱氨酶CDA通过连接蛋白1与Cas蛋白突变体dBhCas12b连接，Cas蛋白突变体dBhCas12b通过连接蛋白2与尿嘧啶糖基化酶抑制剂(UGI)结构域连接；所述CDA和dBhCas12b的连接蛋白1的氨基酸序列为(GSAASR)_n；dBhCas12b和UGI的连接蛋白的氨基酸序列为(GPKKKRKVGT)_n，其中n独立地为1-30的整数。

在一种实施方式终，所述CDA和dBhCas12b的连接蛋白1的氨基酸序列为GSAASR；dBhCas12b和UGI的连接蛋白2的氨基酸序列为GPKKKRKVGT。

本发明的第二个目的是提供一种编码上述融合蛋白的基因。

本发明的第三个目的是提供一种含有上述融合蛋白的质粒。

所述质粒的出发质粒包括但不限于质粒pAX01。

本发明的第四个目的是提供一种重组细胞，所述重组细胞含有上述融合蛋白的基因或上述质粒。

在本发明的一种实施方式中，所述重组细胞包括枯草芽孢杆菌或大肠杆菌。

在本发明的一种实施方式中，所述枯草芽孢杆菌包括B.subtilis 168。

在本发明的一种实施方式中，所述大肠杆菌包括E.coli JM109或E.coli BL21(DE3)。

本发明的第五个目的是提供所述融合蛋白，或所述基因，或所述质粒，或所述基重组细胞在基因表达和/或蛋白质进化中的应用。

在一种实施方式中，所述应用为将所述融合蛋白，或所述基因，或所述质粒，或所述基重组细胞用于RBS的突变，进而筛选具有高蛋白表达效果的RBS。

在一种实施方式中，所述应用为将所述融合蛋白，或所述基因，或所述质粒，或所述基重组细胞用于靶向目的蛋白，对蛋白质进行突变，进而筛选具有特定性能的蛋白质。

本发明的有益效果：

(1)碱基编辑元件CDA-dBhCas12b-UGI-UGI在枯草芽孢杆菌中的编辑窗口达到了19nt，碱基编辑元件ABE8e-dBhCas12b在枯草芽孢杆菌中的编辑窗口达到了14nt，分别是现有微生物碱基编辑器的3.8和2.33倍；

碱基编辑元件CDA-dBhCas12b-UGI在大肠杆菌中的编辑窗口达到了63nt，是现有微生物碱基编辑器的12.8倍。

(2)提供了碱基编辑元件在枯草芽孢杆菌多样化基因表达中的应用，以碱基编辑元件CDA-dBhCas12b-UGI-UGI进行RBS突变，构建得到了较对照提升68.1倍eGFP表达水平的突变体，实现了多样化基因表达。

(3)提供了碱基编辑元件在蛋白质进化中的应用，以碱基编辑器CDA-dBhCas12b-UGI进行TatABC的定向进化，得到了sfGFP荧光强度表达相较于野生型分泌能力提升6.49倍的突变体。

附图说明

图1：CRISPR-Cas12b在B.subtilis中敲除性能的考察，a：CRISPR-Cas12b的工作示意图；b：CRISPR-AaCas12b的质粒构建示意图；c：CRISPR-AaCas12b对sacA的敲除效率；d：CRISPR-BhCas12b的质粒构建示意图；e：CRISPR-BhCas12b对sacA的敲除效率；f：CRISPR-BhCas12b对aprE的敲除效率。

图2：影响BhCas12b核酸酶活性关键候选位点的确定，a：不同来源Cas12b一级序列比对；b：BhCas12b组织结构示意图；c：BhCas12b和sgRNA对接示意图；d：敲除sacA的探针质粒用于快速鉴定BhCas12b关键核酸酶活性位点的流程示意图；e-g：关键位点(D574，E828，D952)的逐一丙氨酸突变对sacA敲除效率的影响。

图3：CRISPR-dBhCas12b在B.subtilis中抑制基因表达的验证，a：CRISPR-dBhCas12b在B.subtilis中的构建示意图；b：CRISPR-dBhCas12b在表达或不表达时对宿主生物量的影响；c：CRISPR-dBhCas12b的表达对宿主产生总荧光强度的影响；d：CRISPR-dBhCas12b的表达对宿主产生单位荧光强度的影响。

图4：CRISPR-dBhCas12b在B.subtilis中抑制启动子转录起始的验证，a：CRISPR-dBhCas12b在B.subtilis中用于抑制启动子转录起始的构建示意图；b-g：通过单位荧光强度测定，反映CRISPR-dBhCas12b的表达对启动子转录起始活性的影响。

图5：B.subtilis中基于dBhCas12b的BE系统的构建及验证，a：基于dBhCas12b的不同CBE系统的构建；b：不同CBE系统对不同基因(pksA和pksC)编辑性能的考察；c：CBE-d对不同基因(pksE和pksG)编辑性能的考察；d：基于dBhCas12b的ABE系统的构建；e：ABE系统对sigE基因编辑性能的考察；图5b、5c中，5’端(左侧)前4个碱基为对应的PAM序列；浅色的T代表发生了C到T的突变。

图6：基于dBhCas12b的CBE系统在基因表达多样化上的应用，a：基于dBhCas12b的CBE系统在多样化表达元件RBS以及筛选高强度RBS的流程示意图；b：利用CBE系统多样化eGFP的RBS元件，进而筛选高强度表达eGFP的RBS突变体。

图7：基于dBhCas12b的CBE系统在E.coli中的构建及验证，a：CBE系统在E.coli中的构建以及突变体筛选流程示意图；b：CBE系统在E.coli中编辑rpsE基因不同位点的群体测序结果；c：氨苄青霉素平板上编辑rpsE不同位点的单克隆测序结果；d：壮观霉素平板上编辑rpsE不同位点的单克隆测序结果；e：不同rpsE突变体在100μg/ml的壮观霉素条件下的生长状况；f：不同rpsE突变体突变位点的鉴定结果。

图8：不同dCas蛋白构成的CBE系统在E.coli中编辑性能的考察，a：不同CBE系统基因靶点的选择；b：dBhCas12b构成的CBE系统在不同基因中编辑性能的考察；c：dFnCas12a构成的CBE系统在不同基因中编辑性能的考察；b：dSpCas9构成的CBE系统在不同基因中编辑性能的考察；b：不同dCas蛋白构成的CBE系统对E.coli生长的影响。

图9：基于dBhCas12b的CBE系统在E.coli中蛋白质进化的应用，a：TatABC基因复合体的组织结构示意图；b：用于筛选高活性TacABC突变体系统的构建及其流程示意图；c：不同TatABC突变体总的周质荧光水平；d：不同TatABC突变体的生物量；e：不同TatABC突变体产生的单位周质荧光水平；f：不同TatABC突变体在蓝光仪照射下荧光强度的直视图。

具体实施方式

以下实施例试剂购买自生工生物工程(上海)公司。

(一)培养基

LB培养基(g·L^-1)：胰蛋白胨(Tryptone)10；酵母提取物(Yeast extract)5；氯化钠(NaCl)10。

SPI培养基(g·L^-1)：配方参考文献：Construction and application of anefficient dual-base editing platform for Bacillus subtilis evolutionemployingprogrammable base conversion。

(二)B.subtilis168质粒转化方法

挑单菌落B.subtilis 168接种至2mL的SPI培养基中，37℃摇床培养12-14h；从培养物中取100μL，接种至5mL SPI培养基中，37℃摇床培养4-5h后开始测OD₆₀₀。当OD₆₀₀约为1.0时，移取200μL菌液转接至2mL的SPI培养基中，于37℃、100r·min^-1摇床孵育1.5h；向管中加入20μL 100×EGTA(乙二醇双(α-氨基乙基醚)四乙酸)溶液，于37℃、100r·min^-1摇床中培养10min后分装500μL每l.5mL离心管；向管中加入经过测序验证正确的质粒10μg，吹吸混匀放置于37℃、100r·min^-1的摇床中培养2h；培养结束，吸取菌液约200μL均匀涂相应的选择性平板，37℃过夜培养12-14h。

(三)B.subtilis168基因组整合方法(以pAX-CDA-dBhCas12b-UGI-UGI为例)

首先，使用表2所述引物lacA-dCas9-F和lacA-dCas9-R去扩增目的基因CDA-dBhCas12b-UGI-UGI以及两侧的lacA整合位点的同源臂(上游同源臂800bp；下游同源臂691bp)和氯霉素抗性基因。然后，对目的片段进行纯化备用。根据上述方法制作B.subtilis感受态并将纯化好的片段转化进去，复苏培养2h。最后，将复苏好的菌液均匀涂布到氯霉素筛选LB平板上。生长起来的克隆被用作模板用于PCR目的片段来鉴定阳性克隆。

(四)单克隆编辑效率的测定

对于单克隆测序：在基因编辑完成后，将混合编辑溶液进行稀释并涂布到含相应抗生素平板上，以单克隆为模板进行PCR并将PCR产生进行测序，从而鉴定编辑效率。

(五)群体编辑效率的测定

对于群体测序：在基因编辑完成后，吸取编辑后的混合培养物作为模板，用定制的引物扩增突变的位置，并将混合产生用于测序，使用软件BEAT去分析测序产生的色谱图，从而给出编辑频率。

(六)周质蛋白的提取方法

1)将待处理的细胞在3500-4500rpm，4℃离心10min，弃上清，并用PBS清洗细胞1次；2)按1：40(v/v)加入40mM pH 9.0精氨酸溶液(HCl调pH)，轻柔吹吸混匀后至于4℃冰浴30min(这一步细胞容易裂解，吹吸的剪切力过大或处理时间太长都会造成胞内蛋白释放，导致最终结果偏高)；3)4500rpm 4℃离心10min，收集上清液，即为周质组分，用PBS重悬并洗涤沉淀部分(1-3次)，即为胞内组分。

(七)本发明涉及的引物及序列、菌株、sgRNA序列

表1本发明所使用的引物及其核苷酸序列

/>

表2本发明涉及的菌株

/>

表3本发明涉及的sgRNA及其核苷酸序列

/>

实施例1 dBhCas12b的改造与验证

(1)不同来源的CRISPR-Cas12b在B.subtilis中基因编辑效率的考察

CRISPR-Cas12b的工作原理如图1a所示。

基因敲除质粒的构建

具体构建方法如下：首先，以AaCas12b(基因由安升达合成)、BhCas12b(基因由安升达合成)以及pHT-AIO-sacA(构建方法参考文献：Haoetal.Front.Bioeng.Biotechnol,2020,8:524676)作为模板，使用引物AaCas12b-F/AaCas12b-R、BhCas12b-F/BhCas12b-R、BhCas12b-b-F/BhCas12b-b-R以及AaCas12b-b-F/AaCas12b-b-R分别扩增AaCas12b基因、BhCas12b基因以及他们对应的骨架。通过核酸电泳凝胶确定扩增出片段以后，对其片段进行模板消化，约2～3小时(DpnI，Takara)。随后对消化的片段产物进行纯化(使用试剂盒：DNA片段纯化，康为世纪)以除去杂质。随后，使用ABclonal DNA重组试剂盒将片段两两组合，得到重组质粒：pHT-AaCas12b和pHT-BhCas12b。以pHT-AIO-sacA、pHT-AaCas12b和pHT-BhCas12b作为模板，使用引物sacAT-b-F/sacAT-b-R以及sacAT-F/sacAT-R分别扩增sacA同源臂的骨架以及sacA的同源臂，随后对其片段进行消化、纯化以及组装(方法同上)，得到重组质粒pHT-AaCas12b-sacAT和pHT-BhCas12b-sacAT。最后，以AasgRNA(基因由安升达合成)、BhsgRNA(基因由安升达合成)、pHT-AaCas12b-sacAT和pHT-BhCas12b-sacAT为模板，使用引物AasgRNA-F/AasgRNA-R、BhsgRNA-F/BhsgRNA-R、AasgRNA-b-F/AasgRNA-b-R以及BhsgRNA-b-F/BhsgRNA-b-R分别扩增AasgRNA、BhsgRNA以及他们对应的骨架，随后将这些片段进行消化、纯化以及组装，得到最终的敲除质粒pHT-AaCas12b-AIO以及pHT-BhCas12b-AIO。

基因敲除效率验证

将构建好的敲除质粒(pHT-AaCas12b-AIO和pHT-BhCas12b-AIO)转化到B.subtilis 168中。将生长出的克隆分别挑至新鲜LB液体培养基中进行培养编辑12h。随后将培养好的培养物进行稀释(约10⁵倍)并涂布到含有相应抗性的LB平板上。等到单克隆生长起来后，用对应的菌落PCR引物对敲除位置的两端进行扩增以确定敲除与否。

结果显示，以内源基因sacA为敲除对象时，CRISPR-AaCas12b的编辑效率仅为1/23(图1c)，而CRISPR-BhCas12b的编辑效率高达18/18(图1e)。以内源基因aprE为敲除对象时，CRISPR-BhCas12b对aprE的敲除效率高达10/10(图1f)。

(2)dBhCas12b的设计与改造

BhCas12b候选关键活性位点的确认

分别将来源于Alicyclobacillus acidoterrestris、Alicyclobacillusacidiphilus、Bacillus hisashii的Cas12b的一级序列进行同源比对，比对结果如图2a所示。根据AacCas12b、AaCas12b、BhCas12b的结构区域图(参考文献：Liu,L.et al.C2c1-sgRNA complex structure reveals RNA-guided DNA cleavage mechanism.Mol.Cell65,310-322(2017)；Strecker,J.et al.Engineering of CRISPR-Cas12b for human genomeediting.Nat.Commun.10,212(2019)；Teng,F.et al.Repurposing CRISPR-Cas12b formammalian genome engineering.Cell Discov.4,63(2018).)以及AacCas12b的结晶结果(PDB:5WQE)，我们将BhCas12b的不同结构域进行划分，其结构组织图如图2b所示。进一步将BhCas12b与sgRNA分子(GTTCTGTCTTTTGGTCAGGACAACCGTCTAGCTATAAGTGCTGCAGGGTGTGAGAAACTCCTATTGCTGGACGATGTCTCTTACGAGGCATTAGCACCATTTTCTATACACCGGGAGGCATTTTTTTT)进行对接，分子对接结果如图2c所示。

dBhCas12b的构建与基因敲除效率筛选验证

dBhCas12b筛选示意图如图2d所示。

以表2中引物D574A-F/D574A-R，以质粒pHT-BhCas12b-AIO为模板，反向PCR构建含有靶向sacA基因的质粒pHT-BhCas12b(D574A)-AIO；

以表2中引物E828A-F/E828A-R，以质粒pHT-BhCas12b(D574A)-AIO为模板，通过反向PCR，对BhCas12b(D574A)的上述位点(E828)进行突变为丙氨酸A，获得含有双组合突变体dBhCas12b(D574A/E828A)的质粒pHT-BhCas12b(D574A/E828A)-AIO；

以表2中引物D952A-F/D952A-R，以质粒pHT-BhCas12b(D574A/E828A)-AIO为模板，通过反向PCR，对BhCas12b(D574A/E828A)的上述位点(D952)进行突变为丙氨酸A，获得含有三组合突变体dBhCas12b(D574A/E828A/D952A)的质粒pHT-BhCas12b(D574A/E828A/D952A)-AIO。

将质粒pHT-BhCas12b(D574A)-AIO、pHT-BhCas12b(D574A/E828A)-AIO、pHT-BhCas12b(D574A/E828A/D952A)-AIO分别转化至枯草芽孢杆菌B.subtilis中，对sacA基因敲除效率进行验证，结果显示，dBhCas12b(D574A)敲除效率为13％(图2e)；dBhCas12b(D574A，E828A)敲除效率为8.69％(图2f)；dBhCas12b(D574A，E828A，D952A)敲除效率为0(图2g)。

(3)CRISPR-dBhCas12b对转录延伸的抑制

CRISPR-dBhCas12b对转录延伸的抑制流程图如图3a所示。

CRISPR-dBhCas12b表达菌株的构建

将获得的BhCas12b(D574A，E828A，D952A)突变体整合到B.subtilis的lacA位点，获得重组菌株BS1，其中BhCas12b(D574A，E828A，D952A)的表达受到木糖启动子调节；对于sgRNA整合载体的构建：以pUC57-sgRNA(金唯智合成)和pDGT-P43-GFP为模板，使用引物pDG-sgRNA-F/pDG-sgRNA-R以及pDG-sgRNA-b-F/pDG-sgRNA-b-R分别扩增sgRNA(Pveg启动子组成型表达)及其对应的骨架。随后对两个片段进行消化、纯化以及组装，最终生成重组整合质粒pDG-sgRNA。15条靶向eGFP的sgRNA被设计(sgRNA序列参考表4，G1-G15)，并以反向PCR的方式，使用表2引物G1-F/G1-R、G2-F/G2-R、G3-F/G3-R、G4-F/G4-R、G5-F/G5-R、G6-F/G6-R、G7-F/G7-R、G8-F/G8-R、G9-F/G9-R、G10-F/G10-R、G11-F/G11-R、G12-F/G12-R、G13-F/G13-R、G14-F/G14-R以及G15-F/G15-R分别构建靶向eGFP的整合载体。随后将这些sgRNA表达盒扩增并分别整合到BS1菌株的amyE位点，从而生成15个含有CRISPRi的重组菌株BS2-BS16(图3a)。

eGFP表达质粒pB-P43-eGFP的构建(参考文献：Haoetal.Front.Bioeng.Biotechnol.,2020,8:524676)。将pB-P43-eGFP分别转化至BS2-BS16中，生成重组菌株BS2_eGFP-BS16_eGFP。

菌株发酵检测eGFP荧光强度

将重组菌株BS2_eGFP-BS16_eGFP进行划线，分别获得对应的单克隆。将获得的单克隆进行接种并过夜培养(约12h)。第二天，将对应的种子液以(OD₆₀₀为0.05)转接到新鲜的LB培养基中(每个菌株接两份；一份不加木糖，另一份加入1％木糖用于诱导CRISPRi的表达)并在37℃、200rpm的条件下培养约24h。然后对不同的菌株进行eGFP荧光表达的测定。

结果显示，和不添加木糖的对照组相比，诱导CRISPR-dBhCas12b的表达可以显著提高B.subtilis的生物量(图3b)。木糖在B.subtilis生长的过程中扮演了两个角色，既可以作为诱导剂又可以作为碳源提高生物量，并且CRISPR-dBhCas12b的表达对可以进一步降低eGFP总荧光强度(图3c)以及显著降低eGFP单位荧光强度(图3d)。具体相对荧光强度如表4所示。

上述结果表明，BhCas12b(D574A，E828A，D952A)可以有效结合至目标基因，并抑制目标基因表达，表明基于dBhCas12b的CRISPRi能够成功用于靶向目标基因并对RNA聚合酶的转录延伸过程产生了阻碍。BE的构成需要一个只能靶向且不能切割DNA的失活版本的Cas蛋白(dCas)。

表4CRISPR-dBhCas12b对eGFP的抑制效果

(4)CRISPR-dBhCas12b对转录起始的抑制

CRISPR-dBhCas12b对转录起始的抑制示意图如图4a所示。选取6种启动子P43、PylbP、PrelA、PspoVG、PrpoB、PsigW作为靶标，考察CRISPR-dBhCas12b(D574A，E828A，D952A)对启动子转录起始的抑制效果。

含有不同启动子表达质粒的构建方法

以pB-P43-eGFP作为模板，使用表2的引物PylbP-F/PylbP-R；PrelA-F/PrelA-R；PspoVG-F/PspoVG-R；PrpoB-F/PrpoB-R；PsigW-F/PsigW-R对模板进行反向PCR，将PCR产物进行消化，纯化以及组装步骤，最终构建出不同启动子表达eGFP的表达质粒：pB-PylbP-eGFP、pB-PrelA-eGFP、pB-PspoVG-eGFP、pB-PsigW-eGFP以及pB-PrpoB-eGFP。

以pDG-sgRNA作为模板，使用反向PCR的方法，构建携带表3所示sgRNA：P43-1、P43-2、P43-3、P43-4、ylbP-1、ylbP-2、ylbP-3、ylbP-4、relA-1、relA-2、relA-3、relA-4、spoVG-1、spoVG-2、spoVG-3、spoVG-4、rpoB-1、rpoB-2、rpoB-3、sigW-1、sigW-2序列的表达盒，靶向6种不同启动子核心区，整合到BS1的amyE位点，获得重组菌株BS17-BS37，构建得到整合型CRISPRi系统。

将含有不同启动子表达eGFP的质粒分别转化至BS17-BS37，考察该系统抑制eGFP转录起始的效果(图4a)。经过对eGFP单位荧光的比较，CRISPR-dBhCas12b能够高效抑制不同启动子转录起始活性，抑制率区间为18％-99％(图4b-g)。

上述结果显示，BhCas12b(D574A，E828A，D952A)/sgRNA复合体可以有效结合至启动子的核心区从而抑制启动子的转录的起始过程，表明基于BhCas12b(D574A，E828A，D952A)的CRISPRi系统既能够从转录的起始抑制基因表达，又能从转录的延伸抑制基因的表达。为构建基于不同脱氨酶的BE系统提供了有效的基因靶点定位的功能。

实施例2 B.subtilis中胞嘧啶碱基编辑器(CBE)的设计与验证

基于dBhCas12b的CBE系统的结构如图5a所示。

dBhCas12b-CDA的构建(引物及序列参考表1)：

以引物pAX-dBhCas12b-F/pAX-dBhCas12b-R和pAX-dBhCas12b-b-F/pAX-dBhCas12b-b-R将dBhCas12b克隆至pAX01载体的木糖启动子下游，构建得到pAX-dBhCas12b。使用引物pAX-cCDA-F/pAX-cCDA-R和pAX-cCDA-b-F/pAX-cCDA-b-R扩增CDA脱氨酶基因，并将其克隆至dBhCas12b的C端，获得整合载体pAX-dBhCas12b-CDA。

CDA-dBhCas12b、CDA-dBhCas12b-UGI、CDA-dBhCas12b-UGI-UGI的构建(引物及序列参考表1)：

使用引物pAX-nCDA-F/pAX-nCDA-R和pAX-nCDA-b-F/pAX-nCDA-b-R，以pUC-CDA和pAX-dBhCas12b为模板，将CDA连接到dBhCas12b的N端，构建得到整合载体pAX-CDA-dBhCas12b。使用引物pAX-UGI-F/pAX-UGI-R和pAX-UGI-b-F/pAX-UGI-b-R，以pUC-UGI和pAX-CDA-dBhCas12b为模板，扩增UGI基因并将其克隆至CDA-dBhCas12b的C端，获得整合载体pAX-CDA-dBhCas12b-UGI。以pAX-CDA-dBhCas12b-UGI为模板继续添加一拷贝的UGI，获得载体质粒pAX-CDA-dBhCas12b-UGI-UGI。

基于不同dBhCas12b的CBE体系整合菌株的构建：

依照上述方法，将工程化的dBhCas12b与CDA进行不同位置的融合，获得了4种不同的CBE结构，其构成方式如图5a所示。将上述不同CBE整合至B.subtilis168，分别命名为BS38-BS41。

编辑性能验证：

1、靶标质粒的构建

以表1所示引物pksA-F/pksA-R，构建sgRNA表达盒，并连接至质粒pHYT上，测序验证后，获得pksA编辑靶标质粒，命名为pHY-pksA；

pksC、pksE、pksG的构建同上，区别在于，引物替换为pksC-F/pksC-R、pksE-F/pksE-R以及pksG-F/pksG-R，测序验证后，获得pksC、pksE、pksG编辑靶标质粒，分别命名为pHY-pksC、pHY-pksE以及pHY-pksG。

2、四种CBE系统编辑性能验证

将步骤1获得的质粒pHY-pksA以及pHY-pksC，分别转化至BS38-BS41，在37℃200rpm条件下，使用木糖诱导表达，并通过一代sanger测序，检测其pksA、pksC基因编辑性能。

将步骤1获得的质粒pHY-pksE以及pHY-pksG，转化至BS38-BS41，在37℃200rpm条件下，使用木糖诱导表达，并通过一代sanger测序，检测其pksE、pksG基因编辑性能。

结果显示，图5a中，构成方式d所示的CBE能够产生较好的编辑性能，其pksA、pksC编辑窗口高达16nt(图5b)，其它构成方式的pksA、pksC编辑效率偏低，其中构成方式c所示的编辑窗口为16nt，但编辑效率仅为20％；构成方式a和b并没有检测到编辑效率。此外，通过pksE、pksG基因的进一步验证，结果也显示构成方式d可以使得pksE、pksG的基因编辑窗口达到19nt(图5c)。

实施例3：B.subtilis中腺嘌呤碱基编辑器ABE8e-dBhCas12b的设计与验证

腺嘌呤碱基编辑器ABE8e-dBhCas12b的结构如图5d所示。

具体方法同实施例2，区别在于，以引物ABE8e-F/ABE8e-R扩增ABE8e，将其与dBhCas12b的N端连接，构成ABE8e-dBhCas12b(图5d)。随后将ABE8e-dBhCas12b表达框(木糖诱导)整合至B.subtilis的lacA位点，形成重组菌株BS42(图5d)。以sigE作为验证基因，以表4所示sgRNA(sigE-E1、sigE-E2以及sigE-E3)，构建靶标质粒pHY-sigE1、pHY-sigE2以及pHY-sigE3。

结果如图5e所示，由dBhCas12b构成的ABE系统在一个较宽的编辑窗口内(14nt，A6-A19)产生了较高的编辑效率(100％)。

实施例4：基于dBhCas12b的CBE在B.subtilis中多样化基因表达的应用

为了展示本研究开发的具有扩宽编辑窗口BE的优势，我们将CBE用于构建RBS+Spacer(RS)文库，从而多样化目的基因的表达。

首先，以上述重组菌株BS41为出发菌株，在质粒pB-P43-eGFP上构建一个定制RS序列G₁₅(15个连续的G)用于表达eGFP，再将靶向RS的sgRNA整合到上述质粒中，形成一个完整的探针质粒pB-P43-eGFPsgRNA(图6a)。

将上述探针质粒转化至BS41中，验证其编辑RS序列从而调节基因表达的能力。

培养、诱导、检测具体条件方法

首先，将上述探针质粒转化至BS41中(转化方法参考前面提到的B.subitlis标准转化方法)；将获得的单克隆挑到含有1％木糖的LB培养基中进行培养大约12h。此外，以野生型B.subtilis 168和不带有sgRNA的pB-P43-eGFP作为阴性对照进行试验。

确定荧光差异较大的个体并加以测序，最终筛选到较对照提升68.1倍eGFP表达水平的RS突变体(图6b)，RS序列及荧光强度如表5所示。

表5不同RS突变产生的eGFP荧光强度

/>

实施例5：基于dBhCas12b的CBE在E.coli中的设计与验证

为了考察基于dBhCas12b的BE在不同宿主之间的普适性，选取E.coli BL21(DE3)作为宿主，以编码一种参与翻译的小核糖体亚基蛋白uS5的基因rpsE作为靶标基因进一步验证。

以按实施例2方法得到的载体pAX-CDA-dBhCas12b-UGI和载体pKD46为模板，将融合基因CDA-dBhCas12b-UGI克隆至载体pKD46中阿拉伯糖启动子(P_araBAD)下游并替换原来的基因，形成重组质粒pKD-P_araBAD-CDA-dBhCas12b-UGI。同时，使用引物pKD-Bhsg-F/pKD-Bhsg-R以及pKD-Bhsg-b-F/pKD-Bhsg-b-R将组成型表达的sgRNA表达盒(P_veg-sgRNA)克隆至质粒pKD-P_araBAD-CDA-dBhCas12b-UGI上(片段组装方式参考实施例1)，最终形成一个all-in-one(AIO)质粒pKD-CDA-dBhCas12b-UGI。引物和相关序列参考表1和表2。

通过转化“AIO”质粒pKD-CDA-dBhCas12b-UGI、阿拉伯糖诱导编辑以及最终的单克隆或群体测序来鉴定突变频率，流程示意图如图7a所示。具体是：首先将编辑质粒pKD-CDA-dBhCas12b-UGI通过化学转化的方式(热激法)转化到大肠杆菌BL21(DE3)中；然后挑取大小合适的单克隆并将其转接到新鲜的LB培养基中大约培养3～4小时，随后在该体系中加入50％(g/ml)的阿拉伯糖诱导系统编辑约12h；最后，将编辑好的培养物分成两份：一份直接作为PCR模板使用定制的引物去扩增目标突变区，并将PCR产物进行测序(群体测序)；另一份样品进行稀释(10⁵倍)，然后将稀释好的培养物均匀地涂布到含有氨苄抗生素的LB平板上，待克隆长出来后，随机挑取单克隆用作模板，使用定制的引物去扩增目标突变区，随后将PCR产物用于测序鉴定突变效率(单克隆测序)。在rpsE上选取4个位点(rpsE1、rpsE2、rpsE3和rpsE4)作为靶标，通过培养、诱导以及测序确定其群体编辑效率(参考上述群体测序描述)，结果显示CBE在一个宽泛的编辑窗口内(42nt)实现了较高的编辑效率(编辑效率在3％～98％)(图7b)。

接下来，对CBE编辑性能在单克隆水平上进行评估，结果发现和群体测序结果类似(图7c)。rpsE编码一种参与翻译的小核糖体亚基蛋白uS5，对rpsE进行适当突变，能够获得天然抗壮观霉素的大肠杆菌。我们将编辑好的培养物涂布到含有壮观霉素的平板上，发现只有编辑了rpsE3和rpsE4的培养物能生长，随机挑取两个平板上的克隆各10个去进行测序。结果发现突变的趋势跟群体测序类似且最宽的编辑窗口高达63nt(图7d)。在这些平板上随机挑取单克隆用于在高浓度壮观霉素下生长状况的考察，结果发现这些克隆的生长情况和对照(E.coli BL21(DE3)空宿主)基本无异，这说明突变的这些克隆产生了对壮观霉素的抗性(图7e)。对这些克隆进行测序，最终获得了明确的突变位点(图7f)。

实施例6：不同dCas构成的CBE编辑性能的比较

为了比较不同Cas蛋白构成的CBE的编辑性能，选择了dBhCas12b、dFnCas12a(来源于Francisellanovicida U112)以及dSpCas9(来源于Streptococcus pyogenes)构建CBE。具体构建方法：使用引物dCas12a-F/dCas12a-R以及dCas12a-b-F/dCas12a-b-R，以pLCx-dFnCas12a和pKD-CDA-dBhCas12b-UGI为模板，分别扩增dFnCas12a以及对应的骨架，随后按照实施例1的方式将两个片段进行消化、纯化并组装，得到重组质粒pKD-CDA-dFnCas12a-UGI。同理，构建pKD-CDA-dSpCas9-UGI的过程与构建pKD-CDA-dFnCas12a-UGI相似。对于不同CBE，我们各选择了10个靶点来比较它们的编辑性能(图8a)。通过比较，我们发现基于dBhCas12b的CBE具备更宽的编辑窗口(42nt)且效率较高(编辑效率跨度2％～91％，图8b)。而基于dFnCas12a的CBE编辑效率低(大部分位点的编辑效率低于30％)且窗口窄(仅为C8-C10，约3nt，图8c)；基于dSpCas9的CBE编辑效率高(大部分位点的编辑效率在60％-100％)且窗口窄(约7nt，图8d)。为了考察不同dCas构成的CBE对E.coli生长情况的影响，我们比较了相同时间下，dCas-CBE的表达对细胞生长的抑制实验。结果显示三种dCas蛋白构成的CBE对E.coli的生长均无明显抑制效应(图8e)。

实施例7：dBhCas12b-CBE在E.coli中蛋白质进化的应用

为了强调本研究构建的基于E.coli版本的新型BE(pKD-CDA-dBhCas12b-UGI)在蛋白质进化方面的应用，我们选择了TatABC作为进化对象以期提高E.coli自身对外源蛋白质的分泌能力。首先在TatABC上选取了共22个靶点(TatA选取10个靶点；TatB选取5个靶点；TatC选取7个靶点)，从而构建得到一个迷你sgRNA文库用于进化TatABC(图9a)。具体构建流程：首先根据CHOPCHOP(http://chopchop.cbu.uib.no/)设计靶向TatABC相应的sgRNA序列；然后，使用引物表2的引物A1-F/A1-R、A2-F/A2-R、A3-F/A3-R、A4-F/A4-R、A5-F/A5-R、A6-F/A6-R、A7-F/A7-R、A8-F/A8-R、A9-F/A9-R、A10-F/A10-R、B1-F/B1-R、B2-F/B2-R、B3-F/B3-R、B4-F/B4-R、B5-F/B5-R、C1-F/C1-R、C2-F/C2-R、C3-F/C3-R、C4-F/C4-R、C5-F/C5-R、C6-F/C6-R以及C7-F/C7-R，以pKD-CDA-dBhCas12b-UGI-rpsE1sg为模板，构建靶向TatABC不同的sgRNA(sgRNA序列参考表4)，并将上述质粒转化至大肠杆菌JM109中，以实施例5所述方法进行TatABC突变。随后再将sfGFP表达质粒转化至含有不同TatABC突变的大肠杆菌JM109中。通过图9b的流程，以上述周质蛋白的提取方法来检测sfGFP分泌表达量，筛选TatABC分泌能力增强的突变体。突变体及荧光强度如表6所示，通过以总分泌荧光强度(图9c)，总OD(图9d)以及单位分泌荧光强度(图9e)进行筛选比较，最终筛选得到了一株相较于野生型分泌能力提升6.49倍的突变体。并且，通过将这些突变体在蓝光仪下照射同样能直观观察到最好的突变体C7-2的分泌sfGFP的能力是最强的(图9f)。

表6不同Tat突变体分泌sfGFP荧光强度

虽然本发明已以较佳实施例公开如上，但其并非用以限定本发明，任何熟悉此技术的人，在不脱离本发明的精神和范围内，都可做各种的改动与修饰，因此本发明的保护范围应该以权利要求书所界定的为准。

Claims

1.一种融合蛋白，所述融合蛋白包括脱氨酶和Cas蛋白突变体dBhCas12b；

所述脱氨酶位于所述Cas蛋白突变体dBhCas12b的N端；

所述Cas蛋白突变体dBhCas12b相较于原始序列，发生了包括以下的突变：第574位天冬氨酸、第828位谷氨酸和第952位天冬氨酸突变为了丙氨酸A；所述原始序列的氨基酸序列如SEQ ID NO.3所示；

所述脱氨酶包括胞苷脱氨酶CDA或腺苷碱基编辑器ABE8e。

2.根据权利要求1所述的融合蛋白，其特征在于，所述胞苷脱氨酶CDA的氨基酸序列如SEQ ID NO.1所示；所述腺苷碱基编辑器ABE8e的氨基酸序列如SEQ ID NO.2所示。

3.根据权利要求1或2所述的融合蛋白，其特征在于，所述融合蛋白还包含了尿嘧啶糖基化酶抑制剂结构域UGI；所述尿嘧啶糖基化酶抑制剂结构域UGI的氨基酸序列如SEQ IDNO.4所示。

4.根据权利要求3所述的融合蛋白，其特征在于，所述尿嘧啶糖基化酶抑制剂结构域UGI位于所述Cas蛋白突变体dBhCas12b的C端。

5.根据权利要求3或4所述的融合蛋白，其特征在于，所述胞苷脱氨酶CDA通过连接蛋白1与Cas蛋白突变体dBhCas12b连接，Cas蛋白突变体dBhCas12b通过连接蛋白2与尿嘧啶糖基化酶抑制剂(UGI)结构域连接；

所述CDA和dBhCas12b的连接蛋白1的氨基酸序列为(GSAASR)_n；dBhCas12b和UGI的连接蛋白的氨基酸序列为(GPKKKRKVGT)_n，其中n独立地为1-30的整数。

6.编码权利要求1-5任一所述融合蛋白的基因。

7.含有权利要求6所述基因的表达载体。

8.含有权利要求6所述基因，或权利要求7所述表达载体的重组细胞。

9.根据权利要求8所述的重组细胞，其特征在于，所述重组细胞包括枯草芽孢杆菌或大肠杆菌。

10.权利要求1-5任一所述融合蛋白，或权利要求6所述基因，或权利要求7所述表达载体，或权利要求8或9所述重组细胞在基因表达和/或蛋白质进化中的应用。