CN117327683A

CN117327683A - 一种在DNA的gC基序上实现高效C/G到T/A编辑的高保真LnCBE系统

Info

Publication number: CN117327683A
Application number: CN202311178714.7A
Authority: CN
Inventors: 沈彬; 孙海峰; 沈李宓妮; 冯烨玲; 韩露; 王兆君; 程凯
Original assignee: Nanjing Medical University
Current assignee: Nanjing Medical University
Priority date: 2023-09-13
Filing date: 2023-09-13
Publication date: 2024-01-02

Abstract

本发明公开了一种在DNA的gC基序上实现高效C/G到T/A编辑的高保真LnCBE系统。该编辑系统通过工程化改造Lachnospiraceae bacterium sunii NSJ‑8来源的双链DNA胞嘧啶脱氨基酶DddA结构域的分割蛋白来构建骨架载体，相较于原始版本的脱氨基酶，能够在DNA上实现更加高效的在靶编辑和极低的脱靶编。同时公开了一种DNA双链脱氨基酶免疫抑制蛋白，能够有效抑制LnCBE编辑系统核DNA脱靶编辑。该LnCBE编辑系统可用于制备基因编辑试剂盒，构建C/G到T/A的线粒体DNA致病突变动物模型，为基因编辑技术提供了新的工具。

Description

一种在DNA的gC基序上实现高效C/G到T/A编辑的高保真LnCBE 系统

技术领域

本发明属于基因编辑技术领域，是一种在DNA的gC基序上实现高效C/G到T/A编辑的高保真LnCBE系统。

背景技术

线粒体疾病是一类严重危害人类健康可致残致死的母性遗传疾病，如线粒体脑肌病、共济失调等。线粒体疾病常由细胞核基因突变和线粒体DNA突变引起，特别地，针对线粒体DNA(mtDNA)突变造成的线粒体疾病更是束手无策，其中最重要的原因是缺少线粒体基因编辑工具构建线粒体疾病动物模型，以开展系统的分子机制研究和治疗方法探索。

由于RNA无法进入线粒体，因此现有的基于CRISPR的编辑工具无法用来编辑mtDNA。通过融合线粒体定位信号肽的限制性内切酶、mito-ZFN和mito-TALEN可以对突变的mtDNA引入DNA双链断裂(DSB)，以降低突变mtDNA的比例。然而，这些方法不能实现对mtDNA进行单个碱基的精准编辑，因此不能用来构建mtDNA突变动物疾病模型，也无法用于探索线粒体疾病的精准治疗。

来自Burkholderia cenocepacia的细菌毒素蛋白的DddA功能域即DddA_tox具有双链DNA脱氨基酶活性，通过和TALE相连形成胞嘧啶碱基编辑器(DdCBE)，可以实现线粒体中定点C/G到T/A的突变。但是，原始版本的DdCBE只能对线粒体DNA上的“tC”基序中的C进行编辑，通过噬菌体进化得到的DdCBE突变体V6和V11的版本，提高了编辑效率，拓宽了编辑序列偏好性，但是针对“gC”基序中的C编辑的效率依然很低，且会在全线粒体DNA上造成脱靶编辑，无法实现精准编辑，同时也会在核DNA上造成核脱靶，严重影响了其在生物应用方面的安全性。

发明内容

本发明的目的是针对现有技术的上述不足，提供一种精确高效的DNA胞嘧啶编辑系统LnCBE，并且通过DddI_A抑制其核脱靶编辑，可以实现对“gC”基序中的C进行高效精确编辑。

本发明的另一目的是提供该系统的应用。

本发明的目的可通过以下技术方案实现：

一种双链DNA胞嘧啶脱氨基酶DddA结构域，该DddA结构域为Lachnospiraceaebacterium sunii NSJ-8来源的双链DNA胞嘧啶脱氨基酶DddA结构域，Uniprot ID为A0A7G9FZY2，基因名简称为FZY2。

本发明所述的胞嘧啶脱氨基酶DddA结构域氨基酸序列如SEQ ID NO:1所示。

编码本发明所述的胞嘧啶脱氨基酶DddA结构域的基因。

作为本发明的一种优选，所述的胞嘧啶脱氨基酶DddA结构域的编码基因序列如SEQ ID NO:2所示。

来自本发明所述DddA结构域的分割蛋白，按该DddA的结构域的氨基酸结构特征选择在S100位点进行分割得到一对half DddA的分割蛋白，为：S100N和S100C，分割蛋白成对使用；S100N氨基酸序列如SEQ ID NO:3所示，S100C氨基酸序列如SEQ ID NO:5所示。

编码本发明所述的分割蛋白的基因。

作为本发明的一种优选，编码S100N的核苷酸序列如SEQ ID NO:4所示，编码S100C的核苷酸序列如SEQ ID NO:6所示。

增强版分割蛋白，在上述的分隔蛋白的氨基酸序列中引入突变，用于提高原始蛋白脱氨基酶活性，得到的增强版分割蛋白的氨基酸序列如下所示：S100N-mut1氨基酸序列如SEQ ID NO:7所示，S100N-mut2氨基酸序列如SEQ ID NO:9所示，S100C-mut3氨基酸序列如SEQ ID NO:11所示。

编码本发明所述的增强版分割蛋白的基因。

作为本发明的一种优选，S100N-mut1编码基因序列如SEQ ID NO:8所示，S100N-mut2编码基因序列如SEQ ID NO:10所示；S100C-mut3编码基因序列如SEQ ID NO:12所示。

本发明所述的双链DNA胞嘧啶脱氨基酶DddA结构域或其编码基因、所述的分割蛋白或其编码基因、所述的增强版分割蛋白或其编码基因在构建对gC基序中的C实现高效C/G到T/A的高保真编辑系统LnCBE中的应用,所述的应用不包含对人的疾病治疗。

采用本发明所述的编码增强版分割蛋白的基因构建的胞嘧啶编辑系统LnCBE。

作为本发明的一种优选，所述胞嘧啶编辑系统LnCBE，包括RVD文库、线粒体定位骨架载体和/或细胞核定位骨架载体，用于实现线粒体DNA的C/G到T/A编辑的胞嘧啶编辑系统LnCBE采用MTS-LnCBE骨架载体，用于实现细胞核DNA的C/G到T/A编辑的胞嘧啶编辑系统LnCBE采用NLS-LnCBE骨架载体。

作为本发明的一种优选，5个线粒体定位骨架载体(即MTS-LnCBE骨架载体)分别为：MTS-ccdb-S100N-mut1-UGI、MTS-ccdb-S100N-mut2-UGI、MTS-ccdb-S100N-UGI、MTS-ccdb-S100C-mut3-UGI、MTS-ccdb-S100C-UGI；5个细胞核定位骨架载体(即NLS-LnCBE骨架载体)分别为：NLS-ccdb-S100N-mut1-UGI、NLS-ccdb-S100N-mut2-UGI、NLS-ccdb-S100N-UGI、NLS-ccdb-S100C-mut3-UGI、NLS-ccdb-S100C-UGI。

使用时由于分割蛋白配对使用，因此，相应的线粒体定位骨架载体或细胞核定位骨架载体也应按照S100N-mut1和S100C配对，S100N-mut2和S100C配对，S100N-mut1和S100C-mut3配对，S100N-mut2和S100C-mut3配对的原则配对使用。即：MTS-ccdb-S100N-mut1-UGI和MTS-ccdb-S100C-UGI配对使用，MTS-ccdb-S100N-mut2-UGI和MTS-ccdb-S100C-UGI配对使用，MTS-ccdb-S100N-mut1-UGI和MTS-ccdb-S100C-mut3-UGI配对使用，MTS-ccdb-S100N-mut2-UGI和MTS-ccdb-S100C-mut3-UGI配对使用；NLS-ccdb-S100N-mut1-UGI和NLS-ccdb-S100C-UGI配对使用，NLS-ccdb-S100N-mut2-UGI和NLS-ccdb-S100C-UGI配对使用，NLS-ccdb-S100N-mut1-UGI和NLS-ccdb-S100C-mut3-UGI配对使用，NLS-ccdb-S100N-mut2-UGI和NLS-ccdb-S100C-mut3-UGI配对使用。

作为本发明的一种优选，MTS-TALE骨架载体的核苷酸序列如SEQ ID NO:13所示；NLS-TALE骨架载体的核苷酸序列如SEQ ID NO:14所示；UGI编码基因的核苷酸序列如SEQID NO:15所示。

一种双链DNA胞嘧啶脱氨基酶免疫抑制蛋白DddI_A，该蛋白为Lachnospiraceaebacterium sunii NSJ-8来源的双链DNA胞嘧啶脱氨基酶免疫抑制蛋白，Uniprot ID为A0A7G9FY10，能够抑制LnCBE编辑系统在核DNA中的脱靶编辑；该免疫抑制蛋白的氨基酸序列如SEQ ID NO:18所示。

编码所述的双链DNA胞嘧啶脱氨基酶免疫抑制蛋白DddI_A的基因。

作为本发明的一种优选，编码所述的双链DNA胞嘧啶脱氨基酶免疫抑制蛋白DddI_A的基因核苷酸序列如SEQ ID NO:19所示。

采用本发明所述脱氨基酶免疫抑制蛋白DddI_A、或其所述的基因构建NLS-FZY2-DddI_A载体。

作为本发明的一种优选，所述的NLS-FZY2-DddI_A载体包含细胞核定位骨架载体、Flag标签蛋白及编码FZY2-DddI_A的基因序列。

作为本发明的一种优选，细胞核定位骨架载体的核苷酸序列如SEQ ID NO:20所示；Flag标签蛋白核甘酸序列如SEQ ID NO:21所示。

本发明所述的胞嘧啶编辑系统LnCBE和/或所述的NLS-FZY2-DddI_A载体在线粒体DNA或者细胞核DNA的C/G到T/A编辑中的应用。

本发明所述的双链DNA胞嘧啶脱氨基酶DddA结构域或其编码基因、所述的分割蛋白或其编码基因、所述的增强版分割蛋白或其编码基因、所述的胞嘧啶编辑系统LnCBE和/或所述的NLS-FZY2-DddI_A载体在制备线粒体DNA或细胞核DNA的C/G到T/A编辑的试剂盒中的应用。

一种用于线粒体DNA或细胞核DNA的C/G到T/A编辑的试剂盒，该试剂盒含有本发明所述的双链DNA胞嘧啶脱氨基酶DddA结构域或其编码基因、所述的分割蛋白或其编码基因、所述的增强版分割蛋白或其编码基因、所述的胞嘧啶编辑系统LnCBE和/或所述的NLS-FZY2-DddI_A载体。

作为本发明的一种优选，所述的试剂盒含有选自以下任意一种的组分：

(1)MTS-ccdb-S100N-mut1-UGI和MTS-ccdb-S100C-UGI，

(2)MTS-ccdb-S100N-mut2-UGI和MTS-ccdb-S100C-UGI，

(3)MTS-ccdb-S100N-mut1-UGI和MTS-ccdb-S100C-mut3-UGI，

(4)MTS-ccdb-S100N-mut2-UGI和MTS-ccdb-S100C-mut3-UGI；

(5)NLS-ccdb-S100N-mut1-UGI和NLS-ccdb-S100C-UGI，

(6)NLS-ccdb-S100N-mut2-UGI和NLS-ccdb-S100C-UGI，

(7)NLS-ccdb-S100N-mut1-UGI和NLS-ccdb-S100C-mut3-UGI，

(8)NLS-ccdb-S100N-mut2-UGI和NLS-ccdb-S100C-mut3-UGI，

(9)NLS-ccdb-S100N-mut1-UGI、NLS-ccdb-S100C-UGI和NLS-FZY2-DddI_A，

(10)NLS-ccdb-S100N-mut2-UGI、NLS-ccdb-S100C-UGI和NLS-FZY2-DddI_A，

(11)NLS-ccdb-S100N-mut1-UGI、NLS-ccdb-S100C-mut3-UGI和NLS-FZY2-DddI_A，(12)NLS-ccdb-S100N-mut2-UGI、NLS-ccdb-S100C-mut3-UGI和NLS-FZY2-DddI_A。

进一步说明：

本发明提供的用于实现DNA的C/G到T/A编辑的胞嘧啶编辑系统LnCBE，在于工程化改造已发现的来源于Lachnospiraceae bacterium sunii NSJ-8菌属中的双链DNA胞嘧啶脱氨基结构域DddA_tox(Uniprot ID：A0A7G9FZY2)，基因名简称为FZY2，通过TALE融合增强版本FZY2的DddA_tox分割蛋白和糖基化酶抑制剂(Uracil glycosylase inhibitor,UGI)组成了LnCBE系统，可以提高原始FZY2蛋白脱氨酶活性，实现对靶位点的gC基序中的C进行高效编辑。

该工程化改造后的结构域没有作为DddA结构域进行公开过，但是其原始蛋白的序列是在Uniprot和NCBI等蛋白数据库中是存在的，注释的名称是A0A7G9FZY2。

本发明将Lachnospiraceae bacterium sunii NSJ-8来源的FZY2中的DddA结构域(第1-125位氨基酸)在第100位氨基酸进行分割，产生2种Half DddA,并对这两种分割蛋白进行多个单氨基酸的工程化突变，通过筛选获得有增强效果的改造版本的分割蛋白，分别将改造后的分割蛋白和糖基化酶抑制剂(UGI)通过linker氨基酸序列融合后分别插入到MTS-TALE骨架载体和NLS-TALE骨架载体中，按照S100N-mut1和S100C配对，S100N-mut2和S100C配对，S100N-mut1和S100C-mut3配对，S100N-mut2和S100C-mut3配对的原则，共构建LnCBE-v1.6、LnCBE-v2.3、LnCBE-v2.3、LnCBE-v2.4四种编辑系统，最终获得5个MTS骨架载体和5个NLS骨架载体(如图1和图2所示)。

本发明提供的用于实现DNA的C/G到T/A编辑的胞嘧啶编辑系统LnCBE，包含以下5个MTS-LnCBE骨架载体(见图2)，分别为MTS-ccdb-S100N-mut1-UGI、MTS-ccdb-S100N-mut2-UGI、MTS-ccdb-S100N-UGI、MTS-ccdb-S100C-mut3-UGI、MTS-ccdb-S100C-UGI；和/或，5个NLS-LnCBE骨架载体(见图2)NLS-ccdb-S100N-mut1-UGI、NLS-ccdb-S100N-mut2-UGI、NLS-ccdb-S100N-UGI、NLS-ccdb-S100C-mut3-UGI、NLS-ccdb-S100C-UGI。

本发明提供的用于抑制LnCBE编辑系统核脱靶的NLS-FZY2-DddI_A，来源于新发现的Lachnospiraceae bacterium sunii NSJ-8菌属的双链DNA脱氨基酶免疫抑制蛋白DddI_A，Uniprot ID为A0A7G9FY10。通过同源重组融合核定位信号蛋白和Flag标签蛋白，组成NLS-FZY2-DddI_A(见图2)，可有效抑制LnCBE编辑系统在核基因组上的脱靶编辑。

该免疫抑制蛋白未作为DddI_A进行公开过，但是其整个蛋白的序列是在Uniprot和NCBI等蛋白数据库中是存在的，其功能没有做过探究。

本发明的所有骨架载体匹配于一种TALE组装系统，骨架载体毒素基因ccdb两侧分别含有Bsa I酶切位点，酶切后产生不同的粘性末端用于特异性连接识别特定DNA序列的TALE序列，组装方法见授权专利：一种基于TALE组装的线粒体DNA编辑系统，专利号ZL202110688797.9。

本发明所述的四种LnCBE编辑系统用于双链DNA的C/G到T/A编辑的应用，尤其是对线粒体DNA的编辑应用，针对“gC”基序中的C进行高效编辑。

本发明按照S100N-mut1和S100C配对，S100N-mut2和S100C配对，S100N-mut1和S100C-mut3配对，S100N-mut2和S100C-mut3配对的原则，选择本发明系统中所述的对应的2个LnCBE载体进行配对，将其转染到所要编辑的细胞，通过嘌呤霉素筛选转染成功的细胞，实现DNA“gC”基序中C的编辑。

进一步的，本发明将S100N与S100C进行配对，并和NLS-FZY2-DddI_A载体共转染细胞，实现对细胞核DNA的编辑应用，针对“gC”基序中的C进行高效编辑，且有效抑制LnCBE编辑系统在核基因组上的脱靶编辑。

本发明所述的四种LnCBE编辑系统可以用来探索线粒体或细胞核DNA突变的功能。同时，利用本发明的工具可以在细胞上对突变的DNA进行修复。

本发明的工作原理：将LnCBE系统转染细胞后，可以对编辑位点实现C/G到T/A的编辑，主要通过双链DNA胞嘧啶脱氨基酶进行对要编辑的C进行脱氨基形成dU，进一步通过细胞的复制实现C/G到T/A的编辑。

为了实现线粒体DNA的C/G到T/A编辑，Mok BY等报道的TALE-DddA_tox可以实现线粒体DNA上“tC”序列中的C/G到T/A编辑(Nature.2020Jul；583(7817):631-637.)，同时Li Mi等报道的Simiaoa sunii(Ddd_Ss)可以实现线粒体DNA上“gC”序列中C/G到T/A编辑(NatCommun.2023Feb；14(1):874.)，而本发明开发的DNA编辑系统LnCBE相较于Ddd_Ss能进一步增强线粒体DNA上“gC”序列中高效的C/G到T/A编辑。

本发明有益效果：

本发明主要的创新价值在于对一个双链DNA脱氨基酶进行了工程化改造，增强了原始脱氨蛋白的功能活性，可以实现对双链DNA上任意位置“gC”基序中的C进行高效编辑，并且公开了一种DNA双链脱氨基酶免疫抑制蛋白，能够有效的抑制LnCBE编辑系统的核脱靶效应，使LnCBE可被设计成为gC兼容性更好的mtDNA胞嘧啶编辑器。

附图说明

图1工程化改造LnCBE编辑系统示意图

A为DddA、DddA-V6、DddA-V11以及FZY2氨基酸序列比对结果；B为工程化改造后的FZY2蛋白3D结构图；C为第一轮FZY2氨基酸单突变版本；D为第二轮FZY2氨基酸双突变及三突变版本。

图2四种LnCBE编辑系统的MTS及NLS骨架载体示意图

A为LnCBE系统工作示意图；B为NLS-FZY2-DddI_A载体示意图；C为带有线粒体定位信号(MTS)及核定位信号(NLS)的不同分割类型的四种LnCBE编辑系统，载体携带ccdb基因元件，ccdb位于两个Bsa I酶切位点之间，载体上带有氨苄青霉素抗性元件。

图3 T-Pool表征LnCBE编辑系统特性

A为FZY2不同突变版本在T-Pool中的编辑活性比较；B为四种增强版本LnCBE的四种不同NC-motif的编辑效率情况。

图4四种LnCBE编辑系统在线粒体上GC位点的编辑情况

A，上图为线粒体m.G3635A位点编辑窗口的序列信息，下图为DddA-V11及LnCBE编辑系统对m.G3635A位点窗口内所有序列的编辑情况；B为DddA-V11及LnCBE编辑系统在m.G3635A位点编辑效率比较；C，上图为线粒体m.G8313A位点编辑窗口的序列信息，下图为LnCBE编辑系统对m.G8313A位点窗口内所有序列的编辑情况；D为LnCBE编辑系统在m.G8313A位点编辑效率比较。

图5LnCBE编辑系统在线粒体位点m.G3460A，m.G3635A的脱靶情况A为LnCBE编辑系统在线粒体m.G3635A位点上的脱靶数目以及平均脱靶率；B为LnCBE编辑系统在线粒体m.G8313A位点上的脱靶数目以及平均脱靶率；C为LnCBE编辑系统在线粒体m.G3635A位点上全线粒体靶位点编辑及脱靶情况

图6共表达FZY2-DddI_A对LnCBE编辑系统的核脱靶抑制情况

A为DddA-DddI_A与FZY2-DddI_A的蛋白结构比对；B为共表达DddA-DddI_A与FZY2-DddI_A分别对DddA与FZY2的核脱靶抑制情况；C为共表达DddA-DddI_A与FZY2-DddI_A分别对DddA-G1397NC的核脱靶抑制情况；D为共表达DddA-DddI_A分别对DddA与FZY2的核脱靶抑制情况；E为共表达FZY2-DddI_A对FZY2的核脱靶抑制情况；F为在核基因组位点JAK2上共表达FZY2-DddI_A对FZY2的核脱靶抑制情况；G为共表达FZY2-DddI_A对线粒体G8313位点的核脱靶抑制情况。

具体实施方式

下面结合实施例对本发明做详细说明，借此对如何应用本发明实现DNA的C/G到T/A编辑充分理解并据以实施。

下面结合附图对本发明进一步说明。本发明提供了一种新型DNA编辑工具：LnCBE可以实现C/G到T/A编辑，并通过共表达NLS-FZY2-DddI_A抑制其核脱靶效应，LnCBE系统包括：线粒体定位的有5个载体，细胞核定位的有5个载体。可以选择线粒体定位的LnCBE实现对线粒体DNA的编辑，选择细胞核定位的LnCBE可以实现对细胞核基因组上的编辑。RVD文库可以选择与编辑系统相适应的任意文库，本发明在实施例中采用的文库见CellDiscov.2021Sep3；7(1):78，组装方法见授权专利：一种基于TALE组装的线粒体DNA编辑系统，专利号ZL202110688797.9。实施例未详细描述的步骤、试剂、模块等为本领域技术人员熟知的内容，本申请不再赘述。

实施例1

胞嘧啶编辑系统LnCBE的MTS-LnCBE和NLS-LnCBE骨架载体的构建方法说明如下：

将Lachnospiraceae bacterium sunii NSJ-8来源的双链DNA胞嘧啶脱氨基酶DddA结构域分割成2个half DddA，对2个分割蛋白分别进行工程化氨基酸突变，获得增强版本的分割蛋白，其相互配对并分别和糖基化酶抑制剂(UGI)融合之后，分别插入到MTS-TALE骨架载体的NheⅠ和PmeⅠ这两个酶切位点之间，分别得到5个MTS-LnCBE骨架载体；具体步骤1、根据FZY2与DddA的氨基酸同源比对及蛋白的二级结构，选择DddA-G1397对应的FZY2-S100蛋白分割位点进行分割，得到两个蛋白分割对，随之合成不同分割对的基因片段；2、设计带有16bp的引物，对合成的基因片段及糖基化酶抑制剂(UGI)进行PCR扩增，使不同的蛋白基因片段一端与糖基化酶抑制剂(UGI)一端具有16bp同源臂，两者另一端分别带有Nhe I和Pme I酶切位点同源臂；3、选择带有线粒体定位信号(MTS)、Nhe I和Pme I酶切位点、ccdb毒素基因及氨苄青霉素抗性基因的载体进行酶切，获得两端分别与蛋白基因片段及糖基化酶抑制剂(UGI)基因片段相匹配的同源臂的DNA骨架片段；4、将骨架片段，蛋白基因片段及糖基化酶抑制剂(UGI)基因片段进行同源重组；5、多片段重组的产物转入具有ccdb毒素抗性的感受态细胞trans DB3.1后经氨苄青霉素筛选，选取单克隆进行Sanger测序验证，获得测序结果正确的5个MTS-LnCBE骨架载体：MTS-ccdb-S100N-mut1-UGI、MTS-ccdb-S100N-mut2-UGI、MTS-ccdb-S100N-UGI、MTS-ccdb-S100C-mut3-UGI、MTS-ccdb-S100C-UGI；据此同样的方法，将Lachnospiraceae bacterium sunii NSJ-8来源的双链DNA胞嘧啶脱氨基酶DddA结构域分割成2个half DddA，对2个分割蛋白分别进行工程化氨基酸突变，获得增强版本的分割蛋白，其相互配对并分别和糖基化酶抑制剂(UGI)融合之后，分别插入到NLS-TALE骨架载体的NheⅠ和PmeⅠ这两个酶切位点之间，分别得到5个NLS-LnCBE骨架载体：NLS-ccdb-S100N-mut1-UGI、NLS-ccdb-S100N-mut2-UGI、NLS-ccdb-S100N-UGI、NLS-ccdb-S100C-mut3-UGI、NLS-ccdb-S100C-UGI。

以上所述的MTS-TALE骨架载体包含的主要元件5’端到3’端依次为：线粒体定位信号(MTS)序列、TALE-N端(NTD)136个氨基酸的核苷酸序列、ccdb毒素基因、TALE-C末端(CTD)41个氨基酸的核苷酸序列、嘌呤霉素细胞药筛基因、氨苄青霉素抗性元件；NLS-TALE骨架载体包含的主要元件5’端到3’端依次为：细胞核定位信号(NLS)序列、TALE-N端(NTD)136个氨基酸的核苷酸序列、ccdb毒素基因、TALE-C端(CTD)63个氨基酸的核苷酸序列、嘌呤霉素细胞药筛基因、氨苄青霉素抗性元件。

S100N的核苷酸序列如SEQ ID NO:4所示，S100C的核苷酸序列如SEQ ID NO:6所示，S100N-mut1的核苷酸序列如SEQ ID NO:8所示，S100N-mut2的核苷酸序列如SEQ ID NO:10所示；S100C-mut3的核苷酸序列如SEQ ID NO:12所示，MTS-TALE骨架载体的核苷酸序列如SEQ ID NO:13所示，NLS-TALE骨架载体的核苷酸序列如SEQ ID NO:14所示，UGI编码基因的核苷酸序列如SEQ ID NO:15所示。

所有骨架载体匹配于一种TALE组装系统，骨架载体毒素基因ccdb两侧分别含有Bsa I酶切位点，酶切后产生不同的粘性末端用于特异性连接识别特定DNA序列的TALE序列。

实施例2

利用细胞核定位的NLS版本的LnCBE，在人293FT细胞中对靶向的T载体进行编辑。

(一)设计TALE序列和LnCBE的组装

构建Spacer内包含不同motif的T载体(6xNNC、6xNCN、6xCNN、JAK2、SIRT6)，Spacer两端还有相同的识别序列及4bp不同长度的碱基序列作为后续拆分index，将不同motif的T载体(共38个)按照等纳克数混合成T-Pool，测定总体浓度。将靶向T载体识别不同DNA碱基的RVD模块(Cell Discov.2021Sep3；7(1):78)通过Golden Gate的方法分别组装到LnCBE骨架载体上，组装方法见授权专利：一种基于TALE组装的线粒体DNA编辑系统，专利号ZL202110688797.9。

将组装的产物转化DH5α并采用含有氨苄青霉素的固体LB培养板进行筛选，之后挑取单克隆并使用下述引物进行PCR鉴定，引物序列如SEQ ID NO:16、17所示。根据RVD数量，判断阳性的克隆，如16个RVD大小应为1759bp，15个RVD大小应为1657bp。之后，使用上述引物进行正反测序，序列正确的阳性克隆提取质粒用于后续实验。

(二)转染细胞进行检测不同组合LnCBE的编辑效率

选择293FT细胞作为编辑对象，在细胞密度达到70-90％时，提前2小时换液，细胞计数后，取1.5x10⁵个细胞用于细胞电转染(仪器：Lonza4D-nucleofector)。将5个NLS版本的Half-DddA的载体按照S100N-mut1和S100C配对，S100N-mut2和S100C配对，S100N-mut1和S100C-mut3配对，S100N-mut2和S100C-mut3配对的原则进行组合与包含不同motif的T载体进行电转细胞293FT细胞。左右两端的载体各转染400ng，T-Pool 50ng使用SF-Cell Line4D-nucleofector X-kit电转染细胞。

电转染完成后，将细胞接入12孔板中并培养24小时，接着使用含有1μg/mL的嘌呤霉素进行细胞筛选，培养72小时后将细胞消化离心，并收取细胞用于检测DNA突变效率。

收取的细胞样品DNA提取方式如下：采用30μL的QuickExtract^TM DNA ExtractionSolution(Lucigen)重选细胞，之后65℃加热45min，接着98°C加热2min。

采用2Green Taq Mix(Vazyme)扩增T载体或线粒体DNA上含有编辑位点的目的片段，之后用于Sanger测序；或采用Phanta Super-Fidelity DNA polymerase(Vazyme)及高通量测序建库引物进行高通量测序分析编辑效率。如图2和图3所示，L-S100N-mut1+R-S100C(LnCBE-v1.6)；L-S100N-mut2+R-S100C(LnCBE-v2.1)；L-S100N-mut1+R-S100C-mut3(LnCBE-v2.3)；L-S100N-mut2+R-S100C-mut3(LnCBE-v2.4)(L为左端，R为右端)，高通量测序的结果显示，LnCBE增强版本系统(v1.6、v2.1、v2.3、v2.4)相较于原始LnCBE编辑系统(FZY2)，其针对“gC”基序中的C进行高效的编辑的能力有明显提升。

实施例3

利用线粒体定位的MTS版本的LnCBE，在人293FT细胞中线粒体DNA进行编辑。

选择人类线粒体DNA(参考序列版本：NC_012920.1)上m.G8313A,m.G3635A位点进行编辑(如图4的上部分所示)，根据这些位点的附近的DNA序列，设计识别的TALE序列，将识别的不同DNA碱基的RVD模块通过Golden Gate的方法分别组装到5个线粒体定位的LnCBE的骨架载体上。

将组装的产物转化DH5α并采用含有氨苄青霉素的固体LB培养板进行筛选，之后挑取单克隆并使用下述引物进行PCR鉴定，引物序列如SEQ ID NO:16及SEQ ID NO:17所示。根据RVD数量，判断阳性的克隆，如16个RVD大小应为1759bp，15个RVD大小应为1657bp。之后，使用上述引物进行正反测序，序列正确的阳性克隆提取质粒用于后续实验。

按实施例2中后面相同的操作流程，每个位点的的四个组合分别转染293FT细胞，并进行收集细胞，提取DNA进行构建全线粒体文库，进行突变效率分析。如图4所示，L-S100N-mut1+R-S100C(LnCBE-v1.6)；L-S100N-mut2+R-S100C(LnCBE-v2.1)；L-S100N-mut1+R-S100C-mut3(LnCBE-v2.3)；L-S100N-mut2+R-S100C-mut3(LnCBE-v2.4)(L为左端，R为右端)，LnCBE增强版本系统(v1.6、v2.1、v2.3、v2.4)相较于原始LnCBE编辑系统(FZY2)，其针对线粒体内源性“gC”位点能进行高效的编辑的能力明显提升，显示其高效且特异对“gC”基序中C的编辑效果。如图5所示,针对“gC”位点的编辑相应的平均脱靶率及脱靶数目，LnCBE编辑系统均低于DddA-V11,表明LnCBE编辑系统对“gC”高效，特异且高保真的特性。

实施例4

针对LnCBE编辑系统核脱靶抑制的NLS-FZY2-DddIA载体的构建方法说明如下：

将Lachnospiraceae bacterium sunii NSJ-8菌属的双链DNA脱氨基酶免疫抑制蛋白FZY2-DddI_A与Flag标签蛋白融合后插入到NLS-骨架载体的NheI和PmlI这两个酶切位点之间，得到NLS-FZY2-DddI_A，具体步骤为：设计带有16bp同源臂的引物，对合成的基因片段DddI_A与Flag标签蛋白进行PCR扩增，使合成的DddI_A一端与Flag一端具有16bp同源臂，两者分别带有NheI和PmlI两个酶切位点同源臂；然后将骨架片段、Flag和DddI_A基因片段进行同源重组，将重组产物转入感受态细胞trans 5后经氨苄青霉素筛选，选取单克隆进行Sanger测序验证，获得测序结果正确的NLS-FZY2-DddI_A。

以上所述FZY2-DddI_A氨基酸序列为SEQ ID NO:18，编码序列为SEQ ID NO:19，NLS-骨架载体核苷酸序列为SEQ ID NO:,20，Flag标签蛋白的核苷酸序列为SEQ ID NO:21。

按实施例2中后面相同的操作流程，将NLS-FZY2-DddI_A载体与实施例2的LnCBE系统共转染293FT细胞，并进行收集细胞，提取DNA构建长片段扩增子文库，进行突变效率分析。如图6所示，通过共表达NLS-FZY2-DddI_A载体，LnCBE编辑系统对于细胞核DNA的脱靶编辑明显被抑制，表明FZY2-DddI_A免疫抑制蛋白可以有效抑制LnCBE编辑系统核脱靶。

本发明实施例中仅是以一种编码序列构建载体验证技术方案的可行性和技术效果，任何编码本发明所述的双链DNA胞嘧啶脱氨基酶DddA结构域、分隔蛋白、增强分割蛋白、双链DNA胞嘧啶脱氨基酶免疫抑制蛋白DddI_A的基因都在本发明的保护范围内，均可以用于本发明技术方案的实施，产生与上述实施例相似或相同的技术效果，解决本发明的技术问题。

Claims

1.一种双链DNA胞嘧啶脱氨基酶DddA结构域，其特征在于该DddA结构域为Lachnospiraceae bacterium sunii NSJ-8来源的双链DNA胞嘧啶脱氨基酶DddA结构域，Uniprot ID为A0A7G9FZY2，基因名简称为FZY2。

2.根据权利要求1所述的胞嘧啶脱氨基酶DddA结构域，其特征在于该DddA结构域的氨基酸序列如SEQ ID NO:1所示。

3.编码权利要求1所述的胞嘧啶脱氨基酶DddA结构域的基因。

4.来自权利要求1所述DddA结构域的分割蛋白，其特征在于，按该DddA的结构域的氨基酸结构特征选择在S100位点进行分割得到一对half DddA的分割蛋白，为：S100N和S100C，分割蛋白成对使用；S100N氨基酸序列优选如SEQ ID NO:3所示，S100C氨基酸序列优选如SEQ ID NO:5所示。

5.编码权利要求4所述的分割蛋白的基因。

6.增强版分割蛋白，其特征在于，在权利要求4中所述的分隔蛋白的氨基酸序列中引入突变，用于提高原始蛋白脱氨基酶活性，得到的增强版分割蛋白的氨基酸序列如下所示：S100N-mut1氨基酸序列如SEQ ID NO:7所示，S100N-mut2氨基酸序列如SEQ ID NO:9所示，S100C-mut3氨基酸序列如SEQ ID NO:11所示。

7.编码权利要求6所述的增强版分割蛋白的基因。

8.权利要求1所述的双链DNA胞嘧啶脱氨基酶DddA结构域、权利要求3所述的基因、权利要求4所述的分割蛋白、权利要求5所述的基因、权利要求6所述的增强版分割蛋白、权利要求7所述的基因在构建对gC基序中的C实现高效C/G到T/A的高保真编辑系统LnCBE中的应用。

9.采用权利要求7所述的基因构建的胞嘧啶编辑系统LnCBE。

10.根据权利要求9所述胞嘧啶编辑系统LnCBE，包括RVD文库、线粒体定位骨架载体和/或细胞核定位骨架载体，其特征在于，用于实现线粒体DNA的C/G到T/A编辑的胞嘧啶编辑系统LnCBE采用MTS-LnCBE骨架载体，用于实现细胞核DNA的C/G到T/A编辑的胞嘧啶编辑系统LnCBE采用NLS-LnCBE骨架载体。

11.根据权利要求10所述胞嘧啶编辑系统LnCBE，其特征在于，5个MTS-LnCBE骨架载体分别为：MTS-ccdb-S100N-mut1-UGI、MTS-ccdb-S100N-mut2-UGI、MTS-ccdb-S100N-UGI、MTS-ccdb-S100C-mut3-UGI、MTS-ccdb-S100C-UGI；5个NLS-LnCBE骨架载体分别为：NLS-ccdb-S100N-mut1-UGI、NLS-ccdb-S100N-mut2-UGI、NLS-ccdb-S100N-UGI、NLS-ccdb-S100C-mut3-UGI、NLS-ccdb-S100C-UGI。

12.根据权利要求11所述胞嘧啶编辑系统LnCBE，其特征在于，MTS-TALE骨架载体的核苷酸序列如SEQ ID NO:13所示；NLS-TALE骨架载体的核苷酸序列如SEQ ID NO:14所示；UGI编码基因的核苷酸序列如SEQ ID NO:15所示。

13.一种双链DNA胞嘧啶脱氨基酶免疫抑制蛋白DddI_A，其特征在于该蛋白为Lachnospiraceae bacterium sunii NSJ-8来源的双链DNA胞嘧啶脱氨基酶免疫抑制蛋白，Uniprot ID为A0A7G9FY10，能够抑制LnCBE编辑系统在核DNA中的脱靶编辑；优选该免疫抑制蛋白的氨基酸序列如SEQ ID NO:18所示。

14.编码权利要求13所述的双链DNA胞嘧啶脱氨基酶免疫抑制蛋白DddI_A的基因。

15.采用权利要求13所述脱氨基酶免疫抑制蛋白DddI_A、权利要求14所述的基因构建NLS-FZY2-DddI_A载体。

16.根据权利要求15所述的NLS-FZY2-DddI_A载体，其特征在于包含细胞核定位骨架载体、Flag标签蛋白及FZY2-DddI_A。

17.根据权利要求15所述的NLS-FZY2-DddI_A载体，其特征在于，细胞核定位骨架载体的核苷酸序列如SEQ ID NO:20所示；Flag标签蛋白核甘酸序列如SEQ ID NO:21所示。

18.权利要求9-12中任一所述的胞嘧啶编辑系统LnCBE和/或权利要求15-17所述的NLS-FZY2-DddI_A载体在线粒体DNA或者细胞核DNA的C/G到T/A编辑中的应用，所述的应用不包含对人的疾病治疗。

19.权利要求1所述的双链DNA胞嘧啶脱氨基酶DddA结构域、权利要求3所述的基因、权利要求4所述的分割蛋白、权利要求5所述的基因、权利要求6所述的增强版分割蛋白、权利要求7所述的基因、权利要求9-12中任一所述的胞嘧啶编辑系统LnCBE和/或权利要求15-17所述的NLS-FZY2-DddI_A载体在制备线粒体DNA或细胞核DNA的C/G到T/A编辑的试剂盒中的应用。

20.一种用于线粒体DNA或细胞核DNA的C/G到T/A编辑的试剂盒，其特征在于，该试剂盒含有权利要求1所述的双链DNA胞嘧啶脱氨基酶DddA结构域、权利要求3所述的基因、权利要求4所述的分割蛋白、权利要求5所述的基因、权利要求6所述的增强版分割蛋白、权利要求7所述的基因、权利要求9-12中任一所述的胞嘧啶编辑系统LnCBE和/或权利要求15-17所述的NLS-FZY2-DddI_A载体。