WO2023015759A1

WO2023015759A1 - 一种无pam限制的腺嘌呤碱基编辑器融合蛋白及应用

Info

Publication number: WO2023015759A1
Application number: PCT/CN2021/131279
Authority: WO
Inventors: 马旭; 曹小芳; 金孝华
Original assignee: 国家卫生健康委科学技术研究所
Priority date: 2021-08-10
Filing date: 2021-11-17
Publication date: 2023-02-16
Also published as: US20230406893A1; CN113699135A; CN113699135B

Abstract

一种无PAM限制的腺嘌呤碱基编辑器融合蛋白及应用。提供了一种突变体多肽，所述多肽自N端至C端依次包括SpRY(D10A)的N端片段、TadA8e片段和SpRY(D10A)多肽的C端片段。含有所述突变体多肽的融合蛋白可以靶向全基因组，拓宽了基因组的可编辑范围；能够更高效率地引起A:T到G:C的碱基转换，具有很大的应用潜力，包括但不限于基因疾病致病性位点的模拟或修复；且造成转录组水平上的脱靶更低，兼顾效率高和脱靶低的突变体形式。

Description

一种无PAM限制的腺嘌呤碱基编辑器融合蛋白及应用

技术领域

本公开属于生物医药领域，涉及一种无PAM限制的腺嘌呤碱基编辑器融合蛋白及应用。

背景技术

CRISPR/Cas9系统最初发现于细菌和古细菌中，后经过优化和改造形成强大的基因编辑工具，被广泛应用于DNA的敲除、敲入、修饰等研究。CRISPR/Cas9系统由Cas9核酸酶和识别靶序列的sgRNA两部分组成，sgRNA与靶序列互补配对介导Cas9核酸酶对基因组的定向切割，造成双链DNA断裂(double strand break,DSB)后，利用细胞中的修复机制同源重组(有模板情况下)和非同源末端连接(无模板情况下)实现靶向位点的编辑 ^[1,2]。随后，David Liu等人构建RuvC结构域失活的nickase Cas9(nCas9)，并在此基础上开发出单碱基编辑系统即胞嘧啶碱基编辑器(cytosine base editor,CBE)和腺嘌呤碱基编辑器(adenine base editor,ABE)，两种碱基编辑器在不引起DNA双链断裂的情况下可分别实现C:G到T:A、A:T到G:C的碱基转换，极大提升了单碱基编辑的效率和安全性 ^[2,3]。

ABE由腺嘌呤脱氨酶和nCas9融合而成，根据ClinVar数据库收录的数据，与人类疾病相关的基因变异有58％是点突变，而其中47％的致病点突变可通过ABE介导的A:T到G:C的碱基转换得到修复 ^[4]。已有大量研究显示ABE在疾病修复领域的应用价值。例如，通过病毒递送ABE和相应的sgRNA至杜氏肌营养不良的小鼠肌肉中，可修复致病基因DMD的无义突变 ^[5]；通过脂质纳米颗粒递送mRNA形式的ABE至患酪氨酸血症的成年小鼠肝脏中，修复了致病性的剪切位点变异，恢复肝细胞中FAH的表达 ^[6]。但ABE对于位点的编辑受到编辑窗口和PAM序列的限制，应用最为广泛的ABEmax识别的PAM序列为NGG，为进一步拓展碱基编辑器的编辑范围，识别不同PAM序列的ABE相继出现，如识别PAM序列为NG的xABE和ABE-NG ^[7]，其中PAM限制最为宽松的是2020年3月发表的ABEmax-SpRY，其PAM序列为NRN(R代表A、G)和NYN(Y代表C、T) ^[8]。ABEmax-SpRY可以靶向基因组的所有序列，但是ABEmax-SpRY编辑效率较低，且未解决ABE存在的在转录组水平上的脱靶问题，限制了该碱基编辑器的应用，需要对其进行改进和优化。

发明内容

一些实施方案中，本公开了提供了一种分离的突变体多肽，所述多肽自N端至C端依次包括SpRY(D10A)的N端片段、TadA8e片段和SpRY(D10A)多肽的C端片段。

一些实施方案中，所述SpRY(D10A)蛋白N端片段的氨基酸序列与如SEQ ID NO:1所示的氨基酸序列具有至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％或至少99.5％或至少99.8％或至少99.9％、或100％的序列同一性，或所述TadA8e片段的氨基酸序列与如SEQ ID NO:3所示的氨基酸序列具有至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％或至少99.5％或至少99.8％或至少99.9％、或100％的序列同一性，或所述SpRY(D10A)蛋白C端片段的氨基酸序列与如SEQ ID NO:5所示的氨基酸序列具有至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％或至少99.5％或至少99.8％或至少99.9％、或100％的序列同一性。

一些实施方案中，所述SpRY(D10A)蛋白N端片段的氨基酸序列如SEQ ID NO:1所示，所述TadA8e片段的氨基酸序列如SEQ ID NO:3所示，所述SpRY(D10A)蛋白C端片段的氨基酸序列如SEQ ID NO:5所示。

一些实施方案中，编码所述SpRY(D10A)蛋白N端片段的核苷酸序列与如SEQ ID NO:2所示的核苷酸序列具有至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％或至少99.5％或至少99.8％或至少99.9％、或100％的序列同一性。

一些实施方案中，编码所述SpRY(D10A)蛋白N端片段的核苷酸序列如SEQ ID NO:2所示。

一些实施方案中，编码所述TadA8e片段的核苷酸序列与如SEQ ID NO:4所示的核苷酸序列具有至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％或至少99.5％或至少99.8％或至少99.9％、或100％的序列同一性。

一些实施方案中，编码所述TadA8e片段的核苷酸序列如SEQ ID NO:4所示。

一些实施方案中，编码所述SpRY(D10A)蛋白C端片段的核苷酸序列与如SEQ ID NO:6所示的核苷酸序列具有至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％或至少99.5％或至少99.8％或至少99.9％、或100％的序列同一性。

一些实施方案中，编码所述SpRY(D10A)蛋白C端片段的核苷酸序列如SEQ ID NO:6所示。

一些实施方案中，所述突变体多肽用于基因编辑。

一些实施方案中，所述基因编辑的编辑窗口约为3～10位。

一些实施方案中，所述基因编辑的编辑窗口约为8～10位。

一些实施方案中，所述突变体多肽包含与如SEQ ID NO:13所示的序列具有至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％或至少99.5％或至少99.8％或至少99.9％、或100％的序列同一性的氨基酸序列。

一些实施方案中，所述突变体多肽包含如SEQ ID NO:13所示的序列。

一些实施方案中，本公开提供了一种分离的融合蛋白，包含所述的突变体多肽。

在一些实施方案中，含有所述突变体多肽的融合蛋白可以靶向全基因组，拓宽了基因组的可编辑范围；能够更高效率地引起A:T到G:C的碱基转换，具有很大的应用潜力，包括但不限于基因疾病致病性位点的模拟或修复。一些实施例中，含有所述突变体多肽的融合蛋白拓宽了碱基编辑窗口；且造成转录组水平上的脱靶更低，兼顾效率高和脱靶低的突变体形式。

一些实施方案中，相较于现有的腺嘌呤碱基编辑器突变体，ABEmax-SpRY无PAM限制，有效提高了基因组的可靶向范围，但是其编辑活性不高。

在一些实施方案中，发明人用ABE8e中的腺嘌呤脱氨酶TadA8e代替ABEmax-SpRY中的腺嘌呤脱氨酶二聚体，构建形成8e-SpRY，8e-SpRY相比于ABEmax-SpRY不仅能够更高效率地引起碱基转换，还拓宽了碱基编辑窗口。

在一些实施方案中，发明人又在8e-SpRY的基础上构建了4种突变体，分别为CE-8e-SpRY、V106W-SpRY、8e-SpRY-HF和V106W-SpRY-HF。综合评价编辑效率和脱靶后，CE-8e-SpRY是兼顾效率高和脱靶低的突变体形式。

一些实施方案中，所述融合蛋白还包括连接肽，连接肽位于SpRY(D10A)蛋白N端片段与TadA8e片段之间，和/或位于TadA8e片段与SpRY(D10A)蛋白C端片段之间。

一些实施方案中，所述连接肽序列与如SEQ ID NO:7所示的氨基酸序列具有至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％或至少99.5％或至少99.8％或至少99.9％、或100％的序列同一性。

一些实施方案中，所述连接肽氨基酸序列如SEQ ID NO:7所示。

一些实施方案中，编码所述连接肽的核苷酸序列与如SEQ ID NO:8所示的核苷酸序列具有至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％或至少99.5％或至少99.8％或至少99.9％、或100％的序列同一性。

一些实施方案中，编码所述连接肽的核苷酸序列如SEQ ID NO:8所示。

一些实施方案中，所述融合蛋白还包括核定位信号片段。

一些实施方案中，所述核定位信号片段位于所述融合蛋白的N端和/或C端。

一些实施方案中，所述核定位信号片段的氨基酸序列与如SEQ ID NO:9和/或SEQ ID NO:11所示的氨基酸序列具有至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％或至少99.5％或至少99.8％或至少99.9％、或100％的序列同一性。

一些实施方案中，所述核定位信号片段的氨基酸序列如SEQ ID NO:9和/或SEQ ID NO:11所示。

一些实施方案中，所述核定位信号的核苷酸序列与如SEQ ID NO:10或12所示的核苷酸序列具有至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％或至少99.5％或至少99.8％或至少99.9％、或100％的序列同一性。

一些实施方案中，所述核定位信号的核苷酸序列如SEQ ID NO:10或12所示。

一些实施方案中，所述核定位信号片段包括约两个拷贝。

一些实施方案中，所述融合蛋白的氨基酸序列包含与如SEQ ID NO:13所示的氨基酸序列具有至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％或至少99.5％或至少99.8％或至少99.9％、或100％的序列同一性的氨基酸序列。

一些实施方案中，所述融合蛋白的氨基酸序列包含如SEQ ID NO:13所示的序列。

一些实施方案中，所述融合蛋白在突变位点位于编辑窗口第3-10位时可实现有效的编辑。

一些实施方案中，所述融合蛋白在突变位点位于编辑窗口第8-10位时可实现有效的编辑。

一些实施方案中，所述融合蛋白在突变位点位于编辑窗口第10位时可实现有效的编辑。

一些实施方案中，所述融合蛋白用于基因编辑。

一些实施方案中，所述基因编辑的编辑窗口约为3～10位。

一些实施方案中，所述基因编辑的编辑窗口约为8～10位。

一些实施方案中，本公开提供了一种编码所述的突变体多肽或所述的融合蛋白的多核苷酸或其互补序列。

一些实施方案中，所述多核苷酸为核酸构建体。

一些实施方案中，本公开提供了一种载体，所述载体包含所述的多核苷酸。

一些实施方案中，所述载体为重组表达载体。

一些实施方案中，所述载体骨架选自pCMV或其衍生质粒。

一些实施方案中，所述pCMV的衍生质粒包括ABEmax-SpRY。

一些实施方案中，所述载体包括质粒或病毒载体。

一些实施方案中，所述载体是用于在高等真核细胞或原核细胞中表达的质粒或病毒载体。

一些实施方案中，所述真核细胞选自脑神经瘤细胞或胚胎肾细胞。

一些实施方案中，所述人胚胎肾细胞包括HEK293T细胞。

一些实施方案中，所述脑神经瘤细胞包括N2a细胞。

一些实施方案中，本公开提供了一种产所述载体的方法，在骨架质粒中加入编码SpRY(D10A)蛋白N端片段的多核苷酸、编码TadA8e片段的多核苷酸和编码SpRY(D10A)蛋白C端片段的多核苷酸，由此获得所述的载体。

一些实施方案中，所还载体包括质粒或病毒载体。

一些实施方案中，所述骨架质粒包括pCMV或其衍生质粒ABEmax-SpRY。

一些实施方案中，所述人胚胎肾细胞包括HEK293T细胞。

一些实施方案中，所述脑神经瘤细胞包括N2a细胞。

一些实施方案中，所述方法包括从所述衍生质粒ABEmax-SpRY中去除TadA片段，并用TadA8e替换SpRY(D10A)中1048位至1063位的氨基酸，构建得所述重组表达载体。

一些实施方案中，所述载体为CE-8e-SpRY质粒。

一些实施方案中，本公开提供了一种sgRNA。

一些实施方案中，所述sgRNA的序列包括如SEQ ID NO：18-65所示的序列。

一些实施方案中，本公开提供了一种表达系统，所述表达系统含有所述的表达载体或其基因组中整合有外源的所述的多核苷酸。

一些实施方案中，所述表达系统表达所述的融合蛋白或其基因组中整合的外源序列表达所述的融合蛋白或所述表达系统表达含有所述的多核苷酸或其基因组中整合有外源的如上所述的多核苷酸。

一些实施方案中，所述表达系统还含有RNA。

一些实施方案中，所述RNA是引导RNA。

一些实施方案中，所述RNA是sgRNA。

一些实施方案中，所述sgRNA的序列包括与如SEQ ID NO：18-65所示的序列具有至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％或至少99.5％或至少99.8％或至少99.9％、或100％的序列同一性的序列。

一些实施方案中，本公开提供了一种宿主细胞，包含所述的多核苷酸或所述的载体或所述的表达系统。

一些实施方案中，本公开提供了一种组合物，包含有效量的所述的突变体多肽，所述的融合蛋白，所述的多核苷酸，所述的载体或所述的宿主细胞中的至少一种。

一些实施方案中，所述组合物为试剂盒。

一些实施方案中，所述组合物还含有RNA。

一些实施方案中，所述RNA是引导RNA。

一些实施方案中，所述RNA是sgRNA。

一些实施方案中，本公开提供了一种任一所述的突变体多肽或所述的融合蛋白或所述的多核苷酸或所述的载体或所述的表达系统或所述的宿主细胞在制备治疗基因疾病的药物中的应用。

一些实施方案中，本公开提供了一种任一所述的突变体多肽或所述的融合蛋白或所述的多核苷酸或所述的载体或所述的表达系统或所述的宿主细胞在制备基因编辑试剂中的应用。

一些实施方案中，所述基因编辑的编辑窗口约为3～10位。

一些实施方案中，所述基因编辑的编辑窗口约为8～10位。

一些实施方案中，本公开提供了一种碱基编辑系统，包含任一所述的突变体多肽或所述的融合蛋白或所述的多核苷酸或所述的载体或所述的表达系统或所述的宿主细胞。

一些实施方案中，所述碱基编辑系统还含有RNA。

一些实施方案中，所述RNA是引导RNA。

一些实施方案中，所述RNA是sgRNA。

一些实施方案中，本公开提供了一种基因编辑方法，通过所述的碱基编辑系统进行基因编辑。

一些实施方案中，所述基因编辑的编辑窗口约为3～10位。

一些实施方案中，所述基因编辑的编辑窗口约为8～10位。

一些实施方案中，本公开提供了一种方法，用于重组产生任一所述的突变体多肽或所述的融合蛋白，包括步骤：将所述的载体引入宿主细胞以产生转染的或感染的宿主细胞，体外培养所述转染的或感染的宿主细胞，回收细胞培养物并任选地纯化所产生的突变体多肽或融合蛋白。

一些实施方案中，本公开提供了一种所述的突变体多肽或所述的融合蛋白的制备方法，包括：(1)在骨架质粒中加入编码SpRY(D10A)蛋白N端片段的多核苷酸、编码TadA8e片段的多核苷酸和编码SpRY(D10A)蛋白C端片段的多核苷酸，由此获得重组表达载体；(2)转染所述重组表达载体至宿主细胞使其表达所述突变体多肽或所述融合蛋白。

一些实施方案中，所述方法包括从所述衍生质粒ABEmax-SpRY中去除TadA二聚体，并用TadA8e替换SpRY(D10A)中1048位至1063位的氨基酸，构建得所述重组表达载体。

一些实施方案中，所还载体质粒或病毒载体。

一些实施方案中，所述人胚胎肾细胞包括HEK293T细胞。

一些实施方案中，所述脑神经瘤细胞包括N2a细胞。

一些实施方案中，本公开提供了一种产生所述载体的方法，包括步骤：将所述载体引入至适宜的细胞系，在适宜条件下培养所述细胞系从而使所述目的载体能够产生，从所述细胞系的培养物回收所产生的质粒和任选地纯化所述质粒。

一些实施方案中，本公开提供了一种基因疾病的治疗方法，包括以下步骤：向受试者施予一定量的对所述基因疾病有效的所述的突变体多肽，所述的融合蛋白，所述的多核苷酸中的至少一种，或其任意组合。

一些实施方案中，所述基因疾病包括包括苯丙酮尿症。

在一些实施方案中，上述的蛋白为分离的多肽。

在一些实施方案中，上述的多肽为分离的多肽。

在一些实施方案中，上述的核酸为分离的多核酸。

附图说明

图1为ABEmax-SpRY和8e-SpRY及其突变体的示意图。

图2-图7为ABEmax-SpRY和8e-SpRY在PAM为NNN时的编辑效率。

图8为ABEmax-SpRY和8e-SpRY多点编辑效率的统计结果。

图9为ABEmax-SpRY和8e-SpRY的编辑窗口。

图10-图15为8e-SpRY及其突变体在PAM为NNN时的编辑效率。

图16为8e-SpRY及其突变体多点编辑效率的统计结果。

图17为8e-SpRY及其突变体在PAM为NAN、NGN、NCN和NTN时多点编辑效率的统计结果。

图18为8e-SpRY及其突变体的编辑窗口。

图19为ABEmax-SpRY、8e-SpRY及其突变体的DNA靶向编辑效率。

图20为ABEmax-SpRY、8e-SpRY及其突变体的RNA脱靶量。

图21为ABEmax-SpRY、8e-SpRY及其突变体A-to-I的RNA脱靶示意图。

图22为PKU 728 G>A细胞模型基因型的sanger测序图以及8种修复sgRNA修复效率的sanger测序图。

图23为3种有修复效果的sgRNA修复效率的柱状图。

图24为其他3种ABE突变体修复效率的sanger测序图。

具体实施方式

以下通过具体的实施例进一步说明本公开的技术方案，具体实施例不代表对本公开保护范围的限制。其他人根据本公开理念所做出的一些非本质的修改和调整仍属于本公开的保护范围。

苯丙酮尿症(Phenylketonuria，简称PKU)是先天代谢性疾病的一种，本症是由于染色体基因突变导致肝脏中苯丙氨酸羟化酶(PAH)缺陷从而引起苯丙氨酸(PA)代谢障碍所致。

实施例1碱基编辑器质粒的构建

首先构建8e-SpRY以及相应的突变体。参照ClonExpress MultiS One Step Cloning Kit(Vazyme,C113-01)说明书设计引物，扩增ABE8e(Addgene#138489)中的TadA8e片段，并用TadA8e替代ABEmax-SpRY(Addgene#140003)中的TadA二聚体，构建得到8e-SpRY质粒。

先将8e-SpRY中的TadA8e从原位置删除，再用TadA8e替代SpRY D10A中第1048位至1063位的氨基酸，构建得到CE-8e-SpRY质粒，从5’端到3’端的顺序依次为SpRY(D10A)N端、TadA8e和SpRY(D10A)C端，其中SpRY(D10A)N端的核苷酸序列如SEQ ID NO:2(氨基酸序列如SEQ ID NO:1所示)，TadA8e的核苷酸序列如SEQ ID NO:4(氨基酸序列如SEQ ID NO:3所示)，SpRY(D10A)C端的核苷酸序列如SEQ ID NO:6(氨基酸序列如SEQ ID NO:5所示)。

将8e-SpRY中的TadA8e进行V106W突变，得到V106W-SpRY，其中TadA8e V106W核苷酸序列如SEQ ID NO:15，SpRY D10A核苷酸序列如SEQ ID NO:16。

将8e-SpRY中的SpRY D10A进行N497A,R661A,Q695A，和Q926A突变，得到8e-SpRY-HF，其中SpRY D10A-HF核苷酸序列如SEQ ID NO:17。

将8e-SpRY-HF中的TadA8e进行V106W突变，得到V106W-SpRY-HF。

8e-SpRY及其突变体两端均携带核定位信号，核定位信号为bpNLS(核定位信号的核苷酸序列如SEQ ID NO:10所示；氨基酸序列如SEQ ID NO:9所示)或SV40NLS(核定位信号的核苷酸序列如SEQ ID NO:12所示；氨基酸序列如SEQ ID NO:11所示)。8e-SpRY及其突变体具体图示如图1所示。

(1)ABEmax-SpRY(融合蛋白)

所述ABEmax-SpRY(融合蛋白)的氨基酸序列如SEQ ID NO:67所示；其组成从N端到C端的顺序依次为bpNLS、TadA二聚体、SpRY D10A和bpNLS。一些实施例中，两端携带核定位信号也可为SV40NLS。

(2)8e-SpRY(融合蛋白)

所述8e-SpRY(融合蛋白)的氨基酸序列如SEQ ID NO:68所示；其组成从N端到C端的顺序依次为bpNLS、TadA8e、SpRY D10A和bpNLS。一些实施例中，两端携带核定位信号也可为SV40NLS。

(3)CE-8e-SpRY(融合蛋白)

所述CE-8e-SpRY(融合蛋白)的氨基酸序列如SEQ ID NO:13所示(CE-8e-SpRY融合蛋白的核苷酸序列如SEQ ID NO:14所示)，其组成为:自N端至C端依次包括bpNLS、SpRY(D10A)的N端片段、TadA8e片段和SpRY(D10A)多肽的C端片段和bpNLS，在SpRY(D10A)N端片段与TadA8e片段之间、TadA8e片段与SpRY(D10A)C端片段之间具有连接肽，所述连接肽的氨基酸序列如SEQ ID NO:7所示(编码CE-8e-SpRY连接肽的核苷酸序列如SEQ ID NO:8所示)。一些实施例中，两端携带核定位信号也可为SV40NLS。

(4)V106W-SpRY(融合蛋白)

所述V106W-SpRY(融合蛋白)的氨基酸序列如SEQ ID NO:69所示；其组成从N端到C端的顺序依次为bpNLS、TadA8eV106W、SpRY D10A、和bpNLS，两端携带核定位信号也可为SV40NLS。

(5)8e-SpRY-HF(融合蛋白)

所述8e-SpRY-HF(融合蛋白)的氨基酸序列如SEQ ID NO:70所示；其组成从N端到C端的顺序依次为bpNLS、TadA8e、SpRY D10A-HF、和bpNLS，两端携带核定位信号也可为SV40NLS。

(6)V106W-SpRY-HF

所述V106W-SpRY-HF(融合蛋白)的氨基酸序列如SEQ ID NO:71所示；其组成从N端到C端的顺序依次为bpNLS、TadA8eV106W、SpRY D10A-HF、和bpNLS，两端携带核定位信号也可为SV40NLS。

实施例2

在本实施例中，利用ABEmax-SpRY、8e-SpRY及其突变体在293T细胞中进行内源位点的编辑。

2.1sgRNA质粒的构建

参考人基因组序列，根据SpRY核酸酶的PAM特征设计48条sgRNA，涵盖16种不同的PAM序列，sgRNA序列如SEQ ID NO:18-65所示，sgRNA序列5’端加入ACCG为上游序列，sgRNA反向互补序列的5’端加入AAAC为下游序列，合成oligo后上下游序列退火(程序为：95℃，5min；95℃-85℃at-2℃/s；85℃-25℃at-0.1℃/s；hold at 16℃)后与经过BsaI(NEB：R3733L)酶切后的pGL3-U6-sgRNA(Addgene#51133)载体连接。酶切体系为：pGL3-U6-sgRNA 2μg；CutSmart buffer(NEB：B7204S)6μL；BsaI 1μL；ddH ₂O补齐到60μL，37℃酶切过夜。连接体系为：Solution I(Takara：6022Q)3μL；酶切后载体1μL；退火产物6μL，16℃连接30min后转化、挑菌、鉴定。对阳性克隆菌摇菌提取质粒(Axygene：AP-MN-P-250G)、测定浓度后备用。

2.2细胞培养与转染

HEK293T细胞(购自ATCC)接种培养于添加10％血清(Gibco:10270-106)的DMEM培养基中(Gibco：C11995500BT)，其中含1％双抗(v/v)(Gibco：15140122)。转染前一天铺24孔板，使转染时的细胞密度达到80％左右，转染前2h换液。每孔转染的质粒量分别为碱基编辑器质粒600ng，sgRNA质粒(sgRNA1-48的序列如SEQ ID NO:18～SEQ ID NO:65所示)300ng，将质粒稀释于40μL的DMEM中，将3μL的EZ Trans细胞转染试剂(上海李记生物：AC04L092)稀释于40μL的DMEM中，最后将稀释好的EZ转染试剂加入到稀释好的质粒中，混匀后室温静置15min。将混有质粒和EZ的DMEM加入24孔板中，6h后用含有10％血清的完全培养基换液，转染48h后显微镜观察绿色荧光蛋白(Green fluorescent protein,GFP)的表达，流式细胞分选仪分选GFP阳性细胞。

其中GFP是pGL3-U6-sgRNA载体上的。

2.3检测编辑效率

将分选得到的GFP阳性细胞离心去上清后，加入裂解液(50mM KCl,1.5mM MgCl ₂,10mM Tris pH 8.0,0.5％Nonidet P-40,0.5％Tween 20,100μg/ml protease K)，以GFP阳性细胞裂解液为模板，扩增靶向序列，扩增体系为：2×buffer(Vazyme：P505)25μL；dNTP 1μL；Forward Primer(10μmol/L)1μL；Reverse Primer(10pmol/L)1μL；细胞裂解产物1μL；DNA聚合酶(Vazyme：P505)0.5μL；ddH2O补齐到50μL。Forward Primer和Reverse Primer序列如SEQ ID NO:72～SEQ ID NO:167所示(分别对应sgRNA1-48)。

扩增出来的PCR产物用回收试剂盒进行纯化(Axygen：AP-PCR-250G)，具体步骤为：扩增产物中加入3倍体积的PCR-A，混匀后加入吸附柱中，12000r/min离心1min；弃废液，吸附柱中加入700μL W2(需加入指定体积的乙醇)，12000r/min离心1min；弃废-液，吸附柱中加入400μL W2(需加入指定体积的乙醇)，12000r/min离心1min；弃废液，12000r/min离心2min；开盖晾干乙醇后，加入28μL ddH ₂O，12000r/min离心1min进行洗脱，纯化后的PCR产物送Sanger测序或深度检测，分析编辑效果。

相关结果如图2-9所示。结果显示在所有检测位点上，涵盖NAN、NGN、NCN和NTN的PAM，8e-SpRY的编辑效率均明显高于ABEmax-SpRY；图8的多点编辑效率的统计结果显示，8e-SpRY显著改善了A到G的编辑效率。图9的编辑窗口结果显示，ABEmax-SpRY碱基编辑窗口为5-6位；8e-SpRY碱基编辑窗口为3-10位，窗口更宽。

图10-15显示在NRN(R代表A或G)、NYN(Y代表C或T)PAM下，8e-SpRY突变体编辑效率的对比结果；将8e插入到SpRY中间的CE-8e-SpRY可以很好的维持其A-to-G的编辑活性，将V106W引入Tad8e的V106W-SpRY同样未明显损伤原来的编辑活性，但是将4种突变引入SpRY的8e-SpRY-HF和V106W-SpRY-HF则使编辑活性明显下降。

图16的多点编辑效率的统计结果显示，8e-SpRY-HF和V106W-SpRY-HF显著降低了活性，CE-8e-SpRY编辑效率提高但无显著性差异，V106W-SpRY编辑效率降低同样无显著性差异。

图17在NAN、NGN、NCN和NTN的多点编辑效率的统计结果显示，CE-8e-SpRY在NGN和NTN的编辑效率有所提高，V106W-SpRY在4种PAM下的编辑效率均有所下降，但均无统计学意义。图18的编辑窗口结果显示，V106W-SpRY维持与8e-SpRY相同的编辑窗口，均为3-10位，高活编辑窗口(编辑效率大于40％)为3-9位；CE-8e-SpRY维持相同的编辑窗口即3-10位，高活编辑窗口(编辑效率大于40％)为3-10位，且在8-10位的编辑效率高于8e-SpRY。

表1.实施例2中转染细胞所用的质粒组合(1)

表2.实施例2中转染细胞所用的质粒组合(2)

实施例3

在本实施例中，对比ABEmax-SpRY、8e-SpRY及其突变体在293T细胞中的RNA脱靶情况。

3.1 sgRNA的构建

用于RNA脱靶检测的sgRNA序列为5’-CTGGAACACAAAGCATAGAC-‘3(SEQ ID NO:66)，按照2.1所述的质粒构建方法进行构建。

3.2细胞培养与转染

细胞培养按照2.2所述进行，转染前一天用293T细胞铺6cm Dish，使转染时的细胞密度达到80％左右。每皿转染的质粒量为碱基编辑器质粒4μg，sgRNA质粒2μg，将质粒稀释于250μL的DMEM中，将18μL的EZ Trans细胞转染试剂(上海李记生物：AC04L092)稀释于250μL的DMEM中，最后将稀释好的EZ转染试剂加入到稀释好的质粒中，混匀后室温静置15min。将混有质粒和EZ的DMEM加入6cm Dish中，6h后用含有10％血清的完全培养基换液(DMEM+10％FBS)，转染48h后显微镜观察GFP(GFP是pGL3-U6-sgRNA载体上的)表达，流式细胞分选仪分选GFP阳性细胞。取少数阳性细胞按照2.3所述检测编辑效率，其余阳性细胞提取RNA后送RNA-Seq。

3.3 RNA提取

GFP阳性细胞3000r/min离心10min后弃上清，加入1mL RNA isolater Total RNA extraction Reagent(Vazyme：R401-01-AA)充分裂解细胞；加入200μL氯仿，上下剧烈混匀，室温放置3min后，4℃12000r/min离心15min；取上层水相500μL，加入500μL的异丙醇，上下颠倒混匀，4℃12000r/min离心15min；吸弃上清，加入1mL 75％的乙醇，轻轻颠倒几次清洗沉淀，4℃12000r/min离心5min；吸弃上清，开盖干燥5-10min，待乙醇完全挥发后，加入15μL RNase-Free水溶解沉淀，取1μL测浓度。取1μg RNA送RNA-Seq。

相关结果如19-21所示。图19显示在DNA靶向位点上的第8位A的编辑效率，ABEmax-SpRY、8e-SpRY及其突变体均能引起有效的编辑，其中8e-SpRY及其突变体引起的DNA靶向编辑效率相当，ABEmax-SpRY的编辑效率相对较低。图20和图21的RNA脱靶结果显示，相对于ABEmax-SpRY和8e-SpRY的其他突变体，CE-8e-SpRY有效降低了在转录组水平的脱靶编辑。

综合编辑效率检测和脱靶检测结果，发明人获得的CE-8e-SpRY碱基编辑器可以靶向全基因，同时显著提高了A-to-G的编辑效率，并且有效降低了在转录组水平上的脱靶编辑，具有很大的应用潜力。

表3.实施例3中转染细胞所用的质粒组合

实施例4 CE-8e-SpRY在修复疾病致病位点中的应用

4.1构建人PAH 728 G>A细胞模型

4.1.1突变mut-sgRNA构建

参考人基因组序列，设计mut-sgRNA(SEQ ID NO:168)，按照2.1所述的质粒构建方法进行构建。

4.1.2细胞培养与转染

细胞培养按照2.2所述进行，转染前一天铺24孔板，使转染时的细胞密度达到80％左右，转染前2h换液。每孔转染的质粒量分别为碱基编辑器质粒600ng，sgRNA质粒300ng，将质粒稀释于40μL的DMEM中，将3μL的EZ Trans细胞转染试剂(上海李记生物：AC04L092)稀释于40μL的DMEM中，最后将稀释好的EZ转染试剂加入到稀释好的质粒中，混匀后室温静置15min。将混有质粒和EZ的DMEM加入24孔板中，6h后用含有10％血清的完全培养基换液，转染48h后流式细胞分选仪分选GFP阳性细胞到96孔板中，每孔分选1个阳性细胞，放置于培养箱培养14天后鉴定细胞单克隆基因型。

4.1.3单克隆细胞基因型鉴定

每孔的单克隆细胞取部分细胞离心后加入裂解液(50mM KCl,1.5mM MgCl ₂,10mM Tris pH 8.0,0.5％Nonidet P-40,0.5％Tween 20,100μg/ml protease K)，以细胞裂解液为模板，扩增靶向序列，扩增体系为：2×buffer(Vazyme：P505)25μL；dNTP 1μL；Forward Primer(10μmol/L)1μL；Reverse Primer(10pmol/L)1μL；细胞裂解产物1μL；DNA聚合酶(Vazyme：P505)0.5μL；ddH ₂O补齐到50μL。Forward Primer序列为：5’-gtccctgggcagttatgtgtac-3’(SEQ ID NO:177)，Reverse Primer序列为5’-caactggtagctggaggacag-3’(SEQ ID NO:178)。扩增产物送Sanger测序后挑选PAH 728 G>A纯和突变的细胞即为人PAH 728 G>A细胞模型。

4.2修复PAH 728 G>A突变

CE-8e-SpRY在3-10位有较高的编辑效率，且识别PAM为NNN，根据CE-8e-SpRY的编辑窗口和PAM特点，发明人围绕需要修复的致病突变设计了8条Rec-sgRNA(SEQ ID NO:169-～SEQ ID NO:176)，并按照2.1所述的质粒构建方法进行构建。按照2.2所述的细胞培养与转染方法进行转染。按照2.3所述的检测编辑效率的方法进行修复效率的检测。

结果如图22和图23所示：Mut-sgRNA成功造成728G>A的纯和突变；8条Rec-sgRNA中，Rec-sgRNA1(即图22和图23中的sg1)对728 G>A的修复效率最高，Rec-sgRNA 2(即图22和图23中的sg2)和Rec-sgRNA 3(即图22和图23中的sg3)具有微弱的修复效果。

根据x-ABEmax，ABEmax-NG和ABEmax-SpRY的PAM特点和编辑窗口，这3种碱基编辑器的修复sgRNA为SEQ ID NO:173，按照2.1所述的质粒构建方法进行构建，按照2.2所述的细胞培养与转染方法进行转染，按照2.3所述的检测编辑效率的方法进行修复效率的检测。结果如图24所示，3种碱基编辑器对728 G>A的突变位点均无明显修复效果。

本实施例说明由于CE-8e-SpRY识别的PAM为NNN，围绕需要修复的位点有多种sgRNA的选择，可经过sgRNA的筛选选择最符合修复要求的sgRNA，有效提高了可修复位点的范围和修复效果的灵活性。另外，现有的3种碱基编辑器在各自的编辑窗口内均无法修复728 G>A的突变位点，发明人提供的CE-8e-SpRY在突变位点位于编辑窗口第10位时可实现有效的编辑，拓展了现有碱基编辑工具的可编辑范围，显示出独特的编辑特性。

参考文献

1.Jinek M,Chylinski K,Fonfara I,et al.A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.Science.2012；337(6096):816-21.

2.Komor AC,Kim YB,Packer MS,et al.Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage.Nature.2016；533(7603):420-4.

3.Gaudelli NM,Komor AC,Rees HA,et al.Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage.Nature.2017；551(7681):464-471.

4.Rees HA and Liu DR.Publisher Correction:Base editing:precision chemistry on the genome and transcriptome of living cells.Nat Rev Genet.2018；19(12):801.

5.Ryu SM,Koo T,Kim K,et al.Adenine base editing in mouse embryos and an adult mouse model of Duchenne muscular dystrophy.Nat Biotechnol.2018；36(6):536-539.

6.Song CQ,Jiang T,Richter M,et al.Adenine base editing in an adult mouse model of tyrosinaemia.Nat Biomed Eng.2020；4(1):125-130.

7.Huang TP,Zhao KT,Miller SM,et al.Circularly permuted and PAM-modified Cas9 variants broaden the targeting scope of base editors.Nat Biotechnol.2019；37(6):626-631.

8.Walton RT,Christie KA,Whittaker MN,et al.Unconstrained genome targeting with near-PAMless engineered CRISPR-Cas9 variants.Science.2020；368(6488):290-296.

Claims

一种分离的突变体多肽，其特征在于，所述多肽自N端至C端依次包括SpRY(D10A)的N端片段、TadA8e片段和SpRY(D10A)多肽的C端片段。
如权利要求1所述的突变体多肽，其特征在于，所述SpRY(D10A)蛋白N端片段的氨基酸序列与如SEQ ID NO:1所示的氨基酸序列具有至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％或至少99.5％或至少99.8％或至少99.9％、或100％的序列同一性，或所述TadA8e片段的氨基酸序列与如SEQ ID NO:3所示的氨基酸序列具有至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％或至少99.5％或至少99.8％或至少99.9％、或100％的序列同一性，或所述SpRY(D10A)蛋白C端片段的氨基酸序列与如SEQ ID NO:5所示的氨基酸序列具有至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％或至少99.5％或至少99.8％或至少99.9％、或100％的序列同一性；

优选地，编码所述SpRY(D10A)蛋白N端片段的核苷酸序列与如SEQ ID NO:2所示的核苷酸序列具有至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％或至少99.5％或至少99.8％或至少99.9％、或100％的序列同一性；

优选地，编码所述TadA8e片段的核苷酸序列与如SEQ ID NO:4所示的核苷酸序列具有至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％或至少99.5％或至少99.8％或至少99.9％、或100％的序列同一性；

优选地，编码所述SpRY(D10A)蛋白C端片段的核苷酸序列与如SEQ ID NO:6所示的核苷酸序列具有至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％或至少99.5％或至少99.8％或至少99.9％、或100％的序列同一性；

优选地，所述突变体多肽用于基因编辑；

优选地，所述基因编辑的编辑窗口约为3～10位；

优选地，所述基因编辑的编辑窗口约为8～10位；

优选地，所述突变体多肽包含与如SEQ ID NO:13所示的序列具有至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％或至少99.5％或至少99.8％或至少99.9％、或100％的序列同一性的氨基酸序列。
一种分离的融合蛋白，其特征在于，包含权利要求1-2任一所述的突变体多肽；

优选地，所述融合蛋白还包括连接肽，连接肽位于SpRY(D10A)蛋白N端片段与TadA8e片段之间，和/或位于TadA8e片段与SpRY(D10A)蛋白C端片段之间；

优选地，所述连接肽序列与如SEQ ID NO:7所示的氨基酸序列具有至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％或至少99.5％或至少99.8％或至少99.9％、或100％的序列同一性；

优选地，编码所述连接肽的核苷酸序列与如SEQ ID NO:8所示的核苷酸序列具有至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％或至少99.5％或至少99.8％或至少99.9％、或100％的序列同一性；

优选地，所述融合蛋白还包括核定位信号片段；

优选地，所述核定位信号片段位于所述融合蛋白的N端和/或C端；

优选地，所述核定位信号片段的氨基酸序列与如SEQ ID NO:9和/或SEQ ID NO:11所示的氨基酸序列具有至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％或至少99.5％或至少99.8％或至少99.9％、或100％的序列同一性；

优选地，所述核定位信号的核苷酸序列与如SEQ ID NO:10或12所示的核苷酸序列具有至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％或至少99.5％或至少99.8％或至少99.9％、或100％的序列同一性；

优选地，所述核定位信号片段包括约两个拷贝；优选地，所述融合蛋白包含与如SEQ ID NO:13所示的氨基酸序列具有至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％或至少99.5％或至少99.8％或至少99.9％、或100％的序列同一性的氨基酸序列；

优选地，所述融合蛋白用于基因编辑；

优选地，所述基因编辑的编辑窗口约为3～10位；

优选地，所述基因编辑的编辑窗口约为8～10位；

优选地，所述融合蛋白可以靶向全基因组，能够更高效率地引起A:T到G:C的碱基转换；

优选地，所述融合蛋白在突变位点位于编辑窗口第3-10位时可实现有效的编辑；

优选地，所述融合蛋白在突变位点位于编辑窗口第8-10位时可实现有效的编辑；

优选地，所述融合蛋白在突变位点位于编辑窗口第10位时可实现有效的编辑。
编码权利要求1-2任一所述的突变体多肽或权利要求3所述的融合蛋白的多核苷酸，或其互补序列；

优选地，所述多核苷酸为核酸构建体。
一种载体，其特征在于，所述载体包含权利要求4所述的多核苷酸；

优选地，所述载体为重组表达载体；

优选地，所述载体骨架选自pCMV或其衍生质粒；

优选地，所述pCMV的衍生质粒包括ABEmax-SpRY；

优选地，所述载体包括质粒或病毒载体；

优选地，所述载体是用于在高等真核细胞或原核细胞中表达的质粒或病毒载体；

优选地，所述真核细胞选自脑神经瘤细胞或胚胎肾细胞；

优选地，所述人胚胎肾细胞包括HEK293T细胞；

优选地，所述脑神经瘤细胞包括N2a细胞。
一种产权利要求5所述载体的方法，其特征在于，在骨架质粒中加入编码SpRY(D10A)蛋白N端片段的多核苷酸、编码TadA8e片段的多核苷酸和编码SpRY(D10A)蛋白C端片段的多核苷酸，由此获得所述的载体；

优选地，所还载体包括质粒或病毒载体；

优选地，所述载体是用于在高等真核细胞或原核细胞中表达的质粒或病毒载体；

优选地，编码所述SpRY(D10A)蛋白N端片段的核苷酸序列如SEQ ID NO:2所示；

优选地，编码所述TadA8e片段的核苷酸序列如SEQ ID NO:4所示；

优选地，编码所述SpRY(D10A)蛋白C端片段的核苷酸序列如SEQ ID NO:6所示；

优选地，所述骨架质粒包括pCMV或其衍生质粒ABEmax-SpRY；

优选地，所述真核细胞选自脑神经瘤细胞或胚胎肾细胞；

优选地，所述人胚胎肾细胞包括HEK293T细胞；

优选地，所述脑神经瘤细胞包括N2a细胞；

优选地，所述方法包括从所述衍生质粒ABEmax-SpRY中去除TadA片段，并用TadA8e替换SpRY(D10A)中1048位至1063位的氨基酸，构建得所述重组表达载体；

优选地，所述载体为CE-8e-SpRY质粒。
一种表达系统，其特征在于，所述表达系统表达如权利要求3所述的融合蛋白或其基因组中整合的外源序列表达如权利要求3所述的融合蛋白或所述表达系统表达含有如权利要求4所述的多核苷酸或其基因组中整合有外源的如权利要求4所述的多核苷酸；

优选地，所述表达系统还含有RNA；

优选地，所述RNA是引导RNA；

优选地，所述RNA是sgRNA；

优选地，所述sgRNA的序列包括与如SEQ ID NO：18-65所示的序列具有至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％或至少99.5％或至少99.8％或至少99.9％、或100％的序列同一性的序列。
宿主细胞，其特征在于，包含权利要求4所述的多核苷酸或权利要求5所述的载体或权利要求7所述的表达系统。
一种组合物，其特征在于，包含有效量的权利要求1-2任一所述的突变体多肽，权利要求3所述的融合蛋白，权利要求4所述的多核苷酸，权利要求5所述的载体或权利要求8所述的宿主细胞中的至少一种；

优选地，所述组合物为试剂盒；

优选地，所述组合物还含有RNA；

优选地，所述RNA是引导RNA；

优选地，所述RNA是sgRNA；

优选地，所述sgRNA的序列包括与如SEQ ID NO：18-65所示的序列具有至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％或至少99.5％或至少99.8％或至少99.9％、或100％的序列同一性的序列。
权利要求1-2任一所述的突变体多肽或权利要求3所述的融合蛋白或权利要求4所述的多核苷酸或权利要求5所述的载体或权利要求7所述的表达系统或权利要求8所述的宿主细胞在制备治疗基因疾病的药物中的应用；

优选地，所述基因疾病包括苯丙酮尿症。
权利要求1-2任一所述的突变体多肽或权利要求3所述的融合蛋白或权利要求4所述的多核苷酸或权利要求5所述的载体或权利要求7所述的表达系统或权利要求8所述的宿主细胞在制备基因编辑试剂中的应用；

优选地，所述基因编辑的编辑窗口约为3～10位；

优选地，所述基因编辑的编辑窗口约为8～10位。
一种碱基编辑系统，其特征在于，包含如权利要求1-2任一所述的突变体多肽或权利要求3所述的融合蛋白或权利要求4所述的多核苷酸或权利要求5所述的载体或权利要求7所述的表达系统或权利要求8所述的宿主细胞；

优选地，所述碱基编辑系统还含有RNA；

优选地，所述RNA是引导RNA；

优选地，所述RNA是sgRNA；

优选地，所述sgRNA的序列包括与如SEQ ID NO：18-65所示的序列具有至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％或至少99.5％或至少99.8％或至少99.9％、或100％的序列同一性的序列。
一种基因编辑方法，其特征在于，通过权利要求12所述的碱基编辑系统进行基因编辑；

优选地，所述基因编辑的编辑窗口约为3～10位；

优选地，所述基因编辑的编辑窗口约为8～10位。
一种方法，其特征在于，用于重组产生权利要求1-2任一所述的突变体多肽或权利要求3所述的融合蛋白，其特征在于，包括步骤：将权利要求5所述的载体引入宿主细胞以产生转染的或感染的宿主细胞，体外培养所述转染的或感染的宿主细胞，回收细胞培养物并任选地纯化所产生的突变体多肽或融合蛋白。
一种权利要求1-2任一所述的突变体多肽或权利要求3所述的融合蛋白的制备方法，其特征在于，包括：

(1)在骨架质粒中加入编码SpRY(D10A)蛋白N端片段的多核苷酸、编码TadA8e片段的多核苷酸和编码SpRY(D10A)蛋白C端片段的多核苷酸，由此获得重组表达载体；

(2)转染所述重组表达载体至宿主细胞使其表达所述突变体多肽或所述融合蛋白；

优选地，编码所述SpRY(D10A)蛋白N端片段的核苷酸序列如SEQ ID NO:2所示；

优选地，编码所述TadA8e片段的核苷酸序列如SEQ ID NO:4所示；

优选地，编码所述SpRY(D10A)蛋白C端片段的核苷酸序列如SEQ ID NO:6所示；

优选地，所述骨架质粒包括pCMV或其衍生质粒ABEmax-SpRY；

优选地，所述方法包括从所述衍生质粒ABEmax-SpRY中去除TadA二聚体，并用TadA8e替换SpRY(D10A)中1048位至1063位的氨基酸，构建得所述重组表达载体；

优选地，所还载体质粒或病毒载体；

优选地，所述载体是用于在高等真核细胞或原核细胞中表达的质粒或病毒载体；

优选地，所述真核细胞选自脑神经瘤细胞或胚胎肾细胞；

优选地，所述人胚胎肾细胞包括HEK293T细胞；

优选地，所述脑神经瘤细胞包括N2a细胞。
一种基因疾病的治疗方法，其特征在于，包括以下步骤：向受试者施予一定量的对所述基因疾病有效的权利要求1-2任一所述的突变体多肽，权利要求3所述的融合蛋白，权利要求4所述的多核苷酸中的至少一种，或其任意组合；

优选地，所述基因疾病为苯丙酮尿症。