CN117980490A

CN117980490A - 通过多种载体的共同递送产生大型蛋白质

Info

Publication number: CN117980490A
Application number: CN202280064349.4A
Authority: CN
Inventors: 杰弗里·S·钱伯兰; 伊莎姆·塔斯法欧特
Original assignee: University of Washington
Current assignee: University of Washington
Priority date: 2021-07-23
Filing date: 2022-07-22
Publication date: 2024-05-03

Abstract

本文提供了用于将大型蛋白质递送至有需要的受试者以治疗疾病或病症的方法和组合物。在某些实施方案中，本文所述的方法和组合物可用于使用包含第一AAV载体和第二AAV载体的蛋白质表达系统将大型蛋白质递送至受试者以治疗肌肉或神经肌肉疾病或病症。

Description

通过多种载体的共同递送产生大型蛋白质

相关申请的交叉引用

本申请根据35U.S.C.§119(e)要求提交于2021年7月23日的美国临时申请号63/225,212和提交于2021年10月18日的美国临时申请号63/256,819的权益，所述申请中的每一个的内容以引用方式整体并入本文。

技术领域

本发明的领域涉及使用多种载体递送大型治疗性蛋白质或诱导其产生的方法。

背景技术

使用AAV载体的基因疗法在治疗不同的功能丧失性遗传性病症方面具有广阔的前景(Li 2020)。然而，这种治疗方式因该病毒载体的小包装容量(～5kb)而受到挑战。

发明内容

本文所述的方法和组合物部分基于以下发现：分裂内含肽可以允许使用AAV载体递送大型多肽，包括但不限于肌营养不良蛋白。

在一个方面，本文描述的是一种用于将外源多肽递送至细胞的方法，所述方法包括使细胞接触：第一腺相关病毒(AAV)载体颗粒，其包含编码第一融合多肽的第一核酸，所述第一融合多肽包含与分裂内含肽的第一部分融合的外源多肽的第一部分；以及第二AAV载体颗粒，其包含编码第二融合多肽的第二核酸，所述第二融合多肽包含与分裂内含肽的第二部分融合的外源多肽的第二部分；其中第一融合多肽和第二融合多肽在细胞中由第一核酸和第二核酸产生，并且其中分裂内含肽的第一部分和第二部分促进外源多肽的第一部分与外源多肽的第二部分的连接，从而将外源多肽递送至细胞；其中所递送的外源多肽大于单个AAV载体颗粒可以编码的多肽。

在本文描述的这个方面和所有其他方面的一个实施方案中，第一核酸和第二核酸包含肌肉特异性表达盒(MSEC)。

在本文描述的这个方面和所有其他方面的另一个实施方案中，分裂内含肽是天然存在的分裂内含肽。

在本文描述的这个方面和所有其他方面的另一个实施方案中，分裂内含肽是基因修饰的分裂内含肽。在另一个实施方案中，分裂内含肽的基因修饰选自针对在哺乳动物细胞中的表达和/或稳定性的密码子优化、分裂内含肽的缩短或延长，或改变分裂内含肽中的编码氨基酸以更紧密地匹配待递送的外源蛋白的序列。

在本文描述的这个方面和所有其他方面的另一个实施方案中，外源多肽的第一部分和第二部分的大小基本上相同。

在本文描述的这个方面和所有其他方面的另一个实施方案中，外源多肽的第一部分和第二部分的大小相差不超过50个氨基酸。

在本文描述的这个方面和所有其他方面的另一个实施方案中，外源多肽包含来自分裂内含肽的少于四个氨基酸的足迹。

在本文描述的这个方面和所有其他方面的另一个实施方案中，外源多肽包含来自分裂内含肽的3个或更少氨基酸的足迹。

在本文描述的这个方面和所有其他方面的另一个实施方案中，将外源多肽的第一部分和第二部分分开的分裂位点选择在具有与分裂内含肽足迹相同的序列的位点处，从而产生不含来自分裂内含肽的额外氨基酸的外源多肽。

在本文描述的这个方面和所有其他方面的另一个实施方案中，外源多肽是治疗性多肽。

在本文描述的这个方面和所有其他方面的另一个实施方案中，治疗性多肽选自肌营养不良蛋白、微型肌营养不良蛋白、utrophin和dysferlin、伴肌动蛋白、肌联蛋白、肌球蛋白、含血影蛋白重复的核包膜蛋白1(Syne-1)、肌营养不良蛋白聚糖(dystroglycan)、ATP合酶、凝血因子IIX、核纤层蛋白A/C、甲状腺球蛋白、表皮生长因子受体(EGFR)、α和/或β血影蛋白、雷帕霉素的肌肉靶标(mTOR)以及利阿诺定(ryanodine)受体1。在另一个实施方案中，微型肌营养不良蛋白大于160kDa并且小于全长肌营养不良蛋白。

在本文描述的这个方面和所有其他方面的另一个实施方案中，治疗性多肽是肌营养不良蛋白，并且肌营养不良蛋白外显肽的N端部分在肌营养不良蛋白铰链结构域内或附近与分裂内含肽的N端部分连接。

在本文描述的这个方面和所有其他方面的另一个实施方案中，铰链结构域包含肌营养不良蛋白的铰链1、2、3或4。

在本文描述的这个方面和所有其他方面的另一个实施方案中，治疗性多肽是肌营养不良蛋白，并且肌营养不良蛋白外显肽的N端部分在24个肌营养不良蛋白血影蛋白样重复结构域中的一个内与将螺旋b与螺旋c或螺旋c与螺旋a’连接的环结构域连接。

在本文描述的这个方面和所有其他方面的另一个实施方案中，治疗性多肽是肌营养不良蛋白，并且肌营养不良蛋白外显肽的C端部分在肌营养不良蛋白铰链结构域内或附近与分裂内含肽的C端部分连接或在24个肌营养不良蛋白血影蛋白样重复结构域中的一个内与将螺旋b与螺旋c或螺旋c与螺旋a’连接的环结构域连接。在本文描述的这个方面和所有其他方面的另一个实施方案中，铰链结构域包含肌营养不良蛋白的铰链1、2、3或4。

在本文描述的这个方面和所有其他方面的另一个实施方案中，外源多肽在细胞中具有功能。

在另一方面，本文描述的是一种用于将外源多肽递送至细胞的方法，所述方法包括使细胞接触：第一腺相关病毒(AAV)载体颗粒，其包含编码第一融合多肽的第一核酸，所述第一融合多肽包含与第一分裂内含肽的第一部分融合的外源多肽的第一部分，其中分裂内含肽的第一部分与外源多肽的第一部分的羧基端融合；第二AAV载体颗粒，其包含编码第二融合多肽的第二核酸，所述第二融合多肽包含外源多肽的第二部分，所述第二部分(i)在外源多肽的第二部分的氨基端与第一分裂内含肽的第二部分融合并且(ii)在外源多肽的第二部分的羧基端与第二分裂内含肽的第一部分融合；以及第三AAV载体颗粒，其包含编码第三融合多肽的第三核酸，所述第三融合多肽包含外源多肽的第三部分，所述第三部分在外源多肽的第三部分的氨基端与第二分裂内含肽的第二部分融合，其中第一融合多肽、第二融合多肽和第三融合多肽在细胞中由第一核酸、第二核酸和第三核酸产生，并且其中第一分裂内含肽和第二分裂内含肽的相应部分促进(a)外源多肽的第一部分的羧基端与外源多肽的第二部分的氨基端的连接以及(b)外源多肽的第二部分的羧基端与外源多肽的第三部分的氨基端的连接，从而将外源多肽递送至细胞；其中所递送的外源多肽大于单个AAV载体颗粒可以编码的多肽。在本文描述的这个方面和所有其他方面的一个实施方案中，第一分裂内含肽和第二分裂内含肽不交叉剪接。

在另一方面，本文描述的是一种包含一组AAV载体颗粒的蛋白质表达系统，所述AAV载体颗粒组包括第一AAV颗粒和第二AAV颗粒，其中第一AAV载体颗粒包含编码第一融合多肽的第一核酸，所述第一融合多肽包含与分裂内含肽的第一部分融合的外源多肽的第一部分；并且其中第二AAV载体颗粒包含编码第二融合多肽的第二核酸，所述第二融合多肽包含与分裂内含肽的第二部分融合的外源多肽的第二部分。

在本文描述的这个方面和所有其他方面的一个实施方案中，用第一AAV载体颗粒和第二AAV载体颗粒共感染细胞促进外源多肽的第一部分与外源多肽的第二部分的连接，同时去除分裂内含肽的第一部分和第二部分。

在本文描述的这个方面和所有其他方面的另一个实施方案中，外源多肽的第一部分与外源多肽的第二部分连接，同时去除分裂内含肽的第一部分和第二部分，产生比在单个AAV颗粒中可以编码的多肽更大的外源多肽。

在另一方面，本文描述的是一种包含一组AAV载体颗粒的蛋白质表达系统，所述AAV载体颗粒组包括第一AAV颗粒、第二AAV颗粒和第三AAV颗粒，其中第一AAV载体颗粒包含编码第一融合多肽的第一核酸，所述第一融合多肽包含与第一分裂内含肽的第一部分融合的外源多肽的第一部分，其中分裂内含肽的第一部分与外源多肽的第一部分的羧基端融合；其中第二AAV载体颗粒包含编码第二融合多肽的第二核酸，所述第二融合多肽包含外源多肽的第二部分，所述第二部分(i)在外源多肽的第二部分的氨基端与第一分裂内含肽的第二部分融合并且(ii)在外源多肽的第二部分的羧基端与第二分裂内含肽的第一部分融合；并且其中第三AAV载体颗粒包含编码第三融合多肽的第三核酸，所述第三融合多肽包含外源多肽的第三部分，所述第三部分在外源多肽的第三部分的氨基端与第二分裂内含肽的第二部分融合。

在本文描述的这个方面和所有其他方面的一个实施方案中，用第一AAV载体颗粒、第二AAV载体颗粒和第三AAV载体颗粒共感染细胞促进外源多肽的第一部分与外源多肽的第二部分的连接，同时去除第一分裂内含肽的第一部分和第二部分，以及外源多肽的第二部分与外源多肽的第三部分的连接，同时去除第二分裂内含肽的第一部分和第二部分。

在本文描述的这个方面和所有其他方面的另一个实施方案中，外源多肽的第一部分与外源多肽的第二部分连接，同时去除第一分裂内含肽的第一部分和第二部分，以及外源多肽的第二部分与外源多肽的第三部分连接，同时去除第二分裂内含肽的第一部分和第二部分，产生比在单个AAV颗粒中可以编码的多肽更大的外源多肽。

在本文描述的这个方面和所有其他方面的另一个实施方案中，第一融合多肽和第二融合多肽，或第一融合多肽、第二融合多肽和第三融合多肽的表达由肌肉特异性表达盒驱动。

在另一方面，本文描述的是一种治疗有需要的受试者的疾病或病症的方法，所述方法包括施用如本文所述的蛋白质表达系统，从而治疗受试者。

在本文描述的这个方面和所有其他方面的一个实施方案中，有需要的受试者患有肌肉或神经肌肉疾病或病症。

在本文描述的这个方面和所有其他方面的另一个实施方案中，外源多肽是肌营养不良蛋白或微型肌营养不良蛋白，并且有需要的受试者患有杜氏肌营养不良症(DMD)或贝克型肌营养不良症(BMD)。

在本文描述的这个方面和所有其他方面的另一个实施方案中，肌营养不良蛋白或微型肌营养不良蛋白使营养不良的肌肉的力量增加至少10％。

在本文描述的这个方面和所有其他方面的另一个实施方案中，蛋白质表达系统通过输注到脉管系统中或通过直接注射到组织中来施用。

在另一方面，本文描述的是一种用于诱导细胞中产生外源多肽的方法，所述方法包括使细胞接触：第一腺相关病毒(AAV)载体颗粒，其包含编码第一融合多肽的第一核酸，所述第一融合多肽包含与分裂内含肽的第一部分融合的外源多肽的第一部分；以及第二AAV载体颗粒，其包含编码第二融合多肽的第二核酸，所述第二融合多肽包含与分裂内含肽的第二部分融合的外源多肽的第二部分；其中第一融合多肽和第二融合多肽在细胞中由第一核酸和第二核酸产生，并且其中分裂内含肽的第一部分和第二部分促进外源多肽的第一部分与外源多肽的第二部分的连接，从而诱导细胞中产生外源多肽；其中所产生的外源多肽大于单个AAV载体颗粒可以编码的多肽。

在本文描述的这个方面和所有其他方面的另一个实施方案中，分裂内含肽是基因修饰的分裂内含肽。在另一个实施方案中，分裂内含肽的基因修饰选自针对在哺乳动物细胞中的表达和/或稳定性的密码子优化、分裂内含肽的缩短或延长，或改变分裂内含肽中的编码氨基酸以更紧密地匹配待产生的外源蛋白的序列。

在本文描述的这个方面和所有其他方面的另一个实施方案中，外源多肽包含3个或更少氨基酸的分裂内含肽足迹。

在本文描述的这个方面和所有其他方面的另一个实施方案中，治疗性多肽选自肌营养不良蛋白、微型肌营养不良蛋白、utrophin和dysferlin、伴肌动蛋白、肌联蛋白、肌球蛋白、含血影蛋白重复的核包膜蛋白1(Syne-1)、肌营养不良蛋白聚糖、ATP合酶、凝血因子IIX、核纤层蛋白A/C、甲状腺球蛋白、表皮生长因子受体(EGFR)、α和/或β血影蛋白、雷帕霉素的肌肉靶标(mTOR)以及利阿诺定受体1。

在本文描述的这个方面和所有其他方面的另一个实施方案中，微型肌营养不良蛋白大于160kDa并且小于全长肌营养不良蛋白。

在本文描述的这个方面和所有其他方面的另一个实施方案中，治疗性多肽是肌营养不良蛋白，并且肌营养不良蛋白外显肽的C端部分在肌营养不良蛋白铰链结构域内或附近与分裂内含肽的C端部分连接或在24个肌营养不良蛋白血影蛋白样重复结构域中的一个内与将螺旋b与螺旋c或螺旋c与螺旋a’连接的环结构域连接。

在另一方面，本文描述的是一种用于诱导细胞中产生外源多肽的方法，所述方法包括使细胞接触：第一腺相关病毒(AAV)载体颗粒，其包含编码第一融合多肽的第一核酸，所述第一融合多肽包含与第一分裂内含肽的第一部分融合的外源多肽的第一部分，其中分裂内含肽的第一部分与外源多肽的第一部分的羧基端融合；第二AAV载体颗粒，其包含编码第二融合多肽的第二核酸，所述第二融合多肽包含外源多肽的第二部分，所述第二部分(i)在外源多肽的第二部分的氨基端与第一分裂内含肽的第二部分融合并且(ii)在外源多肽的第二部分的羧基端与第二分裂内含肽的第一部分融合；以及第三AAV载体颗粒，其包含编码第三融合多肽的第三核酸，所述第三融合多肽包含外源多肽的第三部分，所述第三部分在外源多肽的第三部分的氨基端与第二分裂内含肽的第二部分融合，其中第一融合多肽、第二融合多肽和第三融合多肽在细胞中由第一核酸、第二核酸和第三核酸产生，并且其中第一分裂内含肽和第二分裂内含肽的相应部分促进(a)外源多肽的第一部分的羧基端与外源多肽的第二部分的氨基端的连接以及(b)外源多肽的第二部分的羧基端与外源多肽的第三部分的氨基端的连接，从而在细胞中产生外源多肽；其中所产生的外源多肽大于单个AAV载体颗粒可以编码的多肽。在本文描述的这个方面和所有其他方面的一个实施方案中，第一分裂内含肽和第二分裂内含肽不交叉剪接。

在另一方面，本文提供的是一种如本文所述的组合物，其用于治疗有需要的受试者(例如，患有肌肉或神经肌肉病症的受试者)的疾病或病症。

附图说明

图1A-1B.(图1A)编码肌营养不良蛋白的全长“肌肉特异性”同工型(下)的DMD编码序列(上)的示意图，所述同工型由以下组成：结合肌动蛋白细胞骨架的氨基端球状结构域，接着是由穿插有四个富含脯氨酸的“铰链”区域的24个血影蛋白样重复构成的柔性且有弹性的杆结构域。肌营养不良蛋白聚糖结合结构域(DgBD)位于杆结构域之后，接着是含有互养蛋白(syntrophin)和异连蛋白(dystrobrevin)蛋白质家族的结合位点的羧基端(CT)结构域。DgBD和CT结构域使肌营养不良蛋白-糖蛋白蛋白质复合物(DGC)的组装有核。(图1B)Pfizer、SareptaTherapeutics和Solid Biosciences正在临床试验中评估的不同μDys构建体。

图2.用于重构微型Dys(ΔH2-SR19)的双重AAV载体同源重组策略。两种AAV载体编码N端(上)或C端(下)微型Dys片段。两种载体均携带重组序列(外显子51至53)，这允许形成更大且具有功能的微型Dys(ΔH2-SR19)。

图3.由连续(更常见)或分裂内含肽介导的蛋白质反式剪接的示意图。

图4A-4B在HEK293细胞中使用分裂Npu内含肽重构GFP的实例。(图4A)用野生型(WT)GFP、N端和/或C端GFP/Npu内含肽质粒转染的活HEK293细胞的明场和荧光显微镜照片。(图4B)使用分光光度计测量GFP荧光强度。值表示为平均值±s.e.m(n＝3)。

图5A-5C微型Dys重构的体外验证。(图5A)内含肽介导的微型Dys重构的示意图。左：N端载体，其编码人DMD序列的外显子1至50，但缺少外显子21至41。右：C端载体，其编码人DMD序列的外显子51至79。微型Dys序列与所选内含肽的N端或C端半部分融合。(图5B)HEK293细胞裂解物的蛋白质印迹(Western blot)分析，其示出290kDa的微型Dys。在对照微型dys中，用表达整个微型DysΔSR5-15的质粒转染细胞。在分裂的微型Dys/内含肽中，用N端和C端载体共转染细胞。每个泳道代表SR19与铰链3之间的选定分裂位点。(图5C)针对上样对照GAPDH归一化的微型Dys的光密度量化(n＝4-5个独立实验)。数据示出为平均值±s.e.m。M.W：分子量。kDa：千道尔顿。

图6A-6B使用SIMPL-GT(用于基因疗法的分裂内含肽介导的蛋白质连接(SplitIntein-Mediated Protein Ligation for Gene Therapy))方法进行的基于AAV的肌营养不良蛋白替换的示意图。(图6A)双重载体策略，其包括同时施用表达与分裂内含肽融合的微型Dys(ΔSR5-15)的两个半部分的两种AAV载体。使用N端或C端微型Dys片段进行框内转录和翻译后，内含肽多肽自我切除并连接相邻的肽，从而表达具有高度功能性的微型Dys(ΔSR5-15)。(图6B)通过三重AAV载体施用进行的全长肌营养不良蛋白的表达。第1AAV载体编码肌营养不良蛋白的N端至SR8的蛋白质，其与分裂内含肽1的N端片段融合。第2AAV载体编码肌营养不良蛋白的中间片段(SR9-19)，其两侧为内含肽1的C端半部分和内含肽2的N端半部分。而第3AAV载体则编码肌营养不良蛋白的C端片段，其与内含肽2的C端半部分融合。内含肽1和2的双重反式剪接分别将导致三个肌营养不良蛋白片段连接成全长蛋白质。

图7使用分裂GFP系统进行的分裂内含肽筛选。GFP的N端或C端半部分与我们的密码子优化的分裂内含肽的N端或C端半部分一起进行框内克隆。人胚肾293(HEK293)细胞用N端和C端GFP/内含肽质粒共转染。24小时后，使用分光光度计测量GFP荧光强度。值表示为相对于WT GFP的百分比的平均值±s.e.m(n＝5-6)。各分裂内含肽的蛋白质连接效率(给定内含肽/内部对照的GFP荧光)标记在条柱上。

图8使用分裂GFP系统得到的分裂内含肽特异性和交叉反应性。为了测试给定的N端分裂内含肽与另一分裂内含肽C端的交叉反应性，在HEK293细胞上测试N端和C端分裂GFP内含肽。由于来自第1组的分裂内含肽呈现出氨基酸相似性，因此它们表现出较差的特异性并与同一组的不同内含肽交叉反应。然而，来自第2组的分裂内含肽，即gp41.1、IMPDH和Nrdj1，对同一内含肽的另一半更具特异性，并且不与任何其他分裂内含肽交叉反应。值表示为相对于WTGFP的百分比的平均值±s.e.m(n＝3-4)。这些观察结果尤其对于三重载体策略非常重要，其中需要2种非常具有特异性的分裂内含肽才能将3个肌营养不良蛋白片段连接成全长蛋白质。

图9A-9C.分裂内含肽足迹的重要性和肌营养不良蛋白重构的优化。(图9A)内含肽介导的蛋白质反式剪接高度依赖在天然细菌外显肽蛋白中发现的并置氨基酸。当N端和C端分裂内含肽片段融合并剪除(splice out)时，这些天然外显肽氨基酸(对于Aha和Sel为AEY和CFN；并且对于gp41.1为SGY和SSS；对于IMPDH为GGG和SIC；对于Nrdj1为NPC和SEI)作为足迹留在重构蛋白中。在此处，发明人测试了几种组合，以将这种足迹减至最小。这些数据表明，当在分裂GFP系统上测试时，在Aha分裂内含肽的情况下，使用AEY可实现与AEY/CFN相同的剪接效率，而使用gp41.1 GY/S足以实现有效的GFP连接。该足迹在使用IMPDH和Nrdj1的情况下甚至更短，分别只有G/S和C/S。值表示为相对于WT GFP的百分比的平均值±s.e.m(n＝4)。使用对于全长(图9B)或微型肌营养不良蛋白(图9C)重构具有最小足迹残留的Aha和/或gp41.1进行蛋白质反式剪接的示意性实例。

图10人肌营养不良蛋白中的几个分裂位点的鉴定，其中一些天然氨基酸可以用作内含肽足迹的一部分。

图11A-11B.(图11A)HEK293细胞裂解物的蛋白质印迹分析，其示出290kDa的微型Dys。在对照微型dys中，用表达整个微型DysΔSR5-15的质粒转染细胞。在分裂的微型Dys/内含肽中，用N端和C端载体共转染细胞。每个泳道代表SR19与铰链3之间的选定分裂位点。(图11B)针对上样对照GAPDH归一化的微型Dys的光密度量化(n＝4-5个独立实验)。数据示出为平均值±s.e.m。M.W：分子量。kDa：千道尔顿。这些数据表明，将分裂gp41.1插入4个不同的分裂位点有效重构微型肌营养不良蛋白ΔSR-5-15。

图12A-12C.AAV肌内注射后的体内微型肌营养不良蛋白ΔSR-5-15表达。将分裂的微型肌营养不良蛋白/内含肽克隆插入到含有肌肉特异性肌酸激酶8(CK8)调控盒和两侧为两个AAV血清型2反向末端重复(ITR)的小合成polyA的pAAV质粒中。将最终的pAAV质粒与pDG6包装质粒一起共转染到HEK293细胞中以产生重组AAV2/6载体，并通过肝素亲和色谱纯化，然后使用蔗糖梯度离心浓缩。将5x10¹⁰病毒基因组(v.g)剂量的编码N端和/或C端分裂微型肌营养不良蛋白/内含肽的AAV施用到三周龄C57BL/6-mdx^4cv的胫骨前肌(T.A)中。注射后四周，收获经注射的肌肉，提取总蛋白并在SDS凝胶上分离以用于蛋白质印迹(图12A)。在所测试的4个T.A肌肉中检测到微型肌营养不良蛋白ΔSR5-15的强烈表达，凸显了SIMPLI-GT方法的功效。将肌肉冷冻切片并针对肌营养不良蛋白进行免疫染色(图12B)或用苏木精和曙红染色，并测量肌纤维尺寸和细胞核位置(图12C)。重构的微型肌营养不良蛋白ΔSR5-15正确定位在注射了双重AAV N端和C端载体的mdx^4cv的肌纤维肌膜处。这些肌肉表现出一般肌肉组织学改善且没有炎症。

图13.通过三重载体策略实现的全长肌营养不良蛋白表达的体外概念验证。用表达人肌营养不良蛋白的N、C或中间片段的3种质粒转染的HEK293细胞裂解物的蛋白质印迹分析。分裂内含肽gp41.1用于连接中间与C端片段，同时针对N端和中间片段连接测试了6种不同的分裂内含肽。

图14A-14B.全长Dysferlin表达的体外概念验证。(图14A)用表达全长人Dysferlin或分裂的Dysferlin/gp41.1内含肽或Dysferlin/IMPDH的质粒转染的HEK293细胞裂解物的蛋白质印迹分析。测试了3个分裂位点。(图14B)针对上样对照GAPDH归一化的全长Dysferlin表达的光密度量化(n＝5个独立实验)。数据示出为平均值±s.e.m。这些数据表明，将分裂gp41.1插入2个不同的分裂位点有效重构全长Dysferlin。

图15A-15W.分裂内含肽DNA和蛋白质序列。图15A，Aha(SEQID No:1和2)。图15B，Aov(SEQ ID No:3和4)。图15C，Asp(SEQID No:5和6)。图15D，Ava(SEQ ID No:7和8)。图15E，Cra(SEQID No:9和10)。图15F，Csp-CCY(SEQ ID No:11和12)。图15G，Csp-PCC7424(SEQ IDNo:13和14)。图15H，Csp-PCC8801(SEQ IDNo:15和16)。图15I，Cwa(SEQ ID No:17和18)。图15J，gp41.1(SEQID No:19和20)。图15K，gp41.8(SEQ ID No:21和22)。图15L，IMPDH(SEQ IDNo:23和24)。图15M，Maer(SEQ ID No:25和26)。图15N，Mcht(SEQ ID No:27和28)。图15O，Npu(SEQ ID No:29和30)。图15P，Nrdj(SEQ ID No:31和32)。图15Q，Oli(SEQ ID No:33和34)。图15R，Sel(SEQ ID No:35和36)。图15S，Ssp-PCC6803(SEQ ID No:37和38)。图15T，Ssp-PCC7002(SEQ ID No:39和40)。图15U，Tel(SEQ ID No:41和42)。图15V，Ter(SEQ IDNo:43和44)。图15W，Tvu(SEQ ID No:45和46)。

图16.全长Dysferlin分裂位点。

图17.全长肌营养不良蛋白分裂位点(IMPDH内含肽)。

图18.全长肌营养不良蛋白分裂位点(Nrdj内含肽)。

图19.全长肌营养不良蛋白分裂位点。

图20.全长肌营养不良蛋白分裂位点(gp41.1内含肽)。

图21.微型肌营养不良蛋白ΔSR5-15分裂位点。

图22A-22D肌内施用3种内含肽载体后全长肌营养不良蛋白的体内表达。将每个组合的分裂的肌营养不良蛋白/内含肽克隆包装到使用CK8e启动子的AAV6载体中，并以每个构建体5x10¹⁰ v.g局部施用到3周龄mdx^4cv小鼠的TA肌肉中。注射后四周，使用识别肌营养不良蛋白C末端的抗体通过蛋白质印迹分析总蛋白(图22A)。与体外观察结果类似，用两种组合均检测到427kDa条带，其中使用分裂Nrdj1和分裂gp41.1组合检测到更高的表达(相对于WT表达高2至4倍)。更重要的是，在此早期时间点观察到中央有核肌纤维的显著减少，在未处理的mdx^4cv TA肌肉中为～65％，相对于在用这种三重载体策略处理的肌肉中为30％至40％，并且一般肌肉组织学在该短时间点有显著改善(图22B、22C)。当使用识别全长肌营养不良蛋白的N端、C端或中间片段的三种不同抗体中的任一种进行评估时，重构的全长肌营养不良蛋白正确定位在肌膜上。图22A，示出在mdx^4cv TA肌肉中施用三重载体后全长肌营养不良蛋白的表达的蛋白质印迹(上方)。图22B，用不同载体组合(或盐水)处理并用苏木精和曙红染色的mdx^4cvTA肌肉横截面中的中央有核肌纤维的可视化。还示出来自年龄匹配的小鼠的未处理的野生型(WT)或mdx^4cv TA肌肉。仅N端：肌肉仅注射单一载体，在这种情况下为N端载体；仅中间：肌肉仅注射单一载体，在这种情况下为中间载体；仅C端：肌肉仅注射单一载体，在这种情况下为C端载体。其他图示出注射了两种载体或全部3种载体(三重)的组合的肌肉。图22C，用所指示的三重载体组合(或盐水)处理并用苏木精和曙红染色的mdx4cvTA肌肉横截面中的中央有核肌纤维的量化。还示出来自未处理的野生型(WT)小鼠TA肌肉的值。数据来自对来自各种肌肉的～400条肌纤维的计数。图22D，使用针对肌营养不良蛋白的N端、C端或中间片段的抗体对TA肌肉冷冻切片进行三重免疫标记。野生型肌肉未注射；mdx^4cv肌肉注射盐水或2个三重载体组合，如图22A所示。

图23A-23C静脉内输注双重或三重载体后微型Dys和全长肌营养不良蛋白的体内表达。8周龄mdx^4cv以2x10¹⁴ vg/kg的总剂量进行全身处理，处理持续三个月。使用肌力传感器评估后肢和膈肌收缩特性(图23A、图23B)。相对于盐水处理的mdx^4cv和野生型小鼠肌肉，用双重或三重载体处理的小鼠表现出胫骨前肌和膈肌的肌肉比力发育的显著改善。使用蛋白质印迹，这些肌肉显示出微型Dys和全长肌营养不良蛋白的强烈表达(图23C)。图23A，胫骨前肌的体内比力。图23B，分离的膈肌条的体外比力。图23C，示出全身施用双重或三重载体后胫骨前肌中微型Dys和全长肌营养不良蛋白的表达的蛋白质印迹。

具体实施方式

本文提供了可用于递送太大而无法装配在单个腺病毒、腺相关病毒、慢病毒或逆转录病毒载体中的外源多肽的方法和组合物。本文所述的方法和组合物利用分裂内含肽的使用，所述分裂内含肽介导使用至少两种病毒载体(例如，AAV载体)递送的大型外源多肽的第一部分和第二部分的融合，从而允许将大型外源多肽递送至细胞(例如，肌肉细胞)。所述方法和组合物还涉及此类外源多肽(例如，肌营养不良蛋白、utrophin和dysferlin)的肌肉特异性细胞表达。

定义

为了方便起见，在这里收集了整个申请(包括说明书、实施例和所附权利要求书)中使用的某些术语。除非另外定义，本文所用的所有科技术语的含义与本发明所属领域的普通技术人员通常理解的一样。

如本文所用，术语“剪接(splice或splices)”意指切除多肽的内部部分，将内部部分两侧的部分接合起来以形成两个或更多个较小的多肽分子(例如，切除的多肽和剪接的多肽)。在一些情况下，剪接还包括将两个或更多个较小多肽融合在一起以形成新多肽的步骤。剪接还可以指通过分裂内含肽的作用将两个单独的核酸序列上或两个单独的载体中编码的两个多肽连接起来。

如本文所用，术语“切割(cleave或cleaves)”意指将单个多肽分开以形成两个或更多个较小的多肽分子。在一些情况下，切割是通过添加外来的肽链内切酶介导的，这通常称为“蛋白水解切割”。在其他情况下，切割可以由一个或两个经切割的肽序列的内在活性介导，这通常称为“自切割”。切割还可以指通过添加非蛋白水解的第三肽诱导的两种多肽的自切割，如在如本文所述的分裂内含肽系统的作用中那样。

术语“融合”是指共价键合。例如，当两个肽彼此共价键合(例如，通过肽键)时，第一肽与第二肽融合。

如本文所用，术语“内含肽”是指天然存在的自剪接蛋白质亚结构域，其能够从较大的蛋白质结构中切除其自身的蛋白质亚结构域，同时将两个先前侧接的肽区域(“外显肽”)连接在一起以形成成熟的宿主蛋白。在一些内含肽中，前体蛋白来自两种基因，这被称为‘分裂内含肽’。

如本文所用，术语“分裂内含肽”是指由两个或更多个彼此不融合的单独组分构成的内含肽。分裂内含肽可以天然存在，或可以通过分裂连续内含肽来工程化。通常，术语“分裂内含肽”是指其中在N端内含肽区段与C端内含肽区段之间存在一个或多个肽键断裂使得N端和C端内含肽区段成为可以非共价地重新缔合或重构为对于剪接或切割反应具有功能的内含肽的单独分子的任何内含肽。任何催化活性内含肽或其片段可以用于衍生用于本文公开的系统和方法的分裂内含肽。例如，在一个方面，分裂内含肽可以衍生自真核内含肽。在另一方面，分裂内含肽可以衍生自细菌内含肽。在另一方面，分裂内含肽可以衍生自古细菌内含肽。优选地，如此衍生的分裂内含肽将仅具有催化剪接反应所必需的氨基酸序列。

如本文所用，“N端内含肽区段”是指包含当与相应的C端内含肽区段组合时对于剪接和/或切割反应具有功能的N端氨基酸序列的任何内含肽序列。因此，N端内含肽区段还包含在发生剪接时被剪除的序列。N端内含肽区段可以包含为天然存在的(天然)内含肽序列的N端部分的修饰的序列。例如，N端内含肽区段可以包含另外的氨基酸残基和/或突变的残基，只要此类另外的和/或突变的残基的包含不使内含肽失去剪接或切割功能即可。优选地，另外的和/或突变的残基的包含改善或增强内含肽的剪接活性和/或可控性。非内含肽残基也可以通过基因方法与内含肽区段融合以提供另外的功能性，诸如被亲和纯化或共价固定的能力。

如本文所用，“C端内含肽区段”是指包含当与相应的N端内含肽区段组合时对于剪接或切割反应具有功能的C端氨基酸序列的任何内含肽序列。在一个方面，C端内含肽区段包含在发生剪接时被剪除的序列。在另一方面，将C端内含肽区段从与其C端融合的肽序列中切割下来。从C端内含肽的C端切割的序列是用于治疗肌肉病症的蛋白质，诸如肌营养不良蛋白、utrophin、dysferlin、微型肌营养不良蛋白等。C端内含肽区段可以包含为天然存在的(天然)内含肽序列的C端部分的修饰的序列。例如，C端内含肽区段可以包含另外的氨基酸残基和/或突变的残基，只要此类另外的和/或突变的残基的包含不使C端内含肽区段失去剪接或切割功能即可。优选地，另外的和/或突变的残基的包含改善或增强内含肽的剪接和/或切割活性。

如本文所用，术语“大于单个AAV载体颗粒可以编码的”是指其编码核酸超过AAV载体颗粒的包装极限的多肽。虽然确切的包装极限可因所用AAV载体的血清型或变体而略有不同，但有效感染和转导靶细胞的AAV载体的最大基因组包装容量为约5kb(野生型AAV基因组为约4.7kb；在某些条件下可以包装最多至5.5kb或更大的较大基因组，但它们不能有效地感染和转导靶细胞)。不包括ITR，这允许并入约3.5kb的DNA，以用于待由单个AAV载体颗粒携带的转基因构建体的启动子、转基因编码区、聚腺苷酸化序列和其他调控元件。因此，需要超过约3.5kb来指导期望蛋白质的表达的转基因大于单个AAV载体颗粒可以编码的基因，如该术语在本文所使用的那样。在一些实施方案中，比单个载体颗粒可以编码的蛋白质更大的蛋白质需要至少4kb、至少4.5kb、至少5kb、至少5.5kb、至少6kb、至少6.5kb、至少7kb、至少7.5kb、至少8kb、至少8.5kb、至少9kb、至少9.5kb、至少10kb、至少10.5kb、至少11kb、至少11.5kb、至少12kb、至少12.5kb、至少13kb、至少13.5kb、至少14kb或更多来编码转基因多肽。也如本文其他地方所讨论的，当靶蛋白需要比将装配到两个单独病毒载体中的核酸序列更多的核酸序列以产生全长靶多肽(或相对于更截短的微型基因或微基因构建体具有功能改善的亚全长多肽)时，多肽可以分裂在包括三个或可能更多分裂内含肽构建体的单独载体上。在这种情况下，与该组载体的共感染可以产生全长或改善的亚全长多肽。

如本文所用，如关于如本文所述的用于将外源多肽递送至细胞的方法、在细胞中产生外源多肽的方法或基于此类递送或产生的治疗或预防方法或其组合物所用的术语“与分裂内含肽的第一部分融合的外源多肽的第一部分”和“与分裂内含肽的第二部分融合的外源多肽的第二部分”是指比单个AAV载体颗粒可以编码的多肽更大的靶多肽的片段。靶多肽的第一部分和第二部分片段分别与分裂内含肽的氨基和羧基端部分融合，其方式允许当两种融合蛋白在细胞中表达时切除内含肽并将第一部分和第二部分(工程化的外显肽)多肽共价连接以重构靶蛋白。靶蛋白的第一部分和第二部分的大小可以变化，例如，氨基端片段比羧基端片段短、大小大致相同或大于所述羧基端片段(并且相应的羧基端片段变化，使得其分别比氨基端片段长、大小大致相同或比所述氨基端片段短)，但当靶标被分成两个片段时，优选的是，大约在靶蛋白的中间附近分裂靶标。当如本文所述将靶蛋白分成三个片段时，大小可以变化，但优选的是，三个片段的长度也大致相同。可以考虑在结构域之间或连接处而不是在其之内分裂靶蛋白，例如，在α螺旋、β折叠之间或在任何两个这样的结构域之间。作为一个非限制性实例，在肌营养不良蛋白或utrophin多肽的情况下，预期在血影蛋白样重复结构域之间或在血影蛋白样重复结构域与铰链结构域之间分裂蛋白质。示例性的大型蛋白肌营养不良蛋白、utrophin和dysferlin的各种结构域在下文进一步讨论。肌营养不良蛋白和dysferlin多肽的各种结构域的边界也在下文描述，并且本领域普通技术人员可以确定其他蛋白质中的结构域之间的边界。

如本文所用，术语“包含(comprising或comprises)”用于指组合物、方法及其对应的组分，它们对于本发明来说是必需的，但可以包括无论是否必需的未指定要素。

如本文所用，术语“基本上由……组成”是指给定实施方案所需的那些要素。所述术语容许存在实质上不影响本发明的所述实施方案的基本和新颖或功能特征的附加要素。

术语“由……组成”是指如本文所述的组合物、方法及其对应的组分，其不包括在实施方案的所述描述中未列举的任何要素。

如在本说明书和所附权利要求书中所用的，单数形式“一个”、“一种”和“所述”包括复数指代物，除非上下文另外明确指出。因而，例如，提到“所述方法”包括本文所述类型的一种或多种方法和/或步骤，和/或本领域技术人员在阅读本公开时将理解的方法和/或步骤等等。应理解，前面的详细描述和下列实施例仅仅是说明性的，而不应理解为对本发明范围的限制。在不脱离本发明的精神和范围的情况下，可以对所公开的实施方案进行各种改变和修改，这对于本领域技术人员来说将是显而易见的。此外，将所有确定的专利、专利申请和出版物通过引用明确并入本文，目的是描述和公开例如在这样的出版物中描述的可能与本发明结合使用的方法。提供这些出版物仅仅是因为它们的公开在本申请的申请日之前。在这方面不应被解释为承认发明人无权凭借在先发明或由于任何其他原因而先于这样的公开。所有关于日期的声明或关于这些文件的内容的表述都是基于申请人可获得的信息，并不构成对这些文件的日期或内容的正确性的任何承认。

在一个优选实施方案中，本文所述的公开内容不涉及用于克隆人类的方法、用于修改人类的种系遗传特性的方法、人类胚胎用于工业或商业目的的用途或用于修改动物的遗传特性的方法，这些可能导致他们/它们遭受痛苦，而对人类或动物以及由此类方法得到的动物没有任何实质性的医疗益处。

肌营养不良症

肌营养不良症是一组以进行性肌肉无力和肌肉组织丧失为特征的遗传性病症。

肌营养不良症包括许多遗传性病症，包括贝克型肌营养不良症和杜氏肌营养不良症，所述病症均由肌营养不良蛋白基因(即，DMD)的突变引起。尽管贝克型肌营养不良症是一种进展较慢的疾病形式，但这两种病症具有相似的症状。杜氏肌营养不良症是一种快速进展的肌营养不良症形式。

这两种病症的特征在于腿部和骨盆的进行性肌肉无力，这与肌肉量的损失(消瘦)相关。肌肉无力还出现在手臂、颈部和其他区域，但不像在下半身那么严重。小腿肌肉最初增大(身体试图补偿肌肉力量的损失)，增大的肌肉组织最终被脂肪和结缔组织替代(假性肥大)。在腿部和脚后跟发生肌肉收缩，从而由于肌肉纤维的缩短和结缔组织的纤维化而导致无法使用肌肉。骨发育异常，导致胸部和其他区域的骨骼畸形。几乎所有病例都发生心肌病。存在DMD的小鼠模型，并且被证明可用于进一步了解肌营养不良蛋白的正常功能和该疾病的病理学。具体地，增强utrophin(肌营养不良蛋白的亲戚)的产生以便补偿肌营养不良蛋白的损失的实验是有希望的，并且可能引起针对这种毁灭性疾病的有效疗法的开发。

dysferlin肌病(Dysferlinopathy)是由dysferlin基因的突变引起的肌营养不良症。dysferlin肌病的症状在个体之间显著变化。与dysferlin肌病最常相关的临床表现包括肢带型肌营养不良症(LGMD2B)、三好氏肌病(Miyoshi myopathy)、胫骨前肌发病的远端肌病(distal myopathywith anterior tibial onset，DMAT)、近远端肌无力(proximodistalweakness)、假代谢性肌病和高CK血症(hyperCKemia)。最常见的是，患者在生命的第二个十年内报告远端肌肉无力，并在随后的十年内丧失远端运动功能。患者通常需要轮椅来活动以及不同程度的总体身体控制。由于dysferlin肌病常被误诊，因此其发病率尚未确定。迄今为止，还没有用以减缓肌肉功能的丧失或逆转/改善营养不良表型的有效治疗。

外源多肽

本文所述的方法和组合物的独特优点是编码大型蛋白质并将其递送至细胞例如肌肉细胞等的能力。载体，诸如腺病毒相关载体(AAV)，受限于其核酸包装容量，因此，大型蛋白质不可在单个AAV载体上编码和递送。本文所述的方法和组合物利用分裂内含肽，其中分裂内含肽的N端区域和期望外源多肽的一部分在第一AAV载体上编码，并且分裂内含肽的C端区域和期望外源多肽的第二部分在第二AAV载体上编码。来自各AAV的产物在细胞中一起表达允许分裂内含肽的第一部分和第二部分促进外源多肽的第一部分与外源多肽的第二部分的连接。本领域技术人员将理解，本文所述的方法和组合物可以用于任何大型基因产物，其不必受功能限制。

本文所述的方法和组合物在使用肌肉蛋白(包括肌营养不良蛋白、utrophin和dysferlin)的工作实施例中举例说明。

肌营养不良蛋白：肌营养不良蛋白是一种427kDa的细胞骨架蛋白并且是血影蛋白/α-辅肌动蛋白超家族的成员(参见例如，Blake等人,Brain Pathology,6:37(1996)；Winder,J.Muscle Res.Cell.Motil.,18:617(1997)；以及Tinsley等人,PNAS,91:8307(1994))。肌营养不良蛋白的N端与肌动蛋白结合，其对非肌肉肌动蛋白的亲和力高于对肌节肌动蛋白的亲和力。肌营养不良蛋白参与质膜下方的非肌肉肌动蛋白的膜下网络。肌营养不良蛋白与蛋白质和糖蛋白的寡聚跨膜复合物(即肌营养不良蛋白相关的蛋白复合物(DPC))相关。肌营养不良蛋白的C端与β-肌营养不良蛋白聚糖的细胞质尾结合，并与肌动蛋白协同作用，将肌营养不良蛋白锚定于肌膜。DPC的细胞质成员也与肌营养不良蛋白的C端结合。肌营养不良蛋白从而在肌肉纤维的基于肌动蛋白的细胞骨架与细胞外基质之间提供连接。正是这种连接在肌营养不良症中被破坏。

肌营养不良蛋白的中央杆结构域由一系列24个大约110个氨基酸的弱重复单元构成，所述重复单元与在血影蛋白中所发现的那些类似(即，血影蛋白样重复)。该结构域构成肌营养不良蛋白的大部分，并赋予肌营养不良蛋白柔性杆状结构。杆结构域被四个富含脯氨酸的铰链区域间断。预期杆结构域在DPC成员之间提供结构连接。

表1：全长肌营养不良蛋白cDNA的结构域

/>

已在多种生物体中鉴定了肌营养不良蛋白的同源物，包括小鼠(Genbank登录号M68859)；狗(Genbank登录号AF070485)；以及鸡(Genbank登录号X13369)。通过使用多种可获得的计算机程序中的任一种(例如，来自NCBI的BLAST)，可以与来自其他物种的同源物(包括但不限于上文所述的那些)产生类似的比较。可以使用任何合适的测定(包括但不限于本文所述的那些)针对生物活性对候选同源物进行筛选。

Utrophin：Utrophin是肌营养不良蛋白的常染色体编码同源物，并且据推测，所述蛋白质发挥类似的生理作用(关于近期综述，参见例如Blake等人,Brain Pathology,6:37[1996])。人utrophin显示出与肌营养不良蛋白的显著同源性，主要差异存在于杆结构域中，其中utrophin缺乏重复15和19以及两个铰链区(参见例如，Love等人,Nature 339:55[1989]；Winder等人,FEBS Lett.,369:27[1995])。因此，Utropin含有22个血影蛋白样重复和两个铰链区。

Dysferlin：Dysferlin包含以下结构域：C2A、C2B、C2C、FerA、DysF、C2D、C2E、C2F、C2G和TM。每个结构域的确切边界可因直向同源物和变体而异。人dysferlin中的每个结构域的大致氨基酸范围在表2中示出。所列出的结构域边界可变化最多至约20个残基，例如约5、10、15或20个残基。

表2：Dysferlin结构域结构域氨基酸范围

蛋白质变体：此外，如上所述，还预期了将外源多肽诸如肌营养不良蛋白、utrophin、微型肌营养不良蛋白或dysferlin的变体形式(例如，突变体)与本文所述的方法和组合物一起使用。例如，预期用异亮氨酸或缬氨酸分离地替换亮氨酸、用谷氨酸替换天冬氨酸、用丝氨酸替换苏氨酸，或用结构相关的氨基酸类似地替换氨基酸(即，保守突变)不一定对所得分子的生物活性产生重大影响。因此，在一些实施方案中，外源多肽可以包含一个或多个保守氨基酸替换。保守替换是在其侧链相关的氨基酸家族内发生的那些替换。基因编码的氨基酸可以分为四个家族：(1)酸性(天冬氨酸、谷氨酸)；(2)碱性(赖氨酸、精氨酸、组氨酸)；(3)非极性(丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)；以及(4)不带电荷的极性(甘氨酸、天冬酰胺、谷氨酰胺、半胱氨酸、丝氨酸、苏氨酸、酪氨酸)。苯丙氨酸、色氨酸和酪氨酸有时被共同归类为芳香族氨基酸。以类似方式，氨基酸库可以分组为(1)酸性(天冬氨酸、谷氨酸)；(2)碱性(赖氨酸、精氨酸、组氨酸)，(3)脂族(甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、丝氨酸、苏氨酸)，其中丝氨酸和苏氨酸任选地单独分组为脂族-羟基；(4)芳香族(苯丙氨酸、酪氨酸、色氨酸)；(5)酰胺(天冬酰胺、谷氨酰胺)；以及(6)含硫(半胱氨酸和甲硫氨酸)(参见例如，Stryer(编辑),Biochemistry,第2版,W HFreeman and Co.[1981])。通过评估变体肽以与野生型蛋白质类似的方式发挥功能的能力，可以容易地确定肽的氨基酸序列的变化是否产生功能同源物。发生了不止一种替换的肽可以容易地以相同的方式测试。

在一些实施方案中，将外源多肽的变体工程化以包含增强的生物活性。当从重组DNA构建体表达时，此类多肽可以用于如本文所述的治疗实施方案中。

在一些实施方案中，外源多肽的变体可以包含与相应的野生型蛋白质相比增加的细胞内半衰期。例如，此类变体蛋白对于蛋白水解降解或导致变体破坏或以其他方式失活的其他细胞过程而言可以是更稳定或更不稳定的。此类变体以及编码它们的基因可以用于通过调节蛋白质的半衰期来改变表达变体外源多肽的构建体的药物活性。例如，短半衰期可能产生更短暂的生物效应。如上所述，此类蛋白质可用于药物应用或用于治疗肌肉疾病或病症。

本领域已知广泛多种用于筛选通过点突变制备的组合文库的基因产物，以及用于筛选cDNA文库中具有特定特性的基因产物的技术。此类技术通常可适用于快速筛选通过给定外源多肽的组合诱变产生的基因文库。用于筛选大基因文库的最广泛使用的技术通常包括将基因文库克隆到可复制的表达载体中，用所得的载体文库转化适当的细胞，以及在期望活性的检测有利于相对容易地分离编码其产物被检测到的基因的载体的条件下表达组合基因。

在一些实施方案中，外源多肽包含微型肌营养不良蛋白或微肌营养不良蛋白。如本文所用，“微型肌营养不良蛋白”包含氨基端肌动蛋白结合结构域、-肌营养不良蛋白聚糖结合结构域和多个(例如，至少2个)血影蛋白样重复结构域。

腺病毒相关载体(AAV)

AAV是一种小病毒，其呈现出非常低的免疫原性并且与任何已知的人类疾病无关，这使得它作为外源遗传物质(例如，用于基因疗法)的载体具有吸引力。然而，AAV衣壳的大小对可以包装在其内的DNA的量施加限制。AAV基因组的大小为大约4.7千碱基(kb)。

本文所述的方法和组合物允许通过施用两种(或更多种)各自具有待表达的外源多肽的一部分和分裂内含肽的一部分的AAV载体来递送大型蛋白质(例如，大于4.7kb)。在一个实施方案中，本文所述的方法和组合物使用至少两种不同的腺相关病毒(AAV)载体。第一AAV载体包含与外源多肽(例如，肌营养不良蛋白、dysferlin、utrophin或其他期望的治疗性蛋白质，例如用于肌肉或其他疾病或病症)的第一部分融合的分裂内含肽的N端部分，并且第二AAV载体包含与外源多肽的第二部分融合的分裂内含肽的C端部分。当第一融合多肽和第二融合多肽在细胞中表达时，分裂内含肽的第一部分和第二部分促进外源多肽的第一部分与外源多肽的第二部分的连接，从而将外源多肽递送至细胞。该系统或布置允许递送比单个AAV载体颗粒可以编码的多肽更大的外源多肽。

本文提供了第一AAV载体和第二AAV载体的实施方案并且包括以下非限制性实施方案。如本文所用的AAV载体可以是成熟AAV颗粒或病毒体的形式，即，被AAV蛋白衣壳包围的核酸。AAV载体可以包含AAV基因组或其部分或衍生物。AAV基因组是编码产生AAV颗粒所需功能的多核苷酸。这些功能包括在宿主细胞中的AAV复制和包装周期中运行的功能，包括将AAV基因组衣壳化成AAV颗粒。天然存在的AAV是复制缺陷型的，并且依赖于反式提供辅助功能来完成复制和包装周期。因此，如本文所用的载体的AAV基因组通常是复制缺陷型的。

AAV基因组可以是单链形式，可以是正链或负链，也可以是双链形式。双链形式的使用允许绕过靶细胞中的DNA复制步骤，因此可以加速转基因表达。在一个实施方案中，AAV基因组为单链形式。AAV基因组可以来自任何天然衍生的AAV血清型、分离株或进化枝。因此，AAV基因组可以是天然存在的AAV或重组的、工程化的AAV的完整基因组。如技术人员所已知的，自然界中存在的AAV可根据各种生物系统进行归类。

通常，AAV是根据其血清型来提及的。血清型对应于AAV的变体亚种，由于其衣壳表面抗原的表达谱，其具有可以用于将其与其他变体亚种区分开的独特反应性。通常，具有特定AAV血清型的病毒不与对任何其他AAV血清型具有特异性的中和抗体有效地交叉反应。AAV血清型包括AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10和AAV11，以及重组血清型，诸如Rec2和Rec3。这些AAV血清型中的任一种都可以与本文所述的方法和组合物一起使用。AAV血清型的综述可以在Choi等人(2005)Curr.Gene Ther.5:299-310和Wu等人(2006)Molecular Therapy 14:316-27中找到。AAV基因组的序列或包括ITR序列、rep或cap基因的AAV基因组的元件的序列可以衍生自以下AAV全基因组序列登录号：腺相关病毒1NC_002077、AF063497；腺相关病毒2NC_001401；腺相关病毒3NC_001729；腺相关病毒3B NC_001863；腺相关病毒4NC_001829；腺相关病毒5Y18065、AF085716；腺相关病毒6NC_001862；禽类AAV ATCC VR-865AY186198、AY629583、NC_004828；禽类AAV毒株DA-1NC_006263、AY629583；牛AAV NC_005889、AY388617。

AAV也可以根据进化枝或克隆来提及。这是指天然衍生的AAV的系统发育关系，并且通常是指可以追溯到共同祖先的AAV的系统发育组，并包括其所有后代。

另外，AAV可以根据特定分离株来提及，即在自然界中发现的特定AAV的遗传分离株。术语“遗传分离株”描述了一种AAV群体，所述群体与其他天然存在的AAV进行了有限的基因混合，从而在基因水平上限定了可辨别的不同群体。

技术人员可以基于他们对特定AAV特征的常识选择适当的AAV血清型、进化枝、克隆或分离株以用于与本文所述的方法和组合物一起使用。

AAV血清型决定AAV病毒感染(或向性)的组织特异性。因此，用于在根据本文所述的方法和组合物施用于患者的AAV中使用的优选AAV血清型是例如对肌肉内的靶细胞的感染具有天然向性或高效率的那些。

通常，天然衍生的AAV血清型、分离株或进化枝的AAV基因组包含至少一个反向末端重复序列(ITR)。ITR序列顺式作用，以提供功能性复制起点，并允许载体整合在细胞的基因组中和从中切除。

AAV基因组通常还包含包装基因，诸如编码AAV颗粒的包装功能的rep和/或cap基因。rep基因编码蛋白质Rep78、Rep68、Rep52和Rep40中的一种或多种或其变体。cap基因编码一种或多种衣壳蛋白，诸如VP1、VP2和VP3或其变体。这些蛋白质构成AAV颗粒的衣壳。下面讨论衣壳变体。启动子可以可操作地连接至各包装基因。此类启动子的具体实例包括p5、p19和p40启动子(Laughlin等人(1979)Proc.Natl.Acad.Sci.USA 76:5567-5571)。例如，p5和p19启动子通常用于表达rep基因，而p40启动子通常用于表达cap基因。

通常，用于与本文所述的方法和组合物一起使用的AAV基因组将被衍生化以用于向患者施用的目的。这种衍生化在本领域中是标准的(参见例如，Coura和Nardi(2007)Virology Journal 4:99)。AAV基因组的衍生物包括AAV基因组的允许转基因在体内表达的任何截短或修饰形式。通常，可以显著截短AAV基因组，以包括最小的病毒序列，但仍保留上述功能。出于安全原因，这是优选的，以降低载体与野生型病毒重组的风险，并且还避免因靶细胞中存在病毒基因蛋白而触发细胞免疫应答。

通常，AAV基因组的衍生物将包括至少一个反向末端重复序列(ITR)，优选多于一个ITR，诸如两个或更多个ITR。一个或多个ITR可衍生自具有不同血清型的AAV基因组，或者可以是嵌合或突变的ITR。优选的突变ITR是缺失trs(末端解链位点(terminal resolutionsite))的突变ITR。这种缺失允许基因组继续复制以产生包含编码序列和互补序列的单链基因组，即自我互补的AAV基因组。这允许绕过靶细胞中的DNA复制，并且从而实现加速的转基因表达。

优选包含一个或多个ITR以帮助载体在宿主细胞的细胞核中形成多联体，例如在通过宿主细胞DNA聚合酶的作用将单链载体DNA转化为双链DNA之后。此类附加型多联体的形成在宿主细胞的生命过程中保护载体构建体，从而允许转基因在体内的表达延长。

在一些实施方案中，ITR元件是衍生物中从天然AAV基因组中保留的唯一序列。因此，衍生物将优选不包括天然基因组的rep和/或cap基因以及天然基因组的任何其他序列。由于上述原因，并且为了减小载体整合到宿主细胞基因组中的可能性，这是优选的。因此，在衍生物中可以移除以下部分：一个反向末端重复(ITR)序列、复制基因(rep)和衣壳基因(cap)。然而，在一些实施方案中，衍生物可另外包括AAV基因组的一种或多种rep和/或cap基因或其他病毒序列。天然存在的AAV在人19号染色体上的特定位点以高频率整合，并且显示出可忽略不计的随机整合频率，使得在治疗环境中可耐受载体中整合能力的保留。当衍生物包含衣壳蛋白，即VP1、VP2和/或VP3时，衍生物可以是一种或多种天然存在的AAV的嵌合的、改组的或衣壳修饰的衍生物。具体地，本文所述的方法和组合物涵盖在同一载体(即假型载体)内提供来自不同的AAV血清型、进化枝、克隆或分离株的衣壳蛋白序列。

通常选择嵌合的、改组的或衣壳修饰的衍生物来为病毒载体提供一种或多种期望的功能性。因此，与包含天然存在的AAV基因组(诸如AAV2的基因组)的AAV载体相比，这些衍生物可表现出基因递送效率的增加、免疫原性(体液或细胞)的降低、向性范围的改变和/或特定细胞类型的靶向性的改善。基因递送效率的增加可以通过细胞表面的受体或共受体结合的改善、内化的改善、细胞内和进入细胞核的运输的改善、病毒颗粒的脱壳的改善和/或单链基因组向双链形式的转化的改善来实现。效率的增加还可与特定细胞群的向性范围或靶向性的改变有关，使得载体剂量不因施用于不需要的组织而被稀释。

嵌合衣壳蛋白包括通过天然存在的AAV血清型的两个或更多个衣壳编码序列之间的重组产生的那些。这可以例如通过标志物拯救方法(marker rescue approach)来进行，其中一种血清型的非感染性衣壳序列与不同血清型的衣壳序列共转染，并且使用定向选择来选择具有期望特性的衣壳序列。不同血清型的衣壳序列可以通过细胞内的同源重组来改变，以产生新型嵌合衣壳蛋白。

嵌合衣壳蛋白还包括通过对衣壳蛋白序列工程化以在两种或更多种衣壳蛋白之间，例如在不同血清型的两种或更多种衣壳蛋白之间转移特定的衣壳蛋白结构域、表面环或特定的氨基酸残基而产生的那些。

改组或嵌合的衣壳蛋白也可以通过DNA改组或易错PCR产生。杂合AAV衣壳基因可以通过以下方式产生：将相关AAV基因(例如编码多种不同血清型的衣壳蛋白的那些)的序列随机片段化，接着随后在自引发聚合酶反应中将片段重新组装，这还可在序列同源性的区域中导致交叉。可以筛选通过改组几种血清型的衣壳基因而以此方式产生的杂合AAV基因的文库，以鉴定具有期望功能性的病毒克隆。类似地，易错PCR可用于随机突变AAV衣壳基因，以产生变体的多样化文库，然后可针对期望特性对所述变体进行选择。

还可以对衣壳基因的序列进行基因修饰，以相对于天然野生型序列引入特定的缺失、取代或插入。具体地，可通过在衣壳编码序列的开放阅读框内或在衣壳编码序列的N端和/或C端插入不相关的蛋白质或肽的序列来修饰衣壳基因。

本文所用的载体可以涵盖以与天然AAV基因组不同的顺序和构造提供AAV基因组的序列。载体还可以包括用来自另一种病毒的序列或由来自多于一种病毒的序列构成的嵌合基因替换一种或多种AAV序列或基因。此类嵌合基因可以由来自不同病毒物种的两种或更多种相关病毒蛋白的序列构成。

如本文所述使用的AAV载体可以包括跨衣壳化(transcapsidated)形式，其中具有一种血清型的ITR的AAV基因组或衍生物被包装在不同血清型的衣壳中。此类AAV载体还可以包括嵌合形式(mosaicform)，其中来自两种或更多种不同血清型的未修饰衣壳蛋白的混合物构成病毒衣壳。AAV载体还可以包括带有吸附至衣壳表面的配体的化学修饰形式。例如，此类配体可包括用于靶向特定细胞表面受体的抗体。

如本文所述的AAV载体系统的第一AAV载体和第二AAV载体一起包含全功能性外源多肽在被两种载体转导后的靶细胞中重新组装所必需的所有组分。技术人员将了解常用于确保转基因在病毒载体转导的细胞中表达的另外遗传元件。这些可称为表达控制序列。因此，本文所述的AAV病毒载体系统的AAV载体通常包含与编码期望的外源多肽(例如，肌营养不良蛋白、utrophin、dysferlin等)的核苷酸序列可操作地连接的表达控制序列(例如包含启动子序列)。

可以使用任何合适的启动子。启动子序列可以是具有组成型活性的(即在任何宿主细胞背景中操作)，或者可仅在特定的宿主细胞环境中具有活性，从而允许转基因在特定细胞类型中的靶向表达(例如组织特异性启动子)。启动子可以响应于另一因子(例如宿主细胞中存在的因子)的存在而表现出诱导型表达。无论如何，当载体被施用以用于治疗时，优选的是，启动子应在靶细胞背景中具有功能。

在一些实施方案中，优选的是，启动子在肌肉细胞中高度有效，以便允许转基因优先或仅在肌肉细胞群中表达。因此，由启动子实现的表达可以是肌细胞特异性的。在一个实施方案中，肌肉特异性启动子包含在肌肉特异性表达盒中，如所述术语在本文所使用的。

本文所述载体中的至少一种可以包含位于启动子与上游多肽编码核酸序列之间的非翻译区(UTR)(即5′UTR)。可以使用任何合适的UTR序列。UTR可以包含以下元件中的一种或多种：原鸡(Gallusgallus)β-肌动蛋白(CBA)内含子1片段、穴兔(Oryctolaguscuniculus)β-珠蛋白(RBG)内含子2片段和穴兔β-珠蛋白外显子3片段。UTR可以包含Kozak共有序列。可以使用任何合适的Kozak共有序列。

本文所述载体中的至少一种还可以包含转录后反应元件(也称为转录后调控元件)或PRE。可以使用任何合适的PRE。合适的PRE的存在可以增强期望转基因的表达。在一个实施方案中，PRE是土拨鼠肝炎病毒PRE(WPRE)。一种或多种载体还可以包含位于编码蛋白质的核酸序列3′的聚腺苷酸化序列。可以使用任何合适的聚腺苷酸化序列。在一个实施方案中，聚腺苷酸化序列是牛生长激素(bGH)聚腺苷酸化序列。

给定外源蛋白的表达需要用第一AAV载体和第二AAV载体转导靶细胞；然而，顺序并不重要。因此，可以按照任何顺序用第一AAV载体和第二AAV载体(第一AAV载体随后第二AAV载体，或第二AAV载体随后第一AAV载体)或同时转导靶细胞。用AAV载体转导靶细胞的方法是本领域已知的并且将是技术人员熟悉的。靶细胞优选是肌肉细胞，优选骨骼肌细胞或心肌细胞。

虽然本文所述的方法和组合物涉及至少两种腺相关载体的使用，但所述方法和组合物可以利用替代载体，包括例如第二代腺病毒载体、慢病毒载体或逆转录病毒载体。

第二代腺病毒载体缺失Ad基因组的早期区域(E2A、E2B和E4)。高度修饰的第二代腺病毒载体在大规模载体制备过程中不太可能产生具有复制能力的病毒。因此，针对晚期病毒蛋白的宿主免疫应答减少(参见Amalfitano等人,“Production andCharacterization of ImprovedAdenovirus Vectors With the E1,E2b,and E3 GenesDeleted,”J.Virol.72:926-933(1998))。从腺病毒基因组中消除E2A、E2B和E4基因还提供了增大的克隆容量。这与本文所述的分裂内含肽方法相结合可以进一步增加所引入的外源编码多肽的大小。

基于慢病毒的载体感染非分裂细胞，作为其正常生命周期的一部分，并通过在表达病毒蛋白的细胞系中表达可包装的载体构建体来产生。慢病毒颗粒的小尺寸将它们能够携带的外源DNA的量限制为约10kb。

已出现可用于基因疗法应用的基于莫洛尼鼠白血病病毒(MMLV)和其他逆转录病毒的载体。这些载体稳定转导活跃分裂的细胞，作为其正常生命周期的一部分，并整合到宿主细胞染色体中。逆转录病毒可以如本文所述使用，例如在肌肉前体细胞诸如成肌细胞、卫星细胞或其他肌肉干细胞的感染和转导的上下文中。

分裂内含肽

内含肽是天然存在的自剪接蛋白质亚结构域，其能够从较大的蛋白质结构中切除其自身的蛋白质亚结构域，同时将两个先前侧接的肽区域(“外显肽”)连接在一起以形成成熟的宿主蛋白。

内含肽重新排列两侧肽键，并在与其天然外显肽以外的蛋白质融合时保持活性的能力催生了许多基于内含肽的生物技术。这些生物技术包括各种类型的蛋白质连接和激活应用，以及蛋白质标记和追踪应用。内含肽的一个重要应用是生产纯化的重组蛋白。具体地，内含肽能够向许多常规亲和和纯化标签赋予自切割活性，从而提供了用于研究、医疗和其他商业应用的重组蛋白产品的生产的重大进展。

分裂内含肽与本文提供的方法和组合物的使用允许大型蛋白质编码序列被分到两个(或更多个)不同的载体诸如AAV载体中，所述序列当在细胞中表达时连接在一起以形成完整蛋白。鉴于AAV载体受到其可以携带的蛋白质编码序列的大小的限制，分裂内含肽的使用允许将无法单独在单个AAV载体上编码的大型蛋白质递送至细胞。

任何催化活性内含肽或其片段可以用于衍生用于在本发明的方法中使用的分裂内含肽。例如，在一个方面，分裂内含肽可以衍生自真核内含肽。在另一方面，分裂内含肽可以衍生自细菌内含肽。在另一方面，分裂内含肽可以衍生自古细菌内含肽。优选地，如此衍生的分裂内含肽将仅具有催化反式剪接反应所必需的氨基酸序列。

N端分裂内含肽，如所述术语在本文所使用的，可以包含为天然存在的内含肽序列的N端部分的修饰的序列。例如，N端分裂内含肽序列可以包含另外的氨基酸残基和/或突变的残基，只要此类另外的和/或突变的残基的包含不使内含肽相对于外源多肽的两个部分的剪接失去功能即可。优选地，另外的和/或突变的残基的包含改善或增强内含肽的剪接活性。

用于与本文所述的方法和组合物一起使用的C端分裂内含肽可以是包含对于反式剪接反应具有功能的C端氨基酸序列的任何内含肽序列。在一个方面，C端分裂内含肽包含4至7个连续氨基酸残基，其中至少4个氨基酸来自其所来源的内含肽的最后一个β-链。因此，C端分裂内含肽区域还包含当发生反式剪接时被剪除的序列。C端分裂内含肽区域可以包含为天然存在的内含肽序列的C端部分的修饰的序列。例如，C端分裂内含肽区域可以包含另外的氨基酸残基和/或突变的残基，只要此类另外的和/或突变的残基的包含不使内含肽相对于剪接失去功能即可。优选地，另外的和/或突变的残基的包含改善或增强C端分裂内含肽区域的剪接活性。

在一些实施方案中，连接至C端或N端分裂内含肽区域的肽可以包含另外的化学部分，其中包括荧光基团、生物素、聚乙二醇(PEG)、氨基酸类似物、非天然氨基酸、磷酸酯基团、糖基、放射性同位素标记和药物分子。在其他实施方案中，连接至C端分裂内含肽区域的肽可以包含一个或多个化学反应性基团，其中包括酮、醛、Cys残基和Lys残基。当存在“内含肽剪接多肽(ISP)”时，分裂内含肽的N-内含肽和C-内含肽可以非共价缔合形成活性内含肽并催化剪接反应。“内含肽剪接多肽(ISP)”是分裂内含肽的当从分裂内含肽中移除C端或N端分裂内含肽区域或两者时保留的氨基酸序列的一部分。在某些实施方案中，N端分裂内含肽区域包含ISP。在另一个实施方案中，C端分裂内含肽区域包含ISP。在另一个实施方案中，ISP是不与C端或N端分裂内含肽区域共价连接的单独的肽。

在蛋白质反式剪接中，一种前体蛋白由N-外显肽部分和随后的N-内含肽组成，另一种前体蛋白由C-内含肽和随后的C-外显肽部分组成，并且反式剪接反应(由N-和C-内含肽一起催化)切除两个内含肽序列并将两个外显肽序列用肽键联接起来。蛋白质反式剪接，一种酶促反应，可以在非常低(例如微摩尔)的蛋白质浓度下工作，并且可以在生理条件下进行。

在一些实施方案中，针对在特定细胞诸如真核细胞(例如，真核肌肉细胞)中的表达对本文所用的分裂内含肽序列进行密码子优化。真核细胞可以是特定生物体的或来源于所述特定生物体的那些细胞，所述生物体诸如哺乳动物，包括但不限于人、小鼠、大鼠、兔、狗或非人灵长类动物。一般来说，密码子优化是指通过用在感兴趣的宿主细胞的基因中更频繁或最频繁使用的密码子替换天然序列的至少一个密码子(例如约或多于约1、2、3、4、5、10、15、20、25、50或更多个密码子)，同时保持天然氨基酸序列来修饰核酸序列以增强在所述宿主细胞中的表达的过程。各种物种对特定氨基酸的某些密码子表现出特定的偏好性。密码子偏好性(生物体之间的密码子使用差异)经常与信使RNA(mRNA)的翻译效率相关联，据信所述翻译效率反过来尤其依赖于被翻译的密码子的特性和特定转运RNA(tRNA)分子的可用性。细胞中的选定tRNA的优势一般是在肽合成中最频繁使用的密码子的反映。相应地，可以基于密码子优化对基因进行定制，以使基因在给定生物体中的表达最佳。密码子使用表是容易获得的，例如，在“密码子使用数据库(Codon Usage Database)”，并且这些表可以多种方式改编。参见Nakamura,Y.等人“Codon usage tabulated from theinternationalDNA sequence databases:status for the year 2000”Nucl.Acids Res.28:292(2000)。用于针对在特定宿主细胞中的表达对特定序列进行密码子优化的计算机算法也是可获得的，诸如Gene Forge(Aptagen；Jacobus,Pa.)。

在一些实施方案中，本文所述的方法和组合物利用存在于下表中的一种或多种分裂内含肽。用于本文的示例性分裂内含肽在本文示出于图15A-15U中。

表3：示例性分裂内含肽

/>

在一些实施方案中，外源多肽的编码序列可以分裂成三个(或更多个)部分。

分裂内含肽可以介导两种或更多种异源外显肽多肽的有效翻译后剪接。然而，所得的剪接产物通常包括在剪接的氨基端和羧基端外显肽多肽的连接处引入的内含肽序列的三至五个氨基酸。在一些情况下，这三至五个“内含肽足迹”(或简称“足迹”)氨基酸不明显影响最终剪接多肽的功能，但在其他情况下，此类插入氨基酸的存在可以对最终产物的结构和功能产生负面影响。因此，最小化或甚至完全避免反式剪接蛋白产物中的内含肽足迹可以是有益的。

在一个方面，在如本文所述的方法和组合物中可以最小化或甚至完全避免内含肽足迹插入序列。为了实现这一点，例如，可以相对于已知的分裂内含肽足迹分析靶蛋白的序列，以鉴定靶标内与分裂内含肽的足迹匹配或非常接近的序列。

表4：用于最小化分裂内含肽足迹的示例性序列

氨基酸缩写：

A：丙氨酸

C：半胱氨酸

E：谷氨酸

F：苯丙氨酸

G：甘氨酸

I：异亮氨酸

N：天冬酰胺

P：脯氨酸

S：丝氨酸

Y：酪氨酸

然后可以使用这种具有在给定靶蛋白中天然存在的足迹的分裂内含肽来设计待单独表达的异源外显肽-内含肽融合体，从而最小化或甚至避免在剪接的多肽产物中插入非天然存在的氨基酸。例如，在筛选靶蛋白序列中与分裂内含肽足迹序列相匹配的序列后，可以制备编码靶多肽片段与对应的氨基和羧基端分裂内含肽片段的氨基和羧基端融合体的序列，其中外显肽融合多肽序列中省略了足迹氨基酸。在这种情况下，在外显肽序列的切割和接合后，内含肽足迹插入序列重构天然靶多肽序列，从而产生氨基酸序列与天然靶多肽没有差异的剪接靶多肽。也就是说，虽然技术上仍然存在所述分裂内含肽所特有的足迹插入序列，但其序列与靶蛋白中存在的序列相匹配，使得所得的剪接多肽产物中不存在非天然足迹。

在一些情况下，给定的靶多肽可能缺乏与分裂内含肽足迹的精确匹配，或者精确匹配可能位于非常接近靶蛋白的氨基或羧基端的位置，以致于在该点分裂编码靶蛋白的序列不将靶蛋白编码序列分成将各自装配到递送载体中的片段。在此类情况下，鉴定靶蛋白内与分裂内含肽足迹序列相似但不相同的序列仍然可以是有益的。这种相似性可以是，例如，匹配五个足迹氨基酸中的四个、五个足迹氨基酸中的三个，或甚至五个足迹氨基酸中的两个。在此上下文中的相似性还可以包括，例如，包含与足迹中的氨基酸具有相似特性的氨基酸，例如作为天然存在的氨基酸的保守取代或匹配和保守取代的组合的氨基酸。类似于可以在靶蛋白中的有益位置中鉴定出与内含肽足迹的精确匹配的情况，这种基于足迹相似性的方法可以使内含肽足迹和/或其对所剪接的靶蛋白的功能的影响最小化。因此，可以如本文所述产生具有相对于天然存在的或期望的靶蛋白序列具有四个或更少差异、三个或更少、两个或更少、一个或更少差异或没有差异的内含肽足迹的剪接产物。

在一些实施方案中，“工程化的”分裂内含肽与天然存在的多肽或核酸相差一个或多个氨基酸或核酸缺失、添加、取代或侧链修饰，但仍保留了天然存在的分裂内含肽序列的一种或多种特定功能或生物活性。氨基酸取代包括其中氨基酸被不同的天然存在的或非常规氨基酸残基替换的改变。一些取代可以归类为“保守的”，在这种情况下，多肽中所含的氨基酸残基被在极性、侧链功能性或大小方面具有相似特征的另一个天然存在的氨基酸替换。如本文所述的变体所涵盖的取代也可以是“非保守的”，其中存在于肽中的氨基酸残基被具有不同特性的氨基酸取代(例如，用不带电荷的或疏水性的氨基酸取代带电荷的或亲水性的氨基酸)，或者，其中天然存在的氨基酸被非常规氨基酸取代。

在一个实施方案中，分裂内含肽包含SEQ ID No:1-46中的至少两个。在另一个实施方案中，分裂内含肽包含SEQ ID NO:1和SEQ ID NO:2。在另一个实施方案中，分裂内含肽包含SEQ ID NO:3和SEQ ID NO:4。在另一个实施方案中，分裂内含肽包含SEQ ID NO:5和SEQ ID NO:6。在另一个实施方案中，分裂内含肽包含SEQ ID NO:7和SEQ ID NO:8。在另一个实施方案中，分裂内含肽包含SEQ ID NO:9和SEQ ID NO:10。在另一个实施方案中，分裂内含肽包含SEQ ID NO:11和SEQ ID NO:12。在另一个实施方案中，分裂内含肽包含SEQ IDNO:13和SEQ ID NO:14。在另一个实施方案中，分裂内含肽包含SEQ ID NO:15和SEQ ID NO:16。在另一个实施方案中，分裂内含肽包含SEQ ID NO:17和SEQ ID NO:18。在另一个实施方案中，分裂内含肽包含SEQ ID NO:19和SEQ ID NO:20。在另一个实施方案中，分裂内含肽包含SEQ ID NO:21和SEQ ID NO:22。在另一个实施方案中，分裂内含肽包含SEQ ID NO:23和SEQ ID NO:24。

在另一个实施方案中，分裂内含肽包含SEQ ID NO:25和SEQ ID NO:26。在另一个实施方案中，分裂内含肽包含SEQ ID NO:27和SEQ ID NO:28。在另一个实施方案中，分裂内含肽包含SEQ ID NO:29和SEQ ID NO:30。在另一个实施方案中，分裂内含肽包含SEQ IDNO:31和SEQ ID NO:32。在另一个实施方案中，分裂内含肽包含SEQ ID NO:33和SEQ ID NO:34。在另一个实施方案中，分裂内含肽包含SEQ ID NO:35和SEQ ID NO:36。在另一个实施方案中，分裂内含肽包含SEQ ID NO:37和SEQ ID NO:38。在另一个实施方案中，分裂内含肽包含SEQ ID NO:39和SEQ ID NO:40。在另一个实施方案中，分裂内含肽包含SEQ ID NO:41和SEQ ID NO:42。在另一个实施方案中，分裂内含肽包含SEQ ID NO:43和SEQ ID NO:44。在另一个实施方案中，分裂内含肽包含SEQ ID NO:45和SEQ ID NO:46。

具有相应内含肽的特定肌营养不良蛋白、dysferlin、utrophin和微型肌营养不良蛋白片段的示例性序列在本文提供于实施例2中。

MSEC

在某些实施方案中，本文所述的分裂内含肽构建体可以受益于细胞类型特异性表达。这种设计不仅可以确保靶蛋白在最需要的地方表达，包括高水平、中等水平或低水平或受调控的表达，而且可以避免或限制在非靶细胞或组织中异位表达的潜在负面影响。因此，组织特异性表达盒的包含可以使转基因引入的治疗有益效果最大化。这种设计还可以例如促进或允许载体的全身施用，因为虽然感染可能发生在非靶细胞或组织中，但一种或多种转基因多肽的表达将基本上仅发生在期望的细胞或组织类型中。当与例如对给定组织或细胞类型的转导具有向性或增强的向性的载体组合使用时，使用组织特异性表达盒来驱动如本文所述的各靶蛋白-分裂内含肽构建体的表达可以是非常有益的。当在递送两种或更多种载体的情况下使用时，可以使用多个组织特异性表达盒来产生比率平衡的例如mRNA产生或积聚或者蛋白质翻译、产生或积聚。

“组织特异性表达盒”，如该术语在本文所使用的，以限制于特定组织或细胞类型的方式提供靶蛋白的表达。“限制于”或“以限制方式”在此上下文中是指由构建体实现的表达在靶组织或细胞类型中比在其他组织或细胞类型中高至少5倍，例如高至少5倍、高10倍、高15倍、高20倍或更多。表达可以在例如mRNA产生或积聚的水平上测量，或者在蛋白质翻译、产生或积聚的水平上测量。在一个实施方案中，组织特异性表达盒是如本文所述的“肌肉特异性表达盒”或“MSEC”。MSEC将以肌肉细胞或肌肉组织限制性方式驱动所连接的构建体的表达，如所述术语在上文所定义的。

MSEC通常包括肌肉特异性启动子和增强子的元件。参见，例如，Salva等人,Molecular Therapy 15:320-329(2007)，其中经设计用于rAAV载体以驱动骨骼肌和心肌中的异源蛋白表达的肌肉特异性表达盒的实例和讨论以引用方式并入本文。肌肉特异性表达盒包括例如衍生自肌肉特异性基因的启动子和增强子序列元件，所述基因包括肌肉肌酸激酶(MCK)、骨骼α-肌动蛋白和α-肌球蛋白重链基因等。鼠MCK基因包括位于转录起始位点上游大约1.2kb处的206bp增强子和358bp近端启动子。然而，对于在基因治疗载体诸如AAV中使用，如本文所讨论的病毒包装极限需要经设计来驱动肌肉特异性表达的调控元件保持最小(约800bp或更小)，以便使给定载体的有效负载蛋白质编码序列的量最大化。因此，可用于本文所述的方法和组合物的肌肉特异性表达盒由为生肌调节因子提供结合位点的截短/修饰的肌肉特异性调控元件，以及Inr(起始子元件)和/或TATA盒序列构成，并且可以包括例如来自肌肉特异性基因的5’非翻译区的附加序列。Salva等人描述的MHCK7盒仅是可用于本文所述的方法和组合物的MSEC的一个实例。所述盒在MM14肌细胞中对表达的驱动达到比组成型活性CMV启动子更高的程度，但在非肌肉细胞(例如，HEK 293成纤维细胞、鼠L细胞成纤维细胞和JAWSII树突状细胞)中基本上无活性。另外参见U.S.10,479,821中描述的表达盒，其通过引用并入本文。仅作为一个例子，在其中描述并被称为CK8的SEQ ID NO:19在心肌和骨骼肌中具有高度活性。预期此类MSEC序列的变体也可以提供治疗性转基因的高活性、肌肉特异性表达。例如，与此类MSEC具有至少80％、85％、90％、95％、96％、97％、98％、99％或更大同一性的序列也可以用于本文所述的方法和组合物中。本领域技术人员可以确定给定MSEC在肌肉细胞或组织中的活性，例如，使用如Salva等人的出版物中所述的测定。

药物组合物

本文提供了可用于治疗或预防受试者的多种不同疾病和/或病症的载体组合物。疾病和病症的一个重要子集是肌肉疾病和病症。在一个实施方案中，组合物是药物组合物。组合物可以包含治疗或预防有效量的至少两种编码外源多核苷酸或治疗剂的载体。至少两种载体利用分裂内含肽来帮助将大型蛋白质编码核酸递送至给定细胞。

组合物可以任选地包含载剂，诸如药学上可接受的载剂。药学上可接受的载剂部分地由所施用的具体组合物以及用于施用组合物的具体方法来确定。因此，存在药物组合物的广泛多种合适的制剂。可以配制适合肠胃外施用的制剂，例如，用于静脉内、肌内、皮内、腹膜内和皮下途径。载剂可以包括水性等张无菌注射溶液，其可以包含抗氧化剂、缓冲剂、抑菌剂和致使制剂与预期接受者的血液等张的溶质，以及水性和非水性无菌悬浮液，其可以包括助悬剂、增溶剂、增稠剂、稳定剂、防腐剂、脂质体、微球和乳液。

在一个实施方案中，组合物被配制用于肌内递送。

治疗组合物含有生理上可耐受的载剂以及作为活性成分溶解或分散在其中的本文所述的载体。如本文所用，术语“药学上可接受的”、“生理上可耐受的”及其语法变型，当它们是指组合物、载剂、稀释剂和试剂时，可互换使用，并表示材料能够施用至或于哺乳动物而不产生不期望的生理效应，诸如恶心、头晕、胃部不适等。药学上可接受的载剂将不促进对与其掺混的剂的免疫应答的产生，除非期望如此。包含溶解或分散在其中的活性成分的药物组合物的制备是本领域中了解的并且不需要基于制剂进行限制。通常，此类组合物被制备成呈液体溶液或悬浮液形式的可注射物；然而，也可以制备适合在使用之前溶解或悬浮于液体中的固体形式。制剂也可以被乳化或呈现为脂质体组合物。活性成分可以与药学上可接受并且与活性成分相容并且以适合用于本文所述的治疗方法的量的赋形剂混合。合适的赋形剂包括，例如，水、盐水、右旋糖、甘油、乙醇等及其组合。另外，如果期望，组合物可以包含增强活性成分的有效性的少量辅助物质，诸如润湿剂或乳化剂、pH缓冲剂等。用于与本文所述的方法一起使用的治疗组合物可以包括其中组分的药学上可接受的盐。药学上可接受的盐包括与例如像盐酸或磷酸的无机酸或诸如乙酸、酒石酸、扁桃酸等有机酸形成的酸加成盐(与多肽的游离氨基形成)。与游离羧基形成的盐也可以衍生自无机碱，诸如氢氧化钠、氢氧化钾、氢氧化铵、氢氧化钙或氢氧化铁，以及有机碱，诸如异丙胺、三甲胺、2-乙基氨基乙醇、组氨酸、普鲁卡因等。生理上可耐受的载剂是本领域众所周知的。示例性液体载剂是无菌水溶液，其不含除活性成分和水以外的材料，或包含缓冲剂，诸如生理pH值下的磷酸钠、生理盐水或两者，诸如磷酸盐缓冲盐水。另外，水性载剂可以包含多于一种缓冲盐，以及诸如氯化钠和氯化钾的盐、右旋糖、聚乙二醇和其他溶质。除了水之外还有以及排除水，液体组合物还可以包含液相。此类另外的液相的实例是甘油、植物油诸如棉籽油和水-油乳液。将有效治疗特定病症或病状的本文待施用的载体的量将取决于病症或病状的性质、治疗剂的表达，并且可以通过标准临床技术确定。

虽然可以将本领域普通技术人员已知的任何合适的载剂用于药物组合物中，但是载剂的类型将根据施用方式而变化。如本文所述使用的组合物可以被配制用于任何适当的施用方式，包括例如局部、口服、经鼻、静脉内、颅内、腹膜内、皮下或肌内施用。对于肠胃外施用，诸如肌内或皮下注射，载剂优选包括水、盐水、醇、脂肪、蜡或缓冲剂。可替代地，如本文所述的组合物可以被配制为冻干物。还可以将化合物包封在脂质体内。

剂量和施用

使用本文所述的方法和组合物的治疗包括疾病发作的预防/防治和活动性疾病的治疗。预防或治疗可以通过在单个时间点或多个时间点单次直接注射来完成。也可以几乎同时对多个部位进行施用。患者或受试者包括哺乳动物，诸如人、牛科、马科、犬科、猫科、猪科和羊科动物以及其他兽医学受试者。优选地，患者或受试者是人。

在一个方面，本文所述的方法提供了一种用于治疗受试者的疾病或病症(例如，肌肉疾病或病症)的方法。在一个实施方案中，受试者可以是哺乳动物。在另一个实施方案中，哺乳动物可以是人，尽管该方法对于所有哺乳动物都是有效的。所述方法包括向受试者施用有效量的药物组合物，所述药物组合物包含处于药学上可接受的载剂中的如本文所述的载体。

剂的剂量范围取决于治疗性蛋白质的效力、表达水平并且包括足够大以产生期望效果(例如，待治疗的疾病的至少一种症状的减轻)的量。剂量不应过大，以免引起不可接受的不良副作用。一般来说，剂量将根据载体表达的外源蛋白的类型(例如，重组多肽、肽、拟肽、小分子等)、治疗性蛋白质特征(例如，肌营养不良蛋白、utrophin、dysferlin等)以及患者的年龄、状况和性别而变化。剂量可以由本领域技术人员确定并且在发生任何并发症的情况下，也可以由个体医师调整。

在一些实施方案中，以至少5、至少10、至少20、至少30、至少40、至少50、至少100、至少200、至少500或更大的感染复数(MOI)施用载体。

在某些实施方案中，以至少1x 10⁵、1x 10⁶、1x 10⁷、1x 10⁸、1x 10⁹、1x 10¹⁰、1x10¹¹、1x 10¹²个病毒颗粒或更大的滴度施用载体。

可以根据需要进行重复施用以维持治疗功效。如本文所用，术语“治疗有效量”是指载体或所表达的治疗剂足以在疾病的至少一种症状上产生统计学显著的、可测量的变化的量(参见下文“功效测量”)。可替代地，治疗有效量是载体或所表达的治疗性蛋白质足以在与受试者的疾病相关的生物标志物的表达水平上产生统计学显著的、可测量的变化的量。此类有效量可以在给定剂的临床试验以及动物研究中计量。

载体组合物可以直接施用于特定部位(例如，肌内注射、静脉内输注到特定器官中)或可以口服施用。本文还预期，剂还可以静脉内(通过推注或连续输注)、通过吸入、鼻内、腹膜内、肌内、皮下、腔内递送，并且可以通过蠕动方式(如果期望的话)或通过本领域技术人员已知的其他方式递送。如果期望的话，剂可以全身施用。

包含至少一种剂的治疗组合物可以常规地以单位剂量施用。当关于治疗组合物使用时，术语“单位剂量”是指适合作为用于受试者的单一剂量的物理上离散的单位，每个单位包含与所需的生理学上可接受的稀释剂(即，载剂或媒介物)结合的经计算产生期望治疗效果的预定量的活性物质。

需要施用的活性成分的精确量取决于从业人员的判断并且对于每个个体来说都是特定的。然而，用于全身应用的合适剂量范围在本文公开并且取决于施用途径。合适的施用方案也是可变的，但典型的是初始施用，随后通过后续注射或其他施用以一个或多个间隔施用重复剂量。可替代地，预期了足以将血液中的浓度维持在针对体内疗法所指定的范围内的连续静脉内输注。

功效测量

给定治疗对疾病的功效可以由熟练临床医生确定。然而，如果在用如本文所述的载体治疗后，待治疗的疾病的任何一种或所有体征或症状以有益方式改变，其他临床上接受的疾病症状或标志物也改善或甚至减轻例如至少10％，则治疗被认为是“有效治疗”，如该术语在本文所使用的。功效还可以通过个体未恶化(如通过疾病的稳定所评估的)、住院或需要医疗干预来衡量(即，疾病进展停止或至少减缓)。测量这些指标的方法是本领域技术人员已知的和/或在本文描述。治疗包括对个体或动物(一些非限制性实例包括人或哺乳动物)的疾病的任何治疗，并且包括：(1)抑制疾病，例如，阻止或减缓疾病的进展；或(2)缓解疾病，例如，引起症状的消退；以及(3)预防或减少发展疾病的可能性或预防与疾病相关的继发性问题。

在一些实施方案中，肌肉疾病或病症的治疗功效可以通过评估肌肉功能的一个或多个参数来确定，所述参数包括但不限于比力产生、活动性、痉挛、张力、稳定性等。在一些实施方案中，用于确定肌肉功能改善的临床测试，诸如肌电图、磁共振成像(MRI)或肌肉活检，可以用于评估如本文所述的治疗方法的功效。

应理解，前面的描述和下列实施例仅仅是说明性的，而不应理解为对本发明范围的限制。在不脱离本发明的精神和范围的情况下，可以对公开的实施方案进行各种改变和修改，这对于本领域技术人员来说将是显而易见的。此外，将所有确定的专利、专利申请和出版物通过引用明确并入本文，目的是描述和公开例如在这样的出版物中描述的可能与本发明结合使用的方法。提供这些出版物仅仅是因为它们的公开在本申请的申请日之前。在这方面不应被解释为承认发明人无权凭借在先发明或由于任何其他原因而先于这样的公开。所有关于日期的声明或关于这些文件的内容的表述都是基于申请人可获得的信息，并不构成对这些文件的日期或内容的正确性的任何承认。

实施例

下面提供了展示和支持如本文所述的技术的非限制性实施例。

实施例1

概述

杜氏肌营养不良症(DMD)是最常见的人类遗传性病症之一，影响大约五千分之一的男婴(Emery 2003)。它是由DMD基因的基因突变引起的，所述突变阻止为人类细胞所产生的最大蛋白质之一的功能性肌营养不良蛋白的表达(Monaco 1985、Kunkel 1986)。基于腺相关病毒(AAV)载体的基因递送已积极用于治疗DMD(Crudele 2019)。然而，与DMD基因的递送相关的主要限制因素是其大型编码序列(11kb)(Koenig 1989、Chamberlain 1989)，而最大的AAV载货容量小于5kb(Srivastava 1983)。发明人之前的工作包括开发可以包装在单个AAV载体中的微型化的“微肌营养不良蛋白”(μDys)(Harper 2002、Gregorevic 2006)。尽管缺少肌营养不良蛋白的机械和信号传导功能所需的关键结构域并且不可能在一个AAV载体中全部运输，这些截短的、仍具有功能的肌营养不良蛋白已被证明在施用于肌营养不良蛋白缺陷型动物模型时改善骨骼肌力量和组织学。

使用AAV载体的基因疗法在治疗不同的功能丧失性遗传性病症方面具有广阔的前景(Li 2020)。然而，这种治疗方式因该病毒载体的小包装容量(-5kb)而受到挑战。由于DMD编码序列的尺寸大(-11.2kb)，目前正在开发的使用AAV载体的DMD治疗方法旨在表达微型化的μDys或恢复开放阅读框的遗传元件(CRISPR/Cas9介导的基因编辑或U7小核RNA诱导的外显子跳跃)(Harper 2002、Goyenvalle 2004、Long 2016、Nelson 2016、Bengtsson2017)。在这两种策略中，都产生比正常的肌营养不良蛋白更小的肌营养不良蛋白。此外，当使用CRISPR/Cas9或U7工具跳过一个或多个外显子时，观察到非常低的表达和不稳定的二级结构(最有可能是由于不正确‘定相的(phased)’重复；Harper 2002)。先前的工作已经证明了在施用两种或三种载体后通过同源重组重构较大的微型或全长肌营养不良蛋白的可行性(图2)(Odom 2011、Koo 2014、Lostal 2014)。然而，这些事件很罕见，并且在一些情况下，导致将危及其临床使用的不想要的且潜在有毒的产物。

本文提供了一种新型治疗方法，其可以高表达并以精确的方式递送较大的、可能最多至全长的肌营养不良蛋白。该方法不受不想要的重组产物的限制，并且可以适用于任何患有杜氏或贝克型肌营养不良症(BMD)患者的临床使用。这种改善的策略允许以高特异性和效率表达大型且稳定的蛋白质(SIMPLI-GT(用于基因疗法的分裂内含肽介导的蛋白质连接)。该方法利用分裂内含肽介导蛋白质反式剪接并且因此重构较大的治疗性构建体的固有能力，从而将基于AAV的基因替换方法的使用扩展到超过AAV载体的最大载货容量的任何基因。

研究

使用AAV载体的基因替换疗法在治疗由功能丧失性突变引起的遗传性病症方面具有广阔的前景。目前，已分离出数百种灵长类动物血清型，更多血清型正在开发中(Li2020)。发明人先前已证明，AAV可以用于将基因高效地全身递送至心肌和骨骼肌(Gregorevic 2004)。大量研究还已表明，在不同的动物模型中，表达非常稳定，持续长达8年(Rivera 2005、Niemeyer 2009)。在临床上，最近有若干患有诸如肌管性肌病或脊髓性肌萎缩症等神经肌肉病症的患者接受了单剂量AAV载体的治疗，以分别替换缺陷基因MTM或SMN(NCT03199469、NCT02122952)，并且临床数据已显示出非常有希望的生理结果，并且转基因和载体都缺乏细胞免疫原性。

然而，AAV载体的主要缺点之一是其包装容量有限(～5kb)，这使得许多遗传性病症无法使用这些载体作为基因转运体。由于肌营养不良症如杜氏或2B型肢带肌营养不良症中的缺陷基因的编码序列大，因此不可使用单个AAV载体将DMD或DYSF基因分别递送至受影响的肌肉。对于DMD，先前开发了一系列可以通过单个AAV载体递送的微型化μDy(图1)(Harper 2002、Gregorevic 2006、Banks2010、Ramos 2019)。这些截短的仍具有功能的肌营养不良蛋白已被证明在施用于肌营养不良蛋白缺陷型动物模型时改善骨骼肌力量和组织学，并且Sarepta和Solid Biosciences目前正在人体临床试验中测试三种构建体(NCT03375164、NCT03368742)。

值得注意的是，迄今为止开发的大多数μDy均含有4至6个血影蛋白重复(SR)与2或3个铰链，外加N端肌动蛋白结合结构域(ABD)和肌营养不良蛋白聚糖结合结构域(DgBD)(Ramos,2019)。最初构成全长肌营养不良蛋白的24个SR和4个铰链结构域可以通过数千种组合产生μDys。如此大量的可能组合加上有限的AAV运载容量使得预测哪种μDys将具有最佳生理结果具有挑战性。事实上，先前的研究揭示，许多μDy没有功能，并且迄今为止克隆的最佳构建体表现出不完全的心脏和骨骼拯救(Wasla 2018、Ramos 2019)。这表明治疗性候选物应包括更多结构域来稳定肌营养不良蛋白结构并提供另外的蛋白质功能。

另一方面，据报道，两名携带DMD基因的46％的缺失(Δ外显子17-48)的患者表达缺乏在铰链2与SR19中间之间的大部分区域的截短但具有高度功能性的肌营养不良蛋白，并呈现出具有正常寿命的非常温和的表型(England 1990)，这激发了更大的‘微型肌营养不良蛋白’(微型Dys)构建体的开发(Phelps 1995、Harper,2002、Odom 2011)。同时施用表达两侧为短同源区域的微型Dys(ΔH2-SR19)的两个半部分的两种AAV载体允许AAV基因组的重组，从而导致微型Dys的重构(图2)。当在mdx^4cv小鼠模型中测试时，这种具有高度功能性的蛋白质显示出改善肌肉组织学和生理性能的巨大治疗潜力。尽管如此，通过DNA印迹(Southern blot)分析和聚合酶链反应检测到不想要的产物，所述产物最大可能是通过单链基因组的非特异性退火和多联体的形成获得的。这些非特异性产物可能具有潜在毒性并触发免疫反应，从而阻碍其临床使用。

在本研究中，发明人描述了一种名为SIMPLI-GT(用于基因疗法的分裂内含肽介导的蛋白质连接的缩写)的新型方法，其目的是利用由内含肽介导的蛋白质反式剪接机制重构较大的治疗性构建体。这种方法可以克服与基于AAV的基因替换相关的主要障碍，并将其应用扩展到许多由大基因的功能丧失引起的遗传性病症。

内含肽是在单细胞生物体中发现的遗传元件。它们嵌入参与DNA转录、复制和维持的必需基因(例如DNA或RNA聚合酶亚基、解旋酶、回旋酶和核糖核苷酸还原酶)或其他管家基因(包括必需蛋白酶和代谢酶)中(Shah 2014)。在与宿主基因进行框内转录和翻译后，内含肽多肽(大小在138至844个氨基酸之间变化)从前体蛋白(也称为外显肽)上自我切除并连接相邻的肽。这种被称为蛋白质剪接的翻译后修饰不需要能量供应、辅因子或外源蛋白酶干预。迄今为止，已鉴定出超过600种内含肽，并且大约30种具有将由两种单独基因编码的特殊性。与更常见的连续内含肽不同，这些分裂内含肽以N-和C-内含肽片段的形式单独转录和翻译。然后，它们缔合并形成一种重构复合物(N-外显肽/N-内含肽/C-内含肽/C-外显肽)，之后内含肽自发剪接，从而得到重构且功能完全的外显肽(宿主蛋白)(图3)。

这种蛋白质反式剪接机制用于生物技术应用，包括蛋白质纯化和标记步骤(Li2015)。发明人提出利用分裂内含肽来重构由于载体的包装极限而无法由单个AAV载体递送的较大蛋白。因此，他们已生成了具有23种分裂内含肽的文库，以便针对其将两个多肽片段重构为一种功能蛋白的能力进行筛选。这种预筛选将使用绿色荧光蛋白(GFP)作为筛选平台来进行，这将允许在相同条件下并且以公正且可靠的方式测试若干内含肽。GFP是广泛使用的蛋白质，由于其小尺寸(238个氨基酸)、易用性、特异性和无细胞毒性，它给不同的生物学领域带来了革命性的变化。它先前被改造为支架来筛选适体和小抗菌肽(Abedi 1988、Soundrarajan 2016)。

首先，发明人鉴定出GFP蛋白序列中可以插入N端和C端内含肽的分裂位点。在初步测试中，克隆两种质粒，所述质粒编码与Npu内含肽(研究最多的内含肽之一，在点形念珠藻蓝细菌中发现)的N端或C端半部分融合的GFP的N端或C端半部分。然后，将人胚肾293(HEK293)细胞用N端和/或C端GFP/内含肽质粒共转染。24小时后，仅在用WT GFP(从一个质粒表达的全长GFP)或双重分裂GFP/内含肽质粒转染的细胞中检测到GFP荧光，但在用单个N端或C端质粒转染的细胞中未检测到GFP荧光(图4A)。这些数据表明GFP通过Npu内含肽介导的蛋白质反式剪接有效地重新组装。使用分光光度计测量活细胞中的GFP荧光强度。发现来自重构蛋白的GFP信号低于来自WT GFP的GFP信号(图4B)。这可能是由于转染时间短以及形成功能性GFP之前的不同步骤(即，N端和C端片段的转录、翻译、融合、内含肽剪接以及两个N端和C端GFP的连接)所需要的时间。此外，发明人观察到目前正在筛选的其他内含肽具有更高的活性。初始测试证明了使用分裂GFP测试内含肽重构能够发射可测量荧光的全长GFP的能力的可行性。发明人继续使用该准确系统筛选内含肽文库，并且来自多种另外的分裂内含肽的结果在图7中示出。

接下来，测试了内含肽连接微型Dys的两个半部分的能力。由于分裂内含肽的尺寸小，双重AAV载体方法允许表达迄今为止所测试的最大微型Dys构建体。计算机建模显示，两个AAV载体可以转运两个肌营养不良蛋白片段的编码序列：N端克隆编码从N端到SR19末端的蛋白质，但缺乏SR 5-15，而C端克隆编码从铰链3直到C端结构域的序列。因此，由分裂内含肽反式剪接介导的重构的微型Dys包含4个铰链、13个SR、ABD、CR和CT结构域。与肌营养不良蛋白中常通过外显子跳跃或基因编辑产生的不正确定相的重复不同(Harper,2002)，这种新型微型Dys(ΔSR5-15)仅携带将稳定其二级结构和分子折叠的完整的血影蛋白样重复。更重要的是，这种微型Dys(ΔSR5-15)大于在非常轻微的贝克型患者中发现的高度功能性的ΔH2-SR19肌营养不良蛋白(在背景部分讨论)。新的微型Dys具有若干功能结构域，包括肌动蛋白、肌营养不良蛋白聚糖、异连蛋白、互养蛋白和神经元型一氧化氮合酶(nNOS)结合位点，所述位点对其机械和信号传导作用非常重要。

在测试中，发明人克隆了表达N端或C端微型Dys/内含肽片段的两种质粒(图5A)。发明人测试了位于SR19与铰链3之间的接头中的四个不同的分裂位点。(参见，例如，图10)。用编码整个微型Dys(ΔSR5-15)的对照质粒或编码与分裂内含肽融合的分裂的微型Dys(ΔSR5-15)的N端和C端载体转染HEK293细胞。48小时后，收获总蛋白用于蛋白质印迹分析。令人惊讶的是，发现与对照质粒相比，微型Dys蛋白水平在分裂载体的情况下更高(5至11倍)(图5B和5C)。这可能可以通过同时加工由两种载体编码的两个半部分所需的时间短(相对于由单个载体表达的长构建体)或通过转染效率来解释。有趣的是，发明人注意到所有四个选定的分裂位点均导致有效的微型Dys形成，并且在位点#2的情况下获得最高表达。此外，即使在过度暴露后，在蛋白质印迹膜上也未检测到其他条带，这凸显了该方法的特异性。

这些体外数据表明，这种新的分裂的微型Dys系统可以用于体外验证预选的内含肽。一旦鉴定出最有效的内含肽，就将分裂的微型Dys/内含肽组克隆到AAV载体中以进行体内验证。

使用分裂GFP系统进行内含肽文库的预筛选。

已经描述了许多分裂内含肽对，并且发明人使用分裂内含肽GFP系统比较了更多这些分裂内含肽对的剪接(与图4和5中的数据相比)。将表达CMV-eGFP的质粒(对照)、携带eGFP的N端或C端半部分与密码子优化的分裂内含肽的N端或C端半部分的双重质粒，以及携带CMV-eGFP与将由双重载体的分裂内含肽连接留下的足迹的单个质粒克隆并转染到HEK293细胞中并监测相对荧光(图7)。数据表明，该系统对于比较分裂内含肽剪接效果良好。虽然没有一对产生与WT GFP一样强的荧光，但是几种分裂内含肽载体产生的水平与来自携带外显肽连接后留下的相应足迹的单个载体的水平相似(例如分裂的Aha内含肽；图7)。

为了评估是否可以在3种载体中使用2组分裂内含肽来制备全长Dys，测试了分裂内含肽半部分的组合，以查看其中的一些是否可与不同的分裂内含肽交叉剪接，这可以防止来自3种载体的外显肽通过跳过中间外显肽而连接。据观察，许多分裂内含肽确实进行交叉剪接，但较新的类别‘第2组内含肽’通常不这样(图8)。

接下来测试了足迹的大小是否可以从其正常的6个氨基酸(AA)减小，并且发现当修饰成仅留下3个AA的足迹时，一些分裂内含肽有效剪接(图9A)。这些结果表明，可以使用快速GFP测定有效筛选‘野生型’和合成的分裂内含肽，并且一些分裂内含肽对表现出有效且特异性的剪接，同时在外显肽连接后留下最小足迹。

使用分裂的微型Dys系统对预选内含肽进行体外验证

该内含肽系统适用于微型和全长肌营养不良蛋白(Dys)。使用一组或两组分裂内含肽制备两种或三种载体并在HEK293细胞中进行测试。对照使用表达相应的微型(ΔSR5-15)或完整Dys的单个质粒。所有分裂内含肽载体均以高于在使用单个载体情况下的水平制备正确的蛋白质(可能反映了较大质粒的转染效率降低；图9B、9C；图5A-5C；图13)。一些较小的产物在细胞中积聚(双重载体)，而在三重载体研究中则积聚了一些“微型Dys”，后者表明N端外显肽直接剪接至C端外显肽。

通过肌内注射对最佳微型Dys/内含肽组进行体内验证

已在mdx^4cv肌肉中测试的一组双重载体的实例揭示了ΔSR5-15微型肌营养不良蛋白的有效表达(图12)。在本实例中，将分裂的微型肌营养不良蛋白/内含肽克隆插入到含有肌肉特异性肌酸激酶8(CK8)调控盒和两侧为两个AAV血清型2反向末端重复序列(ITR)的小合成polyA的AAV质粒中并用于制备AAV载体。将5x10¹⁰病毒基因组(v.g)剂量的编码N端和/或C端分裂微型肌营养不良蛋白/内含肽的AAV注射到三周龄C57BL/6-mdx^4cv的胫骨前肌(T.A)中。注射后四周，收获并分析经注射的肌肉。在所测试的4个T.A肌肉中检测到微型肌营养不良蛋白ΔSR5-15的强烈表达，凸显了SIMPLI-GT方法的功效(图12A)。另外对肌肉进行冷冻切片并进行肌营养不良蛋白的免疫染色或用苏木精和曙红染色。重构的微型肌营养不良蛋白ΔSR5-15正确定位在注射了双重AAV N端和C端载体的mdx^4cv的肌纤维肌膜处(图12B)。这些肌肉表现出一般肌肉组织学改善且没有炎症(图12C)。

对于任何给定的分裂内含肽，在精确地在何处分裂微型Dys外显肽方面存在灵活性，这可影响剪接效率并使外显肽连接后残余的足迹最小(图B-E)。我们的一些工作聚焦在ΔSR5-15微型Dys(图10和9C)上，其中血影蛋白样重复(SR)4连接至SR16。这种微型Dys是从在轻度受影响患者中制备的外显子17-48缺失的Dys修饰得到的，所述患者直到70多岁才卧床(英格兰，1989年)。然而，本文所述的设计移除在外显子49上编码的部分SR(Harper,2002)并在SR 16-17中添加nNOS定位结构域。(Adams等人,2018；Lai等人,2009)该ΔSR5-15微型Dys被预期组装整个DGC。与外显子跳跃或Cas9切割方法不同，不需要在精确的外显子处分裂Dys序列(这通常留下部分结构域)。相反，可以将SR16-19区域的部分放入任一载体中，后跟5’分裂内含肽，而3’载体可以携带与其余SR连接的3’分裂内含肽。唯一的区别是足迹的位置。已经并且可以测试多个分裂位点，以使足迹最小化，同时监测在293细胞中的剪接效率(图10、9B、9C和13)。还已开发了工程化的分裂内含肽以产生更小的内含肽，其与候选分裂位点具有更接近的足迹匹配(例如靠近微型Dys克隆的中间；图10。此处的要点是，存在分裂靶标的多种选择，使得内含肽足迹可以与Dys序列相匹配，同时使剪接效率(和蛋白质稳定性/功能)最大化。理想情况下，将使用包含与内含肽足迹的完美6AA匹配的Dys区域。虽然发明人尚未在可用的位置发现这样的6AA链段，但他们发现了足迹与Dys仅相差1或2个氨基酸的区域。考虑到理想的微型Dys蛋白的大小，Dys中间存在至少600bp来靶向分裂内含肽，因为每个外显肽载体必须适合AAV克隆容量(<5kb)，其中包括ITR(360bp)、polyA位点(～60bp)和MSEC。用于使足迹最小化的另一种方式是靶向表现出与给定足迹的保守氨基酸差异的Dys序列。

为了使该系统适用于除肌营养不良蛋白以外的基因，发明人使用3个不同的分裂位点将dysferlin cDNA分裂成两段，并克隆3组质粒，每组质粒携带一组分裂内含肽，类似于在双重肌营养不良蛋白载体研究中所做的操作。在本研究中，将三组分裂内含肽dysferlin质粒单独共转染到HEK293细胞中，随后收获细胞并通过针对dysferlin蛋白的蛋白质印迹进行分析(图14)。如图14A所示，在HEK293细胞中用两组分裂内含肽dysferlin克隆产生全长dysferlin蛋白。两组都产生了与携带全长dysferlin cDNA的对照质粒相似的dysferlin水平。图14B示出蛋白质水平的量化，说明了获得的类似效率。

新的SIMPLI-GT方法具有若干优点并且可以应用于任何缺陷基因大于AAV载体的包装容量的遗传性病症。它依赖于AAV载体的使用，所述载体因其效率、血清型多样性和组织向性而广泛用于基因治疗领域。与CRISPR-Cas9基因编辑和U7外显子跳跃方法不同，该方法将促进具有将稳定肌营养不良蛋白结构的正确定相的结构域的较大肌营养不良蛋白的高表达。该策略可以应用于任何DMD或BMD患者，无论其基因突变如何，并且最终将导致一种变异性和监管障碍较小的治疗性候选物的制造。

引用文献：

Banks G.B.，Judge L.M.，Allen J.M.，Chamberlain J.S.(2010).Thepolyproline site in hinge 2influences the functional capacity of truncateddystrophins，PLoS Genet.，6(5)：e1000958

Bengtsson N.E.，Hall J.K.，Odom G.L.，Phelps M.P.，Andrus C.R.，HawkinsR.D.，Hauschka S.D.，Chamberlain J.R.，Chamberlain J.S.(2017).Muscle-specificCRISPR/Cas9 dystrophin gene editing ameliorates pathophysiology in a mousemodel for Duchenne muscular dystrophy，Nat Commun.，14；8：14454

Chamberlain J.S.，Gibbs R.A.，Ranier J.E.，Nguyen P.N.，CaskeyC.T.(1988)Deletion screening of the Duchenne muscular dystrophy locus via multiplex DNAamplification，Nucleic Acids Res.，16(23)：11141-11156

Crudele J.M.，Chamberlain J.S.(2019).AAV-based gene therapies for themuscular dystrophies，Human Molecular Genetics，Volume 28，Issue R1，Pages R102-R107

Emery E，Muntoni F.(2003).Duchenne muscular dystrophy，OxfordUniversity Press，New York，3rd edition，ISBN No.0198515316

England S.B.，Nicholson L.V.，Johnson M.A.，Forrest S.M.，Love D.R.，Zubrzycka-Gaarn E.E.，Bulmaa D.E.，Harris J.B.，Davies K.E.(1990).Very mildmuscular dystrophy associated with the deletion of46％of dystrophin，Nature，343(6254)：180-2

Goyenvalle A.，Vulin A.，Fougerousse F.，Leturcq F.，Kaplan J.，Garcia L.，Danos O.(2004).Rescue of dystrophic muscle through U7 snRNA-mediated exonskipping，Science，306(5702)：1796-9

Gregorevic P.，Allen J.M.，Minami E.，Blankinship M.J.，Haraguchi M.，Meuse L.，Finn E.，Adams M.E.，Froehner S.C.，Murry C.E.，Chamberlain J.S.(2006).rAAV6-microdystrophin preserves muscle function and extends lifespan inseverely dystrophic mice，Nat Med.12(7)：787-9

Gregorevic P.，Blankinship M.J.，Allen J.M.，Crawford R.W.，Meuse L.，Miller D.G.，Russell D.W.，Chamberlain J.S.(2004).Systemic delivery of genes tostriated muscles usng adeno-associated viral vectors，Nat Med.，10(8)：828-34

Harper S.Q.，Hauser M.A.，DelloRusso C.，Duan D.，Crawford R.W.，PhelpsS.F.，Harper H.A.，Robinson A.S.，Engelhardt J.F.，Brooks S.V.，Chamberlain J.S.(2002).Modular flexibility of dystrophin：implications for gene therapy ofDuchenne muscular dystrophy，Nat Med.，8(3)：253-61

Koenig M.，Beggs A.H.，Moyer M.，Scherpf S.，Heindrich K.，Bettecken T.，Meng G.，Müller C.R.，M.，Kaariainen H.，de la Chapellet A.，Kiuru A.，Savontaus M.L.，Gilgenkrantz H.，Récan D.，Chelly J.，Kaplan J.C.，Covone A.E.，Archidiacono N.，Romeo G.，Liechti-Gailati S.，Schneider V.，Braga S.，Moser H.，Darras B.T.，Murphy P.，Francke U.，Chen J.D.，Morgan G.，Denton M.，GreenbergC.R.，Wrogemann，Blonden L.A.，van Paassen M.B.，van Ommen G.J.，Kunkel L.M.(1989).The molecular basis for Duchenne versus Becker muscular dystrophy：correlation of severity with type of deletion，Am J Hum Genet.，45(4)：498-506

Koo T.，Popplewell L.，Athanasopoulos T.，Dickson G.(2014)Triple trans-splicing adeno-associated virus vectors capable of transferring the codingsequence for full-length dystrophin protein into dystrophic mice，Hum GeneTher，25(2)：98-108

Kunkel L.M.&co-authors(1986).Analysis of deletions in DNA frompatients with Becker and Duchenne museular dystrophy，Nature，322，pages73-77

Li C&Samulski R.J.(2020).Engineering adeno-associated virus vectorsfor gene therapy，Nature Reviews Genetics，21，p255-272

Li Y.(2015)Split-inteins and their bioapplications，Biotechnol Lett.，37(11)：2121-37

Abedi M.R.，Caponigro G.，Kamb A.(1998).Green fluorescent protein as ascaffold for intracellular presentation of peptides，Nucleic Acids Res.，26(2)：623-630

Long C.，Amoasii L.，Mireault A.A.，McAnally J.R.，Li H.，Sanchez-OrtizE.，Bhattacharyya S.，Shelton J.M.，Bassel-Duby R.，Olson E.N(2016).Postnaralgenome editing partially restores dystrophin expression in a mouse model ofmuscular dystrophy，Science，Vol.351，Issue 6271，pp.400-403

Lostal W.，Kodippili K.，Yue Y.，Duan D.(2014).Full-length dystrophinteconStitution with adeno-associated viral vectors，Hum Gene Ther.，25(6)：552-62

Monaco A.P.，Bertelson C.J.，Middlesworth W.，Colletti C.，Aldridge J.，Fischbeck K.H.，Bartlett R.，Pericak-Vance M.A.，Roses A.D.&Kunkel L.M.(1985)，Detection of deletions spanning the Ducheune muscular dystrophy locus using atightly linked DNA segment，Nature，316，pages842-845

Nelson C.E.，Hakim C.H.，Ousterout D.G.，Thakore P.I.，Moreb E.A.，Castellanos Rivera R.M.，Madhavan S.，Pan X.，Aun Ran F.，Yan W.X.，Asokan A.，Zhang F.，Duan D.，Gersbach C.A.(2016).In vivo genome editing improves musclefunction in a mouse model of Duchenne muscular dystrophy，Science，Vol.351，Issue 6271，pp.403-407

Niemeyer G.P.，Herzog R.W.，Mount J.，Arruda V.R.，Tillson D.M.，HathcockJ.，van Ginkel F.W.，High K.A.，Lothrop Jr C.D.(2009).Long-term correction ofinhibitor-prone hemophilia B dogs treated with liver-directed AAV2-mediatedfactor IX gene therapy，Blood，113(4)：797-806

Ramos J.N.，Hollinger K.，Bengtsson N.E.，Allen J.M.，Hauschka S.D.，Chamberlain J.S.(2019).Development of Novel Micro-dystrophins with EnhancedFunctionality，Mol Ther.，27(3)：623-635

Rivera v.M.，Gao G.，Grant R.L.，Schnell M.A.，Zoltick P.W.，Rozamus L.W.，Clackson T.，Wilson J.M.(2005).Long-term pharmacologically regulatedexpression of erythropoietin in primates following AAV-mediated genetransfer，Blood，105(4)：1424-30

Odom G.L.，Gregorevic P.，Allen J.M.，Chamberlain J.S(2011).Gene therapyof mdx mice with large truncated dystrophins generated by recombination usingrAAV6，Mol Ther.，19(1)：36-45

Shah N.H.，Muir T.W.(2015)Inteins：nature′s gift to protein chemists，2014，Chemical Science，5(2)，446-461

Phelps S.F.，Hanser M.A.，Cole N.M.，Rafael J.A.，Hinkle R.T.，FaulknerJ.A.，Chamberlain J.S.(1995).Expression of full-length and truncateddystrophin mini-genes in transgenic mdx mice，Hum.mol.gen.，Volume 4，Issue 8，Pages1251-1258

Srivastava A.，Lusby E.W.，Berns K.I.(1983).Nucleotide sequence andorganization of the adeno-associated virus 2 genome，J Virol，45(2)：555-64

Soundrarajan N.,Cho H.,Ahn B.,Choi M.,Thong L.M.,Choi H.,Cha S.,KimJ.,Park C.,Seo K.,Park C.(2016).Green fluorescent protein as a scaffold forhigh efficiency production of functional bacteriotoxic proteins inEscherichia coli,Sci Rep.,6:20661

Wasala N.B.,Shin J.H.,Lai Y.,Yue Y.,Montanaro F.,Duan D.(2018).Cardiac specific expression of ΔH2-R15 mini-dystrophin normalized all ECGabnormalities and the end-diastolic volume in a 23-m-old mouse model ofDuchenne dilated cardiomyopathy,Hum.Gene Ther.,Vol.29,No.7

Adams ME,Odom GL,Kim MJ,Chamberlain JS and Froehner SC:Syntrophinbinds directly to multiple spectrin-like repeats in dystrophin and mediatesbinding of nNOS to repeats 16-17.Hum Mol Genet 2018；27:2978-2985.

Lai Y,Thomas GD,Yue Y,Yang HT,Li D,Long C,Judge L,Bostick B,Chamberlain JS,Terjung RL and Duan D:Dystrophins carrying spectrin-likerepeats 16 and 17 anchor nNOS to the sarcolemma and enhance exerciseperformance in a mouse model of muscular dystrophy.J Clin Invest 2009,119:624-635.

实施例2：分裂内含肽与微型肌营养不良蛋白、肌营养不良蛋白、dysferlin或utropin的示例性序列

微型DysΔSR5-15：

1)分裂位点#1：

·微型Dys-gp41.1 N1(SEQ ID NO.82)：

MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDGRRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIGSTDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSWVRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQSATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQQVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTSSPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVNLDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMMDLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLRVASMEKQSNLHRVLMDLQNQKLKELNDWLTKTEERTRKMEEEPLGPDLEDLKRQVQQHKVLQEDLEQEQVRVNSLTHMVVVVDESSGDHATAALEEQLKVLGDRWANICRWTEDRWVLLQDILLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKDQNEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQKTEAWLDNFARCWDNLVQKLEKSTAQISQAVTTTQPSLTQTTVMETVTTVTTREQILVKHAQEELPPPPPQKKRQITVDSEIRKRLDVDITELHSWITRSEAVLQSPEFAIFRKEGNFSDLKEKVNAIEREKAEKFRKLQDASRSAQALVEQMVNEGVNADSIKQASEQLNSRWIEFCQLLSERLNWLEYSYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESLKNIKDSLQQSSGRIDIIHSKKTAALQSATPVERVKLQEALSQLDFQWEKVNKMYKDRQGRFDRSVEKWRRFHYDIKIFNQWLTEAEQFLRKTQIPENWEHAKYKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQEKLGSLNLRWQEVCKQLSDRKKRLEEQKNILSEFQRDLNEFVLWLEEADNIASIPLEPGKEQQLKEKLEQVKLLVEELPLRQGILKQLNETGGPVLVSAPISPEEQDKLENKLKQTNLQWIKVSRALPEKQGEIEAQIKDLGQLEKKLEDLEEQLNHLLLWLSPIRNQLEIYNQPNQEGPFDVQETEIAVQAKQPDVEEILSKGQHLYKEKPGYCLDLKTQVQTPQGMKEISNIQVGDLVLSNTGYNEVLNVFPKSKKKSYKITLEDGKEIICSEEHLFPTQTGEMNISGGLKEGMCLYVKE*

·微型Dys-gp41.1 C1(SEQ ID NO.83)：

MMLKKILKIEELDERELIDIEVSGNHLFYANDILTHNSATQPVKRKLEDLSSEWKAVNRLLQELRAKQPDLAPGLTTIGASPTQTVTLVTQPVVTKETAISKLEMPSSLMLEVPALADFNRAWTELTDWLSLLDQVIKSQRVMVGDLEDINEMIIKQKATMQDLEQRRPQLEELITAAQNLKNKTSNQEARTIITDRIERIQNQWDEVQEHLQNRRQQLNEMLKDSTQWLEAKEEAEQVLGQARAKLESWKEGPYTVDAIQKKITETKQLAKDLRQWQTNVDVANDLALKLLRDYSADDTRKVHMITENINASWRSIHKRVSEREAALEETHRLLQQFPLDLEKFLAWLTEAETTANVLQDATRKERLLEDSKGVKELMKQWQDLQGEIEAHTDVYHNLDENSQKILRSLEGSDDAVLLQRRLDNMNFKWSELRKKSLNIRSHLEASSDQWKRLHLSLQELLVWLQLKDDELSRQAPIGGDFPAVQKQNDVHRAFKRELKTKEPVIMSTLETVRIFLTEQPLEGLEKLYQEPRELPPEERAQNVTRLLRKQAEEVNTEWEKLNLHSADWQRKIDETLERLQELQEATDELDLKLRQAEVIKGSWQPVGDLLIDSLQDHLEKVKALRGEIAPLKENVSHVNDLARQLTTLGIQLSPYNLSTLEDLNTRWKLLQVAVEDRVRQLHEAHRDFGPASQHFLSTSVQGPWERAISPNKVPYYINHETQTTCWDHPKMTELYQSLADLNNVRFSAYRTAMKLRRLQKALCLDLLSLSAACDALDQHNLKQNDQPMDILQIINCLTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYDTGRTGRIRVLSFKTGIISLCKAHLEDKYRYLFKQVASSTGFCDQRRLGLLLHDSIQIPRQLGEVASFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMRLEPQSMVWLPVLHRVAAAETAKHQAKCNICKECPIIGFRYRSLKHFNYDICQSCFFSGRVAKGHKMHYPMVEYCTPTTSGEDVRDFAKVLKNKFRTKRYFAKHPRMGYLPVQTVLEGDNMETPVTLINFWPVDSAPASSPQLSHDDTHSRIEHYASRLAEMENSNGSYLNDSISPNESIDDEHLLIQHYCQSLNQDSPLSQPRSPAQILISLESEERGELERILADLEEENRNLQAEYDRLKQQHEHKGLSPLPSPPEMMPTSPQSPRDAELIAEAKLLRQHKGRLEARMQILEDHNKQLESQLHRLRQLLEQPQAEAKVNGTTVSSPSTSLQRSDSSQPMLLRVVGSQTSDSMGEEDLLSPPQDTSTGLEEVMEQLNNSFPSSRGRNTPGKPMREDTM*

2)分裂位点#2：

·微型Dys-gp41.1 N2(SEQ ID NO.84)：

MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDGRRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIGSTDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSWVRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQSATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQQVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTSSPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVNLDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMMDLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLRVASMEKQSNLHRVLMDLQNQKLKELNDWLTKTEERTRKMEEEPLGPDLEDLKRQVQQHKVLQEDLEQEQVRVNSLTHMVVVVDESSGDHATAALEEQLKVLGDRWANICRWTEDRWVLLQDILLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKDQNEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQKTEAWLDNFARCWDNLVQKLEKSTAQISQAVTTTQPSLTQTTVMETVTTVTTREQILVKHAQEELPPPPPQKKRQITVDSEIRKRLDVDITELHSWITRSEAVLQSPEFAIFRKEGNFSDLKEKVNAIEREKAEKFRKLQDASRSAQALVEQMVNEGVNADSIKQASEQLNSRWIEFCQLLSERLNWLEYSYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESLKNIKDSLQQSSGRIDIIHSKKTAALQSATPVERVKLQEALSQLDFQWEKVNKMYKDRQGRFDRSVEKWRRFHYDIKIFNQWLTEAEQFLRKTQIPENWEHAKYKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQEKLGSLNLRWQEVCKQLSDRKKRLEEQKNILSEFQRDLNEFVLWLEEADNIASIPLEPGKEQQLKEKLEQVKLLVEELPLRQGILKQLNETGGPVLVSAPISPEEQDKLENKLKQTNLQWIKVSRALPEKQGEIEAQIKDLGQLEKKLEDLEEQLNHLLLWLSPIRNQLEIYNQPNQEGPFDVQETEIAVQAKQPDVEEILSKGQHLYKEGYCLDLKTQVQTPQGMKEISNIQVGDLVLSNTGYNEVLNVFPKSKKKSYKITLEDGKEIICSEEHLFPTQTGEMNISGGLKEGMCLYVKE*

·微型Dys-gp41.1 C2(SEQ ID NO.85)：

MMLKKILKIEELDERELIDIEVSGNHLFYANDILTHNSTQPVKRKLEDLSSEWKAVNRLLQELRAKQPDLAPGLTTIGASPTQTVTLVTQPVVTKETAISKLEMPSSLMLEVPALADFNRAWTELTDWLSLLDQVIKSQRVMVGDLEDINEMIIKQKATMQDLEQRRPQLEELITAAQNLKNKTSNQEARTIITDRIERIQNQWDEVQEHLQNRRQQLNEMLKDSTQWLEAKEEAEQVLGQARAKLESWKEGPYTVDAIQKKITETKQLAKDLRQWQTNVDVANDLALKLLRDYSADDTRKVHMITENINASWRSIHKRVSEREAALEETHRLLQQFPLDLEKFLAWLTEAETTANVLQDATRKERLLEDSKGVKELMKQWQDLQGEIEAHTDVYHNLDENSQKILRSLEGSDDAVLLQRRLDNMNFKWSELRKKSLNIRSHLEASSDQWKRLHLSLQELLVWLQLKDDELSRQAPIGGDFPAVQKQNDVHRAFKRELKTKEPVIMSTLETVRIFLTEQPLEGLEKLYQEPRELPPEERAQNVTRLLRKQAEEVNTEWEKLNLHSADWQRKIDETLERLQELQEATDELDLKLRQAEVIKGSWQPVGDLLIDSLQDHLEKVKALRGEIAPLKENVSHVNDLARQLTTLGIQLSPYNLSTLEDLNTRWKLLQVAVEDRVRQLHEAHRDFGPASQHFLSTSVQGPWERAISPNKVPYYINHETQTTCWDHPKMTELYQSLADLNNVRFSAYRTAMKLRRLQKALCLDLLSLSAACDALDQHNLKQNDQPMDILQIINCLTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYDTGRTGRIRVLSFKTGIISLCKAHLEDKYRYLFKQVASSTGFCDQRRLGLLLHDSIQIPRQLGEVASFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMRLEPQSMVWLPVLHRVAAAETAKHQAKCNICKECPIIGFRYRSLKHFNYDICQSCFFSGRVAKGHKMHYPMVEYCTPTTSGEDVRDFAKVLKNKFRTKRYFAKHPRMGYLPVQTVLEGDNMETPVTLINFWPVDSAPASSPQLSHDDTHSRIEHYASRLAEMENSNGSYLNDSISPNESIDDEHLLIQHYCQSLNQDSPLSQPRSPAQILISLESEERGELERILADLEEENRNLQAEYDRLKQQHEHKGLSPLPSPPEMMPTSPQSPRDAELIAEAKLLRQHKGRLEARMQILEDHNKQLESQLHRLRQLLEQPQAEAKVNGTTVSSPSTSLQRSDSSQPMLLRVVGSQTSDSMGEEDLLSPPQDTSTGLEEVMEQLNNSFPSSRGRNTPGKPMREDTM*

3)分裂位点#3：

·微型Dys-gp41.1 N3(SEQ ID NO.86)：

MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDGRRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIGSTDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSWVRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQSATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQQVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTSSPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVNLDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMMDLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLRVASMEKQSNLHRVLMDLQNQKLKELNDWLTKTEERTRKMEEEPLGPDLEDLKRQVQQHKVLQEDLEQEQVRVNSLTHMVVVVDESSGDHATAALEEQLKVLGDRWANICRWTEDRWVLLQDILLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKDQNEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQKTEAWLDNFARCWDNLVQKLEKSTAQISQAVTTTQPSLTQTTVMETVTTVTTREQILVKHAQEELPPPPPQKKRQITVDSEIRKRLDVDITELHSWITRSEAVLQSPEFAIFRKEGNFSDLKEKVNAIEREKAEKFRKLQDASRSAQALVEQMVNEGVNADSIKQASEQLNSRWIEFCQLLSERLNWLEYSYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESLKNIKDSLQQSSGRIDIIHSKKTAALQSATPVERVKLQEALSQLDFQWEKVNKMYKDRQGRFDRSVEKWRRFHYDIKIFNQWLTEAEQFLRKTQIPENWEHAKYKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQEKLGSLNLRWQEVCKQLSDRKKRLEEQKNILSEFQRDLNEFVLWLEEADNIASIPLEPGKEQQLKEKLEQVKLLVEELPLRQGILKQLNETGGPVLVSAPISPEEQDKLENKLKQTNLQWIKVSRALPEKQGEIEAQIKDLGQLEKKLEDLEEQLNHLLLWLSPIRNQLEIYNQPNQEGPFDVQETEIAVQAKQPDVEEILSKGQHLYKEKPATQPVKRKLEDLSSEWKAVNRLLQELRAKQPDLAPGYCLDLKTQVQTPQGMKEISNIQVGDLVLSNTGYNEVLNVFPKSKKKSYKITLEDGKEIICSEEHLFPTQTGEMNISGGLKEGMCLYVKE*

·微型Dys-gp41.1 C3(SEQ ID NO.87)：

MMLKKILKIEELDERELIDIEVSGNHLFYANDILTHNSLTTIGASPTQTVTLVTQPVVTKETAISKLEMPSSLMLEVPALADFNRAWTELTDWLSLLDQVIKSQRVMVGDLEDINEMIIKQKATMQDLEQRRPQLEELITAAQNLKNKTSNQEARTIITDRIERIQNQWDEVQEHLQNRRQQLNEMLKDSTQWLEAKEEAEQVLGQARAKLESWKEGPYTVDAIQKKITETKQLAKDLRQWQTNVDVANDLALKLLRDYSADDTRKVHMITENINASWRSIHKRVSEREAALEETHRLLQQFPLDLEKFLAWLTEAETTANVLQDATRKERLLEDSKGVKELMKQWQDLQGEIEAHTDVYHNLDENSQKILRSLEGSDDAVLLQRRLDNMNFKWSELRKKSLNIRSHLEASSDQWKRLHLSLQELLVWLQLKDDELSRQAPIGGDFPAVQKQNDVHRAFKRELKTKEPVIMSTLETVRIFLTEQPLEGLEKLYQEPRELPPEERAQNVTRLLRKQAEEVNTEWEKLNLHSADWQRKIDETLERLQELQEATDELDLKLRQAEVIKGSWQPVGDLLIDSLQDHLEKVKALRGEIAPLKENVSHVNDLARQLTTLGIQLSPYNLSTLEDLNTRWKLLQVAVEDRVRQLHEAHRDFGPASQHFLSTSVQGPWERAISPNKVPYYINHETQTTCWDHPKMTELYQSLADLNNVRFSAYRTAMKLRRLQKALCLDLLSLSAACDALDQHNLKQNDQPMDILQIINCLTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYDTGRTGRIRVLSFKTGIISLCKAHLEDKYRYLFKQVASSTGFCDQRRLGLLLHDSIQIPRQLGEVASFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMRLEPQSMVWLPVLHRVAAAETAKHQAKCNICKECPIIGFRYRSLKHFNYDICQSCFFSGRVAKGHKMHYPMVEYCTPTTSGEDVRDFAKVLKNKFRTKRYFAKHPRMGYLPVQTVLEGDNMETPVTLINFWPVDSAPASSPQLSHDDTHSRIEHYASRLAEMENSNGSYLNDSISPNESIDDEHLLIQHYCQSLNQDSPLSQPRSPAQILISLESEERGELERILADLEEENRNLQAEYDRLKQQHEHKGLSPLPSPPEMMPTSPQSPRDAELIAEAKLLRQHKGRLEARMQILEDHNKQLESQLHRLRQLLEQPQAEAKVNGTTVSSPSTSLQRSDSSQPMLLRVVGSQTSDSMGEEDLLSPPQDTSTGLEEVMEQLNNSFPSSRGRNTPGKPMREDTM*

4)分裂位点#4：

·微型Dys-gp41.1 N4(SEQ ID NO.88)：

MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDGRRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIGSTDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSWVRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQSATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQQVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTSSPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVNLDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMMDLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLRVASMEKQSNLHRVLMDLQNQKLKELNDWLTKTEERTRKMEEEPLGPDLEDLKRQVQQHKVLQEDLEQEQVRVNSLTHMVVVVDESSGDHATAALEEQLKVLGDRWANICRWTEDRWVLLQDILLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKDQNEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQKTEAWLDNFARCWDNLVQKLEKSTAQISQAVTTTQPSLTQTTVMETVTTVTTREQILVKHAQEELPPPPPQKKRQITVDSEIRKRLDVDITELHSWITRSEAVLQSPEFAIFRKEGNFSDLKEKVNAIEREKAEKFRKLQDASRSAQALVEQMVNEGVNADSIKQASEQLNSRWIEFCQLLSERLNWLEYSYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESLKNIKDSLQQSSGRIDIIHSKKTAALQSATPVERVKLQEALSQLDFQWEKVNKMYKDRQGRFDRSVEKWRRFHYDIKIFNQWLTEAEQFLRKTQIPENWEHAKYKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQEKLGSLNLRWQEVCKQLSDRKKRLEEQKNILSEFQRDLNEFVLWLEEADNIASIPLEPGKEQQLKEKLEQVKLLVEELPLRQGILKQLNETGGPVLVSAPISPEEQDKLENKLKQTNLQWIKVSRALPEKQGEIEAQIKDLGQLEKKLEDLEEQLNHLLLWLSPIRNQLEIYNQPNQEGPFDVQETEIAVQAKQPDVEEILSKGQHLYKEKPATQPVKRKLEDLSSEWKAVNRLLQELRAKQPDLAPGLTTIGYCLDLKTQVQTPQGMKEISNIQVGDLVLSNTGYNEVLNVFPKSKKKSYKITLEDGKEIICSEEHLFPTQTGEMNISGGLKEGMCLYVKE*

·微型Dys-gp41.1 C4(SEQ ID NO.89)：

MMLKKILKIEELDERELIDIEVSGNHLFYANDILTHNSPTQTVTLVTQPVVTKETAISKLEMPSSLMLEVPALADFNRAWTELTDWLSLLDQVIKSQRVMVGDLEDINEMIIKQKATMQDLEQRRPQLEELITAAQNLKNKTSNQEARTIITDRIERIQNQWDEVQEHLQNRRQQLNEMLKDSTQWLEAKEEAEQVLGQARAKLESWKEGPYTVDAIQKKITETKQLAKDLRQWQTNVDVANDLALKLLRDYSADDTRKVHMITENINASWRSIHKRVSEREAALEETHRLLQQFPLDLEKFLAWLTEAETTANVLQDATRKERLLEDSKGVKELMKQWQDLQGEIEAHTDVYHNLDENSQKILRSLEGSDDAVLLQRRLDNMNFKWSELRKKSLNIRSHLEASSDQWKRLHLSLQELLVWLQLKDDELSRQAPIGGDFPAVQKQNDVHRAFKRELKTKEPVIMSTLETVRIFLTEQPLEGLEKLYQEPRELPPEERAQNVTRLLRKQAEEVNTEWEKLNLHSADWQRKIDETLERLQELQEATDELDLKLRQAEVIKGSWQPVGDLLIDSLQDHLEKVKALRGEIAPLKENVSHVNDLARQLTTLGIQLSPYNLSTLEDLNTRWKLLQVAVEDRVRQLHEAHRDFGPASQHFLSTSVQGPWERAISPNKVPYYINHETQTTCWDHPKMTELYQSLADLNNVRFSAYRTAMKLRRLQKALCLDLLSLSAACDALDQHNLKQNDQPMDILQIINCLTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYDTGRTGRIRVLSFKTGIISLCKAHLEDKYRYLFKQVASSTGFCDQRRLGLLLHDSIQIPRQLGEVASFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMRLEPQSMVWLPVLHRVAAAETAKHQAKCNICKECPIIGFRYRSLKHFNYDICQSCFFSGRVAKGHKMHYPMVEYCTPTTSGEDVRDFAKVLKNKFRTKRYFAKHPRMGYLPVQTVLEGDNMETPVTLINFWPVDSAPASSPQLSHDDTHSRIEHYASRLAEMENSNGSYLNDSISPNESIDDEHLLIQHYCQSLNQDSPLSQPRSPAQILISLESEERGELERILADLEEENRNLQAEYDRLKQQHEHKGLSPLPSPPEMMPTSPQSPRDAELIAEAKLLRQHKGRLEARMQILEDHNKQLESQLHRLRQLLEQPQAEAKVNGTTVSSPSTSLQRSDSSQPMLLRVVGSQTSDSMGEEDLLSPPQDTSTGLEEVMEQLNNSFPSSRGRNTPGKPMREDTM*

全长肌营养不良蛋白：

a.使用IMPDH和gp41.1：

1)分裂位点ImS1：

·N端片段(SEQ ID NO.90)：

MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDGRRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIGSTDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSWVRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQSATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQQVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTSSPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVNLDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMMDLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLRVASMEKQSNLHRVLMDLQNQKLKELNDWLTKTEERTRKMEEEPLGPDLEDLKRQVQQHKVLQEDLEQEQVRVNSLTHMVVVVDESSGDHATAALEEQLKVLGDRWANICRWTEDRWVLLQDILLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKDQNEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQKTEAWLDNFARCWDNLVQKLEKSTAQISQAVTTTQPSLTQTTVMETVTTVTTREQILVKHAQEELPPPPPQKKRQITVDSEIRKRLDVDITELHSWITRSEAVLQSPEFAIFRKEGNFSDLKEKVNAIEREKAEKFRKLQDASRSAQALVEQMVNEGVNADSIKQASEQLNSRWIEFCQLLSERLNWLEYQNNIIAFYNQLQQLEQMTTTAENWLKIQPTTPSEPTAIKSQLKICKDEVNRLSGLQPQIERLKIQSIALKEKGQGPMFLDADFVAFTNHFKQVFSDVQAREKELQTIFDTLPPMRYQETMSAIRTWVQQSETKLSIPQLSVTDYEIMEQRLGELQALQSSLQEQQSGLYYLSTTVKEMSKKAPSEISRKYQSEFEEIEGRWKKLSSQLVEHCQKLEEQMNKLRKIQNHIQTLKKWMAEVDVFLKEEWPALGGCFVPGTLVNTENGLKKIEEIKVGDKVFSHTGKLQEVVDTLIFDRDEEIISINGIDCTKNHEFYVIDKENANRVNEDNIHLFARWVHAEELDMKKHLLIELE*

·中间片段(SEQ ID NO.91)：

MKFKLKEITSIETKHYKGKVHDLTVNQDHSYNVRGTVVHNSEILKKQLKQCRLLVSDIQTIQPSLNSVNEGGQKIKNEAEPEFASRLETELKELNTQWDHMCQQVYARKEALKGGLEKTVSLQKDLSEMHEWMTQAEEEYLERDFEYKTPDELQKAVEEMKRAKEEAQQKEAKVKLLTESVNSVIAQAPPVAQEALKKELETLTTNYQWLCTRLNGKCKTLEEVWACWHELLSYLEKANKWLNEVEFKLKTTENIPGGAEEISEVLDSLENLMRHSEDNPNQIRILAQTLTDGGVMDELINEELETFNSRWRELHEEAVRRQKLLEQSIQSAQETEKSLHLIQESLTFIDKQLAAYIADKVDAAQMPQEAQKIQSDLTSHEISLEEMKKHNQGKEAAQRVLSQIDVAQKKLQDVSMKFRLFQKPANFELRLQESKMILDEVKMHLPALETKSVEQEVVQSQLNHCVNLYKSLSEVKSEVEMVIKTGRQIVQKKQTENPKELDERVTALKLHYNELGAKVTERKQQLEKCLKLSRKMRKEMNVLTEWLAATDMELTKRSAVEGMPSNLDSEVAWGKATQKEIEKQKVHLKSITEVGEALKTVLGKKETLVEDKLSLLNSNWIAVTSRAEEWLNLLLEYQKHMETFDQNVDHITKWIIQADTLLDESEKKKPQQKEDVLKRLKAELNDIRPKVDSTRDQAANLMANRGDHCRKLVEPQISELNHRFAAISHRIKTGKASIPLKELEQFNSDIQKLLEPLEAEIQQGVNLKEEDFNKDMNEDNEGTVKELLQRGDNLQQRITDERKREEIKIKQQLLQTKHNALKDLRSQRRKKALEISHQWYQYKRQADDLLKCLDDIEKKLASLPEPRDERKIKEIDRELQKKKEELNAVRRQAEGLSEDGAAMAVEPTQIQLSKRWREIESKFAQFRRLNFAQIHTVREETMMVMTEDMPLEISYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESLKNIKDSLQQSSGRIDIIHSKKTAALQSATPVERVKLQEALSQLDFQWEKVNKMYKDRQGRFDRSVEKWRRFHYDIKIFNQWLTEAEQFLRKTQIPENWEHAKYKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQEKLGSLNLRWQEVCKQLSDRKKRLEEQKNILSEFQRDLNEFVLWLEEADNIASIPLEPGKEQQLKEKLEQVKLLVEELPLRQGILKQLNETGGPVLVSAPISPEEQDKLENKLKQTNLQWIKVSRALPEKQGEIEAQIKDLGQLEKKLEDLEEQLNHLLLWLSPIRNQLEIYNQPNQEGPFDVQETEIAVQAKQPDVEEILSKGQHLYKEGYCLDLKTQVQTPQGMKEISNIQVGDLVLSNTGYNEVLNVFPKSKKKSYKITLEDGKEIICSEEHLFPTQTGEMNISGGLKEGMCLYVKE*

·C端片段(SEQ ID NO.92)：

2)分裂位点ImS2：

·N端片段(SEQ ID NO.93)：

MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDGRRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIGSTDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSWVRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQSATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQQVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTSSPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVNLDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMMDLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLRVASMEKQSNLHRVLMDLQNQKLKELNDWLTKTEERTRKMEEEPLGPDLEDLKRQVQQHKVLQEDLEQEQVRVNSLTHMVVVVDESSGDHATAALEEQLKVLGDRWANICRWTEDRWVLLQDILLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKDQNEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQKTEAWLDNFARCWDNLVQKLEKSTAQISQAVTTTQPSLTQTTVMETVTTVTTREQILVKHAQEELPPPPPQKKRQITVDSEIRKRLDVDITELHSWITRSEAVLQSPEFAIFRKEGNFSDLKEKVNAIEREKAEKFRKLQDASRSAQALVEQMVNEGVNADSIKQASEQLNSRWIEFCQLLSERLNWLEYQNNIIAFYNQLQQLEQMTTTAENWLKIQPTTPSEPTAIKSQLKICKDEVNRLSGLQPQIERLKIQSIALKEKGQGPMFLDADFVAFTNHFKQVFSDVQAREKELQTIFDTLPPMRYQETMSAIRTWVQQSETKLSIPQLSVTDYEIMEQRLGELQALQSSLQEQQSGLYYLSTTVKEMSKKAPSEISRKYQSEFEEIEGRWKKLSSQLVEHCQKLEEQMNKLRKIQNHIQTLKKWMAEVDVFLKEEWPALGCFVPGTLVNTENGLKKIEEIKVGDKVFSHTGKLQEVVDTLIFDRDEEIISINGIDCTKNHEFYVIDKENANRVNEDNIHLFARWVHAEELDMKKHLLIELE*

·中间片段(SEQ ID NO.94)：

·C端片段(SEQ ID NO.95)：

3)分裂位点ImS3：

·N端片段(SEQ ID NO.96)：

MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDGRRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIGSTDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSWVRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQSATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQQVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTSSPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVNLDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMMDLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLRVASMEKQSNLHRVLMDLQNQKLKELNDWLTKTEERTRKMEEEPLGPDLEDLKRQVQQHKVLQEDLEQEQVRVNSLTHMVVVVDESSGDHATAALEEQLKVLGDRWANICRWTEDRWVLLQDILLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKDQNEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQKTEAWLDNFARCWDNLVQKLEKSTAQISQAVTTTQPSLTQTTVMETVTTVTTREQILVKHAQEELPPPPPQKKRQITVDSEIRKRLDVDITELHSWITRSEAVLQSPEFAIFRKEGNFSDLKEKVNAIEREKAEKFRKLQDASRSAQALVEQMVNEGVNADSIKQASEQLNSRWIEFCQLLSERLNWLEYQNNIIAFYNQLQQLEQMTTTAENWLKIQPTTPSEPTAIKSQLKICKDEVNRLSGLQPQIERLKIQSIALKEKGQGPMFLDADFVAFTNHFKQVFSDVQAREKELQTIFDTLPPMRYQETMSAIRTWVQQSETKLSIPQLSVTDYEIMEQRLGELQALQSSLQEQQSGLYYLSTTVKEMSKKAPSEISRKYQSEFEEIEGRWKKLSSQLVEHCQKLEEQMNKLRKIQNHIQTLKKWMAEVDVFLKEEWPALGDSEILKKQLKQCRLLVSDIQTIQPSLNSVNEGGQKIKNEAEPEFASRLETELKELNTQWDHMCQQVYARKEALKGGLEKTVSLQKDLSEMHEWMTQAEEEYLERDFEYGCFVPGTLVNTENGLKKIEEIKVGDKVFSHTGKLQEVVDTLIFDRDEEIISINGIDCTKNHEFYVIDKENANRVNEDNIHLFARWVHAEELDMKKHLLIELE*

·中间片段(SEQ ID NO.97)：

MKFKLKEITSIETKHYKGKVHDLTVNQDHSYNVRGTVVHNSKTPDELQKAVEEMKRAKEEAQQKEAKVKLLTESVNSVIAQAPPVAQEALKKELETLTTNYQWLCTRLNGKCKTLEEVWACWHELLSYLEKANKWLNEVEFKLKTTENIPGGAEEISEVLDSLENLMRHSEDNPNQIRILAQTLTDGGVMDELINEELETFNSRWRELHEEAVRRQKLLEQSIQSAQETEKSLHLIQESLTFIDKQLAAYIADKVDAAQMPQEAQKIQSDLTSHEISLEEMKKHNQGKEAAQRVLSQIDVAQKKLQDVSMKFRLFQKPANFELRLQESKMILDEVKMHLPALETKSVEQEVVQSQLNHCVNLYKSLSEVKSEVEMVIKTGRQIVQKKQTENPKELDERVTALKLHYNELGAKVTERKQQLEKCLKLSRKMRKEMNVLTEWLAATDMELTKRSAVEGMPSNLDSEVAWGKATQKEIEKQKVHLKSITEVGEALKTVLGKKETLVEDKLSLLNSNWIAVTSRAEEWLNLLLEYQKHMETFDQNVDHITKWIIQADTLLDESEKKKPQQKEDVLKRLKAELNDIRPKVDSTRDQAANLMANRGDHCRKLVEPQISELNHRFAAISHRIKTGKASIPLKELEQFNSDIQKLLEPLEAEIQQGVNLKEEDFNKDMNEDNEGTVKELLQRGDNLQQRITDERKREEIKIKQQLLQTKHNALKDLRSQRRKKALEISHQWYQYKRQADDLLKCLDDIEKKLASLPEPRDERKIKEIDRELQKKKEELNAVRRQAEGLSEDGAAMAVEPTQIQLSKRWREIESKFAQFRRLNFAQIHTVREETMMVMTEDMPLEISYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESLKNIKDSLQQSSGRIDIIHSKKTAALQSATPVERVKLQEALSQLDFQWEKVNKMYKDRQGRFDRSVEKWRRFHYDIKIFNQWLTEAEQFLRKTQIPENWEHAKYKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQEKLGSLNLRWQEVCKQLSDRKKRLEEQKNILSEFQRDLNEFVLWLEEADNIASIPLEPGKEQQLKEKLEQVKLLVEELPLRQGILKQLNETGGPVLVSAPISPEEQDKLENKLKQTNLQWIKVSRALPEKQGEIEAQIKDLGQLEKKLEDLEEQLNHLLLWLSPIRNQLEIYNQPNQEGPFDVQETEIAVQAKQPDVEEILSKGQHLYKEKPATQPVKRKLEDLSSEWKAVNRLLQELRAKQPDLAPGLTTIGYCLDLKTQVQTPQGMKEISNIQVGDLVLSNTGYNEVLNVFPKSKKKSYKITLEDGKEIICSEEHLFPTQTGEMNISGGLKEGMCLYVKE*

·C端片段(SEQ ID NO.98)：

4)分裂位点ImS4：

·N端片段(SEQ ID NO.99)：

MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDGRRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIGSTDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSWVRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQSATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQQVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTSSPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVNLDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMMDLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLRVASMEKQSNLHRVLMDLQNQKLKELNDWLTKTEERTRKMEEEPLGPDLEDLKRQVQQHKVLQEDLEQEQVRVNSLTHMVVVVDESSGDHATAALEEQLKVLGDRWANICRWTEDRWVLLQDILLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKDQNEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQKTEAWLDNFARCWDNLVQKLEKSTAQISQAVTTTQPSLTQTTVMETVTTVTTREQILVKHAQEELPPPPPQKKRQITVDSEIRKRLDVDITELHSWITRSEAVLQSPEFAIFRKEGNFSDLKEKVNAIEREKAEKFRKLQDASRSAQALVEQMVNEGVNADSIKQASEQLNSRWIEFCQLLSERLNWLEYQNNIIAFYNQLQQLEQMTTTAENWLKIQPTTPSEPTAIKSQLKICKDEVNRLSGLQPQIERLKIQSIALKEKGQGPMFLDADFVAFTNHFKQVFSDVQAREKELQTIFDTLPPMRYQETMSAIRTWVQQSETKLSIPQLSVTDYEIMEQRLGELQALQSSLQEQQSGLYYLSTTVKEMSKKAPSEISRKYQSEFEEIEGRWKKLSSQLVEHCQKLEEQMNKLRKIQNHIQTLKKWMAEVDVFLKEEWPALGDSEILKKQLKQCRLLVSDIQTIQPSLNSVNEGGQKIKNEAEPEFASRLETELKELNTQWDHMCQQVYARKEALKGGLEKTVSLQKDLSEMHEWMTQAEEEYLERDFEGCFVPGTLVNTENGLKKIEEIKVGDKVFSHTGKLQEVVDTLIFDRDEEIISINGIDCTKNHEFYVIDKENANRVNEDNIHLFARWVHAEELDMKKHLLIELE*

·中间片段(SEQ ID NO.100)：

MKFKLKEITSIETKHYKGKVHDLTVNQDHSYNVRGTVVHNSTPDELQKAVEEMKRAKEEAQQKEAKVKLLTESVNSVIAQAPPVAQEALKKELETLTTNYQWLCTRLNGKCKTLEEVWACWHELLSYLEKANKWLNEVEFKLKTTENIPGGAEEISEVLDSLENLMRHSEDNPNQIRILAQTLTDGGVMDELINEELETFNSRWRELHEEAVRRQKLLEQSIQSAQETEKSLHLIQESLTFIDKQLAAYIADKVDAAQMPQEAQKIQSDLTSHEISLEEMKKHNQGKEAAQRVLSQIDVAQKKLQDVSMKFRLFQKPANFELRLQESKMILDEVKMHLPALETKSVEQEVVQSQLNHCVNLYKSLSEVKSEVEMVIKTGRQIVQKKQTENPKELDERVTALKLHYNELGAKVTERKQQLEKCLKLSRKMRKEMNVLTEWLAATDMELTKRSAVEGMPSNLDSEVAWGKATQKEIEKQKVHLKSITEVGEALKTVLGKKETLVEDKLSLLNSNWIAVTSRAEEWLNLLLEYQKHMETFDQNVDHITKWIIQADTLLDESEKKKPQQKEDVLKRLKAELNDIRPKVDSTRDQAANLMANRGDHCRKLVEPQISELNHRFAAISHRIKTGKASIPLKELEQFNSDIQKLLEPLEAEIQQGVNLKEEDFNKDMNEDNEGTVKELLQRGDNLQQRITDERKREEIKIKQQLLQTKHNALKDLRSQRRKKALEISHQWYQYKRQADDLLKCLDDIEKKLASLPEPRDERKIKEIDRELQKKKEELNAVRRQAEGLSEDGAAMAVEPTQIQLSKRWREIESKFAQFRRLNFAQIHTVREETMMVMTEDMPLEISYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESLKNIKDSLQQSSGRIDIIHSKKTAALQSATPVERVKLQEALSQLDFQWEKVNKMYKDRQGRFDRSVEKWRRFHYDIKIFNQWLTEAEQFLRKTQIPENWEHAKYKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQEKLGSLNLRWQEVCKQLSDRKKRLEEQKNILSEFQRDLNEFVLWLEEADNIASIPLEPGKEQQLKEKLEQVKLLVEELPLRQGILKQLNETGGPVLVSAPISPEEQDKLENKLKQTNLQWIKVSRALPEKQGEIEAQIKDLGQLEKKLEDLEEQLNHLLLWLSPIRNQLEIYNQPNQEGPFDVQETEIAVQAKQPDVEEILSKGQHLYKEKPATQPVKRKLEDLSSEWKAVNRLLQELRAKQPDLAPGLTTIGYCLDLKTQVQTPQGMKEISNIQVGDLVLSNTGYNEVLNVFPKSKKKSYKITLEDGKEIICSEEHLFPTQTGEMNISGGLKEGMCLYVKE*

·C端片段(SEQ ID NO.101)：

b.使用Nrdj-1：

1)分裂位点NrS1：

·N端片段(SEQ ID NO.102)：

MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDGRRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIGSTDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSWVRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQSATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQQVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTSSPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVNLDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMMDLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLRVASMEKQSNLHRVLMDLQNQKLKELNDWLTKTEERTRKMEEEPLGPDLEDLKRQVQQHKVLQEDLEQEQVRVNSLTHMVVVVDESSGDHATAALEEQLKVLGDRWANICRWTEDRWVLLQDILLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKDQNEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQKTEAWLDNFARCWDNLVQKLEKSTAQISQAVTTTQPSLTQTTVMETVTTVTTREQILVKHAQEELPPPPPQKKRQITVDSEIRKRLDVDITELHSWITRSEAVLQSPEFAIFRKEGNFSDLKEKVNAIEREKAEKFRKLQDASRSAQALVEQMVNEGVNADSIKQASEQLNSRWIEFCQLLSERLNWLEYQNNIIAFYNQLQQLEQMTTTAENWLKIQPTTPSEPTAIKSQLKICKDEVNRLSGLQPQIERLKIQSIALKEKGQGPMFLDADFVAFTNHFKQVFSDVQAREKELQTIFDTLPPMRYQETMSAIRTWVQQSETKLSIPQLSVTDYEIMEQRLGELQALQSSLQEQQSGLYYLSTTVKEMSKKAPSEISRKYQSEFEEIEGRWKKLSSQLVEHCQKLEEQMNKLRKIQNHIQTLKKWMAEVDVFLKEEWPALGCCLVGSSEIITRNYGKTTIKEVVEIFDNDKNIQVLAFNTHTDNIEWAPIKAAQLTRPNAELVELEIDTLHGVKTIRCTPDHPVYTKNRGYVRADELTDDDELVVAI*

·中间片段(SEQ ID NO.103)：

MEAKTYIGKLKSRKIVSNEDTYDIQTSTHNFFANDILVHNSEILKKQLKQCRLLVSDIQTIQPSLNSVNEGGQKIKNEAEPEFASRLETELKELNTQWDHMCQQVYARKEALKGGLEKTVSLQKDLSEMHEWMTQAEEEYLERDFEYKTPDELQKAVEEMKRAKEEAQQKEAKVKLLTESVNSVIAQAPPVAQEALKKELETLTTNYQWLCTRLNGKCKTLEEVWACWHELLSYLEKANKWLNEVEFKLKTTENIPGGAEEISEVLDSLENLMRHSEDNPNQIRILAQTLTDGGVMDELINEELETFNSRWRELHEEAVRRQKLLEQSIQSAQETEKSLHLIQESLTFIDKQLAAYIADKVDAAQMPQEAQKIQSDLTSHEISLEEMKKHNQGKEAAQRVLSQIDVAQKKLQDVSMKFRLFQKPANFELRLQESKMILDEVKMHLPALETKSVEQEVVQSQLNHCVNLYKSLSEVKSEVEMVIKTGRQIVQKKQTENPKELDERVTALKLHYNELGAKVTERKQQLEKCLKLSRKMRKEMNVLTEWLAATDMELTKRSAVEGMPSNLDSEVAWGKATQKEIEKQKVHLKSITEVGEALKTVLGKKETLVEDKLSLLNSNWIAVTSRAEEWLNLLLEYQKHMETFDQNVDHITKWIIQADTLLDESEKKKPQQKEDVLKRLKAELNDIRPKVDSTRDQAANLMANRGDHCRKLVEPQISELNHRFAAISHRIKTGKASIPLKELEQFNSDIQKLLEPLEAEIQQGVNLKEEDFNKDMNEDNEGTVKELLQRGDNLQQRITDERKREEIKIKQQLLQTKHNALKDLRSQRRKKALEISHQWYQYKRQADDLLKCLDDIEKKLASLPEPRDERKIKEIDRELQKKKEELNAVRRQAEGLSEDGAAMAVEPTQIQLSKRWREIESKFAQFRRLNFAQIHTVREETMMVMTEDMPLEISYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESLKNIKDSLQQSSGRIDIIHSKKTAALQSATPVERVKLQEALSQLDFQWEKVNKMYKDRQGRFDRSVEKWRRFHYDIKIFNQWLTEAEQFLRKTQIPENWEHAKYKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQEKLGSLNLRWQEVCKQLSDRKKRLEEQKNILSEFQRDLNEFVLWLEEADNIASIPLEPGKEQQLKEKLEQVKLLVEELPLRQGILKQLNETGGPVLVSAPISPEEQDKLENKLKQTNLQWIKVSRALPEKQGEIEAQIKDLGQLEKKLEDLEEQLNHLLLWLSPIRNQLEIYNQPNQEGPFDVQETEIAVQAKQPDVEEILSKGQHLYKEGYCLDLKTQVQTPQGMKEISNIQVGDLVLSNTGYNEVLNVFPKSKKKSYKITLEDGKEIICSEEHLFPTQTGEMNISGGLKEGMCLYVKE*

·C端片段(SEQ ID NO.104)：

2)分裂位点NrS2：

·N端片段(SEQ ID NO.105)：

MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDGRRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIGSTDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSWVRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQSATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQQVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTSSPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVNLDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMMDLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLRVASMEKQSNLHRVLMDLQNQKLKELNDWLTKTEERTRKMEEEPLGPDLEDLKRQVQQHKVLQEDLEQEQVRVNSLTHMVVVVDESSGDHATAALEEQLKVLGDRWANICRWTEDRWVLLQDILLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKDQNEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQKTEAWLDNFARCWDNLVQKLEKSTAQISQAVTTTQPSLTQTTVMETVTTVTTREQILVKHAQEELPPPPPQKKRQITVDSEIRKRLDVDITELHSWITRSEAVLQSPEFAIFRKEGNFSDLKEKVNAIEREKAEKFRKLQDASRSAQALVEQMVNEGVNADSIKQASEQLNSRWIEFCQLLSERLNWLEYQNNIIAFYNQLQQLEQMTTTAENWLKIQPTTPSEPTAIKSQLKICKDEVNRLSGLQPQIERLKIQSIALKEKGQGPMFLDADFVAFTNHFKQVFSDVQAREKELQTIFDTLPPMRYQETMSAIRTWVQQSETKLSIPQLSVTDYEIMEQRLGELQALQSSLQEQQSGLYYLSTTVKEMSKKAPSEISRKYQSEFEEIEGRWKKLSSQLVEHCQKLEEQMNKLRKIQNHIQTLKKWMAEVDVFLKEEWPALGDCCLVGSSEIITRNYGKTTIKEVVEIFDNDKNIQVLAFNTHTDNIEWAPIKAAQLTRPNAELVELEIDTLHGVKTIRCTPDHPVYTKNRGYVRADELTDDDELVVAI*

·中间片段(SEQ ID NO.106)：

·C端片段(SEQ ID NO.107)：

3)分裂位点NrS3：

·N端片段(SEQ ID NO.108)：

MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDGRRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIGSTDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSWVRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQSATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQQVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTSSPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVNLDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMMDLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLRVASMEKQSNLHRVLMDLQNQKLKELNDWLTKTEERTRKMEEEPLGPDLEDLKRQVQQHKVLQEDLEQEQVRVNSLTHMVVVVDESSGDHATAALEEQLKVLGDRWANICRWTEDRWVLLQDILLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKDQNEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQKTEAWLDNFARCWDNLVQKLEKSTAQISQAVTTTQPSLTQTTVMETVTTVTTREQILVKHAQEELPPPPPQKKRQITVDSEIRKRLDVDITELHSWITRSEAVLQSPEFAIFRKEGNFSDLKEKVNAIEREKAEKFRKLQDASRSAQALVEQMVNEGVNADSIKQASEQLNSRWIEFCQLLSERLNWLEYQNNIIAFYNQLQQLEQMTTTAENWLKIQPTTPSEPTAIKSQLKICKDEVNRLSGLQPQIERLKIQSIALKEKGQGPMFLDADFVAFTNHFKQVFSDVQAREKELQTIFDTLPPMRYQETMSAIRTWVQQSETKLSIPQLSVTDYEIMEQRLGELQALQSSLQEQQSGLYYLSTTVKEMSKKAPSEISRKYQSEFEEIEGRWKKLSSQLVEHCQKLEEQMNKLRKIQNHIQTLKKWMAEVDVFLKEEWPALGDSEILKKQLKQCRLLVSDIQTIQPSLNSVNEGGQKIKNEAEPEFASRLETELKELNTQWDHMCQQVYARKEALKGGLEKTVSLQKDLSEMHEWMTQAEEEYLERDFEYCCLVGSSEIITRNYGKTTIKEVVEIFDNDKNIQVLAFNTHTDNIEWAPIKAAQLTRPNAELVELEIDTLHGVKTIRCTPDHPVYTKNRGYVRADELTDDDELVVAI*

·中间片段(SEQ ID NO.109)：

MEAKTYIGKLKSRKIVSNEDTYDIQTSTHNFFANDILVHNSKTPDELQKAVEEMKRAKEEAQQKEAKVKLLTESVNSVIAQAPPVAQEALKKELETLTTNYQWLCTRLNGKCKTLEEVWACWHELLSYLEKANKWLNEVEFKLKTTENIPGGAEEISEVLDSLENLMRHSEDNPNQIRILAQTLTDGGVMDELINEELETFNSRWRELHEEAVRRQKLLEQSIQSAQETEKSLHLIQESLTFIDKQLAAYIADKVDAAQMPQEAQKIQSDLTSHEISLEEMKKHNQGKEAAQRVLSQIDVAQKKLQDVSMKFRLFQKPANFELRLQESKMILDEVKMHLPALETKSVEQEVVQSQLNHCVNLYKSLSEVKSEVEMVIKTGRQIVQKKQTENPKELDERVTALKLHYNELGAKVTERKQQLEKCLKLSRKMRKEMNVLTEWLAATDMELTKRSAVEGMPSNLDSEVAWGKATQKEIEKQKVHLKSITEVGEALKTVLGKKETLVEDKLSLLNSNWIAVTSRAEEWLNLLLEYQKHMETFDQNVDHITKWIIQADTLLDESEKKKPQQKEDVLKRLKAELNDIRPKVDSTRDQAANLMANRGDHCRKLVEPQISELNHRFAAISHRIKTGKASIPLKELEQFNSDIQKLLEPLEAEIQQGVNLKEEDFNKDMNEDNEGTVKELLQRGDNLQQRITDERKREEIKIKQQLLQTKHNALKDLRSQRRKKALEISHQWYQYKRQADDLLKCLDDIEKKLASLPEPRDERKIKEIDRELQKKKEELNAVRRQAEGLSEDGAAMAVEPTQIQLSKRWREIESKFAQFRRLNFAQIHTVREETMMVMTEDMPLEISYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESLKNIKDSLQQSSGRIDIIHSKKTAALQSATPVERVKLQEALSQLDFQWEKVNKMYKDRQGRFDRSVEKWRRFHYDIKIFNQWLTEAEQFLRKTQIPENWEHAKYKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQEKLGSLNLRWQEVCKQLSDRKKRLEEQKNILSEFQRDLNEFVLWLEEADNIASIPLEPGKEQQLKEKLEQVKLLVEELPLRQGILKQLNETGGPVLVSAPISPEEQDKLENKLKQTNLQWIKVSRALPEKQGEIEAQIKDLGQLEKKLEDLEEQLNHLLLWLSPIRNQLEIYNQPNQEGPFDVQETEIAVQAKQPDVEEILSKGQHLYKEKPATQPVKRKLEDLSSEWKAVNRLLQELRAKQPDLAPGLTTIGYCLDLKTQVQTPQGMKEISNIQVGDLVLSNTGYNEVLNVFPKSKKKSYKITLEDGKEIICSEEHLFPTQTGEMNISGGLKEGMCLYVKE*

·C端片段(SEQ ID NO.110)：

4)分裂位点NrS4：

·N端片段(SEQ ID NO.111)：

MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDGRRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIGSTDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSWVRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQSATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQQVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTSSPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVNLDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMMDLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLRVASMEKQSNLHRVLMDLQNQKLKELNDWLTKTEERTRKMEEEPLGPDLEDLKRQVQQHKVLQEDLEQEQVRVNSLTHMVVVVDESSGDHATAALEEQLKVLGDRWANICRWTEDRWVLLQDILLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKDQNEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQKTEAWLDNFARCWDNLVQKLEKSTAQISQAVTTTQPSLTQTTVMETVTTVTTREQILVKHAQEELPPPPPQKKRQITVDSEIRKRLDVDITELHSWITRSEAVLQSPEFAIFRKEGNFSDLKEKVNAIEREKAEKFRKLQDASRSAQALVEQMVNEGVNADSIKQASEQLNSRWIEFCQLLSERLNWLEYQNNIIAFYNQLQQLEQMTTTAENWLKIQPTTPSEPTAIKSQLKICKDEVNRLSGLQPQIERLKIQSIALKEKGQGPMFLDADFVAFTNHFKQVFSDVQAREKELQTIFDTLPPMRYQETMSAIRTWVQQSETKLSIPQLSVTDYEIMEQRLGELQALQSSLQEQQSGLYYLSTTVKEMSKKAPSEISRKYQSEFEEIEGRWKKLSSQLVEHCQKLEEQMNKLRKIQNHIQTLKKWMAEVDVFLKEEWPALGDSEILKKQLKQCRLLVSDIQTIQPSLNSVNEGGQKIKNEAEPEFASRLETELKELNTQWDHMCQQVYARKEALKGGLEKTVSLQKDLSEMHEWMTQAEEEYLERDFECCLVGSSEIITRNYGKTTIKEVVEIFDNDKNIQVLAFNTHTDNIEWAPIKAAQLTRPNAELVELEIDTLHGVKTIRCTPDHPVYTKNRGYVRADELTDDDELVVAI*

·中间片段(SEQ ID NO.112)：

MEAKTYIGKLKSRKIVSNEDTYDIQTSTHNFFANDILVHNSTPDELQKAVEEMKRAKEEAQQKEAKVKLLTESVNSVIAQAPPVAQEALKKELETLTTNYQWLCTRLNGKCKTLEEVWACWHELLSYLEKANKWLNEVEFKLKTTENIPGGAEEISEVLDSLENLMRHSEDNPNQIRILAQTLTDGGVMDELINEELETFNSRWRELHEEAVRRQKLLEQSIQSAQETEKSLHLIQESLTFIDKQLAAYIADKVDAAQMPQEAQKIQSDLTSHEISLEEMKKHNQGKEAAQRVLSQIDVAQKKLQDVSMKFRLFQKPANFELRLQESKMILDEVKMHLPALETKSVEQEVVQSQLNHCVNLYKSLSEVKSEVEMVIKTGRQIVQKKQTENPKELDERVTALKLHYNELGAKVTERKQQLEKCLKLSRKMRKEMNVLTEWLAATDMELTKRSAVEGMPSNLDSEVAWGKATQKEIEKQKVHLKSITEVGEALKTVLGKKETLVEDKLSLLNSNWIAVTSRAEEWLNLLLEYQKHMETFDQNVDHITKWIIQADTLLDESEKKKPQQKEDVLKRLKAELNDIRPKVDSTRDQAANLMANRGDHCRKLVEPQISELNHRFAAISHRIKTGKASIPLKELEQFNSDIQKLLEPLEAEIQQGVNLKEEDFNKDMNEDNEGTVKELLQRGDNLQQRITDERKREEIKIKQQLLQTKHNALKDLRSQRRKKALEISHQWYQYKRQADDLLKCLDDIEKKLASLPEPRDERKIKEIDRELQKKKEELNAVRRQAEGLSEDGAAMAVEPTQIQLSKRWREIESKFAQFRRLNFAQIHTVREETMMVMTEDMPLEISYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESLKNIKDSLQQSSGRIDIIHSKKTAALQSATPVERVKLQEALSQLDFQWEKVNKMYKDRQGRFDRSVEKWRRFHYDIKIFNQWLTEAEQFLRKTQIPENWEHAKYKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQEKLGSLNLRWQEVCKQLSDRKKRLEEQKNILSEFQRDLNEFVLWLEEADNIASIPLEPGKEQQLKEKLEQVKLLVEELPLRQGILKQLNETGGPVLVSAPISPEEQDKLENKLKQTNLQWIKVSRALPEKQGEIEAQIKDLGQLEKKLEDLEEQLNHLLLWLSPIRNQLEIYNQPNQEGPFDVQETEIAVQAKQPDVEEILSKGQHLYKEKPATQPVKRKLEDLSSEWKAVNRLLQELRAKQPDLAPGLTTIGYCLDLKTQVQTPQGMKEISNIQVGDLVLSNTGYNEVLNVFPKSKKKSYKITLEDGKEIICSEEHLFPTQTGEMNISGGLKEGMCLYVKE*

·C端片段(SEQ ID NO.113)：

全长Dysferlin：

1)分裂位点#1(使用分裂gp41.1)：

·N端片段(SEQ ID NO.114)：

MLRVFILYAENVHTPDTDISDAYCSAVFAGVKKRTKVIKNSVNPVWNEGFEWDLKGIPLDQGSELHVVVKDHETMGRNRFLGEAKVPLREVLATPSLSASFNAPLLDTKKQPTGASLVLQVSYTPLPGAVPLFPPPTPLEPSPTLPDLDVVADTGGEEDTEDQGLTGDEAEPFLDQSGGPGAPTTPRKLPSRPPPHYPGIKRKRSAPTSRKLLSDKPQDFQIRVQVIEGRQLPGVNIKPVVKVTAAGQTKRTRIHKGNSPLFNETLFFNLFDSPGELFDEPIFITVVDSRSLRTDALLGEFRMDVGTIYREPRHAYLRKWLLLSDPDDFSAGARGYLKTSLCVLGPGDEAPLERKDPSEDKEDIESNLLRPTGVALRGAHFCLKVFRAEDLPQMDDAVMDNVKQIFGFESNKKNLVDPFVEVSFAGKMLCSKILEKTANPQWNQNITLPAMFPSMCEKMRIRIIDWDRLTHNDIVATTYLSMSKISAPGGEIEEEPAGAVKPSKASDLDDYLGFLPTFGPCYINLYGSPREFTGFPDPYTELNTGKGEGVAYRGRLLLSLETKLVEHSEQKVEDLPADDILRVEKYLRRRKYSLFAAFYSATMLQDVDDAIQFEVSIGNYGNKFDMTCLPLASTTQYSRAVFDGCHYYYLPWGNVKPVVVLSSYWEDISHRIETQNQLLGIADRLEAGLEQVHLALKAQCSTEDVDSLVAQLTDELIAGCSQPLGDIHETPSATHLDQYLYQLRTHHLSQITEAALALKLGYCLDLKTQVQTPQGMKEISNIQVGDLVLSNTGYNEVLNVFPKSKKKSYKITLEDGKEIICSEEHLFPTQTGEMNISGGLKEGMCLYVKE*

·C端片段(SEQ ID NO.115)：

MMLKKILKIEELDERELIDIEVSGNHLFYANDILTHNSELPAALEQAEDWLLRLRALAEEPQNSLPDIVIWMLQGDKRVAYQRVPAHQVLFSRRGANYCGKNCGKLQTIFLKYPMEKVPGARMPVQIRVKLWFGLSVDEKEFNQFAEGKLSVFAETYENETKLALVGNWGTTGLTYPKFSDVTGKIKLPKDSFRPSAGWTWAGDWFVCPEKTLLHDMDAGHLSFVEEVFENQTRLPGGQWIYMSDNYTDVNGEKVLPKDDIECPLGWKWEDEEWSTDLNRAVDEQGWEYSITIPPERKPKHWVPAEKMYYTHRRRRWVRLRRRDLSQMEALKRHRQAEAEGEGWEYASLFGWKFHLEYRKTDAFRRRRWRRRMEPLEKTGPAAVFALEGALGGVMDDKSEDSMSVSTLSFGVNRPTISCIFDYGNRYHLRCYMYQARDLAAMDKDSFSDPYAIVSFLHQSQKTVVVKNTLNPTWDQTLIFYEIEIFGEPATVAEQPPSIVVELYDHDTYGADEFMGRCICQPSLERMPRLAWFPLTRGSQPSGELLASFELIQREKPAIHHIPGFEVQETSRILDESEDTDLPYPPPQREANIYMVPQNIKPALQRTAIEILAWGLRNMKSYQLANISSPSLVVECGGQTVQSCVIRNLRKNPNFDICTLFMEVMLPREELYCPPITVKVIDNRQFGRRPVVGQCTIRSLESFLCDPYSAESPSPQGGPDDVSLLSPGEDVLIDIDDKEPLIPIQEEEFIDWWSKFFASIGEREKCGSYLEKDFDTLKVYDTQLENVEAFEGLSDFCNTFKLYRGKTQEETEDPSVIGEFKGLFKIYPLPEDPAIPMPPRQFHQLAAQGPQECLVRIYIVRAFGLQPKDPNGKCDPYIKISIGKKSVSDQDNYIPCTLEPVFGKMFELTCTLPLEKDLKITLYDYDLLSKDEKIGETVVDLENRLLSKFGARCGLPQTYCVSGPNQWRDQLRPSQLLHLFCQQHRVKAPVYRTDRVMFQDKEYSIEEIEAGRIPNPHLGPVEERLALHVLQQQGLVPEHVESRPLYSPLQPDIEQGKLQMWVDLFPKALGRPGPPFNITPRRARRFFLRCIIWNTRDVILDDLSLTGEKMSDIYVKGWMIGFEEHKQKTDVHYRSLGGEGNFNWRFIFPFDYLPAEQVCTIAKKDAFWRLDKTESKIPARVVFQIWDNDKFSFDDFLGSLQLDLNRMPKPAKTAKKCSLDQLDDAFHPEWFVSLFEQKTVKGWWPCVAEEGEKKILAGKLEMTLEIVAESEHEERPAGQGRDEPNMNPKLEDPRRPDTSFLWFTSPYKTMKFILWRRFRWAIILFIILFILLLFLAIFIYAFPNYAAMKLVKPFS*

2)分裂位点#2(使用分裂gp41.1)：

·N端片段(SEQ ID NO.116)：

MLRVFILYAENVHTPDTDISDAYCSAVFAGVKKRTKVIKNSVNPVWNEGFEWDLKGIPLDQGSELHVVVKDHETMGRNRFLGEAKVPLREVLATPSLSASFNAPLLDTKKQPTGASLVLQVSYTPLPGAVPLFPPPTPLEPSPTLPDLDVVADTGGEEDTEDQGLTGDEAEPFLDQSGGPGAPTTPRKLPSRPPPHYPGIKRKRSAPTSRKLLSDKPQDFQIRVQVIEGRQLPGVNIKPVVKVTAAGQTKRTRIHKGNSPLFNETLFFNLFDSPGELFDEPIFITVVDSRSLRTDALLGEFRMDVGTIYREPRHAYLRKWLLLSDPDDFSAGARGYLKTSLCVLGPGDEAPLERKDPSEDKEDIESNLLRPTGVALRGAHFCLKVFRAEDLPQMDDAVMDNVKQIFGFESNKKNLVDPFVEVSFAGKMLCSKILEKTANPQWNQNITLPAMFPSMCEKMRIRIIDWDRLTHNDIVATTYLSMSKISAPGGEIEEEPAGAVKPSKASDLDDYLGFLPTFGPCYINLYGSPREFTGFPDPYTELNTGKGEGVAYRGRLLLSLETKLVEHSEQKVEDLPADDILRVEKYLRRRKYSLFAAFYSATMLQDVDDAIQFEVSIGNYGNKFDMTCLPLASTTQYSRAVFDGCHYYYLPWGNVKPVVVLSSYWEDISHRIETQNQLLGIADRLEAGLEQVHLALKAQCSTEDVDSLVAQLTDELIAGCSQPLGDIHETPSATHLDQYLYQLRTHHLSQITEAALALKLGHSELPAALEQAEDWLLRLRALAEEPQNSLPDIVIWMLQGDKRVAYQRVPAHQVLFSRRGANYCGKNCGKLQTIFLKYPMEKVPGARMPVQIRVKLWFGYCLDLKTQVQTPQGMKEISNIQVGDLVLSNTGYNEVLNVFPKSKKKSYKITLEDGKEIICSEEHLFPTQTGEMNISGGLKEGMCLYVKE*

·C端片段(SEQ ID NO.117)：

MMLKKILKIEELDERELIDIEVSGNHLFYANDILTHNSVDEKEFNQFAEGKLSVFAETYENETKLALVGNWGTTGLTYPKFSDVTGKIKLPKDSFRPSAGWTWAGDWFVCPEKTLLHDMDAGHLSFVEEVFENQTRLPGGQWIYMSDNYTDVNGEKVLPKDDIECPLGWKWEDEEWSTDLNRAVDEQGWEYSITIPPERKPKHWVPAEKMYYTHRRRRWVRLRRRDLSQMEALKRHRQAEAEGEGWEYASLFGWKFHLEYRKTDAFRRRRWRRRMEPLEKTGPAAVFALEGALGGVMDDKSEDSMSVSTLSFGVNRPTISCIFDYGNRYHLRCYMYQARDLAAMDKDSFSDPYAIVSFLHQSQKTVVVKNTLNPTWDQTLIFYEIEIFGEPATVAEQPPSIVVELYDHDTYGADEFMGRCICQPSLERMPRLAWFPLTRGSQPSGELLASFELIQREKPAIHHIPGFEVQETSRILDESEDTDLPYPPPQREANIYMVPQNIKPALQRTAIEILAWGLRNMKSYQLANISSPSLVVECGGQTVQSCVIRNLRKNPNFDICTLFMEVMLPREELYCPPITVKVIDNRQFGRRPVVGQCTIRSLESFLCDPYSAESPSPQGGPDDVSLLSPGEDVLIDIDDKEPLIPIQEEEFIDWWSKFFASIGEREKCGSYLEKDFDTLKVYDTQLENVEAFEGLSDFCNTFKLYRGKTQEETEDPSVIGEFKGLFKIYPLPEDPAIPMPPRQFHQLAAQGPQECLVRIYIVRAFGLQPKDPNGKCDPYIKISIGKKSVSDQDNYIPCTLEPVFGKMFELTCTLPLEKDLKITLYDYDLLSKDEKIGETVVDLENRLLSKFGARCGLPQTYCVSGPNQWRDQLRPSQLLHLFCQQHRVKAPVYRTDRVMFQDKEYSIEEIEAGRIPNPHLGPVEERLALHVLQQQGLVPEHVESRPLYSPLQPDIEQGKLQMWVDLFPKALGRPGPPFNITPRRARRFFLRCIIWNTRDVILDDLSLTGEKMSDIYVKGWMIGFEEHKQKTDVHYRSLGGEGNFNWRFIFPFDYLPAEQVCTIAKKDAFWRLDKTESKIPARVVFQIWDNDKFSFDDFLGSLQLDLNRMPKPAKTAKKCSLDQLDDAFHPEWFVSLFEQKTVKGWWPCVAEEGEKKILAGKLEMTLEIVAESEHEERPAGQGRDEPNMNPKLEDPRRPDTSFLWFTSPYKTMKFILWRRFRWAIILFIILFILLLFLAIFIYAFPNYAAMKLVKPFS*

3)分裂位点#3(使用分裂IMPDH)：

·N端片段(SEQ ID NO.118)：

MLRVFILYAENVHTPDTDISDAYCSAVFAGVKKRTKVIKNSVNPVWNEGFEWDLKGIPLDQGSELHVVVKDHETMGRNRFLGEAKVPLREVLATPSLSASFNAPLLDTKKQPTGASLVLQVSYTPLPGAVPLFPPPTPLEPSPTLPDLDVVADTGGEEDTEDQGLTGDEAEPFLDQSGGPGAPTTPRKLPSRPPPHYPGIKRKRSAPTSRKLLSDKPQDFQIRVQVIEGRQLPGVNIKPVVKVTAAGQTKRTRIHKGNSPLFNETLFFNLFDSPGELFDEPIFITVVDSRSLRTDALLGEFRMDVGTIYREPRHAYLRKWLLLSDPDDFSAGARGYLKTSLCVLGPGDEAPLERKDPSEDKEDIESNLLRPTGVALRGAHFCLKVFRAEDLPQMDDAVMDNVKQIFGFESNKKNLVDPFVEVSFAGKMLCSKILEKTANPQWNQNITLPAMFPSMCEKMRIRIIDWDRLTHNDIVATTYLSMSKISAPGGEIEEEPAGAVKPSKASDLDDYLGFLPTFGPCYINLYGSPREFTGFPDPYTELNTGKGEGVAYRGRLLLSLETKLVEHSEQKVEDLPADDILRVEKYLRRRKYSLFAAFYSATMLQDVDDAIQFEVSIGNYGNKFDMTCLPLASTTQYSRAVFDGCHYYYLPWGNVKPVVVLSSYWEDISHRIETQNQLLGIADRLEAGLEQVHLALKAQCSTEDVDSLVAQLTDELIAGCSQPLGDIHETPSATHLDQYLYQLRTHHLSQITEAALALKLGHSELPAALEQAEDWLLRLRALAEEPQNSLPDIVIWMLQGDKRVAYQRVPAHQVLFSRRGANYCGKNCGKLQTIFLKYPMEKVPGARMPVQIRVKLWFGLSVDEKEFNQFAEGKLSVFAETYENETKLALVGNWGTTGLTYPKFSDVTGKIKLPKDSFRPSAGWTWAGDWFVCPEKTLLHDMDAGHLSFVEEVFENQTRLPGGQWIYMSDNYTDVNGEKVLPKDDIECPLGWKWEDEEWSTDLNRAVDEQGWEYSITIPPERKPKHWVPAEKMYYTHRRRRWVRLRRRDLSQMEALKRHRQAEAEGEGWEYASLFGWKFHLEYRKTDAFRRRRWRRRMEPLEKTGPAAVFALEGALGGVMDDKSEDSMSVSTLSFGVNRPTISCIFDYGNRYHLRCYMYQARDLAAMDKDSFSDPYAIVSFLHQSQKTVVVKNTLNPTWDQTLIFYEIEIFGEPATVAEQPPSIVVELYDHDTYGADEFMGRCICQPSLERMPRLAWFPLTRGCFVPGTLVNTENGLKKIEEIKVGDKVFSHTGKLQEVVDTLIFDRDEEIISINGIDCTKNHEFYVIDKENANRVNEDNIHLFARWVHAEELDMKKHLLIELE*

·C端片段(SEQ ID NO.119)：

MKFKLKEITSIETKHYKGKVHDLTVNQDHSYNVRGTVVHNSQPSGELLASFELIQREKPAIHHIPGFEVQETSRILDESEDTDLPYPPPQREANIYMVPQNIKPALQRTAIEILAWGLRNMKSYQLANISSPSLVVECGGQTVQSCVIRNLRKNPNFDICTLFMEVMLPREELYCPPITVKVIDNRQFGRRPVVGQCTIRSLESFLCDPYSAESPSPQGGPDDVSLLSPGEDVLIDIDDKEPLIPIQEEEFIDWWSKFFASIGEREKCGSYLEKDFDTLKVYDTQLENVEAFEGLSDFCNTFKLYRGKTQEETEDPSVIGEFKGLFKIYPLPEDPAIPMPPRQFHQLAAQGPQECLVRIYIVRAFGLQPKDPNGKCDPYIKISIGKKSVSDQDNYIPCTLEPVFGKMFELTCTLPLEKDLKITLYDYDLLSKDEKIGETVVDLENRLLSKFGARCGLPQTYCVSGPNQWRDQLRPSQLLHLFCQQHRVKAPVYRTDRVMFQDKEYSIEEIEAGRIPNPHLGPVEERLALHVLQQQGLVPEHVESRPLYSPLQPDIEQGKLQMWVDLFPKALGRPGPPFNITPRRARRFFLRCIIWNTRDVILDDLSLTGEKMSDIYVKGWMIGFEEHKQKTDVHYRSLGGEGNFNWRFIFPFDYLPAEQVCTIAKKDAFWRLDKTESKIPARVVFQIWDNDKFSFDDFLGSLQLDLNRMPKPAKTAKKCSLDQLDDAFHPEWFVSLFEQKTVKGWWPCVAEEGEKKILAGKLEMTLEIVAESEHEERPAGQGRDEPNMNPKLEDPRRPDTSFLWFTSPYKTMKFILWRRFRWAIILFIILFILLLFLAIFIYAFPNYAAMKLVKPFS*

微型UtropinΔSR5-15(位点#1)或ΔSR6-14(位点#2)：

1)分裂位点#1(使用分裂IMPDH)：

·N端片段(SEQ ID NO.120)：

MAKYGEHEASPDNGQNEFSDIIKSRSDEHNDVQKKTFTKWINARFSKSGKPPINDMFTDLKDGRKLLDLLEGLTGTSLPKERGSTRVHALNNVNRVLQVLHQNNVELVNIGGTDIVDGNHKLTLGLLWSIILHWQVKDVMKDVMSDLQQTNSEKILLSWVRQTTRPYSQVNVLNFTTSWTDGLAFNAVLHRHKPDLFSWDKVVKMSPIERLEHAFSKAQTYLGIEKLLDPEDVAVQLPDKKSIIMYLTSLFEVLPQQVTIDAIREVETLPRKYKKECEEEAINIQSTAPEEEHESPRAETPSTVTEVDMDLDSYQIALEEVLTWLLSAEDTFQEQDDISDDVEEVKDQFATHEAFMMELTAHQSSVGSVLQAGNQLITQGTLSDEEEFEIQEQMTLLNARWEALRVESMDRQSRLHDVLMELQKKQLQQLSAWLTLTEERIQKMETCPLDDDVKSLQKLLEEHKSLQSDLEAEQVKVNSLTHMVVIVDENSGESATAILEDQLQKLGERWTAVCRWTEERWNRLQEINILWQELLEEQCLLKAWLTEKEEALNKVQTSNFKDQKELSVSVRRLAILKEDMEMKRQTLDQLSEIGQDVGQLLDNSKASKKINSDSEELTQRWDSLVQRLEDSSNQVTQAVAKLGMSQIPQKDLLETVRVREQAITKKSKQELPPPPPPKKRQIHVDIEAKKKFDAISAELLNWILKWKTAIQTTEIKEYMKMQDTSEMKKKLKALEKEQRERIPRADELNQTGQILVEQMGKEGLPTEEIKNVLEKVSSEWKNVSQHLEDLERKIQLEEWRQFHCDLNDLTQWITEAEELLVDTCAPGGSLDLEKARIHQQELEVGISSHQPSFAALNRTGDGIVQKLSQADGSFLKEKLAGLNQRWDAIVAEVKDRQPRLKGESKQVMKYRHQLDEIICWLTKAEHAMQKRSTTELGENLQELRDLTQEMEVHAEKLKWLNRTELEMLSDKSLSLPERDKISESLRTVNMTWNKICREVPTTLKECIQEPSSVSQTRIAAHPNVQKVVLVSSASDIPVQSHRTSEISIPADLDKTITELADWLVLIDQMLKSNIVTVGDVEEINKTVSRMKITKADLEQRHPQLDYVFTLAQNLKNKASSSDMRTAITEKLERVKNQWDGTQHGVELRQQQLEDMIIDSLQWDDHREETEELMRKYEARLYILQQARRDPLTKQISDNQILLQELGPGDGIVMAFDNVLQKLLEEYGCFVPGTLVNTENGLKKIEEIKVGDKVFSHTGKLQEVVDTLIFDRDEEIISINGIDCTKNHEFYVIDKENANRVNEDNIHLFARWVHAEELDMKKHLLIELE*

·C端片段(SEQ ID NO.121)：

MKFKLKEITSIETKHYKGKVHDLTVNQDHSYNVRGTVVHNSDDTRNVKETTEYLKTSWINLKQSIADRQNALEAEWRTVQASRRDLENFLKWIQEAETTVNVLVDASHRENALQDSILARELKQQMQDIQAEIDAHNDIFKSIDGNRQKMVKALGNSEEATMLQHRLDDMNQRWNDLKAKSASIRAHLEASAEKWNRLLMSLEELIKWLNMKDEELKKQMPIGGDVPALQLQYDHCKALRRELKEKEYSVLNAVDQARVFLADQPIEAPEEPRRNLQSKTELTPEERAQKIAKAMRKQSSEVKEKWESLNAVTSNWQKQVDKALEKLRDLQGAMDDLDADMKEAESVRNGWKPVGDLLIDSLQDHIEKIMAFREEIAPINFKVKTVNDLSSQLSPLDLHPSLKMSRQLDDLNMRWKLLQVSVDDRLKQLQEAHRDFGPSSQHFLSTSVQLPWQRSISHNKVPYYINHQTQTTCWDHPKMTELFQSLADLNNVRFSAYRTAIKIRRLQKALCLDLLELSTTNEIFKQHKLNQNDQLLSVPDVINCLTTTYDGLEQMHKDLVNVPLCVDMCLNWLLNVYDTGRTGKIRVQSLKIGLMSLSKGLLEEKYRYLFKEVAGPTEMCDQRQLGLLLHDAIQIPRQLGEVAAFGGSNIEPSVRSCFQQNNNKPEISVKEFIDWMHLEPQSMVWLPVLHRVAAAETAKHQAKCNICKECPIVGFRYRSLKHFNYDVCQSCFFSGRTAKGHKLHYPMVEYCIPTTSGEDVRDFTKVLKNKFRSKKYFAKHPRLGYLPVQTVLEGDNLETPITLISMWPEHYDPSQSPQLFHDDTHSRIEQYATRLAQMERTNGSFLTDSSSTTGSVEDEHALIQQYCQTLGGESPVSQPQSPAQILKSVEREERGELERIIADLEEEQRNLQVEYEQLKDQHLRRGLPVGSPPESIISPHHTSEDSELIAEAKLLRQHKGRLEARMQILEDHNKQLESQLHRLRQLLEQPESDSRINGVSPWASPQHSALSYSLDPDASGPQFHQAAGEDLLAPPHDTSTDLTEVMEQIHSTFPSCCPNVPSRPQAM*

2)分裂位点#2(使用分裂Nrdj-1)：

·N端片段(SEQ ID NO.122)：

MAKYGEHEASPDNGQNEFSDIIKSRSDEHNDVQKKTFTKWINARFSKSGKPPINDMFTDLKDGRKLLDLLEGLTGTSLPKERGSTRVHALNNVNRVLQVLHQNNVELVNIGGTDIVDGNHKLTLGLLWSIILHWQVKDVMKDVMSDLQQTNSEKILLSWVRQTTRPYSQVNVLNFTTSWTDGLAFNAVLHRHKPDLFSWDKVVKMSPIERLEHAFSKAQTYLGIEKLLDPEDVAVQLPDKKSIIMYLTSLFEVLPQQVTIDAIREVETLPRKYKKECEEEAINIQSTAPEEEHESPRAETPSTVTEVDMDLDSYQIALEEVLTWLLSAEDTFQEQDDISDDVEEVKDQFATHEAFMMELTAHQSSVGSVLQAGNQLITQGTLSDEEEFEIQEQMTLLNARWEALRVESMDRQSRLHDVLMELQKKQLQQLSAWLTLTEERIQKMETCPLDDDVKSLQKLLEEHKSLQSDLEAEQVKVNSLTHMVVIVDENSGESATAILEDQLQKLGERWTAVCRWTEERWNRLQEINILWQELLEEQCLLKAWLTEKEEALNKVQTSNFKDQKELSVSVRRLAILKEDMEMKRQTLDQLSEIGQDVGQLLDNSKASKKINSDSEELTQRWDSLVQRLEDSSNQVTQAVAKLGMSQIPQKDLLETVRVREQAITKKSKQELPPPPPPKKRQIHVDIEAKKKFDAISAELLNWILKWKTAIQTTEIKEYMKMQDTSEMKKKLKALEKEQRERIPRADELNQTGQILVEQMGKEGLPTEEIKNVLEKVSSEWKNVSQHLEDLERKIQLQEDINAYFKQLDELEKVIKTKEEWVKHTSISESSRQSLPSLKDSCQRELTNLLGLHPKIEMARASCSALMSQPSAPDFVQRGFDSFLGRYQAVQEAVEDRQQHLENELKLLPTDYLVEINKILLCMDDVELSLNVPELNTAIYEDFSFQEDSLKNIKDQLDKLGEQIAVIHEKQPDVILEASGPEAIQIRDTLTQLNAKWDRINRMYSDRKGCFDRAMEEWRQFHCDLNDLTQWITEAEELLVDTCAPGGSLDLEKARIHQQELEVGISSHQPSFAALNRTGDGIVQKLSQADGSFLKEKLAGLNQRWDAIVAEVKDRQPRLKGESKQVMKYRHQLDEIICWLTKAEHAMQKRSTTELGENLQELRDLTQEMEVHAEKLKWLNRTELEMLSDKSLSLPERDKISESLRTVNMTWNKICREVPTTLKECIQEPSSVSQTRIAAHPNVQKVVLVSSASDIPVQSHRTCCLVGSSEIITRNYGKTTIKEVVEIFDNDKNIQVLAFNTHTDNIEWAPIKAAQLTRPNAELVELEIDTLHGVKTIRCTPDHPVYTKNRGYVRADELTDDDELVVAI*

·C端片段(SEQ ID NO.123)：

MEAKTYIGKLKSRKIVSNEDTYDIQTSTHNFFANDILVHNSEISIPADLDKTITELADWLVLIDQMLKSNIVTVGDVEEINKTVSRMKITKADLEQRHPQLDYVFTLAQNLKNKASSSDMRTAITEKLERVKNQWDGTQHGVELRQQQLEDMIIDSLQWDDHREETEELMRKYEARLYILQQARRDPLTKQISDNQILLQELGPGDGIVMAFDNVLQKLLEEYGSDDTRNVKETTEYLKTSWINLKQSIADRQNALEAEWRTVQASRRDLENFLKWIQEAETTVNVLVDASHRENALQDSILARELKQQMQDIQAEIDAHNDIFKSIDGNRQKMVKALGNSEEATMLQHRLDDMNQRWNDLKAKSASIRAHLEASAEKWNRLLMSLEELIKWLNMKDEELKKQMPIGGDVPALQLQYDHCKALRRELKEKEYSVLNAVDQARVFLADQPIEAPEEPRRNLQSKTELTPEERAQKIAKAMRKQSSEVKEKWESLNAVTSNWQKQVDKALEKLRDLQGAMDDLDADMKEAESVRNGWKPVGDLLIDSLQDHIEKIMAFREEIAPINFKVKTVNDLSSQLSPLDLHPSLKMSRQLDDLNMRWKLLQVSVDDRLKQLQEAHRDFGPSSQHFLSTSVQLPWQRSISHNKVPYYINHQTQTTCWDHPKMTELFQSLADLNNVRFSAYRTAIKIRRLQKALCLDLLELSTTNEIFKQHKLNQNDQLLSVPDVINCLTTTYDGLEQMHKDLVNVPLCVDMCLNWLLNVYDTGRTGKIRVQSLKIGLMSLSKGLLEEKYRYLFKEVAGPTEMCDQRQLGLLLHDAIQIPRQLGEVAAFGGSNIEPSVRSCFQQNNNKPEISVKEFIDWMHLEPQSMVWLPVLHRVAAAETAKHQAKCNICKECPIVGFRYRSLKHFNYDVCQSCFFSGRTAKGHKLHYPMVEYCIPTTSGEDVRDFTKVLKNKFRSKKYFAKHPRLGYLPVQTVLEGDNLETPITLISMWPEHYDPSQSPQLFHDDTHSRIEQYATRLAQMERTNGSFLTDSSSTTGSVEDEHALIQQYCQTLGGESPVSQPQSPAQILKSVEREERGELERIIADLEEEQRNLQVEYEQLKDQHLRRGLPVGSPPESIISPHHTSEDSELIAEAKLLRQHKGRLEARMQILEDHNKQLESQLHRLRQLLEQPESDSRINGVSPWASPQHSALSYSLDPDASGPQFHQAAGEDLLAPPHDTSTDLTEVMEQIHSTFPSCCPNVPSRPQAM*

Claims

1.一种用于将外源多肽递送至细胞的方法，所述方法包括使所述细胞接触：

第一腺相关病毒(AAV)载体颗粒，其包含编码第一融合多肽的第一核酸，所述第一融合多肽包含与分裂内含肽的第一部分融合的外源多肽的第一部分；以及

第二AAV载体颗粒，其包含编码第二融合多肽的第二核酸，所述第二融合多肽包含与所述分裂内含肽的第二部分融合的所述外源多肽的第二部分；

其中所述第一融合多肽和所述第二融合多肽在所述细胞中由所述第一核酸和所述第二核酸产生，并且其中所述分裂内含肽的所述第一部分和所述第二部分促进所述外源多肽的所述第一部分与所述外源多肽的所述第二部分的连接，从而将所述外源多肽递送至所述细胞；

其中所递送的所述外源多肽大于单个AAV载体颗粒能够编码的多肽。

2.如权利要求1所述的方法，其中所述第一核酸和所述第二核酸包含肌肉特异性表达盒(MSEC)。

3.如权利要求1或权利要求2所述的方法，其中所述分裂内含肽是天然存在的分裂内含肽。

4.如权利要求1-3中任一项所述的方法，其中所述分裂内含肽是基因修饰的分裂内含肽。

5.如权利要求4所述的方法，其中所述分裂内含肽的基因修饰选自针对在哺乳动物细胞中的表达和/或稳定性的密码子优化、所述分裂内含肽的缩短或延长，或改变所述分裂内含肽中的编码氨基酸以更紧密地匹配待递送的所述外源蛋白的序列。

6.如权利要求1-5中任一项所述的方法，其中所述外源多肽的所述第一部分和所述第二部分的大小基本上相同。

7.如权利要求1-5中任一项所述的方法，其中所述外源多肽的所述第一部分和所述第二部分的大小相差不超过50个氨基酸。

8.如权利要求1-7中任一项所述的方法，其中所述外源多肽包含来自所述分裂内含肽的少于四个氨基酸的足迹。

9.如权利要求8所述的方法，其中所述外源多肽包含来自所述分裂内含肽的3个或更少氨基酸的足迹。

10.如权利要求9所述的方法，其中将所述外源多肽的所述第一部分和所述第二部分分开的分裂位点选择在具有与所述分裂内含肽足迹相同的序列的位点处，从而产生不含来自所述分裂内含肽的额外氨基酸的所述外源多肽。

11.如权利要求1-10中任一项所述的方法，其中所述外源多肽是治疗性多肽。

12.如权利要求11所述的方法，其中所述治疗性多肽选自肌营养不良蛋白、微型肌营养不良蛋白、utrophin和dysferlin、伴肌动蛋白、肌联蛋白、肌球蛋白、含血影蛋白重复的核包膜蛋白1(Syne-1)、肌营养不良蛋白聚糖、ATP合酶、凝血因子IIX、核纤层蛋白A/C、甲状腺球蛋白、表皮生长因子受体(EGFR)、α和/或β血影蛋白、雷帕霉素的肌肉靶标(mTOR)以及利阿诺定受体1。

13.如权利要求12所述的方法，其中所述微型肌营养不良蛋白大于160kDa并且小于全长肌营养不良蛋白。

14.如权利要求12所述的方法，其中所述治疗性多肽是肌营养不良蛋白，并且所述肌营养不良蛋白外显肽的N端部分在肌营养不良蛋白铰链结构域内或附近与分裂内含肽的N端部分连接。

15.如权利要求14所述的方法，其中所述铰链结构域包含肌营养不良蛋白的铰链1、2、3或4。

16.如权利要求12所述的方法，其中所述治疗性多肽是肌营养不良蛋白，并且所述肌营养不良蛋白外显肽的N端部分在24个肌营养不良蛋白血影蛋白样重复结构域中的一个内与将螺旋b与螺旋c或螺旋c与螺旋a’连接的环结构域连接。

17.如权利要求12所述的方法，其中所述治疗性多肽是肌营养不良蛋白，并且所述肌营养不良蛋白外显肽的C端部分在肌营养不良蛋白铰链结构域内或附近与所述分裂内含肽的C端部分连接或在24个肌营养不良蛋白血影蛋白样重复结构域中的一个内与将螺旋b与螺旋c或螺旋c与螺旋a’连接的环结构域连接。

18.如权利要求17所述的方法，其中所述铰链结构域包含肌营养不良蛋白的铰链1、2、3或4。

19.如权利要求1-18中任一项所述的方法，其中所述外源多肽在所述细胞中具有功能。

20.一种用于将外源多肽递送至细胞的方法，所述方法包括使所述细胞接触：

第一腺相关病毒(AAV)载体颗粒，其包含编码第一融合多肽的第一核酸，所述第一融合多肽包含与第一分裂内含肽的第一部分融合的外源多肽的第一部分，其中所述分裂内含肽的所述第一部分与所述外源多肽的所述第一部分的羧基端融合；

第二AAV载体颗粒，其包含编码第二融合多肽的第二核酸，所述第二融合多肽包含所述外源多肽的第二部分，所述第二部分(i)在所述外源多肽的所述第二部分的氨基端与所述第一分裂内含肽的第二部分融合并且(ii)在所述外源多肽的所述第二部分的羧基端与第二分裂内含肽的第一部分融合；以及

第三AAV载体颗粒，其包含编码第三融合多肽的第三核酸，所述第三融合多肽包含所述外源多肽的第三部分，所述第三部分在所述外源多肽的所述第三部分的氨基端与所述第二分裂内含肽的第二部分融合，

其中所述第一融合多肽、所述第二融合多肽和所述第三融合多肽在所述细胞中由所述第一核酸、所述第二核酸和所述第三核酸产生，并且其中所述第一分裂内含肽和所述第二分裂内含肽的相应部分促进(a)所述外源多肽的所述第一部分的羧基端与所述外源多肽的所述第二部分的氨基端的连接，以及(b)所述外源多肽的所述第二部分的羧基端与所述外源多肽的所述第三部分的氨基端的连接，从而将所述外源多肽递送至所述细胞；

21.如权利要求20所述的方法，其中所述第一分裂内含肽和所述第二分裂内含肽不交叉剪接。

22.一种蛋白质表达系统，其包含一组AAV载体颗粒，所述AAV载体颗粒组包括第一AAV颗粒和第二AAV颗粒，

其中所述第一AAV载体颗粒包含编码第一融合多肽的第一核酸，所述第一融合多肽包含与分裂内含肽的第一部分融合的外源多肽的第一部分；并且

其中所述第二AAV载体颗粒包含编码第二融合多肽的第二核酸，所述第二融合多肽包含与所述分裂内含肽的第二部分融合的所述外源多肽的第二部分。

23.如权利要求22所述的蛋白质表达系统，其中用所述第一AAV载体颗粒和所述第二AAV载体颗粒共感染细胞促进所述外源多肽的所述第一部分与所述外源多肽的所述第二部分的连接，同时去除所述分裂内含肽的所述第一部分和所述第二部分。

24.如权利要求22或23所述的蛋白质表达系统，其中所述外源多肽的所述第一部分与所述外源多肽的所述第二部分连接，同时去除所述分裂内含肽的所述第一部分和所述第二部分，产生比在单个AAV颗粒中能够编码的多肽更大的外源多肽。

25.一种蛋白质表达系统，其包含一组AAV载体颗粒，所述AAV载体颗粒组包括第一AAV颗粒、第二AAV颗粒和第三AAV颗粒，

其中所述第一AAV载体颗粒包含编码第一融合多肽的第一核酸，所述第一融合多肽包含与第一分裂内含肽的第一部分融合的外源多肽的第一部分，其中所述分裂内含肽的所述第一部分与所述外源多肽的所述第一部分的羧基端融合；

其中所述第二AAV载体颗粒包含编码第二融合多肽的第二核酸，所述第二融合多肽包含所述外源多肽的第二部分，所述第二部分(i)在所述外源多肽的所述第二部分的氨基端与所述第一分裂内含肽的第二部分融合并且(ii)在所述外源多肽的所述第二部分的羧基端与第二分裂内含肽的第一部分融合；并且

其中所述第三AAV载体颗粒包含编码第三融合多肽的第三核酸，所述第三融合多肽包含所述外源多肽的第三部分，所述第三部分在所述外源多肽的所述第三部分的氨基端与所述第二分裂内含肽的第二部分融合。

26.如权利要求25所述的蛋白质表达系统，其中用所述第一AAV载体颗粒、所述第二AAV载体颗粒和所述第三AAV载体颗粒共感染细胞促进所述外源多肽的所述第一部分与所述外源多肽的所述第二部分的连接，同时去除所述第一分裂内含肽的所述第一部分和所述第二部分，以及所述外源多肽的所述第二部分与所述外源多肽的所述第三部分的连接，同时去除所述第二分裂内含肽的所述第一部分和所述第二部分。

27.如权利要求25或26所述的蛋白质表达系统，其中所述外源多肽的所述第一部分与所述外源多肽的所述第二部分连接，同时去除所述第一分裂内含肽的所述第一部分和所述第二部分，以及所述外源多肽的所述第二部分与所述外源多肽的所述第三部分连接，同时去除所述第二分裂内含肽的所述第一部分和所述第二部分，产生比在单个AAV颗粒中能够编码的多肽更大的外源多肽。

28.如权利要求22-27中任一项所述的蛋白质表达系统，其中所述第一融合多肽和所述第二融合多肽，或所述第一融合多肽、所述第二融合多肽和所述第三融合多肽的表达由肌肉特异性表达盒驱动。

29.一种治疗有需要的受试者的疾病或病症的方法，所述方法包括施用如权利要求22-28中任一项所述的蛋白质表达系统，从而治疗所述受试者。

30.如权利要求29所述的方法，其中所述有需要的受试者患有肌肉或神经肌肉疾病或病症。

31.如权利要求29或30所述的方法，其中所述外源多肽是肌营养不良蛋白或微型肌营养不良蛋白，并且所述有需要的受试者患有杜氏肌营养不良症(DMD)或贝克型肌营养不良症(BMD)。

32.如权利要求31所述的方法，其中所述肌营养不良蛋白或微型肌营养不良蛋白使营养不良的肌肉的力量增加至少10％。

33.如权利要求29-32中任一项所述的方法，其中所述第一融合多肽和所述第二融合多肽，或所述第一融合多肽、所述第二融合多肽和所述第三融合多肽的表达由肌肉特异性表达盒驱动。

34.如权利要求29-33中任一项所述的方法，其中所述蛋白质表达系统通过输注到脉管系统中或通过直接注射到组织中来施用。

35.一种用于诱导细胞中产生外源多肽的方法，所述方法包括使所述细胞接触：

其中所述第一融合多肽和所述第二融合多肽在所述细胞中由所述第一核酸和所述第二核酸产生，并且其中所述分裂内含肽的所述第一部分和所述第二部分促进所述外源多肽的所述第一部分与所述外源多肽的所述第二部分的连接，从而诱导所述细胞中产生所述外源多肽；

其中所产生的所述外源多肽大于单个AAV载体颗粒能够编码的多肽。

36.如权利要求35所述的方法，其中所述第一核酸和所述第二核酸包含肌肉特异性表达盒(MSEC)。

37.如权利要求35或36所述的方法，其中所述分裂内含肽是天然存在的分裂内含肽。

38.如权利要求35-37中任一项所述的方法，其中所述分裂内含肽是基因修饰的分裂内含肽。

39.如权利要求38所述的方法，其中所述分裂内含肽的基因修饰选自针对在哺乳动物细胞中的表达和/或稳定性的密码子优化、所述分裂内含肽的缩短或延长，或改变所述分裂内含肽中的编码氨基酸以更紧密地匹配待产生的所述外源蛋白的序列。

40.如权利要求35-39中任一项所述的方法，其中所述外源多肽的所述第一部分和所述第二部分的大小基本上相同。

41.如权利要求35-40中任一项所述的方法，其中所述外源多肽的所述第一部分和所述第二部分的大小相差不超过50个氨基酸。

42.如权利要求35-41中任一项所述的方法，其中所述外源多肽包含来自所述分裂内含肽的少于四个氨基酸的足迹。

43.如权利要求42所述的方法，其中所述外源多肽包含3个或更少氨基酸的分裂内含肽足迹。

44.如权利要求43所述的方法，其中将所述外源多肽的所述第一部分和所述第二部分分开的分裂位点选择在具有与所述分裂内含肽足迹相同的序列的位点处，从而产生不含来自所述分裂内含肽的额外氨基酸的所述外源多肽。

45.如权利要求35-44中任一项所述的方法，其中所述外源多肽是治疗性多肽。

46.如权利要求45所述的方法，其中所述治疗性多肽选自肌营养不良蛋白、微型肌营养不良蛋白、utrophin和dysferlin、伴肌动蛋白、肌联蛋白、肌球蛋白、含血影蛋白重复的核包膜蛋白1(Syne-1)、肌营养不良蛋白聚糖、ATP合酶、凝血因子IIX、核纤层蛋白A/C、甲状腺球蛋白、表皮生长因子受体(EGFR)、α和/或β血影蛋白、雷帕霉素的肌肉靶标(mTOR)以及利阿诺定受体1。

47.如权利要求46所述的方法，其中所述微型肌营养不良蛋白大于160kDa并且小于全长肌营养不良蛋白。

48.如权利要求45或46所述的方法，其中所述治疗性多肽是肌营养不良蛋白，并且所述肌营养不良蛋白外显肽的N端部分在肌营养不良蛋白铰链结构域内或附近与分裂内含肽的N端部分连接。

49.如权利要求48所述的方法，其中所述铰链结构域包含肌营养不良蛋白的铰链1、2、3或4。

50.如权利要求45或46所述的方法，其中所述治疗性多肽是肌营养不良蛋白，并且所述肌营养不良蛋白外显肽的N端部分在24个肌营养不良蛋白血影蛋白样重复结构域中的一个内与将螺旋b与螺旋c或螺旋c与螺旋a’连接的环结构域连接。

51.如权利要求45或46所述的方法，其中所述治疗性多肽是肌营养不良蛋白，并且所述肌营养不良蛋白外显肽的C端部分在肌营养不良蛋白铰链结构域内或附近与所述分裂内含肽的C端部分连接或在24个肌营养不良蛋白血影蛋白样重复结构域中的一个内与将螺旋b与螺旋c或螺旋c与螺旋a’连接的环结构域连接。

52.如权利要求51所述的方法，其中所述铰链结构域包含肌营养不良蛋白的铰链1、2、3或4。

53.如权利要求35-52中任一项所述的方法，其中所述外源多肽在所述细胞中具有功能。

54.一种用于诱导细胞中产生外源多肽的方法，所述方法包括使所述细胞接触：

其中所述第一融合多肽、所述第二融合多肽和所述第三融合多肽在所述细胞中由所述第一核酸、所述第二核酸和所述第三核酸产生，并且其中所述第一分裂内含肽和所述第二分裂内含肽的相应部分促进(a)所述外源多肽的所述第一部分的羧基端与所述外源多肽的所述第二部分的氨基端的连接，以及(b)所述外源多肽的所述第二部分的羧基端与所述外源多肽的所述第三部分的氨基端的连接，从而在所述细胞中产生所述外源多肽；

55.如权利要求54所述的方法，其中所述第一分裂内含肽和所述第二分裂内含肽不交叉剪接。

56.如权利要求22-28中任一项所述的蛋白质表达系统，其用于治疗有需要的受试者的疾病或病症。

57.如权利要求56所述的蛋白质表达系统，其中所述有需要的受试者包括患有肌肉或神经肌肉病症的受试者。