CN116194587A

CN116194587A - 一种新的肌肉特异性启动子

Info

Publication number: CN116194587A
Application number: CN202180052616.1A
Authority: CN
Inventors: 威廉·洛斯塔尔; 伊莎贝尔·理查德
Original assignee: Evry Wald Esson University; Institut National de la Sante et de la Recherche Medicale INSERM; Genethon
Current assignee: Evry Wald Esson University; Institut National de la Sante et de la Recherche Medicale INSERM; Genethon
Priority date: 2020-07-10
Filing date: 2021-07-09
Publication date: 2023-05-30
Also published as: WO2022008711A1; BR112023000305A2; JP2023532806A; EP4179096A1; CA3184923A1; US20230277686A1

Abstract

本发明涉及一种新的短启动子，其特征在于在骨骼肌中具有高活性，而在心脏中具有低活性。因此，它构成了一个有价值的候选者，特别是用于驱动编码对治疗肌营养不良症有用的蛋白质的转基因的表达。

Description

一种新的肌肉特异性启动子

技术领域

本发明基于一种新的启动子的鉴定，该启动子具有较小的尺寸和目的表达谱，即在骨骼肌中具有高活性而在心脏中具有低活性。然后，它提供了一种有价值且安全的治疗工具，例如用于驱动编码对治疗肌营养不良症有用的蛋白质的转基因的表达。

背景技术

肌营养不良症(MD)是一组肌肉疾病，随着时间的推移，会导致骨骼肌的日益衰弱和分解。这些病症在主要受到影响的肌肉的种类、衰弱的程度、其恶化的速度以及症状开始的时间上有所不同。许多人最终会变得无法行走。有些类型还与其他器官的问题有关。在一些肌营养不良症的病例中，也会观察到心肌病。

肌营养不良症组包含30种不同的遗传性病症，通常被分为九个主要类别或类型。最常见的类型是杜氏肌营养不良症(DMD)，它通常从四岁左右开始影响男性。其他类型包括贝克肌营养不良症、面肩肱型肌营养不良症、肢带型肌营养不良症(LGMD)和强直性肌营养不良。它们是由于参与制造肌肉蛋白的基因发生了突变。这可能是由于从父母那里继承了缺陷或在早期发育过程中发生了突变。病症可能是X连锁隐性遗传、常染色体隐性遗传或常染色体显性遗传。诊断通常涉及血液检查和基因测试。

肌营养不良症是无法治愈的。物理疗法、支架和矫正手术可能有助于缓解一些症状。对于那些呼吸肌衰弱的人，可能需要辅助通风。使用的药物包括减缓肌肉退化的类固醇、控制癫痫发作和一些肌肉活动的抗惊厥药以及延缓垂死肌肉细胞损伤的免疫抑制剂。预后取决于病症的特定类型。

基因疗法作为一种治疗方法，正处于人类研究的早期阶段。它通常是基于携带编码在待治疗的受试者中发生了突变的野生型蛋白质的转基因的表达系统的全身施用。

在基因疗法方面，安全的表达系统被定义为确保在靶组织中，即在需要所述蛋白质来治愈与天然蛋白质缺乏有关的异常的组织中，产生治疗有效量的蛋白质而不显示任何毒性，特别是在基本和重要器官或组织中。在肌营养不良症方面，靶组织涉及骨骼肌，可能还涉及心脏。

对转基因表达的严格调节似乎是一个关键因素。例如，文件WO2014/167253报道，在人类结蛋白(desmin)启动子控制下，全身施用包含编码肌微管素(myotubularin)(以治疗X连锁肌管性肌病或XLMTM)或钙蛋白酶3(calpain3)(以治疗肢带型肌营养不良症2A型或LGMD2A)的核酸序列的AAV载体会导致肌肉拯救，但与心脏毒性有关。

存在许多用于高效肌肉表达的启动子。例如，Brennan等人(The Journal ofBiological Chemistry,1993,268(1):719-25)报道，人类α肌动蛋白ACTA1基因(SEQ IDNO:1)的-2000至+239区域允许在成人骨骼肌中高水平表达，以及横纹肌特异性表达和在发育过程中正确调节。然而，这种启动子的大尺寸(2239个核苷酸)使它不适合大量的应用。

在骨骼肌α肌动蛋白基因启动子区域方面：

Muscat等人(Mol.Cell.Biol.,1987,7(11):4089-99)已经鉴定了人类基因的多个5’-侧翼区域，它们协同调节肌肉特异性表达。

Petropoulos等人(Mol.Cell.Biol.,1989,9(9):3785-92)已经研究了鸡基因启动子的表达谱。

Muscat等人(Gene Expression,1992,2(2):111-126)已经鉴定了人类骨骼α肌动蛋白基因中的肌肉特异性增强子。

此外，并且正如本申请中在结蛋白启动子方面所显示的，它们中的大多数在心脏中也显示出高活性，可能与心脏毒性有关。此外，通常观察到，启动子越小，越难获得表达的特异性。例如，一个具有高肌肉表达的小启动子是合成的C5-12启动子(361个核苷酸)，它被证明在一些非肌肉细胞中有泄漏。

因此，本领域仍然需要设计尽可能小的转录元件，导致基因在骨骼肌细胞中的高水平和特异性表达，以达到蛋白质表达的治疗水平，并避免广泛的基因表达所固有的潜在副作用。

发明内容

本发明旨在提供合成启动子，这些启动子是肌肉特异性的，即在骨骼肌中的表达活性高于所有其他组织或器官，特别是心脏，同时尺寸小，以便与任何表达系统，特别是腺相关(AAV)载体兼容。

这些新型启动子可用于基因疗法，例如用于治疗神经肌肉疾病，包括肌营养不良症。

本发明涉及一种包含这种合成启动子的核酸分子。

本发明的启动子可与目的转基因可操作地连接。因此，本发明进一步涉及一种表达盒，其包含本文所述的核酸分子，可操作地与转基因连接。

本发明进一步涉及一种包含上述表达盒的载体。在特定实施方案中，该载体是质粒载体。在另一个实施方案中，该载体是病毒载体。

本发明还涉及一种包含根据本发明的核酸构建体的分离的重组细胞。

本发明进一步涉及一种药物组合物，其包含在药学上可接受的载体中的本发明的载体或分离的细胞。

此外，本发明还涉及本文公开的表达盒、载体或细胞用作药物。在这一方面，包含在表达盒、载体或细胞中的目的转基因是治疗性转基因。

本发明进一步涉及本文公开的表达盒、载体或细胞用于基因疗法。

在另一方面，本发明涉及本文公开的表达盒、载体或细胞用于治疗神经肌肉病症，例如肌营养不良症。

定义

除非另有定义，否则本文所用的所有技术和科学术语具有与本领域普通技术人员通常理解的相同含义。描述中使用的术语仅出于描述特定实施方案的目的，并不旨在进行限制。

冠词“一个/一种(a)”和“一个/一种(an)”在本文中用于指代冠词的语法对象中的一个或多于一个(即，至少一个)。举例来说，“一个要素”是指一个要素或多于一个要素。

在提及可测量的值(例如数量、持续时间等)时，本文所用的“约/大约(about)”或“约/大约(approximately)”是指涵盖指定值的±20％或±10％、更优选±5％、甚至更优选±1％、并且还更优选±0.1％的变化，因为这样的变化适合于执行所公开的方法。

范围：在整个本公开中，本发明的各个方面可以以范围格式呈现。应当理解，范围格式的描述仅仅是为了方便和简洁，不应被解释为对本发明范围的不可更改的限制。因此，范围的描述应该被认为已经具体公开了所有可能的子范围以及该范围内的各个数值。例如，对诸如从1到6的范围的描述应该被认为已经具体公开了子范围，例如从1到3、从1到4、从1到5、从2到4、从2到6、从3到6等，以及该范围内的各个数字，例如1、2、2.7、3、4、5、5.3和6。无论范围的广度如何，这都适用。

“分离的”是指从天然状态改变或取出。例如，活体动物中天然存在的核酸或肽不是“分离的”，而从其天然状态的共存材料部分或完全分离的相同核酸或肽是“分离的”。分离的核酸或蛋白质可以以基本上纯化的形式存在，或者可以存在于非天然环境(例如宿主细胞)中。

在本发明的背景中，使用以下常见核酸碱基的缩写。“A”是指腺苷，“C”是指胞嘧啶，“G”是指鸟苷，“T”是指胸苷，“U”是指尿苷。

“编码氨基酸序列的核苷酸序列”包括彼此为简并版本并且编码相同氨基酸序列的所有核苷酸序列。编码蛋白质或RNA或cDNA的短语核苷酸序列也可以包括内含子，以至于编码蛋白质的核苷酸序列在一些版本中可以包含内含子。

“编码”是指多核苷酸(例如基因、cDNA或mRNA)中的特定核苷酸序列用作合成生物过程中的具有限定的核苷酸序列(即rRNA、tRNA和mRNA)或限定的氨基酸序列的其他聚合物和大分子的模板的固有特性以及由此产生的生物学特性。因此，如果基因所对应的mRNA能在细胞或其他生物系统中转录和翻译产生蛋白质，则该基因编码蛋白质。编码链(其核苷酸序列与mRNA序列相同，通常在序列表中提供)和非编码链(用作基因或cDNA转录的模板)都可以称为编码蛋白质或该基因或cDNA的其他产物。

如本文所用，术语“多核苷酸”被定义为核苷酸链。此外，核酸是核苷酸的聚合物。因此，本文所用的核酸和多核苷酸是可互换的。本领域技术人员的常识是，核酸是可以水解成单体“核苷酸”的多核苷酸。单体核苷酸可以水解成核苷。如本文所用，多核苷酸包括但不限于通过本领域可用的任何方法(包括但不限于重组方法，即使用普通克隆技术和PCR等从重组文库或细胞基因组中克隆核酸序列，以及通过合成方法)获得的所有核酸序列。

如本文所用，术语“肽”、“多肽”和“蛋白质”可互换使用，是指由通过肽键共价连接的氨基酸残基组成的化合物。蛋白质或肽必须包含至少两个氨基酸，并且对可以构成蛋白质或肽序列的氨基酸的最大数目没有限制。多肽包括包含通过肽键彼此连接的两个或更多个氨基酸的任何肽或蛋白质。如本文所用，该术语既指短链，其在本领域中也通常称为例如肽、寡肽和寡聚体，也指更长链，其在本领域中通常称为蛋白质，其中有很多类型。“多肽”包括例如生物活性片段、基本上同源的多肽、寡肽、同二聚体、异二聚体、多肽的变体、修饰的多肽、衍生物、类似物、融合蛋白等。多肽包括天然肽、重组肽、合成肽或其组合。

蛋白质可能会被“改变”并包含氨基酸残基的缺失、插入或取代，这种氨基酸残基的缺失、插入或取代产生沉默的变化并导致功能等同。只要保留生物活性，可以基于残基的极性、电荷、溶解性、疏水性、亲水性和/或两亲性质的相似性进行有意的氨基酸取代。例如，带负电荷的氨基酸可以包括天冬氨酸和谷氨酸；带正电荷的氨基酸可以包括赖氨酸和精氨酸；具有相似亲水性值的含有不带电荷的极性头基团的氨基酸可以包括亮氨酸、异亮氨酸和缬氨酸、甘氨酸和丙氨酸、天冬酰胺和谷氨酰胺、丝氨酸和苏氨酸以及苯丙氨酸和酪氨酸。

如本文所用，“变体”是指被一个或多个氨基酸改变的氨基酸序列。变体可以具有“保守”变化，其中取代的氨基酸具有相似的结构或化学性质，例如用异亮氨酸替换亮氨酸。变体也可以具有“非保守”变化，例如用色氨酸替换甘氨酸。类似的微小变化也可以包括氨基酸缺失或插入或两者。可以使用本领域众所周知的计算机程序找到确定哪些氨基酸残基可以被取代、插入或缺失而不消除生物学或免疫学活性的指导。

“同一的”或“同源的”是指两个多肽之间或两个核酸分子之间的序列同一性或序列相似性。当所比较的两个序列的每一个中的一个位置被相同的碱基或氨基酸单体亚基占据时，例如，如果两个DNA分子的每一个中的一个位置被腺嘌呤占据，那么分子在该位置是同源的或同一的。两个序列之间的同源性/同一性百分比是两个序列共有的匹配位置数除以所比较的位置数乘以100的函数。例如，如果两个序列的10个位置中有6个匹配，则两个序列是60％同一的。通常，当比对两个序列时进行比较，以获得最大同源性/同一性。

“载体”是包含分离的核酸并且可用于将分离的核酸递送至细胞内部的物质组合物。许多载体是本领域已知的，包括但不限于线性多核苷酸、与离子或两亲化合物相关的多核苷酸、质粒和病毒。因此，术语“载体”包括自主复制的质粒或病毒。该术语还应当被解释为包括促进核酸转移到细胞中的非质粒和非病毒化合物，例如聚赖氨酸化合物、脂质体等。病毒载体的实例包括但不限于腺病毒载体、腺相关病毒载体、逆转录病毒载体等。“病毒载体”是指为将遗传物质递送到细胞中而设计的非复制性、非致病性病毒。在病毒载体中，复制和毒力所必需的病毒基因被目的基因的表达盒所取代。因此，病毒载体基因组包括表达盒，其两侧是病毒载体生产所需的病毒序列。

“表达载体”是指包含重组多核苷酸的载体，其包含与待表达的核苷酸序列可操作地连接的表达控制序列。表达载体包含足够的用于表达的顺式作用元件；用于表达的其他元件可以由宿主细胞或在体外表达系统中提供。表达载体包括本领域已知的所有那些，例如掺入重组多核苷酸的粘粒、质粒(例如，裸露的或包含在脂质体中)和病毒(例如，慢病毒、逆转录病毒、腺病毒和腺相关病毒)。

如本文所用，术语“启动子”被定义为由细胞的转录机制或引入的转录机制识别的核酸序列，这对于启动多核苷酸序列，特别是目的基因的特异性转录是必需的。

如本文所用，术语“启动子/调控序列”是指与启动子/调控序列可操作地连接的基因产物(即目的基因)的表达所需的核酸序列。在一些情况下，该序列可以是核心启动子序列，而在其他情况下，该序列还可以包括基因产物的表达所需的增强子序列和其他调控元件。启动子/调控序列可以例如是一种以组织特异性方式表达基因产物的序列。

如上文所用，术语“可操作地连接”是指目的基因与控制其转录的序列并列在一起。在启动子和目的基因之间可以有另外的残基，只要这种功能关系得以保留。

“组成型”启动子是一种核苷酸序列，当其与编码或指定基因产物的多核苷酸可操作地连接时，导致基因产物在细胞的大部分或所有生理条件下在细胞中产生。

“诱导型”启动子是一种核苷酸序列，当其与编码或指定基因产物的多核苷酸可操作地连接时，基本上仅当细胞中存在与该启动子相对应的诱导物或当其抑制物被移除时，才会导致基因产物在该细胞中产生。

“组织特异性”启动子是一种核苷酸序列，当其与编码基因或由基因指定的多核苷酸可操作地连接时，如果细胞是与该启动子相对应的组织类型的细胞，则导致基因产物优先在该细胞中产生。

“目的基因”或“转基因”是一种对特定应用有用的基因，例如不限于诊断、报告、修改、治疗和基因组编辑。例如，目的基因可以是一个治疗基因、报告基因或基因组编辑酶。在一些实施方案中，目的基因是一个人类基因。

在一些实施方案中，目的基因是一个基因的功能版本或其片段。所述基因的功能版本包括野生型基因、变异型基因，如属于同一家族的变异型和其他变异型，或截短的版本，它至少部分保留了编码蛋白的功能。基因的功能性版本对于替代或加成性基因治疗是很有用的，它可以替代患者体内缺乏或没有功能的基因。在其他实施方案中，目的基因是一个能使引起常染色体显性遗传病的显性等位基因失活的基因。基因的片段可作为重组模板与基因组编辑酶结合使用。

或者，目的基因可以编码特定应用的目的蛋白(例如，抗体或抗体片段，基因组编辑酶)或RNA。在一些实施方案中，蛋白质是一种治疗性蛋白质，包括治疗性抗体或抗体片段，或一种基因组编辑酶。在一些实施方案中，RNA是一种治疗性RNA。所关注的基因是能够在疾病的靶细胞，特别是肌肉细胞中产生编码的蛋白质、肽或RNA的功能基因。RNA有利地与靶DNA或RNA序列互补或与靶蛋白结合。例如，RNA是一种干扰RNA，如shRNA、microRNA、与Cas酶或类似酶结合使用的基因组编辑的引导RNA(gRNA)、能够跳过外显子的反义RNA，如改良的小核RNA(snRNA)或长非编码RNA。干扰RNA或microRNA可用于调节参与肌肉疾病的靶基因的表达。引导RNA与Cas酶或用于基因组编辑的类似酶复合，可用于修改靶基因的序列，特别是纠正突变/缺陷基因的序列，或修改涉及疾病的靶基因的表达，特别是神经肌肉疾病。能够跳过外显子的反义RNA特别用于纠正阅读框并恢复具有中断的阅读框的缺陷基因的表达。在一些实施方案中，该RNA是一种治疗性RNA。

在本发明的一些实施方案中，所述目的基因编码治疗性蛋白质或治疗性核糖核酸，可以是任何对骨骼肌细胞提供治疗效果的蛋白质或核糖核酸。在本发明的另一个实施方案中，所述治疗性蛋白质可以是在骨骼肌细胞外提供治疗效果的任何蛋白。所述治疗性蛋白质确实可以由所述细胞分泌。

当在生物体、组织、细胞或其成分的背景中使用时，术语“异常的”是指与那些表现出“正常的”(预期的)各自特征的生物体、组织、细胞或其成分相比，在至少一个可观察或可检测的特征(例如，年龄、治疗、一天中的时间等)上不同的那些生物体、组织、细胞或其成分。一种细胞或组织类型的正常或预期的特征对于不同的细胞或组织类型可能是异常的。

术语“患者”、“受试者”、“个体”等在本文中可互换使用，是指任何动物或其细胞，无论在体外还是在体都适用于本文所述的方法。受试者可以是哺乳动物，例如人、狗，还可以是小鼠、大鼠或非人类灵长类动物。在某些非限制性实施方案中，患者、受试者或个体是人。

“疾病”或“病理”是受试者的这样一种健康状况，其中受试者不能维持体内平衡，并且如果疾病没有得到改善，则受试者的健康继续恶化。相反，受试者的“病症(disorder)”是这样一种健康状况，其中受试者能够维持体内平衡，但受试者的健康状况不如没有病症时那样良好。如果不进行治疗，病症不一定会导致受试者的健康状况进一步下降。

如果疾病或病症的症状的严重程度、患者经历这种症状的频率或两者都降低，则疾病或病症“减轻”或“改善”。这还包括阻止疾病或病症的进展。如果疾病或病症的症状的严重程度、患者经历这种症状的频率或两者都被消除，则疾病或病症被“治愈”。

“治疗性”治疗是对表现出病理体征的受试者施用的治疗，目的是减少或消除这些体征。“预防性”治疗是对未表现出病理体征或尚未诊断出病理的受试者施用的治疗，目的是预防或推迟这些体征的发生。

如本文所用，“治疗疾病或病症”是指降低受试者所经历的疾病或病症的至少一种体征或症状的频率或严重程度。在治疗的背景中，疾病和病症在本文中可互换使用。

化合物的“有效量”是足以为施用化合物的受试者提供有益效果的化合物的量。如本文所用，短语“治疗有效量”是指足以或有效预防或治疗(延迟或预防其发作、阻止其进展、抑制、减少或逆转)疾病或病况(包括减轻此类疾病的症状)的量。递送载体的“有效量”是足以有效结合或递送化合物的量。

附图说明

图1：用5^e13 vg/kg AAV9-启动子-GFP-Luc(启动子＝结蛋白或ACTA1)注射的C57Bl6白化病小鼠(4只雄性/启动子)中的GFP-Luc转基因的荧光素酶活性

A/对注射的小鼠进行成像分析

B/不同器官(TA：胫骨前肌；膈肌；心脏；肝脏；肾脏；adr腺：肾上腺)的荧光素酶活性按总蛋白量进行归一化。

图2：钙蛋白酶3在未注射(NI)或注射有1^e14 vg/kg AAV9-启动子-hCalpain3-2x靶标-miR208a的小鼠(2或3只雄性/启动子)的TA(胫骨前)肌和心脏中的表达

2T：2x靶标-miR208a

启动子＝结蛋白:Des或ACTA1:ACTA

A/用Rplp0归一化后，通过qRT-PCR检测RNA水平

B/在蛋白质水平上，使用针对钙蛋白酶3的抗体进行蛋白质印迹。

具体实施方式

本发明是基于对源自人类ACTA1基因的启动子的鉴定。

ACTA1基因编码的产物(人类版本也被命名为肌动蛋白α1、骨骼肌或HAS)属于蛋白质的肌动蛋白家族，是高度保守的蛋白质，在细胞运动、结构和完整性方面发挥作用。已经鉴定了α、β和γ肌动蛋白的异构体，其中α肌动蛋白是收缩装置的主要成分，而β和γ肌动蛋白则参与细胞运动的调节。这种肌动蛋白是一种α肌动蛋白，存在于骨骼肌中。该基因位于1q42.13位(NCBI参考序列：NG_006672.1)。

正如本申请所证明的那样，可以有具有324个核苷酸甚至更少核苷酸的序列，它在骨骼肌中的活性高于任何其他组织或器官，特别是心脏。因此，这种启动子的肌肉活性可以高于众所周知的1061个核苷酸的人类结蛋白启动子，而在心脏中的活性较低。

根据一个方面，本发明涉及一种启动子，其包含源自人类ACTA1基因的近端区域和远端区域，定义如下。

本申请中所引用的启动子的核苷酸位置是相对于有关(天然)基因(有地的是人类ACTA1基因)的假定转录起始位点(或代表位置+1的加帽位点)编号的。举例来说，转录起始位点上游的第一个核苷酸被编号为-1，而后面的核苷酸被编号为+2。

在本申请的框架内，近端区域是位于目的基因5’端上游的区域，例如编码序列的起始密码子。远端区域位于远处，即位于近端区域的上游。换句话说，近端区域比远端区域更接近要表达的基因。

根据具体实施方案，根据本发明的启动子的近端区域包括ACTA1基因的核心或基础启动子，足以保证最低水平的转录。

根据一个实施方案，本发明的启动子包括与远端区域可操作地连接的近端区域。

在这种情况下，“可操作地连接”是指近端和远端区域的并列，允许它们介导置于所述启动子控制下的目的基因的表达。例如，如果远端区域增强了目的基因的转录，导致其在宿主细胞或生物体中的表达增强，则远端区域与近端区域可操作地连接。在近端区域和远端区域之间可以有另外的残基，只要这种功能关系得以保留。

有利地，如果远端区域增加由近端区域驱动的基因表达，则远端区域与近端区域可操作地连接。远端区域可以与近端区域相邻，距离很近，或者与近端区域相隔多达几个kb的距离。有利地，远端区域位于近端区域的上游，更有利地，分离所述两个区域的距离小于500bp，优选小于200bp。更优选地，远端区域紧邻或连接到近端区域。

根据不同的实施方案，所述远端和近端区域可以是连续的，或者可以被一个序列分开，该序列可能来自人类ACTA1启动子，有利地是天然围绕所述区域的序列，但也可以是外源序列或间隔区。根据具体实施方案，分离远端和近端区域的序列的尺寸小于500、450、400、350、300、250、200、150，或甚至小于100或50个核苷酸。

此外，相对于近端区域赋予的转录方向，远端区域的定向可以是正义的(5’->3’)或反义的(3’->5’)。本发明的启动子中存在的每个元件相对于其他元件的最佳位置和定向可以通过常规实验确定。

根据一个实施方案，远端区域包括人类ACTA1基因的-1282至-1177区域，或由其组成。换句话说，它包括SEQ ID NO:1中所示的719至824位的核苷酸序列或SEQ ID NO:3中所示的核苷酸序列，或由其组成。

根据其他实施方案，远端区域可以包括以下或由其组成：

-序列SEQ ID NO:3在5’和/或3’上延伸多达10个核苷酸，即可能对应于SEQ IDNO:1的709至834位；

-序列SEQ ID NO:3在5’和/或3’上截短多达10个核苷酸，即可能对应于SEQ IDNO:1的729至814位(也对应于SEQ ID NO:3的11至96位)；

-与所述序列，有利地与SEQ ID NO:3具有大于或等于90％，优选大于或等于95％或甚至99％的同一性的序列，特别是为了涵盖相应的序列，但来自另一来源，例如来自鸡、小鼠或大鼠，甚至其衍生物，只要所述序列具有相同的活性，有利地具有与例如SEQ ID NO:3相同的表达谱。

根据具体实施方案，远端区域包括上述序列的反向序列或由其组成。在本申请的框架内，反向序列是指相同的序列，但处于相反方向或反义定向。

根据一个实施方案，近端区域包括人类ACTA1基因的-153至+1区域，或由其组成。换句话说，它包括SEQ ID NO:1中所示的1848至2001位的核苷酸序列或SEQ ID NO:4中所示的39至192位的核苷酸序列，或由其组成。

根据其他实施方案，近端区域可以包括以下或由其组成：

-1848至2001位的序列SEQ ID NO:1，在5’上延伸至SEQ ID NO:1的1810位或甚至至SEQ ID NO:1的1729位，和/或在3’上延伸至SEQ ID NO:1的2027位或甚至至SEQ ID NO:1的2239位；

-与所述序列，有利地与SEQ ID NO:4具有大于或等于90％，优选大于或等于95％或甚至99％的同一性的序列，特别是为了涵盖相应的序列，但来自另一来源，例如来自鸡、小鼠或大鼠，甚至其衍生物，只要所述序列具有相同的活性，有利地具有与例如SEQ ID NO:4相同的表达谱。

根据具体实施方案，近端区域具有序列SEQ ID NO:4。

根据另一个具体实施方案，对应于SEQ ID NO:1的1848至1914位的序列以反义定向存在于近端区域。

根据另一个实施方案，根据本发明的启动子的近端区域包括人类ACTA1基因的-98至+1区域或由其组成。换句话说，它包括SEQ ID NO:1中所示的1903至2001位的核苷酸序列或SEQ ID NO:4中所示的94至192位的核苷酸序列，或由其组成。

根据本发明的一个实施方案，启动子的长度小于800、750、700个核苷酸，有利地小于650、600、550、500、450、400或350个核苷酸。在另一个特定实施方案中，启动子的尺寸至少为150、200、250或300个核苷酸。

有利地，启动子序列的尺寸在250至350个核苷酸之间，有利地在260至325个核苷酸之间。

根据具体实施方案，根据本发明的启动子包括序列SEQ ID NO:3和SEQ ID NO:4。

根据一个实施方案，根据本发明的启动子包括连接到SEQ ID NO:4的SEQ ID NO:3，即SEQ ID NO:2。

根据另一个实施方案，根据本发明的启动子包括连接到SEQ ID NO:4的SEQ IDNO:3的反向序列。

根据具体实施方案，根据本发明的启动子包括序列SEQ ID NO:2，或与SEQ ID NO:2的同一性大于或等于90％，优选大于或等于95％甚至99％的序列，或由其组成，特别是为了涵盖其衍生物，只要所述序列具有相同的活性，有利地具有与例如SEQ ID NO:2相同的表达谱。根据更具体的实施方案，根据本发明的启动子包括与SEQ ID NO:2的同一性大于或等于90％，优选大于或等于91％、或92％、或93％、或94％、或95％、或96％、或97％、或98％、或99％的序列，或由其组成。

与SEQ ID NO:2的同一性大于或等于90％的序列特别涵盖：

-相应的序列，但来自另一来源，例如来自鸡、小鼠或大鼠；

-SEQ ID NO:2在5’上延长或截短多达10个核苷酸和/或在3’上延长或截短，例如在SEQ ID NO:2的298位结束。

根据本发明，启动子是肌源性启动子，有利地是肌肉特异性启动子，即在肌肉中，有利地在骨骼肌中的活性高于任何其他组织或器官，特别是心脏。有利地，根据本发明的启动子确保或允许在骨骼肌中的表达水平高于心脏。

换句话说，并且特别是在肌营养不良症方面，本发明的启动子可以允许：

-在靶组织中，有利地在骨骼肌中，以及可能在心脏中以治疗上可接受的水平表达目的蛋白；但

-与靶组织中，特别是骨骼肌中的表达水平相比，所述蛋白在心脏中的表达水平足够，以避免任何潜在的心脏毒性(即在治疗上可接受的水平)。

在本申请的框架内，靶组织被定义为该蛋白将在其中发挥治疗作用的组织或器官，特别是在编码该蛋白的天然基因有缺陷的情况下。根据本发明的特定实施方案，靶组织包括横纹骨骼肌，以下称为骨骼肌，即所有参与运动能力的肌肉和膈肌，可能还有平滑肌。靶骨骼肌的非限制性实例是胫骨前肌(TA)、腓肠肌、比目鱼肌、四头肌、腰肌、三角肌、膈肌、臀肌、长伸肌(EDL)、肱二头肌、......。如上所述，并在一些肌营养不良症方面，心脏也可以是靶组织，但其中蛋白质的水平或活性过高可能会有毒性。

在本发明的背景中，术语“治疗上可接受的水平”是指所产生的蛋白质有助于改善患者的病理状况(特别是在生活质量或寿命方面)的事实。因此，与影响骨骼肌的疾病有关，这涉及改善受疾病影响的受试者的肌肉状况或恢复与健康受试者相似的肌肉表型。肌肉状态主要由肌肉的力量、尺寸、组织学和功能定义，可以通过本领域已知的不同方法进行评估，例如活检，测量肌肉的力量、肌张力、体积或活动性，临床检查，医学成像，生物标志物等。

因此，有助于评估骨骼肌方面的治疗益处并且可以在治疗后的不同时间进行评估的标准特别是以下中的至少一种：

-预期寿命的增加；

-肌肉力量的增加；

-组织学的改善；和/或

-膈肌功能的改善。

在本发明的背景中，术语“毒性上可接受的水平”是指由表达系统产生的蛋白质不会导致组织的显著改变(特别是在组织学、生理学和/或功能上)的事实。特别是，蛋白质的表达可能不是致命的。可以从组织学、生理学和功能上评估组织中的毒性。

在心脏方面，蛋白质的任何毒性可以通过对形态和心脏功能的研究，通过临床检查、电生理学、成像、生物标志物、预期寿命的监测或通过组织学分析，包括检测纤维化和/或细胞浸润和/或炎症，例如通过用天狼猩红(sirius red)或苏木精(例如苏木精-伊红-萨弗兰(Hematoxyline-Eosin-Saffran,HES)或苏木精-根皮红-萨弗兰(Hematoxyline-Phloxin-Saffron,HFS))染色进行评估。

根据具体实施方案，根据本发明的启动子的表达谱可以通过计算表达基因在骨骼肌中，例如在TA肌中的量与表达基因在心脏中的量之间的比率来评估。有利地，该比率(骨骼肌中的相对活性与心脏中的相对活性)优于或等于1、5、10，或甚至20、30、40、50、60、70、80、90或甚至100。

对与本发明的启动子可操作地连接的基因产生的蛋白质量的评估可以通过使用针对所述蛋白质的抗体进行免疫检测来进行，例如通过蛋白质印迹或ELISA，或通过质谱法。或者，相应的信使RNA可以被定量，例如通过PCR或RT-PCR。这种定量可以在一个组织样品或几个样品上进行。因此，在靶组织是骨骼肌的情况下，可以对一种肌肉类型或几种肌肉类型(例如四头肌、膈肌、胫骨前肌、三头肌等)进行。

有利地，本发明的启动子在骨骼肌中的活性高于参照结蛋白启动子(有利地是序列SEQ ID NO:5)。换句话说，有利地，在本发明的启动子控制下可操作地连接的任何转基因的肌肉表达水平比所述转基因与结蛋白启动子可操作地连接时获得的肌肉表达水平要高。

有利地，本发明的启动子在心脏中的活性低于参照结蛋白启动子(有利地是序列SEQ ID NO:5)。换句话说，有利地，在本发明的启动子控制下可操作地连接的任何转基因的心脏表达水平比所述转基因与结蛋白启动子可操作地连接时获得的心脏表达水平要低。

因此，根据本发明的启动子在骨骼肌中显示出非常高的活性。此外，它避免了与其他可用的在骨骼肌中具有高活性的启动子相关的潜在心脏毒性。

根据另一个实施方案，根据本发明的启动子允许在非靶组织中低表达，即在与启动子可操作地连接的转基因所编码的蛋白质没有治疗效果或所述蛋白质没有天然表达的组织中。如上所述，有利地，骨骼肌和可能的心脏不被视为非靶组织。相反，肝脏、肾脏、大脑和肾上腺可以被视为非靶组织。

根据另一个具体实施方案，根据本发明的启动子在非靶组织，特别是肝脏、肾脏和肾上腺中的活性低于在骨骼肌中的活性，并且可能低于在心脏中的活性。

根据另一方面，本发明涉及一种包含如上所述的启动子的核酸。

根据另一方面，本发明涉及一种表达系统，其包含置于上述启动子控制下的目的基因或转基因。

在本发明的框架内，表达系统通常被定义为允许在体内产生目的基因的多核苷酸，可能是蛋白质。根据一个方面，所述系统包括编码所述蛋白质的核酸，也称为转基因，以及根据本发明的至少一个启动子。然后，所述表达系统可以对应于表达盒。或者，所述表达盒可以由载体或质粒携带。如本文所用，“表达系统”一词涵盖所有方面。

合适地，本发明的表达系统包括如上定义的启动子，该启动子管理编码蛋白质的序列的转录，优选置于所述序列的5’处并与之功能连接。优选地，这确保了该蛋白在骨骼肌和心脏中的治疗上可接受的表达水平，以及在心脏中的毒性上可接受的水平，如上文所定义。

根据一个实施方案，本发明的表达系统包括编码目的蛋白，有利地是在骨骼肌和可能在心脏中具有治疗活性的蛋白质的序列，其对应于转基因。在本发明的背景中，术语“转基因”是指使用本发明的表达系统反式提供的序列，优选是开放阅读框。治疗活性的概念如上文中与术语“治疗上可接受的水平”有关的定义。

根据特定实施方案，该序列是存在于被引入表达系统的身体基因组中的内源性序列的拷贝、与之相同或等同。

根据另一个实施方案，内源性序列有一个或多个突变，使蛋白质部分或完全无功能，甚至不存在(缺乏内源性蛋白质的表达或活性)，或不能正确定位在所需的亚细胞区室中。换句话说，本发明的表达系统旨在被施用于具有编码蛋白质的序列的缺陷拷贝并具有相关病理学的受试者。在这种情况下，由本发明的表达系统携带的序列所编码的蛋白质因此可以被定义为一种蛋白质，其突变导致例如肌营养不良症。

如前所述，根据本发明的启动子可用于生产任何目的蛋白，特别是任何治疗性蛋白质。

特别令人感兴趣的是根据本发明的启动子在专门用于治疗神经肌肉疾病，特别是肌营养不良症的表达系统中的使用。

下面列举了参与相关神经肌肉遗传性病症的突变基因的实例，然后是可置于根据本发明的启动子控制下的基因的实例：

肌营养不良症

/>

/>

先天性肌营养不良症

/>

/>

先天性肌病

/>

远端肌病

/>

其他肌病

/>

肌强直综合征

/>

离子通道肌肉疾病

恶性高热症

代谢性肌病

/>

其他神经肌肉病症

/>

在一些实施方案中，基因疗法的靶基因(加成基因疗法或基因编辑)是负责上文列出的肌营养不良症之一的基因，特别是DMD或BMD(DMD基因)；LGMD(DNAJB6、FKRP CAPN3、DYSF、SGCG、SCCA、SGCB、SGCD、ANO5基因及其他)。

根据具体实施方案并在肌营养不良症方面，转基因可以编码选自由以下组成的组的蛋白质：肌营养不良蛋白(包括微小肌营养不良蛋白(microdystrophin)、迷你肌营养不良蛋白(minidystrophin)、类似肌营养不良蛋白(quasidystrophin))、HSP-40同源物B6、钙蛋白酶3、dysferlin(DYSF)、肌糖(α、β、γ、δ)、FKRP(Fukutin相关蛋白)和Anoctamin5。

根据更具体的实施方案，目的基因编码钙蛋白酶3蛋白，有利地是人钙蛋白酶3，更有利地是序列SEQ ID NO:8。

编码所述蛋白质的序列，也被命名为ORF，代表“开放阅读框”，是核酸序列或多核苷酸，特别是可以是单链或双链DNA(脱氧核糖核酸)、RNA(核糖核酸)或cDNA(互补脱氧核糖核酸)。

有利地，所述序列或转基因编码功能性蛋白质，即能够确保其天然或基本功能的蛋白质，特别是在骨骼肌中。这意味着使用本发明的表达系统产生的蛋白质是正确表达和定位的，并且是有活性的。

根据优选实施方案，所述序列编码天然蛋白质，所述蛋白质优选为人类来源。它也可以是该蛋白质的衍生物或片段，只要该衍生物或片段保留了所需的活性。优选地，术语“衍生物”或“片段”是指与天然人类序列具有至少50％，优选60％，甚至更优选70％或甚至80％、85％、90％、95％、96％、97％、98％或99％同一性的蛋白质序列。其他来源(非人类哺乳动物等)的蛋白质或截短的、或甚至突变的但有活性的蛋白质例如也包括在内。因此，在本发明的背景中，术语“蛋白质”被理解为全长的蛋白质，无论其来源如何，以及其功能衍生物和片段。

如前所述，根据一个具体实施方案，根据本发明的在骨骼肌中具有高活性并在心脏中具有低活性的启动子在非靶组织中，例如在肝脏、大脑或肾脏中没有活性或具有低活性......如前所述。或者，根据本发明的表达系统进一步包括一个序列，该序列允许通过阻止、减少或抑制其在非靶组织或在编码的蛋白质可能有毒的组织，例如心脏中的表达，通过稳定编码目的蛋白如治疗性蛋白质的mRNA，来控制目的治疗性转基因的表达。这些序列包括，例如，沉默子(例如组织特异性沉默子)、microRNA靶序列、内含子和多腺苷酸化信号。

在本发明的背景中，术语“阻止表达”优选是指甚至在没有所述序列的情况下没有表达的情况，而术语“降低表达水平”是指通过提供所述序列来降低(或减少)表达的情况。

有利地，所述序列能够阻止转基因在组织中的表达或降低其表达水平，其中蛋白质表达是不感兴趣的或可能是有毒的。这种作用可以根据各种机制发生，特别是：

-关于编码蛋白质的序列的转录水平；

-关于编码蛋白质的序列的转录所产生的转录物，例如，通过它们的降解；

-关于转录本翻译成蛋白质。

这样的序列优选是例如选自以下组中的小RNA分子的靶标：

-microRNA；

-内源性小干扰RNA或siRNA；

-转运RNA(tRNA)的小片段；

-基因间区域的RNA；

-核糖体RNA(rRNA)；

-小核RNA(snRNA)；

-小核仁RNA(snoRNA)；

-与piwi蛋白相互作用的RNA(piRNA)。

有利地，这种序列对转基因在靶组织中，特别是在骨骼肌中的表达没有负面影响。

优选地，这样的序列是根据其在组织中的有效性来选择的，其中蛋白质的表达没有治疗活性或具有毒性。由于该序列的有效性可能因组织而异，因此可能需要组合这些序列中的几个，根据它们在所述组织中的有效性选择。

根据优选实施方案，该序列是microRNA(miRNA)的靶序列。众所周知，这种明智选择的序列有助于特异性抑制选定组织中的基因表达。

因此，根据特定实施方案，本发明的表达系统进一步包括在组织中表达或存在的microRNA(miRNA)的靶序列，在这些组织中，蛋白质的表达没有治疗活性和/或具有毒性。合适地，存在于靶组织，特别是骨骼肌中的这种miRNA的数量少于存在于转基因无用或甚至有毒的组织中的数量，或者这种miRNA甚至可能不在靶组织中表达。根据特定实施方案，靶miRNA在骨骼肌中不表达，并且可能在心脏中也不表达。

如本领域技术人员已知的，miRNA的存在或表达水平(特别是在给定组织中)可以通过PCR(优选通过RT-PCR)或通过Northern印迹来评估。

不同的miRNA以及它们的靶序列和它们的组织特异性对于本领域技术人员来说是已知的，并且例如在文件WO 2007/000668中进行了描述。在肝脏中表达的miRNA是例如miR-122。

根据特定实施方案，并且在不希望在心脏中表达转基因的情况下，根据本发明的表达系统可以包括一个或多个在心脏中表达的miRNA如miR208a的靶序列的拷贝。根据具体实施方案，这种靶序列也可以串联使用。

例如，可能的miR208a的靶序列对应于SEQ ID NO:7的3411至3432或3439至3460位核苷酸。然而，可以使用其任何能够与miR208a结合的衍生物。

根据本发明，表达系统包括存在的转基因的表达所需的元件。除了像上面定义的那些确保和调节转基因表达的序列外，这样的系统还可以包括其他序列，例如：

-用于稳定转录本的序列，例如编码人β球蛋白(HBB2)的基因的内含子2/外显子3(经修饰的)。有利地，所述内含子的后面是共有Kozak序列(GCCACC)，包括在mRNA内的AUG起始密码子之前，以改善翻译的启动；

-多腺苷酸化信号，例如目的基因的polyA、SV40或β血红蛋白(HBB2)的polyA，有利地是在转基因的3’处；

-增强子序列。

可以将根据本发明的表达系统引入细胞、组织或身体中，特别是人类中。以本领域技术人员已知的方式，可以离体或体内进行引入，例如通过转染或转导。根据另一方面，本发明因此包含优选人类来源的细胞或组织，其包含本发明的表达系统。这样的表达系统或细胞可用于体外生产编码的蛋白质。

根据本发明的表达系统，即分离的核酸，可以在受试者中施用，即以裸DNA的形式。为了促进这种核酸向细胞中的引入，它可以与不同的化学方法相结合，例如胶体分散系统(大分子复合物、纳米胶囊、微球、珠粒)或基于脂质的系统(水包油乳液、胶束、脂质体)。

或者，根据优选实施方案，本发明的表达系统包含质粒或载体。有利地，这样的载体是病毒载体。通常用于哺乳动物(包括人类)中的基因疗法的病毒载体是本领域技术人员已知的。这样的病毒载体优选选自以下列表：源自疱疹病毒的载体、杆状病毒载体、慢病毒载体、逆转录病毒载体、腺病毒载体和腺相关病毒载体(AAV)。

根据本发明的具体实施方案，包含表达系统的病毒载体是腺相关病毒(AAV)载体。

腺相关病毒(AAV)载体已成为治疗各种病症的强大的基因递送工具。AAV载体具有许多使其理想地适合基因疗法的特征，包括致病性的缺乏、中等免疫原性以及以稳定和有效的方式转导有丝分裂后的细胞和组织的能力。通过选择AAV血清型、启动子和递送方法的适当组合，可以将AAV载体中包含的特定基因的表达特异性靶向至一种或多种类型的细胞。

在一个实施方案中，编码序列包含在AAV载体中。已知有100多种天然存在的AAV血清型。AAV衣壳中存在许多天然变体，允许鉴定和使用具有特别适合营养不良病理的特性的AAV。可以使用传统的分子生物学技术对AAV病毒进行工程化，从而可以优化这些颗粒以用于核酸序列的细胞特异性递送、最小化免疫原性、调节稳定性和颗粒寿命、有效降解、准确递送至细胞核。

如上所述，AAV载体的使用是DNA外源递送的常见模式，因为它相对无毒，可提供有效的基因转移，并且可以轻松针对特定目的进行优化。在从人类或非人类灵长类动物(NHP)分离并良好表征的AAV血清型中，人类血清型2是第一个被开发为基因转移载体的AAV。目前使用的其他AAV血清型包括AAV1、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAVrh10、AAVrh74、AAV11、AAV12及其变体。此外，非天然的工程化的变体和嵌合AAV也可以有用。

用于组装成载体的理想AAV片段包括cap蛋白(包括vp1、vp2、vp3和高变区)、rep蛋白(包括rep 78、rep 68、rep 52和rep 40)以及编码这些蛋白质的序列。这些片段可以很容易地用于各种载体系统和宿主细胞。

这样的片段可以单独使用，与其他AAV血清型序列或片段组合使用，或与来自其他AAV或非AAV病毒序列的元件组合使用。如本文所用，人工AAV血清型包括但不限于具有非天然存在的衣壳蛋白的AAV。这样的人工衣壳可以通过任何合适的技术产生，使用所选的AAV序列(例如，vp1衣壳蛋白的片段)与异源序列相结合，所述异源序列可以从所选的不同AAV血清型、相同AAV血清型的非连续部分、非AAV病毒来源或非病毒来源获得(即其衣壳包括源自至少两种不同AAV血清型的VP衣壳蛋白，或包括至少一个嵌合VP蛋白，其结合源自至少两种AAV血清型的VP蛋白区域或结构域)。人工AAV血清型可以是但不限于嵌合AAV衣壳、重组AAV衣壳或“人源化”AAV衣壳。此外，可以在所述衣壳中引入肽(P)，例如引入cap基因的可变区域中，可能来改变AAV的趋向性。

在一个实施方案中，可用于本文所述的组合物和方法的载体至少包含编码所选AAV血清型衣壳(例如AAV8衣壳)的序列或其片段。在另一个实施方案中，有用的载体至少包含编码所选AAV血清型rep蛋白(例如AAV8 rep蛋白)的序列或其片段。任选地，这样的载体可以同时包含AAV cap和rep蛋白。在同时提供AAV rep和cap的载体中，AAV rep和AAV cap序列都可以是一种血清型来源，例如，所有AAV8来源。或者，可以使用其中rep序列来自AAV血清型的载体，其不同于提供cap序列的载体。在一个实施方案中，rep和cap序列从不同的来源(例如，不同的载体，或宿主细胞和载体)表达。在另一个实施方案中，这些rep序列在框内融合至不同AAV血清型的cap序列以形成嵌合AAV载体。在一些实施方案中，AAV载体包括源自不同血清型的AAV的基因组和衣壳。

因此，示例性的AAV或人工AAV包括AAV2/8(US 7,282,199)、AAV2/5(可从美国国立卫生研究院获得)、AAV2/9(WO2005/033321)、AAV2/6(US 6,156,303)、AAVrh10(WO2003/042397)、AAVrh74(WO2003/123503)、AAV9-rh74杂合体或AAV9-rh74-P1杂合体(WO2019/193119；WO2020/200499；EP20306005.8).

根据一个实施方案，AAV是血清型2、5、8或9，或AAVrh74。有利地，所述载体包括选自由以下组成的组的衣壳：AAV8衣壳、AAV9衣壳、AAV9-rh74衣壳和AAV9-rh74-P1衣壳。

在本发明使用的AAV载体中，AAV基因组可以是单链(ss)核酸或双链(ds)/自互补(sc)核酸分子。

有利地，目的基因或转基因被插入到AAV载体的ITR(“反转末端重复”)序列之间。通常，ITR序列来自AAV2或AAV9，有利地是AAV2。

重组病毒颗粒可以通过本领域技术人员已知的任何方法获得，例如通过单纯疱疹病毒系统和杆状病毒系统共转染293HEK细胞。载体滴度通常表示为每毫升病毒基因组(vg/mL)。

在一个实施方案中，载体包括调节序列，其包括如上所述的根据本发明的启动子。

在编码序列SEQ ID NO:8的多核苷酸方面，本发明的载体可以包括序列SEQ IDNO:7所示的序列。

根据具体实施方案，本发明的表达系统对应于AAV9-rh74-P1杂合体，有利地如EP20306005.8中所公开，携带的序列含有以下：

-根据本发明的启动子，有利地是序列SEQ ID NO:2；或与SEQ ID NO:2的同一性大于或等于90％的序列；

-编码钙蛋白酶3的序列，有利地是序列SEQ ID NO:8，置于所述启动子控制下；

-mir208a的至少一个靶序列，可能是两个串联的靶序列，位于编码钙蛋白酶3的序列的3’处。

根据另一个具体实施方案，本发明的表达系统对应于AAV9-rh74-P1杂合体，有利地如EP20306005.8中所公开，携带的序列含有以下：

-mir208a的一个靶序列，位于编码钙蛋白酶3的序列的3’处。

根据优选实施方案，本发明的表达系统包括具有适当趋向性的载体，在这种情况下，对靶组织，有利地是骨骼肌和心脏，比对不希望表达蛋白质的组织具有更高的趋向性。

本发明的进一步的方面涉及：

-如上所公开的包含本发明的表达系统的细胞或包含所述表达系统的载体。

细胞可以是任何类型的细胞，即原核细胞或真核细胞。细胞可用于载体的增殖或可以进一步引入(例如移植)到宿主或受试者中。可以通过本领域已知的任何方式将表达系统或载体引入细胞中，例如通过转化、电穿孔或转染。也可以使用源自细胞的囊泡。

-如上所公开的包含本发明的表达系统的转基因动物(有利地是非人类)、包含所述表达系统的载体、或包含所述表达系统或所述载体的细胞。

本发明的另一方面涉及一种包含如上所公开的表达系统、载体或细胞的组合物用作药物。

根据一个实施方案，组合物至少包含所述基因治疗产物(表达系统、载体或细胞)，以及可能的其他专门用于治疗同一种疾病或另一种疾病的活性分子(其他基因治疗产物、化学分子、肽、蛋白质......)。

根据具体实施方案，根据本发明的表达系统的使用与抗炎药物如皮质激素类的使用相结合。

本发明然后提供包含本发明的表达系统、载体或细胞的药物组合物。这样的组合物包含治疗有效量的治疗剂(本发明的表达系统或载体或细胞)以及药学上可接受的载体。在具体实施方案中，术语“药学上可接受的”是指由联邦或州政府的监管机构批准或在美国或欧洲药典或其他公认的用于动物和人类的药典中列出。术语“载体”是指与治疗剂一起施用的稀释剂、佐剂、赋形剂或溶媒。这样的药物载体可以是无菌液体，例如水和油，包括石油、动物、植物或合成来源的那些，例如花生油、大豆油、矿物油、芝麻油等。当药物组合物被静脉内施用时，水是优选的载体。盐水溶液和右旋糖和甘油水溶液也可以用作液体载体，特别是用于可注射溶液。合适的药物赋形剂包括淀粉、葡萄糖、乳糖、蔗糖、硬脂酸钠、单硬脂酸甘油酯、滑石粉、氯化钠、脱脂奶粉、甘油、丙二醇、水、乙醇等。

如果需要，组合物还可以含有少量的润湿剂或乳化剂或pH缓冲剂。这些组合物可以采取溶液、悬浮液、乳液、缓释制剂等形式。合适的药物载体的实例在E.W.Martin的“Remington’s Pharmaceutical Sciences”中进行了描述。这样的组合物将包含治疗有效量的治疗剂，优选以纯化形式，以及合适量的载体，以便为受试者提供适当施用的形式。

在优选实施方案中，根据常规程序将组合物配制为适合于向人静脉内施用的药物组合物。通常，用于静脉内施用的组合物是无菌等渗水性缓冲液中的溶液。必要时，组合物还可以包括增溶剂和局部麻醉剂，例如利多卡因，以缓解注射部位的疼痛。

在一个实施方案中，根据本发明的组合物适用于在人类中施用。组合物优选为液体形式，有利地为盐水组合物，更有利地为磷酸盐缓冲盐水(PBS)组合物或林格(Ringer)-乳酸溶液。

可以通过标准临床技术确定将有效治疗目标疾病的本发明治疗剂(即表达系统或载体或细胞)的量。此外，可任选地采用体内和/或体外测定来帮助预测最佳剂量范围。制剂中使用的精确剂量还取决于施用途径，所考虑的个体的身体特征，如性别、年龄和体重，同时服用的药物，其他因素以及疾病的严重程度，应根据从业者的判断和每位患者的情况来决定。

合适的施用应该允许将治疗有效量的基因治疗产物递送至靶组织，尤其是骨骼肌和可能的心脏。在本发明的背景中，当基因治疗产物是病毒载体时，治疗剂量被定义为向每千克(kg)受试者施用的含有转基因的病毒颗粒的数量(对于病毒基因组是vg)。

在治疗包括向受试者施用病毒载体如AAV载体的情况下，典型的载体剂量为每公斤体重至少1x10⁸个载体基因组(vg/kg)，例如至少1x10⁹ vg/kg、至少1x10¹⁰ vg/kg、至少1x10¹¹ vg/kg、至少1x10¹² vg/kg、至少1x10¹³ vg/kg、至少1x10¹⁴vg/kg、至少10¹⁵vg/kg。具体来说，剂量可以在5.10¹¹vg/kg和10¹⁴vg/kg之间，例如1、2、3、4、5、6、7、8或9.10¹³vg/kg。为了避免潜在的毒性和/或免疫反应，也可以考虑较低的剂量，例如1、2、3、4、5、6、7、8或9.10¹²vg/kg。正如技术人员所知道的那样，就效率而言，尽可能低的剂量能产生令人满意的结果是优选的。

可用的施用途径是局部、肠内(全系统作用，但通过胃肠道(GI)递送)或肠胃外(全身作用，但通过胃肠道以外的途径递送)。本文公开的组合物的优选施用途径是肠胃外，包括肌内施用(即进入肌肉)和全身施用(即进入循环系统)。在该背景中，术语“注射”(或“灌注”或“输注”)涵盖血管内，特别是静脉内(IV)、肌内(IM)、眼内、鞘内或脑内施用。通常使用注射器或导管进行注射。

在一个实施方案中，组合物的全身递送包括在局部治疗部位附近施用组合物，即在虚弱的肌肉附近的静脉或动脉中。在某些实施方案中，本发明包括组合物的局部递送，其产生全身作用。这种施用途径(通常称为“局部(限于局部)输注”、“通过孤立(isolated)肢体灌注施用”或“高压经静脉肢体灌注”)已成功用作肌营养不良症的基因递送方法。

根据一个方面，通过输注或灌注将组合物施用于孤立肢体(限于局部)。换句话说，本发明包括在压力下通过血管内施用途径(即静脉(经静脉)或动脉)在腿和/或手臂中局部递送组合物。这通常通过使用止血带暂时阻止血液循环同时允许注入产物的局部扩散来实现，例如Toromanoff等人(2008)披露的。

在一个实施方案中，将组合物注射到受试者的肢体中。当受试者是人时，肢体可以是手臂或腿。根据一个实施方案，组合物在受试者身体的下部(例如膝盖以下)或在受试者身体的上部(例如肘部以下)施用。

根据本发明的优选施用方法是全身施用。全身注射开辟了注射整个身体以到达受试者身体的整个肌肉(包括心脏和膈肌)以及然后真正治疗这些全身性的且仍然无法治愈的疾病的途径。在某些实施方案中，全身递送包括将组合物递送至受试者，使得组合物可遍及受试者的身体。

根据优选实施方案，全身施用通过在血管中注射组合物进行，即血管内(静脉内或动脉内)施用。根据一个实施方案，组合物通过外周静脉通过静脉注射施用。

在具体实施方案中，治疗包括组合物的单次施用。

这样的组合物主要旨在用于受试者的基因治疗，特别是用于治疗由于上述鉴定的蛋白质的缺乏而导致的疾病，特别是神经肌肉疾病和肌营养不良症。因此，通过基因编辑或基因替换，在受影响患者的肌肉细胞中提供正确的基因版本，这可能有助于对下面列出的疾病的有效治疗。

在一些实施方案中，本发明的药物组合物用于治疗肌肉疾病(即肌病)或肌肉损伤，特别是没有肝脏损伤的神经肌肉遗传性病症，例如：肌营养不良症、先天性肌营养不良症、先天性肌病、远端肌病、其他肌病、肌强直综合征、离子通道肌肉疾病、恶性高热症、代谢性肌病和其他神经肌肉病症，有利地是肌营养不良症、先天性肌营养不良症、先天性肌病、远端肌病和其他肌病。

肌营养不良症尤其包括：

-抗肌萎缩蛋白病(dystrophinopathies)，是由编码肌营养不良蛋白的DMD基因的致病变体引起的一系列X连锁肌肉疾病。抗肌萎缩蛋白病包括杜氏肌营养不良症(DMD)、贝克肌营养不良症(BMD)和DMD相关的扩张型心肌病；

-肢带型肌营养不良症(LGMD)，它是一组临床上与DMD相似的病症，但由于常染色体隐性和常染色体显性遗传而发生在男女两性身上。肢带型肌营养不良症是由编码肌糖和其他与肌肉细胞膜有关的蛋白质的基因突变引起的，这些蛋白质与肌营养不良蛋白相互作用。术语LGMD1是指显示显性遗传(常染色体显性)的基因类型，而LGMD2是指常染色体隐性遗传的类型。已经报道了超过50个基因座处的致病变体(LGMD1A至LGMD1H；LGMD2A至LGMD2Y)。

-钙蛋白病(calpainopathy,LGMD2A)是由基因CAPN3的突变引起的，描述了超过450个致病变体。

这类疾病的非限制性列表包括：中央核肌病，有利地是X连锁肌管性肌病(XLMTM)和Charcot-Marie-Tooth病，肢带型肌营养不良症，有利地是LGMD2A、LGMD2B、LGMD2D或LGMD2I、LGMD1D、LGMD2L，先天性肌营养不良症1C型(MDC1C)，Walker-Warburg综合征(WWS)，肌-眼-脑疾病(MEB)，杜氏(DMD)或贝克(BMD)肌营养不良症，先天性肌营养不良症伴硒蛋白N缺乏症、先天性肌营养不良症伴原发性分区蛋白缺乏症、Ullrich先天性肌营养不良症、中央核先天性肌病、多小核先天性肌病、中央核常染色体肌病、纤维比例失调性肌病、线粒体肌病、先天性肌无力综合征、miyoshi远端肌病、dysferlinopathies、抗肌萎缩相关糖蛋白病(dystroglycanopathies)和肌聚糖病(sarcoglycanopathies)。在一些实施方案中，本发明的药物组合物用于治疗杜氏(DMD)或贝克(BMD)肌营养不良症、先天性肌营养不良症、肢带型肌营养不良症，有利地是LGMD2A、LGMD2B、LGMD2D、LGMD2I、LGMD1D或LGMD2L。

基因编辑的具体实例是治疗肢带型肌营养不良症2A(LGMD2A)，其是由钙蛋白酶-3基因(CAPN3)的突变引起。其他实例是治疗DMD基因的突变。

可以从本发明的组合物受益的受试者包括所有被诊断患有此类疾病或有患上此类疾病的风险的患者。然后可以通过本领域技术人员已知的任何方法(包括例如所述基因的测序)基于编码上面列出的蛋白质的基因中的突变或缺失的鉴定，和/或通过本领域技术人员已知的任何方法评估蛋白表达水平或活性，来选择待治疗的受试者。因此，所述受试者包括已经表现出这种疾病的症状的受试者和有患上所述疾病的风险的受试者。在一个实施方案中，所述受试者包括已经表现出此类疾病的症状的受试者。在另一个实施方案中，所述受试者是能走动的患者和早期不能走动的患者。

更一般的和根据进一步的实施方案，根据本发明的表达系统对以下情况是有用的：

-增加受试者的肌肉力量、肌肉耐力和/或肌肉质量；

-减少受试者的纤维化；

-减少受试者中收缩引起的损伤；

-治疗受试者的肌营养不良症；

-减少患有肌营养不良症的受试者的退化纤维或坏死纤维；

-减少患有肌营养不良症的受试者的炎症；

-降低患有肌营养不良症的受试者中肌酸激酶(或任何其他营养不良标志物)的水平；

-治疗患有肌营养不良症的受试者的肌纤维萎缩和肥大；

-减少患有肌营养不良症的受试者的营养不良性钙化；

-减少受试者的脂肪浸润；

-减少受试者的中心成核现象。

根据一个实施方案，本发明涉及一种治疗此类病况的方法，其包括向受试者施用上文公开的基因治疗产物(表达系统、载体或细胞)。

有利地，表达系统在体内全身施用，特别是在动物中，有利地在哺乳动物中并且更优选在人类中。

除非另有说明，本发明的实践采用分子生物学(包括重组技术)、微生物学、细胞生物学、生物化学和免疫学的常规技术，这些技术完全在本领域技术人员的视界内。此类技术在文献中得到了充分解释，例如“Molecular Cloning:A Laboratory Manual”,fourthedition(Sambrook,2012)；“Oligonucleotide Synthesis”(Gait,1984)；“Culture ofAnimal Cells”(Freshney,2010)；“Methods in Enzymology”“Handbook of ExperimentalImmunology”(Weir,1997)；“Gene Transfer Vectors for Mammalian Cells”(Miller andCalos,1987)；“Short Protocols in Molecular Biology”(Ausubel,2002)；“PolymeraseChain Reaction:Principles,Applications and Troubleshooting”,(Babar,2011)；“Current Protocols in Immunology”(Coligan,2002)。这些技术适用于本发明的多核苷酸和多肽的生产，因此可以在制备和实践本发明时被考虑。用于特定实施方案的特别有用的技术将在以下部分中讨论。

本文引用的每篇专利、专利申请和出版物的公开内容均通过引用整体并入本文。

在没有进一步描述的情况下，相信本领域的普通技术人员可以使用前面的描述和下面的说明性实施例来制备和利用本发明的化合物并实施要求保护的方法。

实验性实施例

参考下面的实验性实施例和附图对本发明作进一步详细描述。提供这些实施例仅用于说明目的，并不旨在进行限制。

具体地，结合AAV9载体对本发明进行了说明，该载体包括置于与人结蛋白启动子相比的根据本发明的截短的ACTA1启动子(注意是ACTA1)控制下的转基因。

材料和方法：

动物模型

动物研究是根据欧洲现行的关于动物护理和实验的法规(2010/63/EU)进行的，并得到了法国Evry的Centre d’Exploration et de Recherche Fonctionnelle Expérimentale的机构伦理委员会的批准(协议APAFIS DAP 2018-024-B#19736)。C57Bl6白化病小鼠是向Charles River机构订购的。

表达盒和AAV介导的基因转移

使用AAV2 ITR序列、融合转基因GFP-荧光素酶和SV40聚腺苷酸化序列设计了两种不同的AAV盒。启动子是构建体之间唯一不同的元件。在这项研究中，比较了人结蛋白(Des)启动子(SEQ ID NO:5)和本发明的截短的ACTA1启动子(SEQ ID NO:2)。使用三转染法将血清型9用于生产GFP-Luc重组腺相关病毒(AAV9-启动子-GFP-Luc)。包括ITR序列的相应序列显示在SEQ ID NO:6中，与截短的ACTA1启动子有关。

还设计了另外两个AAV盒，使用相同的启动子，但具有人钙蛋白酶3转基因和：

-AAV9 ITR序列；

-在启动子和转基因之间插入的HBB2内含子；

-在转基因和HBB2聚腺苷酸化序列之间串联插入的mir208a的两个靶序列。

使用三转染法将血清型9用于生产重组钙蛋白酶3腺相关病毒(AAV9-启动子-hCalpain3-2x靶标-miR208a)。包括ITR序列的相应序列显示在SEQ ID NO:7中，与截短的ACTA1启动子有关。

不同的载体通过单次全身施用在雄性1月龄的C57Bl6白化病小鼠或C57Bl6小鼠的尾静脉中注射，以分别表达GFP-Luc转基因或产生人钙蛋白酶3。在5e13vg/kg的AAV9-启动子-GFP-Luc或在1e14vg/kg的AAV9-启动子-hCalpain3-2x靶标-miR208a时，注射的载体剂量按小鼠体重进行归一化。用AAV9-启动子-GFP-Luc治疗两周后，通过活体动物的荧光素酶成像来评估全身的生物分布。用AAV9-启动子-GFP-Luc和AAV9-启动子-hCalpain3-2x靶标-miR208a分别治疗三周或四周后，处死小鼠并收集组织。胫骨前(TA)肌被选为代表性骨骼肌。

用荧光素酶测定对荧光素酶活性进行定量

首先用500μL测定缓冲液(Tris/磷酸盐，25mM；甘油15％；DTT，1mM；EDTA 1mM；MgCl2 8mM)和0.2％的Triton X-100以及蛋白酶抑制剂混合物PIC(罗氏)将样品匀浆。将10μL裂解液装入白色不透明的96孔板的平底孔中。Enspire分光光度计被用来对发光进行定量。泵送系统将D-荧光素(167μM；Interchim)和含有ATP(40nM)(Sigma-Aldrich)的测定缓冲液递送到板的每个孔中。在每次分配D-荧光素和ATP后，测量相对光单位(RLU)的信号，每个样品之间有2秒的延迟。进行BCA蛋白定量(Thermo Scientific)，以使每个样品中的蛋白量归一化。结果表示为按蛋白量进行归一化的RLU水平。

全身的生物分布

通过吸入异氟醚对小鼠进行麻醉，腹腔注射50mg/ml D-荧光素(LifeTechnologies，加利福尼亚，美国)。使用

Lumina成像系统(PerkinElmer)进行体内成像。使用软件Living/>

(PerkinElmer)来分析图像。

mRNA定量

按照NucleoZOL协议的

RNASet(Macherey Nagel)从冷冻组织中进行总RNA提取。提取的RNA在60μl的无RNase水中洗脱，并用Free DNA试剂盒(Ambion)处理以除去残留的DNA。使用Nanodrop分光光度计(ND8000Labtech)对总RNA进行定量。

为了对转基因的表达进行定量，使用RevertAid H minus逆转录酶试剂盒(ThermoFisher Scientific)和随机寡核苷酸和oligo-dT的混合物对1μg的RNA进行逆转录。使用LightCycler480(罗氏)进行实时PCR，使用特定的引物和探针组(Thermo FisherScientific)来对人钙蛋白酶3进行定量：

FWD：5’-CGCCTCCAAGGCCCGT-3’(SEQ ID NO:9)

REV：5’-GGCGGAAGCGCTGGCT-3’(SEQ ID NO:10)，和

探针：5’-CTACATCAACATGAGAGAGGT-3’(SEQ ID NO:11)。

对于小鼠样品，Rplp0被用来对各样品的数据进行归一化：

FWD：5’-ctccaagcagatgcagcaga-3’(SEQ ID NO:12)

REV：5’-atagccttgcgcatcatggt-3’(SEQ ID NO:13)，和

探针：5’-ccgtggtgctgatgggcaagaa-3’(SEQ ID NO:14)。

每个实验都是一式两份进行。定量周期(Cq)值用

480SW 1.5.1使用第2次导数最大值法计算。以原始Cq表示的RT-qPCR结果被归一化到Rplp0。使用2^-ΔCt方法计算相对表达。

蛋白质印迹分析

将大约1mm的组织(心脏和TA肌)的冷冻切片溶解在含有蛋白酶抑制剂混合物的放射免疫沉淀测定(RIPA)缓冲液中。对于钙蛋白酶3，将1mg组织与40μl尿素缓冲液(8M尿素，2M硫脲，3％ SDS，50mM Tris-HCl pH6.8，0.03％溴酚蓝pH6.8，50％超纯甘油+蛋白酶抑制剂混合物(100X)Sigma P8340)和40μl甘油混合。蛋白质提取物通过BCA(二辛可宁酸)蛋白质测定(Pierce)进行定量。使用钙蛋白酶3抗体(CALP-12A2(Leica Biosystem)；COP-COP-080049(Cosmo Bio))对30μg的总蛋白进行蛋白质印迹分析。二抗的荧光信号在Odyssey成像系统上读取，并通过Odyssey应用软件(LI-COR Biosciences，2.1版本)测量带强度。

统计分析

统计分析使用GraphPad Prism版本6.04(GraphPad Software，San Diego，CA)进行。所有实验的统计分析都是通过ANOVA进行的。数据以平均值±SD表示。小于0.05的P值被认为是统计学显著的。

结果

I/使用报告基因GFP-Luc比较新启动子与结蛋白启动子的表达谱：

在四只一月龄的雄性C57Bl6白化病小鼠的尾静脉中注射5e13vg/kg的AAV9-启动子-GFP-Luc两周后，用IVIS系统在活体动物中通过荧光素酶成像来评估全身的生物分布。

两种启动子的全身生物分布显示是不同的(图1A)。事实上，荧光素酶成像显示，与结蛋白启动子相比，截短的ACTA1启动子在四肢肌肉中的信号更强，而在胸部的信号则更低。

在第21天，处死小鼠。需要指出的是，在结蛋白启动子组中发现一只小鼠死亡。在截短的ACTA1启动子组中没有观察到死亡。

对取样的肌肉和器官中的荧光素酶活性进行生化测量，然后将其归一化为每个样品中的蛋白质量。与结蛋白启动子相比，截短的ACTA1启动子在骨骼肌中的荧光素酶活性水平较高(见TA和膈肌)，而在心脏中较低(图1B)。在其他分析的器官，即肝脏、肾脏和肾上腺中没有观察到变化。

总之，这些结果表明，与使用结蛋白启动子相比，根据本发明的截短的ACTA1启动子的使用导致骨骼肌中转基因表达水平较高，而心肌中水平较低。II/使用钙蛋白酶3转基因验证了新启动子与结蛋白启动子相比的表达谱：

为了验证这些观察结果，并确认截短的ACTA1启动子适用于例如驱动人钙蛋白酶3转基因的表达，对C57Bl6雄性小鼠(每组2或3只)静脉注射rAAV(AAV9-启动子-hCalpain3-2x靶标-miR208a)，剂量为1e14 vg/kg。注射4周后，动物被安乐死。对肌肉和心脏进行取样以进行分子分析。

钙蛋白酶3的表达是在mRNA水平上测量的(图2A)。与结蛋白启动子相比，截短的ACTA1启动子的钙蛋白酶3mRNA水平在胫骨前肌(TA)中较高，在心脏中较低。

还测量了钙蛋白酶3蛋白的水平(图2B)。与结蛋白启动子相比，截短的ACTA1启动子在TA肌中的钙蛋白酶3水平更高。以一种预期的方式，两个启动子在心脏中都没有钙蛋白酶3蛋白的表达，因为两个靶序列的盒中都存在miR208a。

结论

所有这些结果表明，与结蛋白启动子相比，根据本发明的小尺寸的截短的ACTA1启动子导致转基因在骨骼肌中的表达水平较高，而在心脏中的表达水平较低。

序列表

<110> 吉尼松公司

国家健康与医学研究院

埃夫里-瓦尔德艾松大学

<120> 一种新的肌肉特异性启动子

<130> G143-B-57712 PCT

<150> EP20305796.3

<151> 2020-07-10

<160> 14

<170> BiSSAP 1.3.6

<210> 1

<211> 2239

<212> DNA

<213> 人工序列

<220>

<223> 人ACTA1启动子-2000至+239

<400> 1

tcaaggccca aatgtaagct agtcccctta cgttacatgc agctcatttg ctaagtggtt 60

tttttctagt atctccacta ctcgctgaca caggaggaca caggatgtta aaaaggaaat 120

acagttctgt caattattca cttactctcc aaaatacttg gaagaactaa atatggaacc 180

ataggagact ttatcctcac cgcatagtcc ctatactagt caaactcctt attttttaat 240

tgatcatttt taggaaggta gcattttatt cactagaaca tttttgttaa tacttgttta 300

tttttgggat gaactgccat gatgtgggct acagaggagg gtcgcatatg cttccatccc 360

ccttttagag aatccacacc tgtcccagtt gctgggttcc actaccaaaa gtgaattgca 420

actattttag gagcacttaa gcacatccga aaaatgagtg attctgttct ggcccacacc 480

acatcactga tgtaccccct taaagcatgt ccctgagttc atcacagaag actgctcctc 540

ctgtgccctc cacaaggtta gaactgtcct tgtcttaggg aaaaaggaga gagagagaga 600

gagagagaga gagagagaga gagagagaga gagagaggga caggcaccaa ctgggtaacc 660

tctgctgacc cccactctac tttaccataa gtagctccaa atccttctag aaaatctgaa 720

aggcatagcc ccatatatca gtgatataaa tagaacctgc agcaggctct ggtaaatgat 780

gactacaagg tggactggga ggcagcccgg ccttggcagg catcatcctc taaatataaa 840

gatgagtttg ttcagccttt gcagaaggaa aaactgccac ccatcctaga gtgccgcgtc 900

cttgtccccc caccccctcc aatttattgg gaggaaggac cagctaagcc tcatctagga 960

agagcccctc acccatctcc acctccactc caggtctagc cagtcctggg ttgtgaccct 1020

tgtctttcag ccccaggaga gggacacaca tagtgccacc aaagaggctg ggggagggcc 1080

tcagcccacc aaaacctggg gccagtgcgt cctacaggag gggaaccctc accccttcaa 1140

tccctttagg agacccaagg gcgctgcgcg tccctgaggc ggacagctcc gtgtgctcag 1200

gctttgcgcc tgacaggcct atccccggga gcccccgcgc ctcctccccg gcgctccgcc 1260

ctcgcctccc cccgccagtt gtctatcctg cgacagctgc gcgccctccg gccgccggtg 1320

gccctctgtg cggtggggga aggggtcgac gtggctcagc tttttggatt cagggagctc 1380

gggggtggga agagagaaat ggagttccag gggcgtaaag gagagggagt tcgccttcct 1440

tcccttcctg agactcagga gtgactgctt ctccaatcct cccaagccca ccactccaca 1500

cgactccctc ttcccggtag tcgcaagtgg gagtttgggg atctgagcaa agaacccgaa 1560

gaggagttga aatattggaa gtcagcagtc aggcaccttc ccgagcgccc agggcgctca 1620

gagtggacat ggttggggag gcctttggga caggtgcggt tcccggagcg caggcgcaca 1680

catgcaccca ccggcgaacg cggtgaccct cgccccaccc catcccctcc ggcgggcaac 1740

tgggtcgggt caggaggggc aaacccgcta gggagacact ccatatacgg cccggcccgc 1800

gttacctggg accgggccaa cccgctcctt ctttggtcaa cgcaggggac ccgggcgggg 1860

gcccaggccg cgaaccggcc gagggagggg gctctagtgc ccaacaccca aatatggctc 1920

gagaagggca gcgacattcc tgcggggtgg cgcggaggga atgcccgcgg gctatataaa 1980

acctgagcag agggacaagc ggccaccgca gcggacagcg ccaagtgaag cctcgcttcc 2040

cctccgcggc gaccagggcc cgagccgaga gtagcagttg tagctacccg cccaggtagg 2100

gcaggagttg ggaggggaca gggggacagg gcactaccga ggggaacctg aaggactccg 2160

gggcagaacc cagtcggttc acctggtcag ccccaggcct gcgccctgag cgctgtgcct 2220

cgtctccgga gccacacgc 2239

<210> 2

<211> 324

<212> DNA

<213> 人工序列

<220>

<223> 截短的pACTA1

<400> 2

aaaggcatag ccccatatat cagtgatata aatagaacct gcagcaggct ctggtaaatg 60

atgactacaa ggtggactgg gaggcagccc ggccttggca ggcatcgacc gggccaaccc 120

gctccttctt tggtcaacgc aggggacccg ggcgggggcc caggccgcga accggccgag 180

ggagggggct ctagtgccca acacccaaat atggctcgag aagggcagcg acattcctgc 240

ggggtggcgc ggagggaatg cccgcgggct atataaaacc tgagcagagg gacaagcggc 300

caccgcagcg gacagcgcca agtg 324

<210> 3

<211> 106

<212> DNA

<213> 人工序列

<220>

<223> 部分1截短的pACTA1 (远端)

<400> 3

aaaggcatag ccccatatat cagtgatata aatagaacct gcagcaggct ctggtaaatg 60

atgactacaa ggtggactgg gaggcagccc ggccttggca ggcatc 106

<210> 4

<211> 218

<212> DNA

<213> 人工序列

<220>

<223> 部分2截短的pACTA1 (近端)

<400> 4

gaccgggcca acccgctcct tctttggtca acgcagggga cccgggcggg ggcccaggcc 60

gcgaaccggc cgagggaggg ggctctagtg cccaacaccc aaatatggct cgagaagggc 120

agcgacattc ctgcggggtg gcgcggaggg aatgcccgcg ggctatataa aacctgagca 180

gagggacaag cggccaccgc agcggacagc gccaagtg 218

<210> 5

<211> 1061

<212> DNA

<213> 人工序列

<220>

<223> 人结蛋白启动子

<400> 5

taccccctgc cccccacagc tcctctcctg tgccttgttt cccagccatg cgttctcctc 60

tataaatacc cgctctggta tttggggttg gcagctgttg ctgccaggga gatggttggg 120

ttgacatgcg gctcctgaca aaacacaaac ccctggtgtg tgtgggcgtg ggtggtgtga 180

gtagggggat gaatcaggga gggggcgggg gacccagggg gcaggagcca cacaaagtct 240

gtgcgggggt gggagcgcac atagcaattg gaaactgaaa gcttatcaga ccctttctgg 300

aaatcagccc actgtttata aacttgaggc cccaccctcg acagtaccgg ggaggaagag 360

ggcctgcact agtccagagg gaaactgagg ctcagggcta gctcgcccat agacatacat 420

ggcaggcagg ctttggccag gatccctccg cctgccaggc gtctccctgc cctcccttcc 480

tgcctagaga cccccaccct caagcctggc tggtctttgc ctgagaccca aacctcttcg 540

acttcaagag aatatttagg aacaaggtgg tttagggcct ttcctgggaa caggccttga 600

ccctttaaga aatgacccaa agtctctcct tgaccaaaaa ggggaccctc aaactaaagg 660

gaagcctctc ttctgctgtc tcccctgacc ccactccccc ccaccccagg acgaggagat 720

aaccagggct gaaagaggcc cgcctggggg ctgcagacat gcttgctgcc tgccctggcg 780

aaggattggc aggcttgccc gtcacaggac ccccgctggc tgactcaggg gcgcaggcct 840

cttgcggggg agctggcctc cccgccccca cggccacggg ccgccctttc ctggcaggac 900

agcgggatct tgcagctgtc aggggagggg aggcgggggc tgatgtcagg agggatacaa 960

atagtgccga cggctggggg ccctgtctcc cctcgccgca tccactctcc ggccggccgc 1020

ctgcccgccg cctcctccgt gcgcccgcca gcctcgcccg c 1061

<210> 6

<211> 3319

<212> DNA

<213> 人工序列

<220>

<223> AAV9-截短的pACTA1-GFP-Luc

<400> 6

ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120

aggggttcct tgtagttaat gattaacccg ccatgctact tatctacatt aattttttgc 180

ggccgcaaag gcatagcccc atatatcagt gatataaata gaacctgcag caggctctgg 240

taaatgatga ctacaaggtg gactgggagg cagcccggcc ttggcaggca tcgaccgggc 300

caacccgctc cttctttggt caacgcaggg gacccgggcg ggggcccagg ccgcgaaccg 360

gccgagggag ggggctctag tgcccaacac ccaaatatgg ctcgagaagg gcagcgacat 420

tcctgcgggg tggcgcggag ggaatgcccg cgggctatat aaaacctgag cagagggaca 480

agcggccacc gcagcggaca gcgccaagtg gctagcgcta ccggtcgtcg cgatggtgag 540

caagggcgag gagctgttca ccggggtggt gcccatcctg gtcgagctgg acggcgacgt 600

aaacggccac aagttcagcg tgtccggcga gggcgagggc gatgccacct acggcaagct 660

gaccctgaag ttcatctgca ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac 720

caccctgacc tacggcgtgc agtgcttcag ccgctacccc gaccacatga agcagcacga 780

cttcttcaag tccgccatgc ccgaaggcta cgtccaggag cgcaccatct tcttcaagga 840

cgacggcaac tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg 900

catcgagctg aagggcatcg acttcaagga ggacggcaac atcctggggc acaagctgga 960

gtacaactac aacagccaca acgtctatat catggccgac aagcagaaga acggcatcaa 1020

ggtgaacttc aagatccgcc acaacatcga ggacggcagc gtgcagctcg ccgaccacta 1080

ccagcagaac acccccatcg gcgacggccc cgtgctgctg cccgacaacc actacctgag 1140

cacccagtcc gccctgagca aagaccccaa cgagaagcgc gatcacatgg tcctgctgga 1200

gttcgtgacc gccgccggga tcactctcgg catggacgag ctgtacaagt ccggccggac 1260

tcagatctcg agctcaagct tcgaattcga agacgccaaa aacataaaga aaggcccggc 1320

gccattctat ccgctggaag atggaaccgc tggagagcaa ctgcataagg ctatgaagag 1380

atacgccctg gttcctggaa caattgcttt tacagatgca catatcgagg tggacatcac 1440

ttacgctgag tacttcgaaa tgtccgttcg gttggcagaa gctatgaaac gatatgggct 1500

gaatacaaat cacagaatcg tcgtatgcag tgaaaactct cttcaattct ttatgccggt 1560

gttgggcgcg ttatttatcg gagttgcagt tgcgcccgcg aacgacattt ataatgaacg 1620

tgaattgctc aacagtatgg gcatttcgca gcctaccgtg gtgttcgttt ccaaaaaggg 1680

gttgcaaaaa attttgaacg tgcaaaaaaa gctcccaatc atccaaaaaa ttattatcat 1740

ggattctaaa acggattacc agggatttca gtcgatgtac acgttcgtca catctcatct 1800

acctcccggt tttaatgaat acgattttgt gccagagtcc ttcgataggg acaagacaat 1860

tgcactgatc atgaactcct ctggatctac tggtctgcct aaaggtgtcg ctctgcctca 1920

tagaactgcc tgcgtgagat tctcgcatgc cagagatcct atttttggca atcaaatcat 1980

tccggatact gcgattttaa gtgttgttcc attccatcac ggttttggaa tgtttactac 2040

actcggatat ttgatatgtg gatttcgagt cgtcttaatg tatagatttg aagaagagct 2100

gtttctgagg agccttcagg attacaagat tcaaagtgcg ctgctggtgc caaccctatt 2160

ctccttcttc gccaaaagca ctctgattga caaatacgat ttatctaatt tacacgaaat 2220

tgcttctggt ggcgctcccc tctctaagga agtcggggaa gcggttgcca agaggttcca 2280

tctgccaggt atcaggcaag gatatgggct cactgagact acatcagcta ttctgattac 2340

acccgagggg gatgataaac cgggcgcggt cggtaaagtt gttccatttt ttgaagcgaa 2400

ggttgtggat ctggataccg ggaaaacgct gggcgttaat caaagaggcg aactgtgtgt 2460

gagaggtcct atgattatgt ccggttatgt aaacaatccg gaagcgacca acgccttgat 2520

tgacaaggat ggatggctac attctggaga catagcttac tgggacgaag acgaacactt 2580

cttcatcgtt gaccgcctga agtctctgat taagtacaaa ggctatcagg tggctcccgc 2640

tgaattggaa tccatcttgc tccaacaccc caacatcttc gacgcaggtg tcgcaggtct 2700

tcccgacgat gacgccggtg aacttcccgc cgccgttgtt gttttggagc acggaaagac 2760

gatgacggaa aaagagatcg tggattacgt cgccagtcaa gtaacaaccg cgaaaaagtt 2820

gcgcggagga gttgtgtttg tggacgaagt accgaaaggt cttaccggaa aactcgacgc 2880

aagaaaaatc agagagatcc tcataaaggc caagaagggc ggaaagatcg ccgtgtaatt 2940

ctcgaagatc caccggatct agataactga tcataatcag ccataccaca tttgtagagg 3000

ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat aaaatgaatg 3060

caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa agcaatagca 3120

tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac 3180

tcatcaatgt atcttaacgc gtgtagataa gtagcatggc gggttaatca ttaactacaa 3240

ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc 3300

cgggcgacca aaggtcgcc 3319

<210> 7

<211> 4376

<212> DNA

<213> 人工序列

<220>

<223> AAV9-pACTA1-hCalpain3-2x靶标-miR208a

<400> 7

ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60

cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120

gccaactcca tcactagggg ttcctacgcg tatgcataaa ggcatagccc catatatcag 180

tgatataaat agaacctgca gcaggctctg gtaaatgatg actacaaggt ggactgggag 240

gcagcccggc cttggcaggc atcgaccggg ccaacccgct ccttctttgg tcaacgcagg 300

ggacccgggc gggggcccag gccgcgaacc ggccgaggga gggggctcta gtgcccaaca 360

cccaaatatg gctcgagaag ggcagcgaca ttcctgcggg gtggcgcgga gggaatgccc 420

gcgggctata taaaacctga gcagagggac aagcggccac cgcagcggac agcgccaagt 480

ggctagcgta cacatattga ccaaatcagg gtaattttgc atttgtaatt ttaaaaaatg 540

ctttcttctt ttaatatact tttttgttta tcttatttct aatactttcc ctaatctctt 600

tctttcaggg caataatgat acaatgtatc atgcctcttt gcaccattct aaagaataac 660

agtgataatt tctgggttaa ggcaatagca atatttctgc atataaatat ttctgcatat 720

aaattgtaac tgatgtaaga ggtttcatat tgctaatagc agctacaatc cagctaccat 780

tctgctttta ttttttggtt gggataaggc tggattattc tgagtccaag ctaggccctt 840

ttgctaatct tgttcatacc tcttatcttc ctcccacagc tcctgggcaa cgtgctggtc 900

tctgtgctgg cccatcactt tggcaaagaa ttcgccacca tgccgaccgt cattagcgca 960

tctgtggctc caaggacagc ggctgagccc cggtccccag ggccagttcc tcacccggcc 1020

cagagcaagg ccactgaggc tgggggtgga aacccaagtg gcatctattc agccatcatc 1080

agccgcaatt ttcctattat cggagtgaaa gagaagacat tcgagcaact tcacaagaaa 1140

tgtctagaaa agaaagttct ttatgtggac cctgagttcc caccggatga gacctctctc 1200

ttttatagcc agaagttccc catccagttc gtctggaaga gacctccgga aatttgcgag 1260

aatccccgat ttatcattga tggagccaac agaactgaca tctgtcaagg agagctaggg 1320

gactgctggt ttctcgcagc cattgcctgc ctgaccctga accagcacct tcttttccga 1380

gtcatacccc atgatcaaag tttcatcgaa aactacgcag ggatcttcca cttccagttc 1440

tggcgctatg gagagtgggt ggacgtggtt atagatgact gcctgccaac gtacaacaat 1500

caactggttt tcaccaagtc caaccaccgc aatgagttct ggagtgctct gctggagaag 1560

gcttatgcta agctccatgg ttcctacgaa gctctgaaag gtgggaacac cacagaggcc 1620

atggaggact tcacaggagg ggtggcagag ttttttgaga tcagggatgc tcctagtgac 1680

atgtacaaga tcatgaagaa agccatcgag agaggctccc tcatgggctg ctccattgat 1740

gatggcacga acatgaccta tggaacctct ccttctggtc tgaacatggg ggagttgatt 1800

gcacggatgg taaggaatat ggataactca ctgctccagg actcagacct cgaccccaga 1860

ggctcagatg aaagaccgac ccggacaatc attccggttc agtatgagac aagaatggcc 1920

tgcgggctgg tcagaggtca cgcctactct gtcacggggc tggatgaggt cccgttcaaa 1980

ggtgagaaag tgaagctggt gcggctgcgg aatccgtggg gccaggtgga gtggaacggt 2040

tcttggagtg atagatggaa ggactggagc tttgtggaca aagatgagaa ggcccgtctg 2100

cagcaccagg tcactgagga tggagagttc tggatgtcct atgaggattt catctaccat 2160

ttcacaaagt tggagatctg caacctcacg gccgatgctc tgcagtctga caagcttcag 2220

acctggacag tgtctgtgaa cgagggccgc tgggtacggg gttgctctgc cggaggctgc 2280

cgcaacttcc cagatacttt ctggaccaac cctcagtacc gtctgaagct cctggaggag 2340

gacgatgacc ctgatgactc ggaggtgatt tgcagcttcc tggtggccct gatgcagaag 2400

aaccggcgga aggaccggaa gctaggggcc agtctcttca ccattggctt cgccatctac 2460

gaggttccca aagagatgca cgggaacaag cagcacctgc agaaggactt cttcctgtac 2520

aacgcctcca aggcccgtag caaaacctac atcaacatga gagaggtgag ccagcgcttc 2580

cgcctgcctc ccagcgagta cgtcatcgtg ccctccacct acgagcccca ccaggagggg 2640

gaattcatcc tccgggtctt ctctgaaaag aggaacctct ctgaggaagt tgaaaatacc 2700

atctccgtgg atcggccagt gaaaaagaaa aaaaccaagc ccatcatctt cgtttcggac 2760

agagcaaaca gcaacaagga gctgggtgtg gaccaggagt cagaggaggg caaaggcaaa 2820

acaagccctg ataagcaaaa gcagtcccca cagccacagc ctggcagctc tgatcaggaa 2880

agtgaggaac agcaacaatt ccggaacatt ttcaagcaga tagcaggaga tgacatggag 2940

atctgtgcag atgagctcaa gaaggtcctt aacacagtcg tgaacaaaca caaggacctg 3000

aagacacacg ggttcacact ggagtcctgc cgtagcatga ttgcgctcat ggatacagat 3060

ggctctggaa agctcaacct gcaggagttc caccacctct ggaacaagat taaggcctgg 3120

cagaaaattt tcaaacacta tgacacagac cagtccggca ccatcaacag ctacgagatg 3180

cgaaatgcag tcaacgacgc aggattccac ctcaacaacc agctctatga catcattacc 3240

atgcggtacg cagacaaaca catgaacatc gactttgaca gtttcatctg ctgcttcgtt 3300

aggctggagg gcatgttcag agcttttcat gcatttgaca aggatggaga tggtatcatc 3360

aagctcaacg ttctggagtg gctgcagctc accatgtatg cctgacgcgt acaagctttt 3420

tgctcgtctt atcctaggac aagctttttg ctcgtcttat gcggcattca ccccaccagt 3480

gcaggctgcc tatcagaaag tggtggctgg tgtggctaat gccctggccc acaagtatca 3540

ctaagctcgc tttcttgctg tccaatttct attaaaggtt cctttgttcc ctaagtccaa 3600

ctactaaact gggggatatt atgaagggcc ttgagcatct ggattctgcc taataaaaaa 3660

catttatttt cattgcaatg atgtatttaa attatttctg aatattttac taaaaaggga 3720

atgtgggagg tcagtgcatt taaaacataa agaaatgaag agctagttca aaccttggga 3780

aaatacacta tatcttaaac tccatgaaag aaggtgaggc tgcaaacagc taatgcacat 3840

tggcaacagc cctgatgcct atgccttatt catccctcag aaaaggattc aagtagaggc 3900

ttgatttgga ggttaaagtt ttgctatgct gtattttaca ttacttattg ttttagctgt 3960

cctcatgaat gtcttttcac tacccatttg cttatcctgc atctctcagc cttgactcca 4020

ctcagttctc ttgcttagag ataccacctt tcccctgaag tgttccttcc atgttttacg 4080

gcgagatggt ttctcctcgc ctggccactc agccttagtt gtctctgttg tcttatagag 4140

gtctacttga agaaggaaaa acagggggca tggtttgact gtcctgtgag cccttcttcc 4200

ctgcctcccc cactcacagt gacccggaat caggaacccc tagtgatgga gttggccact 4260

ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg 4320

ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gagagggagt ggccaa 4376

<210> 8

<211> 821

<212> PRT

<213> 人工序列

<220>

<223> 人钙蛋白酶3

<400> 8

Met Pro Thr Val Ile Ser Ala Ser Val Ala Pro Arg Thr Ala Ala Glu

1 5 10 15

Pro Arg Ser Pro Gly Pro Val Pro His Pro Ala Gln Ser Lys Ala Thr

20 25 30

Glu Ala Gly Gly Gly Asn Pro Ser Gly Ile Tyr Ser Ala Ile Ile Ser

35 40 45

Arg Asn Phe Pro Ile Ile Gly Val Lys Glu Lys Thr Phe Glu Gln Leu

50 55 60

His Lys Lys Cys Leu Glu Lys Lys Val Leu Tyr Val Asp Pro Glu Phe

65 70 75 80

Pro Pro Asp Glu Thr Ser Leu Phe Tyr Ser Gln Lys Phe Pro Ile Gln

85 90 95

Phe Val Trp Lys Arg Pro Pro Glu Ile Cys Glu Asn Pro Arg Phe Ile

100 105 110

Ile Asp Gly Ala Asn Arg Thr Asp Ile Cys Gln Gly Glu Leu Gly Asp

115 120 125

Cys Trp Phe Leu Ala Ala Ile Ala Cys Leu Thr Leu Asn Gln His Leu

130 135 140

Leu Phe Arg Val Ile Pro His Asp Gln Ser Phe Ile Glu Asn Tyr Ala

145 150 155 160

Gly Ile Phe His Phe Gln Phe Trp Arg Tyr Gly Glu Trp Val Asp Val

165 170 175

Val Ile Asp Asp Cys Leu Pro Thr Tyr Asn Asn Gln Leu Val Phe Thr

180 185 190

Lys Ser Asn His Arg Asn Glu Phe Trp Ser Ala Leu Leu Glu Lys Ala

195 200 205

Tyr Ala Lys Leu His Gly Ser Tyr Glu Ala Leu Lys Gly Gly Asn Thr

210 215 220

Thr Glu Ala Met Glu Asp Phe Thr Gly Gly Val Ala Glu Phe Phe Glu

225 230 235 240

Ile Arg Asp Ala Pro Ser Asp Met Tyr Lys Ile Met Lys Lys Ala Ile

245 250 255

Glu Arg Gly Ser Leu Met Gly Cys Ser Ile Asp Asp Gly Thr Asn Met

260 265 270

Thr Tyr Gly Thr Ser Pro Ser Gly Leu Asn Met Gly Glu Leu Ile Ala

275 280 285

Arg Met Val Arg Asn Met Asp Asn Ser Leu Leu Gln Asp Ser Asp Leu

290 295 300

Asp Pro Arg Gly Ser Asp Glu Arg Pro Thr Arg Thr Ile Ile Pro Val

305 310 315 320

Gln Tyr Glu Thr Arg Met Ala Cys Gly Leu Val Arg Gly His Ala Tyr

325 330 335

Ser Val Thr Gly Leu Asp Glu Val Pro Phe Lys Gly Glu Lys Val Lys

340 345 350

Leu Val Arg Leu Arg Asn Pro Trp Gly Gln Val Glu Trp Asn Gly Ser

355 360 365

Trp Ser Asp Arg Trp Lys Asp Trp Ser Phe Val Asp Lys Asp Glu Lys

370 375 380

Ala Arg Leu Gln His Gln Val Thr Glu Asp Gly Glu Phe Trp Met Ser

385 390 395 400

Tyr Glu Asp Phe Ile Tyr His Phe Thr Lys Leu Glu Ile Cys Asn Leu

405 410 415

Thr Ala Asp Ala Leu Gln Ser Asp Lys Leu Gln Thr Trp Thr Val Ser

420 425 430

Val Asn Glu Gly Arg Trp Val Arg Gly Cys Ser Ala Gly Gly Cys Arg

435 440 445

Asn Phe Pro Asp Thr Phe Trp Thr Asn Pro Gln Tyr Arg Leu Lys Leu

450 455 460

Leu Glu Glu Asp Asp Asp Pro Asp Asp Ser Glu Val Ile Cys Ser Phe

465 470 475 480

Leu Val Ala Leu Met Gln Lys Asn Arg Arg Lys Asp Arg Lys Leu Gly

485 490 495

Ala Ser Leu Phe Thr Ile Gly Phe Ala Ile Tyr Glu Val Pro Lys Glu

500 505 510

Met His Gly Asn Lys Gln His Leu Gln Lys Asp Phe Phe Leu Tyr Asn

515 520 525

Ala Ser Lys Ala Arg Ser Lys Thr Tyr Ile Asn Met Arg Glu Val Ser

530 535 540

Gln Arg Phe Arg Leu Pro Pro Ser Glu Tyr Val Ile Val Pro Ser Thr

545 550 555 560

Tyr Glu Pro His Gln Glu Gly Glu Phe Ile Leu Arg Val Phe Ser Glu

565 570 575

Lys Arg Asn Leu Ser Glu Glu Val Glu Asn Thr Ile Ser Val Asp Arg

580 585 590

Pro Val Lys Lys Lys Lys Thr Lys Pro Ile Ile Phe Val Ser Asp Arg

595 600 605

Ala Asn Ser Asn Lys Glu Leu Gly Val Asp Gln Glu Ser Glu Glu Gly

610 615 620

Lys Gly Lys Thr Ser Pro Asp Lys Gln Lys Gln Ser Pro Gln Pro Gln

625 630 635 640

Pro Gly Ser Ser Asp Gln Glu Ser Glu Glu Gln Gln Gln Phe Arg Asn

645 650 655

Ile Phe Lys Gln Ile Ala Gly Asp Asp Met Glu Ile Cys Ala Asp Glu

660 665 670

Leu Lys Lys Val Leu Asn Thr Val Val Asn Lys His Lys Asp Leu Lys

675 680 685

Thr His Gly Phe Thr Leu Glu Ser Cys Arg Ser Met Ile Ala Leu Met

690 695 700

Asp Thr Asp Gly Ser Gly Lys Leu Asn Leu Gln Glu Phe His His Leu

705 710 715 720

Trp Asn Lys Ile Lys Ala Trp Gln Lys Ile Phe Lys His Tyr Asp Thr

725 730 735

Asp Gln Ser Gly Thr Ile Asn Ser Tyr Glu Met Arg Asn Ala Val Asn

740 745 750

Asp Ala Gly Phe His Leu Asn Asn Gln Leu Tyr Asp Ile Ile Thr Met

755 760 765

Arg Tyr Ala Asp Lys His Met Asn Ile Asp Phe Asp Ser Phe Ile Cys

770 775 780

Cys Phe Val Arg Leu Glu Gly Met Phe Arg Ala Phe His Ala Phe Asp

785 790 795 800

Lys Asp Gly Asp Gly Ile Ile Lys Leu Asn Val Leu Glu Trp Leu Gln

805 810 815

Leu Thr Met Tyr Ala

820

<210> 9

<211> 16

<212> DNA

<213> 人工序列

<220>

<223> FWD hcalpain3

<400> 9

cgcctccaag gcccgt 16

<210> 10

<211> 16

<212> DNA

<213> 人工序列

<220>

<223> REV hcalpain3

<400> 10

ggcggaagcg ctggct 16

<210> 11

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 探针hcalpain3

<400> 11

ctacatcaac atgagagagg t 21

<210> 12

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> FWD Rplp0

<400> 12

ctccaagcag atgcagcaga 20

<210> 13

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> REV Rplp0

<400> 13

atagccttgc gcatcatggt 20

<210> 14

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 探针Rplp0

<400> 14

ccgtggtgct gatgggcaag aa 22

Claims

1.一种启动子，其包含：

-序列SEQ ID NO:2；或

-与SEQ ID NO:2的同一性大于或等于90％的序列。

2.根据权利要求1所述的启动子，其中其尺寸不超过350个核苷酸。

3.根据权利要求1或2所述的启动子，其中它确保在骨骼肌中的表达水平高于在心脏中的表达水平。

4.根据权利要求1至3中任一项所述的启动子，其中它包含序列SEQ ID NO:2或由其组成。

5.一种表达系统，其包含根据权利要求1至4中任一项所述的启动子，以及有利地置于所述启动子控制下的转基因。

6.根据权利要求5所述的表达系统，其中所述转基因编码选自由以下组成的组的蛋白质：肌营养不良蛋白(包括微小肌营养不良蛋白、迷你肌营养不良蛋白、类似肌营养不良蛋白)、HSP-40同源物B6、钙蛋白酶3、dysferlin、肌糖(α、β、γ、δ)、FKRP(Fukutin相关蛋白)和Anoctamin5。

7.根据权利要求6所述的表达系统，其中所述钙蛋白酶3蛋白具有序列SEQ ID NO:8。

8.根据权利要求5至7中任一项所述的表达系统，其中它进一步包含至少一个选自由以下组成的组的另外的序列：

-用于稳定转录本的序列，有利地是编码人β球蛋白(HBB2)的基因的内含子；

-多腺苷酸化信号，有利地是目的基因的polyA、SV40或β血红蛋白(HBB2)的polyA；

-增强子序列；和

-microRNA的靶序列。

9.根据权利要求8所述的表达系统，其中它进一步包含miR208a的至少一个靶序列。

10.根据权利要求5至9中任一项所述的表达系统，其中它包含病毒载体，有利地是腺相关病毒载体(AAV)，优选血清型8或9，更有利地具有选自由以下组成的组的衣壳：AAV8衣壳、AAV9衣壳、AAV9-rh74衣壳和AAV9-rh74-P1衣壳。

11.一种药物组合物，其包含根据权利要求5至10中任一项所述的表达系统。

12.根据权利要求5至10中任一项所述的表达系统或根据权利要求11所述的药物组合物，用于基因疗法。

13.根据权利要求5至10中任一项所述的表达系统或根据权利要求11所述的药物组合物，用于治疗神经肌肉疾病，有利地是肌营养不良症。

14.根据权利要求13所述的表达系统或药物组合物，其中所述疾病选自由以下组成的组：肌营养不良症、先天性肌营养不良症、先天性肌病、远端肌病、其他肌病、肌强直综合症、离子通道肌肉疾病、恶性高热症、代谢性肌病和其他神经肌肉病症，有利地是杜氏(DMD)或贝克(BMD)肌营养不良症和肢带型肌营养不良症，优选LGMD2A、LGMD2B、LGMD2D、LGMD2I、LGMD1D、LGMD2L。

15.根据权利要求13或14所述的表达系统或药物组合物，其中它全身施用，优选通过静脉注射。