CN116234916A

CN116234916A - Csrp3(富含半胱氨酸和甘氨酸的蛋白质3)基因疗法

Info

Publication number: CN116234916A
Application number: CN202180057650.8A
Authority: CN
Inventors: C·D·赫尔佐格; C·B·萨克拉门多; R·普拉巴卡尔; D·里克斯
Original assignee: Spaceship Seven LLC
Current assignee: Spaceship Seven LLC
Priority date: 2020-08-05
Filing date: 2021-08-03
Publication date: 2023-06-06
Also published as: MX2023000994A; US20230257431A1; AU2021321410A1; BR112023001336A2; KR20230042468A; IL300187A; JP2023536618A; WO2022031756A1; EP4192962A1; CA3184983A1

Abstract

本文提供了例如使用腺相关病毒(AAV)载体对与心肌病相关联的CSRP3(富含半胱氨酸和甘氨酸的蛋白质3)‑相关基因缺陷的基因疗法。载体的启动子可以是MHCK7启动子或心肌肌钙蛋白T(HTNNT2)启动子。衣壳可以是AAV9或AAVrh74衣壳或其功能变体。可以使用其他启动子或衣壳。还提供了治疗方法，如通过rAAV载体的静脉内、冠状动脉内、颈动脉内或心内施用，以及其他组合物和方法。

Description

CSRP3(富含半胱氨酸和甘氨酸的蛋白质3)基因疗法

相关申请的交叉引用

本申请要求2020年8月5日提交的美国申请号63/061,727的优先权，该申请的内容通过引用整体并入本文。

关于序列表的声明

与本申请相关联的序列表以文本格式提供，代替纸质副本，并在此通过引用并入本说明书中。包含序列表的文本文件名称为ROPA_020_01WO_ST25.txt。该文本文件约为120KB，创建于2021年8月3日，经由EFS-Web以电子方式提交。

背景技术

富含半胱氨酸和甘氨酸的蛋白质3(CSRP3)编码肌肉LIM蛋白(MLP)。CSRP3中的遗传缺陷与常染色体显性心肌病(肥厚型心肌病(HCM)和扩张型心肌病(DCM)两者)相关联，因为蛋白质的不同结构域中的常染色体显性突变与不同的表型相关。降低MLP水平的功能丧失突变可导致蛋白质错误定位和蛋白酶体介导的降解，从而导致心肌和骨骼肌中正常信号传导通路的破坏。MLP水平或细胞内定位的变化也与骨骼肌病相关联，包括面肩胛肱型肌营养不良症、线状体肌病和2B型肢带型肌营养不良症。在2A型肢带型肌营养不良症、Duchenne型肌营养不良症和皮肌炎患者中已检测到同种型MLP-b蛋白水平的变化或MLP:MLP-b比率的失调。

CSRP3患者表现出取决于特定突变的不同症状，但一般症状包括阻塞性HCM或DCM、心室肥大(室间隔在14-32mm的范围内)、室性心动过速、运动不耐受、心绞痛。I-II的轻度NYHA(纽约心脏协会)得分是常见的。已观察到心脏性猝死，例如在携带C58G突变的家族中。在一项研究中，大多数提供肌肉活检的C58G携带者在就诊时抱怨劳力性肌痛和痉挛。

对于CSRP3相关疾病或病症的治疗存在未满足的需求。本文提供的基因疗法解决了这一需求。

发明内容

本发明大体上涉及使用表达MLP或其功能变体的载体对疾病或病症例如心脏疾病或病症的基因疗法。

在一个方面，本公开提供了包含表达盒和任选地侧接腺相关病毒(AAV)反向末端重复序列(ITR)的多核苷酸，其中所述多核苷酸包含可操作地连接至启动子的编码肌肉LIM蛋白(MLP)或其功能变体的多核苷酸序列。

在一些实施方案中，启动子为心脏特异性启动子。

在一些实施方案中，启动子为肌肉特异性启动子。

在一些实施方案中，启动子为心肌细胞特异性启动子。

在一些实施方案中，启动子为MHCK7启动子。

在一些实施方案中，MHCK7启动子与SEQ ID NO:31具有至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的同一性。

在一些实施方案中，启动子为心肌肌钙蛋白T(hTNNT2)启动子。

在一些实施方案中，hTNNT2启动子与SEQ ID NO:32具有至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的同一性。

在一些实施方案中，表达盒包含心肌肌钙蛋白T(hTNNT2)基因的外显子1，其中任选地hTNNT2启动子和外显子1一起与SEQ ID NO:32具有至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的同一性。

在一些实施方案中，启动子为泛在启动子(ubiquitous promoter)，任选地CMV启动子或CAG启动子。

在一些实施方案中，表达盒包含polyA信号。

在一些实施方案中，polyA信号为人生长激素(hGH)polyA。

在一些实施方案中，表达盒包含土拨鼠肝炎病毒转录后调控元件(WPRE)，任选地WPRE(x)。

在一些实施方案中，肌肉LIM蛋白(MLP)或其功能变体为MLP。

在一些实施方案中，MLP为人MLP。

在一些实施方案中，MLP为MLP同种型A。

在一些实施方案中，MLP与SEQ ID NO:1具有至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的同一性。

在一些实施方案中，MLP为MLP同种型B。

在一些实施方案中，MLP与SEQ ID NO:2具有至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的同一性。

在一些实施方案中，MLP与SEQ ID NO:3具有至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的同一性。

在一些实施方案中，MLP与SEQ ID NO:4具有至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的同一性。

在一些实施方案中，编码MLP的多核苷酸序列为富含半胱氨酸和甘氨酸的蛋白质3(CSRP3)多核苷酸。

在一些实施方案中，CSRP3多核苷酸为人CSRP3多核苷酸。

在一些实施方案中，编码MLP的多核苷酸序列与SEQ ID NO:5具有至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的同一性。

在一些实施方案中，编码MLP的多核苷酸序列与SEQ ID NO:7具有至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的同一性。

在一些实施方案中，多核苷酸包含至少约2.4kb、至多约2.6kb、或约2.4kb至约2.6kb之间。

在一些实施方案中，多核苷酸包含至少约3.0kb、至多约3.3kb、或约3.0kb至约3.3kb之间。

在一些实施方案中，多核苷酸包含至少约2.4kb、至少约2.6kb、至少约3.0kb、至少约3.3kb、至少约3.5kb、至少约3.7kb、至少约3.9kb、至少约4.1kb、或至少约4.3kb。

在一些实施方案中，多核苷酸包含至少约2.6kb、至少约3.0kb、至多约3.3kb、至多约3.5kb、至多约3.7kb、至多约3.9kb、至多约4.1kb、至多约4.3kb、或至多约4.5kb。

在一些实施方案中，表达盒与SEQ ID NO:8-11中的任何一个具有至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的同一性。

在一些实施方案中，多核苷酸与SEQ ID NO:12-15中的任何一个具有至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的同一性。

在一些实施方案中，表达盒侧接5'和3'反向末端重复序列(ITR)，任选地AAV2ITR，任选地与SEQ ID NO:20-26中的任何一个具有至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的同一性的ITR。

在一些实施方案中，多核苷酸是自互补的。

在一些实施方案中，多核苷酸包含表达盒和表达盒的反向补体。

在一些实施方案中，表达盒和表达盒的反向补体侧接5'和3'反向末端重复序列(ITR)，任选地AAV2 ITR，任选地与SEQ ID NO:23或SEQ ID NO:26具有至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的同一性的ITR。

在另一个方面，本公开提供了一种包含本公开的多核苷酸的基因疗法载体。

在一些实施方案中，基因疗法载体为重组腺相关病毒(rAAV)载体。

在一些实施方案中，rAAV载体为AAV9或其功能变体。

在一些实施方案中，rAAV载体包含与SEQ ID NO:77中的任何一个具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的同一性的衣壳蛋白。

在一些实施方案中，rAAV载体为AAVrh10或其功能变体。

在一些实施方案中，rAAV载体包含与SEQ ID NO:79中的任何一个具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的同一性的衣壳蛋白。

在一些实施方案中，rAAV载体为AAV6或其功能变体。

在一些实施方案中，rAAV载体包含与SEQ ID NO:78中的任何一个具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的同一性的衣壳蛋白。

在一些实施方案中，rAAV载体为AAVrh74或其功能变体。

在一些实施方案中，rAAV载体包含与SEQ ID NO:80中的任何一个具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的同一性的衣壳蛋白。

在一些实施方案中，rAAV载体为自互补的AAV载体。

在另一个方面，本公开提供了一种在有此需要的受试者中治疗和/或预防疾病或病症的方法，其包括向受试者施用本公开的载体。

在一些实施方案中，疾病或病症为心脏病症。

在一些实施方案中，疾病或病症为心力衰竭。

在一些实施方案中，疾病或病症为肥厚型心肌病。

在一些实施方案中，疾病或病症为扩张型心肌病。

在一些实施方案中，受试者为哺乳动物。

在一些实施方案中，受试者为灵长类动物。

在一些实施方案中，受试者为人。

在一些实施方案中，相对于编码具有SEQ ID NO:1序列的人MLP的人CSRP3，受试者在CSRP3基因中具有引起选自C58G、L44P、S54R、E55G和/或K69R的氨基酸取代的突变。

在一些实施方案中，载体通过静脉内注射、心内注射、心内输注和/或心导管插入术来施用。

在一些实施方案中，施用使MLP表达增加至少约5％。

在一些实施方案中，施用使MLP表达增加至少约30％。

在一些实施方案中，施用使MLP表达增加至少约70％。

在一些实施方案中，施用使MLP表达增加约5％至约10％。

在一些实施方案中，施用使MLP表达增加约30％至约50％。

在一些实施方案中，施用使MLP表达增加约70％至约100％。

在一些实施方案中，所述方法治疗和/或预防所述疾病或病症。

在另一个方面，本公开提供了一种药物组合物，其包含本公开的载体。

在另一个方面，本公开提供了一种试剂盒，其包含本公开的载体或药物组合物和任选地使用说明书。

在另一个方面，本公开提供了本公开的组合物用于任选地根据本文公开的任何方法治疗疾病或病症的用途。

在另一个方面，本公开提供了用于任选地根据本文公开的任何方法治疗疾病或病症的本公开组合物。

在另一个方面，本公开提供了一种表达肌肉LIM蛋白(MLP)或其功能变体的方法，其包括使细胞与本公开的载体接触。

在一些实施方案中，细胞为心肌细胞。

在一些实施方案中，心肌细胞为人心肌细胞。

在一些实施方案中，启动子为MHCK7启动子并且其中MLP的表达水平比用具有hTNNT2启动子的载体转导的细胞中MLP的表达水平高至少2倍。

在一些实施方案中，启动子为MHCK7启动子并且其中MLP的表达水平比用具有hTNNT2启动子的载体转导的细胞中MLP的表达水平高2倍至高10倍。

下面的详细描述中公开了各种其他方面和实施方案。本发明仅受所附权利要求书的限制。

附图说明

图1示出了载体基因组的一个非限制性实例的载体图。该载体基因组的完整多核苷酸序列为SEQ ID NO:12。大写部分为表达盒(SEQ ID NO:8)。

图2示出了载体基因组的一个非限制性实例的载体图。该载体基因组的完整多核苷酸序列为SEQ ID NO:13。大写部分为表达盒(SEQ ID NO:9)。

图3示出了载体基因组的一个非限制性实例的载体图。该载体基因组的完整多核苷酸序列为SEQ ID NO:14。大写部分为表达盒(SEQ ID NO:10)。

图4示出了载体基因组的一个非限制性实例的载体图。该载体基因组的完整多核苷酸序列为SEQ ID NO:15。大写部分为表达盒(SEQ ID NO:11)。

图5A示出了在转导的CHO-Lec2中的CSRP3表达。

图5B示出了在转导的心肌细胞(分化的AC16细胞系-Sigma-

目录号SCC109)中的CSRP3表达。用来自每个载体的3E5 MOI转导细胞；6天后，收集细胞裂解物，并使用抗-CSRP3多克隆抗体(Thermo-/>

PA5-29155 1:1000)进行蛋白质印迹法。/>

具体实施方式

本公开提供了用于递送编码MLP的多核苷酸的CSPRP3的基因疗法载体，以及使用方法，及其他组合物和方法。CSPRP3-相关病症的治疗因大多数形式的CSPRP3-相关病症的常染色体显性性质而复杂化，并且证据表明蛋白质表达的水平和MLP同种型之间的平衡对于健康受试者的正常功能至关重要。此外，成功的心脏基因疗法是不可预测的。心肌细胞是基因疗法靶向的一种特别具有挑战性的细胞类型。本文公开的组合物和方法解决了这个问题。

定义

章节标题仅用于组织目的，而不应解释为将所描述的主题限制于特定的方面或实施方案。

除非另有定义，否则本文使用的所有技术和科学术语具有与本发明所属领域普通技术人员通常所理解相同的含义。下文将描述合适的方法和材料，但在本发明的实践中可使用与本文描述的那些类似或等同的方法和材料。本文提及的所有出版物、专利申请、专利和其他参考文献明确地通过引用整体并入。在发生冲突的情况下，以本说明书(包括定义)为准。另外，本文描述的材料、方法和实例仅是示意性的而不旨在限制。

本文中提到的所有出版物和专利在此通过引用整体并入，犹如每个个别出版物或专利被具体地和单独地指出通过引用并入。在发生冲突的情况下，以本申请(包括其中的任何定义)为准。然而，本文引用的任何参考文献、文章、出版物、专利、专利公开和专利申请的提及均不是也不应被视为是承认或任何形式的暗示它们构成有效的现有技术或形成世界上任何国家的公知常识的一部分。

在本说明书中，除非另有指明，否则任何浓度范围、百分比范围、比率范围或整数范围均应理解为包括在所述及的范围内的任何整数的值，并在适当时包括其分数(例如，整数的十分之一和百分之一)。术语“约”，当紧接在数字或数值之前时，意指加或减10％的数字或数值范围。应理解，除非另有指明，否则如本文所用，术语“一种(a/an)”是指所列举的组分中的“一种或多种”。备选词(例如，“或”)的使用应理解为表示备选项中的一个、两个或其任何组合。术语“和/或”应理解为意指备选项中的一个或两个。如本文所用，术语“包括”和“包含”同义地使用。

如本文所用，关于多肽或多核苷酸序列，术语“同一性”和“相同”是指在该“查询”序列与“主题”序列的比对中精确匹配残基的百分比，如由BLAST算法生成的比对。除非另有说明，否则在主题序列的全长上计算同一性。因此，如果在将查询序列与主题序列比对时，查询序列与主题序列“具有至少x％的同一性”，则主题序列中至少x％(向下四舍五入)的残基被比对为与查询序列中的对应残基精确匹配。在主题序列具有可变位置(例如，表示为X的残基)时，与查询序列中任何残基的比对被计为匹配。

如本文所用，“AAV载体”或“rAAV载体”是指包含一种或多种侧接AAV末端重复序列(ITR)的目的多核苷酸(或转基因)的重组载体。当存在于已用编码和表达rep和cap基因产物的质粒转染的宿主细胞中时，此类AAV载体可被复制和包装成感染性病毒颗粒。或者，可使用已经稳定工程化以表达rep和cap基因的宿主细胞将AAV载体包装成感染性颗粒。

如本文所用，“AAV病毒体”或“AAV病毒颗粒”或“AAV载体颗粒”是指由至少一种AAV衣壳蛋白和衣壳化多核苷酸AAV载体组成的病毒颗粒。如本文所用，如果颗粒包含异源多核苷酸(即，非野生型AAV基因组的多核苷酸，如待递送至哺乳动物细胞的转基因)，则其通常被称为“AAV载体颗粒”或简称为“AAV载体”。因此，AAV载体颗粒的产生必然包括AAV载体的产生，因为这样的载体包含在AAV载体颗粒内。

如本文所用，“启动子”是指能够促进从真核细胞中的多核苷酸开始RNA转录的多核苷酸序列。

如本文所用，“载体基因组”是指由载体(例如，rAAV病毒体)包装的多核苷酸序列，包括侧接序列(在AAV中，反向末端重复序列)。术语“表达盒”和“多核苷酸盒”是指侧接ITR序列之间的载体基因组的部分。“表达盒”意指载体基因组包含至少一个编码基因产物的基因，该基因产物可操作地连接至驱动表达的元件(例如，启动子)。

如本文所用，术语“有需要的患者”或“有需要的受试者”是指有患上适合于用本文公开的重组基因疗法载体或基因编辑系统治疗或改善的疾病、病症或病患的风险或者正罹患适合于用本文公开的重组基因疗法载体或基因编辑系统治疗或改善的疾病、病症或病患的患者或受试者。有需要的患者或受试者可以是例如被诊断患有与心脏相关联的病症的患者或受试者。受试者可能在CSRP3基因中具有突变或具有CSRP3基因的全部或部分的缺失，这会引起MLP蛋白的异常表达。“受试者”和“患者”在本文中可互换地使用。通过本文描述的方法治疗的受试者可以是成人或儿童。受试者的年龄可以不等。

如本文所用，术语“变体”或“功能变体”可互换地指与保留亲本蛋白质的一种或多种所需活性的亲本蛋白质相比具有一个或多个氨基酸取代、插入或缺失的蛋白质。

如本文所用，“遗传破坏”是指基因中功能的部分或完全丧失或异常活性。例如，受试者可能遭受CSRP3基因中表达或功能的遗传破坏，所述遗传破坏在受试者的至少一些细胞(例如，心脏细胞)中降低MLP蛋白的表达或者导致MLP蛋白的丧失或异常功能。

如本文所用，“治疗”是指改善疾病或病症的一种或多种症状。术语“预防”是指延迟或中断疾病或病症的一种或多种症状的发作或者减慢CSRP3-相关疾病或病症例如肥厚型心肌病(HCM)、扩张型心肌病(DCM)或骨骼肌病的进展。

MLP蛋白或多核苷酸

本公开涵盖与肌肉LIM蛋白(MLP)蛋白有关的组合物和使用方法。已知CSRP3中的各种突变与肥厚型心肌病(HCM)或扩张型心肌病(DCM)相关联。已观察到遗传性突变和新生突变。在一些情况下，杂合错义突变足以引起疾病。

MLP的多肽序列为如下：

MPNWGGGAKCGACEKTVYHAEEIQCNGRSFHKTCFHCMACRKALDSTTVAAHESEIYCKVCYGRRYGPKGIGYGQGAGCLSTDTGEHLGLQFQQSPKPARSVTTSNPSKFTAKFGESEKCPRCGKSVYAAEKVMGGGKPWHKTCFRCAICGKSLESTNVTDKDGELYCKVCYAKNFGPTGIGFGGLTQQVEKKE

(SEQ ID NO:1)。

MLP的第二同种型具有以下多肽序列：MPNWGGGAKCGACEKTVYHAEEIQCNGRSFHKTCFHCSPQSRHAQLPPATLPNSLRSLESPRSALDVASQSMLLRRLWEVASLGTRPVSAVPSVGRVWSPQMSLTKMGNFIAKFAMPKILAPRVLGLEALHNKWKRKNEEVRRFSDFLRA

(SEQ ID NO:2)。

MLP的另一同种型具有以下多肽序列：

MPNWGGGAKCGACEKTVYHAEEIQCNGRSFHKTCFHCLC

(SEQ ID NO:3)。

MLP的另一同种型具有以下多肽序列：

MPNWGGGAKCGACEKTVYHAEEIQCNGRSFHKTCFHCTLAQDLFP LCHLWEESGVHKC

(SEQ ID NO:4)。

在一些实施方案中，MLP蛋白包含与SEQ ID NO:1-4中的任何一个至少75％、80％、85％、90％、92％、93％、94％、95％、96％、97％、98％、99％或100％相同的多肽序列。

在一些实施方案中，本公开提供了一种重组腺相关病毒(rAAV)病毒体，其包含衣壳和载体基因组，其中所述载体基因组包含可操作地连接至启动子的编码MLP或其功能变体的多核苷酸序列。在一些实施方案中，本公开提供了一种重组腺相关病毒(rAAV)病毒体，其包含衣壳和载体基因组，其中所述载体基因组包含可操作地连接至启动子的编码MLP的多核苷酸序列。编码MLP的多核苷酸可以包含与以下至少75％、80％、85％、90％、92％、93％、94％、95％、96％、97％、98％、99％或100％相同的多核苷酸序列：

ATGCCAAACTGGGGCGGAGGCGCAAAATGTGGAGCCTGTGAAAAGACCGTCTACCATGCAGAAGAAATCCAGTGCAATGGAAGGAGTTTCCACAAGACGTGTTTCCACTGCATGGCCTGCAGGAAGGCTCTTGACAGCACGACAGTCGCGGCTCATGAGTCGGAGATCTACTGCAAGGTGTGCTATGGGCGCAGATATGGCCCCAAAGGGATCGGGTATGGACAAGGCGCTGGCTGTCTCAGCACAGACACGGGCGAGCATCTCGGCCTGCAGTTCCAACAGTCCCCAAAGCCGGCACGCTCAGTTACCACCAGCAACCCTTCCAAATTCACTGCGAAGTTTGGAGAGTCCGAGAAGTGCCCTCGATGTGGCAAGTCAGTCTATGCTGCTGAGAAGGTTATGGGAGGTGGCAAGCCTTGGCACAAGACCTGTTTCCGCTGTGCCATCTGTGGGAAGAGTCTGGAGTCCACAAATGTCACTGACAAAGATGGGGAACTTTATTGCAAAGTTTGCTATGCCAAAAATTTTGGCCCCACGGGTATTGGGTTTGGAGGCCTTACACAACAAGTGGAAAAGAAAGAA

(SEQ ID NO:5)。

任选地，编码载体基因组的多核苷酸序列可以包含Kozak序列，包括但不限于GCCACCATGG(SEQ ID NO:6)。Kozak序列可以与编码MLP蛋白或其功能变体的多核苷酸序列重叠。例如，载体基因组可以包含与以下至少75％、80％、85％、90％、92％、93％、94％、95％、96％、97％、98％、99％或100％相同的多核苷酸序列(Kozak加有下划线)：

gccaccATGCCAAACTGGGGCGGAGGCGCAAAATGTGGAGCCTGTGAAAAGACCGTCTACCATGCAGAAGAAATCCAGTGCAATGGAAGGAGTTTCCACAAGACGTGTTTCCACTGCATGGCCTGCAGGAAGGCTCTTGACAGCACGACAGTCGCGGCTCATGAGTCGGAGATCTACTGCAAGGTGTGCTATGGGCGCAGATATGGCCCCAAAGGGATCGGGTATGGACAAGGCGCTGGCTGTCTCAGCACAGACACGGGCGAGCATCTCGGCCTGCAGTTCCAACAGTCCCCAAAGCCGGCACGCTCAGTTACCACCAGCAACCCTTCCAAATTCACTGCGAAGTTTGGAGAGTCCGAGAAGTGCCCTCGATGTGGCAAGTCAGTCTATGCTGCTGAGAAGGTTATGGGAGGTGGCAAGCCTTGGCACAAGACCTGTTTCCGCTGTGCCATCTGTGGGAAGAGTCTGGAGTCCACAAATGTCACTGACAAAGATGGGGAACTTTATTGCAAAGTTTGCTATGCCAAAAATTTTGGCCCCACGGGTATTGGGTTTGGAGGCCTTACACAACAAGTGGAAAAGAAAGAA

(SEQ ID NO:7)。

在一些实施方案中，Kozak序列为包含以下中的任何一个或由以下中的任何一个组成的替代Kozak序列：

(gcc)gccRccAUGG(SEQ ID NO:16)；

(gcc)gccRccAUGC(SEQ ID NO:17)；

AGNNAUGN；

ANNAUGG；

ANNAUGC；

ACCAUGG；

ACCAUGC；

GACACCAUGG(SEQ ID NO:18)；和

GACACCAUGC(SEQ ID NO:19)。

在一些实施方案中，载体基因组不包含Kozak序列。

载体基因组

本公开的AAV病毒体包含载体基因组。载体基因组可以包含表达盒(或用于不需要表达多核苷酸序列的基因编辑应用的多核苷酸盒)。可以使用任何合适的反向末端重复序列(ITR)。ITR可以来自与衣壳相同的血清型或不同的血清型(例如，可以使用AAV2 ITR)。

在一些实施方案中，5′ITR包含与以下至少75％、80％、85％、90％、92％、93％、94％、95％、96％、97％、98％、99％或100％相同的多核苷酸序列：

CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCT

(SEQ ID NO:20)

GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTGTAGTTAATGATTAACCCGCCATGCTACTTATCTACGTA

(SEQ ID NO:21)

CTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTGTAGTTAATGATTAACCCGCCATGCTACTTATCTACGTA

(SEQ ID NO:22)

TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCT

(SEQ ID NO:23)

在一些实施方案中，3′ITR包含与以下至少75％、80％、85％、90％、92％、93％、94％、95％、96％、97％、98％、99％或100％相同的多核苷酸序列：

AGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGG

(SEQ ID NO:24)

TACGTAGATAAGTAGCATGGCGGGTTAATCATTAACTACAAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGC

(SEQ ID NO:25)

AGGAACCCCTAGTGATGGAGACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGT

(SEQ ID NO:26)

在一些实施方案中，载体基因组包含一个或多个填充序列，例如与以下至少75％、80％、85％、90％、92％、93％、94％、95％、96％、97％、98％、99％或100％相同的填充序列：

GCGGCAATTCAGTCGATAACTATAACGGTCCTAAGGTAGCGATTT AAATACGCGCTCTCTTAAGGTAGCCCCGGGACGCGTCAATTGACTACA AACCGAGTATCTGCAGAGGGCCCTGCGTATG(SEQ ID NO:27)；

CTTCTGAGGCGGAAAGAACCAGATCCTCTCTTAAGGTAGCATCGA GATTTAAATTAGGGATAACAGGGTAATGGCGCGGGCCGC(SEQ ID NO:28)；或

GTTACCCAGGCTGGAGTGCAGTGGCACATTTCTGCTCACTGCAAC CTCCTCCTCCCTGGGTTC(SEQID NO:29)。

启动子

在一些实施方案中，编码MLP蛋白或其功能变体的多核苷酸序列可操作地连接至启动子。

本公开涵盖各种启动子的使用。可用于本公开的实施方案中的启动子包括但不限于巨细胞病毒(CMV)启动子、磷酸甘油酸激酶(PGK)启动子或由CMV增强子及鸡β-肌动蛋白启动子和兔β-球蛋白基因的部分组成的启动子序列(CAG)。在一些情况下，启动子可以是合成启动子。示例性的合成启动子由Schlabach等人,PNAS USA.107(6):2538–43(2010)提供。在一些实施方案中，启动子包含与以下至少75％、80％、85％、90％、92％、93％、94％、95％、96％、97％、98％、99％或100％相同的多核苷酸序列：

ACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGG

(SEQ ID NO:30)

在一些实施方案中，编码MLP蛋白或其功能变体的多核苷酸序列可操作地连接至诱导型启动子。诱导型启动子可以配置为响应于试剂的添加或积累或者响应于试剂的去除、降解或稀释而使多核苷酸序列转录表达或不转录表达。试剂可以是药物。试剂可以是四环素或其衍生物之一，包括但不限于强力霉素。在一些情况下，诱导型启动子为tet-on启动子、tet-off启动子、化学调节的启动子、物理调节的启动子(即，响应于光的存在或不存在或响应于低温或高温的启动子)。诱导型启动子包括重金属离子诱导型启动子(如小鼠乳房肿瘤病毒(mMTV)启动子或各种生长激素启动子)，以及来自在T7 RNA聚合酶的存在下具有活性的T7噬菌体的启动子。该诱导型启动子列表是非限制性的。

在一些情况下，启动子为组织特异性启动子，如能够在心脏细胞中比在非心脏细胞中更大程度地驱动表达的启动子。在一些实施方案中，组织特异性启动子选自任何各种心脏细胞特异性启动子，包括但不限于肌间线蛋白(Des)、α-肌球蛋白重链(α-MHC)、肌球蛋白轻链2(MLC-2)、心肌肌钙蛋白C(cTnC)、心肌肌钙蛋白T(hTNNT2)、肌肉肌酸激酶(CK)及其启动子/增强子区域的组合，如MHCK7。在一些情况下，启动子为泛在启动子。“泛在启动子”是指在实验或临床条件下不具有组织特异性的启动子。在一些情况下，泛在启动子为CMV、CAG、UBC、PGK、EF1-α、GAPDH、SV40、HBV、鸡β-肌动蛋白和人β-肌动蛋白启动子中的任何一种。

在一些实施方案中，启动子序列选自表3。在一些实施方案中，启动子包含与SEQID NO 31-51中的任何一个至少75％、80％、85％、90％、92％、93％、94％、95％、96％、97％、98％、99％或100％相同的多核苷酸序列。

表3

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

在一个优选的实施方案中，载体基因组包含与SEQ ID NO:31至少75％、80％、85％、90％、92％、93％、94％、95％、96％、97％、98％、99％或100％相同的多核苷酸序列。在一个优选的实施方案中，载体基因组包含与SEQ ID NO:32至少75％、80％、85％、90％、92％、93％、94％、95％、96％、97％、98％、99％或100％相同的多核苷酸序列。在一个优选的实施方案中，载体基因组包含与SEQ ID NO:33至少75％、80％、85％、90％、92％、93％、94％、95％、96％、97％、98％、99％或100％相同的多核苷酸序列。

启动子的其他示意性实例有来自猿猴病毒40的SV40后期启动子、杆状病毒多面体增强子/启动子元件、单纯疱疹病毒胸苷激酶(HSV tk)、来自巨细胞病毒(CMV)的立即早期启动子和包括LTR元件的各种逆转录病毒启动子。多种其他启动子是本领域已知并通常可获得的，并且许多这样的启动子的序列可在序列数据库如GenBank数据库中获得。

其他调控元件

在一些情况下，本公开的载体还包含一种或多种选自以下的调控元件：增强子、内含子、poly-A信号、2A肽编码序列、WPRE(土拨鼠肝炎病毒转录后调控元件)和HPRE(乙型肝炎转录后调控元件)。

在一些实施方案中，载体包含CMV增强子。

在某些实施方案中，载体包含一种或多种增强子。在特定的实施方案中，增强子为CMV增强子序列、GAPDH增强子序列、β-肌动蛋白增强子序列或EF1-α增强子序列。前述序列是本领域已知的。例如，CMV立即早期(IE)增强子的序列为：

ACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCA

(SEQ ID NO:50)

在某些实施方案中，载体包含一种或多种内含子。在特定的实施方案中，内含子为兔球蛋白内含子序列、鸡β-肌动蛋白内含子序列、合成内含子序列、SV40内含子或EF1-α内含子序列。

在某些实施方案中，载体包含polyA序列。在特定的实施方案中，polyA序列为兔球蛋白polyA序列、人生长激素polyA序列、牛生长激素polyA序列、PGK polyA序列、SV40polyA序列或TK polyA序列。在一些实施方案中，poly-A信号可以是牛生长激素多腺苷酸化信号(bGHpA)。

在某些实施方案中，载体包含一种或多种转录物稳定元件。在特定的实施方案中，转录物稳定元件为WPRE序列、HPRE序列、支架附着区、3'UTR或5'UTR。在特定的实施方案中，载体包含5'UTR和3'UTR两者。

在一些实施方案中，载体包含选自表4的5'非翻译区(UTR)。在一些实施方案中，载体基因组包含与SEQ ID NO 51-61中的任何一个至少75％、80％、85％、90％、92％、93％、94％、95％、96％、97％、98％、99％或100％相同的多核苷酸序列。

表4

/>

/>

/>

/>

/>

在一些实施方案中，载体包含选自表5的3'非翻译区。在一些实施方案中，载体基因组包含与SEQ ID NO 62-70中的任何一个至少75％、80％、85％、90％、92％、93％、94％、95％、96％、97％、98％、99％或100％相同的多核苷酸序列。

表5

/>

/>

/>

/>

在一些实施方案中，载体包含选自表6的多腺苷酸化(polyA)信号。在一些实施方案中，polyA信号包含与SEQ ID NO 71-75中的任何一个至少75％、80％、85％、90％、92％、93％、94％、95％、96％、97％、98％、99％或100％相同的多核苷酸序列。

表6

/>

/>

示意性的载体基因组在图1-4中描绘并作为SEQ ID NO:12-15提供。大写的每个序列的表达盒为SEQ ID NO:8-11。在一些实施方案中，载体基因组包含以下、基本上由以下组成或由以下组成：与SEQ ID NO:8-11中的任何一个具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的多核苷酸序列，任选地具有或不具有小写的ITR序列。编码序列是大写的。

腺相关病毒载体

腺相关病毒(AAV)是一种复制缺陷型细小病毒，其单链DNA基因组的长度为约4.7kb，包括两个～145-核苷酸反向末端重复序列(ITR)。AAV有多种已知的变体，当按抗原表位分类时有时也称为血清型。AAV血清型的基因组的核苷酸序列是已知的。例如，AAV-1的完整基因组在GenBank登录号NC_002077中提供；AAV-2的完整基因组在GenBank登录号NC_001401和Srivastava等人,J.Virol.,45:555-564(1983)中提供；AAV-3的完整基因组在GenBank登录号NC_1829中提供；AAV-4的完整基因组在GenBank登录号NC_001829中提供；AAV-5基因组在GenBank登录号AF085716中提供；AAV-6的完整基因组在GenBank登录号NC_00 1862中提供；AAV-7和AAV-8基因组的至少一部分分别在GenBank登录号AX753246和AX753249中提供；AAV-9基因组在Gao等人,J.Virol.,78:6381-6388(2004)中提供；AAV-10基因组在Mol.Ther.,13(1):67-76(2006)中提供；AAV-11基因组在Virology,330(2):375-383(2004)中提供。AAVrh.74基因组的序列在美国专利9,434,928中提供，该专利通过引用并入本文。指导病毒DNA复制(rep)、衣壳化/包装和宿主细胞染色体整合的顺式作用序列包含在AAV ITR中。三个AAV启动子(根据其相对图谱位置命名为p5、p19和p40)驱动编码rep和cap基因的两个AAV内部开放阅读框的表达。两个rep启动子(p5和p19)，与单个AAV内含子(在核苷酸2107和2227处)的差异剪接相结合，导致从rep基因产生四种rep蛋白(rep78、rep68、rep52和rep40)。Rep蛋白具有多重酶促性质，其最终负责复制病毒基因组。cap基因由p40启动子表达并且其编码三种衣壳蛋白VP1、VP2和VP3。选择性剪接和非共有翻译起始位点负责三种相关衣壳蛋白的产生。单个共有多腺苷酸化位点位于AAV基因组的图谱位置95处。AAV的生命周期和遗传学在Muzyczka,Current Topics in Microbiology andImmunology,158:97-129(1992)中有综述。

AAV具有独特的特征，这些特征使得其作为例如在基因疗法中向细胞递送外源DNA的载体具有吸引力。培养物中细胞的AAV感染是不致细胞病变的，而人和其他动物的自然感染是沉默且无症状的。此外，AAV感染许多哺乳动物细胞，从而有可能在体内靶向许多不同的组织。此外，AAV转导缓慢分裂和非分裂的细胞，并且可以作为转录活性核附加体(染色体外元件)基本上在这些细胞的整个生命周期内持续存在。AAV前病毒基因组作为克隆的DNA插入质粒中，这使得重组基因组的构建成为可能。此外，由于指导AAV复制和基因组衣壳化的信号包含在AAV基因组的ITR内，故内部大约4.3kb的基因组(编码复制和结构衣壳蛋白，rep-cap)中的一些或全部可被替换为外源DNA。为了生成AAV载体，可以以反式提供rep和cap蛋白。AAV的另一显著特征在于其是极其稳定且强大的病毒。它容易承受用于灭活腺病毒的条件(56℃至65℃持续数小时)，使得AAV的冷藏保存变得不那么重要。AAV甚至可以冻干。最后，AAV感染的细胞对重复感染没有抵抗力。

可用于本发明的实践中的基因递送病毒载体可利用分子生物学领域中公知的方法来构建。通常，携带转基因的病毒载体由编码转基因的多核苷酸、合适的调控元件和产生介导细胞转导的病毒蛋白所必需的元件组装。这样的重组病毒可以通过本领域已知的技术产生，例如通过转染包装细胞或通过用辅助质粒或病毒瞬时转染。病毒包装细胞的典型实例包括但不限于HeLa细胞、SF9细胞(任选地具有杆状病毒辅助载体)、293细胞等。可使用基于疱疹病毒的系统来产生AAV载体，如US20170218395A1中所述。用于产生这样的复制缺陷型重组病毒的详细方案可见于例如W095/14785、W096/22378、美国专利号5,882,877、美国专利号6,013,516、美国专利号4,861,719、美国专利号5,278,056和W094/19478中，这些专利中的每一个的完整内容在此通过引用并入。

可使用包括基于腺病毒和无辅助系统的各种系统将可用于本发明的实践中的AAV载体包装成AAV病毒体(病毒颗粒)。AAV生物学中的标准方法包括Kwon和Schaffer.PharmRes.(2008)25(3):489-99；Wu等人,Mol.Ther.(2006)14(3):316-27；Burger等人,Mol.Ther.(2004)10(2):302-17；Grimm等人,Curr Gene Ther.(2003)3(4):281-304；DeyleDR,Russell DW.Curr Opin Mol Ther.(2009)11(4):442-447；McCarty等人,Gene Ther.(2001)8(16):1248-54；和Duan等人,Mol Ther.(2001)4(4):383-91中描述的那些。无辅助系统包括US 6,004,797、US 7,588,772和US 7,094,604中描述的那些；

rAAV基因组中的AAV DNA可以来自可衍生出重组病毒的任何AAV变体或血清型，包括但不限于AAV变体或血清型AAV-1、AAV-2、AAV-3、AAV-4、AAV-5、AAV-6、AAV-7、AAV-8、AAV-9、AAV-10、AAV-11、AAV-12、AAV-13和AAVrh10。假型rAAV的生产在例如WO 01/83692中有公开。还涵盖其他类型的rAAV变体，例如具有衣壳突变的rAAV。参见例如Marsic等人,Molecular Therapy,22(11):1900-1909(2014)。各种AAV血清型的基因组的核苷酸序列是本领域已知的。

在一些情况下，rAAV包含自互补基因组。如本文所定义，包含“自互补”或“双链”基因组的rAAV是指已经工程化使得rAAV的编码区配置为形成分子内双链DNA模板的rAAV，如McCarty等人,Self-complementary recombinant adeno-associated virus(scAAV)vectors promote efficient transduction independently of DNA synthesis.GeneTherapy.8(16):1248–54(2001)中所述。本公开涵盖在一些情况下使用包含自互补基因组的rAAV，因为在感染(如转导)时，scAAV的两个互补半部将缔合形成一个准备好立即复制和转录的双链DNA(dsDNA)单元，而不是等待rAAV基因组的第二链的细胞介导合成。应理解，与在rAAV中发现的完全编码容量(4.7-6kb)不同，包含自互补基因组的rAAV只能容纳该量的约一半(≈2.4kb)。

在其他情况下，rAAV载体包含单链基因组。如本文所定义，“单一标准”基因组是指不自互补的基因组。在大多数情况下，非重组AAV具有单链DNA基因组。已经有一些迹象表明，rAAV应当是scAAV以实现细胞的有效转导。然而，本公开涵盖可能具有单链基因组而不是自互补基因组的rAAV载体，应理解rAAV载体的其他遗传修饰可能有益于在靶细胞中获得最佳基因转录。在一些情况下，本公开涉及能够实现向小鼠眼前段的有效基因转移的单链rAAV载体。参见Wang等人,Single stranded adeno-associated virus achievesefficient gene transfer to anterior segment in the mouse eye.PLoS ONE 12(8):e0182473(2017)。

在一些情况下，rAAV载体具有血清型AAV1、AAV2、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV13、AAVrh10或AAVrh74。假型rAAV的生产在例如WO 01/83692中有公开。还涵盖其他类型的rAAV变体，例如具有衣壳突变的rAAV。参见例如Marsic等人,Molecular Therapy,22(11):1900-1909(2014)。在一些情况下，rAAV载体具有血清型AAV9。在一些实施方案中，所述rAAV载体具有血清型AAV9并包含单链基因组。在一些实施方案中，所述rAAV载体具有血清型AAV9并包含自互补基因组。在一些实施方案中，rAAV载体包含AAV2的反向末端重复(ITR)序列。在一些实施方案中，rAAV载体包含AAV2基因组，使得rAAV载体为AAV-2/9载体、AAV-2/6载体或AAV-2/8载体。

大多数已知的AAV的衣壳基因的全长序列和序列在美国专利号8,524,446中提供，该专利整体并入本文。

AAV载体可以包含野生型AAV序列，或者它们可以包含对野生型AAV序列的一个或多个修饰。在某些实施方案中，AAV载体在衣壳蛋白例如VP1、VP2和/或VP3内包含一个或多个氨基酸修饰，例如取代、缺失或插入。在特定的实施方案中，在向受试者提供AAV载体时，修饰提供了降低的免疫原性。

可以修饰rAAV的衣壳蛋白使得rAAV靶向特定的目的靶组织如内皮细胞或更特别地内皮尖端细胞。在一些实施方案中，rAAV被直接注射到受试者的脑室内空间中。

在一些实施方案中，rAAV病毒体为AAV2 rAAV病毒体。衣壳可以是AAV2衣壳或其功能变体。在一些实施方案中，AAV2衣壳与例如以下的参考AAV2衣壳具有至少98％、99％或100％的同一性：

MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGNRQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL

(SEQ ID NO:76)

在一些实施方案中，rAAV病毒体为AAV9 rAAV病毒体。衣壳可以是AAV9衣壳或其功能变体。在一些实施方案中，AAV9衣壳与例如以下的参考AAV9衣壳具有至少98％、99％或100％的同一性：

MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTINGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHQSAQAQAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL

(SEQ ID NO:77)

在一些实施方案中，rAAV病毒体为AAV6 rAAV病毒体。衣壳可以是AAV9衣壳或其功能变体。在一些实施方案中，AAV6衣壳与例如以下的参考AAV6衣壳具有至少98％、99％或100％的同一性：

MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPFGLVEEGAKTAPGKKRPVEQSPQEPDSSSGIGKTGQQPAKKRLNFGQTGDSESVPDPQPLGEPPATPAAVGPTTMASGGGAPMADNNEGADGVGNASGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISSASTGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTTNDGVTTIANNLTSTVQVFSDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLNRTQNQSGSAQNKDLLFSRGSPAGMSVQPKNWLPGPCYRQQRVSKTKTDNNNSNFTWTGASKYNLNGRESIINPGTAMASHKDDKDKFFPMSGVMIFGKESAGASNTALDNVMITDEEEIKATNPVATERFGTVAVNLQSSSTDPATGDVHVMGALPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPPAEFSATKFASFITQYSTGQVSVEIEWELQKENSKRWNPEVQYTSNYAKSANVDFTVDNNGLYTEPRPIGTRYLTRPL

(SEQ ID NO:78)

在一些实施方案中，rAAV病毒体为AAVrh.10rAAV病毒体。衣壳可以是AAV9衣壳或其功能变体。在一些实施方案中，AAVrh.10衣壳与例如以下的参考AAVrh.10衣壳具有至少98％、99％或100％的同一性：

MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPLGLVEEGAKTAPGKKRPVEPSPQRSPDSSTGIGKKGQQPAKKRLNFGQTGDSESVPDPQPIGEPPAGPSGLGSGTMAAGGGAPMADNNEGADGVGSSSGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISNGTSGGSTNDNTYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNEGTKTIANNLTSTIQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFEFSYQFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTQSTGGTAGTQQLLFSQAGPNNMSAQAKNWLPGPCYRQQRVSTTLSQNNNSNFAWTGATKYHLNGRDSLVNPGVAMATHKDDEERFFPSSGVLMFGKQGAGKDNVDYSSVMLTSEEEIKTTNPVATEQYGVVADNLQQQNAAPIVGAVNSQGALPGMVWQNRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGLKHPPPQILIKNTPVPADPPTTFSQAKLASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSTNVDFAVNTDGTYSEPRPIGTRYLTRNL

(SEQ ID NO:79)

在一些实施方案中，衣壳蛋白由在质粒上以反式供给到转移质粒的多核苷酸编码。野生型AAVrh74 cap的多核苷酸序列为如下：

AAVrh74衣壳编码序列(SEQ IDNO:80)

ATGGCTGCCGATGGTTATCTTCCAGATTGGCTCGAGGACAACCTCTCTGAGGGCATTCGCGAGTGGTGGGACCTGAAACCTGGAGCCCCGAAACCCAAAGCCAACCAGCAAAAGCAGGACAACGGCCGGGGTCTGGTGCTTCCTGGCTACAAGTACCTCGGACCCTTCAACGGACTCGACAAGGGGGAGCCCGTCAACGCGGCGGACGCAGCGGCCCTCGAGCACGACAAGGC

CTACGACCAGCAGCTCCAAGCGGGTGACAATCCGTACCTGCGGTATA

ATCACGCCGACGCCGAGTTTCAGGAGCGTCTGCAAGAAGATACGTCT

TTTGGGGGCAACCTCGGGCGCGCAGTCTTCCAGGCCAAAAAGCGGGT

TCTCGAACCTCTGGGCCTGGTTGAATCGCCGGTTAAGACGGCTCCTGG

AAAGAAGAGACCGGTAGAGCCATCACCCCAGCGCTCTCCAGACTCCT

CTACGGGCATCGGCAAGAAAGGCCAGCAGCCCGCAAAAAAGAGACT

CAATTTTGGGCAGACTGGCGACTCAGAGTCAGTCCCCGACCCTCAACC

AATCGGAGAACCACCAGCAGGCCCCTCTGGTCTGGGATCTGGTACAA

TGGCTGCAGGCGGTGGCGCTCCAATGGCAGACAATAACGAAGGCGCC

GACGGAGTGGGTAGTTCCTCAGGAAATTGGCATTGCGATTCCACATG

GCTGGGCGACAGAGTCATCACCACCAGCACCCGCACCTGGGCCCTGC

CCACCTACAACAACCACCTCTACAAGCAAATCTCCAACGGGACCTCG

GGAGGAAGCACCAACGACAACACCTACTTCGGCTACAGCACCCCCTG

GGGGTATTTTGACTTCAACAGATTCCACTGCCACTTTTCACCACGTGA

CTGGCAGCGACTCATCAACAACAACTGGGGATTCCGGCCCAAGAGGC

TCAACTTCAAGCTCTTCAACATCCAAGTCAAGGAGGTCACGCAGAAT

GAAGGCACCAAGACCATCGCCAATAACCTTACCAGCACGATTCAGGT

CTTTACGGACTCGGAATACCAGCTCCCGTACGTGCTCGGCTCGGCGCA

CCAGGGCTGCCTGCCTCCGTTCCCGGCGGACGTCTTCATGATTCCTCA

GTACGGGTACCTGACTCTGAACAATGGCAGTCAGGCTGTGGGCCGGT

CGTCCTTCTACTGCCTGGAGTACTTTCCTTCTCAAATGCTGAGAACGG

GCAACAACTTTGAATTCAGCTACAACTTCGAGGACGTGCCCTTCCACA

GCAGCTACGCGCACAGCCAGAGCCTGGACCGGCTGATGAACCCTCTC

ATCGACCAGTACTTGTACTACCTGTCCCGGACTCAAAGCACGGGCGGT

ACTGCAGGAACTCAGCAGTTGCTATTTTCTCAGGCCGGGCCTAACAAC

ATGTCGGCTCAGGCCAAGAACTGGCTACCCGGTCCCTGCTACCGGCA

GCAACGCGTCTCCACGACACTGTCGCAGAACAACAACAGCAACTTTG

CCTGGACGGGTGCCACCAAGTATCATCTGAATGGCAGAGACTCTCTG

GTGAATCCTGGCGTTGCCATGGCTACCCACAAGGACGACGAAGAGCG

ATTTTTTCCATCCAGCGGAGTCTTAATGTTTGGGAAACAGGGAGCTGG

AAAAGACAACGTGGACTATAGCAGCGTGATGCTAACCAGCGAGGAAG

AAATAAAGACCACCAACCCAGTGGCCACAGAACAGTACGGCGTGGTG

GCCGATAACCTGCAACAGCAAAACGCCGCTCCTATTGTAGGGGCCGT

CAATAGTCAAGGAGCCTTACCTGGCATGGTGTGGCAGAACCGGGACG

TGTACCTGCAGGGTCCCATCTGGGCCAAGATTCCTCATACGGACGGCA

ACTTTCATCCCTCGCCGCTGATGGGAGGCTTTGGACTGAAGCATCCGC

CTCCTCAGATCCTGATTAAAAACACACCTGTTCCCGCGGATCCTCCGA

CCACCTTCAATCAGGCCAAGCTGGCTTCTTTCATCACGCAGTACAGTA

CCGGCCAGGTCAGCGTGGAGATCGAGTGGGAGCTGCAGAAGGAGAA

CAGCAAACGCTGGAACCCAGAGATTCAGTACACTTCCAACTACTACA

AATCTACAAATGTGGACTTTGCTGTCAATACTGAGGGTACTTATTCCG

AGCCTCGCCCCATTGGCACCCGTTACCTCACCCGTAATCTGTAA

本公开还提供了AAVrh74 VP1、VP2和VP3的蛋白质序列，包括SEQ ID NO:2-4，以及其同源物或功能变体。

AAVrh74 VP1 (SEQ ID NO: 81)

MAAGGGAPMADNNEGADGVGSSSGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISNGTSGGSTNDNTYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNEGTKTIANNLTSTIQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFEFSYNFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTQSTGGTAGTQQLLFSQAGPNNMSAQAKNWLPGPCYRQQRVSTTLSQNNNSNFAWTGATKYHLNGRDSLVNPGVAMATHKDDEERFFPSSGVLMFGKQGAGKDNVDYSSVMLTSEEEIKTTNPVATEQYGVVADNLQQQNAAPIVGAVNSQGALPGMVWQNRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGLKHPPPQILIKNTPVPADPPTTFNQAKLASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSTNVDFAVNTEGTYSEPRPIGTRYLTRNL

AAVrh74 VP2(SEQ ID NO: 82)

STIQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFEFSYNFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTQSTGGTAGTQQLLFSQAGPNNMSAQAKNWLPGPCYRQQRVSTTLSQNNNSNFAWTGATKYHLNGRDSLVNPGVAMATHKDDEERFFPSSGVLMFGKQGAGKDNVDYSSVMLTSEEEIKTTNPVATEQYGVVADNLQQQNAAPIVGAVNSQGALPGMVWQNRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGLKHPPPQILIKNTPVPADPPTTFNQAKLASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSTNVDFAVNTEGTYSEPRPIGTRYLTRNL

AAVrh74 VP3 (SEQ ID NO:83)

RTGNNFEFSYNFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTQSTGGTAGTQQLLFSQAGPNNMSAQAKNWLPGPCYRQQRVSTTLSQNNNSNFAWTGATKYHLNGRDSLVNPGVAMATHKDDEERFFPSSGVLMFGKQGAGKDNVDYSSVMLTSEEEIKTTNPVATEQYGVVADNLQQQNAAPIVGAVNSQGALPGMVWQNRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGLKHPPPQILIKNTPVPADPPTTFNQAKLASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSTNVDFAVNTEGTYSEPRPIGTRYLTRNL

在某些情况下，AAVrh74衣壳包含SEQ ID NO:2中阐述的氨基酸序列。在一些实施方案中，rAAV载体包含多肽，所述多肽包含例如与SEQ ID NO:2中阐述的AAVrh74 VP1的氨基酸序列至少65％、至少70％、至少75％、至少80％、81％、82％、83％、84％、85％、86％、87％、88％或89％、更通常90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多地相同的序列，或基本上由这样的序列组成，或还进一步由这样的序列组成。在一些实施方案中，rAAV载体包含多肽，所述多肽包含例如与SEQ ID NO:3中阐述的AAVrh74 VP2的氨基酸序列至少65％、至少70％、至少75％、至少80％、81％、82％、83％、84％、85％、86％、87％、88％或89％、更通常90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多地相同的序列，或基本上由这样的序列组成，或还进一步由这样的序列组成。在一些实施方案中，rAAV载体包含多肽，所述多肽包含例如与SEQ ID NO:4中阐述的AAVrh74 VP3的氨基酸序列至少65％、至少70％、至少75％、至少80％、81％、82％、83％、84％、85％、86％、87％、88％或89％、更通常90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多地相同的序列，或基本上由这样的序列组成，或还进一步由这样的序列组成。

在一些实施方案中，rAAV病毒体为AAV-PHP.B rAAV病毒体或其神经营养变体，如但不限于在国际专利公开号WO 2015/038958 A1和WO 2017/100671A1中公开的那些。例如，AAV衣壳可以包含来自序列TLAVPFK(SEQ ID NO:85)或KFPVALT(SEQ ID NO:86)的至少4个连续氨基酸，例如插入在编码AAV9的氨基酸588和589的序列之间。

衣壳可以是AAV-PHP.B衣壳或其功能变体。在一些实施方案中，AAV-PHP.B衣壳与例如以下的参考AAV-PHP.B衣壳具有至少98％、99％或100％的同一性：

MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTINGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHQSAQTLAVPFKAQAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL

(SEQ ID NO:84)

本公开的rAAV病毒体中使用的更多AAV衣壳包括在专利公开号WO 2009/012176A2和WO 2015/168666A2中公开的那些。

不受理论的束缚，本发明人已确定AAV9载体、AAVrh.74或AAVrh.10载体将在载体上赋予期望的心脏趋向性。不受理论的束缚，本发明人还已确定AAV9载体、AAVrh.74或AAVrh.10载体可以向心脏细胞提供所需的特异性。

药物组合物和试剂盒

在一个方面，本公开提供了包含本公开的rAAV病毒体和一种或多种药学上可接受的载体、稀释剂或赋形剂的药物组合物。

就施用的目的而言，例如通过注射，可以采用各种溶液，如无菌水溶液。如果需要，可对这样的水溶液进行缓冲，并且首先用盐水或葡萄糖使液体稀释剂等渗。rAAV呈游离酸(DNA含有酸性磷酸酯基团)或药理学上可接受的盐的溶液可在与表面活性剂如泊洛沙姆188例如以0.001％或0.01％适当混合的水中制备。rAAV的分散体也可在甘油、液体聚乙二醇及其混合物中和油中制备。在一般的储存和使用条件下，这些制剂含有防腐剂以防止微生物的生长。就此而言，所采用的无菌水性介质均可通过本领域技术人员熟知的标准技术容易地获得。

适合于可注射使用的药物形式包括但不限于无菌水溶液或分散体以及用于临时制备无菌可注射溶液或分散体的无菌粉末。在所有情况下，该形式都是无菌的并且必须是流体的至存在易于注射性的程度。其在制造和储存条件下必须是稳定的，并且必须防止微生物如细菌和真菌的污染作用。载体可以是溶剂或分散介质，其含有例如水、乙醇、多元醇(例如，甘油、丙二醇、液体聚乙二醇等)、它们的合适混合物和植物油。适当的流动性可例如通过使用涂料如卵磷脂、通过在分散体的情况下保持所需的粒度以及通过使用表面活性剂来保持。可通过各种抗细菌剂和抗真菌剂例如对羟基苯甲酸酯、氯丁醇、苯酚、山梨酸、硫柳汞等来防止微生物的作用。在许多情况下，优选包括等渗剂，例如糖或氯化钠。可通过使用延迟吸收剂例如单硬脂酸铝和明胶来延长可注射组合物的吸收。

无菌可注射溶液可以通过将rAAV以所需的量与上文列举的各种其他成分一起并入在适宜的溶剂中来制备，如果需要，随后进行过滤灭菌。通常，通过将灭菌的活性成分并入到无菌载体中来制备分散体，该无菌载体含有基础的分散介质和来自上面列举的那些的所需其他成分。在用于制备无菌可注射溶液的无菌粉末的情况下，优选的制备方法是真空干燥和冷冻干燥技术，其产生活性成分外加来自其先前无菌过滤的溶液的任何其他所需成分的粉末。

在另一个方面，本公开包括试剂盒，所述试剂盒包括本公开的rAAV病毒体和使用说明书。

使用方法

在一个方面，本公开提供了一种增加细胞中的MLP活性的方法，其包括使细胞与本公开的rAAV接触。在另一个方面，本公开提供了一种增加受试者中的MLP活性的方法，其包括施用本公开的rAAV。在一些实施方案中，细胞和/或受试者缺乏CSRP3信使RNA或MLP蛋白表达水平和/或活性和/或在CSRP3中包含功能丧失突变。细胞可以是心脏细胞，例如心肌细胞。

在一些实施方案中，所述方法促进细胞培养物中和/或体内心脏细胞例如心肌细胞的存活。在一些实施方案中，所述方法促进和/或恢复心脏的功能。

治疗方法

在另一个方面，本公开提供了一种在有此需要的受试者中治疗疾病或病症的方法，其包括向受试者施用有效量的本公开的rAAV病毒体。在一些实施方案中，疾病或病症为心脏疾病或病症。示意性的心脏病症包括心力衰竭、肥厚型心肌病和扩张型心肌病。在一些实施方案中，受试者罹患CSRP3表达或功能的遗传破坏。在一些实施方案中，疾病或病症为HCM或DCM。在一些实施方案中，疾病或病症为家族性肥厚型心肌病-12(CMH12)。在一些实施方案中，疾病或病症为扩张型心肌病-1M(CMD1M)。在一些实施方案中，疾病或病症为骨骼肌病。在一些实施方案中，疾病或病症为面肩胛肱型肌营养不良症、线状体肌病或2B型肢带型肌营养不良症。在一些实施方案中，疾病或病症为2A型肢带型肌营养不良症、Duchenne型肌营养不良症或皮肌炎。

AAV介导的MLP蛋白向心脏的递送可以延长寿命，预防或减弱心脏细胞变性、心力衰竭、瘢痕形成、射血分数降低、心律失常、心绞痛、阻塞性HCM或DCM、心室肥大(IVS：范围14-32mm)、室性心动过速、常见的I-II的轻度NYHA得分、运动不耐受、心绞痛(胸痛)、心脏性猝死、劳力性肌痛和痉挛。

本文公开的方法可以在心脏中提供有效的生物分布。它们可能导致在所有或大部分心脏细胞例如心肌细胞中的持续表达。值得注意的是，本文公开的方法可以在受试者施用AAV载体后的整个寿命期间提供MLP蛋白的持久表达。

本发明还涵盖组合疗法。特别涵盖本发明的方法与标准医学治疗(例如，皮质类固醇或局部减压药物)的组合，以及与新型疗法的组合。在一些情况下，可以用类固醇和/或免疫抑制剂的组合来治疗受试者以防止或减少对施用本文所述rAAV的免疫反应。

在一些实施方案中，AAV载体以每千克(vg)受试者总体重约1×10¹²至5×10¹⁴个AAV载体的载体基因组(vg)的剂量(vg/kg)施用。在一些实施方案中，AAV载体以约1×10¹³至5×10¹⁴vg/kg的剂量施用。在一些实施方案中，AAV载体以约5×10¹³至3×10¹⁴vg/kg的剂量施用。在一些实施方案中，AAV载体以约5×10¹³至1×10¹⁴vg/kg的剂量施用。在一些实施方案中，AAV载体以小于约1×10¹²vg/kg、小于约3×10¹²vg/kg、小于约5×10¹²vg/kg、小于约7×10¹²vg/kg、小于约1×10¹³vg/kg、小于约3×10¹³vg/kg、小于约5×10¹³vg/kg、小于约7×10¹³vg/kg、小于约1×10¹⁴vg/kg、小于约3×10¹⁴vg/kg、小于约5×10¹⁴vg/kg、小于约7×10¹⁴vg/kg、小于约1×10¹⁵vg/kg、小于约3×10¹⁵vg/kg、小于约5×10¹⁵vg/kg、或小于约7×10¹⁵vg/kg的剂量施用。

在一些实施方案中，AAV载体以约1×10¹²vg/kg、约3×10¹²vg/kg、约5×10¹²vg/kg、约7×10¹²vg/kg、约1×10¹³vg/kg、约3×10¹³vg/kg、约5×10¹³vg/kg、约7×10¹³vg/kg、约1×10¹⁴vg/kg、约3×10¹⁴vg/kg、约5×10¹⁴vg/kg、约7×10¹⁴vg/kg、约1×10¹⁵vg/kg、约3×10¹⁵vg/kg、约5×10¹⁵vg/kg、或约7×10¹⁵vg/kg的剂量施用。

在一些实施方案中，AAV载体以1×10¹²vg/kg、3×10¹²vg/kg、5×10¹²vg/kg、7×10¹²vg/kg、1×10¹³vg/kg、3×10¹³vg/kg、5×10¹³vg/kg、7×10¹³vg/kg、1×10¹⁴vg/kg、3×10¹⁴vg/kg、5×10¹⁴vg/kg、7×10¹⁴vg/kg、1×10¹⁵vg/kg、3×10¹⁵vg/kg、5×10¹⁵vg/kg、或7×10¹⁵vg/kg的剂量施用。

在一些实施方案中，AAV载体以每千克(vg)受试者总体重约1×10¹²至5×10¹⁴个AAV载体的载体基因组(vg)的剂量(vg/kg)全身施用。在一些实施方案中，AAV载体以约1×10¹³至5×10¹⁴vg/kg的剂量全身施用。在一些实施方案中，AAV载体以约5×10¹³至3×10¹⁴vg/kg的剂量全身施用。在一些实施方案中，AAV载体以约5×10¹³至1×10¹⁴vg/kg的剂量全身施用。在一些实施方案中，AAV载体以小于约1×10¹²vg/kg、小于约3×10¹²vg/kg、小于约5×10¹²vg/kg、小于约7×10¹²vg/kg、小于约1×10¹³vg/kg、小于约3×10¹³vg/kg、小于约5×10¹³vg/kg、小于约7×10¹³vg/kg、小于约1×10¹⁴vg/kg、小于约3×10¹⁴vg/kg、小于约5×10¹⁴vg/kg、小于约7×10¹⁴vg/kg、小于约1×10¹⁵vg/kg、小于约3×10¹⁵vg/kg、小于约5×10¹⁵vg/kg、或小于约7×10¹⁵vg/kg的剂量全身施用。

在一些实施方案中，AAV载体以约1×10¹²vg/kg、约3×10¹²vg/kg、约5×10¹²vg/kg、约7×10¹²vg/kg、约1×10¹³vg/kg、约3×10¹³vg/kg、约5×10¹³vg/kg、约7×10¹³vg/kg、约1×10¹⁴vg/kg、约3×10¹⁴vg/kg、约5×10¹⁴vg/kg、约7×10¹⁴vg/kg、约1×10¹⁵vg/kg、约3×10¹⁵vg/kg、约5×10¹⁵vg/kg、或约7×10¹⁵vg/kg的剂量全身施用。

在一些实施方案中，AAV载体以1×10¹²vg/kg、3×10¹²vg/kg、5×10¹²vg/kg、7×10¹²vg/kg、1×10¹³vg/kg、3×10¹³vg/kg、5×10¹³vg/kg、7×10¹³vg/kg、1×10¹⁴vg/kg、3×10¹⁴vg/kg、5×10¹⁴vg/kg、7×10¹⁴vg/kg、1×10¹⁵vg/kg、3×10¹⁵vg/kg、5×10¹⁵vg/kg、或7×10¹⁵vg/kg的剂量全身施用。

在一些实施方案中，AAV载体以每千克(vg)受试者总体重约1×10¹²至5×10¹⁴个AAV载体的载体基因组(vg)的剂量(vg/kg)静脉内施用。在一些实施方案中，AAV载体以约1×10¹³至5×10¹⁴vg/kg的剂量静脉内施用。在一些实施方案中，AAV载体以约5×10¹³至3×10¹⁴vg/kg的剂量静脉内施用。在一些实施方案中，AAV载体以约5×10¹³至1×10¹⁴vg/kg的剂量静脉内施用。在一些实施方案中，AAV载体以小于约1×10¹²vg/kg、小于约3×10¹²vg/kg、小于约5×10¹²vg/kg、小于约7×10¹²vg/kg、小于约1×10¹³vg/kg、小于约3×10¹³vg/kg、小于约5×10¹³vg/kg、小于约7×10¹³vg/kg、小于约1×10¹⁴vg/kg、小于约3×10¹⁴vg/kg、小于约5×10¹⁴vg/kg、小于约7×10¹⁴vg/kg、小于约1×10¹⁵vg/kg、小于约3×10¹⁵vg/kg、小于约5×10¹⁵vg/kg、或小于约7×10¹⁵vg/kg的剂量静脉内施用。

在一些实施方案中，AAV载体以约1×10¹²vg/kg、约3×10¹²vg/kg、约5×10¹²vg/kg、约7×10¹²vg/kg、约1×10¹³vg/kg、约3×10¹³vg/kg、约5×10¹³vg/kg、约7×10¹³vg/kg、约1×10¹⁴vg/kg、约3×10¹⁴vg/kg、约5×10¹⁴vg/kg、约7×10¹⁴vg/kg、约1×10¹⁵vg/kg、约3×10¹⁵vg/kg、约5×10¹⁵vg/kg、或约7×10¹⁵vg/kg的剂量静脉内施用。

在一些实施方案中，AAV载体以1×10¹²vg/kg、3×10¹²vg/kg、5×10¹²vg/kg、7×10¹²vg/kg、1×10¹³vg/kg、3×10¹³vg/kg、5×10¹³vg/kg、7×10¹³vg/kg、1×10¹⁴vg/kg、3×10¹⁴vg/kg、5×10¹⁴vg/kg、7×10¹⁴vg/kg、1×10¹⁵vg/kg、3×10¹⁵vg/kg、5×10¹⁵vg/kg、或7×10¹⁵vg/kg的剂量静脉内施用。

纽约心脏协会功能分类(NYHA分级)、病理心电图、左心室舒张末期/收缩末期直径、最大心室壁厚度、最大后壁厚度、E峰和A峰速度、峰值早期和峰值晚期经二尖瓣充盈速度、早期舒张和晚期舒张组织多普勒速度、高血压和心脏肥大程度的变化可能揭示患者功能改善、临床获益或疗效的证据。与基线或疾病匹配的对照患者相比，另外的心肌组织学将揭示AAV介导的MLP益处，其显示心肌细胞肥大的减少、肌细胞阵列的减少以及间质和血管周围纤维化和瘢痕的减少。

组合物的施用

可以通过本领域的标准途径施用有效剂量的组合物，包括但不限于全身、局部、直接注射、静脉内、心内施用。在一些情况下，施用包括全身、局部、直接注射、静脉内、心内注射。施用可以通过心导管插入术进行。

在一些实施方案中，本公开提供了有效剂量的rAAV和本发明组合物的局部施用和全身施用。例如，全身施用可以是施用到循环系统中，从而影响整个身体。全身施用包括通过注射、输注或植入进行肠胃外施用。本文公开的组合物的施用途径包括静脉内(“IV”)施用、腹膜内(“IP”)施用、肌肉内(“IM”)施用、病灶内施用或皮下(“SC”)施用，或缓慢释放装置例如微型渗透泵、储库制剂等的植入。在一些实施方案中，本公开的方法包括通过静脉内、肌肉内、动脉内、肾内、尿道内、心内、冠状动脉内、心肌内、真皮内、硬膜外、皮下、腹膜内、心室内、离子电渗疗法或颅内施用来施用本公开的AAV载体或其药物组合物。

特别地，本发明的rAAV的施用可以通过使用将rAAV重组载体输送到动物靶组织中的任何物理方法来实现。施用包括但不限于注射到心脏中。

在一些实施方案中，本公开的方法包括心内递送。可以使用专用套管、导管、注射器/针头、使用输注泵进行输注。施用可以包括向心脏递送有效量的rAAV病毒体或包含rAAV病毒体的药物组合物。这些可以例如经由静脉内、肌肉内、动脉内、肾内、尿道内、心内、冠状动脉内、心肌内、真皮内、硬膜外、皮下、腹膜内、心室内、离子电渗疗法或颅内施用来实现。本公开的组合物还可以静脉内施用。

本文公开的治疗方法可以减少和/或预防一种或多种症状，包括但不限于心室肥大、室性心动过速、常见的I-II的轻度NYHA得分、运动不耐受和心绞痛。

实施例

实施例1：临床前生物活性和功效

使用培养的心肌细胞(例如，诱导的多能干细胞心肌细胞，iPSC-CM)对图1-4中示意的载体进行体外测试。通过免疫荧光法和蛋白质印迹法来评估MLP的表达。磷酸化测定揭示蛋白激酶C-α(PKC-A)自磷酸化的减少。

使用心肌病的MLP-缺陷型或MLP-突变型小鼠模型(例如，C58G敲入(KI)模型或W4RKI模型)对选择的载体进行体内测试。通过测量左心室射血分数(LVEF)和/或左心室舒张末期尺寸(LVED)(使用超声心动描记术)、总体心脏重量的减少(例如，标准化为胫骨长度)、左心室性能dP/dt_max、dP/dt_min和松弛常数Tau的有创血流动力学评估或组织学评价后左和/或右心室肥大的减少来确定功效。另外，通过测量生物标志物来评估在小鼠模型中的体内功效，所述生物标志物包括但不限于心房利钠因子(Nppa)基因表达、脑利钠肽(Nppb)基因表达和β-肌球蛋白重链蛋白表达。通过测试蛋白激酶C-α(PKC-A)活性、心脏中的磷酸化MLP、泛素蛋白酶体降解活性来确定生理功效。对AAV载体观察到响应于治疗的正常化或缓解。

实施例2：人心肌细胞中的蛋白质表达

使用对照细胞系(CHO-Lec2；图5A)和培养的心肌细胞(分化的AC16细胞系；图5B)对图1-4中示意的载体进行体外测试。通过蛋白质印迹法评估肌肉LIM蛋白(MLP；由CSRP3编码的蛋白)的表达。

图5A示出了在转导的CHO-Lec2中的CSRP3表达。图5B示出了在转导的心肌细胞(分化的AC16细胞系-Sigma-

目录号SCC109)中的CSRP3表达。用来自每个载体的3E5MOI转导细胞；6天后，收集细胞裂解物，并使用抗-CSRP3多克隆抗体(Thermo-/>

PA5-29155 1:1000)进行蛋白质印迹法。

当使用MHCK7启动子时，来自CSRP3转基因的MLP蛋白的表达高于当使用hTNNT2("hTnT")启动子时。AAV载体的AAV9和AAVrh74血清型两者都能够转导心肌细胞细胞系。基于图5B中的数据，用AAVrh74载体的MLP蛋白表达明显高于用AAV9载体的表达。

序列表

<110> Spacecraft Seven, LLC

<120> CSRP3（富含半胱氨酸和甘氨酸的蛋白质3）基因疗法

<130> ROPA-020/01WO 329592-22266

<150> US 63/061,727

<151> 2020-08-05

<160> 86

<170> PatentIn 3.5版

<210> 1

<211> 194

<212> PRT

<213> 智人

<400> 1

Met Pro Asn Trp Gly Gly Gly Ala Lys Cys Gly Ala Cys Glu Lys Thr

1 5 10 15

Val Tyr His Ala Glu Glu Ile Gln Cys Asn Gly Arg Ser Phe His Lys

20 25 30

Thr Cys Phe His Cys Met Ala Cys Arg Lys Ala Leu Asp Ser Thr Thr

35 40 45

Val Ala Ala His Glu Ser Glu Ile Tyr Cys Lys Val Cys Tyr Gly Arg

50 55 60

Arg Tyr Gly Pro Lys Gly Ile Gly Tyr Gly Gln Gly Ala Gly Cys Leu

65 70 75 80

Ser Thr Asp Thr Gly Glu His Leu Gly Leu Gln Phe Gln Gln Ser Pro

85 90 95

Lys Pro Ala Arg Ser Val Thr Thr Ser Asn Pro Ser Lys Phe Thr Ala

100 105 110

Lys Phe Gly Glu Ser Glu Lys Cys Pro Arg Cys Gly Lys Ser Val Tyr

115 120 125

Ala Ala Glu Lys Val Met Gly Gly Gly Lys Pro Trp His Lys Thr Cys

130 135 140

Phe Arg Cys Ala Ile Cys Gly Lys Ser Leu Glu Ser Thr Asn Val Thr

145 150 155 160

Asp Lys Asp Gly Glu Leu Tyr Cys Lys Val Cys Tyr Ala Lys Asn Phe

165 170 175

Gly Pro Thr Gly Ile Gly Phe Gly Gly Leu Thr Gln Gln Val Glu Lys

180 185 190

Lys Glu

<210> 2

<211> 150

<212> PRT

<213> 智人

<400> 2

Met Pro Asn Trp Gly Gly Gly Ala Lys Cys Gly Ala Cys Glu Lys Thr

1 5 10 15

Val Tyr His Ala Glu Glu Ile Gln Cys Asn Gly Arg Ser Phe His Lys

20 25 30

Thr Cys Phe His Cys Ser Pro Gln Ser Arg His Ala Gln Leu Pro Pro

35 40 45

Ala Thr Leu Pro Asn Ser Leu Arg Ser Leu Glu Ser Pro Arg Ser Ala

50 55 60

Leu Asp Val Ala Ser Gln Ser Met Leu Leu Arg Arg Leu Trp Glu Val

65 70 75 80

Ala Ser Leu Gly Thr Arg Pro Val Ser Ala Val Pro Ser Val Gly Arg

85 90 95

Val Trp Ser Pro Gln Met Ser Leu Thr Lys Met Gly Asn Phe Ile Ala

100 105 110

Lys Phe Ala Met Pro Lys Ile Leu Ala Pro Arg Val Leu Gly Leu Glu

115 120 125

Ala Leu His Asn Lys Trp Lys Arg Lys Asn Glu Glu Val Arg Arg Phe

130 135 140

Ser Asp Phe Leu Arg Ala

145 150

<210> 3

<211> 39

<212> PRT

<213> 智人

<400> 3

Met Pro Asn Trp Gly Gly Gly Ala Lys Cys Gly Ala Cys Glu Lys Thr

1 5 10 15

Val Tyr His Ala Glu Glu Ile Gln Cys Asn Gly Arg Ser Phe His Lys

20 25 30

Thr Cys Phe His Cys Leu Cys

35

<210> 4

<211> 58

<212> PRT

<213> 智人

<400> 4

Met Pro Asn Trp Gly Gly Gly Ala Lys Cys Gly Ala Cys Glu Lys Thr

1 5 10 15

Val Tyr His Ala Glu Glu Ile Gln Cys Asn Gly Arg Ser Phe His Lys

20 25 30

Thr Cys Phe His Cys Thr Leu Ala Gln Asp Leu Phe Pro Leu Cys His

35 40 45

Leu Trp Glu Glu Ser Gly Val His Lys Cys

50 55

<210> 5

<211> 582

<212> DNA

<213> 智人

<400> 5

atgccaaact ggggcggagg cgcaaaatgt ggagcctgtg aaaagaccgt ctaccatgca 60

gaagaaatcc agtgcaatgg aaggagtttc cacaagacgt gtttccactg catggcctgc 120

aggaaggctc ttgacagcac gacagtcgcg gctcatgagt cggagatcta ctgcaaggtg 180

tgctatgggc gcagatatgg ccccaaaggg atcgggtatg gacaaggcgc tggctgtctc 240

agcacagaca cgggcgagca tctcggcctg cagttccaac agtccccaaa gccggcacgc 300

tcagttacca ccagcaaccc ttccaaattc actgcgaagt ttggagagtc cgagaagtgc 360

cctcgatgtg gcaagtcagt ctatgctgct gagaaggtta tgggaggtgg caagccttgg 420

cacaagacct gtttccgctg tgccatctgt gggaagagtc tggagtccac aaatgtcact 480

gacaaagatg gggaacttta ttgcaaagtt tgctatgcca aaaattttgg ccccacgggt 540

attgggtttg gaggccttac acaacaagtg gaaaagaaag aa 582

<210> 6

<211> 10

<212> DNA

<213> 人工序列

<220>

<223> Kozak序列基序

<400> 6

gccaccatgg 10

<210> 7

<211> 588

<212> DNA

<213> 人工序列

<220>

<223> 编码具有Kozak序列的MLP的多核苷酸

<400> 7

gccaccatgc caaactgggg cggaggcgca aaatgtggag cctgtgaaaa gaccgtctac 60

catgcagaag aaatccagtg caatggaagg agtttccaca agacgtgttt ccactgcatg 120

gcctgcagga aggctcttga cagcacgaca gtcgcggctc atgagtcgga gatctactgc 180

aaggtgtgct atgggcgcag atatggcccc aaagggatcg ggtatggaca aggcgctggc 240

tgtctcagca cagacacggg cgagcatctc ggcctgcagt tccaacagtc cccaaagccg 300

gcacgctcag ttaccaccag caacccttcc aaattcactg cgaagtttgg agagtccgag 360

aagtgccctc gatgtggcaa gtcagtctat gctgctgaga aggttatggg aggtggcaag 420

ccttggcaca agacctgttt ccgctgtgcc atctgtggga agagtctgga gtccacaaat 480

gtcactgaca aagatgggga actttattgc aaagtttgct atgccaaaaa ttttggcccc 540

acgggtattg ggtttggagg ccttacacaa caagtggaaa agaaagaa 588

<210> 8

<211> 2152

<212> DNA

<213> 人工序列

<220>

<223> 实验室中制备 - MHCK7-CSRP3表达盒

<400> 8

acccttcaga ttaaaaataa ctgaggtaag ggcctgggta ggggaggtgg tgtgagacgc 60

tcctgtctct cctctatctg cccatcggcc ctttggggag gaggaatgtg cccaaggact 120

aaaaaaaggc catggagcca gaggggcgag ggcaacagac ctttcatggg caaaccttgg 180

ggccctgctg tctagcatgc cccactacgg gtctaggctg cccatgtaag gaggcaaggc 240

ctggggacac ccgagatgcc tggttataat taacccagac atgtggctgc cccccccccc 300

ccaacacctg ctgcctctaa aaataaccct gtccctggtg gatcccctgc atgcgaagat 360

cttcgaacaa ggctgtgggg gactgagggc aggctgtaac aggcttgggg gccagggctt 420

atacgtgcct gggactccca aagtattact gttccatgtt cccggcgaag ggccagctgt 480

cccccgccag ctagactcag cacttagttt aggaaccagt gagcaagtca gcccttgggg 540

cagcccatac aaggccatgg ggctgggcaa gctgcacgcc tgggtccggg gtgggcacgg 600

tgcccgggca acgagctgaa agctcatctg ctctcagggg cccctccctg gggacagccc 660

ctcctggcta gtcacaccct gtaggctcct ctatataacc caggggcaca ggggctgccc 720

tcattctacc accacctcca cagcacagac agacactcag gagccagcca ggccaccatg 780

ccaaactggg gcggaggcgc aaaatgtgga gcctgtgaaa agaccgtcta ccatgcagaa 840

gaaatccagt gcaatggaag gagtttccac aagacgtgtt tccactgcat ggcctgcagg 900

aaggctcttg acagcacgac agtcgcggct catgagtcgg agatctactg caaggtgtgc 960

tatgggcgca gatatggccc caaagggatc gggtatggac aaggcgctgg ctgtctcagc 1020

acagacacgg gcgagcatct cggcctgcag ttccaacagt ccccaaagcc ggcacgctca 1080

gttaccacca gcaacccttc caaattcact gcgaagtttg gagagtccga gaagtgccct 1140

cgatgtggca agtcagtcta tgctgctgag aaggttatgg gaggtggcaa gccttggcac 1200

aagacctgtt tccgctgtgc catctgtggg aagagtctgg agtccacaaa tgtcactgac 1260

aaagatgggg aactttattg caaagtttgc tatgccaaaa attttggccc cacgggtatt 1320

gggtttggag gccttacaca acaagtggaa aagaaagaat gatcaacctc tggattacaa 1380

aatttgtgaa agattgactg gtattcttaa ctatgttgct ccttttacgc tatgtggata 1440

cgctgcttta atgcctttgt atcatgctat tgcttcccgt atggctttca ttttctcctc 1500

cttgtataaa tcctggttgc tgtctcttta tgaggagttg tggcccgttg tcaggcaacg 1560

tggcgtggtg tgcactgtgt ttgctgacgc aacccccact ggttggggca ttgccaccac 1620

ctgtcagctc ctttccggga ctttcgcttt ccccctccct attgccacgg cggaactcat 1680

cgccgcctgc cttgcccgct gctggacagg ggctcggctg ttgggcactg acaattccgt 1740

ggtgttgtcg gggaaatcat cgtcctttcc ttggctgctc gcctgtgttg ccacctggat 1800

tctgcgcggg acgtccttct gctacgtccc ttcggccctc aatccagcgg accttccttc 1860

ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt cgccttcgcc ctcagacgag 1920

tcggatctcc ctttgggccg cctccccgca ctgcccgggt ggcatccctg tgacccctcc 1980

ccagtgcctc tcctggccct ggaagttgcc actccagtgc ccaccagcct tgtcctaata 2040

aaattaagtt gcatcatttt gtctgactag gtgtccttct ataatattat ggggtggagg 2100

ggggtggtat ggagcaaggg gcccaagttg ggaagaaacc tgtagggcct gc 2152

<210> 9

<211> 1925

<212> DNA

<213> 人工序列

<220>

<223> 实验室中制备 - hTnT-CSRP3表达盒

<400> 9

ctcagtccat taggagccag tagcctggaa gatgtcttta cccccagcat cagttcaagt 60

ggagcagcac ataactcttg ccctctgcct tccaagattc tggtgctgag acttatggag 120

tgtcttggag gttgccttct gccccccaac cctgctccca gctggccctc ccaggcctgg 180

gttgctggcc tctgctttat caggattctc aagagggaca gctggtttat gttgcatgac 240

tgttccctgc atatctgctc tggttttaaa tagcttatct gagcagctgg aggaccacat 300

gggcttatat ggcgtggggt acatgttcct gtagccttgt ccctggcacc tgccaaaata 360

gcagccaaca ccccccaccc ccaccgccat ccccctgccc cacccgtccc ctgtcgcaca 420

ttcctccctc cgcagggctg gctcaccagg ccccagccca catgcctgct taaagccctc 480

tccatcctct gcctcaccca gtccccgctg agactgagca gacgcctcca ggatctgtcg 540

gcaggccacc atgccaaact ggggcggagg cgcaaaatgt ggagcctgtg aaaagaccgt 600

ctaccatgca gaagaaatcc agtgcaatgg aaggagtttc cacaagacgt gtttccactg 660

catggcctgc aggaaggctc ttgacagcac gacagtcgcg gctcatgagt cggagatcta 720

ctgcaaggtg tgctatgggc gcagatatgg ccccaaaggg atcgggtatg gacaaggcgc 780

tggctgtctc agcacagaca cgggcgagca tctcggcctg cagttccaac agtccccaaa 840

gccggcacgc tcagttacca ccagcaaccc ttccaaattc actgcgaagt ttggagagtc 900

cgagaagtgc cctcgatgtg gcaagtcagt ctatgctgct gagaaggtta tgggaggtgg 960

caagccttgg cacaagacct gtttccgctg tgccatctgt gggaagagtc tggagtccac 1020

aaatgtcact gacaaagatg gggaacttta ttgcaaagtt tgctatgcca aaaattttgg 1080

ccccacgggt attgggtttg gaggccttac acaacaagtg gaaaagaaag aatgatcaac 1140

ctctggatta caaaatttgt gaaagattga ctggtattct taactatgtt gctcctttta 1200

cgctatgtgg atacgctgct ttaatgcctt tgtatcatgc tattgcttcc cgtatggctt 1260

tcattttctc ctccttgtat aaatcctggt tgctgtctct ttatgaggag ttgtggcccg 1320

ttgtcaggca acgtggcgtg gtgtgcactg tgtttgctga cgcaaccccc actggttggg 1380

gcattgccac cacctgtcag ctcctttccg ggactttcgc tttccccctc cctattgcca 1440

cggcggaact catcgccgcc tgccttgccc gctgctggac aggggctcgg ctgttgggca 1500

ctgacaattc cgtggtgttg tcggggaaat catcgtcctt tccttggctg ctcgcctgtg 1560

ttgccacctg gattctgcgc gggacgtcct tctgctacgt cccttcggcc ctcaatccag 1620

cggaccttcc ttcccgcggc ctgctgccgg ctctgcggcc tcttccgcgt cttcgccttc 1680

gccctcagac gagtcggatc tccctttggg ccgcctcccc gcactgcccg ggtggcatcc 1740

ctgtgacccc tccccagtgc ctctcctggc cctggaagtt gccactccag tgcccaccag 1800

ccttgtccta ataaaattaa gttgcatcat tttgtctgac taggtgtcct tctataatat 1860

tatggggtgg aggggggtgg tatggagcaa ggggcccaag ttgggaagaa acctgtaggg 1920

cctgc 1925

<210> 10

<211> 2152

<212> DNA

<213> 人工序列

<220>

<223> 实验室中制备 - MHCK7-CSRP3表达盒

<400> 10

acccttcaga ttaaaaataa ctgaggtaag ggcctgggta ggggaggtgg tgtgagacgc 60

tcctgtctct cctctatctg cccatcggcc ctttggggag gaggaatgtg cccaaggact 120

aaaaaaaggc catggagcca gaggggcgag ggcaacagac ctttcatggg caaaccttgg 180

ggccctgctg tctagcatgc cccactacgg gtctaggctg cccatgtaag gaggcaaggc 240

ctggggacac ccgagatgcc tggttataat taacccagac atgtggctgc cccccccccc 300

ccaacacctg ctgcctctaa aaataaccct gtccctggtg gatcccctgc atgcgaagat 360

cttcgaacaa ggctgtgggg gactgagggc aggctgtaac aggcttgggg gccagggctt 420

atacgtgcct gggactccca aagtattact gttccatgtt cccggcgaag ggccagctgt 480

cccccgccag ctagactcag cacttagttt aggaaccagt gagcaagtca gcccttgggg 540

cagcccatac aaggccatgg ggctgggcaa gctgcacgcc tgggtccggg gtgggcacgg 600

tgcccgggca acgagctgaa agctcatctg ctctcagggg cccctccctg gggacagccc 660

ctcctggcta gtcacaccct gtaggctcct ctatataacc caggggcaca ggggctgccc 720

tcattctacc accacctcca cagcacagac agacactcag gagccagcca ggccaccatg 780

cccaattggg gtggaggagc taaatgtgga gcttgtgaaa aaacagttta tcatgctgaa 840

gaaattcaat gtaatggaag atcttttcat aaaacatgtt ttcattgtat ggcttgtaga 900

aaagcacttg attctacaac tgttgcagca catgaaagtg aaatctattg taaagtatgt 960

tatggaagaa gatatggacc aaaaggaatt ggatatggac aaggagcagg atgtctttct 1020

acagatactg gagaacattt gggattgcaa tttcaacaaa gtcctaaacc agctagatct 1080

gttacaacaa gtaatccatc aaaatttact gctaaatttg gagaatccga aaaatgtcct 1140

agatgtggaa aatcagtata tgctgctgaa aaagttatgg gaggtggaaa accatggcat 1200

aagacatgtt ttagatgtgc aatttgtggt aaatctttgg aatctacaaa tgttacagat 1260

aaagatggag aattgtattg taaagtttgt tatgctaaaa attttggacc tacaggtata 1320

ggatttggag gtttgacaca acaagttgaa aaaaaagaat gatcaacctc tggattacaa 1380

aatttgtgaa agattgactg gtattcttaa ctatgttgct ccttttacgc tatgtggata 1440

cgctgcttta atgcctttgt atcatgctat tgcttcccgt atggctttca ttttctcctc 1500

cttgtataaa tcctggttgc tgtctcttta tgaggagttg tggcccgttg tcaggcaacg 1560

tggcgtggtg tgcactgtgt ttgctgacgc aacccccact ggttggggca ttgccaccac 1620

ctgtcagctc ctttccggga ctttcgcttt ccccctccct attgccacgg cggaactcat 1680

cgccgcctgc cttgcccgct gctggacagg ggctcggctg ttgggcactg acaattccgt 1740

ggtgttgtcg gggaaatcat cgtcctttcc ttggctgctc gcctgtgttg ccacctggat 1800

tctgcgcggg acgtccttct gctacgtccc ttcggccctc aatccagcgg accttccttc 1860

ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt cgccttcgcc ctcagacgag 1920

tcggatctcc ctttgggccg cctccccgca ctgcccgggt ggcatccctg tgacccctcc 1980

ccagtgcctc tcctggccct ggaagttgcc actccagtgc ccaccagcct tgtcctaata 2040

aaattaagtt gcatcatttt gtctgactag gtgtccttct ataatattat ggggtggagg 2100

ggggtggtat ggagcaaggg gcccaagttg ggaagaaacc tgtagggcct gc 2152

<210> 11

<211> 1925

<212> DNA

<213> 人工序列

<220>

<223> 实验室中制备 - 优化的hTnT-CSRP3表达盒密码子

<400> 11

ctcagtccat taggagccag tagcctggaa gatgtcttta cccccagcat cagttcaagt 60

ggagcagcac ataactcttg ccctctgcct tccaagattc tggtgctgag acttatggag 120

tgtcttggag gttgccttct gccccccaac cctgctccca gctggccctc ccaggcctgg 180

gttgctggcc tctgctttat caggattctc aagagggaca gctggtttat gttgcatgac 240

tgttccctgc atatctgctc tggttttaaa tagcttatct gagcagctgg aggaccacat 300

gggcttatat ggcgtggggt acatgttcct gtagccttgt ccctggcacc tgccaaaata 360

gcagccaaca ccccccaccc ccaccgccat ccccctgccc cacccgtccc ctgtcgcaca 420

ttcctccctc cgcagggctg gctcaccagg ccccagccca catgcctgct taaagccctc 480

tccatcctct gcctcaccca gtccccgctg agactgagca gacgcctcca ggatctgtcg 540

gcaggccacc atgcccaatt ggggtggagg agctaaatgt ggagcttgtg aaaaaacagt 600

ttatcatgct gaagaaattc aatgtaatgg aagatctttt cataaaacat gttttcattg 660

tatggcttgt agaaaagcac ttgattctac aactgttgca gcacatgaaa gtgaaatcta 720

ttgtaaagta tgttatggaa gaagatatgg accaaaagga attggatatg gacaaggagc 780

aggatgtctt tctacagata ctggagaaca tttgggattg caatttcaac aaagtcctaa 840

accagctaga tctgttacaa caagtaatcc atcaaaattt actgctaaat ttggagaatc 900

cgaaaaatgt cctagatgtg gaaaatcagt atatgctgct gaaaaagtta tgggaggtgg 960

aaaaccatgg cataagacat gttttagatg tgcaatttgt ggtaaatctt tggaatctac 1020

aaatgttaca gataaagatg gagaattgta ttgtaaagtt tgttatgcta aaaattttgg 1080

acctacaggt ataggatttg gaggtttgac acaacaagtt gaaaaaaaag aatgatcaac 1140

ctctggatta caaaatttgt gaaagattga ctggtattct taactatgtt gctcctttta 1200

cgctatgtgg atacgctgct ttaatgcctt tgtatcatgc tattgcttcc cgtatggctt 1260

tcattttctc ctccttgtat aaatcctggt tgctgtctct ttatgaggag ttgtggcccg 1320

ttgtcaggca acgtggcgtg gtgtgcactg tgtttgctga cgcaaccccc actggttggg 1380

gcattgccac cacctgtcag ctcctttccg ggactttcgc tttccccctc cctattgcca 1440

cggcggaact catcgccgcc tgccttgccc gctgctggac aggggctcgg ctgttgggca 1500

ctgacaattc cgtggtgttg tcggggaaat catcgtcctt tccttggctg ctcgcctgtg 1560

ttgccacctg gattctgcgc gggacgtcct tctgctacgt cccttcggcc ctcaatccag 1620

cggaccttcc ttcccgcggc ctgctgccgg ctctgcggcc tcttccgcgt cttcgccttc 1680

gccctcagac gagtcggatc tccctttggg ccgcctcccc gcactgcccg ggtggcatcc 1740

ctgtgacccc tccccagtgc ctctcctggc cctggaagtt gccactccag tgcccaccag 1800

ccttgtccta ataaaattaa gttgcatcat tttgtctgac taggtgtcct tctataatat 1860

tatggggtgg aggggggtgg tatggagcaa ggggcccaag ttgggaagaa acctgtaggg 1920

cctgc 1925

<210> 12

<211> 2430

<212> DNA

<213> 人工序列

<220>

<223> 实验室中制备 - 载体基因组的全多核苷酸序列

<400> 12

ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60

cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120

gccaactcca tcactagggg ttcctaccct tcagattaaa aataactgag gtaagggcct 180

gggtagggga ggtggtgtga gacgctcctg tctctcctct atctgcccat cggccctttg 240

gggaggagga atgtgcccaa ggactaaaaa aaggccatgg agccagaggg gcgagggcaa 300

cagacctttc atgggcaaac cttggggccc tgctgtctag catgccccac tacgggtcta 360

ggctgcccat gtaaggaggc aaggcctggg gacacccgag atgcctggtt ataattaacc 420

cagacatgtg gctgcccccc cccccccaac acctgctgcc tctaaaaata accctgtccc 480

tggtggatcc cctgcatgcg aagatcttcg aacaaggctg tgggggactg agggcaggct 540

gtaacaggct tgggggccag ggcttatacg tgcctgggac tcccaaagta ttactgttcc 600

atgttcccgg cgaagggcca gctgtccccc gccagctaga ctcagcactt agtttaggaa 660

ccagtgagca agtcagccct tggggcagcc catacaaggc catggggctg ggcaagctgc 720

acgcctgggt ccggggtggg cacggtgccc gggcaacgag ctgaaagctc atctgctctc 780

aggggcccct ccctggggac agcccctcct ggctagtcac accctgtagg ctcctctata 840

taacccaggg gcacaggggc tgccctcatt ctaccaccac ctccacagca cagacagaca 900

ctcaggagcc agccaggcca ccatgccaaa ctggggcgga ggcgcaaaat gtggagcctg 960

tgaaaagacc gtctaccatg cagaagaaat ccagtgcaat ggaaggagtt tccacaagac 1020

gtgtttccac tgcatggcct gcaggaaggc tcttgacagc acgacagtcg cggctcatga 1080

gtcggagatc tactgcaagg tgtgctatgg gcgcagatat ggccccaaag ggatcgggta 1140

tggacaaggc gctggctgtc tcagcacaga cacgggcgag catctcggcc tgcagttcca 1200

acagtcccca aagccggcac gctcagttac caccagcaac ccttccaaat tcactgcgaa 1260

gtttggagag tccgagaagt gccctcgatg tggcaagtca gtctatgctg ctgagaaggt 1320

tatgggaggt ggcaagcctt ggcacaagac ctgtttccgc tgtgccatct gtgggaagag 1380

tctggagtcc acaaatgtca ctgacaaaga tggggaactt tattgcaaag tttgctatgc 1440

caaaaatttt ggccccacgg gtattgggtt tggaggcctt acacaacaag tggaaaagaa 1500

agaatgatca acctctggat tacaaaattt gtgaaagatt gactggtatt cttaactatg 1560

ttgctccttt tacgctatgt ggatacgctg ctttaatgcc tttgtatcat gctattgctt 1620

cccgtatggc tttcattttc tcctccttgt ataaatcctg gttgctgtct ctttatgagg 1680

agttgtggcc cgttgtcagg caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc 1740

ccactggttg gggcattgcc accacctgtc agctcctttc cgggactttc gctttccccc 1800

tccctattgc cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg acaggggctc 1860

ggctgttggg cactgacaat tccgtggtgt tgtcggggaa atcatcgtcc tttccttggc 1920

tgctcgcctg tgttgccacc tggattctgc gcgggacgtc cttctgctac gtcccttcgg 1980

ccctcaatcc agcggacctt ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc 2040

gtcttcgcct tcgccctcag acgagtcgga tctccctttg ggccgcctcc ccgcactgcc 2100

cgggtggcat ccctgtgacc cctccccagt gcctctcctg gccctggaag ttgccactcc 2160

agtgcccacc agccttgtcc taataaaatt aagttgcatc attttgtctg actaggtgtc 2220

cttctataat attatggggt ggaggggggt ggtatggagc aaggggccca agttgggaag 2280

aaacctgtag ggcctgcagg aacccctagt gatggagact ccctctctgc gcgctcgctc 2340

gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc 2400

agtgagcgag cgagcgcgca gagagggagt 2430

<210> 13

<211> 2203

<212> DNA

<213> 人工序列

<220>

<223> 实验室中制备 - 载体基因组的全多核苷酸序列

<400> 13

ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60

cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120

gccaactcca tcactagggg ttcctctcag tccattagga gccagtagcc tggaagatgt 180

ctttaccccc agcatcagtt caagtggagc agcacataac tcttgccctc tgccttccaa 240

gattctggtg ctgagactta tggagtgtct tggaggttgc cttctgcccc ccaaccctgc 300

tcccagctgg ccctcccagg cctgggttgc tggcctctgc tttatcagga ttctcaagag 360

ggacagctgg tttatgttgc atgactgttc cctgcatatc tgctctggtt ttaaatagct 420

tatctgagca gctggaggac cacatgggct tatatggcgt ggggtacatg ttcctgtagc 480

cttgtccctg gcacctgcca aaatagcagc caacaccccc cacccccacc gccatccccc 540

tgccccaccc gtcccctgtc gcacattcct ccctccgcag ggctggctca ccaggcccca 600

gcccacatgc ctgcttaaag ccctctccat cctctgcctc acccagtccc cgctgagact 660

gagcagacgc ctccaggatc tgtcggcagg ccaccatgcc aaactggggc ggaggcgcaa 720

aatgtggagc ctgtgaaaag accgtctacc atgcagaaga aatccagtgc aatggaagga 780

gtttccacaa gacgtgtttc cactgcatgg cctgcaggaa ggctcttgac agcacgacag 840

tcgcggctca tgagtcggag atctactgca aggtgtgcta tgggcgcaga tatggcccca 900

aagggatcgg gtatggacaa ggcgctggct gtctcagcac agacacgggc gagcatctcg 960

gcctgcagtt ccaacagtcc ccaaagccgg cacgctcagt taccaccagc aacccttcca 1020

aattcactgc gaagtttgga gagtccgaga agtgccctcg atgtggcaag tcagtctatg 1080

ctgctgagaa ggttatggga ggtggcaagc cttggcacaa gacctgtttc cgctgtgcca 1140

tctgtgggaa gagtctggag tccacaaatg tcactgacaa agatggggaa ctttattgca 1200

aagtttgcta tgccaaaaat tttggcccca cgggtattgg gtttggaggc cttacacaac 1260

aagtggaaaa gaaagaatga tcaacctctg gattacaaaa tttgtgaaag attgactggt 1320

attcttaact atgttgctcc ttttacgcta tgtggatacg ctgctttaat gcctttgtat 1380

catgctattg cttcccgtat ggctttcatt ttctcctcct tgtataaatc ctggttgctg 1440

tctctttatg aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt 1500

gctgacgcaa cccccactgg ttggggcatt gccaccacct gtcagctcct ttccgggact 1560

ttcgctttcc ccctccctat tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc 1620

tggacagggg ctcggctgtt gggcactgac aattccgtgg tgttgtcggg gaaatcatcg 1680

tcctttcctt ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac gtccttctgc 1740

tacgtccctt cggccctcaa tccagcggac cttccttccc gcggcctgct gccggctctg 1800

cggcctcttc cgcgtcttcg ccttcgccct cagacgagtc ggatctccct ttgggccgcc 1860

tccccgcact gcccgggtgg catccctgtg acccctcccc agtgcctctc ctggccctgg 1920

aagttgccac tccagtgccc accagccttg tcctaataaa attaagttgc atcattttgt 1980

ctgactaggt gtccttctat aatattatgg ggtggagggg ggtggtatgg agcaaggggc 2040

ccaagttggg aagaaacctg tagggcctgc aggaacccct agtgatggag actccctctc 2100

tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg 2160

cccgggcggc ctcagtgagc gagcgagcgc gcagagaggg agt 2203

<210> 14

<211> 2430

<212> DNA

<213> 人工序列

<220>

<223> 实验室中制备 - 载体基因组的全多核苷酸序列

<400> 14

ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60

cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120

gccaactcca tcactagggg ttcctaccct tcagattaaa aataactgag gtaagggcct 180

gggtagggga ggtggtgtga gacgctcctg tctctcctct atctgcccat cggccctttg 240

gggaggagga atgtgcccaa ggactaaaaa aaggccatgg agccagaggg gcgagggcaa 300

cagacctttc atgggcaaac cttggggccc tgctgtctag catgccccac tacgggtcta 360

ggctgcccat gtaaggaggc aaggcctggg gacacccgag atgcctggtt ataattaacc 420

cagacatgtg gctgcccccc cccccccaac acctgctgcc tctaaaaata accctgtccc 480

tggtggatcc cctgcatgcg aagatcttcg aacaaggctg tgggggactg agggcaggct 540

gtaacaggct tgggggccag ggcttatacg tgcctgggac tcccaaagta ttactgttcc 600

atgttcccgg cgaagggcca gctgtccccc gccagctaga ctcagcactt agtttaggaa 660

ccagtgagca agtcagccct tggggcagcc catacaaggc catggggctg ggcaagctgc 720

acgcctgggt ccggggtggg cacggtgccc gggcaacgag ctgaaagctc atctgctctc 780

aggggcccct ccctggggac agcccctcct ggctagtcac accctgtagg ctcctctata 840

taacccaggg gcacaggggc tgccctcatt ctaccaccac ctccacagca cagacagaca 900

ctcaggagcc agccaggcca ccatgcccaa ttggggtgga ggagctaaat gtggagcttg 960

tgaaaaaaca gtttatcatg ctgaagaaat tcaatgtaat ggaagatctt ttcataaaac 1020

atgttttcat tgtatggctt gtagaaaagc acttgattct acaactgttg cagcacatga 1080

aagtgaaatc tattgtaaag tatgttatgg aagaagatat ggaccaaaag gaattggata 1140

tggacaagga gcaggatgtc tttctacaga tactggagaa catttgggat tgcaatttca 1200

acaaagtcct aaaccagcta gatctgttac aacaagtaat ccatcaaaat ttactgctaa 1260

atttggagaa tccgaaaaat gtcctagatg tggaaaatca gtatatgctg ctgaaaaagt 1320

tatgggaggt ggaaaaccat ggcataagac atgttttaga tgtgcaattt gtggtaaatc 1380

tttggaatct acaaatgtta cagataaaga tggagaattg tattgtaaag tttgttatgc 1440

taaaaatttt ggacctacag gtataggatt tggaggtttg acacaacaag ttgaaaaaaa 1500

agaatgatca acctctggat tacaaaattt gtgaaagatt gactggtatt cttaactatg 1560

ttgctccttt tacgctatgt ggatacgctg ctttaatgcc tttgtatcat gctattgctt 1620

cccgtatggc tttcattttc tcctccttgt ataaatcctg gttgctgtct ctttatgagg 1680

agttgtggcc cgttgtcagg caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc 1740

ccactggttg gggcattgcc accacctgtc agctcctttc cgggactttc gctttccccc 1800

tccctattgc cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg acaggggctc 1860

ggctgttggg cactgacaat tccgtggtgt tgtcggggaa atcatcgtcc tttccttggc 1920

tgctcgcctg tgttgccacc tggattctgc gcgggacgtc cttctgctac gtcccttcgg 1980

ccctcaatcc agcggacctt ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc 2040

gtcttcgcct tcgccctcag acgagtcgga tctccctttg ggccgcctcc ccgcactgcc 2100

cgggtggcat ccctgtgacc cctccccagt gcctctcctg gccctggaag ttgccactcc 2160

agtgcccacc agccttgtcc taataaaatt aagttgcatc attttgtctg actaggtgtc 2220

cttctataat attatggggt ggaggggggt ggtatggagc aaggggccca agttgggaag 2280

aaacctgtag ggcctgcagg aacccctagt gatggagact ccctctctgc gcgctcgctc 2340

gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc 2400

agtgagcgag cgagcgcgca gagagggagt 2430

<210> 15

<211> 2203

<212> DNA

<213> 人工序列

<220>

<223> 实验室中制备 - 载体基因组的全多核苷酸序列

<400> 15

ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60

cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120

gccaactcca tcactagggg ttcctctcag tccattagga gccagtagcc tggaagatgt 180

ctttaccccc agcatcagtt caagtggagc agcacataac tcttgccctc tgccttccaa 240

gattctggtg ctgagactta tggagtgtct tggaggttgc cttctgcccc ccaaccctgc 300

tcccagctgg ccctcccagg cctgggttgc tggcctctgc tttatcagga ttctcaagag 360

ggacagctgg tttatgttgc atgactgttc cctgcatatc tgctctggtt ttaaatagct 420

tatctgagca gctggaggac cacatgggct tatatggcgt ggggtacatg ttcctgtagc 480

cttgtccctg gcacctgcca aaatagcagc caacaccccc cacccccacc gccatccccc 540

tgccccaccc gtcccctgtc gcacattcct ccctccgcag ggctggctca ccaggcccca 600

gcccacatgc ctgcttaaag ccctctccat cctctgcctc acccagtccc cgctgagact 660

gagcagacgc ctccaggatc tgtcggcagg ccaccatgcc caattggggt ggaggagcta 720

aatgtggagc ttgtgaaaaa acagtttatc atgctgaaga aattcaatgt aatggaagat 780

cttttcataa aacatgtttt cattgtatgg cttgtagaaa agcacttgat tctacaactg 840

ttgcagcaca tgaaagtgaa atctattgta aagtatgtta tggaagaaga tatggaccaa 900

aaggaattgg atatggacaa ggagcaggat gtctttctac agatactgga gaacatttgg 960

gattgcaatt tcaacaaagt cctaaaccag ctagatctgt tacaacaagt aatccatcaa 1020

aatttactgc taaatttgga gaatccgaaa aatgtcctag atgtggaaaa tcagtatatg 1080

ctgctgaaaa agttatggga ggtggaaaac catggcataa gacatgtttt agatgtgcaa 1140

tttgtggtaa atctttggaa tctacaaatg ttacagataa agatggagaa ttgtattgta 1200

aagtttgtta tgctaaaaat tttggaccta caggtatagg atttggaggt ttgacacaac 1260

aagttgaaaa aaaagaatga tcaacctctg gattacaaaa tttgtgaaag attgactggt 1320

attcttaact atgttgctcc ttttacgcta tgtggatacg ctgctttaat gcctttgtat 1380

catgctattg cttcccgtat ggctttcatt ttctcctcct tgtataaatc ctggttgctg 1440

tctctttatg aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt 1500

gctgacgcaa cccccactgg ttggggcatt gccaccacct gtcagctcct ttccgggact 1560

ttcgctttcc ccctccctat tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc 1620

tggacagggg ctcggctgtt gggcactgac aattccgtgg tgttgtcggg gaaatcatcg 1680

tcctttcctt ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac gtccttctgc 1740

tacgtccctt cggccctcaa tccagcggac cttccttccc gcggcctgct gccggctctg 1800

cggcctcttc cgcgtcttcg ccttcgccct cagacgagtc ggatctccct ttgggccgcc 1860

tccccgcact gcccgggtgg catccctgtg acccctcccc agtgcctctc ctggccctgg 1920

aagttgccac tccagtgccc accagccttg tcctaataaa attaagttgc atcattttgt 1980

ctgactaggt gtccttctat aatattatgg ggtggagggg ggtggtatgg agcaaggggc 2040

ccaagttggg aagaaacctg tagggcctgc aggaacccct agtgatggag actccctctc 2100

tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg 2160

cccgggcggc ctcagtgagc gagcgagcgc gcagagaggg agt 2203

<210> 16

<211> 13

<212> DNA

<213> 人工序列

<220>

<223> Kozak序列基序

<400> 16

gccgccrcca ugg 13

<210> 17

<211> 13

<212> DNA

<213> 人工序列

<220>

<223> Kozak序列基序

<400> 17

gccgccrcca ugc 13

<210> 18

<211> 10

<212> DNA

<213> 人工序列

<220>

<223> Kozak序列基序

<400> 18

gacaccaugg 10

<210> 19

<211> 10

<212> DNA

<213> 人工序列

<220>

<223> Kozak序列基序

<400> 19

gacaccaugc 10

<210> 20

<211> 141

<212> DNA

<213> 腺相关病毒

<400> 20

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60

gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120

actccatcac taggggttcc t 141

<210> 21

<211> 168

<212> DNA

<213> 腺相关病毒2

<400> 21

gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg 60

tcgcccggcc tcagtgagcg agcgagcgcg cagagaggga gtggccaact ccatcactag 120

gggttccttg tagttaatga ttaacccgcc atgctactta tctacgta 168

<210> 22

<211> 170

<212> DNA

<213> 腺相关病毒

<400> 22

ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120

aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta 170

<210> 23

<211> 145

<212> DNA

<213> 腺相关病毒

<400> 23

ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60

cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120

gccaactcca tcactagggg ttcct 145

<210> 24

<211> 141

<212> DNA

<213> 腺相关病毒

<400> 24

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60

ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120

gagcgcgcag ctgcctgcag g 141

<210> 25

<211> 168

<212> DNA

<213> 腺相关病毒2

<400> 25

tacgtagata agtagcatgg cgggttaatc attaactaca aggaacccct agtgatggag 60

ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 120

cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgc 168

<210> 26

<211> 133

<212> DNA

<213> 腺相关病毒2

<400> 26

aggaacccct agtgatggag actccctctc tgcgcgctcg ctcgctcact gaggccgggc 60

gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc 120

gcagagaggg agt 133

<210> 27

<211> 124

<212> DNA

<213> 人工序列

<220>

<223> 实验室中制备 - 载体填充序列

<400> 27

gcggcaattc agtcgataac tataacggtc ctaaggtagc gatttaaata cgcgctctct 60

taaggtagcc ccgggacgcg tcaattgact acaaaccgag tatctgcaga gggccctgcg 120

tatg 124

<210> 28

<211> 84

<212> DNA

<213> 人工序列

<220>

<223> 实验室中制备 - 载体填充序列

<400> 28

cttctgaggc ggaaagaacc agatcctctc ttaaggtagc atcgagattt aaattaggga 60

taacagggta atggcgcggg ccgc 84

<210> 29

<211> 63

<212> DNA

<213> 人工序列

<220>

<223> 实验室中制备 - 载体填充序列

<400> 29

gttacccagg ctggagtgca gtggcacatt tctgctcact gcaacctcct cctccctggg 60

ttc 63

<210> 30

<211> 573

<212> DNA

<213> 人工序列

<220>

<223> 实验室中制备 - 部分人β疱疹病毒5中的CAG启动子

<400> 30

acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat 60

aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga 120

gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc 180

ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt 240

atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtcga 300

ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac ccccaatttt 360

gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg ggggggcgcg 420

cgccaggcgg ggcggggcgg ggcgaggggc ggggcggggc gaggcggaga ggtgcggcgg 480

cagccaatca gagcggcgcg ctccgaaagt ttccttttat ggcgaggcgg cggcggcggc 540

ggccctataa aaagcgaagc gcgcggcggg cgg 573

<210> 31

<211> 771

<212> DNA

<213> 人工序列

<220>

<223> 实验室中制备 - MHCK7启动子

<400> 31

acccttcaga ttaaaaataa ctgaggtaag ggcctgggta ggggaggtgg tgtgagacgc 60

tcctgtctct cctctatctg cccatcggcc ctttggggag gaggaatgtg cccaaggact 120

aaaaaaaggc catggagcca gaggggcgag ggcaacagac ctttcatggg caaaccttgg 180

ggccctgctg tctagcatgc cccactacgg gtctaggctg cccatgtaag gaggcaaggc 240

ctggggacac ccgagatgcc tggttataat taacccagac atgtggctgc cccccccccc 300

ccaacacctg ctgcctctaa aaataaccct gtccctggtg gatcccctgc atgcgaagat 360

cttcgaacaa ggctgtgggg gactgagggc aggctgtaac aggcttgggg gccagggctt 420

atacgtgcct gggactccca aagtattact gttccatgtt cccggcgaag ggccagctgt 480

cccccgccag ctagactcag cacttagttt aggaaccagt gagcaagtca gcccttgggg 540

cagcccatac aaggccatgg ggctgggcaa gctgcacgcc tgggtccggg gtgggcacgg 600

tgcccgggca acgagctgaa agctcatctg ctctcagggg cccctccctg gggacagccc 660

ctcctggcta gtcacaccct gtaggctcct ctatataacc caggggcaca ggggctgccc 720

tcattctacc accacctcca cagcacagac agacactcag gagccagcca g 771

<210> 32

<211> 544

<212> DNA

<213> 智人

<400> 32

ctcagtccat taggagccag tagcctggaa gatgtcttta cccccagcat cagttcaagt 60

ggagcagcac ataactcttg ccctctgcct tccaagattc tggtgctgag acttatggag 120

tgtcttggag gttgccttct gccccccaac cctgctccca gctggccctc ccaggcctgg 180

gttgctggcc tctgctttat caggattctc aagagggaca gctggtttat gttgcatgac 240

tgttccctgc atatctgctc tggttttaaa tagcttatct gagcagctgg aggaccacat 300

gggcttatat ggcgtggggt acatgttcct gtagccttgt ccctggcacc tgccaaaata 360

gcagccaaca ccccccaccc ccaccgccat ccccctgccc cacccgtccc ctgtcgcaca 420

ttcctccctc cgcagggctg gctcaccagg ccccagccca catgcctgct taaagccctc 480

tccatcctct gcctcaccca gtccccgctg agactgagca gacgcctcca ggatctgtcg 540

gcag 544

<210> 33

<211> 502

<212> DNA

<213> 智人

<400> 33

ctcagtccat taggagccag tagcctggaa gatgtcttta cccccagcat cagttcaagt 60

ggagcagcac ataactcttg ccctctgcct tccaagattc tggtgctgag acttatggag 120

tgtcttggag gttgccttct gccccccaac cctgctccca gctggccctc ccaggcctgg 180

gttgctggcc tctgctttat caggattctc aagagggaca gctggtttat gttgcatgac 240

tgttccctgc atatctgctc tggttttaaa tagcttatct gagcagctgg aggaccacat 300

gggcttatat ggcgtggggt acatgttcct gtagccttgt ccctggcacc tgccaaaata 360

gcagccaaca ccccccaccc ccaccgccat ccccctgccc cacccgtccc ctgtcgcaca 420

ttcctccctc cgcagggctg gctcaccagg ccccagccca catgcctgct taaagccctc 480

tccatcctct gcctcaccca gt 502

<210> 34

<211> 5464

<212> DNA

<213> 小家鼠

<400> 34

ggtaccggat cctgcaaggt cacacaaggg tctccaccca ccaggtgccc tagtctcaat 60

ttcagtttcc atgccttgtt ctcacaatgc tggcctcccc agagctaatt tggactttgt 120

ttttatttca aaagggcctg aatgaggagt agatcttgtg ctacccagct ctaagggtgc 180

ccgtgaagcc ctcagacctg gagcctttgc aacagccctt taggtggaag cagaataaag 240

caattttcct taaagccaaa atcctgcctc tagactcttc ttctctgacc tcggtccctg 300

ggctctaggg tggggaggtg gggcttggaa gaagaaggtg gggaagtggc aaaagccgat 360

ccctagggcc ctgtgaagtt cggagccttc cctgtacagc actggctcat agatcctcct 420

ccagccaaac atagcaagaa gtgatacctc ctttgtgact tccccaggcc cagtacctgt 480

caggttgaaa caggatttag agaagcctct gaactcacct gaactctgaa gctcatccac 540

caagcaagca cctaggtgcc actgctagtt agtatcctac gctgataata tgcagagctg 600

ggccacagaa gtcctggggt gtaggaactg accagtgact tttcagtcgg caaaggtatg 660

accccctcag cagatgtagt aatgtcccct tagatcccat cccaggcagg tctctaagag 720

gacatgggat gagagatgta gtcatgtggc attccaaaca cagctatcca cagtgtccct 780

tgccccttcc acttagccag gaggacagta accttagcct atctttcttc ctccccatcc 840

tcccaggaca caccccctgg tctgcagtat tcatttcttc cttcacgtcc cctctgtgac 900

ttccatttgc aaggcttttg acctctgcag ctgctggaag atagagtttg gccctaggtg 960

tggcaagcca tctcaagaga aagcagacaa cagggggacc agattttgga aggatcagga 1020

actaaatcac tggcgggcct gggggtagaa aaaagagtga gtgagtccgc tccagctaag 1080

ccaagctagt ccccgagata ctctgccaca gctgggctgc tcggggtagc tttaggaatg 1140

tgggtctgaa agacaatggg attggaagac atctctttga gtctcccctc aaccccacct 1200

acagacacac tcgtgtgtgg ccagactcct gttcaacagc cctctgtgtt ctgaccactg 1260

agctaggcaa ccagagcatg ggccctgtgc tgaggatgaa gagttggtta ccaatagcaa 1320

aaacagcagg ggagggagaa cagagaacga aataaggaag gaagaaggaa aggccagtca 1380

atcagatgca gtcagaagag atgggaagcc aacacacagc ttgagcagag gaaacagaaa 1440

agggagagat tctgggcata aggaggccac agaaagaaga gcccaggccc cccaagtctc 1500

ctctttatac cctcatcccg tctcccaatt aagcccactc ttcttcctag atcagacctg 1560

agctgcagcg aagagacccg tagggaggat cacactggat gaaggagatg tgtggagaag 1620

tccagggaac ctaagagcca gagcctaaaa gagcaagaga taaaggtgct tcaaaggtgg 1680

ccaggctgtg cacacagagg gtcgaggact ggtggtagag cctcaagata aggatgatgc 1740

tcagaatggg cggggggggg gattctgggg gggggagaga gaaggtgaga aggagcctgg 1800

aacagagaat ctggaagcgc tggaaacgat accataaagg gaagaaccca ggctaccttt 1860

agatgtaaat catgaaagac agggagaagg gaagctggag agagtagaag gaccccgggg 1920

caagacattg aagcaaggac aagccaggtt gagcgctccg tgaaatcagc ctgctgaagg 1980

cagagccctg gtatgagcac cagaacagca gaggctaggg ttaatgtcga gacagggaac 2040

agaaggtaga cacaggaaca gacagagacg ggggagccag gtaacaaagg aatggtcctt 2100

ctcacctgtg gccagagcgt ccatctgtgt ccacatactc tagaatgttc atcagactgc 2160

agggctggct tgggaggcag ctggaaagag tatgtgagag ccaggggaga caagggggcc 2220

taggaaagga agaagagggc aaaccaggcc acacaagagg gcagagccca gaactgagtt 2280

aactccttcc ttgttgcatc ttccatagga ggcagtggga actctgtgac caccatcccc 2340

catgagcccc cactacccat accaagtttg gcctgagtgg cattctaggt tccctgagga 2400

cagagcctgg cctttgtctc ttggacctga cccaagctga cccaatgttc tcagtacctt 2460

atcatgccct caagagcttg agaaccaggc agtgacatat taggccatgg gctaaccctg 2520

gagcttgcac acaggagcct caagtgacct ccagggacac agctgcagac aggtggcctt 2580

tatccccaaa gagcaaccat ttggcatagg tggctgcaaa tgggaatgca aggttgaatc 2640

aggtcccttc aagaatactg catgcaagac ctaagacccc tggagagagg ggtatgctcc 2700

tgcccccacc caccataagg ggagtgaact atcctagggg gctggcgacc ttggggagac 2760

accacattac tgagagtgct gagcccagaa aaactgaccg ccctgtgtcc tgcccacctc 2820

cacactctag agctatattg agaggtgaca gtagataggg tgggagctgg tagcagggag 2880

agtgttcctg ggtgtgaggg tgtaggggaa agccagagca ggggagtctg gctttgtctc 2940

ctgaacacaa tgtctactta gttataacag gcatgacctg ctaaagaccc aacatctacg 3000

acctctgaaa agacagcagc cctggaggac aggggttgtc tctgagcctt gggtgcttga 3060

tggtgccaca aaggagggca tgagtgtgag tataaggccc caggagcgtt agagaagggc 3120

acttgggaag gggtcagtct gcagagcccc tatccatgga atctggagcc tggggccaac 3180

tggtgtaaat ctctgggcct gccaggcatt caaagcagca cctgcatcct ctggcagcct 3240

ggggaggcgg aagggagcaa ccccccactt ataccctttc tccctcagcc ccaggattaa 3300

cacctctggc cttccccctt cccacctccc atcaggagtg gagggttgca gagggagggt 3360

aaaaacctac atgtccaaac atcatggtgc acgatatatg gatcagtatg tgtagaggca 3420

agaaaggaaa tctgcaggct taactgggtt aatgtgtaaa gtctgtgtgc atgtgtgtgt 3480

gtctgactga aaacgggcat ggctgtgcag ctgttcagtt ctgtgcgtga ggttaccaga 3540

ctgcaggttt gtgtgtaaat tgcccaaggc aaagtgggtg aatcccttcc atggtttaaa 3600

gagattggat gatggcctgc atctcaagga ccatggaaaa tagaatggac actctatatg 3660

tgtctctaag ctaaggtagc aaggtctttg gaggacacct gtctagagat gtgggcaaca 3720

gagactacag acagtatctg tacagagtaa ggagagagag gagggggtgt agaattctct 3780

tactatcaaa gggaaactga gtcgtgcacc tgcaaagtgg atgctctccc tagacatcat 3840

gactttgtct ctggggagcc agcactgtgg aacttcaggt ctgagagagt aggaggctcc 3900

cctcagcctg aagctatgca gatagccagg gttgaaaggg ggaagggaga gcctgggatg 3960

ggagcttgtg tgttggaggc aggggacaga tattaagcct ggaagagaag gtgaccctta 4020

cccagttgtt caactcaccc ttcagattaa aaataactga ggtaagggcc tgggtagggg 4080

aggtggtgtg agacgctcct gtctctcctc tatctgccca tcggcccttt ggggaggagg 4140

aatgtgccca aggactaaaa aaaggccatg gagccagagg ggcgagggca acagaccttt 4200

catgggcaaa ccttggggcc ctgctgtcct cctgtcacct ccagagccaa gggatcaaag 4260

gaggaggagc caggacagga gggaagtggg agggagggtc ccagcagagg actccaaatt 4320

taggcagcag gcatatggga tgggatataa aggggctgga gcactgagag ctgtcagaga 4380

tttctccaac ccaggtaaga gggagtttcg ggtgggggct cttcacccac accagacctc 4440

tccccaccta gaaggaaact gcctttcctg gaagtggggt tcaggccggt cagagatctg 4500

acagggtggc cttccaccag cctgggaagt tctcagtggc aggaggtttc cacaagaaac 4560

actggatgcc ccttccctta cgctgtcttc tccatcttcc tcctggggat gctcctcccc 4620

gtcttggttt atcttggctc ttcgtcttca gcaagatttg ccctgtgctg tccactccat 4680

ctttctctac tgtctccgtg ccttgccttg ccttcttgcg tgtccttcct ttccacccat 4740

ttctcacttc accttttctc cccttctcat ttgtattcat ccttccttcc ttccttcctt 4800

ccttccttcc ttccttcctt ccttcctttc tcccttcctt ccttccttcc ttccttcctt 4860

ccttccttcc ttcctgtgtc agagtgctga gaatcacacc tggggttccc acccttatgt 4920

aaacaatctt ccagtgagcc acagcttcag tgctgctggg tgctctctta ccttcctcac 4980

cccctggctt gtcctgttcc atcctggtca ggatctctag attggtctcc cagcctctgc 5040

tactcctctt cctgcctgtt cctctctctg tccagctgcg ccactgtggt gcctcgttcc 5100

agctgtggtc cacattcttc aggattctct gaaaagttaa ccaggtgaga atgtttcccc 5160

tgtagacagc agatcacgat tctcccggaa gtcaggcttc cagccctctc tttctctgcc 5220

cagctgcccg gcactcttag caaacctcag gcacccttac cccacataga cctctgacag 5280

agaagcaggc actttacatg gagtcctggt gggagagcca taggctacgg tgtaaaagag 5340

gcagggaagt ggtggtgtag gaaagtcagg acttcacata gaagcctagc ccacaccaga 5400

aatgacagac agatccctcc tatctccccc ataagagttt gagtcgaccc gcggccccga 5460

attg 5464

<210> 35

<211> 413

<212> DNA

<213> 原鸡

<400> 35

gggataaaag cagtctgggc tttcacatga cagcatctgg ggctgcggca gagggtcggg 60

tccgaagcgc tgccttatca gcgtccccag ccctgggagg tgacagctgg ctggcttgtg 120

tcagcccctc gggcactcac gtatctccgt ccgacgggtt taaaatagca aaactctgag 180

gccacacaat agcttgggct tatatgggct cctgtggggg aagggggagc acggaggggg 240

ccggggccgc tgctgccaaa atagcagctc acaagtgttg cattcctctc tgggcgccgg 300

gcacattcct gctggctctg cccgccccgg ggtgggcgcc ggggggacct taaagcctct 360

gccccccaag gagcccttcc cagacagccg ccggcaccca ccgctccgtg gga 413

<210> 36

<211> 1090

<212> DNA

<213> 智人

<400> 36

ctctcagccc tggaagtcct tgctcacagc cgaggcgccg agagcgcttg ctctgcccag 60

atctgcgcga gtctggcgcc cgcgctctga acggcgtcgc tgcccagccc ccttccccgg 120

gaggtgggag cggccaccca gggccccgtg gctgcccttg taaggaggcg aggcccgagg 180

acacccgaga cgcccggtta taattaacca ggacacgtgg cgaacccccc tccaacacct 240

gcccccgaac ccccccatac ccagcgcctc gggtctcggc ctttgcggca gaggagacag 300

caaagcgccc tctaaaaata actcctttcc cggcgaccga gaccctccct gtcccccgca 360

cagcggaaat ctcccagtgg caccgagggg gcgagggtta agtggggggg agggtgacca 420

ccgcctccca cccttgccct gagtttgaat ctctccaact cagccagcct cagtttcccc 480

tccactcagt ccctaggagg aaggggcgcc caagcgcggg tttctggggt tagactgccc 540

tccattgcaa ttggtccttc tcccggcctc tgcttcctcc agctcacagg gtatctgctc 600

ctcctggagc cacaccttgg ttccccgagg tgccgctggg actcgggtag gggtgagggc 660

ccagggggca cagggggagc cgagggccac aggaagggct ggtggctgaa ggagactcag 720

gggccagggg acggtggctt ctacgtgctt gggacgttcc cagccaccgt cccatgttcc 780

cggcgggggg ccagctgtcc ccaccgccag cccaactcag cacttggtca gggtatcagc 840

ttggtggggg ggcgtgagcc cagcccctgg ggcggctcag cccatacaag gccatggggc 900

tgggcgcaaa gcatgcctgg gttcagggtg ggtatggtgc gggagcaggg aggtgagagg 960

ctcagctgcc ctccagaact cctccctggg gacaacccct cccagccaat agcacagcct 1020

aggtccccct atataaggcc acggctgctg gcccttcctt tgggtcagtg tcacctccag 1080

gatacagaca 1090

<210> 37

<211> 253

<212> DNA

<213> 智人

<400> 37

gcccagcacc ccaaggcggc caacgccaaa actctccctc ctcctcttcc tcaatctcgc 60

tctcgctctt tttttttttc gcaaaaggag gggagagggg gtaaaaaaat gctgcactgt 120

gcggcgaagc cggtgagtga gcggcgcggg gccaatcagc gtgcgccgtt ccgaaagttg 180

ccttttatgg ctcgagcggc cgcggcggcg ccctataaaa cccagcggcg cgacgcgcca 240

ccaccgccga gtc 253

<210> 38

<211> 281

<212> DNA

<213> 原鸡

<400> 38

ggtcgaggtg agccccacgt tctgcttcac tctccccatc tcccccccct ccccaccccc 60

aattttgtat ttatttattt tttaattatt ttgtgcagcg atgggggcgg gggggggggg 120

ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg cggggcgagg cggagaggtg 180

cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg aggcggcggc 240

ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcggg a 281

<210> 39

<211> 220

<212> DNA

<213> 人β疱疹病毒5

<400> 39

tggtgatgcg gttttggcag tacaccaatg ggcgtggata gcggtttgac tcacggggat 60

ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt ttggcaccaa aatcaacggg 120

actttccaaa atgtcgtaat aaccccgccc cgttgacgca aatgggcggt aggcgtgtac 180

ggtgggaggt ctatataagc agagctcgtt tagtgaaccg 220

<210> 40

<211> 583

<212> DNA

<213> 人β疱疹病毒5

<400> 40

tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180

atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360

catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420

atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480

ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540

acggtgggag gtctatataa gcagagctgg tttagtgaac cgt 583

<210> 41

<211> 508

<212> DNA

<213> 人β疱疹病毒5

<400> 41

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 60

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 120

atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 180

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 240

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 300

catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 360

atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 420

ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 480

acggtgggag gtctatataa gcagagct 508

<210> 42

<211> 573

<212> DNA

<213> 人工序列

<220>

<223> 实验室中制备 - 部分人β疱疹病毒5中的CAG启动子

<400> 42

acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat 60

aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga 120

gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc 180

ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt 240

atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtcga 300

ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac ccccaatttt 360

gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg ggggggcgcg 420

cgccaggcgg ggcggggcgg ggcgaggggc ggggcggggc gaggcggaga ggtgcggcgg 480

cagccaatca gagcggcgcg ctccgaaagt ttccttttat ggcgaggcgg cggcggcggc 540

ggccctataa aaagcgaagc gcgcggcggg cgg 573

<210> 43

<211> 580

<212> DNA

<213> 人工序列

<220>

<223> 实验室中制备 - 部分人β疱疹病毒5中的CAG启动子

<400> 43

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 60

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 120

atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 180

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 240

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 300

catgtcgagg tgagccccac gttctgcttc actctcccca tctccccccc ctccccaccc 360

ccaattttgt atttatttat tttttaatta ttttgtgcag cgatgggggc gggggggggg 420

ggggcgcgcg ccaggcgggg cggggcgggg cgaggggcgg ggcggggcga ggcggagagg 480

tgcggcggca gccaatcaga gcggcgcgct ccgaaagttt ccttttatgg cgaggcggcg 540

gcggcggcgg ccctataaaa agcgaagcgc gcggcgggcg 580

<210> 44

<211> 455

<212> DNA

<213> 智人

<400> 44

caacctttgg agctaagcca gcaatggtag agggaagatt ctgcacgtcc cttccaggcg 60

gcctccccgt caccaccccc cccaacccgc cccgaccgga gctgagagta attcatacaa 120

aaggactcgc ccctgccttg gggaatccca gggaccgtcg ttaaactccc actaacgtag 180

aacccagaga tcgctgcgtt cccgccccct cacccgcccg ctctcgtcat cactgaggtg 240

gagaatagca tgcgtgaggc tccggtgccc gtcagtgggc agagcgcaca tcgcccacag 300

tccccgagaa gttgggggga ggggtcggca attgaacggg tgcctagaga aggtggcgcg 360

gggtaaactg ggaaagtgat gtcgtgtact ggctccgcct ttttcccgag ggtgggggag 420

aaccgtatat aagtgcagta gtcgccgtga acgtt 455

<210> 45

<211> 401

<212> DNA

<213> 智人

<400> 45

agtgcaagtg ggttttagga ccaggatgag gcggggtggg ggtgcctacc tgacgaccga 60

ccccgaccca ctggacaagc acccaacccc cattccccaa attgcgcatc ccctatcaga 120

gagggggagg ggaaacagga tgcggcgagg cgcgtgcgca ctgccagctt cagcaccgcg 180

gacagtgcct tcgcccccgc ctggcggcgc gcgccaccgc cgcctcagca ctgaaggcgc 240

gctgacgtca ctcgccggtc ccccgcaaac tccccttccc ggccaccttg gtcgcgtccg 300

cgccgccgcc ggcccagccg gaccgcacca cgcgaggcgc gagatagggg ggcacgggcg 360

cgaccatctg cgctgcggcg ccggcgactc agcgctgcct c 401

<210> 46

<211> 448

<212> DNA

<213> 智人

<400> 46

agtgcaagtg ggttttagga ccaggatgag gcggggtggg ggtgcctacc tgacgaccga 60

ccccgaccca ctggacaagc acccaacccc cattccccaa attgcgcatc ccctatcaga 120

gagggggagg ggaaacagga tgcggcgagg cgcgtgcgca ctgccagctt cagcaccgcg 180

gacagtgcct tcgcccccgc ctggcggcgc gcgccaccgc cgcctcagca ctgaaggcgc 240

gctgacgtca ctcgccggtc ccccgcaaac tccccttccc ggccaccttg gtcgcgtccg 300

cgccgccgcc ggcccagccg gaccgcacca cgcgaggcgc gagatagggg ggcacgggcg 360

cgaccatctg cgctgcggcg ccggcgactc agcgctgcct cagtctgcgg tgggcagcgg 420

aggagtcgtg tcgtgcctga gagcgcag 448

<210> 47

<211> 422

<212> DNA

<213> 智人

<400> 47

ctgcagaggg ccctgcgtat gagtgcaagt gggttttagg accaggatga ggcggggtgg 60

gggtgcctac ctgacgaccg accccgaccc actggacaag cacccaaccc ccattcccca 120

aattgcgcat cccctatcag agagggggag gggaaacagg atgcggcgag gcgcgtgcgc 180

actgccagct tcagcaccgc ggacagtgcc ttcgcccccg cctggcggcg cgcgccaccg 240

ccgcctcagc actgaaggcg cgctgacgtc actcgccggt cccccgcaaa ctccccttcc 300

cggccacctt ggtcgcgtcc gcgccgccgc cggcccagcc ggaccgcacc acgcgaggcg 360

cgagataggg gggcacgggc gcgaccatct gcgctgcggc gccggcgact cagcgctgcc 420

tc 422

<210> 48

<211> 281

<212> DNA

<213> 智人

<400> 48

acttgtggac aaagtttgct ctattccacc tcctccaggc cctccttggg tccatcaccc 60

caggggtgct gggtccatcc cacccccagg cccacacagg cttgcagtat tgtgtgcggt 120

atggtcaggg cgtccgagag caggtttcgc agtggaaggc aggcaggtgt tggggaggca 180

gttaccgggg caacgggaac agggcgtttt ggaggtggtt gccatgggga cctggatgct 240

gacgaaggct cgcgaggctg tgagcagcca cagtgccctg c 281

<210> 49

<211> 851

<212> DNA

<213> 人工序列

<220>

<223> 实验室中制备 - eSYN启动子多核苷酸

<400> 49

gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60

catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120

acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180

ctttccattg acgtcaatgg gtggactatt tacggtaaac tgcccacttg gcagtacatc 240

aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300

ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360

tagtcatcgc tattaccatg gctgcagagg gccctgcgta tgagtgcaag tgggttttag 420

gaccaggatg aggcggggtg ggggtgccta cctgacgacc gaccccgacc cactggacaa 480

gcacccaacc cccattcccc aaattgcgca tcccctatca gagaggggga ggggaaacag 540

gatgcggcga ggcgcgtcgc gactgccagc ttcagcaccg cggacagtgc cttcgccccc 600

gcctggcggc gcgcgccacc gccgcctcag cactgaaggc gcgctgacgt cactcgccgg 660

tcccccgcaa actccccttc ccggccacct tggtcgcgtc cgcgccgccg ccggcccagc 720

cggaccgcac cacgcgaggc gcgagatagg ggggcacggg cgcgaccatc tgcgctgcgg 780

cgccggcgac tcagcgctgc ctcagtctgc ggtgggcagc ggaggagtcg tgtcgtgcct 840

gagagcgcag g 851

<210> 50

<211> 304

<212> DNA

<213> 人β疱疹病毒5

<400> 50

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 60

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 120

atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 180

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 240

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 300

catg 304

<210> 51

<211> 953

<212> DNA

<213> 智人

<400> 51

cgcgtccgcc cgcgagcaca gagcctcgcc tttgccgatc cgccgcccgt ccacacccgc 60

cgccaggtaa gcccggccag ccgaccgggg catgcggccg cggcccttcg cccgtgcaga 120

gccgccgtct gggccgcagc ggggggcgca tggggcggaa ccggaccgcc gtggggggcg 180

cgggagaagc ccctgggcct ccggagatgg gggacacccc acgccagttc gcaggcgcga 240

ggccgcgctc gggcgggcgc gctccggggg tgccgctctc ggggcggggg caaccggcgg 300

ggtctttgtc tgagccgggc tcttgccaat ggggatcgca cggtgggcgc ggcgtagccc 360

ccgtcaggcc cggtgggggc tggggcgcca tgcgcgtgcg cgctggtcct ttgggcgcta 420

actgcgtgcg cgctgggaat tggcgctaat tgcgcgtgcg cgctgggact caatggcgct 480

aatcgcgcgt gcgttctggg gcccgggcgc ttgcgccact tcctgcccga gccgctggcg 540

cccgagggtg tggccgctgc gtgcgcgcgc gcgacccggt cgctgtttga accgggcgga 600

ggcggggctg gcgcccggtt gggagggggt tggggcctgg cttcctgccg cgcgccgcgg 660

ggacgcctcc gaccagtgtt tgccttttat ggtaataacg cggccggccc ggcttccttt 720

gtccccaatc tgggcgcgcg ccggcgcccc ctggcggcct aaggactcgg cgcgccggaa 780

gtggccaggg cggcagcggc tgctcttggc ggccccgagg tgactatagc cttcttttgt 840

gtcttgatag ttcgccagcc tctgctaacc atgttcatgc cttcttcttt ttcctacagc 900

tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt tggcaaagaa ttc 953

<210> 52

<211> 1068

<212> DNA

<213> 人工序列

<220>

<223> 实验室中制备 - 鸡β-肌动蛋白外显子/内含子加兔球蛋白内含子

<400> 52

gtcgctgcgc gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc 60

cggctctgac tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg 120

ggctgtaatt agcgcttggt ttaatgacgg cttgtttctt ttctgtggct gcgtgaaagc 180

cttgaggggc tccgggaggg ccctttgtgc ggggggagcg gctcgggggg tgcgtgcgtg 240

tgtgtgtgcg tggggagcgc cgcgtgcggc tccgcgctgc ccggcggctg tgagcgctgc 300

gggcgcggcg cggggctttg tgcgctccgc agtgtgcgcg aggggagcgc ggccgggggc 360

ggtgccccgc ggtgcggggg gggctgcgag gggaacaaag gctgcgtgcg gggtgtgtgc 420

gtgggggggt gagcaggggg tgtgggcgcg tcggtcgggc tgcaaccccc cctgcacccc 480

cctccccgag ttgctgagca cggcccggct tcgggtgcgg ggctccgtac ggggcgtggc 540

gcggggctcg ccgtgccggg cggggggtgg cggcaggtgg gggtgccggg cggggcgggg 600

ccgcctcggg ccggggaggg ctcgggggag gggcgcggcg gcccccggag cgccggcggc 660

tgtcgaggcg cggcgagccg cagccattgc cttttatggt aatcgtgcga gagggcgcag 720

ggacttcctt tgtcccaaat ctgtgcggag ccgaaatctg ggaggcgccg ccgcaccccc 780

tctagcgggc gcggggcgaa gcggtgcggc gccggcagga aggaaatggg cggggagggc 840

cttcgtgcgt cgccgcgccg ccgtcccctt ctccctctcc agcctcgggg ctgtccgcgg 900

ggggacggct gccttcgggg gggacggggc agggcggggt tcggcttctg gcgtgtgacc 960

ggcggctcta gagcctctgc taaccatgtt catgccttct tctttttcct acagctcctg 1020

ggcaacgtgc tggttattgt gctgtctcat cattttggca aagaattc 1068

<210> 53

<211> 149

<212> DNA

<213> 人工序列

<220>

<223> 实验室中制备 - 嵌合体内含子序列

<400> 53

ggtaagttta gtctttttgt cttttatttc aggtcccgga tccggtggtg gtgcaaatca 60

aagaactgct cctcagtgga tgttgccttt acttctaggc ctgtacggaa gtgttacttc 120

tgctctaaaa gctgcggaat tgtacccgc 149

<210> 54

<211> 126

<212> DNA

<213> 智人

<400> 54

agtctgcggt gggcagcgga ggagtcgtgt cgtgcctgag agcgcagctg tgctcctggg 60

caccgcgcag tccgcccccg cggctcctgg ccagaccacc cctaggaccc cctgccccaa 120

gtcgca 126

<210> 55

<211> 121

<212> DNA

<213> 人β疱疹病毒5

<400> 55

tcagatcgcc tggagaggcc atccacgctg ttttgacctc catagtggac accgggaccg 60

atccagcctc cgcggccggg aacggtgcat tggaacgcgg attccccgtg ccaagagtga 120

c 121

<210> 56

<211> 512

<212> DNA

<213> 人工序列

<220>

<223> 实验室中制备 - 腺病毒衍生增强子元件

<400> 56

ctcactctct tccgcatcgc tgtctgcgag ggccagctgt tgggctcgcg gttgaggaca 60

aactcttcgc ggtctttcca gtactcttgg atcggaaacc cgtcggcctc cgaacggtac 120

tccgccaccg agggacctga gcgagtccgc atcgaccgga tcggaaaacc tctcgagaaa 180

ggcgtctaac cagtcacagt cgcaaggtag gctgagcacc gtggcgggcg gcagcgggtg 240

gcggtcgggg ttgtttctgg cggaggtgct gctgatgatg taattaaagt aggcggtctt 300

gagacggcgg atggtcgagg tgaggtgtgg caggcttgag atccagctgt tggggtgagt 360

actccctctc aaaagcgggc attacttctg cgctaagatt gtcagtttcc aaaaacgagg 420

aggatttgat attcacctgg cccgatctgg ccatacactt gagtgacaat gacatccact 480

ttgcctttct ctccacaggt gtccactccc ag 512

<210> 57

<211> 956

<212> DNA

<213> 智人

<400> 57

ctttttcgca acgggtttgc cgccagaaca caggtaagtg ccgtgtgtgg ttcccgcggg 60

cctggcctct ttacgggtta tggcccttgc gtgccttgaa ttacttccac ctggctccag 120

tacgtgattc ttgatcccga gctggagcca ggggcgggcc ttgcgcttta ggagcccctt 180

cgcctcgtgc ttgagttgag gcctggcctg ggcgctgggg ccgccgcgtg cgaatctggt 240

ggcaccttcg cgcctgtctc gctgctttcg ataagtctct agccatttaa aatttttgat 300

gacgtgctgc gacgcttttt ttctggcaag atagtcttgt aaatgcgggc caggatctgc 360

acactggtat ttcggttttt gggcccgcgg ccggcgacgg ggcccgtgcg tcccagcgca 420

catgttcggc gaggcggggc ctgcgagcgc ggccaccgag aatcggacgg gggtagtctc 480

aagctggccg gcctgctctg gtgcctggcc tcgcgccgcc gtgtatcgcc ccgccctggg 540

cggcaaggct ggcccggtcg gcaccagttg cgtgagcgga aagatggccg cttcccggcc 600

ctgctccagg gggctcaaaa tggaggacgc ggcgctcggg agagcgggcg ggtgagtcac 660

ccacacaaag gaaaagggcc tttccgtcct cagccgtcgc ttcatgtgac tccacggagt 720

accgggcgcc gtccaggcac ctcgattagt tctggagctt ttggagtacg tcgtctttag 780

gttgggggga ggggttttat gcgatggagt ttccccacac tgagtgggtg gagactgaag 840

ttaggccagc ttggcacttg atgtaattct ccttggaatt tggccttttt gagtttggat 900

cttggttcat tctcaagcct cagacagtgg ttcaaagttt ttttcttcca tttcag 956

<210> 58

<211> 939

<212> DNA

<213> 智人

<400> 58

gtaagtgccg tgtgtggttc ccgcgggcct ggcctcttta cgggttatgg cccttgcgtg 60

ccttgaatta cttccacctg gctgcagtac gtgattcttg atcccgagct tcgggttgga 120

agtgggtggg agagttcgag gccttgcgct taaggagccc cttcgcctcg tgcttgagtt 180

gaggcctggc ctgggcgctg gggccgccgc gtgcgaatct ggtggcacct tcgcgcctgt 240

ctcgctgctt tcgataagtc tctagccatt taaaattttt gatgacctgc tgcgacgctt 300

tttttctggc aagatagtct tgtaaatgcg ggccaagatc tgcacactgg tatttcggtt 360

tttggggccg cgggcggcga cggggcccgt gcgtcccagc gcacatgttc ggcgaggcgg 420

ggcctgcgag cgcggccacc gagaatcgga cgggggtagt ctcaagctgg ccggcctgct 480

ctggtgcctg gcctcgcgcc gccgtgtatc gccccgccct gggcggcaag gctggcccgg 540

tcggcaccag ttgcgtgagc ggaaagatgg ccgcttcccg gccctgctgc agggagctca 600

aaatggagga cgcggcgctc gggagagcgg gcgggtgagt cacccacaca aaggaaaagg 660

gcctttccgt cctcagccgt cgcttcatgt gactccacgg agtaccgggc gccgtccagg 720

cacctcgatt agttctcgag cttttggagt acgtcgtctt taggttgggg ggaggggttt 780

tatgcgatgg agtttcccca cactgagtgg gtggagactg aagttaggcc agcttggcac 840

ttgatgtaat tctccttgga atttgccctt tttgagtttg gatcttggtt cattctcaag 900

cctcagacag tggttcaaag tttttttctt ccatttcag 939

<210> 59

<211> 83

<212> DNA

<213> 智人

<400> 59

tcagaagccc cgggctcgtc agtcaaaccg gttctctgtt tgcactcggc agcacgggca 60

ggcaagtggt ccctaggttc ggg 83

<210> 60

<211> 476

<212> DNA

<213> 智人

<400> 60

gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60

cataggaagg ggagaagtaa cagggtacac atattgacca aatcagggta attttgcatt 120

tgtaatttta aaaaatgctt tcttctttta atatactttt ttgtttatct tatttctaat 180

actttcccta atctctttct ttcagggcaa taatgataca atgtatcatg cctctttgca 240

ccattctaaa gaataacagt gataatttct gggttaaggc aatagcaata tttctgcata 300

taaatatttc tgcatataaa ttgtaactga tgtaagaggt ttcatattgc taatagcagc 360

tacaatccag ctaccattct gcttttattt tatggttggg ataaggctgg attattctga 420

gtccaagcta ggcccttttg ctaatcatgt tcatacctct tatcttcctc ccacag 476

<210> 61

<211> 196

<212> DNA

<213> 类人猿病毒40

<400> 61

tctagaggat ccggtactcg aggaactgaa aaaccagaaa gttaactggt aagtttagtc 60

tttttgtctt ttatttcagg tcccggatcc ggtggtggtg caaatcaaag aactgctcct 120

cagtggatgt tgcctttact tctaggcctg tacggaagtg ttacttctgc tctaaaagct 180

gcggaattgt acccgc 196

<210> 62

<211> 589

<212> DNA

<213> 人工序列

<220>

<223> 实验室中制备 - 突变的土拨鼠肝炎调控元件

<400> 62

aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60

ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120

atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180

tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240

ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300

attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360

ttgggcactg acaattccgt ggtgttgtcg gggaaatcat cgtcctttcc ttggctgctc 420

gcctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480

aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540

cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589

<210> 63

<211> 588

<212> DNA

<213> 人工序列

<220>

<223> 实验室中制备 - 突变的土拨鼠肝炎调控元件

<400> 63

tcaacctctg gattacaaaa tttgtgaaag attgactggt attcttaact atgttgctcc 60

ttttacgcta tgtggatacg ctgctttaat gcctttgtat catgctattg cttcccgtat 120

ggctttcatt ttctcctcct tgtataaatc ctggttgctg tctctttatg aggagttgtg 180

gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt gctgacgcaa cccccactgg 240

ttggggcatt gccaccacct gtcagctcct ttccgggact ttcgctttcc ccctccctat 300

tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc tggacagggg ctcggctgtt 360

gggcactgac aattccgtgg tgttgtcggg gaaatcatcg tcctttcctt ggctgctcgc 420

ctgtgttgcc acctggattc tgcgcgggac gtccttctgc tacgtccctt cggccctcaa 480

tccagcggac cttccttccc gcggcctgct gccggctctg cggcctcttc cgcgtcttcg 540

ccttcgccct cagacgagtc ggatctccct ttgggccgcc tccccgca 588

<210> 64

<211> 755

<212> DNA

<213> 人工序列

<220>

<223> 实验室中制备 - 突变的土拨鼠肝炎调控元件

<400> 64

ttcctgttaa tcaacctctg gattacaaaa tttgtgaaag attgactggt attcttaact 60

atgttgctcc ttttacgcta tgtggatacg ctgctttaat gcctttgtat catgctattg 120

cttcccgtat ggctttcatt ttctcctcct tgtataaatc ctggttgctg tctctttatg 180

aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt gctgacgcaa 240

cccccactgg ttggggcatt gccaccacct gtcagctcct ttccgggact ttcgctttcc 300

ccctccctat tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc tggacagggg 360

ctcggctgtt gggcactgac aattccgtgg tgttgtcggg gaagctgacg tcctttccgc 420

ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac gtccttctgc tacgtccctt 480

cggccctcaa tccagcggac cttccttccc gcggcctgct gccggctctg cggcctcttc 540

cgcctcttcg ccttcgccct cagacgagtc ggatctccct ttgggccgcc tccccgccca 600

tgtatctttt tcacctgtgc cttgtttttg cctgtgttcc gcgtcctact tttcaagcct 660

ccaagctgtg ccttgggcgg ctttggggca tggacataga tccctataaa gaatttggtt 720

catcttatca gttgttgaat tttcttcctt tggac 755

<210> 65

<211> 12

<212> DNA

<213> 人工序列

<220>

<223> CAAX基序

<400> 65

tgtgtgataa tg 12

<210> 66

<211> 810

<212> DNA

<213> 智人

<400> 66

ctgttctcat cacatcatat caaggttata taccatcaat attgccacag atgttactta 60

gccttttaat atttctctaa tttagtgtat atgcaatgat agttctctga tttctgagat 120

tgagtttctc atgtgtaatg attatttaga gtttctcttt catctgttca aatttttgtc 180

tagttttatt ttttactgat ttgtaagact tctttttata atctgcatat tacaattctc 240

tttactgggg tgttgcaaat attttctgtc attctatggc ctgacttttc ttaatggttt 300

tttaatttta aaaataagtc ttaatattca tgcaatctaa ttaacaatct tttctttgtg 360

gttaggactt tgagtcataa gaaatttttc tctacactga agtcatgatg gcatgcttct 420

atattatttt ctaaaagatt taaagttttg ccttctccat ttagacttat aattcactgg 480

aatttttttg tgtgtatggt atgacatatg ggttcccttt tattttttac atataaatat 540

atttccctgt ttttctaaaa aagaaaaaga tcatcatttt cccattgtaa aatgccatat 600

ttttttcata ggtcacttac atatatcaat gggtctgttt ctgagctcta ctctatttta 660

tcagcctcac tgtctatccc cacacatctc atgctttgct ctaaatcttg atatttagtg 720

gaacattctt tcccattttg ttctacaaga atatttttgt tattgtcttt gggctttcta 780

tatacatttt gaaatgaggt tgacaagtta 810

<210> 67

<211> 726

<212> DNA

<213> 乙型肝炎病毒

<400> 67

ataacaggcc tattgattgg aaagtttgtc aacgaattgt gggtcttttg gggtttgctg 60

ccccttttac gcaatgtgga tatcctgctt taatgccttt atatgcatgt atacaagcaa 120

aacaggcttt tactttctcg ccaacttaca aggcctttct cagtaaacag tatatgaccc 180

tttaccccgt tgctcggcaa cggcctggtc tgtgccaagt gtttgctgac gcaaccccca 240

ctggttgggg cttggccata ggccatcagc gcatgcgtgg aacctttgtg tctcctctgc 300

cgatccatac tgcggaactc ctagccgctt gttttgctcg cagcaggtct ggagcaaacc 360

tcatcgggac cgacaattct gtcgtactct cccgcaagta tacatcgttt ccatggctgc 420

taggctgtgc tgccaactgg atcctgcgcg ggacgtcctt tgtttacgtc ccgtcggcgc 480

tgaatcccgc ggacgacccc tcccggggcc gcttggggct ctaccgcccg cttctccgtc 540

tgccgtaccg tccgaccacg gggcgcacct ctctttacgc ggactccccg tctgtgcctt 600

ctcatctgcc ggaccgtgtg cacttcgctt cacctctgca cgtcgcatgg aggccaccgt 660

gaacgcccac cggaacctgc ccaaggtctt gcataagagg actcttggac tttcagcaat 720

gtcatc 726

<210> 68

<211> 755

<212> DNA

<213> 人工序列

<220>

<223> 实验室中制备 - HepB衍生增强子元件

<400> 68

ttcctgtaaa caggcctatt gattggaaag tttgtcaacg aattgtgggt cttttggggt 60

ttgctgcccc ttttacgcaa tgtggatatc ctgctttaat gcctttatat gcatgtatac 120

aagcaaaaca ggcttttact ttctcgccaa cttacaaggc ctttctcagt aaacagtata 180

tgacccttta ccccgttgct cggcaacggc ctggtctgtg ccaagtgttt gctgacgcaa 240

cccccactgg ttggggcttg gccataggcc atcagcgcat gcgtggaacc tttgtgtctc 300

ctctgccgat ccatactgcg gaactcctag ccgcttgttt tgctcgcagc tggactggag 360

caaacctcat cgggaccgac aattctgtcg tactctcccg caagcactca ccgtttccgc 420

ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac gtccttctgc tacgtccctt 480

cggccctcaa tccagcggac cttccttccc gcggcctgct gccggctctg cggcctcttc 540

cgcctcttcg ccttcgccct cagacgagtc ggatctccct ttgggccgcc tccccgccca 600

tgtatctttt tcacctgtgc cttgtttttg cctgtgttcc gcgtcctact tttcaagcct 660

ccaagctgtg ccttgggcgg ctttggggca tggacataga tccctataaa gaatttggtt 720

catcttatca gttgttgaat tttcttcctt tggac 755

<210> 69

<211> 94

<212> DNA

<213> 智人

<400> 69

gctggagcct cggtagccgt tcctcctgcc cgctgggcct cccaacgggc cctcctcccc 60

tccttgcacc ggcccttcct ggtctttgaa taaa 94

<210> 70

<211> 596

<212> DNA

<213> 土拨鼠肝炎病毒

<400> 70

attcgagcat cttaccgcca tttattccca tatttgttct gtttttcttg atttgggtat 60

acatttaaat gttaataaaa caaaatggtg gggcaatcat ttacattttt agggatatgt 120

aattactagt tcaggtgtat tgccacaaga caaacatgtt aagaaacttt cccgttattt 180

acgctctgtt cctgttaatc aacctctgga ttacaaaatt tgtgaaagat tgactgatat 240

tcttaactat gttgctcctt ttacgctgtg tggatatgct gctttaatgc ctctgtatca 300

tgctattgct tcccgtacgg ctttcgtttt ctcctccttg tataaatcct ggttgctgtc 360

tctttatgag gagttgtggc ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc 420

tgacgcaacc cccactggct ggggcattgc caccacctgt caactccttt ctgggacttt 480

cgctttcccc ctcccgatcg ccacggcaga actcatcgcc gcctgccttg cccgctgctg 540

gacaggggct aggttgctgg gcactgataa ttccgtggtg ttgtcgggga agggcc 596

<210> 71

<211> 387

<212> DNA

<213> 穴兔

<400> 71

tggctaataa aggaaattta ttttcattgc aatagtgtgt tggaattttt tgtgtctctc 60

actcggaaga acatatggga gggcaaatca tttaaaacat cagaatgagt atttggttta 120

gagtttggca acatatgccc atatgctggc tgccatgaac aaaggttggc tataaagagg 180

tcatcagtat atgaaacagc cccctgctgt ccattcctta ttccatagaa aagccttgac 240

ttgaggttag atttttttta tattttgttt tgtgttattt ttttctttaa catccctaaa 300

attttcctta catgttttac tagccagatt tttcctcctc tcctgactac tcccagtcat 360

agctgtccct cttctcttat ggagatc 387

<210> 72

<211> 251

<212> DNA

<213> 牛

<400> 72

ttgccagcca tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac 60

tcccactgtc ctttcctaat aaaatgagga aattgcatcg cattgtctga gtaggtgtca 120

ttctattctg gggggtgggg tggggcagga cagcaagggg gaggattggg aatacaatag 180

caggcatgct ggggatgcgg tgggctctat gggtacccag gtgctgaaga attgacccgg 240

ttcctcctgg g 251

<210> 73

<211> 251

<212> DNA

<213> 牛

<400> 73

ttgccagcca tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac 60

tcccactgtc ctttcctaat aaaatgagga aattgcatcg cattgtctga gtaggtgtca 120

ttctattctg gggggtgggg tggggcagga cagcaagggg gaggattggg aagacaatag 180

caggcatgct ggggatgcgg tgggctctat gggtacccag gtgctgaaga attgacccgg 240

ttcctcctgg g 251

<210> 74

<211> 225

<212> DNA

<213> 牛

<400> 74

ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 60

tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 120

tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt 180

gggaagacaa tagcaggcat gctggggatg cggtgggctc tatgg 225

<210> 75

<211> 202

<212> DNA

<213> 智人

<400> 75

ctgcccgggt ggcatccctg tgacccctcc ccagtgcctc tcctggccct ggaagttgcc 60

actccagtgc ccaccagcct tgtcctaata aaattaagtt gcatcatttt gtctgactag 120

gtgtccttct ataatattat ggggtggagg ggggtggtat ggagcaaggg gcccaagttg 180

ggaagaaacc tgtagggcct gc 202

<210> 76

<211> 735

<212> PRT

<213> 腺相关病毒2

<400> 76

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser

1 5 10 15

Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro

20 25 30

Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly

145 150 155 160

Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro

180 185 190

Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly

195 200 205

Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr

260 265 270

Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His

275 280 285

Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp

290 295 300

Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val

305 310 315 320

Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu

325 330 335

Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr

340 345 350

Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp

355 360 365

Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser

370 375 380

Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser

385 390 395 400

Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu

405 410 415

Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg

420 425 430

Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr

435 440 445

Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln

450 455 460

Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly

465 470 475 480

Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn

485 490 495

Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly

500 505 510

Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp

515 520 525

Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys

530 535 540

Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr

545 550 555 560

Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr

565 570 575

Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr

580 585 590

Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp

595 600 605

Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr

610 615 620

Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys

625 630 635 640

His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn

645 650 655

Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln

660 665 670

Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys

675 680 685

Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr

690 695 700

Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr

705 710 715 720

Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 77

<211> 736

<212> PRT

<213> 腺相关病毒9

<400> 77

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly

145 150 155 160

Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro

180 185 190

Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn

260 265 270

Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg

275 280 285

Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn

290 295 300

Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile

305 310 315 320

Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn

325 330 335

Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu

340 345 350

Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro

355 360 365

Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp

370 375 380

Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe

385 390 395 400

Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu

405 410 415

Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu

420 425 430

Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser

435 440 445

Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser

450 455 460

Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro

465 470 475 480

Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn

485 490 495

Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn

500 505 510

Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly

530 535 540

Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile

545 550 555 560

Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser

565 570 575

Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln

580 585 590

Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met

625 630 635 640

Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 78

<211> 736

<212> PRT

<213> 腺相关病毒6

<400> 78

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro

20 25 30

Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro

115 120 125

Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly

145 150 155 160

Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro

180 185 190

Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His

260 265 270

Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe

275 280 285

His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn

290 295 300

Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln

305 310 315 320

Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn

325 330 335

Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro

340 345 350

Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala

355 360 365

Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly

370 375 380

Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro

385 390 395 400

Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe

405 410 415

Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp

420 425 430

Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg

435 440 445

Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser

450 455 460

Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro

465 470 475 480

Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn

485 490 495

Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn

500 505 510

Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys

515 520 525

Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly

530 535 540

Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile

545 550 555 560

Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg

565 570 575

Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala

580 585 590

Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu

625 630 635 640

Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn

690 695 700

Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu

705 710 715 720

Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu

725 730 735

<210> 79

<211> 738

<212> PRT

<213> 非人灵长类动物腺相关病毒

<400> 79

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro

20 25 30

Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile

145 150 155 160

Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln

165 170 175

Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro

180 185 190

Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly

195 200 205

Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser

210 215 220

Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val

225 230 235 240

Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His

245 250 255

Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp

260 265 270

Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn

275 280 285

Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn

290 295 300

Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn

305 310 315 320

Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala

325 330 335

Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln

340 345 350

Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe

355 360 365

Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn

370 375 380

Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr

385 390 395 400

Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr

405 410 415

Gln Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser

420 425 430

Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu

435 440 445

Ser Arg Thr Gln Ser Thr Gly Gly Thr Ala Gly Thr Gln Gln Leu Leu

450 455 460

Phe Ser Gln Ala Gly Pro Asn Asn Met Ser Ala Gln Ala Lys Asn Trp

465 470 475 480

Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser

485 490 495

Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His

500 505 510

Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr

515 520 525

His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met

530 535 540

Phe Gly Lys Gln Gly Ala Gly Lys Asp Asn Val Asp Tyr Ser Ser Val

545 550 555 560

Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr

565 570 575

Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Gln Asn Ala Ala

580 585 590

Pro Ile Val Gly Ala Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val

595 600 605

Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile

610 615 620

Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe

625 630 635 640

Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val

645 650 655

Pro Ala Asp Pro Pro Thr Thr Phe Ser Gln Ala Lys Leu Ala Ser Phe

660 665 670

Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu

675 680 685

Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr

690 695 700

Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Asp

705 710 715 720

Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg

725 730 735

Asn Leu

<210> 80

<211> 2217

<212> DNA

<213> 非人灵长类动物腺相关病毒

<400> 80

atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60

gagtggtggg acctgaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120

aacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180

aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240

cagcagctcc aagcgggtga caatccgtac ctgcggtata atcacgccga cgccgagttt 300

caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgcgc agtcttccag 360

gccaaaaagc gggttctcga acctctgggc ctggttgaat cgccggttaa gacggctcct 420

ggaaagaaga gaccggtaga gccatcaccc cagcgctctc cagactcctc tacgggcatc 480

ggcaagaaag gccagcagcc cgcaaaaaag agactcaatt ttgggcagac tggcgactca 540

gagtcagtcc ccgaccctca accaatcgga gaaccaccag caggcccctc tggtctggga 600

tctggtacaa tggctgcagg cggtggcgct ccaatggcag acaataacga aggcgccgac 660

ggagtgggta gttcctcagg aaattggcat tgcgattcca catggctggg cgacagagtc 720

atcaccacca gcacccgcac ctgggccctg cccacctaca acaaccacct ctacaagcaa 780

atctccaacg ggacctcggg aggaagcacc aacgacaaca cctacttcgg ctacagcacc 840

ccctgggggt attttgactt caacagattc cactgccact tttcaccacg tgactggcag 900

cgactcatca acaacaactg gggattccgg cccaagaggc tcaacttcaa gctcttcaac 960

atccaagtca aggaggtcac gcagaatgaa ggcaccaaga ccatcgccaa taaccttacc 1020

agcacgattc aggtctttac ggactcggaa taccagctcc cgtacgtgct cggctcggcg 1080

caccagggct gcctgcctcc gttcccggcg gacgtcttca tgattcctca gtacgggtac 1140

ctgactctga acaatggcag tcaggctgtg ggccggtcgt ccttctactg cctggagtac 1200

tttccttctc aaatgctgag aacgggcaac aactttgaat tcagctacaa cttcgaggac 1260

gtgcccttcc acagcagcta cgcgcacagc cagagcctgg accggctgat gaaccctctc 1320

atcgaccagt acttgtacta cctgtcccgg actcaaagca cgggcggtac tgcaggaact 1380

cagcagttgc tattttctca ggccgggcct aacaacatgt cggctcaggc caagaactgg 1440

ctacccggtc cctgctaccg gcagcaacgc gtctccacga cactgtcgca gaacaacaac 1500

agcaactttg cctggacggg tgccaccaag tatcatctga atggcagaga ctctctggtg 1560

aatcctggcg ttgccatggc tacccacaag gacgacgaag agcgattttt tccatccagc 1620

ggagtcttaa tgtttgggaa acagggagct ggaaaagaca acgtggacta tagcagcgtg 1680

atgctaacca gcgaggaaga aataaagacc accaacccag tggccacaga acagtacggc 1740

gtggtggccg ataacctgca acagcaaaac gccgctccta ttgtaggggc cgtcaatagt 1800

caaggagcct tacctggcat ggtgtggcag aaccgggacg tgtacctgca gggtcccatc 1860

tgggccaaga ttcctcatac ggacggcaac tttcatccct cgccgctgat gggaggcttt 1920

ggactgaagc atccgcctcc tcagatcctg attaaaaaca cacctgttcc cgcggatcct 1980

ccgaccacct tcaatcaggc caagctggct tctttcatca cgcagtacag taccggccag 2040

gtcagcgtgg agatcgagtg ggagctgcag aaggagaaca gcaaacgctg gaacccagag 2100

attcagtaca cttccaacta ctacaaatct acaaatgtgg actttgctgt caatactgag 2160

ggtacttatt ccgagcctcg ccccattggc acccgttacc tcacccgtaa tctgtaa 2217

<210> 81

<211> 535

<212> PRT

<213> 非人灵长类动物腺相关病毒

<400> 81

Met Ala Ala Gly Gly Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala

1 5 10 15

Asp Gly Val Gly Ser Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp

20 25 30

Leu Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro

35 40 45

Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly

50 55 60

Gly Ser Thr Asn Asp Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly

65 70 75 80

Tyr Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp

85 90 95

Gln Arg Leu Ile Asn Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn

100 105 110

Phe Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly

115 120 125

Thr Lys Thr Ile Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr

130 135 140

Asp Ser Glu Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly

145 150 155 160

Cys Leu Pro Pro Phe Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly

165 170 175

Tyr Leu Thr Leu Asn Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe

180 185 190

Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn

195 200 205

Phe Glu Phe Ser Tyr Asn Phe Glu Asp Val Pro Phe His Ser Ser Tyr

210 215 220

Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln

225 230 235 240

Tyr Leu Tyr Tyr Leu Ser Arg Thr Gln Ser Thr Gly Gly Thr Ala Gly

245 250 255

Thr Gln Gln Leu Leu Phe Ser Gln Ala Gly Pro Asn Asn Met Ser Ala

260 265 270

Gln Ala Lys Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val

275 280 285

Ser Thr Thr Leu Ser Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly

290 295 300

Ala Thr Lys Tyr His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly

305 310 315 320

Val Ala Met Ala Thr His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser

325 330 335

Ser Gly Val Leu Met Phe Gly Lys Gln Gly Ala Gly Lys Asp Asn Val

340 345 350

Asp Tyr Ser Ser Val Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr

355 360 365

Asn Pro Val Ala Thr Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln

370 375 380

Gln Gln Asn Ala Ala Pro Ile Val Gly Ala Val Asn Ser Gln Gly Ala

385 390 395 400

Leu Pro Gly Met Val Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro

405 410 415

Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe His Pro Ser Pro

420 425 430

Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile

435 440 445

Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ala

450 455 460

Lys Leu Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val

465 470 475 480

Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro

485 490 495

Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe

500 505 510

Ala Val Asn Thr Glu Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr

515 520 525

Arg Tyr Leu Thr Arg Asn Leu

530 535

<210> 82

<211> 398

<212> PRT

<213> 非人灵长类动物腺相关病毒

<400> 82

Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr Val

1 5 10 15

Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp Val

20 25 30

Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser Gln

35 40 45

Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln

50 55 60

Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr Asn Phe Glu Asp

65 70 75 80

Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg Leu

85 90 95

Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr Gln

100 105 110

Ser Thr Gly Gly Thr Ala Gly Thr Gln Gln Leu Leu Phe Ser Gln Ala

115 120 125

Gly Pro Asn Asn Met Ser Ala Gln Ala Lys Asn Trp Leu Pro Gly Pro

130 135 140

Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser Gln Asn Asn Asn

145 150 155 160

Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly Arg

165 170 175

Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr His Lys Asp Asp

180 185 190

Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met Phe Gly Lys Gln

195 200 205

Gly Ala Gly Lys Asp Asn Val Asp Tyr Ser Ser Val Met Leu Thr Ser

210 215 220

Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr Gly

225 230 235 240

Val Val Ala Asp Asn Leu Gln Gln Gln Asn Ala Ala Pro Ile Val Gly

245 250 255

Ala Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val Trp Gln Asn Arg

260 265 270

Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp

275 280 285

Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His

290 295 300

Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro

305 310 315 320

Pro Thr Thr Phe Asn Gln Ala Lys Leu Ala Ser Phe Ile Thr Gln Tyr

325 330 335

Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu

340 345 350

Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr

355 360 365

Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu Gly Thr Tyr Ser

370 375 380

Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

385 390 395

<210> 83

<211> 332

<212> PRT

<213> 非人灵长类动物腺相关病毒

<400> 83

Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr Asn Phe Glu Asp Val Pro

1 5 10 15

Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn

20 25 30

Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr Gln Ser Thr

35 40 45

Gly Gly Thr Ala Gly Thr Gln Gln Leu Leu Phe Ser Gln Ala Gly Pro

50 55 60

Asn Asn Met Ser Ala Gln Ala Lys Asn Trp Leu Pro Gly Pro Cys Tyr

65 70 75 80

Arg Gln Gln Arg Val Ser Thr Thr Leu Ser Gln Asn Asn Asn Ser Asn

85 90 95

Phe Ala Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly Arg Asp Ser

100 105 110

Leu Val Asn Pro Gly Val Ala Met Ala Thr His Lys Asp Asp Glu Glu

115 120 125

Arg Phe Phe Pro Ser Ser Gly Val Leu Met Phe Gly Lys Gln Gly Ala

130 135 140

Gly Lys Asp Asn Val Asp Tyr Ser Ser Val Met Leu Thr Ser Glu Glu

145 150 155 160

Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr Gly Val Val

165 170 175

Ala Asp Asn Leu Gln Gln Gln Asn Ala Ala Pro Ile Val Gly Ala Val

180 185 190

Asn Ser Gln Gly Ala Leu Pro Gly Met Val Trp Gln Asn Arg Asp Val

195 200 205

Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn

210 215 220

Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro

225 230 235 240

Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr

245 250 255

Thr Phe Asn Gln Ala Lys Leu Ala Ser Phe Ile Thr Gln Tyr Ser Thr

260 265 270

Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser

275 280 285

Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser

290 295 300

Thr Asn Val Asp Phe Ala Val Asn Thr Glu Gly Thr Tyr Ser Glu Pro

305 310 315 320

Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

325 330

<210> 84

<211> 743

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体 - AAV9变体

<400> 84

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly

145 150 155 160

Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro

180 185 190

Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn

260 265 270

Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg

275 280 285

Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn

290 295 300

Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile

305 310 315 320

Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn

325 330 335

Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu

340 345 350

Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro

355 360 365

Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp

370 375 380

Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe

385 390 395 400

Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu

405 410 415

Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu

420 425 430

Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser

435 440 445

Arg Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser

450 455 460

Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro

465 470 475 480

Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn

485 490 495

Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn

500 505 510

Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly

530 535 540

Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile

545 550 555 560

Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser

565 570 575

Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Thr Leu Ala Val

580 585 590

Pro Phe Lys Ala Gln Ala Gln Thr Gly Trp Val Gln Asn Gln Gly Ile

595 600 605

Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro

610 615 620

Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe His Pro Ser Pro

625 630 635 640

Leu Met Gly Gly Phe Gly Met Lys His Pro Pro Pro Gln Ile Leu Ile

645 650 655

Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala Phe Asn Lys Asp

660 665 670

Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val

675 680 685

Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro

690 695 700

Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser Asn Asn Val Glu Phe

705 710 715 720

Ala Val Asn Thr Glu Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr

725 730 735

Arg Tyr Leu Thr Arg Asn Leu

740

<210> 85

<211> 7

<212> PRT

<213> 人工序列

<220>

<223> 肽插入物

<400> 85

Thr Leu Ala Val Pro Phe Lys

1 5

<210> 86

<211> 7

<212> PRT

<213> 人工序列

<220>

<223> 肽插入物

<400> 86

Lys Phe Pro Val Ala Leu Thr

1 5

Claims

1.一种包含表达盒和任选地侧接腺相关病毒(AAV)反向末端重复序列(ITR)的多核苷酸，其中所述多核苷酸包含可操作地连接至启动子的编码肌肉LIM蛋白(MLP)或其功能变体的多核苷酸序列。

2.根据权利要求1所述的多核苷酸，其中所述启动子为心脏特异性启动子。

3.根据权利要求1或权利要求2所述的多核苷酸，其中所述启动子为肌肉特异性启动子。

4.根据权利要求1至3中任一项所述的多核苷酸，其中所述启动子为心肌细胞特异性启动子。

5.根据权利要求1至4中任一项所述的多核苷酸，其中所述启动子为MHCK7启动子。

6.根据权利要求5所述的多核苷酸，其中所述MHCK7启动子与SEQ ID NO:31具有至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的同一性。

7.根据权利要求1至4中任一项所述的多核苷酸，其中所述启动子为心肌肌钙蛋白T(hTNNT2)启动子。

8.根据权利要求7所述的多核苷酸，其中所述hTNNT2启动子与SEQ ID NO:32具有至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的同一性。

9.根据权利要求1至8中任一项所述的多核苷酸，其中所述表达盒包含所述心肌肌钙蛋白T(hTNNT2)基因的外显子1，其中任选地所述hTNNT2启动子和外显子1一起与SEQ ID NO:32具有至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的同一性。

10.根据权利要求1至4中任一项所述的多核苷酸，其中所述启动子为泛在启动子，任选地CMV启动子或CAG启动子。

11.根据权利要求1至10中任一项所述的多核苷酸，其中所述表达盒包含polyA信号。

12.根据权利要求11所述的多核苷酸，其中所述polyA信号为人生长激素(hGH)polyA。

13.根据权利要求1至12中任一项所述的多核苷酸，其中所述表达盒包含土拨鼠肝炎病毒转录后调控元件(WPRE)，任选地WPRE(x)。

14.根据权利要求1至13中任一项所述的多核苷酸，其中所述肌肉LIM蛋白(MLP)或其功能变体为MLP。

15.根据权利要求14所述的多核苷酸，其中所述MLP为人MLP。

16.根据权利要求14或权利要求15所述的多核苷酸，其中所述MLP为MLP同种型A。

17.根据权利要求15或16所述的多核苷酸，其中所述MLP与以下具有至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的同一性：

(SEQ ID NO:1)。

18.根据权利要求14或权利要求15所述的多核苷酸，其中所述MLP为MLP同种型B。

19.根据权利要求15或18所述的多核苷酸，其中所述MLP与以下具有至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的同一性：

MPNWGGGAKCGACEKTVYHAEEIQCNGRSFHKTCFHCSPQSRHAQLPPATLPNSLRSLESPRSALDVASQSMLLRRLWEVASLGTRPVSAVPSVGRVWSPQMSLTKMGNFIAKFAMPKILAPRVLGLEALHNKWKRKNEEVRRFSDFLRA

(SEQ ID NO:2)。

20.根据权利要求15所述的多核苷酸，其中所述MLP与以下具有至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的同一性：

MPNWGGGAKCGACEKTVYHAEEIQCNGRSFHKTCFHCLC

(SEQ ID NO:3)。

21.根据权利要求15所述的多核苷酸，其中所述MLP与以下具有至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的同一性：

MPNWGGGAKCGACEKTVYHAEEIQCNGRSFHKTCFHCTLAQDLFP LCHLWEESGVHKC

(SEQ ID NO:4)。

22.根据权利要求1至21中任一项所述的多核苷酸，其中编码MLP的所述多核苷酸序列为富含半胱氨酸和甘氨酸的蛋白质3(CSRP3)多核苷酸。

23.根据权利要求22所述的多核苷酸，其中所述CSRP3多核苷酸为人CSRP3多核苷酸。

24.根据权利要求1至23中任一项所述的多核苷酸，其中编码MLP的所述多核苷酸序列与以下具有至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的同一性：

(SEQ ID NO:5)。

25.根据权利要求1至24中任一项所述的多核苷酸，其中编码MLP的所述多核苷酸序列与以下具有至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的同一性：

ATGCCCAATTGGGGTGGAGGAGCTAAATGTGGAGCTTGTGAAAAAACAGTTTATCATGCTGAAGAAATTCAATGTAATGGAAGATCTTTTCATAAAACATGTTTTCATTGTATGGCTTGTAGAAAAGCACTTGATTCTACAACTGTTGCAGCACATGAAAGTGAAATCTATTGTAAAGTATGTTATGGAAGAAGATATGGACCAAAAGGAATTGGATATGGACAAGGAGCAGGATGTCTTTCTACAGATACTGGAGAACATTTGGGATTGCAATTTCAACAAAGTCCTAAACCAGCTAGATCTGTTACAACAAGTAATCCATCAAAATTTACTGCTAAATTTGGAGAATCCGAAAAATGTCCTAGATGTGGAAAATCAGTATATGCTGCTGAAAAAGTTATGGGAGGTGGAAAACCATGGCATAAGACATGTTTTAGATGTGCAATTTGTGGTAAATCTTTGGAATCTACAAATGTTACAGATAAAGATGGAGAATTGTATTGTAAAGTTTGTTATGCTAAAAATTTTGGACCTACAGGTATAGGATTTGGAGGTTTGACACAACAAGTTGAAAAAAAAGAA

(SEQ ID NO:7)。

26.根据权利要求1至25中任一项所述的多核苷酸，其中所述多核苷酸包含至少约2.4kb、至多约2.6kb、或约2.4kb至约2.6kb之间。

27.根据权利要求1至26中任一项所述的多核苷酸，其中所述多核苷酸包含至少约3.0kb、至多约3.3kb、或约3.0kb至约3.3kb之间。

28.根据权利要求1至27中任一项所述的多核苷酸，其中所述多核苷酸包含至少约2.4kb、至少约2.6kb、至少约3.0kb、至少约3.3kb、至少约3.5kb、至少约3.7kb、至少约3.9kb、至少约4.1kb、或至少约4.3kb。

29.根据权利要求1至28中任一项所述的多核苷酸，其中所述多核苷酸包含至少约2.6kb、至少约3.0kb、至多约3.3kb、至多约3.5kb、至多约3.7kb、至多约3.9kb、至多约4.1kb、至多约4.3kb、或至多约4.5kb。

30.根据权利要求1至29中任一项所述的多核苷酸，其中所述表达盒与SEQ ID NO:8-11中的任何一个具有至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的同一性。

31.根据权利要求1至30中任一项所述的多核苷酸，其中所述多核苷酸与SEQ ID NO:12-15中的任何一个具有至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的同一性。

32.根据权利要求1至31中任一项所述的多核苷酸，其中所述表达盒侧接5'和3'反向末端重复序列(ITR)，任选地AAV2 ITR，任选地与SEQ IDNO:20-26中的任何一个具有至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的同一性的ITR。

33.根据权利要求1至32中任一项所述的多核苷酸，其中所述多核苷酸是自互补的。

34.根据权利要求1至33中任一项所述的多核苷酸，其中所述多核苷酸包含所述表达盒和所述表达盒的反向补体。

35.根据权利要求34所述的多核苷酸，其中所述表达盒和所述表达盒的所述反向补体侧接5'和3'反向末端重复序列(ITR)，任选地AAV2 ITR，任选地与SEQ ID NO:23或SEQ IDNO:26具有至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的同一性的ITR。

36.一种基因疗法载体，所述载体包含根据权利要求1至35中任一项所述的多核苷酸。

37.根据权利要求36所述的载体，其中所述基因疗法载体为重组腺相关病毒(rAAV)载体。

38.根据权利要求37所述的载体，其中所述rAAV载体为AAV9或其功能变体。

39.根据权利要求38所述的载体，其中所述rAAV载体包含与SEQ IDNO:77中的任何一个具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的同一性的衣壳蛋白。

40.根据权利要求37所述的载体，其中所述rAAV载体为AAVrh10或其功能变体。

41.根据权利要求40所述的载体，其中所述rAAV载体包含与SEQ IDNO:79中的任何一个具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的同一性的衣壳蛋白。

42.根据权利要求37所述的载体，其中所述rAAV载体为AAV6或其功能变体。

43.根据权利要求42所述的载体，其中所述rAAV载体包含与SEQ IDNO:78中的任何一个具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的同一性的衣壳蛋白。

44.根据权利要求37所述的载体，其中所述rAAV载体为AAVrh74或其功能变体。

45.根据权利要求44所述的载体，其中所述rAAV载体包含与SEQ IDNO:80中的任何一个具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的同一性的衣壳蛋白。

46.根据权利要求36至45中任一项所述的载体，其中所述rAAV载体为自互补的AAV载体。

47.一种在有此需要的受试者中治疗和/或预防疾病或病症的方法，所述方法包括向所述受试者施用根据权利要求35至46中任一项所述的载体。

48.根据权利要求47所述的方法，其中所述疾病或病症为心脏病症。

49.根据权利要求47或48所述的方法，其中所述疾病或病症为心力衰竭。

50.根据权利要求47至49中任一项所述的方法，其中所述疾病或病症为肥厚型心肌病。

51.根据权利要求47至49中任一项所述的方法，其中所述疾病或病症为扩张型心肌病。

52.根据权利要求47至51中任一项所述的方法，其中所述受试者为哺乳动物。

53.根据权利要求52所述的方法，其中所述受试者为灵长类动物。

54.根据权利要求53所述的方法，其中所述受试者为人。

55.根据权利要求45至54中任一项所述的方法，其中相对于编码具有SEQ ID NO:1序列的人MLP的人CSRP3，所述受试者在所述CSRP3基因中具有引起选自C58G、L44P、S54R、E55G和/或K69R的氨基酸取代的突变。

56.根据权利要求47至55中任一项所述的方法，其中所述载体通过静脉内注射、心内注射、心内输注和/或心导管插入术来施用。

57.根据权利要求47至56中任一项所述的方法，其中所述施用使MLP表达增加至少约5％。

58.根据权利要求47至56中任一项所述的方法，其中所述施用使MLP表达增加至少约30％。

59.根据权利要求47至56中任一项所述的方法，其中所述施用使MLP表达增加至少约70％。

60.根据权利要求47至56中任一项所述的方法，其中所述施用使MLP表达增加约5％至约10％。

61.根据权利要求47至56中任一项所述的方法，其中所述施用使MLP表达增加约30％至约50％。

62.根据权利要求47至56中任一项所述的方法，其中所述施用使MLP表达增加约70％至约100％。

63.根据权利要求47至62中任一项所述的方法，其中所述方法治疗和/或预防所述疾病或病症。

64.一种药物组合物，所述药物组合物包含根据权利要求36至46中任一项所述的载体。

65.一种试剂盒，所述试剂盒包括根据权利要求34至46中任一项所述的载体或根据权利要求64所述的药物组合物和任选地使用说明书。

66.根据权利要求36至46中任一项所述的组合物用于任选地根据权利要求47至63中任一项所述的方法治疗疾病或病症的用途。

67.根据权利要求36至46中任一项所述的组合物，其用于任选地根据权利要求47至63中任一项所述的方法治疗疾病或病症。

68.一种表达肌肉LIM蛋白(MLP)或其功能变体的方法，所述方法包括使细胞与根据权利要求36至46中任一项的所述载体接触。

69.根据权利要求68所述的方法，其中所述细胞为心肌细胞。

70.根据权利要求69所述的方法，其中所述心肌细胞为人心肌细胞。

71.根据权利要求68至70中任一项所述的方法，其中所述启动子为MHCK7启动子并且其中所述MLP的表达水平比用具有hTNNT2启动子的载体转导的细胞中MLP的表达水平高至少2倍。

72.根据权利要求68至70中任一项所述的方法，其中所述启动子为MHCK7启动子并且其中所述MLP的表达水平比用具有hTNNT2启动子的载体转导的细胞中MLP的表达水平高2倍至高10倍。