CN116438312A

CN116438312A - 编码glp-1受体激动剂融合物的病毒载体和其在治疗代谢性疾病中的用途

Info

Publication number: CN116438312A
Application number: CN202180072447.8A
Authority: CN
Inventors: J·M·维尔松; C·欣德雷尔; 堀内真
Original assignee: University of Pennsylvania Penn
Current assignee: University of Pennsylvania Penn
Priority date: 2020-08-24
Filing date: 2021-08-24
Publication date: 2023-07-14
Also published as: WO2022046815A1; EP4200429A1; CA3190399A1; JP2023543125A; MX2023002293A; BR112023003310A2; US20230372539A1; AU2021332235A1; WO2022046815A9

Abstract

提供了用于治疗受试者的代谢性疾病的组合物和方法。提供了一种病毒载体，所述病毒载体包含核酸分子，所述核酸分子包括编码GLP‑1受体激动剂融合蛋白的序列和指导其表达的调控序列。

Description

编码GLP-1受体激动剂融合物的病毒载体和其在治疗代谢性疾病中的用途

背景技术

胰高血糖素样肽1(GLP-1)是在葡萄糖稳态中起重要作用的内源性肽激素。GLP-1是在胃肠(GI)道中由胰高血糖素前体蛋白的蛋白水解切割产生的肽激素。GLP-1和其它GLP-1受体激动剂具有通过增强胰岛素释放、增加胰岛素敏感性、防止β细胞损失和延迟胃排空来控制高血糖的能力。然而，GLP-1具有短的半衰期，这阻碍了其作为药物的使用。其它GLP-1受体激动剂目前在人类中用于治疗糖尿病。被工程化以通过将激动剂与具有较长半衰期的蛋白质融合来克服天然激素的短半衰期的GLP-1受体激动剂已经成为用于治疗2型糖尿病(T2DM)的重要治疗剂。

发明内容

本文提供了编码胰高血糖素样肽1(GLP-1)受体激动剂融合蛋白构建体的病毒载体。在一些实施例中，与不具有融合配偶体的GLP-1受体激动剂的载体介导的递送相比，这些病毒载体可以实现GLP-1受体激动剂在受试者中的持续表达和/或增加的循环半衰期。进一步提供了制备和使用此类病毒载体的方法。

在一方面，提供了一种病毒载体，所述病毒载体包含核酸，所述核酸包括编码融合蛋白的多核苷酸序列。所述融合蛋白包含(a)前导序列，所述前导序列包括分泌信号肽，(b)胰高血糖素样肽-1(GLP-1)受体激动剂，以及(c)融合结构域，所述融合结构域包括(i)IgGFc或其功能变体或(ii)白蛋白或其功能变体。在一个实施例中，所述载体是腺相关病毒载体。

在一个实施例中，(i)所述前导序列的所述分泌信号肽包括凝血酶信号肽；(ii)所述前导序列包括凝血酶前肽；和/或(iii)所述前导序列包括凝血酶前导序列。在另一个实施例中，所述前导序列包括IL-2前导序列。在一个实施例中，所述GLP-1受体激动剂选自SEQID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6和其功能变体。

在一个实施例中，所述融合结构域是人IgG4 Fc，所述人IgG4 Fc具有SEQ ID NO:11的序列或共享与其至少90％同一性的序列或其功能变体。在另一个实施例中，所述融合结构域是人白蛋白，所述人白蛋白具有SEQ ID NO:12的序列或共享与其至少90％同一性的序列或其功能变体。在一个实施例中，所述融合结构域是恒河猴IgG4 Fc，所述恒河猴IgG4Fc具有SEQ ID NO:17的序列或共享与其至少90％同一性的序列或其功能变体。

在另一方面，所述病毒载体包含AAV衣壳和包装在所述AAV衣壳中的载体基因组，所述载体基因组包括AAV反向末端重复序列(ITR)、编码所述融合蛋白的所述多核苷酸序列以及指导所述融合蛋白的表达的调控序列。

在另一方面，提供了一种适用于治疗受试者的代谢性疾病的药物组合物。所述组合物包含水性液体和如本文所述的病毒载体。在一个实施例中，所述受试者是人。

在又另一方面中，提供了如本文所述的病毒载体用于制造用于治疗患有代谢性疾病，任选地糖尿病的受试者的药物的用途。

在另一方面，提供了一种治疗患有代谢性疾病的受试者的方法。所述方法包含向所述受试者施用有效量的如本文所述的病毒载体或组合物。

根据本发明的以下详细描述，本发明的其它方面和优点将变得显而易见。

附图说明

图1A是度拉鲁肽(Dulaglutide)的示意图。

图1B是阿必鲁肽(Albiglutide)的示意图。

图2示出了体外的诱导型h度拉鲁肽(Trb)对CB7.fe度拉鲁肽(feTrb)。在用具有人凝血酶信号序列的诱导型人度拉鲁肽(TF.GT2A.度拉鲁肽(Trb))和CB7.猫科动物度拉鲁肽(feTrb)的质粒转染的HEK293细胞的培养上清液中测量GLP1-Fc融合物。在用0nM、4nM和40nM的雷帕霉素(Rapa)处理后48小时或在转染CB7.fe度拉鲁肽(feTrb)后48小时，收集上清液。GLP1-Fc通过活性形式GLP1 ELISA连同试剂盒的STD进行定量。

图3示出了GLP-1在Rag1KO(RAG1^-/-)小鼠(n＝5/载体)中的诱导型表达。通过肌内(I.M.或IM)递送所示载体(即，AAVrh91.TF.h度拉鲁肽(Trb)3w.rBG和AAVrh91.TF.rh度拉鲁肽(rhTrb).3w.rBG)，向Rag1KO雌性小鼠施用1x 10¹¹GC/小鼠。每周进行一次采血。进行对活性形式的GLP-1具有特异性的GLP1 ELISA。在第0天注射AAV载体，并且在AAV注射后约第14天和第15天通过口服强饲法施用雷帕霉素。

图4是pAAV.CMV.TF.GT2A.度拉鲁肽(Trb).3w.rBG的质粒图谱的示意图。

图5示出了经工程化的GLP-1构建体在小鼠体内的AAV介导的表达。

图6A示出了用于在双载体系统中使用的包括诱导型构建体的示例表达盒的示意图。

图6B示出了用于在1-载体系统中使用的包括诱导型构建体的表达盒的示意图，所述表达盒包括IRES连接子。

图7A示出了用于在1-载体系统中使用的包括诱导型构建体的表达盒的示意图，所述表达盒包括F2A切割序列连接子和具有分泌信号的人GLP1-Fc(h度拉鲁肽)。

图7B示出了GT2A切割序列的进一步详细视图，其中GT2A_V1包括SEQ ID NO:21的氨基酸序列，并且GT2A_V2包括SEQ ID NO:22的氨基酸序列。

图8示出了在HEK293细胞上清液中的恒河猴示例性治疗转基因(rhTT)的表达，如在用各种构建体转染并且用0nM、4nM和40nM的雷帕霉素处理后测量的，并且以IU/mL rhTT绘制。

图9示出了体外的诱导型人(h)和恒河猴(rh)GLP-1表达。在用包括凝血酶信号序列的诱导型h度拉鲁肽、包括2-载体系统的rh度拉鲁肽和CB7.rh度拉鲁肽的质粒转染的HEK293细胞的培养上清液中测量GLP1-Fc融合物。将细胞在第0天铺板，在第1天转染，在第2天用0nM、4nM和40nM的雷帕霉素处理，并且在第4天或转染CB7.rh度拉鲁肽(rhTrb)后48小时收集来自细胞的上清液。GLP1-Fc通过活性形式GLP1 ELISA连同试剂盒的STD进行定量。

图10A至10C示出了针对NHP1(18-128)的rhGLP1-Fc表达和抗rhGLP1-Fc ADA(抗药物抗体)检测测定的分析。图10A示出了以nM绘制的血清中的rhGLP1-Fc表达水平，如在第0至200天测量的。图10B示出了以μg/L绘制的血清中的雷帕霉素水平，如在第0至200天测量的。图10C示出了以O.D.450nm绘制的ADA检测测定的结果，如在第0至200天测量的。

图11A至11C示出了针对NHP1(18-072)的rhGLP1-Fc表达和抗rhGLP1-Fc ADA测定的分析。图11A示出了以nM绘制的血清中的rhGLP1-Fc表达水平，如在第0至200天测量的。图11B示出了以μg/L绘制的血清中的雷帕霉素水平，如在第0至200天测量的。图11C示出了以O.D.450nm绘制的ADA检测测定的结果，如在第0至200天测量的。

图12A至12C示出了针对NHP1(18-013)的rhGLP1-Fc表达和抗rhGLP1-Fc ADA测定的分析。图12A示出了以nM绘制的血清中的rhGLP1-Fc表达水平，如在第0至200天测量的。图12B示出了以μg/L绘制的血清中的雷帕霉素水平，如在第0至200天测量的。图12C示出了以O.D.450nm绘制的ADA检测测定的结果，如在第0至200天测量的。

具体实施方式

已经开发了长效GLP-1受体激动剂融合蛋白表达构建体用于在有需要的受试者(包含人)中使用。提供了一种前导序列，所述前导序列包含分泌信号肽以及旨在延长所得融合蛋白的循环时间的融合结构域。

描述了通过多种途径，并且特别是通过由如rAAV载体等重组载体介导的体内表达将这些构建体递送到有需要的受试者。还提供了在用于治疗有需要的受试者的糖尿病或代谢综合征并且增加受试者的GLP-1的半衰期的方案中使用这些构建体的方法。另外，提供了用于增强受试者的GLP-1的活性的方法。还提供了用于诱导有需要的受试者的体重减轻的方法。

GLP-1融合蛋白

胰高血糖素样肽1或GLP-1是衍生自胰高血糖素原基因的转录产物的肠降血糖素。在体内，胰高血糖素基因表达180氨基酸前多肽原，所述前多肽原经过蛋白水解加工以形成胰高血糖素，GLP-1和GLP-2的两种形式。最初的测序研究表明GLP-1具有37个氨基酸残基。然而，随后的信息显示，此肽是前肽，并且经过另外的加工以从氨基末端去除6个氨基酸以形成GLP-1(7-37)，即GLP-1的活性形式。位置37处的甘氨酸也在体内转化为酰胺，以形成GLP-1(7-36)酰胺。GLP-1(7-37)和GLP-1(7-36)酰胺是具有同等效力的促胰岛素激素。因此，如本文所使用的，在本文中有用的GLP-1的生物学“活性”形式是：GLP-1-(7-37)和GLP-1-(7-36)NH₂。

GLP-1受体激动剂是一类模拟胰高血糖素样肽作用的抗糖尿病剂。GLP-1是在消化期间从肠道释放后影响身体的若干种天然存在的肠降血糖素化合物中的一种天然存在的肠降血糖素化合物。通过结合并激活GLP-1受体，GLP-1受体激动剂能够降低血糖水平，从而帮助T2DM患者达到血糖控制。如本文所使用的，术语“GLP-1受体激动剂”是指至少GLP-1或其功能片段、GLP-1或其功能片段的氨基酸序列变体以及GLP-1受体的其它多肽激动剂(例如，exedin-4和其变体)。本公开提供了包括GLP-1受体激动剂的一个或多个拷贝的融合蛋白，以及编码此类融合蛋白的多核苷酸和载体。在一些实施例中，融合蛋白包括编码融合蛋白的多核苷酸序列，所述融合蛋白包括(a)前导序列，所述前导序列包括分泌信号肽；(b)胰高血糖素样肽-1(GLP-1)受体激动剂；以及(c)融合结构域。在一个实施例中，GLP-1受体激动剂包括凝血酶前导序列、GLP-1受体激动剂以及IgG Fc或其功能变体。在另一个实施例中，融合蛋白包括凝血酶前导序列、GLP-1受体激动剂以及白蛋白或其功能变体。在另一个实施例中，融合蛋白包括凝血酶前导序列、GLP-1受体激动剂的两个拷贝和白蛋白或其功能变体。

在一些实施例中，GLP-1受体激动剂包含变体，所述变体可以包含与本文所述的或本领域已知的GLP-1核酸或氨基酸序列至多约10％变化，所述变体保留野生型序列的功能。如本文所使用的，“保留功能”意指核酸或氨基酸以与野生型序列相同的方式起作用，尽管不一定在同一表达或活性水平下。例如，在一个实施例中，与野生型序列相比，功能变体具有增加的表达或活性。在另一个实施例中，与野生型序列相比，功能变体具有降低的表达或活性。在一个实施例中，与野生型序列相比，功能变体的表达或活性具有10％、20％、30％、40％、50％、60％、70％、80％、90％或更大的增加或减少。

将GLP-1受体激动剂与稳定融合结构域融合的若干种人药物在本领域中是已知的。这些人药物包含阿必鲁肽、利拉鲁肽、度拉鲁肽和利西拉肽(还以其化学名称去-38-脯氨酸-艾塞那肽-4(钝尾毒蜥(Heloderma suspectum))-(1-39)-肽基五-L-赖氨酰-L-赖氨酰胺(des-38-proline-exendin-4(Heloderma suspectum)-(1–39)-peptidylpenta-L-lysyl-L-lysinamide)已知)。度拉鲁肽是二硫化物结合的同二聚体融合肽，其中每个单体由一个GLP-1类似物部分和一个IgG4 Fc区组成。Yu M等人(2018)GLP-1递送技术之战(Battle of GLP-1delivery technologies),《先进的药物递送综述(Adv.DrugDeliv.Rev)》。图1A中示出了度拉鲁肽的示意图。参见WO 2005/000892A2，所述文献通过引用并入本文。

阿必鲁肽是由与人白蛋白融合的GLP-1类似物的两个拷贝构成的重组蛋白。分子在GLP-1类似物的两个拷贝中都具有Gly8至Ala取代，以改进对DPP-4降解的抗性。图1B中示出了阿必鲁肽的示意图。

在一个实施例中，融合物包括GLP-1类似物与异源序列的组合。GLP-1类似物意指与天然人GLP-1(7-37)共享至少90％、95％、97％、98％、99％或100％同一性的多肽。在一个实施例中，与天然序列相比，GLP-1类似物具有最多1个、2个或3个氨基酸取代。天然人GLP-1(1-37)具有HDEFERHAEGTFTSDVSSYLEGQAAKEFIAWLVKGRG(SEQ ID NO:1)的序列，其中GLP-1(7-37)具有HAEGTFTSDVSSYLEGQAAKEFIAWLVKGRG(SEQ ID NO:2)的序列。在一些实施例中，令人期望的是改变天然GLP-1序列以优化其一个或多个特征。例如，在一个实施例中，与天然序列相比，GLP-1类似物含有选自A8G、G22E和R36G的一个、两个或三个氨基酸取代。这些取代已经显示出改善GLP-1的临床特征的功效，包含保护免于DPP-4失活(A8G)、增加的溶解度(G22E)以及通过用甘氨酸残基取代位置36处的精氨酸(R36G)以去除潜在的T细胞表位来降低免疫原性。在一个实施例中，GLP-1类似物是GLP-1的DPP-IV抗性变体。在一个实施例中，GLP-1类似物具有包括SEQ ID NO:3:HGEGTFTSDVSSYLEEQAAKEFIAWLVKGGG或由其组成的序列。在另一个实施例中，GLP-1类似物具有包括SEQ ID NO:4:HGEGTFTSDVSSYLEGQAAKEFIAWLVKGRG或由其组成的序列。在另一个实施例中，GLP-1受体激动剂具有包括SEQ ID NO:5:HGEGTFTSDLSKQMEEEAVRL FIEWLKNGGPSSGAPPPS或其功能变体或由其组成的序列。在一个实施例中，变体与SEQ ID NO:5共享至少90％同一性、95％同一性、97％同一性、98％同一性、99％同一性或100％同一性。在另一个实施例中，GLP-1受体激动剂具有包括SEQ ID NO:6:HGEGTFTSDLSKQMEEEAVRLFIEWLKNGGPSSGAPPSKKKKKK或其功能变体或由其组成的序列。在一个实施例中，变体与SEQ ID NO:6共享至少90％同一性、95％同一性、97％同一性、98％同一性、99％同一性或100％同一性。在一个实施例中，GLP-1类似物的多于一个拷贝存在于融合蛋白中。在另一个实施例中，GLP-1受体激动剂是GLP-1(7-37)或其DPP-IV抗性变体的两个串联拷贝。

融合蛋白可以包括前导序列，所述前导序列可以包括分泌信号肽。如本文所使用的，术语“前导序列”是指多肽的任何N末端序列。

前导序列可以源自最终打算施用的相同物种，例如，人。如本文所使用的，术语“源性”或“源自”是指序列或蛋白质来源于特定受试者物种或与来源于特定受试者物种的蛋白质或序列共享同一序列。例如，“源自”人的前导序列与如在人中表达的相同前导序列共享同一序列(或其变体，如本文所定义的)。然而，指定的核酸或氨基酸实际上不需要来源于人。本领域已知能够产生期望序列的各种技术，包含诱变类似蛋白质(例如，同源物)或人工产生核酸或氨基酸序列。“衍生的”核酸或氨基酸在其“所衍生”的物种中保留相同核酸或氨基酸的功能，而不管衍生序列的实际来源。

术语“氨基酸取代”和其同义词旨在涵盖通过用另一个取代氨基酸置换一个氨基酸来修饰氨基酸序列。取代可以是保守取代。所述取代还可以是非保守取代。关于两个氨基酸，术语保守旨在意指氨基酸共享本领域技术人员公认的共同性质。例如，具有疏水性非酸性侧链的氨基酸、具有疏水性酸性侧链的氨基酸、具有亲水性非酸性侧链的氨基酸、具有亲水性酸性侧链的氨基酸以及具有亲水性碱性侧链的氨基酸。共同性质还可以是具有疏水性侧链的氨基酸、具有脂肪族疏水性侧链的氨基酸、具有芳香族疏水性侧链的氨基酸、具有极性中性侧链的氨基酸、具有带电侧链的氨基酸、具有带电酸性侧链的氨基酸以及具有带电碱性侧链的氨基酸。天然存在的氨基酸和非天然存在的氨基酸两者在本领域中都是已知的并且可以在各实施例中用作取代氨基酸。用于置换氨基酸的方法是本领域技术人员熟知的，并且包含但不限于编码氨基酸序列的核苷酸序列的突变。在本文中提及“一个或多个”旨在涵盖例如1个、2个、3个、4个、5个、6个或更多个的单独实施例。

在一个实施例中，前导序列是人凝血酶(因子II)序列。在一个实施例中，凝血酶前导序列具有带有最多1个、2个或3个氨基酸取代的SEQ ID NO:7:MAHVRGLQLPGCLALAALCSLVHSQHVFLAPQQARSLLQRVRR或其功能变体中所示的序列。在一些实施例中，前导序列包括信号肽和前肽。在一个实施例中，前导序列的分泌信号肽包括人凝血酶信号肽。在一个实施例中，信号肽是具有最多1个、2个或3个氨基酸取代的MAHVRGLQLPGCLALAALCSLVHS(SEQ IDNO:8)或其功能变体。在另一个实施例中，前导序列包括人凝血酶前肽。在一个实施例中，前肽具有带有最多1个、2个或3个氨基酸取代的QHVFLAPQQARSLLQRVRR(SEQ ID NO:9)或其功能变体的序列。

在一个实施例中，前导序列是人IL-2序列。在一个实施例中，IL-2前导序列具有带有最多1个、2个或3个氨基酸取代的SEQ ID NO:10:MYRMQLLSCIALSLALVTNS或其功能变体中所示的序列。

在一个实施例中，期望的前导序列的功能变体包含变体，所述变体可以包含与本文所述的或本领域已知的前导核酸或氨基酸序列至多约10％变化，所述变体保留野生型序列的功能。

在一些实施例中，前肽和GLP-1肽两者的编码区被掺入到单个核酸序列中，而在前肽的编码序列与GLP-1的编码序列之间没有连接子。

融合蛋白进一步包含融合结构域。在一个实施例中，融合结构域是人IgG Fc片段或其功能变体。免疫球蛋白通常具有较长的体内循环半衰期。通过将GLP-1受体激动剂(和前导序列)与IgG Fc融合，融合蛋白的循环时间被延长，同时GLP-1的功能被保留。在另一个实施例中，融合结构域是恒河猴IgG Fc片段或其功能变体。

如本文所使用的，免疫球蛋白的Fc部分具有免疫学领域中通常给予所述术语的含义。具体地，此术语是指不含有来自抗体的两个抗原结合区(Fab片段)的抗体片段。Fc部分由来自两条重链的抗体的恒定区组成，所述两条重链通过非共价相互作用和二硫键缔合。Fc部分可以包含铰链区并且通过CH2和CH3结构域延伸到抗体的c末端。Fc部分可以进一步包含一个或多个糖基化位点。在一个实施例中，融合结构域是人IgG Fc。高度保守的四个亚类IgG1、IgG2、IgG3和IgG4在其恒定区方面，特别是在其铰链和上部CH2结构域方面有所不同。参见，Vidarsson等人,IgG亚型和同种型：从结构到效应子功能(IgG Subclasses andAllotypes:From Structure to Effector Functions),《免疫学前沿(Front Immunol.)》2014年10月；5:520，所述文献通过引用并入本文。Fc结构域可以源自任何人IgG，包含人IgG1、人IgG2、人IgG3或人IgG4。在一个实施例中，人IgG Fc是IgG4 Fc。在一个实施例中，人IgG Fc是SEQ ID NO:11:

AESKYGPPCPPCPAPEAAGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSQEDPEVQFNWYVDGVEVHNAKTKPREEQFNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKGLPSSIEKTISKAKGQPREPQVYTLPPSQEEMTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSRLTVDKSRWQEGNVFSCSVMHEALHNHYTQKSLSLSLG。在另一个实施例中，人IgG Fc与SEQ ID NO:11共享至少90％同一性、至少95％同一性、至少99％同一性或至少100％同一性。

在另一个实施例中，融合结构域是恒河猴IgG Fc。Fc结构域可以源自任何恒河猴IgG，包含恒河猴IgG1、恒河猴IgG2、恒河猴IgG3或恒河猴IgG4。在一个实施例中，恒河猴IgGFc是IgG4 Fc。在一个实施例中，恒河猴IgG Fc是SEQ ID NO:17:PPCPPCPAPE LLGGPSVFLFPPKPKDTLMI SRTPEVTCVV VDVSQEDPEVQFNWYVDGVE VHNAQTKPRE RQFNSTYRVV SVLTVTHQDWLNGKEYTCKVSNKGLPAPIE KTISKAKGQP REPQVYILPP PQEELTKNQV SLTCLVTGFYPSDIAVEWESNGQPENTYKT TPPVLDSDGS YLLYSKLTVN KSRWQPGNIFTCSVMHEALH NHYTQKSLSV SPGK。在另一个实施例中，恒河猴IgG Fc与SEQ ID NO:17共享至少90％同一性、至少95％同一性、至少99％同一性或至少100％同一性。在一个实施例中，恒河猴IgG进一步包括铰链序列。

在另一个实施例中，融合结构域是人白蛋白或其功能变体。在一个实施例中，人白蛋白是SEQ ID NO:12:

DAHKSEVAHRFKDLGEENFKALVLIAFAQYLQQCPFEDHVKLVNEVTEFAKTCVADESAENCDKSLHTLFGDKLCTVATLRETYGEMADCCAKQEPERNECFLQHKDDNPNLPRLVRPEVDVMCTAFHDNEETFLKKYLYEIARRHPYFYAPELLFFAKRYKAAFTECCQAADKAACLLPKLDELRDEGKASSAKQRLKCASLQKFGERAFKAWAVARLSQRFPKAEFAEVSKLVTDLTKVHTECCHGDLLECADDRADLAKYICENQDSISSKLKECCEKPLLEKSHCIAEVENDEMPADLPSLAADFVESKDVCKNYAEAKDVFLGMFLYEYARRHPDYSVVLLLRLAKTYETTLEKCCAAADPHECYAKVFDEFKPLVEEPQNLIKQNCELFEQLGEYKFQNALLVRYTKKVPQVSTPTLVEVSRNLGKVGSKCCKHPEAKRMPCAEDYLSVVLNQLCVLHEKTPVSDRVTKCCTESLVNRRPCFSALEVDETYVPKEFNAETFTFHADICTLSEKERQIKKQTALVELVKHKPKATKEQLKAVMDDFAAFVEKCCKADDKETCFAEEGKKLVAASQAALGL。在另一个实施例中，人白蛋白与SEQ ID NO:12共享至少90％同一性、至少95％同一性、至少99％同一性或至少100％同一性。

本公开的融合蛋白的体内功能和稳定性可以通过添加小肽连接子来优化，例如，以防止潜在地不想要的结构域相互作用或出于其它原因。另外，富含甘氨酸的连接子可以提供一些结构柔性，使得GLP-1类似物部分可以与如胰腺的β细胞等靶细胞上的GLP-1受体有效地相互作用。因此，在一个实施例中，GLP-1类似物的C末端和融合蛋白的融合结构域的N末端通过连接子融合。在一个实施例中，连接子包含具有序列GGGGSGGGGSGGGGS(SEQ IDNO:13)的富含G的肽连接子的1个、1.5个或2个重复序列。

在一个实施例中，融合蛋白包括(a)人凝血酶前导序列；(b)GLP-1(7-37)的DPP-IV抗性变体、连接子；以及(c)人IgG Fc。在一个实施例中，融合蛋白具有SEQ ID NO:14的序列或与其至少90％、至少95％、至少98％或至少99％相同的序列。

SEQ ID NO:14

MAHVRGLQLPGCLALAALCSLVHSQHVFLAPQQARSLLQRVRRHGEGTFTSDVSSYLEEQAAKEFIAWLVKGGGGGGGSGGGGSGGGGSAESKYGPPCPPCPAPEAAGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSQEDPEVQFNWYVDGVEVHNAKTKPREEQFNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKGLPSSIEKTISKAKGQPREPQVYTLPPSQEEMTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSRLTVDKSRWQEGNVFSCSVMHEALHNHYTQKSLSLSLG

在一个实施例中，编码融合蛋白的序列是SEQ ID NO:15或与其至少75％、至少85％、至少90％、至少95％、至少98％或至少99％相同的序列。

SEQ ID NO:15:

atggctcacgttcgaggactgcagctgcctggatgtctggctcttgccgctctgtgtagcctggtgcacagccagcacgtgtttctggctcctcagcaagccagatcactgctgcagagagttagaaggcacggcgagggcacctttacctccgacgtgtctagctacctggaagaacaggccgccaaagagtttatcgcctggctggtcaaaggtggcggcggaggcggaggaagcggtggcggaggttcaggtggtggtggatctgccgagtctaagtacggccctccttgtcctccctgtcctgctcccgaagctgctggcggcccatccgtgtttctgttccctccaaagcctaaggacaccctgatgatcagcagaacccctgaagtgacctgcgtggtggtcgacgtgtcccaagaggatcctgaggtgcagttcaattggtacgtggacggcgtggaagtgcacaacgccaagaccaagcctagagaggaacagttcaacagcacctacagagtggtgtccgtgctgaccgtgctgcaccaggattggctgaacggcaaagagtacaagtgcaaggtgtccaacaagggcctgcctagctccatcgagaaaaccatcagcaaggccaagggccagccaagagaaccccaggtgtacacactgcctccaagccaagaggaaatgaccaagaaccaggtgtccctgacctgcctcgtgaagggcttctacccttccgatatcgccgtggaatgggagagcaatggccagcctgagaacaactacaagaccacacctcctgtgctggacagcgacggctcattcttcctgtacagcagactgaccgtggacaagagcagatggcaagagggcaacgtgttcagctgcagcgtgatgcacgaggccctgcacaaccactacacccagaagtctctgagcctgagcctgggc

在一个实施例中，融合蛋白包括(a)人凝血酶前导序列；(b)GLP-1(7-37)的DPP-IV抗性变体、连接子；以及(c)恒河猴IgG Fc。在一个实施例中，融合蛋白包括(a)恒河猴凝血酶前导序列；(b)GLP-1(7-37)的DPP-IV抗性变体、连接子；以及(c)恒河猴IgG Fc。

在一个实施例中，融合蛋白具有SEQ ID NO:37的序列或与其至少90％、至少95％、至少98％或至少99％相同的序列。

SEQ ID NO:37

MAHVRGLQLPGCLALAALCSLVHSQHVFLAPQQALSLLQRVRRHGEGTFTSDVSSYLEEQAAKEFIAWLVKGGGGGGGSGGGGSGGGGSAEFTPPCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSQEDPEVQFNWYVDGVEVHNAQTKPRERQFNSTYRVVSVLTVTHQDWLNGKEYTCKVSNKGLPAPIEKTISKAKGQPREPQVYILPPPQEELTKNQVSLTCLVTGFYPSDIAVEWESNGQPENTYKTTPPVLDSDGSYLLYSKLTVNKSRWQPGNIFTCSVMHEALHNHYTQKSLSVSPG

在一个实施例中，编码融合蛋白的序列是SEQ ID NO:36或与其至少75％、至少85％、至少90％、至少95％、至少98％或至少99％相同的序列。

SEQ ID NO:36

atggctcacgttcgaggactgcagctgcctggatgtctggctcttgccgctctgtgtagcctggtgcacagccagcatgtgtttctggctcctcaacaagccctgagcctgctgcaaagagttagaaggcacggcgagggcaccttcacctccgacgtgtccagctacctggaagaacaggccgccaaagagtttatcgcctggctggtcaaaggcggtggtggtggcggaggatctggcggaggtggaagcggcggaggcggatctgctgagtttacacctccttgtcctccctgtcctgctcccgagctgctcggaggcccttccgtgtttctgttccctccaaagcctaaggacaccctgatgatcagcagaacccctgaagtgacctgcgtggtcgtggacgtgtcccaagaggatcctgaggtgcagttcaattggtacgtggacggcgtggaagtgcacaacgcccagacaaagcccagagagcggcagttcaacagcacctacagagtggtgtccgtgctgaccgtgacacaccaggattggctgaacggcaaagagtacacctgtaaagtctccaacaagggcctgcctgctcctatcgagaaaaccatcagcaaggccaagggccagcctagagaaccccaggtgtacatcctgcctccacctcaagaggaactgaccaagaaccaggtgtccctgacctgtctggtcaccggcttctacccttccgatatcgccgtggaatgggagagcaacggacagcccgagaacacctacaagaccacacctccagtgctggacagcgacggcagctatctgctgtactccaagctgacagtgaacaagagccggtggcagcccggcaacatcttcacctgttctgtgatgcacgaggccctgcacaaccactacacccagaagtctctgagcgtcagccctggc

在一个实施例中，融合蛋白包括(a)人凝血酶前导序列；(b)GLP-1(7-37)的DPP-IV抗性变体、连接子；以及(c)人白蛋白。在另一个实施例中，融合蛋白包括融合蛋白包括(a)人凝血酶前导序列；(b)人GLP-1(7-37)或其DPP-IV抗性变体的两个串联拷贝、连接子；以及(c)人白蛋白。

当期望前导序列、GLP-1受体激动剂或融合结构域的变体或片段时，可以使用野生型核酸序列的定点诱变来产生这些肽的编码序列。可替代地或另外，基于网络的或可商购获得的计算机程序以及基于服务的公司可以用于将氨基酸序列反向翻译为核酸编码序列，包含RNA和/或cDNA两者。参考，例如通过EMBOSS，ebi.ac.uk/Tools/st/；Gene Infinity(geneinfinity.org/sms-/sms_backtranslation.html)；ExPasy(expasy.org/tools/)的backtranseq。在一个实施例中，RNA和/或cDNA编码序列被设计成在最终打算施用的受试者物种(例如，人类)中进行最佳表达。

可以使用密码子优化将编码序列设计用于最佳表达。密码子优化的编码区可以通过各种不同的方法来设计。可以使用在线可获得的方法、公开的方法或提供密码子优化服务的公司来进行此优化。例如在国际专利申请公开第WO 2015/012924号中描述了一种密码子优化方法，所述国际专利申请公开通过引用并入本文。简而言之，用同义密码子序列修饰编码产物的核酸序列。适合地，对产物的开放阅读框(ORF)的整个长度进行修饰。然而，在一些实施例中，仅ORF的片段可以被改变。通过使用这些方法中的一种方法，可以将频率应用于任何给定的多肽序列，并且产生编码多肽的经密码子优化的编码区的核酸片段。

除了本文所提供的前导序列、GLP-1受体激动剂、融合结构域和融合蛋白之外，还提供了编码这些多肽的核酸序列。在一个实施例中，提供了一种编码本文所述的GLP-1肽的核酸序列。在一些实施例中，所述核酸序列可以包含编码SEQ ID NO:1的GLP-1序列的任何核酸序列。在另一个实施例中，所述核酸序列包含包括SEQ ID NO:2的GLP-1序列的任何核酸。在另一个实施例中，所述核酸序列包含包括SEQ ID NO:3的GLP-1序列的任何核酸。在另一个实施例中，所述核酸序列包含包括SEQ ID NO:4的GLP-1序列的任何核酸。在另一个实施例中，所述核酸序列包含包括SEQ ID NO:5的GLP-1序列的任何核酸。在另一个实施例中，所述核酸序列包含包括SEQ ID NO:6的GLP-1序列的任何核酸。

在一个实施例中，提供了一种编码本文所述的GLP-1融合蛋白的核酸序列。在另一个实施例中，所述核酸序列包含编码SEQ ID NO:14的GLP-1融合蛋白的任何核酸序列。

表达盒

在另一方面，本文提供了一种表达盒，所述表达盒包括编码如本文所述的GLP-1融合蛋白的核酸。如本文所使用的，“表达盒”是指包括生物学上有用的核酸序列(例如，编码蛋白质、酶或其它有用的基因产物的基因cDNA、mRNA等)和与其可操作地连接的调控序列的核酸分子，所述调控序列指导或调节核酸序列和其基因产物的转录、翻译和/或表达。如本文所使用的，“可操作地连接的”序列包含与核酸序列邻接或非邻接的调控序列(也称为元件)以及以反式或顺式核酸序列起作用的调控序列两者。此类调控序列通常包含例如以下中的一者或多者：启动子、增强子、转录因子、转录终止子、内含子、增强翻译效率的序列(即，Kozak共有序列)、有效的RNA加工信号(如切片和聚腺苷酸化序列)、稳定细胞质mRNA的序列(例如，土拨鼠肝炎病毒(WHP)翻译后调控元件(WPRE))和TATA信号。表达盒可以含有基因序列上游(5'处)的调控序列，例如，启动子、增强子、内含子等中的一者或多者以及增强子中的一个或多个，或基因序列下游(3'处)的调控序列，例如，包括聚腺苷酸化位点的3'非翻译区(3'UTR)，以及其它元件。在某些实施例中，调控序列与基因产物的核酸序列可操作地连接，其中调控序列通过插入的核酸序列，即5'非翻译区(5'UTR)与基因产物的核酸序列分离。在某些实施例中，表达盒包括一种或多种基因产物的核酸序列。在一些实施例中，表达盒可以是单顺反子表达盒或双顺反子表达盒。在其它实施例中，术语“转基因”是指来自外源的插入到靶细胞中的一个或多个DNA序列。

在一个实施例中，表达盒是指包括GLP-1构建体编码序列(例如，GLP-1融合蛋白的编码序列)、启动子的核酸分子，并且可以包含其的其它调控序列，所述盒可以被工程化到遗传元件中和/或包装到病毒载体(例如，病毒颗粒)的衣壳中。通常，用于产生病毒载体的这种表达盒含有本文所述的GLP-1构建体序列和其它表达控制序列(如本文所述的表达控制序列)，所述GLP-1构建体序列侧接病毒基因组(并且被称为“载体基因组”)的包装信号。可以使用本领域已知的技术针对特定物种优化任何表达控制序列，所述技术包含例如密码子优化，如本文所述。

在某些实施例中，表达盒包含组成型启动子。在另一个实施例中，使用CB7启动子。CB7是具有巨细胞病毒增强子元件的鸡β-肌动蛋白启动子。在一些实施例中，CB7启动子具有SEQ ID NO:33的核酸序列。在一个实施例中，启动子是CMV启动子。在一些实施例中，CMV启动子是SEQ ID NO:27的核酸序列。

在另一个实施例中，使用组织特异性启动子。可替代地，可以使用其它肝脏特异性启动子，如在冷泉港的肝脏特异性基因启动子数据库(the Liver Specific GenePromoter Database,Cold Spring Harbor)(rulai.schl.edu/LSPD)中列出的肝脏特异性启动子，并且包含但不限于α1抗胰蛋白酶(A1AT)；人白蛋白(Miyatake等人,《病毒学杂志(J.Virol.)》,71:5124 32(1997))，humAlb；乙型肝炎病毒核心启动子(Sandig等人,《基因疗法(Gene Ther.)》,3:1002 9(1996))；TTR最小增强子/启动子，α-抗胰蛋白酶启动子，肝脏特异性启动子(LSP)(Wu等人《分子疗法(Mol Ther.)》16:280-289(2008))，TBG肝脏特异性启动子。如病毒启动子、组成型启动子、可调控启动子(参见例如，WO 2011/126808和WO2013/04943)等其它启动子或对生理学线索有应答的启动子可以用于本文所述的载体中。

在一个实施例中，启动子包括在诱导型基因表达系统中。诱导型基因调控/表达系统含有至少以下组分：与编码本文所述的GLP-1融合蛋白的转基因可操作地连接的启动子(也称为可调控启动子)、激活结构域、DNA结合结构域和锌指同源结构域结合位点。在其它实施例中，另外的组分可以包含在表达系统中，如本文进一步描述的。图4中示出了显示示例性诱导型表达系统设计的质粒。

系统包括GLP-1融合蛋白的编码序列上游的启动子。可以使用本文所述的启动子，如CMV和CB7启动子。在一个实施例中，启动子是CMV启动子，如SEQ ID NO:27中所示的启动子。在另一个实施例中，启动子是普遍存在的诱导型启动子Z12I，其包括ZFHD1和IL2最小启动子的结合位点的12个重复拷贝。参见例如，Chen等人,《人类基因疗法方法(Hum GeneTher Methods.)》2013年8月；24(4):270–278，所述文献并入本文。

表达系统包括激活结构域，所述激活结构域优选地位于DNA结合结构域的上游。在一个实施例中，激活结构域是来自NF-κB的p65亚基的羧基末端与FKBP12-雷帕霉素相关蛋白(FRAP)的FKBP12-雷帕霉素结合(FRB)结构域的融合物。在一个实施例中，激活结构域是与来自人的NF-κB的p65亚基的羧基末端融合的人FKBP12-雷帕霉素相关蛋白(FRAP)的FKBP12-雷帕霉素结合(FRB)结构域。在一个实施例中，FRB结构域具有SEQ ID NO:24中所示的氨基酸序列。在一个实施例中，FRB结构域具有由SEQ ID NO:23的核酸序列编码的SEQ IDNO:24中所示的氨基酸序列。在一个实施例中，p65亚基具有SEQ ID NO:26中所示的序列。在一个实施例中，p65亚基具有由SEQ ID NO:25的核酸序列编码的SEQ ID NO:26中所示的序列。

诱导型系统可以包括在包括融合蛋白的编码序列的单个载体中，或包括在双载体系统中。本文描述了掺入GLP1融合蛋白的2-载体(图6A)和1-载体(图6B和图7A)系统的实例。

在一个实施例中，在反式激活结构域与DNA结合结构域之间存在连接子，所述连接子可以是F2A或IRES。在一个实施例中，连接子选自IRES或2A肽。在一个实施例中，连接子是可切割的2A肽。在一个实施例中，连接子包括GT2A_V1肽，其包括SEQ ID NO:21的氨基酸序列。在一个实施例中，连接子包括GT2A_V2肽，其包括SEQ IDNO:22的氨基酸序列。在一个实施例中，选择2A肽以增加包装限制，从而允许单个载体系统。

DNA结合结构域由锌指同源结构域1(ZFHD1)与FK506结合蛋白(FKBP)的至多三个拷贝连接的DNA结合融合物构成。在存在诱导剂(例如，雷帕霉素类似物，如雷帕霉素)的情况下，DNA结合结构域和激活结构域通过其FKBP和FRB结构域的相互作用而二聚化，从而导致转基因的转录激活。在一些实施例中，ZFHD1包含在具有GT2A或IRES的框架中。在一个实施例中，ZFHD1具有SEQ ID NO:29中所示的序列。在一个实施例中，ZFHD1具有由SEQ ID NO:28的核酸序列编码的SEQ ID NO:28的序列。

表达系统被设计成具有FKBP序列的一个、两个或三个拷贝。这些在本文中称为FKBP亚基。在一个实施例中，亚基被设计成表达相同的蛋白质但具有彼此不同的核酸，以使重组最小化。例如，SEQ ID NO:30提供了FKBP的3个“摆动的”编码序列，所述编码序列中的每个序列编码SEQ ID NO:31:GVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKFDSSRDRNKPFKFMLGKQEVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE中所示的序列。

表达系统进一步包括锌指同源结构域结合位点。核酸分子含有至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个或12个ZFHD结合位点。在一个实施例中，表达系统含有8(八)个锌指同源结构域结合位点(结合配偶体)(8XZFHD)。然而，本发明涵盖具有锌指结合位点的二至约十二个拷贝的表达系统。ZFHD结合位点的单个拷贝的实例是：aatgatgggcgctcgagt(SEQ ID NO:32)。

在一些实施例中，在锌指同源结构域结合位点的下游存在最小IL2启动子。示例性IL2启动子示出于SEQ ID NO:10中。

此类诱导型系统在本领域中是已知的，并且包含例如由以下文献描述的雷帕霉素诱导型系统：例如，Rivera等人,用于基因表达的药理学控制的人源化系统(A humanizedsystem for pharmacologic control of gene expression),《自然医学(NatureMedicine)》第2卷,第1028-1032页(1996年9月)以及Rivera等人,在AAV介导的基因转移后灵长类动物的促红细胞生成素的长期药理学调控的表达(Long-term pharmacologicallyregulated expression of erythropoietin in primates following AAV-mediatedgene transfer),《血液(Blood)》,2005年2月15日,第105卷,第4期，这两个文献均通过引用并入本文。在一个实施例中，诱导型基因表达系统包括CMV启动子，激活结构域是与来自人的NF-κB的p65亚基的羧基末端融合的人FKBP12-雷帕霉素相关蛋白(FRAP)的FKBP12-雷帕霉素结合(FRB)结构域、GT2A肽、ZFHD1 DNA结合结构域、三个FKBP亚基、hGH poly A、8XZFHD和最小sIL2启动子。这些序列除了GLP-1融合蛋白的编码序列以及任选地其它调控序列之外。

除了启动子之外，表达盒和/或载体还可以含有其它适当的转录起始、终止、增强子序列、如剪接和聚腺苷酸化(polyA)信号等的有效RNA加工信号；稳定细胞质mRNA的序列；增强翻译效率的序列(即，Kozak共有序列)；增强蛋白质稳定性的序列；以及在期望时，增强经过编码的产物的分泌的序列。合适的polyA序列的实例包含例如SV40、牛生长激素(bGH)、人生长激素(hGH)、SV40、兔β-珠蛋白(也称为兔珠蛋白polyA；RGB)、经修饰的RGB(mRGB)和TK polyA。合适的增强子的实例包含例如α-胎蛋白增强子、TTR最小启动子/增强子、LSP(TH结合球蛋白启动子/α1微球蛋白/双库尼茨抑制剂增强子)等。在一个实施例中，polyA是兔珠蛋白polyA。

这些控制序列与GLP-1构建体序列“可操作地连接”。如本文所使用的，术语“可操作地连接”是指与所关注基因邻接的表达控制序列以及以反式或在远处起作用以控制所关注基因的表达控制序列两者。

在一个实施例中，提供了rAAV，所述rAAV包含5'ITR、CB7启动子、鸡β-肌动蛋白内含子、SEQ ID NO:14的融合蛋白的编码序列、兔珠蛋白poly A和3'ITR。在另一个实施例中，rAAV包括包含CMV启动子的多核苷酸，激活结构域是与来自人的NF-κB的p65亚基的羧基末端融合的人FKBP12-雷帕霉素相关蛋白(FRAP)的FKBP12-雷帕霉素结合(FRB)结构域、GT2A肽、ZFHD1 DNA结合结构域、三个FKBP亚基、hGH poly A、8XZFHD、最小sIL2启动子、SEQ IDNO:14的GLP-1融合蛋白的编码序列和兔β球蛋白polyA。

在一个实施例中，提供了一种表达盒，所述表达盒包含多核苷酸，所述多核苷酸包括CB7启动子、鸡β-肌动蛋白内含子、SEQ ID NO:14的融合蛋白的编码序列和兔珠蛋白polyA。在一个实施例中，表达盒是发现于SEQ ID NO:34中的表达盒，或共享与其至少70％、75％、80％、85％、90％、95％、99％或100％同一性的序列。在另一个实施例中，提供了一种载体基因组，其中SEQ ID NO:34或共享与其至少70％、75％、80％、85％、90％、95％、99％或100％同一性的序列侧接5'和3'AAV ITR。

在另一个实施例中，提供了一种表达盒，所述表达盒包含多核苷酸，所述多核苷酸包括CB7启动子、鸡β-肌动蛋白内含子、SEQ ID NO:37的融合蛋白的编码序列和兔珠蛋白poly A。在一个实施例中，表达盒是发现于SEQ ID NO:35中的表达盒，或共享与其至少70％、75％、80％、85％、90％、95％、99％或100％同一性的序列。在另一个实施例中，提供了一种载体基因组，其中SEQ ID NO:35或共享与其至少70％、75％、80％、85％、90％、95％、99％或100％同一性的序列侧接5'和3'AAV ITR。

在另一个实施例中，提供了一种表达盒，所述表达盒包含多核苷酸，所述多核苷酸包括CMV启动子、与来自人的NF-κB的p65亚基的羧基末端融合的人FKBP12-雷帕霉素相关蛋白(FRAP)的FKBP12-雷帕霉素结合(FRB)结构域、GT2A肽、ZFHD1 DNA结合结构域、三个FKBP亚基、8XZFHD、最小IL2启动子、SEQ ID NO:14的GLP-1融合蛋白的编码序列和兔β珠蛋白polyA。在一个实施例中，表达盒是发现于SEQ ID NO:38中的表达盒，或共享与其至少70％、75％、80％、85％、90％、95％、99％或100％同一性的序列。在另一个实施例中，提供了一种载体基因组，其中SEQ ID NO:38或共享与其至少70％、75％、80％、85％、90％、95％、99％或100％同一性的序列侧接5'和3'AAV ITR。

在另一个实施例中，提供了一种表达盒，所述表达盒包含多核苷酸，所述多核苷酸包括CMV启动子、与来自人或恒河猴的NF-κB的p65亚基的羧基末端融合的人或恒河猴FKBP12-雷帕霉素相关蛋白(FRAP)的FKBP12-雷帕霉素结合(FRB)结构域、GT2A肽、ZFHD1DNA结合结构域、三个FKBP亚基、8XZFHD、最小IL2启动子、SEQ ID NO:37的GLP-1融合蛋白的编码序列和兔β珠蛋白polyA。在一个实施例中，表达盒是发现于SEQ ID NO:39中的表达盒，或共享与其至少70％、75％、80％、85％、90％、95％、99％或100％同一性的序列。在另一个实施例中，提供了一种载体基因组，其中SEQ ID NO:39或共享与其至少70％、75％、80％、85％、90％、95％、99％或100％同一性的序列侧接5'和3'AAV ITR。

在另一个实施例中，提供了一种表达盒，所述表达盒包含多核苷酸，所述多核苷酸包括Z12I启动子(包括12个ZFHD1位点和最小IL2启动子)、SEQ ID NO:37的GLP-1融合蛋白的编码序列和兔β珠蛋白polyA。在一个实施例中，表达盒是发现于SEQ ID NO:40中的表达盒，或共享与其至少70％、75％、80％、85％、90％、95％、99％或100％同一性的序列。在另一个实施例中，提供了一种载体基因组，其中SEQ ID NO:40或共享与其至少70％、75％、80％、85％、90％、95％、99％或100％同一性的序列侧接5'和3'AAV ITR。提供了一种第二表达盒，所述第二表达盒包含多核苷酸，所述多核苷酸包括CMV启动子、嵌合内含子、与来自人或恒河猴(或其一部分)的NF-κB的p65亚基融合的人或恒河猴FKBP12-雷帕霉素相关蛋白(FRAP)的FKBP12-雷帕霉素结合(FRB)结构域、IRES或2A肽、ZFHD1 DNA结合结构域、三个FKBP亚基、8XZFHD和polyA序列。在一个实施例中，表达盒是发现于SEQ ID NO:41中的表达盒，或共享与其至少70％、75％、80％、85％、90％、95％、99％或100％同一性的序列。在另一个实施例中，提供了一种载体基因组，其中SEQ ID NO:41或共享与其至少70％、75％、80％、85％、90％、95％、99％或100％同一性的序列侧接5'和3'AAV ITR。

病毒载体

在另一方面，提供了包含本文所述的表达盒的病毒载体。在本文所述的病毒载体的某些实施例中，病毒载体是腺相关病毒(AAV)病毒载体或重组AAV(rAAV)。如本文所使用的，术语“重组AAV”或“rAAV”是指天然存在的腺相关病毒、本领域技术人员可获得的和/或鉴于本文所述的组合物和方法可获得的腺相关病毒以及人工AAV。腺相关病毒(AAV)病毒载体是具有AAV蛋白衣壳的AAV DNase抗性颗粒，其中包装有侧接AAV反向末端重复序列(ITR)(一起称为“载体基因组”)的用于递送到靶细胞的表达盒。AAV衣壳由60个衣壳(cap)蛋白亚基VP1、VP2和VP3构成，其以二十面体对称布置，比率为大约1:1:10至1:1:20，取决于所选择的AAV。可以选择各种AAV作为如上文所鉴定的AAV病毒载体的衣壳的来源。在一个实施例中，AAV衣壳是AAVrh91衣壳或其变体。在某些实施例中，衣壳蛋白由rAAV载体名称中的术语“AAV”之后的数字或数字和字母的组合指定。除非另外指明，否则本文所述的AAV衣壳、ITR和其它所选择的AAV组分可以容易地选自任何AAV，包含但不限于鉴定为AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAVrh10、AAVhu37、AAVrh32.33、AAVAnc80、AAV10、AAV11、AAV12、AAVrh8、AAVrh74、AAV-DJ8、AAV-DJ、AAVhu.37、AAVrh.64R1和AAVhu68的AAV。参见例如，美国公开专利申请第2007-0036760-A1号；美国公开专利申请第2009-0197338-A1号；EP 1310571。还参见WO 2003/042397(AAV7和其它猿猴AAV)、美国专利7790449和美国专利7282199(AAV8)、WO 2005/033321和US 7,906,111(AAV9)和WO 2006/110689以及WO2003/042397(rh.10)、WO 2005/033321、WO 2018/160582(AAVhu68)，所述文献通过引用并入本文。其它合适的AAV可以包含但不限于AAVrh90[于2020年4月28日提交的PCT/US20/30273]、AAVrh91[于2020年4月28日提交的PCT/US20/030266，现在是于2020年11月5日公开的公开WO 2020/223231]、AAVrh92、AAVrh93、AAVrh91.93[于2020年4月28日提交的PCT/US20/30281]，所述文献均通过引用并入本文。其它合适的AAV包含于2019年10月21日提交的美国临时专利申请第62/924,112号和于2020年5月15日提交的美国临时专利申请第63/025,753号中描述的AAV3B变体，所述文献描述了AAV3B.AR2.01、AAV3B.AR2.02、AAV3B.AR2.03、AAV3B.AR2.04、AAV3B.AR2.05、AAV3B.AR2.06、AAV3B.AR2.07、AAV3B.AR2.08、AAV3B.AR2.10、AAV3B.AR2.11、AAV3B.AR2.12、AAV3B.AR2.13、AAV3B.AR2.14、AAV3B.AR2.15、AAV3B.AR2.16或AAV3B.AR2.17，所述文献均通过引用并入本文。还参见于2021年8月13日提交的国际专利申请第PCT/US21/45945号、于2020年8月14日提交的美国临时专利申请第63/065,616号和于2020年11月4日提交的美国临时专利申请第63/109,734号，所述专利申请全都通过引用整体并入本文。这些文档还描述了可以选择用于产生rAAV的其它AAV衣壳，并且通过引用并入。在从人或非人灵长类动物(NHP)中分离或工程化以及良好表征的AAV中，人AAV2是第一个被开发为基因转移载体的AAV；其已被广泛用于不同靶组织和动物模型中的高效基因转移实验。

如本文所使用的，关于AAV，术语“变体”意指源自已知AAV序列的任何AAV序列，包含具有保守氨基酸置换的AAV序列以及与氨基酸或核酸序列共享至少90％、至少95％、至少97％、至少99％或更高的序列同一性的AAV序列。在另一个实施例中，AAV衣壳包含变体，所述变体可以包含与任何所描述或已知的AAV衣壳序列至多约10％变化。也就是说，AAV衣壳与本文所提供的和/或本领域已知的AAV衣壳共享约90％同一性至约99.9％同一性、约95％至约99％同一性或约97％至约98％同一性。在一个实施例中，AAV衣壳与AAV衣壳共享至少95％同一性。当确定AAV衣壳的同一性百分比时，可以对任何可变蛋白质(例如，vp1、vp2或vp3)进行比较。

在一个实施例中，病毒载体是具有AAV8的衣壳或其功能变体的rAAV。在一个实施例中，病毒载体是具有AAVrh91的衣壳或其功能变体的rAAV。在一个实施例中，病毒载体是具有AAV3.AR.2.12的衣壳或其功能变体的rAAV。在一个实施例中，病毒载体是具有选自AAV9、AAVrh64R1、AAVhu37或AAVrh10的衣壳的rAAV。

在某些实施例中，提供了新型分离的AAVrh91衣壳。在SEQ ID NO:18中提供了编码AAVrh91衣壳的核酸序列，并且在SEQ ID NO:20中提供了经编码的氨基酸序列。本文提供了一种rAAV，所述rAAV包括AAVrh91(SEQ ID NO:20)的vp1、vp2和vp3中的至少一个。本文还提供了rAAV，所述rAAV包括由AAVrh91(SEQ ID NO:18)的vp1、vp2和vp3中的至少一个编码的AAV衣壳。在又另一个实施例中，在SEQ ID NO:19中提供了编码AAVrh91氨基酸序列的核酸序列，并且在SEQ ID NO:20中提供了经编码的氨基酸序列。本文还提供了rAAV，所述rAAV包括由AAVrh91eng(SEQ ID NO:19)的vp1、vp2和vp3中的至少一个编码的AAV衣壳。在某些实施例中，vp1、vp2和/或vp3是AAVrh91(SEQ ID NO:20)的全长衣壳蛋白。在其它实施例中，vp1、vp2和/或vp3具有N末端和/或C末端截短(例如，约1至约10个氨基酸的截短)。

在某些实施例中，AAVrh91衣壳由以下的一种或多种表征：(1)AAVrh91衣壳蛋白，所述AAVrh91衣壳蛋白包括：选自以下的AAVrh91 vp1蛋白的异质群体：通过由从编码SEQID NO:20的1至736的预测的氨基酸序列的核酸序列表达产生的vp1蛋白，由SEQ ID NO:18产生的vp1蛋白，或由与编码SEQ ID NO:20的1至736的预测的氨基酸序列的SEQ ID NO:18至少70％相同的核酸序列产生的vp1蛋白，选自以下的AAVrh91vp2蛋白的异质群体：通过由从编码SEQ ID NO:20的至少约氨基酸138至736的预测的氨基酸序列的核酸序列表达产生的vp2蛋白，由包括SEQ ID NO:18的至少核苷酸412至2208的序列产生的vp2蛋白，或由与编码SEQ ID NO:20的至少约氨基酸138至736的预测的氨基酸序列的SEQ ID NO:18的至少核苷酸412至2208至少70％相同的核酸序列产生的vp2蛋白，选自以下的AAVrh91 vp3蛋白的异质群体：通过由从编码SEQ ID NO:20的至少约氨基酸203至736的预测的氨基酸序列的核酸序列表达产生的vp3蛋白，由包括SEQ ID NO:18的至少核苷酸607至2208的序列产生的vp3蛋白，或由与编码SEQ ID NO:20的至少约氨基酸203至736的预测的氨基酸序列的SEQID NO:18的至少核苷酸607至2208至少70％相同的核酸序列产生的vp3蛋白；和/或(2)vp1蛋白的异质群体，所述vp1蛋白是编码SEQ ID NO:20的氨基酸序列的核酸序列的产物，vp2蛋白的异质群体，所述vp2蛋白是编码SEQ ID NO:20的至少约氨基酸138至736的氨基酸序列的核酸序列的产物，以及vp3蛋白的异质群体，所述vp3蛋白是编码SEQ ID NO:20的至少氨基酸203至736的核酸序列的产物，其中：所述vp1、vp2和vp3蛋白含有具有氨基酸修饰的亚群体，所述氨基酸修饰包括SEQ ID NO:20中的天冬酰胺-甘氨酸对中的至少两个高度脱酰胺化的天冬酰胺(N)；并且任选地进一步包括包含其它脱酰胺化的氨基酸的亚群体，其中脱酰胺化引起氨基酸变化；以及(B)AAVrh91衣壳中的载体基因组，所述载体基因组包括核酸分子，所述核酸分子包括AAV反向末端重复序列和非AAV核酸序列，所述非AAV核酸序列编码与指导产物在宿主细胞中的表达的序列可操作地连接的产物。

在某些实施例中，AAVrh91衣壳由以下的一种或多种表征：(1)AAVrh91衣壳蛋白，所述AAVrh91衣壳蛋白包括：选自以下的AAVrh91 vp1蛋白的异质群体：通过由从编码SEQID NO:20的1至736的预测的氨基酸序列的核酸序列表达产生的vp1蛋白，由SEQ ID NO:19产生的vp1蛋白，或由与编码SEQ ID NO:20的1至736的预测的氨基酸序列的SEQ ID NO:19至少70％相同的核酸序列产生的vp1蛋白，选自以下的AAVrh91vp2蛋白的异质群体：通过由从编码SEQ ID NO:20的至少约氨基酸138至736的预测的氨基酸序列的核酸序列表达产生的vp2蛋白，由包括SEQ ID NO:19的至少核苷酸412至2208的序列产生的vp2蛋白，或由与编码SEQ ID NO:20的至少约氨基酸138至736的预测的氨基酸序列的SEQ ID NO:19的至少核苷酸412至2208至少70％相同的核酸序列产生的vp2蛋白，选自以下的AAVrh91 vp3蛋白的异质群体：通过由从编码SEQ ID NO:20的至少约氨基酸203至736的预测的氨基酸序列的核酸序列表达产生的vp3蛋白，由包括SEQ ID NO:19的至少核苷酸607至2208的序列产生的vp3蛋白，或由与编码SEQ ID NO:20的至少约氨基酸203至736的预测的氨基酸序列的SEQID NO:19的至少核苷酸607至2208至少70％相同的核酸序列产生的vp3蛋白；和/或(2)vp1蛋白的异质群体，所述vp1蛋白是编码SEQ ID NO:20的氨基酸序列的核酸序列的产物，vp2蛋白的异质群体，所述vp2蛋白是编码SEQ ID NO:20的至少约氨基酸138至736的氨基酸序列的核酸序列的产物，以及vp3蛋白的异质群体，所述vp3蛋白是编码SEQ ID NO:20的至少氨基酸203至736的核酸序列的产物，其中：所述vp1、vp2和vp3蛋白含有具有氨基酸修饰的亚群体，所述氨基酸修饰包括SEQ ID NO:20中的天冬酰胺-甘氨酸对中的至少两个高度脱酰胺化的天冬酰胺(N)；并且任选地进一步包括包含其它脱酰胺化的氨基酸的亚群体，其中脱酰胺化引起氨基酸变化；以及(B)AAVrh91衣壳中的载体基因组，所述载体基因组包括核酸分子，所述核酸分子包括AAV反向末端重复序列和非AAV核酸序列，所述非AAV核酸序列编码与指导产物在宿主细胞中的表达的序列可操作地连接的产物。

在某些实施例中，AAVrh91 vp1、vp2和vp3蛋白含有具有氨基酸修饰的亚群体，所述氨基酸修饰包括SEQ ID NO:20中的天冬酰胺-甘氨酸对中的至少两个高度脱酰胺化的天冬酰胺(N)，并且任选地进一步包括包含其它脱酰胺化的氨基酸的亚群体，其中脱酰胺化引起氨基酸变化。相对于SEQ ID NO:20的编号，在N-G对N57、N383和/或N512处观察到高水平的脱酰胺化。在其它残基中已经观察到脱酰胺化。在某些实施例中，AAVrh91可以具有其它脱酰胺化的残基，例如通常小于10％，和/或可以具有其它修饰，所述其它修饰包含磷酸化(例如，在存在的情况下，在约2％至约30％、或约2％至约20％、或约2％至约10％的范围内)(例如，在S149处)或氧化(例如，在～W22、～M211、W247、M403、M435、M471、W478、W503、～M537、～M541、～M559、～M599、M635和/或W695中的一个或多个处)。任选地，W可以氧化成犬尿氨酸。

表A-AAVrh91脱酰胺化

在某些实施例中，在所提供的如使用胰蛋白酶使用质谱所确定的范围内，在上表中鉴定的位置中的一个或多个位置中修饰AAVrh91衣壳。在某些实施例中，如本文所述的修饰位置中的一个或多个位置或N之后的甘氨酸。残基数量基于本文所提供的AAVrh91序列。参见，SEQ ID NO:20。

在某些实施例中，AAVrh91衣壳包括：vp1蛋白的异质群体，所述vp1蛋白是编码SEQID NO:20的氨基酸序列的核酸序列的产物，vp2蛋白的异质群体，所述vp2蛋白是编码SEQID NO:20的至少约氨基酸138至736的氨基酸序列的核酸序列的产物，以及vp3蛋白的异质群体，所述vp3蛋白是编码SEQ ID NO:20的至少氨基酸203至736的核酸序列的产物。

在某些实施例中，经修饰的AAVrh91核酸序列用于产生具有比天然AAVrh91衣壳脱酰胺化程度更低的衣壳的突变rAAV。此类突变rAAV可以具有降低的免疫原性和/或增加储存时的稳定性，特别是以悬浮液形式储存时的稳定性。

在一方面，提供了一种重组AAV(rAAV)。rAAV包含来自腺相关病毒rh91的AAV衣壳和包装在所述AAV衣壳中的载体基因组，所述载体基因组包括AAV反向末端重复序列(ITR)、SEQ ID NO:14的GLP-1受体激动剂的编码序列以及指导GLP-1受体激动剂表达的调控序列。

在一个实施例中，rAAV是scAAV。缩写“sc”是指自身互补的。“自身互补的AAV”是指具有其中重组AAV核酸序列携带的编码区已经被设计成形成分子内双链DNA模板的表达盒的质粒或载体。感染后，未等待细胞介导的第二条链合成，而是两条互补的半scAAV将缔合以形成易于立即复制和转录的一条双链DNA(dsDNA)。参见例如，DM McCarty等人,“自身互补的重组腺相关病毒(scAAV)载体独立于DNA合成而促进高效转导(Self-complementaryrecombinant adeno-associated virus(scAAV)vectors promote efficienttransduction independently of DNA synthesis)”,《基因疗法》,(2001年8月),第8卷,第16期,第1248-1254页。在例如美国专利第6,596,535号、第7,125,717号和第7,456,683号中描述了自身互补的AAV，所述美国专利通过引用整体并入本文。

在一个实施例中，编码本文所述的GLP-1构建体的核酸序列被工程化到任何合适的遗传元件中，例如，裸DNA、噬菌体、转座子、粘粒、RNA分子(例如，mRNA)、附加体等，所述遗传元件将其上携带的GLP-1序列转移至宿主细胞，例如，用于在包装宿主细胞中产生携带DNA或RNA的纳米颗粒、病毒载体和/或用于递送到受试者的宿主细胞。在一个实施例中，遗传元件是质粒。所选择的基因元件可以通过任何合适的方法递送，包含转染、电穿孔、脂质体递送、膜融合技术、高速DNA包被的团粒、病毒感染和原生质体融合。用于制备此类构建体的方法对于核酸操纵技术人员而言是已知的并且包含基因工程、重组工程以及合成技术。参见例如，Green和Sambrook,《分子克隆：实验室手册(Molecular Cloning:A LaboratoryManual)》,纽约市冷泉港的冷泉港实验室出版社(Cold Spring Harbor Press,ColdSpring Harbor,NY)(2012)。

如本文所使用的，术语“宿主细胞”可以指包装细胞系，其中由生产质粒产生载体(例如，重组AAV或rAAV)。在替代方案中，术语“宿主细胞”可以指期望表达本文所述的基因产物的任何靶细胞。因此，“宿主细胞”是指原核或真核细胞(例如，细菌细胞、人类细胞或昆虫细胞)，所述原核或真核细胞含有通过任何方式(例如，电穿孔、磷酸钙沉淀、显微注射、转化、病毒感染、转染、脂质体递送、膜融合技术、高速DNA包被的团粒、病毒感染和原生质体融合)引入到细胞中的外源性或异源性DNA。在本文中的某些实施例中，术语“宿主细胞”是指用于体外评估本文所述的组合物的各种哺乳动物物种的细胞的培养物。在本文中的其它实施例中，术语“宿主细胞”是指用于产生和包装病毒载体或重组病毒的细胞。在另外的实施例中，术语“宿主细胞”是肠细胞、小肠细胞、胰细胞、肝脏细胞。

如本文所使用的，术语“靶细胞”是指期望表达异源性核酸序列或蛋白质的任何靶细胞。在某些实施例中，靶细胞是肝脏细胞。在其他实施例中，靶细胞是肌细胞。

在一个实施例中，提供了rAAV，所述rAAV包括包含表达盒的载体基因组，其中所述表达盒包括CMV启动子，激活结构域是与来自人的NF-κB的p65亚基的羧基末端融合的人FKBP12-雷帕霉素相关蛋白(FRAP)的FKBP12-雷帕霉素结合(FRB)结构域、GT2A_V1肽、ZFHD1DNA结合结构域、三个FKBP亚基、hGH poly A、8XZFHD、最小sIL2启动子、SEQ ID NO:14的GLP-1融合蛋白的编码序列和兔β珠蛋白polyA。在另一个实施例中，提供了rAAV，所述rAAV包括包含表达盒的载体基因组，其中所述表达盒包括CMV启动子，激活结构域是与来自人的NF-κB的p65亚基的羧基末端融合的人FKBP12-雷帕霉素相关蛋白(FRAP)的FKBP12-雷帕霉素结合(FRB)结构域、GT2A_V2肽、ZFHD1 DNA结合结构域、三个FKBP亚基、hGH poly A、8XZFHD、最小sIL2启动子、SEQ ID NO:14的GLP-1融合蛋白的编码序列和兔β珠蛋白polyA。

将表达盒包装到AAV病毒颗粒中所需的最小序列是与衣壳具有相同AAV起源或具有不同AAV起源(以产生AAV假型)的AAV 5'和3'ITR。在一个实施例中，来自AAV2的ITR序列或其删除版本(ΔITR)是为方便起见采用的，并且为了加快监管审批。然而，可以选择来自其它AAV来源的ITR。优选地，ITR的来源与Rep蛋白的来源相同，所述Rep蛋白以反式提供用于生产。通常，AAV载体的表达盒包括AAV 5'ITR、GLP-1融合蛋白编码序列和任何调控序列以及AAV 3'ITR。然而，这些元件的其它构型可以是合适的。已经描述了被称为ΔITR的5'ITR的缩短版本，其中缺失了D序列和末端解析位点(trs)。在其它实施例中，使用了全长AAV5'和3'ITR。

为了将表达盒包装到病毒粒子中，ITR是在与基因相同的构建体中顺式所需的唯一AAV组分。在一个实施例中，用于复制(rep)和/或衣壳(cap)的编码序列从AAV基因组中移除并以反式供应或由包装细胞系供应，以产生AAV载体。例如，如上所述，假型AAV可以含有来自与AAV衣壳的来源不同的来源的ITR。在一个实施例中，可以利用嵌合AAV衣壳。可以选择仍其它的AAV组分。此类AAV序列的来源在本文中有所描述并且还可以从学术、商业或公共来源分离或获得(例如，维吉尼亚州马纳萨斯的美国典型培养物保藏中心(the AmericanType Culture Collection,Manassas,VA))。AAV序列可以通过合成或其它合适的方式通过参考公开的序列(如在文献中或在如例如

等数据库中可获得的公开的序列)而获得。/>

用于产生和分离适合于向受试者递送的AAV病毒载体的方法在本领域中是已知的。[参见例如，美国专利7790449；美国专利7282199；WO 2003/042397；WO 2005/033321；WO2006/110689；以及US 7588772 B2]。在一个系统中，用编码侧接ITR的转基因的构建体和编码rep和cap的构建体瞬时转染生产细胞系。在第二系统中，用编码侧接ITR的转基因的构建体瞬时转染稳定供应rep和cap的包装细胞系。在这些系统的每种系统中，响应于用辅助腺病毒或疱疹病毒感染而产生AAV病毒粒子，从而需要从污染的病毒中分离rAAV。最近，已开发了不需要用辅助病毒感染来回收AAV的系统—通过所述系统还反式地提供所需辅助功能(即，腺病毒E1、E2a、VA和E4或疱疹病毒UL5、UL8、UL52和UL29，以及疱疹病毒聚合酶)。在这些较新的系统中，可以通过用编码所需辅助功能的构建体瞬时转染细胞来提供辅助功能，或者所述细胞可以被工程化成稳定地含有编码辅助功能的基因，所述基因的表达可以被控制在转录水平或转录后水平下。在又另一个系统中，通过用基于杆状病毒的载体进行感染来将侧接ITR的转基因和rep/cap基因引入到昆虫细胞中。关于这些产生系统的综述，通常参见例如Zhang等人,2009,“用于大规模重组腺相关病毒产生的腺病毒-腺相关病毒杂合体(Adenovirus-adeno-associated virus hybrid for large-scale recombinant adeno-associated virus production)”，《人类基因疗法(Human Gene Therapy)》20:922-929，所述参考文献中的每个参考文献的内容通过引用整体并入本文。在以下美国专利中也描述了制备和使用这些及其它AAV产生系统的方法，所述美国专利中的每个美国专利的内容通过引用整体并入本文：5,139,941；5,741,683；6,057,152；6,204,059；6,268,213；6,491,907；6,660,514；6,951,753；7,094,604；7,172,893；7,201,898；7,229,823和7,439,065。通常参见例如，Grieger和Samulski,2005,“腺相关病毒作为基因疗法载体：载体研发、产生及临床应用(Adeno-associated virus as a gene therapy vector:Vector development,production and clinical applications)”,《生物化学工程/生物技术进展(Adv.Biochem.Engin/Biotechnol.)》99:119-145；Buning等人,2008,“腺相关病毒载体技术的最新进展(Recent developments in adeno-associated virus vectortechnology)”,《基因医学杂志(J.Gene Med.)》10:717-733；以及下文引用的参考文献，所述参考文献中的每个参考文献通过引用整体并入本文。用于构建本发明的任何实施例的方法对于核酸操作技术人员是已知的并且包含遗传工程、重组工程以及合成技术。参见例如，Green和Sambrook等人,《分子克隆：实验室手册》,纽约市冷泉港的冷泉港实验室出版社(2012)。类似地，产生rAAV病毒粒子的方法是熟知的，并且对合适的方法的选择不是对本发明的限制。参见例如，K.Fisher等人,(1993)《病毒学杂志》,70:520-532和美国专利第5,478,745号。

本文所述的rAAV包括具有包装在内部的载体基因组的所选择的衣壳。载体基因组(或rAAV基因组)包括5'和3'AAV反向末端重复序列(ITR)、编码融合蛋白的多核苷酸序列以及指导编码融合蛋白的多核苷酸序列插入宿主细胞的基因组的调控序列。在一个实施例中，载体基因组是SEQ ID NO:16中所示的序列或共享与其至少70％、至少75％、至少80％、至少85％、至少90％、至少95％或至少99％同一性的序列。

如本文所使用的，“载体基因组”是指包装在形成病毒颗粒的细小病毒(例如，rAAV)衣壳内部的核酸序列。此类核酸序列含有AAV反向末端重复序列(ITR)。在本文中的实例中，载体基因组至少含有从5'至3'的AAV 5'ITR、编码序列(即，转基因)和AAV 3'ITR。可以选择来自AAV2(与衣壳来源不同的AAV)或除了非全长ITR之外的ITR。在某些实施例中，ITR来自与在产生或反式补充AAV期间提供rep功能的AAV来源相同的AAV。另外，可以使用其它ITR，例如，自身互补的(scAAV)ITR。单链AAV和自身互补的(sc)AAV两者都涵盖在rAAV内。转基因是与载体序列异源的核酸编码序列，所述核酸编码序列编码多肽、蛋白质、功能性RNA分子(例如，miRNA、miRNA抑制剂)或其它所关注基因产物。核酸编码序列以允许转基因在靶组织的细胞中转录、翻译和/或表达的方式与调控组分可操作地连接。在本文中更详细地讨论了载体基因组的合适组分。在一个实例中，“载体基因组”至少含有从5'至3'的载体特异性序列、编码GLP-1构建体的核酸序列，所述核酸序列与调控控制序列(所述调控控制序列指导其在靶细胞中表达)可操作地连接，其中载体特异性序列可以是将载体基因组特异性地包装到病毒载体衣壳或包膜蛋白中的末端重复序列。例如，AAV反向末端重复序列用于包装到AAV和某些其它细小病毒衣壳中。

载体的AAV序列通常包括顺式作用的5'和3'反向末端重复序列(参见例如，B.J.Carter,《细小病毒手册(Handbook of Parvoviruses)》,P.Tijsser编辑,CRC出版社,第155 168页(1990))。ITR序列的长度为约145bp。优选地，分子中使用了编码ITR的基本上整个序列，尽管允许对这些序列进行一定程度的微小修饰。修饰这些ITR序列的能力在本领域的技术范围内。(参见例如，文本，如Sambrook等人,《分子克隆：实验室手册》,第2版,纽约的冷泉港实验室(Cold Spring Harbor Laboratory,New York)(1989)；以及K.Fisher等人,《病毒学杂志》,70:520 532(1996))。在本发明中采用的此类分子的实例是含有转基因的“顺式作用”质粒，其中所选择的转基因序列和相关调控元件侧接5'和3'AAV ITR序列。在一个实施例中，ITR来自与供应衣壳的AAV不同的AAV。在一个实施例中，来自AAV2的ITR序列。然而，可以选择来自其它AAV来源的ITR。已经描述了被称为ΔITR的5'ITR的缩短版本，其中缺失了D序列和末端解析位点(trs)。在某些实施例中，载体基因组包含130个碱基对的缩短的AAV2 ITR，其中缺失了外部A元件。不希望受理论束缚，据信在使用内部(A')元件作为模板的载体DNA扩增期间，缩短的ITR回复到145个碱基对的野生型长度。在其它实施例中，使用了全长AAV 5'和3'ITR。在ITR的来源来自AAV2并且AAV衣壳来自另一个AAV来源的情况下，所得载体可以被称为假型的。然而，这些元件的其它构型可以是合适的。

任选地，本文所述的GLP-1构建体可以通过除了rAAV之外的病毒载体递送。此类其它病毒载体可以包含适合于基因疗法的任何病毒，包含但不限于腺病毒；疱疹病毒；慢病毒；逆转录病毒等。合适地，在产生这些其它载体中的一种载体时，其产生为复制缺陷型病毒载体。

“复制缺陷型病毒”或“病毒载体”是指其中含有所关注基因的表达盒包装在病毒衣壳或包膜中的合成或人工病毒颗粒，其中也包装在病毒衣壳或包膜内的任何病毒基因组序列均是复制缺陷型的；即，所述合成或人工病毒颗粒不能产生子代病毒粒子但保留了感染靶细胞的能力。在一个实施例中，病毒载体的基因组不包含编码复制所需的酶的基因(基因组可以被工程化成“无肠的(gutless)”-仅含有所关注转基因，其侧接扩增和包装人工基因组所需的信号)，但是这些基因可以在产生期间供应。因此，这被认为可以安全地用于基因疗法，因为除非存在复制所需的病毒酶，否则不会发生通过子代病毒粒子进行的复制和感染。

还提供了包含本文所述的病毒载体构建体的组合物。本文所述的药物组合物被设计成用于通过任何合适的途径或不同途径的组合递送到有需要的受试者。直接递送到肝脏(任选地通过静脉内、通过肝动脉或通过移植)、口服施用途径、吸入施用途径、鼻内施用途径、气管内施用途径、动脉内施用途径、眼内施用途径、静脉内施用途径、肌内施用途径、皮下施用途径、皮内施用途径以及其它母体施用途径。本文所述的病毒载体可以以单一组合物或多种组合物的形式递送。任选地，可以递送两种或更多种不同的AAV，或多种病毒[参见例如，WO 2011/126808和WO 2013/049493]。在另一个实施例中，多种病毒可以含有不同的复制缺陷型病毒(例如，AAV和腺病毒)。在一个实施例中，施用是肌内进行的。在另一个实施例中，施用是静脉内进行的。

复制缺陷型病毒可以与生理上可接受的载体一起调配，用于基因转移和基因疗法应用。在AAV病毒载体的情况下，基因组拷贝(“GC”)的定量可以用作调配物中所含有的剂量的量度。可以使用本领域已知的任何方法来确定本发明的复制缺陷型病毒组合物的基因组拷贝(GC)数量。用于进行AAV GC数量滴定的一种方法如下：经纯化的AAV载体样品首先用DNase进行处理，以消除来自产生过程的未衣壳化的AAV基因组DNA或污染质粒DNA。然后使核酸酶抗性颗粒经受热处理，以从衣壳中释放基因组。然后使用靶向病毒基因组特定区域(通常为polyA信号)的引物/探针组通过实时PCR来定量经释放的基因组。用于确定基因组拷贝的另一种合适的方法是定量PCR(qPCR)，特别是经优化的qPCR或数字液滴PCR[LockMartin等人,《人类基因疗法方法(Human Gene Therapy Methods.)》2014年4月,25(2):115-125.doi:10.1089/hgtb.2013.131，2013年12月13日编辑之前在线发布]。

而且，复制缺陷型病毒组合物可以以一定剂量单位调配以含有在约1.0x 10⁹GC至约1.0x 10¹⁵GC的范围内的复制缺陷型病毒量。在另一个实施例中，这一量的病毒基因组可以以分剂量的形式递送。在一个实施例中，对于约70kg的平均人受试者，剂量为约1.0x10¹⁰GC至约3.0x 10¹⁴GC。在另一个实施例中，剂量约1x 10⁹GC。例如，AAV病毒的剂量可以为约1x 10¹⁰GC、1x 10¹¹Gc、约5X 10¹¹GC、约1X 10¹²GC、约5X10¹²GC或约1X 10¹³GC。在另一个实施例中，对于人受试者，剂量为约1.0x 10⁹GC/kg至约3.0x 10¹⁴GC/kg。在另一个实施例中，剂量约1x 10⁹GC/kg。例如，AAV病毒的剂量可以为约1x 10¹⁰GC/kg、1x 10¹¹GC/kg、约5X10¹¹GC/kg、约1X 10¹²GC/kg、约5X 10¹²GC/kg或约1X 10¹³GC/kg。在一个实施例中，构建体可以以1μL至约100mL的体积递送。如本文所使用的，术语“剂量”或“量”可以指在治疗过程中向受试者递送的总剂量或量或以单一单位(或多单位或分剂量)施用递送的剂量或量。

可以根据所公开的方法将上文所述的重组载体递送到宿主细胞。可以将优选地悬浮于生理学相容的载体中的rAAV施用于包含人在内的期望的受试者。鉴于转移病毒所针对的适应症，本领域技术人员可以容易地选择合适的载体。例如，一种合适的载体包含盐水，其可以与各种缓冲溶液(例如，磷酸盐缓冲盐水)一起调配。其它示例性载体包含无菌盐水、乳糖、蔗糖、磷酸钙、明胶、葡聚糖、琼脂、果胶、花生油、芝麻油和水。对载体的选择不是对本发明的限制。

在另一个实施例中，组合物包含载体、稀释剂、赋形剂和/或佐剂。在某些实施例中，为了施用于人类患者，将rAAV合适地悬浮于含有盐水、表面活性剂和药学上和/或生理学上相容的盐或盐的混合物的水溶液中。合适地，将调配物调整至生理上可接受的pH，例如，在pH 6至9、或pH 6.0至7.5、或pH 6.2至7.7、或pH 6.5至7.5、pH 7.0至7.7或pH 7.2至7.8或约7.0的范围内。在某些实施例中，将调配物的pH调整至约6.0、约6.1、约6.2、约6.3、约6.4、约6.5、约6.6、约6.7、约6.8、约6.9、约7.0、约7.1、约7.2、约7.3、约7.4、约7.5、约7.6、约7.7或约7.8。在某些实施例中，可能期望的pH为约7.28至约7.32、约6.0至约7.5、约6.2至约7.7、约7.5至约7.8、约6.0、约6.1、约6.2、约6.3、约6.4、约6.5、约6.6、约6.7、约6.8、约6.9、约7.0、约7.1、约7.2、约7.3、约7.4、约7.5、约7.6、约7.7或约7.8。在某些实施例中，对于静脉内递送，可能期望的pH为约6.8至约7.2。然而，可以选择最宽范围和这些子范围内的其它pH用于其它递送途径。

任选地，除了rAAV和/或变体以及载体之外，本发明的组合物还可以含有其它常规药物成分，如防腐剂或化学稳定剂。合适的示例性防腐剂包含氯丁醇、山梨酸钾、山梨酸、二氧化硫、没食子酸丙酯、对羟基苯甲酸甲酯、乙基香草醛、甘油、苯酚和对氯苯酚。合适的化学稳定剂包含明胶和白蛋白。

如本文所使用的，“载体”包含任何和所有溶剂、分散介质、媒剂、涂层、稀释剂、抗细菌剂和抗真菌剂、等渗剂和吸收延迟剂、缓冲液、载体溶液、悬浮液、胶质物等。此类介质和药剂用于药物活性物质的用途在本领域中是熟知的。补充性活性成分也可以掺入到组合物中。短语“药学上可接受的”是指当施用于宿主时不会产生过敏或类似不良反应的分子实体和组合物。如脂质体、纳米胶囊、微颗粒、微球、脂质颗粒、囊泡等递送媒剂可以用于将本发明的组合物引入到合适的宿主细胞中。具体地，rAAV载体递送的转基因可以被调配成用于递送或包封在脂质颗粒、脂质体、囊泡、纳米球或纳米颗粒等中。

在一个实施例中，组合物包含适合于递送到受试者的最终调配物，所述组合物是例如缓冲到生理上相容的pH和盐浓度的水性液体悬浮液。任选地，调配物中存在一种或多种表面活性剂。在另一个实施例中，可以将组合物作为稀释以施用于受试者的浓缩物运输。在其它实施例中，可以在施用时将组合物冻干并重构。

可以从无毒的非离子表面活性剂中选择合适的表面活性剂或表面活性剂的组合。在一个实施例中，选择终止于伯羟基的双官能嵌段共聚物表面活性剂，例如

F68[BASF公司(BASF)]，也被称为泊洛沙姆(Poloxamer)188，其具有中性pH，平均分子量为8400。可以选择其它表面活性剂和其它泊洛沙姆，即非离子三嵌段共聚物，所述非离子三嵌段共聚物由与聚氧乙烯(聚(环氧乙烷))的两个亲水链侧接的聚氧丙烯(聚(环氧丙烷))的中心疏水链、SOLUTOL HS 15(聚乙二醇-15羟基硬脂酸酯)、LABRASOL(聚氧辛酸甘油酯)、聚氧10油醚、TWEEN(聚氧乙烯山梨聚糖脂肪酸酯)、乙醇和聚乙二醇构成。在一个实施例中，调配物含有泊洛沙姆。这些共聚物通常以字母“P”(对于泊洛沙姆)命名，后跟三个数字：前两位数字x 100给出了聚氧丙烯核的近似分子量，并且最后一位数字x 10给出了聚氧乙烯含量的百分比。在一个实施例中，选择了泊洛沙姆188。表面活性剂可以以悬浮液的至多约0.0005％至约0.001％的量存在。

载体的剂量主要取决于如所治疗的病状、患者的年龄、体重和健康状况等因素，并且因此在患者之间可能有所不同。例如，病毒载体的治疗有效人剂量通常在约25微升至约1000微升至约100mL溶液的范围内，所述溶液含有浓度为约1x 10⁹至1x 10¹⁶个基因组病毒载体(以治疗平均体重为70kg的受试者)，包含所述范围内的整数或分数量，并且对于人类患者，优选地为1.0x 10¹²GC至1.0x 10¹³GC。本发明的组合物可以以约0.1μL至约10mL的体积递送，包含所述范围内的所有数字，这取决于待治疗区域的大小、所使用的病毒滴度、施用途径以及所述方法的期望效果。在一个实施例中，体积为约50μL。在另一个实施例中，体积为约70μL。在另一个实施例中，体积为约100μL。在另一个实施例中，体积为约125μL。在另一个实施例中，体积为约150μL。在另一个实施例中，体积为约175μL。在又另一个实施例中，体积为约200μL。在另一个实施例中，体积为约250μL。在另一个实施例中，体积为约300μL。在另一个实施例中，体积为约450μL。在另一个实施例中，体积为约500μL。在另一个实施例中，体积为约600μL。在另一个实施例中，体积为约750μL。在另一个实施例中，体积为约850μL。在另一个实施例中，体积为约1000μL。在另一个实施例中，体积为约1.5mL。在另一个实施例中，体积为约2mL。在另一个实施例中，体积为约2.5mL。在另一个实施例中，体积为约3mL。在另一个实施例中，体积为约3.5mL。在另一个实施例中，体积为约4mL。在另一个实施例中，体积为约5mL。在另一个实施例中，体积为约5.5mL。在另一个实施例中，体积为约6mL。在另一个实施例中，体积为约6.5mL。在另一个实施例中，体积为约7mL。在另一个实施例中，体积为约8mL。在另一个实施例中，体积为约8.5mL。在另一个实施例中，体积为约9mL。在另一个实施例中，体积为约9.5mL。在另一个实施例中，体积为约10mL。

在一些实施例中，在组合物中，携带编码期望转基因的核酸序列的重组腺相关病毒在调控序列的控制下的浓度令人期望地在约10⁷和10¹⁴个载体基因组/毫升(vg/mL)(也称为基因组拷贝/mL(GC/mL))的范围内。

在一个实施例中，组合物中的rAAV的剂量为约1.0x 10⁹GC/kg体重至约1.5x10¹³GC/kg。在一个实施例中，剂量为约1.0x 10¹⁰GC/kg。在一个实施例中，剂量为约1.0x10¹¹GC/kg。在一个实施例中，剂量为约1.0x 10¹²GC/kg。在一个实施例中，剂量为约5.0x 10¹²GC/kg。在一个实施例中，剂量为约1.0x 10¹³GC/kg。本文所述的所有范围都包含端点。

在一个实施例中，有效剂量(所递送的总基因组拷贝)为约10⁷至10¹³个载体基因组。在一个实施例中，总剂量为约10⁸个基因组拷贝。在一个实施例中，总剂量为约10⁹个基因组拷贝。在一个实施例中，总剂量为约10¹⁰个基因组拷贝。在一个实施例中，总剂量为约10¹¹个基因组拷贝。在一个实施例中，总剂量为约10¹²个基因组拷贝。在一个实施例中，总剂量为约10¹³个基因组拷贝。在一个实施例中，总剂量为约10¹⁴个基因组拷贝。在一个实施例中，总剂量为约10¹⁵个基因组拷贝。

令人期望的是利用最低有效浓度的病毒以降低如毒性等不期望效果的风险。在这些范围内的仍其它剂量和施用体积可以由主治医师考虑所治疗的受试者(优选地人)的身体状态、受试者的年龄、特定病症和病症(如果进行性的话)已经发展的程度来选择。

在某些实施例中，组合物包括rAAV，所述rAAV包括诱导型GLP-1激动剂构建体。在某些实施例中，诱导剂或分子是雷帕霉素或雷帕霉素类似物。在某些实施例中，诱导剂是雷帕霉素，并且在包括rAAV的组合物之后施用至少一次或多次、至少两次或更多次、至少三次或更多次。在一些实施例中，雷帕霉素以至少约4nM至至少约40nM的剂量施用。在某些实施例中，诱导剂(即，雷帕霉素)以至少约0.1mg/kg至至少约3.0mg/kg的剂量施用。在某些实施例中，诱导剂(即，雷帕霉素)以至少约0.5mg/kg至至少约2.0mg/kg的剂量施用。

本文所述的病毒载体和其它构建体可以用于制备药物，所述药物用于将GLP-1融合蛋白构建体递送到有需要的受试者，将具有增加的半衰期的GLP-1供应到受试者，和/或用于治疗受试者的I型糖尿病、II型糖尿病或代谢综合征。因此，在另一方面，提供了一种治疗糖尿病的方法。所述方法包含向有需要的受试者施用如本文所述的组合物。在一个实施例中，组合物包含含有GLP-1融合蛋白表达盒的病毒载体，如本文所述。

如本文所使用的，术语“治疗(treatment)”或“治疗(treating)”被定义为涵盖出于改善I型糖尿病、II型糖尿病或代谢综合征的一种或多种症状的目的向受试者施用本文所述的一种或多种化合物或组合物。因此，“治疗”可以包含降低给定受试者的I型糖尿病、II型糖尿病或代谢综合征的进展、降低给定受试者的症状的严重程度、消除给定受试者的疾病症状、延迟给定受试者的疾病的进展或增加给定受试者的疗法功效中的一种或多种。

如本文所使用的，术语“缓解”是指当受试者不再表现出糖尿病的临床体征并且具有正常血糖水平时停止胰岛素治疗的能力。

在另一个实施例中，提供了一种用于治疗受试者的T2DM的方法。所述方法包含施用病毒载体，所述病毒载体包括核酸分子，所述核酸分子包括编码如本文所述的融合蛋白的序列。在一个实施例中，所述受试者是人。

在另一方面，提供了一种治疗受试者的代谢性疾病的方法。所述方法包含向有需要的受试者施用如本文所述的组合物。在一个实施例中，组合物包含含有GLP-1融合蛋白表达盒的病毒载体，如本文所述。在一个实施例中，代谢性疾病是I型糖尿病。在一个实施例中，代谢性疾病是II型糖尿病。在一个实施例中，代谢性疾病是代谢综合征。在一个实施例中，受试者是人。

在另一方面，提供了一种减轻受试者的体重的方法。所述方法包含向有需要的受试者施用如本文所述的组合物。在一个实施例中，组合物包含含有GLP-1融合蛋白表达盒的病毒载体，如本文所述。

治疗过程可以任选地涉及重复施用相同的病毒载体(例如，AAVrh91载体)或不同的病毒载体(例如，AAVrh91和AAV3B.AR2.12)。可以使用本文所述的病毒载体选择仍其它组合。任选地，本文所述的组合物可以组合在涉及其它糖尿病药物或基于蛋白质的疗法(包含例如GLP-1类似物、胰岛素、口服抗高血糖药物(磺酰脲类、双胍类、噻唑烷二酮类和α-葡糖苷酶抑制剂))的方案中。任选地，本文所述的组合物可以组合在涉及生活方式变化的方案中，包含饮食和锻炼方案。在某些实施例中，AAV载体和组合疗法是基本上同时施用的。在其它实施例中，AAV载体是首先施用的。在其它实施例中，组合疗法是首先施用的。

在一个实施例中，组合物与有效量的胰岛素组合施用。各种可商购获得的胰岛素产品在本领域中是已知的，包含但不限于鱼精蛋白锌重组人胰岛素

猪胰岛素锌悬浮液/>

甘精胰岛素/>

赖脯胰岛素(Lispro)(优泌乐(Humalog))、天冬胰岛素(Aspart)(诺和锐(Novolog))、赖谷胰岛素(Glulisine)(艾倍得(Apidra))、诺和灵(novolin)和Velosulin。

在一些实施例中，与用病毒载体进行治疗之前相比，本文所述的rAAV与胰岛素的组合降低了受试者的胰岛素剂量要求。此类剂量要求可以降低10％或更多、20％或更多、30％或更多、40％或更多、50％或更多、60％或更多、70％或更多、80％或更多、或90％或更多。治疗医师可以确定受试者所需的胰岛素的正确剂量。例如，可以使用胰岛素或其它疗法来治疗受试者，所述治疗医师可以在施用AAV载体后继续进行治疗。此类胰岛素或其它协同疗法可以随后根据需要继续、减少或中断。

在一个实施例中，将包括表达盒、载体基因组、rAAV的组合物或本文所述的用于基因疗法的其它组合物以单剂量/患者递送。在一个实施例中，向受试者递送治疗有效量的本文所述的组合物。如本文所使用的，“治疗有效量”是指表达盒或载体或其组合在靶细胞中递送和表达足以达到治疗目标的GLP1-Fc的量的量。治疗有效量可以由治疗医师选择，或基于先前确定的指南指导。例如，度拉鲁肽可以以0.75mg的初始剂量每周一次皮下注射。剂量可以以1.5mg增量增加以实现另外的血糖控制。在将剂量增加至每周一次3mg之前，患者应保持在每周一次1.5mg剂量持续至少4周。在将剂量增加至每周一次4.5mg之前，患者应保持在每周一次3mg剂量持续至少4周。度拉鲁肽的维持剂量可以为每周一次皮下注射0.75mg至4.5mg，其中最大剂量为每周4.5mg。可以将rAAV递送到受试者，并且然后根据需要用口服或皮下度拉鲁肽、胰岛素或其它药物补充，以达到每周0.75mg至4.5mg的期望剂量的当量。

在某些实施例中，治疗目标是改善或治疗I型糖尿病、II型糖尿病或代谢综合征的症状中的一种或多种。治疗有效量可以基于动物模型而不是人类患者来确定。在另一个实施例中，治疗目标是缓解受试者的代谢性疾病。如本文所使用的，当用于指vp衣壳蛋白时，术语“异质”或其任何语法变型是指由不相同的元件组成的群体，例如具有带有不同的经修饰的氨基酸序列的vp1、vp2或vp3单体(蛋白质)。SEQ ID NO:20提供了AAVrh91 vp1蛋白的经编码的氨基酸序列。与vp1、vp2和vp3蛋白(可替代地被称为同种型)结合使用的术语“异质的”是指衣壳内的vp1、vp2和vp3蛋白的氨基酸序列中的差异。AAV衣壳含有具有来自预测的氨基酸残基的修饰的vp1蛋白内、vp2蛋白内和vp3蛋白内的亚群体。这些亚群体至少包含某些脱酰胺化的天冬酰胺(N或Asn)残基。例如，某些亚群体包括天冬酰胺-甘氨酸对中的至少一个、两个、三个或四个高度脱酰胺化的天冬酰胺(N)位置，并且任选地进一步包括其它脱酰胺化的氨基酸，其中脱酰胺化引起氨基酸变化和其它任选的修饰。

如本文所使用的，除非另有说明，否则vp蛋白的“亚群体”是指一组vp蛋白，所述一组vp蛋白具有至少一个限定的共同特性，并且由至少一个组成员到少于参考组的所有成员组成。例如，除非另有说明，否则vp1蛋白的“亚群体”是至少一种(1)vp1蛋白，并且少于组装的AAV衣壳中的所有vp1蛋白。除非另有说明，否则vp3蛋白的“亚群体”可以是少于组装的AAV衣壳中的所有vp3蛋白的一种(1)vp3蛋白。例如，vp1蛋白可以是vp蛋白的亚群体；vp2蛋白可以是vp蛋白的单独亚群体，并且vp3是组装的AAV衣壳中的vp蛋白的仍另外的亚群体。在另一个实例中，vp1、vp2和vp3蛋白可以含有具有不同修饰的亚群体，例如，至少一种、两种、三种或四种高度脱酰胺化的天冬酰胺，例如在天冬酰胺-甘氨酸对处。

如本文所使用的，rAAV的“原液”是指rAAV的群体。尽管由于脱酰胺作用，其衣壳蛋白具有异质性，但是rAAV在原液中被预期与5共享相同的载体基因组。原液可以包含具有衣壳的rAAV，所述衣壳具有例如所选择的AAV衣壳蛋白和所选择的产生系统的特有的异质脱酰胺模式。原液可以从单个产生系统中产生，或者从产生系统的多次运行中池化。可以选择各种产生系统，包含但不限于本文所述的产生系统。如本文所使用的，术语“GLP-1构建体”、“GLP-1表达构建体”和同义词包含如本文所述的GLP-1序列与前导序列和融合结构域的组合。术语“GLP-1构建体”、“GLP-1表达构建体”和同义词可以用于指编码GLP-1融合蛋白或其表达产物的核酸序列。

在核酸序列的上下文中，术语“同一性百分比(％)”、“序列同一性”、“序列同一性百分比”或“相同百分比”是指两个序列中的碱基在比对以获得对应性时是相同的。序列同一性比较的长度可以超过基因组的全长、基因编码序列的全长或至少约100至150个核苷酸的片段，或根据需要。然而，也可能期望较小片段之间的同一性，例如至少约九个核苷酸，通常至少约20至24个核苷酸、至少约28至32个核苷酸、至少约36个或更多个核苷酸。多个序列比对程序也可用于核酸序列。此类程序的实例包含“Clustal W”、“CAP序列组装”、“BLAST”、“MAP”和“MEME”，这些程序可通过因特网上的Web服务器进行访问。此类程序的其它来源是本领域技术人员已知的。可替代地，也使用了载体NTI实用程序。本领域已知的许多算法可以用于测量核苷酸序列同一性，包含上述程序中所含有的算法。作为另一个实例，可以使用GCG 6.1版本的程序Fasta^TM比较多核苷酸序列。Fasta^TM提供了查询序列与搜索序列之间最佳重叠区的比对和序列同一性百分比。例如，核酸序列之间的序列同一性百分比可以是使用如GCG 6.1版本中所提供的采用其默认参数(字号6和评分矩阵的NOPAM系数)的Fasta^TM所确定的，所述程序通过引用并入本文。

术语“高度保守的”意指至少80％同一性、优选地至少90％同一性，并且更优选地超过97％同一性。通过使用本领域技术人员已知的算法和计算机程序，本领域技术人员可以容易地确定同一性。

除非由较高范围另行规定，否则应当理解，同一性百分比是同一性的最低水平，并且涵盖同一性的所有较高水平，直至与参考序列的100％同一性。除非另有说明，否则应当理解，同一性的百分比是同一性的最低水平，并且涵盖同一性的所有较高水平，直至与参考序列的100％同一性。例如，“95％同一性”和“至少95％同一性”可以互换地使用，并且包含与参考序列的95％、96％、97％、98％、99％以及直至100％同一性，以及其间的所有分数。

在氨基酸序列的上下文中，术语“同一性百分比(％)”、“序列同一性”、“序列同一性百分比”或“相同百分比”是指两个序列中的残基在比对以获得对应性时是相同的。可以容易地确定蛋白质全长、多肽、约70个氨基酸至约100个氨基酸或其肽片段或对应的核酸序列编码序列上的氨基酸序列的同一性百分比。合适的氨基酸片段的长度可以为至少约8个氨基酸，并且可以为至多约150个氨基酸。通常，当提及两种不同序列之间的“同一性”、“同源性”或“类似性”时，参考“比对”序列来确定“同一性”、“同源性”或“类似性”。“比对”序列或“比对”是指与参考序列相比，通常含有对丢失的或另外的碱基或氨基酸的校正的多个核酸序列或蛋白质(氨基酸)序列。使用多种公开或可商购获得的多序列比对程序中的任一种进行比对。序列比对程序可用于氨基酸序列，例如，“Clustal X”、“MAP”、“PIMA”、“MSA”、“BLOCKMAKER”、“MEME”和“Match-Box”程序。通常，以默认设置使用这些程序中的任何程序，尽管本领域技术人员可以根据需要改变这些设置。可替代地，本领域技术人员可以利用另一种算法或计算机程序，所述算法或计算机程序提供至少与参考算法和程序所提供的同一性或比对水平相同的同一性或比对。参见例如，J.D.Thomson等人,《核酸研究(Nucl.Acids.Res.)》,“多个序列比对的全面比较(A comprehensive comparison ofmultiple sequence alignments)”,27(13):2682-2690(1999)。

应注意的是，术语“一个(a)”或“一种(an)”是指一个或多个/一种或多种。如此，术语“一个”(或“一种”)、“一个或多个”和“至少一个”在本文可互换地使用。

词语“包括(comprise)”、“包括(comprises)”和“包括(comprising)”将被解释为是包含性而非排他性的。词语“由…组成(consist/consisting)”和其变型将被解释为是排他性的而非包含性的。虽然说明书中的各个实施例是使用“包括”语言来呈现的，但是在其它情况下，也旨在使用“由…组成”或“基本上由…组成”的语言来解释和描述相关实施例。

如本文所使用的，“患者”或“受试者”是指哺乳动物，包含人、兽医或农场动物、家畜或宠物以及通常用于临床研究的动物。在一个实施例中，这些方法和组合物的受试者是人。在另实施例中，受试者不是猫科动物。

如本文所使用的，除非另有说明，否则术语“约”意指相对于给定参考的10％(±10％，例如，±1、±2、±3、±4、±5、±6、±7、±8、±9、±10或其之间的值)的变化性。

在某些情况下，术语“E+#”或术语“e+#”用于指代指数。例如，“5E10”或“5e10”是5x10¹⁰。这些术语可以互换地使用。

如本文所使用的，术语“调控”或其变型是指组合物抑制生物通路的一个或多个组分的能力。

如本文所使用的，“疾病”、“病症”和“病状”可互换地用于指示受试者的异常状态。

除非在本说明书中另有定义，否则本文所使用的技术术语和科学术语具有与本领域的普通技术人员和参照公开文本所通常理解的相同含义，这为本领域的技术人员提供了本申请中使用的许多术语的通用指南。

在描述实施例时对“一个实施例”或“另一个实施例”的引用并不意味着所引用的实施例与另一个实施例(例如，在所引用实施例之前描述的实施例)相互排斥，除非另有明确规定。

具体实施例

1.一种病毒载体，其包括核酸，所述核酸包括编码融合蛋白的序列，所述融合蛋白包括GLP-1类似物和IgG4 Fc。

2.根据实施例1所述的病毒载体，其中所述载体是腺相关病毒载体。

3.根据实施例1或实施例2所述的病毒载体，其中所述融合蛋白进一步包括凝血酶前导序列。

4.根据实施例3所述的病毒载体，其中所述凝血酶前导序列包括具有至多1个、2个或3个氨基酸取代的SEQ ID NO:7或其功能变体的序列。

5.根据实施例1至4中任一项所述的病毒载体，其中所述融合蛋白进一步包括间隔子。

6.根据实施例1至5中任一项所述的病毒载体，其中所述融合蛋白包括人凝血酶前导序列、GLP-1类似物、间隔子和人IgG4 Fc。

7.根据实施例1至6所述的病毒载体，其中所述融合蛋白具有SEQ ID NO:14的序列或与其至少99％相同的序列。

8.根据实施例1至7中任一项所述的病毒载体，其中编码所述融合蛋白的所述序列是SEQ ID NO:15。

9.根据实施例1至8中任一项所述的病毒载体，其包括：

(a)AAV衣壳，以及

(b)包装在所述AAV衣壳中的载体基因组，所述载体基因组包括AAV反向末端重复序列(ITR)、所述融合蛋白的所述编码序列以及指导所述融合蛋白的表达的调控序列。

10.根据实施例1至9中任一项所述的病毒载体，其中所述病毒载体是具有AAV8的所述AAV衣壳或其功能变体的重组腺相关病毒(rAAV)。

11.根据实施例1至9中任一项所述的病毒载体，其中所述病毒载体是具有AAVrh91的AAV衣壳或其功能变体的rAAV。

12.根据实施例1至9中任一项所述的病毒载体，其中所述病毒载体是具有AAV3B.AR2.12的所述AAV衣壳或其功能变体的rAAV。

13.根据实施例1至9中任一项所述的病毒载体，其中所述病毒载体是具有选自以下的所述AAV衣壳或其功能变体的rAAV：AAV9、AAVrh64R1、AAVhu37或AAVrh10。

14.根据实施例1至13中任一项所述的病毒载体，其包括载体基因组，所述载体基因组包括诱导型基因表达系统、可调控启动子、编码所述融合蛋白的所述序列和聚腺苷酸化信号。

15.根据实施例9至14中任一项所述的病毒载体，其中所述AAV反向末端重复序列(ITR)是侧接所述融合蛋白编码序列和所述调控序列的AAV2 5'ITR和AAV2 3'ITR。

16.根据实施例9至15中任一项所述的病毒载体，其中所述载体基因组包括人巨细胞病毒启动子和兔珠蛋白poly A。

17.根据实施例1至16中任一项所述的病毒载体，其包括诱导型基因表达系统。

18.根据实施例17所述的病毒载体，其中所述诱导型基因表达系统包括：

(a)激活结构域，所述激活结构域包括FKBP12-雷帕霉素相关蛋白(FRAP)的反式激活结构域和FKBP12-雷帕霉素结合(FRB)结构域；

(b)DNA结合结构域，所述DNA结合结构域包括锌指同源结构域(ZFHD)和一个、两个或三个FK506结合蛋白结构域(FKBP)亚基基因；以及

(c)ZFHD结合位点的至少一个拷贝，随后是最小IL2启动子，以及

(d)可调控启动子；

其中有效量的雷帕霉素或雷帕霉素类似物的存在诱导转基因在宿主细胞中的表达。

19.根据实施例18所述的病毒载体，其中所述FKBP亚基基因序列彼此共享小于约85％同一性。

20.根据实施例18或19所述的病毒载体，其中所述FKBP亚基基因序列之一是天然FKBP基因序列。

21.根据实施例18至20中任一项所述的病毒载体，其中所述反式激活结构域包括NF-κB p65的一部分。

22.根据实施例18至21中任一项所述的病毒载体，其中所述可调控启动子是组成型启动子。

23.根据实施例18至21中任一项所述的病毒载体，其中所述可调控启动子是组织特异性启动子。

24.根据实施例18至22中任一项所述的病毒载体，其中所述可调控启动子是CMV启动子。

25.根据实施例18至24中任一项所述的病毒载体，其进一步包括IRES或2A。

26.根据实施例18至25中任一项所述的病毒载体，其进一步包括选自GT2A_V1(SEQID NO:21)或GT2A_V2(SEQ ID NO:22)的2A连接子。

27.根据实施例18至26中任一项所述的病毒载体，其包括所述ZFHD结合位点的至少8个拷贝。

28.根据实施例18至27中任一项所述的病毒载体，其中所述载体基因组包括SEQID NO:16的序列或与其至少95％至99.9％相同的序列。

29.一种病毒载体，其包括核酸分子，所述核酸分子包括：可调控启动子；激活结构域，所述激活结构域包括p65反式激活结构域和FKBP12-雷帕霉素相关蛋白(FRAP)的FKBP12-雷帕霉素结合(FRB)结构域；DNA结合结构域，所述DNA结合结构域包括锌指同源结构域(ZFHD)和三个FK506结合蛋白结合域(FKBP)亚基基因；ZFHD结合位点的8个拷贝；以及编码包括GLP-1类似物和人IgG4 Fc的融合蛋白的序列。

30.一种适用于治疗受试者的代谢性疾病的药物组合物，所述药物组合物包括水性液体和根据实施例1至20中任一项所述的病毒载体。

31.根据实施例30所述的药物组合物，其中所述融合蛋白包括人凝血酶前导序列、GLP-1类似物、间隔子和人IgG4 Fc。

32.根据实施例1至29中任一项所述的病毒载体或根据实施例30或31中任一项所述的药物组合物，其在用于治疗患有代谢性疾病的受试者的方法中使用。

33.根据实施例1至29中任一项所述的病毒载体或根据实施例29至31中任一项所述的药物组合物在制造用于治疗患有代谢性疾病的受试者的药物中的用途。

34.根据实施例32或33所述的病毒载体或用途，其中所述组合物被调配为以1x10⁹GC/kg至5x 10¹³GC/kg的所述rAAV的剂量施用。

35.根据实施例32或33中任一项所述的病毒载体或用途，其中所述患者是人并且向所述患者施用1x 10¹⁰GC至1.5x 10¹⁵GC的所述rAAV的剂量。

36.根据实施例32至35中任一项所述的病毒载体或用途，其中所述rAAV是肌内或静脉内递送的。

37.一种治疗患有代谢性疾病的受试者的方法，所述方法包括向所述受试者递送重组腺相关病毒(rAAV)，所述rAAV具有来自腺相关病毒rh91的AAV衣壳和包装在所述AAV衣壳中的载体基因组，所述载体基因组包括AAV反向末端重复序列(ITR)、编码包括GLP-1类似物和人IgG4 Fc的融合蛋白的序列以及指导所述融合蛋白的表达的调控序列。

38.根据实施例37所述的方法，其中向所述患者施用根据实施例1至29中任一项所述的病毒载体或根据实施例30至31中任一项所述的药物组合物。

39.根据实施例37或38所述的方法，其中向所述患者施用1x 10⁹GC/kg至5x10¹³GC/kg体重的所述AAV的剂量。

40.根据实施例37至39中任一项所述的方法，其中所述rAAV是肌内或静脉内递送的。

41.根据实施例1至29、32或34至36中任一项所述的病毒载体、根据实施例30至32中任一项所述的组合物、根据任一实施例33至36所述的用途或根据实施例37至40中任一项所述的方法，其用于治疗人的糖尿病。

实例

提供以下实例来说明本发明的各个实施例。实例并非旨在以任何方式限制本发明。

胰高血糖素样肽1(GLP-1)是由胰高血糖素前蛋白在胃肠(GI)道中的蛋白水解切割产生的激素。GLP-1通过增强β细胞的胰岛素释放、增加一些组织的胰岛素敏感性、减缓胃排空(不引起低血糖症)和增加饱腹感来广泛调控葡萄糖稳态。GLP-1由于其极短的半衰期而无法有效地用作药物，但GLP-1的长效类似物已成为广泛用于治疗2型糖尿病的药物。GLP-1激动剂具有优异的安全性特征并且需要重复的、通常终生的肠胃外施用，从而使得所述激动剂成为AAV介导的基因转移的良好候选物，这可以在单次施用之后实现长期表达。GLP-1和GLP-1激动剂难以从AAV载体中表达，因为蛋白质无法在其天然背景(胰高血糖素蛋白)中表达，这需要由对小肠的L细胞具有特异性的蛋白酶进行加工。使用异源性信号肽表达GLP-1的尝试未能实现高水平的表达。提出信号肽可能无法实现可靠的表达，因为所述信号肽不导致参与受体结合的GLP-1N末端的适当加工。相反，使用前肽表达GLP-1，所述前肽被切割以产生游离GLP-1蛋白。从如凝血酶和因子IX等凝血因子中选择前肽用于GLP-1表达，因为这些前肽可以被普遍存在的蛋白酶(例如，弗林蛋白酶)切割并且是将不具有免疫原性的内源性肽。相对于单独的信号肽，凝血酶前肽将人GLP-1类似物的表达增加至少100倍。使用这一技术，已经开发了可以从AAV载体中表达的两种长效GLP-1类似物，一种长效GLP-1类似物包括IgG4 Fc融合物，并且一种长效GLP-1类似物包括白蛋白融合物，两者都携带人前肽。已经开发了用于通过施用激活GLP-1激动剂序列的转录的小分子药物来组成性地或以受控方式表达这些蛋白质的表达盒。目标产品特征被设计为单次肌内注射。在一个实施例中，单次注射包括诱导型版本，如每2-4周一次单个丸剂，其被设计成维持治疗性GLP-1激动剂水平。作为另一个实施例，单次注射包括组成型版本，其被设计成用于在一次剂量之后以治疗水平持续终生表达。将所设计产品在临床前模型中进行测试，以检查在非人类灵长动物中的药理学和安全性。开发了针对GLP-1激动剂表达和活性的测定。已经检查了安全性和药代动力学，以分析实现已知治疗浓度的能力。

这一创新允许针对2型糖尿病进行一次性、潜在的终生治疗，尤其是在3个月后单独使用二甲双胍(metformin)或其它口服剂未实现糖化血红蛋白(也称为糖化血红蛋白、血红蛋白A1c、HbA1c或A1c)目标的患者中。目前的护理标准包含长效皮下GLP-1激动剂，如利拉鲁肽(每日施用)、度拉鲁肽(每周施用)、DPP(例如，二肽基肽酶-4)IV抑制剂(PO)和塞马鲁肽(Semaglutide)PO(每日施用)。实现AAV介导的GLP-1表达的先前尝试产生显著更低的表达，或需要使用具有免疫原性并且不适于临床应用的异种前导序列。

实例1-GLP-1载体的构建

GLP-1激动剂通过腺相关病毒(AAV)表达是具有挑战性的。GLP-1通常由胰高血糖素前体蛋白表达，其需要组织特异性蛋白酶并且产生不想要的蛋白质。使用传统的异源性信号肽的表达系统产生低表达。使用具有通用蛋白酶切割位点的异源性前肽的表达系统产生可以作为T细胞的靶标的外源蛋白序列。开发了一种系统，所述系统在不引入外源蛋白序列的情况下将肝脏或肌细胞中的GLP-1表达增加约300倍。图5示出了经工程化的GLP-1构建体在小鼠体内的AAV介导的表达。小鼠接受肌内注射表达GLP-1激动剂的AAV载体与已经开发的标准IL-2信号肽或内源性前体。注射后3周通过ELISA测量血清GLP-1浓度。

更具体地，构建了载体，其中前导序列置于若干GLP-1受体激动剂氨基酸序列之一的上游，随后是融合结构域。参见例如，图4。将所得蛋白质序列回译，随后添加kozak共有序列、终止密码子和克隆位点。产生序列，并且将序列在诱导型表达系统的控制下克隆到含有CMV启动子的表达载体中。表达构建体侧接AAV2 ITR。所得质粒被称为pAAV.TF.GT2A.度拉鲁肽(trb).3w.rBG。人凝血酶-度拉鲁肽氨基酸序列示出于SEQ ID NO:14中；编码序列示出于SEQ ID NO:15中；载体基因组示于SEQ ID NO:16中。

目前可获得的诱导型构建体包含2-载体和1-载体诱导型系统。参见例如，图6A和图6B。图6A示出了用于在双载体系统中使用的包括诱导型构建体的示例表达盒的示意图。图6B示出了用于在1-载体系统中使用的包括诱导型构建体的表达盒的示意图，所述表达盒包括IRES连接子。

此外，在包括GLP1-Fc转基因的表达载体中引入GT2A肽。具有分泌信号的人GLP1-Fc(h度拉鲁肽)为954bp。对于h度拉鲁肽构建体(如上所述)在图6B所示的表达载体中的表达，用GT2A切割序列置换IRES连接子，这允许其适合于包装限制(图7A；GLP-1Fc的单诱导型盒)。GT2A肽选自包括SEQ ID NO:21的氨基酸序列的GT2A_V1肽或包括SEQ ID NO:22的氨基酸序列的GT2A_V2肽。图7A示出了用于在1-载体系统中使用的包括诱导型构建体的表达盒的示意图，所述表达盒包括F2A切割序列连接子和具有分泌信号的人GLP1-Fc(h度拉鲁肽)。

实例2–体外表达

在用具有人凝血酶信号序列的诱导型人度拉鲁肽(TF.GT2A.度拉鲁肽(Trb))和CB7.猫科动物度拉鲁肽(feTrb)的质粒转染的HEK293细胞的培养上清液中测量GLP1-Fc融合物。猫科度拉鲁肽是指这样的构建体，其中度拉鲁肽的IgG Fc部分被猫科IgG序列置换，任选地与猫科凝血酶前导序列(feTrb)组合。在用0nM、4nM和40nM的雷帕霉素(Rapa)处理后48小时或在转染CB7.fe度拉鲁肽(feTrb)后48小时，收集上清液。GLP1-Fc通过活性形式GLP1 ELISA连同试剂盒的STD进行定量。在图2中示出了三种构建体的表达。增加雷帕霉素的剂量引起GLP-1的表达增加。

此外，评估了恒河猴示例性治疗转基因(rhTT)在包括GT2A_V1或GT2A_V2肽的所设计的构建体中的表达(图6B、7A和7B)。图8示出了在HEK293细胞上清液中的恒河猴治疗转基因(rhTT)的表达，如在用包括GT2A肽的各种构建体转染并且用0nM、4nM和40nM的雷帕霉素处理后测量的，并且以IU/mL rhTT绘制。接下来，使用包括GT2A_V1和GT2A_V2肽的所设计的单个诱导型盒在体外检查人和恒河猴GLP-1Fc表达的表达。图9示出了体外的诱导型人(h)和恒河猴(rh)GLP-1表达。在用包括凝血酶信号序列的诱导型h度拉鲁肽、包括2-载体系统的rh度拉鲁肽和CB7.rh度拉鲁肽的质粒转染的HEK293细胞的培养上清液中测量GLP1-Fc融合物。将细胞在第0天铺板，在第1天转染，在第2天用0nM、4nM和40nM的雷帕霉素处理，并且在第4天或转染CB7.rh度拉鲁肽(rhTrb)后48小时收集来自细胞的上清液。GLP1-Fc通过活性形式GLP1 ELISA连同试剂盒的STD进行定量。

实例3-Rag1KO小鼠体内的中试表达

如先前所述，通过三重转染和碘克沙醇梯度纯化将以下构建体包装到AAVrh91载体中。

AAVrh91.TF.h度拉鲁肽(Trb).3w.rBG，具有人凝血酶信号

AAVrh91.TF.rh度拉鲁肽(rhTrb).3w.rBG，具有恒河猴凝血酶信号

通过IM施用途径，通过注射载体(1x 10¹¹GC/小鼠)处理Rag1KO雌性小鼠(n＝5/载体)。通过在含有5微升DPP-IV抑制剂(密理博公司(Millipore))的血清分离管中分离全血来连续收集血清，并且如上所述测定活性GLP-1表达和活性。在第0天注射载体，并且在约第14天和第15天施用雷帕霉素。图3中示出了血清活性GLP-1浓度。在雷帕霉素施用后大约1周，血清水平达到最大值。

实例4–NHP体内的长期表达研究

在这项研究中，检查了恒河猴GLP-1(rh度拉鲁肽)在非人类灵长类动物(NHP；即，恒河猴)体内的表达。表1A和1B示出了包含AAV施用和雷帕霉素施用(即，诱导)在内的研究的概况。简而言之，通过肌内注射(IM)施用NHPs1-3(AAVrh91指定的载体)–NHP1：AAVrh91.CB7.rh度拉鲁肽.rBG，以1x 10¹²(1e12)GC/kg的剂量；NHP2：AAVrh91.CMV.TFNc.3AAVrh91.Z12I.rh度拉鲁肽.rBG和AAVrh91.Z12I.rh度拉鲁肽.rBG，各自以5x 10¹²(5e12)GC/kg的剂量；以及NHP3：1x 10¹³(1e13)GC/kg。对于NHP2，在第21天以0.5mg/kg的剂量施用雷帕霉素，在第56天以0.5mg/kg的剂量施用雷帕霉素，并且在第126天以2.0mg/kg的剂量施用雷帕霉素。对于NHP3，在第21天以0.5mg/kg的剂量施用雷帕霉素，在第78天以0.5mg/kg的剂量施用雷帕霉素，并且在第148天以2.0mg/kg的剂量施用。

表1A.

表1B.

总之，已经开发了用于表达人GLP1-Fc融合物的1-载体诱导型系统。另外，证实了在Rag1KO小鼠中雷帕霉素对人GLP1-Fc的诱导。在NHP中，观察到表达猴GLP1-Fc的1-载体和2-载体诱导型载体响应于雷帕霉素并且引起血清GLP1-Fc在大于1nM下在超过20天持续时间内瞬时增加。观察到低剂量组成型表达载体提供了NHP的血清GLP1-Fc的高且持续的表达。

(序列表自由测试)

对于在数字标识符<223>下含有自由文本的序列，提供了以下信息。

本说明书中引用的所有文件通过引用并入本文。于2020年8月24日提交的美国临时专利申请第63/069,500号连同其序列表一起通过引用整体并入本文。随此提交的标记为“20-9429PCT_Seq_List_ST25”的序列表以及其中的序列和文本通过引用并入。虽然已经参考特定实施例描述了本发明，但是应当理解，可以在不脱离本发明的精神的情况下进行修改。此类修改旨在落入所附权利要求的范围内。

序列表

<110> 宾夕法尼亚大学受托人

（The Trustees of the University of Pennsylvania）

<120> 编码GLP-1受体激动剂融合物的病毒载体和其在治疗代谢性

疾病中的用途

<130> UPN-20-9429.PCT

<150> US 63/069,500

<151> 2020-08-24

<160> 41

<170> PatentIn 3.5版

<210> 1

<211> 37

<212> PRT

<213> 智人（Homo sapiens）

<400> 1

His Asp Glu Phe Glu Arg His Ala Glu Gly Thr Phe Thr Ser Asp Val

1 5 10 15

Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu

20 25 30

Val Lys Gly Arg Gly

35

<210> 2

<211> 31

<212> PRT

<213> 智人（Homo sapiens）

<400> 2

His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly

1 5 10 15

Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly

20 25 30

<210> 3

<211> 31

<212> PRT

<213> 人工序列

<220>

<223> 构建序列

<400> 3

His Gly Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Glu

1 5 10 15

Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Gly Gly

20 25 30

<210> 4

<211> 31

<212> PRT

<213> 人工序列

<220>

<223> 构建序列

<400> 4

His Gly Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly

1 5 10 15

Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly

20 25 30

<210> 5

<211> 39

<212> PRT

<213> 人工序列

<220>

<223> 构建序列

<400> 5

His Gly Glu Gly Thr Phe Thr Ser Asp Leu Ser Lys Gln Met Glu Glu

1 5 10 15

Glu Ala Val Arg Leu Phe Ile Glu Trp Leu Lys Asn Gly Gly Pro Ser

20 25 30

Ser Gly Ala Pro Pro Pro Ser

35

<210> 6

<211> 44

<212> PRT

<213> 人工序列

<220>

<223> 构建序列

<400> 6

His Gly Glu Gly Thr Phe Thr Ser Asp Leu Ser Lys Gln Met Glu Glu

1 5 10 15

Glu Ala Val Arg Leu Phe Ile Glu Trp Leu Lys Asn Gly Gly Pro Ser

20 25 30

Ser Gly Ala Pro Pro Ser Lys Lys Lys Lys Lys Lys

35 40

<210> 7

<211> 43

<212> PRT

<213> 智人（Homo sapiens）

<400> 7

Met Ala His Val Arg Gly Leu Gln Leu Pro Gly Cys Leu Ala Leu Ala

1 5 10 15

Ala Leu Cys Ser Leu Val His Ser Gln His Val Phe Leu Ala Pro Gln

20 25 30

Gln Ala Arg Ser Leu Leu Gln Arg Val Arg Arg

35 40

<210> 8

<211> 24

<212> PRT

<213> 智人（Homo sapiens）

<400> 8

Met Ala His Val Arg Gly Leu Gln Leu Pro Gly Cys Leu Ala Leu Ala

1 5 10 15

Ala Leu Cys Ser Leu Val His Ser

20

<210> 9

<211> 19

<212> PRT

<213> 智人（Homo sapiens）

<400> 9

Gln His Val Phe Leu Ala Pro Gln Gln Ala Arg Ser Leu Leu Gln Arg

1 5 10 15

Val Arg Arg

<210> 10

<211> 20

<212> PRT

<213> 智人（Homo sapiens）

<400> 10

Met Tyr Arg Met Gln Leu Leu Ser Cys Ile Ala Leu Ser Leu Ala Leu

1 5 10 15

Val Thr Asn Ser

20

<210> 11

<211> 229

<212> PRT

<213> 智人（Homo sapiens）

<400> 11

Ala Glu Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu

1 5 10 15

Ala Ala Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp

20 25 30

Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp

35 40 45

Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly

50 55 60

Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn

65 70 75 80

Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp

85 90 95

Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro

100 105 110

Ser Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu

115 120 125

Pro Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn

130 135 140

Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile

145 150 155 160

Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr

165 170 175

Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg

180 185 190

Leu Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys

195 200 205

Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu

210 215 220

Ser Leu Ser Leu Gly

225

<210> 12

<211> 585

<212> PRT

<213> 智人（Homo sapiens）

<400> 12

Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly Glu

1 5 10 15

Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu Gln

20 25 30

Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu

35 40 45

Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Lys

50 55 60

Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Leu

65 70 75 80

Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu Pro

85 90 95

Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn Leu

100 105 110

Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His

115 120 125

Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala Arg

130 135 140

Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg

145 150 155 160

Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala Ala

165 170 175

Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ser

180 185 190

Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly Glu

195 200 205

Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe Pro

210 215 220

Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr Lys

225 230 235 240

Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Asp

245 250 255

Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile Ser

260 265 270

Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His

275 280 285

Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser

290 295 300

Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ala

305 310 315 320

Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Arg

325 330 335

Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Thr

340 345 350

Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu

355 360 365

Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro

370 375 380

Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Glu

385 390 395 400

Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro

405 410 415

Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys

420 425 430

Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys

435 440 445

Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu His

450 455 460

Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser

465 470 475 480

Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Thr

485 490 495

Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp

500 505 510

Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Ala

515 520 525

Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu

530 535 540

Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys

545 550 555 560

Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val

565 570 575

Ala Ala Ser Gln Ala Ala Leu Gly Leu

580 585

<210> 13

<211> 15

<212> PRT

<213> 人工序列

<220>

<223> 构建序列

<400> 13

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

1 5 10 15

<210> 14

<211> 318

<212> PRT

<213> 人工序列

<220>

<223> 构建序列

<400> 14

Met Ala His Val Arg Gly Leu Gln Leu Pro Gly Cys Leu Ala Leu Ala

1 5 10 15

Ala Leu Cys Ser Leu Val His Ser Gln His Val Phe Leu Ala Pro Gln

20 25 30

Gln Ala Arg Ser Leu Leu Gln Arg Val Arg Arg His Gly Glu Gly Thr

35 40 45

Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Glu Gln Ala Ala Lys Glu

50 55 60

Phe Ile Ala Trp Leu Val Lys Gly Gly Gly Gly Gly Gly Gly Ser Gly

65 70 75 80

Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Glu Ser Lys Tyr Gly Pro

85 90 95

Pro Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala Gly Gly Pro Ser Val

100 105 110

Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr

115 120 125

Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu Asp Pro Glu

130 135 140

Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys

145 150 155 160

Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg Val Val Ser

165 170 175

Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys

180 185 190

Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu Lys Thr Ile

195 200 205

Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro

210 215 220

Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu

225 230 235 240

Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn

245 250 255

Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser

260 265 270

Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp Lys Ser Arg

275 280 285

Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu

290 295 300

His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu Gly

305 310 315

<210> 15

<211> 954

<212> DNA

<213> 人工序列

<220>

<223> 构建序列

<400> 15

atggctcacg ttcgaggact gcagctgcct ggatgtctgg ctcttgccgc tctgtgtagc 60

ctggtgcaca gccagcacgt gtttctggct cctcagcaag ccagatcact gctgcagaga 120

gttagaaggc acggcgaggg cacctttacc tccgacgtgt ctagctacct ggaagaacag 180

gccgccaaag agtttatcgc ctggctggtc aaaggtggcg gcggaggcgg aggaagcggt 240

ggcggaggtt caggtggtgg tggatctgcc gagtctaagt acggccctcc ttgtcctccc 300

tgtcctgctc ccgaagctgc tggcggccca tccgtgtttc tgttccctcc aaagcctaag 360

gacaccctga tgatcagcag aacccctgaa gtgacctgcg tggtggtcga cgtgtcccaa 420

gaggatcctg aggtgcagtt caattggtac gtggacggcg tggaagtgca caacgccaag 480

accaagccta gagaggaaca gttcaacagc acctacagag tggtgtccgt gctgaccgtg 540

ctgcaccagg attggctgaa cggcaaagag tacaagtgca aggtgtccaa caagggcctg 600

cctagctcca tcgagaaaac catcagcaag gccaagggcc agccaagaga accccaggtg 660

tacacactgc ctccaagcca agaggaaatg accaagaacc aggtgtccct gacctgcctc 720

gtgaagggct tctacccttc cgatatcgcc gtggaatggg agagcaatgg ccagcctgag 780

aacaactaca agaccacacc tcctgtgctg gacagcgacg gctcattctt cctgtacagc 840

agactgaccg tggacaagag cagatggcaa gagggcaacg tgttcagctg cagcgtgatg 900

cacgaggccc tgcacaacca ctacacccag aagtctctga gcctgagcct gggc 954

<210> 16

<211> 4931

<212> DNA

<213> 人工序列

<220>

<223> 构建序列

<400> 16

ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120

aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180

agtacgcgtt cgagctcgcc ccgttacata acttacggta aatggcccgc ctggctgacc 240

gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 300

agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 360

acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 420

cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 480

cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg 540

atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt 600

gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac 660

gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttagtgaa 720

ccgtcagatc gcctggagac gccatccacg ctgttttgac ctccatagaa gacaccggga 780

ccgatccagc ctccggggga tcttggtggc gtgaaactcc cgcagatctt cggccagcga 840

attccagaag ccaccatgga ctatcctgct gccaagaggg tcaagttgga ctctagaatc 900

ctctggcatg agatgtggca tgaaggcctg gaagaggcat ctcgtttgta ctttggggaa 960

aggaacgtga aaggcatgtt tgaggtgctg gagcccttgc atgctatgat ggaacggggc 1020

ccccagactc tgaaggaaac atcctttaat caggcctatg gtcgagattt aatggaggcc 1080

caagagtggt gcaggaagta catgaaatca gggaatgtca aggacctcct ccaagcctgg 1140

gacctctatt atcatgtgtt ccgacgaatc tcaaagacta gagatgagtt tcccaccatg 1200

gtgtttcctt ctgggcagat cagccaggcc tcggccttgg ccccggcccc tccccaagtc 1260

ctgccccagg ctccagcccc tgcccctgct ccagccatgg tatcagctct ggcccaggcc 1320

ccagcccctg tcccagtcct agccccaggc cctcctcagg ctgtggcccc acctgccccc 1380

aagcccaccc aggctgggga aggaacgctg tcagaggccc tgctgcagct gcagtttgat 1440

gatgaagacc tgggggcctt gcttggcaac agcacagacc cagctgtgtt cacagacctg 1500

gcatccgtcg acaactccga gtttcagcag ctgctgaacc agggcatacc tgtggccccc 1560

cacacaactg agcccatgct gatggagtac cctgaggcta taactcgcct agtgacaggg 1620

gcccagaggc cccccgaccc agctcctgct ccactggggg ccccggggct ccccaatggc 1680

ctcctttcag gagatgaaga cttctcctcc attgcggaca tggacttctc agccctgctg 1740

agtcagatca gctccggctc tggcgaaggc agaggcagcc tgcttacctg tggcgacgtg 1800

gaagagaacc ccggacctgc tgccaagagg gtcaagttgg actctagaga acgcccatat 1860

gcttgccctg tcgagtcctg cgatcgccgc ttttctcgct cggatgagct tacccgccat 1920

atccgcatcc acacaggcca gaagcccttc cagtgtcgaa tctgcatgcg taacttcagt 1980

cgtagtgacc accttaccac ccacatccgc acccacacag gcggcggccg caggaggaag 2040

aaacgcacca gcatagagac caacatccgt gtggccttag agaagagttt cttggagaat 2100

caaaagccta cctcggaaga gatcactatg attgctgatc agctcaatat ggaaaaagag 2160

gtgattcgtg tttggttctg taaccgccgc cagaaagaaa aaagaatcaa cactagagga 2220

gtgcaggtgg aaaccatctc cccaggagac gggcgcacct tccccaagcg cggccagacc 2280

tgcgtggtgc actacaccgg gatgcttgaa gatggaaaga aatttgattc ctcccgggac 2340

agaaacaagc cctttaagtt tatgctaggc aagcaggagg tgatccgagg ctgggaagaa 2400

ggggttgccc agatgagtgt gggtcagaga gccaaactga ctatatctcc agattatgcc 2460

tatggtgcca ctgggcaccc aggcatcatc ccaccacatg ccactctcgt cttcgatgtg 2520

gagcttctaa aactggaaac tagaggcgtt caggtggaaa ccatcagtcc aggggatggc 2580

cgaacttttc caaagagagg gcagacttgc gtcgtgcatt atactggtat gctggaggat 2640

gggaaaaagt tcgactcttc cagagatcgg aacaaaccat tcaaattcat gctcgggaaa 2700

caggaagtta tccgcggatg ggaggagggc gtggcccaga tgtccgtggg ccagcgcgcc 2760

aagctaacca tctccccaga ctacgcctac ggagccaccg gacaccccgg tatcataccc 2820

ccacacgcca cccttgtgtt tgacgtggaa ctgcttaagc tagagactag aggcgtgcag 2880

gtcgagacca tcagccccgg cgacggccgc acctttccca agagaggcca gacttgcgtg 2940

gtccactaca ccggcatgct ggaggacggc aagaagttcg acagcagccg cgaccgcaac 3000

aagcccttca agttcatgct gggcaaacag gaagtgatcc gcggctggga ggaaggcgtg 3060

gctcagatga gcgtggggca gcgggccaag ctgaccatca gccccgacta tgcctacggc 3120

gccaccggcc accccggcat catccccccc cacgccaccc tggtgttcga cgtggagctg 3180

ctgaagctgg agtgataagg atccccactc cagtgcccac cagccttgtc ctaataaaat 3240

taagttgcat cattttgtct gactaggtgt ccttctataa tattatgggg tggagggggg 3300

tggtttggag caaggcgcgt gctagctaat gatgggcgct cgagtaatga tgggcggtcg 3360

actaatgatg ggcgctcgag taatgatggg cgtctagcta atgatgggcg ctcgagtaat 3420

gatgggcggt cgactaatga tgggcgctcg agtaatgatg ggcgtctaga acgcgaatta 3480

attcaacatt ttgacacccc cataatattt ttccagaatt aacagtataa attgcatctc 3540

ttgttcaaga gttccctatc actctcttta atcactactc acagtaacct caactcctgc 3600

cacaagcttg aattcgccct gcagcgggaa ttgccaccat ggctcacgtt cgaggactgc 3660

agctgcctgg atgtctggct cttgccgctc tgtgtagcct ggtgcacagc cagcacgtgt 3720

ttctggctcc tcagcaagcc agatcactgc tgcagagagt tagaaggcac ggcgagggca 3780

cctttacctc cgacgtgtct agctacctgg aagaacaggc cgccaaagag tttatcgcct 3840

ggctggtcaa aggtggcggc ggaggcggag gaagcggtgg cggaggttca ggtggtggtg 3900

gatctgccga gtctaagtac ggccctcctt gtcctccctg tcctgctccc gaagctgctg 3960

gcggcccatc cgtgtttctg ttccctccaa agcctaagga caccctgatg atcagcagaa 4020

cccctgaagt gacctgcgtg gtggtcgacg tgtcccaaga ggatcctgag gtgcagttca 4080

attggtacgt ggacggcgtg gaagtgcaca acgccaagac caagcctaga gaggaacagt 4140

tcaacagcac ctacagagtg gtgtccgtgc tgaccgtgct gcaccaggat tggctgaacg 4200

gcaaagagta caagtgcaag gtgtccaaca agggcctgcc tagctccatc gagaaaacca 4260

tcagcaaggc caagggccag ccaagagaac cccaggtgta cacactgcct ccaagccaag 4320

aggaaatgac caagaaccag gtgtccctga cctgcctcgt gaagggcttc tacccttccg 4380

atatcgccgt ggaatgggag agcaatggcc agcctgagaa caactacaag accacacctc 4440

ctgtgctgga cagcgacggc tcattcttcc tgtacagcag actgaccgtg gacaagagca 4500

gatggcaaga gggcaacgtg ttcagctgca gcgtgatgca cgaggccctg cacaaccact 4560

acacccagaa gtctctgagc ctgagcctgg gctaaggtac cgatcttttt ccctctgcca 4620

aaaattatgg ggacatcatg aagccccttg agcatctgac ttctggctaa taaaggaaat 4680

ttattttcat tgcaatagtg tgttggaatt ttttgtgtct ctcactcgga aggcgcgccg 4740

atcctcgaga ctagagcatg gctacgtaga taagtagcat ggcgggttaa tcattaacta 4800

caaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga 4860

ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga 4920

gcgagcgcgc a 4931

<210> 17

<211> 224

<212> PRT

<213> 恒河猴（Macaca mulatta）

<400> 17

Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser

1 5 10 15

Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg

20 25 30

Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu Asp Pro

35 40 45

Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala

50 55 60

Gln Thr Lys Pro Arg Glu Arg Gln Phe Asn Ser Thr Tyr Arg Val Val

65 70 75 80

Ser Val Leu Thr Val Thr His Gln Asp Trp Leu Asn Gly Lys Glu Tyr

85 90 95

Thr Cys Lys Val Ser Asn Lys Gly Leu Pro Ala Pro Ile Glu Lys Thr

100 105 110

Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Ile Leu

115 120 125

Pro Pro Pro Gln Glu Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys

130 135 140

Leu Val Thr Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser

145 150 155 160

Asn Gly Gln Pro Glu Asn Thr Tyr Lys Thr Thr Pro Pro Val Leu Asp

165 170 175

Ser Asp Gly Ser Tyr Leu Leu Tyr Ser Lys Leu Thr Val Asn Lys Ser

180 185 190

Arg Trp Gln Pro Gly Asn Ile Phe Thr Cys Ser Val Met His Glu Ala

195 200 205

Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Val Ser Pro Gly Lys

210 215 220

<210> 18

<211> 2211

<212> DNA

<213> 腺相关病毒rh91

<400> 18

atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60

gagtggtggg cgctgaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120

gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180

aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240

cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300

caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360

gccaagaagc gggttctcga accttttggt ctggttgagg aagcagctaa gacggctcct 420

ggaaagaaac gtccggtaga gcagtcgccc caagaaccag actcctcctc gggcattggc 480

aaatcaggcc agcagcccgc caaaaagaga ctcaatttcg gtcagactgg cgactcagag 540

tcagtccccg accctcaacc tctcggagaa cctccagaaa cccccgctgc tgtgggacct 600

actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660

gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720

accaccagca cccgaacctg ggcccttcct acctacaaca accacctcta caagcaaatc 780

tccagcgctt caacgggggc cagtaacgac aaccactact ttggctacag caccccctgg 840

gggtattttg atttcaacag attccactgc cacttctcac cacgtgactg gcagcgactc 900

attaacaaca actggggatt ccggcccaag agactcaact tcaagctctt caacatccag 960

gtcaaggagg tcacgacgaa tgatggcgtc acaaccatcg ctaataacct taccagcacg 1020

gttcaagtgt tctcggactc ggagtaccag ctgccgtacg tcctcggttc tgcgcaccag 1080

ggctgcctcc ctccgttccc ggcggacgta ttcatgattc ctcagtacgg ctacctaacg 1140

ctcaacaatg gcagccaggc cgtaggacgt tcatcctttt attgcctgga atatttccca 1200

tctcaaatgc tgagaacggg caacaacttt accttcagct acacctttga agatgtgcct 1260

ttccacagca gttacgcgca cagccagagc ctggacaggc taatgaatcc tctaatcgac 1320

cagtacctgt attacctaaa cagaactcag aatcaatccg gaagtgcaca aaacaaggac 1380

ttgctgttta gccgggggtc tccagctggc atgtctgttc agcccaaaaa ctggctaccc 1440

gggccctgtt accgacagca gcgtgtttct aaaacaaaaa cagacaacaa caacagcaac 1500

tttacctgga ctggtgcctc caaatacaat ctgaacggac gtgaatccat cattaaccct 1560

ggcaccgcta tggcatccca caaggacgac gaagacaaat tttttcccat gagcggtgtt 1620

atgatttttg gcaaagaaaa tgcaggagca tcaaacactg cattagacaa tgttatgatt 1680

acagatgaag aggaaattaa agctaccaac cccgtggcca ccgagagatt tggaactgtg 1740

gcagtcaatc tccaaagcag caatacagac cctgcaacag gagacgtgca tgtcatgggg 1800

gctttacctg gcatggtgtg gcaagacaga gacgtgtacc tgcagggtcc catttgggcc 1860

aagattcctc acacggatgg acactttcac ccgtctcctc ttatgggcgg ctttggactt 1920

aagcacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggca 1980

gagttttcgg ctacaaagtt tgcttcattc atcacccagt actccacagg acaagtgagc 2040

gtggaaattg aatgggagct gcagaaagaa aacagtaagc gctggaatcc tgaagtgcag 2100

tacacctcca actacgcgaa atctgccaac gttgatttca ctgtggacaa caatggactt 2160

tatactgagc ctcgccccat tggcacccgt taccttaccc gtccccttta a 2211

<210> 19

<211> 2211

<212> DNA

<213> 腺相关病毒rh91

<220>

<221> misc_feature

<222> (1)..(2211)

<223> AAVrh.91

<400> 19

atggctgctg acggttatct tccagattgg ctcgaggaca acctttctga aggcattcgt 60

gagtggtggg ctctgaaacc tggagcccct aaacccaaag cgaaccaaca aaagcaggac 120

gacggccggg gtcttgtgct tccgggttac aaatacctcg gacccttcaa cggactcgac 180

aaaggagagc cggtcaacgc ggcggacgcg gcagccctcg aacacgacaa agcttacgac 240

cagcagctca aggccggtga caacccgtac ctccggtaca accacgccga cgccgagttt 300

caggagcgtc ttcaagaaga tacgtctttt gggggcaacc ttggcagagc agtcttccag 360

gccaaaaaga gggttcttga gccttttggt ctggttgagg aagcagctaa aacggctcct 420

ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcatcatc tggtattggc 480

aaatcgggcc agcagcctgc caaaaaaaga ctaaatttcg gtcagactgg cgactcagag 540

tcagtccccg accctcaacc tctcggagaa cctccagaaa cccccgctgc tgtgggacct 600

actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660

gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720

accaccagca cccgaacctg ggcccttcct acctacaaca accacctcta caagcaaatc 780

tccagcgctt caacgggggc cagtaacgac aaccactact ttggctacag caccccctgg 840

gggtattttg atttcaacag attccactgc cacttctcac cacgtgactg gcagcgactc 900

attaacaaca actggggatt ccggcccaag agactcaact tcaagctctt caacatccag 960

gtcaaggagg tcacgacgaa tgatggcgtc acaaccatcg ctaataacct taccagcacg 1020

gttcaagtgt tctcggactc ggagtaccag ctgccgtacg tcctcggttc tgcgcaccag 1080

ggctgcctcc ctccgttccc ggcggacgta ttcatgattc ctcagtatgg atacctcacc 1140

ctgaacaacg gaagtcaagc ggtgggacgc tcatcctttt actgcctgga gtacttccct 1200

tcgcagatgc taaggactgg aaataacttc accttcagct ataccttcga ggatgtacct 1260

tttcacagca gctacgctca cagccagagt ttggatcgct tgatgaatcc tcttattgat 1320

cagtatctgt actacctgaa cagaacgcaa aatcaatctg gaagtgcaca aaacaaggac 1380

ctgcttttta gccgggggtc tcctgctggc atgtctgttc agcccaaaaa ttggctacct 1440

gggccctgct accggcaaca gagagtttca aagactaaaa cagacaacaa caacagtaac 1500

tttacctgga caggtgccag caaatataat ctcaatggcc gcgaatcgat cattaatcca 1560

ggaaccgcta tggccagtca caaggacgat gaagacaaat ttttccctat gagcggcgtt 1620

atgatatttg gcaaagaaaa tgcaggagca agtaacactg cattagataa tgtaatgatt 1680

acggatgaag aagagattaa agctaccaat cctgtggcaa cagagagatt tggaactgtg 1740

gcagtcaact tgcagagctc aaatacagac cccgcaactg gagacgtcca tgtcatgggg 1800

gccttacctg gcatggtgtg gcaagatcgt gacgtgtacc ttcaaggacc tatctgggca 1860

aagattcctc acacggatgg acactttcat ccttctcctc tgatgggagg ctttggactg 1920

aaacatccgc ctcctcaaat cctcatcaaa aatactccgg taccggcaaa tcctccggca 1980

gagttcagcg ctacaaagtt tgcttcattt atcactcagt actccactgg acaggtcagc 2040

gtggaaattg agtgggagct acagaaagaa aacagcaaac gttggaatcc agaggtgcag 2100

tacacttcca actacgcgaa gtctgccaat gtggacttta ctgtagacaa caatggtctt 2160

tatactgaac ctcgccctat tggaacccgg tatctcacac gacccttgta a 2211

<210> 20

<211> 736

<212> PRT

<213> 腺相关病毒rh91

<400> 20

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro

20 25 30

Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro

115 120 125

Phe Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly

145 150 155 160

Lys Ser Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro

180 185 190

Glu Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His

260 265 270

Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe

275 280 285

His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn

290 295 300

Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln

305 310 315 320

Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn

325 330 335

Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro

340 345 350

Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala

355 360 365

Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly

370 375 380

Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro

385 390 395 400

Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe

405 410 415

Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp

420 425 430

Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg

435 440 445

Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser

450 455 460

Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro

465 470 475 480

Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn

485 490 495

Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn

500 505 510

Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys

515 520 525

Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly

530 535 540

Lys Glu Asn Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile

545 550 555 560

Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg

565 570 575

Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Asn Thr Asp Pro Ala

580 585 590

Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu

625 630 635 640

Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn

690 695 700

Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu

705 710 715 720

Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu

725 730 735

<210> 21

<211> 29

<212> PRT

<213> 构建序列

<220>

<221> SITE

<222> (20)..(21)

<223> 切割

<400> 21

Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu

1 5 10 15

Glu Asn Pro Gly Pro Ala Ala Lys Arg Val Lys Leu Asp

20 25

<210> 22

<211> 33

<212> PRT

<213> 构建序列

<220>

<221> SITE

<222> (20)..(21)

<223> 切割

<400> 22

Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu

1 5 10 15

Glu Asn Pro Gly Pro Met Tyr Asp Pro Ala Ala Lys Arg Val Lys Leu

20 25 30

Asp

<210> 23

<211> 279

<212> DNA

<213> 人工序列

<220>

<223> 人FKBP12-雷帕霉素相关蛋白（FRAP）的FKBP12-雷帕霉素结合

（FRB）结构域的核酸序列

<400> 23

atggactatc ctgctgccaa gagggtcaag ttggactcta gaatcctctg gcatgagatg 60

tggcatgaag gcctggaaga ggcatctcgt ttgtactttg gggaaaggaa cgtgaaaggc 120

atgtttgagg tgctggagcc cttgcatgct atgatggaac ggggccccca gactctgaag 180

gaaacatcct ttaatcaggc ctatggtcga gatttaatgg aggcccaaga gtggtgcagg 240

aagtacatga aatcagggaa tgtcaaggac ctcctccaa 279

<210> 24

<211> 93

<212> PRT

<213> 人工序列

<220>

<223> 人FKBP12-雷帕霉素相关蛋白（FRAP）的FKBP12-雷帕霉素结合

（FRB）结构域的氨基酸序列

<400> 24

Met Asp Tyr Pro Ala Ala Lys Arg Val Lys Leu Asp Ser Arg Ile Leu

1 5 10 15

Trp His Glu Met Trp His Glu Gly Leu Glu Glu Ala Ser Arg Leu Tyr

20 25 30

Phe Gly Glu Arg Asn Val Lys Gly Met Phe Glu Val Leu Glu Pro Leu

35 40 45

His Ala Met Met Glu Arg Gly Pro Gln Thr Leu Lys Glu Thr Ser Phe

50 55 60

Asn Gln Ala Tyr Gly Arg Asp Leu Met Glu Ala Gln Glu Trp Cys Arg

65 70 75 80

Lys Tyr Met Lys Ser Gly Asn Val Lys Asp Leu Leu Gln

85 90

<210> 25

<211> 573

<212> DNA

<213> 人工序列

<220>

<223> 来自人的NF-κB的核酸序列p65亚基

<400> 25

gatgagtttc ccaccatggt gtttccttct gggcagatca gccaggcctc ggccttggcc 60

ccggcccctc cccaagtcct gccccaggct ccagcccctg cccctgctcc agccatggta 120

tcagctctgg cccaggcccc agcccctgtc ccagtcctag ccccaggccc tcctcaggct 180

gtggccccac ctgcccccaa gcccacccag gctggggaag gaacgctgtc agaggccctg 240

ctgcagctgc agtttgatga tgaagacctg ggggccttgc ttggcaacag cacagaccca 300

gctgtgttca cagacctggc atccgtcgac aactccgagt ttcagcagct gctgaaccag 360

ggcatacctg tggcccccca cacaactgag cccatgctga tggagtaccc tgaggctata 420

actcgcctag tgacaggggc ccagaggccc cccgacccag ctcctgctcc actgggggcc 480

ccggggctcc ccaatggcct cctttcagga gatgaagact tctcctccat tgcggacatg 540

gacttctcag ccctgctgag tcagatcagc tcc 573

<210> 26

<211> 191

<212> PRT

<213> 人工序列

<220>

<223> 来自人的NF-κB的氨基酸序列p65亚基

<400> 26

Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala

1 5 10 15

Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala

20 25 30

Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala

35 40 45

Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro

50 55 60

Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu

65 70 75 80

Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn

85 90 95

Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser

100 105 110

Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr

115 120 125

Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val

130 135 140

Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala

145 150 155 160

Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser

165 170 175

Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser

180 185 190

<210> 27

<211> 672

<212> DNA

<213> 人工序列

<220>

<223> CMV启动子

<400> 27

acgcgttcga gctcgccccg ttacataact tacggtaaat ggcccgcctg gctgaccgcc 60

caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa cgccaatagg 120

gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact tggcagtaca 180

tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta aatggcccgc 240

ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt acatctacgt 300

attagtcatc gctattacca tggtgatgcg gttttggcag tacatcaatg ggcgtggata 360

gcggtttgac tcacggggat ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt 420

ttggcaccaa aatcaacggg actttccaaa atgtcgtaac aactccgccc cattgacgca 480

aatgggcggt aggcgtgtac ggtgggaggt ctatataagc agagctcgtt tagtgaaccg 540

tcagatcgcc tggagacgcc atccacgctg ttttgacctc catagaagac accgggaccg 600

atccagcctc cgggggatct tggtggcgtg aaactcccgc agatcttcgg ccagcgaatt 660

ccagaagcca cc 672

<210> 28

<211> 402

<212> DNA

<213> 人工序列

<220>

<223> 锌指同源结构域（ZFHD1）的核酸序列

<400> 28

cctgctgcca agagggtcaa gttggactct agagaacgcc catatgcttg ccctgtcgag 60

tcctgcgatc gccgcttttc tcgctcggat gagcttaccc gccatatccg catccacaca 120

ggccagaagc ccttccagtg tcgaatctgc atgcgtaact tcagtcgtag tgaccacctt 180

accacccaca tccgcaccca cacaggcggc ggccgcagga ggaagaaacg caccagcata 240

gagaccaaca tccgtgtggc cttagagaag agtttcttgg agaatcaaaa gcctacctcg 300

gaagagatca ctatgattgc tgatcagctc aatatggaaa aagaggtgat tcgtgtttgg 360

ttctgtaacc gccgccagaa agaaaaaaga atcaacacta ga 402

<210> 29

<211> 134

<212> PRT

<213> 人工序列

<220>

<223> 锌指同源结构域（ZFHD1）的氨基酸序列

<400> 29

Pro Ala Ala Lys Arg Val Lys Leu Asp Ser Arg Glu Arg Pro Tyr Ala

1 5 10 15

Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Glu Leu

20 25 30

Thr Arg His Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg

35 40 45

Ile Cys Met Arg Asn Phe Ser Arg Ser Asp His Leu Thr Thr His Ile

50 55 60

Arg Thr His Thr Gly Gly Gly Arg Arg Arg Lys Lys Arg Thr Ser Ile

65 70 75 80

Glu Thr Asn Ile Arg Val Ala Leu Glu Lys Ser Phe Leu Glu Asn Gln

85 90 95

Lys Pro Thr Ser Glu Glu Ile Thr Met Ile Ala Asp Gln Leu Asn Met

100 105 110

Glu Lys Glu Val Ile Arg Val Trp Phe Cys Asn Arg Arg Gln Lys Glu

115 120 125

Lys Arg Ile Asn Thr Arg

130

<210> 30

<211> 978

<212> DNA

<213> 人工序列

<220>

<223> FK506结合蛋白结构域（FKBP）亚基基因的核酸序列

<400> 30

ggagtgcagg tggaaaccat ctccccagga gacgggcgca ccttccccaa gcgcggccag 60

acctgcgtgg tgcactacac cgggatgctt gaagatggaa agaaatttga ttcctcccgg 120

gacagaaaca agccctttaa gtttatgcta ggcaagcagg aggtgatccg aggctgggaa 180

gaaggggttg cccagatgag tgtgggtcag agagccaaac tgactatatc tccagattat 240

gcctatggtg ccactgggca cccaggcatc atcccaccac atgccactct cgtcttcgat 300

gtggagcttc taaaactgga aactagaggc gttcaggtgg aaaccatcag tccaggggat 360

ggccgaactt ttccaaagag agggcagact tgcgtcgtgc attatactgg tatgctggag 420

gatgggaaaa agttcgactc ttccagagat cggaacaaac cattcaaatt catgctcggg 480

aaacaggaag ttatccgcgg atgggaggag ggcgtggccc agatgtccgt gggccagcgc 540

gccaagctaa ccatctcccc agactacgcc tacggagcca ccggacaccc cggtatcata 600

cccccacacg ccacccttgt gtttgacgtg gaactgctta agctagagac tagaggcgtg 660

caggtcgaga ccatcagccc cggcgacggc cgcacctttc ccaagagagg ccagacttgc 720

gtggtccact acaccggcat gctggaggac ggcaagaagt tcgacagcag ccgcgaccgc 780

aacaagccct tcaagttcat gctgggcaaa caggaagtga tccgcggctg ggaggaaggc 840

gtggctcaga tgagcgtggg gcagcgggcc aagctgacca tcagccccga ctatgcctac 900

ggcgccaccg gccaccccgg catcatcccc ccccacgcca ccctggtgtt cgacgtggag 960

ctgctgaagc tggagtga 978

<210> 31

<211> 107

<212> PRT

<213> 人工序列

<220>

<223> FK506结合蛋白结构域（FKBP）亚基基因的氨基酸序列

<400> 31

Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe Pro

1 5 10 15

Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu Asp

20 25 30

Gly Lys Lys Phe Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys Phe

35 40 45

Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val Ala

50 55 60

Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp Tyr

65 70 75 80

Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His Ala Thr

85 90 95

Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu

100 105

<210> 32

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> ZFHD结合位点

<400> 32

aatgatgggc gctcgagt 18

<210> 33

<211> 665

<212> DNA

<213> 人工序列

<220>

<223> 构建序列

<400> 33

ctagtcgaca ttgattattg actagttatt aatagtaatc aattacgggg tcattagttc 60

atagcccata tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac 120

cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa 180

tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc cacttggcag 240

tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc 300

ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct 360

acgtattagt catcgctatt accatggtcg aggtgagccc cacgttctgc ttcactctcc 420

ccatctcccc cccctcccca cccccaattt tgtatttatt tattttttaa ttattttgtg 480

cagcgatggg ggcggggggg gggggggggc gcgcgccagg cggggcgggg cggggcgagg 540

ggcggggcgg ggcgaggcgg agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa 600

agtttccttt tatggcgagg cggcggcggc ggcggcccta taaaaagcga agcgcgcggc 660

gggcg 665

<210> 34

<211> 2903

<212> DNA

<213> 人工序列

<220>

<223> 构建序列

<400> 34

ctagtcgaca ttgattattg actagttatt aatagtaatc aattacgggg tcattagttc 60

atagcccata tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac 120

cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa 180

tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc cacttggcag 240

tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc 300

ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct 360

acgtattagt catcgctatt accatggtcg aggtgagccc cacgttctgc ttcactctcc 420

ccatctcccc cccctcccca cccccaattt tgtatttatt tattttttaa ttattttgtg 480

cagcgatggg ggcggggggg gggggggggc gcgcgccagg cggggcgggg cggggcgagg 540

ggcggggcgg ggcgaggcgg agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa 600

agtttccttt tatggcgagg cggcggcggc ggcggcccta taaaaagcga agcgcgcggc 660

gggcgggagt cgctgcgcgc tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc 720

gcccgccccg gctctgactg accgcgttac tcccacaggt gagcgggcgg gacggccctt 780

ctcctccggg ctgtaattag cgcttggttt aatgacggct tgtttctttt ctgtggctgc 840

gtgaaagcct tgaggggctc cgggagggcc ctttgtgcgg ggggagcggc tcggggggtg 900

cgtgcgtgtg tgtgtgcgtg gggagcgccg cgtgcggctc cgcgctgccc ggcggctgtg 960

agcgctgcgg gcgcggcgcg gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg 1020

ccgggggcgg tgccccgcgg tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg 1080

gtgtgtgcgt gggggggtga gcagggggtg tgggcgcgtc ggtcgggctg caaccccccc 1140

tgcacccccc tccccgagtt gctgagcacg gcccggcttc gggtgcgggg ctccgtacgg 1200

ggcgtggcgc ggggctcgcc gtgccgggcg gggggtggcg gcaggtgggg gtgccgggcg 1260

gggcggggcc gcctcgggcc ggggagggct cgggggaggg gcgcggcggc ccccggagcg 1320

ccggcggctg tcgaggcgcg gcgagccgca gccattgcct tttatggtaa tcgtgcgaga 1380

gggcgcaggg acttcctttg tcccaaatct gtgcggagcc gaaatctggg aggcgccgcc 1440

gcaccccctc tagcgggcgc ggggcgaagc ggtgcggcgc cggcaggaag gaaatgggcg 1500

gggagggcct tcgtgcgtcg ccgcgccgcc gtccccttct ccctctccag cctcggggct 1560

gtccgcgggg ggacggctgc cttcgggggg gacggggcag ggcggggttc ggcttctggc 1620

gtgtgaccgg cggctctaga gcctctgcta accatgttca tgccttcttc tttttcctac 1680

agctcctggg caacgtgctg gttattgtgc tgtctcatca ttttggcaaa gaattcgccc 1740

tgcagcggga attgccacca tggctcacgt tcgaggactg cagctgcctg gatgtctggc 1800

tcttgccgct ctgtgtagcc tggtgcacag ccagcacgtg tttctggctc ctcagcaagc 1860

cagatcactg ctgcagagag ttagaaggca cggcgagggc acctttacct ccgacgtgtc 1920

tagctacctg gaagaacagg ccgccaaaga gtttatcgcc tggctggtca aaggtggcgg 1980

cggaggcgga ggaagcggtg gcggaggttc aggtggtggt ggatctgccg agtctaagta 2040

cggccctcct tgtcctccct gtcctgctcc cgaagctgct ggcggcccat ccgtgtttct 2100

gttccctcca aagcctaagg acaccctgat gatcagcaga acccctgaag tgacctgcgt 2160

ggtggtcgac gtgtcccaag aggatcctga ggtgcagttc aattggtacg tggacggcgt 2220

ggaagtgcac aacgccaaga ccaagcctag agaggaacag ttcaacagca cctacagagt 2280

ggtgtccgtg ctgaccgtgc tgcaccagga ttggctgaac ggcaaagagt acaagtgcaa 2340

ggtgtccaac aagggcctgc ctagctccat cgagaaaacc atcagcaagg ccaagggcca 2400

gccaagagaa ccccaggtgt acacactgcc tccaagccaa gaggaaatga ccaagaacca 2460

ggtgtccctg acctgcctcg tgaagggctt ctacccttcc gatatcgccg tggaatggga 2520

gagcaatggc cagcctgaga acaactacaa gaccacacct cctgtgctgg acagcgacgg 2580

ctcattcttc ctgtacagca gactgaccgt ggacaagagc agatggcaag agggcaacgt 2640

gttcagctgc agcgtgatgc acgaggccct gcacaaccac tacacccaga agtctctgag 2700

cctgagcctg ggctaaggta cctctagagt cgacccgggc ggcctcgagg acggggtgaa 2760

ctacgcctga ggatccgatc tttttccctc tgccaaaaat tatggggaca tcatgaagcc 2820

ccttgagcat ctgacttctg gctaataaag gaaatttatt ttcattgcaa tagtgtgttg 2880

gaattttttg tgtctctcac tcg 2903

<210> 35

<211> 2897

<212> DNA

<213> 人工序列

<220>

<223> 构建序列

<400> 35

ctagtcgaca ttgattattg actagttatt aatagtaatc aattacgggg tcattagttc 60

atagcccata tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac 120

cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa 180

tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc cacttggcag 240

tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc 300

ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct 360

acgtattagt catcgctatt accatggtcg aggtgagccc cacgttctgc ttcactctcc 420

ccatctcccc cccctcccca cccccaattt tgtatttatt tattttttaa ttattttgtg 480

cagcgatggg ggcggggggg gggggggggc gcgcgccagg cggggcgggg cggggcgagg 540

ggcggggcgg ggcgaggcgg agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa 600

agtttccttt tatggcgagg cggcggcggc ggcggcccta taaaaagcga agcgcgcggc 660

gggcgggagt cgctgcgcgc tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc 720

gcccgccccg gctctgactg accgcgttac tcccacaggt gagcgggcgg gacggccctt 780

ctcctccggg ctgtaattag cgcttggttt aatgacggct tgtttctttt ctgtggctgc 840

gtgaaagcct tgaggggctc cgggagggcc ctttgtgcgg ggggagcggc tcggggggtg 900

cgtgcgtgtg tgtgtgcgtg gggagcgccg cgtgcggctc cgcgctgccc ggcggctgtg 960

agcgctgcgg gcgcggcgcg gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg 1020

ccgggggcgg tgccccgcgg tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg 1080

gtgtgtgcgt gggggggtga gcagggggtg tgggcgcgtc ggtcgggctg caaccccccc 1140

tgcacccccc tccccgagtt gctgagcacg gcccggcttc gggtgcgggg ctccgtacgg 1200

ggcgtggcgc ggggctcgcc gtgccgggcg gggggtggcg gcaggtgggg gtgccgggcg 1260

gggcggggcc gcctcgggcc ggggagggct cgggggaggg gcgcggcggc ccccggagcg 1320

ccggcggctg tcgaggcgcg gcgagccgca gccattgcct tttatggtaa tcgtgcgaga 1380

gggcgcaggg acttcctttg tcccaaatct gtgcggagcc gaaatctggg aggcgccgcc 1440

gcaccccctc tagcgggcgc ggggcgaagc ggtgcggcgc cggcaggaag gaaatgggcg 1500

gggagggcct tcgtgcgtcg ccgcgccgcc gtccccttct ccctctccag cctcggggct 1560

gtccgcgggg ggacggctgc cttcgggggg gacggggcag ggcggggttc ggcttctggc 1620

gtgtgaccgg cggctctaga gcctctgcta accatgttca tgccttcttc tttttcctac 1680

agctcctggg caacgtgctg gttattgtgc tgtctcatca ttttggcaaa gaattcgccc 1740

tgcagcggga attgccacca tggctcacgt tcgaggactg cagctgcctg gatgtctggc 1800

tcttgccgct ctgtgtagcc tggtgcacag ccagcatgtg tttctggctc ctcaacaagc 1860

cctgagcctg ctgcaaagag ttagaaggca cggcgagggc accttcacct ccgacgtgtc 1920

cagctacctg gaagaacagg ccgccaaaga gtttatcgcc tggctggtca aaggcggtgg 1980

tggtggcgga ggatctggcg gaggtggaag cggcggaggc ggatctgctg agtttacacc 2040

tccttgtcct ccctgtcctg ctcccgagct gctcggaggc ccttccgtgt ttctgttccc 2100

tccaaagcct aaggacaccc tgatgatcag cagaacccct gaagtgacct gcgtggtcgt 2160

ggacgtgtcc caagaggatc ctgaggtgca gttcaattgg tacgtggacg gcgtggaagt 2220

gcacaacgcc cagacaaagc ccagagagcg gcagttcaac agcacctaca gagtggtgtc 2280

cgtgctgacc gtgacacacc aggattggct gaacggcaaa gagtacacct gtaaagtctc 2340

caacaagggc ctgcctgctc ctatcgagaa aaccatcagc aaggccaagg gccagcctag 2400

agaaccccag gtgtacatcc tgcctccacc tcaagaggaa ctgaccaaga accaggtgtc 2460

cctgacctgt ctggtcaccg gcttctaccc ttccgatatc gccgtggaat gggagagcaa 2520

cggacagccc gagaacacct acaagaccac acctccagtg ctggacagcg acggcagcta 2580

tctgctgtac tccaagctga cagtgaacaa gagccggtgg cagcccggca acatcttcac 2640

ctgttctgtg atgcacgagg ccctgcacaa ccactacacc cagaagtctc tgagcgtcag 2700

ccctggctaa ggtacctcta gagtcgaccc gggcggcctc gaggacgggg tgaactacgc 2760

ctgaggatcc gatctttttc cctctgccaa aaattatggg gacatcatga agccccttga 2820

gcatctgact tctggctaat aaaggaaatt tattttcatt gcaatagtgt gttggaattt 2880

tttgtgtctc tcactcg 2897

<210> 36

<211> 951

<212> DNA

<213> 恒河猴（Macaca mulatta）

<220>

<221> CDS

<222> (1)..(951)

<400> 36

atg gct cac gtt cga gga ctg cag ctg cct gga tgt ctg gct ctt gcc 48

Met Ala His Val Arg Gly Leu Gln Leu Pro Gly Cys Leu Ala Leu Ala

1 5 10 15

gct ctg tgt agc ctg gtg cac agc cag cat gtg ttt ctg gct cct caa 96

Ala Leu Cys Ser Leu Val His Ser Gln His Val Phe Leu Ala Pro Gln

20 25 30

caa gcc ctg agc ctg ctg caa aga gtt aga agg cac ggc gag ggc acc 144

Gln Ala Leu Ser Leu Leu Gln Arg Val Arg Arg His Gly Glu Gly Thr

35 40 45

ttc acc tcc gac gtg tcc agc tac ctg gaa gaa cag gcc gcc aaa gag 192

Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Glu Gln Ala Ala Lys Glu

50 55 60

ttt atc gcc tgg ctg gtc aaa ggc ggt ggt ggt ggc gga gga tct ggc 240

Phe Ile Ala Trp Leu Val Lys Gly Gly Gly Gly Gly Gly Gly Ser Gly

65 70 75 80

gga ggt gga agc ggc gga ggc gga tct gct gag ttt aca cct cct tgt 288

Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Glu Phe Thr Pro Pro Cys

85 90 95

cct ccc tgt cct gct ccc gag ctg ctc gga ggc cct tcc gtg ttt ctg 336

Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu

100 105 110

ttc cct cca aag cct aag gac acc ctg atg atc agc aga acc cct gaa 384

Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu

115 120 125

gtg acc tgc gtg gtc gtg gac gtg tcc caa gag gat cct gag gtg cag 432

Val Thr Cys Val Val Val Asp Val Ser Gln Glu Asp Pro Glu Val Gln

130 135 140

ttc aat tgg tac gtg gac ggc gtg gaa gtg cac aac gcc cag aca aag 480

Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Gln Thr Lys

145 150 155 160

ccc aga gag cgg cag ttc aac agc acc tac aga gtg gtg tcc gtg ctg 528

Pro Arg Glu Arg Gln Phe Asn Ser Thr Tyr Arg Val Val Ser Val Leu

165 170 175

acc gtg aca cac cag gat tgg ctg aac ggc aaa gag tac acc tgt aaa 576

Thr Val Thr His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Thr Cys Lys

180 185 190

gtc tcc aac aag ggc ctg cct gct cct atc gag aaa acc atc agc aag 624

Val Ser Asn Lys Gly Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys

195 200 205

gcc aag ggc cag cct aga gaa ccc cag gtg tac atc ctg cct cca cct 672

Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Ile Leu Pro Pro Pro

210 215 220

caa gag gaa ctg acc aag aac cag gtg tcc ctg acc tgt ctg gtc acc 720

Gln Glu Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Thr

225 230 235 240

ggc ttc tac cct tcc gat atc gcc gtg gaa tgg gag agc aac gga cag 768

Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln

245 250 255

ccc gag aac acc tac aag acc aca cct cca gtg ctg gac agc gac ggc 816

Pro Glu Asn Thr Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly

260 265 270

agc tat ctg ctg tac tcc aag ctg aca gtg aac aag agc cgg tgg cag 864

Ser Tyr Leu Leu Tyr Ser Lys Leu Thr Val Asn Lys Ser Arg Trp Gln

275 280 285

ccc ggc aac atc ttc acc tgt tct gtg atg cac gag gcc ctg cac aac 912

Pro Gly Asn Ile Phe Thr Cys Ser Val Met His Glu Ala Leu His Asn

290 295 300

cac tac acc cag aag tct ctg agc gtc agc cct ggc taa 951

His Tyr Thr Gln Lys Ser Leu Ser Val Ser Pro Gly

305 310 315

<210> 37

<211> 316

<212> PRT

<213> 恒河猴（Macaca mulatta）

<400> 37

Met Ala His Val Arg Gly Leu Gln Leu Pro Gly Cys Leu Ala Leu Ala

1 5 10 15

Ala Leu Cys Ser Leu Val His Ser Gln His Val Phe Leu Ala Pro Gln

20 25 30

Gln Ala Leu Ser Leu Leu Gln Arg Val Arg Arg His Gly Glu Gly Thr

35 40 45

Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Glu Gln Ala Ala Lys Glu

50 55 60

Phe Ile Ala Trp Leu Val Lys Gly Gly Gly Gly Gly Gly Gly Ser Gly

65 70 75 80

Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Glu Phe Thr Pro Pro Cys

85 90 95

Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu

100 105 110

Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu

115 120 125

Val Thr Cys Val Val Val Asp Val Ser Gln Glu Asp Pro Glu Val Gln

130 135 140

Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Gln Thr Lys

145 150 155 160

Pro Arg Glu Arg Gln Phe Asn Ser Thr Tyr Arg Val Val Ser Val Leu

165 170 175

Thr Val Thr His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Thr Cys Lys

180 185 190

Val Ser Asn Lys Gly Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys

195 200 205

Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Ile Leu Pro Pro Pro

210 215 220

Gln Glu Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Thr

225 230 235 240

Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln

245 250 255

Pro Glu Asn Thr Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly

260 265 270

Ser Tyr Leu Leu Tyr Ser Lys Leu Thr Val Asn Lys Ser Arg Trp Gln

275 280 285

Pro Gly Asn Ile Phe Thr Cys Ser Val Met His Glu Ala Leu His Asn

290 295 300

His Tyr Thr Gln Lys Ser Leu Ser Val Ser Pro Gly

305 310 315

<210> 38

<211> 4545

<212> DNA

<213> 人工序列

<220>

<223> 构建序列

<400> 38

acgcgttcga gctcgccccg ttacataact tacggtaaat ggcccgcctg gctgaccgcc 60

caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa cgccaatagg 120

gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact tggcagtaca 180

tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta aatggcccgc 240

ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt acatctacgt 300

attagtcatc gctattacca tggtgatgcg gttttggcag tacatcaatg ggcgtggata 360

gcggtttgac tcacggggat ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt 420

ttggcaccaa aatcaacggg actttccaaa atgtcgtaac aactccgccc cattgacgca 480

aatgggcggt aggcgtgtac ggtgggaggt ctatataagc agagctcgtt tagtgaaccg 540

tcagatcgcc tggagacgcc atccacgctg ttttgacctc catagaagac accgggaccg 600

atccagcctc cgggggatct tggtggcgtg aaactcccgc agatcttcgg ccagcgaatt 660

ccagaagcca ccatggacta tcctgctgcc aagagggtca agttggactc tagaatcctc 720

tggcatgaga tgtggcatga aggcctggaa gaggcatctc gtttgtactt tggggaaagg 780

aacgtgaaag gcatgtttga ggtgctggag cccttgcatg ctatgatgga acggggcccc 840

cagactctga aggaaacatc ctttaatcag gcctatggtc gagatttaat ggaggcccaa 900

gagtggtgca ggaagtacat gaaatcaggg aatgtcaagg acctcctcca agcctgggac 960

ctctattatc atgtgttccg acgaatctca aagactagag atgagtttcc caccatggtg 1020

tttccttctg ggcagatcag ccaggcctcg gccttggccc cggcccctcc ccaagtcctg 1080

ccccaggctc cagcccctgc ccctgctcca gccatggtat cagctctggc ccaggcccca 1140

gcccctgtcc cagtcctagc cccaggccct cctcaggctg tggccccacc tgcccccaag 1200

cccacccagg ctggggaagg aacgctgtca gaggccctgc tgcagctgca gtttgatgat 1260

gaagacctgg gggccttgct tggcaacagc acagacccag ctgtgttcac agacctggca 1320

tccgtcgaca actccgagtt tcagcagctg ctgaaccagg gcatacctgt ggccccccac 1380

acaactgagc ccatgctgat ggagtaccct gaggctataa ctcgcctagt gacaggggcc 1440

cagaggcccc ccgacccagc tcctgctcca ctgggggccc cggggctccc caatggcctc 1500

ctttcaggag atgaagactt ctcctccatt gcggacatgg acttctcagc cctgctgagt 1560

cagatcagct ccggctctgg cgaaggcaga ggcagcctgc ttacctgtgg cgacgtggaa 1620

gagaaccccg gacctgctgc caagagggtc aagttggact ctagagaacg cccatatgct 1680

tgccctgtcg agtcctgcga tcgccgcttt tctcgctcgg atgagcttac ccgccatatc 1740

cgcatccaca caggccagaa gcccttccag tgtcgaatct gcatgcgtaa cttcagtcgt 1800

agtgaccacc ttaccaccca catccgcacc cacacaggcg gcggccgcag gaggaagaaa 1860

cgcaccagca tagagaccaa catccgtgtg gccttagaga agagtttctt ggagaatcaa 1920

aagcctacct cggaagagat cactatgatt gctgatcagc tcaatatgga aaaagaggtg 1980

attcgtgttt ggttctgtaa ccgccgccag aaagaaaaaa gaatcaacac tagaggagtg 2040

caggtggaaa ccatctcccc aggagacggg cgcaccttcc ccaagcgcgg ccagacctgc 2100

gtggtgcact acaccgggat gcttgaagat ggaaagaaat ttgattcctc ccgggacaga 2160

aacaagccct ttaagtttat gctaggcaag caggaggtga tccgaggctg ggaagaaggg 2220

gttgcccaga tgagtgtggg tcagagagcc aaactgacta tatctccaga ttatgcctat 2280

ggtgccactg ggcacccagg catcatccca ccacatgcca ctctcgtctt cgatgtggag 2340

cttctaaaac tggaaactag aggcgttcag gtggaaacca tcagtccagg ggatggccga 2400

acttttccaa agagagggca gacttgcgtc gtgcattata ctggtatgct ggaggatggg 2460

aaaaagttcg actcttccag agatcggaac aaaccattca aattcatgct cgggaaacag 2520

gaagttatcc gcggatggga ggagggcgtg gcccagatgt ccgtgggcca gcgcgccaag 2580

ctaaccatct ccccagacta cgcctacgga gccaccggac accccggtat cataccccca 2640

cacgccaccc ttgtgtttga cgtggaactg cttaagctag agactagagg cgtgcaggtc 2700

gagaccatca gccccggcga cggccgcacc tttcccaaga gaggccagac ttgcgtggtc 2760

cactacaccg gcatgctgga ggacggcaag aagttcgaca gcagccgcga ccgcaacaag 2820

cccttcaagt tcatgctggg caaacaggaa gtgatccgcg gctgggagga aggcgtggct 2880

cagatgagcg tggggcagcg ggccaagctg accatcagcc ccgactatgc ctacggcgcc 2940

accggccacc ccggcatcat ccccccccac gccaccctgg tgttcgacgt ggagctgctg 3000

aagctggagt gataaggatc cccactccag tgcccaccag ccttgtccta ataaaattaa 3060

gttgcatcat tttgtctgac taggtgtcct tctataatat tatggggtgg aggggggtgg 3120

tttggagcaa ggcgcgtgct agctaatgat gggcgctcga gtaatgatgg gcggtcgact 3180

aatgatgggc gctcgagtaa tgatgggcgt ctagctaatg atgggcgctc gagtaatgat 3240

gggcggtcga ctaatgatgg gcgctcgagt aatgatgggc gtctagaacg cgaattaatt 3300

caacattttg acacccccat aatatttttc cagaattaac agtataaatt gcatctcttg 3360

ttcaagagtt ccctatcact ctctttaatc actactcaca gtaacctcaa ctcctgccac 3420

aagcttgaat tcgccctgca gcgggaattg ccaccatggc tcacgttcga ggactgcagc 3480

tgcctggatg tctggctctt gccgctctgt gtagcctggt gcacagccag cacgtgtttc 3540

tggctcctca gcaagccaga tcactgctgc agagagttag aaggcacggc gagggcacct 3600

ttacctccga cgtgtctagc tacctggaag aacaggccgc caaagagttt atcgcctggc 3660

tggtcaaagg tggcggcgga ggcggaggaa gcggtggcgg aggttcaggt ggtggtggat 3720

ctgccgagtc taagtacggc cctccttgtc ctccctgtcc tgctcccgaa gctgctggcg 3780

gcccatccgt gtttctgttc cctccaaagc ctaaggacac cctgatgatc agcagaaccc 3840

ctgaagtgac ctgcgtggtg gtcgacgtgt cccaagagga tcctgaggtg cagttcaatt 3900

ggtacgtgga cggcgtggaa gtgcacaacg ccaagaccaa gcctagagag gaacagttca 3960

acagcaccta cagagtggtg tccgtgctga ccgtgctgca ccaggattgg ctgaacggca 4020

aagagtacaa gtgcaaggtg tccaacaagg gcctgcctag ctccatcgag aaaaccatca 4080

gcaaggccaa gggccagcca agagaacccc aggtgtacac actgcctcca agccaagagg 4140

aaatgaccaa gaaccaggtg tccctgacct gcctcgtgaa gggcttctac ccttccgata 4200

tcgccgtgga atgggagagc aatggccagc ctgagaacaa ctacaagacc acacctcctg 4260

tgctggacag cgacggctca ttcttcctgt acagcagact gaccgtggac aagagcagat 4320

ggcaagaggg caacgtgttc agctgcagcg tgatgcacga ggccctgcac aaccactaca 4380

cccagaagtc tctgagcctg agcctgggct aaggtaccga tctttttccc tctgccaaaa 4440

attatgggga catcatgaag ccccttgagc atctgacttc tggctaataa aggaaattta 4500

ttttcattgc aatagtgtgt tggaattttt tgtgtctctc actcg 4545

<210> 39

<211> 4539

<212> DNA

<213> 人工序列

<220>

<223> 构建序列

<400> 39

acgcgttcga gctcgccccg ttacataact tacggtaaat ggcccgcctg gctgaccgcc 60

caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa cgccaatagg 120

gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact tggcagtaca 180

tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta aatggcccgc 240

ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt acatctacgt 300

attagtcatc gctattacca tggtgatgcg gttttggcag tacatcaatg ggcgtggata 360

gcggtttgac tcacggggat ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt 420

ttggcaccaa aatcaacggg actttccaaa atgtcgtaac aactccgccc cattgacgca 480

aatgggcggt aggcgtgtac ggtgggaggt ctatataagc agagctcgtt tagtgaaccg 540

tcagatcgcc tggagacgcc atccacgctg ttttgacctc catagaagac accgggaccg 600

atccagcctc cgggggatct tggtggcgtg aaactcccgc agatcttcgg ccagcgaatt 660

ccagaagcca ccatggacta tcctgctgcc aagagggtca agttggactc tagaatcctc 720

tggcatgaga tgtggcatga aggcctggaa gaggcatctc gtttgtactt tggggaaagg 780

aacgtgaaag gcatgtttga ggtgctggag cccttgcatg ctatgatgga acggggcccc 840

cagactctga aggaaacatc ctttaatcag gcctatggtc gagatttaat ggaggcccaa 900

gagtggtgca ggaagtacat gaaatcaggg aatgtcaagg acctcctcca agcctgggac 960

ctctattatc atgtgttccg acgaatctca aagactagag atgagtttcc caccatggtg 1020

tttccttctg ggcagatcag ccaggcctcg gccttggccc cggcccctcc ccaagtcctg 1080

ccccaggctc cagcccctgc ccctgctcca gccatggtat cagctctggc ccaggcccca 1140

gcccctgtcc cagtcctagc cccaggccct cctcaggctg tggccccacc tgcccccaag 1200

cccacccagg ctggggaagg aacgctgtca gaggccctgc tgcagctgca gtttgatgat 1260

gaagacctgg gggccttgct tggcaacagc acagacccag ctgtgttcac agacctggca 1320

tccgtcgaca actccgagtt tcagcagctg ctgaaccagg gcatacctgt ggccccccac 1380

acaactgagc ccatgctgat ggagtaccct gaggctataa ctcgcctagt gacaggggcc 1440

cagaggcccc ccgacccagc tcctgctcca ctgggggccc cggggctccc caatggcctc 1500

ctttcaggag atgaagactt ctcctccatt gcggacatgg acttctcagc cctgctgagt 1560

cagatcagct ccggctctgg cgaaggcaga ggcagcctgc ttacctgtgg cgacgtggaa 1620

gagaaccccg gacctgctgc caagagggtc aagttggact ctagagaacg cccatatgct 1680

tgccctgtcg agtcctgcga tcgccgcttt tctcgctcgg atgagcttac ccgccatatc 1740

cgcatccaca caggccagaa gcccttccag tgtcgaatct gcatgcgtaa cttcagtcgt 1800

agtgaccacc ttaccaccca catccgcacc cacacaggcg gcggccgcag gaggaagaaa 1860

cgcaccagca tagagaccaa catccgtgtg gccttagaga agagtttctt ggagaatcaa 1920

aagcctacct cggaagagat cactatgatt gctgatcagc tcaatatgga aaaagaggtg 1980

attcgtgttt ggttctgtaa ccgccgccag aaagaaaaaa gaatcaacac tagaggagtg 2040

caggtggaaa ccatctcccc aggagacggg cgcaccttcc ccaagcgcgg ccagacctgc 2100

gtggtgcact acaccgggat gcttgaagat ggaaagaaat ttgattcctc ccgggacaga 2160

aacaagccct ttaagtttat gctaggcaag caggaggtga tccgaggctg ggaagaaggg 2220

gttgcccaga tgagtgtggg tcagagagcc aaactgacta tatctccaga ttatgcctat 2280

ggtgccactg ggcacccagg catcatccca ccacatgcca ctctcgtctt cgatgtggag 2340

cttctaaaac tggaaactag aggcgttcag gtggaaacca tcagtccagg ggatggccga 2400

acttttccaa agagagggca gacttgcgtc gtgcattata ctggtatgct ggaggatggg 2460

aaaaagttcg actcttccag agatcggaac aaaccattca aattcatgct cgggaaacag 2520

gaagttatcc gcggatggga ggagggcgtg gcccagatgt ccgtgggcca gcgcgccaag 2580

ctaaccatct ccccagacta cgcctacgga gccaccggac accccggtat cataccccca 2640

cacgccaccc ttgtgtttga cgtggaactg cttaagctag agactagagg cgtgcaggtc 2700

gagaccatca gccccggcga cggccgcacc tttcccaaga gaggccagac ttgcgtggtc 2760

cactacaccg gcatgctgga ggacggcaag aagttcgaca gcagccgcga ccgcaacaag 2820

cccttcaagt tcatgctggg caaacaggaa gtgatccgcg gctgggagga aggcgtggct 2880

cagatgagcg tggggcagcg ggccaagctg accatcagcc ccgactatgc ctacggcgcc 2940

accggccacc ccggcatcat ccccccccac gccaccctgg tgttcgacgt ggagctgctg 3000

aagctggagt gataaggatc cccactccag tgcccaccag ccttgtccta ataaaattaa 3060

gttgcatcat tttgtctgac taggtgtcct tctataatat tatggggtgg aggggggtgg 3120

tttggagcaa ggcgcgtgct agctaatgat gggcgctcga gtaatgatgg gcggtcgact 3180

aatgatgggc gctcgagtaa tgatgggcgt ctagctaatg atgggcgctc gagtaatgat 3240

gggcggtcga ctaatgatgg gcgctcgagt aatgatgggc gtctagaacg cgaattaatt 3300

caacattttg acacccccat aatatttttc cagaattaac agtataaatt gcatctcttg 3360

ttcaagagtt ccctatcact ctctttaatc actactcaca gtaacctcaa ctcctgccac 3420

aagcttgaat tcgccctgca gcgggaattg ccaccatggc tcacgttcga ggactgcagc 3480

tgcctggatg tctggctctt gccgctctgt gtagcctggt gcacagccag catgtgtttc 3540

tggctcctca acaagccctg agcctgctgc aaagagttag aaggcacggc gagggcacct 3600

tcacctccga cgtgtccagc tacctggaag aacaggccgc caaagagttt atcgcctggc 3660

tggtcaaagg cggtggtggt ggcggaggat ctggcggagg tggaagcggc ggaggcggat 3720

ctgctgagtt tacacctcct tgtcctccct gtcctgctcc cgagctgctc ggaggccctt 3780

ccgtgtttct gttccctcca aagcctaagg acaccctgat gatcagcaga acccctgaag 3840

tgacctgcgt ggtcgtggac gtgtcccaag aggatcctga ggtgcagttc aattggtacg 3900

tggacggcgt ggaagtgcac aacgcccaga caaagcccag agagcggcag ttcaacagca 3960

cctacagagt ggtgtccgtg ctgaccgtga cacaccagga ttggctgaac ggcaaagagt 4020

acacctgtaa agtctccaac aagggcctgc ctgctcctat cgagaaaacc atcagcaagg 4080

ccaagggcca gcctagagaa ccccaggtgt acatcctgcc tccacctcaa gaggaactga 4140

ccaagaacca ggtgtccctg acctgtctgg tcaccggctt ctacccttcc gatatcgccg 4200

tggaatggga gagcaacgga cagcccgaga acacctacaa gaccacacct ccagtgctgg 4260

acagcgacgg cagctatctg ctgtactcca agctgacagt gaacaagagc cggtggcagc 4320

ccggcaacat cttcacctgt tctgtgatgc acgaggccct gcacaaccac tacacccaga 4380

agtctctgag cgtcagccct ggctaaggta ccgatctttt tccctctgcc aaaaattatg 4440

gggacatcat gaagcccctt gagcatctga cttctggcta ataaaggaaa tttattttca 4500

ttgcaatagt gtgttggaat tttttgtgtc tctcactcg 4539

<210> 40

<211> 1492

<212> DNA

<213> 人工序列

<220>

<223> 构建序列

<400> 40

acgcgtgcta gctaatgatg ggcgctcgag taatgatggg cggtcgacta atgatgggcg 60

ctcgagtaat gatgggcgtc tagctaatga tgggcgctcg agtaatgatg ggcggtcgac 120

taatgatggg cgctcgagta atgatgggcg tctagctaat gatgggcgct cgagtaatga 180

tgggcggtcg actaatgatg ggcgctcgag taatgatggg cgtctagaac gcgaattaat 240

tcaacatttt gacaccccca taatattttt ccagaattaa cagtataaat tgcatctctt 300

gttcaagagt tccctatcac tctctttaat cactactcac agtaacctca actcctgcca 360

caagcttgcc ctgcagcggg aattcgccct gcagcgggaa ttgccaccat ggctcacgtt 420

cgaggactgc agctgcctgg atgtctggct cttgccgctc tgtgtagcct ggtgcacagc 480

cagcatgtgt ttctggctcc tcaacaagcc ctgagcctgc tgcaaagagt tagaaggcac 540

ggcgagggca ccttcacctc cgacgtgtcc agctacctgg aagaacaggc cgccaaagag 600

tttatcgcct ggctggtcaa aggcggtggt ggtggcggag gatctggcgg aggtggaagc 660

ggcggaggcg gatctgctga gtttacacct ccttgtcctc cctgtcctgc tcccgagctg 720

ctcggaggcc cttccgtgtt tctgttccct ccaaagccta aggacaccct gatgatcagc 780

agaacccctg aagtgacctg cgtggtcgtg gacgtgtccc aagaggatcc tgaggtgcag 840

ttcaattggt acgtggacgg cgtggaagtg cacaacgccc agacaaagcc cagagagcgg 900

cagttcaaca gcacctacag agtggtgtcc gtgctgaccg tgacacacca ggattggctg 960

aacggcaaag agtacacctg taaagtctcc aacaagggcc tgcctgctcc tatcgagaaa 1020

accatcagca aggccaaggg ccagcctaga gaaccccagg tgtacatcct gcctccacct 1080

caagaggaac tgaccaagaa ccaggtgtcc ctgacctgtc tggtcaccgg cttctaccct 1140

tccgatatcg ccgtggaatg ggagagcaac ggacagcccg agaacaccta caagaccaca 1200

cctccagtgc tggacagcga cggcagctat ctgctgtact ccaagctgac agtgaacaag 1260

agccggtggc agcccggcaa catcttcacc tgttctgtga tgcacgaggc cctgcacaac 1320

cactacaccc agaagtctct gagcgtcagc cctggctaag gtaccgatct ttttccctct 1380

gccaaaaatt atggggacat catgaagccc cttgagcatc tgacttctgg ctaataaagg 1440

aaatttattt tcattgcaat agtgtgttgg aattttttgt gtctctcact cg 1492

<210> 41

<211> 3856

<212> DNA

<213> 人工序列

<220>

<223> 构建序列

<400> 41

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 60

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 120

atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 180

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 240

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 300

catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 360

atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 420

ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 480

acggtgggag gtctatataa gcagagctcg tttagtgaac cgtcagatcg cctggagacg 540

ccatccacgc tgttttgacc tccatagaag acaccgggac cgatccagcc tccgggggat 600

cttggtggcg tgaaactccc gcagatctgc ttcagctgga ggcactgggc aggtaagtat 660

caaggttaca agacaggttt aaggagacca atagaaactg ggcttgtcga gacagagaag 720

actcttgcgt ttctgatagg cacctattgg tcttactgac atccactttg cctttctctc 780

cacaggtgca gctgctgcag cgggaattcc agaagccacc atggactatc ctgctgccaa 840

gagggtcaag ttggactcta gaatcctctg gcatgagatg tggcatgaag gcctggaaga 900

ggcatctcgt ttgtactttg gggaaaggaa cgtgaaaggc atgtttgagg tgctggagcc 960

cttgcatgct atgatggaac ggggccccca gactctgaag gaaacatcct ttaatcaggc 1020

ctatggtcga gatttaatgg aggcccaaga gtggtgcagg aagtacatga aatcagggaa 1080

tgtcaaggac ctcctccaag cctgggacct ctattatcat gtgttccgac gaatctcaaa 1140

gactagagat gagtttccca ccatggtgtt tccttctggg cagatcagcc aggcctcggc 1200

cttggccccg gcccctcccc aagtcctgcc ccaggctcca gcccctgccc ctgctccagc 1260

catggtatca gctctggccc aggccccagc ccctgtccca gtcctagccc caggccctcc 1320

tcaggctgtg gccccacctg cccccaagcc cacccaggct ggggaaggaa cgctgtcaga 1380

ggccctgctg cagctgcagt ttgatgatga agacctgggg gccttgcttg gcaacagcac 1440

agacccagct gtgttcacag acctggcatc cgtcgacaac tccgagtttc agcagctgct 1500

gaaccagggc atacctgtgg ccccccacac aactgagccc atgctgatgg agtaccctga 1560

ggctataact cgcctagtga caggggccca gaggcccccc gacccagctc ctgctccact 1620

gggggccccg gggctcccca atggcctcct ttcaggagat gaagacttct cctccattgc 1680

ggacatggac ttctcagccc tgctgagtca gatcagctcc tagtaattcc ggttattttc 1740

caccatattg ccgtcttttg gcaatgtgag ggcccggaaa cctggccctg tcttcttgac 1800

gagcattcct aggggtcttt cccctctcgc caaaggaatg caaggtctgt tgaatgtcgt 1860

gaaggaagca gttcctctgg aagcttcttg aagacaaaca acgtctgtag cgaccctttg 1920

caggcagcgg aaccccccac ctggcgacag gtgcctctgc ggccaaaagc cacgtgtata 1980

agatacacct gcaaaggcgg cacaacccca gtgccacgtt gtgagttgga tagttgtgga 2040

aagagtcaaa tggctctcct caagcgtatt caacaagggg ctgaaggatg cccagaaggt 2100

accccattgt atgggatctg atctggggcc tcggtgcaca tgctttacat gtgtttagtc 2160

gaggttaaaa aacgtctagg ccccccgaac cacggggacg tggttttcct ttgaaaaaca 2220

cgatgataat accatggact atcctgctgc caagagggtc aagttggact ctagagaacg 2280

cccatatgct tgccctgtcg agtcctgcga tcgccgcttt tctcgctcgg atgagcttac 2340

ccgccatatc cgcatccaca caggccagaa gcccttccag tgtcgaatct gcatgcgtaa 2400

cttcagtcgt agtgaccacc ttaccaccca catccgcacc cacacaggcg gcggccgcag 2460

gaggaagaaa cgcaccagca tagagaccaa catccgtgtg gccttagaga agagtttctt 2520

ggagaatcaa aagcctacct cggaagagat cactatgatt gctgatcagc tcaatatgga 2580

aaaagaggtg attcgtgttt ggttctgtaa ccgccgccag aaagaaaaaa gaatcaacac 2640

tagaggagtg caggtggaaa ccatctcccc aggagacggg cgcaccttcc ccaagcgcgg 2700

ccagacctgc gtggtgcact acaccgggat gcttgaagat ggaaagaaat ttgattcctc 2760

ccgggacaga aacaagccct ttaagtttat gctaggcaag caggaggtga tccgaggctg 2820

ggaagaaggg gttgcccaga tgagtgtggg tcagagagcc aaactgacta tatctccaga 2880

ttatgcctat ggtgccactg ggcacccagg catcatccca ccacatgcca ctctcgtctt 2940

cgatgtggag cttctaaaac tggaaactag aggagtgcag gtggaaacca tctccccagg 3000

agacgggcgc accttcccca agcgcggcca gacctgcgtg gtgcactaca ccgggatgct 3060

tgaagatgga aagaaatttg attcctcccg ggacagaaac aagcccttta agtttatgct 3120

aggcaagcag gaggtgatcc gaggctggga agaaggggtt gcccagatga gtgtgggtca 3180

gagagccaaa ctgactatat ctccagatta tgcctatggt gccactgggc acccaggcat 3240

catcccacca catgccactc tcgtcttcga tgtggagctt ctaaaactgg aaactagagg 3300

agtgcaggtg gaaaccatct ccccaggaga cgggcgcacc ttccccaagc gcggccagac 3360

ctgcgtggtg cactacaccg ggatgcttga agatggaaag aaatttgatt cctcccggga 3420

cagaaacaag ccctttaagt ttatgctagg caagcaggag gtgatccgag gctgggaaga 3480

aggggttgcc cagatgagtg tgggtcagag agccaaactg actatatctc cagattatgc 3540

ctatggtgcc actgggcacc caggcatcat cccaccacat gccactctcg tcttcgatgt 3600

ggagcttcta aaactggaat agtaaggatc ctgcccgggt ggcatccctg tgacccctcc 3660

ccagtgcctc tcctggccct ggaagttgcc actccagtgc ccaccagcct tgtcctaata 3720

aaattaagtt gcatcatttt gtctgactag gtgtccttct ataatattat ggggtggagg 3780

ggggtggtat ggagcaaggg gcaagttggg aagacaacct gtagggcctg cggggtctat 3840

tcgggaacca agctgg 3856

Claims

1.一种病毒载体，其包括核酸，所述核酸包括编码融合蛋白的序列，所述融合蛋白包括GLP-1类似物和IgG4 Fc，其中所述融合蛋白具有SEQ ID NO:14的序列或与其至少99％相同的序列。

2.根据权利要求1至7中任一项所述的病毒载体，其中编码所述融合蛋白的所述序列是SEQ ID NO:15或共享与其至少75％相同的序列。

3.根据权利要求1至8中任一项所述的病毒载体，其包括：

(a)AAV衣壳，以及

4.根据权利要求1至9中任一项所述的病毒载体，其中所述病毒载体是具有AAVrh91的AAV衣壳的rAAV。

5.根据权利要求1至13中任一项所述的病毒载体，其包括载体基因组，所述载体基因组包括诱导型基因表达系统、可调控启动子、编码所述融合蛋白的所述序列和聚腺苷酸化信号。

6.根据权利要求9至14中任一项所述的病毒载体，其中所述AAV反向末端重复序列(ITR)是侧接所述融合蛋白编码序列和所述调控序列的AAV2 5'ITR和AAV2 3'ITR。

7.根据权利要求9至15中任一项所述的病毒载体，其中所述载体基因组包括CB7启动子和兔珠蛋白poly A。

8.根据权利要求1至16中任一项所述的病毒载体，其包括诱导型基因表达系统。

9.根据权利要求17所述的病毒载体，其中所述诱导型基因表达系统包括：

(a)激活结构域，所述激活结构域包括反式激活结构域和FKBP12-雷帕霉素相关蛋白(FRAP)的FKBP12-雷帕霉素结合(FRB)结构域；

(c)ZFHD结合位点的至少一个拷贝，随后是最小IL2启动子，以及

(d)可调控启动子；

10.根据权利要求18所述的病毒载体，其中所述FKBP亚基基因序列彼此共享小于约85％同一性。

11.根据权利要求18或19所述的病毒载体，其中所述FKBP亚基基因序列之一是天然FKBP基因序列。

12.根据权利要求18至20中任一项所述的病毒载体，其中所述反式激活结构域包括NF-κB p65的一部分。

13.根据权利要求18至21中任一项所述的病毒载体，其中所述可调控启动子是组成型启动子。

14.根据权利要求18至22中任一项所述的病毒载体，其中所述可调控启动子是CMV启动子。

15.根据权利要求18至24中任一项所述的病毒载体，其进一步包括IRES或2A。

16.根据权利要求18至25中任一项所述的病毒载体，其进一步包括选自GT2A_V1(SEQID NO:21)或GT2A_V2(SEQ ID NO:22)的2A连接子。

17.根据权利要求18至26中任一项所述的病毒载体，其包括所述ZFHD结合位点的至少8个拷贝。

18.根据权利要求18至27中任一项所述的病毒载体，其中所述载体基因组包括SEQ IDNO:16的序列或与其至少70％相同的序列。

19.一种病毒载体，其包括核酸分子，所述核酸分子包括：可调控启动子；激活结构域，所述激活结构域包括p65反式激活结构域和FKBP12-雷帕霉素相关蛋白(FRAP)的FKBP12-雷帕霉素结合(FRB)结构域；DNA结合结构域，所述DNA结合结构域包括锌指同源结构域(ZFHD)和三个FK506结合蛋白结合域(FKBP)亚基基因；ZFHD结合位点的8个拷贝；以及编码包括GLP-1类似物和人IgG4 Fc的融合蛋白的序列。

20.一种适用于治疗受试者的代谢性疾病的药物组合物，所述药物组合物包括水性液体和根据权利要求1至20中任一项所述的病毒载体。

21.根据权利要求1至29中任一项所述的病毒载体或根据权利要求30或31中任一项所述的药物组合物，其在用于治疗患有代谢性疾病的受试者的方法中使用。

22.一种根据权利要求1至29中任一项所述的病毒载体或根据权利要求29至31中任一项所述的药物组合物在制造用于治疗患有代谢性疾病的受试者的药物中的用途。

23.根据权利要求32或33所述的病毒载体或用途，其中所述组合物被调配为以1x10⁹GC/kg至5x 10¹³GC/kg的所述rAAV的剂量施用。

24.根据权利要求32或33中任一项所述的病毒载体或用途，其中所述患者是人并且向所述患者施用1x 10¹⁰GC至1.5x 10¹⁵GC的所述rAAV的剂量。

25.根据权利要求32至35中任一项所述的病毒载体或用途，其中所述rAAV是肌内或静脉内递送的。

26.一种治疗患有代谢性疾病的受试者的方法，所述方法包括向所述受试者递送重组腺相关病毒(rAAV)，所述rAAV具有来自腺相关病毒rh91的AAV衣壳和包装在所述AAV衣壳中的载体基因组，所述载体基因组包括AAV反向末端重复序列(ITR)、编码包括GLP-1类似物和人IgG4 Fc的融合蛋白的序列以及指导所述融合蛋白的表达的调控序列。

27.根据权利要求37所述的方法，其中向所述患者施用根据权利要求1至29中任一项所述的病毒载体或根据权利要求30至31中任一项所述的药物组合物。

28.根据权利要求37或38所述的方法，其中向所述患者施用1x 10⁹GC/kg至5x10¹³GC/kg体重的所述AAV的剂量。

29.根据权利要求37至39中任一项所述的方法，其中所述rAAV是肌内或静脉内递送的。

30.根据权利要求1至29、32或34至36中任一项所述的病毒载体、根据权利要求30至32中任一项所述的组合物、根据任一权利要求33至36所述的用途或根据权利要求37至40中任一项所述的方法，其用于治疗人的糖尿病。