CN101263154A

CN101263154A - 用于治疗蛋白质错折叠及蛋白质聚集疾病的组合物和方法

Info

Publication number: CN101263154A
Application number: CNA2005800373913A
Authority: CN
Inventors: 乔伊·G·高斯; 约翰·I·克拉克
Original assignee: University of Washington
Current assignee: University of Washington
Priority date: 2004-11-04
Filing date: 2005-11-04
Publication date: 2008-09-10

Abstract

本发明提供了小分子量的分子，其包括(但不限于)稳定并防止异常折叠及缺陷的蛋白质聚集的肽、肽类似物和拟肽。本发明提供了利用所述肽、肽类似物或拟肽或者利用编码所述肽的核酸来治疗疾病的方法。

Description

用于治疗蛋白质错折叠及蛋白质聚集疾病的组合物和方法

相关专利申请的交叉引用

本申请涉及2004年11月4日提交的、申请号为60/625,364的美国临时专利申请，以及2005年10月7日提交的、申请号为60/724,961的美国临时专利申请，这两个申请以引用方式整体并入本文。

政府资助声明

本发明是在国立卫生研究院国立眼科研究所的政府资助(批准号：EY04542)下完成的。政府享有本发明的某些权利。

技术领域

本发明涉及小分子量分子，其包括(但不限于)稳定蛋白质的非天然状态并防止未折叠、异常折叠或错折叠的蛋白质聚集的肽、肽类似物和拟肽。本发明还涉及利用肽、肽类似物或拟肽或者利用编码所述述肽的核苷酸来治疗蛋白质构象疾病的方法。

背景技术

蛋白质是由基因编码的氨基酸序列组成并通过细胞的蛋白质合成机制来合成的多肽链。蛋白质合成后，折叠成功能性的立体结构，该过程通常需要被称为分子伴侣的单独蛋白质参与。分子伴侣是内源性的专门化蛋白质，其帮助合成的多肽正常折叠成它们的功能形式。正确折叠的蛋白质被转运到它们的目的地并在那里行使其功能。

突变、分子及环境应激、翻译后修饰、蛋白质水解和衰老可改变蛋白质结构，导致未折叠或错折叠的、功能改变的蛋白质。所述改变的功能可以通过许多机制导致发病率的升高，所述机制包括(但不限于)重要细胞进程的破坏、聚集导致的毒性以及细胞死亡反应。

分子伴侣与部分折叠多肽之间的相互作用是对蛋白质未折叠和聚集疾病的一种天然防御。当体内的天然蛋白质因为结构不稳定而获得或失去功能时，就会发生蛋白质构象疾病。蛋白质聚集疾病是蛋白质构象疾病的一个亚类，其中未折叠或错折叠的蛋白质形成对细胞有毒的聚集物。许多蛋白质构象疾病是衰老的自然结果。随着衰老，细胞保护自身免受蛋白质未折叠和聚集的致命影响的能力大大减弱。作为抵抗蛋白质未折叠和错折叠的天然防御分子，分子伴侣的能力也随着衰老而急剧下降，而未折叠和错折叠的蛋白质数量则急剧增加。因此，当类似重新折叠和降解的保护途径变得无效而不能将非功能性的结构缺陷蛋白从细胞和/或组织中清除时，就会导致蛋白质错折叠和聚集疾病(表1)(Sanders和Myers，Annu.Rev.Biophys.Biomol.Struct.，33：25-51，2004)。

表1：蛋白质构象疾病以及其中涉及到的各病原学蛋白质。

疾病/病症	聚集倾向蛋白质
疾病/病症	聚集倾向蛋白质
神经变性疾病
神经变性疾病		阿尔茨海默病	β淀粉样蛋白、牛磺酸
帕金森病	α-核突触蛋白、牛磺酸	阿尔茨海默病	β淀粉样蛋白、牛磺酸
帕金森病	α-核突触蛋白、牛磺酸	克-雅病	淀粉样蛋白
苦鲁病	淀粉样蛋白	克-雅病	淀粉样蛋白
苦鲁病	淀粉样蛋白	GSS病	淀粉样蛋白
亨延顿病	亨廷顿病蛋白(huntingtin)	GSS病	淀粉样蛋白
亨延顿病	亨廷顿病蛋白(huntingtin)	多聚谷氨酰胺病	萎缩蛋白-1(atrophin-1)、失调症蛋白(ataxin)
朊病毒病	朊病毒蛋白	多聚谷氨酰胺病	萎缩蛋白-1(atrophin-1)、失调症蛋白(ataxin)
朊病毒病	朊病毒蛋白	牛海绵样脑病(BSE)	朊病毒蛋白
肌萎缩性侧索硬化	超氧化物岐化酶	牛海绵样脑病(BSE)	朊病毒蛋白
肌萎缩性侧索硬化	超氧化物岐化酶	亚历山大病	胶质纤维酸性蛋白
原发性系统性淀粉样变性病	免疫球蛋白轻链或片断	亚历山大病	胶质纤维酸性蛋白
原发性系统性淀粉样变性病	免疫球蛋白轻链或片断	继发性系统性淀粉样变性病	血清淀粉样蛋白A的片断
老年系统性淀粉样变性病	转甲状腺素蛋白及其片断	继发性系统性淀粉样变性病	血清淀粉样蛋白A的片断
老年系统性淀粉样变性病	转甲状腺素蛋白及其片断	老年淀粉样变性病	脱辅基脂蛋白A-II
		老年淀粉样变性病	脱辅基脂蛋白A-II
		眼病
白内障	晶状体蛋白、纤维	眼病
白内障	晶状体蛋白、纤维	色素性视网膜炎	视紫质
黄斑变性	β淀粉样蛋白、晶状体蛋白	色素性视网膜炎	视紫质
黄斑变性	β淀粉样蛋白、晶状体蛋白
其他疾病
其他疾病		胰岛淀粉样蛋白	胰岛素
髓状甲状腺瘤	降钙素	胰岛淀粉样蛋白	胰岛素
髓状甲状腺瘤	降钙素	遗传性肾淀粉样变性病	纤维蛋白原
血液透析相关的淀粉样变性	β2-微球蛋白	遗传性肾淀粉样变性病	纤维蛋白原
血液透析相关的淀粉样变性	β2-微球蛋白	索蛋白相关的心肌病	索蛋白

虽然分子伴侣可以由数千个肽组成，但是只有少数肽对于抗蛋白质构象疾病的功能是必需的(Santhoshkumar和Sharma，Molecular and CellularBiochemistry 267：147-155，2004)。尽管蛋白质分子伴侣在体内非常有效，但它们非常大，限制了它们在治疗应用中的生物利用度。因此，现有技术存在这样一个明确的、未满足的需求：更容易制备并用于多种治疗和生产应用的具有分子伴侣功能特性的肽。

发明内容

本发明涉及能稳定并减少未折叠、异常折叠或错折叠的蛋白质聚集的多肽、肽类似物和拟肽。因此，本发明提供了基于肽的组合物、肽变异体组合物或拟肽组合物，这些组合物可抑制蛋白质错折叠和/或聚集，并因而可用于多种治疗和生产应用，包括例如蛋白质错折叠和/或聚集相关疾病和病征的治疗以及用于生产和纯化重组蛋白的方法。本发明提供了多肽组合物、功能性变异体及其拟肽，还提供了用于治疗哺乳动物受治疗者疾病的方法，所述方法包括给有相应需要的受治疗者施用具有分子伴侣活性、长度最多约50个氨基酸的多肽。该方法能有效治疗蛋白质聚集相关疾病，以及例如年龄相关性肌病和心脏局部缺血。本发明提供了一种用于稳定蛋白质的方法，所述方法包括使蛋白质与具有分子伴侣活性、长度最多约50个氨基酸的多肽相接触。本发明提供了一种提高治疗性蛋白功效以治疗疾病的方法。本发明还提供了一种提高重组生产的蛋白质的产量的方法。这些方法提供了一种长度最多约50个氨基酸的多肽，作为活性蛋白组合物，所述多肽限制了蛋白质聚集并为重组蛋白提供了正确的多肽折叠。

本发明提供了多肽X₁-WIRRPFFPFHSP-X₂、X₁-WIRRPFFP-X₂、X₁-PFFPFHSP-X₂、X₁-FPFHSPSR-X₂、X₁-DQFFGEHL-X₂、X₁-FFGEHLLE-X₂或X₁-IAIHHPWI-X₂，或者它们的功能性变异体或模拟物，其中，X₁和X₂各自相互独立地代表具有n个氨基酸的任意氨基酸序列，n为0-50，X₁和X₂中的n可以相同或不同。另一方面，所述功能性变异体或模拟物包括保守性氨基酸取代或拟肽取代。具体地，所述功能性变异体有约70％或更高比例的氨基酸序列与X₁-WIRRPFFPFHSP-X₂、X₁-WIRRPFFP-X₂、X₁-PFFPFHSP-X₂、X₁-FPFHSPSR-X₂、X₁-DQFFGEHL-X₂、X₁-FFGEHLLE-X₂或X₁-IAIHHPWI-X₂相同。

本发明提供了多肽X₁-SLSPFYLRPPSFLRAP-X₂、X₁-SPFYLRPP-X₂、X₁-SLSPFYLR-X₂、X₁-FYLRPPSF-X₂、X₁-LRPPSFLR-X₂、X₁-PPSFLRAP-X₂、X₁-SFLRAPSW-X₂、X₁-LRAPSWFD-X₂，或者它们的功能性变异体或模拟物，其中X₁和X₂各自相互独立地代表具有n个氨基酸的任意氨基酸序列，n为0-50，X₁和X₂中的n可以相同或不同。另一方面，所述功能性变异体或模拟物包括保守性氨基酸取代或拟肽取代。具体地，所述功能性变异体有约70％或更高比例的氨基酸序列与X₁-SLSPFYLRPPSFLRAP-X₂、X₁-SPFYLRPP-X₂、X₁-SLSPFYLR-X₂、X₁-FYLRPPSF-X₂、X₁-LRPPSFLR-X₂、X₁-PPSFLRAP-X₂、X₁-SFLRAPSW-X₂、X₁-LRAPSWFD-X₂相同。

本发明提供了X₁-RLEKDRFS-X₂、X₁-FSVNLDVK-X₂、X₁-LKVKVLGD-X₂、X₁-FISREFHR-X₂、X₁-HGFISREF-X₂、X₁-KYRIPADV-X₂、X₁-EFHRKYRI-X₂、X₁-SREFHRKY-X₂、X₁-LTITSSLS-X₂、X₁-GVLTVNGP-X₂或X₁-LTVNGPRK-X₂，或者它们的功能性变异体或模拟物，其中X₁和X₂各自相互独立地代表具有n个氨基酸的任意氨基酸序列，n为0-50，X₁和X₂中的n可以相同或不同。另一方面，所述功能性变异体或模拟物包括保守性氨基酸取代或拟肽取代。具体地，所述功能性变异体有约70％或更高比例的氨基酸序列与X₁-RLEKDRFS-X₂、X₁-FSVNLDVK-X₂、X₁-LKVKVLGD-X₂、X₁-FISREFHR-X₂、X₁-HGFISREF-X₂、X₁-KYRIPADV-X₂、X₁-EFHRKYRI-X₂、X₁-SREFHRKY-X₂、X₁-LTITSSLS-X₂、X₁-GVLTVNGP-X₂或X₁-LTVNGPRK-X₂相同。

本发明提供了一种多肽-X₁-RTIPITRE-X₂或者其功能性变异体或模拟物，其中X₁和X₂各自相互独立地代表具有n个氨基酸的任意氨基酸序列，n为0-50，X₁和X₂中的n可以相同或不同。另一方面，所述功能性变异体或模拟物包括保守性氨基酸取代或拟肽取代。具体地，所述功能性变异体有约70％或更高比例的氨基酸序列与X₁-RTIPITRE-X₂相同。所述功能性变异体含有I-X-I/V氨基酸基序。

本发明提供了一种用于治疗哺乳动物受治疗者的蛋白质构象疾病的方法，所述方法包括给有相应需要的受治疗者施用一种多肽，其中所述多肽是X₁-WIRRPFFPFHSP-X₂、X₁-WIRRPFFP-X₂、X₁-PFFPFHSP-X₂、X₁-FPFHSPSR-X₂、X₁-DQFFGEHL-X₂、X₁-FFGEHLLE-X₂、X₁-IAIHHPWI-X₂、X₁-SLSPFYLRPPSFLRAP-X₂、X₁-SPFYLRPP-X₂、X₁-SLSPFYLR-X₂、X₁-FYLRPPSF-X₂、X₁-LRPPSFLR-X₂、X₁-PPSFLRAP-X₂、X₁-SFLRAPSW-X₂、X₁-LRAPSWFD-X₂、X₁-RLEKDRFS-X₂、X₁-FSVNLDVK-X₂、X₁-LKVKVLGD-X₂、X₁-FISREFHR-X₂、X₁-HGFISREF-X₂、X₁-KYRIPADV-X₂、X₁-EFHRKYRI-X₂、X₁-SREFHRKY-X₂、X₁-LTITSSLS-X₂、X₁-GVLTVNGP-X₂、X₁-LTVNGPRK-X₂或X₁-RTIPITRE-X₂，或者它们的功能性变异体或模拟物，其中X₁和X₂各自相互独立地代表具有n个氨基酸的任意氨基酸序列，n为0-50，X₁和X₂中的n可以相同或不同。另一方面，所述功能性变异体或模拟物包括保守性氨基酸取代或拟肽取代。具体地，所述功能性变异体有约70％或更高比例的氨基酸序列与X₁-WIRRPFFPFHSP-X₂、X₁-WIRRPFFP-X₂、X₁-PFFPFHSP-X₂、X₁-FPFHSPSR-X₂、X₁-DQFFGEHL-X₂、X₁-FFGEHLLE-X₂、X₁-IAIHHPWI-X₂、X₁-SLSPFYLRPPSFLRAP-X₂、X₁-SPFYLRPP-X₂、X₁-SLSPFYLR-X₂、X₁-FYLRPPSF-X₂、X₁-LRPPSFLR-X₂、X₁-PPSFLRAP-X₂、X₁-SFLRAPSW-X₂、X₁-LRAPSWFD-X₂、X₁-RLEKDRFS-X₂、X₁-FSVNLDVK-X₂、X₁-LKVKVLGD-X₂、X₁-FISREFHR-X₂、X₁-HGFISREF-X₂、X₁-KYRIPADV-X₂、X₁-EFHRKYRI-X₂、X₁-SREFHRKY-X₂、X₁-LTITSSLS-X₂、X₁-GVLTVNGP-X₂、X₁-LTVNGPRK-X₂或X₁-RTIPITRE-X₂相同。更具体地，功能性变异体X₁-RTIPITRE-X₂多肽含有I-X-I/V氨基酸基序。所述疾病包括(但不限于)亚历山大病、阿尔茨海默病、克-雅病、帕金森病、亨廷顿病、白内障、色素性视网膜炎、朊病毒病或疯牛病。所述疾病还包括(但不限于)年龄相关性肌病或心脏局部缺血。

本发明提供了一种用于治疗哺乳动物受治疗者的蛋白质构象疾病的方法，所述方法包括给有相应需要的受治疗者施用编码一种多肽的核酸，其中所述多肽是X₁-WIRRPFFPFHSP-X₂、X₁-WIRRPFFP-X₂、X₁-PFFPFHSP-X₂、X₁-FPFHSPSR-X₂、X₁-DQFFGEHL-X₂、X₁-FFGEHLLE-X₂、X₁-IAIHHPWI-X₂、X₁-SLSPFYLRPPSFLRAP-X₂、X₁-SPFYLRPP-X₂、X₁-SLSPFYLR-X₂、X₁-FYLRPPSF-X₂、X₁-LRPPSFLR-X₂、X₁-PPSFLRAP-X₂、X₁-SFLRAPSW-X₂、X₁-LRAPSWFD-X₂、X₁-RLEKDRFS-X₂、X₁-FSVNLDVK-X₂、X₁-LKVKVLGD-X₂、X₁-FISREFHR-X₂、X₁-HGFISREF-X₂、X₁-KYRIPADV-X₂、X₁-EFHRKYRI-X₂、X₁-SREFHRKY-X₂、X₁-LTITSSLS-X₂、X₁-GVLTVNGP-X₂、X₁-LTVNGPRK-X₂或X₁-RTIPITRE-X₂，或者它们的功能性变异体或模拟物，其中X₁和X₂各自相互独立地代表具有n个氨基酸的任意氨基酸序列，n为0-50，X₁和X₂中的n可以相同或不同。另一方面，所述功能性变异体或模拟物包括保守性氨基酸取代或拟肽取代。具体地，所述功能性变异体有约70％或更高比例的氨基酸序列与X₁-WIRRPFFPFHSP-X₂、X₁-WIRRPFFP-X₂、X₁-PFFPFHSP-X₂、X₁-FPFHSPSR-X₂、X₁-DQFFGEHL-X₂、X₁-FFGEHLLE-X₂或X₁-IAIHHPWI-X₂、X₁-SLSPFYLRPPSFLRAP-X₂、X₁-SPFYLRPP-X₂、X₁-SLSPFYLR-X₂、X₁-FYLRPPSF-X₂、X₁-LRPPSFLR-X₂、X₁-PPSFLRAP-X₂、X₁-SFLRAPSW-X₂、X₁-LRAPSWFD-X₂、X₁-RLEKDRFS-X₂、X₁-FSVNLDVK-X₂、X₁-LKVKVLGD-X₂、X₁-FISREFHR-X₂、X₁-HGFISREF-X₂、X₁-KYRIPADV-X₂、X₁-EFHRKYRI-X₂、X₁-SREFHRKY-X₂、X₁-LTITSSLS-X₂、X₁-GVLTVNGP-X₂、X₁-LTVNGPRK-X₂或X₁-RTIPITRE-X₂相同。更具体地，功能性变异体X₁-RTIPITRE-X₂多肽含有I-X-I/V氨基酸基序。所述疾病包括(但不限于)亚历山大病、阿尔茨海默病、克-雅病、帕金森病、亨廷顿病、白内障、色素性视网膜炎、朊病毒病或疯牛病。所述疾病还包括(但不限于)年龄相关性肌病或心脏局部缺血。

本发明提供了一种用于稳定蛋白质的方法，所述方法包括使蛋白质与一种多肽接触，所述多肽是X₁-WIRRPFFPFHSP-X₂、X₁-WIRRPFFP-X₂、X₁-PFFPFHSP-X₂、X₁-FPFHSPSR-X₂、X₁-DQFFGEHL-X₂、X₁-FFGEHLLE-X₂、X₁-IAIHHPWI-X₂、X₁-SLSPFYLRPPSFLRAP-X₂、X₁-SPFYLRPP-X₂、X₁-SLSPFYLR-X₂、X₁-FYLRPPSF-X₂、X₁-LRPPSFLR-X₂、X₁-PPSFLRAP-X₂、X₁-SFLRAPSW-X₂、X₁-LRAPSWFD-X₂、X₁-RLEKDRFS-X₂、X₁-FSVNLDVK-X₂、X₁-LKVKVLGD-X₂、X₁-FISREFHR-X₂、X₁-HGFISREF-X₂、X₁-KYRIPADV-X₂、X₁-EFHRKYRI-X₂、X₁-SREFHRKY-X₂、X₁-LTITSSLS-X₂、X₁-GVLTVNGP-X₂、X₁-LTVNGPRK-X₂或X₁-RTIPITRE-X₂，或者它们的功能性变异体或模拟物，其中X₁和X₂各自相互独立地代表具有n个氨基酸的任意氨基酸序列，n为0-50，X₁和X₂中的n可以相同或不同。另一方面，所述功能性变异体或模拟物包括保守性氨基酸取代或拟肽取代。具体地，所述功能性变异体有约70％或更高比例的氨基酸序列与X₁-WIRRPFFPFHSP-X₂、X₁-WIRRPFFP-X₂、X₁-PFFPFHSP-X₂、X₁-FPFHSPSR-X₂、X₁-DQFFGEHL-X₂、X₁-FFGEHLLE-X₂或X₁-IAIHHPWI-X₂、X₁-SLSPFYLRPPSFLRAP-X₂、X₁-SPFYLRPP-X₂、X₁-SLSPFYLR-X₂、X₁-FYLRPPSF-X₂、X₁-LRPPSFLR-X₂、X₁-PPSFLRAP-X₂、X₁-SFLRAPSW-X₂、X₁-LRAPSWFD-X₂、X₁-RLEKDRFS-X₂、X₁-FSVNLDVK-X₂、X₁-LKVKVLGD-X₂、X₁-FISREFHR-X₂、X₁-HGFISREF-X₂、X₁-KYRIPADV-X₂、X₁-EFHRKYRI-X₂、X₁-SREFHRKY-X₂、X₁-LTITSSLS-X₂、X₁-GVLTVNGP-X₂、X₁-LTVNGPRK-X₂或X₁-RTIPITRE-X₂相同。更具体地，功能性变异体X₁-RTIPITRE-X₂多肽含有I-X-I/V氨基酸基序。

所述用于稳定蛋白质的方法还提供了所述蛋白质为一种治疗性蛋白。所述治疗性蛋白质包括(但不限于)疫苗、胰岛素、生长因子或抗体。另一方面，所述蛋白质是一种重组产生的蛋白。所述用于稳定蛋白质的方法还包括提高治疗性蛋白的稳定性以治疗哺乳动物受治疗者的疾病。所述方法还包括抑制蛋白质错折叠或减少蛋白质聚集。所述方法还包括恢复蛋白质正确或天然的折叠。

本发明提供了一种用于诊断哺乳动物受治疗者的蛋白质构象疾病的方法，所述方法包括：使哺乳动物受治疗者的组织样品与一种多肽接触，所述多肽是X₁-WIRRPFFPFHSP-X₂、X₁-WIRRPFFP-X₂、X₁-PFFPFHSP-X₂、X₁-FPFHSPSR-X₂、X₁-DQFFGEHL-X₂、X₁-FFGEHLLE-X₂、X₁-IAIHHPWI-X₂、X₁-SLSPFYLRPPSFLRAP-X₂、X₁-SPFYLRPP-X₂、X₁-SLSPFYLR-X₂、X₁-FYLRPPSF-X₂、X₁-LRPPSFLR-X₂、X₁-PPSFLRAP-X₂、X₁-SFLRAPSW-X₂、X₁-LRAPSWFD-X₂、X₁-RLEKDRFS-X₂、X₁-FSVNLDVK-X₂、X₁-LKVKVLGD-X₂、X₁-FISREFHR-X₂、X₁-HGFISREF-X₂、X₁-KYRIPADV-X₂、X₁-EFHRKYRI-X₂、X₁-SREFHRKY-X₂、X₁-LTITSSLS-X₂、X₁-GVLTVNGP-X₂、X₁-LTVNGPRK-X₂或X₁-RTIPITRE-X₂，或者它们的功能性变异体或模拟物，其中X₁和X₂各自相互独立地代表具有n个氨基酸的任意氨基酸序列，n为0-50，X₁和X₂中的n可以相同或不同；检测错折叠蛋白、未折叠蛋白或聚集蛋白与所述多肽的结合；确定哺乳动物受治疗者中是否存在所述疾病。另一方面，通过蛋白质错折叠、未折叠或聚集的阶段来检测是否存在所述疾病。另一方面，所述功能性变异体或模拟物包括保守性氨基酸取代或拟肽取代。具体地，所述功能性变异体有约70％或更高比例的氨基酸序列与X₁-WIRRPFFPFHSP-X₂、X₁-WIRRPFFP-X₂、X₁-PFFPFHSP-X₂、X₁-FPFHSPSR-X₂、X₁-DQFFGEHL-X₂、X₁-FFGEHLLE-X₂、X₁-IAIHHPWI-X₂、X₁-SLSPFYLRPPSFLRAP-X₂、X₁-SPFYLRPP-X₂、X₁-SLSPFYLR-X₂、X₁-FYLRPPSF-X₂、X₁-LRPPSFLR-X₂、X₁-PPSFLRAP-X₂、X₁-SFLRAPSW-X₂、X₁-LRAPSWFD-X₂、X₁-RLEKDRFS-X₂、X₁-FSVNLDVK-X₂、X₁-LKVKVLGD-X₂、X₁-FISREFHR-X₂、X₁-HGFISREF-X₂、X₁-KYRIPADV-X₂、X₁-EFHRKYRI-X₂、X₁-SREFHRKY-X₂、X₁-LTITSSLS-X₂、X₁-GVLTVNGP-X₂、X₁-LTVNGPRK-X₂或X₁-RTIPITRE-X₂相同。更具体地，X₁-RTIPITRE-X₂多肽含有I-X-I/V氨基酸基序。所述疾病包括(但不限于)亚历山大病、阿尔茨海默病、克-雅病、帕金森病、亨廷顿病、白内障、色素性视网膜炎、朊病毒病或疯牛病。所述疾病还包括(但不限于)年龄相关性肌病或心脏局部缺血。

附图说明

图1是描述Intellipeptide稳定错折叠蛋白和/或防止蛋白质聚集的治疗性应用的示意图。

图2是描述Intellipeptide在体外对pH诱导的β淀粉样蛋白聚集的影响的条形图。

图3是描述Intellipeptide在体外对Cu⁺⁺⁺诱导的β淀粉样蛋白聚集的影响的条形图。

图4显示了阿尔茨海默病(AD)和帕金森病(PD)中的淀粉样变性以及使用Intellipeptide可能的介入的示意图。

图5显示了一种利用静电表面的分子模型来设计具有多肽特征的合成分子的方法。

图6总结了从多肽SLSPFYLRPPSFLRAPS、EKDRFSVNLDVKHFS、HGFISREFHRKYR、DPLTITSSLSSDGVLTVNGPRKQ和PERTIPITREEK的多肽序列衍生的一系列肽。

图7显示了从序列SLSPFYLRPPSFLRAPS衍生的一系列肽的氨基酸序列。

图8显示了从序列EKDRFSVNLDVKHFS衍生的一系列肽的氨基酸序列。

图9显示了从序列HGFISREFHRKYR衍生的一系列肽的氨基酸序列。

图10显示了从序列DPLTITSSLSSDGVLTVNGPRKQ衍生的一系列肽的氨基酸序列。

图11显示了从序列PERTIPITREEK衍生的一系列肽的氨基酸序列。

图12显示了蛋白质针脚阵列(pin array)检测的示意图。具体方案参考方法部分。

图13显示了固定在针脚上的人αB晶状体蛋白8-mer肽在23℃下与未加热的β_H晶状体蛋白之间以及在45℃下与预热的β_H晶状体蛋白之间相互作用15分种的图式。

图14显示了固定在针脚上的人αB晶状体蛋白8-mer肽在23℃下与未加热的γD晶状体蛋白之间以及在45℃下与预热的γD晶状体蛋白之间相互作用15分种的图式。

图15显示了β_H晶状体蛋白、γD晶状体蛋白、乙醇脱氢酶(ADH)和柠檬酸合成酶(CS)的远紫外圆二色谱(far UVCD)。汇集了β_H晶状体蛋白(A：左上)、γD晶状体蛋白(B：右上)、ADH(C：左下)和CS(右下)在23℃、45℃和50℃的图谱。

图16显示了β_H晶状体蛋白、γD晶状体蛋白、ADH和CS的近紫外圆二色谱(near UVCD)。汇集了β_H晶状体蛋白(A：左上)、γD晶状体蛋白(B：右上)、ADH(C：左下)和CS(D：右下)在23℃、45℃和50℃的图谱。

图17显示了人αB晶状体蛋白肽和ADH之间的相互作用图式。

图18显示了人αB晶状体蛋白肽和CS之间的相互作用图式。

图19显示了两个阳性活性序列₇₃DRFSVNLDVKHFS₈₅和₁₃₁LTITSSLSDGV₁₄₁以及来自人αB晶状体蛋白的α晶状体蛋白核心结构域的一个非活性序列₁₁₁HGKHEERQDE₁₂₀(对照)的分子伴侣检测。

图20显示了使用人αB晶状体蛋白针脚阵列检测所识别的肽与之前报道的αB晶状体蛋白活性序列之间的比较。

图21显示了αB晶状体蛋白活性结构域的立体图。

图22显示了αB晶状体蛋白和5个αB晶状体蛋白衍生肽对Aβ纤维化的影响。

图23显示了αB晶状体蛋白和5个αB晶状体蛋白衍生肽对γD晶状体蛋白纤维化的影响。

图24显示了5个αB晶状体蛋白衍生肽的分子伴侣检测。

发明详述

本发明提供了稳定蛋白质的非天然状态并防止未折叠、异常折叠或错折叠蛋白质聚集的多肽、肽类似物和拟肽。因此，本发明提供了基于肽的组合物，这些组合物抑制蛋白质错折叠、异常折叠和/或聚集，因而可在多种治疗和生产应用中使用，包括，例如与蛋白质错折叠、异常折叠和/或聚集相关的疾病和病症的治疗以及用来生产和纯化重组蛋白的方法。

附图1描述了Intellipeptide稳定错折叠蛋白和/或防止蛋白质聚集的治疗性应用。粗连续箭头显示了新合成的蛋白质(U)、部分折叠的中间体(I)和完全折叠的天然蛋白质(N)的正常路径的示意图。图中细箭头表示蛋白质聚集和降解的路径。潜在的治疗性介入点表示为闪电标志，Intellipeptide能够在这些点介入来防止蛋白质错折叠和聚集疾病。

蛋白质针脚阵列使用天然的晶状体蛋白β_H晶状体蛋白和γD晶状体蛋白，以及体外分子伴侣靶蛋白，如乙醇脱氢酶和柠檬酸合成酶，确定了人αB晶状体蛋白中具有分子伴侣活性的活性多肽序列。具有稳定并减少错折叠蛋白质聚集活性的多肽片断包括来自人αB晶状体蛋白的N末端结构域、α晶状体蛋白核心结构域或C末端结构域的多肽序列。N末端结构域含有具有分子伴侣活性的活性多肽序列₉WIRRPFFPFHSP₂₀和₄₃SLSPFYLRPPSFLRAP₅₈。N末端结构域还含有下述具有分子伴侣活性的活性多肽序列：WIRRPFFP、PFFPFHSP、FPFHSPSR、DQFFGEHL、FFGEHLLE或IAIHHPWI、SPFYLRPP、SLSPFYLR、FYLRPPSF、LRPPSFLR、PPSFLRAP、SFLRAPSW、LRAPSWFD。α晶状体蛋白核心结构域含有下述具有分子伴侣活性的活性蛋白序列：₇₅FSVNLDVK₈₂(β3)、₁₁₃FISREFHR₁₂₀、₁₃₁LTITSSLS₁₃₈(β8)和₁₄₁GVLTVNGP_I48(β9)。α晶状体蛋白核心结构域还含有具有分子伴侣活性的活性蛋白序列：RLEKDRFS、LKVKVLGD、HGFISREF、KYRIPADV、EFHRKYRI、SREFHRKY或LTVNGPRK。C末端结构域含有活性序列₁₅₇RTIPITRE₁₆₄，该序列包括高度保守的I-X-I/V氨基酸基序。将属于α晶状体蛋白核心结构域的两个活性序列₇₃DRFSVNLD VKHFS₈₅和₁₃₁LTITSSLSDGV₁₄₁合成为肽，并检测体外的分子伴侣活性。这两个合成的肽在体外都抑制了β_H晶状体蛋白、乙醇脱氢酶和柠檬酸合成酶的热聚集。针脚阵列所确定的7个分子伴侣序列中的5个序列与之前确定为在人αB晶状体蛋白中产生亚基-亚基相互作用的序列之间是重叠的。结果表明，人αB晶状体蛋白中的活性序列具有双重作用：亚基-亚基组装和分子伴侣活性。

要理解本发明不限于特定的方法、试剂、化合物、组合物或生物系统，这些应该都可以变化。还要理解本文使用的术语只是为了描述特定实施方案的目的，不是要进行限制。如本说明书和权利要求书使用的单数形式的包括复数指代，除非所述内容另有清楚说明。因此，例如，“细胞”包括两个或更多细胞的组合，等等。

本文使用的“约”指代可测量值(如数量、临时的持续时间等)时，意为包括具体值的±20％或±10％、更优选为±5％、甚至更优选为±1％、还更优选为±0.1％的变化，因为这些变化对进行本文公开的方法来说是适当的。

除非另有定义，本文使用的所有技术和科学术语的含义与本发明所属领域普通技术人员所公知的含义相同。虽然本文描述了优选的材料和方法，但是与这些所述材料和方法类似或等同的任何材料和方法都能够用于本发明试验的实践。在本发明的说明书和权利要求书中会使用下述术语：

肽

本发明的肽、肽类似物和拟肽在本文被统称为“Intellipeptide”、“聚集抑制肽”、“抑制蛋白异常折叠、未折叠、错折叠或蛋白聚集的肽”。Intellipeptide的鉴定是使用蛋白质针脚阵列、计算机模型设计、结构和功能上相似的蛋白质的多重序列对比分析、分子伴侣的体外分光测定和/或体内细胞杀伤测定。

Lntellipeptide可稳定并防止多种靶蛋白的未折叠、错折叠或聚集，这些靶蛋白包括(但不限于)：β淀粉样蛋白、β/γ晶状体蛋白、肌动蛋白、索蛋白、波形蛋白、胰岛素、柠檬酸合成酶、乙醇脱氢酶、胶质纤维酸性蛋白、α乳清蛋白、成纤维细胞生长因子、胰岛素样生长因子、β转化生长因子、β神经生长因子、表皮生长因子、血管内皮生长因子、β连环蛋白、α肿瘤坏死因子、Bcl-2、BcI-X1和胱门蛋白酶。

在一种用于治疗哺乳动物受治疗者的蛋白质构象疾病的方法中，Intellipeptide能有效稳定和/或防止多种疾病靶蛋白的未折叠、错折叠或聚集。疾病靶蛋白包括(但不限于)：神经变性疾病，阿尔茨海默病(β淀粉样蛋白、牛磺酸)；帕金森病(α-核突触蛋白、牛磺酸)；克-雅病(淀粉样蛋白)；苦鲁病(淀粉样蛋白)；GSS病(淀粉样蛋白)；亨廷顿病(亨廷顿病蛋白)；多聚谷氨酰胺病(萎缩蛋白-1、失调症蛋白)；朊病毒病(朊病毒蛋白)；牛海绵样脑病(BSE)(朊病毒蛋白)；肌萎缩性侧索硬化(超氧化物岐化酶)；亚历山大病(胶质纤维酸性蛋白)；原发性系统性淀粉样变性病(免疫球蛋白轻链或其片断)；继发性系统性淀粉样变性病(血清淀粉样蛋白A的片断)；老年系统性淀粉样变性病(转甲状腺素蛋白及其片断)；老年淀粉样变性病(脱辅基脂蛋白A-II)；眼病：白内障(晶状体蛋白、纤维)；色素性视网膜炎(视紫质)；黄斑变性(β淀粉样蛋白、晶状体蛋白)；和其他疾病：胰岛淀粉样蛋白(胰岛素)；髓状甲状腺瘤(降钙素)；遗传性肾淀粉样变性病(纤维蛋白原)；血液透析相关的淀粉样变性病(β2-微球蛋白)；索蛋白相关的心肌病(索蛋白)；腓骨肌萎缩病(PMP-22)；尿崩症(水通道蛋白)；尿崩症(血管加压素受体)；腓骨肌萎缩病(连接蛋白32)；囊性纤维病(CFTR)。参见，例如：Sanders和Myers，Annu.Rev.Biophys.Biomol.Struct.，33：25-51，2004。

在一个实施方案中，本发明的Intellipeptide含有αB晶状体蛋白片断或者由αB晶状体蛋白片断组成。在另外一个实施方案中，本发明的Intellipeptide含有肽或者由肽组成，所述肽与从αB晶状体蛋白鉴定出的亲本组肽序列在结构和功能上类似，包括(但不限于)附图6、7、8、9、10及11和表4所提供的肽。本发明证明，亲本组肽以及亲本组肽序列的肽类似物和拟肽干扰了错折叠或未折叠亚基之间的相互作用，从而抑制了蛋白聚集物的形成。另外，Intellipeptide通过提供有益于重新折叠的保护性环境而稳定错折叠或未折叠中间体。

在某些实施方案中，Intellipeptide包括肽类似物和拟肽。事实上，Intellipeptide包括具有多种不同修饰中任意修饰的肽，包括本文公开的那些。

Lntellipeptides类似物一般通过先导肽的化学修饰来设计和生成，所述先导肽包括例如本文描述的任意具体肽，如下述任意序列：i)EKDRFSVNLDVKHFS；ii)DPLTITSSLSSDGVLTVNGPRKQ；iii)LTITSSLSDGVLTVNGPRK；iv)STSLSPFYLRPPSFLRAP；v)SLSPFYLRPPSFLRAPS；vi)GPERTIPITREEK；vii)PERTIPITREEK；viii)HGKHEERQDE；ix)HGFISREFHRKYR；或者这些序列的功能性变异体或拟肽。提供了具有分子伴侣活性的αB晶状体蛋白的示例性多肽片断，例如N-末端结构域多肽片断为₉WIRRPFFPFHSP₂₀或₄₃SLSPFYLRPPSFLRAP₅₈，α晶状体蛋白核心结构域多肽片断为₇₅FSVNLDVK₈₂(β3)、₁₁₃FISREFHR₁₂₀、₁₃₁LTITSSLS₁₃₈(β8)、₁₄₁GVLTVNGP₁₄₈(β9)、₇₃DRFSVNLDVKHFS₈₅或₁₃₁LTITSSLSDGV₁₄₁，C末端结构域多肽片断为₁₅₇RTIPITRE₁₆₄，或者是它们的功能性变异体。本发明清楚确定，完整形式的这些肽以及通过修饰组成性氨基酸的任意侧链所生成的衍生物有能力来防止蛋白质聚集、正确折叠并稳定蛋白质。本发明还包括长度最多约50个氨基酸的多肽，包括本文描述的氨基酸序列以及这些序列的功能性变异体或拟肽。

在一个实施方案中，本发明的Intellipeptide包括N末端修饰和C末端修饰。N末端乙酰化或脱氨赋予了防止在酰胺存在时多种氨基肽酶对肽的消化作用，或者，C末端羧基的乙醇取代防止几种羧肽酶的分解作用，所述羧肽酶包括羧肽酶A和B。

在另一实施方案中，本发明的Intellipeptide包括侧链修饰。非天然氨基酸的存在通常会增加肽的稳定性。另外，这些氨基酸的至少一种(α氨基异丁酸或Aib)赋予模型肽以重要的限制，降低了它们的构象灵活度。因此，Aib的引入有望同时提高肽的稳定性和抑制活性。

在另一实施方案中，本发明的Intellipeptide包括α碳的修饰。为提高肽稳定性而最常使用的α碳修饰是α-甲基化。另外，与Phe、Val或Leu的α碳相连的氢原子的取代有助于采用β-弯曲构象，这不利于β-折叠结构的形成。根据本发明，抑制剂肽中这些残基的甲基化有望提高其稳定性和效价。

在另一实施方案中，本发明的Intellipeptide包括手性改变。天然的L型基团被D型对映体所取代，显著提高了其对蛋白质水解作用的抵抗力。含有D型对映体的聚集抑制剂在防止聚集方面与聚集抑制亲本肽的L型对映体一样有效。

在另一实施方案中，本发明的Intellipeptide是环肽。构象限制的环肽较线性肽是更好的候选药物，因为环肽的构象灵活度降低且对肽链端解酶的抵抗力提高。可以使用两种可选策略将线性序列转化成环状结构。一种策略是引入半胱氨酸残基，通过二硫键的形成来实现环化；另一种策略是侧链连接，涉及树脂结合的头-尾环化。为避免肽序列的修饰，则使用后一种方法。聚集抑制肽含有促进大环化的理想序列，这是因为脯氨酸具有提高翻转和环化的能力而是许多天然存在或人工合成的环肽的组成成分。

在另一实施方案中，本发明的Intellipeptide是假肽。假肽或酰胺键替代物指在一些(或全部)肽键上具有化学修饰的肽。酰胺键替代物的引入不但减少肽的降解，而且还可以明显改变肽的一些生化性质，特别是构象灵活度和疏水性。构象灵活度的提高可能有益于使抑制剂对接至结合位点。另一方面，由于聚集倾向蛋白和抑制剂之间的相互作用似乎很大程度上依赖于疏水性相互作用，提高疏水性的酰胺键取代可提高亲和力，从而提高抑制剂的效价。另外，提高的疏水性还能提高肽的跨膜转运，从而改善屏障通透性(血-脑屏障和肠屏障)。要取代的酰胺键有：位于肽末端的酰胺键，目的是防止胞外蛋白酶的降解；每个脯氨酸后的酰胺键，因为该氨基酸残基之后具有脯氨酰内肽酶的常见内肽酶切割位点。

可以运用蛋白质工程来改善或改变本发明多肽的特性。可以使用本领域技术人员已知的重组DNA技术来生成新型的含有单个或多个氨基酸取代、缺失、添加的突变蛋白或融合蛋白。这些经修饰的多肽能够表现出例如提高的或降低的生物学活性，或者提高的或降低的稳定性。另外，它们能够以较高的产量被纯化，并表现出比相应的天然多肽更好的溶解性，至少是在某些纯化和贮存条件下是这样。而且，本发明的多肽能被制成多聚体，包括二聚体、三聚体和四聚体。可以通过交联剂或异源多肽重组来促进多聚化，所述异源多肽如Fc区。

现有技术已知，可以从N末端或C末端缺失一个或多个氨基酸而没有生物学的显著功能损失。参见，例如Ron等人，Biol Chem.，268：2984-2988，1993。相应地，本发明提供了氨基端有一个或多个氨基酸残基缺失的多肽。同样，已知有许多具有生物学功能的C末端缺失的变异体的例子(参见，例如Dobeli等人，1988)。相应地，本发明提供了羧基端有一个或多个氨基酸残基缺失的多肽。本发明还提供了如下文所述的同时在氨基端和羧基端具有一个或多个氨基酸残基缺失的多肽。

除了上述讨论的N末端和C末端缺失的蛋白质形式，本发明还包括其他变异体。因此，本发明还包括具有显著的分子伴侣多肽活性的多肽变异体。所述变异体包括根据现有技术已知的一般原则所选取的缺失、插入、倒置、重复和取代，这些突变对多肽活性几乎没有影响。

有两种主要的方法用于研究要改变的氨基酸序列的耐受性。参见，Bowie等人，Science，247：1306-1310，1994。第一种方法依靠进化过程，其中通过自然选择而接受或者拒绝突变。第二种方法利用基因工程，在克隆化基因的特定位点引入氨基酸改变，然后利用选择或筛选来识别保持功能的序列。这些研究已经揭示，蛋白质对氨基酸取代有惊人的耐受性。

一般被视为保守性取代的有：脂肪族氨基酸残基Ala、Val、Leu和Phe的一对一取代；羟基氨基酸残基Ser和Thr的互换，酸性氨基酸残基Asp和Glu的交换，酰胺氨基酸残基Asn和Gin之间的取代，碱性氨基酸残基Lys和Arg的交换，以及芳香族氨基酸残基Phe和Tyr的取代。因此，本发明的多肽可以是，例如：(i)其中一个或多个氨基酸残基被保守性或非保守性氨基酸残基(优选为保守性氨基酸残基)所取代的多肽，所述被取代的氨基酸残基是或不是由遗传密码所编码的氨基酸；或(ii)其中一个或多个氨基酸残基含有取代基的多肽；或(iii)其中的PEDF-R多肽与另一化合物融合的多肽，所述另一化合物如增加多肽半衰期的化合物，例如聚乙二醇；或(iv)其中另外的氨基酸与上述类型多肽相融合的多肽，如IgG Fc融合区肽或先导序列或分泌序列或用来纯化上述类型多肽的序列或前蛋白序列。

因此，本发明的多肽可以包括通过天然突变或人工处理所获得的一个或多个氨基酸的取代、缺失或添加。如所指明的，变化优选是较小的，如那些不显著影响蛋白质折叠或活性的保守性氨基酸取代。下述几组氨基酸表示等价交换：(1)Ala、Pro、Gly、Glu、Asp、Gln、Asn、Ser、Thr；(2)Cys、Ser、Tyr、Thr；(3)Val、Ile、Leu、Met、Ala、Phe；(4)Lys、Arg、His；(5)Phe、Tyr、Trp、His。

另外，本发明多肽可以包括一个或多个模拟修饰氨基酸的氨基酸取代。这类取代的例子包括使用荷负电的氨基酸(如门冬氨酸或谷氨酸)来取代那些能够被磷酸化的氨基酸(如丝氨酸、苏氨酸或酪氨酸)，所述荷负电的氨基酸类似于磷酸化氨基酸的负电荷。本发明还可以包括使用带有大量疏水性侧链的氨基酸(如色氨酸或苯丙氨酸)来取代那些能够被疏水基团修饰的氨基酸(如精氨酸)。因此，本发明的具体实施方案包括分子伴侣多肽，所述分子伴侣多肽含有一个或多个模拟修饰氨基酸的氨基酸取代，取代发生在多肽中能够被修饰的氨基酸正常所处的位点。本发明还包括其中可修饰氨基酸的任何亚型被取代的分子伴侣多肽。例如，含有3个丝氨酸残基的分子伴侣多肽可以在任意一个、两个或全部三个所述丝氨酸上被取代。而且，任何能够被修饰的分子伴侣多肽氨基酸可以不被模拟修饰的氨基酸所取代。

本发明还涉及本发明多肽的片断。更具体地，本发明包括经纯化、分离及重组的多肽，含有至少长度为6-504(或者如果多肽氨基酸残基的长度小于1000时，多肽氨基酸残基长度减去1)之间任意整数的连续氨基酸残基片断。优选地，片断长度至少为6，优选为至少8-10，更优选为12、15、20、25、30、35、40、50、60、75、100、125、150、175、200、225、250、275、300、325、350、360或者本发明多肽的更多的连续氨基酸。

本发明还排除了根据5′和3′位点来确定的任何种类的本发明多肽片断或者如上所述的根据氨基酸数目来确定的多肽亚类。如上所述，任何通过5′和3′位点或氨基酸数目来确定的片断数目都可以被排除。

另外，应该理解，在某些实施方案中，本发明的Intellipeptide包括两种或更多种修饰，包括(但不限于)本文所述的那些修饰。考虑到上市的或正处于研发中的肽类药物的特点，显然，大部分成功稳定防止蛋白质水解的肽包括上述几种修饰类型的混合形式。这一结论是可以理解的，因为肽的降解涉及许多不同的酶。

本发明包括Intellipeptide文库。所述文库包括肽文库以及能够表达Intellipeptide的核酸构建文库。在一个实施方案中，本发明的文库由下述相关序列组成：i)EKDRFSVNLDVKHFS；ii)DPLTITSSLSSDGVLTVNGPRKQ；iii)LTITSSLSDGVLTVNGPRK；iv)STSLSPFYLRPPSFLRAP；v)SLSPFYLRPPSFLRAPS；vi)GPERTIPITREEK；vii)PERTIPITREEK；viii)HGKHEERQDE；ix)HGFISREFHRKYR；或者它们的功能性衍生物或模拟物。在一个具体实施方案中，本发明文库由两种或更多种Intellipeptide或其编码序列组成，包括例如图6、7、8、9、10及11以及表4中提供的序列。

肽、肽变异体和拟肽

本发明提供了分离或重组的多肽，或由本发明核酸编码的多肽，其中所述分离或重组的多肽含有的氨基酸序列与αB晶状体蛋白的N末端结构域、α晶状体蛋白核心结构域或C末端结构域的多肽片断在至少约10、50、100、150或200或更多的氨基酸残基结构域范围内具有至少95％、96％、97％、98％、99％或更高的序列同源性，。本发明的一个方面中，所述多肽含有αB晶状体蛋白的N末端结构域、α晶状体蛋白核心结构域或C末端结构域的多肽片断所具有的序列。本发明提供了通过施用αB晶状体蛋白的多肽片断例如本发明的多肽来抑制哺乳动物受治疗者蛋白质聚集的方法。本发明还提供了通过筛选αB晶状体蛋白的多肽片断例如本发明的多肽来筛选具有分子伴侣活性或抑制蛋白聚集的组合物的方法。

本发明的一个方面中，提供了αB晶状体蛋白的多肽片断(以及编码这些多肽片断的核酸)，其中αB晶状体蛋白的多肽片断中的一个、一些或全部氨基酸含有取代氨基酸的取代。在本发明的一个方面中，提供了用来提高具有分子伴侣活性的αB晶状体蛋白的多肽片断与未折叠蛋白、变性蛋白或天然构象蛋白之间相互作用的方法。

本发明的肽和多肽可以在施用上述核酸之后在体内重组表达，或者例如作为药物组合物被直接施用。它们可以被体外或体内表达，来筛选具有分子伴侣活性的αB晶状体蛋白的多肽片断以及能改善疾病(如蛋白质聚集疾病、年龄相关肌病或心脏局部缺血)的因子。

本发明多肽和肽可以从天然来源的、合成的或重组生成的多肽中分离。肽和蛋白质可以在体外或体内被重组表达。可以使用现有技术中已知的任何方法来制备和分离本发明的肽和多肽。还可以使用现有技术中公知的化学方法来全部或部分合成本发明多肽和肽。参见，例如，Caruthers，Nucleic Acids Res.Symp.Ser.215-223，1980；Horn，Nucleic Acids Res.Symp.Ser.225-232，1980；Banga，Therapeutic Peptides and Proteins，Formulation，Processing and Delivery Systems Technomic Publishing Co.，Lancaster，PA，1995。例如，可以使用各种固相法来进行肽合成(参见，例如，Roberge，Science 269：202，1995；Merrifield，Methods Enzymol.289：3-13，1997)，并可以例如按照生产商提供的说明书使用ABI 431A肽合成仪(Perkin Elmer)实现自动化合成。

如上所述的本发明肽和多肽包括全部的“模拟物”和“拟肽”形式。术语“模拟物”和“拟肽”指合成的化合物，其具有与本发明多肽基本相同的结构和/或功能特性。模拟物可以完全由合成的非天然的氨基酸类似物所构成，或者是部分天然肽氨基酸和部分非天然氨基酸类似物的嵌合分子。模拟物中还可以掺入任何量的天然氨基酸保守取代，只要这些取代没有实质上改变模拟物的结构和/或活性。当使用那些为保守性变异体的本发明多肽时，常规实验会确定模拟物是否在本发明范围之内，即其结构和/或功能没有实质上的改变。因此，当模拟组合物被施用于细胞或在细胞中表达时，则该模拟组合物包括在本发明范围之内，如具有分子伴侣活性的αB晶状体蛋白的多肽片断。如果模拟组合物在细胞或患有蛋白质聚集疾病的哺乳动物受治疗者中激发了分子伴侣活性，则该模拟组合物也包括在本发明范围之内。

图4显示了阿尔茨海默病(AD)和帕金森病(PD)中的淀粉样变性以及使用Intellipeptide的可能介入的示意图。淀粉样蛋白原纤维和斑块是AD神经病理学的标志，而Lewy小体是PD的神经病理学特征。在AD中，淀粉样蛋白源性A-β肽聚集而形成A-β斑。Intellipeptide结合β淀粉样蛋白、防止细胞毒性淀粉样蛋白斑的聚集和形成而防止AD。在PD中，α-核突触蛋白聚集形成Lewy小体。Intellipeptide结合α-核突触蛋白、防止Lewy小体的聚集和形成而防止PD。

图5显示了一种设计多肽模拟物的方法，所述方法利用静电表面分子模型来设计具有多肽特征的合成分子。利用分子建模可以构建目标肽的氨基酸图谱。根据氨基酸图谱可计算肽周围的静电表面。从静电表面图谱上移除氨基酸图谱，可以利用静电表面来设计与多肽具有相同形状、大小和电荷特征的合成分子。

抑制异常蛋白质折叠、蛋白质未折叠、蛋白质错折叠或蛋白质聚集的Intellipeptide或肽包括(但不限于)：Intellipeptide序列SLSPFYLRPPSFLRAPS、EKDRFSVNLDVKHFS、HGFISREFHRKYR、DPLTITSSLSSDGVLTVNGPRKQ和PERTIPITREEK。图6总结了Intellipeptide序列SLSPFYLRPPSFLRAPS、EKDRFSVNLDVKHFS、HGFISREFHRKYR、DPLTITSSLSSDGVLTVNGPRKQ和PERTIPITREEK的功能性变异体和拟肽。图7显示了从Intellipeptide序列SLSPFYLRPPSFLRAPS衍生的一系列肽的氨基酸序列。图8显示了从Intellipeptide序列EKDRFSVNLDVKHFS衍生的一系列肽的氨基酸序列。图9显示了从Intellipeptide序列HGFISREFHRKYR衍生的一系列肽的氨基酸序列。图10显示了从Intellipeptide序列DPLTITSSLSSDGVLTVNGPRKQ衍生的一系列肽的氨基酸序列。图11显示了从Intellipeptide序列PERTIPITREEK衍生的一系列肽的氨基酸序列。

模拟多肽组合物可以包括任意组合的非天然结构组分，一般来自三组结构：a)除天然的酰胺键(肽键)连接以外的残基连接基团；b)非天然的氨基酸残基取代天然存在的氨基酸残基；或c)诱导二级结构模拟物即诱导或稳定二级结构如β转角、γ转角、β折叠、α螺旋构象等的残基。例如，当多肽的全部或一些残基以化学手段而非天然肽键连接时，则它具有模拟物的特征。单个的拟肽残基可以通过肽键、其他化学键或联结方式相连接，如戊二醛、N-羟基琥珀酰亚胺酯、双功能马来酰亚胺、N，N′-二环己基碳二亚胺(DCC)或N，N′-二异丙基碳二亚胺(DIC)。可以替代传统酰胺键(肽键)的连接基团包括，例如：南五味子酮(如-C(＝O)-CH₂-取代-C(＝O)-NH-)、氨基甲烯基(CH₂-NH)、乙烯、烯烃(CH＝CH)、醚(CH₂-O)、硫醚(CH₂-S)、四唑(CN₄-)、三唑、反酰胺(retroamide)、硫酰胺或酯(参见，例如：Spatola(1983)in Chemistry and Biochemistry of Amino Acids，Peptides and Proteins，Vol.7，pp 267-357，″Peptide Backbone Modifications，″Marcell Dekker，NY)。

多肽还可以通过含有全部或一些取代天然存在的氨基酸残基的非天然氨基酸残基而具有模拟物的特征。非天然氨基酸残基在科学和专利文献中有适当的描述，下文描述了作为天然氨基酸残基模拟物的几个示例性非天然组合物以及一些指导原则。芳香族氨基酸的模拟物可以通过被下述基团所取代而产生：例如，D-或L-萘丙氨酸；D-或L-苯甘氨酸；D-或L-2噻吩丙氨酸；D-或L-1、-2，3-、或4-芘丙氨酸；D-或L-3噻吩丙氨酸；D-或L-(2-吡啶)-丙氨酸；D-或L-(3-吡啶)-丙氨酸；D-或L-(2-吡嗪)-丙氨酸；D-或L-(4-异丙基)-苯甘氨酸；D-(三氟甲基)-苯甘氨酸；D-(三氟甲基)-苯丙氨酸；D-对-氟-苯丙氨酸；D-或L-对-联苯苯丙氨酸；K-或L-对-甲氧基-联苯苯丙氨酸；D-或L-2-吲哚(烷基)丙氨酸；以及D-或L-烷基丙氨酸，其中烷基可以是经取代的或未经取代的甲基、乙基、丙基、己基、丁基、戊基、异丙基、异丁基、仲异基(sec-isotyl)、异戊基或非酸性氨基酸。非天然氨基酸的芳香环包括噻唑、噻吩、吡唑、苯并咪唑、萘、呋喃、吡咯和吡啶。

氨基酸模拟物的生成可以通过被下述基团所取代：例如，保持负电荷的非羧化氨基酸；(膦酰基)丙氨酸；硫酸化的苏氨酸。羧基侧链基团(如天冬氨酰基或谷氨酰基)也可以通过与碳化二亚胺(R′-N-C-N-R′)的反应而被选择性修饰，所述碳化二亚胺如1-环己基-3(2-吗啉-基-(4-乙基)碳化二亚胺或1-乙基-3(4-氮-4，4-二甲醇戊基)碳化二亚胺。天冬氨酰基或谷氨酰基还可以通过与铵离子的反应而被插入天冬酰胺和谷氨酰氨残基中。

除了赖氨酸和精氨酸外，还可以使用鸟氨酸、瓜氨酸或(`adioimmu)-乙酸或(`adioimmu)烷基乙酸取代来生成碱性氨基酸模拟物，其中所述烷基如上文所定义。腈衍生物(如CN-基团取代COOH)能够被取代为`adioimmuno或谷氨酰胺。天冬酰胺残基和谷氨酰胺残基可以被脱氨生成相应的天冬氨酰或谷氨酰残基。

精氨酸残基模拟物的生成可以通过将精氨酰基与一种或多种常规试剂反应，包括，例如苯乙二醛、2，3-丁二酮、1，2-环己烷二酮或茚三酮，优选在碱性条件下反应。酪氨酸残基模拟物的生成可以通过将酪氨酰基与芳香族重氮化合物或四硝基甲烷反应。N-乙酰咪唑(N-acetyl imidizol)和四硝基甲烷可以分别用来形成O-乙酰酪氨酰类和3-硝基衍生物。半胱氨酸残基模拟物的生成可以通过将半胱氨酸残基与例如α-卤代乙酸(如2-氯乙酸)或氯乙酰胺以及相应的胺类反应，来生成羧甲基或羧氨甲基衍生物。半胱氨酸残基模拟物的生成还可以通过将半胱氨酸残基与下述物质反应：例如，溴-三氟丙酮、α-溴-β-(5-咪唑)丙酸；氯乙酰磷酸、N-烷基马来酰亚胺、3-硝基-2-吡啶二硫化物；甲基2-吡啶二硫化物；对-氯汞苯甲酸；2-氯汞基-4硝基酚；或氯-7-硝基苯并-氧杂-1，3-二唑。赖氨酸模拟物的生成(以及氨基末端残基的改变)可以通过将赖氨酸残基与例如琥珀酸或其他羧酸酸酐反应。赖氨酸和其他含有α-氨基的残基模拟物还可以通过与亚氨酸酯的反应以及与乙醛酸的转酰胺基酶催化反应来生成，所述亚氨酸酯如甲基吡啶亚氨酸(methyl picolinimidate)、磷酸吡哆醛、吡哆醛、氯代硼氢化物、三硝基苯磺酸、邻-甲基异脲、2，4-戊二酮。蛋氨酸模拟物可以通过与蛋氨酸亚砜的反应来生成。`adioim模拟物包括，例如六氢哌啶羧酸、噻唑烷羧酸、3-或4-羟基`adioim、脱氢脯氨酸、3-或4-甲基脯氨酸或3，3-二甲基脯氨酸。组氨酸残基模拟物的生成可以通过将组氨酰基与二乙基焦碳酸酯或对-溴代苯甲酰甲基溴反应。其他模拟物包括由下述途径生成的模拟物：例如，`adioim和赖氨酸的羟基化；丝氨酸或苏氨酸残基的羟基的磷酸化；赖氨酸、精氨酸和组氨酸的α-氨基的甲基化；N末端氨基的乙酰化；主链酰胺残基的甲基化或者被N甲基氨基酸所取代；或C末端羧基的酰胺化。

本发明多肽的组分还可以被氨基酸(或拟肽残基)的手性对映体所取代。因此，任何天然存在的L构型氨基酸(还可以称为R或S构型，这取决于化学个体的结构)可以被手性对映体的化学结构相同的或拟肽的氨基酸(被称为D型氨基酸，但也可以被称为R或S型)所取代。

本发明还提供了与本发明示例性多肽“实质上相同”的多肽。“实质上相同”的氨基酸序列与参照序列之间的区别在于一个或多个保守性或非保守性氨基酸取代、缺失或插入，特别是发生在分子的非活性位点的取代，条件是多肽基本上保持其功能特性。保守性氨基酸取代，例如用一个氨基酸取代另一个同类氨基酸(例如，用一个疏水性氨基酸(如异亮氨酸、缬氨酸、亮氨酸或蛋氨酸)取代另一个疏水性氨基酸；或者用一个极性氨基酸取代另一个极性氨基酸，如精氨酸取代赖氨酸，谷氨酸取代门冬氨酸，或谷氨酰胺取代`adioimmuno)。一个或多个氨基酸可以缺失，例如，从本发明的具有分子伴侣活性的αB晶状体蛋白多肽中缺失，形成多肽的结构修饰，而没有显著改变其生物学活性。例如，可以缺失对αB晶状体蛋白的分子伴侣活性而言不需要的氨基或羧基末端或中间的氨基酸。

本领域技术人员会认可，可以使用多种操作和方法来合成掺入这些模拟物的各合成的残基和多肽，而这些操作和方法在科学和专利文献中有详细说明(如，Organic Syntheses Collective Volumes，Gilman，等人.(Eds)JohnWiley&Sons，Inc.，NY.)。还可以使用组合方法来合成本发明的肽和拟肽。用来生成肽和拟肽文库的各种技术是已知的，包括，例如多中心(multipin)、茶叶袋(teabag)和裂解-偶联-混合(split-couple-mix)技术(参见，例如：al-Obeidi，Mol.Biotechnol.9：205-223，1998；Hruby，Curr.Opin.Chem.Biol.1：114-119，1997；Ostergaard，Mol.Divers.3：17-27，1997；Ostresh，MethodsEnzymol.267：220-234，1996)。本发明的修饰肽还可以通过化学修饰法来生成(例如参见：Belousov，Nucleic Acids Res.25：3440-3444，1997；Frenkel，Free Radic.Biol.Med.19：373-380，1995；Blommers，Biochemistry 33：7886-7896，1994)。

本发明的肽和多肽还可以被合成并表达为连接有一个或多个其他结构域的融合蛋白，例如形成一种免疫原性较强的肽，目的是更容易分离重组合成的肽、识别并分离抗体和表达抗体的B细胞等。有助于检测和纯化的结构域包括：例如金属鳌合肽，如多组氨酸束和组氨酸-色氨酸组件，其允许于固定化的金属上的纯化；蛋白A结构域，其允许于固定化的免疫球蛋白上的纯化；FLAGS延伸/亲和纯化系统(Amgen Corp，Seattle，WA)中使用的结构域。在纯化结构域和包含基序的肽或多肽之间加入可切割的连接序列如凝血因子Xa或肠激酶(Invitrogen，San Diego，CA)来促进纯化。例如，表达载体可以包括编码表位的核酸序列，与6个组氨酸残基相连，随后有硫氧还蛋白和肠激酶切割位点(参见，例如：Williams，Biochemistry 34：1787-1797，1995；Dobeli，Protein Expr.Purif.12：404-14，1998)。组氨酸残基有助于检测和纯化，而肠激酶切割位点提供了从融合蛋白的其余部位纯化表位的方法。有关载体编码的融合蛋白及其应用的技术在科学和专利文献中有很好的描述(参见，例如：Kroll，DNA Cell.Biol，12：441-53，1993)。

本文使用的术语“分离的”指从物质从其初始环境(例如，如果是天然存在的则为天然环境)中被分离出来。例如，活体动物体内天然存在的多核苷酸或多肽不是“分离的”，而从天然体系中的一些或全部共存物质中分离出来的同样的多核苷酸或多肽是“分离的”。这些多核苷酸可以是载体的部分和/或这些多核苷酸或多肽可以是组合物的部分，但它们依然是“分离的”，因为这种载体或组合物不是其天然环境的部分。本文使用的分离的物质或组合物也可以是“纯化的”组合物，即，它并不要求绝对纯，而是一个相对的定义。从文库中获得的各核苷酸能够被常规纯化到电泳纯。另一方面，本发明提供了从基因组DNA或者从文库或其他环境中的其他序列中纯化的核酸，数量级至少为1、2、3、4、5或更高。

具有分子伴侣活性的Intellipeptide类似物、αB晶状体蛋白的多肽片断一般通过先导肽的化学修饰来设计和生成，先导肽例如本文描述的任意具体肽，如下述任意序列：i)EKDRFSVNLDVKHFS；ii)DPLTITSSLSSDGVLTVNGPRKQ；iii)LTITSSLSDGVLTVNGPRK；iv)STSLSPFYLRPPSFLRAP；v)SLSPFYLRPPSFLRAPS；vi)GPERTIPITREEK；vii)PERTIPITREEK；viii)HGKHEERQDE；ix)HGFISREFHRKYR；或者这些序列的功能性变异体或拟肽。提供了具有分子伴侣活性的αB晶状体蛋白的示例性多肽片断，如N-末端结构域多肽片断为₉WIRRPFFPFHSP₂₀或₄₃SLSPFYLRPPSFLRAP₅₈，α晶状体蛋白核心结构域多肽片断为₇₅FSVNLDVK₈₂(β3)、₁₁₃FISREFHR₁₂₀、₁₃₁LTITSSLS₁₃₈(β8)、₁₄₁GVLTVNGP₁₄₈(β9)、₇₃DRFSVNLDVKHFS₈₅或₁₃₁LTITSSLSDGV₁₄₁，C末端结构域多肽片断为₁₅₇RTIPITRE₁₆₄，或者是它们的功能性变异体。

术语“相同的”或“同一性”百分比在两个或多个核酸或多肽序列的上下文中，是指两个或多个序列或亚序列相同或者具有特定百分比的氨基酸残基或核苷酸相同(即，在比对窗口或指定区域内比较和比对最大一致性时，在特定区域(如编码本文所述抗体的核苷酸序列或本文所述抗体的氨基酸序列)约有60％的同一性，优选为65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的同一性)，检测使用了BLAST或BLAST 2.0序列比对算法，缺省参数下文有述，或者使用手工比对和目测。这些序列被称为“实质上相同的”。这一术语还指(或者能被应用于)测试序列的依从性。该术语还包括具有缺失和/或添加的序列以及具有取代的序列。如下文所述，优选的算法可以算入缺口等。优选地，同一性存在于长度至少约为25个氨基酸或核苷酸的区域内，或者更优选地存在于长度为50-100个氨基酸或核苷酸的区域内。

在序列比较中，通常一个序列作为参照序列，测试序列与之比较。当使用序列比对算法时，测试序列和参照序列被输入计算机，并指定序列运算程序参数，如果需要则要指定序列坐标。优选地，可以使用缺省程序参数，或者可以指定其他参数。然后，在程序参数的基础上，序列比对算法计算测试序列相对于参照序列的序列同一性百分比。

本文使用的“比对窗口”指下述任一连续位点的区段：20-60、通常约为50至约200、更通常约为100至约150，区段中的序列与具有相同数量连续位点的参照序列先经过最佳比对，然后进行比较。用于比较的序列比对方法是现有技术已知的。可以通过下述方法进行最佳序列比对，如：局部同一性算法(Smith&Waterman，Adv.Appl.Math.2：482，1981)；同一性比对算法(Needleman&Wunsch，J.Mol.Biol.48：443，1970)；寻求相似性方法(Pearson&Lipman，Proc.Nafl.Acad.Sci.USA 85：2444，1988)；这些算法的计算机实现(GAP，BESTFIT，FASTA，and TFASTA in the WisconsinGenetics Software Package，Genetics Computer Group，575 Science Dr.，Madison，WI)；或者人工比对和目测(参见，例如：Current Protocols inMolecular Biology，Ausubel等人.，eds.1995 supplement)。

寻求比对的程序是现有技术已知的，如BLAST等。例如，如果目标序列是人的，则这种氨基酸序列或基因序列(种系或重排的抗体序列)可以在任何合适的标准数据库中找到，如：Genbank，美国国立生物技术信息中心(NCBI)蛋白质数据库(http://ncbi.nlm.nih.gov/BLAST/)；VBASE，人类抗体基因数据库(http://www.mrc-cpe.cam.ac.uk/imt-doc)；Kabat，免疫球蛋白数据库(http://www.immuno.bme.nwu.edu)；或者它们的翻译产物。如果比对是基于核苷酸序列来进行的，那么应该分析所选择的基因来确定那些亚类基因中哪些基因具有与原始抗体最接近的氨基酸同一性。本发明考虑到那些与数据库中其他序列相比达到较高程度同一性的氨基酸序列或基因序列能够根据本文描述的程序而被利用或者操作。另外，当根据本文描述的程序进行操作或筛选时，如果那些具有较低同一性的氨基酸序列或基因编码的产物对预定靶抗原具有特异性，那么它们能够被利用。在某些实施方案中，可接受的同一性范围高于约50％。应该理解，目标种系可以不是人类。

适合用来测定序列同一性或相似性百分比的优选的算法实例为BLAST和BLAST 2.0算法，分别在下述文献中有所描述：Altschul等人，Nuc.Acids Res.25：3389-3402，1977和Altschul等人，J.Mol.Biol.215：403-410，1990。采用本文描述的参数，使用BLAST和BLAST 2.0来测定本发明的核苷酸和蛋白质的序列同一性百分比。进行BLAST分析的软件可以通过国立生物技术信息中心(http://www.ncbi.nlm.nih.gov/)公开获得。这种算法涉及首先通过在查询序列中识别长度W的短代码来识别高得分序列对(HSP)，当所述短代码与数据库序列中相同长度的代码比对时，符合或满足一些取正值的阈值分数T。T指相邻代码的分数阈值。这些初始的邻近代码采样数作为种子来启动检索，以发现较长的含有这些代码的HSP。代码采样数沿每个序列向两个方向延伸，至累积的比对分数被增加。对于核苷酸序列，累积分数的计算使用参数M(对每对匹配残基的加分，始终＞0)和N(对错配残基的罚分，始终＜0)。对于氨基酸序列，使用评分矩阵来计算累积分数。在下述情况下，代码采样数在每个方向的延伸被停止：累积比对分数从达到的最大值下降了X；由于一个或多个负得分残基比对的累积，累积分数达到0或以下；或到达任一序列的末端。BLAST算法参数W、T和X决定了比对的灵敏度和速度。对于核苷酸序列，BLASTN程序使用的缺省参数值代码长度(W)为11，期望值(E)为10，M＝5，N＝-4，双链比对。对于氨基酸序列，BLASTN程序使用的缺省参数值代码长度(W)为3，预期(E)为10；BLOSUM62得分矩阵(参见：Henikoff&Henikoff，Proc.Natl.Acad.Sci.USA 89：10915，1989)比对(B)为50，期望值(E)为10，M＝5，N＝-4，双链比对。

在本文可互换使用的“多肽”、“肽”和“蛋白质”指氨基酸残基的聚合体。这些术语应用于氨基酸聚合体，其中一个或多个氨基酸残基是相应的天然存在的氨基酸的人工化学模拟物，这些术语还应用于天然存在的氨基酸聚合体和非天然存在的氨基酸聚合体。“多肽”和“蛋白质”还指通过肽键或修饰的肽键(即肽同电子排列体)相互连接的氨基酸，可以含有除20个基因编码氨基酸以外的经修饰的氨基酸。术语“多肽”还包括肽和多肽片断、基序等。该术语还包括糖基化的多肽。本发明的肽和多肽还包括如下文进一步详述的所有“模拟物”和“拟肽”形式。

“氨基酸”或多肽的“功能性变异体或模拟物”指天然存在的及合成的氨基酸，以及以类似天然存在的氨基酸的方式行使功能的氨基酸类似物和氨基酸模拟物。天然存在的氨基酸是由遗传密码所编码的氨基酸以及经过后修饰的氨基酸，如羟脯氨酸、γ-羧基谷氨酸和O-磷酸丝氨酸。氨基酸类似物指与天然存在的氨基酸具有相同的基本化学结构(即：与氢相连的α碳原子、羧基、氨基和R基团)的化合物，如高丝氨酸、原亮氨酸、蛋氨酸亚砜、锍甲基蛋氨酸。这些类似物具有修饰的R基团(如原亮氨酸)或修饰的肽骨架，但保留了与天然存在的氨基酸相同的基本化学结构。氨基酸模拟物指结构上不同于氨基酸的一般化学结构的化合物，但行使功能的方式与天然存在的氨基酸类似。

本文中，氨基酸可以通过公知的三字母符号或者通过IUPAC-IUB生物化学命名委员会推荐的单字母符号表示。同样，核苷酸可以通过普遍接受的单字母符号来表示。

“保守修饰的变异体”或“变异体”既指氨基酸序列也指核苷酸序列。就特定核酸序列而言，保守修饰的变异体指那些编码相同或基本相同的氨基酸序列的核苷酸，或者当核酸没有编码氨基酸序列时，指基本相同的核酸序列。由于遗传密码的简并性，许多功能上相同的核酸编码某一给定的蛋白质。例如，密码子GCA、GCC、GCG和GCU都编码丙氨酸。因此，在每一编码丙氨酸的密码子的位置，都可以改变为所述任何相应的密码子，而不改变所编码的多肽。这种核苷酸变异是“沉默变异”，是一种保守修饰的变异。本文描述的编码多肽的每一个核苷酸序列还描述了每一个可能的核苷酸沉默变异。本领域技术人员会理解，核酸中的每个密码子(除了AUG和TGG，常规上，AUG是蛋氨酸的唯一密码子，TGG是色氨酸的唯一密码子)都能被修饰而生成一种功能上相同的分子。因此，编码多肽的核酸的每个沉默变异隐含在表达产物来的每个所述序列中，但未隐含在实际的探针序列中。

对于氨基酸序列，本领域技术人员能理解，对核酸、肽、多肽或蛋白质序列的各取代、缺失或添加(即在所编码的序列中改变、添加或缺失了单个氨基酸或少量氨基酸)是“保守修饰的变异体”，其中，这些变化使氨基酸被化学上类似的氨基酸所取代。提供了功能相似氨基酸的保守性取代表是现有技术已知的。这类保守修饰的变异体不排除本发明的多态变异体、种间类似物和等位基因。

下述8组氨基酸，每组内的氨基酸相互间可以保守性取代：1)丙氨酸(A)，甘氨酸(G)；2)门冬氨酸(D)，谷氨酸(E)；3)门冬酰胺(N)，谷氨酰胺(Q)；4)精氨酸(R)，赖氨酸(K)；5)异亮氨酸(I)，亮氨酸(L)，蛋氨酸(M)，缬氨酸(V)；6)苯丙氨酸(F)，酪氨酸(Y)，色氨酸(W)；7)丝氨酸(S)，苏氨酸(T)；8)半胱氨酸(C)，蛋氨酸(M)(参见，例如：Creighton，Proteins，1984)。

如多肽结构的大分子结构可以根据各种组织层次来进行描述。有关该组织的一般论述，参见，例如：Alberts等人，Molecular Biology of the Cell(3rded.，1994)；Cantor和Schimmel，Biophysical Chemistry Part I：TheConformation ofBiological Macromolecules，1980。“一级结构”指特定肽的氨基酸序列。“二级结构”指多肽内的局部有序的三维结构。这些结构已知为结构域，如酶结构域、细胞外结构域、跨膜结构域、膜孔结构域以及胞质尾区结构域。结构域是形成紧密单元多肽的组成部分，一般有15-350个氨基酸。示例性结构域包括具有酶活性的结构域，如激酶结构域。典型的结构域由较少组织的部分构成，如β-折叠和α-螺旋的伸展。“三级结构”指多肽单体的完整三维结构。“四级结构”指独立的三级结构单元以非共价结合的方式形成的三维结构。各向异性已知为能量术语。

具体的核酸序列还隐含“剪接变异体”。同样，由一种核苷酸编码的具体蛋白质隐含由该核酸的剪接变异体所编码的任何蛋白质。“剪接变异体”如名字所示，是指基因的可选剪接产物。转录后，初始核酸转录子可以被剪接，致使不同的(替换的)核酸剪接产物编码不同的多肽。剪接变异体的生成机制有所不同，但都包括外显子的可选剪接。“剪接变异体”还包括从同一核酸通读转录衍生而来的可选多肽。该术语包括剪接反应的任何产物，包括剪接产物的重组形式。

这些基因的多肽以及基因产物的功能性变异体在本发明中是有用的。“功能性变异体”分别指具有核苷酸序列或氨基酸序列的核酸或蛋白质，和参照序列是“相同的”、“基本相同的”、“实质相同的”、“同源的”或“相似的”(如下所述)，通过非限制性举例，所述参照序列可以是分离的核酸或蛋白质序列，或者通过比对两个或多个相关核酸或蛋白质或者给定的核酸或蛋白质的一组亚型而得到的共有序列。亚型的非限制性举例包括：来自例如可选的RNA剪接或溶蛋白性裂解的分子量不同的亚型；具有不同翻译后修饰(如糖基化)的亚型；等等。

经过比对，如果两个序列完全相同，没有缺口、取代、插入或缺失等，则这两个序列被称为是“相同的”。

如果符合下述标准，则两个序列被称为是“基本相同的”：经过比对，两个序列之间精确相同，没有缺口、插入或缺失，而只有保守性氨基酸取代。保守性的氨基酸取代如表3所示。

表3：保守性氨基酸取代

氨基酸侧链类型	相互间为保守性取代的氨基酸组
氨基酸侧链类型	相互间为保守性取代的氨基酸组	短侧链	甘氨酸、丙氨酸、丝氨酸、苏氨酸和蛋氨酸
疏水性	亮氨酸、异亮氨酸和缬氨酸	短侧链	甘氨酸、丙氨酸、丝氨酸、苏氨酸和蛋氨酸
疏水性	亮氨酸、异亮氨酸和缬氨酸	极性	谷氨酰胺和门冬酰胺
酸性	谷氨酸和门冬氨酸	极性	谷氨酰胺和门冬酰胺
酸性	谷氨酸和门冬氨酸	碱性	精氨酸、赖氨酸和组氨酸
芳香族	苯丙氨酸、色氨酸和酪氨酸	碱性	精氨酸、赖氨酸和组氨酸

如果两个核苷酸序列编码相同的或基本相同的氨基酸序列，则这两个核苷酸序列是“基本相同的”。现有技术已知，由于遗传密码的性质，一些氨基酸由几个不同的密码子编码，因此，这些密码子可以相互替换而不改变氨基酸序列中相应位置的氨基酸。在遗传密码中，TTA、TTG、CTT、CTC、CTA和CTG编码Leu；AGA、AGG、CGT、CGC、CGA和CGG编码Arg；GCT、GCC、GCA和GCG编码Ala；GGT、GGC、GGA和GGG编码Gly；ACT、ACC、ACA和ACG编码Thr；GTT、GTC、GTA和GTG编码Val；TCT、TCC、TCA和TCG编码Ser；CCT、CCC、CCA和CCG编码Pro；ATA、ATC和ATA编码Ile；GAA和GAG编码Glu；CAA和CAG编码Gln；GAT和GAC编码Asp；AAT和AAC编码Asn；AGT和AGC编码Ser；TAT和TAC编码Tyr；TGT和TGC编码Cys；AAA和AAG编码Lys；CAT和CAC编码His；TTT和TTC编码Phe；TGG编码Trp；ATG编码Met；TGA、TAA和TAG是翻译终止密码子。

经过比对，如果两个序列为下述情况，则这两个序列是“实质上相同的”：(i)两个序列之间的氨基酸残基同一性小于30％，优选＜20％，更优选＜15％，最优选＜10％；(ii)长度最短的比对序列中发生缺口、插入、缺失和/或取代的氨基酸残基数目＜10％更优选＜5％更优选＜3％最优选＜1％。

符合下述任一标准的两个序列被称为“同源的”。术语“同源”包括(不限于)直系同源(ortholog，因共有相同的祖先而具有遗传相似性，其编码的蛋白质在不同种系中具有相同的功能)和旁系同源(paralog，类似于直系同源，但其基因和蛋白质相似性是基因复制的结果)。

核苷酸序列同源的一个指标为两个核酸分子能否在严紧条件下杂交。严紧条件具有序列依赖性，并随不同情况而有所不同。通常，选择的严紧条件大约比特定序列在规定的离子强度和pH下的热熔点(T_m)低5℃。T_m是(在规定离子强度和pH下)50％的靶序列与完全匹配的探针杂交时的温度。典型的严紧条件为：盐浓度约0.02M，pH7，温度至少约为60℃。

能够确定两个序列是否同源的另外一个途径是使用适当的算法来确定是否符合上述对“实质上相同的序列”的标准。两个或多个多聚核苷酸或多肽的序列比较一般使用下述算法进行，如：局部同源性算法(Smith&Waterman，Adv.Appl.Math.2：482，1981)；同源性比对算法(Needleman&Wunsch，J.Mol.Biol.48：443，1970)；寻求相似性方法(Pearson&Lipman，Proc.Nafl.Acad.Sci.USA 85：2444，1988)；这些算法的计算机实现(GAP，BESTFIT，FASTA，and TFASTA in the Wisconsin Genetics Software Package，version 10.2Genetics Computer Group(GCG)，575Science Dr.，Madison，Wis.)；BLASTP、BLASTN和FASTA(Altschul等人，J.Mol.Biol.215：403-410，1990)；或者通过目测。

使用局部同一性算法(Smith&Waterman，Adv.Appl.Math.2：482-4891981)，通过插入缺口来使配对数目最大化，而发现最佳比对。“缺口”使用Needleman&Wunsch，J.Mol.Biol.48：443，1970的算法来找到增加配对数并减少缺口数目的两个完整序列的比对。在这类算法中，对于每个缺口使用约3.0至约20的罚分，对于终点缺口不使用罚分。

同源性蛋白质还包括蛋白质的直系同源簇(COGs)，它们产生于全基因组所编码的蛋白质的种系发生分类。至今，通过比较43个全基因组(代表了30个主要的种系发生谱系)所编码的蛋白序列，已经绘出了COGs。每个COG由各蛋白质或来自至少3个谱系的旁系同源簇组成，因此对应于一个祖先的保守结构域(参见：Tatusov等人，Science，278：631-637，1997；Tatusov等人，Nucleic Acids Res.29：22-28，2001；Chervitz等人，Science 282：2022-2028，1998；http://www.ncbi.nlm.nih.gov/COG/)。

两个序列整体上可以是相互相同的、基本相同的、实质上相同的或者同源的；或者这些序列的部分与其他序列类似长度的序列可以是相同的或实质上相同的。不论哪种情况，这些序列之间都是相似的。典型地，相似序列内的相同或基本相同的序列长度＞12个残基，优选＞24个残基，更优选＞48个残基，最优选＞96个残基。

多肽及其功能性变异体

“多肽”包括蛋白质、融合蛋白、寡肽和多肽衍生物，除了拟肽在本文被认为是小分子。尽管抗体及其衍生物也是多肽，但将在单独的章节进行描述。虽然抗体及抗体衍生物在单独的章节进行描述，但根据本发明目的，抗体和抗体衍生物被视为多肽及衍生物的亚类。

“蛋白质”是具有氨基酸序列的分子，其中氨基酸以肽键彼此连接成线性分子。术语“蛋白质”指从天然来源物分离的多肽，或者是利用重组DNA技术由分离的cDNA生成的多肽，具有的氨基酸序列长度至少为约200个氨基酸。

“融合蛋白”是一种重组蛋白质，其氨基酸序列来源于两种或更多种常规分离的多肽的氨基酸序列。

“蛋白质片断”指较大的多肽的蛋白质水解片断，所述较大的多肽可以是蛋白质或融合蛋白。蛋白质水解片断可以通过较大多肽在体内或体外的蛋白质水解性裂解而制备，一般很大而难以通过化学合成来制备。蛋白质水解片断的氨基酸序列长度为约200至约1000个氨基酸。

“寡肽”是具有短氨基酸序列(即，为2至约200个氨基酸)的多肽。寡肽一般通过化学合成来制备。

虽然寡肽和蛋白质片断的制备可以采用其他方式，但可以使用重组DNA技术和/或体外生化处理。例如，可以制备编码氨基酸序列的核酸，然后以其作为模板进行体外转录/翻译反应。在这一反应中，将编码预选多肽的外源性核酸引入混合物中，混合物基本不含其他外源性核酸，而含有转录和翻译所需的全部细胞组分。在加入外源性DNA之前或与之一起加入一种或多种放射性标记的氨基酸，然后进行转录和翻译。因为反应混合物中唯一的核酸是被加入反应的外源性核酸，所以只生成其编码的多肽，且其中掺入了放射性标记的氨基酸。在该方法中，由预选外源性核酸编码的多肽具有放射性标记。尽管反应混合物中含有其他蛋白质，但预选的多肽是唯一的在存在放射性氨基酸条件下生成的多肽，因此是唯一被标记的多肽。

如下文详细解释的，“多肽衍射物”包括(但不限于)多肽变异体、化学修饰的多肽和拟肽。

本发明的多肽，包括类似物和其他修饰变体，通常可以通过已知技术来制备。优选地，本发明多肽的合成可以根据固相合成法。例如，固相合成法及其许多改良方法都很好理解，并且是用于多肽制备的常用方法。(参见：Merrifield，J.Am.Chem.Soc，85：2149，1964；Stewart和Young，SolidPhase polypeptide Synthesis，Pierce Chemical Company，Rockford，111.，1984；Bodansky和Bodanszky，The Practice of polypeptide Synthesis，Springer-Verlag，New York，1984；Atherton和Sheppard，Solid Phase polypeptideSynthesis：A Practical Approach，IRL Press，New York，1989)。还可以参考下述实施例1中描述的具体方法。

或者，可以使用编码多肽的多核苷酸序列在重组系统中制备本发明的多肽。例如，一般使用重组DNA技术制备融合蛋白。

功能性多肽变体。根据定义，多肽的“变异体”或“功能性变异体”为不是多肽的化合物，即它含有至少一个非肽键的化学连接键。因此，多肽衍生物包括(但不限于)经过天然的翻译后修饰(如糖基化)的蛋白质。可以理解，本发明多肽可以在同一多肽中含有多个下述修饰。优选的多肽衍生物保留所需的性质，所述性质可以是生物学活性；更优选地，多肽衍生物在一个或多个所需性质上有所提高，或者具有亲本多肽不具备的一个或多个所需性质。尽管本部分描述了拟肽，但拟肽在本文中被视为小分子。

所含有的氨基酸序列与天然来源的蛋白质中发现的氨基酸序列相同的多肽是“野生型”多肽。多肽的功能性变异体可以通过化学合成来制备，包括(但不限于)组合合成。

通过改变编码多肽的核苷酸序列，可以使用DNA重组技术来制备比寡肽大的多肽的功能性变异体。尽管有些核苷酸序列的变化不会改变所编码的多肽的氨基酸序列(沉默突变)，但有许多核苷酸序列的变化会导致多肽的氨基酸序列相对于亲本序列有所改变。这种改变的氨基酸序列可以包括氨基酸的取代、缺失和添加，条件是这些氨基酸是天然存在的氨基酸。

因此，对编码多肽的核苷酸进行诱变的技术可以用来制备多肽的功能性变异体，特别是制备具有氨基酸取代但没有缺失或插入的多肽的功能性变异体。已知有多种诱变技术能够在体外或体内使用，包括(但不限于)化学诱变和PCR介导的诱变作用。这类诱变作用的目标可以是随机的(即，突变可以发生在核酸中的任意位点)或者是定向于核酸中编码特定氨基酸序列的一个部分。利用这类技术，可以制备随机的、组合的或集中的化合物文库、库池及其混合物。

含有天然存在的氨基酸缺失或插入的多肽可以是通过氨基酸序列的化学合成所产生的合成寡肽，所述氨基酸序列基于亲本多肽的氨基酸序列，但与之相比，具有一个或多个插入或缺失的氨基酸。具有较长氨基酸序列的多肽中的氨基酸残基的插入和缺失可以通过定向诱变来实现。

经化学修饰的多肽。本发明所关注的“多肽”包括那些相对于另一多肽具有一个或多个化学修饰的多肽，即经化学修饰的多肽。化学修饰之前的多肽可以是：野生型蛋白质、功能性变异体蛋白或功能性变异体多肽、或者它们的多肽片断；本发明的抗体或其他多肽配体，包括(但不限于)单链抗体、晶状体蛋白和它们的多肽衍生物；或根据本文公开内容制备的多肽配体。优选地，化学修饰作用赋予或改善了多肽的所需性质，但没有实质上改变或损害多肽的生物学活性。所需性质包括(但不限于)：延长的贮存期限；提高的血浆或其他体内稳定性；对蛋白酶的抵抗性等。这类修饰包括(但不限于)N末端乙酰化、糖基化和生物素酰化。

带有N末端或C末端化学基团的多肽。赋予对作用于多肽的N末端或C末端残基的肽酶的抵抗性的有效方法是在多肽末端加入化学基团以使修饰后的多肽不再是肽酶的底物。一种这样的化学修饰为在多肽的一个或两个末端进行糖基化。某些化学修饰，特别是N末端糖基化，已经表现出能提高人血浆中多肽的稳定性(Powell等，Pharma.Res.10：1268-1273，1993)。提高血浆稳定性的其他化学修饰包括(但不限于)：加入N末端烷基，包括碳原子数为1-20的低烷基，如乙酰基；和/或加入C末端酰胺或取代的酰胺基。

带有末端D型氨基酸的多肽。N末端D型氨基酸的存在提高了含有L型氨基酸的多肽的血浆稳定性，因为作用于N末端残基的肽链端解酶不能利用D型氨基酸作为底物。同样，C末端D型氨基酸的存在也稳定了多肽，因为作用于C末端残基的肽链端解酶不能利用D型氨基酸作为底物。除了这些末端修饰以外，带有N末端和/或C末端D型氨基酸的多肽的氨基酸序列通常与含有L型氨基酸的亲本多肽的氨基酸序列相同。

天然氨基酸被非天然氨基酸取代的多肽。多肽序列中的天然氨基酸被非天然氨基酸所取代能够赋予或提高包括生物学活性在内的一些所需性质。这种取代能够例如赋予针对作用于N末端的肽链端解酶的蛋白质水解作用的抵抗性。带有非天然氨基酸的多肽的合成是常规的并且是现有技术已知的(参见，例如：Coller，等人.1993，引用如上)。

翻译后化学修饰。不同的宿主细胞会具有不同的翻译后修饰机制，如果融合蛋白中存在需要这种修饰的氨基酸序列，这些机制可以提供特定类型的融合蛋白翻译后修饰。现有技术已经公开了多种(约100种)翻译后修饰，其中几种在本文有所讨论。本领域技术人员将能够选择合适的宿主细胞，并设计编码含有特定类型修饰所需的氨基酸序列的蛋白质成员的嵌合基因。

糖基化是一种发生在许多真核系统中的翻译后化学修饰类型，可以影响蛋白质的活性、稳定性、遗传药理、免疫原性和/或抗原性。但是，在糖基化位点必须存在特定的氨基酸来招募合适的糖基化结构，并非所有的宿主细胞都具有合适的分子结构。酿酒酵母(Saccharomyces cerevisieae)和毕赤巴斯德酵母(Pichia pastoris)提供了糖基化蛋白的生成，利用昆虫细胞的表达系统也提供了糖基化蛋白的生成，但糖基化的模式可以随着用来生成融合蛋白的宿主细胞而不同。

另外一种翻译后修饰是一个或多个Ser、Thr或Tyr残基的侧链自由羟基的磷酸化，这类反应由蛋白激酶催化。磷酸化常常因蛋白磷酸酶的作用而是可逆的，因为蛋白磷酸酶催化氨基酸残基的脱磷酸作用。

氨基末端残基在化学结构上的差异缘于不同的宿主细胞，每种宿主细胞具有不同化学模式的由起始密码子编码的蛋氨酸残基，这将导致具有不同化学修饰的氨基末端。

例如，许多或大多数细菌蛋白的合成中使用的氨基末端氨基酸是经修饰的蛋氨酸，即N-甲酰基-蛋氨酸(fMet)。尽管经常说所有的细菌蛋白的合成使用fMet起始氨基酸，尽管这可能对大肠杆菌(E.coli)来说是正确的，但近期的研究表明，这种说法在其他细菌(如绿脓假单胞菌，Pseudomonas aeruginosa)中是不正确的(Newton等人，J.Biol.Chem.274：22143-22146，1999)。无论怎样，在大肠杆菌中，fMet的甲酰基通常在翻译后被酶解去除，来生成氨基末端蛋氨酸残基，但有时要去除整个fMet残基(参见：Hershey，Chapter 40，″Protein Synthesis″in：Escherichia Coli andSalmonella Typhimurium：Cellular and Molecular Biology，Neidhardt，Frederick C，Editor in Chief，American Society for Microbiology，Washington，D.C.，1987，Volume 1，pages 613-647，and references cited therein.)。缺乏催化所述翻译后修饰的酶(如甲酰基酶)的大肠杆菌突变株将生成具有氨基末端fMet残基的蛋白质(Guillon等人，J.Bacteriol.174：4294-4301，1992)。

在真核生物中，起始蛋氨酸残基或次末端残基(如果起始蛋氨酸已经被去除)的乙酰化一般发生在翻译的同时或之后。乙酰化反应由N末端乙酰转移酶(NAT，a.k.a.N-α-乙酰转移酶)催化，而起始蛋氨酸残基的去除由蛋氨酸氨基肽酶催化(参见综述：Bradshaw等人，Trends Biochem.Sci.23：263-267，1998；Driessen等人，CRC Crit.Rev.Biochem.18：281-325，1985)。氨基末端乙酰化的蛋白质被称为“N乙酰化的”、“N-α乙酰化的”或简单称为“乙酰化的”。

发生在真核生物中的另一个翻译后修饰过程为羧基末端的α-酰胺化(参见综述：Eipper等人，Annu.Rev.Physiol.50：333-344，1988；Bradbury等人，Lung Cancer 14：239-251，1996.)。约50％已知的内分泌和神经内分泌的肽类激素是α-酰胺化的(Treston等人，Cell Growth Differ.4：911-920，1993)。大多数情况下，需要羧基α-酰胺化来激活这些肽类激素。

多肽模拟物

通常，多肽模拟物(拟肽)是模拟多肽生物学活性的分子，但在化学本质上不再是肽类。按照严格的定义，拟肽是不含肽键(即氨基酸之间的酰胺键)的分子。然而，术语“拟肽”有时也用来描述本质上不再完全是肽类的分子，如假肽、半肽和类肽。一些广义上的拟肽(此时，多肽的部分被缺乏肽键的结构所取代)的例子如下文所述。不论是完全非肽还是部分非肽，本发明的拟肽提供了作为拟肽基础的反应性化学基团的空间排列，这种排列接近类似于多肽中活性基团的三维组合。由于这种相似活性位点的几何学特征，拟肽对生物系统的作用类似于多肽的生物学活性。

使用给定多肽的模拟物比使用多肽本身具有几个潜在的优点。例如，多肽可能表现出非所需的性质，即，低的生物利用度和短的作用持续时间。拟肽通常很小，足以口服有效并具有长的作用持续时间。多肽还存在与稳定性、贮存和免疫反应性有关的问题，而拟肽则没有这些问题。

具有所需的生物学活性的候选多肽、主导多肽及其他多肽能够被用于开发具有类似生物学活性的拟肽。从多肽开发拟肽的技术是已知的。肽键可以被非肽键取代，这种非肽键使拟肽具有与原始多肽类似的结构，因此有类似的生物学活性。进一步的修饰还可以用结构类似的其他化学基团来取代氨基酸的化学基团。可以通过NMR光谱、结晶和/或计算机辅助分子模拟测定原始多肽的自由的或与配体结合的三级结构来辅助开发拟肽。这些技术帮助开发比原始多肽具有更高的效价和/或生物利用度和/或稳定性的新型组合物(Dean，BioEssays，16：683-687，1994；Cohen和Shatzmiller，J.Mol.Graph.，11：166-173，1993；Wiley和Rich，Med.Res.Rev.，13：327-384，1993；Moore，Trends Pharmacol.ScL，15：124-129，1994；Hruby，Biopolymers，33：1073-1082，1993；Bugg等人，ScL Am.，269：92-98，1993，全部以引用方式并入本文)。

因此，通过使用上述方法，本发明提供了与上述多肽相比具有提高的治疗活性的化合物。本发明包括通过上述方法获得的拟肽化合物，其具有上述多肽的生物学活性和类似的立体结构。拟肽可以从之前章节描述的任意经修饰的多肽生成，或者从具有之前章节描述的多种修饰的多肽生成，这对于本领域技术人员来说是显而易见的。本发明的拟肽除了作为治疗性化合物的应用外，还可以用来开发更有效的非肽类化合物，这对本领域技术人员来说也是显而易见的。

从之前章节描述的多肽衍生而来的拟肽的具体实例在下文提供。这些实例是说明性的，而不是对其他或另外的修饰的限制。

具有还原的电子等排假肽键的肽。蛋白酶作用于肽键。因此，假肽键对肽键的取代赋予了对蛋白水解的抵抗性。许多一般不影响多肽结构和生物学活性的假肽键已经被公开。还原的电子等排假肽键是一种的合适的假肽键，该假肽键可提高对酶切的稳定性，并没有或有很少的生物学活性丧失(Couder等人，Int.J.Polypeptide Protein Res.41：181-184，1993，以引用方式并入本文)。因此，除了一个或多个肽键被取代为电子等排假肽键外，这些化合物的氨基酸序列可以与它们的L型氨基酸亲本多肽的序列相同。优选地，大部分N末端肽键被取代，因为这种取代会赋予对作用于N末端的肽链端解酶的蛋白质水解的抵抗性。

带有反向(Retro-Inverso)假肽键的肽。为赋予对蛋白质水解的抵抗性，还可以使用反向假肽键来取代肽键(Dalpozzo等人，Int.J.PolypeptideProtein Res.41：561-566，以引用方式并入本文)。根据这一修饰，除了一个或多个肽键被取代为反向假肽键外，这些化合物的氨基酸序列可以与它们的L型氨基酸亲本多肽序列相同。优选地，大部分N末端肽键被取代，因为这种取代会赋予对作用于N末端的肽链端解酶的蛋白质水解的抵抗性。

类肽衍生物。多肽的类肽衍生物代表另一种形式的修饰多肽，其保留了对于生物学活性重要的结构决定子，而清除了肽键，从而赋予对蛋白质水解的抵抗性(Simon等人，Proc.Natl.Acad.Sci.USA，89：9367-9371，1992，以引用方式并入本文)。类肽是N-取代的甘氨酸的寡聚物。已经公开了许多N-烷基，每一个都对应于天然氨基酸的侧链。

组合蛋白质设计

变异体一般表现出同样性质的生物学活性，但是如果需要，分子伴侣活性可以与原始的候选变异体蛋白不同。或者，可以设计变异体，以使候选变异体蛋白的生物学活性改变。例如，糖基化位点可以被改变或去除。同样，生物学功能可以被改变。

另外，在一些实施方案中，期望拥有分子伴侣活性改变的候选变异体蛋白，这种蛋白会结合靶蛋白。优选地，期望拥有具有氧化稳定性、碱稳定性和热稳定性的蛋白质。

氧稳定性的变化通过下述得到证明：当暴露于多种氧化条件时，变异体蛋白的活性与野生型蛋白相比有至少约20％的增加，更优选为至少约50％的增加。通过已知方法来检测氧化稳定性。

碱稳定性的变化通过下述得到证明：当暴露于升高或降低的pH条件时，变异体蛋白的活性半衰期与野生型蛋白相比有至少约5％或更大的增加或减少(优选为增加)。通常，使用已知方法来检测碱稳定性。

热稳定性的变化通过下述得到证明：当暴露于相对高的温度和中性pH条件时，变异体蛋白的活性半衰期与野生型蛋白相比有至少约5％或更大的增加或减少(优选为增加)。通常，使用已知方法来检测热稳定性。

本发明的候选变异体蛋白和核酸可以通过许多方式制备。各核酸和蛋白质可以通过现有技术已知的及下文所列的方法制备。或者，可以制备候选变异体蛋白文库，用于检测。

在一个优选实施方案中，候选变异体蛋白文库产生于概率分布表。如本文所列出的，有多种生成概率分布表的方法，包括使用PDATM技术、序列比对、力场计算(如自洽平均场(SCMF)计算)。另外，概率分布可以用来为每个位置生成信息熵值，作为文库中观察到的突变频率的一个量度。

在该实施方案中，确定了每个氨基酸残基在表中每个可变位置的频率。可以为频率设定阈值，其中，任何低于界值的变异体频率被设定为零。该界值优选为约1％、2％、5％、10％或20％，特别优选为约10％。然后，将这些频率建成候选变异体蛋白的文库。即，如上文所述，收集这些可变位置并生成所有可能的组合，但根据频率来利用那些“填充”候选变异体蛋白文库的氨基酸残基。因此，在一个不基于频率的候选变异体蛋白文库中，有5种可能残基的可变位置上将有20％的蛋白质包含具有第一种可能的残基的可变位置，20％的蛋白质包含具有第二种可能的残基的可变位置，依次类推。然而，在一个基于频率的候选可变蛋白文库中，有5个可能残基的可变位置上5个可能残基的频率分别为10％、15％、25％、30％和20％，则该位置将有10％的蛋白质包含具有第一种可能的残基的可变位置，15％的蛋白质包含具有第二种可能的残基的可变位置，25％的蛋白质包含具有第三种可能的残基的可变位置，依次类推。本领域技术人员会理解，实际频率可能取决于用来实际生成蛋白质的方法；例如，实际频率可能是蛋白质合成时的频率。但是，当使用下文所述的基于频率的引物系统时，每个位置的实际频率将会改变，如下文所述。

本领域技术人员会理解，本文所列的概率分布表能够以多种方式生成。除了本文所列的方法外，可以使用自洽平均场(SCMF)方法来直接生成概率分布表。SCMF是一种确定性计算方法，利用旋转异构体相互作用的平均场描述来计算能量。以这种方式生成的概率表能够用来构建本文公开的候选变异体蛋白文库。可以三种方式使用SCMF：在每个位置上为每个氨基酸列出氨基酸和旋转异构体的频率；从SCMF直接确定概率(参见Delarue等人，Pac.Symp.Biocomput.109-21，1997，以引用方式并入本文)。另外，可以确定高度可变位置和不可变位置。或者，使用另外一种方法来确定在检索序列空间过程中哪个序列跃迁；使用SCMF来获得该序列的准确能量；然后用该能量对该序列评级并产生一个序列等级列表(类似于Monte Carlo序列列表)。然后，可以根据该列表计算显示每个位置上氨基酸频率的概率表(Koehl等人，J.Mol.Biol.239：249，1994；Koehl等人，Nat.Struc.Biol.2：163，1995；Koehl等人，Curr.Opin.Struct.Biol.6：222，1996；Koehl等人，J.Mol.Bio.293：1183，1999；Koehl等人，J.Mol.Biol.293：1161，1999；Lee，J.Mol.Biol.236：918，1994；VasquezBiopolymers 36：53-70，1995；全部以引用方式并入本文)。类似方法包括(但不限于)OPLS-AA(Jorgensen等人，J.Am.Chem.Soc，118：11225-11236，1996；Jorgensen，W.L；BOSS，Version 4.1；Yale University：New Haven，Conn.，1999)、OPLS(Jorgensen等人，J.Am.Chem.Soc，110：1657ff，1988；Jorgensen等人，J Am.Chem.Soc.112：4768ff，1990)、UNRES(联合残基力场；Liwo等人，Protein Science，2：1697-1714，1993；Liwo等人，Protein Science，2：1715-1731，1993；Liwo等人，J.Comp.Chem.18：849-873，1997；Liwo等人，J.Comp.Chem.，18：874-884，1997；Liwo等人，J.Comp.Chem.19：259-276，1998)、蛋白质结构预测的力场(Liwo等人，Proc.Natl.Acad.ScL USA，96：5482-5485，1999)、ECEPP/3(Liwo等人，J Protein Chem 13(4)：375-80，1994)、AMBER 1.1力场(Weiner等人，J.Am.Chem.Soc.106：765-784，1994)、AMBER 3.0力场(U.C.Singh等人，Proc.Natl.Acad.ScL USA.82：755-759，1994)、CHARMM和CHARMM22(Brooks等人，J.Comp.Chem.4：187-217)、cvff3.0(Dauber-Osguthorpe等人，Proteins：Structure，Function and Genetics，4：31-47，1988)；cff91(Maple等人，J.Comp.Chem.15：162-182，1988)、DISCOVER(cvff和cff91)、AMBER力场用于INSIGHT分子模拟包(Biosym/MSI，SanDiego Calif.)，HARMM用于QUANTA分子模拟包(Biosym/MSI，San DiegoCalif.)，全部参考文献以引用方式整体并入本文。

另外，生成概率分布表的方法是通过使用序列比对程序。此外，概率分布表的获得可以通过序列比对和计算方法的结合。例如，可以将在同源序列比对中发现的氨基酸加入到计算结果中。优选的，如果在计算中没有发现野生型氨基酸，可以将它加入概率表。

可以理解，通过组合可变的位置和/或可变位置上的残基所生成的候选变异体蛋白文库可以不在等级列表中。在一些实施方案中，可以制作并测试完整的列表。或者，在一个优选实施方案中，二级文库也可以是等级列表的形式，其可行的原因有几个，包括二级文库的大小依然太大而难以通过实验生成，或者是为了预测目的。这可以通过几种方式来进行。在一个实施方案中，使用PDA^TM的评分功能对二级文库进行评级或过滤，来评级或过滤文库成员。或者，可以使用统计方法。例如，可以通过频率分数来评级或过滤二级文库；即，含有最多高频率残基的蛋白质的评级较高，等等。可以通过将每个可变位置的频率相加或相乘来生成数字分数。同样，可以对二级文库不同位置进行加权，然后对蛋白质打分；例如，含有某些残基的蛋白质可以被任意评级或过滤。

在一个实施方案中，候选变异体文库的不同蛋白质成员可以被化学合成。尽管现有技术已知较长的蛋白质能够通过化学方法或酶来合成，但当所设计的蛋白质长度较短时，化学合成特别有用，较短蛋白质的优选长度为少于150个氨基酸，优选少于100氨基酸，特别优选少于50个氨基酸(参见：Wilken等人，Curr.Opin.Biotechnol.9：412-26，1998，以引用方式并入本文)。

在另一实施方案中，特别对于较长的蛋白质或者期望大样本的蛋白质，候选变异体序列被用来生成核苷酸，如编码成员序列的DNA，如果需要，这类DNA能够被克隆入宿主细胞，被表达并检测。因此，能够制备编码每个成员蛋白质序列的核酸，特别是DNA。这可以使用公知方法来进行。密码子的选择、合适的表达载体以及合适的宿主细胞将取决于大量因素，能够根据需要而轻易优化。

另一实施方案中，使用库池的寡聚核苷酸进行了多重PCR反应。在该实施方案中，根据全长基因合成了重叠的寡聚核苷酸。此外，这些寡聚核苷酸可以代表每个变异位置的所有不同氨基酸或亚基。这些寡聚核苷酸可以等比例集合，进行多重PCR反应来生成全长序列，这些序列含有二级文库所定义的突变组合。另外，也可以使用易错PCR方法。被加入的不同寡聚核苷酸的相对含量可以对应于概率分布表。从而使多重PCR反应形成的全长序列具有期望比例的期望突变组合。

所需要的寡聚核苷酸总数是突变位置数目和这些位点可能的突变数目的函数：恒定位置的寡聚核苷酸数+M1+M2+M3+...Mn＝所需要的寡聚核苷酸总数，其中Mn是序列中位置n处的可能突变数目。

另一个方面，每个重叠寡聚核苷酸只含有一个突变位置；其他实施方案中，突变位置相距太近以至于不能允许这种突变，而每个寡聚核苷酸的多重变异体被用来进行所有可能的全面重组。即，每个寡聚核苷酸可以含有单个突变位置的密码子，或者多个突变位置的密码子。多个突变位置在序列中必须接近，以避免寡聚核苷酸的长度没有实用性。对于寡聚核苷酸上的多个突变位置，通过包括或排除编码这一组合的寡聚核苷酸，文库中可以包括或排除特定的突变组合。例如，如本文所述，可变区域间可以存在关联；即，当位置X是某一残基时，位置Y必须是(或必须不是)某特定残基。在本文，这些可变位置的集合有时指“簇”。当簇由邻近残基共同组成并因此可以存在于一个寡聚核苷酸引物上时，该簇被定为“良好”关联，并清除那些可能降低文库有效性的不良组合。然而，如果簇的残基在序列中相隔很远并因此位于用于合成的不同寡聚核苷酸上，可以期望将这些残基定为“良好”关联，或将它们作为可变残基而完全清除。在可选实施方案中，文库的生成有几个步骤，以便簇的突变只能一起发生。识别突变簇并将它们置于同一寡聚核苷酸或将它们从文库中清除的方法，或者通过几个步骤生成文库并保留簇的方法，能够为实验文库大大丰富正确折叠的蛋白质。簇的识别可以通过许多方式，例如，使用已知的模式识别方法，比较突变发生频率，或者对实验生成的序列进行能量分析(例如，如果相互作用的能量高，则这些位置是关联的)。这些关联可以是位置关联(例如，可变位置1和2总是同时变化或从不同时变化)或序列关联(例如，如果位置1是残基A，则位置2始终是残基B)。参见：Pattern discovery inBiomolecular Data：Tools，Techniques，and Applications；edited by Jason T.L.Wang，Bruce A.Shapiro，Dennis Shasha.New York：Oxford University，1999；Andrews，Harry C.Introduction to mathematical techniques in patterrecognition；New York，Wiley-Interscience，1972；Applications of PatternRecognition；Editor，K.S.Fu.Boca Raton，Fla.CRC Press，1982；GeneticAlgorithms for Pattern Recognition；edited by Sankar K.Pal，Paul P.Wang.Boca Raton：CRC Press，cl996；Pandya，Abhijit S.，Pattern recognition withNeural networks in C++/Abhijit S.Pandya，Robert B.Macy.Boca Raton，Fla.：CRC Press，1996；Handbook of pattern recognition and computer vision/editedby C.H.Chen，L.F.Pau，P.S.P.Wang.2nd ed.Signapore；River Edge，NJ.：World Scientifific，cl999；Friedman，Introduction to Pattern Recognition：Statistical，Structural，Neural，and Fuzzy Logic Approaches；River Edge，N.J.：World Scientific，cl999，Series title：Serien a machine perception and artificialintelligence；vol.32；这些文献全部以引用方式并入本文。另外，可以使用检索共有基序的其他程序。

另外，通过改变寡聚核苷酸的设计可以修正或优化关联和洗牌；即，通过决定寡聚核苷酸(引物)的起始位点和终止位点(例如，序列的“截断”位点)。可以设置寡聚核苷酸的起始和终止位点来使单个寡聚核苷酸中出现的簇的数目最大化，从而丰富文库的高得分序列。可以对不同寡聚核苷酸的起始和终止位点选项进行计算机模拟，并根据单个寡聚核苷酸上展示的簇的数目或者符合预测序列文库的结果序列百分比进行评级或过滤。

当单个寡聚核苷酸编码多个可变位置时，所需寡聚核苷酸的总数增加。退火区域是保持恒定的区域，即含有参照序列的区域。

带有密码子插入或缺失的寡聚核苷酸可以用来构建表达不同长度蛋白质的文库。筛选插入或缺失的特定的计算机序列筛选可以生成限定不同长度蛋白质的二级文库，其中不同长度的蛋白质可以由汇集的不同长度寡聚核苷酸文库表达。

另一个方面，二级文库的构建是通过家族(例如，一组变异体)洗牌；即，某组上部序列(如果使用了评级列表)可以被洗牌，使用或不使用易错PCR。这里的“洗牌”意思是相关序列的重新组合，一般以随机的方式。这可以包括下述专利文献中定义和举例说明的“洗牌”：美国专利No.5,830,721、5,811,238、5,605,793、5,837,458和PCT US/19256，全部以引用方式整体并入本文。该组序列还可以是人工组；例如，来自概率表的组(如使用SCMF产生的组)或Monte Carlo组。同样，“家族”可以是上部10个序列和下部10个序列，上部100个序列，等等。还可以使用易错PCR来完成。

因此，另外一个方面，使用其中描述的计算方法来进行计算机洗牌。即，从两个文库或两个序列开始，可以生成并评价序列的随机组合。

可以进行易错PCR来生成二级文库(参见：美国专利No.5,605,793、5,811,238和5,830,721，全部以引用方式并入本文)。其进行可以针对最佳序列或文库的上部成员，或者一些其他人工组或家族。在该实施方案中，初级文库的计算筛选中发现的最佳序列的基因可以被合成。然后在含有编码二级文库可变位置的突变的寡聚核苷酸(偏移寡聚核苷酸)条件下，对最佳序列基因进行易错PCR。寡聚核苷酸的加入将产生偏移，有助于在二级文库中掺入突变。或者，只有负责某些突变的寡聚核苷酸可以用来偏移文库。

在偏移寡聚核苷酸存在下，可以将易错PCR基因洗牌应用于最佳序列基因，来生成反映二级文库中突变比例的DNA序列文库。偏移寡聚核苷酸的选择可以通过多种方式；可以根据频率来选择，即，可以使用编码高突变频率位置的寡聚核苷酸；或者，可以使用含有最多可变位置的寡聚核苷酸，以增加多样性；如果二级文库经过评级或过滤，可以使用一些高得分位置来生成偏移寡聚核苷酸；可以选择随机位置；可以选择几个高得分和低得分位置；等等。重要的是根据优选的可变位置和序列来生成新序列。

利用野生型基因或多肽序列的PCR可以被使用。在该实施方案中，使用了起始基因；虽然没有要求，但通常该基因是野生型基因。一些情况下，可以是编码全面优化序列或者列表中任意其他序列的基因。在该实施方案中，使用的寡聚核苷酸对应于可变位置并含有二级文库的不同氨基酸。如现有技术已知的，进行PCR时在末端使用了PCR引物。该方案提供了两点好处：首先是需要较少的寡聚核苷酸并产生较少的错误；另外是具有实验上的优势，因为如果使用野生型氨基酸，则它不需要进行合成。可以进行PCR产物的连接。

可以对一个或多个候选变异体二级文库进行多个附加步骤；例如，可以进行其他计算处理，可以重新组合候选变异体二级文库，或者重新组合不同候选变异体二级文库的界值。在一个优选实施方案中，候选变异体二级文库被重新计算处理，来形成另一个二级文库(在本文有时被称为“三级文库”)。例如，可以通过冻结或固定首轮二级文库中的一些或所有被改变的位置，选择任意候选变异体二级文库序列来进行第二轮PDATM。或者，只允许那些在最终概率分布表中可见的改变。或者，可以通过提高或降低界值范围来改变概率表的严紧性。同样，候选变异体二级文库可以在首轮之后被实验重新组合；例如，首轮筛选的最佳基因可以被用来重新组合(例如使用下述技术：多重PCR、易错PCR或洗牌)。或者，使用一个或多个良好基因片断来改变一些位置的概率。这使检索偏移到第一轮计算和实验筛选中发现的序列空间范围。

小分子化学组合物

“小分子”包括能影响生物学过程的任何化学或其他基团。小分子可以包括目前已知并使用的任何多种治疗剂，或者可以是在用于筛选生物学功能的分子文库中合成的小分子。小分子在大小上不同于大分子。本发明的小分子一般具有的分子量小于约5000道尔顿(Da)，优选为小于约2500Da，更优选为小于1000Da，最优选为小于约500Da。

小分子包括(但不限于)有机化合物、拟肽和它们的轭合物。本文使用的术语“有机化合物”指任何基于碳原子的化合物，而不是如核苷酸和多肽之类的大分子。除了碳原子，有机化合物可以含有钙、氯、氟、铜、氢、铁、钾、氮、氧、硫及其他元素。有机化合物可以是芳香族或脂肪族形式。有机化合物的非限制性例子包括：丙酮、乙醇、苯胺、碳水化合物、单糖、寡糖、多糖、氨基酸、核苷、核苷酸、类脂、类视黄醇、类固醇、蛋白聚糖、酮、醛、饱和脂肪、不饱和脂肪、多饱和脂肪、油脂和蜡、烯烃、酯类、醚、硫醇、硫化物、环状化合物、杂环化合物、咪唑和苯酚。本文使用的有机化合物还包括硝化的有机化合物和卤代的(如氯代)有机化合物。下文描述了制备拟肽的方法。使用如加速质谱测定法(AMS)的技术对本发明定义的小分子集合及小分子进行表征(参见：Turteltaub等人.，CurrPharm Des 6(10)：991-1007，2000，Bioanalytical applications of acceleratormass spectrometry for pharmaceutical research；Enjalbal等人，Mass SpectromRev 19(3)：139-61，2000，Mass spectrometry in combinatorial chemistry)。

优选的小分子是那些在生产、配制或制备上相对容易、成本较低的小分子。优选的小分子在多种贮存条件下是稳定的。优选的小分子可以与大分子紧密结合而形成具有生物学活性且药学特征得到改善的分子。改善的药学特征包括在循环周期、扩散、代谢、修饰、排泄、分泌、消除和稳定性方面有利于想要的生物学活性的变化。改善的药学特征包括化学物质在毒理和效力特征方面的变化。

应用方法

本发明的Intellipeptide可以用于多种应用，包括(但不限于)治疗用途，如治疗与蛋白质聚集或错折叠相关的疾病或病症，还可以用于多肽的生产和纯化，所述多肽包括重组生成的多肽。候选治疗性化合物在体外防止蛋白质未折叠和聚集的能力可能与该化合物在体内抑制未折叠和聚集的能力有关。另外，认为候选治疗化合物在体外稳定蛋白质功能性结构的能力可能与该化合物在体内辅助蛋白质行使功能的能力有关。

本文公开的多肽提供了一组多用途的药物分子，其能够作为治疗性肽专门用来防止疾病中涉及的蛋白质聚集或蛋白质错折叠。与蛋白质聚集或蛋白质错折叠有关的疾病包括(但不限于)：阿尔茨海默疾病(β淀粉样蛋白)、白内障(β/γ晶状体蛋白及纤维)、帕金森病(α-核突触蛋白)、亨廷顿病(亨廷顿病蛋白)、色素性视网膜炎(视紫质)、朊病毒病、疯牛病及其他疾病。导致蛋白序列中单个氨基酸改变的错义突变与人类疾病相关联。大约160000个已确认的错义突变中大部分影响蛋白质的折叠或运输，而不是特别影响蛋白质功能。疾病相关的膜内蛋白错义突变导致膜蛋白的不正确装配，例如，腓骨肌萎缩病中的PMP-22、尿崩症中的水通道蛋白、尿崩症中的血管加压素受体、色素性视网膜炎中的视紫质、腓骨肌萎缩病中的连接蛋白32、囊性纤维病中的CFTR。

其他肽可以用来稳定治疗性蛋白，如疫苗、胰岛素、生长因子、单克隆抗体。Intellipeptide可以用于蛋白质的纯化，来辅助蛋白质折叠成功能性立体结构。

因此，本发明描述了多种与Intellipeptide应用有关的方法。在一个实施方案中，本发明提供了一种通过为含有所述蛋白质的细胞或溶液中提供Intellipeptide而抑制蛋白质未折叠或减少蛋白质聚集的方法。在相关的实施方案中，本发明包括通过向含有所述蛋白质的细胞或溶液中提供Intellipeptide而恢复正确或适当的蛋白质折叠的方法。另外，本发明还提供了通过为含有所述多肽的细胞或溶液中提供Intellipeptide而提高重组生成的多肽的生产和/或分离的方法。

可以通过现有技术中可利用的多种方法为细胞或溶液提供Intellipeptide。例如，可以将合成的Intellipeptide直接提供给溶液或细胞。另外，还可以通过向细胞或溶液中导入含有编码Intellipeptide的多聚核苷酸序列的表达载体，所述表达载体带有调控所述Intellipeptide在细胞内表达的调控元件。多聚核苷酸序列可以进一步含有其他编码区，包括，例如：分泌信号，以便Intellipeptide从细胞中分泌出来；和/或调节编码的Intellipeptide表达的其他元件，大多数是现有技术已知并可用的，包括那些用于诱导表达肽和多肽的元件。因此，本发明还包括编码Intellipeptide的多聚核苷酸序列以及含有该序列的表达载体，例如包括病毒载体。

Intellipeptide可以用于治疗(但不限于)蛋白质聚集疾病，例如包括：阿尔茨海默疾病、白内障、帕金森病、亨廷顿病、肌萎缩性脊髓侧索硬化症(Lou Gehrig′s病)、牛海绵样脑病(疯牛病)、朊病毒病、黄斑变性和色素性视网膜炎。另外，Intellipeptide能够稳定治疗用途的蛋白质和/或肽，包括(但不限于)疫苗、胰岛素、生长因子和单克隆抗体。Intellipeptide在蛋白质纯化过程中辅助蛋白质折叠并稳定蛋白质的立体结构。因此，本发明提供了治疗疾病或病症的方法，包括为有相应需要的患者施用Intellipeptide。图1提供了Intellipeptide的有关治疗的应用。

在一个实施方案中，本发明提供了一种通过为阿尔茨海默病患者提供Intellipeptide而治疗阿尔茨海默疾病的方法。阿尔茨海默疾病(AD)是一种破坏性神经变性状态，特征为短期记忆丧失、定向力障碍、判断和推理能力损害。AD是老年人口中最普遍的痴呆症，估计在世界范围内，它以一定程度影响着2500万以上的人。AD的标志为不溶性蛋白质聚集物(已知为淀粉样蛋白)在大脑软组织细胞和血管壁的沉积。淀粉样蛋白的主要组分为4.3KDa的疏水性肽，命名为β淀粉样蛋白肽(β淀粉样蛋白)，由21号染色体编码，作为更长的前体蛋白(APP)的部分(Selkoe，Science 275：630-631，1997)。在过去10年中积累的遗传学、生物化学和神经病理学证据充分表明，淀粉样蛋白在AD的早期发病机理中起重要作用，可能是疾病的触发因素(Selkoe，1997)。在阿尔茨海默病例中，β淀粉样蛋白和牛磺酸的蛋白质聚集与神经细胞和神经突起的病变密切相关。β淀粉样蛋白的聚集导致毒斑的形成，毒斑可引起神经细胞的死亡。另一方面，牛磺酸在神经突起的结构中起关键作用。牛磺酸与被称为微管蛋白的细胞骨架细丝相结合而形成神经突起的核心-微管。牛磺酸的翻译后修饰，特别是高度磷酸化，形成牛磺酸-微管蛋白的相互作用。微管的去稳定作用导致神经突起的病变。最后，牛磺酸-微管蛋白相互作用非常不稳定，以致于牛磺酸与微管蛋白分离而成为自由体。未结合的牛磺酸倾向于形成神经原纤维缠结。神经原纤维缠结有神经毒性而导致神经病变。β淀粉样蛋白斑和神经原纤维缠结是阿尔茨海默疾病的标志。

另一实施方案中，本发明提供了一种通过为患有糖尿病的患者提供Intellipeptide而治疗糖尿病的方法。在一个具体实施方案中，将Intellipeptide作为用于治疗糖尿病的胰岛素的经口和/或鼻给药的稳定分子而提供给患者。因此，本发明包括治疗糖尿病的方法，包括为有相应需要的患者联合施用胰岛素和Intellipeptide。

尽管经口和鼻的胰岛素给药方法是方便及无痛的方法，并且已经在近期获得FDA批准用于人类，但目前对1型糖尿病来说，使用最广泛的胰岛素给药方法是注射。许多糖尿病患者在一天内需要多次注射，既疼痛又不方便。胰岛素是肽类药物，室温下不稳定，不能通过胃肠吸收，易于被胃肠道酶水解。稳定胰岛素的分子保护胰岛素免受刺激性环境(包括温度、pH和蛋白质水解酶)的破坏，将实现胰岛素经口或鼻途径的给药。尽管现有的小分子和聚合物能保护胰岛素免受pH和蛋白质水解酶的破坏，但没有一个现有的聚合物或小分子能够长时间保持胰岛素的结构完整。Intellipeptide能够与胰岛素结合并稳定其结构，保持其功能并保护其免受温度、pH和蛋白质水解酶的破坏。含有一种或多种Intellipeptide的胰岛素制剂将实现胰岛素经下述途径的给药，包括(但不限于)口、鼻、装置和贴片方法。

在另一实施方案中，本发明包括通过向含有所述肽或蛋白质的细胞或溶液引入Intellipeptide而生成和/或纯化肽或蛋白质的方法。现代药物开发过程日益集中于研发特异性分子靶点药物并大大提高了生产重组蛋白质的工业要求。高质量蛋白质的表达对于药物开发和药物治疗来说是基本要求。随着潜在药物靶点数目以及蛋白质和肽类药物数目的增加，对重组蛋白的要求也可能增加。研发大量生产可溶性靶蛋白的有效方法对于现代药物开发来说是基本的要求。Intellipeptide能够作为折叠助剂来折叠那些使用生物技术方法(如细菌或哺乳动物表达系统)合成的蛋白质。

Intellipeptide是一组多用途的分子，作用靶点是蛋白质错折叠和聚集致病路径中的一个或多个中间体。在一个实施方案中，Intellipeptide被设计来结合并稳定构象缺陷蛋白质的中间体，例如，Intellipeptide结合并稳定β淀粉样蛋白并防止其聚集。

具体实施例

实施例1

与β淀粉样蛋白结合的αB晶体蛋白的肽的识别

与靶蛋白β淀粉样蛋白结合的αB晶体蛋白的肽的识别是通过筛选αB晶体蛋白针脚阵列，它提供了一种系统评价方法，以一种平行同步的方式来评价对应于人类αB晶体蛋白的1-175残基的肽与选定的靶蛋白之间的相互作用。

在微孔板中排列的衍生聚乙烯针脚上合成肽。每个肽的长度为8个氨基酸，相邻的肽偏移2个氨基酸。所有的肽都与塑料表面针脚共价连接。对于人类αB晶体蛋白，第一个固定化的肽是₁MDIAIHHP₈，最后一个肽是₁₆₈PAVTAAPK₁₇₅。

在合成之后，使用含有2％牛血清蛋白(BSA)、0.1％吐温-20和0.1％叠氮化钠的10mM pH7.2的磷酸盐缓冲液(PBS)，在室温下预包被针脚1小时。然后用10mM PBS洗涤3次，每次10分种。为筛选与肽结合的靶蛋白，将固定浓度的靶蛋白β淀粉样蛋白溶于含有0.05％吐温-20的10mMPBS中，然后将其加入每个板孔中，室温温育1小时。针脚阵列用含有0.05％吐温-20的10mM PBS洗涤3次，每次10分种。针对靶蛋白β淀粉样蛋白的单克隆或多克隆初级抗体在PBS缓冲液中稀释后加入每个板孔，室温温育1小时。随后，针脚阵列用含有0.05％吐温-20的10mM PBS洗涤3次，每次10分种。抗家兔辣根过氧化物酶结合的二级抗体在PBS缓冲液中稀释后加入每个板孔，室温温育1小时。针脚阵列用含有0.05％吐温-20的10mMPBS洗涤3次，每次10分种。加入无色的辣根过氧化物酶显色底物3，3’，5，5’-四甲基联苯胺(TMB)(Pharmingen，San Diego，CA)，反应45分种。

表现阳性反应的针脚变成蓝色。加入6N硫酸终止反应，颜色从蓝色变为黄色。使用酶标仪(BioTek，Winooski，VT)检测450nm处的吸收度。

对对应于人类αB晶状体蛋白完整基本序列的总计84个肽筛选与靶蛋白β淀粉样蛋白的结合(表2)。有36个肽结合了靶蛋白β淀粉样蛋白。

针脚的再生是通过于60℃下10分种的水槽(VWR Aquasonic，WestChester，PA)声裂法，水槽中装有100mMPBS，其中含有1％十二烷基硫酸钠(SDS)和0.1％2-巯基乙醇。接下来，针脚阵列用预热到60℃的去离子水冲洗三次，每次30分种，然后在预热到60℃的去离子水中振荡30分种。然后用60℃甲醇洗涤15秒，空气干燥后于-20℃保存待用。每个靶蛋白在人类αB晶状体蛋白针脚阵列肽上检测2-5次，来验证结果的重复性。表2中编号为5、7、8、9、13、19、22、23、24、27、35、38、45、51、52、56、57、61、66、71、72、和79的肽在蛋白质针脚阵列检测中重复实验呈阳性。

表2：在蛋白质针脚阵列中合成的人αB晶状体蛋白的连续8-mer的肽列表。第2列和第6列是肽序列。第3列和第7列是生产商提供的疏水性。第4列和第8列是生产商(Mimotopes，San Diego，CA)提供的计算的分子量。

#	肽	疏水性	分子量	#	肽	疏水性	分子量
#	肽	疏水性	分子量	#	肽	疏水性	分子量	1	MDIAIHHP	0.67	915.09	43	SPEELKVK	0.04	911.07
2	IAIHHPWI	1.12	968.17	44	EELKVKVL	0.32	939.16	1	MDIAIHHP	0.67	915.09	43	SPEELKVK	0.04	911.07
2	IAIHHPWI	1.12	968.17	44	EELKVKVL	0.32	939.16	3	IHHPWIRR	0.6	1096.31	45	LKVKVLGD	0.39	853.06
4	HPWIRRPF	0.67	1090.31	46	VKVLGDVI	0.68	824.02	3	IHHPWIRR	0.6	1096.31	45	LKVKVLGD	0.39	853.06
4	HPWIRRPF	0.67	1090.31	46	VKVLGDVI	0.68	824.02	5	WIRRPFFP	0.88	1100.35	47	VLGDVIEV	0.72	824.97
6	RRPFFPFH	0.62	1085.3	48	GDVIEVHG	0.37	806.87	5	WIRRPFFP	0.88	1100.35	47	VLGDVIEV	0.72	824.97
6	RRPFFPFH	0.62	1085.3	48	GDVIEVHG	0.37	806.87	7	PFFPFHSP	0.95	957.12	49	VIEVHGKH	0.36	900.04
8	FPFHSPSR	0.51	956.09	50	EVHGKHEE	-0.18	945.99	7	PFFPFHSP	0.95	957.12	49	VIEVHGKH	0.36	900.04
8	FPFHSPSR	0.51	956.09	50	EVHGKHEE	-0.18	945.99	9	FHSPSRLF	0.63	972.13	51	HGKHEERQ	-0.41	1002.06
10	SPSRLFDQ	0.27	931.03	52	KHEERQDE	-0.6	1052.08	9	FHSPSRLF	0.63	972.13	51	HGKHEERQ	-0.41	1002.06
10	SPSRLFDQ	0.27	931.03	52	KHEERQDE	-0.6	1052.08	11	SRLFDQFF	0.63	1041.19	53	EERQDEHG	-0.47	980.96
12	LFDQFFGE	0.68	984.09	54	RQDEHGFI	0.14	983.06	11	SRLFDQFF	0.63	1041.19	53	EERQDEHG	-0.47	980.96
12	LFDQFFGE	0.68	984.09	54	RQDEHGFI	0.14	983.06	13	DQFFGEHL	0.47	974.05	55	DEHGFISR	0.16	942.01
14	FFGEHLLE	0.73	973.11	56	HGFISREF	0.48	974.1	13	DQFFGEHL	0.47	974.05	55	DEHGFISR	0.16	942.01
14	FFGEHLLE	0.73	973.11	56	HGFISREF	0.48	974.1	15	GEHLLESD	0.18	880.92	57	FISREFHR	0.35	1073.24
16	HLLESDLF	0.7	955.09	58	SREFHRKY	-0.1	1104.25	15	GEHLLESD	0.18	880.92	57	FISREFHR	0.35	1073.24
16	HLLESDLF	0.7	955.09	58	SREFHRKY	-0.1	1104.25	17	LESDLFPT	0.59	903.02	59	EFHRKYRI	0.13	1130.33
18	SDLFPTST	0.49	848.93	60	HRKYRIPA	0.11	1022.23	17	LESDLFPT	0.59	903.02	59	EFHRKYRI	0.13	1130.33
18	SDLFPTST	0.49	848.93	60	HRKYRIPA	0.11	1022.23	19	LFPTSTSL	0.79	847	61	KYRIPADV	0.28	943.12
20	PTSTSLSP	0.44	770.86	62	RIPADVDP	0.28	863.98	19	LFPTSTSL	0.79	847	61	KYRIPADV	0.28	943.12
20	PTSTSLSP	0.44	770.86	62	RIPADVDP	0.28	863.98	21	STSLSPFY	0.66	882.99	63	PADVDPLT	0.42	808.9
22	SLSPFYLR	0.72	964.15	64	DVDPLTIT	0.55	854.97	21	STSLSPFY	0.66	882.99	63	PADVDPLT	0.42	808.9
22	SLSPFYLR	0.72	964.15	64	DVDPLTIT	0.55	854.97	23	SPFYLRPP	0.7	958.15	65	DPLTITSS	0.49	814.91
24	FYLRPPSF	0.83	1008.21	66	LTITS SLS	0.7	802.94	23	SPFYLRPP	0.7	958.15	65	DPLTITSS	0.49	814.91
24	FYLRPPSF	0.83	1008.21	66	LTITS SLS	0.7	802.94	25	LRPPSFLR	0.57	967.2	67	ITSSLSSD	0.35	790.84
26	PPSFLRAP	0.61	866.05	68	SSLSSDGV	0.25	732.75	25	LRPPSFLR	0.57	967.2	67	ITSSLSSD	0.35	790.84
26	PPSFLRAP	0.61	866.05	68	SSLSSDGV	0.25	732.75	27	SFLRAPSW	0.71	945.1	69	LSSDGVLT	0.5	772.86

28	LRAPSWFD	0.62	973.11	70	SDGVLTVN	0.37	785.85
28	LRAPSWFD	0.62	973.11	70	SDGVLTVN	0.37	785.85	29	APSWFDTG	0.56	861.92	71	GVLTVNGP	0.57	737.85
30	SWFDTGLS	0.64	893.96	72	LTVNGPRK	0.16	866.03	29	APSWFDTG	0.56	861.92	71	GVLTVNGP	0.57	737.85
30	SWFDTGLS	0.64	893.96	72	LTVNGPRK	0.16	866.03	31	FDTGLSEM	0.44	880.99	73	VNGPRKQV	0.04	879.02
32	TGLSEMRL	0.4	888.07	74	GPRKQVSG	-0.04	809.92	31	FDTGLSEM	0.44	880.99	73	VNGPRKQV	0.04	879.02
32	TGLSEMRL	0.4	888.07	74	GPRKQVSG	-0.04	809.92	33	LSEMRLEK	0.16	987.2	75	RKQVSGPE	-0.12	881.99
34	EMRLEKDR	-0.27	1058.24	76	QVSGPERT	0.04	854.93	33	LSEMRLEK	0.16	987.2	75	RKQVSGPE	-0.12	881.99
34	EMRLEKDR	-0.27	1058.24	76	QVSGPERT	0.04	854.93	35	RLEKDRFS	-0.12	1032.18	77	SGPERTIP	0.23	837.95
36	EKDRFSVN	-0.13	976.06	78	PERTIPIT	0.49	908.09	35	RLEKDRFS	-0.12	1032.18	77	SGPERTIP	0.23	837.95
36	EKDRFSVN	-0.13	976.06	78	PERTIPIT	0.49	908.09	37	DRFSVNLD	0.19	947.02	79	RTIPITRE	0.27	967.16
38	FSVNLDVK	0.44	903.04	80	IPITREEK	0.16	967.15	37	DRFSVNLD	0.19	947.02	79	RTIPITRE	0.27	967.16
38	FSVNLDVK	0.44	903.04	80	IPITREEK	0.16	967.15	39	VNLDVKHF	0.46	953.1	81	ITREEKPA	-0.02	925.07
40	LDVKHFSP	0.47	924.07	82	REEKPAVT	-0.1	911.04	39	VNLDVKHF	0.46	953.1	81	ITREEKPA	-0.02	925.07
40	LDVKHFSP	0.47	924.07	82	REEKPAVT	-0.1	911.04	41	VKHFSPEE	0.19	954.06	83	EKPAVTAA	0.19	767.89
42	HFSPEELK	0.25	968.09	84	PAVTAAPK	0.36	735.89	41	VKHFSPEE	0.19	954.06	83	EKPAVTAA	0.19	767.89

实施例2

Intellipeptide在体外对pH诱导的β淀粉样蛋白聚集的影响

对实施例1中所识别的αB晶体蛋白衍生的肽进行体外实验来检测其抑制pH诱导的β淀粉样蛋白(1-42)聚集的能力。β淀粉样蛋白(1-42)是与阿尔茨海默疾病有关的肽，在酸性条件(pH5.2)下聚集。在含有或不含实施例1中所识别的合成的肽以及pH5.2的酸性pH条件下使用常规方法进行聚集实验。波长360nm下分光光度计检测聚集的光散射。不含其他肽的聚集的β淀粉样蛋白被指定为100％的聚集，作为含有合成肽的聚集的标准。

含有蛋白质针脚阵列识别序列并被检测其防止pH诱导的β淀粉样蛋白聚集的效力的三个肽能够在体外重现性地防止β淀粉样蛋白的聚集。这三个肽的序列分别为DRFSVNLDVKHFS、LTITSSLSDGV或HGKHEERQDE。图2描述了每个肽对pH诱导的β淀粉样蛋白聚集的影响。DRFSVNLDVKHFS(4％聚集)在pH5.2防止pH诱导的β淀粉样蛋白的聚集方面是最有效的。LTITSSLSDGV(15％聚集)(第4个条形柱)和HGKHEERQDE(30％聚集)(第5个条形柱)防止了pH(pH5.2)诱导的β淀粉样蛋白的聚集。这些数据表明，筛选αB晶状体蛋白针脚阵列所识别的肽有能力减少β淀粉样蛋白的聚集。

图2显示了Intellipeptide在体外对pH诱导的β淀粉样蛋白聚集的影响。聚集被描绘成条形图，算入了两次实验的标准偏差。第一个条形柱是可溶性β淀粉样蛋白在pH5.2下检测到的光散射。第2个条形柱代表在不含任何其他肽或蛋白质时，pH5.2下聚集的β淀粉样蛋白(100％聚集)。第3-5条形柱代表在分别含有DRFSVNLDVKHFS或LTITSSLSDGV或HGKHEERQDE时，pH5.2下的β淀粉样蛋白。DRFSVNLDVKHFS(4％聚集)在pH5.2防止pH诱导的β淀粉样蛋白的聚集方面是最有效的。LTITSSLSDGV(15％聚集)(第4个条形柱)和HGKHEERQDE(30％聚集)(第5个条形柱)可在pH5.2抑制pH诱导的β淀粉样蛋白的聚集。

实施例3

Intellipeptide在体外对Cu⁺⁺⁺诱导的β淀粉样蛋白聚集的影响

对实施例1中所识别的αB晶体蛋白衍生的肽也进行了体外实验来检测其抑制Cu⁺⁺⁺诱导的β淀粉样蛋白(1-42)聚集的能力。在含有或不含实施例1中所识别的合成的肽并含有100mM Cu⁺⁺⁺条件下使用常规方法进行聚集实验。波长360nm下分光光度计检测聚集的光散射。聚集的β淀粉样蛋白被指定为100％的聚集，作为含有合成肽的聚集的标准。

含有蛋白质针脚阵列识别序列并被检测其防止Cu⁺⁺⁺诱导的β淀粉样蛋白聚集的效力的三个肽能够在体外重现性地防止β淀粉样蛋白的聚集，如图3所示。β淀粉样蛋白与野生型αB晶状体蛋白或其肽的摩尔比为1∶1-1∶10时，DRFSVNLDVKHFS、LTITSSLSDGV和HGKHEERQDE在防止Cu⁺⁺⁺诱导的β淀粉样蛋白聚集方面的效果相当。当β淀粉样蛋白与野生型αB晶状体蛋白或其肽的摩尔比为10∶1时，合成肽DRFSVNLDVKHFS、LTITSSLSDGV和HGKHEERQDE在防止Cu⁺⁺⁺诱导的β淀粉样蛋白聚集方面效果较差。这些数据表明，筛选αB晶状体蛋白针脚阵列所识别的肽有能力减少β淀粉样蛋白的聚集，有力支持了这些肽在阿尔茨海默疾病治疗中的应用。

图3显示了Intellipeptide在体外对Cu⁺⁺⁺诱导的β淀粉样蛋白聚集的影响。波长360nm下分光光度计检测聚集的光散射。聚集的β淀粉样蛋白被指定为100％的聚集，作为含有合成肽的聚集的标准。聚集被描绘成柱形图，算入了两次实验的标准偏差。第1个条形柱是在含有100mM Cu⁺⁺⁺条件下检测到的β淀粉样蛋白的光散射。第2-4个条形柱是含有野生型重组人αB晶状体蛋白条件下的β淀粉样蛋白的光散射。第5-13个条形柱是含有选定浓度的合成肽DRFSVNLDVKHFS、LTITSSLSDGV或HGKHEERQDE条件下的β淀粉样蛋白光散射。字首10×代表β淀粉样蛋白与野生型αB晶状体蛋白或其肽的摩尔浓度比为10∶1。字首1×代表β淀粉样蛋白与野生型αB晶状体蛋白或其肽的摩尔浓度比为1∶1。字首0.1×代表β淀粉样蛋白与野生型αB晶状体蛋白或其肽的摩尔浓度比为1∶10。

实施例4

Intellipeptide文库的生成

基于人类αB晶状体蛋白的分子模拟，将实施例2和3中确定有减少蛋白质聚集能力的肽序列用来生成相关的Intellipeptide文库。

使用分子模拟程序MOE(Molecular Operating Environment)(ChemicalComputing Group，Inc，Montreal，Canada)来构建人类αB晶状体蛋白的立体同一性模型，使用小麦sHSP 16.9晶体结构作为模板。MOE运用许多技术来开发基于可获得的高分辨率的模板蛋白分子的晶体和/或NMR结构，所述技术包括(但不限于)多重序列比对、结构重叠、接触分析和折叠识别。在构建人类αB晶状体蛋白同一性模型过程中，首先使用ClustalX对人类αB晶状体蛋白的基本序列与模板蛋白基本序列进行粗略比对。从而获得了预测的人类αB晶状体蛋白二级结构，并使用可获得的自旋标记信息对其结构元件进行验证。使用Procheck和MOE的ModelEval模块来评估人类αB晶状体蛋白的立体结构。

利用对于人类αB晶状体蛋白的静电势计算肽序列的表面疏水性百分比。

将人类αB晶状体全蛋白的基本序列和预测的二级结构与小热激蛋白家族中所有蛋白的基本序列和预测的二级结构进行比对，其中小热激蛋白家族的序列是已知的。选择那些结构上保守且基本序列类似于人类αB晶状体蛋白的同一性肽。制备肽的文库，其中肽的序列相关于并衍生自：i)EKDRFSVNLDVKHFS或ii)LTITSSLSDGVLTVNGPRK。所选择肽的氨基酸序列如图5和图6所示。

实施例5

小热激蛋白和人类αB晶状体蛋白中的分子伴侣活性结构域

蛋白质针脚阵列识别了人类αB晶状体蛋白中的7个伴侣活性序列，利用了天然晶体蛋白、β_H和γD晶状体蛋白、体外分子伴侣靶蛋白、乙醇脱氢酶和柠檬酸合成酶。N末端结构域含有两个活性序列：₉WIRRPFFPFHSP₂₀和₄₃SLSPFYLRPPSFLRAP₅₈。α晶状体多蛋白核心结构域含有4个活性序列：₇₅FSVNLDVK₈₂(β3)、₁₁₃FISREFHR₁₂₀、₁₃₁LTITSSLS₁₃₈(β8)和₁₄₁GVLTVNGP₁₄₈(β9)。C末端结构域含有一个活性序列₁₅₇RTIPITRE₁₆₄，该序列包括高度保守的I-X-I/V氨基酸基序。属于α晶状体蛋白核心结构域的两个活性序列₇₃DRFSVNLDVKHFS₈₅和₁₃₁LTITSSLSDGV₁₄₁被合成为肽并在体外检测其分子伴侣活性。这两个肽在体外都抑制了β_H晶状体蛋白、乙醇脱氢酶和柠檬酸合成酶的热聚集。针脚阵列识别的7个分子伴侣序列中的5个与之前被识别为人类αB晶状体蛋白中亚基-亚基相互作用的序列相重叠。结果表明，人类αB晶状体蛋白中的相互作用的序列具有亚基-亚基组装和分子伴侣活性的双重作用。

人类αB晶状体蛋白是小热激蛋白(sHSP)和分子伴侣。sHSP的特征是分子量＜43kDa、低序列相似性、对环境压力正向调节并通过作为分子伴侣的活性而有能力防止蛋白质的未折叠和聚集(Ingolia和Craig，Proc NatlAcad Sci USA 19：2360-4，1982；Klemenz等人.，Proc Natl Acad Sci USASS：3652-6，1991；Merck等人.JBiol Chem 268：1046-52，1993；de Jong等人.，MolBiol Evol 10：103-26，1993；Groenen等人.，Eur J Biochem 225：1-19，1994；de Jong等人，Int J Biol Macromol 22：151-62，1998；Bloemendal等人，ProgBiophys Mol Biol 86：407-85，2004)。sHSP在所有植物和动物的细胞和组织中是普遍存在的，并在下述疾病中被正向调节：年龄相关疾病；心脏局部缺血；多种蛋白质聚集疾病，包括：亚历山大病、阿尔茨海默病、克-雅病和帕金森病(Iwaki等人，Cell 57：71-8，1989；Iwaki等人，Am JPathol 140：345-56，1992；Kato等人.，Acta Neuropathol(Bed)84：443-8，1992；Shinohara等人.，J Neurol Sci 119：203-8，1993；Goebel和Bornemann，Virchows Arch BCell Pathol Incl Mol Pathol 64：127-35，1993；van Noort等人，Nature 375：798-801，1995；Jackson等人，Neuropathol Appl Neurobiol 21：18-26，1995；Lobrinus等人，Neuromusc Disord 8：77-86，1998；Renkawek等人.，Neuroreport 10：2273-6，1999；van Rijk和Bloemendal，Ophthalmologica 214：7-12，2000；Yeboah和White，CroatMedJ 42：523-6，2001)。晶状体中有约33％的总蛋白含量，翻译后修饰的累积伴随有蛋白质未折叠，促进蛋白质之间的相互作用和聚集物的形成，聚集物大至形成光散射和白内障(Garland等人，Basic Life Sci 49：347-52，1988；Harding，Lens Eye Toxic Res8：245-50，1991；Miesbauer等人，JBiol Chem 269：12494-502，1994；Goode和Crabbe，Comput Chem 19：65-74，1995；Lund等人，Exp Eye Res 63：661-72，1996；Hanson等人，Exp Eye Res 67：301-12，1998；Yan和Hui，Yan Ke XueBao 16：91-6，2000；Feng等人，J Biol Chem 275：11585-90，2000；Garner等人，Biochim Biophys Acta 1476：265-78，2000；Lapko等人，Protein Sci 10：1130-6，2001；Kim等人，Biochemistry 41：14076-84，2002；Ueda等人，InvestOphthalmol Vis Sci 43：205-15，2002)。理论上，晶状体细胞质中高浓度的α晶状体蛋白能够结合未折叠的β/γ晶状体蛋白，稳定透明细胞的结构并通过其作为分子伴侣的活性而防止聚集和浑浊(Fu和Liang，Invest OphthalmolVis Sci 44：1155-9，2003；Srivastava和Srivastava，Mol Vis 9：110-8，2003；del Valle等人，Biochim Biophys Acta 1601：100-9，2002；Slingsby和Clout，Eye 13 Pt 3b：395-402，1999；Hook和Harding，Int J Biol Macromol 22：295-306，1998；Takemoto和Boyle，Int J Biol Macromol 22：331-7，1998)。正常的晶状体中，αB晶状体蛋白是一种结构蛋白，其与β/γ晶状体蛋白存在微弱的相互作用并与纤维网状结构密切相关(Fu和Liang，J Biol Chem 277：4255-60，2002；Nicholl和Quinlan，Embo J 13：945-53，1994)。

虽然已有关于β和γ晶状体蛋白的X射线晶体结构，但αB晶状体蛋白的结构是基于光谱数据和同一性模型(Kim等人，Nature 394：595-9，1998；Basak等人，J Mol Biol 328：1137-47，2003；Purkiss等人，J Biol Chem211：4199-205，2002；Sergeev等人，Mol Vis 4：9，1998；Hejtmancik等人，Protein Eng 10：1347-52，1997；Norledge等人，Protein Sci 6：1612-20，1997；van Montfort等人，Nat Struct Biol 8：1025-30，2001；Carver和Lindner，Int JBiol Macromol 22：197-209，1998；Ghosh和Clark，Protein Sci 14：684-95，2005)。Methanococcus jannaschi(Mj)sHSP16.5和小麦sHSP16.9这两个同源sHSP的光谱数据、二级结构预测和X射线晶体结构表明，sHSP的特征是有3个结构域：N末端结构域，在基本序列中有变化；α晶状体蛋白核心结构域，在基本序列和二级结构中是保守的；C末端延伸，在序列中是可变的。在Mj sHSP16.5和小麦sHSP16.9的晶体结构中，N末端结构域是大量螺旋或非结构化的，α晶状体蛋白核心结构域是一种免疫球蛋白样折叠，C末端延伸结构域产生于α晶状体蛋白核心结构域，是非结构化的并可变形的(Carver和Lindner，Int J Biol Macromol 22：197-209，1998)。α晶状体蛋白核心结构域采用的免疫球蛋白样折叠是一种β夹心(βsandwich)结构，由两个反平行β折叠构成，反平行β折叠由6-9个β折叠股(βstrand)形成，β折叠股由可变长度的环连接。小麦sHSP16.9中二聚体由于一个单体的β2和β3折叠股与一个环中的β6折叠股之间的相互作用而形成的，所述环连接另一单体的β5和β7。C末端延伸含有一个保守的I-X-I/V氨基酸基序，其中I是异亮氨酸，V是缬氨酸，X是任意天然氨基酸。在小麦sHSP16.9中，一个单体的I-X-I基序与另一个单体的β4和β8折叠股的残基相互作用而形成在晶体结构中看到的较高级别的十二基数的四级结构。虽然αB晶状体蛋白含有与Mj sHSP16.5同样的三个结构域，但人类αB晶状体蛋白的复合物聚集比已经结晶的两个sHSP更大、更多分散。这表明αB晶状体蛋白中的二聚体界面和寡聚化界面可能与较小的同源sHSP不同。αB晶状体蛋白和秀丽隐杆线虫(C.elegans)sHSP12.2的蛋白质水解和功能区切换的嵌合变异体表明，sHSP的全部三个结构域中的序列对于复合物聚集和分子伴侣活性来说都是重要的(Kokke等人，Cell Stress Chaperones 6：360-7，2001；Saha和Das，Proteins 57：610-7，2004)。对于αB晶状体蛋白和其他小热激蛋白的复合物聚集和分子伴侣活性而言重要的每个结构域中的特定残基或序列依然需要进行鉴定。

之前的研究中使用了人类αB晶状体蛋白的连续的、重叠的8-mer肽的蛋白质针脚阵列，人αB晶状体蛋白中亚基-亚基相互作用和复合物组装所需要活性结构域得到鉴定(Ghosh和Clark，Protein Sci14：684-95，2005)。下述序列被确定为αB晶状体蛋白中的亚基-亚基相互作用位点：N末端序列₃₇LFPTSTSLSPFYLRPPSF₅₄；三个αB晶状体蛋白核心结构域序列₇₅FSVNLDVK₈₂(β3)、_I31LTITSSLS_I38(β8)和₁₄₁GVLTVNGP₁₄₈(β9)；C末端序列₁₅₅PERTIPITREEK_I66。针脚阵列研究证实了下述研究并在下述研究基础上进行了扩展：光谱研究、突变研究、蛋白质水解实验和双杂交筛选，这些研究确定了sHSP中活性结构域的特征。针脚阵列所识别的亚基-亚基活性结构域与在Mj sHSP16.5和小麦SHSP16.9晶体结构中识别的二聚体和复合物界面(β3、β8、β9和I-X-I/V氨基酸基序)相一致，其中有一个例外，针脚阵列没有将连接β5和β7的环状结构域中的序列识别为αB晶状体蛋白中负责二聚作用的活性序列(Kim等人，Nature 394：595-9，1998；vanMontfort等人，Nat Struct Biol 8：1025-30，2001；Ghosh and Clark，Protein Sci14：684-95，2005)。在运用肽扫描技术的其他报道中，αB晶状体蛋白和小热激蛋白sHSPB中负责亚基-亚基组装和分子伴侣功能的序列得到鉴定，与针脚阵列所识别鉴定的序列一致(Ghosh和Clark，Protein Sci 14：684-95，2005；Sreelakshmi等人，Biochemistry 43：15785-95，2004；Lentze和Narberhaus，Biochem Biophys Res Commun 325：401-7，2004)。据报道，与来自人类αB晶状体蛋白核心结构域序列同源的一段αB晶状体蛋白核心结构域序列KFVIFLDVKHFSPEDLTVK在体外具有分子伴侣样活性(Sharma等人，J BiolChem 275：3767-71，2000)。

在该报道中，蛋白质针脚阵列识别并鉴定了被绘制成立体结构模型的活性序列。人类αB晶状体蛋白中负责分子伴侣功能的7个活性结构域被识别为那些与变性的β_H晶状体蛋白、γD晶状体蛋白、乙醇脱氢酶和柠檬酸合成酶相互作用的序列。₇₃DRFSVNLDVKHFS₈₅和₁₃₁LTITSSLSDGV₁₄₁这两个活性肽被合成，并发现它们在体外具有抵抗β_H晶状体蛋白、ADH和CS热聚集的分子伴侣活性。针脚阵列所识别的负责分子伴侣功能的7个活性结构域与之前识别的负责亚基-亚基相互作用及复合物聚集的活性结构域相重叠(Ghosh and Clark，Protein Sci 14：684-95，2005)。总而言之，这些数据表明，αB晶状体蛋白中的活性结构域介导了分子伴侣活性和亚基-亚基组装的双重功能。

实施例6：材料与方法

针脚的合成、与配体蛋白连接的肽的结合与检测

如图12所示，αB晶状体蛋白针脚阵列被用来检测肽和伴侣靶蛋白之间的相互作用，伴侣靶蛋白包括牛β_H晶状体蛋白、人γD晶状体蛋白、马乙醇脱氢酶(ADH)和猪柠檬酸合成酶(CS)(Ghosh和Clark，Protein Sci14：684-95，2005)。

图12显示了蛋白质针脚阵列检测的示意图。详细方案参考方法部分。在λ＝450nm下检测每个孔的蓝色区域的吸光度，并对照该孔中相应肽的氨基酸序列绘图(图13和14)。含有与靶蛋白相互作用强的肽的孔为深蓝色，含有与靶蛋白弱作用或无作用的肽的孔为淡蓝色或无色。

牛β_H晶状体蛋白、人γD晶状体蛋白、马乙醇脱氢酶(ADH)和猪柠檬酸合成酶(CS)等在针脚阵列检测中所用的靶蛋白的纯度经SDS-PAGE检测为＞90％。另外，每个靶蛋白的初级抗体对该靶蛋白是特异性的，因此不会检测到那些可能与肽结合的污染蛋白。运用同步肽合成策略合成了对应于人类αB晶状体蛋白1-175残基的84个序列重叠肽片断，所述策略由Geysen开发，被称为多中心肽合成法(Mimotopes，San Diego，CA)。Geysen，Southeast Asian J Trop Med Public Health 21：523-33，1990；Chin等人.，J OrgChem 62：538-539，1997。肽被固定在ELISA微升板格式排列的衍生聚乙烯针脚上。每个肽长度为8个氨基酸，连续的肽被两个氨基酸隔开。所有的肽与塑料针脚表面共价连接。第一个肽是对于人类αB晶状体蛋白的₁MDIAIHHP₈，最后一个肽是₁₆₈PAVTAAPK₁₇₅。所有的蛋白质和抗体的供应商列于表3中。

表3：蛋白质针脚阵列实验中使用的蛋白质和抗体列表

蛋白质	产品编号	供应商	使用的蛋白质/孔
蛋白质	产品编号	供应商	使用的蛋白质/孔	牛β_H晶状体蛋白	SPP-235	Stressgen Inc.，BC，Canada	0.05μmol
人γD晶状体蛋白	重组的、纯化的	-	0.05μmol	牛β_H晶状体蛋白	SPP-235	Stressgen Inc.，BC，Canada	0.05μmol
人γD晶状体蛋白	重组的、纯化的	-	0.05μmol	马乙醇脱氢酶	05646	Sigma-Aldrich，MO	0.05μmol
猪柠檬酸合成酶	103381	Roche Diagnostics，IN	0.05μmol	马乙醇脱氢酶	05646	Sigma-Aldrich，MO	0.05μmol
猪柠檬酸合成酶	103381	Roche Diagnostics，IN	0.05μmol	抗体	产品编号	供应商	使用的稀释
小鼠抗β_H晶状体蛋白	SPA-230	Stressgen Inc.，BC，Canada	1∶1000	抗体	产品编号	供应商	使用的稀释
小鼠抗β_H晶状体蛋白	SPA-230	Stressgen Inc.，BC，Canada	1∶1000	小鼠抗γD晶状体蛋白	定制	-	1∶1000
家兔抗乙醇脱氢酶	AB1202	Chemicon International，CA	1∶40000	小鼠抗γD晶状体蛋白	定制	-	1∶1000
家兔抗乙醇脱氢酶	AB1202	Chemicon International，CA	1∶40000	小鼠柠檬酸合成酶	RDI-CBL 249	RDI Diagnostics Inc.，NJ	1∶1000

第1列是购买的或合成的蛋白质或抗体的名称，第2列是购买的或合成的蛋白质或抗体的产品编号，第3列是购买的蛋白质或抗体的供应商，第4列是针脚阵列实验中使用的蛋白质或抗体的浓度。

人类肌红蛋白不与人类αB晶状体蛋白的肽相互作用，作为蛋白质针脚阵列实验的阴性对照(Ghosh和Clark，Protein Sci 14：684-95，2005)。阳性的相互作用在ELISA板孔中生成蓝色。使用酶标仪(BioTek，Winooski，VT)在450nm下测定板孔中蓝色的强度。蓝色的强度(绘制在X轴上)是αB晶状体蛋白与靶蛋白之间相互作用(绘制在Y轴上)的量度。为了测定温度对活性肽与靶蛋白之间相互作用的影响，靶蛋白在使用前于45℃水浴中加热15分钟。针脚阵列无法区别存在于溶液中的靶蛋白的单体、二聚体或寡聚体。但是，针脚阵列能灵敏检测单个肽与特定条件下的溶液中存在的特定靶蛋白的总体(单体、二聚体、寡聚体)之间的相互作用。每个靶蛋白被测定2-5次。全部实验中使用一个针脚阵列，在超过30次重复使用后没有发现相互作用上的改变。蛋白质针脚阵列的最后3个肽₁₆₃REEKPAVT₁₇₀、₁₆₅EKPAVTAA₁₇₂、₁₆₇PAVTAAPK₁₇₄，与人类αB晶状体蛋白中初级抗体的识别表位(₁₆₃REEKPAVTAAPKK_I75)相对应。这3个肽在缺乏人类αB晶状体蛋白作为配体时依然有阳性反应，原因是抗人αB晶状体蛋白的抗体与这3个肽直接结合。利用该实验检测了针脚阵列有效性的损失。测定针脚阵列在经过30次以上的实验后的有效性损失＜5％。

人αB晶状体蛋白的分子模拟。如前所述，分子模拟程序MOE(Molecular Operating Environment)(Chemical Computing Group，Inc，Montreal，Canada)被用来构建人类αB晶状体蛋白的立体同一性模型。Ghosh和Clark，Protein Sci 14：684-95，2005。该软件包括下述模块：多重序列比对、结构重叠、接触分析、折叠识别、预测模型的立体化学性质分析，考虑了下述参数：可平面性、手性、/ψ参数选择、x角、非键合接触距离、未满足的供体和受者。Fechteler等人，J Mol Biol 253：114-31，1995。选择小麦sHSP 16.9晶体结构作为同一性模拟人类αB晶状体蛋白的模板，因为在所有的可变的sHSP晶体结构中，小麦sHSP 16.9与人类αB晶状体蛋白具有最高的序列相似性(晶状体蛋白核心结构域为40％，整体为25.4％)。在构建人类αB晶状体蛋白同一性模型的过程中，使用ClustalX将人类αB晶状体蛋白的基本序列与小麦sHSP 16.9模板蛋白进行比对(eanmougin等人.，Trends Biochem Sci 23：403-5，1998；Aiyar，Methods Mol Biol 132：221-41，2000)。从而获得了预测的人类αB晶状体蛋白二级结构(JPred)，并使用可获得的自旋标记信息对其结构元件进行验证(。Koteiche和McHaourab，J MolBiol 294：561-77，1999)。然后，将人类αB晶状体蛋白二级结构与观察到的小麦sHSP 16.9二级结构进行结构上的比对。运用这种比对在MOE中构建10个能量最小化的模型。使用MOE的ModelEval模块对每个模型进行评价，选出最相符的最为最终模型并通过Procheck进行验证(Morris等人.，Proteins 12：345-64，1992)。根据小麦sHSP16.9和Mj sHSP16.5的X射线晶体结构所计算出的αB晶状体蛋白立体结构与αB晶状体蛋白的电子自旋共振(ESR)数据和之前的同一性模型相符合(Koteiche和McHaourab，J Mol Biol 294：561-77，1999；Guruprasad和Kumari，Int J Biol Macromol 33：107-12，2003；Berengian等人，Biochemistry 36：9951-7，1997；Koteiche等人，Biochemistry 37：12681-8，1998；Muchowski等人，J Mol Biol 289：397-411，1999)。当αB晶状体蛋白的立体同一性模型与小麦sHSP16.9和MjsHSP16.5的晶体结构重叠时，相符性的Cα标准差(RMSD)为3.25

(Ghosh和Clark，Protein Sci 14：684-95，2005)。三个结构的保守的αB晶状体蛋白核心结构域的重叠的Cα标准差为2.06

根据生产商提供的手册计算分子伴侣序列所形成的疏水性表面(Chemical Computing Group，Inc，Montreal，Canada)。使用PyMol和MOE制作关于人类αB晶状体蛋白的图解说明。

实施例7

αB晶状体蛋白中针对β_H和γD晶状体蛋白的活性位点

蛋白质针脚阵列实现了对于人类αB晶状体蛋白的伴侣活性所必需的活性序列的识别。在23℃和λ＝450nm下，测定了固定化的8-mer的人αB晶状体蛋白肽与未加热及预热的β_H晶状体蛋白(晶状体细胞的一种天然蛋白质组成)之间相互作用的吸光度。当靶蛋白是未加热的β_H晶状体蛋白时，检测了下述肽序列的最大吸光度：₉WIRRPFFP₁₆、₄₅SPFYLRPP₅₂、₄₇FYLRPPSF₅₄、₅₁PPSFLRAP₅₈、₆₉RLEKDRFS₇₆、₇₅FSVNLDVK₈₂、₈₉LKVKVLGD₉₆、₁₁₃FISREFHR₁₂₀、₁₂₁KYRIPADV₁₂₈、₁₃₁LTITSSLS₁₃₈、₁₄₁GVLTVNGP₁₄₈和₁₅₇RTIPITRE₁₆₄(图13：条纹柱)。同样测定了αB晶状体蛋白肽在45℃下与经过预热的β_H晶状体蛋白之间相互作用15分钟的最大吸光度(图13：无填充的柱)。与未加热及预热的β_H晶状体蛋白之间具有阳性相互作用的αB晶状体蛋白肽是同样的，差别仅在于吸光度的强度(图13：黑色实心柱)。在针脚阵列的全部84个αB晶状体蛋白肽中，有8个肽与预热β_H晶状体蛋白结合的吸光度比其与未加热β_H晶状体蛋白结合的吸光度要高(A_450nm@45℃-A_450nm@23℃＞0)，而有4个肽与预热β_H晶状体蛋白结合的吸光度和其与未加热β_H晶状体蛋白结合的吸光度相类似(A_450nm@45℃-A_450nm@23℃≈0)。具有最大吸光度的肽的一侧接受一个或两个具有较低吸光度的重叠肽的攻击，生成了表观峰。重叠的攻击肽在最大吸光度的肽上向N末端活C末端移动两个氨基酸。每个峰位吸光度差异((A_450nm@45℃-A_450nm@23℃)最大的肽列于表4：第2列。远紫外圆二色谱表明，45℃加热15分钟所导致的β_H晶状体蛋白二级结构损失＜10％。在预热的β_H晶状体蛋白的近紫外圆二色谱中，主要吸收峰的椭圆率的减小＜20％(图15a和16a)。

图13显示了固定在针脚上的人类αB晶状体蛋白的8-mer肽在23℃下与未加热的β_H晶状体蛋白之间以及在45℃下与预热的β_H晶状体蛋白之间相互作用的模式。Y轴列出了固定在96孔ELISA板中84个针脚上的每个人类αB晶状体蛋白的8-mer肽的氨基酸序列。X轴列出了使用基于ELISA的比色法在450nm处测定的αB晶状体蛋白肽与未加热的β_H晶状体蛋白(条纹柱)或预热的β_H晶状体蛋白(无填充的柱)之间相互作用的吸光度。柱的长度与上述相互作用的强度成正比，柱越长，相互作用越强。并非每个肽都有相互作用，并且与未加热和预热β_H晶状体蛋白之间相互作用的方式也不同。与预热β_H晶状体蛋白之间相互作用的吸光度值＜0.134时，被认为是非特异性相互作用的基线。大部分肽(56/84)与预热β_H晶状体蛋白之间的相互作用大于与未加热β_H晶状体蛋白之间的相互作用。检测的每个肽的吸光度之间的差异(A_450nm@45℃-A_450nm@室温)代表该肽与预热β_H晶状体蛋白的之间相互作用相对于未加热β_H晶状体蛋白的增加或减少(绘制右侧的黑色实心柱)。总体上，αB晶状体蛋白肽与预热β_H晶状体蛋白之间的相互作用大于它与未加热β_H晶状体蛋白之间的相互作用。

当γD晶状体蛋白(晶状体细胞质的一种天然蛋白组成，来自与β晶状体蛋白相同的基因家族)取代β_H晶状体蛋白作为针脚阵列的配体时，有12个活性序列被识别(图14：条纹柱)。与未加热的γD晶状体蛋白在λ＝450nm处有最大吸光度的12个肽为₃IAIHHPWI₁₀、₉WIRRPFFP₁₆、₂₁PFFPFHSP₂₈、₂₅DQFFGEHL₃₂、₄₃SLSPFYLR₅₀、₄₇FYLRPPSF₅₄、₅₂SFLRAPSW₅₉、₇₅FSVNLDVK₈₂、₁₁₁HGFISREF₁₁₈、₁₁₇EFHRKYR)₁₂₄、₁₃₁LTITSSLS₁₃₈和₁₄₁GVLTVNGP₁₄₈。检测了αB晶状体蛋白中相似的肽序列与预热γD晶状体蛋白在45℃相互作用15分钟的最大吸光度(图14：无填充的柱)。使用预热γD晶状体蛋白时，在84个αB晶状体蛋白肽中，56个肽具有较高的吸光度(图14：黑色实心柱)，16个肽具有较低的吸光度。剩余12个肽与未加热和预热的γD晶状体蛋白之间相互作用的吸光度类似。与未加热或预热γD晶状体蛋白之间具有最大吸光度的αB晶状体蛋白肽的一侧被一个或两个具有较低吸光度的重叠肽所攻击，生成了表观峰。重叠的攻击肽从最大吸光度的肽上向N末端活C末端移动两个氨基酸。每个峰位吸光度差异((A_450nm@45℃-A_450nm@23℃)最大的肽列于表4：第3列。远紫外圆二色谱表明，45℃加热15分钟所导致的γD晶状体蛋白二级结构损失＜10％。在预热的γD晶状体蛋白的近紫外圆二色谱中，主要吸收峰的椭圆率的减小＜25％(图15b和16b)。

图14显示了固定在针脚上的人类αB晶状体蛋白的8-mer肽在23℃下与未加热的γD晶状体蛋白之间以及在45℃下与预热的γD晶状体蛋白之间相互作用的模式。Y轴列出了固定在96孔ELISA板中84个针脚上的每个人类αB晶状体蛋白的8-mer肽的氨基酸序列。X轴列出了使用基于ELISA的比色法在450nm处测定的αB晶状体蛋白肽与未加热的γD晶状体蛋白(条纹柱)或预热的γD晶状体蛋白(无填充的柱)之间相互作用的吸光度。柱的长度与上述相互作用的强度成正比，柱越长，相互作用越强。并非每个肽都有相互作用，并且与未加热和预热γD晶状体蛋白之间相互作用的方式也不同。与预热γD晶状体蛋白之间相互作用的吸光度值＜0.348时，被认为是非特异性相互作用的基线。大部分肽(56/84)与预热γD晶状体蛋白之间的相互作用大于与未加热γD晶状体蛋白之间的相互作用。检测的每个肽的吸光度之间的差异(A_450nm@45℃-A_450nm@室温)代表该肽与预热γD晶状体蛋白的之间相互作用相对于未加热γD晶状体蛋白的增加或减少(绘制成黑色实心柱)。总体上，αB晶状体蛋白肽与预热γD晶状体蛋白之间的相互作用大于它与未加热γD晶状体蛋白之间的相互作用。

实施例8

αB晶状体蛋白中针对乙醇脱氢酶(ADH)和柠檬酸合成酶(CS)的伴侣活性位点

除了与β/γ晶状体蛋白家族中生理学靶蛋白相互作用外，αB晶状体蛋白肽与未加热和预热的分子伴侣靶蛋白-乙醇脱氢酶(ADH)和柠檬酸合成酶(CS)之间的相互作用得到检测。在应用于针脚阵列检测之前，使用远紫外圆二色谱测定了β_H晶状体蛋白、γD晶状体蛋白、ADH和CS的二级结构，测定条件分别为在23℃、在45℃加热15分钟之后和在50℃加热60分钟之后(图15)。对于β_H晶状体蛋白，全部3个温度下的最大椭圆率(Θ_max)出现在λ＝214nm处，而最大椭圆率(Θ_max)的值从23℃的-5576deg.cm².decimole^-1降低至45℃加热15分钟之后的-5043deg.cm².decimole^-1，再降低至50℃加热60分钟之后的-4501deg.cm².decimole^-1(图15a)。类似的，对于γD晶状体蛋白，全部3个温度下的最大椭圆率(Θ_max)出现在λ＝217nm处，而最大椭圆率(Θ_max)的值从23℃的-5571deg.cm².decimole^-1降低至45℃加热15分钟之后的-5150deg.cm².decimole^-1，再降低至50℃加热60分钟之后的-4719deg.cm².decimole^-1(图15b)。ADH的最大椭圆率(Θ_max)出现在λ＝215nm处，最大椭圆率(Θ_max)的值从23℃的-5190deg.cm².decimole^-1降低至45℃加热15分钟之后的-5139deg.cm².decimole^-1，表明基于45℃加热的二级结构损失＜1％(图15c)。ADH的最大椭圆率(Θ_max)进一步降低至50℃加热60分钟之后的-2523deg.cm².decimole^-1，表明基于50℃加热的二级结构损失＞50％(图15c)。CS的最大椭圆率(Θ_max)出现在λ＝215nm处，最大椭圆率(Θ_max)的值从23℃的-13076deg.cm².decimole^-1降低至45℃加热15分钟之后的-11070deg.cm².decimole^-1，表明基于45℃加热的二级结构损失＜15％(图15d)。CS的最大椭圆率(Θ_max)进一步降低至50℃加热60分钟之后的-648deg.cm².decimole^-1，表明基于50℃加热的二级结构损失＞95％(图15d)。

图15显示了β_H晶状体蛋白、γD晶状体蛋白、乙醇脱氢酶(ADH)和柠檬酸合成酶(CS)的远紫外圆二色谱。汇集了β_H晶状体蛋白(A：左上)、γD晶状体蛋白(B：右上)、ADH(C：左下)和CS(右下)在23℃、45℃和50℃的图谱。β_H晶状体蛋白和γD晶状体蛋白在23℃-50℃温度范围内的紫外圆二色谱没有大的变化。ADH在23℃和45℃下的紫外圆二色谱相似，而在50℃下，在215nm处的椭圆率明显下降。CS在215nm处的椭圆率随温度升高(23-50℃)而降低。远紫外圆二色谱表明，β_H晶状体蛋白和γD晶状体蛋白是热稳定性的并在50℃以下保持折叠，ADH在45℃以下保持折叠而在50℃则是未折叠的。CS是这四个分子伴侣靶蛋白中最不耐热的，在45℃是未折叠的。因温度升高而未折叠的量如下：CS＞＞＞ADH＞β_H晶状体蛋白～γD晶状体蛋白。

在应用于针脚阵列检测前，使用近紫外圆二色谱测定了β_H晶状体蛋白、γD晶状体蛋白、ADH和CS的三级结构，测定条件分别为在23℃、在45℃加热15分钟之后和在50℃加热60分钟之后(图16)。对于β_H晶状体蛋白，23℃下的最大吸收峰位于λ＝267nm处，267nm处的吸收峰值从23℃的30.71deg.cm².decimole^-1降低至45℃加热15分钟之后的24.22deg.cm².decimole^-1，表明在45℃下有部分未折叠，再降低至50℃加热60分钟之后的15.78deg.cm².decimole^-1，表明在50℃下有大量未折叠(图16a)。对于γD晶状体蛋白，23℃下的最大吸收峰位于λ＝269nm处，269nm处的吸收峰值从23℃的17.26deg.cm².decimole^-1降低至45℃加热15分钟之后的12.74deg.cm².decimole^-1，表明在45℃下有部分未折叠，再降低至50℃加热60分钟之后的6.75deg.cm².decimole^-1，表明在50℃下有大量未折叠(图16b)。对于ADH，23℃下的最大吸收峰位于λ＝270nm处，270nm处的吸收峰值从23℃的44.27deg.cm².decimole^-1降低至45℃加热15分钟之后的14.23deg.cm².decimole^-1，表明在45℃下有部分未折叠，再降低至50℃加热60分钟之后的-2.37deg.cm².decimole^-1，表明在50℃下有大量未折叠(图16c)。对于CS，23℃下的最大吸收峰位于λ＝257nm处，257nm处的吸收峰值从23℃的42.54deg.cm².decimole^-1降低至45℃加热15分钟之后的25.20deg.cm².decimole^-1，表明在45℃下有部分未折叠，再降低至50℃加热60分钟之后的20.95deg.cm².decimole^-1，表明在50℃下有大量未折叠(图16d)。

图16显示了β_H晶状体蛋白、γD晶状体蛋白、乙醇脱氢酶(ADH)和柠檬酸合成酶(CS)的近紫外圆二色谱。汇集了β_H晶状体蛋白(A：左上)、γD晶状体蛋白(B：右上)、ADH(C：左下)和CS(右下)在23℃、45℃和50℃的图谱。在β_H晶状体蛋白、γD晶状体蛋白、乙醇脱氢酶(ADH)和柠檬酸合成酶(CS)的近紫外圆二色谱中，吸收峰的椭圆率在45℃加热15分钟后降低了20-60％。

αB晶状体蛋白与未加热和预热的ADH在λ＝450nm处检测的吸光度图式类似于αB晶状体蛋白与未加热和预热的β_H/γD晶状体蛋白测得的吸光度图式(图17)。当ADH作为针脚阵列检测中的配体时，测定了下述αB晶状体蛋白肽序列的最大吸光度：₉WIRRPFFP₁₆、₁₃PFFPFHSP₂₀、₂₇FFGEHLLE₃₄、₃₇LFPTSTSL₄₄、₄₃SLSPFYLR₅₀、₄₈LRPPSFLR₅₅、₆₉RLEKDRFS₇₆、₇₅FSVNLDVK₈₂、₁₁₅SREFHRKY₁₂₂、₁₃₁LTITSSLS₁₃₈、₁₄₁GVLTVNGP₁₄₈和₁₅₇RTIPITRE₁₆₄。当ADH在45℃预热15分钟后，在84个αB晶状体蛋白肽中，有34个肽的吸光度升高(A4_50nm@45℃-A_450nm@23℃＞0)，而其他50个肽与预热和未加热的ADH之间相互作用的吸光度类似(A_450nm@45℃-A_450nm@23℃～0)。活性肽序列与预热和未加热ADH的吸光值差异(A4_50nm@45℃-A_450nm@23℃)是一个量度，指示了该肽与预热的ADH之间相对于该肽与天然ADH之间相互作用的增加。具有最大吸光值差异(A_450nm@45℃-A_450nm@23℃)的αB晶状体蛋白肽的一侧接受一个或两个具有较低吸光度差异的重叠肽的攻击，生成了表观峰。重叠的攻击肽在最大吸光度的肽上从高峰肽向N末端活C末端移动两个氨基酸。每个峰位吸光度差异((A_450nm@45℃-A_450nm@23℃)最大的肽列于表4：第4列。结果证实，人类αB晶状体蛋白与预热的ADH之间的相互作用要大于与未加热的天然ADH之间的相互作用。

图17显示了人类αB晶状体蛋白肽与ADH之间相互作用的图式。Y轴列出了顺序固定在96孔板的8-mer肽的氨基酸序列。每个肽与预热的、部分变性的ADH和与未加热的天然ADH的吸光度之间的差异(A_450nm@45℃-A_450nm@室温)代表该肽与预热部分变性的ADH之间的相互作用相对于该肽与天然ADH之间相互作用的增加或减少，被绘制为X轴上的水平柱。84个肽中，有34个肽与预热的部分变性ADH之间的相互作用大于与天然ADH之间的相互作用，而剩余50个肽与变性ADH或天然ADH之间的相互作用类似。αB晶状体蛋白肽与预热的未折叠ADH之间的相互作用大于与未加热的天然ADH之间的相互作用。吸光度差异(A_450nm@45℃-A_450nm@室温)小于0.05，被视为基线。

αB晶状体蛋白与未加热和预热的CS在λ＝450nm处检测的吸光度图式类似于αB晶状体蛋白与未加热和预热的β_H/γD晶状体蛋白测得的吸光度图式(图18)。当CS作为针脚阵列检测中的靶蛋白时，测定了下述10个人类αB晶状体蛋白肽序列的最大吸光度：₉WIRRPFFP₁₆、₂₃FPFHSPSR₃₀、₄₃SLSPFYLR₅₀、₄₇FYLRPPSF₅₄、₅₅LRAPSWFD₆₂、₇₅FSVNLDVK₈₂、₁₁₃FISREFHR ₁₂₀、₁₃₁LTITSSLS₁₃₈、₁₄₃LTVNGPRK₁₅₀和₅₇RHPITRE₁₆₄。与预热和未加热CS的吸光值之间差异(A_450nm@45℃-A_450nm@23℃)最大的αB晶状体蛋白肽的一侧接受一个或两个具有较低吸光值差异的重叠肽的攻击，生成了表观峰。重叠的攻击肽在最大吸光度的肽上从高峰肽向N末端活C末端移动两个氨基酸。每个肽与部分未折叠CS和与天然CS的吸光度之间的差异(A_450nm@45℃-A_450nm@23℃)代表该肽与预热的未折叠CS之间的相互作用相对于该肽与未加热的天然CS之间相互作用的增加。当CS在45℃下预热15分钟后，在84个αB晶状体蛋白肽中，有72个肽与预热部分变性CS之间的相互作用有所增加(A_450nm@45℃-A_450nm@23℃＞0)，而剩余12个肽与天然CS或部分未折叠CS之间的相互作用类似(A_450nm@45℃-A_450nm@23℃～0)。每个峰位吸光度差异((A_450nm@45℃-A_450nm@23℃)最大的肽列于表4：第5列。肽与预热的CS的吸光值的增加表明，人类αB晶状体蛋白与预热的部分未折叠CS之间的相互作用要大于与未加热的天然CS之间的相互作用。

图18显示了人类αB晶状体蛋白肽与CS之间相互作用的图式。Y轴列出了顺序固定在96孔板的8-mer肽的氨基酸序列。每个肽与预热的、部分变性的CS和与未加热的天然CS的吸光度之间的差异(A_450nm@45℃-A_450nm@室温)代表该肽与预热的部分变性CS之间的相互作用相对于该肽与未加热的天然CS之间相互作用的增加或减少，被绘制为X轴上的水平柱。84个肽中，有72个肽与部分变性的CS之间的相互作用强于与天然CS之间的相互作用，而剩余12个肽与部分变性CS或天然CS之间的相互作用类似。αB晶状体蛋白肽与预热的未折叠CS之间的相互作用大于与未加热的天然CS之间的相互作用。吸光度差异(A_450nm@45℃-A_450nm@室温)小于0.11被视为基线。

表4：在含有未加热的和预热的β_H晶状体蛋白、γD晶状体蛋白、ADH和CS时，具有最大吸收的αB晶状体蛋白肽

结构域	β_H晶状体蛋白	γD晶状体蛋白	ADH	CS	共有
结构域	β_H晶状体蛋白	γD晶状体蛋白	ADH	CS	共有	N末端	-	₃IAIHHPWI₁₀	-	-	-
N末端	₉WIRRPFFP₁₆	₉WIRRPFFP₁₆	₉WIRRPFFP₁₆	₉WIRRPFFP₁₆	₉WIRRPFFPFHSP₂₀	N末端	-	₃IAIHHPWI₁₀	-	-	-
N末端	₉WIRRPFFP₁₆	₉WIRRPFFP₁₆	₉WIRRPFFP₁₆	₉WIRRPFFP₁₆	₉WIRRPFFPFHSP₂₀	N末端	-	₂₁PFFPFHSP₂₈	₂₁PFFPFHSP₂₈	₂₃FPFHSPSR₃₀	-
N末端	-	₂₅DQFFGEHL₃₂	₂₇FFGEHLLE₃₄	-	-	N末端	-	₂₁PFFPFHSP₂₈	₂₁PFFPFHSP₂₈	₂₃FPFHSPSR₃₀	-
N末端	-	₂₅DQFFGEHL₃₂	₂₇FFGEHLLE₃₄	-	-	N末端	-	-	₃₇LFPTSTSL₄₄	-	₄₃SLSPFYLRPPSFLRAP₅₈
N末端	₄₅SPFYLRPP₅₂	₄₃SLSPFYLR₅₀	₄₃SLSPFYLR₅₀	₄₃SLSPFYLR₅₀	-	N末端	-	-	₃₇LFPTSTSL₄₄	-	₄₃SLSPFYLRPPSFLRAP₅₈
N末端	₄₅SPFYLRPP₅₂	₄₃SLSPFYLR₅₀	₄₃SLSPFYLR₅₀	₄₃SLSPFYLR₅₀	-	N末端	₄₇FYLRPPSF₅₄	₄₇FYLRPPSF₅₄	₄₉LRPPSFLR₅₆	₄₇FYLRPPSF₅₄	-
N末端	₅₁PPSFLRAP₅₈	₅₃SFLRAPSW₆₀	-	₅₅LRAPSWFD₆₂	-	N末端	₄₇FYLRPPSF₅₄	₄₇FYLRPPSF₅₄	₄₉LRPPSFLR₅₆	₄₇FYLRPPSF₅₄	-
N末端	₅₁PPSFLRAP₅₈	₅₃SFLRAPSW₆₀	-	₅₅LRAPSWFD₆₂	-	核心结构域	₆₉RLEKDRFS₇₆	-	₆₉RLEKDRFS₇₆	-	₇₅FSVNLDVK₈₂
核心结构域	₇₅FSVNLDVK₈₂	₇₅FSVNLDVK₈₂	₇₅FSVNLDVK₈₂	₇₅FSVNLDVK₈₂	-	核心结构域	₆₉RLEKDRFS₇₆	-	₆₉RLEKDRFS₇₆	-	₇₅FSVNLDVK₈₂
核心结构域	₇₅FSVNLDVK₈₂	₇₅FSVNLDVK₈₂	₇₅FSVNLDVK₈₂	₇₅FSVNLDVK₈₂	-	核心结构域	₈₉LKVKVLGD₉₆	-	-	-	-
核心结构域	_1l3FISREFHR₁₂₀	₁₁₁HGFISREF₁₁₈	-	₁₁₃FISREFHR₁₂₀	₁₁₃FISREFHR₁₂₀	核心结构域	₈₉LKVKVLGD₉₆	-	-	-	-
核心结构域	_1l3FISREFHR₁₂₀	₁₁₁HGFISREF₁₁₈	-	₁₁₃FISREFHR₁₂₀	₁₁₃FISREFHR₁₂₀	核心结构域	₁₂₁KYRIPADV₁₂₈	₁₁₇EFHRKYRI₁₂₄	₁₁₅SREFHRKY₁₂₂	-	-
核心结构域	₁₃₁LTITSSLS₁₃₈	₁₃₁LTITSSLS₁₃₈	₁₃₁LTITSSLS₁₃₈	₁₃₁LTITSSLS₁₃₈	₁₃₁LTITSSLS₁₃₈	核心结构域	₁₂₁KYRIPADV₁₂₈	₁₁₇EFHRKYRI₁₂₄	₁₁₅SREFHRKY₁₂₂	-	-
核心结构域	₁₃₁LTITSSLS₁₃₈	₁₃₁LTITSSLS₁₃₈	₁₃₁LTITSSLS₁₃₈	₁₃₁LTITSSLS₁₃₈	₁₃₁LTITSSLS₁₃₈	核心结构域	₁₄₁GVLTVNGP₁₄₈	₁₄₁GVLTVNGP₁₄₈	₁₄₁GVLTVNGP₁₄₈	₁₄₃LTVNGPRK₁₅₀	₁₄₁GVLTVNGP₁₄₈
C末端	₁₅₇RTIPITRE₁₆₄	-	₁₅₇RTIPITRE₁₆₄	₅₇RHPITRE₁₆₄	₁₅₇RTIPITRE₁₆₄	核心结构域	₁₄₁GVLTVNGP₁₄₈	₁₄₁GVLTVNGP₁₄₈	₁₄₁GVLTVNGP₁₄₈	₁₄₃LTVNGPRK₁₅₀	₁₄₁GVLTVNGP₁₄₈

第1列列出了αB晶状体蛋白中的分子伴侣序列所属结构域。第2列列出了αB晶状体蛋白中针对人类β_H晶状体蛋白的活性序列。第3列列出了αB晶状体蛋白中针对人类γD晶状体蛋白的活性序列。第4列列出了αB晶状体蛋白中针对ADH的活性序列。第5列列出了αB晶状体蛋白中针对CS的晶状体蛋白肽分子伴侣序列。第6列列出了与3个或更多预热的分子伴侣靶蛋白相互作用的7个共有分子伴侣序列。

αB晶状体蛋白中负责分子伴侣功能的7个活性序列₉WIRRPFFPFHSP₂₀、₄₃SLSPFYLRPPSFLRAP₅₈、₇₅FSVNLDVK₈₂、₁₁₃FISREFHR₁₂₀、₁₃₁LTITSSLS₁₃₈、₁₄₁GVLTVNGP₁₄₈和₁₅₇RTIPITRE₁₆₄被鉴定为与经过45℃预热15分钟的分子伴侣靶蛋白ADH和CS以及生理蛋白β_H/γD晶状体蛋白之间相互作用最强的序列(表4：第6列)。2个伴侣活性序列位于N末端结构域，4个活性序列是保守的α晶状体蛋白核心结构域中的非重叠分子伴侣序列，1个非重叠分子伴侣序列位于αB晶状体蛋白中的C末端延伸结构域。

实施例9

活性序列的分子伴侣活性检测

位于α晶状体蛋白核心结构域的2个αB晶状体蛋白序列₇₃DRFSVNLDVKHFS₈₅和₁₃₁LTITSSLSDGV₁₄₁在针脚阵列中发现与预热的靶蛋白之间具有阳性相互作用，合成这两个序列来测定它们的体外分子伴侣活性。肽的分子伴侣活性是检测它们防止β_H晶状体蛋白、ADH和CS这三个分子伴侣靶蛋白热聚集的能力，分子侣活性检测在50℃下进行(图19)。非活性αB晶状体蛋白序列₁₁₁HGKHEERQDE₁₂₀作为分子伴侣测定中的阴性对照(图19)。基于近和远紫外圆二色谱，当β_H晶状体蛋白、ADH和CS在50℃下预热60分钟后，这3个靶蛋白未折叠排序为CS＞＞＞ADH＞＞β_H晶状体蛋白(图15和16)。在含有和不含每个肽时，β_H晶状体蛋白、ADH和CS的热聚集被测定为λ＝340nm处的光散射。每个肽的伴侣活性被计算为保护百分比，其中不含任何肽的每个靶蛋白的聚集被设为0％保护(图19)。活性肽序列₇₃DRFSVNLDVKHFS₈₅和₁₃₁LTITSSLSDGV₁₄₁是全部3个分子伴侣靶蛋白的有效聚集抑制剂。发现对靶蛋白CS有最大的保护，CS在50℃下加热后的未折叠最多。发现部分未折叠的靶蛋白β_H晶状体蛋白和ADH有较少的保护。肽∶β_H晶状体蛋白/ADH的摩尔比为50∶1时，对β_H晶状体蛋白和ADH产生保护均为约30％；而肽∶CS的摩尔比为10∶1时，能防止70％以上的CS热聚集。即使以50∶1的摩尔比，对照肽₁₁₁HGKHEERQDE₁₂₀也没有防止聚集。

图19显示了两个阳性活性序列₇₃DRFSVNLDVKHFS₈₅和₁₃₁LTITSSLSDGV₁₄₁以及一个来自人类αB晶状体蛋白的α晶状体蛋白核心结构域的非活性序列₁₁₁HGKHEERQDE₁₂₀(对照)的分子伴侣活性检测。A(左上)：不含肽的分子伴侣靶蛋白β_H晶状体蛋白、ADH和CS的热聚集被测定为λ＝340nm下的光散射。每个靶蛋白在不含或含有一个肽时在50℃下加热60分钟。通过近和远紫外圆二色谱发现，聚集量与未折叠的量有关。三个靶蛋白中最耐热的β_H晶状体蛋白聚集最少，60分钟内的最大吸光度为0.05AU，然后是ADH和CS，最大吸光度分别为0.23AU和0.72AU(未折叠量/聚集量：CS＞ADH＞β_H晶状体蛋白)。每个肽的分子伴侣活性被计算为保护百分比，其中每个靶蛋白在不含任何肽时的聚集被设为0％保护。在体外检测了₇₃DRFSVNLDVKHFS₈₅、₁₃₁LTITSSLSDGV₁₄₁和₁₁₁HGKHEERQDE₁₂₀防止β_H晶状体蛋白(B：右上)、ADH(C：左下)和CS(D：右下)热聚集的能力。肽∶靶蛋白摩尔比为50∶1的两个阳性肽产生了对β_H晶状体蛋白和ADH的中度保护，而对照肽没有保护能力。肽∶靶蛋白摩尔比为10∶1的₇₃DRFSVNLDVKHFS₈₅和₁₃₁LTITSSLSDGV₁₄₁足以显著防止CS的聚集。对照肽₁₁₁HGKHEERQDE₁₂₀具有部分防止CS聚集的作用。

实施例10

为人类αB晶状体蛋白的立体结构描绘分子伴侣的位置

根据电子自旋共振(ESR)和同一性模拟数据(图20)，推测出蛋白质针脚阵列所识别的在人类αB晶状体蛋白中负责分子伴侣功能的活性结构域的7个序列的二级结构。N末端结构域中的₉WIRRPFFPFHSP₂₀、α晶状体蛋白核心结构域的环部的₁₁₃FISREFHR₁₂₀和C末端结构域中的₁₅₇RTIPITRE₁₆₄是非结构化基序，而₄₃SLSPFYLR₅₀(α3)和₄₇FYLRPPSF₅₄(α4)形成了N末端结构域中的螺旋-转角-螺旋基序。其他肽₇₅FSVNLDVK₈₂(β3)、₁₃₁LTITSSLS₁₃₈(β8)和₁₄₁GVLTVNGP₁₄₈(β9)形成了α晶状体蛋白核心结构域中的3个β折叠股基序(图20)。

图20显示了使用人αB晶状体蛋白针脚阵列检测所识别的肽与之前报道的αB晶状体蛋白活性序列之间的比较。盒内的序列是利用蛋白质针脚阵列所确定的对伴侣活性重要的活性结构域。灰色阴影区是通过蛋白质针脚阵列所确定的亚基-亚基相互作用的位置。改变了人αB晶状体蛋白的分子伴侣功能的位点特异性突变显示在被取代或删除的残基下方(△)。图中显示了通过ESR和同一性模拟所预测的αB晶状体蛋白的二级结构，～代表单环，■代表β折叠股(Ghosh和Clark，Protein Sci 14：684-95，2005；Guruprasad and Kumari，Int J Biol Macromol 33：107-12，2003；Koteiche等人，Biochemistry 37：12681-8，1998)。所有报道的对αB晶状体蛋白的伴侣活性有影响的点突变与针脚阵列检测所识别的负责分子伴侣功能的共有序列相重叠。所述序列显示为斜体(Sreelakshmi等人，Biochemistry 43：15785-95，2004)

将所发现的活性结构域绘制成αB晶状体蛋白的计算机立体同源模型，来识别活性分子伴侣序列的立体结构(图21a)。生成经过空间填充的人类αB晶状体蛋白模型来观察并分析αB晶状体蛋白中负责分子伴侣功能的活性结构域(图21b)。β3、β8和β9这三个活性序列似乎形成了α晶状体蛋白核心结构域的外表面，α晶状体蛋白核心结构域是一个类似免疫球蛋白样折叠的β夹心结构，该结构是小热激蛋白的特征。内部导向的B折叠股残基稳定了β夹心的结构。外部导向的侧链促成了与分子伴侣靶蛋白之间的相互作用。N末端和C末端中的残基似乎没有直接参与α晶状体蛋白核心结构域的三级结构。核心结构域序列₁₁₃FISREFHR₁₂₀形成了环部的一部分，该所述环部连接核心结构域的两个β折叠且有助于其结构的完整性。N末端活性序列的暴露残基的可及表面区域被计算为有71％的疏水性，C末端延伸结构域有69％是疏水性的，α晶状体蛋白核心结构域有64％是疏水性的。活性序列疏水性表面的比例符合sHSP分子伴侣对未折叠蛋白识别过程中疏水性相互作用的重要性(Sharma等人，J Biol Chem275：3767-71，2000；Sharma等人，Biochem Biophys Res Commun 239：217-22，1997；Sharma等人，J Biol Chem 273：15474-8，1998；Sharma等人，J Biol Chem 273：8965-70，1998；Singh和Rao Ch，FEBS Lett 527：234-8，2002；Srinivas等人，Mol Vis7：114-9，2001；Rajaraman等人，FEBS Lett 497：118-23，2001)。

图21显示了αB晶状体蛋白活性结构域的立体图。针脚阵列所识别的人类αB晶状体蛋白的活性结构域为红色，而非活性结构域为蓝色。A(左)：人类αB晶状体蛋白二级结构和三级结构的带状图。序列₉WIRRPFFPFHSP₂₀、₁₁₃FISREFHR₁₂₀和₁₅₇RTIPITRE₁₆₄不具有二级结构。序列₄₃SLSPFYLRPPSFLRAP₅₈形成了α3-转角-α4基序，而序列₇₅FSVNLDVK₈₂、₁₃₁LTITSSLS₁₃₈、₁₄₁GVLTVNGP₁₄₈分别形成了β折叠股基序β3、β8和β9。B(右)：人类αB晶状体蛋白立体结构的实体模型。活性结构域₉WIRRPFFPFHSP₂₀、₄₃SLSPFYLRPPSFLRAP₅₈、₇₅FSVNLDVK₈₂、₁₁₃FISREFHR₁₂₀、₁₃₁LTITSSLS₁₃₈、₁₄₁GVLTVNGP₁₄₈和₁₅₇RTIPITRE₁₆₄中的溶剂可及性残基表面为粉色。αB晶状体蛋白非活性结构域中的残基表面为灰色。N末端序列₉WIRRPFFPFHSP₂₀和₄₃SLSPFYLRPPSFLRAP₅₈的全部可及性表面的72％是疏水性的。A晶状体蛋白核心结构域序列₇₅FSVNLDVK₈₂(β3)、₁₃₁LTITSSLS₁₃₈(β8)和₁₄₁GVLTVNGP₁₄₈(β9)的全部可及性表面的67％是疏水性的。环部序列₁₁₃FISREFHR₁₂₀有61％是疏水性的，C末端延伸序列₁₅₇RTIPITRE₁64有59％是疏水性的。

实施例11

具有分子伴侣活性的人类αB晶状体蛋白的活性多肽序列

小热激蛋白(sHSP)是一个弹性蛋白家族，是分子量为43kDa以下的分子伴侣，含有长度和基本序列可变的N末端结构域、保守的α晶状体蛋白结构域和C末端延伸结构域，C末端延伸结构域含有高度保守的I-X-I/V氨基酸基序。在本研究中，蛋白质针脚阵列使用内源性靶蛋白β_H/γD晶状体蛋白和非生理性靶蛋白ADH和CS，识别了对人类αB晶状体蛋白的分子伴侣活性重要的7个活性序列₉WIRRPFFPFHSP₂₀、₄₃SLSPFYLRPPSFLRAP₅₈、₇₅FSVNLDVK₈₂、₁₁₃FISREFHR₁₂₀、₁₃₁LTITSSLS₁₃₈、₁₄₁GVLTVNGP₁₄₈和₁₅₇RTIPITRE₁₆₄。尽管，αB晶状体蛋白与天然β_H晶状体蛋白和γD晶状体蛋白之间相互作用(需要二级结构)可能逃避蛋白质针脚阵列的检测，但是针脚阵列识别了在αB晶状体蛋白与天然β_H晶状体蛋白和γD晶状体蛋白之间相互作用中涉及的大多数序列。针脚阵列所识别的活性序列不是人类αB晶状体蛋白针脚阵列中最具疏水性的肽。根据生产商提供的疏水性值，活性肽₉WIRRPFFPFHSP₂₀、₄₃SLSPFYLRPPSFLRAP₅₈和₁₃₁LTITSSLS₁₃₈的疏水性很强。人类αB晶状体蛋白针脚阵列中的14个非活性肽比其余的活性肽₇₅FSVNLDVK₈₂、₁₁₃FISREFHR₁₂₀、₁₄₁GVLTVNGP₁₄₈和₁₅₇RTIPITRE₁₆₄疏水性更强(Ghosh和Clark，Protein Sci 14：684-95，2005)。

远紫外圆二色谱分析表明，β_H晶状体蛋白和γD晶状体蛋白在45℃加热15分钟后二级结构损失＜10％。但是，β_H晶状体蛋白和γD晶状体蛋白在远紫外圆二色谱图中的吸收峰值下降20-25％，这表明了这些蛋白质的三级结构中的构象变化。当远紫外圆二色谱测定β_H晶状体蛋白和γD晶状体蛋白不存在明显未折叠和二级结构损失时，活性αB晶状体蛋白肽与预热的β_H晶状体蛋白和γD晶状体蛋白之间的相互作用增加，这表明αB晶状体蛋白活性结构域检测到了三级结构中的构象变化，这种变化产生于预热的β_H晶状体蛋白和γD晶状体蛋白。针脚阵列在检测未折叠蛋白质三级结构中的扰动方面与近紫外圆二色谱一样灵敏。

在7个伴侣序列中，2个位于N末端，4个位于保守的α晶状体蛋白核心结构域，1个位于含有高度保守的I-X-I/V氨基酸基序的C末端延伸结构域。针脚阵列结果表明，活性结构域内的点突变预期会改变αB晶状体蛋白的伴侣活性，而活性结构域外的点突变预期对伴侣活性影响很小或没有影响。虽然目前还没有报道关于使用针脚阵列所识别的序列基序的系统性研究，但文献结果表明，针脚阵列所识别的序列对于人类αB晶状体蛋白的分子伴侣样活性而言是重要的(Muchowski等人.，J Mol Biol 289：397-411，1999；Gupta和Srivastava，Invest Ophthalmol Vis Sci 45：206-14，2004；Liao等人，Biochem Biophys Res Commun 297：309-16，2002；Kumar等人，JBiol Chem 274：24137-41，1999；Horwitz等人，Int J Biol Macromol 22：263-9，1998；Plater等人，J Biol Chem 271：28558-66，1996；Derham等人，EurJ Biochem 268：713-21，2001)。与完整长度的αB晶状体蛋白相比，αB晶状体蛋白的突变(其中，C末端延伸结构域的缺失包括精氨酸157)导致了体外伴侣活性的降低(Thampi和Abraham，Biochemistry 42：11857-63，2003)。精氨酸157存在于针脚阵列所识别的₁₅₇RTIPITRE₁₆₄分子伴侣序列中。对αB晶状体蛋白截断变异体(αB晶状体蛋白57-157)的X射线溶液散射表明，在不含N末端和C末端延伸结构域时，α晶状体蛋白结构域形成了二聚体，在体外的分子伴侣样活性比完整αB晶状体蛋白相比有所降低(Feil等人，J Biol Chem 276：12024-9，2001)。当合成α晶状体蛋白核心结构域的两个共有分子伴侣序列₇₃DRFSVNLDVKHFS₈₅和₁₃₁LTITSSLSDGV₁₄₁，并在体外测试其防止伴侣靶蛋白β_H晶状体蛋白、ADH和CS的未折叠和热聚集的能力时，发现有实质上的保护作用。分子伴侣活性检测证实，针脚阵列所识别的序列对于αB晶状体蛋白的分子伴侣活性是重要的并与早期的研究相一致，在早期研究中，疏水性探针和伴侣活性检测将αB晶状体蛋白₇₃DRFSVNLDVK₈₂识别为分子伴侣活性序列(Sharma等人.，J Biol Chem 279：6027-34，2004)。在αB晶状体蛋白的活性序列中选择的点突变或组合突变预期会提高或降低伴侣活性。与防止CS聚集所需浓度相比较，这两个肽需要有更高的浓度来防止β_H晶状体蛋白和ADH的聚集。圆二色谱分析表明，50℃下，β_H晶状体蛋白部分未折叠，而ADH和CS都几乎是完全未折叠。总而言之，伴侣活性检测和圆二色谱数据表明，肽在防止完全未折叠的蛋白质聚集中比防止部分折叠或天然蛋白质聚集更加有效。

使用针脚阵列所识别的活性序列被绘成αB晶状体蛋白的立体模型，来分析分子伴侣界面的局部结构(Ghosh和Clark，Protein Sci 14：684-95，2005)。在缺乏X射线晶体或NMR结构时，发现计算的αB晶状体蛋白同源模型与Mj sHSP16.5和小麦sHSP16.9的晶体结构有显著的重叠，α晶状体蛋白核心结构域的Cα标准差为2.06

(Kim等人，Nature 394：595-9，1998；van Montfort等人.，Nat Struct Biol 8：1025-30，2001)。根据电子顺磁共振数据(EPR)以及人类αB晶状体蛋白与小麦sHSP16.9和Mj sHSP16.5晶体结构之间的多重序列比对，推测出针脚阵列所识别的活性序列的二级结构(Kim等人，Nature 394：595-9，1998；van Montfort等人，Nat Struct Biol8：1025-30，2001；Koteiche和McHaourab，J Mol Biol 294：561-77，1999；Koteiche等人，Biochemistry 37：12681-8，1998)。N末端分子伴侣序列₉WIRRPFFPFHSP₂₀是非结构化的并形成一个具有70％疏水性的表面，而序列₄₃SLSPFYLRPPSF₅₄形成了螺旋-转角-螺旋基序，其外表面具有72％的疏水性并有利于结合未折叠蛋白的暴露的小块疏水性表面。α晶状体蛋白核心结构域的4个序列中的3个序列-₇₅FSVNLDVK₈₂(β3)、₁₃₁LTITSSLS₁₃₈(β8)和₁₄₁GVLTVNGP₁₄₈(β9)是β折叠股，形成了具有67％疏水性的表面。含有高度保守的I-X-I/V基序的C末端分子伴侣序列₁₅₇RTIPITRE₁₆₄是非结构化的并形成了具有59％疏水性的表面。该报道中确定的分子伴侣序列₄₃SLSPFYLRPPSF₅₄、₇₅FSVNLDVK₈₂、₁₃₁LTITSSLS₁₃₈、₁₄₁GVLTVNGP₁₄₈和₁₅₇RTIPITRE₁₆₄与之前使用蛋白质针脚阵列确定为αB晶状体蛋白中亚基-亚基相互作用位点的序列显著重叠(图20：阴影残基)(Ghosh和Clark，Protein Sci 14：684-95，2005)。针脚阵列所识别的序列₄₃SLSPFYLRPPSF₅₄是序列₄₂TSLSPFYLRPPSFLRA₅₇的亚基，之前被报道为αB晶状体蛋白中与人类αA晶状体蛋白相互作用的活性结构域(Sreelakshmi等人.，Biochemistry 43：15785-95，2004；Lentze和Narberhaus，Biochem Biophys Res Commun 325：401-7，2004)。防止β_H晶状体蛋白、ADH和CS聚集的两个合成肽₇₃DRFSVNLDVKHFS₈₅和₁₃₁LTITSSLSDGV₁₄₁之前都被识别为负责αB晶状体蛋白中亚基-亚基相互作用的活性序列(Ghosh和Clark，Protein Sci 14：684-95，2005)。这些结果表明，αB晶状体蛋白中的活性序列在亚基组装和伴侣功能中具有双重作用，这与之前的突变数据一致，其中伴侣功能的损失伴随着组装大小的减少(Saha和Das，Proteins 57：610-7，2004；Feil和Augustin，Biochem BiophysRes Commun 247：38-45，1998)。通过针脚阵列对αB晶状体蛋白中负责亚基-亚基相互作用和伴侣活性的共有序列的识别表明，那些能结合未折叠伴侣靶蛋白的分子伴侣序列的暴露可能需要αB晶状体蛋白复合物的分解。这种假设符合之前关于寡聚平衡在调节HSP27和αB晶状体蛋白分子伴侣活性中的作用的研究(Shashidharamurthy等人，J Biol Chem 280：5281-9，2005；Srinivas等人，Mol Vis 11：249-55，2005)。Shashidharamurthy等人报道，与去稳定的T4溶菌酶突变株之间的相互作用需要HSP27寡聚物的分解(Shashidharamurthy等人，J Biol Chem 280：5281-9，2005)。Srinivas等人报道，盐酸精氨酸通过增加亚基-亚基动力而提高了αB晶状体蛋白的分子伴侣活性(Srinivas等人，Mol Vis 11：249-55，2005)。

C.elegans的小热激蛋白(sHSP12.2、sHSP12.3和sHSP12.6)中缺乏类似于αB晶状体蛋白N末端和C末端分子伴侣序列₉WIRRPFFPFHSP₂₀、₄₃SLSPFYLRPPSFLRAP₅₈和₁₅₇RTIPITRE₁₆₄的活性序列，这可以解释C.elegans的小热激蛋白在体外缺乏分子伴侣样活性的原因(Kokke等人，FEBS Lett 433：228-32，1998)。由α晶状体蛋白核心结构域的肽₇₅FSVNLDVK₈₂(β3)、₁₃₁LTITSSLS₁₃₈(β8)、₁₄₁GVLTVNGP ₁₄₈(β9)形成的界面之前被针脚阵列识别为负责人类αB晶状体蛋白亚基组装的界面，所述肽与全部四种分子伴侣靶蛋白相互作用并一起形成了具有67％疏水性的外表面(Ghosh和Clark，Protein Sci 14：684-95，2005)。该界面为疏水性和亲水性的相互作用都提供了天然蛋白质(αA和αB晶状体蛋白)以及未折叠的分子伴侣靶蛋白(β_H晶状体蛋白、γD晶状体蛋白)。α晶状体蛋白核心结构域的结构在小热激蛋白家族中是高度保守的，其他小热激蛋白中与αB晶状体蛋白伴侣序列₇₅FSVNLDVK₈₂、₁₁₃FISREFHR₁₂₀、₁₃₁LTITSSLS₁₃₈、₁₄₁GVLTVNGP₁₄₈同源的序列预期会参与其他小热激蛋白的伴侣功能。总之，针脚阵列、体外分子伴侣活性检测和靶蛋白的圆二色谱识别了在完整αB晶状体蛋白中负责与广泛靶蛋白相互作用的序列，所述靶蛋白包括那些几乎完全未折叠的蛋白(ADH和CS)和那些部分未折叠的蛋白(β_H晶状体蛋白和γD晶状体蛋白)。蛋白质针脚阵列有效识别了人类αB晶状体蛋白中的蛋白质-蛋白质相互作用区域，它们在寡聚物组装以及与未折叠的分子伴侣靶蛋白相互作用中是重要的。对包括人类sHSP27和结核分支杆菌(Mycobacterium tuberculosis)sHSP16.3在内的生理学相关的小热激蛋白中活性结构域的特定序列和立体结构的进一步研究，将提供新的关于sHSP和分子伴侣在疾病中功能的信息。目前的结果表明，sHSP对蛋白质未折叠的共同反应涉及几个活性结构域，sHSP对蛋白质未折叠是相当敏感的。这些结果可以说明小热激蛋白的选择性和灵敏性以及它们对特定细胞需求的适应性和对应激的反应。

实施例12

αB晶状体蛋白和5个αB晶状体蛋白衍生的肽对Aβ或γD晶状体蛋白纤维化的影响。

Aβ硫磺素T荧光。在含有和不含αB晶状体蛋白和肽情况中，在类似于之前描述的含有αB晶状体蛋白时的条件下培养Aβ原纤维(Bakthisaran等人，Biochem J，2005)。肽在三氟乙醇(TFE)中溶解至9.1mM，然后在50mM PBS(100mM NaCl，pH7.4)中稀释为0.91mM的分子伴侣肽贮存液。将3.5mg硫磺素T溶于100μl的50mM甘氨酸溶液(pH8.5)中。制备1mg/ml(0.22mM)的Aβ贮存液。将20μl Aβ贮存液、50μl分子伴侣肽贮存液、2μl硫磺素T溶液与28μl的50mM PBS(100mM NaCl，pH7.4)混合。使用Beckman Coultier DTX 880多方式检测器读取荧光。样品在50℃下加热72小时后再次进行荧光检测。

γD晶状体蛋白硫磺素T荧光。采用与γ晶状体蛋白相同的方式形成γD晶状体蛋白原纤维(Meehan等人，J Biol Chem 279：3413-3419，2004)。于TFE中将肽溶解成9.1mM，并在10％TFE(pH2.0)中稀释成0.91mM的分子伴侣肽贮存液。将3.5mg硫磺素T溶于100μl的50mM甘氨酸溶液(pH8.5)中。制备1mg/ml(0.22mM)的Aβ贮存液。将20μl Aβ贮存液、5μl分子伴侣肽贮存液、2μl硫磺素T溶液与73μl的10％TFE(pH2.0)混合制成。使用Beckman Coultier DTX 880多方式检测器读取荧光。样品在50℃下加热72小时后再次进行荧光检测。

分子伴侣活性检测。使用之前建立的方法(有小的调整)对5个肽进行分子伴侣活性检测(Muchowski等人，J Mol Biol 289：397-411，1999)。分子伴侣：靶蛋白的1∶1的单体摩尔比被确定为最佳比例，所有随后的β3变异体的分子伴侣活性检测都以该比例在96孔ELISA微孔板中重复3次。0.1摩尔的分子伴侣和β_L晶状体蛋白在总体积为200μl的缓冲液(5mM PBS，pH 7.0)中混合。加热前(时间＝0)，使用MCC/340读板器测定λ＝340nm处的光散射。第一次读板后，孔板在50℃下加热1小时，期间每隔15分钟读板一次。

表5显示了在不含或含有野生型αB晶状体蛋白和5个αB晶状体蛋白衍生肽时，Aβ或γD晶状体蛋白的荧光。

表5

	分子量	Δ_荧光(Aβ)	Δ_荧光(γD晶状体蛋白)
	分子量	Δ_荧光(Aβ)	Δ_荧光(γD晶状体蛋白)	不含分子伴侣	-	1，324，974，048	888，803，840
αB晶状体蛋白	20159	318，471，040	1，079，141，056	不含分子伴侣	-	1，324，974，048	888，803，840
αB晶状体蛋白	20159	318，471，040	1，079，141，056	STSLSPFYLRPPSFLRAP	2036	478，389，568	606，290，176
DRFSVNLDVKHFS	1564	264，396，672	661，038，176	STSLSPFYLRPPSFLRAP	2036	478，389，568	606，290，176
DRFSVNLDVKHFS	1564	264，396，672	661，038，176	HGKHEERQDE	1264	796，478，624	734，394，240
LTITSSLSSDGV	1092	352，301，312	675，352，992	HGKHEERQDE	1264	796，478，624	734，394，240
LTITSSLSSDGV	1092	352，301，312	675，352，992	ERTIPITRE	1114	576，742，720	611，017，728

图22显示了αB晶状体蛋白和5个αB晶状体蛋白衍生肽对Aβ纤维化的影响。Aβ纤维化被检测为溶液中荧光染料硫磺素T的荧光，所述溶液中含有的Aβ：肽的单体摩尔比为1∶10。当不含Aβ原纤维时，硫磺素T很少或没有荧光。在不含任何其他分子时，与Aβ原纤维结合72小时后的硫磺素T的荧光被设定为100％。DR肽对Aβ纤维化的影响最强，HG肽对Aβ纤维化的影响最弱。纤维形成＝Δ_荧光Aβ(含分子伴侣)*100/Δ_荧光Aβ(不含分子伴侣)。

图23显示了αB晶状体蛋白和5个αB晶状体蛋白衍生肽对γD晶状体蛋白纤维化的影响。γD晶状体蛋白纤维化被检测为溶液中荧光染料硫磺素T的荧光，所述溶液中含有的γD晶状体蛋白：肽的单体摩尔比为1∶10。当不含原纤维时，硫磺素很少或没有荧光。在不含任何其他分子时，与γD晶状体蛋白原纤维结合72小时后的硫磺素T的荧光被设定为100％。ST肽对γD晶状体蛋白纤维化的影响最强，野生型αB晶状体蛋白对γD晶状体蛋白纤维化的影响最弱。纤维形成＝Δ_荧光γD晶状体蛋白(含分子伴侣)*100/Δ_荧光γD晶状体蛋白(不含分子伴侣)。

图24显示了5个αB晶状体蛋白衍生肽的分子伴侣活性检测。这些肽抑制β_L晶状体蛋白热聚集的能力被分光光度测定为溶液在λ＝340nm处的光散射，溶液中含有的靶蛋白：肽的单体摩尔比为1∶10。在不含β_L晶状体蛋白时，肽的光散射与单独的缓冲液相类似，这表明肽在加热后没有聚集。HG肽对β_L晶状体蛋白聚集的影响最强，ST肽对β_L晶状体蛋白聚集的影响最弱。DR肽、LT肽和ER肽的分子伴侣活性与HG相同或稍微低一些。

本发明说明书使本领域技术人员能够在不背离本发明的精神和范围和无本文所述的预期实验结果的情况下于宽范围的等效参数、浓度和条件下实施本发明。

虽然本发明的描述中结合了一些特定实施方案，但可以理解，这些实施方案还能够进一步改进。本申请意在覆盖根据本发明的原则对本发明进行的任何改变、应用或改进，包括利用本发明所属领域内已知或惯用的手段并可应用于下文所述权利要求范围内的必要技术特征而对本发明公开内容做出的偏离。

本文引用的所有参考文献，包括杂志文章或摘要、公开的或相应的美国或外国专利申请、授权的美国或外国专利或任何其他参考文献，都以引用的方式整体并入文本，包括所引用文献中全部的数据、表格、附图和文字。另外，本文引用的参考文献中所引用的参考文献的全部内容也以引用方式整体并入本文。

Claims

1. 一种多肽，其为X₁-WIRRPFFPFHSP-X₂、X₁-WIRRPFFP-X₂、X₁-PFFPFHSP-X₂、X₁-FPFHSPSR-X₂、X₁-DQFFGEHL-X₂、X₁-FFGEHLLE-X₂或X₁-IAIHHPWI-X₂，或者它们的功能性变异体或模拟物，其中，X₁和X₂各自相互独立地代表具有n个氨基酸的任意氨基酸序列，其中n为0-50，并且X₁和X₂中的n可以相同或不同。

2. 权利要求1所述的多肽，其中所述功能性变异体或模拟物为保守性氨基酸取代或拟肽取代。

3. 权利要求1所述的多肽，其中所述功能性变异体有约70％或更高比例的氨基酸序列与X₁-WIRRPFFPFHSP-X₂、X₁-WIRRPFFP-X₂、X₁-PFFPFHSP-X₂、X₁-FPFHSPSR-X₂、X₁-DQFFGEHL-X₂、X₁-FFGEHLLE-X₂或X₁-IAIHHPWI-X₂相同。

4. 一种多肽，其为X₁-SLSPFYLRPPSFLRAP-X₂、X₁-SPFYLRPP-X₂、X₁-SLSPFYLR-X₂、X₁-FYLRPPSF-X₂、X₁-LRPPSFLR-X₂、X₁-PPSFLRAP-X₂、X₁-SFLRAPSW-X₂、X₁-LRAPSWFD-X₂，或者它们的功能性变异体或模拟物，其中，X₁和X₂各自相互独立地代表具有n个氨基酸的任意氨基酸序列，其中n为0-50，并且X₁和X₂中的n可以相同或不同。

5. 权利要求4所述的多肽，其中所述功能性变异体或模拟物为保守性氨基酸取代或拟肽取代。

6. 权利要求4所述的多肽，其中所述功能性变异体有约70％或更高比例的氨基酸序列与X₁-SLSPFYLRPPSFLRAP-X₂、X₁-SPFYLRPP-X₂、X₁-SLSPFYLR-X₂、X₁-FYLRPPSF-X₂、X₁-LRPPSFLR-X₂、X₁-PPSFLRAP-X₂、X₁-SFLRAPSW-X₂、X₁-LRAPSWFD-X₂相同。

7. 一种多肽，其为X₁-RLEKDRFS-X₂、X₁-FSVNLDVK-X₂、X₁-LKVKVLGD-X₂、X₁-FISREFHR-X₂、X₁-HGFISREF-X₂、X₁-KYRIPADV-X₂、X₁-EFHRKYRI-X₂、X₁-SREFHRKY-X₂、X₁-LTITSSLS-X₂、X₁-GVLTVNGP-X₂或X₁-LTVNGPRK-X₂，或者它们的功能性变异体或模拟物，其中，X₁和X₂各自相互独立地代表具有n个氨基酸的任意氨基酸序列，其中n为0-50，并且X₁和X₂中的n可以相同或不同。

8. 权利要求7所述的多肽，其中所述功能性变异体或模拟物包括保守性氨基酸取代或拟肽取代。

9. 权利要求7所述的多肽，其中所述功能性变异体有约70％或更高比例的氨基酸序列与X₁-RLEKDRFS-X₂、X₁-FSVNLDVK-X₂、X₁-LKVKVLGD-X₂、X₁-FISREFHR-X₂、X₁-HGFISREF-X₂、X₁-KYRIPADV-X₂、X₁-EFHRKYRI-X₂、X₁-SREFHRKY-X₂、X₁-LTITSSLS-X₂、X₁-GVLTVNGP-X₂或X₁-LTVNGPRK-X₂相同。

10. 一种多肽，其为X₁-RTIPITRE-X₂或者它的功能性变异体或模拟物，其中，X₁和X₂各自相互独立地代表具有n个氨基酸的任意氨基酸序列，其中n为0-50，并且X₁和X₂中的n可以相同或不同。

11. 权利要求10所述的多肽，其中所述功能性变异体或模拟物包括保守性氨基酸取代或拟肽取代。

12. 权利要求10所述的多肽，其中所述功能性变异体有约70％或更高比例的氨基酸序列与X₁-RTIPITRE-X₂相同。

13. 权利要求12所述的多肽，其中所述功能性变异体含有I-X-I/V氨基酸基序。

14. 一种用于治疗哺乳动物受治疗者的蛋白质构象疾病的方法，其包括给有相应需要的受治疗者施用一种多肽，其中所述多肽是X₁-WIRRPFFPFHSP-X₂、X₁-WIRRPFFP-X₂、X₁-PFFPFHSP-X₂、X₁-FPFHSPSR-X₂、X₁-DQFFGEHL-X₂、X₁-FFGEHLLE-X₂、X₁-IAIHHPWI-X₂、X₁-SLSPFYLRPPSFLRAP-X₂、X₁-SPFYLRPP-X₂、X₁-SLSPFYLR-X₂、X₁-FYLRPPSF-X₂、X₁-LRPPSFLR-X₂、X₁-PPSFLRAP-X₂、X₁-SFLRAPSW-X₂、X₁-LRAPSWFD-X₂、X₁-RLEKDRFS-X₂、X₁-FSVNLDVK-X₂、X₁-LKVKVLGD-X₂、X₁-FISREFHR-X₂、X₁-HGFISREF-X₂、X₁-KYRIPADV-X₂、X₁-EFHRKYRI-X₂、X₁-SREFHRKY-X₂、X₁-LTITSSLS-X₂、X₁-GVLTVNGP-X₂、X₁-LTVNGPRK-X₂或X₁-RTIPITRE-X₂，或者它们的功能性变异体或模拟物，其中X₁和X₂各自相互独立地代表具有n个氨基酸的任意氨基酸序列，其中n为0-50，X₁和X₂中的n可以相同或不同。

15. 权利要求14所述的方法，其中所述功能性变异体或模拟物包括保守性氨基酸取代或拟肽取代。

16. 权利要求14所述的方法，其中所述功能性变异体有约70％或更高比例的氨基酸序列与X₁-WIRRPFFPFHSP-X₂、X₁-WIRRPFFP-X₂、X₁-PFFPFHSP-X₂、X₁-FPFHSPSR-X₂、X₁-DQFFGEHL-X₂、X₁-FFGEHLLE-X₂、X₁-IAIHHPWI-X₂、X₁-SLSPFYLRPPSFLRAP-X₂、X₁-SPFYLRPP-X₂、X₁-SLSPFYLR-X₂、X₁-FYLRPPSF-X₂、X₁-LRPPSFLR-X₂、X₁-PPSFLRAP-X₂、X₁-SFLRAPSW-X₂、X₁-LRAPSWFD-X₂、X₁-RLEKDRFS-X₂、X₁-FSVNLDVK-X₂、X₁-LKVKVLGD-X₂、X₁-FISREFHR-X₂、X₁-HGFISREF-X₂、X₁-KYRIPADV-X₂、X₁-EFHRKYRI-X₂、X₁-SREFHRKY-X₂、X₁-LTITSSLS-X₂、X₁-GVLTVNGP-X₂、X₁-LTVNGPRK-X₂或X₁-RTIPITRE-X₂相同。

17. 权利要求16所述的方法，其中所述多肽X₁-RTIPITRE-X₂的功能性变异体含有I-X-I/V氨基酸基序。

18. 权利要求10所述的方法，其中所述疾病是亚历山大病、阿尔茨海默病、克-雅病、帕金森病、亨廷顿病、白内障、色素性视网膜炎、朊病毒病或疯牛病。

19. 权利要求10所述的方法，其中所述疾病是年龄相关性肌病。

20. 权利要求10所述的方法，其中所述疾病是心脏局部缺血。

21. 一种用于治疗哺乳动物受治疗者的蛋白质构象疾病的方法，其包括施用编码一种多肽的核苷酸，其中所述多肽是X₁-WIRRPFFPFHSP-X₂、X₁-WIRRPFFP-X₂、X₁-PFFPFHSP-X₂、X₁-FPFHSPSR-X₂、X₁-DQFFGEHL-X₂、X₁-FFGEHLLE-X₂、X₁-IAIHHPWI-X₂、X₁-SLSPFYLRPPSFLRAP-X₂、X₁-SPFYLRPP-X₂、X₁-SLSPFYLR-X₂、X₁-FYLRPPSF-X₂、X₁-LRPPSFLR-X₂、X₁-PPSFLRAP-X₂、X₁-SFLRAPSW-X₂、X₁-LRAPSWFD-X₂、X₁-RLEKDRFS-X₂、X₁-FSVNLDVK-X₂、X₁-LKVKVLGD-X₂、X₁-FISREFHR-X₂、X₁-HGFISREF-X₂、X₁-KYRIPADV-X₂、X₁-EFHRKYRI-X₂、X₁-SREFHRKY-X₂、X₁-LTITSSLS-X₂、X₁-GVLTVNGP-X₂、X₁-LTVNGPRK-X₂或X₁-RTIPITRE-X₂，或者它们的功能性变异体或模拟物，其中X₁和X₂各自相互独立地代表具有n个氨基酸的任意氨基酸序列，其中n为0-50，并且X₁和X₂中的n可以相同或不同。

22. 权利要求21所述的方法，其中所述功能性变异体或模拟物包括保守性氨基酸取代或拟肽取代。

23. 权利要求21所述的方法，其中所述功能性变异体有约70％或更高比例的氨基酸序列与X₁-WIRRPFFPFHSP-X₂、X₁-WIRRPFFP-X₂、X₁-PFFPFHSP-X₂、X₁-FPFHSPSR-X₂、X₁-DQFFGEHL-X₂、X₁-FFGEHLLE-X₂、X₁-IAIHHPWI-X₂、X₁-SLSPFYLRPPSFLRAP-X₂、X₁-SPFYLRPP-X₂、X₁-SLSPFYLR-X₂、X₁-FYLRPPSF-X₂、X₁-LRPPSFLR-X₂、X₁-PPSFLRAP-X₂、X₁-SFLRAPSW-X₂、X₁-LRAPSWFD-X₂、X₁-RLEKDRFS-X₂、X₁-FSVNLDVK-X₂、X₁-LKVKVLGD-X₂、X₁-FISREFHR-X₂、X₁-HGFISREF-X₂、X₁-KYRIPADV-X₂、X₁-EFHRKYRI-X₂、X₁-SREFHRKY-X₂、X₁-LTITSSLS-X₂、X₁-GVLTVNGP-X₂、X₁-LTVNGPRK-X₂或X₁-RTIPITRE-X₂相同。

24. 权利要求23所述的方法，其中所述多肽X₁-RTIPITRE-X₂的功能性变异体含有I-X-I/V氨基酸基序。

25. 权利要求21所述的方法，其中所述疾病是亚历山大病、阿尔茨海默病、克-雅病、帕金森病、亨廷顿病、白内障、色素性视网膜炎、朊病毒病或疯牛病。

26. 权利要求21所述的方法，其中所述疾病是年龄相关性肌病。

27. 权利要求21所述的方法，其中所述疾病是心脏局部缺血。

28.一种用于稳定蛋白质的方法，其包括使所述蛋白质与一种多肽接触，所述多肽是X₁-WIRRPFFPFHSP-X₂、X₁-WIRRPFFP-X₂、X₁-PFFPFHSP-X₂、X₁-FPFHSPSR-X₂、X₁-DQFFGEHL-X₂、X₁-FFGEHLLE-X₂、X₁-IAIHHPWI-X₂、X₁-SLSPFYLRPPSFLRAP-X₂、X₁-SPFYLRPP-X₂、X₁-SLSPFYLR-X₂、X₁-FYLRPPSF-X₂、X₁-LRPPSFLR-X₂、X₁-PPSFLRAP-X₂、X₁-SFLRAPSW-X₂、X₁-LRAPSWFD-X₂、X₁-RLEKDRFS-X₂、X₁-FSVNLDVK-X₂、X₁-LKVKVLGD-X₂、X₁-FISREFHR-X₂、X₁-HGFISREF-X₂、X₁-KYRIPADV-X₂、X₁-EFHRKYRI-X₂、X₁-SREFHRKY-X₂、X₁-LTITSSLS-X₂、X₁-GVLTVNGP-X₂、X₁-LTVNGPRK-X₂或X₁-RTIPITRE-X₂，或者它们的功能性变异体或模拟物，其中X₁和X₂各自相互独立地代表具有n个氨基酸的任意氨基酸序列，其中n为0-50，并且X₁和X₂中的n可以相同或不同。

29. 权利要求28所述的方法，其中所述蛋白质是治疗性蛋白质。

30. 权利要求29所述的方法，其中所述治疗性蛋白质是疫苗、胰岛素、生长因子或抗体。

31. 权利要求29所述的方法，其进一步包括提高所述治疗性蛋白质的稳定性以治疗哺乳动物受治疗者的病状。

32. 权利要求28所述的方法，其中所述蛋白质是重组生成的蛋白质。

33. 权利要求28所述的方法，其进一步包括抑制蛋白质错折叠或减少蛋白质聚集。

34. 权利要求28所述的方法，其进一步包括恢复所述蛋白质正确或天然的折叠。

35. 权利要求28所述的方法，其中所述功能性变异体或模拟物包括保守性氨基酸取代或拟肽取代。

36. 权利要求28所述的方法，其中所述功能性变异体有约70％或更高比例的氨基酸序列与X₁-WIRRPFFPFHSP-X₂、X₁-WIRRPFFP-X₂、X₁-PFFPFHSP-X₂、X₁-FPFHSPSR-X₂、X₁-DQFFGEHL-X₂、X₁-FFGEHLLE-X₂、X₁-IAIHHPWI-X₂、X₁-SLSPFYLRPPSFLRAP-X₂、X₁-SPFYLRPP-X₂、X₁-SLSPFYLR-X₂、X₁-FYLRPPSF-X₂、X₁-LRPPSFLR-X₂、X₁-PPSFLRAP-X₂、X₁-SFLRAPSW-X₂、X₁-LRAPSWFD-X₂、X₁-RLEKDRFS-X₂、X₁-FSVNLDVK-X₂、X₁-LKVKVLGD-X₂、X₁-FISREFHR-X₂、X₁-HGFISREF-X₂、X₁-KYRIPADV-X₂、X₁-EFHRKYRI-X₂、X₁-SREFHRKY-X₂、X₁-LTITSSLS-X₂、X₁-GVLTVNGP-X₂、X₁-LTVNGPRK-X₂或X₁-RTIPITRE-X₂相同。

37. 权利要求36所述的方法，其中所述多肽X₁-RTIPITRE-X₂含有I-X-I/V氨基酸基序。

38. 一种用于诊断哺乳动物受治疗者的蛋白质构象疾病的方法，其包括：使所述哺乳动物受治疗者的组织样品与一种多肽相接触，所述多肽是X₁-WIRRPFFPFHSP-X₂、X₁-WIRRPFFP-X₂、X₁-PFFPFHSP-X₂、X₁-FPFHSPSR-X₂、X₁-DQFFGEHL-X₂、X₁-FFGEHLLE-X₂、X₁-IAIHHPWI-X₂、X₁-SLSPFYLRPPSFLRAP-X₂、X₁-SPFYLRPP-X₂、X₁-SLSPFYLR-X₂、X₁-FYLRPPSF-X₂、X₁-LRPPSFLR-X₂、X₁-PPSFLRAP-X₂、X₁-SFLRAPSW-X₂、X₁-LRAPSWFD-X₂、X₁-RLEKDRFS-X₂、X₁-FSVNLDVK-X₂、X₁-LKVKVLGD-X₂、X₁-FISREFHR-X₂、X₁-HGFISREF-X₂、X₁-KYRIPADV-X₂、X₁-EFHRKYRI-X₂、X₁-SREFHRKY-X₂、X₁-LTITSSLS-X₂、X₁-GVLTVNGP-X₂、X₁-LTVNGPRK-X₂或X₁-RTIPITRE-X₂，或者它们的功能性变异体或模拟物，其中X₁和X₂各自相互独立地代表具有n个氨基酸的任意氨基酸序列，其中n为0-50，并且X₁和X₂中的n可以相同或不同；检测错折叠蛋白、未折叠蛋白或聚集蛋白与所述多肽的结合；以及确定所述哺乳动物受治疗者中是否存在所述疾病。

39. 权利要求38所述的方法，其中所述是否存在所述疾病是通过所述蛋白质错折叠、未折叠或聚集的阶段来进行检测。

40. 权利要求38所述的方法，其中所述蛋白质构象疾病是亚历山大病、阿尔茨海默病、克-雅病、帕金森病、亨廷顿病、白内障、色素性视网膜炎、朊病毒病或疯牛病。

41. 权利要求38所述的方法，其中所述疾病是年龄相关性肌病。

42. 权利要求38所述的方法，其中所述疾病是心脏局部缺血。

43. 权利要求38所述的方法，其中所述功能性变异体或模拟物包括保守性氨基酸取代或拟肽取代。

44. 权利要求38所述的方法，其中所述功能性变异体有约70％或更高比例的氨基酸序列与X₁-WIRRPFFPFHSP-X₂、X₁-WIRRPFFP-X₂、X₁-PFFPFHSP-X₂、X₁-FPFHSPSR-X₂、X₁-DQFFGEHL-X₂、X₁-FFGEHLLE-X₂、X₁-IAIHHPWI-X₂、X₁-SLSPFYLRPPSFLRAP-X₂、X₁-SPFYLRPP-X₂、X₁-SLSPFYLR-X₂、X₁-FYLRPPSF-X₂、X₁-LRPPSFLR-X₂、X₁-PPSFLRAP-X₂、X₁-SFLRAPSW-X₂、X₁-LRAPSWFD-X₂、X₁-RLEKDRFS-X₂、X₁-FSVNLDVK-X₂、X₁-LKVKVLGD-X₂、X₁-FISREFHR-X₂、X₁-HGFISREF-X₂、X₁-KYRIPADV-X₂、X₁-EFHRKYRI-X₂、X₁-SREFHRKY-X₂、X₁-LTITSSLS-X₂、X₁-GVLTVNGP-X₂、X₁-LTVNGPRK-X₂或X₁-RTIPITRE-X₂相同。

45. 权利要求44所述的方法，其中所述多肽X₁-RTIPITRE-X₂含有I-X-I/V氨基酸基序。

46. 一种体外筛选蛋白质错折叠、未折叠或聚集的调节因子的方法，其包括：使靶蛋白与一种多肽相接触；检测蛋白质聚集量的减少；从而确定所述多肽作为蛋白质错折叠、未折叠或聚集的调节因子，其中，所述多肽是X₁-WIRRPFFPFHSP-X₂、X₁-WIRRPFFP-X₂、X₁-PFFPFHSP-X₂、X₁-FPFHSPSR-X₂、X₁-DQFFGEHL-X₂、X₁-FFGEHLLE-X₂、X₁-IAIHHPWI-X₂、X₁-SLSPFYLRPPSFLRAP-X₂、X₁-SPFYLRPP-X₂、X₁-SLSPFYLR-X₂、X₁-FYLRPPSF-X₂、X₁-LRPPSFLR-X₂、X₁-PPSFLRAP-X₂、X₁-SFLRAPSW-X₂、X₁-LRAPSWFD-X₂、X₁-RLEKDRFS-X₂、X₁-FSVNLDVK-X₂、X₁-LKVKVLGD-X₂、X₁-FISREFHR-X₂、X₁-HGFISREF-X₂、X₁-KYRIPADV-X₂、X₁-EFHRKYRI-X₂、X₁-SREFHRKY-X₂、X₁-LTITSSLS-X₂、X₁-GVLTVNGP-X₂、X₁-LTVNGPRK-X₂或X₁-RTIPITRE-X₂，或者它们的功能性变异体或模拟物，其中X₁和X₂各自相互独立地代表具有n个氨基酸的任意氨基酸序列，其中n为0-50，并且X₁和X₂中的n可以相同或不同。

47.权利要求46所述的方法，其中所述靶蛋白是β淀粉样蛋白、β/γ晶状体蛋白、肌动蛋白、索蛋白、波形蛋白、胰岛素、柠檬酸合成酶、乙醇脱氢酶、胶质纤维酸性蛋白、α乳清蛋白、成纤维细胞生长因子、胰岛素样生长因子、β转化生长因子、β神经生长因子、表皮生长因子、血管内皮生长因子、β连环蛋白、α肿瘤坏死因子、Bcl-2、BcI-X1或胱门蛋白酶。

48.权利要求46所述的方法，其中所述功能性变异体或模拟物包括保守性氨基酸取代或拟肽取代。

49. 权利要求46所述的方法，其中所述功能性变异体有约70％或更高比例的氨基酸序列与X₁-WIRRPFFPFHSP-X₂、X₁-WIRRPFFP-X₂、X₁-PFFPFHSP-X₂、X₁-FPFHSPSR-X₂、X₁-DQFFGEHL-X₂、X₁-FFGEHLLE-X₂、X₁-IAIHHPWI-X₂、X₁-SLSPFYLRPPSFLRAP-X₂、X₁-SPFYLRPP-X₂、X₁-SLSPFYLR-X₂、X₁-FYLRPPSF-X₂、X₁-LRPPSFLR-X₂、X₁-PPSFLRAP-X₂、X₁-SFLRAPSW-X₂、X₁-LRAPSWFD-X₂、X₁-RLEKDRFS-X₂、X₁-FSVNLDVK-X₂、X₁-LKVKVLGD-X₂、X₁-FISREFHR-X₂、X₁-HGFISREF-X₂、X₁-KYRIPADV-X₂、X₁-EFHRKYRI-X₂、X₁-SREFHRKY-X₂、X₁-LTITSSLS-X₂、X₁-GVLTVNGP-X₂、X₁-LTVNGPRK-X₂或X₁-RTIPITRE-X₂相同。

50. 权利要求49所述的方法，其中所述多肽X₁-RTIPITRE-X₂含有I-X-I/V氨基酸基序。

51. 一种体内筛选蛋白质错折叠、未折叠或聚集的调节因子的方法，其包括：使表达靶蛋白的细胞或细胞系与编码一种多肽的测试化合物相接触；检测所述细胞系中蛋白质聚集量的减少；从而确定所述多肽作为蛋白质错折叠、未折叠或蛋白质聚集行为的调节因子，其中，所述多肽是X₁-WIRRPFFPFHSP-X₂、X₁-WIRRPFFP-X₂、X₁-PFFPFHSP-X₂、X₁-FPFHSPSR-X₂、X₁-DQFFGEHL-X₂、X₁-FFGEHLLE-X₂、X₁-IAIHHPWI-X₂、X₁-SLSPFYLRPPSFLRAP-X₂、X₁-SPFYLRPP-X₂、X₁-SLSPFYLR-X₂、X₁-FYLRPPSF-X₂、X₁-LRPPSFLR-X₂、X₁-PPSFLRAP-X₂、X₁-SFLRAPSW-X₂、X₁-LRAPSWFD-X₂、X₁-RLEKDRFS-X₂、X₁-FSVNLDVK-X₂、X₁-LKVKVLGD-X₂、X₁-FISREFHR-X₂、X₁-HGFISREF-X₂、X₁-KYRIPADV-X₂、X₁-EFHRKYRI-X₂、X₁-SREFHRKY-X₂、X₁-LTITSSLS-X₂、X₁-GVLTVNGP-X₂、X₁-LTVNGPRK-X₂或X₁-RTIPITRE-X₂，或者它们的功能性变异体或模拟物，其中X₁和X₂各自相互独立地代表具有n个氨基酸的任意氨基酸序列，其中n为0-50，并且X₁和X₂中的n可以相同或不同。

52. 权利要求51所述的方法，其中所述靶蛋白是β淀粉样蛋白、β/γ晶状体蛋白、肌动蛋白、索蛋白、波形蛋白、胰岛素、柠檬酸合成酶、乙醇脱氢酶、胶质纤维酸性蛋白、α乳清蛋白、成纤维细胞生长因子、胰岛素样生长因子、β转化生长因子、β神经生长因子、表皮生长因子、血管内皮生长因子、β连环蛋白、α肿瘤坏死因子、Bcl-2、BcI-X1或胱门蛋白酶。

53. 权利要求51所述的方法，其中所述功能性变异体或模拟物包括保守性氨基酸取代或拟肽取代。

54. 权利要求51所述的方法，其中所述功能性变异体有约70％或更高比例的氨基酸序列与X₁-WIRRPFFPFHSP-X₂、X₁-WIRRPFFP-X₂、X₁-PFFPFHSP-X₂、X₁-FPFHSPSR-X₂、X₁-DQFFGEHL-X₂、X₁-FFGEHLLE-X₂、X₁-IAIHHPWI-X₂、X₁-SLSPFYLRPPSFLRAP-X₂、X₁-SPFYLRPP-X₂、X₁-SLSPFYLR-X₂、X₁-FYLRPPSF-X₂、X₁-LRPPSFLR-X₂、X₁-PPSFLRAP-X₂、X₁-SFLRAPSW-X₂、X₁-LRAPSWFD-X₂、X₁-RLEKDRFS-X₂、X₁-FSVNLDVK-X₂、X₁-LKVKVLGD-X₂、X₁-FISREFHR-X₂、X₁-HGFISREF-X₂、X₁-KYRIPADV-X₂、X₁-EFHRKYRI-X₂、X₁-SREFHRKY-X₂、X₁-LTITSSLS-X₂、X₁-GVLTVNGP-X₂、X₁-LTVNGPRK-X₂或X₁-RTIPITRE-X₂相同。

55. 权利要求54所述的方法，其中所述多肽X₁-RTIPITRE-X₂含有I-X-I/V氨基酸基序。