具有改良的抗原结合亲和力的改变的抗体
相关信息
本申请以申请日为2003年7月26日的美国临时专利申请号60/490,087为优先权,其全部内容在此引用作为参考。
本说明书中引用的任何专利、专利申请和参考文献全文在此作为参考。
发明背景
抗体是灵敏的、天然存在的生物因子,其在机体对病原体的防御中起关键作用。抗体,通常也被表示为免疫球蛋白,含有四条多肽:两条相同的较长多肽(重链)和两条相同的短多肽(轻链)。重链通过二硫键与轻链配对,两条重链类似的相互结合从而构成四聚体结构。此外,重链和轻链每个含有可变区域和一个或多个恒定区域:重链包括一个可变区域(VH)和三个恒定区域(C1H,C2H和C3H),轻链包括一个可变区域(VL)和一个恒定区域(CL)。
每对轻链和重链的可变区域构成与抗原接触的位点。VH和VL都具有同样的常规结构,含有四个构架区(FRs),其序列相对保守,通过三个高变或互补决定区域(CDRs)连接(参见Kabat et al.,In“Sequences of Proteinsof Immunological Interest,”U.S.Department of Health and HumanServices,1983;也参见Chothia et al.,J.Mol.Biol.196:901-917,1987)。四个构架区主要采用β-折叠结构,CDRs构成环形连接,在一些情况下构成部分β-折叠结构。VH和VL的CDRs通过FRs相互紧贴,CDRs中的氨基酸残基结合抗原。关于可变区域结构的更详细说明可见于Poljak等(Proc.Natl.Acad.Sci.USA 70:3305-3310,1973)、Segal等(Proc.Natl.Acad.Sci.USA 71:4298-4302,1974)和Marquart等(J.Mol.Biol.,141:369-391,1980)。
研究者通过不同方式修饰抗体以研究其功能或改善其作为治疗药物的应用。在一些最早期的修饰中,研究者使用双链DNA序列表达VH或VL区域,但是没有恒定区域的序列(见如EP-A-0088994;Schering Corporation)。还制备有其它片段和嵌合抗体。一种特别的嵌合体,通常表示为CDR-移植抗体,包含来自两个不同物种抗体的序列(如小鼠CDRs用于其它人类抗体中以取代天然出现的CDRs的位置;参见如美国专利No.5,225,539)。研究者希望该抗体与真正的人类抗体相比不具有更多的异源性,但是至少在一些例子中,该抗体的使用受限于对抗原的抗体亲和力降低。在改变亲和力的尝试中,CDR-移植抗体的FRs中的一些氨基酸被改变,从受体分子(如人类抗体)的氨基酸改变为提供CDRs的抗体的氨基酸(如小鼠抗体的氨基酸;见如US专利No.5,585,089;US专利No.5,693,761;US专利No.5,693,762和US专利No.6,180,370)。
因此,仍然需要不引起强免疫反应但仍强烈结合于其抗原的抗体以及识别该抗体的方法。
发明概述
本发明部分基于抗体(或其抗原结合片段)的亲和力可以通过修饰抗体中的氨基酸残基得以改良的发现。该修饰整体或部分根据抗体和其结合的抗原之间静电力的计算分析。该计算分析反过来根据对抗体中电荷分布的预测,该电荷分布产生影响溶剂(例如水溶剂,如水、磷酸盐缓冲液(PBS)、血浆、或血)中抗体和其抗原之间结合的静电力。计算方法确定了指定靶位点和几何(geometry)的静电互补(抗原-抗体复合物中不利的去溶剂化能与有利的相互作用之间的最佳平衡)。
特别的,本发明提供用于计算最优电荷分布和在溶剂中结合时抗体与抗原间结合自由能的相应改变,然后确定修饰的离散残基位置的标准或规则。此外,发明提供指导在确定的残基位置,如侧链化学选择合适修饰的规则,其通过在计算机(in silico)中建立修饰的子集,而后重新计算结合自由能并选择优选的修饰。
因此,本发明具有几个优点在于,其与其它方法不同,不仅限于整体或成对方式电荷排列,以及抗体和抗原之间只有相反的净电荷是有利的假定的结论。相反,本发明提供了显示准确残基位置和侧链化学以用于调节抗体/抗原复合物的结合亲和力的更加复杂的分析(当适当时,条件是一般的抗体含有带有链内和链间二硫键的最多四条多肽链和六个CDR结合表面以及链间表面)。
此外,本发明还充分说明了抗体在溶剂中结合抗原时的结合相互作用。
并且重要的,本发明提供了改变抗原结合的抗体修饰,其它方法或无法识别这种修饰或由于不适合试验而无法接受。
在一方面,本发明描述了一种调整抗体的抗原结合亲和力的方法,其包括步骤提供相应于抗体及该抗体结合的抗原之间复合物的结构(如三维结构)的数据的步骤;使用该数据测定抗体中(如在一个或多个CDRs中)电荷分布(如一组多极或点电荷)的表示法,该电荷分布可以降低(即优化或使得更负电荷)抗体和抗原间结合自由能的静电作用;修饰抗体中(如一个或多个CDRs中)一个或多个氨基酸残基以产生对应(或更好的对应于)该电荷分布(即测定的最优电荷分布)的修饰的抗体。结果是能够用于调控(如增强、改变等)抗体和其抗原之间相互作用的电荷分布。例如,如果在优化的抗体中氨基酸残基侧链的总净电荷为-1,可以替换初始抗体(有时表示为第一抗体或亲代抗体)中相应的氨基酸残基为具有负电荷侧链的氨基酸残基从而产生是亲代抗体变体的修饰抗体,其通常在此表示为第二抗体(乃至第三或第四抗体,如果其表示先前已经经过修饰的抗体的修饰并因此为先前抗体的迭代变异体)。
在相关的方面,本发明提供了调控抗体的抗原结合亲和力的方法,其是通过测定抗体氨基酸最优电荷分布的空间表示法和抗体在溶剂中结合抗原时结合自由能的相应改变;确定要被修饰的抗体的至少一个候选氨基酸残基位置以改变抗体在结合抗原时的结合自由能;和挑选选择的氨基酸残基用于所述氨基酸位置的取代,如此由于取代,调节抗体的抗原结合亲和性。
如下面进一步所述,一旦测定了电荷分布,抗体中一个或多个氨基酸残基(如CDR(s)中一个或多个残基,如2-10个残基或更多,如虽不是全部但是大多数的CDR残基,可选的,仅在CDR(s)中)被修饰以符合,或更好的符合电荷分布。例如,氨基酸残基可以用另一天然存在的氨基酸残基或非天然存在的残基替代。该取代可以或可以不构成保守氨基酸取代。在一些实例中,可能需要通过删除或插入一个或多个氨基酸残基改变电荷的分布。
在一些实例中,例如,抗体和抗原间复合物的结构数据在提供抗体前就是已知的,则仅需要知道亲代抗体的序列(或该抗体一个或多个CDRs的序列)。只要具有,或能够获得包含亲代抗体的抗体-抗原复合物中电荷分布的信息就可以实施该方法;该信息接着被用于以改良修饰抗体对抗原亲和力的方式调节修饰的抗体。可选的,本发明的方法可以用于改变(如优化)完整人抗体或含有人FRs和人CDRs的抗原结合片段的亲和力,例如,亲和力成熟抗体以改良抗原结合亲和力。完全的人抗体可以取自人血浆(即使这是一种不常用的方式)或在活体内产生(如在含有人免疫球蛋白基因的转基因小鼠中产生的抗体,见美国专利No.6,150,584)。
在本发明的方法中,亲代和修饰的抗体可以来自相同或不同的物种(如亲代抗体可以是非人类抗体(如鼠抗体),修饰的抗体可以是人类抗体)。抗体也可以是相同或不同的类型或亚类。不论它们的起源或分类,两抗体的部分序列相互间可以是相同的。例如,亲代抗体的FRs可以与修饰抗体的FRs相同。这种情况出现在,例如,亲代抗体是人抗体,修饰的抗体与亲代抗体的不同仅在于修饰的抗体含有一个或多个非人类CDRs(即在修饰的抗体中,一个或多个初始的人类CDRs被非人类(如鼠)的CDR所替代)。
本发明的方法可以实施于具有天然存在抗体结构的抗体。例如,本发明的方法可以实施于具有IgG分子结构(两全长重链和两全长轻链)的抗体。因而,在一些实施方式中,亲代和/或修饰的抗体可以包括抗体的Fc区域(如人抗体的Fc区域)。本发明的方法也可以实施于不完全的抗体;其能够实施于抗体的任何抗原结合片段,包括下面进一步描述的这些(Fab片段,F(ab’)2片段或单链抗体(scFv))。“片段”可以构成天然存在的抗体的微小变异体。例如,抗体片段可以包括“完整”抗体中除少量外全部的氨基酸残基(如VH或VL的FR可被截短)。
无论该方法是用于完整的抗体或其片段,在全部或部分FR存在时,FR的序列可以为野生型抗体的序列。可选的,FR可以含有突变。例如,本发明的方法可以实施于包括构架区(如人FR)的亲代抗体,其含有一个或多个不同于野生型FR相应残基的氨基酸残基。突变可以是将氨基酸残基改变为其它物种抗体的相应残基。因而,在其它方面是人的FR可以含有鼠残基(该突变被本领域表示为“后退突变(back mutations)”)。例如,人抗体的构架区可以“后退突变”为非人类抗体同样位置的氨基酸残基。该后退突变的抗体可以在本方法中用作“亲代”抗体,在该例子中“修饰”抗体可以包括完整的人FRs。FRs中的突变可以发生于VH或VL(或VH和VL中)的FR1,FR2,FR3,和/或FR4中任何一个。多至约10个残基或更多能够被突变(如FR1,FR2,FR3,和/或FR4中1,2,3,4,5,6,7,8,9,或10个或更多的残基能够由天然存在的残基(如人类残基)改变为另外的残基(如在相应位置的供体残基,例如鼠残基))。直接位于CDRs侧面的残基是可以被突变的残基之一。
在一个实施方式中,本发明的方法可以施用于完全非人类的亲代抗体(例如鼠抗体)以及含有人Fc区域和完整人FRs的修饰抗体。
在某个实施方式中,亲代和修饰抗体(例如本发明的亲代、修饰或改变的抗体)的相对亲和力可以是修饰抗体对某一抗原的亲和力至少与亲代抗体对该抗原的亲和力一样高。例如,修饰抗体对抗原的亲和力可以比亲代抗体对抗原的亲和力高至少(或约)1.1,1.2,1.3,1.4,1.5,1.6,1.7,1.8,1.9,2,3,5,8,10,50,102,103,104,105,或106,107,或108倍(或位于其之间的任何范围或数值)。
该方法也可以被用于降低抗体的亲和力,例如,当其需要具有更低的亲和力以产生更好的药物动力学、抗原结合特异性、与相关抗原表位间降低的干扰等等。例如,修饰抗体对抗原的亲和力可以比亲代抗体对抗原的亲和力低至少(或约)1.1,1.2,1.3,1.4,1.5,1.6,1.7,1.8,1.9,2,3,5,8,10,50,102,103,104,105,或106,107,或108倍(或位于其之间的任何范围或数值)。
本发明的方法可以是迭代的。如上所述产生的抗体可以被重新改造(例如在用计算机或根据经验,如使用实验数据)和进一步改变以进一步增强抗原结合。如此,上述步骤后可以有附加步骤,包括获得修饰抗体与抗原复合物结构的相应数据;使用该数据(其可以表示为“附加数据”以区别于在亲代“回合”获得和使用的数据)测定修饰抗体CDRs的附加电荷分布的表示法,其最小化修饰抗体与抗原间结合自由能的静电作用;和表达结合抗原的第三或进一步修饰的抗体,该第三抗体具有与修饰抗体CDR至少一个氨基酸不同的成熟CDR,该成熟CDR对应于附加的电荷分布。又一附加回合的成熟化(maturation)可以被实施。在刚刚记载的方法中,获得的抗体复合于(即可结合于)抗原,并用于获得最小化静电作用的电荷分布。接着产生第四或进一步修饰的抗体,其含有由电荷分布指导的可改良抗原结合的修饰。等等。
如上所述,修饰的抗体(或代替修饰抗体起作用的后继抗体)可以含有被修饰从而导致抗体-抗原复合物的静电力被改良(或优化)的CDR。目前,用于检测静电力的软件模拟最优电荷分布,用户随后确定何种氨基酸取代或改变可以改善该分布。因此,该步骤(如检测模拟的最优电荷分布和确定改良抗原结合的序列修饰)是或可以是现在要求保护的方法的一部分。然而,由于调节软件使得该程序包括氨基酸取代(或改变)的选择并不困难,而后,仅需要检查该输出和执行建议的改变(或它的一些变异,如果需要的话)。
本发明的方法可以描述为“产生”抗体(或其片段)的方法。术语“产生”表示“制造”、“形成”或“设计”非天然存在的抗体(或其片段)。产生的抗体可以被认为比其序列(如其CDR和FRs)在其构建过程中被使用的任一抗体都更加“成熟”。虽然产生的抗体对抗原具有更强的亲和性,本发明的方法不限于产生具有改良亲和力的抗体的方法。例如,本发明的方法可以产生抗原亲和力与用本方法修饰前基本相同的抗体。如现有技术所述,当修饰人抗体以含有小鼠CDRs,得到的CDR-移植抗体会失去对其抗原的亲和力。因此,例如,在本发明的方法用于CDR-移植抗体时,当它们防止了在其它常规CDR移植中发生的亲和力丢失(部分或全部丢失时)它们是有用和成功的。
除了最小化结合自由能的静电作用,本发明的方法进一步包括最小化结合自由能的范德瓦耳斯(van der Waals)或溶剂可及的表面积作用。在该进一步的计算分析中,亲代抗体CDR中的附加氨基酸可以改变以产生修饰的抗体,从而使得结合自由能的进一步降低超出了单独最小化静电作用所得到的。少至一个和多达50个的CDR残基可以在本发明方法和组合物中被修饰。最常见的,在1和10之间(如1,2,3,4,5,6,7,8,9,或10)的氨基酸残基在本发明方法和组合物中被改变。
本发明任意方法所产生的抗体,含有这些抗体的药学组合物,和编码该抗体的核酸也在本发明的范围内。本发明还包括通过上述方法发现的编码修饰抗体(或其多肽或片段)的载体。这些载体可用于转化细胞系,该转化(如转染)的细胞在本发明的范围内。
本发明一个或多个实施方式的细节在下面的描述中进一步被阐明。本发明的其它特征、对象和优点可以显而易见的从说明书和权利要求书中获得。
附图说明
图1图示了模拟抗体或其抗原结合片段与抗原在溶剂中结合时的结合相互作用的几何(上图)。特别的,边界值问题,其包括测定半径为R,介电常数为∈1,由介电常数为∈2的溶剂环绕的球形区域的电荷分布,以及抗体-抗原表面的其它几何(下图,也见在下文本)。
图2描述了5c8重链可变和轻链可变区域的核苷酸(SEQ ID NOs:1,3)和多肽(SEQ ID NOs:2,4)序列。
发明详述
为了清晰的理解说明书和权利要求书,在下面方便的提供了所用的定义。
定义
本文所用的术语“结构”或“结构数据”包括三维空间中已知的,预测的和/或模拟的位置,其被本发明的原子、分子、化合物、氨基酸残基及其部分、和大分子及其部分所占据,特别是结合溶剂中抗原的抗体。大量用于在分子/原子水平识别和/或预测结构的方法可以被使用,例如X线晶体照相术、NMR结构模拟等。
本文中所用术语“结合亲和力”包括结合相互作用的强度并因此包括实际结合亲和力(actual binding affinity)及表观结合亲和力(apparent bindingaffinity)。实际结合亲和力是结合率(association rate)对解离率的比值。因此,赋与或优化结合亲和力包括改变一个或所有组成以获得结合亲和力的预期水平。表观亲和力包括,例如,相互作用的亲和力。例如,二价改变的可变区域结合片段可以由于其化合价显示出改变的或优化的结合亲和力。结合亲和力也可以被模拟,该模拟有利于选择本发明方法中的残基改变。
本文中所用术语“结合自由能”或“结合的自由能”包括其本领域公认的含义,并特别是当用于溶剂中抗体-抗原相互作用时。结合自由能的降低增强了抗体-抗原亲和力,反之,增加结合自由能降低抗体-抗原亲和力。
本文中所用短语“最优电荷分布的空间表示法”包括构建抗体或抗体-抗原复合物电荷分布的模型,与已知和/或模拟的亲代抗体和/或结合抗原时的亲代抗体的电荷分布表示法相比,其中抗体在结合抗原时的自由能的静电作用被优化(最小化)。最优电荷分布的建模可以通过计算机程序实现,其将已知和/或模拟的抗体和/或抗体-抗原复合物结构作为输入。应答连续(response continuum)模拟(如线性Poisson-Boltzmann方程)可以被用于表示抗原-抗体复合物在溶剂中的静电结合自由能为抗体解溶剂化、抗体-抗原相互作用和抗原解溶剂化项之和。该计算机过程的特征在于能够将单极、两极和四极项用于表示本发明模拟的电荷分布中的电荷分布,并可以广延(extensive)分析抗体在未结合与结合状态间转换的期间,抗体残基的溶剂化/解溶剂化能。模拟抗体-抗原复合物优化电荷分布的空间表示法的过程另外可以加入模拟范德瓦耳斯力、溶剂可及表面积等。
本文中所用术语“溶剂”包括其本领域公认的最广泛的含义,表示可以溶解本发明抗体的任何液体和/或残油(resides)。
本文中所用术语“抗体”包括单克隆抗体(包括全长单克隆抗体)、多克隆抗体、多特异性抗体(如双特异性抗体)、嵌合抗体、CDR-移植抗体、人源化抗体、人抗体及其抗原结合片段,例如抗体轻链(VL)、抗体重链(VH)、单链抗体(scFv)、F(ab’)2片段、Fab片段、Fd片段、Fv片段和单结构域抗体片段(DAb)。
本文中所用术语“抗原”包括抗体特异性结合的实体(如蛋白质性质的实体或肽),和包括如与本文定义的亲代抗体和修饰抗体都结合的预定抗原。靶抗原可以是多肽、碳水化合物、核酸、脂、半抗原或其它天然存在或合成的化合物。优选的,靶抗原是多肽。
本文中所用的术语“CDR”包括互补决定区域,其为例如Kabat,Chothia,或MacCallum等人所描述(见如,Kabat et al.,In“Sequences of Proteins ofImmunological Interest,”U.S.Department of Health和Human Services,1983;Chothia et al.,J.Mol.Biol.
196:901-917,1987;and MacCallum et al.,J.Mol.Biol.262:732-745(1996);其内容在此全文引用)。
下面列出了通常包括上述引用的参考文献中所记载CDRs的氨基酸残基位置以用于进行比较。
CDR定义表
|
Kabat |
Chothia |
MacCallum |
VHCDR1VHCDR2VHCDR3VLCDR1VLCDR2VLCDR3 |
31-3550-6595-10224-3450-5689-97 |
26-3253-5596-10126-3250-5291-96 |
30-3547-5893-10130-3646-5589-96 |
本文中所用的术语“可变区域”包括抗体的氨基末端部分,其使得抗原结合于该分子并且不是恒定区域。该术语意欲包括功能性片段,例如抗原结合片段,其具有整个可变区域的一些或全部结合功能。
本文中所用的术语“构架区”包括位于CDRs之间并分开CDRs的抗体序列。因此,可变区域构架长度在约100-120个氨基酸之间,但是意欲仅表示CDRs外的氨基酸。对于重链可变区域的特殊例子和对于Kabat等定义的CDRs,构架区1对应包括氨基酸1-30的可变区的区域;区2对应包括氨基酸36-49的可变区的区域;区3对应包括氨基酸66-94的可变区的区域;区4对应包括氨基酸103至可变区域末端的可变区的区域。轻链的构架区类似的被每个轻链可变区域CDRs分开。类似的,使用Chothia等或McCallum等的CDRs定义,构架区边界被相应的上述CDR末端分开。
本文中所用的术语“修饰的”或“改变的”包括与发生变化的位置的亲代氨基酸序列相比,在例如,CDR(s)、构架区或在两者都含有一个或多个氨基酸变化的抗体或其抗原结合片段。修饰的或改变的抗体通常有一个或多个残基被其它氨基酸残基、其相关的侧链化学(chemistry)、或一个或多个氨基酸插入或缺失所取代。
本文中所用术语“亲代抗体”、“初始抗体”、“起始抗体”、“野生型”或“第一抗体”包括任何预期通过本发明方法进行抗体-抗原亲和力修饰的抗体。因此,亲代抗体表示用于进行本发明方法的输入抗体。亲代多肽可以含有天然序列(即天然存在的)抗体(包括天然存在的等位变体)、或具有天然序列的预先存在的(pre-existing)氨基酸序列修饰(如插入、缺失和/或其它改变)的抗体。亲代抗体可以是单克隆、嵌合、CDR移植、人源化或人类抗体。
本文中所用术语“抗体变体”、“修饰抗体”、“含有修饰氨基酸的抗体”、“突变体”或“第二抗体”、“第三抗体”等包括具有不同于亲代抗体氨基酸序列的氨基酸序列的抗体。优选的,抗体变体包括具有自然中不存在的氨基酸序列的重链可变区或轻链可变区。该变体与亲代抗体必须具有少于100%的序列同一性或相似性。在优选的实施例中,抗体变体的氨基酸序列与亲代抗体的重链或轻链可变区域的氨基酸序列具有约75%到少于100%的氨基酸序列同一性或相似性,更优选的,为约80%到少于100%,更优选约85%到少于100%,更优选约90%到少于100%,最优选约95%到少于100%。关于该序列的同一性或相似性在本文中定义为通过对序列进行排比(aligning)和在需要时引入间隙(gaps)以得到最大比例的序列同一性后,候补序列中与亲代抗体残基相同(即同样的残基)的氨基酸残基的比例。通常,在N端、C端或内部延伸(extensions)、缺失、或插入到可变区域外的抗体序列并不被认为影响序列同一性或相似性。抗体变体通常含有位于或邻接其一个或多个高变区域(hypervariable regions)的一个或多个氨基酸改变。本发明的修饰抗体可以或者被表达,或可选的在计算机中被模拟。
本文中所用的短语“候选氨基酸残基位置”包括在本发明抗体中识别的氨基酸位置,其中候选氨基酸的取代被模拟、预测或已知,以通过改变、缺失、插入或用其它氨基酸取代会影响抗体的电荷分布。
本文中所用的术语“选择的氨基酸”表示通过本发明方法挑选出的作为抗体中候选氨基酸位置的替代氨基酸用于取代的氨基酸残基。候选氨基酸残基位置用所选氨基酸进行取代可以或者降低或者增强抗体-抗原复合物的结合自由能的静电作用。
本文中所用的术语“氨基酸改变”或“所述氨基酸的改变”包括表示预定氨基酸序列的氨基酸序列中的改变。典型的改变包括插入、取代和缺失。
本文中所用的术语“氨基酸修饰”包括通过,例如氨基酸取代,以其它不同的氨基酸残基侧链化学替换预定氨基酸序列中现有的氨基酸氨基酸残基侧链化学。本发明单独的氨基酸修饰选自下述任一:(1)含有无极性侧链的氨基酸系列,如Ala,Cys,Ile,Leu,Met,Phe,Pro,Val,(2)含有负电荷侧链的氨基酸系列,如Asp,Glu,(3)含有正电荷侧链的氨基酸系列,如Arg,His,Lys,和(4)增加了Cys,Gly,Met和Phe的含有不带电极性侧链的氨基酸系列,如Asn,Cys,Gln,Gly,His,Met,Phe,Ser,Thr,Trp,Tyr。
本文中所用术语“天然存在的氨基酸残基”包括由遗传密码编码的,通常选自丙氨酸(Ala)、精氨酸(Arg)、天冬酰胺(Asn)、天冬氨酸(Asp)、半胱氨酸(Cys)、谷氨酰胺(Gln)、谷氨酸(Glu)、甘氨酸(Gly)、组氨酸(His)、异亮氨酸(Ile)、亮氨酸(Leu)、赖氨酸(Lys)、甲硫氨酸(Met)、苯丙氨酸(Phe)、脯氨酸(Pro)、丝氨酸(Ser)、苏氨酸(Thr)、色氨酸(Trp)、酪氨酸(Tyr)和缬氨酸(Val)。
本文中所用术语“非天然存在的氨基酸残基”包括除了上述列出的那些天然存在氨基酸残基以外的氨基酸残基,其在多肽链中能够共价连接邻近的氨基酸残基。非天然存在的氨基酸残基的例子包括正亮氨酸、鸟氨酸、正缬氨酸、高丝氨酸和其它氨基酸残基类似物,例如在Ellman等.Meth.Enzym.202:301-336(1991)中记载的那些。为产生该非天然存在的氨基酸残基,可以使用Noren等Science 244:182(1989)和Ellman等,见前中的程序。简要的,这些程序包括化学激活带有非天然存在的氨基酸残基的抑制子tRNA,而后在活体外进行RNA的转录和翻译。
本文中所用术语“暴露的”氨基酸残基包括当在溶液中存在于多肽(例如抗体或多肽抗原)内时,至少部分表面于某种程度上暴露于溶剂的氨基酸残基。优选的,暴露氨基酸残基的至少约三分之一的侧链表面区域暴露于溶剂。多种方法可用于检测残基是否暴露,包括分析多肽的分子模型或结构。
术语“治疗”表示治疗性治疗和预防性或预防性措施。需要治疗的包括那些已经患病的和那些要预防患病的。
术语“病症或疾病”是任何可以从抗体变体治疗中受益的情况。这包括慢性或急性病症或疾病,其中包括怀疑易使哺乳动物患病的病理状况。
本文中所用的术语“细胞”、“细胞系”“细胞培养物”或“宿主细胞”包括“转化体”、“转化细胞”或“转染细胞”和其后代。本发明范围内的宿主细胞包括原核细胞,例如大肠杆菌,低等的真核细胞例如,酵母细胞、昆虫细胞和高等的真核细胞,例如脊椎动物细胞,例如哺乳动物细胞,如中国仓鼠卵巢细胞和NSO骨髓瘤细胞。
详细描述
概述
本文所述的方法可以用于获得优化的抗体(或其抗原结合片段)。基于计算分析,可以识别任何给出的抗体中优化的抗体-抗原复合物的电荷分布与原始抗体-抗原复合物之间存在差异(差异越大,其越明显)的位点。该电荷分布的差异也与抗体在溶剂中结合抗原时结合自由能的改变有关。然后可以改变该位点的氨基酸残基以使得原始抗体中的静电力更接近于(或在另一实施例,更偏离)优化抗体中的静电力,从而调节抗体在溶剂中结合抗原时的结合自由能。抗体中的改变是根据本文所述的一系列离散的标准或规则诱导的。
调节抗体以改良功能的规则
本发明的规则可以如下应用。为调节抗体的抗原结合亲和力,例如,改良或恢复所述结合,首先获得基本的序列和/或结构数据。静电荷优化技术然后被用于建议改良亲和力的突变体。一般的,静电荷优化首先被用于确定对于结合是次优化的CDR残基的位置(Lee and Tidor,J.Chem.Phys.106:8681-8690,1997;Kangas and Tidor,J.Chem.Phys.109:7522-7545,1998)。然后,一个或多个CDR突变(即修饰)被用于进一步的计算分析。基于这些计算,确定根据本发明规则具有一个或多个修饰的修饰抗体的子集的结合亲和力。
使用连续静电模型,可以在抗体CDRs中氨基酸的每条侧链上进行静电荷优化。电荷优化给出原子中心的电荷,但并不总得到实际的突变。因此,一轮电荷优化可以通过使用各种强制表示目的位点天然侧链特征的限制进行。例如,可进行优化使得净侧链电荷为-1、0和+1,附加限制是没有原子的电荷超过特定值,如0.85电子电荷单位。然后根据在优化中观察到的静电结合自由能的电位增加确定候选氨基酸残基链位置和这些位置的残基修饰。
计算在从天然残基到完全不带电荷的侧链等排物(isostere),即形状相同但原子上不带或带部分电荷的残基的过程中结合自由能的差异(kcal/mol)。负数表示结合亲和力的预期增长。净侧链电荷为+1、0或-1的优化电荷分布可以被用于计算结合自由能差异。
在那些结合自由能差异是有利的(ΔG<-0.25kcal/mol)且涉及从天然残基到完全不带电荷的侧链等排物,即形状相同但原子上不带或带部分电荷的残基,的转变的实例中,选择来自含有非极性侧链的氨基酸残基组,如Ala,Cys,Ile,Leu,Met,Phe,Pro,Val的修饰。
当根据侧链中优化的电荷分布和-1的净侧链电荷获得的结合自由能差异是有利的(ΔG<-0.25kcal/mol),选择来自含有负电荷侧链的系列氨基酸,如Asp,Glu的修饰。
类似的,当根据侧链中优化的电荷分布和+1的净侧链电荷获得的结合自由能差异是有利的(ΔG<-0.25kcal/mol),选择来自含有正电荷侧链的氨基酸系列,如Arg,His,Lys的修饰。
最后,在那些根据侧链中优化的电荷分布和0的净侧链电荷获得的结合自由能差异是有利的(ΔG<-0.25kcal/mol)例子中,选择来自增加了Cys,Gly,Met和Phe的含有不带电极性侧链的氨基酸系列,如Asn,Cys,Gln,Gly,His,Met,Phe,Ser,Thr,Trp,Tyr的修饰。
如本文所述,设计的修饰抗体可以通过计算机构建并重新计算结合能。修饰的侧链可以通过使用CHARMM中的旋转异构体二面角扫描(rotamerdihedral scan),采用60度的二面角增量进行构建从而测定每条侧链上最满意的位置。然后使用Poisson-Boltzmann静电能以及表示范德瓦耳斯能和隐藏表面积(buried surface area)的附加项计算野生型(亲代)和突变型(修饰的)复合物的结合能。
然后将从这些计算的修饰计算得到的结果根据需要重新计算,例如,在随后该方法或在计算机上或从附加的实验结构/功能数据获得信息进行重复之后。
该规则可进行几种预测,其分类如下:
1)涉及抗体上残基的作用表面的修饰,其由于结合变为部分隐藏(通过与抗原形成氢键增强相互作用);
2)抗体上极性残基的修饰,其由于结合变为隐藏并因此付出解溶剂化代价,但不与抗原产生任何直接的静电作用(通常通过修饰获得与野生型残基类似的形状的疏水残基或增加能够有利于静电作用的残基产生改良);和
3)抗体上表面残基的修饰,其位于非互补电位(uncomplementarypotentials)的区域。该修饰被认为增强了抗体和抗原间远距离静电作用,不影响结合界面的包装(packing)相互作用。
如此实施,本发明的规则可成功预测使亲和力改变(如增强)的侧链修饰。这些发现可以被分类为三种修饰的常规类型。修饰的第一种类型涉及位于抗原带电基团对面的表面的残基,其能够产生氢键;第二种类型涉及隐藏的极性残基,其由于结合付出解溶剂化代价但不反之产生静电作用;第三种类型涉及远距离静电作用。
通过检查基本的物理/化学因素测定第一种类型的修饰,因为这些残基基本与抗原的不饱和氢配体(unsatisfied hydrogen partners)形成氢键。与其它方法不同,本发明的规则允许得到令人惊奇的残基修饰,其中解溶剂化的成本可以超过相互作用能的得益。
第二种类型的修饰表示另一组修饰,其获得的能量主要来自于在保留非极性相互作用的同时消除不利的解溶剂化。
第三种类型的修饰涉及远距离的相互作用,其显示显著增加亲和力的能力。该类型的修饰特别有趣,因为它们不与抗原产生直接的接触,因此对抗体-抗原界面的精细相互作用很少产生干扰。
因此,当根据规则确定了候选氨基酸位点所需要的侧链化学,该残基位点如本文进一步所述的被修饰或改变,比如通过取代、插入或缺失。
除了上述抗体修饰的规则以外,值得注意的是特定的测定,如溶解效果可以被用于最优电荷分布的初始(和后续)计算中。
获得抗体或其抗原结合片段
用于产生非天然存在的抗体(或其抗原结合片段)的本发明的方法可以,但不必须从获得抗体开始。该抗体在本文中可以表示为“亲代”抗体或有时表示为“第一”抗体,其可用于获得信息,以便于修饰或改变该抗体中(即亲代抗体中)、或序列类似于或含有部分亲代抗体序列的修饰的或改变的抗体中一个或多个氨基酸残基。如本文所述,例如,亲代抗体的一个或多个CDRs(或其部分)可以通过标准的遗传工程技术用修饰抗体的相应CDR(s)替换,以完成所谓的CDR移植或移植。因此,方法可以从哺乳动物单克隆或多克隆抗体(如鼠或灵长类动物)、嵌合、CDR-移植、人源化或人抗体开始。
亲代抗体可以从本领域公知的来源获得或根据本领域公知的技术生产。例如,亲代抗体可以是具有来自其它来源或物种,如鼠的CDR区域的CDR移植或人源化抗体。
亲代抗体或本发明的任一修饰抗体可以是单克隆抗体的形式。生产单克隆抗体的方法是本领域公知的(见,如Kohler and Milstein,Nature256:495-497,1975),以及将免疫球蛋白编码DNA稳定导入骨髓瘤细胞的技术(见,如Oi等,Proc.Natl.Acad.Sci.USA 80:825-829,1983;Neuberger,EMBO J.2:1373-1378,1983;和Ochi等.,Proc.Natl.Acad.Sci.USA80:6351-6355,1983)。这些包括体外诱变和DNA转染的技术可以构建重组免疫球蛋白,这些技术可用于生产用于本发明方法的亲代和修饰抗体,或生产那些方法产生的修饰抗体。可选的,亲代抗体可以从供应商处购得。抗体片段(scFvs和Fabs)也可以在大肠杆菌中生产(生产方法和细胞宿主如下进一步所述)。
亲代抗体或本发明的任一修饰抗体可以是IgA,IgD,IgE,IgG,或IgM类的抗体。
如上所述,本发明的方法不仅能用于四聚抗体(如具有G类免疫球蛋白结构的抗体(IgG))。例如,修饰抗体的方法也可以用于任意抗体的抗原结合片段。片段可以重组产生和构建、合成、或通过蛋白水解酶酶切抗体来产生。例如,片段可以是Fab片段,用木瓜蛋白酶酶切在该区域破裂抗体,其断裂点在结合两重链的链间(即VH-VH)二硫键之前。这导致形成两个同样的片段,其含有轻链,和重链的VH和CH1结构域。可选的,片段可以是F(ab’)2片段。这些片段可以通过用木瓜蛋白酶酶切抗体获得,该酶在链间二硫键之后切开重链,导致含有全部两个抗原结合位点的片段。另一可选的是使用“单链”抗体。单链Fv(scFv)片段可以通过多种方法构建。例如,VH的C端可以连接到VL的N端。通常,连接体(如(GGGGS)4)被置于VH和VL之间。然而,链的连接顺序可以倒转,便于识别或纯化用的标记(如Myc-,His-,或FLAG-标记)可以包含在其中(如这些的标记可以添加于本发明的任意抗体或抗体片段,它们的使用并不限于scFv)。因此,如下所示的,标记的抗体在本发明的范围内。在可选的实施方式中,用于本文所述方法、或由这些方法产生的抗体可以为重链二聚体或轻链二聚体。又进一步的,可以使用抗体轻链或重链或其部分,例如单结构域抗体(DAb)。
由于本发明的方法可以迭代,亲代抗体可以不是天然存在的抗体。由于修饰抗体的步骤可以如所需重复多次,起始抗体(或其抗原结合片段)可以为完全非人的或含有人FRs和非人(如鼠)CDRs的抗体。因此,“亲代”抗体可以是CDR移植抗体,其用于本发明的方法以改善抗体的亲和力,即抗体亲和力成熟。如上所述,亲和力仅可以被增强到约等于(或不明显低于)天然存在的人抗体(FR供体)对其抗原的程度。因此,“亲代”抗体可以,相反,为通过一或多个更早的修饰轮次制备的抗体,其包括含有一个以上物种(如人FRs和非人CDRs)序列的抗体。本发明的方法包括“亲代”抗体的应用,其含有一个或多个来自非人(如小鼠)抗体的CDRs和人抗体的FRs。可选的,亲代抗体可以完全是人的。
当然,如果结构是已知的,可以通过该结构开始计算分析(不用重新创造它)。
基于抗体-抗原结构数据信息的本发明方法
已知蛋白根据其氨基酸序列和该蛋白(或含蛋白的复合物)所处的溶剂折叠为三维结构。该蛋白三维结构影响其生物学活性和稳定性,该结构可以通过多种方法进行测定或预测。通常,经验方法使用物理生化分析。可选的,三级结构可以通过使用模型进行预测,该模型构建了一个或多个已知三维结构的同源蛋白(或蛋白复合物)的三维结构。X线晶体照相术可能是最常见的测定蛋白结构的方法(因此,术语“晶体结构”可用于替代术语“结构”),但是,也可以使用圆形二色性、光散射、或通过测量辐射能的吸收和发散进行估计。其它有用的技术包括中子衍射和核磁共振(NMR)。所有这些方法都是本领域普通技术人员公知的,它们都清楚的记载于标准教科书(参见,如Physical Chemistry,4th Ed.,W.J.Moore,Prentiss-Hall,N.J.,1972,或Physical Biochemistry,K.E.Van Holde,Prentiss-Hall,N.J.,1971))和大量出版物中。任意的上述技术可以被用于测定抗体或包含抗体-抗原的复合物的结构,其然后可以根据本发明的方法进行分析,以及例如,用于为本发明方法的一个或多个步骤提供信息。
类似的,这些和类似的方法可以用于获得结合于抗体片段的抗原结构,其包括由,如单链抗体、Fab片段等组成的片段。形成抗体、抗体片段或scFv-抗原复合物的结晶的方法报道于,例如,van den Elsen等(Proc.Natl.Acad.Sci.USA 96:13679-13684,1999,其在此特别作为参考进行引用)。
计算分析
用于实施本发明方法的基本计算公式记载于,如美国专利No.6,230,102中,其内容在本申请中全文引用作为参考。
如上所述,抗体可以根据抗体与其结合的抗原之间静电力的计算分析结果进行改变(或修饰),优选的,依照本文所述发明的离散标准或规则。计算分析使得能够预测抗体中最优电荷分布,在计算机系统中表示电荷分布的一种方法是作为多极组。可选的,电荷分布可以通过一组位于抗体原子位置的点电荷进行表示。一旦测定了电荷分布(优选,最优的电荷分布),可以修饰抗体以符合,或更好的符合,该电荷分布。
计算分析可以通过计算机执行的程序进行,其运行记载于美国专利No.6,230,102中的计算。在此改写计算机程序以考虑抗原-抗体结合的现实情况内容(不同于其它方法,本发明的方法考虑,如在溶剂中抗体与其抗原间结合中的溶剂、远距离静电和介电效果)。该程序被用于识别实现“成熟”抗体上电荷分布的抗体结构的修饰,其使成熟抗体和其抗原间结合自由能的静电作用最小化(与未修饰(“起始”或“亲代”)抗体相比)。通常,实施本文所述操作(更详细记载于美国专利No.6,230,102中)的计算机系统(或设备)可以包括为使用者显示信息的输出设备(如CRT显示器、LCD、打印机、通信设备如调制解调器、音频输出等)。此外,实施本方法的指令可以,部分或全部的,用于适合在电子设备中使用的媒介中以实现该指令。因此,本发明的方法可被改良用于高通量方法,其含有软件(如计算机可读指令)和硬件(如计算机、机器人和芯片)。计算机执行的程序不限于特殊的计算机平台、特定处理器或特定高级程序语言。
有用的程序阐明于附录A中(美国专利No.6,230,102),更详细的说明记载于附录B中(Lee and Tidor(J.Chem.Phys.106:8681-8690,1997;其中每个均在此特别作为参考进行引用)。
亲和力分析
亲和力、亲和势(avidity)和/或特异性可以通过多种方法进行测量。通常,不管定义或测量亲和力的准确方法,本发明的方法在产生抗体时改善抗体亲和力,该抗体在临床用途的任意方面优于用于制备其的抗体(例如,当与用于制备其的抗体相比,修饰的抗体可以以更低剂量或更低频率给药或通过更方便的途径给药时,)本发明的方法被认为是有效或成功的。
更特殊的,抗体和其结合的抗原间的亲和力可以通过各种实验进行测量,包括,如BiaCore实验或KinExATM3000实验(可从Sapidyne Instruments(Boise,ID)购得)。后一实验被用于测量AQC2scFv突变体对VLA1 I结构域的亲和力(见下述实施例)。简要的,琼脂糖微球用抗原包被(在下述实施例中),抗原是VLA1 I结构域蛋白,但本发明方法中使用的抗原可以是任何共价结合的目的抗原(如癌抗原、细胞表面蛋白或分泌蛋白、病原体的抗原(如细菌或病毒抗原(如HIV抗原、流感抗原或肝炎抗原))或变态反应原)。(可是可以理解,本文所述的方法通常是可应用的,其不限于产生结合任意特殊抗原或抗原类型的抗体。)
本领域常规技术人员将明白测量亲和力并不总是像看单一、概要图那么简单。由于抗体具有两臂,其表观亲和力通常远高于可变区和抗原间的内在亲和力(这被认为是由于亲和势(avidity))。内在亲和力可以使用scFv或Fab片段进行测量。
嵌合抗体和抗体片段
术语“嵌合抗体”用于表述至少含有免疫球蛋白分子的抗原结合部分的蛋白,该分子通过,例如肽键或肽连接体连接于异源蛋白或其肽。“异源”蛋白可以是非免疫球蛋白或不同物种、类型或亚类的免疫球蛋白的一部分。
有许多程序可以用于制备该抗体。例如,可制备表达载体,其含有可操作的连接于至少编码VH或VL的DNA序列的启动子,以及编码异源蛋白(或其肽(该肽具有足够的长度以使其能够被识别为非免疫球蛋白分子(即不具有与免疫球蛋白实质序列相同性的肽)))的序列。如果必须,或需要,可以制备第二表达载体,其含有可操作的连接于编码互补可变区的DNA序列的启动子((即,亲代表达载体编码VH,第二表达载体编码VL,反之亦然)。然后细胞系(如永生哺乳动物细胞系)可以用一个或全部两个表达载体转化,并在允许嵌合可变区或嵌合抗体表达的条件下培养(见,如Neuberger等的国际专利申请No.PCT/GB85/00392)。虽然Neuberger等生产的嵌合抗体,其全部可变区由亲代表达载体编码,该方法可用于表达本发明的修饰抗体、含有全长重链和轻链的抗体、或其片段(如本文中所述的Fab,F(ab’)2,或scFv片段)。该方法不限于嵌合抗体的表达。
本文中所述方法产生的抗体可以被标记,就像任意其它抗体可以被标记一样。因此,发明包括由本方法产生的抗体,其标记有可识别标记,例如放射性标记(如P32或S35)、酶(如辣根过氧化物酶、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶(β-gal)等)、含有量子点的发色团或荧光团。标记的抗体可以用于在多种细胞或组织类型中实施诊断程序(许多诊断实验依赖于检测蛋白抗原(如PSA))。为了成像操作,在活体外或活体内,本文所述方法生产的改变抗体可以用附加的试剂进行标记,如NMR造影剂、X线造影剂或量子点。将可检测试剂连接于多肽,包括抗体或其片段的方法是本领域公知的。抗体也可以连接于不溶支持物(如微球、玻璃或塑料载玻片等)。
构建修饰抗体
一旦抗体的序列(如CDR移植或其它修饰或“人源化”抗体)被决定,抗体可以通过分子生物学领域公知的技术进行制备。更特殊的,重组DNA技术可以用于通过以核酸序列(如编码预期蛋白产物(如修饰的重链或轻链、其可变区或其它抗原结合片段)的DNA序列)转化宿主细胞来产生大量的多肽。
更特殊的,制备方法可以如上所述的用于嵌合抗体。编码例如改变的可变区的DNA序列可以通过寡核苷酸合成制备。可变区可包含人受体分子的FRs和供体,如小鼠的CDRs,在一个或多个残基之前或之后(如CDR中的残基)进行修饰以促进抗原结合。通过测定受体抗体的构架区序列和至少供体抗体的CDR序列可以使其容易。可选的,编码改变的可变区的DNA序列可以通过引物指导的寡核苷酸点突变进行制备。该技术涉及用含有突变点的单链DNA杂交编码目的突变的寡核苷酸,和使用单链作为模板延伸寡核苷酸以产生含有突变的链。该技术以不同的形式被如Zoller和Smith(Nuc.Acids Res.10:6487-6500,1982)、Norris等(Nuc.Acids Res.11:5103-5112,1983)、Zoller和Smith(DNA 3:479-488,1984)和Kramer等(Nuc.Acids Res.10:6475-6485,1982)描述。
其它将突变导入序列的方法是公知的,而且可以用于产生本文所述的改变的抗体(参见,如Carter等,Nuc.Acids Res.13:4431-4443,1985)。用于点突变的寡核苷酸可以通过寡核苷酸合成制备或通过使用合适的限制酶从编码供体抗体可变区的DNA中分离。
用于表达修饰抗体的宿主细胞和细胞系
本文所述的亲代抗体或修饰抗体(最终形式或中间形式)可以通过培养中的宿主细胞或细胞系表达。它们也可以在体内细胞中表达。被转化(如转染)以产生改变的抗体的细胞系可以为永生哺乳动物细胞系,如淋巴来源的(如骨髓瘤、杂交瘤、三体杂交瘤(trioma)或四体杂交瘤(quadroma)细胞系)。细胞系也可以包括正常的淋巴细胞,如B细胞,其通过用病毒(如Epstein-Barr病毒)转化进行永生化。
虽然通常用于产生改变的抗体的细胞系是哺乳动物细胞系,其它来源的细胞系(如细菌和酵母)也可以被使用。特别地,可以使用大肠杆菌来源的细胞菌株,特别是,如噬菌体展示。
一些永生淋巴细胞系,如骨髓瘤细胞系,在其正常状态,分泌分离的Ig轻链或重链。如果该细胞系用表达改变的抗体的载体转化,在本发明的过程中制备,其不需要进行过程中的余下步骤,只要正常分泌的链互补于由早前制备的载体编码的Ig链的可变区。
如果永生细胞系不分泌或不分泌互补链,必须导入细胞编码合适互补链或其片段的载体。
在永生细胞系分泌互补轻链或重链的例子中,转化细胞系的制备可以通过例如,用载体转化合适的细菌细胞,然后将细菌细胞与永生细胞系融合(如通过原生质球融合)。可变的,DNA可以直接通过电穿孔导入永生细胞系。
药学试剂及其应用
在预防疾病的应用中,将药物组合物或药剂以足够的量给药患有疾病的患者以减少或减低风险,减轻严重程度,或延迟疾病的开始,其包括疾病的生物化学、组织学和/或行为学症状,在疾病发展过程中表现的并发症和中间病理表型。在治疗应用中,将组合物或药剂以足够的量给药怀疑或已经患有该疾病的患者以治愈、或至少部分阻止疾病的症状(生物化学、组织学和或行为学),其包括在疾病发展过程中的并发症和中间病理表型。
用于治疗疾病的本发明组合物的有效剂量依赖于许多不同因素,包括给药的方式、靶位点、患者的生理状态、患者是人或动物、其它给药的药物、和治疗是预防性的还是治疗性的。通常,患者是人,但是非人的哺乳动物包括转基因哺乳动物也可以被治疗。
对于抗体的被动免疫,剂量范围从宿主体重的约0.0001到100mg/kg,和更常见的0.01到20mg/kg。例如剂量可以为1mg/kg体重或10mg/kg体重或在1-10mg/kg的范围内,如最少1mg/kg。患者可以每天、隔天、每星期或根据任何其它通过经验分析确定的日程表给药该剂量。可仿效的治疗需要以多倍剂量给药持续一段较长时间,例如,至少六个月。额外的可仿效的治疗方式需要每两个星期给药一次或者一个月一次或者每3至6个月一次。可仿效的剂量表包括连续数日1-10mg/kg或15mg/kg,隔天30mg/kg或者每周60mg/kg。在一些方法中,具有不同结合特性的两个或更多的单克隆抗体被同时给药,在这种情况下给药的每个抗体的剂量落在显示的范围内。
抗体通常在多种场合被给药。单剂量间的间隔可以为每周、每个月或者每年。在一些方法中,调整剂量以达到1-1000mg/ml的血浆抗体浓度以及在一些方法中为25-300μg/ml。可选择地,抗体可以被以缓释制剂的形式给药,在这种情况下需要比较不频繁的给药。剂量和频率依据受试者抗体的半衰期而不同。总的来说,人抗体显示最长的半衰期,接下来以逐渐递减的顺序为人源化抗体、嵌合抗体、以及非人抗体。
给药的剂量和频率可以依据治疗是预防性的还是治疗性的而不同。在治疗性的应用中,含有目前抗体的组合物或其鸡尾酒被给药至还未处于患病状态的受试者以增强受试者的抵抗力。这样的剂量被定义为“预防有效剂量”。在这个应用中,精确的量再次依据受试者的健康和普通免疫状态,但是每剂量通常范围为0.1至25mg,优选每剂量0.5至2.5mg。在长时间内以相对稀少的间隔给药相对低剂量。一些受试者在其余生中继续接受治疗。
在治疗的应用中,在相对短的间隔内有些时候需要相对高的剂量(例如,每剂量约1至200mg抗体,从5至25mg的剂量更常用)直至疾病的进展降低或者终止,并且优选直至受试者显示疾病的症状部分或全部改善。这样之后,本专利可用预防方式被给药。
为了预防性和/或治疗性的治疗,治疗试剂可以被通过肠道外、局部、静脉、口服、经皮、动脉内、颅内、腹膜内、鼻内或者肌肉内的方式给药。蛋白药物最典型的给药途径是血管内给药、经皮给药,或者肌内给药,尽管其它途径也是有效的。在一些方法中,试剂直接被注射至沉积物堆积的特殊器官,例如颅内注射。在一些方法中,抗体被以缓释组合物或者装置给药,诸如MedipadTM装置。蛋白药物也可以通过经呼吸道给药,例如,采用干粉吸入装置。
本发明的试剂可以选择的与其它对免疫疾病的治疗至少部分有效的试剂联合给药。
本发明的药物组合物包括包含在药学可接受载体中的本发明的至少一种抗体。“药学可接受载体”是指一般用于活性成分的给药的药物制剂的至少一种组分。这样的话,载体可能含有用于本领域的任意药物赋形剂和给药的任意形式的载体。组合物可以为,例如,注射溶液、水性悬浮液或者溶液、非水溶的悬浮液或者溶液、固体和液体口服制剂、软膏、凝胶、油膏、经皮贴剂、膏剂、洗剂、片剂、胶囊、缓释制剂等。附加的赋形剂可能包括,例如,着色剂、矫味剂、助溶剂、混悬剂、压制剂、肠溶衣、助缓释剂等。
本发明的制剂通常以包括活性治疗试剂和各种其它药学可接受组分的药物组合物被给药。见Remington′s药物科学(15th ed.,Mack PublishingCompany,Easton,Pennsylvania(1980))。优选的形式依靠想要的给药和治疗应用的模式。依赖于涉及的制剂,组合物还可以包括,药学可接受的、非毒性载体或稀释剂,其被定义为作为用于配制对动物或人类给药的药物组合物的常用载体。稀释剂被选择以使得不会影响组合的生物活性。这样的稀释剂的例子为蒸馏水、生理磷酸盐缓冲液、Ringer′s溶液、葡萄糖溶液和Hank′s溶液。此外,药物组合物或制剂可能还包括其它载体、助剂或者无毒的、非治疗性的、非免疫原性稳定剂等。
抗体可以以贮存注射或植入制剂的形式被给药,其可以按照允许活性成分的缓释的这种形式形成。可仿效的组合物包括形成于由50mM L-组氨酸、150mM NaCl组成的,用HCl调节至pH 6.0的水溶性缓冲液中的5mg/ml的单克隆抗体。单克隆抗体的合适的制剂缓冲液的另一个例子包含20mM柠檬酸钠、pH 6.0,10%的蔗糖,0.1%吐温80。
一般地,组合物以可注射形式被制备,或者以液体溶液或者混悬液的形式;也可以制备成适合在注射前在液体赋形剂中的溶液,或者混悬液的固体形式。制剂也可以被乳化或者胶囊化至增强助剂作用的诸如聚交酯、聚乙交酯或共聚物脂质体或者微粒中,如前面所描述的(见Langer,Science249:1527(1990)和Hanes,Advanced Drug Delivery Reviews 28:97(1997))。
治疗
受疾病或病症困扰的患者的治疗可以用标准方法被监视。一些方法需要确定基准值,例如,在给药试剂剂量之前,受试者中的抗体水平或曲线,并且用这个与治疗之后的曲线或水平的值进行比较。水平或者曲线值的显著的增加(即,高于相同的样品的重复测量中实验误差的一般界限,表示为该测量的平均值的标准偏差)标志着好的治疗结果(即,试剂的给药已经达到了理想的响应)。如果免疫应答的值不显著改变,或者减少,则显示出负面的治疗结果。
在其它方法中,水平或曲线的对照值(即,平均值和标准偏差)通过对照人群被确定。一般在对照人群中的个体尚未接受事先治疗。在给药治疗试剂后的受试者中的测定的水平或曲线值随后与对照值相比较。与对照值相对的显著的增加(例如,比平均值高一个标准偏差)标志着正面的或者充分的治疗结果。显著增加的缺乏或者降低标志着负面的或者不充分的治疗结果。试剂的给药通常当水平相对于对照值增加的时候继续。如之前的,达到相对于对照值稳定水平是治疗的给药在剂量和/或频率上可以被中止或者减少的指针。
在其它方法中,水平或曲线(例如,平均和标准偏差)的对照值通过已经经历用治疗试剂治疗的以及其对治疗的应答的水平和曲线已经达到稳定水平的个体的对照人群被确定。受试者的水平或曲线的测量的值与对照值比较。如果测定的受试者的水平与对照值没有显著不同(例如,超过一个标准偏差),治疗可以被中止。如果受试者的水平比对照值显著低,则批准试剂的继续给药。如果受试者的水平持续低于对照值,则可能指示治疗的变化。
在其它方法中,目前不接受治疗但是已经经历了之前治疗过程的受试者被监测抗体水平或曲线以确定是否需要恢复治疗。测定的受试者的水平或曲线可以与受试者之前在之前的治疗过程之后达到的值相比较。相对于之前测量显著降低(即,比相同的样品的重复测量中误差的一般界限高)是治疗可以被恢复的指示。可选择的,测定的受试者的值可以与在经历治疗过程后的受试者人群中确定的对照值(平均值加标准偏差)相比较。可选择的,测定的受试者的值可以与保持无疾病症状的作为预防性处理的受试者人群或显示疾病特征改善的治疗性治疗的受试者群体的对照值相比较。在所有这些情况中,相对于对照水平显著的降低(即多于一个标准差)是受试者的治疗应该继续的标志。
在给药之后的抗体曲线一般显示在指数衰退之后抗体浓度的直接峰值。不给予进一步的剂量,衰退在几天至几个月的期限内依据给药的抗体的半衰期接近预处理水平。例如一些人抗体的半衰期为20天的数量级。
在一些方法中,在给药之前进行受试者给定抗原的抗体的基准测量,随后进行第二测量以确定峰抗体水平,并且间隔中进行一个以及多个进一步的测量在以监测抗体水平的衰退。当抗体的水平已经衰退至基准或者峰值小于基准的预定百分比(例如,50%,25%or10%)时,给药抗体的进一步剂量的给药。在一些方法中,峰值或随后测定的更少干扰的水平与之前确定以构成其它受试者的有益的预防或治疗性治疗的制度的参考水平相比。如果测定的抗体水平比参考水平显著低(例如,低于那些从治疗中受益的受试者人群的参考值的平均值减标准偏差),则显示给药额外剂量的抗体。
额外的方法包括在治疗的过程中监测通常依赖研究者或者医师任意本领域公知的生理症状(例如,生理或精神症状)以诊断或监测病症。
下面的实施例为了例证的目的被引入而不作为限制本发明的解释。
实施方式
在实施例中,除非另外说明,将使用下列材料和方法。
材料和方法
通常,除非另外说明,本发明的操作使用化学、分子生物学、重组DNA技术、免疫学(特别的,如抗体技术)的常规技术和电泳的标准技术。参见,如Sambrook,Fritsch和Maniatis,Molecular Cloning:Cold Spring HarborLaboratory Press(1989);Antibody Engineering Protocols(Methods inMolecular Biology),510,Paul,S.,Humana Pr(1996);Antibody Engineering:APractical Approach(Practical Approach Series,169),McCafferty,Ed.,Irl Pr(1996);Antibodies:A Laboratory Manual,Harlow等,C.S.H.L.Press,Pub.(1999);and Current Protocols in Molecular Biology,eds.Ausubel等,John Wiley& Sons(1992)。
抗体和其抗原结合片段的生成
抗体,例如,嵌合、人源、单克隆和单链抗体的选择、克隆和制备公知于本领域。此外,以前已经记载了hu5c8mAb的人源化。分别参见Lederman,1992and Karpusas,2001。该抗体可以从ATCC(PTA-4931)中获得。5c8抗体在NS0骨髓瘤细胞中稳定的表达,通过Protein A和凝胶过滤色谱法纯化。SDS-PAGE和凝胶过滤色谱法分析显示蛋白形成预期的二硫键连接的四聚物。本发明的单链抗体通常在大肠杆菌中表达,并使用标准技术免疫纯化。
AQC2scFv的制备
AQC2scFv通过质粒pKJS217表达。该质粒含有AQC2轻链的318个核苷酸,其编码106个氨基酸的轻链可变区,后为在框架中的其编码3拷贝的GGGGS连接物部分的45个核苷酸。在框架中连接物之后为360个核苷酸,其编码120个氨基酸的AQC2重链可变区。重链可变区之后紧邻的是肠激酶酶切位点和myc和HIS标记。表达在大肠杆菌中进行,通过ara-BAD启动子驱动,蛋白通过编码来自噬菌体fd的g111肽的80个核苷酸片段导入周质空间。该肽在周质输出的过程中从蛋白上切除。
5C8Fab的制备
5C8Fab片段通过双顺反子质粒pBEF064表达。第一顺反子含有5C8重链的354个核苷酸,其编码118个氨基酸的重链可变区,在框架中其后是306个核苷酸,其编码人IgG1恒定区的首个102个氨基酸,以及编码6个组氨酸标签的18个核苷酸。第二核糖体插入位点位于重链顺反子末端之后7个核苷酸处。第二顺反子含有333个核苷酸,其编码111个氨基酸的5C8轻链可变区,在框架中其后为321个核苷酸,其编码107个氨基酸的轻链恒定区。表达在大肠杆菌中进行,通过ara-BAD启动子驱动,重链和轻链通过OmpA(重链)和PhoA(轻链)周质定位信号导入周质空间。该周质定位信号在周质输出过程中从蛋白上切除。
结合实验
结合实验通常使用KinExATM试剂盒进行。该实验的进行是通过将抗体(或抗原结合片段)的稀释溶液经过试剂盒中提供的柱,一些抗体(或其抗原结合片段)与微球上抗原结合。然后抗体(或片段)用结合荧光染料Cy5的二级抗人IgG重链或轻链抗体检测(Jackson ImmunoResearchLaboratories,Inc.,West Grove,PA)。设定抗体(或片段)的浓度以使得来自荧光染料的信号与蛋白的浓度成比例。为获得相互作用的溶液相亲和力,抗体(或片段)与连续稀释的可溶抗原混合。这些蛋白(抗体和抗原)通过三小时室温孵育或4℃隔夜孵育达到平衡。混合物流过含抗原的柱,信号与仍存在于溶液中的未结合抗体(或抗体片段)的数量成比例。获得的数据可以标绘于线性-对数轴图(linear-log scale graph),并通过非线性回归拟合至二次曲线,其得出KD值。
5C8-CD40L结合实验
进行基于ELISA的竞争结合实验。用抗c-myc mAb在10ug/mL的PBS中于室温包被NUNC Maxisorb平板两个小时。将未标记5C8Fab(突变或野生型)进行连续稀释,并与等体积确定浓度(30ng/ml)的生物素标记5C8Fab竞争物相混合,加入平板。室温培养两小时后,洗涤平板,采用链霉亲和素-HRP检测结合的生物素标记5C8Fab竞争物。从四参数曲线拟合中获得结合亲和力。
计算机建模度量和公式
为了实施本发明的抗体的优化,可以使用下列度量和公式。例如,抗体的结合和未结合状态中的静电自由能之间的结合自由能差异可以表示为,Gbinding=Gbound-Gunbound(见图1a)。由于介电模型包括影响熵以及焓的应答,因此静电能被认为是自由能。每个状态的自由能表示为库仑力和反应场(水合作用)项的总和,其涉及抗原(L)、抗体(或其抗原结合片段)(R),以及它们的相互作用(L-R):
Gstate=Gcoul,L state+Gcoul,R state+Gcoul,L-R state+Ghyd,L state+Ghyd,R state+
Ghyd,L-R state。 (1)
这导致下面的结合自由能表达式的结果,
ΔGbinding=ΔGcoul,L-R+ΔGhyd,L-R+ΔGhyd,L+ΔGhyd,R (2)
其中抗原和抗体中点电荷的几何保持确定的事实被用于模型中以删除抗体和抗原的库仑自作用,并且其中两个L-R项仅归因于结合状态,因为抗体和抗原被假定在未结合状态不相互作用(然而注意到抗原的电荷分布不需要在结合和未结合状态都一样。如果它们不同,这加入了一个常数到Gbinding中,其能够在定义方程(3)的Gvar中被删去)。因此,方程(2)将静电结合自由能描述为抗体和抗原的解溶剂化作用(其为不利的)与结合状态中溶剂遮蔽的静电作用(其通常为有利的)的和。由于目标是改变抗体电荷分布以优化静电结合自由能,而且最后的项只简单地加一常数,相关变化的结合自由能被定义,
ΔGvar=ΔGint,L-R+ΔGhyd,L (3)
其中在方程(2)右手边(RHS)的前两项已经结合到遮蔽作用项并且删除了常数项。注意:
以及
其中如指示的VL state为指定状态中仅由于抗体电荷分布的总的静电电位,Vterm,L state为库仑或反应场(水合作用)项。总和包括抗体中(i∈L)或抗原j∈R)中的原子点电荷。方程(5)中的因子1/2是由于抗体电荷分布与自诱导反应场相互作用的事实。Vcoul,L bound,Vhyd,L bound,和Vhyd,L unbound,这三个在方程(4)和(5)中的静电电位通过解决图1b中显示的边界值问题以给出的几何和电荷分布进行表示。电荷分布(对应于抗体)包含在半径为R的球形中。球形的中心作为坐标的原点(无撇的),但多极中电荷分布在第二个原点(有撇的)周围延伸,其顺着z轴转变了距离d,因此
各处电位满足泊松方程。在球形中,可以被写作,
其中RHS的第一项为库仑,第二项为反应场(水合作用)电位,i的总和与抗体点电荷一致。在球形外,库仑和反应场电位能够被结合并且写作,
其中A
l,m和B
l,m将通过合适的边界条件被确定,Y
l,m(θ,Φ)为球谐函数。方程(7)中的库仑项在球谐函数和球中心附近电荷分布的多极中展开。此处多极展开的原点被位移至
采用Jackson使用的Yl,m(θ,Φ)的定义(J,D.Jackson,Electrodynamics,2nded,(John Wiley和Sons.New York.1975)。
方程(10)中的表达式对于r′>r′i(即,在抗体之外或者更准确的,在中心位于
且半径为
和点电荷之间的最长距离的球形之外)是有效的。为了代入方程(7)和结合包括球谐函数的项,方程(10)的第一个Y
l,m(θ′,Φ′)/r′
l+1根据Y
l,m(θ,Φ)/r
l+1展开。这通过使用Greengard的结果进行(The Rapid Evaluation ofPotential Fields in Particle Systems MIT Press,Cambridge,Mass.,1988),其规定对于r>d,
其中
由于使用θd=0的几何,只有方程(12)中的m′=0项是非零的,在这种情况下方程(10)变为,
其中获得点
附近的多极分布,但是电位被表示为大球中心附近的球谐函数的和。上述方程也可以被写作,
其中具有相同的Yl,m(θ,Φ)的项被聚集在一起,方程(14)与其相反,其中具有相同的Q′* l,m的项被聚集在一起。
将方程(15)代入方程(7)并且匹配r=R或者室温的边界条件后,
Vin|r=R=Vout|r=R (16)
在球内的水合作用(反应场)电位为,
其中
可以改写各种V′s,从而明确它们与Q′* l,m的相关性。V′coul,L bound由方程(20)给出,Vhyd,L bound由方程(19)给出但是重新改写导致具有相同Q′* l,m的项被聚集,Vhyd,L unbound由R=a以及d=0的方程(19)给出。
代入方程(4),明确Gint,L-R与Q′* l,m的相关性
其中在最后一行元件αl,m被定义,其与Q′* l,m不相关,是方程(25)中与Q′* l,m相乘的因子。每个αl,m表示多极对Gint,L-R的作用并且包含获得Gvar所需的涉及抗原电荷分布的所有信息。对于Ghyd,L,其在根据Q′* l,m(描述抗体电荷分布的多极,而不是个体电荷qi)重新表达方程(5)中是有用的。
Rose(M.E.Rose,J.Math.& Phys.37,215(1958);M.E.Rose,ElementaryTheory of Angular Momentum(John Wiley和Sons,New York,1957))已经显示在球面坐标中展开变为,
其中
对于正数m,以及当
根据拉普拉斯方程(即,r
lY
l,m(θ,Φ)或Y
l,m(θ,Φ)/r
l+1)的解运算时,显示为,
for m≥0。
双因子被定义为
球偏导数为
为了计算负数m的
应用Y
l,-m(θ,Φ)=(-1)
mY
* l,m(θ,Φ)的事实以及方程(34)中球偏导数的定义以获得,
for m≥0。
结合抗体的水合能因此为
为了估算方程(37)中的
使用方程(31)和梯度公式(M.E.Rose,Elementary Theory of Angular Momentum(John Wiley和Sons,New York,1957))
其中
C(l′,1,l;m-m′,m′)为向量加法(或Clebsch-Gordon)系数,其经常在表1所示的角动量研究中遇见(Rose的),和
为球形单位向量,
因此,
从方程(38)到(41),
u(rlYl,m(θ,φ)=(-1)u[1(2l+1)]1/2C(l-1,1,l;m+u,-u)rl-1Yl-1,m+u(θ(φ)2)
使用表I,方程(31),和方程(37)到(42),获得以下中间结果,
结合状态中抗体的水合作用能的最终表达式,
其中βl,m,l′,m′由上述两个方程定义;注意βl,m,l′,m′对m′m为零。
非结合抗体的水合作用能通过设置方程(46)中的d=0和R=α获得,
其中γl,m通过方程(48)和(49)定义。然后,γl,m为符号表示方便写为1和m的函数,虽然并不与m形式相关。
因此Gvar被表示为抗体电荷分布的多极,Q′l,m(在抗体球的中心附近展开)和不依赖于Q′l,m的元件αl,m,βl,m,l′,m′and γl,m的函数。结合方程(26)、(47)和(49)得到
注意仅有αl,m依赖于抗体电荷,而βl,m,l′,m′和γl,m单独依赖于结合或未结合状态的几何。虽然ΔGvar opt为实数量,αl,m和Q′l,m是复数且积αl,mQ′* l,m和Q′* l,mQ′l′,m包括形式Y* l′,m(θ′,Φ′)Yl,m(θ,Φ)的项的总和;注意βl,m,l′,m′,和γl,m是实数。然后ΔGvar opt根据αl,m和Q′l,m的实数和虚数部分进行改写,
(其中m的总和不包括l=0的),又注意Yl,-m(θ,Φ)=(-1)mY* l,m(θ,Φ)和
Y* l,m(θ′,φ′)Yl,m(θ,φ)+Y* r,-m(θ′,φ′)Yl,-m(θ,φ)=Y* r,m(θ′,φ′)Yl,m(θ,φ)
+Yr,m(θ′,φ′)Y* l,m(θ,φ) (52)
=2[ReYr,m(θ′,φ′)-ReYl,m(θ,φ)+ImYl,m(θ′,φ′)-ImYl,m(θ,φ)]。 (53)
新变量ReQ′l,m和ImQ′l,m被改变符号并且如下重新命名为Qi,
{Q′0,0,Q′1,0,ReQ′1,1,ImQ′1,1,Q′2,0,ReQ′2,1,ImQ′2,1,
ReQ′2,2,...}(Q1,Q2,Q3,Q4,Q5,Q6,Q7,Q8,...}。 (54)
类似的转变被用于产生αi,βij,和γi.。方程(51)因此可以被写作,
或者以矩阵符号,
其中Q为由Q
i形成的向量,A为由α
i形成的向量,
为由(β
ij,-δ
ijγ
i)形成的对称矩阵,并且平方的完成被用于获得方程(58)。由于方程(57)中的
对应于抗体去溶剂化的代价,对于化学合理的几何其必须大于0,矩阵
为正定的并且G
var的外项是最小值(G.Strang,Introduction toApplied Mathematics(Wellesley-Cambridge Press,Wellesley,Mass.,1986)。
从方程(58)中获得多极的最佳值,Qopt和最小的变化结合能,ΔGvar opt。
为了用确定的单级(全部电荷)(Q1=Q)求解最优多极分布,剩余的最优多极(i≠1)的方程为,
其与方程(59)类似。
带有在imax=(lmax+1)2舍去的维数的上述矩阵方程,能够通过相对适当的计算资源被数字地求解。实际上,由于αi和βij含有无数项的总和,lcut的第二界限值必须被用于在方程(25)和(46)中以舍去最内总和。当lmax和lcut为足够大时,ΔGvar opt收敛并且包括更多多极的增加的优点基本消去。
对任意给定的抗原和几何,现有说明已经如此描述了测定作为一组多极的最紧密结合抗体的电荷分布方法。任何测试抗体的优化的结合自由能的误差可以通过从方程(58)减去方程(60)和使用方程(59)消去A计算得到。
表1-载体附加系数
afrom reference 4
1.
实施例1
改良抗整联蛋白抗体的抗原结合亲和力的方法
在这个实施例中,描述了改良抗体对治疗相关靶抗原的结合亲和力的方法。
作为原理性的证明,本发明的方法应用于VLA-1整联蛋白的抗体、胶原和层粘连蛋白的细胞表面受体,并且特别地,单克隆抗体AQC2,其通过小鼠中亲和力成熟而抗人类VLA-1受体。AQC2抑制通过VLA-1整联蛋白介导的病理过程(见,例如WO 02/083854)。
含有两个突变的ACQ2变体以比野生型抗体低100倍的亲和力连接至VLA-1。在恢复该结合的努力中,静电电荷优化技术分两步应用于抗体-抗原复合物的晶体结构以提出改良亲和力的突变体。首先,静电电荷优化被应用于确定对于结合为次优选的CDR残基的位置(Lee和Tidor,J.Chem.Phys.
106:8681-8690,1997;Kangas和Tidor,J.Chem.Phys.
109:7522-7545,1998)。第二,一组CDR突变随后被确定以进一步计算分析。基于这些计算,确定36个具有单个突变的修饰的抗体(即,36“单突变体”)和10个具有两个突变的抗体(即,10个“双突变体”)的结合亲和力。据预测26个单突变体相对于野生型抗体静电有利,15个根据包含范德瓦耳斯能项和溶剂可及表面积项的完整能量函数结合的更好。这些项与静电力无关,但是它们被计算以确保设计的突变体不接触其它残基并且不会显著减少隐藏的表面积的量;在复合物形成中增加隐藏的表面积通常是有益的(见下表中的“完整能量”栏)。此外,据预测许多双突变体将比野生型复合物更好并且效果将是单突变体的部分加成。
突变预测能够分类为包括(1)相互作用表面的突变,其涉及由于结合变为部分隐藏的残基(通过与抗体形成氢键改良相互作用);(2)抗体上极性残基的突变,其由于结合变为隐藏并因此付出解溶剂化代价,但不与抗体产生任何直接的静电作用(改良通常是通过突变为与野生型残基形状类似的疏水残基或者通过增加能够产生有利静电作用的残基);以及(3)抗体上表面残基的修饰,该残基位于非互补电位的区域。该修饰被认为增强了抗体和抗原间远距离静电作用,不影响结合表面的包装相互作用。
基于从电荷优化中获得的结果,确定突变体以用于计算分析(最优电荷分布和比目前的残基更接近最优的设计的突变体被检测;这个过程通过检验进行)。电荷优化提供原子中心的电荷但是不产生实际的突变。一轮电荷优化可以通过使用强制表示天然侧链特征的各种限制进行。例如,针对-1、0和+1的净侧链电荷,进行优化附加限制是没有原子的电荷超过0.85电子电荷单位的绝对值。
VLA-1/AQC2复合物的晶体结构(PDB编码:1MHP)通过使用标准程序制备,用程序CHARMM(Accelrys,公司San Diego,CA)加氢。N-乙酰胺和N-甲基酰胺碎片被分别应用至N末端和C-末端。在其中一个复合物(模型1)中存在残基288-293的缺失密度,但是没有尝试重建密度。使用连续静电模型,在ACQ2抗体的CDRs中的每个氨基酸侧链上实施静电电荷优化。然后根据在优化中观测到的静电结合能中的可能增加确定合适的侧链突变。侧链通过执行CHARMM中的旋转异构体二面角扫描(rotamer dihedralscab),采用60度的二面角增量构建,以确定每个侧链的最满意的位置。然后使用Poisson-Boltzmann静电能以及表示范德瓦耳斯能和隐藏表面积(buried surface area)的附加项计算野生型和突变型复合物的结合能。
与人源化中和抗体(AQC2)的Fab片段复合的α1整联蛋白I-区域(VLA-1)的晶体结构在pH 7.40下被溶解至2.8。在不对称单元晶胞中存在两个复合物。在两个复合物中锰(MN)原子都在复合界面,其大部分相互作用来自于I-区域。抗体中的Asp101模拟胶原谷氨酸作用。
下面的表中显示了对AQC2重链中的CDR可变环2获得的优化结果。Mut(突变能量)栏对应从天然残基至完全不带电的侧链等排物(即,具有相同形状但是在原子上不带电或者部分带电的残基)的转变中产生的结合自有能差异(kcal/mol)。负数显示预测的结合亲和力的增加。Opt-1栏对应能够用侧链中最优电荷分布和-1的净侧链电荷获得的结合自由能差异。Opt0和Opt1栏分别对应最优电荷,为0和+1的净电荷的结合自由能差异。基于这些结果和结构的目测,突变体被设计为能够利用这些结合自由能的改良。例如,从THR50至VAL的突变(其为不带电的等排物)使用了预测的-0.52kcal/mol突变能量。对于向净电荷为-1的侧链的突变LYS64至GLU的突变使用-1.42kcal/mol预测的最大自由能增加。
突变体设计的选择按照下面的规则进一步的计算探究。
例如,在突变能量(Mut,对应于结合自由能差异(kcal/mol),其与从天然残基至完全不带电的侧链等排物,即,具有相同形状但是在原子上不带电或部分带电的残基的转变相关)被模拟为有利(例如,ΔG<-0.25kcal/mol)的例子中,选择带有非极性侧链的系列氨基酸,例如,Ala,Cys,Ile,Leu,Met,Phe,Pro,Val的突变。
当Opt-1能量(对应于可以由侧链中最优电荷分布和-1的净侧链电荷获得的结合自由能差异)是有利的(例如,ΔG<-0.25kcal/mol),选择带有负电荷侧链的系列氨基酸,例如,Asp,Glu的突变。
类似地,当Opt+1能量(对应于可以由侧链中最优电荷分布和+1的净侧链电荷获得的结合自由能差异)是有利的(例如,ΔG<-0.25kcal/mol),选择带有正电荷侧链的系列氨基酸,例如,Arg,His,Lys的突变。
最后,在Opt0能量(对应于可以由侧链中最优电荷分布和0的净侧链电荷获得的结合自由能差异)是有利的(例如,ΔG<-0.25kcal/mol),选择带有不带电的极性侧链的系列氨基酸,例如,Asn,Cys,Gln,Gly,His,Met,Phe,Ser,Thr,Trp,Tyr,并加入Cys,Gly,Met和Phe的突变。
表2-AQC2CDR重链可变环2获得的优化结果
号码 |
残基 |
Mut |
Opt-1 |
Opt0 |
Opt1 |
505152535455565758596061626364 |
THRILESERGLYGLYGLYHSDTHRTYRTYRLEUASPSERVALLYS |
-0.5200.39----------0.20.05-0.130.0300.560.010-0.55 |
0.3-1.056.33----------0.09-0.77-1.98-1.35-1.39-0.11-0.21-0.98-1.42 |
-1.24-0.91-0.09----------0.68-0.61-1.37-0.91-1.080.25-0.08-0.73-1.23 |
3.17-0.561.77----------0.02-0.33.06-0.39-0.710.640.08-0.36-0.97 |
如前所述,设计的突变体被在计算机中建立并且重新计算结合能。从这些计算的突变运算中获得的结果被在下面显示。号码表示从野生型至突变体的结合亲和力的变化(负数表示突变体更有利)。能量为两个模型的平均值。
表3-AQC2CDRs的计算突变运算
重链修饰 |
突变 |
静电 |
完整能量 |
类型 |
Asp106Asn |
-0.1 |
-0.1 |
3 |
Arg31Gln |
-2.2 |
2.3 |
1 |
Arg31Glu |
-0.8 |
4.9 |
1 |
Arg31Lys |
0.5 |
2.7 |
1 |
Arg31Phe |
0.9 |
2.8 |
2 |
Tyr32Phe |
-0.4 |
0.6 |
2 |
Ser35Asn |
-1.3 |
-1.3 |
2 |
Ser35Gln |
-0.6 |
-0.7 |
2 |
Thr50Val |
-1.2 |
-1.7 |
2 |
His56Phe |
-0.8 |
-0.8 |
2 |
Tyr58Asn |
-0.3 |
5.1 |
3 |
Tyr58Asp |
-2.0 |
3.2 |
3 |
Tyr58Gln |
-2.4 |
2.1 |
3 |
Tyr58Glu |
-1.2 |
3.1 |
3 |
Tyr59Asp |
-0.6 |
-0.6 |
3 |
Try59Glu |
-0.5 |
-0.5 |
3 |
Leu60Asp |
-0.1 |
-0.1 |
3 |
Leu60Glu |
-0.3 |
-0.3 |
3 |
Lys64Asn |
-0.6 |
-0.5 |
3 |
Lys64Asp |
-0.9 |
-0.8 |
3 |
Lys64Gln |
-0.6 |
-0.5 |
3 |
Lys64Glu |
-0.9 |
-0.9 |
3 |
表3-AQC2CDRs的计算突变运算(续前)
轻链修饰 |
Asn30Ala |
-0.1 |
1.1 |
2 |
Asn30Ile |
0.5 |
0.2 |
2 |
Asn30Leu |
-0.3 |
-0.5 |
2 |
Asn30Val |
-0.5 |
-0.2 |
2 |
His31Arg |
1.6 |
1.9 |
1 |
His31Lys |
-0.7 |
1.3 |
1 |
Leu49Arg |
1.0 |
0.0 |
1 |
Leu49His |
2.4 |
0.6 |
1 |
Leu49Lys |
-0.1 |
-1.1 |
1 |
Asn52Arg |
0.1 |
0.1 |
1 |
Asn52His |
2.8 |
-0.2 |
1 |
Asn52Lys |
0.3 |
1.5 |
1 |
Trp95Asp |
2.5 |
4.4 |
3 |
Trp95Glu |
0.7 |
2.9 |
3 |
如结果显示,上面描述的计算过程被成功地执行以预测增强侧链突变的亲和力。这些发现被归类为三种常规的突变类型。第一种突变类型涉及位于抗原带电基团对面的表面残基,其能够产生氢键;第二种涉及隐藏的极性残基,其由于结合付出解溶剂化代价但不反之产生静电作用;第三种涉及远距离静电作用。
通过检查基本的物理/化学因素测定第一种类型的修饰,因为这些残基基本与抗原的不饱和氢配体形成氢键。令人惊奇的,观察到其中解溶剂化的成本似乎在多数情况下超过互作用能的得益。突变的第二种类型表示较少的直观的突变类型或系列,其获得的能量主要来自于在保留非极性相互作用的同时消除不利的解溶剂化。第三种类型的突变涉及远距离的相互作用,其显示显著增加亲和力的潜能。该类型的修饰特别有趣,因为它们不与抗原产生直接的接触,因此对抗体-抗原表面的精细相互作用很少产生干扰。
根据如上所述获得的计算数据,产生ACQ2的突变体(单链Fv突变体),并且通过上述KinExATM分析测定其亲和力。迄今为止产生的突变体在下面的表中显示。当进行了亲和力分析时,结果显示于标题为“Kd.”的栏中。原始ACQ2单链Fv的亲和力为25nM。
表4-观察到的AQC2改变抗体的亲和力值
重链修饰 |
突变体 |
Kd |
R31Q |
8.2nM |
Y32F |
34nM |
S35N |
39nM |
S35Q |
37nM |
T50V |
14nM |
L60D |
21nM |
K64E |
38nM |
K64Q |
12nM |
K64D |
6.3nM |
K64N |
4.1nM |
D106N |
67nM |
轻链修饰 |
N30V |
8.9nM |
H31R |
31nM |
N52K |
49nM |
N52R |
17nM |
N52H |
43nM |
AQC2中还做出了的下述改动:重链修饰R31K,R31F,R31E,H56F,Y58E,Y58Q,Y59D,Y59E,L60E;轻链突变N30L,N30A,N30I,H31K,L49K,L49R,L49H,W95E,W95D。
实施例2
改良抗-CD154抗体的抗原结合亲和力的方法
在这个实施例中,描述了改良抗体对治疗相关靶抗原的结合亲和力的方法。
人类CD154的抗体(也已知为CD40配体或CD40L;见,例如,Yamada等,Transplantation,73:S36-9(2002);Schonbeck等,Cell.Mo1.Life Sci.58:4-43(2001);Kirk等,Philos.Trans.R.Soc.Lond.B.Sci.356:691-702(2001);Fiumara等,Br.J.Haematol.113:265-74(2001);以及Biancone等,Int.J.Mol.Med.3(4):343-53(1999)),其为涉及介导免疫应答的TNF蛋白家族的成员,通过小鼠中亲和力成熟诱导。5c8单克隆抗体由本研究制备并且被确定抑制由CD154/CD40L介导的病理过程。
在增加5c8/CD40L相互作用的亲和力的努力中,静电电荷优化技术分两步应用于抗体-抗原复合物的晶体结构以提出改良亲和力的突变体。首先,静电电荷优化被用于确定次优结合的CDR残基的位置(Lee和Tidor,J.Chem.Phys.
106:8681-8690,1997;Kangas和Tidor,J.Chem.Phys.109:7522-7545,1998)。第二,一组CDR突变被确定以用于进一步的计算分析。基于这些计算,23个具有单突变的修饰的抗体(即,23个“单突变体”)的结合亲和力被计算确定。预计8个单突变体根据静电能和根据含有范德瓦耳斯能项和溶剂可及表面积项的完整能量函数都比野生型抗体更有利。这些项与静电力无关,但是它们被计算出以确保设计的突变不接触其它残基并且不会显著减少隐藏表面积的量;复合物结构中增加的隐藏表面积通常是有益的(见下表中的“完整能量”栏)。
突变预测能够分类为包括(1)相互作用表面的突变,其涉及由于结合变为部分隐藏的残基(通过与抗体形成氢键改良相互作用);(2)抗体上极性残基的修饰,其由于结合变为隐藏并因此付出解溶剂化代价,但不与抗体产生任何直接的静电作用(改良通常是通过突变为与野生型残基形状类似的疏水残基或者通过增加能够产生有利静电作用的残基);以及(3)抗体上表面残基的修饰,其位于非互补电位的区域。该修饰被认为增强了抗体和抗原间远距离静电作用,不影响结合表面的包装相互作用。
基于从电荷优化中获得的结果,确定突变体以用于计算分析(最优电荷分布和比目前的残基更接近最优的设计的突变体被检测;这个过程通过检验进行)。电荷优化提供原子中心的电荷但是不产生实际的突变。一轮电荷优化可以通过使用强制表示天然侧链特征的各种限制进行。例如,针对-1、0和+1的净侧链电荷获得优化,附加限制为没有原子的电荷超过0.85电子电荷单位的绝对值。
CD40L/5c8复合物的晶体结构(PDB编码:1I9R)通过使用标准程序制备,用程序CHARMM(Accelrys,公司San Diego,CA)加氢。N-乙酰胺和N-甲基酰胺碎片被分别应用至N末端和C-末端。使用连续静电模型,在ACQ2抗体的CDRs中的每个氨基酸侧链上实施静电电荷优化。然后根据在优化中观测到的静电结合能中的可能增加确定合适的侧链突变。侧链通过执行CHARMM中的旋转异构体二面角扫描(rotamer dihedral scan),采用60度的二面角增量构建,以确定每个侧链的最满意的位置。然后使用Poisson-Boltzmann静电能以及表示范德瓦耳斯能和隐藏表面积(buried surfacearea)的附加项计算野生型和突变型复合物的结合能。
与人源化中和抗体(5c8)的Fab片段复合的CD40配体的晶体结构在pH6.50下被溶解至3.1。由于CD40L天然为三聚体,在复合物中有三个5c8Fab分子和5个CD40L分子。它们在复合物中形成三个独立的CD40L/5c8界面。锌(ZN)原子被结合至每个5c8Fab上并且被包括至计算中。对三个界面独立地进行计算并且采用被发现在所有三个位点都比野生型有利的氨基酸取代。
下表显示从所有三个5c8分子的5c8轻链中的CDR可变环1获得的优化的结果。Mut(突变能量)栏对应于从天然残基至完全不带电荷侧链等排物(即,具有相同形状但是在原子上没有电荷或者部分电荷的残基)的结合自有能差异(kcal/mol)。负数表示预测的结合亲和力的增加。Opt-1栏对应于能够由侧链中最优电荷分布和侧链净电荷为-1获得的结合自由能差异。Opt0和Opt1栏分别对应于最优电荷,净电荷为0和+1的结合自由能差异。基于这些结果和结构的目测,突变被设计为能够利用这些结合自由能的改良。例如,从SER 31至VAL的突变(其为不带电荷的等排物)使用预测的-1.23至-0.98kcal/mol的突变能量。GLN 27至GLU的突变使用-1.21至-0.88kcal/mol预测的突变为静电荷为-1的例链的最大自由能增加。
表5-5c8CDR轻链可变环1中获得的最佳结果
链残基 |
Mut |
Opt-1 |
Opt0 |
Opt1 |
1L 24ARG1L 26SER1L 27GLN1L 28ARG1L 30SER1L 31SER1L 32SER1L 33THR1L 34TYR1L 35SER1L 36TYR1L 38HSD2L 24ARG2L 26SER2L 27GLN2L 28ARG2L 30SER2L 31SER2L 32SER2L 33THR2L 34TYR2L 35SER2L 36TYR2L 38HSD3L 24ARG |
-0.11-0.060.210.11-0.01-1.231.45-0.02-0.25-0.020.01-0.15-0.46-0.290.26-0.590.08-0.980.740.00-0.090.090.10-0.23-0.35 |
0.17-0.59-1.21-0.96-0.143.880.91-0.66-1.000.00-0.95-0.48-1.04-1.60-0.88-0.94-0.384.042.31-0.65-0.620.02-1.70-1.20-0.34 |
-0.11-0.06-0.95-0.71-0.42-2.16-0.65-0.41-1.10-0.11-1.31-0.70-0.46-0.79-0.41-0.46-0.55-1.89-0.86-0.38-0.480.09-1.24-1.17-0.35 |
-0.370.57-0.26-0.40-0.47-0.42-0.670.07-0.800.041.74-0.620.130.190.350.08-0.42-0.54-0.870.09-0.120.182.37-0.79-0.35 |
3L 26SER3L 27GLN3L 28ARG3L 30SER3L 31SER3L 32SER3L 33THR3L 34TYR3L 35SER3L 36TYR3L 38HSD |
-0.270.11-0.300.03-1.060.820.200.090.060.04-0.20 |
-1.23-1.07-0.850.024.021.18-0.32-0.80-0.05-0.99-0.46 |
-0.53-0.71-0.30-0.29-2.03-0.85-0.15-0.74-0.10-1.30-0.76 |
0.27-0.080.15-0.36-0.90-1.050.29-0.38-0.021.66-0.72 |
如前所述,设计的突变体在计算机中被构建并且重新计算结合能。从这些计算突变运算中获得的结果在下面显示。号码代表野生型到突变体的结合亲和力的变化(负数表示突变体更有利)。5c8所有三个链的能量都被给出。
表6-5c8CDRs的计算突变运算
链突变体 |
完整能量 |
静电学 |
1H TYR33PHE1H ASN59ASP1H ASN59LEU1L SER26ASP1L GLN27GLU1L SER31VAL1L THR33ASP1L TYR54GLU2H TYR33PHE2H ASN59ASP2H ASN59LEU2L SER26ASP2L GLN27GLU2L SER31VAL2L THR33ASP2L TYR54GLU3H TYR33PHE3H ASN59ASP3H ASN59LEU3L SER26ASP3L GLN27GLU3L SER31VAL3L THR33ASP3L TYR54GLU |
0.197-0.995-1.294-0.703-0.5148.154-0.219-0.9990.623-0.218-1.116-1.333-0.6589.293-0.430-1.0120.145-0.837-1.179-0.540-0.4978.129-0.337-1.123 |
-2.741-2.548-2.517-0.712-0.357-1.739-0.916-0.729-2.726-2.885-3.067-1.627-0.395-0.832-1.359-1.030-1.979-2.267-2.271-0.565-0.342-1.284-0.676-0.825 |
如结果显示,上面描述的计算过程被成功地执行以预测增强亲和力的侧链突变。这些发现被归类为三种常规的突变类型。第一种突变类型涉及位于抗原带电基团对面的表面残基,其能够产生氢键;第二种涉及隐藏的极性残基,其由于结合付出解溶剂化代价但不反之产生静电作用;第三种涉及远距离静电作用。
通过检查测定第一种类型的突变,因为这些残基基本与抗原的不饱和氢配体形成氢键。令人惊奇的,观察到其中解溶剂化的成本似乎在多数情况下超过互作用能的得益。突变的第二种类型表示较不直观的突变类型或系列,其获得的能量主要来自于在保留非极性相互作用的同时消除不利的解溶剂化。第三种类型的突变涉及远距离的相互作用,其显示显著增加亲和力的潜能。该类型的修饰特别有趣,因为它们不与抗原产生直接的接触,因此对抗体-抗原表面的精细相互作用很少产生干扰。
根据如上所述获得的计算数据,产生5c8的突变体(Fab片段),并且通过上述KinExATM分析测定其对于CD40L的亲和力。迄今为止产生的一些突变体的选择的结果在下面的表中显示。进行了亲和力分析,结果显示在标题为“IC50”的栏中。原始5c8Fab对CD40L的亲和力为0.81nM。
表7-观察到的5c8改变的抗体的亲和力值
突变体 |
IC50 |
轻链 | |
S26D |
0.26nM |
Q27E |
0.12nM |
因此,认为本发明的方法可使得治疗相关抗体的亲和力成熟。
等价物
对于本领域技术人员而言,使用不超常规的实验,有许多本文描述的发明的特殊实施例的等价物。所述等价物意欲通过下述权利要求被包含。
识别最小化溶剂中配体和分子间结合的结合静电作用的电荷
分布的计算机系统和程序及其应用
图1
图2
图3
图4A
图4B
图4C
图4D
摘要
本计算机执行的程序涉及用于测定配体性质的方法学,其随后可用来设计结合蛋白质或其它分子靶,如HIV靶的配体。方法学定义了对给定靶位点和几何的静电互补。静电互补可与靶位点的空间互补一起使用以通过明确的构建和通过组合库的设计或偏向发现配体。静电互补的定义,即复合物中不利去溶剂化能和有利相互作用之间的最优折中,被发现在配体设计中有用。该方法学通过定义基于物理原则的最优配体的特性,实质上转化了设计问题。这些特性提供了清晰和精确的标准,测试配体可相对于此标准进行比较,并可被用作修饰已有配体和重新构建新配体的模板。给定靶位点的静电互补通过电荷分布进行定义,该电荷分布最小化结合至给定溶剂中分子的结合位点的静电贡献。在计算机系统中表示电荷分布的一个方式是作为一组多极。通过确定具有匹配这一最优电荷分布的点电荷的分子,测定的电荷分布可被用于确定配体,设计药物,和设计组合库。
相关申请
本申请根据35USC§119(e)要求1997年4月4日申请提交的,名称为识别最小化溶剂中配体和分子间结合的结合静电作用的电荷分布的计算机系统和程序及其应用的美国临时专利申请系列号60/042,692的优先权。临时申请的内容在此全文引入作为参考。
政府支持
本工作由国家健康协会授权号GM47678和GM56552提供部分资金支持。因此,美国政府可以享有本发明的确定的某些权利。
发明领域
本发明涉及合理的药物设计,并且更特别地,涉及基于将对溶剂中的配体和其靶向分子之间的连接的静电贡献最小化的配体上电荷分布的预测的合理的药物设计,该预测将对溶剂中的配体和其靶向分子之间的连接的静电贡献最小化。本程序还涉及做出所述预测和增强的连接的配体的方法和工具,以及涉及如此制成的配体的诊断和治疗用途。
发明背景
计算的合理药物设计方法包括两种常规途径:筛选整个分子以及探测局部位点并通过结合分子片段或嫁接化学基团到亲代结构以构建分子。DOCK是全分子算法的例子,其使用了查找所给靶位点互补形状的操作(I.D.Kuntz等,J.Mol.Biol.161:269(1982)(Kuntz);R.L.DesJarlais等,J.Med.Chem.31:722(1988)(DesJarlais))。大大分子化合物数据库可以进行计算“筛选”,其首先去除形状与靶位点不相容的分子(通过计算与互补形状的重叠),然后尝试将余下的分子根据近似能量函数分类排列。该操作成功的识别出大量结合靶位点的配体。不幸的是,X射线晶体研究显示通常配体结合的位点与预测的不同。对于这种预测和事实之间差异的一种可能的解释是虽然形状互补算法有效的去除了非常不相容的实验配体,但近似能量函数在定义更高水平的结合细节上非常不准确。
MCSS(多拷贝同时搜索(Multiple Copy Simultaneous Search))算法是最常用的基于片段的配体设计方法之一(P.J.Goodford,J.Med.Chem.28:849(1985);A.Miranker和M.Karplus,Proteins:Strut.,Funct.,Genet.11:29(1991);和A.Caflisch等,J.Med.Chem.36:2142(1993))。基本设想是使用表示功能基团(羰基、氨基、胺、羧酸盐、羟基等)库的探针搜索结合位点的区域,测定具有特别有利的互作用能的位点。当探针成功的置于结合位点后,连接各种小分子团集形成凝聚分子。对于该问题开发了两种途径。一种尝试将数据库中的小分子装配结合到以功能基团(HOOK)(M.B.Eisen等,Proteins:Strut.,Funct.,Genet.19:199(1995),另一种使用模拟退火方案以产生片段间的连接体原子和键从而获得具有良好共价几何结构和非键合相互作用的配体候选物(DLD,动态配体设计(dynamic ligand design))(A.Miranker和M.Karplus,Proteins:Strut.,Funct.,Genet.11:29-34(1991)和23:472(1995)).。
现有的用于合理药物设计的方法可有效的提出新的和诱发令人感兴趣的几何结构,其显示大约粗略互补于位点中的氢键基团。不幸的是,现有方法使用近似值,其可能不准确且会导致难以准确的将候选物分类排列。因此,虽然存在大量的计算算法可用于分析结合位点和结合复合物,以及合理设计配体和其它药物候选物,基于结构的设计依然是不准确和不确定的努力企图。
发明概述
现有技术的局限被通过以下步骤克服(i)精确处理靶分子与候选配体的非结合和结合状态中的溶剂化、介电和远距离静电效果,和(ii)将提出的配体分类排列的详细的定量方法。本方法基于以下发现,对溶剂化、远距离静电和介电效果的粗糙处理,以及缺乏对靶分子与候选配体非结合状态的合适处理,限制了合理设计和识别新的用于结合预定靶分子的候选配体。本计算机执行程序通过提供考虑配体/靶分子结合的交换性质的方法克服了这些局限,其中与溶剂的相互作用被交换为配体和其互补靶分子间的相互作用。与现有技术不同,本文所述方法考虑了在溶剂中配体与其靶受体间的结合中的溶剂化、远距离静电和介电效果。
因此,在一方面,提供了方法识别配体在溶剂中结合靶分子(如受体、酶)的性质的方法,其条件是提供了靶分子三维形状的表示法。方法包括选择以三维定义的配体的三维形状,其形状互补于(符合)所选靶分子所选部分的形状;测定配体上电荷分布的表示法,其该电荷分布最小化溶剂中配体和靶分子间结合的静电作用。在一些实施方式中,电荷分布的表示法是一组多极。在其它实施方式中,方法进一步包括识别具有符合电荷分布表示法的点电荷的分子的步骤。
这些方法在设计用于结合具有已知配体的靶分子的结合增强配体中特别有效。如在本文中所使用的,结合增强配体表示的配体,其结构依据靶分子的已知配体,但根据本文所述方法进行了修饰从而具有最小化溶剂中配体和靶分子间结合的静电作用的电荷分布。因此,本计算机执行程序提供提供了合理药物设计的方法,其识别结合具有已知或可预测的三维结构的靶分子的该增强改进的配体。方法包括选择配体的以三维结构定义的形状,其符合该形状与所选靶分子部分的形状相匹配,测定配体上电荷分布的表示法,其该电荷分布最小化溶剂中配体和靶分子间结合的静电作用。
用所要求方法识别的其配体的靶分子是分子三维形状的表示法已知或可以预测的分子。该靶分子包括生物高聚物和非生物高聚物。生物高聚物的例子包括蛋白、核酸、脂类、糖类和前述的混合物(如糖蛋白、脂蛋白等等)。非生物高聚物的例子包括聚酰胺、聚碳酸酯、聚烷撑、聚烷撑二醇、聚烷撑氧化物、polyalkylene terphthalates、聚乙烯醇、聚乙烯醚、聚乙烯酯、聚乙烯卤化物、聚乙烯吡咯烷酮、聚乙醇酸交酯、聚硅氧烷、聚氨基甲酸酯、烷基纤维素、丙烯酸和甲基丙酸烯酸酯的聚合体、聚乙烯、聚丙烯、聚乙二醇、聚乙撑氧、poly(ethylene terphthalate)、聚乙烯醇、多乙酸乙烯酯、聚氯乙烯、聚苯乙烯、聚乙烯吡咯烷酮、乳酸和羟基乙酸的聚合体、聚酐、多正酯类、聚亚安酯、poly(butic acid)、聚戊酸、poly(lactide-cocaprolactone)及其共聚物。
在本文中,术语“蛋白”或“多肽”可互换使用以包含大量由氨基酸组成的生物多聚物,如受体、激素和酶。需要理解的是如本文中所述,涉及“蛋白”、“多肽”或“受体”通常都也可用于类似结构,如脂蛋白、糖蛋白、连接有其它有机或无机基团的蛋白以及多链和多结构域的多肽结构,如大分子酶和病毒,和包括非生物多聚物。在这些例子中,出现关于配体和蛋白分子间结合的静电作用的类似结果问题。
在一些实施方式中,靶分子为蛋白,本计算机执行程序被用于识别新的和/或增强改进的配体以在溶剂中结合具有已知三维结构的蛋白。配体和蛋白的已知结合伴侣包括激素/受体、辅因子或抑制剂/酶、抗原/抗体等等。对于配体以前已经被识别了的蛋白,本方法被用于识别对已知配体结构的合适修饰以获得“增强”“改进”配体上的电荷分布,其与未修饰(天然)配体的电荷分布相比,最小化了增强改进的配体和蛋白间结合的静电作用。实施例中提供了作为示例的配体/蛋白结合伴侣,其被用作根据本方法识别“增强”“改进的”配体的起点。
在另一方面,提供了识别结合蛋白靶分子的新的和/或结合增前强的配体的方法。已知蛋白根据氨基酸序列(蛋白一级结构)和蛋白所处的溶剂折叠为三维结构。蛋白的生物学活性和稳定性依赖于蛋白的三维结构。可以通过多种方法测定和或预测蛋白的三维结构。最常见的用于测定蛋白结构的方法包括使用X射线晶体分析法。蛋白三维结构也可以使用圆形二色性、光散射、或通过测量辐射能的吸收和发散进行估计。蛋白结构也可以通过使用如中子衍射技术、或通过核磁共振(NMR)进行测定。前述的方法均为本领域普通技术人员所公知的,而且记载于标准化学教科书中(如Physical Chemistry,4th Ed.Moore,W.J.,Prentiss-Hall N.J.(1972)和PhysicalBiochemistry,Van Holde,K.E.,Prentiss-Hall,N.J.(1971))。使用上述技术,识别了大量天然存在的蛋白中的循环再发模式(recurring patterns),其中最常见的是α螺旋、并行β折叠片层和非并行β折叠片层,参见如R.Dickerson,等,The Structure and Action of Proteins(1969)。蛋白二级结构的螺旋、折叠片层和旋转转角共同产生了活性分子的三维结构。蛋白的三维结构可以根据经验使用进行物理生化分析进行测定,或可选的,使用模型进行预测,该模型构建了一个或多个已知三维结构的同源蛋白的一个或多个三维结构。
本计算机执行程序在设计增强改进的配体中特别有效,该配体的结构依据靶分子的已知配体的结构,但根据本文所述方法进行了修饰从而具有最小化溶剂中增前改进的配体和靶分子间结合的静电作用的电荷分布。该增强改进的配体在本文中表示为“结合增强的配体”。因此,本方法使用已知构造构型的配体作为起点从而进一步优化和选择配体结构,其降低结合该结构对分子和溶剂的结合具有降低的静电作用。例如,本方法用于产生增强改进的(结合增强的)的辅因子或酶抑制剂(如HIV-1蛋白酶)。
本计算机执行程序也用于设计增强改进的激素或其它配体从而优化结合(最小化结合的静电作用)以符合任何已知的受体位点。该方法对药物设计特别有效,因为其允许更有选择性和更稳定的设计和制造能够更有选择性和更稳定的结合受体位点的药物。设计结合改进与受体的增强结合的配体意味着使用的剂量更低,由此降低了可能与更高剂量相关的副作用和/或毒性的机会。设计结合改进与受体结合的增强配体也可以识别比用作识别具有增强结合性质的增强配体的基础的原始配体更高效的药物,该原始配体用作识别具有改进的结合性质的改进配体的基础。因此,已知的蛋白配体可用作设计增强改进的配体的出发点,其中增强改进是基于改进的配体对蛋白增强的结合性质,这该改进的结合性质是由于选择了具有最小化溶剂中配体与蛋白间结合的静电作用的电荷分布的配体。因此,本方法允许对抗原和表位进行定制,以更选择性和以更高亲和力与抗体结合,并提供新的和/或改进的配体的设计和选择,该配体与其它受体或靶分子结合。
根据本文所述方法识别的配体可以用可识别标记,如放射性标记、酶、发色团等进行标记以实施免疫诊断操作或其它诊断操作。这些标记试剂可以被用于检测各种诊断样本中的靶分子。为了成像操作,在活体外或活体内,本文所识别的配体可以用附加的试剂进行标记,如NMR造影剂或X线造影剂。将可识别试剂连接于多肽或其它含有活性氨基的小分子的方法是本领域所公知的。配体也可以连接于不溶性支持物以便于诊断实验。
本计算机执行程序也可有效的搜索三维数据库,以获得形状与所选蛋白部分的形状相符合匹配,并且具有最小化溶剂中配体与蛋白间结合的静电作用的电荷分布的结构。
可选的,三维结构数据库可以单独基于配体的形状进行筛选(使得其符合所选蛋白所选部分的形状),进一步修饰满足该标准的数据库分子以具有最小化溶剂中修饰配体与蛋白间结合的静电作用的电荷分布。进行三维数据库比较的搜索算法记载于文献中。参见,如V.Balaji等申请的U.S.Pat.No.5,612,895,″Method of Rational Drug Design Based on Ab Initio ComputerSimulation of Conformational Features of Peptides″以及其中公开的参考文献。对于相关的药物设计的计算机方法,也参见Omichinsld等申请的U.S.Pat.No.5,081,584,″Computer-assisted Design of Anti-peptides Based on the Aminoacid Sequence of a Target Peptide″,和Hardman申请的U.S.Pat.No.4,939,666,″Incremental Macromolecule Construction Meth-ods″。
每个使用本方法识别的新的和/或“改进增强的”配体都采用标准的合成或重组步骤进行制备,然后测试生物学活性。显示生物学活性的化合物为候选的拟肽(peptidomimetics);不显示生物学活性的化合物帮助进一步定义配体与靶分子结合所必须的配体部分。在本文中,peptidomimetics拟肽广泛表示模拟肽的化合物。例如,吗啡为内啡肽的peptidomimetics拟肽。
已知化合物的数据库(如the Cambridge Crystal Structure Data Base,Crystallographic Data Center,Lensfield Road,Cambridge,CB2 1EW,England;and Allen,F.H.,et al.,Acta Crystallogr.,B35:2331(1979))也能够用于搜索含有空间(形状)参数的结构,其该结构被用于互补(符合匹配)所选靶分子所选部分的形状。发现具有预期空间参数的化合物被检索获得,并进一步分析以确定哪个检索获得的化合物也具有预期的电荷分布或能够被修饰为具有预期的电荷分布,以最小化溶剂中配体与靶分子间结合的静电作用。被发现同时具有预期的形状和电荷分布的配体是原始靶肽的peptidomimetics拟肽的附加候选物。
评估根据本计算机执行程序识别的配体的生物学活性和/或对靶分子的结合亲和力。迭代方法被用于识别具有最优选的生物学性质的配体。参见,如PCT WO 19359,″Process formaldng Xanthene or Cubane based compounds,and Protease Inhibitors″,其描述了识别复杂化学组合库中酶抑制剂的生物活性构像的方法。生物活性构像然后被用于设计peptidomimetics拟肽,或被用于搜索有机结构的三维数据库以建议潜在的peptidomimetics拟肽。标准生理学、药理学和生物化学程序可用于测试用本方法识别的“增强的”“改进的”或新的配体。评估生物活性的特殊方案是被测试化合物的函数。这种分析能够被用于结合靶分子(如HIV蛋白酶、MHC II类蛋白)的已知配体从而为这些生物学重要的靶分子设计结合增强的配体。
附图的简要说明
在附图中,
图1是描述一个本计算机执行程序的实施方式的框图;
图2是可以用于执行本计算机执行程序的计算机系统的框图;
图3是表示本发明计算机执行程序所依据的化学原理的图;和
图4是表示HIV-1蛋白酶抑制剂的图。
图5是问题几何结构的图形。
具体描述
本计算机执行程序可以通过下面的详细描述更完整的被理解,其应该与附图结合阅读,其中相似的参考号表示相似的结构。所有上述和以下说明中引用的参考文献都在此特别作为参考引入。
本计算机执行程序包括确定配体性质的方法,其依次被用于设计配体以结合蛋白或其它分子靶,如HIV靶。方法定义了所给靶位点和几何结构的静电互补。静电互补可以与靶位点的空间互补一起通过清楚的构建和通过组合库的设计或偏向用于发现配体,其是通过清楚的构建和通过组合库的设计或偏向。
静电互补的定义,即复合物中不利的去溶剂化能和有利的相互作用之间的最优交换,被发现在配体设计中是有用的。该方法通过根据物理原理定义优化配体的性质转化了设计问题。这些性质提供了清楚和准确标准,使得实验配体可以被比较以及在已有配体的修饰和新配体的重新构建中用做模板。
所给靶位点的静电互补用电荷分布定义,其最小化所给溶剂中分子上结合位点的结合的静电作用。一种在计算机系统中表示电荷分布的方法是作为一组多极。通过识别具有符合匹配该最优电荷分布的点电荷的分子,确定的电荷分布可以被用于识别配体、设计药物和设计组合库。
现在参考图1,显示了一个本计算机执行程序的实施方式。该实施方式可以使用一种或多种计算机程序在计算机系统上执行,下面描述了它的一个例子。给出要设计配体的分子的定义,在30表示,分子分析工具32提供了如34所示的可能的分子构像或形状。有多个系统可以通过该构像,包括但不限于X射线晶体分析法、同源模型、核磁共振成像或分析技术,如Kuntz和DesJarlais所示的。分子上预期的结合或活性位点,在36所示,和预期的用于在指示的结合位点与分子结合的配体形状,如在38所示,也输入计算机系统。
静电连续分析器40,在下面更加详细的描述,被用于测定最小化所给溶剂中结合位点处结合的静电作用的电荷分布,给出分子形状的三维空间表示法,分子上的结合位点通过在三维空间中的位置定义,预期的配体形状也在三维空间中定义。因此,分析器40的输出是最小化结合的静电作用的电荷分布的表示法,如42所示。
电荷分布42被用于与具有预期配体形状的候选配体结合,入如44所示。候选配体形状和点电荷分析器46测定哪个候选配体具有与最优电荷分布42最接近的电荷分布。分析器46输出如48所示的结合位点的候选配体。类似的,筛选系统50也可以用于筛选接近42所示最优电荷分布的候选配体44,以生成组合库52。该组合库可以被用于开发具有预期特征的更复杂的分子。
现在参考图2,合适的计算机系统60通常包括为用户显示信息的输出设备62。计算机系统包括主要部件单元61,其连接于输出设备62和输入设备64,如键盘。主要部件单元61通常包括处理器66,其通过互连结构70连接于存储系统68。输入设备64也通过互连结构70连接于处理器66和存储系统68,输出设备62也一样。
应该理解一个或多个输出设备可以连接到计算机系统。输出设备的例子包括阴极射线管(CRT)显示器、液晶显示器(LCD)、打印机、通讯设备如调制解调器,和音频输出。也应该理解一个或多个输入设备可以连接到计算机系统。输入设备的例子包括键盘、键区、滚迹球(track ball)、鼠标、手写板、通讯设备、音频输入和扫描仪。可以理解本计算机执行程序不限于特殊的与计算机系统结合使用的特殊输入或输出设备或本文所述的那些。
计算机系统60可以是常规用途的计算机系统,其可以使用高级计算机编程语言,如“C”“Fortran”或“Pascal”进行编程。计算机系统也可以是专门编程的、特殊用途的硬件。在常规用途的计算机系统中,处理器通常是可商购的处理器,例子是可从Intel购得的x86系列处理器和可从Motorola购得的680X0系列微处理器。许多其它处理器也是可以获得的。该微处理器运行称为操作系统的程序,例子是UNIX、DOS和VMS,其控制其它计算机的运行,并提供调度、调试、输入/输出控制、记录、编译、存储分配、数据管理和内存管理,以及通讯控制和相关服务。一个实施方式的执行是通过使用具有aPA-7200(99MHz)芯片的Hewlett-Packard 9000/735计算机。该处理器和操作系统定义了计算机平台以编写高级编程语言的应用程序。
存储系统通常包括计算机可读和可写的固定记录介质,例子是磁盘、闪存和磁带。磁盘可以是可移动的,已知为软盘、或固定的,已知为硬盘。磁盘具有大量的磁道,信号存储于其中,通常是以二进制的形式,即解译为一和零的序列的形式。该信号可以定义通过微处理器运行的应用程序、或存储在磁盘上以被应用程序处理的信息。通常,在运算中,处理器导致大量数据由固定记录介质读入集成电路存储元件,其通常为快速、随机存取存储器,如动态随机存储器(DRAM)或静态存储器(SRAM)。集成电路存储元件允许比磁盘更快的由处理器存取信息。处理器通常在集成电路存储器中操作数据,然后在加工程序完成时拷贝数据到磁盘。已知多种机制可管理磁盘和集成电路存储元件间的数据移动,本程序并无限制。可以理解本程序也不限制为特殊的存储系统。
应该理解本计算机执行程序不限于特殊的计算机平台,特殊的处理器或特殊的高级程序绪言语言。另外,计算机系统60可以为多处理器计算机系统或可以包括多部通过计算机网络连接的计算机。
定义配体性质
使用该连续计算定义静电作用的互补配体性质的程序略述于图3。因为静电作用的交换性质,在结合状态中的表面上“强的”静电吸引力经常破坏结合平衡,但是似乎有利于特异性。这是因为隐藏极性和带电基团导致的实质去溶剂化处罚代价,它们的对大分子联合的净静电贡献通常是不利的。在为所给的、固定的在位点具有极性和带电基团的靶设计配体时,重要的是平衡去溶剂化和相互作用能以使得对结合最有利或至少提供最小可能的不稳定。以下方法使用理想的几何和连续静电模型分析的解决了该问题,提供了单独、唯一的被精确解答的最优值。
对于结合球形配体到任意形状的受体以组成球形复合物的例子,结合的自由能根据配体的电荷多极表达。通过最小化多极的结合自由能,(i)存在单个、最优的多极分布,其定义了所给几何的最紧结合配体,(ii)该多极分布对应于ΔGbinding中的最小值,(iii)在该最优值,配体去溶剂化处罚代价的量正好是复合物中有利的分子间静电作用的一半,以及(iv)次优的电荷分布的结合自由能的损失可以通过与最优值进行比较容易的被计算出来。该多极结合自由能的最小值提供了清楚和明确的路线,从连续模型、接受的大分子和配体的接受的能量表示法到最优配体的一组表示符,即多极。为了该方法可更广泛的应用,任何对球形几何的要求都被去除了。因此,大分子和配体可是任意形状的,并同样这样处理。
在球形例子中,优化的可变结合能如下定义:
ΔGvar=ΔGint,L-R+Ghyd,L bound-Ghyd,L unbound (1)
其包括三个项,在此分别讨论。第一个是配体受体筛过的作用能,其包括来自每个配体电荷分布的每个多极组分与受体中所有电点电荷的相互作用的值。该值通过被分析计算的系数,αl,m和配体多极(Q′l,m)计算得到,
第二项是由于配体电荷分布Gbound hyd,L的结合状态反应场能。其具有来自所有具有相同值m的多极组分所有配对的值,因为配体多极分布通常在不是结合状态中球形边界中心的点附近展开,但是根据方位角的对称选择几何,
第三项是非结合状态溶剂化能,其包括来自每个多极组分的值。因为多极展开是在配体球中心的附近,和由于球面低谐函数的正交性,消去所有交叉项(cross-terms),得出
结合上面三个方程,
转换为矩阵符号,完成平方并为Q′opt l,m求解得出最优可变结合能。由于从可变结合能中忽略的项对所给几何是恒定的,这描述了最优结合配体的多极。该步骤更详细的解释阐明于文章L.P.Lee和B.Tidor,J.Chem.Phys.,106:8681-8690,(1997),其在此特别引用作为参考,并且其部分记载在附录中。
运行计算机程序以实施那种Lee和Tidor,同上和附录中略述的方法可接受,输入值lmax,其确定方程59和61(见附录)的矩阵大小,leur,其截除方程25和46中的最内总和(见附录),得到问题的几何,其表示靶和配体的形状,以及单极的优化值是任意的还是固定为一些值。问题的几何包括半径以及结合状态和配体球的中心的在z轴上的坐标和系统中每个局部原子电荷的大小的坐标值。介电常数∈1和∈2通过特殊的程序问题测定。对αi、Bij和γi值进行估算,其通过随后求解矩阵方程59或61(见附录),例如通过使用LU分解。可以获得B矩阵的本征值以验证该固定值为最小值。所有的实数浮点值可以被表示,例如,使用64位或其它合适的格式。矩阵代数的计算可以使用可行的,或精确度增加版本的合适子程序进行,如Press等,Numerical Recipes in C:The Art of Scientific Computing,CambridgeUniversity Press,Cambridge,1988中定义的。程序运行时的输出是优化电荷分布的表示法(如使用多极)、固定点的性质和记录α、β、γ值的文件。由于直接的方法,即LU分解被用于解矩阵方程,时间测量为(lmax)6和所用存储测量等级为(lmax)4的存储。该程序输出可以通过计算矩阵方程中特殊的稀疏矩阵被改善。也可以通过以迭代法,如共轭梯度法或各种张驰方法求解矩阵方程提供优化。该方法被实施并使用高对称电荷分布和α螺旋的末端作为受体进行测试。
该方法其通过使用迭代数字运算以计算相关的矩阵系数扩展到任意形状的分子,并且为了效率,使用大量散布于配体体积的中心,单独的多极位于其上这些中心上。
当该方法扩展到非球形几何,其具有以下形式,。αl,m保持同样的符号,βl,m,l′,m变为βl,m,l′,m′,因为方位角排列不再被使用,γl,m变为Yl,m,l′,m,因为球面低谐函数不消去非球形表面的交叉项(cross-terms)。因此,出现非常类似的矩阵方程,
其求解可以通过用于球形例子的同样的矩阵方法或者通过奇异值分解,其使用可行的或增强准确性版本的应用合适子程序,例如定义于Press等,同上中的。然而,数值计算可以用于计算相关的矩阵系数。对于上述球形例子,可以根据闭合形式表达式进行快速计算。当使用迭代数值方法计算时同样的矩阵系数(αl,m,βl,m,l′,m′和γl,m,)使用迭代数值方法进行计算时,计算的需求极大增加。
可选的,配体通过使用更多的中心描述,每个通过少量的多极描述。极端的,每个配体可以被安排在点电荷位置,现在500是可以承受的,即可以在三个星期的计算时间内被计算,其中每个中心的lmax=0。可能最好的解决方式是居中的,其中存在大学大约10个lmax=2的位置(单极、双极或四极项)或在每个中心出现这种情况。低次序多极的分布中心可以是用于描述任意配体电荷分布的有效和准确的方法。该方法被合适的阐述以包含间分离的多极中心间的相互作用,并且使用球形几何的结果显示使用两个多极分布而不是一个可以获得最优电荷分布的等价描述,其使用大约四分之一数量的多极组分以及因此必需的基本上四分之一的时间。
两种可选的方案可以被用于矩阵系数的迭代数值计算。第一种方案是改良的有限差Poisson-Boltzmann(FDPB)求解器,如DELPHI(I.Klapper,R.Hagstrom,R.Fine,K.Sharp.和B.Honig)。关注Cu-Zn过氧化物歧化酶的活性位点中的电场:离子强度和氨基酸修饰的影响。蛋白Proteins:Struct.,Funct.,Genet.1:47-59(1986),M.K.Gilson,K.A.Sharp,和B.H.Honig。计算溶液中分子的静电电位:方法和误差估算。J.Comput.Chem.9:327-335(1988)和UHBD(B.A.Luty,M.E.Davis,和J.A.McCammon.Solving thefinite-difference non-linear Poisson-Boltzmann equation.J.Comput.Chem.13:1114-1118(1992),M.Zacharias,B.A.Luty,M.E.Dayis,和J,A.Mcammon.Poisson-Boltzmann analysis of the X repressor-operating interaction.Biophys.J.63:1280-1285(1992)),第二种方案是改良的边界元素方法(BEM)(R.J.Zauhar和R.S.Morgan.The rigorous computation of the molecu-lar electric potential.J.Comput.Chem.9:171-187(1988),R.Bharadwaj,A.Windemuth,S.Sridharan,B.Honig,和A.Nicholls.The fast multipole boundary element method formolecular electrostatics:An optimal approach for large systems.J.Comput.Chem.16:898-913(1995))。这些改良使得点多极,(与仅仅点电荷相对的,)被表示。
因此,更加复杂的方法包括下列。对于在每个中心的每个极组分,进行迭代连续运算以测定其筛过的(screened)与受体点电荷的库仑相互作用(基本上αl,m),其与自身反应场的相互作用和在结合(基本上βl,m,l′,m′)和非结合(基本上γl,m,l′,m′)状态下系统中每个其它极组分的相互作用。估计由99个极组分表示的配体(如在每个中有11个lmax=2的11个中心)需要三周以下的CPU时间。对于许多应用程序,减半中心的数量的一半和减半时间的一半是足够的。单个中心周围的多极分布使用许多全球整体项以准确的描述与中心相当远的复杂电荷分布。通过在空间中分布大量用于展开的中心,同样准确的描述能够根据许多较少数,、稍微更局部的项被获得。
使用分子描述符以发现配体
再次参考图1,由上述步骤定义的电荷分布42可以被用于测定哪个候选配体将具有最接近最优值的电荷分布。电荷分布和分子形状的描述可以被用于重新构建配体结构,或它们可以被用于筛选化合物数据库,或者它们可以被用于组合库的设计或偏差。
在发现配体的程序中,详细的点电荷分布被拟合于用上述方法测定的多极分布。接着,分子片段和/或分子被拟合于点电荷分布。最后,点电荷和片段都可以在如下所述的组合库的设计中被使用。
最小二乘拟合步骤被用于定义最拟合于描述最优值所描述的多极分布的点电荷分布。例如,使用粗略具有用于FDPB计算的间距的格点的规则立方格。这能够采用在FDPB编码中使用的同样的三线函数获得,以实现相反方向的绘制,被绘制于带电格点的任意点电荷绘制于带电格点(参见Klapper.)。是否一组点电荷能够充分拟合于多极表示的静电电荷分布,可以通过比较由于使用拟合点电荷分布替换多极本身所导致的结合自由能的降低进行确定。使用具有0.5间距的格点立方格的实验表明由于拟合点电荷导致的计算的结合能的计算的损失低于0.001kcal/mol。此外,获得的给定点电荷在数量上是合理的(几乎所有的都小于0.10e),其似乎可能与分子片段拟合。在该实施方式中,多极,(其为电荷分布的稍微非局部描述,)被根据点电荷描述转换到局部格,从而分子可以被拟合。
在拟合电荷中固定点的效果不仅可以通过最小化结合能损失进行测量,还可以通过如何简单分子或分子片段如何可以简单地从点电荷构建。立方格(cubic lattice)如上所述的被用于拟合功能基团合和分子。更基于分子的格也被使用,且可以包括为针对共植入的相同化合价(spsp2和sp3)的连通性。此外,相同的点电荷密度可以是不利的,更合适的,而具有在配体表面附近更高的点电荷密度可以提供更加有效的拟合。
给出定点电荷分布,其可以以七种方法拟合于分子或分子片段。例如,分子片段几何和点电荷分布的数据库(如来源于片段的PARSE参数组的库(D.Sitkoff,K.Sharp,和B.Honig.Accurate calculation of hydration free ener-gies using macroscopic solvent models.J.Phys.Chem.98:1978-1988(1994)))可以被用于匹配个体功能基团到点电荷分布上的有利位置。如果每个片段需要在配体体积中的所有位置并以每个方向进行尝试,该匹配过程可以是非常大的扫描搜索。耗时可以通过为点电荷分布使用规则的立方格得到充分的改善。每个片段只需要在格的相对小的部分被扫描以确定为其“诊断”的格点电荷组。该诊断可以被用于所有的库片段,例如,在杂凑表中,且点电荷值的聚类可以被用于查询杂凑表和拟合片段到电荷格。只要保持同样的格间距,杂凑表可以为许多不同的靶和优化被重新使用。
片段被安置后,将它们组合到分子中的问题类似于上述MCSS方法算法所解决的,虽然选择片段位置的理论基础在该方法和在本计算机执行程序中非常不同。其产生的两种解决方法适于在此使用。在上述HOOK方法中,小分子的数据库被用做连接体以组合片段,通常试图同时引入刚度(rigidity)。在上述动态配体方法(DLD)中,大量碳原子与片段重叠,模拟退火过程被使用,其中每个碳的占位性有可以增长大或缩短缩小,且其中键形成和键断裂事件被用于结合新的碳连接体。在每种方法中,每个片段通常允许被略微移动以使得产生相对松弛的配体。可以使用移动的准确的移动处罚代价函数,其是基于移动如何影响计算的结合能。基于DLD的方法由于其适应性是更好的。
可选的,分子可以以连续的方式增长以至充满配体体积和符合点电荷分布。一种直接的方案包括安置单链一片段于其符合点电荷场的位置,进行对能够结合于首个片段的其它片段的搜索,通过连接转矩调整它们的相对方向。该过程能够以树性样方式进行以产生大量配体。优值(merit)或距离值的合适图形被用于确定是否接受或拒绝每个新片段。包括范德瓦尔斯和扭力项的电位以及对定义的优化值的体积和电荷分布的拟合可以被用于该方法中。
又另外可选的是“最低要求”配体的设计。优化的多极分布可以与尽可能少的点电荷拟合。该优化过程包括寻找相对少量的点电荷,其计算结合能在最优kcal/mol的十分之几中。对互补核苷酸碱基的研究表明,比天然使用的更好的互补“碱基”可以使用仅仅三分之一数量的点电荷被重建,即腺嘌呤的互补可以使用仅仅四个点电荷被重建;该互补结合的得比腺嘌呤更紧。这些简化的点电荷配体保留了与伴侣(partner)的Watson-Crick氢键,虽然以稍微不同的方式。含有非常少的必需点电荷的配体的模型可以表示更精细配体应该具有的关键补偿相互作用。它们可以作为有效的支架或种子,基于它更多的计算分子设计可以被实施,或者根据它合成组合策略可以有效的被建立。如果它们结合的足够紧,它们可以是特别有效的疗法,因为病毒难以对靶定于催化侧链的小分子配体产生抗性。
设计组合库
在图1中50所示的组合库的设计,现在被更详细的描述。虽然,相当长期以来一直感兴趣的是使用计算分子建模以重新进行合理的配体设计,但该方法还可以通过其它方式用于配体的发现。特别的,该方法可以用于定义相对狭窄的化学空间区域,组合库可以被设计以特别详尽的搜索该限制空间。提供甚至最艰巨的组合化学方案的限定合成能力,该机制可以引导合成差异到更高的可能方向。
另外,有几个可选该计算方法的执行方式。一种执行方式开始于详细的点电荷格拟合至最优多极,隔离该格为对应适合接受一个或多个功能基团的口袋(pockets)的空间区域。形状和点电荷随后被用于确定一般大小和特征,如带正电荷、带负电荷、高极性、中等极性、弱极性或疏水性。这些特征定义可以被用于指导组合合成以产生合适的配体。
已经描述了本计算机执行程序的计算方面,一些生物学模型系统现在被描述。
生物学模型系统
实施例1
II类主要组织相容性复合物(MHC)蛋白
介绍
主要组织相容性复合物蛋白(MHC)是细胞表面抗原呈递结构,其作用是向T细胞显示蛋白溶解的细胞内肽的例子。通过T细胞识别肽为“外来的”,诱导免疫应答。该应答包括杀死抗原呈递细胞(通常为MHC类)或分泌淋巴因子,该淋巴因子控制免疫系统各种元件的攻击,包括B细胞激活(通常为II类MHC)。由于每个个体具有有限数量的组织相容性蛋白和实际上无限数量的要呈递的肽,每个MHC分子能够呈递大量的肽。结构研究已经显示了I类MHC和II类MHC分子各自用于获得高亲和力但相当低特异性的机制。(L.J.Stem and D.C.Wiley,Structure 2:245(1994))。
与来自流感病毒的肽复合的II类MHC蛋白HLA-DR1的结构已经被解读(L.J.Stem,etal.,Nature(London)368:215(1994))。与流感红血球凝聚素残基306-318(PKYVKQNTLKLAT)的复合物中HLA-DR1原始结构说明了大量结合和识别的重要特征,其已经在其它II类MHC复合物中被证实。该蛋白包含细胞表面侧上具有两个免疫球蛋白样结构域的八条β折叠和细胞外侧上的一对α螺旋。肽结合位点是两个螺旋间的裂口,并被β折叠支撑。肽以延展但高扭曲的构象结合,类似于II类聚脯氨酸螺旋构象;N端和C端延伸出该位点。大部分肽和蛋白间的氢键(15个中的12个)位于肽骨干基团,其帮助解释了蛋白如何识别许多不同的肽。观察到的肽构象强制每条肽侧链进入到三个方向中的一个:侧链中的5条(Y308,Q311,T313,L314,和L316)被导入MHC分子表面的口袋,且基本被隐藏,侧链中的6条(K307,V309,K310,N312,K315,和T318)被从结合位点导出至T细胞受体,余下的两条侧链(P306和A317)被引导越过位点。因此,产生与MHC广泛接触的残基大部分截然不同于预备与合适T细胞相互作用的那些。5个口袋中,最深的容纳Tyr308,通过结合研究表明酪氨酸、苯丙氨酸或色氨酸都被允许。不同的II类MHC等位基因在接受5个隐藏的侧链的5个口袋处掺入取代。认为相互作用中的改变导致肽特异性中的同种异型差异。由于个体在它们的MHC分子的同种异型补体中不同,个体在它们的免疫应答方面不同。
肽结合到单个II类MHC分子的相对亲和力被认为导致相对肽抗原性。噬菌体展示的筛选和扩增研究定义了每个氨基酸在高亲和力肽的单个位置出现的频率(.Hammer等,J.Exp.Med.176:1007(1992)和J.Hammer,等,PNAS U.S.A.91:4456(1994))。最强的锚定位置测定为位置1的大分子芳香基团,其主要被发现为Tyr(48%),Phe(25%),或Trp(13%)。位置4是长疏水物,为Met(50%)和Leu(28%);位置6是小分子残基,为Ala(32%)和Gly(22%);以及位置9通常被发现为Leu(45%).(J.Hammer,等,J.Exp.Med.176:1007(1992))。而且,在任意位置都非常少有负电荷侧链恢复。该数据提供了有效的半定量的系列相对亲和力,其在确证本程序的计算方法方面是有效的。
测试和确证
II类MHC HLA-DR1系统被用于测试本文所述的计算方法以分析肽结合位点,和设计增强结合的分子。测试和确证由大量任务组成,开始于使用结合病毒肽的晶体结构(L.J.Stem等.,Nature(London)368:215(1994))。这些测试被设计用于证实该方法能够(i)认可观察到的结合肽是良好的结合体,(ii)认可已知的有害肽突变是不利的,(iii)认可已知的增强结合肽突变是有利的,(iv)在个体表面口袋中重新产生已知模式的结合疏水、极性和带电的残基,以及(v)重新建立已知的肽骨架结构和联系。
结合肽复合物的分析
使用本文所述的方法分析病毒肽与HLA-DR1的结合。简要的,本文所述的策略被用于重新建立结合肽的电荷分布。可变点电荷被置于每个肽的原子上,且电荷值被计算以优化结合自由能。通过比较这些点电荷与实际的点电荷,计算出与计算的优化值相比肽亲和力的下降。病毒肽的计算得到的和实际点电荷之间点电荷的差异表明存在设计增强结合肽的可能性。以该方式,这组测试被用于确认要求的方法在根据已知配体和其结合伴侣结构设计增强结合配体方面的有待证实的应用。
增强和减弱结合的突变体
相对亲和力的测试最初采用等排的或接近等排的替换进行实施。从Hammer等使用噬菌体展示研究的数据中,在位置1上Tyr比Phe优选,在位置4上Met或Leu比Gin优选,其中下划标记的残基对应在结合肽结构中的残基(L.J.Stem等.,Nature(London)368:215(1994);J.Hammer,等,J.Exp.Med.176:1007(1992);和J.Hammer,等,PNAS U.S.A.91:4456(1994))。本文所述方法被用于计算由于这些突变导致的亲和力改变。
本文所述的用于配体设计的新策略开始于受体的给定结构(或其它靶分子,如抗体或酶)并找出最优互补于该结构的配体性质。本文所述实施的测试分析是否该方法能够测定由于配体电荷分布差异导致的亲和力差异,这是定义最优配体电荷分布的基本条件。当点电荷量如前面段落所述的被优化,预期Tyr1羟基的极性被保持,Val2极性的增长,Gln4和Thr6的降低,其反映了Hammer等的静电倾向(J.Hammer,等,J.Exp.Med.176:1007(1992);和J.Hammer,等,PNAS U.S.A.91:4456(1994))。
极性和非极性侧链的模式
本计算机执行程序的方法被用于探测没有记载于肽原子已知位置的肽结合位点。该探测可以通过两种方式进行。一种方式中,五个主要结合口袋的每个通过只在该位点中的点电荷分布的个体优化进行探测;第二种中,五个主要结合口袋根据在一个计算中优化的整个位点的电荷分布共同进行探测。结果的比较表明位点被连接的程度;实验工作表明该连接将是最小化的(J.Hammer等,J.Exp.Med.180:2353(1994))。互补形状区域通过球形包装进行构建,计算优化与位点结合的多级电荷分布。通过多极的直接检测和通过构建互补于该位点的分格的点电荷分布,每个位点根据其接受疏水、极性、正电和负电基团的程度进行分类。检测可以展示混合的特征,其中位点大部分疏水但接受一些局部的极性基团(推测Tyr1位点是该类型)。与已知位点特征进行比较从而评估该结果。差异可以导致是否计算中使用的肽去溶剂化代价(其是由结合构象中的刚性肽导致的)是完全不同于在噬菌体展示研究中通过实际配体经历的。然而,我们不期望该差异被考虑,因为去溶剂化代价主要是由极性和带电基团控制,其在非结合状态暴露于溶剂,并且其应该在观察到的延伸和扭曲构造中。
骨干轮廓(traces)和接触
由于骨干轮廓被认为对于基本所有结合的肽是不变的,希望位点强烈知道骨干接触。因此,本计算机执行程序的方法被用于重新构建晶体中观察到的骨干的位置以进一步确证本文所述的方法。使用上述方法,肽骨干结合区域中优化配体的分布多极表示法被识别,转化为分格的点电荷场,肽的氨基基团(N-甲基乙酰胺)作为最小平方拟合被拟合到电场中,虽然也不允许与位点的壁空间上重叠。
设计增强的结合
一般而言,设计增强结合配体的策略被用于查找机会,其中已知配体没有充分利用该位点。为此目的,付出的去溶剂化能比其在有利相互作用中恢复的更多的个体化学基团,和现在配体的基团不符合计算优值的位点都被识别。上述实施的计算(测试和确证)在该机会的搜索中被重新分析。
结合肽复合物的分析
上述完整的静电分析被用于测定功能基团(在肽和结合位点上的侧链或骨干双极基团),其结合的总静电作用是不利的(即,其向疏水基团的突变被计算出导致更紧的结合)。该静电分析建议了用于修饰为疏水基团以产生更稳定复合物的肽的靶区域(即使它们是骨干的)。使用该策略我们能够在Arc抑制物的变异体中识别三个稳定的突变(Z.S.Hendsch,等.,Biochemistry 35:7621(1996))。不利于结合的MHC蛋白基团可以通过修饰肽以获得与其改良的结合而被改善。这些机会可以通过大量的并行的研究被证实,包括重新优化病毒肽原子点电荷的计算(见上述)。同样的降低和增加配体极性的位点可以被发现。该平行验证被用于提供进一步的证据,证明提出的位点可以被修饰以增强结合。
极性和非极性侧链的模式
预期个体口袋优化和其整个位点可以被用作建议的详细改变的来源以识别与其靶分子增强结合的配体。在选择该优化的位点中,当通过实际和优化电荷分布间的差异进行衡量时,获得最大自由能的区域可以被重新获得,相应的结合能被最初选择。三个该区域包括:位置1结合口袋,肽骨干结合区域(见下)和在病毒-肽研究中被溶剂群占据的口袋(L.J.Stem,等,Nature(London)368:215(1994))。在病毒-肽复合物中位置1容纳Tyr(L.J.Stem,等.,Nature(London)368:215(1994)),但是也经常被发现为Phe或Trp(J.Hammer,等,J.Exp.Med.176:1007(1992);和J.Hammer,等,PNASU.S.A.91:4456(1994)。在最近确定的HLA-DR1与不同肽结合的晶体结构中,Trp占据该位点。Trp侧链的方向是相对Tyr的90°旋转,然而周围蛋白口袋基本是不变的。将大分子疏水侧链放入该口袋实际显示对结合的需求,J.Hammer,等,PNAS U.S.A.91:4456(1994))。为结合于该口袋的基团产生最优的电荷分布可以被用作对合成增强结合配体的组合合成方案的指导。
骨干轮廓和接触
本计算机执行程序可以被用于设计具有非肽骨干的配体以改善连接。通过比较骨干结合区域的最优电荷分布和肽电荷分布,改良的骨干化学(chemistries)可以被合理的设计。例如,该方法可以被用于识别具有α碳等价物(或至少β碳)的配体,因此允许呈递的侧链在任何新平台的T细胞面的连接被设计。
实施例2
HIV蛋白酶
概述
HIV蛋白酶对于病毒的正确组装是必需的。通过突变使蛋白酶失活导致产生无感染性的颗粒。HIV蛋白酶抑制物的设计是过去二十年或更久时间里大量制药公司的主要成就。该研究受益于在表达、纯化和结晶化的合适条件确定之后获得高通量X射线晶体数据的设备。在蛋白数据库中现在已经有超过45个或是单独的或是在与配体的复合物中的HIV-1蛋白酶结构。这些结构提供了丰富的数据集用于测试不同配体与同一个蛋白的作用形式。已经开发了大量非常有希望的抑制物,一些处在临床实验中,少量已经被FDA批准。然而,蛋白酶的“脱逸(escape)”突变体已经被分离获得许多该抑制物。
蛋白酶结构显示了99个残基多肽链的基本对称同型二聚体。活性位点组成于二折叠轴,被一对对称相关环围绕,该环在非结合状态显示高柔性,但是配体结合后遮蔽活性位点,并且邻近能够结合多至七个残基长的底物的缺口。该活性位点包括来自每个亚单位的三个一组的Asp25,Thr26和Gly27,和一对非常接近且几乎共面的Asp25羧酸基团。没有配体时酶外观上精确的二折叠对称通过结合(不对称)肽配体被稍微破坏。在设计研究中一个特别有趣的问题在于是不对称配体(例如在肽底物上模拟的)还是对称配体(其具有机会结合于符合酶二折叠的配体二折叠轴)是更紧结合的。令人惊奇的结果是某些对称配体被发现在活性位点中不对称的结合。本文所述计算方法能够被用于研究产生这种差异的能量作用。
底物特异性研究被用于测定肽的结合选择。这显示了在P2’位置Gln或Glu和P1上大分子疏水侧链(Phe,Leu,Met,Asn,或Tyr)的亲和力。不明确的选择包括P3上的Glu和P2上的疏水物(A.Wlodawer和J.W.Erickson,Annu.Rev.Bio-chem.62:543(1993))。
本文所述方法对其所包含的对HIV感染是决定性的分子的结合方式的分析的应用可以被用于为了作为诊断和治疗试剂的促进紧密结合配体分子的设计。总的来说,本计算机-执行的程序的方法主要是连续静电学和第二自由能模拟。程序提供寻找靶向分子的静电学补充体的新的方法初步结果证明了本文所用的用于连续分析的对分子和能量的剖析的计算模型得到与通过使用对通过434抑制物对蛋白-DNA识别的一对研究的更加详细(以及耗时的)的自由能模拟的发现的相一致的结论(见,实施例3)。
测试
本方法的基本原理的初步测试在II类MHC分子的研究中执行,并且之后用HIV-1蛋白酶执行。因此,上述方法被使用以设计结合至HIV-1蛋白酶的增强的结合配体。许多配体设计草案中遇到的一个困难是需要预测结合复合物的构像。目前的计算机执行的程序通过选择蛋白的构像和解决一系列的最佳补充配体的分子描述符绕开了这个问题。程序还提供了工具以检验单独的和在含有各种配体的复合物中的HIV-1蛋白酶的已有结构的子集。
环构像
两个对称的相关的环在酶的未结合形式中位于开放的构像中,并在结合形式中关闭活性位点。一系列被良好表征并由于其相对刚性而有吸引力的抑制剂是环尿素化合物,其由DuPont Merck Pharmaceuticals开发(P.Y.S.Lam,等,Science 263:380(1994)和C.N.Hodge,等,Chem.& Biol.3:301(1996))。该化合物家族的成员可以被用于分析结合状态结构。例如与XK263(带有两个萘基、两个苯基和两个羟基取代的对称环尿素)的复合物是在蛋白数据库中,与DMP323和DMP450的复合物显示于图4中(“HIV-1蛋白酶的抑制物”)。该构象改变的影响使用上述方法根据计算的最优配体的性质测定。受体构象改变对互补配体性质的影响通过用占据活性位点上个体亚位点口袋的部分的形状和相对极性描述优化进行测定。预期计算中的差异可以很小,因为底物必须启动与开放构象的环的结合并在环闭合时完成结合。底物或者表现互补于开放或闭合形式之间的一些折中,或者两者间没有实质差异。
质子化状态
一个重要的并且目前未解决的对蛋白酶抑制剂的设计很重要的问题是摧化的门冬氨酰残基的质子化状态(Asp 25和25′)。预测侧链的这个对的质子化状态将本质上改变计算的静电补充体的性质。对配体来说承担更多的去溶剂化代价以与带电荷而不是不带电荷的天门冬氨酸反应可能是值得的。预测到计算的优化配体静电学性质和实际的结合配体的比较将允许质子化状态分配至一些这些复合物。DuPont Merck组中的循环尿素的情况在这个研究中是有用的因为NMR证据与每个被质子化的门冬氨酰基团一致(D.A Torchia,等,J.Am.Chem.Soc.116:1149(1989))。通过用双-,单-,以及未质子化的催化对从计算结果中比较优化的补充,确定活性位点中的化学自由度的可获得性对其配体特性的影响。该研究还允许比其它对配体结合更敏感的优选的滴定状态的识别。
对称的和不对称的结合
许多对称的抑制剂已经基于它们将对对称酶更互补的原则被设计(M.Miller,等,Science 246:1149(1989))。尽管这些中的一些已经被观察到在结晶研究中对称地结合(XK 263(P.Y.S.Lam,等,Science 263:380(1994),DMP 450(C.N.Hodge,等,Chem.& Biol.3:301(1996)),以及A-76928(M.V.Hosur,等,J.Am.Chem.Soc.116:847(1994)),但是其它的非对称地结合(A-76889(M.V.Hosur,等,J.Am.Chem.Soc.116:847(1994))。对称的抑制剂的非对称的结合可能有两个原因。位点可以使变形以致其真实地互补于对称的配体,或者位点可以保持基本上对称,但配体优先进行非对称反应。这些情况可以通过这些位点携带检验位点的计算的静电互补更加精确地被区别,为二折叠对称而锚定对称和不对称结合配体。如果补充体对不对称的结合配体保持对称,对配体的改善可以用上述方法被定义。例如,增强结合的配体可以通过研究表示不同选择(对称的和不对称的)的图4中的四个化合物使用羟基基团以补偿埋藏的催化天门冬氨酸侧链被设计。
设计
设计蛋白酶抑制剂的方法类似于上述关于MHC配体设计的那些描述。几个特定用于HIV蛋白酶的设计点在本文中描述。
每个上述研究解答了关于活性位点的构像和滴定改变如何影响计算互补配体性质的特殊问题。每个研究也能够分析修饰存在的配体(获得“增强的结合配体”)或者设计具有增强的亲和力的全新配体的机会。乙醇和二醇在大量的HIV-1蛋白酶抑制剂中普遍存在;为满足门冬氨酰基团的静电学性质的更有效部分可以被识别以设计增强结合的配体。
对靶向至HIV的所有药物的一个特别重要的问题是“脱逸”突变体的最终演化。本发明对发展补充活性位点残基所需的最小电荷构型是有用的。据信这样的核心分子是有用的,因为其有限的尺寸应当通过脱逸突变体减少潜在可分裂的接触的数量。此外,由于接触将都在催化位点,因此分裂突变体可以是没有活性的。
对其它HIV靶向的设计的研究
对其它HIV靶向的设计的研究用上述方法执行。其它HIV靶向包括TAR和RRE的RNA复合物以及HIV包膜蛋白。
实施例3
434抑制物DNA-结合区域
简介
我们已经用连续静电计算分析了434抑制物DNA-结合区域,R1-69,(其结合至OR1算子)的高分辨率的X-射线晶体结构。主要结果在下面大致描述。相互反应被分裂为从每个蛋白主链羰基,CαNH,以及侧链和每个核酸核糖,碱基以及磷酸酯的贡献。对每个组,对结合的去溶剂化的贡献以及使得贯穿界面(定义为“分子间的”)的新反应的贡献和用蛋白或者DNA中的筛选的变化(定义为“分子内反应”)的贡献被计算。
目前仅仅预先适应的蛋白二聚物与预先适应DNA的刚性结合已经被研究。这些方法可以被延展至用于如上文所述的构像柔性。全部的对结合的静电贡献是不利的(45.3kcal/mol)。这是由于仅仅部分由有利分子间项(-96.4kcal/mol)弥补的大量的去溶剂化代价所导致的。分子内项的和是小的而且是不利的(8.8kcal/mol)。在复合物中形成的四个盐桥(两个对称相关的对)通过每个为-1.7kcal/mol的平均稳定复合物形成。这大部分是由于这些组比蛋白侧链在从未折叠状态中承担更小的去溶剂化代界的事实。在这点上,结合似乎与折叠有几分不同,但是我们的进一步结果显示区别似乎更复杂。
对去溶剂化代价最大的贡献来自于系统中的带电荷基团,蛋白侧链(63.5kcal/mol)和DNA主链基团(50.6kcal/mol)。蛋白主链基团(6.9kcal/mol)和DNA碱(11.9kcal/mol)承担小得多的成本。去溶剂化代价对许多在蛋白-DNA界面上埋藏的基团是巨大的。有趣的是,位于附近但是不在界面上的一些侧链也在结合上损失显著的溶剂化。
在复合物中形成的强的、有利的分子间反应几乎全部由DNA主链基团组成。令人惊奇的,相同的量来自与蛋白侧链的相互反应(-42.2kcal/mol),其包括大量的带电荷基团,蛋白主链也是一样(-41.8kcal/mol),其除了带电荷末端以外仅仅是极性的。分析表明在α-螺旋的N-末端和个体磷酸酯基团之间进行的强反应以及一系列磷酸酯与蛋白环中的主链基团之间的强反应。此外,带电荷侧链和DNA主链之间的一些相互反应也是相当疏远的,但是通过低介电蛋白被指导,其中由于通过溶剂的较少的筛选,可以预期静电反应在较长的范围。
与碱基的分子间相互反应是小的:蛋白主链为2.2kcal/mol(不利的)以及用蛋白侧链为-14.6kcal/mol(有利的),尽管碱基-例链反应被通常认为是给蛋白-DNA复合物带来大量的特异性。有趣的是,足够近以使得形成氢键的反应导致大约一半有利的分子间反应;相同的贡献来自太远而不能形成氢键的相互反应。特别地,许多这些更疏远的相互反应是对算子的中心区域中的“未接触”碱基的;左侧和右侧半-位点中的Arg43贡献-3.9kcal/mol。
全部分子内反应对静电进入能量仅仅贡献8.8kcal/mol,但是这个作用的起源是非常有趣的。由于它们位于蛋白或者DNA内,这些反应存在于结合和自由态中的相同几何中。它们的值在进入的时候改变,无论如何,由于复合物中的高介电溶剂的移去减少了相互反应的筛选。由于在结合状态中的减少的溶剂筛选导致较低的有效介电,DNA主链内的排斥力(大部分由于磷酸酯-磷酸酯相互反应)的值在结合蛋白上增加了19.2kcal/mol。这部分由-11.9kcal/mol的蛋白侧链之间的有利贡献弥补,其大部分是由于有吸引力的蛋白的盐桥,其强度由于在复合物中减少的筛选而“增加”。
当对每个基团的进行所有的贡献(去溶剂化,分子间,分子内)制表时,大部分基团各自对去溶剂化能量的付出比它们在其它反应中得到的要更多。这对于磷酸酯基团和除了一个碱基之外的所有碱基以及对在结合界面的侧链是特别正确的。所得到的比它们在去溶剂化能量中的付出多的基团倾向于在未进入状态中大部分被埋藏。
总的来说,这个工作证明了得自对结合事件的积极剖析的详细的观察。这些技术对探测结合至HIV靶向的配体是有用的,并且允许增强的结合配体的合理设计。
点突变作用的自由能分析:在434抑制物-DNA复合物中碱基对的改变得模拟
为了解决识别的特殊问题并且验证我们的连续静电研究的结果,我们用明确的溶剂进行自由能模拟研究。结合状态起始结构是R1-69,结合至OR2的的高分辨率复合物(L.J.W.Shimon和S.C.Harrison,J.Mol.Biol.232:826-838(1993))。在位置7L的突变是TA→GC。DNA的多倍未结合构像从300-ps分子动力学轨迹开始产生。轨道的五个框架被作为未结合态自由能计算的起始结构被选择和应用。尽管434抑制物和DNA之间的大部分反应在大沟中,这个操作子突变在抑制物面对DNA小沟一侧的假-二级轴附近发生。总共十个模拟在未结合态中和六个在结合状态中被执行,其带来好的统计学信息。结果在这里简要描述(E.J.Simon,″A Molecular DynamicsStudy of a Mutation in a Bacteriophage 434 Operator/Repressor Complex″,PhDthesis,Harvard Univer-sity(1996))。
结果:
整体的稳定性变化为+1.4±0.7kcal/mol,其排斥对突变运算子的结合。这与0.8-1.2kcal/mol的实验值非常一致(G.B.Koudelka,等,Nature(London)326:886(1987))。进行这个全部稳定性改变(B.Tidor,″MolecularModeling of Contributions to Free Energy Changes:Applications toProteins.PhD thesis,Harvard University(1990);B.Tidor and M.Karplus,Biochemistry 30:3217(1991);以及B.Tidor Proteins:Strict.,Funct.,Genet.19:310(1994))的来源的分析并且显示出Arg43L侧链和突变体鸟嘌呤的N2氨基基团之间的强烈的排斥。这是非常有趣的反应因为它表明这个精氨酸通过在这个位置用鸟嘌呤“干扰”作为特异性的负面因素。在突变位点的富含AT的区域中的小沟中的氢键受体和侧面磷酸酯基团的排列极化了周围的溶剂水以有利地与这个负电位相互反应。Gua N2供体向小沟的引入有效地排斥了这一极化溶剂。在未结合态中的排斥比在结合状态中的强因为在蛋白结合后溶剂从小沟的这个区域被替代。
这些自由能模拟结果和连续静电学研究的比较基本上显示对Arg 43的反应的相同的剖析,包括溶剂极化作用。这个比较证明了相对于明确的模拟,连续方法学的精确性。目前的计算机-执行的程序是围绕着连续方法为基础,其更加节约并且能够被用于立即分析全部结合点,而不是一次一个基团。自由能模拟主要用于检验连续理论和实验之间的不同点。
附件
图5举例说明了问题几何。图5a显示了在受体(R)和球形配体(L)之间的严格接合以形成球形结合状态复合物的结合反应。受体、配体和复合物都为由高介电的溶剂(∈2)围绕的低介电的介质(∈3)。图5b显示了解决的边界值问题包括用介电常量为∈2的溶剂包围的介电常量为∈1的半径为R的球形区域的电荷分布。坐标的原点是较大球形区域的中心,但是在多极中电荷分布在沿着z轴距离d的点附近展开。几何要求为配体球不扩展超过受体球,R≥d+a,尽管平等的情况也在图中例证。
静电结合自由能是在结合状态和未结合状态中的静电自由能之间的差,ΔGbinding=Gbound-Gunbound(见图5a)。由于介电模型包括影响熵以及焓的应答,因此静电能被认为是自由能。这里我们表达每个状态的自由能为包括配体(L)、受体(R)、以及它们的相互作用(L-R)的库仑和反应场(水合作用)项的总和。
Gstate=Gcoul,L state+Gcoul,R state+Gcoul,L-R state+Ghyd,L state+Ghyd,R state+
Ghyd,L-R state。 (1)
下面表达式为结合自由能的结果:
ΔGbinding=ΔGcoul,L-R+ΔGhyd,L-R+ΔGhyd,L+ΔGhyd,R (2)
其中我们应用了在受体和配体中的点电荷几何保持固定的事实以消除配体和受体的库仑自身作用,并且其中两个L-R项仅仅归于结合状态,因为配体和受体被假定不在未结合状态中相互反应。(但是注意,虽然受体的电荷分布在结合和非结合状态不需要相同。如果它们是不同的,这加入一个常数到ΔGbinding,其能够在定义方程(3)中ΔGvar时消去)。因此,方程(2)描述静电结合自由能为配体和受体的去溶剂化作用(其为不利的)和结合状态中溶剂遮蔽的静电作用(其通常是有利的)的总和。由于我们的目标是改变配体电荷分布以优化静电结合自由能并且最后一项仅仅加上一常数,因此我们定义相关的变化结合能,
ΔGvar=ΔGint,L-R+ΔGhyd,L (3)
其中方程(2)的RHS的前两项已经结合称遮蔽的反应项并且常数项已经被消除。注意
以及
其中V
L state为指定态中仅归因于配体电荷分布的总静电电位以及如显示的,V
term,L state为库仑或反应场(水合作用)项。总和为配体(i∈L)或受体(j∈R)中的原子点电荷的和。方程(5)中的
因子是由于配体电荷分布与自身诱导的反应场相互影响的事实。
Vcoul,L bound,Vhyd,L bound,和Vhyd,L unbound,方程(4)和(5)中的三个静电电位,根据通过解决图1b中显示的边界值问题给定的几何和电荷分布进行显示。电荷分布(对应于配体)位于半径R的球中。我们采用球的中心作为坐标的原点(不带撇的)但是多极中的电荷分布展开于第二原点(带撇的)周围,其顺着Z轴转移了距离d,从而
各处的电位满足泊松方程。在球内部,可以被写为
其中RHS的第一项为库仑并且第二项为反应场(水合作用)电位,并且i的总和与配体点电荷一致。在球的外部,库仑和反应场电荷可以合并并且写作
其中Al,m和Bl,m由适当的边界条件确定并且Yl,m(θ,φ)为球谐函数。在球谐函数和球中心周围的电荷分布的多极中展开在方程(7)中的库仑项。这里我们将多极扩展的原点移至
其中Q′l,m是围绕带撇原点
展开的球形多极,
我们采取Jackson1使用的Yl,m(θ,φ)的定义。方程(10)中的表达式当r′>ri′时(即在配体外部或者,更明确的,在中心在
并且半径是从
至点电荷的最远距离的球体的外部)是有效的。
为了代入方程(7)和合并包括谐低函数的项,我们首先根据Yl,m(θ,φ)/rl+1展开方程(10)的Yl,m(θ′,φ′)/r′l+1。这个可以使用Greengard 2的结果轻易获得,其规定为r>d,
其中
由于我们已经选取了θd=0的几何(图1b),方程(12)中仅仅m’=0的项是非零的,这种情况下方程(10)变为
其中多极分布围绕点
进行,但是电位表达为围绕大球中心的球谐函数的总和。上面的方程也可以被写作,
其中具有相同的Yl,m(θ,φ)的项可以被集中在一起,从而与方程(14)相反,方程(14)中具有相同的Q′* l,m的被集中。
在将方程(15)代入方程(7)并且匹配r=R的边界条件,
Vin|r=R=Vout|r=R (16)
球内的水合作用(反应场)电位为,
其中
我们现在可以再写出不同的V′s,明确它们对Q′* l,m的依赖性。V′coul,L bound通过方程(10)给定,Vhyd,L bound通过方程(19)给定但是重新改写以使具有相同的Q′* l,m的项被集中,Vhyd,L unbound通过R=a和d=0时的方程(19)给定,
代入方程(4),我们更加清楚ΔGint,L-R对Q′* l,m的依赖,
其中在最后一行我们已经定义了组分αl,m,其独立于Q′* l,m’,作为方程(25)中乘以Q′* l,m’的因子。每个αl,m表达多极对ΔGint,L-R的贡献并且包含获得ΔGvar所需的关于受体电荷分布的所有信息。
对于ΔGhyd,L,根据Q′* l,m’重新表达方程(5)是有用的,多极描述了配体电荷分布而不是个体电荷,qi。我们围绕着多极扩展的中心
展开
已经由Rose表明在球体坐标中扩展变为3,
其中
并且
是通过用
替代
获得的算子。对于正的m并且当
根据拉普拉斯方程的解(即r
lY
l,m(θ,φ)或Y
l,m(θ,φ)/r
l+1)进行处理,显示出
3,
双因子被定义为
并且球形部分衍生物为
为了计算负数m的
我们应用
的事实以及方程(34)中球形部分衍生物的定义从而获得
for m≥0。
结合配体的水合作用能随后为
为了估算方程(37)中的
我们使用方程(31)和梯度方程4
其中
C(l′,1,l;m-m′,m′)为经常在角动量的研究中遇到的向量加法(或Clebsch-Gordon)系数,其在表I中显示4,
为球形单位向量,
相应的
从方程(38)至(41),我们有
u(rlYl,m(θ,φ)=(-1)u[l(2l+1)]1/2C(l-1,1,l;m+u,-u)rl-1Yl-1,m+u(θ(φ)2)
应用表I、方程(31)和方程(37)至(42),我们获得下面的中间结果:
并且在结合状态下配体的水合作用能的最终表达式,
其中,βl,m,l′,m′由上面两个方程定义;注意m′≠m时βl,m,l′,m′为零。我们通过在方程(46)中设定d=0和R=a获得未结合配体的水合作用能,
其中γl,m通过方程(48)和(49)定义。为了符号表示方便,我们将γl,m写作为l和m的函数,尽管并不与m形式相关。
因此ΔGvar已经被表示为配体电荷分布的多极,Ql,m′(围绕配体球的中心扩展)和不依赖于Ql,m′的组分αl,m,βl,m,l′,m′以及γl,m的函数。结合方程(26)、(47)和(49)可得
注意仅仅αl,m依赖于受体电荷,而βl,m,l′,m′和γl,m仅仅依赖于结合和未结合状态的几何。虽然ΔGvar opt为实数量,αl,m和Ql,m′为复数且积αl,m,Ql,m′*和Ql,m′*Ql′,m′包括形式γl′,m *(θ′,φ′)Yl,m(θ,φ)的项的总和;注意βl,m,l′,m′和γl,m为实数。
我们用αl,m和Ql,m′的实数和虚数部分重新改写ΔGvar opt,
(其中m的总和不包含l=0)注意
以及
Y* l,m(θ′,φ′)Yl,m(θ,φ)+Y* r,-m(θ′,φ′)Yl,-m(θ,φ)=Y* r,m(θ′,φ′)Yl,m(θ,φ)
+Yr,m(θ′,φ′)Y* l,m(θ,φ) (52)
=2[ReYr,m(θ′,φ′)·ReYl,m(θ,φ)+ImYr,m(θ′,φ′)·ImYl,m(θ,φ)]. (53)
新的变量ReQl,m′和ImQl,m′被改变符号和如下重新命名Qi:
{Q′0,0,Q′1,0,ReQ′1,1,ImQ′1,1,Q′2,0,ReQ′2,1,ImQ′2,1,
ReQ′2,2,...)(Q1,Q2,Q3,Q4,Q5,Q6,Q7,Q8,...). (54)
并且相似的转换用于创造αi,βij,和γi。方程(51)可以被写作
或者用矩阵符号表示,
其中
是由Q
i形成的向量,
是由α
i形成的向量,
是由(β
ij-δ
ijγ
i)形成的对称矩阵,并且平方的完成已经被应用以得到方程(58)。由于方程(57)中的
对应于配体去溶剂化代价,其对于化学合理几何必须大于零,矩阵
是正定的并且ΔG
var的极值为最小值5。从方程(58)中可获得多极的最优值,
和最小变化结合能,ΔG
var opt,
由于
也是正定的所以ΔGvar opt总是负的。
为了用固定的单极(全部电荷)(Q1=Q)求解最优多极分布,剩余的最优多极(i≠1)的方程为
其与方程(59)相类似。
上述矩阵方程(其具有在lmax=(lmax+1)2舍去的维数)能够通过相对适当的计算资源被数字地求解。在实践中,由于αi和βij包含无数项的总和,第二界限值lcut必须被用于舍去方程(25)和(46)中最内总和。当lmax和lcut足够大,ΔGvar opt收敛并且增加的优点包括更多的多极基本消去。
对任意给定的受体和几何,我们已经如此描述了作为一组多极测定紧密结合配体的电荷分布的方法。任意测试配体的优化中的结合自由能的误差可以通过从方程(58)中减去方程(60)并且使用方程(59)以消除
来计算,
TABLE I
afrom reference 4
参考附录
1J.D.Jackson,Classical Electrodynamics,2nd ed.(JohnWiley and Sons,New York,1975).
2L.Greengard,The Rapid Evaluation of Potential Fields inParticle Systems(MIT Press,Cambridge,Mass.,1988).
3M.E.Rose,J.Math.& Phys.37,215(1958);
4M.E.Rose,Elementary Theory of Angular Momentum(John Wiley and Sons,New York,1957).
5G.Strang,Introduction to Applied Mathematics(Wellesley-Cambridge Press,Wellesley,Mass.,1986).
现在已经描述了本计算机-执行的程序的一些实施例,前面所述的仅仅是举例例证而不构成限定作用对本领域的技术人员而言应该是清晰的,仅仅是通过实施例的方式显示。许多修改和其它实施例也在本领域的普通技术人员的范围内并且计划落入由附加的权利要求和与其等同的那些定义的目前程序的范围内。
序列表
<160>序列的数量:1
<210>SEQ ID NO 1
<2l1>长度:13
<212>类型:PRT
<213>生物体:流感A病毒
<400>序列:1
Prc Lys Tyr Val Lye Gln Aen Thr Leu Lye Leu Ala Thr
1 5 10
权利要求:
1.为识别结合至溶剂中靶向分子的配体的性质的计算机执行的过程,包括步骤:
接受在三维中定义的选择形状的配体的显示,其互补于在三维中定义的选择的部分靶向分子的形状,
测定使溶液中配体和靶分子结合自由能的静电分布最小化的电荷分布的表示法。
2.权利要求1的计算机执行的过程,其中电荷分布的表示法是一系列的多极。
3.权利要求1的计算机执行的过程,进一步包括识别具有与电荷分布的表示法匹配的点电荷配体的步骤。
4.权利要求2的计算机执行的过程,进一步包括识别具有与电荷分布的表示法匹配的点电荷配体的步骤。
5.权利要求1的计算机执行的过程,进一步包含设计含有具有与电荷分布的表示法相匹配的点电荷的配体的组合库的步骤。
6.权利要求2的计算机执行的过程,进一步包含设计含有具有与电荷分布的表示法相匹配的点电荷的配体的组合库的步骤。
静电结合自由能的优化
Lee-Peng Lee
Departments of Chemistry and Physics,Massachusetts Institute of
Technology,Cambridge,Massachusetts 02139-4307
Bruce Tidora)
Deparnnent of Chemistry,Massacltussetts Institute of Techmology,
Cambridge,Massaclaussets 02139-4307
(收稿日1996年12月9日;接受日1997年2月24日)
获得的分析结果定义了特定受体电荷分布和球形几何的最紧密结合配体的电荷分布。使用连续静电的框架,最优分布表示为通过最小化静电结合自由能确定的一组多极。提供了两个简单受体系统的结果以阐明该理论的应用。1997美国物理协会
[S0021-9606(97)50221-2]
1.简介
一种在许多疾病中运行的机制是蛋白(这里表示为受体)的不良行为,其至少在原则上能够通过分子配体的紧密结合(例如,通过空间屏蔽活性位点或者通过阻止必需的构像改变)被抑制。1为了有效的用作药物,该分子必须具有许多重要的药理学活性,诸如生物可利用率和非毒性。在药物分子的发现过程中的一个步骤是紧密结合配体的识别或设计。配体设计是特别困难的,因为对结合自由能的反作用必须被适当协调。例如,增加配体中的点电荷的大小可以增强其与受体的相互作用(倾向于有利结合),但是它也增强了其在未结合状态中与溶剂的相互作用(倾向于不利结合)。应当选择多少电荷量以平衡这些作用和产生最有利的结合自由能?这个问题可以被推广至配体电荷分布的所有多极项。最佳平衡这些作用的电荷分布将最紧密结合至受体。
在这里,确定最紧密结合至给定受体的配体电荷分布的问题用连续静电理论解决。在第II部分中,根据以下情况给出了解决方法,即对自由配体和结合复合物都是由高介电的水溶性介质围绕的低介电的球形区域,并且系统的行为受泊松方程支配。为了促进分析结果,采用下述假定:配体和受体在未结合状态不相互反应,配体电荷分布在结合和未结合状态是一样的,并且配体严格地结合至具有独特定向的受体。最优电荷分布通过表达配体电荷分布为任意系列的多极以及最小化多极的结合自由能而获得。在第三部分中,理论被应用于为了试验目的设计的高度对称的电荷分布以及第二电荷分布,存在于一些蛋白结合位点中的α-螺旋末端。讨论和结论在第四部分显示。
II.理论
在结合状态和未结合状态中的静电自由能的差是静电结合自由能,ΔGbinding=Gbound-Gunbound(见图1a)。由于介电模型包括影响熵以及焓的应答,因此静电能被认为是自由能。这里我们表达每个状态的自由能为包括配体(L)、受体(R)、以及它们的相互作用(L-R)的库仑和反应场(水合作用)项的总和。
下面表达式为结合自由能的结果:
ΔGbinding=ΔGcoul,L-R+ΔGhyd,L-R+ΔGhyd,L+ΔGhyd,R,
(2)
其中我们应用了以下事实,即在受体2和配体中的点电荷几何再模型中保持固定以消除配体和受体的库仑自身作用,并且其中两个L-R项仅仅归于结合状态,因为配体和受体被假定不在未结合状态中相互反应。因此,方程(2)描述静电结合自由能为配体和受体的去溶剂化作用(其为不利的)和结合状态中溶剂遮蔽的静电作用(其通常是有利的)的总和。由于我们的目标是改变配体电荷分布以优化静电结合自由能并且最后一项仅简单加上一常数,因此我们定义相关的变化结合能,
ΔGvar=ΔGint,L·R+ΔGhyd,L, (3)
图1.问题几何的图解。(a)结合反应被显示于受体(R)和球形配体(L)之间,其严格接合以形成球形结合状态复合物。受体、配体和复合物为由高介电的溶剂(∈2)围绕的低介电的介质(∈1)。(b)这里解决的边界值问题包括用介电常量为∈2的溶剂包围的介电常量为∈1的半径为R的球形区域中的电荷分布。坐标的原点是较大球形区域的中心,但是在多极中电荷分布在沿着z轴距离d的点附近展开。几何要求为配体球不扩展超过受体球,R≥d+a,尽管平等的情况也在图中例证。
其中方程(2)的RHS的前两项已经结合至遮蔽的反应项并且常数项已经被消除。注意
以及
其中VL state为指定态中仅归因于配体电荷分布的总静电电位以及如显示的,Vterm,L state为库仑或反应场(水合作用)项。总和为配体(i∈L)或受体(j∈R)中的原子点电荷的和。方程(5)中的
因子是由于配体电荷分布与自身诱导的反应场相互影响的事实。
我们通过表达方程(4)和(5)中的三个静电电位Vcoul,bound,Vhyd,L bound,和Vyd,L unbound,根据通过解决图1b中显示的边界值问题给定的几何和电荷分布向下进行。电荷分布(对应于配体)位于半径R的球中。我们采用球的中心作为坐标的原点(不带撇的)但是使展开多极中的电荷分布于第二原点(带撇的)周围展开,其顺着Z轴转移了距离d,从而
各处的电位满足泊松方程。在球内部,可以被写为
其中RHS的第一项为库仑并且第二项为反应场(水合作用)电位,并且i的总和与配体点电荷一致。在球的外部,库仑和反应场电荷可以合并并且写作
其中A
l,m和B
l,m由适当的边界条件确定并且Y
l,m(θ,φ)为球谐函数。继续进行的标准方法是在球谐函数和球中心周围的电荷分布的多极中在方程(7)中展开库仑项。这里我们将多极扩展的原点移至
其中Ql,m′是围绕带撇原点
展开的球形多极,
需要注意,在这个工作中我们采取Jackson
3使用的Y
l,m(θ,φ)的定义。方程(10)中的表达式当r′>r
i′时(即在配体外部或者,更明确的,在中心在
并且半径是从
至最远点电荷的距离的球体的外部)是有效的。
为了代入方程(7)和合并包括球谐函数的项,我们首先根据Y′l,m(θ,φ)/rl+1展开方程(10)的Yl,m(θ′,φ′)/r′l+1。这个可以使用Greengard 4的结果轻易获得,其规定为r>d,
其中
由于我们已经选取了θd=0的几何(图1b),方程(12)中仅仅m’=0的项是非零的,这种情况下方程(10)变为
其中多极分布围绕点
进行,但是电位表达为围绕大球中心的球谐函数的总和。上面的方程也可以被写作,
其中具有相同的Yl,m(θ,φ)的项可以被集中在一起,与方程(14)相反,其中具有相同的Ql,m′*的被集中。
在将方程(15)代入方程(7)并且匹配r=R的边界条件,
Vin|r=R=Vout|r=R, (16)
我们获得球内的水合作用(反应场)电位,
其中
我们现在可以写出不同的V′s,明确它们对Ql,m′*的依赖性。V′coul,L bound通过方程(10)给定,Vhyd,L bound通过方程(19)给定但是重新改写以使具有相同的Ql,m′*的项被集中,Vhyd,L unbound通过R=a和d=0时的方程(19)给定,
代入方程(4),我们更加清楚ΔGint,L-R对Ql,m′*的依赖,
其中在最后一行我们已经定义了组分αl,m,其独立于Ql,m′*,作为方程(25)中的乘以Ql,m′*的因子。每个αl,m表达多极对ΔGint,L-R的贡献并且包含获得ΔGvar所需的关于受体电荷分布的所有信息。
对于ΔG
hyd,L,根据Q
l,m′
*重新表达方程(5)是有用的,多极描述了配体电荷分布而不是个体电荷,q
i。我们围绕着多极扩展的中心
展开
已经由Rose表明在球体坐标中扩展变为5,
其中
并且
是通过用
替代
获得的算子。对于正的m并且当
根据拉普拉斯方程的解(即r
lY
l,m(θ,φ)或Y
l,m(θ,φ)/r
l+1)进行处理,显示出
5,
双因子被定义为
并且球形部分衍生物为
为了计算负数m的
我们应用
的事实以及方程(34)中球形部分衍生物的定义从而获得
结合配体的水合作用能随后为
为了估算方程(37)中的
我们使用方程(31)和梯度公式
6
其中
为经常在角动量的研究中遇到的向量加法(或Clebsch-Gordon)系数,在表I中显示
6,
为球形单位向量,
直接显示
从方程(38)至(41),我们有
应用表I、方程(31)和方程(37)至(42),我们获得下面的中间结果:
aFrom Reference 6.
并且在结合状态下配体的水合作用能的最终表达式,
其中,βl,m,l′,m′由上面两个方程定义;注意m′≠m时βl,m,l′,m′为零。我们通过在方程(46)中设定d=0和R=a获得未结合配体的水合作用能,
其中γl,m通过方程(48)和(49)定义。为了符号表示方便,我们将γl,m写作为l和m的函数,尽管并不与m形式相关。
因此ΔGvar已经被表示为配体电荷分布的多极,Ql,m′(围绕配体球的中心扩展)和不依赖于Ql,m′的组分αl,m,βl,m,l′,m′以及γl,m的函数。结合方程(26)、(47)和(49)可得
注意仅仅αl,m依赖于受体电荷,而βl,m,l′,m′和γl,m仅仅依赖于结合和未结合状态的几何。虽然ΔGvar opt为实数量,αl,m和Ql,m′为复数且积αl,mQl,m′*和Ql,m′*Ql′,m′包括形式Yl′,m *(θ′,φ′)Yl,m(θ,φ)的项的总和;注意βl,m,l′m′和γl,m为实数。我们根据αl,m和Ql,m′的实数和虚数部分重新改写ΔGvar opt,
(其中m的总和不包含l=0)又注意
以及
新的变量ReQl,m′和ImQl,m′被改变符号和如下重新命名Ql:
{Q0,0′,Q1,0′,ReQ1,1′,ImQ1,1′,Q2,0′,ReQ2,1′,ImQ2,1′,ReQ2,2′,…}
{Q1,Q2,Q3,Q4,Q5,Q6,Q7,Q8,…}, (54)
并且相似的转换用于创造αi,βij,和γi。方程(51)可以被写作
或者用矩阵符号表示,
其中
是由Q
i形成的向量,
是由α
i形成的向量,
是由(β
ij-δ
ijγ
i)形成的对称矩阵,并且平方的完成已经被应用以得到方程(58)。由于方程(57)中的
对应于配体去溶剂化代价,其对于化学合理几何必须大于零,矩阵
是正定的并且ΔG
var的极值为最小值
7。从方程(58)中可获得多极的最优值,
和最小变化结合能,ΔG
var opt;,
为了用拟合的单极(全部电荷)(Q1=Q)求解最优多极分布,剩余的最优多极(i≠1)的方程为
其与方程(59)相类似。
具有在lmax=(lmax+1)2舍去的维数的上述矩阵方程,能够通过相对适当的计算资源被数字地求解。在实践中,由于αi和βij包含无数项的总和,第二界限值lout必须被使用以舍去方程(25)和(46)中最内总和。当lmax和lout足够大,ΔGvar opt收敛并且包括更多的多极的增加的优点基本消去。
对任意给定的受体和几何,我们已经如此描述了测定作为一组多极紧密结合配体的电荷分布的方法。任意测试配体的优化中的结合自由能的误差可以通过从方程(58)中减去方程(60)并且使用方程(59)以消除
来计算,
III.结果
A.执行
描述的算法在计算机程序中被执行,该计算机程序输入为l
max(其确定方程(59)和(61)中的矩阵的大小),l
out(其被用于舍去方程(25)和(46)中的最内总和),问题的几何,以及优化的单极是否是任意的或者固定为一些值的。问题的几何包括半径和结合状态和配体球的中心的坐标(在z轴上)以及系统中的每个部分原子电荷的坐标和大小。分别选择介电常数∈
1和∈
2为4和80。在用LU分解求出矩阵方程(方程(59)或(61))的解之后,执行α′
i,β
ij,和γ
i的估算。获得
矩阵的特征值以证明驻点是最小的。所有实数浮点值用64比特表示。矩阵代数用由Press等
8给定的适当的子程序的增加精确度的版本完成。程序的输出包括优化电荷分布的多极,ΔG
var opt,驻点的原始值(nature),以及记录α
i,β
ij,和γ
i的文件。对l
max=l
cut=40的受体的典型的CPU用法是在具有PA-7200(99MHz)芯片的Hewlett-Packard 9000/735上进行20分钟,并且使用的最大内存为大约22MB。由于我们已经使用了直接的方法(即,LU分解)来求解矩阵方程,其中矩阵的大小为(l
max+1)
2×(l
max+1)2,时间等级为(l
max)
6并且存储等级为(l
max)
4。在这个点上没有尝试优化编码。例如,矩阵方程包含特殊的可能被用于减少必要的计算工作的稀疏矩阵(由于对该问题选择方位角几何)。优化问题还可以用迭代方法解决,诸如共轭梯度法或者不同的张弛方法。
B.测试问题
第一个测试问题由带有四个平行双极基团的受体组成,每个在z=15.50平面含有-0.55e的负电荷以及在z=14.25平面含有+0.55e的正电荷。所有的长度和距离用单位埃(1=0.1nm)给定。电荷的(x,y)坐标为(+1.5,+1.5),(-1.5,+1.5),(-1.5,-1.5),以及(+1.5,-1.5)。结合状态低介电区域被在原点作为中心的半径24.0的球体结合,配体球为半径4.0并且在结合状态中被设定中心在(x,y,z)=(0.0,0.0,20.0)。
第二个测试问题由理想的作为受体的α-螺旋组成。螺旋由分别在N-和C-端具有乙酰基和N-甲基酰胺保护基团的18个丙氨酸残基构成。坐标在用CHARMM PAR9(Ref.9)键长度和角度以及φ=-57°和ψ=-47°表示的极性-氢表示法中生成。部分原子电荷从PARSE参数被改写1。螺旋的轴符合坐标系统的z-轴并且Ala 10的氮原子最接近原点。结合状态低介电区域被原点作为中心的半径24.0的球体结合,配体球为半径4.0并且在结合状态中被设定中心在(x,y,z)=(0.0,0.0,20.0)(接近聚丙氨酸α螺旋的C末端)。
C.结果分析
每个测试问题用lmax的不同的值(用固定在40的lout作为这里显示的结果,尽管当值增加至80时获得基本上不能辨别的结果)和或者任意或者固定在0或+le的变量分布的单极多次求解。图2显示了作为所用lmax′的值的函数的计算的ΔGvar opt的收敛(部分a是四极基团问题而部分b是α-螺旋)。在所有情况下,计算的ΔGvar opt仅仅对于增加的lmax而降低,而对lmax的任意值,具有任意的单极值比固定单极值时的ΔGvar opt低(更有利),如变量的优化所期待的。对所有两个测试问题,对浮动的或者固定的单极,超过20的lmax时的ΔGvar opt值似乎变化的非常小。图3显示了作为lmax(含任意单极值)的函数的最优分布的低多极距的量。2l-极的值如
定义,其中a为配体半径。首个六个多极的值通过为10的lmax收敛。图4显示了计算的最优配体导致的库仑电位,仍作为lmax的函数;电位显示几乎收敛在为20的lmax处。优化配体的收敛的库仑电位绘制于恰好在配体之外(在z=16.0)的xy-平面中并且用为40的lmax计算,显示在对四极基团问题的图5a中和对α-螺旋的图5c中。优化配体的电位包含适当的四折叠对称以与四双极基团受体相匹配,显示这样的配体将与所有四个双极同样相互反应。然而,对α-螺旋(其表示在z-方向后退的一圈双极基团)显示出用这种方式计算的优化的配体将仅仅与最接近的双极基团强烈反应。还非常有趣的是注意到由于以这种方式计算的优化的多极分布的库仑电位不是绝缘的受体的库仑电位的简单反应。例如,比较优化的配体(图5a)导致的和四双极基团问题的受体(图5b)导致的库仑电位,两者都在z=16.0平面中计算。配体电位中的峰值位于受体电位的“内部”。这可能是基本不对称的静电优化的结合反应的一般特征,由于当其它是优化的时候一个分布是固定的。
图2ΔGvar opt的收敛作为用于计算中的值lmax的函数。自始至终使用常量值lmax=40。对于(a)四个双极基团和(b)α螺旋,配体总电荷为任意值的优化被绘制为(□),固定为0的用(×)表示,固定为1的用(◇)表示。
图3.当值lmax的函数用于对(a)四个双极基团和(b)α螺旋的计算时最优配体的最低七个2l-极的值的收敛。优化的运行没有对总配体电荷的限制。在(a)中注意1=4和1=5的线在彼此顶点相互接近。
IV.讨论和结论
泊松方程的分析结果已经被用于定义产生结合球形配体至不变化受体以形成球形复合物的自由能的最小值的配体的多极分布。算法已经被发展和执行,使用数字计算法以评估分析理论,并且结果已经在两个测试情况中显示。迄今为止验证的所有结果中,二级导数分析已经被证明驻点是最小的。在这种意义上,多极分布被说明是优化的。该理论的一个重要特征是,通过表示优化为多极分布,可以直接求解,而不采取随机的搜索或者优化的其它非确定方法。给定球状配体形状和结合几何的优化电荷分布的多极性质的这个特征可以用于理解分子结合和识别中的互补反应。这样的性质可以证明特别适用于配体设计领域,其或者通过促进构建个体紧密结合配体或者通过提供用于搜索化合物库或帮助设计组合库的描述符。
图4.对(a)四极基团和(b)α-螺旋优化配体导致的库仑电位的收敛,沿线(y=-1.1,z=16.0)在lmax的值的范围内绘制。优化通过不对全部配体电荷约束进行。注意lmax=20和40的曲线几乎是相同的。
观察到优化可以再这里呈现的连续模型种定义以提供配体和受体之间相对于超过不利的配体去溶剂化能量的最大超额的有利相互反应,这表明紧密结合配体的成功的设计可以包括基本上不仅仅是提供在受体结合位点对极性和电荷基团的补充相互反应的互补形状分子的构建。例如,受体中中性的、极性的羟基与中性的、极性的羰基基团的静电互补基本上不同于将其与带正电荷铵基团的互补。此外,由于远距离的静电反应的作用,仅仅按照基团的单独互补对讨论问题可能是不合适的,因为每个基团影响配体的整体多极距(moment)。为了帮助回答这些问题,我们目前研究算法以设计点电荷组以及分子,其具有最相当于这种算法定义的优值的多极距。
图5.对于(a)四个双极基团的最优配体,(b)四个双极基团本身,(c)α螺旋的最优配体,(d)α螺旋本身,在z=16.0平面中的库仑电位的轮廓图。优化的进行没有对总配体电荷的限制。每个图由相同间隔的外形水平组成。每个标记表示最近的外形水平,并对三个小数位是有效的(即在(a)中0.32为0.320,在(b)中-0.8为0.800),除了(d)中的-1.1,其为-1.090但是在图中为了清楚被四舍五入了。
最优多极分布和结合能量的性质对进一步研究很有价值。这里我们注意到ΔGvar opt永远是负的(有利的),但是全部结合自由能ΔGbinding由于受体去溶剂化能量可能是正的或者可能不是正的(不利的)11。此外,证明筛选的配体-受体相互反应自由能的值是在最优值时的配体去溶剂化能量的二倍 是简单异懂的,并且相同的关系控制每个多极组分,Qi opt,的贡献12。最后,优化的电荷分布的库仑电位和受体的库仑电位之间的关系显示出反映如何在与配体去溶剂化相关的结合状态中最好地达到有利反应的微妙的重要特征。对于涉及四双极基团的例子,这显示了补偿每个双极的化学基团应当比相应的受体双极更接近方位角轴。
目前的理论为进一步的研究提供有用的起点。我们目前正在研究延伸(extension)以解线性和非线性泊松方程,其将允许包括水溶性介质的离子强度作用。此外,放松未结合配体和具有球状几何学的结合复合物的限制是可能的,使得配体的电荷分布在结合状态和未结合状态是一样的,而且在固定的质子化状态处理可滴定的基团。应当注意在目前理论中对未结合受体的形状或电荷分布的没有限制,因为它的贡献是在ΔGvar的定义中已被除去的常量。
致谢
作者感谢Moungi G.Bawendi,Christopher C.Cummins,Rick L.Danheiser,Robert W.Field,Cristina Jarque,Erik Kangas,Whay C.Lee,Stephen J.Lippard,Irwin Oppenheim,Carl O.Pabo,Robert J.Silbey,并且特别地感谢Sara E.Dempster的帮助讨论。本工作由National Institutes of Health(GM47678)和MIT Science Partnership Fund支持。
1M.Perutz,Protein Structure:New Approaches to Disease and Therapy(Freeman,New York,1992).
2The charge distribution for the receptor need not be the same in the boundand unbound states.If they are different,this adds a constant to#Gbinding thatcan be dropped in defining ΔGvarin Eq.(3).
3J.D.Jackson,Classical Electrodynamics,2nd ed.(Wiley,New York,1975).
4L.Greengard,The Rapid Evaluationof Potential Fields in Particle Sys-tents(Massachusetts Institute of Technology,Cambridge,1988).
5M.E.Rose,J.Math.Phys.37,215(1958).
6M.E.Rose,Elementary Theory of Angular Momentlon(Wiley,New York,1957).
7G.Strang,Lttroduction to Applied Mathematics(Wellesley-Cambridge,Wellesley,1986).
8W.H.Press,B.P.Flannery,S.A.Teukolsky,and W.T.Vetterling,Numerical Recipes in C.The Art of Scientific Computing(CambridgeUniversity Press,Cambridge,1988).
9B.R.Brooks et al.,J.CompuL Chem.4,187(1983).
10D.Sitkoff,K.Sharp,and B.Honig,J.Phys.Chem.98,1978(1994).
11Z.S.Hendsch and B.Tidor(unpublished).
12S.E.Dempster,L.-P.Lee,and B.Tidor(unpublished).
13J.G.Kirkwood,J.Chem.Phys.2,351(1934).