CN1150478C - 从三维结构数据库检索新的配位化合物的方法 - Google Patents

从三维结构数据库检索新的配位化合物的方法 Download PDF

Info

Publication number
CN1150478C
CN1150478C CNB951969684A CN95196968A CN1150478C CN 1150478 C CN1150478 C CN 1150478C CN B951969684 A CNB951969684 A CN B951969684A CN 95196968 A CN95196968 A CN 95196968A CN 1150478 C CN1150478 C CN 1150478C
Authority
CN
China
Prior art keywords
compound
test compound
database
conformation
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB951969684A
Other languages
English (en)
Other versions
CN1171160A (zh
Inventor
�微����
板井昭子
水谷实穗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Itai Akiko
Medicinal Mocule Design & Research Inst Co Ltd
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of CN1171160A publication Critical patent/CN1171160A/zh
Application granted granted Critical
Publication of CN1150478C publication Critical patent/CN1150478C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/40Searching chemical structures or physicochemical data
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Medicinal Chemistry (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

三维结构数据库检索对生物高分子配位化合物的方法,该方法包括以下的工序,(1)对于2种以上的试验化合物的三维坐标给予氢键性质编号、分子力场计算用的信息及作成构象用的信息的第1工序;(2)从生物高分子的三维坐标,准备配位体结合区域的物理化学的信息及空位原子的第2工序;(3)对于第1工序准备的试验化合物的三维坐标给予氢键性质编号、分子力场计算用的信息及制作构象用的信息、以及以第2工序准备的配位体结合区域的物理化学的信息为基础,在不断变化试验化合物的构象条件下,使生物高分子和试验化合物对接作成复合体的结构,通过评价生物高分子和试验化合物分子间的相互作用探索上述复合体的最稳定的结构的第3工序;(4)根据第3工序探索的最稳定复合体结构时的生物高分子和试验化合物的相互作用能量值,判断是否将该试验化合物选择为配位候补化合物的第4工序;(5)对于所有的试验化合物重复第3工序及第4工序操作的第5工序。

Description

从三维结构数据库检索 新的配位化合物的方法
技术领域
本发明涉及可利用于医药、农药、其它的生物活性化合物的结构设计的三维结构数据库检索方法。
背景技术
一般来说,药物是通过与构成靶的生物高分子的强烈作用,来发挥其药理作用的。近年来,由于X射线晶体学分析和核磁共振的技术的进步,对于生物体内起着重要作用的生物高分子的立体结构逐渐解释清楚。随着这些研究的进展,对于以往用专门随机筛选和偶然的发现得到的新药物的前导物的研制,也报道了基于生物高分子的三维结构逻辑途径的成功方法论。现在这样的研究途径的重要性越来越被人们认识到,在世界上,也在从各种不同的角度进行研究。
这些研究的目标之一是在于提供了用计算机构建配位体候选结构的方法,其它的目标在于提供从已知的化合物的三维结构数据库检索新的配位结构的方法。前者(自动结构构建法)的优点是无论结构是否已知都可以得到广泛的启发。而另一方面,后者的优点(数据库法),是用于从储存已知化合物的结构的数据库发现新的生物活性化合物,特别是对于本公司储存的或者可以买到的市售化合物的数据库为对象进行检索,不需要合成满足检索条件化合物(中的化合物)的劳动即可得到,能够测定与靶生物高分子的结合常数和生物活性。
合成具有新骨架结构化合物时,一般即使专家也需要数个月,所以合成数目很多的有希望的结构、并测定活性时,是需要很长的年月和大量的劳力。只要是可以得到的化合物,对于数十个的有希望的配位体候补化合物,测定其结合常数和生物活性是容易的。另外,将被认为有某种程度强结合的或活性的化合物的结构作为基础,设计结合常数和生物活性更强的化合物,通过合成可以有效地创造前导化合物。这种理由使得人们对于检索已知化合物的三维结构数据库,发现新的生理活性化合物的研究途径更加关心。
此方法的问题点在于用什么样的检索条件进行检索。一般是采用,将构成模板代表性的生物活性化合物所具有的原子团和官能基中,是否具有可推测出活性的原子团和官能基或者这些模板的位置关系是否与模板化合物类似作为检索条件,检索三维数据库的方法。当靶生物高分子的结构不清楚时,基本上是采用这样的方法,但是这样的检索方法是基于推测和假说的基础上,所以中的化合物往往不具有模板化合物的活性。结构特征不同的2个以上的分子具有相同的活性时,即使使用了关于这些分子结构的信息也只不过是将活性必需的官能基和它们的位置关系构建成更合理的假说而已。
检索三维结构数据库时,最困难的问题是试验化合物的构象的自由度的处理。已经知道,结合在生物高分子(形成最稳定的复合体)时的配位体的构象,未必与该分子本身的结晶或溶液中的结构和通过能量计算的最稳定的能量的结构都相符合,即使相同的配位体分子,由于对象的生物高分子,也可以以不同的构象形成最稳定的复合体。一般,在数据库中,对于一个的化合物往往储存着可以存在的多个构象中的一个构象的三维结构的原子坐标。另外,除去来自结晶结构的数据库,各化合物的三维结构的信息,是将输入到二维上的结构计算成三维结构为其基础的。这样的三维结构,往往是其分子本身可取得的局部稳定的结构之一。
因此,只是将收纳在数据库中的化合物的构象为基础,调查是否满足检索条件,在考虑其它的构象时,往往不能适当地选择应该中的的化合物。应该考虑构象的数目,是根据可旋转的键数而变化,另外根据考虑构象的微细程度等的因素而变化,但是含有3-6个可旋转的键的可中等自由度的分子,一般是需要以数十个到数十万的构象来对待。考虑这些可能的构象时,只能将予先选择的有希望的构象输入到数据库,或者在检索时制作出后进行调查的方法。无论如何,都需要庞大的计算机资源(存储容量)和计算时间。
最近,Merck公司的Kearsley等作成了在一个数据库侧,对于一个化合物作成可以最大收纳20个的构象的数据库。发表了以官能基间的位置关系为主的检索条件的检索系统FLOG。(M.D.Miller,S.K.Kearsley,D.J.Undetwood,和R.P.Sheridan:计算机辅助分子设计杂志,8,1994,153-174页,FLOG:一种选择与已知三维结构受体入补的“准自由”配位体的系统)。FLOG在检索10万个化合物的具有200万构象的数据库时,使用所谓CRAY超级计算机大约需要1周的时间。对于各化合物有20个的构象,预先进行对各化合物的构象解析,选择出能量稳定的局部稳定结构后,进行储存,为此要花费大量的时间和劳力。而且1个化合物远远不止于20个构象。
此外,作为检索条件是采用了,在构成模板的活性化合物中,推测出是否有活性官能基和这些基间的距离,角度和方向,但是这些条件是可考虑的条件中的最低基本条件,其优点是阿拉伯计算方法容易,也不花费计算时间,可是中的化合物具有实际所需活性的概率不高。其理由是只是将官能基置于所需的位置,而分子整体形状和大小不适当的分子是不能发挥活性的。在已知靶生物高分子的立体结构时,利用这些信息可以取得最好的效果,中的化合物具有所需要的活性的概率大大提高。
例如,Dupont Merck公司的Eyermann等对与生物高分子的复合体,根据X射线晶体学分析的配位体分子中的官能基的位置关系,检索了数据库。(P.Y.S.Lam,P.K.Jadhav,C.J.Eyermann,C.N.Hodge,Y.Ru,L.T.Bacheler,J.L.Meek,M.J.Otto,M.M.Rayner,Y.N.Wong.C.H.Chang,P.C.Weber,D.A.Jackson,T.R.Sharp,和S.Erickson-Viitanen:Science,263,1994,pp.380-384,作为HIV蛋白酶抑制剂的有效的,生物可利用的,非肽环状脲的合理设计)。报告了,HIV蛋白酶的系统中,在肽性配位体分子中的2个的苯环的中心,检索出,用氢键结合着的蛋白酶和配位体的水分子中的氧原子的3个位点是处于相同位置关系的分子。从中的化合物选出一个可以很好地嵌合在配位体的结合部位、选择出一个进入检索条件的除氧以外的,也能形成氢键的化合物。以此化合物的结构为基础,测定对酶活性的抑制,反复操作合成修正了适宜结构化合物的结果,可以发现活性非常高的化合物。可是对检索的方法没有详细的叙述,如何处理构象还是不清楚。
使中的化合物所需活性的概率达到最高的检索条件是取决于中的生物高分子的配位结合部位上,化合物是否稳定地结合的检索条件。在即使满足这些条件的情况下,由于物理化学因素(水溶性等)的原因有时也不能表达活性,但是满足这些条件是表达活性的最低限的条件。另一方面,是有否特定的官能基和官能基的位置关系不是表达活性的必要条件,即使化合物系不同,分子骨架不同,只要与靶生物高分子间形成同等程度的稳定复合体,也可以发挥同样的生物活性。因此,能够满足在配位体结合部位稳定结合条件的化合物,实际上成为配位化合物的可能性高。也就是,通过使用适合在靶生物高分子结合部位的检索条件,可以从数据库中选择出具有所需生物活性的更广泛结构的化合物。
为了判断对于靶生物高分子是否可以结合特定的配位体分子,在可能的复合体机构中,探索最稳定的复合体结构,需要知道该复合体稳定到何种程度,在探索给予的生物高分子和配位体分子间的最稳定的复合体结构时,要对所有的可能结合方式(固定一方的分子,对应地旋转、平移其它的分子)和可能的配位体的构象进行稳定性的评价。可是,这种的作业是需要庞大的计算工作,人们难以对着图形显示器进行会话,所以希望开发出能将这种作业自动地且有效地对接(docking)方法。
作为自动对接的方法,Kuntz等开发出,使用数个至数十个的内接球来表现配位体结合部位形状,通过比较这些球中心的矢量群和配位体化合物的分子内的原子间矢量群,推断可能结合方式的方法(R.L.Desjarlais,R.P.Sheridan,G.L.Seibel,J.S.Dixon,I.D.Kuntz和R.Venkataraghavan:J.Med.Chem.31(1989)722-729在已知三维结构的受体结合位点的配位体设计中,用形状互补性进行初步筛选)。最近的改良方法中,除了表示矢量的一致性的记录统计外,也可变更成计算分子间的能量。
可是,这些方法的缺点是光是结合模式的收集就需要相当的时间。改良方法中,对于一个化合物的对接变更成可以改变构象的方法,但是不能设计成自动地进行所有的对接的过程。另外对于能量的评价,即使对于中的化合物可以进行能量评价,而在得出结果前的过程中,也只能作简略的统计计算,也不能考虑氢键等。另外,精度上也存在问题,对于结晶,观测的正确复合体结构不能给予最稳定的结果,往往被估计成相当低位顺序的问题。可是致命的缺陷是基本地固定构象后,所进行的方法,而构象的自由度难以处理。特别是对于自动地处理很多化合物的三维数据库的检索,上述的缺点用人们的手工也是难以补救的,所以实用性低。
本发明者们开发出了自动地、无先入之见地推测出生物高分子和配位体间的最稳定的复合体结构的方法,即ADAM法,成功地解决了上述存在的一切问题(PCT/JP93/0365,PCT国际公开WO93/20525;M.Yamada和A.Itai,Chem.Pharm.Bull.,41,p.1200,1993;M.Y.Aamada和A.Itai,Chem.Pharm.Bull.,41,p.1203,1993;和M.Yamada Mizutani,N.Tomioka和A.Itai,J.Miol.,243,pp.310-326,1994)。
通过晶体学分析而得知复合体结构的某些酶-抑制剂分子系统中,应用ADAM时,所有的情况下,能量最低的复合体模型能很好地再现结晶中复合体的结构,配位体分子中的可转动键扭转角和氢键形式等也能极其良好地再现。ADAM的高精度在于全部是进行三次的最佳结构计算(能量最小化)。所需的时间是依计算机的性能和空位(dummy)原子数、杂原子数、旋转的键数而定,所以不能一概而论,但是使用广泛普及的工作站(R4400)时,用普通的药物分子的结构得到初期复合体模型需要数分钟~小于1小时程度。这种解析速度,作为不固定构象考虑可能全部构象的方法要比现在发表的最快的方法快数十倍。
可是,ADAM尽管适用于探索一个生物高分子和一个配位分子间的最稳定的复合体结构,但不适于从收集在数据库的各种各样的化合物中探索新的配位化合物,因此需要进一步加以改进。
因此,本发明的目的在于解决以上技术上存在的问题,提供从各种各样的化合物中探索新的配位化合物的方法。
发明的公开
本发明者们经过不断努力的研究结果,开发出了,在不断变化试验化合物的构象条件下,使生物高分子和试验化合物对接作成复合体的结构,评价生物高分子和试验化合物分子间的相互作用能(例如氢键、静电相互作用及范德华力),通过反复变化结构探索上述复合体的最稳定的结构,根据得到的最稳定复合体中的生物高分子和试验化合物的能量值,从试验化合物群中选择配位候补化合物,成功地从庞大的试验化合物中选择出多个有希望的候补化合物的方法。从而完成了本发明。
也就是本发明在于提供了从三维结构数据库检索新的配位化合物的方法,该方法包括,
(1)对于2种以上的试验化合物的三维坐标给予氢键性质编号、分子力场计算用的信息及作成构象用的信息的第1工序;
(2)从生物高分子的三维坐标,准备配位体结合区域的物理化学的信息及空位原子的第2工序;
(3)对于第1工序准备的试验化合物的三维坐标给予氢键性质编号、分子力场计算用的信息及制作构象用的信息、以及以第2工序准备的配位体结合区域的物理化学的信息为基础,在不断变化试验化合物的构象条件下,使生物高分子和试验化合物对接作成复合体的结构,通过评价生物高分子和试验化合物分子间的相互作用探索上述复合体的最稳定的结构的第3工序;
(4)根据第3工序探索的最稳定复合体结构时的生物高分子和试验化合物的相互作用能量值,判断是否将该试验化合物选择为配位候补化合物的第4工序及
(5)对于所有的试验化合物重复第3工序及第4工序操作的第5工序。
进而,本发明的方法也可以包括根据与生物高分子形成的氢键数和/或与生物高分子的相互作用能量值筛选在第4工序选择的候补化合物的第6工序。
附图的简单说明
第1图是表示构成本发明方法的概要图。
第2图是表示本发明方法一实施方案的流程图,图中的S表示各步骤。
第3图是表示用本发明方法作为配位候补化合物而得到的二氢叶酸还原酶的底物及已知抑制剂类似物的图。
第4图是表示用本发明方法得到的、具有二氢叶酸还原酶的新结构的配位候补化合物实例的图。
实施本发明的最佳方案
在本发明的方法中,只要试验的化合物是结构已知的化合物就可以,对于其它没有特殊的限制,例如可以利用现存数据库中收纳的各种化合物。氢键性质编号是对于可以形成氢键官能团的识别用编号,并赋予给在该原子团中与氢键连接的杂原子。根据其编号,可以立刻作出该官能团的几何学结构及氢键性质和构成对方氢键性原子(空位原子)的位置。分子力场计算用信息是指,使用分子力场后,为了计算分子内。分子间的相互作用能量给予各原子的编号和电子状态,使用含有原子序号和原子电荷的。另外作为制作构象用的信息是指,改变旋转键的扭转角,为了系统地制作不同构象时所使用的这些扭转角的初期值。终值及旋转几度后的增量值,包括了对于一个键,构成扭转角的4个原子的输入顺序号和扭转角的初期值、终值及旋转角。
生物高分子是指,生物体上所出现的高分子外,也包括模拟生物体上高分子的分子。配位体结合区域的物理化学区域的信息,是指在可以结合配位体的生物高分子的凹陷区域内部对生物高分子的全部原子势能的影响,包括了配位体结合区域内的三维晶格点的氢键性(氢键受体或供体)、其三维晶格点上置以测试原子时,生物高分子和测试原子间作用的范得华相互作用能量及静电相互作用能量。对接一般是指,形成某些配位化合物的分子和某些生物高分子的复合体,以及包括探索两者稳定的复合体的概念。对接,一般是使用分子模型方法、计算机和计算机图形的模拟法或者自动对接法等而进行的。
生物高分子和试验化合物的相互作用是指,生物高分子和试验化合物间的作用力,例如氢键、静电相互作用、范得华相互作用等。配位体或配位化合物是指,结合在生物高分子上的低分子量化合物,作为例子可以举出药物、酶的底物和抑制剂。辅酶、其它的生物活性物质。
按照本发明方法的一个实施方案,上述的第3工序也可以包括以下的步骤:
(1)通过将生物高分子中构成氢键性官能基的、成为氢键对象的杂原子位置上设定的空位原子和试验化合物中的氢键性杂原子对应地组合,收集生物高分子和试验化合物间的有利结合形式的步骤a;
(2)系统地改变试验化合物的构象条件下,通过比较上述的空位原子间的距离和上述氢键性杂原子间的距离,同时判断生物高分子-试验化合物间的可能氢键的形式及试验化合物的氢键性部分的构象的步骤b;和
(3)对每个在步骤b得到的氢键形式和构象,根据试验化合物中的氢键性杂原子和空位原子的对应关系,将试验化合物的全部原子的坐标置换成生物高分子的坐标系,得到生物高分子-试验化合物的复合体结构步骤c。
另外,按照本发明的其它实施方案,上述的第3工序包括以下的步骤:
(1)通过将生物高分子中构成氢键性官能基的、成为氢键对象的杂原子的位置上设定的空位原子和试验化合物的部分结构中的氢键性杂原子对应地组合,收集生物高分子和试验化合物间的有利结合方式的步骤a;
(2)系统地改变试验化合物的构象条件下,通过比较上述的空位原子间的距离和上述氢键性杂原子间的距离,同时判断生物高分子-试验化合物间的氢键的形式及试验化合物的部分结构的构象的步骤b;
(3)根据在工序b得到的氢键形式和构象,将上述试验化合物的部分结构中不能给予氢键形式的空位原子和氢键性杂原子组合、以及保存与空位原子不能形成氢键的氢键性杂原子的步骤c;
(4)除去步骤c保存的氢键性杂原子组合群、及在工序c中保存的空位原子和氢键性杂原子的组合群,收集空位原子和试验化合物全体的氢键性杂原子的对应组合群,得到生物高分子-试验化合物间的有利结合形式的步骤d;
(5)系统地变化试验化合物构象的条件下,通过比较上述空位原子间的距离和上述的氢键性杂原子间的距离,可以同时推断生物高分子-试验化合物间的可能氢键形式及试验化合物的氢键性部分的构象的步骤e;
(6)对在每个步骤e得到的氢键形式和构象,根据试验化合物中的氢键性杂原子和空位原子的对应关系,将试验化合物的全部原子的坐标置换成生物高分子的坐标系,得到生物高分子-配位分子的复合体结构的步骤f。
第3工序通过上述的各步骤,可以高速地探索生物高分子-试验化合物的稳定复合体结构,同时生物高分子和/或试验化合物即使有复杂的结构,也可以在最短的时间内探索出包括最稳定的复合体结构。
进而,按照本发明的其它实施方案,上述的第3工序也可以包括以下的步骤:
(1)通过将在生物高分子中构成氢键性官能基的、成为氢键对象的杂原子的位置上设定的空位原子和试验化合物中的氢键性杂原子对应地组合,收集生物高分子和试验化合物间的有利结合方式的步骤a;
(2)系统地变化试验化合物构象的条件下,通过比较上述空位原子间的距离和上述的氢键性杂原子间的距离,可以同时推断生物高分子-试验化合物间的可能氢键方式及试验化合物的氢键性部分的构象的步骤b;
(3)保持步骤b得到的氢键样式,选择可以使空位原子和试验化合物中的氢键性杂原子的位置一致的最适宜的试验化合物的构象,接着除去分子内能高的试验化合物构象的步骤c;
(4)对在步骤c未除去的每个构象,根据试验化合物中的氢键性杂原子和空位原子的对应关系,将试验化合物的全部原子的坐标置换成生物高分子的坐标系,得到生物高分子-配位体分子的复合体结构步骤d;
(5)从步骤d得到的氢键性部分的复合体结构,除去试验化合物中的氢键性部分的分子内能及生物高分子-该试验化合物中的氢键性部分的分子间相互作用能量高的复合体结构,接着对剩余的复合体结构进行结构最佳化的步骤e;
(6)对在步骤e得到的每个构象,使之产生试验化合物的非氢键性部分的构象,得到含有新试验化合物的复合体结构的步骤f;
(7)从步骤f得到的复合体结构,除去试验化合物全体的分子内能及生物高分子-试验化合物的分子间相互作用能高的复合体结构,接着对剩余的结构进行最佳化的步骤g。
第3工序通过上述的步骤,虽然使生成的构象数减少,但也可以选择适当的复合体结构,得到精度高的稳定复合体。
在上述的方法中,对于氢键性官能基是含有与氢键相关的官能基及原子。另外所谓的氢键性杂原子是指构成存在于试验化合物中的氢键性官能基的杂原子。所谓的氢键性部分,是指试验化合物中含有与空位原子对应的氢键性杂原子的结构部分,非氢键性部分是指氢键性部分以外的结构部分。
进而,本发明其它的实施方案在于提供了通过读取试验化合物的三维坐标,必要时附加氢原子的三维坐标,赋予原子型号、氢键性质编号、原子电荷及键转动的样式作成三维数据库的方法。
本发明具体涉及以下技术方案:
1.一种从包含三维坐标信息的化合物数据库选择至少一种配位体候补化合物的方法,所述数据库包含任选构象中的至少两个数据库登记项目的三维坐标信息,所述配位体候补化合物适于与目标生物聚合物键合,该方法包括:
(1)在目标生物聚合物与试验化合物之间评估一种最稳定的对接结构,所述试验化合物是以至少两种登记项目中的每一个项目作为试验化合物,其中,所述评估包括进行自动化检索;以及,
(2)根据最稳定的对接结构确定所述试验化合物是否是一个候补化合物。
2.根据1所述的方法,其中,所述评估包括考虑所有可能键合的模式和所述试验化合物的信息,以获得最稳定的对接结构。
3.根据2所述的方法,其中,所述评估还包括至少一种能量最小化的方法,以获得具有最佳结合方式和最佳扭转角的最稳定的对接结构。
4.根据3所述的方法,其中,所述评估包括至少三种能量最小化的方法,每一种最小化方法包括重复的方法。
5.根据3所述的方法,其中,所述评估包括一种自动对接的方法。
6.根据5所述的方法,其中,所述自动对接方法是所谓的“ADAM”法。
7.根据1所述的方法,其中,至少一种配位体候补化合物是根据最稳定的对接结构而选择的。
8.根据7所述的方法,其中,至少一种配位体候补化合物是根据最稳定的对接结构的稳定性和结构特性而选择的。
9.根据8所述的方法,其中,所述特性包括目标生物聚合物与试验化合物之间的一些氢键合和相互作用。
10.根据9所述的方法,其中,它还包括至少一种附加的选择方法。
11.根据1所述的方法,其中,所述自动对接的方法是“ADAM”法。
12.一种从包含三维坐标信息的化合物数据库选择至少一种配位体候补化合物的方法,所述数据库包含任选构象中的至少两个数据库的登记项目的三维坐标信息,所述配位体候补化合物适于与目标生物聚合物键合,所述方法包括:
(a)指定与氢键合的类别编号、计算分子力场能量值,以及至少两种数据库登记项目的构象;
(b)准备有关所述生物聚合物的配位体键合区的物理化学信息和至少一个空位原子;
(c)在目标生物聚合物与至少两个数据库登记项目的每一项之间评估最稳定的对接结构,其中,所述评估包括进行自动检索;
(d)根据所述最稳定的对接结构确定所述试验化合物是否是一个候补化合物。
13.根据12所述的方法,该方法还包括,对于由包含至少一个附加的选择方法的步骤(d)所选定的配位体候补化合物进行选择。
14.根据12所述的方法,其中,所述评估还包括,在试验化合物的至少一个与氢键合的杂原子与所述目标生物聚合物的至少一个空位原子之间,制造结合的对应。
15.根据14所述的方法,其中,所述评估包括在试验化合物的至少一与氢键合的杂原子与所述目标生物聚合物的至少一个空位原子之间,保存所述不可能结合的对应。
16.根据15所述的方法,其中,所述评估包括,在试验化合物与目标生物聚合物之间同时评估与氢键合的模式。
17.根据16所述的方法,其中,所述评估包括,在试验化合物与目标生物聚合物之间得到一种对接结构。
18.根据13所述的方法,其中,所述至少一种附加的选择方法包括,计算范德华以及静电的相互作用,以选择一种最稳定的对接结构。
19.一种从包含三维坐标信息的化合物数据库选择至少一种配位体候补化合物的方法,所述数据库包含在目标生物聚合物与试验化合物之间评估最稳定的对接结构的任选构象中的至少两种数据库项目的三维坐标信息,而该试验化合物是以至少两个登记项目中的一项作为该试验化合物,
其中,所述评估包括考虑所述试验化合物可能键合的模式和构象。
20.根据19所述的方法,其中,所述评估包括一种自动对接的方法。
21.根据20所述的方法,其中,所述自动对接的方法是所述的“ADAM”法。
22.根据19所述的方法,其中,所述化合物数据库包括计算相互作用能量的信息和产生构象的信息。
23.一种从包含评估最稳定对接结构的化合物数据库选择至少一种适用于与目标生物聚合物键合的配位体候补化合物的方法,
所述方法包括用一种自动对接方法,在目标生物聚合物与登记数据库项目的至少两项中的每一项作为试验化合物之间,评估最稳定的对接结构,
其中,
所述评估包括考虑所述试验化合物可能键合的模式和构象;和
所述化合物数据库包括任选构象中至少两种登记数据库项目的三维坐标的信息。
24.根据23所述的方法,其中,所述自动对接方法是所谓的“ADMA”法。
25.根据23所述的方法,其中,所述化合物数据库包括计算相互作用能量的信息和产生构象的信息。
26.一种从化合物数据库选择至少一个配位体候补化合物的方法,
所述候补化合物适用于与目标生物聚合物键合,
所述方法包括用自动对接方法,在所述目标生物聚合物与登记数据库项目的至少两项的每一项作为一种试验化合物之间,评估最稳定的对接结构,其中,
所述评估包括,根据所述化合物中与氢键合的杂原子与所述目标生物聚合物中与氢键合的空位原予之间的距离匹配,考虑试验化合物可能的模式和构象,以及,
所述化合物数据库包括任选构象中至少两个数据库登记项的三维坐标的信息。
27.根据26所述的方法,其中,所述自动对接方法是所谓的“ADMA”法。
28.根据26所述的方法,其中,所述化合物数据库包括计算相互作用能量用的信息,以及产生构象用的信息。
29.一种从化合物数据库选择至少一个配位体候补化合物的方法,
所述候补化合物适用于与目标生物聚合物键合,
所述方法包括,在所述目标生物聚合物与至少两个登记项中的每一项作为一种试验化合物之间,评估最稳定的对接结构;
其中,
所述评估包括分子间能量的计算、分子内能量的计算、或氢键数的计算;以及
所述化合物数据库包括任选构象中至少两个数据库登记项目的三维坐标的信息。
30.根据29所述的方法,其中,所述化合物数据库包括计算相互作用能量用的信息和产生构象用的信息。
以下,参照第2图的流程图,对本发明的优选方案加以说明。第2图的S表示各步骤,所说的ADAM,在国际公开WO93/20525号说明书(国际公开日1993年10月14日)中表示了的生物高分子-配位分子的稳定复合体结构的探索方法。此外,PCT国际公开WO93/20525号说明书的内容包括在本说明书中。
最初,作成2种以上的试验化合物的ADAM规格的三维数据库(SI)。上述的数据库可以按照以下的方法作成。首先输入试验化合物的三维坐标。作为试验化合物的三维坐标可以使用通过从二维结构数据库得到的二维坐标用力场计算法变换成三维坐标或者以结晶数据库或能量计算为基础的模型构建的立体结构等而得到的坐标。对于试验化合物的原子坐标表示的立体结构,只要原子间的结合距离、结合角等的几何学量正确,基本上构象不成为问题。为了尽量正确地计算出构成试验化合物的各原子的电荷,最好单独地输入给予稳定立体结构的原子坐标。
输入上述的化合物的三维坐标后,必要时,附加氢原子,进而,自动地附加各原子的原子型编号、氢键性杂原子的氢键性质编号、各原子的电荷、键旋转的方式(如何进行旋转、或者从几度开始旋转,每隔几度旋转等),而作成三维数据库。
构成试验化合物的原子的原子型号可以使用Weiner等(Weiner,S.J.,Kollman,P.A.,Case,D.A.,Singh,U.C.,Ghio.C.,Alagona,G.,Profeta,S.,Jr.,和Weiner,P.,J.Am.Chem.Soc.,106,1984,pp.765-794)所附加的编号。试验化合物中存在的氢键性杂原子的氢键性质编号可按照以下表1进行附加。构成试验化合物的各原子的电荷可以按照Gasteiger法、MOPAC程序中的NNDO法、AMI法等的分子轨道计算法算出。键旋转的方式,最好采用在60°~120°一定的旋转角下,使可扭转的单键旋转的方式。
表1
    氢键性质编号          构成氢键性官能基的原子种类
    1                     伯胺sP2的N
    2                     伯胺sP3的N
    3                     铵离子的sP3的N
    4                     酰胺的sP2的N
    5                     仲胺的sP3的N
    6                     芳香族基的N
    7                     质子化芳香N的N
    8                     叔胺的N
    9                     质子化叔胺N
    10                    带有可旋转的羟基的O
    11                    醚的O
    12                    羰基的O
    13                    羧酸盐的阴离子的O
    14                    羧酸的O
    15                    磷酸盐的O
    16                    水分子的O
    17                    巯基的S
    18                    硫醚的S
    19                    氢的位置固定的羟基的O
接着,输入构成生物高分子原子的编号和原子坐标(但是氢原子的原子坐标除外。)(S2)。生物高分子的原子坐标可以使用由X线结晶解析和NMR解析而得到的立体结构信息、由蛋白质结晶数据库等入手的信息、或者以这些信息为基础构建的生物高分子模型的原子坐标等。生物高分子的原子坐标最好用三维坐标系表示。另外结合在生物高分子上后,在结构上、功能上都起重要作用的辅助因子也看作生物高分子的一部分,也可以在输入结合了该辅助因子状态的生物高分子的原子坐标后,进行后续的步骤。这些辅助因子可以举出辅酶、水分子或者金属离子等。
接着上述的步骤,计算出存在于生物高分子中、构成氨基酸残基的氢原子的原子坐标(S3)。一般,用X射线晶体学分析和NMR解析等的实验方法求出生物高分子的氢原子的位置是困难的,而且也不能从蛋白质结晶数据库等得到有关氢原子的信息。因此,有必要根据存在于生物高分子中的氨基酸残基的结构计算出构成该氨基酸残基的氢原子的原子坐标。由于结合在可旋转的氨基酸残基,其原子坐标不能一次确定的氢原子,最好假定存在于反位上后,计算出原子坐标。
而后,将电荷附加在构成生物高分子中的氨基酸残基的原子上(S4),对于构成生物高分子中的氢键性官能基的杂原子附加氢键性质编号(S5)。作为电荷值可以使用对各氨基酸算出的文献值,例如Weiner的值等(Weiner,S.J.,Kollman,P.A.Case,D.A.,Singh,U.C.,Ghio,C.,Alagona,G.,Profeta,S.,Jr.和Weiner,P.,J.Am.Chem.Soc.,106,1984,pp.765-784)。氢键性质的编号可按照表1标记。
以下,指定配位体结合区域(S6)。作为结合区域,包括生物高分子的任意部位的区域,优选的是选择矩形的区域。根据目的,也可以选择配位体结合袋和其周围的生物高分子的部位,必要时,可以选择包括结合效应因子等的其它分子的生物高分子部位的区域。此外,配位体结合袋是指,在生物高分子的凹陷的分子表面,结合底物或抑制剂等配位体分子的穴。配位体结合区域范围的确定,可以利用例如程序GREEN(Tomioka,N.,Itai,A.,and Litaka,Y.,Journal of ComputerAided Molecular Design,vol.I,1987,pp.197-210)的一部分功能。
在S6指定的区域内,使之发生三维晶格点,对各三维晶格点进行标记符号和晶格点的数据计算(S7)。所谓三维晶格点是指,在生物高分子的配位体结合的区域内的每隔一定的间隔,所发生在三维晶格上的点,所谓晶格点的数据包括了,在各三维晶格点上,假定探测原子后,计算出的生物高分子和探测原子间的范得华相互作用能及静电相互作用能,以及氢键性等的配位体结合区域的局部的物理化学的数据。通过利用这些三维晶格点的晶格点的信息,可以快速且近似地计算出以后步骤中生物高分子和试验化合物的分子间的相互作用能,而且,可以合理地决定以后步骤中设定的空位原子的位置。其结果,能够在短时间内无遗漏地探索生物高分子和试验化合物的对接模型。
三维晶格点,是在0.3~2.0埃、优选的是0.3-0.5埃的一定间隔,在S6的指定的区域内发生。作为探测原子最好是选用含在可成为配位体的化合物中的所有的原子种类。配置在各三维晶格点的各探测原子和生物高分子间的范得华相互作用能,可通过使用经验的势能函数,按照常规方法的原子对计算而得到。经验的势能函数,可以使用下述的Lennard-Jones type函数。
G vdw . i = Σ j ( A / r ij 12 - B / r ij 6 )
式中,i是表示探测原子位置的编号、j是表示生物高分子的原子编号。A及B是表示决定极小的势能位置和大小的参数。rij是表示配置在第i位的探测原子和生物高分子的第j位原子间的距离。另外,上述的A及B的参数可以使用Weiner等的值(Weiner,S.J.,Kollman,P.A.Case,D.A.,Singh,U.C.,Ghio,C.,Alagona,G.,Profeta,S.,Jr.和Weiner,P.,J.Am.Chem.Soc.,106,1984,pp.765-784)。
将试验化合物配置在三维晶格点上时的试验化合物-生物高分子间的范得华相互作用能可从下式(式中,m是试验化合物中的原子的编号、N是试验化合物中的原子数、m0是与m位的原子最接近的三维晶格点的编号)计算。
E vdw = Σ m = 1 N G vdw . mo
配置在各三维晶格点上的探测原子和生物高分子间的静电相互作用能可以通过以下的式子(式中i、j及rij是如上的定义,qj表示生物高分子第j位的原子电荷,K是变换能量单位的常数,ε表示介电常数)计算出。上述的介电常数也可以使用恒定的值,但最好使用Warshel等提出的依赖值(Warshel,A.,J.Phys.Chem.,83,1979,pp.1640-1652)。
G elc , i = Σ j Kq j / ϵr ij
将试验化合物配置在三维晶格点上时的试验化合物-生物高分子间的静电作用能相互作用能可从下式(式中,m、N、m0是与上述定义相同)计算。
E elc = Σ m = 1 N q m G elc , mo
所谓氢键性晶格点的信息是指给氢性原子或者受氢性原子中的一个原子配置在三维晶格点上时,可与生物高分子的氢键性官能基形成氢键,或者即使任一个原子配置在三维晶格点上,该原子都可与生物高分子的氢键性官能基形成氢键(或不能形成氢键)的信息。例如,通过在受氢性的三维晶格点上标记1、在给氢性的三维晶格点上标记2、具有两方性质的三维晶格点上标记3、在没有氢键性的三维晶格点上标记0的符号,来表示三维晶格点上的氢键性。
三维晶格点上的氢键性可用以下的方法判断。三维晶格点P和生物高分子中存在的给氢性原子D间的距离DP是可以形成氢键的距离(例如,2.5~3.1埃),而且,三维晶格点P、氢H、及给氢原子D所成的角度∠DHP只要是可形成氢键的角度(例如30度以上),就可以判断此三维晶格点是受氢性的。同样,某三维晶格点P和生物高分子中存在的受氢性原子A间的距离PA是可以形成氢键的距离,而且,三维晶格点P、孤立电子对L、及受氢性原子A所成的角度∠ALP只要是可形成氢键的角度,就可以判断此三维晶格点是给氢性的。此外,某三维晶格点若没有受氢性也没有给氢性时,可以按照没有氢键性对待。
接着,在生物高分子中存在的氢键性官能基中,从S6指定的区域内的氢键性官能基中选择出预想可与试验化合物形成氢键性官能基(S8)。存在有多个氢键性官能基时,可根据其重要性进行选择。进而,根据S7计算出的三维晶格点的信息,对于S8选择出的各氢键性官能基设定空位原子(S9)。
此步骤中,基于S7计算出的三维晶格点的氢键性,确定可与在S8选择出的各氢键性官能基形成的氢键区域(氢键性区域)后,在含有适当数(例如5-20个)的三维晶格点的氢键性区域的三维晶格点的中心配置空位原子。在该氢键性区域内,其它的范得华半径外配置空位原子。氢键性区域是由具有相同的氢键性、而且互相邻接的一群三维晶格点构成的区域。由1个氢键性官能基有时可以设定2个以上的空位原子,相反1个空位原子也不能设定的情况也会发生,应给予足够的注意。设定的空位原子数多时,在与配位体结合区域的内孔的纵向深度内,最好缩减到10个以下,如5-20个,以便只留下认为重要的空位原子。此外,在空位原子的中心给予与配置了该空位原子三维晶格点相同的氢键性。
接着,选择一个试验化合物(S10),从S1作成的ADAM规格数据库读取选择的试验化合物的三维坐标、氢键性质编号、分子力场计算用信息及作成构象用信息(S11)。而后,在空位原子和试验化合物中的氢键性杂原子间赋予对应的氢键关系(S12)。将空位原子数取为m个、存在于试验化合物中的氢键性杂原子的数取为n个时,则形成i个氢键的对应关系(组合)的数N(i)成为,mPi×nCi(P表示顺序、C表示组合)个。最好选择空位原子和试验化合物中的氢键性杂原子的所有可能的组合。
而后,对于满足关系1min≤i≤1max的所有i,反复操作S12~S29的步骤。其结果,在空位原子和存在于试验化合物中的氢键性杂原子间,可以选择
Σ i = 1 min 1 max N ( i )
个的组合群的全部。通过这样的操作,选择生物高分子和试验化合物形成的氢键性的全部组合群,可以系统地且有效地探索生物高分子和试验化合物的结合方式。最好选择1min作为空位原子和氢键性杂原子的数中较小的值,最好选择1max为空位原子和氢键性杂原子的数中较大的值。
更具体的说,选择在S12中标记对应关系的、空位原子和试验化合物中的氢键性杂原子组合群的一个(S13)。此时,不要选择空位原子和试验化合物中的氢键性杂原子不一致的组合。接着,对于含在S13选择的组合群中的空位原子,计算出各空位原子间的距离(S14)。此外,空位原子和试验化合物中的氢键性杂原子数,其中为1个时,则不进行S14~S21的步骤直接跳到S26的步骤。空位原子的数和试验化合物中的氢键性杂原子数,都是一个时,则不进行S14~S21的步骤直接跳到S22的步骤。
将试验化合物分割成氢键性部分和非氢键性部分(S15),对于在S15分割的试验化合物的氢键性部分选择可扭转的键和其扭转方式(S16)。而后,将S16选择的键,按照输入到S1作成的ADAM规格三维数据库的键旋转方式进行旋转,顺次生成试验化合物的构象(S17)。而后,对每个生成构象重复操作以后的S18~S29的步骤。
这些步骤的详细过程如下。对于S17生成的构象,计算出含在S13选择组合群的试验化合物中的各氢键性杂原子的原子距离(S18)。计算S14得到的空位原子的原子距离和S18得到的对应试验化合物中的氢键性杂原子的原子间距离的差的平方和的F值,并且除去该F值在一定范围以上的氢键性组合和构象(S19)。也就是,在下述情况时,
F = Σ j n ( n - 1 ) 2 ( r li - r di ) 2
要除去Ka≤F≤Ka′范围以外的氢键组合(式中,n表示氢键的数,rdi表示第i位的空位原子间的距离,rli表示试验化合物的氢键性杂原子的第i位的原子间的距离,Ka表示F的下限值,Ka′表示F的上限值)。上述的Ka最好是0.6~0.8,Ka′最好是1.2~1.4。通过此步骤,可以高效地收集生物高分子和试验化合物的氢键方式及配位体的构象。
而后,对于在S19未能除去的氢键组合群和构象,使试验化合物的氢键性部分构象最佳化以便使上述的F值最小(S20)。通过此步骤,修正试验化合物的构象,以便使生物高分子和试验化合物形成稳定的氢键。将存在于试验化合物的氢键部分的能扭转键的扭转角作为变量,用Fletcher-Powell法(Fletcher,R.,Powell,M.j.D.,ComputerJ.,6,1968,P.163)使上述函数F的值最小化,可以检索到最适宜的试验化合物的氢键性部分的构象。
接着,计算出在S20的步骤中最适宜的试验化合物的氢键性部分的分子内能量后,除去该分子内能量值在一定值以上的构象(S21)。例如,使用AMBER4.0的分子力场,计算试验化合物的氢键性部分的分子内能量时,最好除去该分子内能量为100Kcal/mol以上的构象。而后,将试验化合物的原子坐标置换成生物高分子的坐标系,以便使在上述S21前的步骤得到的、具有构象的试验化合物的氢键性杂原子的坐标与对应的空位原子的坐标一致(S22)。在此步骤中可以使用Kabsh的最小二乘法(Kabsh,W.,Acta Cryst.,A32,1976,p.922;Kabsh,W.,ActaCryst.,A34,1978,p.827)。通过这样的操作,可以同时大致推断可能的氢键形式和试验化合物的氢键结合性部分的构象。
接着上述的步骤,计算出生物高分子和试验化合物的氢键性部分的分子间的相互作用能(范得华相互作用能及静电相互作用能的和)、及试验化合物的氢键部分的分子能(S23)。生物高分子和试验化合物的氢键性部分的分子间的相互作用能EINTER,是使用最接近试验化合物中的各原子K的三维晶格点的晶格点信息的范得华相互作用能Gvdw(k)及静电相互作用能Gelc(k),可以从下式(式中的qk表示原子k的电荷)算出。
E inter = Σ K { G vdw ( k ) + G elc ( k ) · q K }
此外,试验化合物的氢键性部分的分子内的能量EINTER可以按照已知的方法计算出。例如,EINTER使用AMBER4.0等公开了的力场用下式计算出〔式中Vn表示对于构成扭转角的4个原子的原子型的排列所给予的常数、n表示对扭转角旋转势能对称性的函数、φ表示扭转角、Y表示相对扭转角的势能相位(对于构成扭转角的4个原子的原子型的排列所给予的)、Aij和Bij是表示试验化合物分子中的第i位和第j位的原子间的距离、qi表示试验化合物分子中的第i位的原子的电荷、qj表示试验化合物分子中的第j位的原子的电荷、ε表示介电常数〕。
E intra = Σ Dihedrals Σ n V n / 2 { 1 + cos ( nφ - r ) }
+ &Sigma; i < j ( A ij / R ij 12 - B ij / R ij 6 ) + &Sigma; i < j ( q i q j / &epsiv; R ij )
除去在S23计算出的分子间相互作用能和分子内能的和超过一定值以上的试验化合物的构象(S24)。例如最好除去上述的能量和为10Kcal/mol(分子量100时)以上的构象。而后,将在S24未除去的、具有构象的试验化合物的氢键性部分的结构进行最适宜的调整(S25)。进行最佳结构计算,将试验化合物氢键性部分的扭转角、及试验化合物的位置及方向的最优组合,可以得到最佳的试验化合物的氢键性部分的结构。
例如,使用Powell法(Press,W.H.,Flannery,B.P.,Teukolsky,S.A.,Vitterling,W.T.,Numerical Recipes in C,Cambridge University,Press,Cambridge,1989)可从下式计算出全能量最小的Etotal,从而使试验化合物的氢键性部分的结构最佳化。
          Etotal=Einter+Eintra+Whb·Nhb·Chb
〔式中,Einter及Eintra如上所述的定义,Whb表示重量、Nhb表示氢键的数及Chb表示1个氢键的稳定能(例如2.5Kcal/mol)〕
接着,将试验化合物的非氢键性部分的能旋转的键,按照输入到S1作成的ADAM规格的三维数据库的键旋转方式进行旋转,使之顺次生成试验化合物的构象(S26),对每个生成的构象重复操作以后的S27-S29的步骤。具体的是计算出生物高分子和试验化合物的分子间的相互作用能以及试验化合物的分子内能(S27),除去在S27算出的分子间的相互作用能与分子内能的和超过一定值以上的试验化合物的构象(S28)。而后将在S28未除去的、具有构象的试验化合物的全部试验化合物进行最适宜的调整(S29),算出S29前的步骤得到的生物高分子-试验化合物的复合体的结构的能量,选择出该能量最小的最稳定的复合体的结构(S30)。
用与S23相同的方法可以算出分子间相互作用能及分子内能(其中,在S23只是对试验化合物分子的氢键性部分进行计算,但是在S27中需要对全体试验化合物进行计算)。另外,作为上述能量和的上限值最好是10Kcal/mol(对分子量100)。通过此步骤可以得到生物高分子和试验化合物的稳定复合体及试验化合物的活性构象。试验化合物分子的最佳选择可用与S25步骤相同的方法进行(其中,在S25只是对试验化合物分子的氢键性部分的结构进行最佳化,但是在S29中需要对全体试验化合物分子进行结构最佳化)。
上述生物高分子和试验化合物的对接操作可使用自动对接程序ADAM的方法进行(PCT国际公开WO93/20525;Yamada,M.andItai,A.,Chem.Pharm.Bull.,41,1993,p.1200;Yamada,M.and Itai,A.,Chem.Pharm.Bull.,41,1993,p.1203;Yamada Mizutani,M.,Tomika,N.,and Itai,A.,J.Mol.Biol.,243,1994,pp.310-326)
根据S30得到的最稳定的复合体结构中的生物高分子和试验化合物的分子间的相互作用能量、试验化合物的分子内能的值、氢键数及环的数等的所有基准或其一部分,判断该试验化合物是否可选择为配位体候补化合物(S31)。作为分子间的相互作用能可以举出静电相互作用能、范得华相互作用、氢键能及这些的和。例如可将静电相互作用能量与范得华相互作用的和,对于每分子量100-2Kcal/mol以下的试验化合物选择为配位体候补化合物。而后,判断是否选择了所有的试验化合物(S32),如果没有选择所有的化合物时,则回到S10的步骤重复S10-S31的操作步骤,选择完毕时进入S33的步骤。
在S31中,从选择了的配位体候补化合物中筛选更有希望的配位体候补化合物(S33)。在此筛选前,要输出试验化合物的信息表(例如生物高分子和试验化合物的分子间的相互作用能量的值、氢键数及环的数等),这样对确定筛选标准是非常便利的。例如,最好将生物高分子和配位体候补化合物间可形成的氢键数、生物高分子和配位体候补化合物的分子间相互作用能量值及原子数等作为基准进行筛选。
作为分子间相互作用能可以举出静电相互作用能、范得华相互作用能及这些的和。例如,可将静电相互作用能量与范得华相互作用的和,对于每分子量100-8Kcal/mol以下的试验化合物分子筛选为有希望的配位体候补化合物。氢键的数可根据生物高分子的种类设定任意的数,但最好设定为2以上,优选的是3以上。原子数也可以任意的设定,如20个以上,但是最好设定20-40个的范围。
由生物高分子制作非常多的空位原子时,或者试验化合物具有相当大的构象自由度或具有很多的杂原子时,可按照本发明的更好的实施方案,在S9的步骤中输入有关试验化合物的信息后,对试验化合物的部分结构进行S13-S25的步骤,将其部分结构中不能给予氢键的空位原子与试验化合物中的氢键性杂原子进行组合,以及保存与空位原子不能形成氢键的试验化合物中的氢键性杂原子的信息。试验化合物的部分结构在不受任何的结构限制条件下,可以任意的确定,但是最好是含有3个以上的氢键性官能基的结构部分。另外可以忽视该结构部分的构象自由度的存在与否。
接着上述的步骤,对试验化合物的全体结构进行S13-S33的步骤,但是要将上述步骤中含有的保存的氢键性杂原子组合群及空位原子和氢键性杂原子的组合群从S12步骤作成的对应关系的组合群中除去。其结果,可以减少试验化合物组合群及构象的数,大大地缩短了检索生物高分子-试验化合物的稳定复合体的结构所需的时间(上述方法称为Pre-Pruning法:也称为PP法)。PP法是基于以下的假设,即在试验化合物的部分结构中不能成为氢键形式和配位体构象,在试验化合物全体的结构中也是不可能的。通过采用PP法,可在不影响得到的生物高分子-试验化合物复合体结构的精度和可靠性的条件下,大幅度地缩短检索时间。
实施例
为了验证本发明方法的有效性,将二氢叶酸还原酶作为靶生物高分子,将底物和已知抑制剂、或者这些的模拟物作为配位体候补化合物进行是否可选择的试验。
作为二氢叶酸还原酶(以下称为“DHFR”)的原子坐标,是使用从Protein Data Back entry 4DFR得到的大肠杆菌的DHFR-甲氨蝶呤的二维复合体的原子坐标得到的值。根据DHFR-叶酸-NADP+的三维复合体的结晶结构,将辅助因子NADP+分子的原子坐标附加在上述二维复合体的原子坐标上。此时,除了很强的结合在DHFR上、用化学方法不能除去的2个水分子以外的所有水分子都从上述二维复合体的原子坐标上除去。未除去的2个分子中的一个以氢键结合在DHFR的21位的色氨酸及26位的天冬氨酸上,另一个以氢键结合在114位的亮氨酸及116位的苏氨酸上。
作为试验化合物的数据库使用含有大约110,000个分子数据的TheAvailable Chemicals Directory(ACD-3D、MDL社),从收纳在上述数据库中的分子中,将除去原子数5个以下的分子、用H、C、Si及卤素构成的分子、含有H、C、N、O、S、P及卤素外的分子、具有6个以上可旋转键的分子及不具有环的分子的10,017个分子作为解析对象,并进行氢原子的加成和赋予原子型编号、氢键性质编号、原子电荷及键的旋转形式(以120度的旋转角旋转)。作为选择配位候补化合物的判断基准:将与靶生物高分子(酶)的相互作用的能量值是每100的分子量-7Kcal/mol以下、氢键数3根以上,而且原子数为25以上作为基准的。
用本发明的方法,最终选择了大约1400个的试验化合物作为配位体候补化合物,从输入生物体高分子三维坐标到选择配位体候补化合物的时间大约80小时。这些配位体候补化合物中,以第3图所示的化合物为主都含有多数的底物及已知抑制剂的类似物。抑制剂氨甲蝶呤和底物二氢叶酸,由于可旋转的键的限制从这次检索排除,选择了甲氧苄氨嘧啶作为候补化合物。另外用本发明的方法提示的配位体候补化合物的键形式及构象是与从底物和抑制剂类似物和酶的复合体结晶结构推测的键形式及构象很一致。
另外,用本发明的方法,可以选择很多的具有与底物、已知抑制剂类似性少的新结构的配位体候补化合物。在第4图中表示了对接模型例。图中,粗线表示配位体分子的骨架、点线表示氢键、细的实线表示生物高分子的一部分、虚线所画的笼子表示在配位体的原子中心可允许的区域。观察这些对接模型,可以看出能形成多根的氢键,与酶的凹处形状的配合性相当良好。因此,这些配位体候补化合物可以期待作为二氢叶酸还原酶的抑制剂的前导化合物。
产业上的可利用性
按照本发明的方法,在考虑自由度的条件下,短时间内可以从三维结构数据库检索出对结构已知的靶生物高分子配位的配位化合物,极其容易地得到可靠性高的检索结果。因此,按照本发明的方法,在医学、药学区域中对于生物高分子起着抑制剂和激动剂或拮抗剂作用的前导化合物等的制作是非常有用的。

Claims (30)

1.一种从包含三维坐标信息的化合物数据库选择至少一种配位体候补化合物的方法,所述数据库包含任选构象中的至少两个数据库登记项目的三维坐标信息,所述配位体候补化合物适于与目标生物聚合物键合,该方法包括:
(1)在目标生物聚合物与试验化合物之间评估一种最稳定的对接结构,所述试验化合物是以至少两种登记项目中的每一个项目作为试验化合物,其中,所述评估包括进行自动化检索;以及,
(2)根据最稳定的对接结构确定所述试验化合物是否是一个候补化合物。
2.根据权利要求1所述的方法,其中,所述评估包括考虑所有可能键合的模式和所述试验化合物的信息,以获得最稳定的对接结构。
3.根据权利要求2所述的方法,其中,所述评估还包括至少一种能量最小化的方法,以获得具有最佳结合方式和最佳扭转角的最稳定的对接结构。
4.根据权利要求3所述的方法,其中,所述评估包括至少三种能量最小化的方法,每一种最小化方法包括重复的方法。
5.根据权利要求3所述的方法,其中,所述评估包括一种自动对接的方法。
6.根据权利要求5所述的方法,其中,所述自动对接方法是所谓的“ADAM”法。
7.根据权利要求1所述的方法,其中,至少一种配位体候补化合物是根据最稳定的对接结构而选择的。
8.根据权利要求7所述的方法,其中,至少一种配位体候补化合物是根据最稳定的对接结构的稳定性和结构特性而选择的。
9.根据权利要求8所述的方法,其中,所述特性包括目标生物聚合物与试验化合物之间的一些氢键合和相互作用。
10.根据权利要求9所述的方法,其中,它还包括至少一种附加的选择方法。
11.根据权利要求1所述的方法,其中,所述自动对接的方法是“ADAM”法。
12.一种从包含三维坐标信息的化合物数据库选择至少一种配位体候补化合物的方法,所述数据库包含任选构象中的至少两个数据库的登记项目的三维坐标信息,所述配位体候补化合物适于与目标生物聚合物键合,所述方法包括:
(a)指定与氢键合的类别编号、计算分子力场能量值,以及至少两种数据库登记项目的构象;
(b)准备有关所述生物聚合物的配位体键合区的物理化学信息和至少一个空位原子;
(c)在目标生物聚合物与至少两个数据库登记项目的每一项之间评估最稳定的对接结构,其中,所述评估包括进行自动检索;
(d)根据所述最稳定的对接结构确定所述试验化合物是否是一个候补化合物。
13.根据权利要求12所述的方法,该方法还包括,对于由包含至少一个附加的选择方法的步骤(d)所选定的配位体候补化合物进行选择。
14.根据权利要求12所述的方法,其中,所述评估还包括,在试验化合物的至少一个与氢键合的杂原子与所述目标生物聚合物的至少一个空位原子之间,制造结合的对应。
15.根据权利要求14所述的方法,其中,所述评估包括在试验化合物的至少一与氢键合的杂原子与所述目标生物聚合物的至少一个空位原子之间,保存所述不可能结合的对应。
16.根据权利要求15所述的方法,其中,所述评估包括,在试验化合物与目标生物聚合物之间同时评估与氢键合的模式。
17.根据权利要求16所述的方法,其中,所述评估包括,在试验化合物与目标生物聚合物之间得到一种对接结构。
18.根据权利要求13所述的方法,其中,所述至少一种附加的选择方法包括,计算范德华以及静电的相互作用,以选择一种最稳定的对接结构。
19.一种从包含三维坐标信息的化合物数据库选择至少一种配位体候补化合物的方法,所述数据库包含在目标生物聚合物与试验化合物之间评估最稳定的对接结构的任选构象中的至少两种数据库项目的三维坐标信息,而该试验化合物是以至少两个登记项目中的一项作为该试验化合物,
其中,所述评估包括考虑所述试验化合物可能键合的模式和构象。
20.根据权利要求19所述的方法,其中,所述评估包括一种自动对接的方法。
21.根据权利要求20所述的方法,其中,所述自动对接的方法是所述的“ADAM”法。
22.根据权利要求19所述的方法,其中,所述化合物数据库包括计算相互作用能量的信息和产生构象的信息。
23.一种从包含评估最稳定对接结构的化合物数据库选择至少一种适用于与目标生物聚合物键合的配位体候补化合物的方法,
所述方法包括用一种自动对接方法,在目标生物聚合物与登记数据库项目的至少两项中的每一项作为试验化合物之间,评估最稳定的对接结构,
其中,
所述评估包括考虑所述试验化合物可能键合的模式和构象;和
所述化合物数据库包括任选构象中至少两种登记数据库项目的三维坐标的信息。
24.根据权利要求23所述的方法,其中,所述自动对接方法是所谓的“ADMA”法。
25.根据权利要求23所述的方法,其中,所述化合物数据库包括计算相互作用能量的信息和产生构象的信息。
26.一种从化合物数据库选择至少一个配位体候补化合物的方法,
所述候补化合物适用于与目标生物聚合物键合,
所述方法包括用自动对接方法,在所述目标生物聚合物与登记数据库项目的至少两项的每一项作为一种试验化合物之间,评估最稳定的对接结构,其中,
所述评估包括,根据所述化合物中与氢键合的杂原子与所述目标生物聚合物中与氢键合的空位原子之间的距离匹配,考虑试验化合物可能的模式和构象,以及,
所述化合物数据库包括任选构象中至少两个数据库登记项的三维坐标的信息。
27.根据权利要求26所述的方法,其中,所述自动对接方法是所谓的“ADMA”法。
28.根据权利要求26所述的方法,其中,所述化合物数据库包括计算相互作用能量用的信息,以及产生构象用的信息。
29.一种从化合物数据库选择至少一个配位体候补化合物的方法,
所述候补化合物适用于与目标生物聚合物键合,
所述方法包括,在所述目标生物聚合物与至少两个登记项中的每一项作为一种试验化合物之间,评估最稳定的对接结构;
其中,
所述评估包括分子间能量的计算、分子内能量的计算、或氢键数的计算;以及
所述化合物数据库包括任选构象中至少两个数据库登记项目的三维坐标的信息。
30.根据权利要求29所述的方法,其中,所述化合物数据库包括计算相互作用能量用的信息和产生构象用的信息。
CNB951969684A 1994-10-31 1995-10-30 从三维结构数据库检索新的配位化合物的方法 Expired - Fee Related CN1150478C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP267688/94 1994-10-31
JP267688/1994 1994-10-31
JP26768894 1994-10-31

Publications (2)

Publication Number Publication Date
CN1171160A CN1171160A (zh) 1998-01-21
CN1150478C true CN1150478C (zh) 2004-05-19

Family

ID=17448156

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB951969684A Expired - Fee Related CN1150478C (zh) 1994-10-31 1995-10-30 从三维结构数据库检索新的配位化合物的方法

Country Status (6)

Country Link
US (3) US6389378B2 (zh)
EP (2) EP1944708A1 (zh)
JP (1) JP3669704B2 (zh)
KR (1) KR970707500A (zh)
CN (1) CN1150478C (zh)
WO (1) WO1996013785A1 (zh)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1150478C (zh) * 1994-10-31 2004-05-19 板井昭子 从三维结构数据库检索新的配位化合物的方法
US6549900B2 (en) 1995-12-28 2003-04-15 Akiko Itai Method for creating physiologically active compounds
EP0818744A3 (en) * 1996-07-08 1998-07-08 Proteus Molecular Design Limited Process for selecting candidate drug compounds
WO1999001409A1 (fr) * 1997-07-03 1999-01-14 Akiko Itai Procede de deduction des fonctions proteiques au moyen d'une base de donnees de ligands
EP0918296A1 (en) * 1997-11-04 1999-05-26 Cerep Method of virtual retrieval of analogs of lead compounds by constituting potential libraries
WO2001018627A2 (en) * 1999-09-06 2001-03-15 National University Of Singapore Method and apparatus for computer automated detection of protein and nucleic acid targets of a chemical compound
US6727100B1 (en) 1999-10-21 2004-04-27 4Sc Ag Method of identifying candidate molecules
CA2431655A1 (en) * 2000-11-15 2002-05-23 Akiko Itai Method of profiling protein
WO2002044112A1 (fr) * 2000-11-30 2002-06-06 Toyo Suisan Kaisha, Ltd Procede de conception de la structure moleculaire d'un inhibiteur d'enzyme
JP3843260B2 (ja) * 2001-01-19 2006-11-08 株式会社インシリコサイエンス 誘導適合を含めたタンパク質の立体構造構築方法およびその利用
US7001887B2 (en) * 2001-02-02 2006-02-21 Chugai Seiyaku Kabushiki Kaisha Peptide derivatives
WO2003072596A2 (en) * 2002-02-27 2003-09-04 Protein Mechanics, Inc. Clustering conformational variants of molecules and methods of use thereof
US6671628B2 (en) 2002-03-04 2003-12-30 Chemnavigator, Inc. Methods for identifying a molecule that may bind to a target molecule
CA2479818A1 (en) 2002-04-10 2003-10-23 Transtech Pharma, Inc. System and method for integrated computer-aided molecular discovery
US20040034481A1 (en) * 2002-08-16 2004-02-19 Hurst John R. Methods for identifying a prospective binding site on a target molecule and for characterizing a site on a target molecule
WO2004022737A1 (ja) * 2002-09-03 2004-03-18 Sei-Ichi Tanuma 生理活性ペプチドの設計法及びその用途
KR100456627B1 (ko) * 2002-12-10 2004-11-10 한국전자통신연구원 3차원 구조기반의 거대분자의 기능 예측 시스템 및 그 방법
US7826979B2 (en) * 2003-02-14 2010-11-02 Vertex Pharmaceuticals Incorporated Method of modeling complex formation between a query ligan and a target molecule
JP4314128B2 (ja) 2004-02-24 2009-08-12 株式会社インシリコサイエンス タンパク質立体構造と誘導適合を利用したリガンド探索方法
JP2005250721A (ja) * 2004-03-03 2005-09-15 Hitachi High-Technologies Corp 蛋白質または高分子複合体の検索・照合方法及び装置
US20060052943A1 (en) * 2004-07-28 2006-03-09 Karthik Ramani Architectures, queries, data stores, and interfaces for proteins and drug molecules
JP4688467B2 (ja) * 2004-10-15 2011-05-25 株式会社菱化システム 受容体−リガンド安定複合体構造探索方法
CA2600745A1 (en) * 2005-03-03 2006-09-08 The Burnham Institute For Medical Research Screening methods for protein kinase b inhibitors employing virtual docking approaches and compounds and compositions discovered thereby
WO2006099178A2 (en) 2005-03-11 2006-09-21 Schrodinger, Llc Predictive scoring function for estimating binding affinity
KR100839600B1 (ko) * 2006-12-04 2008-06-19 한국전자통신연구원 특이 결합부위 자동추출을 이용한 리간드 검색 장치 및 그방법
WO2008154456A2 (en) * 2007-06-06 2008-12-18 Nationwide Children's Hospital, Inc. Methods and compositions relating to viral fusion proteins
JP5052985B2 (ja) * 2007-07-31 2012-10-17 住友重機械工業株式会社 分子シミュレーション方法、分子シミュレーション装置、分子シミュレーションプログラム、及び該プログラムを記録した記録媒体
US20090124579A1 (en) * 2007-11-09 2009-05-14 University Of South Carolina Systems and Methods For Determination of Compounds for Stimulation or Inhibition of Neocalcification
EP3077823B1 (en) 2013-12-05 2019-09-04 The Broad Institute, Inc. Compositions and methods for identifying and treating cachexia or pre-cachexia
CN104750761B (zh) * 2013-12-31 2018-06-22 上海致化化学科技有限公司 分子结构数据库的建立方法及搜索方法
US11111296B2 (en) 2015-12-14 2021-09-07 The Broad Institute, Inc. Compositions and methods for treating cardiac dysfunction
JP7139805B2 (ja) * 2018-09-11 2022-09-21 富士通株式会社 化合物探索装置、化合物探索方法、及び化合物探索プログラム
WO2020168507A1 (zh) * 2019-02-21 2020-08-27 深圳晶泰科技有限公司 分子对接云计算流程控制方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5331573A (en) * 1990-12-14 1994-07-19 Balaji Vitukudi N Method of design of compounds that mimic conformational features of selected peptides
ATE199109T1 (de) 1992-03-27 2001-02-15 Akiko Itai Verfahren zur analyse der struktur von stabilen zusammengesetzten biopolymerligandmolekuelen
JP3256307B2 (ja) 1993-01-07 2002-02-12 昭子 板井 生理活性を有するリガンドの分子構造を構築する方法
US6081766A (en) * 1993-05-21 2000-06-27 Axys Pharmaceuticals, Inc. Machine-learning approach to modeling biological activity for molecular design and to modeling other characteristics
JP3785195B2 (ja) 1993-11-11 2006-06-14 昭子 板井 生理活性を有するリガンドの分子構造を構築する方法
CN1150478C (zh) * 1994-10-31 2004-05-19 板井昭子 从三维结构数据库检索新的配位化合物的方法
JP3928000B2 (ja) 1995-11-13 2007-06-13 昭子 板井 生理活性化合物の設計方法
CN1209111A (zh) 1995-12-28 1999-02-24 板井昭子 生理活性化合物的创制方法
US6389978B1 (en) * 1999-11-12 2002-05-21 Manuel B. Hooper Gun barrel cleaning shell

Also Published As

Publication number Publication date
US6490588B2 (en) 2002-12-03
US6389378B2 (en) 2002-05-14
WO1996013785A1 (fr) 1996-05-09
US20010018682A1 (en) 2001-08-30
EP0790567A4 (zh) 1997-09-03
CN1171160A (zh) 1998-01-21
JP3669704B2 (ja) 2005-07-13
EP0790567A1 (en) 1997-08-20
KR970707500A (ko) 1997-12-01
US20020111938A1 (en) 2002-08-15
US20030061198A1 (en) 2003-03-27
EP1944708A1 (en) 2008-07-16

Similar Documents

Publication Publication Date Title
CN1150478C (zh) 从三维结构数据库检索新的配位化合物的方法
Schwede et al. Protein structure computing in the genomic era
Sharan et al. Identification of protein complexes by comparative analysis of yeast and bacterial protein interaction data
CN1108579C (zh) 在序列同源性检测中完成模式词典组成的方法和设备
Anderson The process of structure-based drug design
Koehl et al. De novo protein design. II. Plasticity in sequence space
US20070016380A1 (en) Protein engineering
US11942188B2 (en) Obtaining an improved therapeutic ligand
CN1493051A (zh) 进行离散子结构分析的计算机系统的操作方法
Peitsch About the use of protein models
Ferrara et al. Evaluation of the utility of homology models in high throughput docking
Simpkin et al. Tertiary structure assessment at CASP15
US7826979B2 (en) Method of modeling complex formation between a query ligan and a target molecule
CN1725222A (zh) 组合化学集中库设计与优化方法
CN1209111A (zh) 生理活性化合物的创制方法
Li et al. Blind assessment of monomeric AlphaFold2 protein structure models with experimental NMR data
JP2006323833A (ja) 生理活性化合物の設計方法及び設計装置、並びに生理活性化合物の設計プログラム
Vankayala et al. Elucidating a chemical defense mechanism of Antarctic sponges: a computational study
Kozlowski et al. Computer-aided design of chiral ligands: Part I. Database search methods to identify chiral ligand types for asymmetric reactions
Berman et al. Data to knowledge: how to get meaning from your result
JP3747048B2 (ja) 三次元構造データベースから新規リガンド化合物を検索するためのデータベースの作成方法
CN1515690A (zh) 结核分支杆菌诊断及耐药分析芯片及其制备工艺和使用方法
Gosto Assessment of accuracies of protein 3-dimensional prediction software
Reeves et al. MS01 O1
Jagodzinski Towards large-scale validation of protein flexibility using rigidity analysis

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: AKIKO ITAI; DRUG MOLECULAR DESIGN INSTITUTE CO.,

Free format text: FORMER OWNER: AKIKO ITAI

Effective date: 20071116

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20071116

Address after: Tokyo, Japan, Japan

Co-patentee after: Medicinal Mocule Design & Research Inst. Co. Ltd.

Patentee after: Itai Akiko

Address before: Tokyo, Japan, Japan

Patentee before: Itai Akiko

C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20040519

Termination date: 20111030