CN1209111A - 生理活性化合物的创制方法 - Google Patents

生理活性化合物的创制方法 Download PDF

Info

Publication number
CN1209111A
CN1209111A CN96180097A CN96180097A CN1209111A CN 1209111 A CN1209111 A CN 1209111A CN 96180097 A CN96180097 A CN 96180097A CN 96180097 A CN96180097 A CN 96180097A CN 1209111 A CN1209111 A CN 1209111A
Authority
CN
China
Prior art keywords
molecular
compound
skeleton
database
biomacromolecule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN96180097A
Other languages
English (en)
Inventor
板井昭子
首藤紘一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of CN1209111A publication Critical patent/CN1209111A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07BGENERAL METHODS OF ORGANIC CHEMISTRY; APPARATUS THEREFOR
    • C07B61/00Other general methods
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/40Searching chemical structures or physicochemical data
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/90Programming languages; Computing architectures; Database systems; Data warehousing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medicinal Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Genetics & Genomics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Software Systems (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
  • Heterocyclic Carbon Compounds Containing A Hetero Ring Having Oxygen Or Sulfur (AREA)

Abstract

应用计算机进行生理活性化合物的创制方法,它包含以下工序:(1)构建收录有网罗了从基本分子骨架上存在的可修饰部位选择的至少1个的取代部位和可以利用的取代基的全部组合的分子结构的化合物数据库;(2)从该化合物数据库中筛选出满足发挥生理活性所必要条件的分子结构。

Description

生理活性化合物的创制方法
[技术范围]本发明涉及利用计算机创制对药物和农药有用的生理活性化合物的方法
[背景技术]为了创制高用途的药物和农药,必须有已证实具有所希望的生理活性且可作为进行各种化学修饰点的先导化合物。但是以前并不知道创制先导化合物的理论方法,一般将有机体内存在的激素及神经递质等生理活性物质或随机筛选所得到的具有期望生理活性的化合物作为先导化合物。
另一方面,许多生物大分子的立体结构已用X射线晶体衍射分析法阐明,酶抑制剂等低分子化合物(配基)和生物大分子的复合物的立体结构也有许多报道。从其结果可发现一条自然规则,为了使某化合物具有生理活性,它必须契合目标生物大分子的配基结合域且能稳定地结合。基于这些认识,利用计算机对目标生物大分子配基结合区和某化合物结合的可能性及结合的强弱进行计算就可判断该化合物和生物大分子结合后能否发挥生理活性,即是否具有作为配基起作用的可能性,这作为先导化合物和生理活性化合物理论上的创制方法备受注目。
作为利用计算机创制生理活性化合物的方法,已知有对与生物大分子配基结合域以最适状态(例如产生最大氢键结合的状态)结合的化合物进行计算的自动构建方法(结构自动构建法)以及从现存数据库收录的化合物群中挑选出满足发挥生理活性必要条件的化合物的方法(数据库法)。
作为结构自动构建法,例如有西端等的方法(Nishibata,Y.andItai,A.,Tetrahedron,47,pp.8985-8990,1991;Nishibata,Y.and Itai,A.,J.Med.Chem.,36,pp.2921-2928,1993)。结构自动构建法的优点在于不管化合物是已知还是未知,都能广泛地提示满足具有生理活性所需的必要条件的结构。
作为数据库法,已知有利用与生物大分子结合的已知药物的结构信息,对该药物和化合物间官能团及其三维位置关系等是否一致进行判断从而筛选出化合物的方法。(例如利用ISIS-3D:MDL InformationSystems,Inc.;UNITY:Trips,Inc.;Chem-X:Chemical Design,Ltd.等程序的方法)。此方法的特征在于在不能利用目标生物大分子的立体结构信息的情况下也适用,具有很高的通用性。
此外,在能够利用生物大分子配基结合域的三维座标时,可利用不受假设和先入之见影响的可信度高的数据库检索法。即本发明者们开发了自动推测生物大分子和配基分子间最稳定复合物结构的方法(程序“ADAM”、PCT国际公开WO 93/20525;Yamada,M.et al.,J.Mol.Biol.,243,pp.310-326,1994),并应用此方法,完成了从三维结构数据库中筛选出可与目标生物大分子配基结合域稳定结合的配基化合物的方法(程序“ADAM&EVE”、PCT国际公开WO 96/13785;第24届构效关系研讨会,Mizutani,M.et al.,演讲题目序号14-S20,1996)。此方法具有不仅仅考虑结合形式和构象的自由度,而且在连续空间使弯曲角最适化,并根据复合体的能量稳定性从数据库中高速检索所期望配基化合物的优点。
此外,能够利用确定或推断和目标生物大分子结合的配基结构的基本分子骨架时,可以利用应用拓扑学的高速数据库检索法(程序“EUREKA”,PCT/JP96/03325)。此方法基于基本分子骨架和生物大分子的结合形式及构象,能够从数据库中检索出和该生物大分子配基结合域有结合可能的衍生物或结构类似分子(拟似物)。
上述数据库检索法可以将收录任何化合物群的数据库作为对象,但在以能够得到的(市售的或公司里有的)化合物的数据库为对象时,具有不用合成满足条件的化合物1就能很容易地评价生理活性的优点。利用只收录有现有(已报道)化合物的数据库时,不合成化合物1而想直接入手也许是不可能的,但至少还有知道其化合物的存在可能、其合成方法和物理化学性质等许多优点。
但是这种能得到的化合物和现有化合物的数据库中所含的结构只是理论上可能存在的天文数字的结构的一小部分,又因为其结构有偏向性且在可能存在的结构中的分布(稀疏),所以它常常一开始就不含有具有最大生理活性的最适化学结构的化合物。如果利用这样的数据库,被选中的化合物固然有活性,但也有可能因其活性较弱而作为先导物本来应该有望的化合物被忽略掉,而且因被选中的化合物的结构和最适结构相差很大,而存在需要花大量劳力和时间进行改良的问题。
此外,某结构作为先导物已知或用随机筛选或上述方法发现先导物的情况下,为了提高期望生理活性至最大而进行的化学修饰方面的研究就要试错性地合成许多衍生物和类似化合物,需要花费大量的劳动力和时间。
另一方面,作为高效开发药物的实验方法,对官能团的种类和位置的可能性及多个结构单位的联系的可能性等进行网罗式组合的化合物群进行多种同时合成或多种同时筛选的方法备受注目(组合化学法)。例如,对基本分子骨架上存在的多个可修饰部位和多个取代基的组合,或者肽这样由两个以上结构单位形成的化合物中结构单位的种类和结合顺序变换而成的化合物组合进行研究。多流程同时操作一起合成这些化合物,更进一步对全部化合物同时进行生理活性试验(Gollop,M.A.et al.,J.Med.Chem.,37,pp.1233-1251,1994;Burgess,K.et al.,J.Med.Chem.,37,pp.2985-2987,1994)。根据这种方法,可以从研究出的组合中很容易地选出具有该基本分子骨架且生理活性最强的化合物,因此此方法具有先导物创制和生理活性最适化过程同时进行的特点。
[发明的公开]
本发明的目的在于提供高效地创制生理活性化合物的方法,并提供利用计算机解决上述问题的方法。具体的说本发明的目的就是从根据对基本分子骨架添加的官能团的种类和位置的可能性或多个结构单位的种类和结合顺序的可能性进行组合式收集而研究出的化合物群中进行适当的选择,从而筛选出具最适化学结构而有期望生理活性的化合物。
本发明者们努力开发不用进行大规模试错就能直接得到对所望生理活性尽量有利的最适化学结构的方法,结果将采用上述组合化学实验方法的数据库构建法和本发明者们开发出的数据库检索法进行综合,从而达到了本发明的目的。即用计算机建立收集有各种基本分子骨架的可修饰部位和取代基的组合或多个结构单位的组合的化合物群的三维结构数据库,并用此数据库按以上述数据库法进行检索,从而能够高效地进行生理活性化合物的创制。采用这种方法,因能够以包含以前根据化学合成的组合化学法决不可能达到的巨大数量的化合物的数据库为对象进行检索,所以一次检索就选出具最大生理活性化合物成为可能。本发明正是基于这种认识而完成。
也就是说,本发明为应用计算机进行生理活性化合物创制的方法,它提供了包含下述工序的方法:(1)建立化合物数据库的工序,该数据库中收录网罗从基本分子骨架上存在的可修饰部位选出的一个或两个以上取代部位和可利用取代基之间全部组合的分子结构;  (2)从该化合物数据库中挑选出满足发挥生理活性必要条件的分子结构的工序。本说明书的用语“生理活性化合物的创制”包括新先导化合物的创制、新先导化合物的创制和创制出的先导化合物的最优化、利用已知先导化合物分子骨架来优化新先导化合物等,具有生理活性化合物的创制及最优化等概念,所以应作最广义的解释。
上述(1)工序中,作为基本分子骨架,可以用任何可进行取代基的交换、追加、去除等结构修饰的分子结构,用能证实或推测具有所期望生理活性的配基基本结构的全部或一部分,或者合成或合成性结构修饰不困难的分子结构。作为可证实具有所期望生物活性的已知配基的基本结构,例如有苯二氮骨架和苯巴比妥酸骨架等。作为推测具有所期望生理活性的配基结构,例如有根据“LEGEND”和“ADAM&EVE”等方法制造和选择出的分子结构。作为合成及合成性结构修饰较容易的分子骨架可举例,例如具有可能修饰部位的一个或两个以上的结构单位和一个或两个以上的连接部件相互连接而成的分子骨架。在这种情况下,可以从一个或两个以上种类的结构单位和连接部件组合成一个或两个以上的分子骨架中适当选择出一些作为基本分子骨架。
此外,本发明其它的形式还包括被使用于利用计算机数据库检索法的生理活性化合物创制方法的三维结构数据库,收录有从基本分子骨架上存在的可修饰部位中选出一个或两个以上的取代部位和可利用的取代基间的全组合而成的分子结构的数据库,以及存储该数据库的存储介质。用于作出此数据库中含有的分子结构的基本分子骨架只要可进行取代基交换、追加、去除等结构修饰的分子结构就均可使用,具体的说可以用上述所说明的结构。
[图的简单说明]
图1表示作为从化合物数据库中挑选出具生理活性配基候补化合物的方法使用程序ADAM&EVE时的流程图。图中S表示步骤。
[发明实施的最佳形式]
本发明方法的第一道工序,就是从基本分子骨架上存在的可修饰部位选出1个或2个以上的取代部位和可利用的取代基用计算机进行网罗式组合,将全部构建的允许其基本分子骨架的分子结构收录入化合物数据库。在必要情况下,可预先设定组合的条件,在此条件下进行所允许的全部组合,构建出分子结构,从而有效地利用计算机资源。本发明方法的特征在于以此工序所得的网罗式的化合物数据库为对象,筛选出满足实现生理活性必要条件的分子结构(第二道工序)。
数据库中收录的分子结构的构建例如可按以下工序进行:
(A)为了构建分子结构,从现存分子骨架及其类似分子骨架中选出或组合出1个或2个以上的基本分子骨架。
(B)为了引入取代基,在每个基本分子骨架中,从该基本分子骨架上存在的1个或2个以上的可修饰部位中选出1个或2个以上的取代部位;
(C)确定可利用的取代基,根据需要也确定要引入的每个取代基的最大个数,并对取代部位和取代基进行相应的搭配。
(D)收集上述工序(B)选择出的全部取代部位和上述工序(C)确定的全部取代基所有可能的组合,但是,上述工序(C)中任意条件已被设定的情况下收集其范围内所有可能的组合,构建出化合物的分子结构。
工序(A)中,作为基本分子骨架可以从具有所期望的生物活性的已知的配基基本结构,例如苯二氮骨架、巴比妥酸骨架、尿素骨架、吩噻嗪骨架、丁酰苯骨架、黄嘌呤骨架、苯乙胺骨架、吗啡骨架、前列腺素骨架、甾体骨架、青霉素骨架、头孢菌素骨架、喹啉酮羧酸骨架、四环素骨架、以及其类似分子骨架,例如同系物等作为医药和农药的分子骨架,从业人员已经可以利用的骨架中选择出适当的骨架。另外,工序(A)中,可以组合基本分子骨架自骨。作为这种方法可以采用对具有可修饰部位的1个或2个以上结构单位和1个或2个以上连接部件进行网罗式组合的方法。例如基本分子结构的建立可按以下工序进行。例如,分子骨架的构建可按以下工序进行。
(E)从可利用的结构单位中选出1个或2个以上的结构单位。
(F)关于各结构单位,根据需要附加1分子结构中的使用次数限制,是否允许相邻的结合、是否只在未端使用等使用条件。
(G)从可利用的连接部件中选出1个或2个以上的连接部件。
(H)设定应结合的结构单位数目的上限及下限。
对上述工序(E)和工序(G)选择出的全部结构单位和连接部件收集所有可能的组合,构建出1个或2个以上的基本分子骨架(但是,在上述工序(F)中对结构单位的1个或2个以上的使用条件进行设定的情况下,收集其范围内所有的可能的组合)。
以前,利用计算机数据库法进行生理活性化合物创制的方法中所用数据库只限于已有的可利用的数据库,还没有象上面一样人工构建化合物数据库而用于数据库法的检索中的实例。所以,本发明的上述化合物数据库是新型的。存储化合物数据库的存储介质只要能够确实地存储数据库的信息而且在必要时能读出信息即可,并没有特殊的限定。例如,研究者可采用磁带、硬盘、软盘或CD-ROM等从业者可利用的存储介质。
此外,化合物数据库的构建方法并不只限于上述所说的,只要是收集了从基本分子骨架的可修饰部位选出的取代部位和指定的取代基的所有组合的,不管以什么方法构建的都包含在本发明的范围内。上述化合物数据库的构建方法只是作为示例,以便于理解,根据目的可以作适当的改变和修饰,这一点研究者是容易理解的。
本发明方法的第二道工序,是从上述化合物数据库中筛选出满足发挥生理活性所必要条件的化合物。此步骤也用计算机进行,作为它的算法,只要是可以作为满足发挥生理活性所必要条件的化合物的筛选方法使用就都可以应用。
作为化合物的筛选方法,例如可以根据已知具有所期望生理活性的药物的化学结构为基础,选择此药物中存在的官能团中认为发挥生理活性所必须的基团,并将此药物基本分子骨架和选择的官能团的三维位置关系同化合物数据中分子结构的三维结构信息进行重合,从而判断药物和该分子结构的类似性。作为此种重合判断法,研究者例如可利用ISIS-3D(MDL Information System,Inc.)、UNITY(Tripos,Inc.)、Chem-X(Chemical Design,Ltd.)等程序。
此外,作为其它的筛选方法,在可以利用目标生物大分子配基结合域三维座标的情况下,用“ADAM&EVE”程序,根据该配基结合域和分子结构的相互作用(例如氢键、静电相互作用、范德华力相互作用等),筛选出可与生物大分子结合的分子结构。此方法在特愿平6-267688号说明书中详细记载,研究者参考此说明书可以很容易利用此方法。依照程序“ADAM&EVE”的分子结构的筛选可按以下所述进行。
对于上述化合物数据库中分子结构的三维坐标,准备氢键性分类序号、分子力学计算用信息及构象构建用信息等。氢键性分类序号为对形成氢键结合的原子团所用的识别用序号,被分别给予这些原子团中直接氢键结合所涉及的不同原子。根据赋有序号原子团的几何学结构及氢键结合的性质等特征,并可以立即得出成为其结合对象的氢键性原子(虚拟原子)的位置。
分子力学计算用信息是为了用分子力学对分子内、分子间的相互作用的能量进行计算而给予各原子的序号和电子状态等,包括原子序号和原子电荷等。构象构建用信息是为了系统地构建使可旋转的结合的结合弯曲角变化的不同构象而应用的其弯曲角的初值、终值以及旋转多少度的增加值等,此信息包含一个结合中构成弯曲角的四个原子的输入顺序序号和弯曲各个角初值、终值及旋转角等。
另一方面,根据目标生物大分子的三维座标准备配基结合域的物理化学信息和虚拟原子。配基结合域的物理化学性质说的是能结合配基的生物大分子的凹入区域内部中生物大分子的全体原子势能的影响,是包含配体结合域内三维晶格阵点的氢键性(氢接受性和氢给与性)、此三维晶格阵点中设置探针原子时,生物大分子和探针原子之间相互的范德华力相互作用能和静电相互作用能的概念。虚拟原子设定在作为生物大分子中氢键性官能团的氢键结合对象的杂原子的位置上。
接着,基于对上述化合物数据库中分子结构三维座标而准备的氢键性分类序号,分子力学计算用信息及构象构建用信息、还有上述配基结合域的物理化学信息,一边变化试验分子结构的构象一边构建生物大分子与此分子对接而成的复合体的结构,从而评价生物大分子和试验分子结构间的相互作用,寻找最稳定的结构。分子对接是包含寻找配基化合物分子与某生物大分子复合体的形成和/或两者的稳定复合体结构的概念,一般来说可应用用分子模型的方法,用计算机和计算机图形学的模拟法、或自动对接法等来进行。生物大分子和试验分子结构形成的复合体的最稳定结构的研究可按以下方法进行。
(1)组合式地收集虚拟原子和试验分子结构中的氢键性杂原子的对应配对,网罗生物大分子-分子结构间的有利结合形式。
(2)系统地变化试验分子结构的构象的同时比较虚拟原子的距离和氢键性异原子间的距离,从而推测生物大分子-试验分子结构间可能的氢键结合形式和试验分子结构的氢键性部分的构象。
(3)在工序(2)中所得的每个氢键结合形式和构象中基于试验分子结构中的氢键性杂原子和虚拟原子的对应关系,将试验分子结构全部原子的坐标变换成生物大分子的坐标系,从而得到生物大分子-试验分子结构的复合物结构。
接上述工序(2),也可以按以下步骤进行研究。按照这些步骤可以生成的构象数减少而仍能选择适当的复合物结构,得到高精度的稳定复合体。
(3)保持工序(2)中所得的氢键结合形式,使虚拟原子和试验分子结构中的氢键性杂原子的位置一致化,从而最适化试验分子的构象,接着,除去分子内能较高的试验分子结构的构象。
(4)对于工序(3)保留的每个构象,基于试验分子结构中的氢键性杂原子和虚拟原子的对应关系,将试验分子结构全部原子的坐标变换成生物大分子的坐标系,从而得到生物大分子-试验分子结构的复合物结构。
(5)从工序(4)中所得的氢键性部分的复合物结构中除去试验分子结构中氢键性部分分子内能和生物大分子-试验分子结构中氢键性部分分子间相互作用能较高的复合物结构,接着,对余下的复合物结构进行结构的最适化。
(6)对于工序(5)所得的每个复合物结构,得到含发生了试验分子结构非氢键性部分的构象的新型的试验分子结构全体的复合物结构。
(7)从工序(6)中所得的复合物结构中,除去试验分子结构全体的分子内能和生物大分子-试验分子结构的分子间相互作用能较高的复合物结构,接着,对余下的复合物结构进行结构的最适化。
此外,当生物大分子的结构和试验分子结构很复杂时,为了更高速地研究生物大分子-试验分子结构的稳定复合体结构,例如可利用以下方法。
(1)组合式地收集虚拟原子和试验分子结构的部分结构中的氢键性杂原子间的对应配对,网罗生物大分子-试验分子结构间的有利结合形式。
(2)系统地变化试验分子结构的构象的同时比较虚拟原子间的距离和氢键性杂原子间的距离,从而推测生物大分子-试验分子结构间的氢键结合形式及试验分子结构的部分结构的构象。
(3)基于工序(2)所得的氢键结合形式和构象,除去试验分子结构的部分结构不可能中产生的氢键结合形式的虚拟原子和氢键性杂原子的组合。组合式地收集虚拟原子和试验分子结构全体的氢键性杂原子的对应配对,网罗生物大分子-试验分子结构间的有利结合形式。
(4)系统地变化试验分子结构的构象的同时比较虚拟原子间的距离和氢键性杂原子间的距离,从而推测生物大分子-试验分子结构间的可能氢键结合形式及试验分子结构的氢键性部分的构象。
(5)在工序(4)中所得的每个氢键结合形式和构象中,基于试验分子结构中的氢键性杂原子和虚拟原子的对应关系,将试验分子结构全部原子的坐标变换成生物大分子的坐标系,从而得到生物大分子-试验分子结构的复合物结构。
在上述各种方法中,氢键性官能团是包含能够参与氢键结合的官能团及原子的概念,氢键性杂原子为试验分子结构中存在的构成氢键性官能团的杂原子。氢键性部分为试验分子结构的部分结构中含和虚拟原子对应配对的氢键性杂原子的结构,非氢键性部分为氢键性部分以外的结构部分。
此外,作为利用目标生物大分子配基结合部位立体结构的化合物数据库的检索程序,可以用“EUREKA”(PCT/JP96/03325号说明书公开的生理活性化合物的设计方法,作为本说明书的公开含有上述说明书的公开)。程序“EUREKA”是0根据确定或推测能够与生物大分子结合的配基的结构和与生物大分子的结合形式,能够从数据库中检索出与该生物大分子有结合可能的化合物的方法。本发明方法中利用“EUREKA”时,在具有构建数据库所用的基本骨架结构或其类似结构的化合物和目标生物大分子的结合形式为已知或能够推测的情况下,可以将该化合物的全部或一部分结构作为查询结构进行检索。
进行根据此方法的数据库检索时,把查询结构与生物大分子的结合形式和构象作为检索对象的化合物(试验分子)中不变的参量来对待,只变化查询结构中不存在而试验分子中存在的取代基的构象的同时判定能否和该生物大分子形成稳定的复合物。符合标准可以和上述程序″ADAM&EVE″作同样的设定。根据程序″EUREKA″的检索方法,由于不必探究查询结构和数据库化合物结构之间共同部分的结合形式和构象自由度,所以有能够高速进行检索的优点。这种检索方法对于分子骨架中富有多样性的化合物群的数据库的检索不一定很适合,但是对于基于少数的基本分子骨架只变化官能团的种类与位置而构建的化合物数据库的检索却非常合适。
对于根据上述方法寻找出的最稳定复合物结构,根据生物大分子和试验分子结构的相互作用能量值,对是否选择此分子结构作为候选化合物进行判断,接着,对于化合物数据库中收录的全部分子结构反复进行最稳定复合物结构的寻找和是否选择作为候选化合物的判断,从而能够从化合物数据库中筛选出可能与目标生物大分子结合的配基候选化合物。
[实施例]
下面,就第二道工序中用程序″ADAM&EVE″的本发明的优选形式,以实施例进行详细的说明。
首先,为了构建化合物数据库,选择1个或2个以上的基本分子骨架作为要构建分子结构的基本结构。作为基本分子骨架,可以利用已知的具有所期望生理活性的药物和农药的分子骨架。例如可以利用苯二氮骨架、巴比妥酸骨架、尿素骨架、吩噻嗪骨架、丁酰苯骨架、黄嘌呤骨架、苯乙胺骨架、吗啡骨架、前列腺素骨架、甾体骨架、青霉素骨架、头孢菌素骨架、喹啉酸羧酸骨架、四环素骨架等,但并不仅限于上面所述的,可以用任何研究者所知道药物和农药的分子骨架。在这其中,优选应用可以利用三维座标等结构信息的分子骨架作为基本分子骨架。
接着,在工序(B)中,对于各个基本分子骨架,从其上存在的1个或2个以上的可修饰部位中选出1个或2个以上的取代部位引入取代基。例如以下述式(1)所示的苯二氮骨架为例进行说明,七元环的二氮环中,(在忽略4位氮原子可生成N-氧基的情况下)有6个可能的修饰部位(R1~R6),和二氮环缩合的苯环上有4个可能的修饰部位(R7~R10)。所以,苯二氮骨格上全部有10个可修饰部位,想在这些可修饰部位都引入取代基时,作为取代部位可全部选中R1~R10。例如,不想在R7、R9和R10引入取代基时,可以选择R1~R6和R8作为取代部位。没有选择的R7、R9和R10根据需要可以用氢原子。
此外,式(1)所示的苯二氮骨架中R6为取代或非取代苯基时,基本分子骨架为式(II)所示的骨架,可以从R1~R5、R7~R10以及R11~R15等可修饰部位中选择1个或2个以上的取代部位引入取代基。
此外,对苯二氮环的构成原子作种种选择时以及上述式(I)所示的骨架中选择苯基取代烷基作为R6时,就可能构建出如式(III)所示的基本分子骨架的组合。例如,X从CR2R3、NR2、O或S中,Y从CR4R5、NR4、O或S中选择,而且Z从C1~6的亚烷基、NR16、O、S中选择而进行组合,就可构建出各种基本分子骨架的组合。
在这之后是进行可利用取代基的确定,作为取代基,例如有碳数1至12的烷基、碳数1至12的烷氧基、苯基、吡啶基、羧基、烷基酯基、羟基、羰基(酮基)、卤素原子、氨基、氨甲酰基、羟烷基、硝基、磺酸基等。不过取代基并不仅限于此,可以指定任何种类的取代基。
例如,可利用的取代基指定为″碳数1至12的烷基″时,可预先构建所有满足碳数12以下条件的烷基(直链、支链、环状及其组合),将它们作为取代基组进行收录。此外,例如取代基指定为吡啶基时,可望利用所含取代部位为邻位、间位、对位任一种的取代基组。
上述工序中,根据需要,可以确定各取代基(或取代基组)引入的最大个数。作为这样确定的例子,例如有所构建的分子骨架引入的羟基总数在3个以下的确定;或者例如有所构建的分子骨架引入的苯基总数在2个以下、氨基在4个以下、和/或碳数1至12的烷基在3个以下的确定。
此外,根据需要,可以对特定取代部位和特定的取代基(或取代基组)进行各种对应配对。例如,上述(1)式的苯二氮骨架中选择R1、R5和R7作为取代部位时,可以进行R7只选择卤素原子(含氟、氯、溴和碘的取代基组)取代的对应配对。还有,确定含有氧基(O=)等2价以上的取代基时,可以对此取代基的可取代部位预先进行对应组合。例如,上述苯二氮骨架中,作为氧基的可取代部位,有R2与R3和R4与R5两种可能的对应组合。此外,如果要利用氧基也可以预备分子骨架中含氧基的其它基本分子骨架。
作为其它的组合式构建基本分子骨架的例子,可按以下的组合进行。
首先,应用4个结构单位(A~D)和连接该结构单位的3个连接部件(X~Z),对结构单位和连接部件进行组合,构建出分子结构。接着选择各个分子骨架上存在的结构单位的可利用的1个或2个以上的单位(上图中,R20~R23结合的间次苯基、R24~R27结合的对次苯基、R28~R29结合的亚甲基,R30~R33结合的环己二烯基等)以及连接部件上可能利用的结合基团(上述图中的酰胺基、尿素基等)。在这之后,收集该结构单位和结合基团的全部组合,构建基本分子骨架。
接着,对于选择的全部取代部位和确定的全部取代基(或取代基组),收集全部可能的组合,构建出数量相当于组合总数的分子结构。对于取代基组来说,对取代基组所含的全部元素有必要构建出所有取代部位与其的组合。设定了取代基(或取代基组)数的上限时,和/或设定了取代基(或取代基组)和取代部位的对应配对时,在其范围内收集所有可能的组合。
对所构建的分子结构的数量没有特殊的限制,但是为了使根据数据库法的检索能够高效率高精度地进行,例如优选构建数万至百万的分子结构。还有,利用取代基(或取代基组)的代表构建出数万至数十万的分子结构,用含此的化合物数据库进行第二道工序(筛选工序),选出对生理活性产生必要的取代基(或取代基组),然后进一步构建含有这些取代基(或取代基组)网罗式组合的数据库,从而能够进行第二道工序。含有此种反复操作的方法包含在本发明的范围中。
作为第二道工序的筛选方法,为了使用程序″ADAM&EVE″(特愿平6-267688号)将构建出的分子结构的三维结构信息收录入化合物数据库(S1)。在能够利用基本分子骨架三维坐标信息时,可以基于此三维信息算出所构建的分子结构的三维坐标,但是在不能利用三维坐标信息时,例如可以用CONCORD(TRIPOS Associates Inc.);CONVERTER(BIOSYM/MSI Inc.);和CORINA(Sadowshi,J.andCasteiger,J.,Chem.Rev.,93,pp.2567-2581,1993)等方法算出三维坐标。关于分子结构的原子座标表示的立体结构,如果原子间的结合距离,结合角等的几何学量正确,基本上构象就不成问题,但是为尽量正确地算出构成分子各个原子的电荷,优选在某种程度上单独地输入给出稳定立体结构的原子座标。
下面,依照程序ADAM&EVE(特愿平6-267688号说明书中记载的方法),即以是否和目标生物大分子的配基结合域结合作为发挥生理活性的条件,具体地说明从化合物数据库中筛选与目标生物大分子的配基结合域可结合的分子结构的方法。图1中的S表示各个步骤,ADAM表示国际公开WO93/20525号说明书(国际公开日1993年10月14日)公开的生物大分子—配基分子的稳定复合物结构的寻找方法。此外,本说明书的公开也包含PCT国际公开WO93/20525号和特愿平6-267688号说明书的公开。
首先,对化合物数据库中收录的分子结构构建ADAM方法的三维数据库(S1)。分子结构的三维座标可以利用用力学计算将二维座标变换而成的三维座标,或者根据具有基本分子骨架的化合物的结晶数据库和能量计算的模式所构建所得的立体结构而得的坐标。关于分子结构的原子坐标表示的立体结构,如果原子间的结合距离,结合角等几何学量正确,基本上构象就不成为问题,但是为尽量正确地算出构成分子的各个原子的电荷,优选在某种程度上单独地输入给出稳定立体结构的原子坐标。
输入分子结构的三维坐标后,在必要的情况下添加氢原子,并进一步自动添加各原子的原子类型序号、氢键性杂原子的氢键性分类序号,各原子的原子电荷、键旋转的形式(哪个键旋转、或从几度开始旋转、旋转到几度)等,构建出三维数据库,构成分子结构的各原子的原子类型序号例如可以用Weiner等(Weiner,S.J,et al.,J.Am.Chem.Soc.,106,1984,pp.765-784)用的编号方法。
分子结构中存在的氢键性杂原子的氢键性分类序号可按下述表1进行添加(表中左边的数字表示氢键性分类序号),构成分子的各个原子的电荷可以以例如用Gasteiger法、MOPAC程序中的MNDO法、AMI法的分子轨道法算出。关于键旋转的形式,优选指定能使单键以60~120°的一定的旋转角系统地旋转的旋转形式。
表1
1   伯胺的SP2的N
2   伯胺的SP3的N
3   铵离子的SP3的N
4   酰胺的SP2的N
5   仲胺的SP3的N
6   芳香族的N
7   质子化芳香族的N
8   叔胺的N
9   质子化叔胺的N
10  C-O键的可旋转羟基的O
11  醚的O
12  羰基的O
13  碳螯合物阴离子的O
14  羧酸的O
15  磷酸盐的O
16  水分子的O
17  巯基的S
18  硫醚的S
19  氢位置固定的羟基的O
接着将构成生物大分子的原子的序号和原子坐标(但是除去氢原子的原子坐标)输入(S2)。生物大分子的原子坐标可以用以X射线晶体衍射分析和NMR分析所得的立体结构信息、从蛋白质结晶数据库等得到的信息,或基于这些信息构建的生物大分子模型的原子坐标等。生物大分子的原子坐标优选用三维坐标系表示。此外,把与生物大分子结合的在结构和功能上有重要作用的辅因子看作是生物大分子的一部分,与该辅因子呈结合状态的生物大分子的原子坐标的输入可在以后的步骤进行。作为此种辅因子,例如有辅酶、水分子、或金属离子。
接上述的步骤,算出构成生物大分子中存在的氨基酸残基的氢原子的原子坐标(S3)。一般来说,用X射线晶体衍射分析和NMR分析等实验方法求出生物大分子的氢原子位置比较困难,而且从蛋白质结晶数据库不能得到涉及氢原子的信息。因此,必须根据生物大分子中存在的氨基酸残基的结构,算出构成该氨基酸残基的氢原子的原子坐标。为了与可能旋转的氨基酸残基结合,对于不能决定单一原子坐标的氢原子,优选假定存在于反式位而算出原子坐标。
在这之后,往构成生物大分子中存在的氨基酸残基的原子中添加电荷(S4)。对于构成生物大分子中存在的氢键性官能团的杂原子添加氢键性分类序号(S5)。作为电荷的值,可以用各氨基酸算出的文献值,例如Weiner的值(Weiner,S.J.et al.,J.Am.Chem.Soc.,106,1984,pp.765-784)。氢键性分类序号可以按上述的表1添加。
接下来,确定配基结合域(S6)。作为配基结合域,可以选择含生物大分子任意部位的区域,优选长方体的区域。根据不同目的可以选择生物大分子配基结合“口袋”及其周围的部位,根据需要也可以选择含生物大分子中含效应物等其他分子结合部位的区域。还有,配基结合“口袋”是指存在于生物大分子凹入的分子表面的底物和阻断剂等配基分子结合的内穴。对于配基结合域范围的确定,例如可以利用程序GREEN(Tomioka,N.et al.,Journal of computer-AidedMolecular Design,1,1987,pp.197-210)功能的一部分。
在S6确定的区域内产生出三维晶格阵点,进行各三维晶格阵点中序号的赋于和晶格阵点信息的算出(S7)。三维晶格阵点是指生物大分子配基结合域内每隔一定间隔产生的三维晶格上的点,晶格阵点信息是包含各三维晶格阵点上具有的或假定的作为探针的原子算出的生物大分子和探针原子间范德华相互作用能和静电相互作用能,以及氢键性等的配基结合域局部的物理化学信息的概念。利用此三维晶格阵点的晶格阵点信息,可以使后面步骤中进行的生物大分子和化合物数据库中的分子结构和分子间相互作用能的近似计算高速化,而且可以合理地决定后面步骤中设定的虚拟原子的位置。其结果是能够在短时间内对生物大分子和分子结构的对接模型进行网罗式地探究。
三维晶格阵点可以以0.3-2.0埃,优选0.3-0.5埃的一定间隔在S6确定的区域内产生。作为探针原子,优选采用化合物数据库中收录的分子结构所含的所有原子种类。各三维晶格阵点上配置的各个探针原子和生物大分子间的范德华相互作用能可以以用经验势能函数的通常方法算出。作为经验势能函数,可以用下式表示的Lennard-Jonestype函数。 G vdw , i = Σ j ( A / r ij 12 - B / r ij 6 ) 式中i为表示探针原子位置的序号,i表示生物大分子原子的序号,A和B表示决定最小势能的位置和大小程度的参数;rij表示第i个配置的探针原子和生物大分子第j个原子间的距离。作为A和B的参数,例如可以用Weiner等的值(Weiner,S.J.et al.,J.Am.Chem.Soc.,106,1984,pp.765-784)。
分子结构在此三维晶格阵点上配置时的分子结构-生物大分子间的范德华相互作用能可以从下式(式中m为分子结构中原子的序号,n为分子结构中原子的数量,mo为与第m个原子距离最近的三维格阵点的序号)算出。 E vdw = Σ m = 1 N G vdw , mo
各三维晶格阵点上配置的各探针原子和生物大分子间的静电相互作用能可以用下式(式中i、j和rij和前述定义一样,j表示生物大分子第j个原子的电荷,k表示能量单位变换的常数,ε表示介电常数)算出。上述介电常数可以用一定的值,但更优选用Warshel等建议的依赖于rij的值(Warshel,A.,J.Phys.Chem.,83,1979,pp.1640-1652)。 G elc , i = Σ j K q j / ϵ r ij
分子结构在此三维晶格阵点上配置时的分子结构-生物大分子间的静电相互作用能可以从下式(式中m、n、和mo与上述有相同意义)算出。 E elc = Σ m = 1 N q m G elc , mo
接着给出表示三维晶格阵点氢键性的信息(氢键性晶格阵点信息)。此信息表示在三维晶格阵点中配置氢供与原子或氢接受原子里的哪个使之与生物大分子的氢键性官能团形成氢键,或在三维晶格阵点上配置哪一个原子才能使此原子和生物大分子的氢键性官能团形成氢键或不能形成氢键。例如对氢接受性的三维晶格阵点给予1的序号,氢供与性的三维晶格阵点给予2的序号,具两种性质的三维晶格阵点给予3的序号,没有氢键性的三维晶格阵点给予0的序号,从而表示三维晶格阵点的氢键性。
三维晶格阵点的氢键性可以按以下方法求出。如果某三维晶格阵点P和生物大分子存在的某氢供与原子D间的距离DP为形成氢键的距离(例如2.5~3.1埃),而且,三维晶格阵点P、氢H以及氢供与原子D构成的角∠DHP为形成氢键的角度(例如30°以上),则判定此三维晶格阵点为氢接受性。同样,如果某三维晶格阵点P和生物大分子中存在的某氢接受原子A间的距离P A为形成氢键的距离,而且,三维晶格阵点P、孤对电子L以及氢接受原子A形成的角∠ALP为形成氢键的角度,则判定此三维晶格阵点为氢供与性。还有,在某三维晶格阵点既没有氢接受性也没有氢供与性时,作为没有氢键性对待。
在这之后,从生物大分子中存在的氢键性官能团内S6确定的区域内存在的氢键性官能团中,选择出预计和分子结构形成氢键的氢键性官能团(S8)。在有许多氢键性官能团存在时,可以根据其重要程度进行选择。更进一步,基于S7中算出的三维晶格阵点的晶格阵点信息,设定对应S8中选择的各氢键性官能团的虚拟原子(S9)。
在此步骤中,根据S7中算出的三维晶格阵点,决定了与S8中选择的各氢键性官能团形成氢键的区域(氢键性区域)之后,往构成含适当数量(例如5~20个)三维晶格阵点的氢键性区域的三维晶格阵点的中心配置虚拟原子。虚拟原子配置在该氢键性区域内其他原子的范德华半径外。氢键性区域为由一群具有同样的氢键性而且相邻的三维晶格阵点构成的区域。要注意有时1个氢键性官能团设定2个以上虚拟原子的情况,与此相反,也有1个虚拟原子都不设定的情况。设定的虚拟原子数较多时只留下认为对配基结合域的洞穴的深度很重要的虚拟原子,应掺入10个以下,优选5~10个。还有,对于虚拟原子,设定与此中心配置了该虚拟原子的三维晶格阵点相同的氢键性。
接着,选择出一个化合物数据库收录的分子结构(S10),从S1中构建的ADAM方法的数据库读入选择的分子结构的三维坐标、氢键性分类序号,分子力学计算用的信息以及构象构建用的信息(S11)。在这之后,建立虚拟原子和分子结构中氢键性杂原子间的氢键结合对应关系(S12)。如果虚拟原子数为m个,分子结构中存在的氢键性杂原子数为n个,则形成i个氢键的对应组合的数量N(i)为mPiXnCi(式中P表示排列,C表示组合)个。优选全部选择虚拟原子和分子结构中氢键性杂原子的所有可能组合。
在这之后,对于满足1min≤i≤1max条件的所有i,反复进行S12~S29的步骤。其结果是在虚拟原子和分子结构中存在的氢键性杂原子之间全部选择了 Σ i = 1 min 1 max N ( i ) 个的组合。按这种操作,可以选择生物大分子和分子结构所形成的氢键的全部组合,从而能够系统地高效地研究生物大分子和分子结构的结合形式。1min优选采用虚拟原子和氢键性杂原子数量中较小的数,1max优选采用虚拟原子和氢键性杂原子数量中较大的数。
如对上述工序进行具体的说明,就是在S12中建立对应关系后,选择出虚拟原子和分子结构中氢键性杂原子的一个组合(S13)。此时,不选择虚拟原子的氢键性和分子结构中氢键性杂原子的氢键性不一致的组合。接着,对于S13选择的组合中所含的虚拟原子,算出各虚拟原子间的距离(S14)。但,如果虚拟原子数及分子结构中氢键性杂原子数均为1时,不进行S14~S21的步骤直接到S22的步骤,接着不进行S23~S25的步骤直接到S26的步骤。此外,如果虚拟原子数或分子结构中存在的氢键性杂原子数任一者为1个时,不进行S14~S21的步骤,直接到S22的步骤。
接着,分割分子结构中氢键性部分和非氢键性部分(S15),对于S15中分割的分子结构的氢键性部分的弯曲旋转,选择可能的键及其旋转形式(S16)。在这之后,使S16选择的键按照S1中构建的ADAM方法三维数据库输入的键旋转形式旋转,从而依次生成分子结构的构象(S17)。于是,每个生成的构象重复后面S18~S29的步骤。
这些步骤的详细情况如下所述。对于S17生成的构象,算出含S13选择的组合的分子结构中各氢键性杂原子的原子间距离(S18)。将S14所得虚拟原子的原子间距离和S18所得对应的分子结构中氢键性杂原子的原子间距离的差的平方和即F值在一定范围以上的氢键组合和构象去掉(S19)。即 F = Σ j n ( n - 1 ) 2 ( r li - r di ) 2 时,除去Ka≤F≤Ka’的氢键组合以外的那些(式中n表示氢键的数目,rdi表示第i个虚拟原子间距离,rli表示分子结构中氢键性杂原子的第i个原子间距离,Ka表示F的下限,Ka’表示F的上限)。作为上述Ka,优选0.6~0.8,作为Ka’,优选1.2~1.4。按照这些步骤,可以高效地收集生物大分子和分子结构的氢键结合形式以及配基分子的构象可能性。
在这之后,对于S19中保留的氢键组合和构象,最适化使上述F值最小的分子结构的氢键性部分的构象(S20)。按照此步骤,能使生物大分子和分子结构形成稳定的氢键,从而修正分子结构的构象。将分子结构的氢键性部分中存在的能够弯曲旋转的键的弯曲角作为变量,用Fletcher-Powell法(Fletcher,R.,Powell,M.J.D.,Computer.J.,6,1968,p.163)使上述函数F的值最小化,从而能够最适化分子结构的氢键性部分的构象。
接下来,算出S20步骤最适化的分子结构的氢键性部分的分子内能,并将该分子内能值在一定值以上的构象去除(S21)。例如,利用AMBER4.0的分子力学计算分子结构的氢键性部分的分子内能时,该分子内能在100千卡/摩尔的构象最好去除。在这之后,为了使具有到上述S21为止的步骤所得构象的分子结构的氢键性杂原子的坐标与对应的虚拟原子的坐标一致,将分子结构的原子坐标变换成生物大分子的坐标(S22)。这个步骤中可以用Kabsh的最小二乘法(Kabsh,W.,Acta Cryst.,A32,1976,p.922;Kabsh,W.,ActaCryst.,A34,1978,p.827)。按照此操作,可以同时粗略地推测可能的氢键结合形式和分子结构的氢键性部分的构象。
接上述步骤,算出生物大分子和分子结构的氢键性部分的分子间相互作用能(范德华相互作用能及静电相互作用能的和)以及分子结构的氢键结合部分的分子内能(S23)。生物大分子和分子结构的氢键性部分的分子间相互作用能Einter可以用距分子结构中各原子k最近的三维晶格阵点的晶格阵点信息范德华相互作用能Gvdw(k)以及静电相互作用能Gelc(k),从下式(式中qk表示原子k的电荷)算出。 E inter = Σ K { G vdw ( k ) + G elc ( k ) · q K }
此外,分子结构的氢键性部分的分子内能Eintra可以按照已知的方法算出。例如Eintra可以用AMBER4.0等公开的力学,以下式算出。[式中Vn表示对应构成弯曲角的4个原子的原子类型所给予的常数,n为表示对应弯曲角旋转的势能对称性的常数,Φ表示弯曲角,r表示对应弯曲角旋转的势能相位(对应构成弯曲角的4个原子的原子类型所给予的),Aij和Bij表示对应分子结构中第i个和第j个原子的原子类型对而设定的常数,Rij表示第i个和第j个原子间的距离,qj表示分子结构中第j个原子的电荷,qi表示分子结构中第个原子的电荷,ε表示介电常数] E intra = &Sigma; Dihedrals &Sigma; n V n / 2 { 1 + cos ( n&phi; - &gamma; ) } + &Sigma; i < j ( A ij / R ij 12 - B ij / R ij 6 ) + &Sigma; i < j ( q i q j / &epsiv; R ij )
将S23算出的分子间相互作用能和分子内能的和在一定值以上的分子结构的构象去除(S24)。例如优选去除上述能量和在每100分子量10千卡/摩尔以上的构象。在这之后,将具有S24保留的构象的分子结构氢键性部分的结构进行最适化。通过进行结构最适化计算将分子结构氢键性部分的弯曲角、分子结构的位置和方向最适化,从而可以最适化分子结构氢键性部分的结构。
例如使从下式
Etotal=Einter+Eintra+Whb·Nhb·Chb[式中Einter和Eintra意义和前述相同,Whb表示重量,Nhb表示氢键数目,Chb表示1个氢键的稳定化能(例如2.5千卡/摩尔)]算出的总能量Etotal最小化,可以用Powell法(Press,W.H.,Flannery,B.P.,Teukolsky,S.A.,Vitterling,W.T.,Numerical Recipesin C,Cambridge University Press,Cambridge,1989)等最适化分子结构氢键性部分的结构。
接着,使分子结构非氢键性部分的可以旋转的键按照S1构建的ADAM方法三维数据库输入的键旋转形式进行旋转,依次产生分子结构的构象(S26),对每个产生的构象重复后面S27~S29的步骤。具体地说,就是算出生物大分子和分子结构的分子间相互作用能以及分子结构的分子内能(S27),将S27算出的分子间相互作用能和分子内能的和在一定值以上的分子结构的构象去除(S28)。在这之后,将具有S28保留构象的全部分子结构的结构进行最适化(S29)。算出到S29步骤所得的生物大分子-分子结构复合物结构的能量,选择该能量最小的最稳定复合物结构(S30)。
分子间相互作用能和分子内能可以按和S23同样的方法算出(但是S23中是只对分子结构的氢键性部分进行计算,而S27中则必需对分子结构全体进行计算)。此外,作为上述能量的和的上限,优选每100分子量10千卡/摩尔。按此步骤可以得到生物大分子和分子结构的稳定复合物以及分子结构的活性构象。分子结构的最适化可以按S25步骤中相同方法进行(但是,S25中只对分子结构的氢键性部分的结构进行最适化,而S29中则必须对分子结构全体进行结构的最适化。)
S30所得的最稳定复合物结构中,根据生物大分子和分子结构的分子间相互作用能和分子结构的分子内能的值、氢键数目、以及环的数目等标准的全部或几个,对是否选择该分子结构作为配基候选分子结构作出判断(S31)。作为分子间相互作用能,比如有静电相互作用能、范德华相互作用能、氢键结合能以及它们的和。例如,优选静电相互作用能和范德华相互作用能的和在每100分子量2千卡/摩尔以下的分子结构作为配基候选分子结构。在这之后,判断是否选择了所有的分子结构(S32),如没有选择全部的分子结构时返回步骤S10,重复S10~S31的步骤,选择了全部的分子结构时,接着进行S33的步骤。
从S31选择的配基候选分子结构中,进行向更有希望的配基候选分子结构的掺入(S33)。在此掺入之前先输出配基候选分子结构的信息(例如生物大分子和分子结构的分子间相互作用能和分子结构的分子内能的值、氢键数目以及环的数目等),如果决定了掺入的标准则很方便。例如最好是以生物大分子和配基候选分子结构之间形成的氢键数目、生物大分子和配基候选分子结构的分子间相互作用能的值以及原子数等作为标准进行上述的掺入。
作为分子间相互作用能,有静电相互作用能、范德华相互作用能以及它们的和。例如,优选将静电相互作用能和范德华相互作用能的和在每100分子量8千卡/摩尔以下的分子结构作为有希望的配基候选分子结构进行掺入。氢键数目根据生物大分子的种类可以设定任意的数,例如2以上,但优选设定3以上。原子数可以设定任意数,例如20个以上,但优选设定20~40的范围。
生物大分子中构建了很多虚拟原子时,或者分子结构具有很大的构象自由度或很多的杂原子时,在S9步骤中输入涉及分子结构的信息后,对分子结构的部分结构进行S13至S15的步骤,并保存关于在此部分结构中产生不可能的氢键结合形式的虚拟原子和分子结构中氢键性杂原子的组合,以及不能和虚拟原子形成氢键的分子结构中的氢键性杂原子的信息。分子结构的部分结构可以不受任何结构上的制约任意决定,但优选含3个以上氢键性官能团的结构部分。还有,也可以忽略此结构部分构象自由度的有无。
接上述步骤对分子结构的全部进行S13~S33的步骤,但是将含上述步骤保存的氢键性杂原子的组合以及虚拟原子和氢键性杂原子的组合从步骤S12建立的对应关系的组合中除去。此结果能减小试验组合和构象的数目,从而大幅度缩短寻找生物大分子-分子结构稳定复合物结构所必要时间(上述方法有时称为Pre-Pruning法:PP法)。PP法基于,在分子结构的部分结构中不可能的氢键形式或配基构象在分子结构的全体结构中也是不可能,这样的假说。
采用这种PP法,对所得的生物大分子-分子结构复合物结构的精度和可信度完全没有影响,能够大幅度缩短研究时间。
[产业上的利用可能性]
根据本发明,能够用计算机高效地创制对药物和农药有用的生理活性物质。由于本发明方法利用的数据库收录有极大量没有偏向性的分子,有可能通过一次的筛选工序就能选出有极大生理活性的最适分子结构。

Claims (18)

1.应用计算机进行生理活性化合物的创制方法,它包含以下工序:
(1)构建收录有网罗了从基本分子骨架上存在的可修饰部位选择的1个或2个以上的取代部位和可以利用的取代基的全部组合的分子结构的化合物数据库;
(2)从该化合物数据库中筛选出满足发挥生理活性所必要条件的分子结构。
2.权利要求1记载的方法,其中作为基本分子骨架,应用了具有所期望生物活性的已知配基的分子骨架或其类似分子骨架。
3.权利要求1记载的方法,其中作为基本分子骨架,应用了以结构自动构建法生成的1个或2个以上的配基候选分子骨架或其类似分子骨架。
4.权利要求1记载的方法,其中作为基本分子骨架,应用了从含具有多种分子骨架的化合物组的化合物数据库中以程序“ADAM&EVE”选择出的1个或2个以上的配基候选分子骨架或其类似分子骨架。
5.权利要求1记载的方法,其中应用了组合构建的2个以上的基本分子骨架。
6.权利要求5记载的方法,其中通过组合的基本分子骨架的构建是通过对具有可修饰部位的1个或2个以上结构单位和1个或2个以上连接部件进行网罗式组合的工序的方法进行。
7.权利要求6记载的方法,其中通过组合进行的基本分子骨架的构建以包含以下工序的方法进行:
(E)从可利用的结构单位中选出1个或2个以上的结构单位;
(F)对于各结构单位根据需要添加使用条件;
(G)从可利用的连接部件中选出1个或2个以上的连接部件;
(H)设定应结合的结构单位数目的上限和下限,对于上述工序(E)和工序(G)所选的全部结构单位和连接部件,在上述工序(F)中付加了使用条件的情况下在其范围内,网罗所有可能的组合,构建出1个或2个以上的基本分子骨架。
8.权利要求1至7中任一项记载的方法,其中上述(2)的筛选工序是通过,包含利用目标生物大分子的配基结合域和分子结构的相互作用而筛选与生物大分子可能结合的分子结构的工序的方法进行。
9.权利要求8记载的方法,其中上述(2)的筛选工序是通过,包含考虑了以生物大分子的结合形式和化合物构象自由度,而对两者最稳定的复合物结构进行检索的工序的方法进行。
10.权利要求1至7中任一项记载的方法,其中上述(2)的筛选工序是通过,包含基于已确定或推测可与生物大分子结合的配基分子的结构和生物大分子的结合形式,筛选可与该生物大分子结合的分子结构的工序的方法进行。
11.权利要求1至7中任一项记载的方法,其中上述(2)的筛选工序是通过,从至少含有化合物原子类型和共有结合形式信息的数据库中用计算机选出可与生物大分子受体结合的候选化合物的方法,即包含根据可与生物大分子结合的1个或2个以上疑问分子的原子类型和共有结合形式的信息进行其与数据库中收录的化物的比较而选择配基候选化合物的工序的方法进行。
12.权利要求1至7中任一项记载的方法,上述(2)的筛选工序是通过根据已确定或推测具有所期望生理活性的化合物的分子结构或该化合物中的官能团的配置,判断与该化合物的类似性的方法进行。
13.应用计算机按数据库检索法进行生理活性化合物创制方法中所用的三维数据库是收入有网罗了从基本分子骨架上存在的可修饰部位中选择的1个或2个以上的取代部位和可利用的取代基之间所有的组合的分子结构的数据库。
14.权利要求13中记载的数据库,其中的基本分子骨架是用具有所期望生理活性的已知配基的分子骨架或其类似分子骨架来构建的。
15.权利要求13中记载的数据库,其中的基本分子骨是用以结构自动构建法构建的配基候选分子骨架或其类似分子骨架来构建的。
16.权利要求13记载的数据库,其中的基本分子骨架是用以程序“ADAM&EVE”从化合物数据库中选出的配基候选分子骨架或其类似分子骨架来构建的。
17.权利要求13记载的数据库,是用组合式构建的2个以上的基本分子骨架构建的。
18.用于存储权利要求13至17中任一项记载的数据库的存储介质。
CN96180097A 1995-12-28 1996-12-27 生理活性化合物的创制方法 Pending CN1209111A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP342488/95 1995-12-28
JP34248895 1995-12-28

Publications (1)

Publication Number Publication Date
CN1209111A true CN1209111A (zh) 1999-02-24

Family

ID=18354138

Family Applications (1)

Application Number Title Priority Date Filing Date
CN96180097A Pending CN1209111A (zh) 1995-12-28 1996-12-27 生理活性化合物的创制方法

Country Status (5)

Country Link
EP (1) EP1010681A4 (zh)
CN (1) CN1209111A (zh)
AU (1) AU1152897A (zh)
EA (1) EA199800610A1 (zh)
WO (1) WO1997024301A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4848394A (en) * 1986-05-13 1989-07-18 N B Marketing Company (Proprietary) Limited Gas cartridge
EP0790567A1 (en) 1994-10-31 1997-08-20 ITAI, Akiko Method of retrieving novel ligand compounds from three-dimensional structure database
CA2294771A1 (en) 1997-07-03 1999-01-14 Akiko Itai Method for inferring protein functions with the use of ligand data base
CA2431655A1 (en) * 2000-11-15 2002-05-23 Akiko Itai Method of profiling protein
WO2002044112A1 (fr) * 2000-11-30 2002-06-06 Toyo Suisan Kaisha, Ltd Procede de conception de la structure moleculaire d'un inhibiteur d'enzyme
EP1364960A4 (en) * 2001-02-02 2005-05-18 Chugai Pharmaceutical Co Ltd PEPTIDE DERIVATIVES
JP4327583B2 (ja) * 2003-12-25 2009-09-09 富士通株式会社 生理活性物質候補構造創出プログラム、生理活性物質候補構造創出方法および生理活性物質候補構造創出装置
WO2005103994A1 (ja) * 2004-04-23 2005-11-03 Kissei Pharmaceutical Co., Ltd. リガンド分子の形状作成方法および装置
JP2006028038A (ja) 2004-07-13 2006-02-02 Ishikawajima Harima Heavy Ind Co Ltd 高分子化合物の結合評価方法
WO2020203551A1 (ja) * 2019-03-29 2020-10-08 富士フイルム株式会社 特徴量算出方法、特徴量算出プログラム、及び特徴量算出装置、スクリーニング方法、スクリーニングプログラム、及びスクリーニング装置、化合物創出方法、化合物創出プログラム、及び化合物創出装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5642292A (en) * 1992-03-27 1997-06-24 Akiko Itai Methods for searching stable docking models of biopolymer-ligand molecule complex

Also Published As

Publication number Publication date
EP1010681A1 (en) 2000-06-21
EA199800610A1 (ru) 1999-02-25
EP1010681A4 (en) 2002-06-12
AU1152897A (en) 1997-07-28
WO1997024301A1 (fr) 1997-07-10

Similar Documents

Publication Publication Date Title
CN1150478C (zh) 从三维结构数据库检索新的配位化合物的方法
Hooft et al. The PDBFINDER database: a summary of PDB, DSSP and HSSP information with added value
Jones et al. A genetic algorithm for flexible molecular overlay and pharmacophore elucidation
CN1209111A (zh) 生理活性化合物的创制方法
Zhong et al. Root-aligned SMILES: a tight representation for chemical reaction prediction
Terwilliger et al. Ligand identification using electron-density map correlations
Raymond et al. Comparison of chemical clustering methods using graph-and fingerprint-based similarity measures
CN1527225A (zh) 信息关联性显示方法、程序、存储介质和装置
Sheridan et al. Designing targeted libraries with genetic algorithms
Ivanov et al. 3DGEN: A system for exhaustive 3D molecular design proceeding from molecular topology
EP2007934A2 (en) Forward synthetic synthon generation and its use to identify molecules similar in 3 dimensional shape to pharmaceutical lead compounds
Brusic et al. Molecular immunology databases and data repositories
Kozlowski et al. Computer-aided design of chiral ligands: Part I. Database search methods to identify chiral ligand types for asymmetric reactions
Weissig et al. Protein structure resources
Shankland et al. Conformational analysis of Ibuprofen by crystallographic database searching and potential energy calculation
Smalter Hall et al. An overview of computational life science databases & exchange formats of relevance to chemical biology research
US6549900B2 (en) Method for creating physiologically active compounds
CN117174164B (zh) 基于预测蛋白质-小分子结合姿势筛选先导化合物的方法
Graf et al. The third BASIC fragment search dictionary
Pinheiro Jr et al. WS22 database: combining Wigner Sampling and geometry interpolation towards configurationally diverse molecular datasets
US20030087334A1 (en) Method of flexibly generating diverse reaction chemistries
Kuzmov et al. Determination of Current Knowledge
Sommer Structure-based synthesis planning: An integrative approach into an interactive, user-focused design cycle
Li et al. The biological crystallization resource: facilitating knowledge-based protein crystallizations
Kato et al. Development of a Three-Dimensional Substructure Search Program for Organic Molecules.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C01 Deemed withdrawal of patent application (patent law 1993)
WD01 Invention patent application deemed withdrawn after publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1062273

Country of ref document: HK