CN110459263A - 一种基于bfgs算法的计算机药物筛选方法 - Google Patents

一种基于bfgs算法的计算机药物筛选方法 Download PDF

Info

Publication number
CN110459263A
CN110459263A CN201910569102.8A CN201910569102A CN110459263A CN 110459263 A CN110459263 A CN 110459263A CN 201910569102 A CN201910569102 A CN 201910569102A CN 110459263 A CN110459263 A CN 110459263A
Authority
CN
China
Prior art keywords
small molecule
conformation
receptor
drug screening
bfgs algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910569102.8A
Other languages
English (en)
Inventor
魏志强
刘素娥
刘昊
徐锡明
杨金波
汪雪婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ocean University of China
Qingdao National Laboratory for Marine Science and Technology Development Center
Original Assignee
Ocean University of China
Qingdao National Laboratory for Marine Science and Technology Development Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ocean University of China, Qingdao National Laboratory for Marine Science and Technology Development Center filed Critical Ocean University of China
Priority to CN201910569102.8A priority Critical patent/CN110459263A/zh
Publication of CN110459263A publication Critical patent/CN110459263A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)

Abstract

本发明公开了一种基于BFGS算法的计算机药物筛选方法。本发明包括以下步骤:1)建立数据库,由30000‑40000个海洋小分子的数据集群,循环遍历匹配,形成相似度为0‑1的小分子库;2)数据库预处理,删除步骤1)中所得的小分子库中相似度为1的小分子构象;3)分子对接,将配体置于受体的活性位置点处,使多个配体与一个受体进行分子对接;4)构象搜索,使用BFGS算法进行构象搜索,当新生成的构象与初始构象相同或者两者预设差值不超过0.0001时,停止构象的搜索。本发明通过优化算法使其缩短寻找配体与受体结合在受体活性位点处的低能构象的时间,增加了小分子数据库的基于该方法的虚拟筛选的效果和效率。

Description

一种基于BFGS算法的计算机药物筛选方法
技术领域
本发明属于计算机辅助药物设计的技术领域,特别是指一种基于BFGS算法的计算机药物筛选方法。
背景技术
药物筛选指的是采用适当的方法,对可能作为药物使用的物质(采样)进行生物活性、药理作用及药用价值的评估过程。药物筛选是生化水平和细胞水平的筛选。随着计算机技术的更新以及大数据技术的发展,应用虚拟筛选策略进行药物筛选逐渐成为主流。虚拟筛选,即在进行生物活性筛选之前,利用计算机上的分子对接软件模拟目标靶点与候选药物之间的相互作用,计算两者之间的亲和力大小,以降低实际筛选化合物数目,同时提高先导化合物发现效率。分子对接是一种计算方法,试图预测配体与蛋白质结合的最可能的位置,方向和构象,以不同方式预测配体与蛋白质的结合自由能,就是找到配体与受体在其活性区域相结合时能量最低的构象从而达到从几十到上百万个分子中,发现具有药性的先导化合物的目的。
计算机药物筛选一般是针对选定的靶标,使用高性能并行计算机,从庞大的小分子库中筛选出具有药理活性的化合物。然而,进行虚拟筛选不仅要搜索化合物小分子库,而且要对库中的小分子进行分子筛选,再加上庞大的数据库搜索,需要耗费巨大的计算机时间。而现有技术中比较好的分子对接软件一般需要3-5min完成一个分子的对接,普通计算环境难以在可以接受的时间内得到满意的结果,从而导致传统的药物筛选遇到瓶颈;另外,现有技术中的计算机药物筛选方法还存在受体和配体间的结合方式不合理,使得计算资源无法得到最大化利用,造成计算资源浪费,从而影响计算机虚拟筛选的效果和效率。
发明内容
本发明提供一种基于BFGS算法的计算机药物筛选方法,解决了现有技术中的计算机虚拟筛选方法分子对接时间长以及受体和配体间的结合方式不合理而导致其筛选效率低和筛选效果差的问题。
本发明的一种基于BFGS算法的计算机药物筛选方法,其主要是通过以下技术方案加以实现的:包括以下步骤:1)建立数据库,所述数据库是由30000-40000个海洋小分子建立的数据集群,将数据集群中的海洋小分子进行循环遍历匹配,形成相似度为0-1的小分子库;2)数据库预处理,删除步骤1)中所得的小分子库中相似度为1的小分子构象,得更新小分子库;3)分子对接,从蛋白质数据库中取一个受体,从步骤2)所得更新小分子库中的取多个配体,将配体置于受体的活性位置点处,使多个配体与一个受体进行分子对接;4)构象搜索,使用BFGS算法进行构象搜索,将新生成的构象与初始构象进行匹配,当新生成的构象与初始构象相同或者两者预设差值不超过0.0001时,停止构象的搜索,得能量最低的构象,从而确定待筛选的药物。
本发明采用30000-40000个海洋小分子所建立的数据集群作为数据源,结合计算机辅助药物设计与生物信息学方法相结合进行数据处理。本发明从已有的搜索算法出发,利用计算机强大的计算能力,从已经建立的大规模化合物的三维结构数据库中搜寻与靶标生物大分子活性部位或结合部位相匹配的化合物,通过优化算法使其缩短寻找配体与受体结合在受体活性位点处的低能构象的时间,增加了小分子数据库的基于该方法的虚拟筛选的效果和效率。
作为一种优选的实施方案,所述步骤1)中,相似度的计算方法是分子指纹计算方法。本发明中小分子相似度得到的标准是根据分子指纹的计算,有利于在数据库中进行聚类分析及开展分子多样性的研究,该小分子库中有784,000,000个小分子。
作为一种优选的实施方案,所述步骤1)中,循环遍历匹配是通过两两匹配而完成的。本发明的多个配体的选择是依据30000-40000个海洋小分子建立的数据集群两两匹配形成784,000,000小分子中相似度范围为0-1。
作为一种优选的实施方案,所述步骤1)中,小分子库的相似度为0.85-1。经大量实验表明在这个范围内的小分子更具有相似性。
作为一种优选的实施方案,所述步骤3)中,分子对接的方法是通过bsub任务提交方式提交计算机系统平台进行分子对接。通常情况下,本发明使用计算机系统平台的“神威·太湖之光”建立与30000-40000个海洋小分子数据集群的访问机制,并通过bsub任务提交方式提交计算机系统的国家超算平台进行分子对接。
作为一种优选的实施方案,所述步骤4)中,新生成的构象与初始构象进行匹配时,根据配体的原子类型,对每个配体的原子类型进行氢键个数的判断。本发明在进行构象搜索时,受体的构象为了配合与小分子的结合也会发生相应的改变,为了提高匹配的准确性,本发明将互补匹配原则中的氢键相互作用进行优化改善,根据配体的原子类型,将会给每个配体的原子类型进行氢键个数的判断。
作为一种优选的实施方案,所述步骤1)中,海洋小分子是指相对分子量小于500的海洋小分子。本发明选取的海洋小分子的相对分子量均小于500,这种海洋小分子的分子量小,具有口服成药的潜能。
与现有技术相比,本发明的有益效果是:本发明采用30000-40000个海洋小分子所建立的数据集群作为数据源,结合计算机辅助药物设计与生物信息学方法相结合进行数据处理。本发明从已有的搜索算法出发,利用计算机强大的计算能力,从已经建立的大规模化合物的三维结构数据库中搜寻与靶标生物大分子活性部位或结合部位相匹配的化合物,通过构象搜索的优化算法使其缩短寻找配体与受体结合在受体活性位点处的低能构象的时间,增加了小分子数据库的基于该方法的虚拟筛选的效果和效率。本发明是一种基于国产众核环境的BFGS算法的药物筛选策略,利用国产化的计算机操作平台实现了药物的快速筛选,降低了药物筛选成本,实现了药物筛选的国产化。
具体实施方式
下面将结合本发明的具体实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的一种基于BFGS算法的计算机药物筛选方法,包括以下步骤:
1)建立数据库,所述数据库是由30000-40000个海洋小分子建立的数据集群,将数据集群中的海洋小分子进行循环遍历匹配,形成相似度为0-1的小分子库;
2)数据库预处理,删除步骤1)中所得的小分子库中相似度为1的小分子构象,得更新小分子库;
3)分子对接,从蛋白质数据库中取一个受体,从步骤2)所得更新小分子库中的取多个配体,将配体置于受体的活性位置点处,使多个配体与一个受体进行分子对接;
4)构象搜索,使用BFGS算法进行构象搜索,将新生成的构象与初始构象进行匹配,当新生成的构象与初始构象相同或者两者预设差值不超过0.0001时,停止构象的搜索,得能量最低的构象,从而确定待筛选的药物。
优选地,所述步骤1)中,相似度的计算方法是分子指纹计算方法。
进一步地,所述步骤1)中,循环遍历匹配是通过两两匹配而完成的。
具体地,所述步骤1)中,小分子库的相似度为0.85-1。
再优选地,所述步骤3)中,分子对接的方法是通过bsub任务提交方式提交计算机系统平台进行分子对接。
再进一步地,所述步骤4)中,新生成的构象与初始构象进行匹配时,根据配体的原子类型,对每个配体的原子类型进行氢键个数的判断。
再具体地,所述步骤1)中,海洋小分子是指相对分子量小于500的海洋小分子。
实施例一
本发明的一种基于BFGS算法的计算机药物筛选方法,包括以下步骤:
1)建立数据库,所述数据库是由30000个海洋小分子建立的数据集群,将数据集群中的海洋小分子进行循环遍历匹配,形成相似度为0-1的小分子库;
2)数据库预处理,删除步骤1)中所得的小分子库中相似度为1的小分子构象,得更新小分子库;
3)分子对接,从蛋白质数据库中取一个受体,从步骤2)所得更新小分子库中的取多个配体,将配体置于受体的活性位置点处,使多个配体与一个受体进行分子对接;
4)构象搜索,使用BFGS算法进行构象搜索,将新生成的构象与初始构象进行匹配,当新生成的构象与初始构象相同或者两者预设差值不超过0.0001时,停止构象的搜索,得能量最低的构象,从而确定待筛选的药物。
本实施例中,使用“神威·太湖之光”从核架构,分子对接时间为16s,药物的筛选时间是16s。
实施例二
本发明的一种基于BFGS算法的计算机药物筛选方法,包括以下步骤:
1)建立数据库,所述数据库是由40000个海洋小分子建立的数据集群,将数据集群中的海洋小分子通过两两匹配方法进行循环遍历匹配,形成相似度为0-1的小分子库,相似度的计算方法为分子指纹计算方法;
2)数据库预处理,删除步骤1)中所得的小分子库中相似度为1的小分子构象,得更新小分子库;
3)分子对接,从蛋白质数据库中取一个受体,从步骤2)所得更新小分子库中的取多个配体,将配体置于受体的活性位置点处,使多个配体与一个受体进行分子对接,分子对接的方法是通过bsub任务提交方式提交计算机系统的国家超算平台进行分子对接;
4)构象搜索,使用BFGS算法进行构象搜索,将新生成的构象与初始构象进行匹配,当新生成的构象与初始构象相同或者两者预设差值不超过0.0001时,停止构象的搜索,得能量最低的构象,从而确定待筛选的药物。
本实施例中,分子对接时间为11s,药物的筛选时间是11s。
实施例三
本发明的一种基于BFGS算法的计算机药物筛选方法,包括以下步骤:
1)建立数据库,所述数据库是由35000个相对分子量小于500的海洋小分子建立的数据集群,将数据集群中的海洋小分子通过两两匹配方法进行循环遍历匹配,形成相似度为0.85-1的小分子库,相似度的计算方法为分子指纹计算方法;
2)数据库预处理,删除步骤1)中所得的小分子库中相似度为1的小分子构象,得更新小分子库;
3)分子对接,从蛋白质数据库中取一个受体,从步骤2)所得更新小分子库中的取多个配体,将配体置于受体的活性位置点处,使多个配体与一个受体进行分子对接,分子对接的方法是通过bsub任务提交方式提交“神威·太湖之光”计算机系统平台进行分子对接;
4)构象搜索,使用BFGS算法进行构象搜索,将新生成的构象与初始构象进行匹配,新生成的构象与初始构象进行匹配时,根据配体的原子类型,对每个配体的原子类型进行氢键个数的判断,当新生成的构象与初始构象相同或者两者预设差值不超过0.0001时,停止构象的搜索,得能量最低的构象,从而确定待筛选的药物。
本实施例中,分子对接时间为21s,药物的筛选时间是21s。
与现有技术相比,本发明的有益效果是:本发明采用30000-40000个海洋小分子所建立的数据集群作为数据源,结合计算机辅助药物设计与生物信息学方法相结合进行数据处理。本发明从已有的搜索算法出发,利用计算机强大的计算能力,从已经建立的大规模化合物的三维结构数据库中搜寻与靶标生物大分子活性部位或结合部位相匹配的化合物,通过优化算法使其缩短寻找配体与受体结合在受体活性位点处的低能构象的时间,增加了小分子数据库的基于该方法的虚拟筛选的效果和效率。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种基于BFGS算法的计算机药物筛选方法,其特征在于:包括以下步骤:
1)建立数据库,所述数据库是由30000-40000海洋小分子建立的数据集群,将数据集群中的海洋小分子进行循环遍历匹配,形成相似度为0-1的小分子库;
2)数据库预处理,删除步骤1)中所得的小分子库中相似度为1的小分子构象,得更新小分子库;
3)分子对接,从蛋白质数据库中取一个受体,从步骤2)所得更新小分子库中的取多个配体,将配体置于受体的活性位置点处,使多个配体与一个受体进行分子对接;
4)构象搜索,使用BFGS算法进行构象搜索,将新生成的构象与初始构象进行匹配,当新生成的构象与初始构象相同或者两者预设差值不超过0.0001时,停止构象的搜索,得能量最低的构象,从而确定待筛选的药物。
2.根据权利要求1所述的基于BFGS算法的计算机药物筛选方法,其特征在于:
所述步骤1)中,相似度的计算方法是分子指纹计算方法。
3.根据权利要求2所述的基于BFGS算法的计算机药物筛选方法,其特征在于:
所述步骤1)中,循环遍历匹配是通过两两匹配而完成的。
4.根据权利要求1所述的基于BFGS算法的计算机药物筛选方法,其特征在于:
所述步骤1)中,小分子库的相似度为0.85-1。
5.根据权利要求1-4中任意一项所述的基于BFGS算法的计算机药物筛选方法,其特征在于:
所述步骤3)中,分子对接的方法是通过bsub任务提交方式提交计算机系统平台进行分子对接。
6.根据权利要求1-4中任意一项所述的基于BFGS算法的计算机药物筛选方法,其特征在于:
所述步骤4)中,新生成的构象与初始构象进行匹配时,根据配体的原子类型,对每个配体的原子类型进行氢键个数的判断。
7.根据权利要求1所述的基于BFGS算法的计算机药物筛选方法,其特征在于:
所述步骤1)中,海洋小分子是指相对分子量小于500的海洋小分子。
CN201910569102.8A 2019-06-27 2019-06-27 一种基于bfgs算法的计算机药物筛选方法 Pending CN110459263A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910569102.8A CN110459263A (zh) 2019-06-27 2019-06-27 一种基于bfgs算法的计算机药物筛选方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910569102.8A CN110459263A (zh) 2019-06-27 2019-06-27 一种基于bfgs算法的计算机药物筛选方法

Publications (1)

Publication Number Publication Date
CN110459263A true CN110459263A (zh) 2019-11-15

Family

ID=68481761

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910569102.8A Pending CN110459263A (zh) 2019-06-27 2019-06-27 一种基于bfgs算法的计算机药物筛选方法

Country Status (1)

Country Link
CN (1) CN110459263A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111243660A (zh) * 2020-01-06 2020-06-05 中国海洋大学 一种基于异构众核架构的并行海洋药物筛选方法
CN111402964A (zh) * 2020-03-19 2020-07-10 西南医科大学 一种基于混合烟花算法的分子构象搜索方法
CN111863120A (zh) * 2020-06-28 2020-10-30 深圳晶泰科技有限公司 晶体复合物的药物虚拟筛选系统及方法
WO2021103516A1 (zh) * 2020-06-28 2021-06-03 深圳晶泰科技有限公司 晶体复合物的药物虚拟筛选系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030167136A1 (en) * 2002-03-04 2003-09-04 Hurst John R. Methods for identifying a molecule that may bind to a target molecule
CN103294933A (zh) * 2013-05-10 2013-09-11 司宏宗 一种药物筛选方法
CN109255427A (zh) * 2018-08-30 2019-01-22 无锡城市职业技术学院 一种基于量子粒子群优化算法的分子对接计算方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030167136A1 (en) * 2002-03-04 2003-09-04 Hurst John R. Methods for identifying a molecule that may bind to a target molecule
CN103294933A (zh) * 2013-05-10 2013-09-11 司宏宗 一种药物筛选方法
CN109255427A (zh) * 2018-08-30 2019-01-22 无锡城市职业技术学院 一种基于量子粒子群优化算法的分子对接计算方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
唐启升 等: "《中国海洋工程与科技发展战略研究 海洋生物资源卷》", 电子科技大学出版社, pages: 166 - 169 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111243660A (zh) * 2020-01-06 2020-06-05 中国海洋大学 一种基于异构众核架构的并行海洋药物筛选方法
CN111243660B (zh) * 2020-01-06 2021-03-12 中国海洋大学 一种基于异构众核架构的并行海洋药物筛选方法
CN111402964A (zh) * 2020-03-19 2020-07-10 西南医科大学 一种基于混合烟花算法的分子构象搜索方法
CN111402964B (zh) * 2020-03-19 2023-07-25 西南医科大学 一种基于混合烟花算法的分子构象搜索方法
CN111863120A (zh) * 2020-06-28 2020-10-30 深圳晶泰科技有限公司 晶体复合物的药物虚拟筛选系统及方法
WO2021103516A1 (zh) * 2020-06-28 2021-06-03 深圳晶泰科技有限公司 晶体复合物的药物虚拟筛选系统及方法

Similar Documents

Publication Publication Date Title
CN110459263A (zh) 一种基于bfgs算法的计算机药物筛选方法
CN107038348A (zh) 基于蛋白‑配体相互作用指纹图谱的药物靶标预测方法
CN112185458B (zh) 基于卷积神经网络预测蛋白和配体分子结合自由能的方法
CN111243660B (zh) 一种基于异构众核架构的并行海洋药物筛选方法
CN108615555A (zh) 基于标记基因和混合核函数svm的结直肠癌预测方法和装置
WO2024011837A1 (zh) 药物筛选方法及系统
Danel et al. Docking-based generative approaches in the search for new drug candidates
CN110931079A (zh) 基于虚拟筛选的Bevantolol作为AIBP抑制剂方面的应用
CN103077226B (zh) 一种多模态蛋白质构象空间搜索方法
WO2022082739A1 (zh) 基于卷积神经网络预测蛋白和配体分子结合自由能的方法
Shao et al. DTIGCCN: Prediction of drug-target interactions based on GCN and CNN
Galizia et al. An MPI–CUDA library for image processing on HPC architectures
CN108647487A (zh) G蛋白偶联受体-配体相互作用关系的预测方法及预测系统
Yuan et al. Protein-ligand binding affinity prediction model based on graph attention network
Yang et al. A lightweight rice disease identification network based on attention mechanism and dynamic convolution
Breitwieser et al. High-performance and scalable agent-based simulation with BioDynaMo
CN104572256A (zh) 一种地震处理多核异构并行模式自适应匹配通用计算模型
Kozloski et al. Identifying, tabulating, and analyzing contacts between branched neuron morphologies
CN110534153B (zh) 基于深度学习的靶标预测系统及其方法
CN110910949A (zh) 基于虚拟筛选的Imatinib在作为AIBP抑制剂方面的应用
Li et al. Multi-dimensional search for drug–target interaction prediction by preserving the consistency of attention distribution
CN112259175B (zh) 一种irak1激酶抑制剂的虚拟筛选方法
Hu et al. Interpretable prediction of protein-ligand interaction by convolutional neural network
CN114373509B (zh) 一种基于GPU加速AutoDock Vina的方法
CN102385668A (zh) 一种基于蛋白质分子场预测相互作用位点的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191115

RJ01 Rejection of invention patent application after publication