CN109885390A - 分子对接云计算流程控制方法 - Google Patents
分子对接云计算流程控制方法 Download PDFInfo
- Publication number
- CN109885390A CN109885390A CN201910129789.3A CN201910129789A CN109885390A CN 109885390 A CN109885390 A CN 109885390A CN 201910129789 A CN201910129789 A CN 201910129789A CN 109885390 A CN109885390 A CN 109885390A
- Authority
- CN
- China
- Prior art keywords
- task
- molecular docking
- cloud computing
- called
- library function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
本发明属于高通量的分子对接及虚拟筛选计算领域,具体涉及一种分子对接云计算流程控制方法,(1)将原始的数据库导入到MongoDB数据库中,然后调用yoda库函数处理得到分子对接的输入结构文件;(2)调用yoda库函数自动生成对应的分子对接输入参数文件;(3)调用mixc库函数,将任务提交到Majorana任务调度平台;将任务提交到指定的云计算平台上;(4)给每个结构对应的任务添加了一个监控任务,当任务都执行完成,调用数据分析程序,自动分析分子对接结果;(5)从MongoDB数据库获取相应的分析结果作出相应的曲线。本发明实现了大批量、高并行的分子对接及虚拟筛选等计算任务的跨平台调度、连续计算、存储、监控、结果分析和图形化等。
Description
技术领域
本发明属于高通量的分子对接及虚拟筛选计算领域,具体涉及一种分子对接云计算流程控制方法。
背景技术
分子对接(Molecular Docking)计算已广泛地应用于新药研发及设计领域,Autodock Vina作为一个开源、高效的对接计算软件,已成为模拟计算的首选。当前,几乎所有的超算中心和云平台都安装了Autodock Vina软件,并有相应的作业管理系统来完成任务的提交、修改和删除等功能。
当前的分子对接云计算流程主要存在以下缺陷:
不能跨平台调度:当前几乎所有的分子对接云计算平台,都需要先手动登录、编写任务脚本,再提交到各自的平台上计算。
存储形式单一:所有的分子对接计算和分析结果都储存在平台上,不利于实时查看和监控模拟状态。
缺乏用户界面:当前所有的分子对接云计算和分析流程都是基于脚本的形式,用户体验差,不利于任务状态监控、结果的图形化显示等。
发明内容
针对上述技术问题,本发明提供分子对接云计算流程控制方法,用于高通量虚拟筛选寻找新型靶向药物分子。分子对接计算所必须的3类文件包括:小分子配体三维结构文件、大分子受体三维结构文件和分子对接参数。其中,大分子结构中主要来源于蛋白质晶体结构数据库,小分子结构主要来源于商用及非商用数据库,对接模拟参数则是参考已有的文献报道、以及相关的测试和优化结果,因此本发明无缝衔接了虚拟筛选的整个流程。
并且为了解决平台登录、任务脚本编写、分析脚本编写、任务监控、分析数据绘图等跨平台和软件的繁琐步骤,本发明将所有的用户流程都集成到Jupyter中,从而大大提高了计算和分析的效率。
具体技术方案为:
分子对接云计算流程控制方法,包括以下步骤:
(1)将原始的商业及非商业小分子数据库,蛋白质晶体结构数据库导入到MongoDB数据库中。从MongoDB数据库,获取相应的小分子及大分子结构文件,然后调用yoda库函数进行相应的处理,包括小分子和大分子的结构优化及处理,得到分子对接的输入结构文件,用户也可以手动准备和导入;
(2)根据不同阶段对应的对接精度要求,调用相关yoda库函数自动生成对应的分子对接输入参数文件。这些参数可以被用户提供的json格式的输入参数所替换,从而实现了参数的可控调节;
(3)调用mixc库函数,将任务提交到Majorana任务调度平台。Majorana会根据任务参数,将任务提交到指定的云计算平台上,比如亚马逊云,腾讯云等。Majorana会实时获取任务的执行状态并记录下来,用户可以通过调用obiwan库函数来查看任务的执行状态。也可以根据实际需要,通过obiwan库函数来修改指定任务的参数和状态,从而自动触发Majorana发送对应的指令到云平台上,达到远程管理任务的目的。
(4)为了实现任务的自动化连续计算,给每个结构对应的任务添加了一个监控任务(joiner),它会实时获取这些任务的执行状态。当任务都执行完成了,就会调用数据分析程序(基于numpy, pandas和scipy库),自动分析分子对接结果,如小分子对接构象,能量打分,结果排序等,并将任务执行信息、参数、结构、能量和分析结果保存到MongoDB数据库中。同时,将数据量大的结构文件等上传到云存储服务器S3上,用于实时监控各个参数的变化和相关性分析等。最后,根据需要自动提交下一步的计算任务。
(5)等所有的任务都执行完成后,从MongoDB数据库获取相应的分析结果,调用matplotlib绘图库,直接在Jupyter中作出相应的曲线,以直观的查看计算结果。
本发明提供的分子对接云计算流程控制方法,适用于高通量的分子对接及虚拟筛选等科学计算领域,实现了大批量、高并行的分子对接及虚拟筛选等计算任务的跨平台调度、连续计算、存储、监控、结果分析和图形化等。具有以下技术优势:
(1)实现了高通量、高并行分子对接计算任务的跨平台调度;
(2)实现了分子对接计算的模块化操作;
(3)实现了分子对接计算任务的连续计算和结果的自动化分析;
(4)实现了分子对接所需结构文件和模拟参数文件的自动化创建,自动化分析和整合;
(5)无缝衔接了新药筛选流程的分子处理,结合强度评价,及苗头化合物的推荐;
(6)将所有分子对接及虚拟筛选任务的创建、提交和管理,结果分析和绘图等步骤集成到Jupyter中,实现了分子对接云计算流程的可视化操作。
附图说明
图1是本发明方法流程示意图;
图2为实施例的流程图。
具体实施方式
结合实施例说明本发明的具体技术方案。
采用如图1所示的方法流程,进行药物设计,示例流程如图2所示。
(1)通过Jupyter调用验证模块进行初步计算,本模块主要预先利用系统的默认参数进行一轮小规模的分子对接计算,根据对接的结果,选取合适的大分子受体,并获取第一轮的计算参数;
(2)从MongoDB数据库获取正式计算所需要的小分子及大分子结构文件;
(3)通过Jupyter调用过滤模块过滤掉掉不符合要求的小分子;筛选标准主要包括分子的理化性质,药代性质,可合成性等标准;
(4)通过Jupyter调用分子处理模块处理小分子及大分子。小分子处理包括小分子的加氢,加电荷,质子化计算,和能量优化等。大分子的处理包括加氢,加电荷,和修补缺失的氨基酸残基等;
(5)通过Jupyter调用方法模块进行对接计算。需要读入步骤(1)产生的计算参数,以及之前相关步骤处理好的大分子及小分子;
(6)通过Jupyter调用分析模块进行可视化,分析及整合。主要根据对接结果生成相关性图表,大分子与小分子结合模式图等。
(7)通过Jupyter再次调用过滤模块过滤掉不符合要求的分子,此处主要根据分子官能团,能量打分等进行过滤。
(8)根据步骤(6)的结果决定是否需要修改初始参数,再次循环流程步骤(5)-步骤(6),直到寻找到理想的候选分子列表。
Claims (3)
1.分子对接云计算流程控制方法,其特征在于,包括以下步骤:
(1)将原始的商业及非商业小分子数据库、蛋白质晶体结构数据库导入到MongoDB数据库中;从MongoDB数据库,获取相应的小分子及大分子结构文件,然后调用yoda库函数进行相应的处理,得到分子对接的输入结构文件;
(2)根据不同阶段对应的对接精度要求,调用相关yoda库函数自动生成对应的分子对接输入参数文件;这些参数被用户提供的json格式的输入参数所替换,从而实现了参数的可控调节;
(3)调用mixc库函数,将任务提交到Majorana任务调度平台;Majorana根据任务参数,将任务提交到指定的云计算平台上;Majorana实时获取任务的执行状态并记录下来,用户通过调用obiwan库函数来查看任务的执行状态;也可以根据实际需要,通过obiwan库函数来修改指定任务的参数和状态,从而自动触发Majorana发送对应的指令到云平台上,达到远程管理任务的目的;
(4)给每个结构对应的任务添加了一个监控任务,实时获取这些任务的执行状态;当任务都执行完成了,调用数据分析程序,自动分析分子对接结果,并将任务执行信息、参数、结构、能量和分析结果保存到MongoDB数据库中;同时,将数据量大的结构文件上传到云存储服务器S3上;最后,根据需要自动提交下一步的计算任务;
(5)所有的任务都执行完成后,从MongoDB数据库获取相应的分析结果,调用matplotlib绘图库,直接在Jupyter中作出相应的曲线,以直观的查看计算结果。
2.根据权利要求1所述的分子对接云计算流程控制方法,其特征在于,步骤(1)中所述的调用yoda库函数进行相应的处理,包括小分子和大分子的结构优化及处理。
3.根据权利要求1所述的分子对接云计算流程控制方法,其特征在于,步骤(4)所述的调用数据分析程序,基于numpy、 pandas和scipy库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910129789.3A CN109885390B (zh) | 2019-02-21 | 2019-02-21 | 分子对接云计算流程控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910129789.3A CN109885390B (zh) | 2019-02-21 | 2019-02-21 | 分子对接云计算流程控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109885390A true CN109885390A (zh) | 2019-06-14 |
CN109885390B CN109885390B (zh) | 2023-06-23 |
Family
ID=66928725
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910129789.3A Active CN109885390B (zh) | 2019-02-21 | 2019-02-21 | 分子对接云计算流程控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109885390B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112201301A (zh) * | 2020-10-23 | 2021-01-08 | 深圳晶泰科技有限公司 | 基于虚拟现实的药物设计云计算流程控制系统及其方法 |
WO2022082598A1 (zh) * | 2020-10-22 | 2022-04-28 | 深圳晶泰科技有限公司 | 一种准确计算气体分子绝对自由能的方法 |
WO2022082740A1 (zh) * | 2020-10-23 | 2022-04-28 | 深圳晶泰科技有限公司 | 基于虚拟现实的药物设计云计算流程控制系统及其方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030033345A1 (en) * | 2002-06-27 | 2003-02-13 | Keefer Christopher E. | Thread-based methods and systems for using the idle processing power of one or more networked computers to solve complex scientific problems |
US20070094661A1 (en) * | 2005-10-22 | 2007-04-26 | Cisco Technology, Inc. | Techniques for task management using presence |
CN106909785A (zh) * | 2017-02-25 | 2017-06-30 | 辽宁大学 | 一种以24‑脱氢胆固醇还原酶(dhcr24)为靶点进行降胆固醇药物的虚拟筛选方法 |
CN108664729A (zh) * | 2018-05-10 | 2018-10-16 | 深圳晶泰科技有限公司 | 一种gromacs云计算流程控制方法 |
-
2019
- 2019-02-21 CN CN201910129789.3A patent/CN109885390B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030033345A1 (en) * | 2002-06-27 | 2003-02-13 | Keefer Christopher E. | Thread-based methods and systems for using the idle processing power of one or more networked computers to solve complex scientific problems |
US20070094661A1 (en) * | 2005-10-22 | 2007-04-26 | Cisco Technology, Inc. | Techniques for task management using presence |
CN106909785A (zh) * | 2017-02-25 | 2017-06-30 | 辽宁大学 | 一种以24‑脱氢胆固醇还原酶(dhcr24)为靶点进行降胆固醇药物的虚拟筛选方法 |
CN108664729A (zh) * | 2018-05-10 | 2018-10-16 | 深圳晶泰科技有限公司 | 一种gromacs云计算流程控制方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022082598A1 (zh) * | 2020-10-22 | 2022-04-28 | 深圳晶泰科技有限公司 | 一种准确计算气体分子绝对自由能的方法 |
CN112201301A (zh) * | 2020-10-23 | 2021-01-08 | 深圳晶泰科技有限公司 | 基于虚拟现实的药物设计云计算流程控制系统及其方法 |
WO2022082740A1 (zh) * | 2020-10-23 | 2022-04-28 | 深圳晶泰科技有限公司 | 基于虚拟现实的药物设计云计算流程控制系统及其方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109885390B (zh) | 2023-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110221962B (zh) | 一种集中式软件测试管理系统及方法 | |
CN109634728B (zh) | 作业调度方法、装置、终端设备及可读存储介质 | |
US9477581B2 (en) | Integrated system and method for validating the functionality and performance of software applications | |
CN104866599B (zh) | 可视化报表的生产方法和系统 | |
CN109885390A (zh) | 分子对接云计算流程控制方法 | |
CN101493864B (zh) | 分析风力田的性能的系统和方法 | |
US9135714B1 (en) | Method and system for integrating a graphical user interface capture for automated test and retest procedures | |
CN101996117B (zh) | 计算机测试系统及方法 | |
US20190012434A1 (en) | System and method for building intuitive clinical trial applications | |
CN103150249A (zh) | 一种自动化测试的方法和系统 | |
CN112783793B (zh) | 自动化接口测试系统及方法 | |
CN109637592B (zh) | 分子力场参数生成的计算任务管理分析系统及其运行方法 | |
US8701079B2 (en) | Procedure and development environment for generation of an executable overall control program | |
CN112201301A (zh) | 基于虚拟现实的药物设计云计算流程控制系统及其方法 | |
CN105786695A (zh) | 数据测试方法及系统 | |
CN109032850B (zh) | 现场装置调试系统和现场装置调试方法 | |
US9983965B1 (en) | Method and system for implementing virtual users for automated test and retest procedures | |
CN114996127A (zh) | 固态硬盘固件模块智能化测试方法及系统 | |
CN114282877A (zh) | 支持生物技术实验室的用户的方法 | |
US8151189B2 (en) | Computer-implemented systems and methods for an automated application interface | |
CN105320510A (zh) | 一种自动追踪数据关系的方法及装置 | |
CN111966665B (zh) | 数据迁移测试方法及装置 | |
WO2022134001A1 (zh) | 基于容器化技术的机器学习模型框架的开发方法与系统 | |
CN112052181B (zh) | 基于软件工程化的嵌入式软件自动化测试系统 | |
CN114297961A (zh) | 一种芯片测试用例处理方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 3 / F, Shunfeng industrial building, No.2 Hongliu Road, Fubao community, Fubao street, Futian District, Shenzhen City, Guangdong Province Applicant after: Shenzhen Jingtai Technology Co.,Ltd. Address before: 518000 4th floor, No.9 Hualian Industrial Zone, Xinshi community, Dalang street, Longhua District, Shenzhen City, Guangdong Province Applicant before: Shenzhen Jingtai Technology Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |