CN110289055B - 药物靶标的预测方法、装置、计算机设备和存储介质 - Google Patents

药物靶标的预测方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN110289055B
CN110289055B CN201910555486.8A CN201910555486A CN110289055B CN 110289055 B CN110289055 B CN 110289055B CN 201910555486 A CN201910555486 A CN 201910555486A CN 110289055 B CN110289055 B CN 110289055B
Authority
CN
China
Prior art keywords
docking
small molecule
protein
coordinate values
molecule ligand
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910555486.8A
Other languages
English (en)
Other versions
CN110289055A (zh
Inventor
韩露
周文霞
张永祥
高圣乔
程肖蕊
肖智勇
黄晏
刘港
王同兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Pharmacology and Toxicology of AMMS
Original Assignee
Institute of Pharmacology and Toxicology of AMMS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Pharmacology and Toxicology of AMMS filed Critical Institute of Pharmacology and Toxicology of AMMS
Priority to CN201910555486.8A priority Critical patent/CN110289055B/zh
Publication of CN110289055A publication Critical patent/CN110289055A/zh
Application granted granted Critical
Publication of CN110289055B publication Critical patent/CN110289055B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs

Landscapes

  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本申请涉及一种药物靶标的预测方法、装置、计算机设备和存储介质,获取小分子配体、多个蛋白受体的蛋白结构和活性位点数据,根据多个蛋白受体的蛋白结构和活性位点数据分别计算多个蛋白受体的活性中心坐标值和对接盒子的坐标值,从而基于多个蛋白受体的活性中心坐标值和对接盒子的坐标值,将小分子配体与多个蛋白受体分别进行反向对接,并根据反向对接的结果,从多个蛋白受体中预测与小分子配体对应的药物靶标。基于多个蛋白受体的活性中心坐标值和对接盒子的坐标值进行反向对接,提升了小分子配体与多个蛋白受体的对接准确性,解决传统技术中小分子化合物与蛋白质靶标的反向对接准确性不高的技术问题。

Description

药物靶标的预测方法、装置、计算机设备和存储介质
技术领域
本申请涉及药物信息学领域,特别是涉及一种药物靶标的预测方法、装置、计算机设备和存储介质。
背景技术
随着高通量蛋白质纯化、结晶学和核磁共振光谱技术的发展,促进了人们更多地了解蛋白质和蛋白质—配体复合物的结构细节。计算策略也渗透到药物发现的各个方面,例如用于药物先导物识别的虚拟筛选技术(Vitrual Screening,VS)。VS技术是一种直接合理的药物发现方法,具有成本低,有效筛查的优点。VS技术包括基于配体的和基于结构的方法。
对于基于结构的药物设计,分子对接成为药物研究中越来越重要的工具。通过找到可以意外地与先导化合物或现有药物结合的靶标,进而能够减少药物的不良副作用,或通过药物重新定位扩大药物的适应症。反向对接技术正是一种通过与蛋白质数据库自动对接来寻找小分子化合物潜在蛋白质靶标的计算机辅助药物设计技术。
但是,在传统技术中,小分子化合物与蛋白质靶标的反向对接存在准确性不高的技术问题。
发明内容
基于此,有必要针对传统技术中小分子化合物与蛋白质靶标的反向对接准确性不高的技术问题,提供一种药物靶标的预测方法、装置、计算机设备和存储介质。
一种药物靶标的预测方法,所述方法包括:
获取需要对接的小分子配体;
获取多个蛋白受体的蛋白结构和活性位点数据;
根据所述多个蛋白受体的蛋白结构和所述活性位点数据分别计算所述多个蛋白受体的活性中心坐标值和对接盒子的坐标值;
基于所述多个蛋白受体的活性中心坐标值和所述对接盒子的坐标值,将所述小分子配体与所述多个蛋白受体分别进行反向对接;
根据反向对接的结果,从所述多个蛋白受体中预测与所述小分子配体对应的药物靶标。
在其中一个实施例中,在所述获取需要对接的小分子配体之前,所述方法还包括:
获取原始小分子配体;
将所述原始小分子配体的存储格式进行格式转换,得到预设格式的小分子配体;
所述获取需要对接的小分子配体,包括:
获取需要对接的所述预设格式的小分子配体。
在其中一个实施例中,在所述获取多个蛋白受体的蛋白结构和活性位点数据之后,所述方法还包括:
将所述多个蛋白受体的存储格式进行格式转换,得到所述预设格式的蛋白受体;
所述基于所述多个蛋白受体的活性中心坐标值和所述对接盒子的坐标值,将所述小分子配体与所述多个蛋白受体分别进行反向对接,包括:
基于所述多个蛋白受体的活性中心坐标值和所述对接盒子的坐标值,将所述预设格式的小分子配体与多个所述预设格式的蛋白受体分别进行反向对接。
在其中一个实施例中,所述预设格式为pdbqt格式。
在其中一个实施例中,所述基于所述多个蛋白受体的活性中心坐标值和所述对接盒子的坐标值,将所述小分子配体与所述多个蛋白受体分别进行反向对接,包括:
基于所述多个蛋白受体的活性中心坐标值和所述对接盒子的坐标值,利用多线程的方式将所述小分子配体与所述多个蛋白受体分别进行反向对接。
在其中一个实施例中,所述反向对接的结果包括多个对接构象;所述根据反向对接的结果,预测与所述小分子配体对应的药物靶标,包括:
对所述反向对接的结果进行解析,从所述多个对接构象中获取自由能变化最小的对接构象;
根据自由能变化最小的对接构象,预测与所述小分子配体对应的药物靶标。
在其中一个实施例中,所述反向对接的结果还包括对接产生的错误信息;所述方法还包括:
将所述对接构象和所述对接构象的自由能变化值保存在第一路径中;
将所述对接产生的错误信息保存在第二路径中。
一种药物靶标的预测装置,所述装置包括:
第一获取模块,用于获取需要对接的小分子配体;
第二获取模块,用于获取多个蛋白受体的蛋白结构和活性位点数据;
计算模块,用于根据所述多个蛋白受体的蛋白结构和所述活性位点数据分别计算所述多个蛋白受体的活性中心坐标值和对接盒子的坐标值;
对接模块,用于基于所述多个蛋白受体的活性中心坐标值和所述对接盒子的坐标值,将所述小分子配体与所述多个蛋白受体分别进行反向对接;
预测模块,用于根据反向对接的结果,从所述多个蛋白受体中预测与所述小分子配体对应的药物靶标。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一实施例中所述方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一实施例中所述方法的步骤。
上述药物靶标的预测方法、装置、计算机设备和存储介质,获取小分子配体、多个蛋白受体的蛋白结构和活性位点数据,根据多个蛋白受体的蛋白结构和活性位点数据分别计算多个蛋白受体的活性中心坐标值和对接盒子的坐标值,从而基于多个蛋白受体的活性中心坐标值和对接盒子的坐标值,将小分子配体与多个蛋白受体分别进行反向对接,并根据反向对接的结果,从多个蛋白受体中预测与小分子配体对应的药物靶标。基于多个蛋白受体的活性中心坐标值和对接盒子的坐标值进行反向对接,提升了小分子配体与多个蛋白受体的对接准确性,解决传统技术中小分子化合物与蛋白质靶标的反向对接准确性不高的技术问题。
附图说明
图1为一个实施例中药物靶标的预测方法的应用环境图;
图2为一个实施例中药物靶标的预测方法的流程示意图;
图3为一个实施例中药物靶标的预测方法的流程示意图;
图4为一个实施例中药物靶标的预测方法的流程示意图;
图5a为一个实施例中药物靶标的预测方法的流程示意图;
图5b为一个实施例中对接构象的结构示意图;
图6a为一个实施例中药物靶标的预测方法的流程示意图;
图6b为一个实施例中反向对接的界面示意图;
图7为一个实施例中药物靶标的预测装置的结构框图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供一种药物靶标的预测方法,可以应用于图1所示的应用环境中。其中,终端110通过网络与服务器120进行数据交互,本申请对终端110与服务器120的数据交互方式不进行限制。服务器120内可以预存有小分子配体库和蛋白受体库,小分子配体库存储有小分子结构。蛋白受体库中存储有蛋白受体的蛋白结构和活性位点数据。用户可以通过终端110上的应用程序或者网页选择需要预测靶标的小分子配体,并获取多个蛋白受体的蛋白结构和活性位点数据。根据多个蛋白受体的蛋白结构和活性位点数据分别计算多个蛋白受体的活性中心坐标值和对接盒子的坐标值,从而基于多个蛋白受体的活性中心坐标值和对接盒子的坐标值,将小分子配体与多个蛋白受体分别进行反向对接;最终根据反向对接的结果,从多个蛋白受体中预测与小分子配体对应的药物靶标,且终端110可以将与小分子配体对应的药物靶标进行展示。其中,终端110可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。可以理解的是,终端110与服务器120可以集成在一起。
在一个实施例中,如图2所示,提供了一种药物靶标的预测方法,以该方法应用于图1的终端中为例进行说明,包括以下步骤:
S210、获取需要对接的小分子配体。
其中,配体(Ligand,也称为配基)是一个化学名词,表示可与中心原子(金属或类金属)产生键结的原子、分子和离子。一般情况下,配体在参与键结时至少会提供一个电子。具体地,服务器中预存有小分子配体库,可以从预存的小分子配体库中获取小分子配体。或者,接收用户提交的小分子结构作为需要对接的小分子配体。
S220、获取多个蛋白受体的蛋白结构和活性位点数据。
其中,受体是指任何能够同激素、神经递质、药物或细胞内信号分子结合并能引起细胞功能变化的生物大分子。活性位点数据用于指定蛋白受体上底物结合的有限区域。具体地,受体库中预存蛋白受体的蛋白结构和活性位点数据等,则可以从受体库中获取多个蛋白受体的蛋白结构和活性位点数据。
S230、根据多个蛋白受体的蛋白结构和活性位点数据分别计算多个蛋白受体的活性中心坐标值和对接盒子的坐标值。
其中,活性中心是指小分子配体与蛋白受体最佳结合的对接中心。对接盒子(BOX,也称作搜索空间)是指小分子配体与蛋白受体最佳结合的对接空间,小分子配体尝试结合的蛋白受体表面部分由对接盒子的坐标决定。具体地,从受体库中获取多个蛋白受体的蛋白结构和对应的活性位点数据,根据每个蛋白受体的蛋白结构和对应的活性位点数据计算每个蛋白受体的活性中心坐标值和对接盒子的坐标值。
S240、基于多个蛋白受体的活性中心坐标值和对接盒子的坐标值,将小分子配体与多个蛋白受体分别进行反向对接。
其中,分子对接(Molecular Docking)依据配体与受体作用的“锁-钥原理”(Lockand Key Principle),模拟小分子配体与受体生物大分子相互作用。配体与受体相互作用是分子识别的过程,主要包括静电作用、氢键作用、疏水作用、范德华作用等。通过计算可以预测两者间的结合模式和亲和力,从而进行药物的虚拟筛选。而反向对接是通过与蛋白质数据库中的蛋白受体自动对接来寻找小分子配体潜在药物靶标的计算机辅助药物设计技术。具体地,每个蛋白受体的活性中心坐标值确定了小分子配体与蛋白受体的对接位置,对接盒子的坐标值确定了小分子配体与蛋白受体的对接空间。基于每个蛋白受体的活性中心坐标值和对接盒子的坐标值,小分子配体以不同的姿势与每个蛋白受体分别进行反向对接。
S250、根据反向对接的结果,从多个蛋白受体中预测与小分子配体对应的药物靶标。
其中,药物靶标是指受体库中蛋白受体与小分子配体结合后自由能变化最小的蛋白受体。具体地,小分子配体与受体库中各个蛋白受体分别进行反向对接,得到对应的反向对接结果。根据反向对接结果,从受体库中的多个蛋白受体中预测与小分子配体对应的药物靶标。
本实施例中,通过获取多个蛋白受体的蛋白结构和活性位点数据,根据多个蛋白受体的蛋白结构和活性位点数据分别计算多个蛋白受体的活性中心坐标值和对接盒子的坐标值,从而基于多个蛋白受体的活性中心坐标值和对接盒子的坐标值,将小分子配体与多个蛋白受体分别进行反向对接,并根据反向对接的结果,从多个蛋白受体中预测与小分子配体对应的药物靶标。基于多个蛋白受体的活性中心坐标值和对接盒子的坐标值进行反向对接,提升了小分子配体与多个蛋白受体的对接准确性,解决传统技术中小分子化合物与蛋白质靶标的反向对接准确性不高的技术问题。
在一个实施例中,如图3所示,在获取需要对接的小分子配体之前,该方法还包括以下步骤:
S310、获取原始小分子配体;
S320、将原始小分子配体的存储格式进行格式转换,得到预设格式的小分子配体;
获取需要对接的小分子配体,包括:
S330、获取需要对接的预设格式的小分子配体。
其中,为了将小分子配体与蛋白受体进行反向对接,可以对小分子配体的存储格式进行转换。原始小分子配体指的是存储格式转换之前的小分子配体。原始小分子配体的格式可以是smi、sdf、mol2和pdb等格式。具体地,获取原始小分子配体的方式包括两种:一种是用户提供的原始小分子配体;一种是从小分子配体库中获取的原始小分子配体。无论是用户提供的原始小分子配体,还是从小分子配体库中获取的原始小分子配体,需要对获取到的原始小分子配体的格式进行检测,判断原始小分子配体的格式是否为预设格式。若不是预设格式,需要对原始小分子配体进行格式转换,以得到预设格式的小分子配体,从而获取需要对接的预设格式的小分子配体。
示例性的,若预设格式为pdbqt格式。预设格式小分子配体的准备过程如下:用户提交的原始小分子配体的格式可以是smi、sdf、mol2和pdb格式。对于smi、sdf、pdb利用openbabel软件的格式转换命令将smi、sdf、pdb这几种格式转换成mol2格式。并且需要在参数设置中设置添加氢原子和3D坐标信息。利用mgltools中的preparelingand4.py脚本将mol2格式的小分子配体转换成用于反向对接的pdbqt格式的小分子配体。
示例性的,若预设格式为pdbqt格式。预设格式小分子配体的准备过程如下:从已经整合的小分子配体库中选择需要对接的小分子配体。小分子配体库提供的小分子的名称、同义名、2D信息、3D结构信息、分子式、分子结构可视化展示、小分子结构图片等小分子配体的注释信息。用户选择原始小分子配体后,利用mgltools中的prepareligand4.py脚本将从小分子配体库获取的原始小分子配体转换成用于反向对接的pdbqt格式的小分子配体。
进一步地,小分子配体库构建过程包括数据下载和数据清洗。小分子配体库主要包括从ZINC,PUBCHEM下载的部分数据子集。其中,ZINC数据库包含超过2000万种化合物,并且包含化合物模型,其中化合物可以在不同的模型中以其不同的对映体和质子化状态表示数次。这些模型用“化合物”或“配体”来表示。小分子配体库的构建采用Node.js+Express+MongoDB框架。Node.js是运行在服务端的JavaScript,是一个基于Chrome V8引擎的JavaScript运行环境,轻量高效。Express是一个基于Node.js平台的极简、灵活的Web应用开发框架,可辅助创建各种Web和移动设备应用。MongoDB是一种非关系数据库管理系统,存储灵活。
本实施例中,采用预设格式的小分子配体进行反向对接,提升了小分子配体与多个蛋白受体的对接效率,解决传统技术中小分子化合物与蛋白质靶标的反向对接耗时较长的技术问题。
在一个实施例中,如图4所示,在获取多个蛋白受体的蛋白结构和活性位点数据之后,该方法还包以下步骤:
S410、将多个蛋白受体的存储格式进行格式转换,得到预设格式的蛋白受体;
基于多个蛋白受体的活性中心坐标值和对接盒子的坐标值,将小分子配体与多个蛋白受体分别进行反向对接,包括:
S420、基于多个蛋白受体的活性中心坐标值和对接盒子的坐标值,将预设格式的小分子配体与多个预设格式的蛋白受体分别进行反向对接。
具体地,为了将小分子配体与蛋白受体进行反向对接,可以将受体库中的蛋白受体的存储格式进行转换。对获取到的多个蛋白受体的格式分别进行检测,判断受体库中的多个蛋白受体的格式是否为预设格式。若不是预设格式,需要对多个蛋白受体进行格式转换,以得到预设格式的蛋白受体。基于每个蛋白受体的活性中心坐标值确定的对接位置和对接盒子的坐标值确定的对接空间,将小分子配体以不同的姿势与每个预设格式的蛋白受体分别进行反向对接。
示例性地,若获取到蛋白受体的格式为mol2格式,预设格式为pdbqt格式。预设格式蛋白受体的准备过程如下:利用openbabel批量将mol2格式的蛋白受体其转化为pdb格式的的蛋白受体。利用mgltools中的preparereceptor4.py脚本将pdb格式的的蛋白受体转化为pdbqt格式的可以用于对接的蛋白受体。
进一步地,受体库的建立过程包括数据下载和数据录入。具体地,从scPDB数据库中下载相关数据,提取所需要的结构的相关信息,比如名称、3D结构文件和一些必要的注释信息等。进一步地,可以对下载的数据进行清洗。其中,scPDB是一个专门的结构数据库,专注于蛋白结构和活性位点。scPDB数据库收集了PDB数据库中所有的包含天然或合成的所有小分子配体的小分子-蛋白复合体,可以很好的包裹小分子配体并且具有很好生物学相关的特性。scPDB数据库通过基于机器学习的方法预测相关的结合位点。则通过scPDB数据库可以获得蛋白的坐标数据、配体的坐标数据、活性位点的坐标数据。同时scPDB数据库利用pdb、Uniprot等数据库中的信息对这些活性位点进行注释,目前包含1万多条结合位点条目信息。数据的录入过程包括:首先下载安装Node.js,在PATH环境变量中配置Node.js,新建数据库express项目,上传项目代码到svn版本控制器上,并记录链接,安装MongoDB数据库,并导入数据。
本实施例中,采用预设格式的蛋白受体进行反向对接,提升了小分子配体与多个蛋白受体的对接效率,解决传统技术中小分子化合物与蛋白质靶标的反向对接耗时较长的技术问题。
在一个实施例中,基于多个蛋白受体的活性中心坐标值和对接盒子的坐标值,将小分子配体与多个蛋白受体分别进行反向对接,包括:基于多个蛋白受体的活性中心坐标值和对接盒子的坐标值,利用多线程的方式将小分子配体与多个蛋白受体分别进行反向对接。
其中,多线程是指从软件或者硬件上实现多个线程并发执行的技术,具有多线程能力的计算机因有硬件支持而能够在同一时间执行多于一个线程,从而提升整体处理性能。具体地,为了加快运算速度,提升反向对接的效率,基于多个蛋白受体的活性中心坐标值和对接盒子的坐标值,采用多线程的方式将小分子配体与多个蛋白受体分别进行反向对接。示例性地,可以利用分子对接软件AutoDock Vina实现反向对接的过程。Vina实现了一种有效的优化算法。Vina可以基于新的评分函数来估计蛋白质-配体亲和力,并采用新的搜索算法来预测合理的结合模式。此外,Vina可以在一台机器上使用多个内核并行运行计算,以加快计算速度。
在一个实施例中,反向对接的结果包括多个对接构象。如图5a所示,根据反向对接的结果,预测与小分子配体对应的药物靶标,包括:
S510、对反向对接的结果进行解析,从多个对接构象中获取自由能变化最小的对接构象;
S520、根据自由能变化最小的对接构象,预测与小分子配体对应的药物靶标。
其中,对接构象是指小分子配体与蛋白受体反向对接对蛋白受体的结构影响而产生的构象。小分子配体与蛋白受体进行反向对接,蛋白受体的自由能发生变化,分子配体与蛋白受体反向对接的结果包括产生的对接构象和自由能变化值。如图5b所示,还可以对产生的对接构象进行可视化展示。
具体地,小分子配体与受体库中的各个蛋白受体进行反向对接,小分子配体与每个蛋白受体基于该蛋白受体的活性中心坐标值和对接盒子的坐标值进行反向对接,由于结合姿势的不同,小分子配体与每个蛋白受体进行反向对接均可以得到多个对接构象,从小分子配体与每个蛋白受体反向对接产生的多个对接构象中确定自由能变化最小的对接构象。同样的,小分子配体与受体库中其他的每个蛋白受体进行反向对接后,也可以确定对应的自由能变化最小的对接构象。在确定的各个自由能变化最小的对接构象的自由能变化值进行比较,在各个自由能变化最小的对接构象中获取自由能变化最小的对接构象。根据自由能变化最小的对接构象可以确定对应的蛋白受体,预测该蛋白受体是与小分子配体对应的药物靶标。
本实施例中,通过对反向对接的结果进行解析,从多个对接构象中获取自由能变化最小的对接构象,并根据自由能变化最小的对接构象,预测与小分子配体对应的药物靶标。实现了对小分子配体的药物靶标的预测,同时获取药物候选靶标的可视化展示。
在一个实施例中,反向对接的结果还包括对接产生的错误信息;该方法还包括:将对接构象和对接构象的自由能变化值保存在第一路径中;将对接产生的错误信息保存在第二路径中。
其中,在小分子配体与多个蛋白受体反向对接时,存在小分子配体与部分蛋白受体不能对接的情况,这时产生对应的错误信息,错误信息包括蛋白受体的名称,可以将对接产生的错误信息进行保存以向研究人员提供更多的信息。具体地,小分子配体与多个蛋白受体进行反向对接,若小分子配体与部分蛋白受体对接成功,将对接产生的对接构象和对接构象的自由能变化值保存在第一路径中,若小分子配体与部分蛋白受体不能对接,则产生错误信息,将对接产生的错误信息保存在第二路径中。其中,第一路径不同于第二路径。
在一个实施例中,本申请提供了一种药物靶标的预测方法。该预测方法可以在Galaxy上实现。Galaxy是一个基于Web的工作流程管理系统,用Python编程语言实现,广泛用于制作数据库,数据集成,数据处理和数据分析。Galaxy可以直接在Web上使用,也可以安装在本地计算机上。Galaxy的特性可以自由地集成各种工具,具有使用各种生物、化学数据格式的灵活性,并且允许集成用任何编程语言或脚本编写的工具,并未构建命令行调用。本实施例在Galaxy上实现包括文件格式转换、小分子配体准备、蛋白受体准备,反向对接等一系列的工具流程的串行。如图6a所示,该方法包括以下步骤:
S602、获取原始小分子配体;
请参见图6b,可以通过接收用户提供一种是用户提供的原始小分子配体获取小分子配体,也可以从小分子配体库中获取的原始小分子配体。
S604、将原始小分子配体的存储格式进行格式转换,得到预设格式的小分子配体;
S606、获取需要对接的预设格式的小分子配体;
S608、获取多个蛋白受体的蛋白结构和活性位点数据;
S610、根据多个蛋白受体的蛋白结构和活性位点数据分别计算多个蛋白受体的活性中心坐标值和对接盒子的坐标值;
S612、将多个蛋白受体的存储格式进行格式转换,得到预设格式的蛋白受体;
S614、基于多个蛋白受体的活性中心坐标值和对接盒子的坐标值,利用多线程的方式将预设格式的小分子配体与多个预设格式的蛋白受体分别进行反向对接;
S616、对反向对接的结果进行解析,从多个对接构象中获取自由能变化最小的对接构象;
S618、根据自由能变化最小的对接构象,预测与小分子配体对应的药物靶标;
S620、将对接构象和对接构象的自由能变化值保存在第一路径中;将对接产生的错误信息保存在第二路径中。
应该理解的是,虽然上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图7所示,提供了一种药物靶标的预测装置700。该装置包括:
第一获取模块710,用于获取需要对接的小分子配体;
第二获取模块720,用于获取多个蛋白受体的蛋白结构和活性位点数据;
计算模块730,用于根据多个蛋白受体的蛋白结构和活性位点数据分别计算多个蛋白受体的活性中心坐标值和对接盒子的坐标值;
对接模块740,用于基于多个蛋白受体的活性中心坐标值和对接盒子的坐标值,将小分子配体与多个蛋白受体分别进行反向对接;
预测模块750,用于根据反向对接的结果,从多个蛋白受体中预测与小分子配体对应的药物靶标。
关于药物靶标的预测装置的具体限定可以参见上文中对于药物靶标的预测方法的限定,在此不再赘述。上述药物靶标的预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种药物靶标的预测方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中的方法步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中的方法步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种药物靶标的预测方法,其特征在于,所述方法包括:
获取需要对接的小分子配体;
获取多个蛋白受体的蛋白结构和活性位点数据;
根据所述多个蛋白受体的蛋白结构和所述活性位点数据分别计算所述多个蛋白受体的活性中心坐标值和对接盒子的坐标值,所述活性中心坐标值用于确定所述小分子配体与各蛋白受体的对接位置,所述对接盒子的坐标值用于确定所述小分子配体与各蛋白受体的对接空间,且所述对接盒子为小分子配体与蛋白受体最佳结合的对接空间;
基于所述多个蛋白受体的活性中心坐标值和所述对接盒子的坐标值,将所述小分子配体与所述多个蛋白受体分别进行反向对接;
根据反向对接的结果,从所述多个蛋白受体中预测与所述小分子配体对应的药物靶标。
2.根据权利要求1所述的方法,其特征在于,在所述获取需要对接的小分子配体之前,所述方法还包括:
获取原始小分子配体;
将所述原始小分子配体的存储格式进行格式转换,得到预设格式的小分子配体;
所述获取需要对接的小分子配体,包括:
获取需要对接的所述预设格式的小分子配体。
3.根据权利要求2所述的方法,其特征在于,在所述获取多个蛋白受体的蛋白结构和活性位点数据之后,所述方法还包括:
将所述多个蛋白受体的存储格式进行格式转换,得到所述预设格式的蛋白受体;
所述基于所述多个蛋白受体的活性中心坐标值和所述对接盒子的坐标值,将所述小分子配体与所述多个蛋白受体分别进行反向对接,包括:
基于所述多个蛋白受体的活性中心坐标值和所述对接盒子的坐标值,将所述预设格式的小分子配体与多个所述预设格式的蛋白受体分别进行反向对接。
4.根据权利要求3所述的方法,其特征在于,所述预设格式为pdbqt格式。
5.根据权利要求1所述的方法,其特征在于,所述基于所述多个蛋白受体的活性中心坐标值和所述对接盒子的坐标值,将所述小分子配体与所述多个蛋白受体分别进行反向对接,包括:
基于所述多个蛋白受体的活性中心坐标值和所述对接盒子的坐标值,利用多线程的方式将所述小分子配体与所述多个蛋白受体分别进行反向对接。
6.根据权利要求1所述的方法,其特征在于,所述反向对接的结果包括多个对接构象;所述根据反向对接的结果,预测与所述小分子配体对应的药物靶标,包括:
对所述反向对接的结果进行解析,从所述多个对接构象中获取自由能变化最小的对接构象;
根据自由能变化最小的对接构象,预测与所述小分子配体对应的药物靶标。
7.根据权利要求6所述的方法,其特征在于,所述反向对接的结果还包括对接产生的错误信息;所述方法还包括:
将所述对接构象和所述对接构象的自由能变化值保存在第一路径中;
将所述对接产生的错误信息保存在第二路径中。
8.一种药物靶标的预测装置,其特征在于,所述装置包括:
第一获取模块,用于获取需要对接的小分子配体;
第二获取模块,用于获取多个蛋白受体的蛋白结构和活性位点数据;
计算模块,用于根据所述多个蛋白受体的蛋白结构和所述活性位点数据分别计算所述多个蛋白受体的活性中心坐标值和对接盒子的坐标值,所述活性中心坐标值用于确定所述小分子配体与各蛋白受体的对接位置,所述对接盒子的坐标值用于确定所述小分子配体与各蛋白受体的对接空间,且所述对接盒子为小分子配体与蛋白受体最佳结合的对接空间;
对接模块,用于基于所述多个蛋白受体的活性中心坐标值和所述对接盒子的坐标值,将所述小分子配体与所述多个蛋白受体分别进行反向对接;
预测模块,用于根据反向对接的结果,从所述多个蛋白受体中预测与所述小分子配体对应的药物靶标。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN201910555486.8A 2019-06-25 2019-06-25 药物靶标的预测方法、装置、计算机设备和存储介质 Active CN110289055B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910555486.8A CN110289055B (zh) 2019-06-25 2019-06-25 药物靶标的预测方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910555486.8A CN110289055B (zh) 2019-06-25 2019-06-25 药物靶标的预测方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN110289055A CN110289055A (zh) 2019-09-27
CN110289055B true CN110289055B (zh) 2021-09-07

Family

ID=68005700

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910555486.8A Active CN110289055B (zh) 2019-06-25 2019-06-25 药物靶标的预测方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN110289055B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113066539A (zh) * 2021-03-22 2021-07-02 上海商汤智能科技有限公司 预测方法及相关装置、设备
WO2023108465A1 (zh) * 2021-12-15 2023-06-22 深圳晶泰科技有限公司 虚拟筛选方法、装置及电子设备
CN114882940B (zh) * 2022-03-28 2022-11-08 北京玻色量子科技有限公司 一种基于相干伊辛机的分子对接方法和装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002016940A2 (en) * 2000-08-23 2002-02-28 Genome Therapeutics Corporation Genomics-assisted rapid identification of targets
WO2002082048A2 (en) * 2001-04-05 2002-10-17 Bdc Pharma Llc. Structure/properties correlation with membrane affinity profile
CN102930152A (zh) * 2012-10-26 2013-02-13 中国科学院上海药物研究所 一种模拟配体分子与靶标受体反应并计算预测该反应的热力学与动力学参数的方法和系统
CN107038348A (zh) * 2017-05-04 2017-08-11 四川大学 基于蛋白‑配体相互作用指纹图谱的药物靶标预测方法
CN108588167A (zh) * 2018-04-25 2018-09-28 中国人民解放军军事科学院军事医学研究院 一种药物化合物高通量筛选方法
CN109545284A (zh) * 2018-10-16 2019-03-29 中国人民解放军军事科学院军事医学研究院 基于药物及靶标信息的药物综合信息库建设方法及系统
CN109637595A (zh) * 2018-12-12 2019-04-16 中国人民解放军军事科学院军事医学研究院 一种药物重定位方法、装置、电子设备及存储介质
CN109712678A (zh) * 2018-12-12 2019-05-03 中国人民解放军军事科学院军事医学研究院 关系预测方法、装置及电子设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080213768A1 (en) * 2006-08-17 2008-09-04 Zhauhui Cai Identification and use of biomarkers for non-invasive and early detection of liver injury

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002016940A2 (en) * 2000-08-23 2002-02-28 Genome Therapeutics Corporation Genomics-assisted rapid identification of targets
WO2002082048A2 (en) * 2001-04-05 2002-10-17 Bdc Pharma Llc. Structure/properties correlation with membrane affinity profile
CN102930152A (zh) * 2012-10-26 2013-02-13 中国科学院上海药物研究所 一种模拟配体分子与靶标受体反应并计算预测该反应的热力学与动力学参数的方法和系统
CN107038348A (zh) * 2017-05-04 2017-08-11 四川大学 基于蛋白‑配体相互作用指纹图谱的药物靶标预测方法
CN108588167A (zh) * 2018-04-25 2018-09-28 中国人民解放军军事科学院军事医学研究院 一种药物化合物高通量筛选方法
CN109545284A (zh) * 2018-10-16 2019-03-29 中国人民解放军军事科学院军事医学研究院 基于药物及靶标信息的药物综合信息库建设方法及系统
CN109637595A (zh) * 2018-12-12 2019-04-16 中国人民解放军军事科学院军事医学研究院 一种药物重定位方法、装置、电子设备及存储介质
CN109712678A (zh) * 2018-12-12 2019-05-03 中国人民解放军军事科学院军事医学研究院 关系预测方法、装置及电子设备

Also Published As

Publication number Publication date
CN110289055A (zh) 2019-09-27

Similar Documents

Publication Publication Date Title
CN110289055B (zh) 药物靶标的预测方法、装置、计算机设备和存储介质
Raniolo et al. Ligand binding free-energy calculations with funnel metadynamics
Homeyer et al. FEW: a workflow tool for free energy calculations of ligand binding
Dastgeer et al. Auto-tuning SkePU: a multi-backend skeleton programming framework for multi-GPU systems
Schomburg et al. Facing the challenges of structure-based target prediction by inverse virtual screening
Cleves et al. Structure-and ligand-based virtual screening on DUD-E+: performance dependence on approximations to the binding pocket
CN107038348A (zh) 基于蛋白‑配体相互作用指纹图谱的药物靶标预测方法
CA2921231A1 (en) Systems and methods for in silico evaluation of polymers
Yan et al. PointSite: a point cloud segmentation tool for identification of protein ligand binding atoms
Atz et al. Δ-Quantum machine-learning for medicinal chemistry
CN114333986A (zh) 模型训练、药物筛选和亲和力预测的方法与装置
US20210287773A1 (en) Hybrid computational system of classical and quantum computing for drug discovery and methods
Moal et al. Flexible protein-protein docking with SwarmDock
Demir-Kavuk et al. DemQSAR: predicting human volume of distribution and clearance of drugs
Singh et al. Artificial Intelligence and Machine Learning in Pharmacological Research: Bridging the Gap Between Data and Drug Discovery
Hariry et al. From Industry 4.0 to Pharma 4.0
Pevzner et al. Fragment-based docking: development of the CHARMMing Web user interface as a platform for computer-aided drug design
Bharti et al. GCAC: galaxy workflow system for predictive model building for virtual screening
Bhattacharya et al. DisCovER: distance‐and orientation‐based covariational threading for weakly homologous proteins
Evteev et al. Siteradar: utilizing graph machine learning for precise mapping of protein–ligand-binding sites
Grimm et al. LigMate: a multifeature integration algorithm for ligand-similarity-based virtual screening
Czub et al. Artificial Intelligence-Based Quantitative Structure–Property Relationship Model for Predicting Human Intestinal Absorption of Compounds with Serotonergic Activity
Mamada et al. Novel QSAR approach for a regression model of clearance that combines deepsnap-deep learning and conventional machine learning
Al-Ali et al. Workflow optimization of performance and quality of service for bioinformatics application in high performance computing
Chelur et al. Birds-binding residue detection from protein sequences using deep resnets

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant