CN107038348B - 基于蛋白-配体相互作用指纹图谱的药物靶标预测方法 - Google Patents

基于蛋白-配体相互作用指纹图谱的药物靶标预测方法 Download PDF

Info

Publication number
CN107038348B
CN107038348B CN201710309067.7A CN201710309067A CN107038348B CN 107038348 B CN107038348 B CN 107038348B CN 201710309067 A CN201710309067 A CN 201710309067A CN 107038348 B CN107038348 B CN 107038348B
Authority
CN
China
Prior art keywords
target
interaction
drug
fingerprint
compound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710309067.7A
Other languages
English (en)
Other versions
CN107038348A (zh
Inventor
李国菠
吴勇
刘莎
于竹君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
Original Assignee
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University filed Critical Sichuan University
Priority to CN201710309067.7A priority Critical patent/CN107038348B/zh
Publication of CN107038348A publication Critical patent/CN107038348A/zh
Application granted granted Critical
Publication of CN107038348B publication Critical patent/CN107038348B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Data Mining & Analysis (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Analytical Chemistry (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

基于蛋白‑配体相互作用指纹图谱的药物靶标预测方法。收集大量的多样化的靶标与配体复合物晶体结构,构建参考蛋白‑配体相互作用指纹图谱模型,采用分子对接预测待测药物与每个靶标的可能结合模式,建立药物与靶标的相互作用指纹图谱模型,计算指纹图谱与参考相互作用指纹图谱模型的相似性以及药物与靶标的亲和力,综合对接打分、指纹谱图相似性和亲和力大小对靶标库的靶标进行排序,输出该药物潜在的靶标。本发明既采用了相互作用指纹图谱方法进行药物与靶标相互作用模式进行排序和预测,克服分子对接对药物与靶标相互作用模式预测成功率较低的缺点;又采用了综合指标Cvalue对靶标进行排序,发挥各个方法的优势,从根本上提高药物靶标的预测准确率。

Description

基于蛋白-配体相互作用指纹图谱的药物靶标预测方法
技术领域
本发明涉及计算机辅助药物分子设计领域,特别涉及一种融合分子对接和相互作用指纹谱图进行药物靶标预测的新方法,具体是一种基于蛋白-配体相互作用指纹图谱的药物靶标预测方法。
背景技术
药物靶标鉴定是指通过某种方法发现药物或活性化合物的作用靶标。药物靶标鉴定在药物研发和化学生物学等领域发挥着关键作用,如用于阐明药物作用分子机制、开发老药新用途、发展联合用药新方式等。目前,已经发展了多种药物靶标鉴定的实验方法,其中化学蛋白质组学使用最为广泛。该方法采用了“钓鱼”的思想,先将待测药物固定到生物芯片上或接上生物素标签,去捕获与其紧密结合的蛋白质,然后利用亲和层析等方法将这些蛋白质加以分离,再通过高灵敏度的质谱进行鉴定,最后对其做进一步的生物信息学分析,从而最终确定该药物的作用靶标。然而,化学蛋白质组学方法以及其它的实验方法往往十分耗时,费用昂贵且实施困难。为了节约时间和研究成本,近些年各种计算机辅助药物靶标预测方法被应用到药物靶标鉴定研究中。由于通过计算方法预测靶标需要进一步的实验验证,因此一种杂合方法,即计算方法与实验有机结合,逐渐被推广。在这种杂合的方法中,计算机辅助靶标预测方法常常使用在先,因而它的预测能力对最终药物靶标的成功鉴定起着至关重要的作用。
目前已发展的计算机辅助药物靶标预测方法可大致分为两大类:基于配体和基于结构的方法。基于配体的方法通常是通过计算给定药物或化合物与已知靶标的活性化合物的化学结构相似度,来推测其潜在的作用靶标;若给定药物或化合物与某些活性化合物的相似度高,那么活性化合物的靶标也可能是给定药物或化合物的作用靶标。这类基于配体的方法原理简单且十分有效,但仅局限于化学结构相似性高的情况,同时其无法考虑药物靶标的三维结构,很大程度上限制了其应用范围和准确性。基于结构的方法则是计算药物与潜在靶标在三维结构上的形状及电性匹配,从而推测药物可能的作用靶标。其中,反向对接方法是最为常用的基于结构的靶标预测方法,主要利用分子对接方法预测给定药物或化合物与靶标的相互作用模式及亲和力大小,来对药物靶标进行排序,从而为药物确定可能的作用靶标。这类方法充分考虑了靶标蛋白质的三维结构信息,但分子对接方法本身仍存在一些至今尚无有效解决办法的问题,例如蛋白质柔性、打分函数的精度和溶剂水分子等,这些问题导致反向对接方法的预准确度较低。近些年,有研究提出了集成药物靶标预测策略,即集成基于配体和基于受体方法各自优势进行药物靶标预测。这样的策略一定程度上提高了药物靶标预测的准确性。总之,目前已有的计算机辅助药物靶标预测方法,虽然均具有一些优点,但也存在一些本身难以克服的缺点,导致靶标预测准确度不高,影响了药物靶标鉴定的成功率。因而,目前还需要发展新的药物靶标预测方法,提高靶标预测准确度,从而为药物靶标鉴定提供有效工具。
发明内容
本发明的目的是:提供一种新的药物靶标预测方法。该方法集成了分子对接、蛋白-配体相互作用指纹图谱方法和蛋白-配体亲和力预测方法进行靶标预测,充分考虑所涉及靶标的重要结构特征,提高靶标预测的准确度。
本发明的基本思路是:收集大量的多样化的靶标与配体复合物晶体结构,(简称:复合物),针对每个复合物构建一个参考蛋白-配体相互作用指纹图谱模型,采用分子对接预测待测药物与每个靶标的可能结合模式,据此建立药物与靶标的相互作用指纹图谱模型,并计算这些指纹图谱与参考相互作用指纹图谱模型的相似性以及药物与靶标的亲和力,综合对接打分、指纹谱图相似性和亲和力大小对靶标库的靶标进行排序,输出该药物潜在的靶标。这种思路的基本理论是基于:1)靶标库中靶标与蛋白-配体相互作用指纹图谱模型的多样性和丰富性,这样可以全面地反映复合物结构的相互作用特征,使构建的靶标预测系统具有普适性和实用性;2)蛋白-配体相互作用指纹谱图分析方法,能够全面考虑每个靶标的最关键结构特征,从而能够较准确地对预测的药物与靶标作用模式并对其进行排序,克服了分子对接打分函数无法对药物与靶标作用模式正确排序的问题;3)采用了一种综合的指标对靶标进行排序,该指标集成了对接打分、指纹谱图相似性和亲和力大小,这样既可发挥各个方法自身的优势,又可克服单个方法的局限性,从而有利于提高靶标预测的准确性。
本发明的目的是这样达到的:
收集大量的多样化的靶标与配体复合物晶体结构,将这种靶标与配体复合物晶体结构简称为复合物,针对每个复合物构建一个参考蛋白-配体相互作用指纹图谱模型,采用分子对接预测给定药物与每个靶标的可能结合模式,建立药物与靶标的相互作用指纹图谱模型,计算这些指纹图谱与参考相互作用指纹图谱模型的相似性以及药物与靶标的亲和力,综合对接打分、指纹谱图相似性和亲和力大小对靶标库的靶标进行排序,输出给定药物潜在的靶标。
预测按照如下进行:
(1)首先收集药物靶标,建立药物靶标信息库,通过蛋白质晶体结构数据库,收集所有药物靶标与小分子化合物复合物晶体结构,并根据复合物结构建立活性位点数据库;
(2)根据药物靶标活性位点数据库,利用自主发展的蛋白-配体相互作用指纹图谱方法,分析所有收集的复合物晶体结构中蛋白与小分子化合物的相互作用特征,建立参考相互作用指纹图谱模型库;
(3)采用分子对接方法,预测给定药物或化合物与所有靶标的可能的作用模式,据此建立药物与靶标的相互作用指纹图谱模型;
(4)计算这些指纹图谱与相互作用指纹图谱模型的相似性,并根据相似性值确定药物与靶标的作用模式;
(5)对获得的作用模式,利用蛋白-配体亲和力预测方法预测药物与靶标的亲和力大小;
(6)根据对接打分、指纹谱图相似性和亲和力值,计算综合评价指标Cvalue,并根据Cvalue值对靶标库的所有靶标进行排序,输出给定药物的潜在靶标列表。
药物靶标预测的具体步骤是:
(1)靶标信息库与活性位点数据库的构建:
从TTD、PubMed、PDBbind、ChEMBL、PDB公共免费数据库收集药物靶标的名称、生物类别、相关疾病及药物研发相关信息,建立药物靶标信息库;针对每一个靶标,从蛋白质晶体结构PDB数据库中,收集该靶标-化合物复合物晶体结构,所有结构的精度高于2.5埃,若同一个靶标存在多个复合物晶体结构,选择其中包含不同类别的小分子复合物结构;根据收集的复合物晶体结构,利用自主研发的脚本程序分析每个复合物晶体结构,并自动构建活性位点数据库;
(2)参考相互作用指纹图谱模型库的构建:
根据收集的蛋白-化合物复合物晶体结构和活性位点数据库,利用自主研发的IFP-Analyses软件,分析每个复合物中蛋白质-化合物的相互作用,构建参考相互作用指纹图谱模型数据库;
(3)给定药物与靶标的相互作用指纹图谱模型的计算:
采用分子对接方法预测给定药物或化合物与靶标库中所有靶标的相互作用模式,给定药物与每个靶标将生成10个可能的相互作用模式;针对每一种作用模式,按照参考相互作用指纹图谱的计算方法,计算每一种作用模式下给定药物与靶标相互作用指纹图谱模型,同样存储为.ifp格式文件。
(4)给定药物的预测的相互作用指纹图谱与参考相互作用指纹图谱模型的相似度计算:
对给定药物与每一个靶标的10个预测的相互作用模式,逐一计算其对应的相互作用指纹图谱与参考相互作用指纹图谱模型的相似度,相似度按照以下公式(I)进行计算:
Figure BDA0001286606970000041
公式(I)中IFPscore是给定药物的相互作用指纹图谱与参考相互作用指纹图谱的相似性值;Di是给定药物的相互作用指纹图谱中赋值为“1”的总数目;Ri是参考相互作用指纹图谱中赋值为“1”的总数目;Ci是给定药物的相互作用指纹图谱与参考相互作用指纹图谱中赋值均为“1”的总数目;Wi是对应指纹图谱中每一种相互作用类别的权重;
(5)给定药物与靶标亲和力预测:
对于每个靶标,根据以上计算获得的指纹图谱相似度,输出相似度最高时对应的药物与靶标的作用模式;对这样的药物与靶标的作用模式,采用ID-Score程序进行亲和力预测,输出亲和力预测值IDscore;
(6)靶标的综合排序:
根据分子对接打分、指纹谱图相似度和亲和力预测值计算综合指标Cvalue,并根据Cvalue对靶标进行排序,Cvalue按照公式(II)进行计算;
Figure BDA0001286606970000042
公式(II)中:IFPscore为指纹图谱相似性值,Dscore为分子对接打分值,IDscore为亲和力预测值;μ1表示所有靶标对应的指纹图谱相似性值平均值,μ2表示所有靶标对应的分子对接打分值平均值,μ3表示所有靶标对应的亲和力预测值平均值;σ1表示所有靶标对应的指纹图谱相似性值的标准方差值,σ2表示所有靶标对应的分子对接打分值标准方差值,σ3表示所有靶标对应的亲和力预测值的标准方差值;w1表示指纹图谱相似性值的权重,w2表示分子对接打分值的权重,w3表示亲和力预测值的权重。
所述在步骤(1)根据收集的复合物晶体结构,利用自主研发的脚本程序自动构建活性位点数据库,其流程是:首先,自动识别复合物晶体结构中的小分子化合物,将小分子化合物的坐标中心选为活性位点中心;然后,以小分子化合物的长、宽和高,分别加上6埃的距离为活性位点的大小;选择活性位点范围内所有蛋白质残基为活性位点,将中心坐标、活性位点方格大小及所有残基数据,存储为活性位点文件,格式为.conf。
所述在步骤(2)参考相互作用指纹图谱模型库的构建中,构建参考相互作用指纹图谱模型数据库,其流程是:首先,利用IFP-Analyses分析8种蛋白质活性位点残基与化合物的相互作用,包括氢键供体、氢键受体、正电中心、负电中心、面对面π-π相互作用、面对边π-π相互作用、疏水相互作用和配体-金属离子相互作用,若存在以上任意一种相互作用,对应残基被赋值为1,若没有相互作用,则赋值为0;然后,正电中心、负电中心和配体-金属离子相互作用设定加权值为2,氢键供体、氢键受体、面对面π-π相互作用、面对边π-π相互作用和疏水相互作用设定加权值为1,其中活性位点残基-相互作用赋值-权重共同构成了相互作用指纹图谱;利用以上步骤,对每个靶标复合物结构进行分析,构建参考相互作用指纹图谱模型,将其存储为.ifp格式文件。
本发明的积极效果是:建立丰富而多样的药物靶标数据库,构建基于相互作用指纹图谱的靶标预测方法,采用集成分子对接打分、指纹谱图相似度和亲和力预测值对靶标库靶标进行综合排序。本发明的靶标预测方法,一方面采用了相互作用指纹图谱方法进行药物与靶标相互作用模式进行排序和预测,能够克服分子对接对药物与靶标相互作用模式预测成功率较低的缺点;另一方面采用了综合指标Cvalue对靶标进行排序,整合了相互作用指纹图谱、分子对接和亲和力预测方法,能够从不同角度评价药物与靶标的相互作用,发挥各个方法的优势,从而从根本上提高药物靶标的预测准确率。
附图说明
图1是本发明 基于蛋白-配体相互作用指纹图谱的靶标预测方法工作流程图。
图2是本发明构建的靶标库的分布情况。
图3是本发明实施例中相互作用指纹图谱示例。
具体实施方式
附图1描述了基于蛋白-配体相互作用指纹图谱的靶标预测方法。输入的药物化学结构式,该结构式为优化后的三维结构。根据靶标库的靶标列表,使用构建的程序分别依次调用靶标信息,调用分子对接程序将输入的药物三维结构与靶标Ti活性位点进行对接模拟,生成药物分子与靶标Ti的分子对接构象,本实施例为10个构象。调用构建的程序对分子对接构象进行指纹图谱分析,生成靶标Ti的每个对接构象对应的相互作用指纹图谱,计算靶标Ti的所有对接构象的相互作用指纹图谱与指纹图谱库里面的参考相互作用指纹图谱的相似度,输出相似度最高的靶标Ti的对接构象。此时已获得了该对接构象的对接打分值和指纹图谱相似值,对该构象与靶标Ti的亲和力进行预测,输出该构象的亲和力预测值,由靶标Ti的指纹图谱相似度、对接打分值和亲和力预测值,计算靶标 Ti的综合指标Cvalue,按照上述流程计算给定药物与靶标库中所有靶标的综合指标 Cvalue,并按照Cvalue对所有靶标进行排序,最终给出输入药物的潜在作用靶标列表。实现该流程的具体步骤是:
(1)靶标信息库与活性位点数据库的构建:
参见附图2。从TTD、PubMed、PDBbind、ChEMBL、PDB等公共免费数据库收集药物靶标的名称、生物类别、相关疾病及药物研发相关信息,建立药物靶标信息库,该靶标库共涉及2842个药物靶标,覆盖了10个不同的生物类别,包括酶(enzymes)、调节因子(factors andregulators)、结合蛋白(binding proteins)、转运蛋白(transport proteins)、受体(receptors)、信号蛋白(signaling proteins)、结构蛋白(structural proteins)、病毒蛋白(viral proteins)、离子通道(ion channels)和其它。针对每一个靶标,从蛋白质晶体结构PDB数据库中,收集该靶标-化合物复合物晶体结构,所有结构的精度高于 2.5埃,若同一个靶标存在多个复合物晶体结构,选择其中包含不同类别的小分子复合物结构,要求复合物中小分子化合物具有类药性,类药性小分子的条件包括:1)非离子型小分子;2)氢键供体数目不超过5个;3)氢键受体数目不超过10个;4)分子量小于600道尔顿;5)正电或负电中心不超过5个;6)硫原子不超过1个。根据收集的复合物晶体结构,利用自主研发的脚本程序自动构建活性位点数据库,其流程是:首先,自动识别复合物晶体结构中的小分子化合物,将小分子化合物的坐标中心选为活性位点中心;然后,以小分子化合物的长、宽和高,分别加上6埃的距离为活性位点的大小;选择活性位点范围内所有蛋白质残基为活性位点,将中心坐标、活性位点方格大小及所有残基数据,存储为活性位点文件,即.conf格式。
(2)参考相互作用指纹图谱模型库的构建:
根据上述收集的蛋白-化合物复合物晶体结构和活性位点数据库,利用自主研发的 IFP-Analyses软件,分析每个复合物中蛋白质-化合物的相互作用,构建参考相互作用指纹图谱模型数据库,其流程是:1)利用IFP-Analyses分析8种蛋白质活性位点残基与化合物的相互作用,包括氢键供体(D)、氢键受体(H)、正电中心(P)、负电中心(N)、面对面π-π相互作用(F)、面对边π-π相互作用(E)、疏水相互作用(H)和配体-金属离子相互作用(M)等;2)若活性位点残基与复合物结构中的小分子存在上任意一种相互作用,该残基的对应相互作用类型被赋值为1,若没有相互作用,则赋值为0,按照该方式依次循环活性位点所有残基;3)针对正电中心、负电中心和配体-金属离子相互作用类别设定加权值为2,氢键供体、氢键受体、面对面π-π相互作用、面对边π-π相互作用和疏水相互作用设定加权值为1,这样的活性位点残基-相互作用赋值-权重共同构成了相互作用指纹图谱;4)利用以上步骤,对靶标库每个复合物结构进行分析,构建对应的相互作用指纹图谱(被称为参考相互作用指纹图谱),将其存储为.ifp格式文件。附图3中右图是生成的一个相互作用指纹图谱,代表左图中的复合物活性位点残基 Asn51提供氢键受体、Met98提供疏水基团、Leu103提供氢键受体、Leu107提供疏水基团、Phe138提供面对面π-π相互作用和疏水相互作用、Tyr139提供氢键供体和疏水相互作用、Trp162提供面对边π-π相互作用和疏水相互作用以及Thr184提供氢键供体。
(3)给定药物与靶标的相互作用指纹图谱模型的计算:
采用分子对接方法预测给定药物或化合物与靶标库中所有靶标的相互作用模式,给定药物与每个靶标将生成10个可能的对接构象,每个对接构象对应一个对接打分值Dscore;针对每一种对接构象,按照参考相互作用指纹图谱的计算方法,计算对应的相互作用指纹图谱模型,该指纹图谱模型称为对接构象相互作用指纹图谱,同样存储为.ifp 格式文件。
(4)给定药物的对接构象相互作用指纹图谱与参考相互作用指纹图谱模型的相似度计算:
对给定药物与每一个靶标的10个对接构象,逐一计算其对应的相互作用指纹图谱与参考相互作用指纹图谱模型的相似度IFPscore,相似度按照以下公式(I)进行计算:
Figure BDA0001286606970000081
公式(I)中IFPscore是给定药物的相互作用指纹图谱与参考相互作用指纹图谱的相似性值;Di是给定药物的相互作用指纹图谱中赋值为“1”的总数目;Ri是参考相互作用指纹图谱中赋值为“1”的总数目;Ci是给定药物的相互作用指纹图谱与参考相互作用指纹图谱中赋值均为“1”的总数目;Wi是对应指纹图谱中每一种相互作用类别的权重。
(5)给定药物与靶标亲和力预测:
对于每个靶标,根据以上计算获得的指纹图谱相似度,输出相似度最高时对应的药物与靶标的对接构象;对该对接构象,采用ID-Score程序进行亲和力预测,输出亲和力预测值IDscore。
(6)靶标的综合排序:
根据分子对接打分、指纹谱图相似度和亲和力预测值计算综合指标Cvalue,并根据 Cvalue对靶标进行排序,Cvalue按照公式(II)进行计算;
Figure BDA0001286606970000082
公式(II)中:IFPscore为指纹图谱相似性值,Dscore为分子对接打分值,IDscore为亲和力预测值;μ1表示所有靶标对应的指纹图谱相似性值平均值,μ2表示所有靶标对应的分子对接打分值平均值,μ3表示所有靶标对应的亲和力预测值平均值;σ1表示所有靶标对应的指纹图谱相似性值的标准方差值,σ2表示所有靶标对应的分子对接打分值标准方差值,σ3表示所有靶标对应的亲和力预测值的标准方差值;w1表示指纹图谱相似性值的权重,w2表示分子对接打分值的权重,w3表示亲和力预测值的权重。
通过以上步骤,对于给定的药物,该基于蛋白-配体指纹图谱的靶标预测方法将根据综合指标Cvalue对靶标库所有靶标进行综合排序,输出排名前300名的靶标作为该药物的潜在作用靶标。相信这样的方法将为药物靶标鉴定提供有力工具,提高药物靶标鉴定的效率。本实施例的相互作用指纹图谱如附图3所示。

Claims (4)

1.一种基于蛋白-配体相互作用指纹图谱的药物靶标预测方法,其特征在于:收集大量的多样化的靶标与配体复合物晶体结构,将这种靶标与配体复合物晶体结构简称为复合物,针对每个复合物构建一个参考蛋白-配体相互作用指纹图谱模型,采用分子对接预测给定药物与每个靶标的可能结合模式,建立药物与靶标的相互作用指纹图谱模型,计算这些指纹图谱与参考相互作用指纹图谱模型的相似性以及药物与靶标的亲和力,综合对接打分、指纹谱图相似性和亲和力大小对靶标库的靶标进行排序,输出该药物潜在的靶标;
预测按照如下进行:
(1)首先收集药物靶标,建立药物靶标信息库,通过蛋白质晶体结构数据库,收集所有药物靶标与小分子化合物复合物晶体结构,并根据复合物结构建立活性位点数据库;
(2)根据药物靶标活性位点数据库,利用蛋白-配体相互作用指纹图谱方法,分析所有收集的复合物晶体结构中蛋白与小分子化合物的相互作用特征,建立参考相互作用指纹图谱模型库;
(3)采用分子对接方法,预测给定药物或化合物与所有靶标的可能的作用模式,据此建立药物与靶标的相互作用指纹图谱模型;
(4)计算这些指纹图谱与参考相互作用指纹图谱模型的相似性,并根据相似性值确定药物与靶标的作用模式;
(5)对获得的作用模式,利用蛋白-配体亲和力预测方法预测药物与靶标的亲和力大小;
(6)根据对接打分、指纹谱图相似性和亲和力值,计算综合评价指标Cvalue,并根据Cvalue值对靶标库的所有靶标进行排序,输出给定药物的潜在靶标列表。
2.如权利要求1所述的基于蛋白-配体相互作用指纹图谱的药物靶标预测方法,其特征在于:
药物靶标预测的具体步骤是:
(1)靶标信息库与活性位点数据库的构建:
从TTD、PubMed、PDBbind、ChEMBL、PDB公共免费数据库收集药物靶标的名称、生物类别、相关疾病及药物研发相关信息,建立药物靶标信息库;针对每一个靶标,从蛋白质晶体结构PDB数据库中,收集该靶标-化合物复合物晶体结构,所有结构的精度高于2.5埃,若同一个靶标存在多个复合物晶体结构,选择其中包含不同类别的小分子复合物结构;根据收集的复合物晶体结构,利用脚本程序自动构建活性位点数据库;
(2)参考相互作用指纹图谱模型库的构建:
根据收集的蛋白-化合物复合物晶体结构和活性位点数据库,利用IFP-Analyses软件,分析每个复合物中蛋白质-化合物的相互作用,构建参考相互作用指纹图谱模型数据库;
(3)给定药物与靶标的相互作用指纹图谱模型的计算:
采用分子对接方法预测给定药物或化合物与靶标库中所有靶标的相互作用模式,给定药物与每个靶标将生成10个可能的相互作用模式;针对每一种作用模式,按照参考相互作用指纹图谱的计算方法,计算该作用模式下给定药物与靶标相互作用指纹图谱模型,同样存储为.ifp格式文件;
(4)给定药物的预测的相互作用指纹图谱与参考相互作用指纹图谱模型的相似度计算:
对给定药物与每一个靶标的10个预测的相互作用模式,逐一计算其对应的相互作用指纹图谱与参考相互作用指纹图谱模型的相似度,相似度按照以下公式(I)进行计算:
Figure 1
公式(I)中IFPscore是给定药物的相互作用指纹图谱与参考相互作用指纹图谱的相似性值;Di是给定药物的相互作用指纹图谱中赋值为“1”的总数目;Ri是参考相互作用指纹图谱中赋值为“1”的总数目;Ci是给定药物的相互作用指纹图谱与参考相互作用指纹图谱中赋值均为“1”的总数目;Wi是对应指纹图谱中每一种相互作用类别的权重;
(5)给定药物与靶标亲和力预测:
对于每个靶标,根据以上计算获得的指纹图谱相似度,输出相似度最高时对应的药物与靶标的作用模式;对这样的药物与靶标的作用模式,采用ID-Score程序进行亲和力预测,输出亲和力预测值IDscore;
(6)靶标的综合排序:
根据分子对接打分、指纹谱图相似度和亲和力预测值计算综合指标Cvalue,
并根据Cvalue对靶标进行排序,Cvalue按照公式(II)进行计算;
Figure 2
公式(II)中:IFPscore为指纹图谱相似性值,Dscore为分子对接打分值,IDscore为亲和力预测值;μ1表示所有靶标对应的指纹图谱相似性值平均值,μ2表示所有靶标对应的分子对接打分值平均值,μ3表示所有靶标对应的亲和力预测值平均值;σ1表示所有靶标对应的指纹图谱相似性值的标准方差值,σ2表示所有靶标对应的分子对接打分值标准方差值,σ3表示所有靶标对应的亲和力预测值的标准方差值;w1表示指纹图谱相似性值的权重,w2表示分子对接打分值的权重,w3表示亲和力预测值的权重。
3.如权利要求2所述的药物靶标预测方法,其特征在于:
步骤(1)根据收集的复合物晶体结构,利用脚本程序自动构建活性位点数据库,其流程是:首先,自动识别复合物晶体结构中的小分子化合物,将小分子化合物的坐标中心选为活性位点中心;然后,以小分子化合物的长、宽和高,分别加上6埃的距离为活性位点的大小;选择活性位点范围内所有蛋白质残基为活性位点,将中心坐标、活性位点方格大小及所有残基数据,存储为活性位点文件,格式为.conf。
4.如权利要求2所述的药物靶标预测方法,其特征在于:在步骤(2)参考相互作用指纹图谱模型库的构建中,构建参考相互作用指纹图谱模型数据库,其流程是:首先,利用IFP-Analyses分析8种蛋白质活性位点残基与化合物的相互作用,包括氢键供体、氢键受体、正电中心、负电中心、面对面π-π相互作用、面对边π-π相互作用、疏水相互作用和配体-金属离子相互作用,若存在以上任意一种相互作用,对应残基被赋值为1,若没有相互作用,则赋值为0;然后,正电中心、负电中心和配体-金属离子相互作用设定加权值为2,氢键供体、氢键受体、面对面π-π相互作用、面对边π-π相互作用和疏水相互作用设定加权值为1,其中活性位点残基-相互作用赋值-权重共同构成了相互作用指纹图谱;利用以上步骤,对每个靶标复合物结构进行分析,构建参考相互作用指纹图谱模型,将其存储为.ifp格式文件。
CN201710309067.7A 2017-05-04 2017-05-04 基于蛋白-配体相互作用指纹图谱的药物靶标预测方法 Expired - Fee Related CN107038348B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710309067.7A CN107038348B (zh) 2017-05-04 2017-05-04 基于蛋白-配体相互作用指纹图谱的药物靶标预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710309067.7A CN107038348B (zh) 2017-05-04 2017-05-04 基于蛋白-配体相互作用指纹图谱的药物靶标预测方法

Publications (2)

Publication Number Publication Date
CN107038348A CN107038348A (zh) 2017-08-11
CN107038348B true CN107038348B (zh) 2020-03-10

Family

ID=59538415

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710309067.7A Expired - Fee Related CN107038348B (zh) 2017-05-04 2017-05-04 基于蛋白-配体相互作用指纹图谱的药物靶标预测方法

Country Status (1)

Country Link
CN (1) CN107038348B (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107451423B (zh) * 2017-09-29 2019-09-06 武汉百药联科科技有限公司 一种基于热扩散网络的药物发现方法及其应用
CN108509765A (zh) * 2018-03-26 2018-09-07 中山大学 一种基于fm-n-dnn的药物靶标相互作用预测方法
ES2970582T3 (es) * 2018-10-05 2024-05-29 Nec Oncoimmunity As Procedimiento y sistema para la predicción de la afinidad de unión y procedimiento de generación de un péptido de unión a proteínas candidato
CN109637596B (zh) * 2018-12-18 2023-05-16 广州市爱菩新医药科技有限公司 一种药物靶点预测方法
CN109994150B (zh) * 2019-03-12 2022-11-01 华东师范大学 一种显性表示蛋白口袋表层原子与配体相互作用满足程度的方法
CN110444250A (zh) * 2019-03-26 2019-11-12 广东省微生物研究所(广东省微生物分析检测中心) 基于分子指纹和深度学习的高通量药物虚拟筛选系统
CN110010199B (zh) * 2019-03-27 2021-01-01 华中师范大学 一种分析识别蛋白质特异性药物结合口袋的方法
CN110289055B (zh) * 2019-06-25 2021-09-07 中国人民解放军军事科学院军事医学研究院 药物靶标的预测方法、装置、计算机设备和存储介质
CN110658314B (zh) * 2019-10-12 2021-06-29 四川大学 化合物的靶点的鉴定方法、化合物与靶标相互作用的检测方法和化合物药效的评价方法
CN111326218B (zh) * 2020-03-06 2022-08-05 华东师范大学 一种基于蛋白环境描述小分子片段属性的指纹设计方法
CN111383708B (zh) * 2020-03-11 2023-05-12 中南大学 基于化学基因组学的小分子靶标预测算法及其应用
CN111755081A (zh) * 2020-05-06 2020-10-09 北京化工大学 一种高甲烷吸附率MOFs生成与筛选的方法
CN111599403B (zh) * 2020-05-22 2023-03-14 电子科技大学 一种基于排序学习的并行式药物-靶标相关性预测方法
CN112331279A (zh) * 2020-11-27 2021-02-05 上海商汤智能科技有限公司 信息处理方法及装置、电子设备和存储介质
CN114765060B (zh) * 2021-01-13 2023-12-08 四川大学 预测药物靶标相互作用的多注意力方法
KR20220103440A (ko) * 2021-01-15 2022-07-22 (주) 팜캐드 화합물의 타겟 단백질을 결정하는 방법 및 상기 방법을 수행하는 타겟 단백질 결정 장치
CN113077840B (zh) * 2021-04-21 2023-01-31 四川大学 基于药效团与alpha-碳特征的金属酶活性位点对比方法
CN114446383B (zh) * 2022-01-24 2023-04-21 电子科技大学 一种基于量子计算的配体-蛋白相互作用的预测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102222178A (zh) * 2011-03-31 2011-10-19 清华大学深圳研究生院 一种筛选和/或设计针对多靶标的药物的方法
CN102663214A (zh) * 2012-05-09 2012-09-12 四川大学 一种集成药物靶标预测系统的构建和预测方法
CN106446607A (zh) * 2016-09-26 2017-02-22 华东师范大学 基于相互作用指纹和机器学习的药物靶标的虚拟筛选方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102222178A (zh) * 2011-03-31 2011-10-19 清华大学深圳研究生院 一种筛选和/或设计针对多靶标的药物的方法
CN102663214A (zh) * 2012-05-09 2012-09-12 四川大学 一种集成药物靶标预测系统的构建和预测方法
CN106446607A (zh) * 2016-09-26 2017-02-22 华东师范大学 基于相互作用指纹和机器学习的药物靶标的虚拟筛选方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Development and Validation of a Novel Protein-Ligand Fingerprint To Mine Chemogenomic Space: Application to G Protein-Coupled Receptors and Their Ligands;Nathaniel Weill.et.;《Chemical Information and Modeling》;20091231;第49卷(第4期);第1049-1062页 *
ID-Score: A New Empirical Scoring Function Based on a Comprehensive Set of Descriptors Related to Protein-Ligand Interactions;GuoBo Li.et.;《Chemical Information and Modeling》;20131231;第53卷;第592-600页 *
活性整合指纹图谱技术在中药研究中的应用;马文芳等;《中草药》;20140630;第45卷(第11期);第1637-1642页 *
药物靶标预测技术在中药网络药理学中的应用;吴纯伟等;《中国中药杂志》;20161231;第41卷(第3期);第377-382页 *
蛋白质与配体相互作用分子模拟研究;刘吉元;《中国博士学位论文全文数据库 基础科学辑》;20150315(第3期);第A006-47页 *

Also Published As

Publication number Publication date
CN107038348A (zh) 2017-08-11

Similar Documents

Publication Publication Date Title
CN107038348B (zh) 基于蛋白-配体相互作用指纹图谱的药物靶标预测方法
Liu et al. Pse-Analysis: a python package for DNA/RNA and protein/peptide sequence analysis based on pseudo components and kernel methods
Spitzer et al. Mass cytometry: single cells, many features
Singhal et al. A domain-based approach to predict protein-protein interactions
CN105814573B (zh) 基于定向进化的方法、装置及系统
CN104992079B (zh) 基于采样学习的蛋白质-配体绑定位点预测方法
Bettella et al. Protein secondary structure prediction with SPARROW
Liu et al. SPAR: a random forest-based predictor for self-interacting proteins with fine-grained domain information
JP7126337B2 (ja) 化合物の生物活性を予測するためのプログラム、装置及び方法
US20020072887A1 (en) Interaction fingerprint annotations from protein structure models
Diaz-Flores et al. Evolution of artificial intelligence-powered technologies in biomedical research and healthcare
Li et al. Learning from real imbalanced data of 14-3-3 proteins binding specificity
Chen et al. iEsGene-ZCPseKNC: Identify Essential Genes Based on Z Curve Pseudo $ k $-Tuple Nucleotide Composition
WO2003038672A1 (fr) Technique d'analyse, systeme d'analyse et programme d'analyse
Stukalov et al. Deconvolution of targeted protein–protein interaction maps
Zheng et al. An optimized drug similarity framework for side-effect prediction
You et al. Prediction of protein-protein interactions from amino acid sequences using extreme learning machine combined with auto covariance descriptor
Shinobu et al. Building a macro-mixing dual‑basin Gō model using the Multistate Bennett Acceptance Ratio
Inhester Mining of Interaction Geometries in Collections of Protein Structures
US20230245712A1 (en) Approaches to simulating the interactions of biological systems through the use of modular computational workflows
Yang et al. A machine learning-based approach to identify reliable gold standards for protein complex composition prediction
Stiel et al. Identification of protein scaffolds for enzyme design using scaffold selection
Sarai et al. Developing Genome-Scale Prediction System for Transcription Factors and Their Targets
Goulard Coderc de Lacam et al. Classifying Protein–Protein Binding Affinity with Free-Energy Calculations and Machine Learning Approaches
Moreland et al. An AI‐generated proteome‐scale dataset of predicted protein structures for the ctenophore Mnemiopsis leidyi

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200310

Termination date: 20210504