CN107038348B

CN107038348B - 基于蛋白-配体相互作用指纹图谱的药物靶标预测方法

Info

Publication number: CN107038348B
Application number: CN201710309067.7A
Authority: CN
Inventors: 李国菠; 吴勇; 刘莎; 于竹君
Original assignee: Sichuan University
Current assignee: Sichuan University
Priority date: 2017-05-04
Filing date: 2017-05-04
Publication date: 2020-03-10
Anticipated expiration: 2037-05-04
Also published as: CN107038348A

Abstract

基于蛋白‑配体相互作用指纹图谱的药物靶标预测方法。收集大量的多样化的靶标与配体复合物晶体结构，构建参考蛋白‑配体相互作用指纹图谱模型，采用分子对接预测待测药物与每个靶标的可能结合模式，建立药物与靶标的相互作用指纹图谱模型，计算指纹图谱与参考相互作用指纹图谱模型的相似性以及药物与靶标的亲和力，综合对接打分、指纹谱图相似性和亲和力大小对靶标库的靶标进行排序，输出该药物潜在的靶标。本发明既采用了相互作用指纹图谱方法进行药物与靶标相互作用模式进行排序和预测，克服分子对接对药物与靶标相互作用模式预测成功率较低的缺点；又采用了综合指标Cvalue对靶标进行排序，发挥各个方法的优势，从根本上提高药物靶标的预测准确率。

Description

基于蛋白-配体相互作用指纹图谱的药物靶标预测方法

技术领域

本发明涉及计算机辅助药物分子设计领域，特别涉及一种融合分子对接和相互作用指纹谱图进行药物靶标预测的新方法，具体是一种基于蛋白-配体相互作用指纹图谱的药物靶标预测方法。

背景技术

药物靶标鉴定是指通过某种方法发现药物或活性化合物的作用靶标。药物靶标鉴定在药物研发和化学生物学等领域发挥着关键作用，如用于阐明药物作用分子机制、开发老药新用途、发展联合用药新方式等。目前，已经发展了多种药物靶标鉴定的实验方法，其中化学蛋白质组学使用最为广泛。该方法采用了“钓鱼”的思想，先将待测药物固定到生物芯片上或接上生物素标签，去捕获与其紧密结合的蛋白质，然后利用亲和层析等方法将这些蛋白质加以分离，再通过高灵敏度的质谱进行鉴定，最后对其做进一步的生物信息学分析，从而最终确定该药物的作用靶标。然而，化学蛋白质组学方法以及其它的实验方法往往十分耗时，费用昂贵且实施困难。为了节约时间和研究成本，近些年各种计算机辅助药物靶标预测方法被应用到药物靶标鉴定研究中。由于通过计算方法预测靶标需要进一步的实验验证，因此一种杂合方法，即计算方法与实验有机结合，逐渐被推广。在这种杂合的方法中，计算机辅助靶标预测方法常常使用在先，因而它的预测能力对最终药物靶标的成功鉴定起着至关重要的作用。

目前已发展的计算机辅助药物靶标预测方法可大致分为两大类：基于配体和基于结构的方法。基于配体的方法通常是通过计算给定药物或化合物与已知靶标的活性化合物的化学结构相似度，来推测其潜在的作用靶标；若给定药物或化合物与某些活性化合物的相似度高，那么活性化合物的靶标也可能是给定药物或化合物的作用靶标。这类基于配体的方法原理简单且十分有效，但仅局限于化学结构相似性高的情况，同时其无法考虑药物靶标的三维结构，很大程度上限制了其应用范围和准确性。基于结构的方法则是计算药物与潜在靶标在三维结构上的形状及电性匹配，从而推测药物可能的作用靶标。其中，反向对接方法是最为常用的基于结构的靶标预测方法，主要利用分子对接方法预测给定药物或化合物与靶标的相互作用模式及亲和力大小，来对药物靶标进行排序，从而为药物确定可能的作用靶标。这类方法充分考虑了靶标蛋白质的三维结构信息，但分子对接方法本身仍存在一些至今尚无有效解决办法的问题，例如蛋白质柔性、打分函数的精度和溶剂水分子等，这些问题导致反向对接方法的预准确度较低。近些年，有研究提出了集成药物靶标预测策略，即集成基于配体和基于受体方法各自优势进行药物靶标预测。这样的策略一定程度上提高了药物靶标预测的准确性。总之，目前已有的计算机辅助药物靶标预测方法，虽然均具有一些优点，但也存在一些本身难以克服的缺点，导致靶标预测准确度不高，影响了药物靶标鉴定的成功率。因而，目前还需要发展新的药物靶标预测方法，提高靶标预测准确度，从而为药物靶标鉴定提供有效工具。

发明内容

本发明的目的是：提供一种新的药物靶标预测方法。该方法集成了分子对接、蛋白-配体相互作用指纹图谱方法和蛋白-配体亲和力预测方法进行靶标预测，充分考虑所涉及靶标的重要结构特征，提高靶标预测的准确度。

本发明的基本思路是：收集大量的多样化的靶标与配体复合物晶体结构，(简称：复合物)，针对每个复合物构建一个参考蛋白-配体相互作用指纹图谱模型，采用分子对接预测待测药物与每个靶标的可能结合模式，据此建立药物与靶标的相互作用指纹图谱模型，并计算这些指纹图谱与参考相互作用指纹图谱模型的相似性以及药物与靶标的亲和力，综合对接打分、指纹谱图相似性和亲和力大小对靶标库的靶标进行排序，输出该药物潜在的靶标。这种思路的基本理论是基于：1)靶标库中靶标与蛋白-配体相互作用指纹图谱模型的多样性和丰富性，这样可以全面地反映复合物结构的相互作用特征，使构建的靶标预测系统具有普适性和实用性；2)蛋白-配体相互作用指纹谱图分析方法，能够全面考虑每个靶标的最关键结构特征，从而能够较准确地对预测的药物与靶标作用模式并对其进行排序，克服了分子对接打分函数无法对药物与靶标作用模式正确排序的问题；3)采用了一种综合的指标对靶标进行排序，该指标集成了对接打分、指纹谱图相似性和亲和力大小，这样既可发挥各个方法自身的优势，又可克服单个方法的局限性，从而有利于提高靶标预测的准确性。

本发明的目的是这样达到的：

收集大量的多样化的靶标与配体复合物晶体结构，将这种靶标与配体复合物晶体结构简称为复合物，针对每个复合物构建一个参考蛋白-配体相互作用指纹图谱模型，采用分子对接预测给定药物与每个靶标的可能结合模式，建立药物与靶标的相互作用指纹图谱模型，计算这些指纹图谱与参考相互作用指纹图谱模型的相似性以及药物与靶标的亲和力，综合对接打分、指纹谱图相似性和亲和力大小对靶标库的靶标进行排序，输出给定药物潜在的靶标。

预测按照如下进行：

(1)首先收集药物靶标，建立药物靶标信息库，通过蛋白质晶体结构数据库，收集所有药物靶标与小分子化合物复合物晶体结构，并根据复合物结构建立活性位点数据库；

(2)根据药物靶标活性位点数据库，利用自主发展的蛋白-配体相互作用指纹图谱方法，分析所有收集的复合物晶体结构中蛋白与小分子化合物的相互作用特征，建立参考相互作用指纹图谱模型库；

(3)采用分子对接方法，预测给定药物或化合物与所有靶标的可能的作用模式，据此建立药物与靶标的相互作用指纹图谱模型；

(4)计算这些指纹图谱与相互作用指纹图谱模型的相似性，并根据相似性值确定药物与靶标的作用模式；

(5)对获得的作用模式，利用蛋白-配体亲和力预测方法预测药物与靶标的亲和力大小；

(6)根据对接打分、指纹谱图相似性和亲和力值，计算综合评价指标Cvalue，并根据Cvalue值对靶标库的所有靶标进行排序，输出给定药物的潜在靶标列表。

药物靶标预测的具体步骤是：

(1)靶标信息库与活性位点数据库的构建：

从TTD、PubMed、PDBbind、ChEMBL、PDB公共免费数据库收集药物靶标的名称、生物类别、相关疾病及药物研发相关信息，建立药物靶标信息库；针对每一个靶标，从蛋白质晶体结构PDB数据库中，收集该靶标-化合物复合物晶体结构，所有结构的精度高于2.5埃，若同一个靶标存在多个复合物晶体结构，选择其中包含不同类别的小分子复合物结构；根据收集的复合物晶体结构，利用自主研发的脚本程序分析每个复合物晶体结构，并自动构建活性位点数据库；

(2)参考相互作用指纹图谱模型库的构建：

根据收集的蛋白-化合物复合物晶体结构和活性位点数据库，利用自主研发的IFP-Analyses软件，分析每个复合物中蛋白质-化合物的相互作用，构建参考相互作用指纹图谱模型数据库；

(3)给定药物与靶标的相互作用指纹图谱模型的计算：

采用分子对接方法预测给定药物或化合物与靶标库中所有靶标的相互作用模式，给定药物与每个靶标将生成10个可能的相互作用模式；针对每一种作用模式，按照参考相互作用指纹图谱的计算方法，计算每一种作用模式下给定药物与靶标相互作用指纹图谱模型，同样存储为.ifp格式文件。

(4)给定药物的预测的相互作用指纹图谱与参考相互作用指纹图谱模型的相似度计算：

对给定药物与每一个靶标的10个预测的相互作用模式，逐一计算其对应的相互作用指纹图谱与参考相互作用指纹图谱模型的相似度，相似度按照以下公式(I)进行计算：

公式(I)中IFPscore是给定药物的相互作用指纹图谱与参考相互作用指纹图谱的相似性值；D_i是给定药物的相互作用指纹图谱中赋值为“1”的总数目；R_i是参考相互作用指纹图谱中赋值为“1”的总数目；C_i是给定药物的相互作用指纹图谱与参考相互作用指纹图谱中赋值均为“1”的总数目；W_i是对应指纹图谱中每一种相互作用类别的权重；

(5)给定药物与靶标亲和力预测：

对于每个靶标，根据以上计算获得的指纹图谱相似度，输出相似度最高时对应的药物与靶标的作用模式；对这样的药物与靶标的作用模式，采用ID-Score程序进行亲和力预测，输出亲和力预测值IDscore；

(6)靶标的综合排序：

根据分子对接打分、指纹谱图相似度和亲和力预测值计算综合指标Cvalue，并根据Cvalue对靶标进行排序，Cvalue按照公式(II)进行计算；

公式(II)中：IFPscore为指纹图谱相似性值，Dscore为分子对接打分值，IDscore为亲和力预测值；μ₁表示所有靶标对应的指纹图谱相似性值平均值，μ₂表示所有靶标对应的分子对接打分值平均值，μ₃表示所有靶标对应的亲和力预测值平均值；σ₁表示所有靶标对应的指纹图谱相似性值的标准方差值，σ₂表示所有靶标对应的分子对接打分值标准方差值，σ₃表示所有靶标对应的亲和力预测值的标准方差值；w₁表示指纹图谱相似性值的权重，w₂表示分子对接打分值的权重，w₃表示亲和力预测值的权重。

所述在步骤(1)根据收集的复合物晶体结构，利用自主研发的脚本程序自动构建活性位点数据库，其流程是：首先，自动识别复合物晶体结构中的小分子化合物，将小分子化合物的坐标中心选为活性位点中心；然后，以小分子化合物的长、宽和高，分别加上6埃的距离为活性位点的大小；选择活性位点范围内所有蛋白质残基为活性位点，将中心坐标、活性位点方格大小及所有残基数据，存储为活性位点文件，格式为.conf。

所述在步骤(2)参考相互作用指纹图谱模型库的构建中，构建参考相互作用指纹图谱模型数据库，其流程是：首先，利用IFP-Analyses分析8种蛋白质活性位点残基与化合物的相互作用，包括氢键供体、氢键受体、正电中心、负电中心、面对面π-π相互作用、面对边π-π相互作用、疏水相互作用和配体-金属离子相互作用，若存在以上任意一种相互作用，对应残基被赋值为1，若没有相互作用，则赋值为0；然后，正电中心、负电中心和配体-金属离子相互作用设定加权值为2，氢键供体、氢键受体、面对面π-π相互作用、面对边π-π相互作用和疏水相互作用设定加权值为1，其中活性位点残基-相互作用赋值-权重共同构成了相互作用指纹图谱；利用以上步骤，对每个靶标复合物结构进行分析，构建参考相互作用指纹图谱模型，将其存储为.ifp格式文件。

本发明的积极效果是：建立丰富而多样的药物靶标数据库，构建基于相互作用指纹图谱的靶标预测方法，采用集成分子对接打分、指纹谱图相似度和亲和力预测值对靶标库靶标进行综合排序。本发明的靶标预测方法，一方面采用了相互作用指纹图谱方法进行药物与靶标相互作用模式进行排序和预测，能够克服分子对接对药物与靶标相互作用模式预测成功率较低的缺点；另一方面采用了综合指标Cvalue对靶标进行排序，整合了相互作用指纹图谱、分子对接和亲和力预测方法，能够从不同角度评价药物与靶标的相互作用，发挥各个方法的优势，从而从根本上提高药物靶标的预测准确率。

附图说明

图1是本发明基于蛋白-配体相互作用指纹图谱的靶标预测方法工作流程图。

图2是本发明构建的靶标库的分布情况。

图3是本发明实施例中相互作用指纹图谱示例。

具体实施方式

附图1描述了基于蛋白-配体相互作用指纹图谱的靶标预测方法。输入的药物化学结构式，该结构式为优化后的三维结构。根据靶标库的靶标列表，使用构建的程序分别依次调用靶标信息，调用分子对接程序将输入的药物三维结构与靶标T_i活性位点进行对接模拟，生成药物分子与靶标T_i的分子对接构象，本实施例为10个构象。调用构建的程序对分子对接构象进行指纹图谱分析，生成靶标T_i的每个对接构象对应的相互作用指纹图谱，计算靶标T_i的所有对接构象的相互作用指纹图谱与指纹图谱库里面的参考相互作用指纹图谱的相似度，输出相似度最高的靶标T_i的对接构象。此时已获得了该对接构象的对接打分值和指纹图谱相似值，对该构象与靶标T_i的亲和力进行预测，输出该构象的亲和力预测值，由靶标T_i的指纹图谱相似度、对接打分值和亲和力预测值，计算靶标 T_i的综合指标Cvalue，按照上述流程计算给定药物与靶标库中所有靶标的综合指标 Cvalue，并按照Cvalue对所有靶标进行排序，最终给出输入药物的潜在作用靶标列表。实现该流程的具体步骤是：

(1)靶标信息库与活性位点数据库的构建：

参见附图2。从TTD、PubMed、PDBbind、ChEMBL、PDB等公共免费数据库收集药物靶标的名称、生物类别、相关疾病及药物研发相关信息，建立药物靶标信息库，该靶标库共涉及2842个药物靶标，覆盖了10个不同的生物类别，包括酶(enzymes)、调节因子(factors andregulators)、结合蛋白(binding proteins)、转运蛋白(transport proteins)、受体(receptors)、信号蛋白(signaling proteins)、结构蛋白(structural proteins)、病毒蛋白(viral proteins)、离子通道(ion channels)和其它。针对每一个靶标，从蛋白质晶体结构PDB数据库中，收集该靶标-化合物复合物晶体结构，所有结构的精度高于 2.5埃，若同一个靶标存在多个复合物晶体结构，选择其中包含不同类别的小分子复合物结构，要求复合物中小分子化合物具有类药性，类药性小分子的条件包括：1)非离子型小分子；2)氢键供体数目不超过5个；3)氢键受体数目不超过10个；4)分子量小于600道尔顿；5)正电或负电中心不超过5个；6)硫原子不超过1个。根据收集的复合物晶体结构，利用自主研发的脚本程序自动构建活性位点数据库，其流程是：首先，自动识别复合物晶体结构中的小分子化合物，将小分子化合物的坐标中心选为活性位点中心；然后，以小分子化合物的长、宽和高，分别加上6埃的距离为活性位点的大小；选择活性位点范围内所有蛋白质残基为活性位点，将中心坐标、活性位点方格大小及所有残基数据，存储为活性位点文件，即.conf格式。

(2)参考相互作用指纹图谱模型库的构建：

根据上述收集的蛋白-化合物复合物晶体结构和活性位点数据库，利用自主研发的 IFP-Analyses软件，分析每个复合物中蛋白质-化合物的相互作用，构建参考相互作用指纹图谱模型数据库，其流程是：1)利用IFP-Analyses分析8种蛋白质活性位点残基与化合物的相互作用，包括氢键供体(D)、氢键受体(H)、正电中心(P)、负电中心(N)、面对面π-π相互作用(F)、面对边π-π相互作用(E)、疏水相互作用(H)和配体-金属离子相互作用(M)等；2)若活性位点残基与复合物结构中的小分子存在上任意一种相互作用，该残基的对应相互作用类型被赋值为1，若没有相互作用，则赋值为0，按照该方式依次循环活性位点所有残基；3)针对正电中心、负电中心和配体-金属离子相互作用类别设定加权值为2，氢键供体、氢键受体、面对面π-π相互作用、面对边π-π相互作用和疏水相互作用设定加权值为1，这样的活性位点残基-相互作用赋值-权重共同构成了相互作用指纹图谱；4)利用以上步骤，对靶标库每个复合物结构进行分析，构建对应的相互作用指纹图谱(被称为参考相互作用指纹图谱)，将其存储为.ifp格式文件。附图3中右图是生成的一个相互作用指纹图谱，代表左图中的复合物活性位点残基 Asn51提供氢键受体、Met98提供疏水基团、Leu103提供氢键受体、Leu107提供疏水基团、Phe138提供面对面π-π相互作用和疏水相互作用、Tyr139提供氢键供体和疏水相互作用、Trp162提供面对边π-π相互作用和疏水相互作用以及Thr184提供氢键供体。

(3)给定药物与靶标的相互作用指纹图谱模型的计算：

采用分子对接方法预测给定药物或化合物与靶标库中所有靶标的相互作用模式，给定药物与每个靶标将生成10个可能的对接构象，每个对接构象对应一个对接打分值Dscore；针对每一种对接构象，按照参考相互作用指纹图谱的计算方法，计算对应的相互作用指纹图谱模型，该指纹图谱模型称为对接构象相互作用指纹图谱，同样存储为.ifp 格式文件。

(4)给定药物的对接构象相互作用指纹图谱与参考相互作用指纹图谱模型的相似度计算：

对给定药物与每一个靶标的10个对接构象，逐一计算其对应的相互作用指纹图谱与参考相互作用指纹图谱模型的相似度IFPscore，相似度按照以下公式(I)进行计算：

公式(I)中IFPscore是给定药物的相互作用指纹图谱与参考相互作用指纹图谱的相似性值；D_i是给定药物的相互作用指纹图谱中赋值为“1”的总数目；R_i是参考相互作用指纹图谱中赋值为“1”的总数目；C_i是给定药物的相互作用指纹图谱与参考相互作用指纹图谱中赋值均为“1”的总数目；W_i是对应指纹图谱中每一种相互作用类别的权重。

(5)给定药物与靶标亲和力预测：

对于每个靶标，根据以上计算获得的指纹图谱相似度，输出相似度最高时对应的药物与靶标的对接构象；对该对接构象，采用ID-Score程序进行亲和力预测，输出亲和力预测值IDscore。

(6)靶标的综合排序：

根据分子对接打分、指纹谱图相似度和亲和力预测值计算综合指标Cvalue，并根据 Cvalue对靶标进行排序，Cvalue按照公式(II)进行计算；

通过以上步骤，对于给定的药物，该基于蛋白-配体指纹图谱的靶标预测方法将根据综合指标Cvalue对靶标库所有靶标进行综合排序，输出排名前300名的靶标作为该药物的潜在作用靶标。相信这样的方法将为药物靶标鉴定提供有力工具，提高药物靶标鉴定的效率。本实施例的相互作用指纹图谱如附图3所示。

Claims

1.一种基于蛋白-配体相互作用指纹图谱的药物靶标预测方法，其特征在于：收集大量的多样化的靶标与配体复合物晶体结构，将这种靶标与配体复合物晶体结构简称为复合物，针对每个复合物构建一个参考蛋白-配体相互作用指纹图谱模型，采用分子对接预测给定药物与每个靶标的可能结合模式，建立药物与靶标的相互作用指纹图谱模型，计算这些指纹图谱与参考相互作用指纹图谱模型的相似性以及药物与靶标的亲和力，综合对接打分、指纹谱图相似性和亲和力大小对靶标库的靶标进行排序，输出该药物潜在的靶标；

预测按照如下进行：

(2)根据药物靶标活性位点数据库，利用蛋白-配体相互作用指纹图谱方法，分析所有收集的复合物晶体结构中蛋白与小分子化合物的相互作用特征，建立参考相互作用指纹图谱模型库；

(4)计算这些指纹图谱与参考相互作用指纹图谱模型的相似性，并根据相似性值确定药物与靶标的作用模式；

2.如权利要求1所述的基于蛋白-配体相互作用指纹图谱的药物靶标预测方法，其特征在于：

药物靶标预测的具体步骤是：

(1)靶标信息库与活性位点数据库的构建：

从TTD、PubMed、PDBbind、ChEMBL、PDB公共免费数据库收集药物靶标的名称、生物类别、相关疾病及药物研发相关信息，建立药物靶标信息库；针对每一个靶标，从蛋白质晶体结构PDB数据库中，收集该靶标-化合物复合物晶体结构，所有结构的精度高于2.5埃，若同一个靶标存在多个复合物晶体结构，选择其中包含不同类别的小分子复合物结构；根据收集的复合物晶体结构，利用脚本程序自动构建活性位点数据库；

(2)参考相互作用指纹图谱模型库的构建：

根据收集的蛋白-化合物复合物晶体结构和活性位点数据库，利用IFP-Analyses软件，分析每个复合物中蛋白质-化合物的相互作用，构建参考相互作用指纹图谱模型数据库；

(3)给定药物与靶标的相互作用指纹图谱模型的计算：

采用分子对接方法预测给定药物或化合物与靶标库中所有靶标的相互作用模式，给定药物与每个靶标将生成10个可能的相互作用模式；针对每一种作用模式，按照参考相互作用指纹图谱的计算方法，计算该作用模式下给定药物与靶标相互作用指纹图谱模型，同样存储为.ifp格式文件；

(5)给定药物与靶标亲和力预测：

(6)靶标的综合排序：

根据分子对接打分、指纹谱图相似度和亲和力预测值计算综合指标Cvalue，

并根据Cvalue对靶标进行排序，Cvalue按照公式(II)进行计算；

3.如权利要求2所述的药物靶标预测方法，其特征在于：

步骤(1)根据收集的复合物晶体结构，利用脚本程序自动构建活性位点数据库，其流程是：首先，自动识别复合物晶体结构中的小分子化合物，将小分子化合物的坐标中心选为活性位点中心；然后，以小分子化合物的长、宽和高，分别加上6埃的距离为活性位点的大小；选择活性位点范围内所有蛋白质残基为活性位点，将中心坐标、活性位点方格大小及所有残基数据，存储为活性位点文件，格式为.conf。

4.如权利要求2所述的药物靶标预测方法，其特征在于：在步骤(2)参考相互作用指纹图谱模型库的构建中，构建参考相互作用指纹图谱模型数据库，其流程是：首先，利用IFP-Analyses分析8种蛋白质活性位点残基与化合物的相互作用，包括氢键供体、氢键受体、正电中心、负电中心、面对面π-π相互作用、面对边π-π相互作用、疏水相互作用和配体-金属离子相互作用，若存在以上任意一种相互作用，对应残基被赋值为1，若没有相互作用，则赋值为0；然后，正电中心、负电中心和配体-金属离子相互作用设定加权值为2，氢键供体、氢键受体、面对面π-π相互作用、面对边π-π相互作用和疏水相互作用设定加权值为1，其中活性位点残基-相互作用赋值-权重共同构成了相互作用指纹图谱；利用以上步骤，对每个靶标复合物结构进行分析，构建参考相互作用指纹图谱模型，将其存储为.ifp格式文件。