CN102930181A - 基于分子描述符的蛋白质-配体亲和力预测方法 - Google Patents

基于分子描述符的蛋白质-配体亲和力预测方法 Download PDF

Info

Publication number
CN102930181A
CN102930181A CN2012104409102A CN201210440910A CN102930181A CN 102930181 A CN102930181 A CN 102930181A CN 2012104409102 A CN2012104409102 A CN 2012104409102A CN 201210440910 A CN201210440910 A CN 201210440910A CN 102930181 A CN102930181 A CN 102930181A
Authority
CN
China
Prior art keywords
protein
descriptor
affinity
atom
molecule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012104409102A
Other languages
English (en)
Other versions
CN102930181B (zh
Inventor
杨胜勇
李国菠
李琳丽
杨羚羚
魏于全
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
Original Assignee
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University filed Critical Sichuan University
Priority to CN201210440910.2A priority Critical patent/CN102930181B/zh
Publication of CN102930181A publication Critical patent/CN102930181A/zh
Application granted granted Critical
Publication of CN102930181B publication Critical patent/CN102930181B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)

Abstract

基于分子描述符的蛋白质-配体亲和力预测方法。构建完善而系统的分子描述符反映蛋白质-配体亲和力,采用支持向量回归的方法建立描述符与亲和力的关系。步骤是:a、训练集的准备:准备大量同时包含蛋白质-配体复合物晶体结构及其亲和力数据。b、分子描述符的构建与计算:构建50种九类不同的分子描述符,计算出训练集中所有复合物描述符的具体值。c、回归模型的建立;采用支持向量回归方法拟合描述符与亲和力之间的关系,引入共轭梯度法来优化其惩罚因子C和核函数参数。d、组建新型的打分函数,用于预测复合物的亲和力。本发明具有预测能力强、靶点依赖性小、对同系物敏感性高等优点。

Description

基于分子描述符的蛋白质-配体亲和力预测方法
一、技术领域
本发明涉及计算机辅助药物分子设计领域,特别涉及一种基于分子描述符的蛋白质-配体亲和力预测方法。
二、背景技术
在基于结构的药物设计中,例如分子对接和从头设计,预测蛋白质靶标与其配体之间的结合亲和力通常采用打分函数打分的方法。迄今为止,打分函数大致可以分为三类:基于力场、基于知识和基于经验,而其中以基于经验的打分函数打分最受青睐。基于经验的打分函数通常是由多种蛋白质和配体相互作用相关的物理化学项组成,如范德华力、氢键、静电以及金属-配体键能等。这些项的系数往往通过多重线性回归拟合而来。可见,基于经验的打分函数原理简单且计算高效。然而,目前采用基于经验的打分函数打分的方法仍存在一些不足,如预测值与实验值相关性不佳、靶点依赖性大和对同系物敏感性差等。诸多因素可导致这些问题,其中至少包括以下三个方面。第一,用于拟合打分函数各项系数的训练集中蛋白质和配体晶体结构复合物的数目以及多样性不够,这可能导致构建的打分函数对不同蛋白质靶标的预测能力差异较大。第二,打分函数所包含的蛋白质和配体相互作用的项数十分有限,通常少于20项,不足以全面反映蛋白质和配体相互作用。第三,打分函数各项系数通常是由线性回归获得,而线性回归要求各项必须独立,但事实上打分函数各项会相互影响。因此,目前仍然需要发展新的蛋白质-配体亲和力预测方法,以克服当前打分函数存在的问题,从而促进基于结构的药物设计方法在新药研发中的应用,并进而推动创新药物的研发。
三、发明内容
本发明的目的是:提供一种全新的蛋白质-配体亲和力预测方法。这种方法属于一种基于经验的打分函数打分方法,是基于蛋白质和配体之间相互作用的分子描述符,采用支持向量回归的方法来建立描述符与蛋白质-配体亲和力的关系。该方法克服了现有技术中预测值与实验值相关性不佳、靶点依赖性大和对同系物敏感性差等不足。
本发明的基本思路是:收集大量的多样化的蛋白质-配体复合物晶体结构(简称:复合物)及其结合亲和力(简称:亲和力)实验值作为训练集,构建完善而系统的分子描述符,藉以完整地反映蛋白质-配体相互作用,计算训练集中所有蛋白质-配体相互作用分子描述符,采用支持向量回归(SVR, Supporting Vector Regression)的方法来拟合描述符与亲和力之间的关系,从而用于预测给定复合物的亲和力。这种思路的基本理论是基于:(1)训练集的大小、质量以及多样性直接影响着基于经验的打分函数的预测能力。因此,收集大量且多样的复合物结构是至关重要的,这样可以更全面反映多种复合物结构的相互作用特征,从而使打分函数适合更多生物类型的复合物亲和力预测,减少对不同类型的复合物预测能力差异较大的现象。(2)构建若干分子描述符,藉以全面反映蛋白质-配体相互作用。一方面,对于非常重要的相互作用,如范德华力和氢键,分别构建不同原子类型之间的分子描述符;另一方面,充分考虑与蛋白质-配体相互作用密切相关的因素,如疏水效应、熵效应、形状匹配以及表面匹配。这样不仅可以提高打分函数的预测能力,而且可以提高对结构差异小的同系物预测的敏感度。(3)利用支持向量回归的方法来拟合描述符与复合物亲和力的关系,支持向量回归是一种优秀的机器学习方法,可以解决线性回归无法处理相互作用耦合项的关键技术问题,从根本上提高打分函数对复合物亲和力的预测能力。
本发明的目的是这样达到的:一种基于分子描述符的蛋白质-配体亲和力全新预测方法,其特征在于:收集大量的多样化的蛋白质和配体复合物晶体结构及其结合亲和力实验值,构建全面综合的分子描述符藉以反映复合物亲和力,并采用支持向量回归的方法建立描述符与亲和力的关系,从而用于预测给定复合物的亲和力的方法。包括如下四个步骤:(1)训练集的准备:训练集的准备采用同时包含复合物及其亲和力的数据,每个复合物中蛋白质结构和配体结构分别保存在同一个文件夹,蛋白质结构以PDB格式保存,而配体以mol2格式保存。(2)描述符的计算;构建若干蛋白质和配体相互作用相关的分子描述符,这些描述符分别属于九种不同的类型:范德华相互作用、静电相互作用、氢键相互作用、π键相互作用、金属键相互作用、去溶剂效应、熵效应、表面匹配和形状匹配。不同类型的描述符对应不同的计算公式或计算方法,描述符的计算通过编写程序完成。(3)回归模型的建立;采用支持向量回归的方法来建立描述符与亲和力之间的回归模型,在回归过程中引入共轭梯度法来优化支持向量回归中两个重要的参数,即惩罚因子C和核函数γ。(4)基于回归模型建立新型的打分函数,预测复合物的亲和力。
在步骤(1)训练集的准备中,训练集总共包含2278个复合物结构及其亲和力数据;在步骤(2)描述符的构建中,共构建50种蛋白质-配体相互作用相关的描述符。用于计算描述符的程序简要步骤如下:
1)读入训练集复合物名单,并依次调用复合物;
2)分别读入复合物中蛋白质结构和配体结构;
3)调用力场参数文件,并为蛋白质结构和配体结构赋力场参数;
4)定义蛋白质结构活性中心和网格;
5)计算出50种与蛋白质和配体相互作用的描述符;
6)若训练集复合物名单未循环完毕,则返回第一步;
7)输出训练集所有复合物对应的50种描述符具体值。
在步骤(3)回归模型的建立中,引入了共轭梯度法优化惩罚因子C和核函数γ的值的程序是:
1)将训练集中复合物的亲和力实验值与对应的50种描述符值作为输入文件;
2)重新标度描述符值至-1到+1这个区间;
3)初始化惩罚因子C和核函数γ的值;
4)调用支持向量回归SVR程序,建立回归模型,并计算得到一组亲和力预测值;
5)计算训练集中复合物的亲和力实验值与预测值之间的相关系数;
6)根据相关系数值,通过共轭梯度法优化惩罚因子C和核函数γ的值,得到一组新的C和γ值,返回第五步;
7)符合条件时,循环终止;
8)输出最优的回归模型;
在步骤(4)建立新型的打分函数,预测复合物的亲和力的程序如下:
1)分别读入给定复合物中蛋白质结构和配体结构;
2)调用力场参数文件,并为蛋白质结构和配体结构赋力场参数;
3)定义蛋白质结构活性中心和网格;
4)计算出50种与蛋白质和配体相互作用的描述符,
5)将描述符值重新标度至-1到+1这个区间;
6)输入最佳惩罚因子C和核函数γ的值,并读入最佳支持向量回归模型;
7)调用支持向量回归SVR程序;
8)输出给定复合物亲和力的预测值。
本发明的积极效果是:
本发明的方法属于基于经验打分函数打分的方法,其基本功能是预测蛋白质和配体之间亲和力大小。相对以前的经验打分函数打分方法,本发明具有三方面的优势。第一,该方法对蛋白质-配体亲和力预测能力较强;第二,该方法对不同生物类型的蛋白质-配体亲和力的预测差异较小,即生物蛋白靶点依赖性较小,适用于大多数类型的蛋白质-配体亲和力预测;第三,该方法能较好地区分结构差异小的同系物与其靶点的亲和力大小,特别适用于先导化合物优化中。
四、附图说明
图1分子描述符计算的工作流程图。
图2回归模型建立的工作流程图。
图3打分函数进行打分预测的工作流程图。
五、具体实施方式
本发明方法属于基于经验打分函数打分的方法,通过收集2278个多样化的蛋白质和配体复合物晶体结构及其结合亲和力实验值,构建50个完善而系统的蛋白质和配体相互作用相关的分子描述符来反映复合物亲和力,并采用支持向量回归的方法建立描述符与复合物亲和力的关系,从而构建经验打分函数用于预测给定复合物的亲和力。
具体步骤如下:
(1)训练集的准备:
训练集总共包含2278个复合物结构及其亲和力数据。每个复合物中蛋白质结构和配体结构分别以PDB ID号命名并保存在同一个文件夹,其中蛋白质结构以PDB格式保存,而配体以格式保存,以便后续程序调用。
(2)描述符的构建与计算:
构建并计算全面综合的蛋白质和配体相互作用相关描述符是本发明打分函数的核心部分。本发明总共构建了50种与蛋白质-配体相互作用相关的描述符(详见表一),这些描述符分属于九种类型:范德华相互作用、静电相互作用、氢键相互作用、π键相互作用、金属键相互作用、熵效应、去溶剂效应、表面匹配和形状匹配。
描述符的分类如表一。
表一
Figure BDA0000236681251
上述表一中,所有描述符的计算均通过自主编写程序完成,步骤如下:
1)读入训练集复合物名单,并依次调用复合物;
2)分别读入复合物中蛋白质结构和配体结构;
3)调用力场参数文件,并为蛋白质结构和配体结构赋力场参数;
4)定义蛋白质结构活性中心和网格;
5)计算出50种与蛋白质和配体相互作用的描述符,分属于9种不同的类别。每一类描述符的具体计算公式或计算方法如下:
第一类:范德华力相互作用相关描述符,由公式(1)计算得到,公式(1)为:
K I - J vdW = Σ i ∈ I Σ j ∈ J [ ( r i + r j d ij ) 12 - ( r i + r j d ij ) 6 ] - - - ( 1 )
公式(1)中,
Figure BDA0000236681253
表示蛋白质的原子类型I与配体的原子类型J之间的范德华力描述符(有关原子类型信息,详见表二)。ri和rj分别是指蛋白质原子i与配体原子j的范德华力半径。dij表示蛋白质原子i与配体原子j之间的距离。本发明中共考虑了20种范德华力相关描述符(见表一)。
原子类型列表如表二。
表二
Figure BDA0000236681254
第二类:氢键相互作用相关描述符,由公式(2)计算得到,公式(2)为:
K A - D hbond = Σ A Σ D [ ( r 0 d A - D ) 12 - 2 ( r 0 d A - D ) 6 ] * cos 2 ( θ - θ 0 ) - - - ( 2 )
公式(2)中,表示蛋白质的不同原子类型的氢键受体与配体的不同原子类型氢键给体之间的氢键描述符。A代表氢键受体,D代表氢键给体,dA-D代表氢键受体与给体之间距离。r0和θ0表示不同原子类型的氢键给体与受体之间的最佳距离和角度。本发明中共考虑了10种氢键相关描述符(见表一)。
第三类:静电相互作用相关描述符,由公式(3)计算得到,公式(3)为:
K pos - neg elect = q pos q neg d pos , neg - - - ( 3 )
公式(3)中,
Figure BDA0000236681258
表示静电相互作用描述符,dpos,neg代表蛋白质和配体对应正电中心与负电中心的距离。qpos和qneg分别代表正电中心与负电中心所带电荷电量。
第四类:π(或称为共轭系统)相关作用描述符,π相关作用在蛋白质-配体的相互作用中起到至关重要的作用,例如,卤素-π相互作用、π-π相互作用以及电负原子-π相互作用。然而,准确定量这些π相关作用是十分困难的。因此,本发明选择了一种简单有效的方法来表示π相关作用,即计算存在的卤素-π相互作用、π-π相互作用以及电负原子-π相互作用的个数。
第五类:金属-配体相互作用相关描述符,由公式(4)和(5)计算得到:
K L - M metal = Σ i ∈ L Σ j ∈ M δ ( d ij ) - - - ( 4 )
Figure BDA00002366812510
在公式(4)中,
Figure BDA00002366812511
代表配体的原子类型L与蛋白质中金属离子之间相互作用描述符,dij 表示配体原子i与金属离子j之间的距离。
第六类:去溶剂化效应相关描述符,本发明共采用了六个描述符来表征去溶剂化效应,它们分别是:1,
Figure BDA00002366812512
,配体的logP值,由分子中各个原子的贡献之和,其中每个原子的贡献可由它在分子中所占的可及表面积S、所占的范氏体积V以及它的部分电荷q这些微观参数来计算;2,
Figure BDA00002366812513
,配体的极性表面积,由极性片段的极性表面积加和而来,各种极性片段的极性表面积从文献查阅得到;3,
Figure BDA00002366812514
, 配体的体积,通过格点法计算得到;4,
Figure BDA00002366812515
,蛋白质活性口袋的极性原子与非极性原子的比值,与的计算方法一致;5, 
Figure BDA00002366812517
,配体的溶剂可及化表面积,通过以水分子为探针循环格点的方式计算得到; 6,
Figure BDA00002366812518
,蛋白质活性口袋的溶剂可及化表面积,与的计算方法一致。
第七类:熵效应相关描述符,由公式(6)计算得到,公式(6)为:
K lig conf = N rot + Σr [ P nl ( r ) + P nl ′ ( r ) ] / 2 - - - ( 6 )
在公式(6)中,Nrot 表示配体结构中被冻结化学键的数目(在配体结构中某可旋转化学键两端的原子均与蛋白质存在相互作用,则该化学键就称为被冻结化学键),Pnl(r)和P′nl(r)是指配体结构中某可旋转化学键两端重原子的比例。
第八类:形状匹配相关描述符,由公式(7)和(8)计算得到:
K SM shape = ( Σ i ∈ L , j ∈ P δ ij ) / N Latom - - - ( 7 )
δ ij = 1 d ij ≤ | r i + r j ± ϵ | 0 d ij > | r i + r j ± ϵ | - - - ( 8 )
在公式(7)中,
Figure BDA00002366812523
表示形状匹配相关描述符,NLatom 表示配体重原子数目。
在公式(8)中,ri 和rj分别表示原子i和原子j的范德华半径,dij表示原子i和原子j之间的距离,ε表示原子i和原子j之间的碰撞容忍度,在本发明中ε设置为0.4 埃
Figure BDA00002366812524
第九类:表面匹配描述符,其算法简述如下:首先,根据原子类型定义三种表面极性特征:正极性、负极性以及非极性(详见表二),并赋给蛋白质和配体;接着,计算每个格点与蛋白质活性口袋的原子以及配体的原子之间的距离,若某格点与某一个蛋白质原子的距离小于其范德华半径加0.5 埃
Figure BDA00002366812525
,并且与另一个配体原子的距离小于范德华半径加0.5 埃
Figure BDA00002366812526
,那么该格点被标记;然后,被标记的格点根据相应的蛋白质原子以及配体原子表面极性特征进行分类,共分六类,分别是正极性-正极性、正极性-负极性、负极性-负极性、正极性-非极性、负极性-非极性和非极性-非极性;最后,分别统计六类中被标记格点的数目,即为六个不同的描述符的值。
6)若训练集复合物名单未循环完毕,则返回第一步;
7)输出训练集所有复合物对应的50种描述符具体值。
(3)回归模型的建立:
在回归模型的建立过程中,本发明采用改进后支持向量回归方法完成,由自主研发的CG-SVR程序完成,步骤如下:
1)将训练集中复合物的亲和力实验值与对应的50种描述符值作为输入文件;
2)重新标度描述符值至-1到+1这个区间;
3)初始化惩罚因子C和核函数γ的值;
4)调用支持向量回归SVR程序,得到一组亲和力预测值;
5)计算训练集中复合物的亲和力实验值与预测值之间的相关系数;
6)根据相关系数值,通过共轭梯度法优化惩罚因子C和核函数γ的值,得到一组新的C和γ值,返回第五步;
7)符合条件时,循环终止;
8)输出最优的回归模型。
(4)打分函数进行打分预测:
本发明的打分函数是建立在描述符的计算和回归模型的基础之上,通过自主编写程序完成,步骤如下:
1)分别读入给定复合物中蛋白质结构和配体结构;
2)调用力场参数文件,并为蛋白质结构和配体结构赋力场参数;
3)定义蛋白质结构活性中心和网格;
4)按照上述方法计算出50种与蛋白质-配体相互作用的描述符;
5)按照回归过程中相同的方法,将描述符值归化至-1到+1这个区间;
6)输入最佳惩罚因子C和核函数γ的值,并读入最佳回归模型;
7)调用支持向量回归SVR程序;
8)输出给定复合物亲和力的预测值。

Claims (3)

1.一种基于分子描述符的蛋白质-配体亲和力预测方法,其特征在于:收集大量的多样化的蛋白质-配体复合物晶体结构及其结合亲和力数据,构建完善而系统的分子描述符藉以全面反映蛋白质-配体亲和力,并采用支持向量回归的方法建立分子描述符与亲和力的关系,从而用于预测给定复合物的亲和力,包括如下四个步骤:
(1)训练集的准备:训练集的准备采用同时包含复合物及其亲和力的数据,每个复合物中蛋白质结构和小分子配体结构分别保存在同一个文件夹,蛋白质结构以PDB格式保存,而配体以格式保存;
(2)分子描述符的分类构建与计算;构建若干蛋白质-配体相互作用相关的分子描述符,这些描述符分别属于九种不同的类型:范德华相互作用、静电相互作用、氢键相互作用、π键相互作用、金属键相互作用、去溶剂效应、熵效应、表面匹配和形状匹配,不同类型的分子描述符对应不同的计算公式或计算方法,描述符的计算通过编写程序完成;
(3)回归模型的建立;采用支持向量回归方法来拟合描述符与亲和力之间的关系,即建立回归模型;在回归模型建立过程中,引入共轭梯度法来优化惩罚因子C和核函数参数γ的值
(4)在描述符计算和回归模型的基础之上,组建新型的打分函数,预测复合物的亲和力。
2.如权利要求1所述的方法,其特征在于:在步骤(1)训练集的准备中,训练集总共包含2278个复合物结构及其亲和力数据;
在步骤(2)描述符的构建与分类计算中,构建50种蛋白质-配体相互作用相关的分子描述符,描述符的计算程序如下:
1)读入训练集复合物名单,并依次调用复合物;
2)分别读入复合物中蛋白质结构和小分子配体结构;
3)调用力场参数文件,并为蛋白质结构和配体结构赋力场参数;
4)定义蛋白质结构活性中心和网格;
5)计算出50种与蛋白质-配体相互作用的分子描述符;
6)若训练集复合物名单未循环完毕,则返回第一步;
7)输出训练集所有复合物对应的50种描述符具体值;
在步骤(3)回归模型的建立中,引入共轭梯度法优化惩罚因子C和核参数γ的值的程序是:
1)将训练集中复合物的亲和力实验值与对应的50种描述符值作为输入文件;
2)重新标度描述符值至-1到+1这个区间;
3)初始化惩罚因子C和核函数γ的值;
4)调用支持向量回归SVR程序,得到一组亲和力预测值;
5)计算训练集中复合物的亲和力实验值与预测值之间的相关系数;
6)根据相关系数值,通过共轭梯度法优化惩罚因子C和核函数γ的值,得到一组新的C和γ值,返回第五步;
7)符合条件时,循环终止;
8)输出最优的回归模型;
在步骤(4)建立新型的打分函数,预测复合物的亲和力的程序如下:
1)分别读入给定复合物中蛋白质结构和小分子配体结构;
2)调用力场参数文件,并为蛋白质结构和小分子配体结构赋力场参数;
3)定义蛋白质结构活性中心和网格;
4)计算出50种与蛋白质-配体相互作用的分子描述符,
5)将描述符值重新标度至-1到+1这个区间;
6)输入最佳惩罚因子C和核函数γ的值,并读入最佳回归模型;
7)调用支持向量回归SVR程序;
8)输出给定复合物亲和力的预测值。
3.如权利要求1所述的方法,其特征在于:所述分子描述符分属于九种类型,其每一类描述符的具体计算公式或计算方法如下:
第一类,范德华力相互作用描述符的计算,由公式(1)得到,公式(1)为:
K I - J vdW = Σ i ∈ I Σ j ∈ J [ ( r i + r j d ij ) 12 - ( r i + r j d ij ) 6 ] - - - ( 1 )
公式(1)中,
Figure FDA0000236681242
表示蛋白质的原子类型I与配体的原子类型J之间的范德华力描述符,ri和rj分别是指蛋白质原子i与小分子原子j的范德华力半径。dij表示蛋白质原子i与小分子原子j之间的距离;
第二类,氢键相互作用描述符的计算,由公式(2)得到,公式(2)为:
K A - D hbond = Σ A Σ D [ ( r 0 d A - D ) 12 - 2 ( r 0 d A - D ) 6 ] * cos 2 ( θ - θ 0 ) - - - ( 2 )
公式(2)中,
Figure FDA0000236681244
表示蛋白质的不同原子类型的氢键受体与配体的不同原子类型氢键给体之间的氢键描述符,A代表氢键受体,D代表氢键给体,dA-D代表氢键受体与给体之间距离,r0和θ0表示不同原子类型的氢键给体与受体之间的最佳距离和角度;
第三类,静电相互作用描述符的计算,由公式(3)得到,公式(3)为:
K pos - neg elect = q pos q neg d pos , neg - - - ( 3 )
公式(3)中,
Figure FDA0000236681246
表示静电相互作用描述符,dpos,neg代表蛋白质和配体对应正电中心与负电中心的距离,qpos和qneg分别代表正电中心与负电中心所带电荷电量;
第四类,π键相互作用描述符,采用计算存在的卤素-π相互作用、π-π相互作用以及电负原子-π相互作用的个数的方法得到;
第五类,金属键相互作用描述符的计算,由公式(4)和(5)得到:
K L - M metal = Σ i ∈ L Σ j ∈ M δ ( d ij ) - - - ( 4 )
Figure FDA0000236681248
式中,
Figure FDA0000236681249
代表配体的原子类型L与蛋白质中金属离子之间相互作用描述符,dij 表示配体原子i与金属离子j之间的距离;
第六类,去溶剂效应描述符的技术,采用了六个描述符来表征去溶剂化效应,它们分别是:
ⅰ),,配体的logP值,由分子中各个原子的贡献之和,其中每个原子的贡献可由它在分子中所占的可及表面积S、所占的范氏体积V以及它的部分电荷q这些微观参数来计算;
ⅱ),
Figure FDA00002366812411
,配体的极性表面积,由极性片段的极性表面积加和而来,各种极性片段的极性表面积从文献查阅得到;
ⅲ),
Figure FDA00002366812412
, 配体的体积,通过格点法计算得到;
ⅳ),
Figure FDA00002366812413
,蛋白质活性口袋的极性原子与非极性原子的比值,与的计算方法一致;
ⅴ), ,配体的溶剂可及化表面积,通过以水分子为探针循环格点的方式计算得到;
ⅵ),
Figure FDA00002366812416
,蛋白质活性口袋的溶剂可及化表面积,与
Figure FDA00002366812417
的计算方法一致;
第七类,熵效应相关描述符的计算,由公式(6)得到,公式(6)为:
K lig conf = N rot + Σr [ P nl ( r ) + P nl ′ ( r ) ] / 2 - - - ( 6 )
在公式(6)中,Nrot 表示小分子结构中被冻结化学键的数目,Pnl(r)和P′nl(r)指小分子结构中某可旋转化学键两端重原子的比例;
第八类,形状匹配相关描述符,由公式(7)和(8)计算得到:
K SM shape = ( Σ i ∈ L , j ∈ P δ ij ) / N Latom - - - ( 7 )
δ ij = 1 d ij ≤ | r i + r j ± ϵ | 0 d ij > | r i + r j ± ϵ | - - - ( 8 )
在公式(7)中,表示形状匹配相关描述符,NLatom 表示小分子重原子数目,
在公式(8)中,ri 和rj分别表示原子i和原子j的范德华半径,dij表示原子i和原子j之间的距离,ε表示原子i和原子j之间的碰撞容忍度,在本发明中ε设置为0.4埃
Figure FDA00002366812422
第九类,表面匹配描述符,其算法如下:首先,根据原子类型定义三种表面极性特征:正极性、负极性以及非极性,并赋给蛋白质和配体;接着,计算每个格点与蛋白质活性口袋的原子以及配体的原子之间的距离,若某格点与某一个蛋白质原子的距离小于其范德华半径加0.5 埃
Figure FDA00002366812423
,并且与另一个配体原子的距离小于范德华半径加0.5埃
Figure FDA00002366812424
,那么该格点被标记;然后,被标记的格点根据相应的蛋白质原子以及小分子原子表面极性特征进行分类,共分六类,分别是正极性-正极性、正极性-负极性、负极性-负极性、正极性-非极性、负极性-非极性和非极性-非极性;最后,分别统计六类中被标记格点的数目,即为六个不同的描述符的值。
CN201210440910.2A 2012-11-07 2012-11-07 基于分子描述符的蛋白质-配体亲和力预测方法 Expired - Fee Related CN102930181B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210440910.2A CN102930181B (zh) 2012-11-07 2012-11-07 基于分子描述符的蛋白质-配体亲和力预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210440910.2A CN102930181B (zh) 2012-11-07 2012-11-07 基于分子描述符的蛋白质-配体亲和力预测方法

Publications (2)

Publication Number Publication Date
CN102930181A true CN102930181A (zh) 2013-02-13
CN102930181B CN102930181B (zh) 2015-05-27

Family

ID=47644978

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210440910.2A Expired - Fee Related CN102930181B (zh) 2012-11-07 2012-11-07 基于分子描述符的蛋白质-配体亲和力预测方法

Country Status (1)

Country Link
CN (1) CN102930181B (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105354440A (zh) * 2015-08-12 2016-02-24 中国科学技术大学 一种提取蛋白质-小分子相互作用模块的方法
CN106575320A (zh) * 2014-05-05 2017-04-19 艾腾怀斯股份有限公司 结合亲和力预测系统和方法
CN109036580A (zh) * 2018-07-06 2018-12-18 华东师范大学 基于相互作用能项和机器学习的蛋白-配体亲和力预测方法
JP2019028879A (ja) * 2017-08-02 2019-02-21 学校法人立命館 結合性予測方法、装置、プログラム、記録媒体、および機械学習アルゴリズムの製造方法
CN109935278A (zh) * 2019-02-28 2019-06-25 深圳晶泰科技有限公司 晶体结构碰撞快速检测方法
EP3356999A4 (en) * 2015-10-04 2019-07-03 Atomwise Inc. SYSTEMS AND METHODS FOR APPLYING CONVOLUTIONAL NETWORK TO SPATIAL DATA
CN110232954A (zh) * 2019-05-10 2019-09-13 江苏理工学院 基于迁移学习的分子对接方法和系统
US10482355B2 (en) 2014-05-05 2019-11-19 Atomwise Inc. Systems and methods for applying a convolutional network to spatial data
CN110767266A (zh) * 2019-11-04 2020-02-07 山东省计算中心(国家超级计算济南中心) 基于图卷积的面向ErbB靶向蛋白家族的打分函数构建方法
CN110875085A (zh) * 2018-09-03 2020-03-10 中国石油化工股份有限公司 高效批量优化分子结构的方法
CN111279419A (zh) * 2017-10-17 2020-06-12 富士胶片株式会社 特征量计算方法、特征量计算程序及特征量计算装置、筛选方法、筛选程序及筛选装置、化合物创建方法、化合物创建程序及化合物创建装置
CN111292800A (zh) * 2020-01-21 2020-06-16 中南大学 一种基于预测蛋白质亲和力的分子表征及其应用
CN111429972A (zh) * 2019-09-05 2020-07-17 中国海洋大学 一种基于深度学习的蛋白质小分子对接打分方案
CN112289371A (zh) * 2020-09-23 2021-01-29 北京望石智慧科技有限公司 蛋白质与小分子样本生成及结合能、结合构象预测方法
CN112331262A (zh) * 2021-01-06 2021-02-05 北京百度网讯科技有限公司 亲和度预测方法及模型的训练方法、装置、设备及介质
CN113284553A (zh) * 2021-05-28 2021-08-20 南昌大学 一种用于治疗药物成瘾的药物靶点结合能力测试方法
CN115631784A (zh) * 2022-10-26 2023-01-20 苏州立妙达药物科技有限公司 一种基于多尺度判别的无梯度柔性分子对接方法
WO2024026725A1 (zh) * 2022-08-03 2024-02-08 深圳阿尔法分子科技有限责任公司 一种基于mm/pb(gb)sa的蛋白质-药物结合自由能预测方法及预测系统

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10546237B2 (en) * 2017-03-30 2020-01-28 Atomwise Inc. Systems and methods for correcting error in a first classifier by evaluating classifier output in parallel

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070224646A1 (en) * 2006-03-23 2007-09-27 Joseph Audie Method for estimating protein-protein binding affinities
CN102663214A (zh) * 2012-05-09 2012-09-12 四川大学 一种集成药物靶标预测系统的构建和预测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070224646A1 (en) * 2006-03-23 2007-09-27 Joseph Audie Method for estimating protein-protein binding affinities
CN102663214A (zh) * 2012-05-09 2012-09-12 四川大学 一种集成药物靶标预测系统的构建和预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
何万林: "支持向量机排序回归方法及其在优化分子对接打分函数的应用", 《中国优秀硕士学位论文全文数据库基础科学辑》 *
张长胜等: "蛋白质相互作用预测、设计与调控", 《物理化学学报》 *

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10482355B2 (en) 2014-05-05 2019-11-19 Atomwise Inc. Systems and methods for applying a convolutional network to spatial data
CN106575320A (zh) * 2014-05-05 2017-04-19 艾腾怀斯股份有限公司 结合亲和力预测系统和方法
US11080570B2 (en) 2014-05-05 2021-08-03 Atomwise Inc. Systems and methods for applying a convolutional network to spatial data
CN106575320B (zh) * 2014-05-05 2019-03-26 艾腾怀斯股份有限公司 结合亲和力预测系统和方法
CN105354440A (zh) * 2015-08-12 2016-02-24 中国科学技术大学 一种提取蛋白质-小分子相互作用模块的方法
CN105354440B (zh) * 2015-08-12 2019-06-21 中国科学技术大学 一种提取蛋白质-小分子相互作用模块的方法
EP3680820A1 (en) * 2015-10-04 2020-07-15 Atomwise Inc. Method for applying a convolutional network to spatial data
EP3356999A4 (en) * 2015-10-04 2019-07-03 Atomwise Inc. SYSTEMS AND METHODS FOR APPLYING CONVOLUTIONAL NETWORK TO SPATIAL DATA
JP2019028879A (ja) * 2017-08-02 2019-02-21 学校法人立命館 結合性予測方法、装置、プログラム、記録媒体、および機械学習アルゴリズムの製造方法
JP7048065B2 (ja) 2017-08-02 2022-04-05 学校法人立命館 結合性予測方法、装置、プログラム、記録媒体、および機械学習アルゴリズムの学習方法
CN111279419B (zh) * 2017-10-17 2023-10-10 富士胶片株式会社 特征量计算方法、筛选方法、以及化合物创建方法
CN111279419A (zh) * 2017-10-17 2020-06-12 富士胶片株式会社 特征量计算方法、特征量计算程序及特征量计算装置、筛选方法、筛选程序及筛选装置、化合物创建方法、化合物创建程序及化合物创建装置
CN109036580B (zh) * 2018-07-06 2021-08-20 华东师范大学 基于相互作用能项和机器学习的蛋白-配体亲和力预测方法
CN109036580A (zh) * 2018-07-06 2018-12-18 华东师范大学 基于相互作用能项和机器学习的蛋白-配体亲和力预测方法
CN110875085B (zh) * 2018-09-03 2022-07-29 中国石油化工股份有限公司 高效批量优化分子结构的方法
CN110875085A (zh) * 2018-09-03 2020-03-10 中国石油化工股份有限公司 高效批量优化分子结构的方法
CN109935278A (zh) * 2019-02-28 2019-06-25 深圳晶泰科技有限公司 晶体结构碰撞快速检测方法
CN109935278B (zh) * 2019-02-28 2023-04-07 深圳晶泰科技有限公司 晶体结构碰撞快速检测方法
CN110232954A (zh) * 2019-05-10 2019-09-13 江苏理工学院 基于迁移学习的分子对接方法和系统
CN111429972A (zh) * 2019-09-05 2020-07-17 中国海洋大学 一种基于深度学习的蛋白质小分子对接打分方案
CN110767266B (zh) * 2019-11-04 2023-04-18 山东省计算中心(国家超级计算济南中心) 基于图卷积的面向ErbB靶向蛋白家族的打分函数构建方法
CN110767266A (zh) * 2019-11-04 2020-02-07 山东省计算中心(国家超级计算济南中心) 基于图卷积的面向ErbB靶向蛋白家族的打分函数构建方法
CN111292800A (zh) * 2020-01-21 2020-06-16 中南大学 一种基于预测蛋白质亲和力的分子表征及其应用
CN112289371A (zh) * 2020-09-23 2021-01-29 北京望石智慧科技有限公司 蛋白质与小分子样本生成及结合能、结合构象预测方法
CN112331262A (zh) * 2021-01-06 2021-02-05 北京百度网讯科技有限公司 亲和度预测方法及模型的训练方法、装置、设备及介质
CN113284553B (zh) * 2021-05-28 2023-01-10 南昌大学 一种用于治疗药物成瘾的药物靶点结合能力测试方法
CN113284553A (zh) * 2021-05-28 2021-08-20 南昌大学 一种用于治疗药物成瘾的药物靶点结合能力测试方法
WO2024026725A1 (zh) * 2022-08-03 2024-02-08 深圳阿尔法分子科技有限责任公司 一种基于mm/pb(gb)sa的蛋白质-药物结合自由能预测方法及预测系统
CN115631784A (zh) * 2022-10-26 2023-01-20 苏州立妙达药物科技有限公司 一种基于多尺度判别的无梯度柔性分子对接方法
CN115631784B (zh) * 2022-10-26 2024-04-23 苏州立妙达药物科技有限公司 一种基于多尺度判别的无梯度柔性分子对接方法

Also Published As

Publication number Publication date
CN102930181B (zh) 2015-05-27

Similar Documents

Publication Publication Date Title
CN102930181A (zh) 基于分子描述符的蛋白质-配体亲和力预测方法
Barcellona et al. Lithium ion battery models and parameter identification techniques
Zhang et al. Review on the state of charge estimation methods for electric vehicle battery
Xiong et al. Online estimation of peak power capability of Li-ion batteries in electric vehicles by a hardware-in-loop approach
Hautier et al. Finding nature’s missing ternary oxide compounds using machine learning and density functional theory
CN107038348B (zh) 基于蛋白-配体相互作用指纹图谱的药物靶标预测方法
Feng et al. A combined state of charge estimation method for lithium-ion batteries used in a wide ambient temperature range
Baerends et al. A quantum chemical view of density functional theory
Northrop et al. Efficient simulation and reformulation of lithium-ion battery models for enabling electric transportation
Min et al. Research on the optimal charging strategy for Li-ion batteries based on multi-objective optimization
Yan et al. Model predictive control-based fast charging for vehicular batteries
Zhang et al. Variable-order equivalent circuit modeling and state of charge estimation of lithium-ion battery based on electrochemical impedance spectroscopy
Montes et al. Procedure for assessing the suitability of battery second life applications after EV first life
Xiang et al. Lithium-ion battery online rapid state-of-power estimation under multiple constraints
Arlitt et al. The function-based design for sustainability method
Vchirawongkwin et al. Structural and dynamical properties and vibrational spectra of bisulfate ion in water: A study by ab initio quantum mechanical charge field molecular dynamics
Xiao et al. A review on dynamic recycling of electric vehicle battery: Disassembly and echelon utilization
Chandra Shekar et al. Real-time state-of-charge estimation via particle swarm optimization on a lithium-ion electrochemical cell model
Barreras et al. A consensus algorithm for multi-objective battery balancing
Castanho et al. Method for SoC estimation in lithium-ion batteries based on multiple linear regression and particle swarm optimization
Lee et al. A robust and sleek electrochemical battery model implementation: a MATLAB® framework
Khalid et al. Performance analysis of commercial passive balancing battery management system operation using a hardware-in-the-loop testbed
Salazar et al. Estimation and comparison of soc in batteries used in electromobility using the thevenin model and coulomb ampere counting
Ceschia et al. Multi-Criteria Optimal Design for FUEL Cell Hybrid Power Sources
Tucki et al. The Impact of the Available Infrastructure on the Electric Vehicle Market in Poland and in EU Countries

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150527

Termination date: 20151107

EXPY Termination of patent right or utility model