CN102930181B - 基于分子描述符的蛋白质-配体亲和力预测方法 - Google Patents

基于分子描述符的蛋白质-配体亲和力预测方法 Download PDF

Info

Publication number
CN102930181B
CN102930181B CN201210440910.2A CN201210440910A CN102930181B CN 102930181 B CN102930181 B CN 102930181B CN 201210440910 A CN201210440910 A CN 201210440910A CN 102930181 B CN102930181 B CN 102930181B
Authority
CN
China
Prior art keywords
protein
descriptor
affinity
atom
formula
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210440910.2A
Other languages
English (en)
Other versions
CN102930181A (zh
Inventor
杨胜勇
李国菠
李琳丽
杨羚羚
魏于全
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
Original Assignee
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University filed Critical Sichuan University
Priority to CN201210440910.2A priority Critical patent/CN102930181B/zh
Publication of CN102930181A publication Critical patent/CN102930181A/zh
Application granted granted Critical
Publication of CN102930181B publication Critical patent/CN102930181B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)

Abstract

基于分子描述符的蛋白质-配体亲和力预测方法。构建完善而系统的分子描述符反映蛋白质-配体亲和力,采用支持向量回归的方法建立描述符与亲和力的关系。步骤是:a、训练集的准备:准备大量同时包含蛋白质-配体复合物晶体结构及其亲和力数据。b、分子描述符的构建与计算:构建50种九类不同的分子描述符,计算出训练集中所有复合物描述符的具体值。c、回归模型的建立;采用支持向量回归方法拟合描述符与亲和力之间的关系,引入共轭梯度法来优化其惩罚因子C和核函数参数。d、组建新型的打分函数,用于预测复合物的亲和力。本发明具有预测能力强、靶点依赖性小、对同系物敏感性高等优点。

Description

基于分子描述符的蛋白质-配体亲和力预测方法
一、技术领域
本发明涉及计算机辅助药物分子设计领域,特别涉及一种基于分子描述符的蛋白质-配体亲和力预测方法。
二、背景技术
在基于结构的药物设计中,例如分子对接和从头设计,预测蛋白质靶标与其配体之间的结合亲和力通常采用打分函数打分的方法。迄今为止,打分函数大致可以分为三类:基于力场、基于知识和基于经验,而其中以基于经验的打分函数打分最受青睐。基于经验的打分函数通常是由多种蛋白质和配体相互作用相关的物理化学项组成,如范德华力、氢键、静电以及金属-配体键能等。这些项的系数往往通过多重线性回归拟合而来。可见,基于经验的打分函数原理简单且计算高效。然而,目前采用基于经验的打分函数打分的方法仍存在一些不足,如预测值与实验值相关性不佳、靶点依赖性大和对同系物敏感性差等。诸多因素可导致这些问题,其中至少包括以下三个方面。第一,用于拟合打分函数各项系数的训练集中蛋白质和配体晶体结构复合物的数目以及多样性不够,这可能导致构建的打分函数对不同蛋白质靶标的预测能力差异较大。第二,打分函数所包含的蛋白质和配体相互作用的项数十分有限,通常少于20项,不足以全面反映蛋白质和配体相互作用。第三,打分函数各项系数通常是由线性回归获得,而线性回归要求各项必须独立,但事实上打分函数各项会相互影响。因此,目前仍然需要发展新的蛋白质-配体亲和力预测方法,以克服当前打分函数存在的问题,从而促进基于结构的药物设计方法在新药研发中的应用,并进而推动创新药物的研发。
三、发明内容
本发明的目的是:提供一种全新的蛋白质-配体亲和力预测方法。这种方法属于一种基于经验的打分函数打分方法,是基于蛋白质和配体之间相互作用的分子描述符,采用支持向量回归的方法来建立描述符与蛋白质-配体亲和力的关系。该方法克服了现有技术中预测值与实验值相关性不佳、靶点依赖性大和对同系物敏感性差等不足。
本发明的基本思路是:收集大量的多样化的蛋白质-配体复合物晶体结构(简称:复合物)及其结合亲和力(简称:亲和力)实验值作为训练集,构建完善而系统的分子描述符,藉以完整地反映蛋白质-配体相互作用,计算训练集中所有蛋白质-配体相互作用分子描述符,采用支持向量回归(SVR, Supporting Vector Regression)的方法来拟合描述符与亲和力之间的关系,从而用于预测给定复合物的亲和力。这种思路的基本理论是基于:(1)训练集的大小、质量以及多样性直接影响着基于经验的打分函数的预测能力。因此,收集大量且多样的复合物结构是至关重要的,这样可以更全面反映多种复合物结构的相互作用特征,从而使打分函数适合更多生物类型的复合物亲和力预测,减少对不同类型的复合物预测能力差异较大的现象。(2)构建若干分子描述符,藉以全面反映蛋白质-配体相互作用。一方面,对于非常重要的相互作用,如范德华力和氢键,分别构建不同原子类型之间的分子描述符;另一方面,充分考虑与蛋白质-配体相互作用密切相关的因素,如疏水效应、熵效应、形状匹配以及表面匹配。这样不仅可以提高打分函数的预测能力,而且可以提高对结构差异小的同系物预测的敏感度。(3)利用支持向量回归的方法来拟合描述符与复合物亲和力的关系,支持向量回归是一种优秀的机器学习方法,可以解决线性回归无法处理相互作用耦合项的关键技术问题,从根本上提高打分函数对复合物亲和力的预测能力。
本发明的目的是这样达到的:一种基于分子描述符的蛋白质-配体亲和力全新预测方法,其特征在于:收集大量的多样化的蛋白质和配体复合物晶体结构及其结合亲和力实验值,构建全面综合的分子描述符藉以反映复合物亲和力,并采用支持向量回归的方法建立描述符与亲和力的关系,从而用于预测给定复合物的亲和力的方法。包括如下四个步骤:(1)训练集的准备:训练集的准备采用同时包含复合物及其亲和力的数据,每个复合物中蛋白质结构和配体结构分别保存在同一个文件夹,蛋白质结构以PDB格式保存,而配体以mol2格式保存。(2)描述符的计算;构建若干蛋白质和配体相互作用相关的分子描述符,这些描述符分别属于九种不同的类型:范德华相互作用、静电相互作用、氢键相互作用、π键相互作用、金属键相互作用、去溶剂效应、熵效应、表面匹配和形状匹配。不同类型的描述符对应不同的计算公式或计算方法,描述符的计算通过编写程序完成。(3)回归模型的建立;采用支持向量回归的方法来建立描述符与亲和力之间的回归模型,在回归过程中引入共轭梯度法来优化支持向量回归中两个重要的参数,即惩罚因子C和核函数γ。(4)基于回归模型建立新型的打分函数,预测复合物的亲和力。
在步骤(1)训练集的准备中,训练集总共包含2278个复合物结构及其亲和力数据;在步骤(2)描述符的构建中,共构建50种蛋白质-配体相互作用相关的描述符。用于计算描述符的程序简要步骤如下:
1)读入训练集复合物名单,并依次调用复合物;
2)分别读入复合物中蛋白质结构和配体结构;
3)调用力场参数文件,并为蛋白质结构和配体结构赋力场参数;
4)定义蛋白质结构活性中心和网格;
5)计算出50种与蛋白质和配体相互作用的描述符;
6)若训练集复合物名单未循环完毕,则返回第一步;
7)输出训练集所有复合物对应的50种描述符具体值。
在步骤(3)回归模型的建立中,引入了共轭梯度法优化惩罚因子C和核函数γ的值的程序是:
1)将训练集中复合物的亲和力实验值与对应的50种描述符值作为输入文件;
2)重新标度描述符值至-1到+1这个区间;
3)初始化惩罚因子C和核函数γ的值;
4)调用支持向量回归SVR程序,建立回归模型,并计算得到一组亲和力预测值;
5)计算训练集中复合物的亲和力实验值与预测值之间的相关系数;
6)根据相关系数值,通过共轭梯度法优化惩罚因子C和核函数γ的值,得到一组新的C和γ值,返回第五步;
7)符合条件时,循环终止;
8)输出最优的回归模型;
在步骤(4)建立新型的打分函数,预测复合物的亲和力的程序如下:
1)分别读入给定复合物中蛋白质结构和配体结构;
2)调用力场参数文件,并为蛋白质结构和配体结构赋力场参数;
3)定义蛋白质结构活性中心和网格;
4)计算出50种与蛋白质和配体相互作用的描述符,
5)将描述符值重新标度至-1到+1这个区间;
6)输入最佳惩罚因子C和核函数γ的值,并读入最佳支持向量回归模型;
7)调用支持向量回归SVR程序;
8)输出给定复合物亲和力的预测值。
本发明的积极效果是:
本发明的方法属于基于经验打分函数打分的方法,其基本功能是预测蛋白质和配体之间亲和力大小。相对以前的经验打分函数打分方法,本发明具有三方面的优势。第一,该方法对蛋白质-配体亲和力预测能力较强;第二,该方法对不同生物类型的蛋白质-配体亲和力的预测差异较小,即生物蛋白靶点依赖性较小,适用于大多数类型的蛋白质-配体亲和力预测;第三,该方法能较好地区分结构差异小的同系物与其靶点的亲和力大小,特别适用于先导化合物优化中。
四、附图说明
图1分子描述符计算的工作流程图。
图2回归模型建立的工作流程图。
图3打分函数进行打分预测的工作流程图。
五、具体实施方式
本发明方法属于基于经验打分函数打分的方法,通过收集2278个多样化的蛋白质和配体复合物晶体结构及其结合亲和力实验值,构建50个完善而系统的蛋白质和配体相互作用相关的分子描述符来反映复合物亲和力,并采用支持向量回归的方法建立描述符与复合物亲和力的关系,从而构建经验打分函数用于预测给定复合物的亲和力。
具体步骤如下:
(1)训练集的准备:
训练集总共包含2278个复合物结构及其亲和力数据。每个复合物中蛋白质结构和配体结构分别以PDB ID号命名并保存在同一个文件夹,其中蛋白质结构以PDB格式保存,而配体以格式保存,以便后续程序调用。
(2)描述符的构建与计算:
构建并计算全面综合的蛋白质和配体相互作用相关描述符是本发明打分函数的核心部分。本发明总共构建了50种与蛋白质-配体相互作用相关的描述符(详见表一),这些描述符分属于九种类型:范德华相互作用、静电相互作用、氢键相互作用、π键相互作用、金属键相互作用、熵效应、去溶剂效应、表面匹配和形状匹配。
描述符的分类如表一。
表一
上述表一中,所有描述符的计算均通过自主编写程序完成,步骤如下:
1)读入训练集复合物名单,并依次调用复合物;
2)分别读入复合物中蛋白质结构和配体结构;
3)调用力场参数文件,并为蛋白质结构和配体结构赋力场参数;
4)定义蛋白质结构活性中心和网格;
5)计算出50种与蛋白质和配体相互作用的描述符,分属于9种不同的类别。每一类描述符的具体计算公式或计算方法如下:
第一类:范德华力相互作用相关描述符,由公式(1)计算得到,公式(1)为:
K I - J vdW = Σ i ∈ I Σ j ∈ J [ ( r i + r j d ij ) 12 - ( r i + r j d ij ) 6 ] - - - ( 1 )
公式(1)中,表示蛋白质的原子类型I与配体的原子类型J之间的范德华力描述符(有关原子类型信息,详见表二)。ri和rj分别是指蛋白质原子i与配体原子j的范德华力半径。dij表示蛋白质原子i与配体原子j之间的距离。本发明中共考虑了20种范德华力相关描述符(见表一)。
原子类型列表如表二。
表二
第二类:氢键相互作用相关描述符,由公式(2)计算得到,公式(2)为:
K A - D hbond = Σ A Σ D [ ( r 0 d A - D ) 12 - 2 ( r 0 d A - D ) 6 ] * cos 2 ( θ - θ 0 ) - - - ( 2 )
公式(2)中,表示蛋白质的不同原子类型的氢键受体与配体的不同原子类型氢键给体之间的氢键描述符。A代表氢键受体,D代表氢键给体,dA-D代表氢键受体与给体之间距离。r0和θ0表示不同原子类型的氢键给体与受体之间的最佳距离和角度。本发明中共考虑了10种氢键相关描述符(见表一)。
第三类:静电相互作用相关描述符,由公式(3)计算得到,公式(3)为:
K pos - neg elect = q pos q neg d pos , neg - - - ( 3 )
公式(3)中,表示静电相互作用描述符,dpos,neg代表蛋白质和配体对应正电中心与负电中心的距离。qpos和qneg分别代表正电中心与负电中心所带电荷电量。
第四类:π(或称为共轭系统)相关作用描述符,π相关作用在蛋白质-配体的相互作用中起到至关重要的作用,例如,卤素-π相互作用、π-π相互作用以及电负原子-π相互作用。然而,准确定量这些π相关作用是十分困难的。因此,本发明选择了一种简单有效的方法来表示π相关作用,即计算存在的卤素-π相互作用、π-π相互作用以及电负原子-π相互作用的个数。
第五类:金属-配体相互作用相关描述符,由公式(4)和(5)计算得到:
K L - M metal = Σ i ∈ L Σ j ∈ M δ ( d ij ) - - - ( 4 )
在公式(4)中,代表配体的原子类型L与蛋白质中金属离子之间相互作用描述符,dij 表示配体原子i与金属离子j之间的距离。
第六类:去溶剂化效应相关描述符,本发明共采用了六个描述符来表征去溶剂化效应,它们分别是:1,,配体的logP值,由分子中各个原子的贡献之和,其中每个原子的贡献可由它在分子中所占的可及表面积S、所占的范氏体积V以及它的部分电荷q这些微观参数来计算;2,,配体的极性表面积,由极性片段的极性表面积加和而来,各种极性片段的极性表面积从文献查阅得到;3,, 配体的体积,通过格点法计算得到;4,,蛋白质活性口袋的极性原子与非极性原子的比值,与的计算方法一致;5, ,配体的溶剂可及化表面积,通过以水分子为探针循环格点的方式计算得到; 6,,蛋白质活性口袋的溶剂可及化表面积,与的计算方法一致。
第七类:熵效应相关描述符,由公式(6)计算得到,公式(6)为:
K lig conf = N rot + Σr [ P nl ( r ) + P nl ′ ( r ) ] / 2 - - - ( 6 )
在公式(6)中,Nrot 表示配体结构中被冻结化学键的数目(在配体结构中某可旋转化学键两端的原子均与蛋白质存在相互作用,则该化学键就称为被冻结化学键),Pnl(r)和P′nl(r)是指配体结构中某可旋转化学键两端重原子的比例。
第八类:形状匹配相关描述符,由公式(7)和(8)计算得到:
K SM shape = ( Σ i ∈ L , j ∈ P δ ij ) / N Latom - - - ( 7 )
δ ij = 1 d ij ≤ | r i + r j ± ϵ | 0 d ij > | r i + r j ± ϵ | - - - ( 8 )
在公式(7)中,表示形状匹配相关描述符,NLatom 表示配体重原子数目。
在公式(8)中,ri 和rj分别表示原子i和原子j的范德华半径,dij表示原子i和原子j之间的距离,ε表示原子i和原子j之间的碰撞容忍度,在本发明中ε设置为0.4 埃
第九类:表面匹配描述符,其算法简述如下:首先,根据原子类型定义三种表面极性特征:正极性、负极性以及非极性(详见表二),并赋给蛋白质和配体;接着,计算每个格点与蛋白质活性口袋的原子以及配体的原子之间的距离,若某格点与某一个蛋白质原子的距离小于其范德华半径加0.5 埃,并且与另一个配体原子的距离小于范德华半径加0.5 埃,那么该格点被标记;然后,被标记的格点根据相应的蛋白质原子以及配体原子表面极性特征进行分类,共分六类,分别是正极性-正极性、正极性-负极性、负极性-负极性、正极性-非极性、负极性-非极性和非极性-非极性;最后,分别统计六类中被标记格点的数目,即为六个不同的描述符的值。
6)若训练集复合物名单未循环完毕,则返回第一步;
7)输出训练集所有复合物对应的50种描述符具体值。
(3)回归模型的建立:
在回归模型的建立过程中,本发明采用改进后支持向量回归方法完成,由自主研发的CG-SVR程序完成,步骤如下:
1)将训练集中复合物的亲和力实验值与对应的50种描述符值作为输入文件;
2)重新标度描述符值至-1到+1这个区间;
3)初始化惩罚因子C和核函数γ的值;
4)调用支持向量回归SVR程序,得到一组亲和力预测值;
5)计算训练集中复合物的亲和力实验值与预测值之间的相关系数;
6)根据相关系数值,通过共轭梯度法优化惩罚因子C和核函数γ的值,得到一组新的C和γ值,返回第五步;
7)符合条件时,循环终止;
8)输出最优的回归模型。
(4)打分函数进行打分预测:
本发明的打分函数是建立在描述符的计算和回归模型的基础之上,通过自主编写程序完成,步骤如下:
1)分别读入给定复合物中蛋白质结构和配体结构;
2)调用力场参数文件,并为蛋白质结构和配体结构赋力场参数;
3)定义蛋白质结构活性中心和网格;
4)按照上述方法计算出50种与蛋白质-配体相互作用的描述符;
5)按照回归过程中相同的方法,将描述符值归化至-1到+1这个区间;
6)输入最佳惩罚因子C和核函数γ的值,并读入最佳回归模型;
7)调用支持向量回归SVR程序;
8)输出给定复合物亲和力的预测值。

Claims (2)

1.一种基于分子描述符的蛋白质-配体亲和力预测方法,其特征在于:收集大量的多样化的蛋白质-配体复合物晶体结构及其结合亲和力数据,构建完善而系统的分子描述符藉以全面反映蛋白质-配体亲和力,并采用支持向量回归的方法建立分子描述符与亲和力的关系,从而用于预测给定复合物的亲和力,包括如下四个步骤:
(1)训练集的准备:训练集的准备采用同时包含复合物及其亲和力的数据,每个复合物中蛋白质结构和小分子配体结构分别保存在同一个文件夹,蛋白质结构以PDB格式保存,而配体以Mol2格式保存;
(2)分子描述符的分类构建与计算;构建若干蛋白质-配体相互作用相关的分子描述符,这些描述符分别属于九种不同的类型:范德华相互作用、静电相互作用、氢键相互作用、π键相互作用、金属键相互作用、去溶剂效应、熵效应、表面匹配和形状匹配,不同类型的分子描述符对应不同的计算公式或计算方法,描述符的计算通过编写程序完成;
(3)回归模型的建立;采用支持向量回归方法来拟合描述符与亲和力之间的关系,即建立回归模型;在回归模型建立过程中,引入共轭梯度法来优化惩罚因子C和核函数参数γ的值;
(4)在描述符计算和回归模型的基础之上,组建新型的打分函数,预测复合物的亲和力;
在步骤(1)训练集的准备中,训练集总共包含2278个复合物结构及其亲和力数据;
在步骤(2)分子描述符的分类构建与计算中,构建50种蛋白质-配体相互作用相关的分子描述符,描述符的计算程序如下:
1)读入训练集复合物名单,并依次调用复合物;
2)分别读入复合物中蛋白质结构和小分子配体结构;
3)调用力场参数文件,并为蛋白质结构和配体结构赋力场参数;
4)定义蛋白质结构活性中心和网格;
5)计算出50种与蛋白质-配体相互作用的分子描述符;
6)若训练集复合物名单未循环完毕,则返回1);
7)输出训练集所有复合物对应的50种描述符具体值;
在步骤(3)回归模型的建立中,引入共轭梯度法优化惩罚因子C和核函数参数γ的值的程序是:
1)将训练集中复合物的亲和力实验值与对应的50种描述符值作为输入文件;
2)重新标度描述符值至-1到+1这个区间;
3)初始化惩罚因子C和核函数参数γ的值;
4)调用支持向量回归SVR程序,得到一组亲和力预测值;
5)计算训练集中复合物的亲和力实验值与预测值之间的相关系数;
6)根据相关系数值,通过共轭梯度法优化惩罚因子C和核函数参数γ的值,得到一组新的C和γ值,返回5);
7)符合条件时,循环终止;
8)输出最优的回归模型;
在步骤(4)组建新型的打分函数,预测复合物的亲和力的程序如下:
1)分别读入给定复合物中蛋白质结构和小分子配体结构;
2)调用力场参数文件,并为蛋白质结构和小分子配体结构赋力场参数;
3)定义蛋白质结构活性中心和网格;
4)计算出50种与蛋白质-配体相互作用的分子描述符,
5)将描述符值重新标度至-1到+1这个区间;
6)输入最佳惩罚因子C和核函数参数γ的值,并读入最佳回归模型;
7)调用支持向量回归SVR程序;
8)输出给定复合物亲和力的预测值。
2.如权利要求1所述的方法,其特征在于:所述分子描述符分属于九种类型,其每一类描述符的具体计算公式或计算方法如下:
第一类,范德华力相互作用描述符的计算,由公式(1)得到,公式(1)为:
K I - J vdW = Σ i ∈ I Σ j ∈ J [ ( r i + r j d ij ) 12 - ( r i + r j d ij ) 6 ] - - - ( 1 )
公式(1)中,表示蛋白质的原子类型I与配体的原子类型J之间的范德华力描述符,ri和rj分别是指蛋白质原子i与小分子原子j的范德华力半径,dij表示蛋白质原子i与小分子原子j之间的距离;
第二类,氢键相互作用描述符的计算,由公式(2)得到,公式(2)为:
K A - D hbond = Σ A Σ D [ ( r 0 d A - D ) 12 - 2 ( r 0 d A - D ) 6 ] * cos 2 ( θ - θ 0 ) - - - ( 2 )
公式(2)中,表示蛋白质的不同原子类型的氢键受体与配体的不同原子类型氢键给体之间的氢键描述符,A代表氢键受体,D代表氢键给体,dA-D代表氢键受体与给体之间距离,r0和θ0表示不同原子类型的氢键给体与受体之间的最佳距离和角度;
第三类,静电相互作用描述符的计算,由公式(3)得到,公式(3)为:
K pos - neg elect = q pos q neg d pos , neg - - - ( 3 )
公式(3)中,表示静电相互作用描述符,dpos,neg代表蛋白质和配体对应正电中心与负电中心的距离,qpos和qneg分别代表正电中心与负电中心所带电荷电量;
第四类,π键相互作用描述符,采用计算存在的卤素-π相互作用、π-π相互作用以及电负原子-π相互作用的个数的方法得到;
第五类,金属键相互作用描述符的计算,由公式(4)和(5)得到:
K L - M metal = Σ i ∈ L Σ j ∈ M δ ( d ij ) - - - ( 4 )
式中,代表配体的原子类型L与蛋白质中金属离子M之间相互作用描述符,dij表示配体原子i与金属离子j之间的距离;
第六类,去溶剂效应描述符的技术,采用了六个描述符来表征去溶剂化效应,它们分别是:
ⅰ),配体的logP值,由分子中各个原子的贡献之和,其中每个原子的贡献可由它在分子中所占的可及表面积S、所占的范氏体积V以及它的部分电荷q这些微观参数来计算;
ⅱ),配体的极性表面积,由极性片段的极性表面积加和而来,各种极性片段的极性表面积从文献查阅得到;
ⅲ),配体的体积,通过格点法计算得到;
ⅳ),蛋白质活性口袋的极性原子与非极性原子的比值,与的计算方法一致;
ⅴ),配体的溶剂可及化表面积,通过以水分子为探针循环格点的方式计算得到;
ⅵ),蛋白质活性口袋的溶剂可及化表面积,与的计算方法一致;
第七类,熵效应相关描述符的计算,由公式(6)得到,公式(6)为:
K lig conf = N rot + Σr [ P nl ( r ) + P nl ′ ( r ) ] / 2 - - - ( 6 )
在公式(6)中,Nrot表示小分子结构中被冻结化学键的数目,Pnl(r)和P′nl(r)指小分子结构中某可旋转化学键两端重原子的比例;
第八类,形状匹配相关描述符,由公式(7)和(8)计算得到:
K SM shape = ( Σ i ∈ L , j ∈ P δ ij ) / N Latom - - - ( 7 )
δ ij = 1 d ij ≤ | r i + r j ± ϵ | 0 d ij > | r i + r j ± ϵ | - - - ( 8 )
在公式(7)中,表示形状匹配相关描述符,NLatom表示小分子重原子数目,
在公式(8)中,ri和rj分别表示原子i和原子j的范德华半径,dij表示原子i和原子j之间的距离,ε表示原子i和原子j之间的碰撞容忍度,在本发明中ε设置为0.4埃;
第九类,表面匹配描述符,其算法如下:首先,根据原子类型定义三种表面极性特征:正极性、负极性以及非极性,并赋给蛋白质和配体;接着,计算每个格点与蛋白质活性口袋的原子以及配体的原子之间的距离,若某格点与某一个蛋白质原子的距离小于其范德华半径加0.5埃,并且与另一个配体原子的距离小于范德华半径加0.5埃,那么该格点被标记;然后,被标记的格点根据相应的蛋白质原子以及小分子原子表面极性特征进行分类,共分六类,分别是正极性-正极性、正极性-负极性、负极性-负极性、正极性-非极性、负极性-非极性和非极性-非极性;最后,分别统计六类中被标记格点的数目,即为六个不同的描述符的值。
CN201210440910.2A 2012-11-07 2012-11-07 基于分子描述符的蛋白质-配体亲和力预测方法 Expired - Fee Related CN102930181B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210440910.2A CN102930181B (zh) 2012-11-07 2012-11-07 基于分子描述符的蛋白质-配体亲和力预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210440910.2A CN102930181B (zh) 2012-11-07 2012-11-07 基于分子描述符的蛋白质-配体亲和力预测方法

Publications (2)

Publication Number Publication Date
CN102930181A CN102930181A (zh) 2013-02-13
CN102930181B true CN102930181B (zh) 2015-05-27

Family

ID=47644978

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210440910.2A Expired - Fee Related CN102930181B (zh) 2012-11-07 2012-11-07 基于分子描述符的蛋白质-配体亲和力预测方法

Country Status (1)

Country Link
CN (1) CN102930181B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3433780A4 (en) * 2017-03-30 2020-02-26 Atomwise Inc. SYSTEMS AND METHODS FOR ERROR CORRECTION IN A FIRST CLASSIFIER BY EVALUATING CLASSIFIER OUTPUT IN PARALLEL DESIGN

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015168774A1 (en) * 2014-05-05 2015-11-12 Chematria Inc. Binding affinity prediction system and method
US9373059B1 (en) 2014-05-05 2016-06-21 Atomwise Inc. Systems and methods for applying a convolutional network to spatial data
CN105354440B (zh) * 2015-08-12 2019-06-21 中国科学技术大学 一种提取蛋白质-小分子相互作用模块的方法
WO2017062382A1 (en) * 2015-10-04 2017-04-13 Atomwise Inc. Systems and methods for applying a convolutional network to spatial data
JP7048065B2 (ja) * 2017-08-02 2022-04-05 学校法人立命館 結合性予測方法、装置、プログラム、記録媒体、および機械学習アルゴリズムの学習方法
WO2019078006A1 (ja) * 2017-10-17 2019-04-25 富士フイルム株式会社 特徴量算出方法、特徴量算出プログラム、及び特徴量算出装置、スクリーニング方法、スクリーニングプログラム、及びスクリーニング装置、化合物創出方法、化合物創出プログラム、及び化合物創出装置
CN109036580B (zh) * 2018-07-06 2021-08-20 华东师范大学 基于相互作用能项和机器学习的蛋白-配体亲和力预测方法
CN110875085B (zh) * 2018-09-03 2022-07-29 中国石油化工股份有限公司 高效批量优化分子结构的方法
CN109935278B (zh) * 2019-02-28 2023-04-07 深圳晶泰科技有限公司 晶体结构碰撞快速检测方法
CN110232954B (zh) * 2019-05-10 2021-06-15 江苏理工学院 基于迁移学习的分子对接方法和系统
CN111429972A (zh) * 2019-09-05 2020-07-17 中国海洋大学 一种基于深度学习的蛋白质小分子对接打分方案
CN110767266B (zh) * 2019-11-04 2023-04-18 山东省计算中心(国家超级计算济南中心) 基于图卷积的面向ErbB靶向蛋白家族的打分函数构建方法
CN111292800A (zh) * 2020-01-21 2020-06-16 中南大学 一种基于预测蛋白质亲和力的分子表征及其应用
CN112289371A (zh) * 2020-09-23 2021-01-29 北京望石智慧科技有限公司 蛋白质与小分子样本生成及结合能、结合构象预测方法
CN112331262A (zh) * 2021-01-06 2021-02-05 北京百度网讯科技有限公司 亲和度预测方法及模型的训练方法、装置、设备及介质
CN113284553B (zh) * 2021-05-28 2023-01-10 南昌大学 一种用于治疗药物成瘾的药物靶点结合能力测试方法
WO2024026725A1 (zh) * 2022-08-03 2024-02-08 深圳阿尔法分子科技有限责任公司 一种基于mm/pb(gb)sa的蛋白质-药物结合自由能预测方法及预测系统
CN115631784B (zh) * 2022-10-26 2024-04-23 苏州立妙达药物科技有限公司 一种基于多尺度判别的无梯度柔性分子对接方法
EP4386765A1 (en) * 2022-12-16 2024-06-19 Basf Se Apparatus for determining properties of a substance

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663214A (zh) * 2012-05-09 2012-09-12 四川大学 一种集成药物靶标预测系统的构建和预测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7739091B2 (en) * 2006-03-23 2010-06-15 The Research Foundation Of State University Of New York Method for estimating protein-protein binding affinities

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663214A (zh) * 2012-05-09 2012-09-12 四川大学 一种集成药物靶标预测系统的构建和预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
支持向量机排序回归方法及其在优化分子对接打分函数的应用;何万林;《中国优秀硕士学位论文全文数据库基础科学辑》;20121015(第10期);第1页第1行-第7页倒数第1行,第12页第1行-第31页第6行 *
蛋白质相互作用预测、设计与调控;张长胜等;《物理化学学报》;20121015;第28卷(第10期);第2364页左栏第1行-第2374页右栏倒数第1行 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3433780A4 (en) * 2017-03-30 2020-02-26 Atomwise Inc. SYSTEMS AND METHODS FOR ERROR CORRECTION IN A FIRST CLASSIFIER BY EVALUATING CLASSIFIER OUTPUT IN PARALLEL DESIGN

Also Published As

Publication number Publication date
CN102930181A (zh) 2013-02-13

Similar Documents

Publication Publication Date Title
CN102930181B (zh) 基于分子描述符的蛋白质-配体亲和力预测方法
Barcellona et al. Lithium ion battery models and parameter identification techniques
Amara-Ouali et al. A review of electric vehicle load open data and models
Omar et al. Peukert revisited—Critical appraisal and need for modification for lithium-ion batteries
CN107038348B (zh) 基于蛋白-配体相互作用指纹图谱的药物靶标预测方法
Jing et al. Electric vehicles: A review of network modelling and future research needs
Hautier et al. Finding nature’s missing ternary oxide compounds using machine learning and density functional theory
White et al. Efficient and minimal method to bias molecular simulations with experimental data
Wang et al. Modeling the partial atomic charges in inorganometallic molecules and solids and charge redistribution in lithium-ion cathodes
Mo et al. Trends and emerging technologies for the development of electric vehicles
Zhao et al. Characteristics and trends of research on new energy vehicle reliability based on the web of science
Chokkalingam et al. Real-time forecasting of EV charging station scheduling for smart energy systems
Liu et al. Research on the critical issues for power battery reusing of new energy vehicles in China
Hohm et al. New relationships connecting the dipole polarizability, radius, and second ionization potential for atoms
CN109658033A (zh) 货源路线相似度计算方法、系统、设备及存储介质
CN103955628A (zh) 基于子空间融合的蛋白质-维他命绑定位点预测方法
Guttenberg et al. Evaluating the potential of platooning in lowering the required performance metrics of li-ion batteries to enable practical electric semi-trucks
Li et al. Life cycle greenhouse gas emissions for last-mile parcel delivery by automated vehicles and robots
Iacobucci et al. An integrated optimisation-simulation framework for scalable smart charging and relocation of shared autonomous electric vehicles
Wang et al. Locating movable parcel lockers under stochastic demands
CN103500292A (zh) 配体特异性蛋白质-配体绑定区域预测方法
Zhang et al. FM-based: algorithm research on rural tourism recommendation combining seasonal and distribution features
Castanho et al. Method for SoC estimation in lithium-ion batteries based on multiple linear regression and particle swarm optimization
Barreras et al. A consensus algorithm for multi-objective battery balancing
Wei et al. HSM-SMCS: Task assignment based on hybrid sensing modes in sparse mobile crowdsensing

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150527

Termination date: 20151107

EXPY Termination of patent right or utility model