CN110600076B - 一种基于距离和角度信息的蛋白质atp对接方法 - Google Patents

一种基于距离和角度信息的蛋白质atp对接方法 Download PDF

Info

Publication number
CN110600076B
CN110600076B CN201910746836.9A CN201910746836A CN110600076B CN 110600076 B CN110600076 B CN 110600076B CN 201910746836 A CN201910746836 A CN 201910746836A CN 110600076 B CN110600076 B CN 110600076B
Authority
CN
China
Prior art keywords
atp
protein
atom
binding
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910746836.9A
Other languages
English (en)
Other versions
CN110600076A (zh
Inventor
张贵军
饶亮
赵凯龙
夏瑜豪
胡俊
周晓根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201910746836.9A priority Critical patent/CN110600076B/zh
Publication of CN110600076A publication Critical patent/CN110600076A/zh
Application granted granted Critical
Publication of CN110600076B publication Critical patent/CN110600076B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction

Abstract

一种基于距离和角度信息的蛋白质ATP对接方法,首先,使用ATPbind服务器预测蛋白质‑ATP绑定残基信息辅助预测复合物的结构;生成多种绑定组合方式,增加了构象的多样性;然后,通过种群个体的设计将原先的蛋白质‑ATP结构预测问题转换成搜索最优个体的优化问题,降低了计算代价;最后,设计一种精确的能量函数对生成的构象进行打分,提升了复合物结构的预测精度。本发明提供一种计算代价低、搜索效率高的基于距离和角度信息的蛋白质ATP对接方法。

Description

一种基于距离和角度信息的蛋白质ATP对接方法
技术领域
本发明涉及一种生物信息学、智能优化、计算机应用领域,尤其涉及的是一种基于距离和角度信息的蛋白质ATP对接方法。
背景技术
理解蛋白质与配体的相互作用是生物制药和功能食品工业的关键。由于蛋白质的结构决定功能,所以,准确确定蛋白质及其复合物的结构是非常重要的。一直以来,蛋白质与配体复合物实验结构的获取多来自于X射线或NMR核磁共振技术,而且这一过程需要在专业人员的严格控制下进行,消耗大量的时间和成本,因此,这些技术并不适用于一个受体与数以千计的配体之间进行对接实验。为了克服这一重大难题,利用计算机模拟受体和配体对接过程,生成高精度的三维复合物,成为了一个重要的解决方案。
ATP是一种不稳定的高能化合物,又称腺苷三磷酸。水解时释放出大量能量,是生物体内最直接的能量来源。在细胞中,它与蛋白质结合水解为ADP为细胞内部的活动提供能量,ATP和ADP的相互转化实现了贮能和释能,从而保证了细胞各项生命活动的能量供应。蛋白质与配体对接问题可以描述为:已知小分子配体和目标蛋白质的三维结构,通过放置配体到蛋白质的结合位点来预测和评估蛋白质与配体复合物的三维结构。按照对接过程中是否要考虑配体和受体的柔性,又可以将该对接过程分为刚性对接和柔性对接。刚性对接即是在对接过程中,保持小分子配体和目标蛋白质的空间结构不变。
目前利用计算机技术模拟蛋白质与配体分子对接的过程主要是将配体分子在空间中进行随机旋转和平移操作,使用智能优化算法不断搜索更合适的构象,结合能量函数对构象进行打分,算法收敛后得到最终的复合物结构。然而目前这种对接过程还有许多的缺陷,例如算法的搜索效率问题和能量函数的不精确性会导致蛋白质与配体分子对接过程中的计算代价过高和最终得到复合物的三维结构的精确性不高。
因此,现有的蛋白质与配体分子对接方法在计算代价和搜索效率方面存在着缺陷,需要改进。
发明内容
为了克服现有的蛋白质与配体ATP对接方法计算代价高、预测精度不足等缺陷,本发明提出一种计算代价低、预测精度高的基于距离和角度信息的蛋白质 ATP对接方法。
本发明解决其技术问题所采用的技术方案是:
一种基于距离和角度信息的蛋白质ATP对接方法,所述方法包括以下步骤:
1)输入蛋白质和ATP的结构信息,分别记为D和A;
2)对于输入的蛋白质结构信息D,使用ATPbind服务器 (https://zhanglab.ccmb.med.umich.edu/ATPbind/)预测出蛋白质所有的ATP绑定残基,分别记为r1,r2,...,rm,其中m为预测出的ATP绑定残基个数;
3)根据r1,r2,...,rm的中心碳原子Cα坐标信息,取所有Cα坐标值的平均值,聚类出一个中心点CD;根据A中各原子坐标信息,取所有原子坐标值的平均值,聚类出一个中心点CA;移动ATP结构使得CA和CD的坐标重合;
4)对于PDB数据库中每个与蛋白质结合的ATP分子A(j),其中j=1,2,...,N, N为PDB数据库中ATP的数目,定义对于蛋白质的第l个ATP绑定残基,与该残基Cα原子距离最近的ATP中的原子为该残基对应的绑定原子
Figure GDA0003232549720000021
l=1,2,...,n,其中n为该蛋白质ATP绑定残基的个数,若距离最近的ATP 原子已与之前的残基绑定过,则与次近的ATP原子进行绑定;
5)计算每一个绑定对的ATP原子与蛋白质绑定残基的Cα原子的距离
Figure GDA0003232549720000022
其中T为
Figure GDA0003232549720000023
原子的类型,Y是与
Figure GDA0003232549720000024
绑定的蛋白质残基的类型,计算
Figure GDA0003232549720000025
与Y 和Y′类型绑定残基的Cα原子的夹角∠YTY′j,k,其中,Y′是除与
Figure GDA0003232549720000026
原子组成绑定对的残基之外,剩下的n-1个蛋白质绑定残基的类型,k=1,2,...,n-1;
6)计算T类型的
Figure GDA0003232549720000027
原子与Y类型的蛋白质绑定残基间相互作用的平均距离,记作D(T,Y):
Figure GDA0003232549720000028
Figure GDA0003232549720000031
计算T类型的
Figure GDA0003232549720000032
原子与Y类型和Y′类型的蛋白质绑定残基形成的夹角的平均值,记作∠YTY′:
Figure GDA0003232549720000033
Figure GDA0003232549720000034
7)根据步骤5)中所有绑定对的蛋白质残基和
Figure GDA0003232549720000035
的原子类型,将A和D分成 M种绑定对组合方式,对每一种组合进行如下计算;
8)参数设置:设置种群规模NP,缩放因子F,交叉概率CR,最大迭代次数Gmax,初始化迭代次数g=0;
9)种群初始化:随机生成初始种群P={S1,S2,...,Si,...,SNP}, Si=(si,1,si,2,si,3,si,4,si,5,si,6)为种群P的第i个个体,其中si,1、si,2和si,3的取值范围是
Figure GDA0003232549720000036
si,4、si,5与si,6的取值范围为0到2π;
10)对于种群中的每个个体Si,根据如下方式将蛋白质与ATP对接,并计算该个体的得分score(Si):
10.1)根据Si中的后三个元素si,4、si,5、si,6,计算三维空间旋转矩阵R:
Figure GDA0003232549720000037
10.2)将A中所有原子根据旋转矩阵R进行坐标旋转得到Ar
10.3)根据Si中的前三个元素si,1、si,2、si,3,将Ar中的所有原子进行坐标平移得到Ap,过程如下:
Figure GDA0003232549720000038
其中
Figure GDA0003232549720000039
分别是Ar中原子的X,Y,Z坐标,f=1,2,...,Q,Q 是ATP中的原子个数是ATP中的原子个数;
10.4)根据步骤6),计算得分score:
Figure GDA0003232549720000074
其中
Figure GDA0003232549720000042
是ATP中T类型原子与Y类型蛋白质绑定残基Cα原子的距离,∠YTYh′是ATP中T类型原子与其绑定的Y类型蛋白质绑定残基以及非绑定的Y′类型蛋白质绑定残基的Cα原子所形成夹角的角度;
11)根据差分进化算法,对种群P中的每个个体Si,i∈{1,2,…,NP}作如下处理:
11.1)从当前种群P中随机选择三个不同的个体Sa、Sb与Sc,其中a≠b≠c≠i,根据如下等式生成一个突变个体Smutant
Smutant=Sa+F·(Sb-Sc)
11.2)根据如下过程生成交叉个体Scross
Figure GDA0003232549720000043
其中scross,j、smutant,j和si,j分别是Scross、Smutant和Si中的元素,j=1,2,...,6, jrand为1到6之间的随机整数,rand(0,1)为0到1之间的随机小数;
11.3)根据步骤10),分别计算Scross与Si对应的score得分score(Scross)与 score(Si);
11.4)如果score(Scross)<score(Si),则使用Scross替换种群P中的Si,否则Si保留在种群P中;
12)g=g+1;如果g>Gmax,则记录当前种群P中最低的得分score(Si)t和对应的ATP结构信息Atp,t=1,2,...,M;否则返回步骤12);
13)迭代步骤8)至步骤12),直到M种组合计算完成;从A1p,A2p,...,AMp中找出得分最低的结构信息作为最终的ATP结构信息输出。
本发明的技术构思为:首先,使用ATPbind服务器预测蛋白质-ATP绑定残基信息辅助预测复合物的结构;生成多种绑定组合方式,增加了构象的多样性;然后,通过种群个体的设计将原先的蛋白质-ATP结构预测问题转换成搜索最优个体的优化问题,降低了计算代价;最后,设计一种精确的能量函数对生成的构象进行打分,提升了复合物结构的预测精度。本发明提供一种计算代价低、搜索效率高的基于距离和角度信息的蛋白质ATP对接方法。
本发明的有益效果表现在:其一,使用ATPbind服务器预测蛋白质-ATP绑定残基信息,提升了蛋白质-ATP复合物空间结构的预测精度;其二,通过对蛋白质-ATP多种绑定组合方式进行打分和搜索优秀构象,增加了构象的多样性;其三,将蛋白质-ATP对接预测问题转换成选择最优个体的优化问题,并使用差分进化算法搜索最优个体,提高了蛋白质-ATP对接预测的效率。
附图说明
图1为一种基于距离和角度信息的蛋白质ATP对接方法的示意图。
图2为使用一种基于距离和角度信息的蛋白质ATP对接方法对蛋白质1b0u 与ATP进行预测后得到复合物三维空间结构图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1和图2,一种基于距离和角度信息的蛋白质ATP对接方法,包括以下步骤:
1)输入蛋白质和ATP的结构信息,分别记为D和A;
2)对于输入的蛋白质结构信息D,使用ATPbind服务器 (https://zhanglab.ccmb.med.umich.edu/ATPbind/)预测出蛋白质所有的ATP绑定残基,分别记为r1,r2,...,rm,其中m为预测出的ATP绑定残基个数;
3)根据r1,r2,...,rm的中心碳原子Cα坐标信息,取所有Cα坐标值的平均值,聚类出一个中心点CD;根据A中各原子坐标信息,取所有原子坐标值的平均值,聚类出一个中心点CA;移动ATP结构使得CA和CD的坐标重合;
4)对于PDB数据库中每个与蛋白质结合的ATP分子A(j),其中j=1,2,...,N, N为PDB数据库中ATP的数目,定义对于蛋白质的第l个ATP绑定残基,与该残基Cα原子距离最近的ATP中的原子为该残基对应的绑定原子
Figure GDA0003232549720000051
l=1,2,...,n,其中n为该蛋白质ATP绑定残基的个数,若距离最近的ATP 原子已与之前的残基绑定过,则与次近的ATP原子进行绑定;
5)计算每一个绑定对的ATP原子与蛋白质绑定残基的Cα原子的距离
Figure GDA0003232549720000052
其中T为
Figure GDA0003232549720000053
原子的类型,Y是与
Figure GDA0003232549720000054
绑定的蛋白质残基的类型,计算
Figure GDA0003232549720000055
与Y 和Y′类型绑定残基的Cα原子的夹角∠YTY′j,k,其中,Y′是除与
Figure GDA0003232549720000061
原子组成
绑定对的残基之外,剩下的n-1个蛋白质绑定残基的类型,k=1,2,...,n-1;
6)计算T类型的
Figure GDA0003232549720000062
原子与Y类型的蛋白质绑定残基间相互作用的平均距离,记作D(T,Y):
Figure GDA0003232549720000063
Figure GDA0003232549720000064
计算T类型的
Figure GDA0003232549720000065
原子与Y类型和Y′类型的蛋白质绑定残基形成的夹角的平均值,记作∠YTY′:
Figure GDA0003232549720000066
Figure GDA0003232549720000067
7)根据步骤5)中所有绑定对的蛋白质残基和
Figure GDA0003232549720000068
的原子类型,将A和D分成 M种绑定对组合方式,对每一种组合进行如下计算;
8)参数设置:设置种群规模NP,缩放因子F,交叉概率CR,最大迭代次数Gmax,初始化迭代次数g=0;
9)种群初始化:随机生成初始种群P={S1,S2,...,Si,...,SNP}, Si=(si,1,si,2,si,3,si,4,si,5,si,6)为种群P的第i个个体,其中si,1、si,2和si,3的取值范围是
Figure GDA0003232549720000069
si,4、si,5与si,6的取值范围为0到2π;
10)对于种群中的每个个体Si,根据如下方式将蛋白质与ATP对接,并计算该个体的得分score(Si):
10.1)根据Si中的后三个元素si,4、si,5、si,6,计算三维空间旋转矩阵R:
Figure GDA0003232549720000071
10.2)将A中所有原子根据旋转矩阵R进行坐标旋转得到Ar
10.3)根据Si中的前三个元素si,1、si,2、si,3,将Ar中的所有原子进行坐标平移得到Ap,过程如下:
Figure GDA0003232549720000072
其中
Figure GDA0003232549720000073
分别是Ar中原子的X,Y,Z坐标,f=1,2,...,Q,Q 是ATP中的原子个数;
10.4)根据步骤6),计算得分score:
Figure GDA0003232549720000074
其中
Figure GDA0003232549720000075
是ATP中T类型原子与Y类型蛋白质绑定残基Cα原子的距离,∠YTYh′是ATP中T类型原子与其绑定的Y类型蛋白质绑定残基以及非绑定的Y′类型蛋白质绑定残基的Cα原子所形成夹角的角度;
11)根据差分进化算法,对种群P中的每个个体Si,i∈{1,2,…,NP}作如下处理:
11.1)从当前种群P中随机选择三个不同的个体Sa、Sb与Sc,其中a≠b≠c≠i,根据如下等式生成一个突变个体Smutant
Smutant=Sa+F·(Sb-Sc)
11.2)根据如下过程生成交叉个体Scross
Figure GDA0003232549720000076
其中scross,j、smutant,j和si,j分别是Scross、Smutant和Si中的元素,j=1,2,...,6, jrand为1到6之间的随机整数,rand(0,1)为0到1之间的随机小数;
11.3)根据步骤10),分别计算Scross与Si对应的score得分score(Scross)与 score(Si);
11.4)如果score(Scross)<score(Si),则使用Scross替换种群P中的Si,否则Si保留在种群P中;
12)g=g+1;如果g>Gmax,则记录当前种群P中最低的得分score(Si)t和对应的ATP结构信息Atp,t=1,2,...,M;否则返回步骤12);
13)迭代步骤8)至步骤12),直到M种组合计算完成;从A1p,A2p,...,AMp中找出得分最低的结构信息作为最终的ATP结构信息输出。
本实施例以预测蛋白质1b0u和ATP对接后的复合物的三维空间结构为实施例,一种基于距离和角度信息的蛋白质ATP对接方法,包括以下步骤:
1)输入蛋白质和ATP的结构信息,分别记为D和A;
2)对于输入的蛋白质结构信息D,使用ATPbind服务器 (https://zhanglab.ccmb.med.umich.edu/ATPbind/)预测出蛋白质所有的ATP绑定残基,分别记为r1,r2,...,rm,其中m为预测出的ATP绑定残基个数;
3)根据r1,r2,...,rm的中心碳原子Cα坐标信息,取所有Cα坐标值的平均值,聚类出一个中心点CD;根据A中各原子坐标信息,取所有原子坐标值的平均值,聚类出一个中心点CA;移动ATP结构使得CA和CD的坐标重合;
4)对于PDB数据库中每个与蛋白质结合的ATP分子A(j),其中j=1,2,...,N, N为PDB数据库中ATP的数目,定义对于蛋白质的第l个ATP绑定残基,与该残基的Cα原子距离最近的ATP中的原子为该残基对应的绑定原子
Figure GDA0003232549720000081
l=1,2,...,n,其中n为该蛋白质ATP绑定残基的个数,若距离最近的ATP 原子已与之前的残基绑定过,则与次近的ATP原子进行绑定;
5)计算每一个绑定对的ATP原子与蛋白质绑定残基的Cα原子的距离
Figure GDA0003232549720000082
其中T为
Figure GDA0003232549720000083
原子的类型,Y是与
Figure GDA0003232549720000084
绑定的蛋白质残基的类型,计算
Figure GDA0003232549720000085
与Y 和Y′类型绑定残基的Cα原子的夹角∠YTY′j,k,其中,Y′是除与
Figure GDA0003232549720000086
原子组成绑定对的残基之外,剩下的n-1个蛋白质绑定残基的类型,k=1,2,...,n-1;
6)计算T类型的
Figure GDA0003232549720000087
原子与Y类型的蛋白质绑定残基间相互作用的平均距离,记作D(T,Y):
Figure GDA0003232549720000088
Figure GDA0003232549720000091
计算T类型的
Figure GDA0003232549720000092
原子与Y类型和Y′类型的蛋白质绑定残基形成的夹角的平均值,记作∠YTY′:
Figure GDA0003232549720000093
Figure GDA0003232549720000094
7)根据步骤5)中所有绑定对的蛋白质残基和
Figure GDA0003232549720000095
的原子类型,将A和D分成 M种绑定对组合方式,对每一种组合进行如下计算;
8)参数设置:设置种群规模NP=50,缩放因子F=0.6,交叉概率CR=0.7,最大迭代次数Gmax=1000,初始化迭代次数g=0;
9)种群初始化:随机生成初始种群P={S1,S2,...,Si,...,SNP}, Si=(si,1,si,2,si,3,si,4,si,5,si,6)为种群P的第i个个体,其中si,1、si,2和si,3的取值范围是
Figure GDA0003232549720000096
si,4、si,5与si,6的取值范围为0到2π;
10)对于种群中的每个个体Si,根据如下方式将蛋白质与ATP对接,并计算该个体的得分score(Si):
10.1)根据Si中的后三个元素si,4、si,5、si,6,计算三维空间旋转矩阵R:
Figure GDA0003232549720000097
10.2)将A中所有原子根据旋转矩阵R进行坐标旋转得到Ar
10.3)根据Si中的前三个元素si,1、si,2、si,3,将Ar中的所有原子进行坐标平移得到Ap,过程如下:
Figure GDA0003232549720000098
其中
Figure GDA0003232549720000099
分别是Ar中原子的X,Y,Z坐标,f=1,2,...,Q,Q 是ATP中的原子个数;
10.4)根据步骤6),计算得分score:
Figure GDA0003232549720000101
其中
Figure GDA0003232549720000102
是ATP中T类型原子与Y类型蛋白质绑定残基Cα原子的距离,∠YTYh′是ATP中T类型原子与其绑定的Y类型蛋白质绑定残基以及非绑定的Y′类型蛋白质绑定残基的Cα原子所形成夹角的角度;
11)根据差分进化算法,对种群P中的每个个体Si,i∈{1,2,…,NP}作如下处理:
11.1)从当前种群P中随机选择三个不同的个体Sa、Sb与Sc,其中a≠b≠c≠i,根据如下等式生成一个突变个体Smutant
Smutant=Sa+F·(Sb-Sc)
11.2)根据如下过程生成交叉个体Scross
Figure GDA0003232549720000103
其中scross,j、smutant,j和si,j分别是Scross、Smutant和Si中的元素,j=1,2,...,6, jrand为1到6之间的随机整数,rand(0,1)为0到1之间的随机小数;
11.3)根据步骤10),分别计算Scross与Si对应的score得分score(Scross)与score(Si);
11.4)如果score(Scross)<score(Si),则使用Scross替换种群P中的Si,否则Si保留在种群P中;
12)g=g+1;如果g>Gmax,则记录当前种群P中最低的得分score(Si)t和对应的ATP结构信息Atp,t=1,2,...,M;否则返回步骤12);
13)迭代步骤8)至步骤12),直到M种组合计算完成;从A1p,A2p,...,AMp中找出得分最低的结构信息作为最终的ATP结构信息输出。
以预测蛋白质1b0u和ATP对接的三维空间结构为实施例,运用以上方法得到的蛋白质1b0u和ATP的复合物三维空间结构信息,与湿实验测出的复合物结构的均方根偏差为
Figure GDA0003232549720000104
预测的蛋白质ATP复合物结构如图2所示。
以上说明是本发明以蛋白质1b0u和ATP为实例所得出的预测结果,并非限定本发明的实施范围,在不偏离本发明基本内容所涉及范围的前提下对其做各种变形和改进,不应排除在本发明的保护范围之外。

Claims (1)

1.一种基于距离和角度信息的蛋白质ATP对接方法,其特征在于:所述对接方法包括以下步骤:
1)输入蛋白质和ATP的结构信息,分别记为D和A;
2)对于输入的蛋白质结构信息D,使用ATPbind服务器预测出蛋白质所有的ATP绑定残基,分别记为r1,r2,...,rm,其中m为预测出的ATP绑定残基个数;
3)根据r1,r2,...,rm的中心碳原子Cα坐标信息,取所有Cα坐标值的平均值,聚类出一个中心点CD;根据A中各原子坐标信息,取所有原子坐标值的平均值,聚类出一个中心点CA;移动ATP结构使得CA和CD的坐标重合;
4)对于PDB数据库中每个与蛋白质结合的ATP分子A(j),其中j=1,2,...,N,N为PDB数据库中ATP的数目,定义对于蛋白质的第l个ATP绑定残基,与该残基Cα原子距离最近的ATP中的原子为该残基对应的绑定原子
Figure FDA0003232549710000011
Figure FDA0003232549710000012
其中n为该蛋白质ATP绑定残基的个数,若距离最近的ATP原子已与之前的残基绑定过,则与次近的ATP原子进行绑定;
5)计算每一个绑定对的ATP原子与蛋白质绑定残基的Cα原子的距离
Figure FDA0003232549710000013
其中T为
Figure FDA0003232549710000014
原子的类型,Y是与
Figure FDA0003232549710000015
绑定的蛋白质残基的类型,计算
Figure FDA0003232549710000016
与Y和Y′类型绑定残基的Cα原子的夹角∠YTY′j,k,其中,Y′是除与
Figure FDA0003232549710000017
原子组成绑定对的残基之外,剩下的n-1个蛋白质绑定残基的类型,k=1,2,...,n-1;
6)计算T类型的
Figure FDA0003232549710000018
原子与Y类型的蛋白质绑定残基间相互作用的平均距离,记作D(T,Y):
Figure FDA0003232549710000019
Figure FDA00032325497100000110
计算T类型的
Figure FDA00032325497100000111
原子与Y类型和Y′类型的蛋白质绑定残基形成的夹角的平均值,记作∠YTY′:
Figure FDA0003232549710000021
Figure FDA0003232549710000022
7)根据步骤5)中所有绑定对的蛋白质残基和
Figure FDA0003232549710000023
的原子类型,将A和D分成M种绑定对组合方式,对每一种组合进行如下计算;
8)参数设置:设置种群规模NP,缩放因子F,交叉概率CR,最大迭代次数Gmax,初始化迭代次数g=0;
9)种群初始化:随机生成初始种群P={S1,S2,...,Si,...,SNP},Si=(si,1,si,2,si,3,si,4,si,5,si,6)为种群P的第i个个体,其中si,1、si,2和si,3的取值范围是
Figure FDA0003232549710000024
si,4、si,5与si,6的取值范围为0到2π;
10)对于种群中的每个个体Si,根据如下方式将蛋白质与ATP对接,并计算该个体的得分score(Si):
10.1)根据Si中的后三个元素si,4、si,5、si,6,计算三维空间旋转矩阵R:
Figure FDA0003232549710000025
10.2)将A中所有原子根据旋转矩阵R进行坐标旋转得到Ar
10.3)根据Si中的前三个元素si,1、si,2、si,3,将Ar中的所有原子进行坐标平移得到Ap,过程如下:
Figure FDA0003232549710000026
其中
Figure FDA0003232549710000027
分别是Ar中原子的X,Y,Z坐标,f=1,2,...,Q,Q是ATP中的原子个数;
10.4)根据步骤6),计算得分score:
Figure FDA0003232549710000028
其中
Figure FDA0003232549710000029
是ATP中T类型原子与Y类型蛋白质绑定残基Cα原子的距离,∠YTY′h是ATP中T类型原子与其绑定的Y类型蛋白质绑定残基以及非绑定的Y′类型蛋白质绑定残基的Cα原子所形成夹角的角度;
11)根据差分进化算法,对种群P中的每个个体Si,i∈{1,2,…,NP}作如下处理:
11.1)从当前种群P中随机选择三个不同的个体Sa、Sb与Sc,其中a≠b≠c≠i,根据如下等式生成一个突变个体Smutant
Smutant=Sa+F·(Sb-Sc)
11.2)根据如下过程生成交叉个体Scross
Figure FDA0003232549710000031
其中scross,j、smutant,j和si,j分别是Scross、Smutant和Si中的元素,j=1,2,...,6,jrand为1到6之间的随机整数,rand(0,1)为0到1之间的随机小数;
11.3)根据步骤10),分别计算Scross与Si对应的score得分score(Scross)与score(Si);
11.4)如果score(Scross)<score(Si),则使用Scross替换种群P中的Si,否则Si保留在种群P中;
12)g=g+1;如果g>Gmax,则记录当前种群P中最低的得分score(Si)t和对应的ATP结构信息Atp,t=1,2,...,M;否则返回步骤12);
13)迭代步骤8)至步骤12),直到M种组合计算完成;从A1p,A2p,...,AMp中找出得分最低的结构信息作为最终的ATP结构信息输出。
CN201910746836.9A 2019-08-14 2019-08-14 一种基于距离和角度信息的蛋白质atp对接方法 Active CN110600076B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910746836.9A CN110600076B (zh) 2019-08-14 2019-08-14 一种基于距离和角度信息的蛋白质atp对接方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910746836.9A CN110600076B (zh) 2019-08-14 2019-08-14 一种基于距离和角度信息的蛋白质atp对接方法

Publications (2)

Publication Number Publication Date
CN110600076A CN110600076A (zh) 2019-12-20
CN110600076B true CN110600076B (zh) 2021-11-23

Family

ID=68854043

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910746836.9A Active CN110600076B (zh) 2019-08-14 2019-08-14 一种基于距离和角度信息的蛋白质atp对接方法

Country Status (1)

Country Link
CN (1) CN110600076B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112289371A (zh) * 2020-09-23 2021-01-29 北京望石智慧科技有限公司 蛋白质与小分子样本生成及结合能、结合构象预测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017087917A2 (en) * 2015-11-20 2017-05-26 Duke University Bicarbonate biosensors, calcium biosensors, and uses thereof
CN109273048A (zh) * 2018-09-12 2019-01-25 浙江工业大学 一种蛋白质表面残基的快速确定方法
CN109360599A (zh) * 2018-08-28 2019-02-19 浙江工业大学 一种基于残基接触信息交叉策略的蛋白质结构预测方法
WO2019049663A1 (ja) * 2017-09-08 2019-03-14 賢三 小俣 非天然アミノ酸由来のアミノ酸残基を含む人工タンパク質のリボソームによる合成への適性推測方法
CN109524058A (zh) * 2018-11-07 2019-03-26 浙江工业大学 一种基于差分进化的蛋白质二聚体结构预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017087917A2 (en) * 2015-11-20 2017-05-26 Duke University Bicarbonate biosensors, calcium biosensors, and uses thereof
WO2019049663A1 (ja) * 2017-09-08 2019-03-14 賢三 小俣 非天然アミノ酸由来のアミノ酸残基を含む人工タンパク質のリボソームによる合成への適性推測方法
CN109360599A (zh) * 2018-08-28 2019-02-19 浙江工业大学 一种基于残基接触信息交叉策略的蛋白质结构预测方法
CN109273048A (zh) * 2018-09-12 2019-01-25 浙江工业大学 一种蛋白质表面残基的快速确定方法
CN109524058A (zh) * 2018-11-07 2019-03-26 浙江工业大学 一种基于差分进化的蛋白质二聚体结构预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Defining a new nomenclature for the structures of active and inactive kinases";Modi V;《Proceedings of the National Academy of Sciences》;20190402;第1-10页 *
"识别蛋白质配体绑定残基的生物计算方法综述";於东军;《数据采集与处理》;20180331;第195-206页 *

Also Published As

Publication number Publication date
CN110600076A (zh) 2019-12-20

Similar Documents

Publication Publication Date Title
Pattanaik et al. Generating transition states of isomerization reactions with deep learning
CN107609342B (zh) 一种基于二级结构空间距离约束的蛋白质构象搜索方法
CN108846256B (zh) 一种基于残基接触信息的群体蛋白质结构预测方法
CN107633159B (zh) 一种基于距离相似度的蛋白质构象空间搜索方法
CN109524058B (zh) 一种基于差分进化的蛋白质二聚体结构预测方法
CN109360596B (zh) 一种基于差分进化局部扰动的蛋白质构象空间优化方法
CN110600075B (zh) 一种基于配体生长策略的蛋白质atp对接方法
Li et al. Structure prediction of RNA loops with a probabilistic approach
CN110600076B (zh) 一种基于距离和角度信息的蛋白质atp对接方法
CN109872770B (zh) 一种结合排挤度评价的多变异策略蛋白质结构预测方法
Pearce et al. Fast and accurate Ab Initio Protein structure prediction using deep learning potentials
CN109346125B (zh) 一种快速精确的蛋白质绑定口袋结构对齐方法
CN111180004B (zh) 一种多元接触信息的子种群策略蛋白质结构预测方法
CN109360597B (zh) 一种基于全局和局部策略协作的群体蛋白质结构预测方法
Ashtawy et al. Boosted neural networks scoring functions for accurate ligand docking and ranking
CN110197700B (zh) 一种基于差分进化的蛋白质atp对接方法
CN108920894B (zh) 一种基于简约抽象凸估计的蛋白质构象空间优化方法
Zhang et al. Two-stage distance feature-based optimization algorithm for de novo protein structure prediction
Roshan Multiple sequence alignment using Probcons and Probalign
CN110689929B (zh) 一种基于接触概率辅助的蛋白质atp对接方法
Dhakal et al. Predicting Protein-Ligand Binding Structure Using E (n) Equivariant Graph Neural Networks
Yue et al. A systematic review on the state-of-the-art strategies for protein representation
CN109448786B (zh) 一种下界估计动态策略蛋白质结构预测方法
CN109147867B (zh) 一种基于动态片段长度的群体蛋白质结构预测方法
CN109461471B (zh) 一种基于锦标赛机制的自适应蛋白质结构预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant