CN109524058B - 一种基于差分进化的蛋白质二聚体结构预测方法 - Google Patents

一种基于差分进化的蛋白质二聚体结构预测方法 Download PDF

Info

Publication number
CN109524058B
CN109524058B CN201811315949.5A CN201811315949A CN109524058B CN 109524058 B CN109524058 B CN 109524058B CN 201811315949 A CN201811315949 A CN 201811315949A CN 109524058 B CN109524058 B CN 109524058B
Authority
CN
China
Prior art keywords
population
cross
score
protein dimer
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811315949.5A
Other languages
English (en)
Other versions
CN109524058A (zh
Inventor
胡俊
肖璐倩
刘俊
周晓根
张贵军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Zhaoji Biotechnology Co ltd
Shenzhen Xinrui Gene Technology Co ltd
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201811315949.5A priority Critical patent/CN109524058B/zh
Publication of CN109524058A publication Critical patent/CN109524058A/zh
Application granted granted Critical
Publication of CN109524058B publication Critical patent/CN109524058B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于差分进化的蛋白质二聚体结构预测方法,首先,使用I‑TASSER服务器分别预测出蛋白质二聚体的两条链的结构信息,提升了蛋白质每条单链的空间结构的预测精度;然后,通过种群个体的设计将原先的蛋白质二聚体结构预测问题转换成搜索最优个体的优化问题,降低了计算代价;最后,通过使用差分进化算法搜索最优个体,提升了蛋白质二聚体结构的预测精度。本发明提供一种计算代价低、搜索效率高的基于差分进化的蛋白质二聚体结构预测方法。

Description

一种基于差分进化的蛋白质二聚体结构预测方法
技术领域
本发明涉及生物信息学、智能优化及计算机应用领域,具体而言涉及一种基于差分进化的蛋白质二聚体结构预测方法。
背景技术
蛋白质在生命活动中是普遍存在且不可或缺的,它在生物体内承担了多种多样的生物学功能,如酶蛋白的催化作用、膜蛋白的运输作用以及抗体蛋白的免疫作用等。为了完成这些复杂的生物学功能,蛋白质往往需要与其他蛋白质产生相互作用,形成以非共价键相结合的高分子配合物。其中,由两个蛋白质分子组合而成的高分子配合物称为蛋白质双聚体。研究蛋白质双聚体的空间结构,不仅对了解蛋白质双聚体的生物学功能和理解蛋白质之间相互作用的原理与机制至关重要,而且对新蛋白二聚体的设计、蛋白质之间相互作用建模、药物标靶蛋白的设计具有十分重要的指导意义。测定蛋白质二聚体空间结构的实验方法主要包括:X射线晶体衍射、多维核磁共振(NMR)以及冷冻电镜技术(Cryo-EM)。X射线晶体衍射是测定蛋白质二聚体空间结构较为有效的方法,所达到的精度是具有很高的可靠性,主要缺点是蛋白质晶体难以培养且晶体结构测定的周期较长;NMR方法可以直接测定蛋白质在溶液中的构象,但是对样品的需要量大、纯度要求高,目前常用于测定残基数目较少的蛋白质;Cryo-EM是最新的测定蛋白质二聚体空间结构的实验方法,测定的蛋白质二聚体空间结构准确性高,但其所需要的设备仪器价格高昂、维护成本较高。因此,如何以计算机为工具,运用适当的预测算法,从氨基酸序列出发直接预测蛋白质二聚体的空间结构,成为当前生物信息学中一种重要的研究课题。
目前,专门从氨基酸序列出发直接预测蛋白质二聚体空间结构的计算方法极为缺乏。大多数预测蛋白质二聚体空间结构的计算方法都是从已知空间结构信息的两个蛋白质单链出发的,此类方法有Z-DOCK(Brain G.Pierce,et al.ZDOCK server:interactivedocking prediction of protein–protein complexes and symmetric multimers[J].Bioinformatics,2014,30(12):1771-1773.即:布瑞恩.G.皮尔斯等.ZDOC服务器:蛋白质-蛋白质复合物和对称多聚体的交互式对接预测[J].生物信息学,2014,30(12):1771-1773.)与ClusPro(Stephen R.Comeau,et al.ClusPro:an automated docking anddiscrimination method for the prediction of protein complexes[J].Bioinformatics,2004,20(1):45-50.即:史蒂芬·R·科莫等.ClusPro:蛋白质复合物预测的自动对接和判别方法[J].生物信息学,2004,20(1):45-50.)等。其中,Z-DOCK预测一个蛋白质二聚体的空间结构平均需要11.5分钟,这对于直接从蛋白质单链结构出发的预测方法来说,并不能满足实际的需求;ClusPro预测的蛋白质二聚体空间结构与实验测定的空间结构之间的均方根偏差在
Figure BDA00018562650500000214
左右,距离实际应该还有较大的差距。
综上所述,现存的蛋白质二聚体空间结构预测方法在计算代价、预测精度方面,距离实际应用的要求还有很大差距,迫切地需要改进。
发明内容
为了克服现有的蛋白质二聚体结构预测方法在计算代价、预测精确性方面的不足,本发明提出一种计算代价低、预测精确性高的基于差分进化算法的蛋白质二聚体结构预测方法。
本发明解决其技术问题所采用的技术方案是:
一种基于差分进化的蛋白质二聚体结构预测方法,所述方法包括以下步骤:
1)输入待预测蛋白质二聚体中的两条链的序列信息,分别记作Chain1与Chain2
2)对于输入的序列信息Chain1与Chain2,使用I-TASSER服务器(http://zhanglab.ccmb.med.umich.edu/I-TASSER/)预测出对应的三维空间结构信息,分别记作T1与T2
3)计算T1与T2的中心点坐标,分别记作o1与o2
Figure BDA0001856265050000021
其中,N1与N2分别表示T1与T2中含有的氨基酸数目,
Figure BDA0001856265050000022
Figure BDA0001856265050000023
分别表示T1与T2中的第i个氨基酸的中心碳原子Cα的坐标;
4)计算T1中每个氨基酸的Cα的坐标
Figure BDA0001856265050000024
与o1之间的欧氏距离
Figure BDA0001856265050000025
并在所有氨基酸对应的
Figure BDA0001856265050000026
计算得到后,选择最大的
Figure BDA0001856265050000027
记作
Figure BDA0001856265050000028
5)计算T2中每个氨基酸的Cα的坐标
Figure BDA0001856265050000029
与o2之间的欧氏距离
Figure BDA00018562650500000210
并在所有氨基酸对应的
Figure BDA00018562650500000211
计算得到后,选择最大的
Figure BDA00018562650500000212
记作
Figure BDA00018562650500000213
6)参数设置:设置种群规模NP,突变因子F,交叉概率CR,最大迭代次数Gmax,初始化迭代次数G=0;
7)种群初始化:随机生成初始化种群P={S1,S2,...,Si,...,SNP},Si=(si,1,si,2,si,3,si,4,si,5,si,6)为种群P中的第i个个体,si,1、si,2、si,3、si,4、si,5与si,6为Si的6个元素,其中si,1与si,2的取值范围为0到1,si,3的取值范围为0到
Figure BDA0001856265050000031
si,4、si,5与si,6的取值范围为0到2π;
8)对于种群中的每个个体Si,根据如下方式组装T1与T2,并计算该个体的得分score(Si):
8.1)根据Si中的后三个元素si,4、si,5与si,6,计算出一个三维空间旋转矩阵R:
Figure BDA0001856265050000032
8.2)固定T1,将T2中的所有原子坐标信息,根据旋转矩阵R进行旋转,将旋转后的T2记作
Figure BDA0001856265050000033
8.3)根据Si中的前三个元素与o1,计算出一个新的三维空间点onew
Figure BDA0001856265050000034
其中ζ=1-2·si,1
Figure BDA0001856265050000035
T表示向量的转置;
8.4)固定T1,将
Figure BDA0001856265050000036
平移,使得平移后的
Figure BDA0001856265050000037
的中心点与onew重合,记平移后的
Figure BDA0001856265050000038
Figure BDA0001856265050000039
此时,T1
Figure BDA00018562650500000310
形成的复合物被看作为个体Si对应的蛋白质二聚体空间构象,记作
Figure BDA00018562650500000311
8.5)在
Figure BDA00018562650500000312
中,根据T1
Figure BDA00018562650500000313
之间的交互残基对数目ninter与冲突残基对的数目nclash,计算得分score(Si):
score(Si)=ninter-nclash
其中,当分别来自T1
Figure BDA00018562650500000314
的残基AA1,k与AA2,l的Cα原子之间的欧氏距离处于区间[dlow,dhigh]时,交互残基对数目ninter加1,当分别来自T1
Figure BDA00018562650500000315
的残基AA1,k与AA2,l的Cα原子之间的欧氏距离处于区间[0,dlow)时,冲突残基对数目nclash加1;
9)根据差分进化算法,对种群P中的每个个体Si,i∈{1,2,…,NP}作如下处理:
9.1)从当前种群中P随机选择三个不同的个体Sa、Sb与Sc,其中a≠b≠c≠i,根据如下等式生成一个突变个体Smutant
Smutant=Sa+F·(Sb-Sc)
9.2)将Si中的元素信息复制到交叉个体Scross中,再在Scross的6个元素中随机选择一个元素scross,j,使用Smutant中对应的元素smutant,j替换,最后,对于Scross中的每一个元素,使用随机生成的0到1之间的随机数R来控制是否使用Smutant中对应的元素来替换:若R<CR,则替换,否则不替换;
9.3)根据步骤8),分别计算Scross与Si对应的得分score(Scross)与score(Si);
9.4)如果score(Scross)>score(Si),则使用Scross替换种群P中的Si,否则Si保留在种群P中;
10)G=G+1,如果G>Gmax,则根据当前种群P中得分最高的个体Sbest,使用步骤8)组装T1与T2,生成的新空间构象decoybest作为最终的预测结构输出,否则返回步骤9)。
本发明的技术构思为:首先,使用I-TASSER服务器分别预测出蛋白质二聚体的两条链的结构信息,提升了蛋白质每条单链的空间结构的预测精度;然后,通过种群个体的设计将原先的蛋白质二聚体结构预测问题转换成搜索最优个体的优化问题,降低了计算代价;最后,通过使用差分进化算法搜索最优个体,提升了蛋白质二聚体结构的预测精度。本发明提供一种计算代价低、搜索效率高的基于差分进化的蛋白质二聚体结构预测方法。
本发明的有益效果表现在:一方面,使用I-TASSER预测蛋白质二聚体复合物中单链的三维空间结构,提升了单链结构的预测精度,为进一步提升蛋白质二聚体复合物结构的预测精度做好了准备;另一方面,将蛋白质二聚体复合物结构预测问题转换成选择最优个体的优化问题,并使用差分进化算法搜索最优个体,提高了蛋白质二聚体复合物结构预测的效率与准确性。
附图说明
图1为一种基于差分进化的蛋白质二聚体结构预测方法的示意图。
图2为使用一种基于差分进化的蛋白质二聚体结构预测方法对蛋白质二聚体5tpt进行预测后得到三维空间结构图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1和图2,一种基于差分进化的蛋白质二聚体结构预测方法,包括以下步骤:
1)输入待预测蛋白质二聚体中的两条链的序列信息,分别记作Chain1与Chain2
2)对于输入的序列信息Chain1与Chain2,使用I-TASSER服务器(http://zhanglab.ccmb.med.umich.edu/I-TASSER/)预测出对应的三维空间结构信息,分别记作T1与T2
3)计算T1与T2的中心点坐标,分别记作o1与o2
Figure BDA0001856265050000051
其中,N1与N2分别表示T1与T2中含有的氨基酸数目,
Figure BDA0001856265050000052
Figure BDA0001856265050000053
分别表示T1与T2中的第i个氨基酸的中心碳原子Cα的坐标;
4)计算T1中每个氨基酸的Cα的坐标
Figure BDA0001856265050000054
与o1之间的欧氏距离
Figure BDA0001856265050000055
并在所有氨基酸对应的
Figure BDA0001856265050000056
计算得到后,选择最大的
Figure BDA0001856265050000057
记作
Figure BDA0001856265050000058
5)计算T2中每个氨基酸的Cα的坐标
Figure BDA0001856265050000059
与o2之间的欧氏距离
Figure BDA00018562650500000510
并在所有氨基酸对应的
Figure BDA00018562650500000511
计算得到后,选择最大的
Figure BDA00018562650500000512
记作
Figure BDA00018562650500000513
6)参数设置:设置种群规模NP,突变因子F,交叉概率CR,最大迭代次数Gmax,初始化迭代次数G=0;
7)种群初始化:随机生成初始化种群P={S1,S2,...,Si,...,SNP},Si=(si,1,si,2,si,3,si,4,si,5,si,6)为种群P中的第i个个体,si,1、si,2、si,3、si,4、si,5与si,6为Si的6个元素,其中si,1与si,2的取值范围为0到1,si,3的取值范围为0到
Figure BDA00018562650500000514
si,4、si,5与si,6的取值范围为0到2π;
8)对于种群中的每个个体Si,根据如下方式组装T1与T2,并计算该个体的得分score(Si):
8.1)根据Si中的后三个元素si,4、si,5与si,6,计算出一个三维空间旋转矩阵R:
Figure BDA0001856265050000061
8.2)固定T1,将T2中的所有原子坐标信息,根据旋转矩阵R进行旋转,将旋转后的T2记作
Figure BDA0001856265050000062
8.3)根据Si中的前三个元素与o1,计算出一个新的三维空间点onew
Figure BDA0001856265050000063
其中ζ=1-2·si,1
Figure BDA0001856265050000064
T表示向量的转置;
8.4)固定T1,将
Figure BDA0001856265050000065
平移,使得平移后的
Figure BDA0001856265050000066
的中心点与onew重合,记平移后的
Figure BDA0001856265050000067
Figure BDA0001856265050000068
此时,T1
Figure BDA0001856265050000069
形成的复合物被看作为个体Si对应的蛋白质二聚体空间构象,记作
Figure BDA00018562650500000610
8.5)在
Figure BDA00018562650500000611
中,根据T1
Figure BDA00018562650500000612
之间的交互残基对数目ninter与冲突残基对的数目nclash,计算得分score(Si):
score(Si)=ninter-nclash
其中,当分别来自T1
Figure BDA00018562650500000613
的残基AA1,k与AA2,l的Cα原子之间的欧氏距离处于区间[dlow,dhigh]时,交互残基对数目ninter加1,当分别来自T1
Figure BDA00018562650500000614
的残基AA1,k与AA2,l的Cα原子之间的欧氏距离处于区间[0,dlow)时,冲突残基对数目nclash加1;
9)根据差分进化算法,对种群P中的每个个体Si,i∈{1,2,…,NP}作如下处理:
9.1)从当前种群中P随机选择三个不同的个体Sa、Sb与Sc,其中a≠b≠c≠i,根据如下等式生成一个突变个体Smutant
Smutant=Sa+F·(Sb-Sc)
9.2)将Si中的元素信息复制到交叉个体Scross中,再在Scross的6个元素中随机选择一个元素scross,j,使用Smutant中对应的元素smutant,j替换,最后,对于Scross中的每一个元素,使用随机生成的0到1之间的随机数R来控制是否使用Smutant中对应的元素来替换:若R<CR,则替换,否则不替换;
9.3)根据步骤8),分别计算Scross与Si对应的得分score(Scross)与score(Si);
9.4)如果score(Scross)>score(Si),则使用Scross替换种群P中的Si,否则Si保留在种群P中;
10)G=G+1,如果G>Gmax,则根据当前种群P中得分最高的个体Sbest,使用步
骤8)组装T1与T2,生成的新空间构象decoybest作为最终的预测结构输出,否
则返回步骤9)。
本实施例以预测蛋白质二聚体复合物5tpt的三维空间结构为实施例,一种基于差分进化的蛋白质二聚体结构预测方法,包括以下步骤:
1)输入待预测蛋白质二聚体中的两条链的序列信息,分别记作Chain1与Chain2
2)对于输入的序列信息Chain1与Chain2,使用I-TASSER服务器(http://zhanglab.ccmb.med.umich.edu/I-TASSER/)预测出对应的三维空间结构信息,分别记作T1与T2
3)计算T1与T2的中心点坐标,分别记作o1与o2
Figure BDA0001856265050000071
其中,N1与N2分别表示T1与T2中含有的氨基酸数目,
Figure BDA0001856265050000072
Figure BDA0001856265050000073
分别表示T1与T2中的第i个氨基酸的中心碳原子Cα的坐标;
4)计算T1中每个氨基酸的Cα的坐标
Figure BDA0001856265050000074
与o1之间的欧氏距离
Figure BDA0001856265050000075
并在所有氨基酸对应的
Figure BDA0001856265050000076
计算得到后,选择最大的
Figure BDA0001856265050000077
记作
Figure BDA0001856265050000078
5)计算T2中每个氨基酸的Cα的坐标
Figure BDA0001856265050000079
与o2之间的欧氏距离
Figure BDA00018562650500000710
并在所有氨基酸对应的
Figure BDA00018562650500000711
计算得到后,选择最大的
Figure BDA00018562650500000712
记作
Figure BDA00018562650500000713
6)参数设置:设置种群规模NP为50,突变因子F为0.5,交叉概率CR为0.5,最大迭代次数Gmax为2000,初始化迭代次数G=0;
7)种群初始化:随机生成初始化种群P={S1,S2,...,Si,...,SNP},Si=(si,1,si,2,si,3,si,4,si,5,si,6)为种群P中的第i个个体,si,1、si,2、si,3、si,4、si,5与si,6为Si的6个元素,其中si,1与si,2的取值范围为0到1,si,3的取值范围为0到
Figure BDA00018562650500000714
si,4、si,5与si,6的取值范围为0到2π;
8)对于种群中的每个个体Si,根据如下方式组装T1与T2,并计算该个体的得分score(Si):
8.1)根据Si中的后三个元素si,4、si,5与si,6,计算出一个三维空间旋转矩阵R:
Figure BDA0001856265050000081
8.2)固定T1,将T2中的所有原子坐标信息,根据旋转矩阵R进行旋转,将旋转后的T2记作
Figure BDA0001856265050000082
8.3)根据Si中的前三个元素与o1,计算出一个新的三维空间点onew
Figure BDA0001856265050000083
其中ζ=1-2·si,1
Figure BDA0001856265050000084
T表示向量的转置;
8.4)固定T1,将
Figure BDA0001856265050000085
平移,使得平移后的
Figure BDA0001856265050000086
的中心点与onew重合,记平移后的
Figure BDA0001856265050000087
Figure BDA0001856265050000088
此时,T1
Figure BDA0001856265050000089
形成的复合物被看作为个体Si对应的蛋白质二聚体空间构象,记作
Figure BDA00018562650500000810
8.5)在
Figure BDA00018562650500000811
中,根据T1
Figure BDA00018562650500000812
之间的交互残基对数目ninter与冲突残基对的数目nclash,计算得分score(Si):
score(Si)=ninter-nclash
其中,当分别来自T1
Figure BDA00018562650500000813
的残基AA1,k与AA2,l的Cα原子之间的欧氏距离处于区间[dlow,dhigh]时,交互残基对数目ninter加1,当分别来自T1
Figure BDA00018562650500000814
的残基AA1,k与AA2,l的Cα原子之间的欧氏距离处于区间[0,dlow)时,冲突残基对数目nclash加1,dlow与dhigh分别为
Figure BDA00018562650500000815
Figure BDA00018562650500000816
9)根据差分进化算法,对种群P中的每个个体Si,i∈{1,2,…,NP}作如下处理:
9.1)从当前种群中P随机选择三个不同的个体Sa、Sb与Sc,其中a≠b≠c≠i,根据如下等式生成一个突变个体Smutant
Smutant=Sa+F·(Sb-Sc)
9.2)将Si中的元素信息复制到交叉个体Scross中,再在Scross的6个元素中随机选择一个元素scross,j,使用Smutant中对应的元素smutant,j替换,最后,对于Scross中的每一个元素,使用随机生成的0到1之间的随机数R来控制是否使用Smutant中对应的元素来替换:若R<CR,则替换,否则不替换;
9.3)根据步骤8),分别计算Scross与Si对应的得分score(Scross)与score(Si);
9.4)如果score(Scross)>score(Si),则使用Scross替换种群P中的Si,否则Si保留在种群P中;
10)G=G+1,如果G>Gmax,则根据当前种群P中得分最高的个体Sbest,使用步骤8)组装T1与T2,生成的新空间构象decoybest作为最终的预测结构输出,否则返回步骤9)。
以预测蛋白质二聚体复合物5tpt的三维空间结构为实施例,运用以上方法得到的蛋白质二聚体复合物5tpt的三维空间结构信息,与湿实验测出的复合物结构的均方根偏差为
Figure BDA0001856265050000091
预测的二聚体复合物结构如图2所示。
以上说明是本发明以蛋白质二聚体复合物5tpt为实例所得出的预测结果,并非限定本发明的实施范围,在不偏离本发明基本内容所涉及范围的前提下对其做各种变形和改进,不应排除在本发明的保护范围之外。

Claims (1)

1.一种基于差分进化的蛋白质二聚体结构预测方法,其特征在于,所述预测方法包括以下步骤:
1)输入待预测蛋白质二聚体中的两条链的序列信息,分别记作Chain1与Chain2
2)对于输入的序列信息Chain1与Chain2,使用I-TASSER服务器预测出对应的三维空间结构信息,分别记作T1与T2
3)计算T1与T2的中心点坐标,分别记作o1与o2
Figure FDA0002792276610000011
其中,N1与N2分别表示T1与T2中含有的氨基酸数目,
Figure FDA0002792276610000012
Figure FDA0002792276610000013
分别表示T1与T2中的第i个氨基酸的中心碳原子Cα的坐标;
4)计算T1中每个氨基酸的Cα的坐标
Figure FDA0002792276610000014
与o1之间的欧氏距离
Figure FDA0002792276610000015
并在所有氨基酸对应的
Figure FDA0002792276610000016
计算得到后,选择最大的
Figure FDA0002792276610000017
记作
Figure FDA0002792276610000018
5)计算T2中每个氨基酸的Cα的坐标
Figure FDA0002792276610000019
与o2之间的欧氏距离
Figure FDA00027922766100000110
并在所有氨基酸对应的
Figure FDA00027922766100000111
计算得到后,选择最大的
Figure FDA00027922766100000112
记作
Figure FDA00027922766100000113
6)参数设置:设置种群规模NP,突变因子F,交叉概率CR,最大迭代次数Gmax,初始化迭代次数G=0;
7)种群初始化:随机生成初始化种群P={S1,S2,...,Si,...,SNP},Si=(si,1,si,2,si,3,si,4,si,5,si,6)为种群P中的第i个个体,si,1、si,2、si,3、si,4、si,5与si,6为Si的6个元素,其中si,1与si,2的取值范围为0到1,si,3的取值范围为0到
Figure FDA00027922766100000114
si,4、si,5与si,6的取值范围为0到2π;
8)对于种群中的每个个体Si,根据如下方式组装T1与T2,并计算该个体的得分score(Si):
8.1)根据Si中的后三个元素si,4、si,5与si,6,计算出一个三维空间旋转矩阵R:
Figure FDA00027922766100000115
8.2)固定T1,将T2中的所有原子坐标信息,根据旋转矩阵R进行旋转,将旋转后的T2记作
Figure FDA0002792276610000021
8.3)根据Si中的前三个元素与o1,计算出一个新的三维空间点onew
Figure FDA0002792276610000022
其中ζ=1-2·si,1
Figure FDA0002792276610000023
T表示向量的转置;
8.4)固定T1,将
Figure FDA0002792276610000024
平移,使得平移后的
Figure FDA0002792276610000025
的中心点与onew重合,记平移后的
Figure FDA0002792276610000026
Figure FDA0002792276610000027
此时,T1
Figure FDA0002792276610000028
形成的复合物被看作为个体Si对应的蛋白质二聚体空间构象,记作
Figure FDA0002792276610000029
8.5)在
Figure FDA00027922766100000210
中,根据T1
Figure FDA00027922766100000211
之间的交互残基对数目ninter与冲突残基对的数目nclash,计算得分score(Si):
score(Si)=ninter-nclash
其中,当分别来自T1
Figure FDA00027922766100000212
的残基AA1,k与AA2,l的Cα原子之间的欧氏距离处于区间[dlow,dhigh]时,交互残基对数目ninter加1,当分别来自T1
Figure FDA00027922766100000213
的残基AA1,k与AA2,l的Cα原子之间的欧氏距离处于区间[0,dlow)时,冲突残基对数目nclash加1;
9)根据差分进化算法,对种群P中的每个个体Si,i∈{1,2,…,NP}作如下处理:
9.1)从当前种群P中随机选择三个不同的个体Sa、Sb与Sc,其中a≠b≠c≠i,
根据如下等式生成一个突变个体Smutant
Smutant=Sa+F·(Sb-Sc)
9.2)将Si中的元素信息复制到交叉个体Scross中,再在Scross的6个元素中随机选择一个元素scross,j,使用Smutant中对应的元素smutant,j替换,最后,对于Scross中的每一个元素,使用随机生成的0到1之间的随机数R来控制是否使用Smutant中对应的元素来替换:若R<CR,则替换,否则不替换;
9.3)根据步骤8),分别计算Scross与Si对应的得分score(Scross)与score(Si);
9.4)如果score(Scross)>score(Si),则使用Scross替换种群P中的Si,否则Si保留在种群P中;
10)G=G+1,如果G>Gmax,则根据当前种群P中得分最高的个体Sbest,使用步骤8)组装T1与T2,生成的新空间构象decoybest作为最终的预测结构输出,否则返回步骤9)。
CN201811315949.5A 2018-11-07 2018-11-07 一种基于差分进化的蛋白质二聚体结构预测方法 Active CN109524058B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811315949.5A CN109524058B (zh) 2018-11-07 2018-11-07 一种基于差分进化的蛋白质二聚体结构预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811315949.5A CN109524058B (zh) 2018-11-07 2018-11-07 一种基于差分进化的蛋白质二聚体结构预测方法

Publications (2)

Publication Number Publication Date
CN109524058A CN109524058A (zh) 2019-03-26
CN109524058B true CN109524058B (zh) 2021-02-26

Family

ID=65773396

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811315949.5A Active CN109524058B (zh) 2018-11-07 2018-11-07 一种基于差分进化的蛋白质二聚体结构预测方法

Country Status (1)

Country Link
CN (1) CN109524058B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110197700B (zh) * 2019-04-16 2021-04-06 浙江工业大学 一种基于差分进化的蛋白质atp对接方法
CN110600075B (zh) * 2019-08-14 2021-08-03 浙江工业大学 一种基于配体生长策略的蛋白质atp对接方法
CN110600076B (zh) * 2019-08-14 2021-11-23 浙江工业大学 一种基于距离和角度信息的蛋白质atp对接方法
CN110689929B (zh) * 2019-08-29 2021-12-17 浙江工业大学 一种基于接触概率辅助的蛋白质atp对接方法
CN114927165B (zh) * 2022-07-20 2022-12-02 深圳大学 泛素化位点的识别方法、装置、系统和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007075042A (ja) * 2005-09-15 2007-03-29 Univ Of Fukui 変異型hergチャネル発現細胞およびその用途
CN103413067A (zh) * 2013-07-30 2013-11-27 浙江工业大学 一种基于抽象凸下界估计的蛋白质结构预测方法
CN103500292A (zh) * 2013-09-27 2014-01-08 南京理工大学 配体特异性蛋白质-配体绑定区域预测方法
CN105760710A (zh) * 2016-03-11 2016-07-13 浙江工业大学 一种基于两阶段差分进化算法的蛋白质结构预测方法
CN106503484A (zh) * 2016-09-23 2017-03-15 浙江工业大学 一种基于抽象凸估计的多阶段差分进化蛋白质结构预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007075042A (ja) * 2005-09-15 2007-03-29 Univ Of Fukui 変異型hergチャネル発現細胞およびその用途
CN103413067A (zh) * 2013-07-30 2013-11-27 浙江工业大学 一种基于抽象凸下界估计的蛋白质结构预测方法
CN103500292A (zh) * 2013-09-27 2014-01-08 南京理工大学 配体特异性蛋白质-配体绑定区域预测方法
CN105760710A (zh) * 2016-03-11 2016-07-13 浙江工业大学 一种基于两阶段差分进化算法的蛋白质结构预测方法
CN106503484A (zh) * 2016-09-23 2017-03-15 浙江工业大学 一种基于抽象凸估计的多阶段差分进化蛋白质结构预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Conformational Space Sampling Method Using Multi-subpopulation Differential Evolution for De novo Protein Structure Prediction;Xiao-Hu Hao et al.;《IEEE TRANSACTIONS ON NANOBIOSCIENCE》;20171031;第16卷(第7期);第618-633页 *
I-TASSER server for protein 3D structure prediction;Yang Zhang;《BMC Bioinformatics》;20080123;第1-8页 *
蛋白质对接算法与实践;黄一清;《中国优秀硕士学位论文全文数据库 基础科学辑》;20141015(第10期);全文 *

Also Published As

Publication number Publication date
CN109524058A (zh) 2019-03-26

Similar Documents

Publication Publication Date Title
CN109524058B (zh) 一种基于差分进化的蛋白质二聚体结构预测方法
Zimmermann et al. A completely reimplemented MPI bioinformatics toolkit with a new HHpred server at its core
Zheng et al. Detecting distant-homology protein structures by aligning deep neural-network based contact maps
CN110148437B (zh) 一种残基接触辅助策略自适应的蛋白质结构预测方法
CN108846256B (zh) 一种基于残基接触信息的群体蛋白质结构预测方法
CN109215732B (zh) 一种基于残基接触信息自学习的蛋白质结构预测方法
CN109360599B (zh) 一种基于残基接触信息交叉策略的蛋白质结构预测方法
Vangaveti et al. Integrating ab initio and template-based algorithms for protein–protein complex structure prediction
Dürr et al. Metal3D: a general deep learning framework for accurate metal ion location prediction in proteins
Pearce et al. Fast and accurate Ab Initio Protein structure prediction using deep learning potentials
CN109872770B (zh) 一种结合排挤度评价的多变异策略蛋白质结构预测方法
Zhao et al. Protein secondary structure prediction using NMR chemical shift data
Lee et al. Introduction of the Korea BioData Station (K-BDS) for sharing biological data
CN109360597B (zh) 一种基于全局和局部策略协作的群体蛋白质结构预测方法
CN108920894B (zh) 一种基于简约抽象凸估计的蛋白质构象空间优化方法
Zhang et al. Two-stage distance feature-based optimization algorithm for de novo protein structure prediction
CN109360598B (zh) 一种基于两阶段采样的蛋白质结构预测方法
Bassot et al. Using pconsc4 and pconsfold2 to predict protein structure
CN109411013B (zh) 一种基于个体特定变异策略的群体蛋白质结构预测方法
CN109147867B (zh) 一种基于动态片段长度的群体蛋白质结构预测方法
CN109243526B (zh) 一种基于特定片段交叉的蛋白质结构预测方法
CN111815036B (zh) 一种基于多残基接触图协同约束的蛋白质结构预测方法
CN109378035B (zh) 一种基于二级结构动态选择策略的蛋白质结构预测方法
CN110689929B (zh) 一种基于接触概率辅助的蛋白质atp对接方法
CN109256177B (zh) 一种基于子种群协同进化的蛋白质结构预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20221125

Address after: D1101, Building 4, Software Industry Base, No. 19, 17, 18, Haitian 1st Road, Binhai Community, Yuehai Street, Nanshan District, Shenzhen, Guangdong, 518000

Patentee after: Shenzhen Xinrui Gene Technology Co.,Ltd.

Address before: N2248, Floor 3, Xingguang Yingjing, No. 117, Shuiyin Road, Yuexiu District, Guangzhou, Guangdong 510,000

Patentee before: GUANGZHOU ZHAOJI BIOTECHNOLOGY CO.,LTD.

Effective date of registration: 20221125

Address after: N2248, Floor 3, Xingguang Yingjing, No. 117, Shuiyin Road, Yuexiu District, Guangzhou, Guangdong 510,000

Patentee after: GUANGZHOU ZHAOJI BIOTECHNOLOGY CO.,LTD.

Address before: The city Zhaohui six districts Chao Wang Road Hangzhou City, Zhejiang province 310014 18

Patentee before: JIANG University OF TECHNOLOGY

TR01 Transfer of patent right