CN109326320B - 一种系综构象选择策略自适应的蛋白质结构预测方法 - Google Patents

一种系综构象选择策略自适应的蛋白质结构预测方法 Download PDF

Info

Publication number
CN109326320B
CN109326320B CN201810994644.5A CN201810994644A CN109326320B CN 109326320 B CN109326320 B CN 109326320B CN 201810994644 A CN201810994644 A CN 201810994644A CN 109326320 B CN109326320 B CN 109326320B
Authority
CN
China
Prior art keywords
conformation
population
secondary structure
residue
selection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810994644.5A
Other languages
English (en)
Other versions
CN109326320A (zh
Inventor
张贵军
马来发
谢腾宇
周晓根
王小奇
王柳静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201810994644.5A priority Critical patent/CN109326320B/zh
Publication of CN109326320A publication Critical patent/CN109326320A/zh
Application granted granted Critical
Publication of CN109326320B publication Critical patent/CN109326320B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种系综构象选择策略自适应的蛋白质结构预测方法,首先预测查询序列的二级结构信息,残基间接触信息,构建片段库;其次建立基于二级结构信息的相似性评分函数和基于残基间接触评价函数,设计交叉、变异、选择策略,设计基于二级结构相似性和能量的选择策略,利用种群二级结构相似性收敛性,设计三个选择策略的自适应概率函数;最后根据种群二级结构相似性评分函数值、残基间接触评价函数值和能量值实现种群更新,利用系综构象选择策略自适应的蛋白质结构预测方法能够有效地提高算法采样能力,构象能够形成好的二级结构,预测得到低能量的构象。本发明提供一种预测精度较高的系综构象选择策略自适应蛋白质结构预测方法。

Description

一种系综构象选择策略自适应的蛋白质结构预测方法
技术领域
本发明涉及生物信息学、智能信息处理、计算机应用领域、蛋白质结构预测,尤其涉及的是一种系综构象选择策略自适应的蛋白质结构预测方法。
背景技术
蛋白质分子在生物细胞化学反应过程中起着至关重要的作用。它们的结构模型和生物活性状态对我们理解和治愈多种疾病有重要的意义。蛋白质只有折叠成特定的三维结构才能产生其特有的生物学功能。要了解蛋白质的功能,就必须获得其三维空间结构。因此,获得蛋白质的三维结构对人类来说是至关重要的,1961年,Anfinsen提出了氨基酸序列决定蛋白质三维结构这一开创新的理论。而三维结构直接决定了蛋白质的生物性功能,所以人们对蛋白质的三维结构产生了浓厚兴趣并展开研究。国外学者肯德鲁和佩鲁茨对肌血蛋白和血红蛋白进行了结构分析,得到其蛋白质三维结构,是人类第一次测定蛋白质的三维结构,二人借此夺得年诺贝尔化学奖。此外,英国晶体学家Bernal与1958年提出了蛋白质四级结构的概念,将其定义为蛋白质一级结构、二级结构以及结构的延伸发展。多维核磁共振方法和射线晶体方法是近些年来发展起来的两个最主要的测定蛋白质结构的实验方法。多维核磁共振方法是将蛋白质放在水中,利用核磁共振直接测定其三维结构的方法。而射线晶体方法是目前为止最有效的蛋白质三维结构测定手段。到前为止,使用这两种方法测定的蛋白质占了已测蛋白质中的绝大比例。由于釆用实验方法的条件有限、时间有限,需要花费大量的人力和物力,而且测定的速度远远跟不上序列的测定速度,所以急需一种既不依赖化学实验,又具有一定准确率的预测方法。这样如何简便、快速、高效地对未知蛋白质进行三维结构预测,成为研究者的棘手问题。在理论探索和应用需求的双重推动下,依据提出的蛋白质一级结构决定蛋白质三维结构的理论,利用计算机设计适当的算法,以序列为起点,三维结构为目标的蛋白质结构预测自20世纪末蓬勃发展。
以序列为起点,利用计算机和优化算法预测蛋白质的三维结构被称之为从头预测。从头预测方法直接基于蛋白质物理或知识能量模型,利用优化算法在构象空间搜索全局最低能量构象解。构象空间优化(或称采样)方法是目前制约蛋白质结构从头预测精度最关键的因素之一。优化算法应用于从头预测采样过程必须首先解决以下三个方面的问题:(1)能量模型的复杂性。蛋白质能量模型考虑分子体系成键作用以及范德华力、静电、氢键、疏水等非成键作用,致使其形成的能量曲面极其粗糙,局部极小解数量随着序列长度的增加呈指数增长;能量模型的漏斗特性也必然会产生局部高能量障碍,导致算法极易陷入局部解。(2)能量模型高维特性。就目前而言,从头预测方法只能应对尺寸较小的目标蛋白,一般不超过100。对尺寸超过150残基以上的目标蛋白,现有优化方法均无能为力。这也就进一步说明了随着尺寸规模的增加,必然造成维数灾问题,完成如此浩瀚的构象搜索过程所涉及的计算量是目前最先进的计算机也难以承受的。(3)能量模型的不精确性。对于蛋白质这类复杂的生物大分子,除了考虑各种物理成键和知识推理的作用之外,还要考虑它与周围溶剂分子的相互作用,目前还无法给出精确的物理描述。考虑到计算代价问题,近十年来研究者陆续提出了一些基于物理的力场简化模型(AMBER,CHARMM等)、基于知识的力场简化模型(Rosetta,QUARK等)。然而,我们还远远无法构建起能引导目标序列朝正确方向折叠的足够精确力场,导致数学上的最优解并不一定对应于目标蛋白的天然态结构;此外,模型的不精确性也必然会导致无法对算法性能进行客观地分析,从而阻碍了高性能算法在蛋白质结构从头预测领域中的应用。
因此,现在的蛋白质结构预测方法在预测精度和能量函数方面存在着缺陷,需要改进。
发明内容
为了克服现有的蛋白质结构预测方法能量函数不精确和预测精度较低的缺陷,本发明提供一种预测精度较高的一种系综构象选择策略自适应的蛋白质结构预测方法。
本发明解决其技术问题所采用的技术方案是:
一种系综构象选择策略自适应的蛋白质结构预测方法,所述方法包括以下步骤:
1)利用PSIPRED(http://bioinf.cs.ucl.ac.uk/psipred)预测查询序列的二级结构信息,利用MetaPSICOV(http://bioinf.cs.ucl.ac.uk/MetaPSICOV)预测查询序列的残基间距离接触信息;
2)设置初始种群规模NP、最大迭代次数Gen、交叉概率CR、输入查询序列、片段库、片段组装次数N和迭代次数g=0;
3)对种群所有构象进行初始化,对每个构象进行N次片段组装;
4)构象交叉,操作如下:
4.1)选择第i,i∈[1,NP]个构象Ci为目标构象,产生一个随机数r,r∈[0,1],如果r小于CR,则跳到4.2),否则跳至步骤5);
4.2)随机选择一个构象Cj,j≠i,利用计算二级结构算法DSSP获取构象Ci的二级结构信息;
4.3)根据Ci残基位置随机选择一个交叉点p,判断交叉点p对应的残基被预测的二级结构的类型;
4.4)针对Ci和Cj,从交叉点p开始依次互换二面角对直到从交叉点p起预测的二级结构类型和交叉点p处对应的二级结构类型不同为止,产生一个新构象C′i
5)构象变异,对构象C′i和C′j,变异过程如下:
对构象C′i进行3残基片段组装,对C′j进行9残基片段组装,生成两个构象C″i和C″j
6)分别对构象C″i和C″j求二级结构相似性分值Ess
Figure BDA0001781582620000031
其中L是查询序列长度,
Figure BDA0001781582620000032
是查询序列第l个残基预测的二级结构,
Figure BDA0001781582620000033
是测试构象的第l个残基的二级结构,其值由DSSP求得;
7)分别对构象C″i和C″j求残基间距离约束分值Eco
Figure BDA0001781582620000034
其中N是残基接触总数,
Figure BDA0001781582620000035
是查询序列第k个残基对p和q被预测为有接触的置信度,
Figure BDA0001781582620000036
是测试构象的第k个残基对p和q之间的Cα距离,dcon是预测为接触的阈值,
Figure BDA0001781582620000037
8)求种群中每个构象的二级结构相似性分值Ess,计算种群二级结构相似性分值的平均值
Figure BDA0001781582620000038
和方差σ;
9)根据平均值
Figure BDA0001781582620000039
和方差σ,求选择策略切换概率pse
Figure BDA00017815826200000310
其中L是查询序列的长度,
Figure BDA00017815826200000311
和σ分别是种群二级结构相似性分值的平均值和方差;
10)基于选择策略切换概率pse进行选择,过程如下:
10.1)产生一个随机数r′,r′∈[0,1],如果r′<pse,则跳至10.3);
10.2)根据二级结构相似性分值进行种群更新,过程如下:
10.2.1)对种群中的每个构象求二级结构相似性分值Ess,并求出最小的二级结构相似性分值E″ss
10.2.2)从构象C″i和C″j中选择二级结构相似得分E′ss最高的构象作为测试构象;
10.2.3)如果E′ss大于E″ss,则用E′ss对应的构象替换E″ss对应的构象实现种群更新,否则跳至10.4);
10.3)根据残基间距离约束进行选择,过程如下:
10.3.1)对种群中的每个构象求残基间距离约束分值Eco,并求出最小的残基间距离约束分值E″co
10.3.2)从构象C″i和C″j中选择残基间距离约束分值E′co最高的构象作为测试构象;
10.3.3)如果E′co大于E″co,则用E′co对应的构象替换E″co对应的构象实现种群更新,否则跳到10.4);
10.4)根据能量值进行种群更新,过程如下:
10.4.1)对种群中的每个构象利用能量函数Rosetta score3计算能量值E,并计算出最大的能量值E′,分别对构象C″i和C″j利用能量函数Rosetta score3计算能量值Ei和Ej,并计算最小的能量值E″;
10.4.2)如果能量值E′>E″,则用E″对应的构象替换种群中E′对应的构象,否则保持种群不变;
11)g=g+1,判断是否达到最大迭代次数Gen,若不满足条件终止条件,则遍历种群执行步骤4),否则输出能量最低的构象作为最后预测结果。
本发明的技术构思为:一种系综构象选择策略自适应的蛋白质结构预测方法,包括以下步骤:首先预测查询序列的二级结构信息,残基间接触信息,构建片段库;其次建立基于二级结构信息的相似性评分函数和基于残基间接触评价函数,设计交叉、变异、选择策略,设计基于二级结构相似性和能量的选择策略,利用种群二级结构相似性收敛性,设计三个选择策略的自适应概率函数;最后根据种群二级结构相似性评分函数值、残基间接触评价函数值和能量值实现种群更新,利用系综构象选择策略自适应的蛋白质结构预测方法能够有效地提高算法采样能力,构象能够形成好的二级结构,预测得到低能量的构象。
本发明的有益效果为:构象空间采样能力较强、预测的构象能量低、二级结构准确,能够有效地使得有潜力的构象被保存下来进而提高预测精度。
附图说明
图1是系综构象选择策略自适应的蛋白质结构预测方法基本流程图。
图2是蛋白质1BQ9利用系综构象选择策略自适应的蛋白质结构预测方法预测得到的三维结构示意图。
具体实施方式
下面结合附图对本发明做进一步描述。
参照图1和图2,一种系综构象选择策略自适应的蛋白质结构预测方法,包括以下步骤:
1)利用PSIPRED(http://bioinf.cs.ucl.ac.uk/psipred)预测查询序列的二级结构信息,利用MetaPSICOV(http://bioinf.cs.ucl.ac.uk/MetaPSICOV)预测查询序列的残基间距离接触信息;
2)设置初始种群规模NP、最大迭代次数Gen、交叉概率CR、输入查询序列、片段库、片段组装次数N和迭代次数g=0;
3)对种群所有构象进行初始化,对种群中每个构象进行N次片段组装;
4)构象交叉,操作如下:
4.1)选择第i,i∈[1,NP]个构象Ci为目标构象,产生一个随机数r,r∈[0,1],如果r小于CR,则跳到4.2),否则跳至步骤5);
4.2)随机选择一个构象Cj,j≠i,利用计算二级结构算法DSSP获取构象Ci的二级结构信息;
4.3)根据Ci残基位置随机选择一个交叉点p,判断交叉点p对应的残基被预测的二级结构的类型;
4.4)针对Ci和Cj,从交叉点p开始依次互换二面角对直到从交叉点p起预测的二级结构类型和交叉点p处对应的二级结构类型不同为止,产生一个新构象C′i
5)构象变异,对构象C′i和C′j,变异过程如下:
对构象C′i进行3残基片段组装,对C′j进行9残基片段组装,生成两个构象C″i和C″j
6)分别对构象C″i和C″j求二级结构相似性分值Ess
Figure BDA0001781582620000061
其中L是查询序列长度,
Figure BDA0001781582620000062
是查询序列第l个残基预测的二级结构,
Figure BDA0001781582620000063
是测试构象的第l个残基的二级结构,其值由DSSP求得;
7)分别对构象C″i和C″j求残基间距离约束分值Eco
Figure BDA0001781582620000064
其中N是残基接触总数,
Figure BDA0001781582620000065
是查询序列第k个残基对p和q被预测为有接触的置信度,
Figure BDA0001781582620000066
是测试构象的第k个残基对p和q之间的Cα距离,dcon是预测为接触的阈值,
Figure BDA0001781582620000067
8)求种群中每个构象的二级结构相似性分值Ess,计算种群二级结构相似性分值的平均值
Figure BDA0001781582620000068
和方差σ;
9)根据平均值
Figure BDA0001781582620000069
和方差σ,求选择策略切换概率pse
Figure BDA00017815826200000610
其中L是查询序列的长度,
Figure BDA00017815826200000611
和σ分别是种群二级结构相似性分值的平均值和方差;
10)基于选择策略切换概率pse进行选择,过程如下:
10.1)产生一个随机数r′,r′∈[0,1],如果r′<pse,则跳至10.3);
10.2)根据二级结构相似性分值进行种群更新,过程如下:
10.2.1)对种群中的每个构象求二级结构相似性分值Ess,并求出最小的二级结构相似性分值E″ss
10.2.2)从构象C″i和C″j中选择二级结构相似得分E′ss最高的构象作为测试构象;
10.2.3)如果E′ss大于E″ss,则用E′ss对应的构象替换E″ss对应的构象实现种群更新,否则跳至10.4);
10.3)根据残基间距离约束进行选择,过程如下:
10.3.1)对种群中的每个构象求残基间距离约束分值Eco,并求出最小的残基间距离约束分值E″co
10.3.2)从构象C″i和C″j中选择残基间距离约束分值E′co最高的构象作为测试构象;
10.3.3)如果E′co大于E″co,则用E′co对应的构象替换E″co对应的构象实现种群更新,否则跳到10.4);
10.4)根据能量值进行种群更新,过程如下:
10.4.1)对种群中的每个构象利用能量函数Rosetta score3计算能量值E,并计算出最大的能量值E′,分别对构象C″i和C″j利用能量函数Rosetta score3计算能量值Ei和Ej,并计算最小的能量值E″;
10.4.2)如果能量值E′>E″,则用E″对应的构象替换种群中E′对应的构象,否则保持种群不变;
11)g=g+1,判断是否达到最大迭代次数Gen,若不满足条件终止条件,则遍历种群执行步骤4),否则输出能量最低的构象作为最后预测结果。
本实施例以序列长度为53的β折叠蛋白质1BQ9为实施例,一种系综构象选择策略自适应的蛋白质结构预测方法,所述方法包括以下步骤:
1)利用PSIPRED(http://bioinf.cs.ucl.ac.uk/psipred)预测查询序列的二级结构信息,利用MetaPSICOV(http://bioinf.cs.ucl.ac.uk/MetaPSICOV)预测查询序列的残基间距离接触信息;
2)设置初始种群规模100、最大迭代次数10000、交叉概率0.1、输入查询序列、片段库、片段组装次数2000和迭代次数g=0;
3)对种群所有构象进行初始化,对种群中每个构象进行2000次片段组装;
4)构象交叉,操作如下:
4.1)选择第i,i∈[1,100]个构象Ci为目标构象,产生一个随机数r,r∈[0,1],如果r小于0.1,则跳到4.2),否则跳至步骤5);
4.2)随机选择一个构象Cj,j≠i,利用计算二级结构算法DSSP获取构象Ci的二级结构信息;
4.3)根据Ci残基位置随机选择一个交叉点p,判断交叉点p对应的残基被预测的二级结构的类型;
4.4)针对Ci和Cj,从交叉点p开始依次互换二面角对直到从交叉点p起预测的二级结构类型和交叉点p处对应的二级结构类型不同为止,产生一个新构象C′i
5)构象变异,对构象C′i和C′j,变异过程如下:
对构象C′i进行3残基片段组装,对C′j进行9残基片段组装,生成两个构象C″i和C″j
6)分别对构象C″i和C″j求二级结构相似性分值Ess
Figure BDA0001781582620000081
其中L是查询序列长度,
Figure BDA0001781582620000082
是查询序列第l个残基预测的二级结构,
Figure BDA0001781582620000083
是测试构象的第l个残基的二级结构,其值由DSSP求得;
7)分别对构象C″i和C″j求残基间距离约束分值Eco
Figure BDA0001781582620000084
其中N是残基接触总数,
Figure BDA0001781582620000085
是查询序列第k个残基对p和q被预测为有接触的置信度,
Figure BDA0001781582620000086
是测试构象的第k个残基对p和q之间的Cα距离,,dcon是预测为接触的阈值,
Figure BDA0001781582620000087
8)求种群中每个构象的二级结构相似性分值Ess,计算种群二级结构相似性分值的平均值
Figure BDA0001781582620000088
和方差σ;
9)根据平均值
Figure BDA0001781582620000091
和方差σ,求选择策略切换概率pse
Figure BDA0001781582620000092
其中L是查询序列的长度,
Figure BDA0001781582620000093
和σ分别是种群二级结构相似性分值的平均值和方差;
10)基于选择策略切换概率pse进行选择,过程如下:
10.1)产生一个随机数r′,r′∈[0,1],如果r′<pse,则跳至10.3);
10.2)根据二级结构相似性分值进行种群更新,过程如下:
10.2.1)对种群中的每个构象求二级结构相似性分值Ess,并求出最小的二级结构相似性分值E″ss
10.2.2)从构象C″i和C″j中选择二级结构相似得分E′ss最高的构象作为测试构象;
10.2.3)如果E′ss大于E″ss,则用E′ss对应的构象替换E″ss对应的构象实现种群更新,否则跳至10.4);
10.3)根据残基间距离约束进行选择,过程如下:
10.3.1)对种群中的每个构象求残基间距离约束分值Eco,并求出最小的残基间距离约束分值E″co
10.3.2)从构象C″i和C″j中选择残基间距离约束分值E′co最高的构象作为测试构象;
10.3.3)如果E′co大于E″co,则用E′co对应的构象替换E″co对应的构象实现种群更新,否则跳到10.4);
10.4)根据能量值进行种群更新,过程如下:
10.4.1)对种群中的每个构象利用能量函数Rosetta score3计算能量值E,并计算出最大的能量值E′,分别对构象C″i和C″j利用能量函数Rosetta score3计算能量值Ei和Ej,并计算最小的能量值E″;
10.4.2)如果能量值E′>E″,则用E″对应的构象替换种群中E′对应的构象,否则保持种群不变;
11)g=g+1,判断是否达到最大迭代次数10000,若不满足条件终止条件,则遍历种群执行步骤4),否则输出能量最低的构象作为最后预测结果。
以序列长度为53的β折叠蛋白质1BQ9为实施例,运用以上方法得到了该蛋白质的近天然态构象,最小均方根偏差为
Figure BDA0001781582620000101
平均均方根偏差为
Figure BDA0001781582620000102
预测结构如图2所示。
以上说明是本发明以1BQ9蛋白质为实例所得出的优良效果,显然本发明不仅适合上述实施例,在不偏离本发明基本内容所涉及范围的前提下对其做各种变形和改进,不应排除在本发明的保护范围之外。

Claims (1)

1.一种系综构象选择策略自适应的蛋白质结构预测方法,其特征在于:所述方法包括以下步骤:
1)利用PSIPRED预测查询序列的二级结构信息,利用MetaPSICO预测查询序列的残基间距离接触信息;
2)设置初始种群规模NP、最大迭代次数Gen、交叉概率CR、输入查询序列、片段库、片段组装次数M和迭代次数g=0;
3)对种群所有构象进行初始化,对种群中每个构象进行M次片段组装;
4)构象交叉,操作如下:
4.1)选择第i,i∈[1,NP]个构象Ci为目标构象,产生一个随机数r,r∈[0,1],如果r小于CR,则跳到4.2),否则跳至步骤5);
4.2)随机选择一个构象Cj,j≠i,利用计算二级结构算法DSSP获取构象Ci和Cj的二级结构信息;
4.3)根据Ci残基位置随机选择一个交叉点p,判断交叉点p对应的残基被预测的二级结构的类型;
4.4)针对Ci和Cj,从交叉点p开始依次互换二面角对直到从交叉点p起预测的二级结构类型和交叉点p处对应的二级结构类型不同为止,产生两个新构象C′i和C′j
5)构象变异,对构象C′i和C′j,变异过程如下:
对构象C′i进行3残基片段组装,对C′j进行9残基片段组装,生成两个构象C″i和C″j
6)分别对构象C″i和C″j求二级结构相似性分值Ess
Figure FDA0002986821410000011
其中L是查询序列长度,
Figure FDA0002986821410000012
是查询序列第l个残基预测的二级结构,
Figure FDA0002986821410000013
是测试构象的第l个残基的二级结构,其值由DSSP求得;
7)分别对构象C″i和C″j求残基间距离约束分值Eco
Figure FDA0002986821410000021
其中N是残基接触总数,
Figure FDA0002986821410000022
是查询序列第k个残基对p和q被预测为有接触的置信度,
Figure FDA0002986821410000023
是测试构象的第k个残基对p和q之间的Cα距离,dcon是预测为接触的阈值,
Figure FDA0002986821410000024
8)求种群中每个构象的二级结构相似性分值Ess,计算种群二级结构相似性分值的平均值
Figure FDA0002986821410000025
和方差σ;
9)根据平均值
Figure FDA0002986821410000026
和方差σ,求选择策略切换概率pse
Figure FDA0002986821410000027
其中L是查询序列的长度,
Figure FDA0002986821410000028
和σ分别是种群二级结构相似性分值的平均值和方差;
10)基于选择策略切换概率pse进行选择,过程如下:
10.1)产生一个随机数r′,r′∈[0,1],如果r′<pse,则跳至10.3);
10.2)根据二级结构相似性分值进行种群更新,过程如下:
10.2.1)对种群中的每个构象求二级结构相似性分值Ess,并求出最小的二级结构相似性分值E″ss
10.2.2)从构象C″i和C″j中选择二级结构相似得分E′ss最高的构象作为测试构象;
10.2.3)如果E′ss大于E″ss,则用E′ss对应的构象替换E″ss对应的构象实现种群更新,否则跳至10.4);
10.3)根据残基间距离约束进行选择,过程如下:
10.3.1)对种群中的每个构象求残基间距离约束分值Eco,并求出最小的残基间距离约束分值E″co
10.3.2)从构象C″i和C″j中选择残基间距离约束分值E′co最高的构象作为测试构象;
10.3.3)如果E′co大于E″co,则用E′co对应的构象替换E″co对应的构象实现种群更新,否则跳到10.4);
10.4)根据能量值进行种群更新,过程如下:
10.4.1)对种群中的每个构象利用能量函数Rosetta score3计算能量值E,并计算出最大的能量值E′,分别对构象C″i和C″j利用能量函数Rosetta score3计算能量值Ei和Ej,并计算最小的能量值E″;
10.4.2)如果能量值E′>E″,则用E″对应的构象替换种群中E′对应的构象,否则保持种群不变;
11)g=g+1,判断是否达到最大迭代次数Gen,若不满足条件终止条件,则遍历种群执行步骤4),否则输出能量最低的构象作为最后预测结果。
CN201810994644.5A 2018-08-29 2018-08-29 一种系综构象选择策略自适应的蛋白质结构预测方法 Active CN109326320B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810994644.5A CN109326320B (zh) 2018-08-29 2018-08-29 一种系综构象选择策略自适应的蛋白质结构预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810994644.5A CN109326320B (zh) 2018-08-29 2018-08-29 一种系综构象选择策略自适应的蛋白质结构预测方法

Publications (2)

Publication Number Publication Date
CN109326320A CN109326320A (zh) 2019-02-12
CN109326320B true CN109326320B (zh) 2021-06-18

Family

ID=65264518

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810994644.5A Active CN109326320B (zh) 2018-08-29 2018-08-29 一种系综构象选择策略自适应的蛋白质结构预测方法

Country Status (1)

Country Link
CN (1) CN109326320B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114974437A (zh) * 2022-04-26 2022-08-30 北京理工大学 一种分析蛋白质稳态系综结构变化及关键氨基酸的方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106055920B (zh) * 2016-06-02 2018-09-18 浙江工业大学 一种基于阶段性多策略副本交换的蛋白质结构预测方法
CN107609342B (zh) * 2017-08-11 2020-08-18 浙江工业大学 一种基于二级结构空间距离约束的蛋白质构象搜索方法
CN107633159B (zh) * 2017-08-21 2020-06-02 浙江工业大学 一种基于距离相似度的蛋白质构象空间搜索方法

Also Published As

Publication number Publication date
CN109326320A (zh) 2019-02-12

Similar Documents

Publication Publication Date Title
Feinauer et al. Improving contact prediction along three dimensions
Peng et al. Boosting protein threading accuracy
Márquez-Chamorro et al. Soft computing methods for the prediction of protein tertiary structures: A survey
CN109215732B (zh) 一种基于残基接触信息自学习的蛋白质结构预测方法
Wang et al. Improved fragment sampling for ab initio protein structure prediction using deep neural networks
Zhou et al. EL_LSTM: prediction of DNA-binding residue from protein sequence by combining long short-term memory and ensemble learning
CN109086565B (zh) 一种基于残基间接触约束的蛋白质结构预测方法
CN109101785B (zh) 一种基于二级结构相似性选择策略的蛋白质结构预测方法
Estrada et al. Automatic selection of near-native protein-ligand conformations using a hierarchical clustering and volunteer computing
Zimmermann et al. LOCUSTRA: accurate prediction of local protein structure using a two-layer support vector machine approach
CN109326320B (zh) 一种系综构象选择策略自适应的蛋白质结构预测方法
Zhang et al. Protein residue contact prediction based on deep learning and massive statistical features from multi-sequence alignment
Saraswathi et al. Fast learning optimized prediction methodology (FLOPRED) for protein secondary structure prediction
CN109300506B (zh) 一种基于特定距离约束的蛋白质结构预测方法
Zhu et al. Using predicted shape string to enhance the accuracy of γ-turn prediction
Li et al. Identification of protein methylation sites by coupling improved ant colony optimization algorithm and support vector machine
CN109378035B (zh) 一种基于二级结构动态选择策略的蛋白质结构预测方法
Zhu et al. How well can we predict native contacts in proteins based on decoy structures and their energies?
CN109300504B (zh) 一种基于多变异精英选择的蛋白质结构预测方法
Jing et al. Protein inter-residue contacts prediction: methods, performances and applications
CN109243526B (zh) 一种基于特定片段交叉的蛋白质结构预测方法
Mao et al. Identification of residue pairing in interacting β-strands from a predicted residue contact map
Dehghani et al. Enhancement of protein β-sheet topology prediction using maximum weight disjoint path cover
Li et al. Multidimensional scaling method for prediction of lysine glycation sites
CN109002691B (zh) 一种基于玻尔兹曼更新策略的蛋白质结构预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant