CN109360596B - 一种基于差分进化局部扰动的蛋白质构象空间优化方法 - Google Patents
一种基于差分进化局部扰动的蛋白质构象空间优化方法 Download PDFInfo
- Publication number
- CN109360596B CN109360596B CN201811000740.XA CN201811000740A CN109360596B CN 109360596 B CN109360596 B CN 109360596B CN 201811000740 A CN201811000740 A CN 201811000740A CN 109360596 B CN109360596 B CN 109360596B
- Authority
- CN
- China
- Prior art keywords
- phi
- rotation
- population
- follows
- assem
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
Abstract
一种基于差分进化局部扰动的蛋白质构象空间优化方法,在差分进化算法的框架下,利用种群中个体间的信息交换增强算法的探索能力;同时,利用差分进化算法实现对loop区域的微调,增加loop区域结构的多样性,从而在已有的结构的基础上进一步增强对loop区域的探索,进而提高整体的探索效率和预测精度。本发明提供一种预测精度较高的基于差分进化局部扰动的蛋白质构象空间优化方法。
Description
技术领域
本发明涉及生物信息学、计算机应用领域,尤其涉及的是一种基于差分进化局部扰动的蛋白质构象空间优化方法。
背景技术
蛋白质是以氨基酸为基本单位构成的生物大分子。蛋白质是生命的物质基础,是构成细胞的基本有机物。生物体内的氨基酸种类有20种,20种氨基酸排列组合形成了各种各样具有特定功能的蛋白质。蛋白质的功能由其空间结构决定,许多疾病就是由于蛋白质的空间结构发生变化导致的。因此,确定蛋白质的空间结构将有助于相关疾病的治疗。
由于通过实验测定蛋白质三维结构的方法存在局限,因此利用计算机技术根据蛋白质的氨基酸序列预测蛋白质的三维结构成为测定蛋白质空间结构的另一种选择。根据氨基酸序列预测蛋白质三维结构的方法主要分为同源建模法和从头预测法。其中从头预测法不依赖目标蛋白的同源信息。目前比较成功的从头蛋白质结构预测方法有Baker团队开发的Rosetta和张阳团队开发的QUARK等。
根据氨基酸序列预测蛋白质三维结构实质上是在能量模型引导下的构象空间优化问题。目前的构象空间优化方法对α螺旋和β折叠的探索能力较强,往往能形成较高精度的α螺旋和β折叠;但是这些方法对loop区域的探索能力不够,不能形成很好的loop结构,从而影响整体的预测精度。
因此,目前的构象空间优化方法对loop区域的探索存在搜索效率低和预测精度不足等问题,需要改进。
发明内容
为了克服现有的构象空间优化方法对loop区域的探索存在搜索效率低和预测精度不足等问题,本发明提供一种预测精度较高的一种基于差分进化局部扰动的蛋白质构象空间优化方法,本方法在大规模搜索构象空间的同时增强对loop区域的探索,利用差分进化算法实现对loop区域的扰动,从而提高loop区域结构的多样性,在已有结构的基础上进一步优化loop区域的结构,从而提高整体的预测精度。
本发明解决其技术问题所采用的技术方案是:
一种基于差分进化局部扰动的蛋白质构象空间优化方法,所述方法包括以下步骤:
1)输入预测蛋白质的序列信息;
2)设置参数,过程如下:
2.1)构象搜索差分进化参数:种群规模NP,迭代次数G;
2.2)二面角扰动差分进化参数:种群规模NP′,迭代次数G′,交叉概率CR,变异算子F;
3)种群初始化:迭代Rosetta协议第一、二、三阶段,产生具有NP个个体的种群P={P1,P2,...,PNP},其中Pn表示种群P中的第n个个体,n∈{1,2,...,NP};
4)设g=1,其中g∈{1,2,...,G};
5)设n=1,其中n∈{1,2,...,NP};
6)变异操作,过程如下:
6.1)从种群P中随机选择三个互不相同的个体Pselect1、Pselect2、Pselect3;
6.2)在[0,L-3]内生成两个不同的均匀随机整数rand1和rand2,其中L表示氨基酸序列的长度;
6.3)将Pselect1的第rand1至rand1+2号残基的二面角值替换成Pselect2对应残基的二面角值,将Pselect1的第rand2至rand2+2号残基的二面角值替换成Pselect3对应残基的二面角值,形成变异后的个体Pmutate;
7)交叉操作,过程如下:
7.1)在[0,L-3]内生成与rand1和rand2不同的均匀随机整数rand3;
7.2)将Pmutate的第rand3至rand3+2号残基的二面角值替换成Pn对应残基的二面角值,形成交叉后的个体Pcross;
8)利用Psipred算法获取Pcross的二级结构信息,随机选择一段二级结构为loop且长度大于4的区域,记作[b,e],其中b和e分别表示该区域第一个残基和最后一个残基的残基号;
9)利用Rosetta协议第四阶段使用的片段组装技术对Pcross的[b,e]区域执行一次片段组装,得到片段组装后的个体Passem;
10)对Passem的[b,e]区域进行局部扰动,过程如下:
10.1)以Passem第b至e号残基二面角和ψ对应的键作为旋转轴,取键方向上的单位向量得到旋转轴坐标,记作Ω={ω1,ω2,...,ωS},其中S表示旋转轴数量,ωs=(xs,ys,zs)表示第s个旋转轴的坐标,s∈{1,2,...,S};
10.2)记旋转角度Φ={φ1,φ2,...,φS},其中φs表示第s个旋转轴对应的旋转角度,即Passem的[b,e]区域第s个二面角的扰动角度;
10.3)以Passem第e至L号残基的Cα原子作为旋转点,记作X={χ1,χ2,...,χK},其中K表示旋转点数量,χk=(xk,yk,zk)表示第k个旋转点的坐标,k∈{1,2,...,K};
10.4)模型评估,过程如下:
10.4.1)将X中的旋转点χk依次按照旋转角φs绕旋转轴ws旋转,其中k∈{1,2,...,K},s∈{S,S-1,...,1};得到旋转后的X′={χ′1,χ′2,...,χ′K},χ′k=(x′k,y′k,z′k);
10.4.2)打分函数,按如下公式计算Φ对应的得分:
10.5)求解最优的Φ,使其得分最低,过程如下:
10.5.1)初始化:生成初始种群Γ={Φ1,Φ2,...,ΦNP′},其中
10.5.2)设g′=1,其中g′∈{1,2,...,G′};
10.5.3)设n′=1,其中n′∈{1,2,...,NP′};
10.5.4)变异操作,过程如下:
10.5.4.1)从种群Γ中选择得分最低的个体,记作Φbest;再随机选择两个互不相同且与Φbest不同的个体,记作Φselect1、Φselect2;
10.5.4.2)按如下方式生成变异后的个体Φmutate:
10.5.5)交叉操作,过程如下:
10.5.5.1)在[1,S]内生成均匀随机整数srand;
10.5.5.2)生成S个均匀随机小数Rs,Rs∈[0,1],s∈{1,2,...,S};
10.5.5.3)按如下方式生成交叉后的个体Φcross:
10.5.6)选择操作,过程如下:
10.5.6.1)根据步骤10.4)计算Φn′和Φcross的得分Dn′和Dcross;
10.5.6.2)若Ecross<En′,用Φcross替换种群Γ中的个体Φn′;
10.5.7)n′=n′+1;若n′≤NP′,转至步骤10.5.4);
10.5.8)g′=g′+1;若g′≤G′,转至步骤10.5.3);
10.5.9)从种群中选择五个能量最低的个体作为候选扰动角度,记作H={Φ1,Φ2,Φ3,Φ4,Φ5};
10.6)选择扰动,过程如下:
10.6.1)设i=1,其中i∈{1,2,3,4,5};
10.6.2)将H中的第i个个体Φi的扰动角度添加到Passem对应的二面角上,形成扰动后的个体Pperturb;
10.6.3)用Rosetta score3能量函数计算Passem和Pperturb的能量Eassem和Eperturb,并按照如下公式计算接收扰动的概率:
10.6.4)生成均匀随机小数rand4,rand4∈[0,1];若pacc<rand4,令Ptrial=Pperturb,转至步骤11);否则,转至步骤10.6.5);
10.6.5)i=i+1;若i≤5,转至步骤10.6.2);否则,令Ptrial=Passem;
11)用Rosetta score3能量函数计算Ptrial和Pn的能量,根据Metropolis准则决定是否用Ptrial替换种群P中的个体Pn;
12)n=n+1;若n≤NP,转至步骤6);
13)g=g+1;若g≤G,转至步骤5);
14)利用SPICKER聚类算法输出最终的预测结果。
本发明的有益效果为:在差分进化算法的框架下,利用种群中个体间的信息交换增强算法的探索能力;同时,利用差分进化算法实现对loop区域的微调,增加loop区域结构的多样性,从而在已有的结构的基础上进一步增强对loop区域的探索,从而提高整体的探索效率和预测精度。
附图说明
图1是一种基于差分进化局部扰动的蛋白质构象空间优化方法对蛋白质4UEX进行结构预测时的构象更新示意图。
图2是一种基于差分进化局部扰动的蛋白质构象空间优化方法对蛋白质4UEX进行结构预测得到的三维结构图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1和图2,一种基于差分进化局部扰动的蛋白质构象空间优化方法,包括以下步骤:
1)输入预测蛋白质的序列信息;
2)设置参数,过程如下:
2.1)构象搜索差分进化参数:种群规模NP,迭代次数G;
2.2)二面角扰动差分进化参数:种群规模NP′,迭代次数G′,交叉概率CR,变异算子F;
3)种群初始化:迭代Rosetta协议第一、二、三阶段,产生具有NP个个体的种群P={P1,P2,...,PNP},其中Pn表示种群P中的第n个个体,n∈{1,2,...,NP};
4)设g=1,其中g∈{1,2,...,G};
5)设n=1,其中n∈{1,2,...,NP};
6)变异操作,过程如下:
6.1)从种群P中随机选择三个互不相同的个体Pselect1、Pselect2、Pselect3;
6.2)在[0,L-3]内生成两个不同的均匀随机整数rand1和rand2,其中L表示氨基酸序列的长度;
6.3)将Pselect1的第rand1至rand1+2号残基的二面角值替换成Pselect2对应残基的二面角值,将Pselect1的第rand2至rand2+2号残基的二面角值替换成Pselect3对应残基的二面角值,形成变异后的个体Pmutate;
7)交叉操作,过程如下:
7.1)在[0,L-3]内生成与rand1和rand2不同的均匀随机整数rand3;
7.2)将Pmutate的第rand3至rand3+2号残基的二面角值替换成Pn对应残基的二面角值,形成交叉后的个体Pcross;
8)利用Psipred算法获取Pcross的二级结构信息,随机选择一段二级结构为loop且长度大于4的区域,记作[b,e],其中b和e分别表示该区域第一个残基和最后一个残基的残基号;
9)利用Rosetta协议第四阶段使用的片段组装技术对Pcross的[b,e]区域执行一次片段组装,得到片段组装后的个体Passem;
10)对Passem的[b,e]区域进行局部扰动,过程如下:
10.1)以Passem第b至e号残基二面角和ψ对应的键作为旋转轴,取键方向上的单位向量得到旋转轴坐标,记作Ω={ω1,ω2,...,ωS},其中S表示旋转轴数量,ωs=(xs,ys,zs)表示第s个旋转轴的坐标,s∈{1,2,...,S};
10.2)记旋转角度Φ={φ1,φ2,...,φS},其中φs表示第s个旋转轴对应的旋转角度,即Passem的[b,e]区域第s个二面角的扰动角度;
10.3)以Passem第e至L号残基的Cα原子作为旋转点,记作X={χ1,χ2,...,χK},其中K表示旋转点数量,χk=(xk,yk,zk)表示第k个旋转点的坐标,k∈{1,2,...,K};
10.4)模型评估,过程如下:
10.4.1)将X中的旋转点χk依次按照旋转角φs绕旋转轴ws旋转,其中k∈{1,2,...,K},s∈{S,S-1,...,1};得到旋转后的X′={χ′1,χ′2,...,χ′K},χ′k=(x′k,yk′,z′k);
10.4.2)打分函数,按如下公式计算Φ对应的得分:
10.5)求解最优的Φ,使其得分最低,过程如下:
10.5.1)初始化:生成初始种群Γ={Φ1,Φ2,...,ΦNP′},其中
10.5.2)设g′=1,其中g′∈{1,2,...,G′};
10.5.3)设n′=1,其中n′∈{1,2,...,NP′};
10.5.4)变异操作,过程如下:
10.5.4.1)从种群Γ中选择得分最低的个体,记作Φbest;再随机选择两个互不相同且与Φbest不同的个体,记作Φselect1、Φselect2;
10.5.4.2)按如下方式生成变异后的个体Φmutate:
10.5.5)交叉操作,过程如下:
10.5.5.1)在[1,S]内生成均匀随机整数srand;
10.5.5.2)生成S个均匀随机小数Rs,Rs∈[0,1],s∈{1,2,...,S};
10.5.5.3)按如下方式生成交叉后的个体Φcross:
10.5.6)选择操作,过程如下:
10.5.6.1)根据步骤10.4)计算Φn′和Φcross的得分Dn′和Dcross;
10.5.6.2)若Ecross<En′,用Φcross替换种群Γ中的个体Φn′;
10.5.7)n′=n′+1;若n′≤NP′,转至步骤10.5.4);
10.5.8)g′=g′+1;若g′≤G′,转至步骤10.5.3);
10.5.9)从种群中选择五个能量最低的个体作为候选扰动角度,记作H={Φ1,Φ2,Φ3,Φ4,Φ5};
10.6)选择扰动,过程如下:
10.6.1)设i=1,其中i∈{1,2,3,4,5};
10.6.2)将H中的第i个个体Φi的扰动角度添加到Passem对应的二面角上,形成扰动后的个体Pperturb;
10.6.3)用Rosetta score3能量函数计算Passem和Pperturb的能量Eassem和Eperturb,并按照如下公式计算接收扰动的概率:
10.6.4)生成均匀随机小数rand4,rand4∈[0,1];若pacc<rand4,令Ptrial=Pperturb,转至步骤11);否则,转至步骤10.6.5);
10.6.5)i=i+1;若i≤5,转至步骤10.6.2);否则,令Ptrial=Passem;
11)用Rosetta score3能量函数计算Ptrial和Pn的能量,根据Metropolis准则决定是否用Ptrial替换种群P中的个体Pn;
12)n=n+1;若n≤NP,转至步骤6);
13)g=g+1;若g≤G,转至步骤5);
14)利用SPICKER聚类算法输出最终的预测结果。
本实施例以序列长度为81的蛋白质4UEX为实施例,一种基于差分进化局部扰动的蛋白质构象空间优化方法,包括以下步骤:
1)输入预测蛋白质4UEX的序列信息;
2)设置参数,过程如下:
2.1)构象搜索差分进化参数:种群规模NP=100,迭代次数G=100;
2.2)二面角扰动差分进化参数:种群规模NP′=100,迭代次数G′=1000,交叉概率CR=0.1,变异算子F=0.5;
3)种群初始化:迭代Rosetta协议第一、二、三阶段,产生具有NP个个体的种群P={P1,P2,...,PNP},其中Pn表示种群P中的第n个个体,n∈{1,2,...,NP};
4)设g=1,其中g∈{1,2,...,G};
5)设n=1,其中n∈{1,2,...,NP};
6)变异操作,过程如下:
6.1)从种群P中随机选择三个互不相同的个体Pselect1、Pselect2、Pselect3;
6.2)在[0,L-3]内生成两个不同的均匀随机整数rand1和rand2,其中L表示氨基酸序列的长度;
6.3)将Pselect1的第rand1至rand1+2号残基的二面角值替换成Pselect2对应残基的二面角值,将Pselect1的第rand2至rand2+2号残基的二面角值替换成Pselect3对应残基的二面角值,形成变异后的个体Pmutate;
7)交叉操作,过程如下:
7.1)在[0,L-3]内生成与rand1和rand2不同的均匀随机整数rand3;
7.2)将Pmutate的第rand3至rand3+2号残基的二面角值替换成Pn对应残基的二面角值,形成交叉后的个体Pcross;
8)利用Psipred算法获取Pcross的二级结构信息,随机选择一段二级结构为loop且长度大于4的区域,记作[b,e],其中b和e分别表示该区域第一个残基和最后一个残基的残基号;
9)利用Rosetta协议第四阶段使用的片段组装技术对Pcross的[b,e]区域执行一次片段组装,得到片段组装后的个体Passem;
10)对Passem的[b,e]区域进行局部扰动,过程如下:
10.1)以Passem第b至e号残基二面角和ψ对应的键作为旋转轴,取键方向上的单位向量得到旋转轴坐标,记作Ω={ω1,ω2,...,ωS},其中S表示旋转轴数量,ωs=(xs,ys,zs)表示第s个旋转轴的坐标,s∈{1,2,...,S};
10.2)记旋转角度Φ={φ1,φ2,...,φS},其中φs表示第s个旋转轴对应的旋转角度,即Passem的[b,e]区域第s个二面角的扰动角度;
10.3)以Passem第e至L号残基的Cα原子作为旋转点,记作X={χ1,χ2,...,χK},其中K表示旋转点数量,χk=(xk,yk,zk)表示第k个旋转点的坐标,k∈{1,2,...,K};
10.4)模型评估,过程如下:
10.4.1)将X中的旋转点χk依次按照旋转角φs绕旋转轴ws旋转,其中k∈{1,2,...,K},s∈{S,S-1,...,1};得到旋转后的X′={χ′1,χ′2,...,χ′K},χ′k=(x′k,y′k,z′k);
10.4.2)打分函数,按如下公式计算Φ对应的得分:
10.5)求解最优的Φ,使其得分最低,过程如下:
10.5.1)初始化:生成初始种群Γ={Φ1,Φ2,...,ΦNP′},其中
10.5.2)设g′=1,其中g′∈{1,2,...,G′};
10.5.3)设n′=1,其中n′∈{1,2,...,NP′};
10.5.4)变异操作,过程如下:
10.5.4.1)从种群Γ中选择得分最低的个体,记作Φbest;再随机选择两个互不相同且与Φbest不同的个体,记作Φselect1、Φselect2;
10.5.4.2)按如下方式生成变异后的个体Φmutate:
10.5.5)交叉操作,过程如下:
10.5.5.1)在[1,S]内生成均匀随机整数srand;
10.5.5.2)生成S个均匀随机小数Rs,Rs∈[0,1],s∈{1,2,...,S};
10.5.5.3)按如下方式生成交叉后的个体Φcross:
10.5.6)选择操作,过程如下:
10.5.6.1)根据步骤10.4)计算Φn′和Φcross的得分Dn′和Dcross;
10.5.6.2)若Ecross<En′,用Φcross替换种群Γ中的个体Φn′;
10.5.7)n′=n′+1;若n′≤NP′,转至步骤10.5.4);
10.5.8)g′=g′+1;若g′≤G′,转至步骤10.5.3);
10.5.9)从种群中选择五个能量最低的个体作为候选扰动角度,记作H={Φ1,Φ2,Φ3,Φ4,Φ5};
10.6)选择扰动,过程如下:
10.6.1)设i=1,其中i∈{1,2,3,4,5};
10.6.2)将H中的第i个个体Φi的扰动角度添加到Passem对应的二面角上,形成扰动后的个体Pperturb;
10.6.3)用Rosetta score3能量函数计算Passem和Pperturb的能量Eassem和Eperturb,并按照如下公式计算接收扰动的概率:
10.6.4)生成均匀随机小数rand4,rand4∈[0,1];若pacc<rand4,令Ptrial=Pperturb,转至步骤11);否则,转至步骤10.6.5);
10.6.5)i=i+1;若i≤5,转至步骤10.6.2);否则,令Ptrial=Passem;
11)用Rosetta score3能量函数计算Ptrial和Pn的能量,根据Metropolis准则决定是否用Ptrial替换种群P中的个体Pn;
12)n=n+1;若n≤NP,转至步骤6);
13)g=g+1;若g≤G,转至步骤5);
14)利用SPICKER聚类算法输出最终的预测结果。
以上阐述是本发明给出的一个实施的预测效果,本发明不仅适合上述实施例,在不偏离本发明基本思想及不超出本发明实质内容的前提下可对其做种种改进加以实施。
Claims (1)
1.一种基于差分进化局部扰动的蛋白质构象空间优化方法,其特征在于,所述构象空间优化方法包括以下步骤:
1)输入预测蛋白质的序列信息;
2)设置参数,过程如下:
2.1)构象搜索差分进化参数:种群规模NP,迭代次数G;
2.2)二面角扰动差分进化参数:种群规模NP′,迭代次数G′,交叉概率CR,变异算子F;
3)种群初始化:迭代Rosetta协议第一、二、三阶段,产生具有NP个个体的种群P={P1,P2,...,PNP},其中Pn表示种群P中的第n个个体,n∈{1,2,...,NP};
4)设g=1,其中g∈{1,2,...,G};
5)设n=1,其中n∈{1,2,...,NP};
6)变异操作,过程如下:
6.1)从种群P中随机选择三个互不相同的个体Pselect1、Pselect2、Pselect3;
6.2)在[0,L-3]内生成两个不同的均匀随机整数rand1和rand2,其中L表示氨基酸序列的长度;
6.3)将Pselect1的第rand1至rand1+2号残基的二面角值替换成Pselect2对应残基的二面角值,将Pselect1的第rand2至rand2+2号残基的二面角值替换成Pselect3对应残基的二面角值,形成变异后的个体Pmutate;
7)交叉操作,过程如下:
7.1)在[0,L-3]内生成与rand1和rand2不同的均匀随机整数rand3;
7.2)将Pmutate的第rand3至rand3+2号残基的二面角值替换成Pn对应残基的二面角值,形成交叉后的个体Pcross;
8)利用Psipred算法获取Pcross的二级结构信息,随机选择一段二级结构为loop且长度大于4的区域,记作[b,e],其中b和e分别表示该区域第一个残基和最后一个残基的残基号;
9)利用Rosetta协议第四阶段使用的片段组装技术对Pcross的[b,e]区域执行一次片段组装,得到片段组装后的个体Passem;
10)对Passem的[b,e]区域进行局部扰动,过程如下:
10.1)以Passem第b至e号残基二面角和ψ对应的键作为旋转轴,取键方向上的单位向量得到旋转轴坐标,记作Ω={ω1,ω2,...,ωS},其中S表示旋转轴数量,ωs=(xs,ys,zs)表示第s个旋转轴的坐标,s∈{1,2,...,S};
10.2)记旋转角度Φ={φ1,φ2,...,φS},其中φs表示第s个旋转轴对应的旋转角度,即Passem的[b,e]区域第s个二面角的扰动角度;
10.3)以Passem第e至L号残基的Cα原子作为旋转点,记作X={χ1,χ2,...,χK},其中K表示旋转点数量,χk=(xk,yk,zk)表示第k个旋转点的坐标,k∈{1,2,...,K};
10.4)模型评估,过程如下:
10.4.1)将X中的旋转点χk依次按照旋转角φs绕旋转轴ws旋转,其中k∈{1,2,...,K},s∈{S,S-1,...,1};得到旋转后的X′={χ′1,χ′2,...,χ′K},χ′k=(x′k,y′k,z′k);
10.4.2)打分函数,按如下公式计算Φ对应的得分:
10.5)求解最优的Φ,使其得分最低,过程如下:
10.5.1)初始化:生成初始种群Γ={Φ1,Φ2,...,ΦNP′},其中
10.5.2)设g′=1,其中g′∈{1,2,...,G′};
10.5.3)设n′=1,其中n′∈{1,2,...,NP′};
10.5.4)变异操作,过程如下:
10.5.4.1)从种群Γ中选择得分最低的个体,记作Φbest;再随机选择两个互不相同且与Φbest不同的个体,记作Φselect1、Φselect2;
10.5.4.2)按如下方式生成变异后的个体Φmutate:
10.5.5)交叉操作,过程如下:
10.5.5.1)在[1,S]内生成均匀随机整数srand;
10.5.5.2)生成S个均匀随机小数Rs,Rs∈[0,1],s∈{1,2,...,S};
10.5.5.3)按如下方式生成交叉后的个体Φcross:
10.5.6)选择操作,过程如下:
10.5.6.1)根据步骤10.4)计算Φn′和Φcross的得分Dn′和Dcross;
10.5.6.2)若Dcross<Dn′,用Φcross替换种群Γ中的个体Φn′;
10.5.7)n′=n′+1;若n′≤NP′,转至步骤10.5.4);
10.5.8)g′=g′+1;若g′≤G′,转至步骤10.5.3);
10.5.9)从种群中选择五个能量最低的个体作为候选扰动角度,记作Η={Φ1,Φ2,Φ3,Φ4,Φ5};
10.6)选择扰动,过程如下:
10.6.1)设i=1,其中i∈{1,2,3,4,5};
10.6.2)将H中的第i个个体Φi的扰动角度添加到Passem对应的二面角上,形成扰动后的个体Pperturb;
10.6.3)用Rosetta score3能量函数计算Passem和Pperturb的能量Eassem和Eperturb,并按照如下公式计算接收扰动的概率:
10.6.4)生成均匀随机小数rand4,rand4∈[0,1];若pacc<rand4,令Ptrial=Pperturb,转至步骤11);否则,转至步骤10.6.5);
10.6.5)i=i+1;若i≤5,转至步骤10.6.2);否则,令Ptrial=Passem;
11)用Rosetta score3能量函数计算Ptrial和Pn的能量,根据Metropolis准则决定是否用Ptrial替换种群P中的个体Pn;
12)n=n+1;若n≤NP,转至步骤6);
13)g=g+1;若g≤G,转至步骤5);
14)利用SPICKER聚类算法输出最终的预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811000740.XA CN109360596B (zh) | 2018-08-30 | 2018-08-30 | 一种基于差分进化局部扰动的蛋白质构象空间优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811000740.XA CN109360596B (zh) | 2018-08-30 | 2018-08-30 | 一种基于差分进化局部扰动的蛋白质构象空间优化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109360596A CN109360596A (zh) | 2019-02-19 |
CN109360596B true CN109360596B (zh) | 2021-08-03 |
Family
ID=65350122
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811000740.XA Active CN109360596B (zh) | 2018-08-30 | 2018-08-30 | 一种基于差分进化局部扰动的蛋白质构象空间优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109360596B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110189794B (zh) * | 2019-04-16 | 2021-01-01 | 浙江工业大学 | 一种残基接触引导loop扰动的群体蛋白质结构预测方法 |
CN110706739B (zh) * | 2019-08-26 | 2021-10-29 | 浙江工业大学 | 一种基于多模态内外交叉的蛋白质构象空间采样方法 |
CN110689929B (zh) * | 2019-08-29 | 2021-12-17 | 浙江工业大学 | 一种基于接触概率辅助的蛋白质atp对接方法 |
CN112085246A (zh) * | 2020-07-22 | 2020-12-15 | 浙江工业大学 | 一种基于残基对距离约束的蛋白质结构预测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103714265A (zh) * | 2013-12-23 | 2014-04-09 | 浙江工业大学 | 一种基于蒙特卡洛局部抖动和片段组装的蛋白质三维结构预测方法 |
CN104182653A (zh) * | 2014-08-25 | 2014-12-03 | 浙江工业大学 | 一种基于局部抽象凸低估支撑面的群体构象空间优化方法 |
CN104933327A (zh) * | 2015-06-08 | 2015-09-23 | 浙江工业大学 | 一种局部增强的差分进化蛋白质构象空间搜索方法 |
CN106503484A (zh) * | 2016-09-23 | 2017-03-15 | 浙江工业大学 | 一种基于抽象凸估计的多阶段差分进化蛋白质结构预测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10468119B2 (en) * | 2015-07-28 | 2019-11-05 | Yeda Research And Development Co. Ltd. | Stable proteins and methods for designing same |
-
2018
- 2018-08-30 CN CN201811000740.XA patent/CN109360596B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103714265A (zh) * | 2013-12-23 | 2014-04-09 | 浙江工业大学 | 一种基于蒙特卡洛局部抖动和片段组装的蛋白质三维结构预测方法 |
CN104182653A (zh) * | 2014-08-25 | 2014-12-03 | 浙江工业大学 | 一种基于局部抽象凸低估支撑面的群体构象空间优化方法 |
CN104933327A (zh) * | 2015-06-08 | 2015-09-23 | 浙江工业大学 | 一种局部增强的差分进化蛋白质构象空间搜索方法 |
CN106503484A (zh) * | 2016-09-23 | 2017-03-15 | 浙江工业大学 | 一种基于抽象凸估计的多阶段差分进化蛋白质结构预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109360596A (zh) | 2019-02-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109360596B (zh) | 一种基于差分进化局部扰动的蛋白质构象空间优化方法 | |
Deng et al. | Protein structure prediction | |
CN107609342B (zh) | 一种基于二级结构空间距离约束的蛋白质构象搜索方法 | |
CN103714265B (zh) | 一种基于蒙特卡洛局部抖动和片段组装的蛋白质三维结构预测方法 | |
Jia et al. | RNA-MethylPred: a high-accuracy predictor to identify N6-methyladenosine in RNA | |
CN107633159B (zh) | 一种基于距离相似度的蛋白质构象空间搜索方法 | |
CN109086566B (zh) | 一种基于片段重采样的群体蛋白质结构预测方法 | |
CN104951670B (zh) | 一种基于距离谱的群体构象空间优化方法 | |
CN109215733B (zh) | 一种基于残基接触信息辅助评价的蛋白质结构预测方法 | |
Qiu et al. | Prediction of protein–protein interaction sites using patch-based residue characterization | |
Ashtawy et al. | Boosted neural networks scoring functions for accurate ligand docking and ranking | |
Niu et al. | HIV-1 protease cleavage site prediction based on two-stage feature selection method | |
Sun et al. | Smolign: a spatial motifs-based protein multiple structural alignment method | |
Hao et al. | A novel method using abstract convex underestimation in ab-initio protein structure prediction for guiding search in conformational feature space | |
Tan et al. | Statistical potentials for 3D structure evaluation: from proteins to RNAs | |
CN108595910B (zh) | 一种基于多样性指标的群体蛋白质构象空间优化方法 | |
CN109378034B (zh) | 一种基于距离分布估计的蛋白质预测方法 | |
CN108920894B (zh) | 一种基于简约抽象凸估计的蛋白质构象空间优化方法 | |
Olson et al. | Enhancing sampling of the conformational space near the protein native state | |
Shi et al. | Identify essential genes based on clustering based synthetic minority oversampling technique | |
Zhang et al. | Protein structure prediction using population-based algorithm guided by information entropy | |
CN109243525B (zh) | 一种基于种群熵的阶段性蛋白质结构预测方法 | |
Mintseris et al. | Optimizing protein representations with information theory | |
CN110197700B (zh) | 一种基于差分进化的蛋白质atp对接方法 | |
CN109411013B (zh) | 一种基于个体特定变异策略的群体蛋白质结构预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |