CN109360596B - 一种基于差分进化局部扰动的蛋白质构象空间优化方法 - Google Patents

一种基于差分进化局部扰动的蛋白质构象空间优化方法 Download PDF

Info

Publication number
CN109360596B
CN109360596B CN201811000740.XA CN201811000740A CN109360596B CN 109360596 B CN109360596 B CN 109360596B CN 201811000740 A CN201811000740 A CN 201811000740A CN 109360596 B CN109360596 B CN 109360596B
Authority
CN
China
Prior art keywords
phi
rotation
population
follows
assem
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811000740.XA
Other languages
English (en)
Other versions
CN109360596A (zh
Inventor
张贵军
刘俊
彭春祥
周晓根
王柳静
李远锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201811000740.XA priority Critical patent/CN109360596B/zh
Publication of CN109360596A publication Critical patent/CN109360596A/zh
Application granted granted Critical
Publication of CN109360596B publication Critical patent/CN109360596B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]

Abstract

一种基于差分进化局部扰动的蛋白质构象空间优化方法,在差分进化算法的框架下,利用种群中个体间的信息交换增强算法的探索能力;同时,利用差分进化算法实现对loop区域的微调,增加loop区域结构的多样性,从而在已有的结构的基础上进一步增强对loop区域的探索,进而提高整体的探索效率和预测精度。本发明提供一种预测精度较高的基于差分进化局部扰动的蛋白质构象空间优化方法。

Description

一种基于差分进化局部扰动的蛋白质构象空间优化方法
技术领域
本发明涉及生物信息学、计算机应用领域,尤其涉及的是一种基于差分进化局部扰动的蛋白质构象空间优化方法。
背景技术
蛋白质是以氨基酸为基本单位构成的生物大分子。蛋白质是生命的物质基础,是构成细胞的基本有机物。生物体内的氨基酸种类有20种,20种氨基酸排列组合形成了各种各样具有特定功能的蛋白质。蛋白质的功能由其空间结构决定,许多疾病就是由于蛋白质的空间结构发生变化导致的。因此,确定蛋白质的空间结构将有助于相关疾病的治疗。
由于通过实验测定蛋白质三维结构的方法存在局限,因此利用计算机技术根据蛋白质的氨基酸序列预测蛋白质的三维结构成为测定蛋白质空间结构的另一种选择。根据氨基酸序列预测蛋白质三维结构的方法主要分为同源建模法和从头预测法。其中从头预测法不依赖目标蛋白的同源信息。目前比较成功的从头蛋白质结构预测方法有Baker团队开发的Rosetta和张阳团队开发的QUARK等。
根据氨基酸序列预测蛋白质三维结构实质上是在能量模型引导下的构象空间优化问题。目前的构象空间优化方法对α螺旋和β折叠的探索能力较强,往往能形成较高精度的α螺旋和β折叠;但是这些方法对loop区域的探索能力不够,不能形成很好的loop结构,从而影响整体的预测精度。
因此,目前的构象空间优化方法对loop区域的探索存在搜索效率低和预测精度不足等问题,需要改进。
发明内容
为了克服现有的构象空间优化方法对loop区域的探索存在搜索效率低和预测精度不足等问题,本发明提供一种预测精度较高的一种基于差分进化局部扰动的蛋白质构象空间优化方法,本方法在大规模搜索构象空间的同时增强对loop区域的探索,利用差分进化算法实现对loop区域的扰动,从而提高loop区域结构的多样性,在已有结构的基础上进一步优化loop区域的结构,从而提高整体的预测精度。
本发明解决其技术问题所采用的技术方案是:
一种基于差分进化局部扰动的蛋白质构象空间优化方法,所述方法包括以下步骤:
1)输入预测蛋白质的序列信息;
2)设置参数,过程如下:
2.1)构象搜索差分进化参数:种群规模NP,迭代次数G;
2.2)二面角扰动差分进化参数:种群规模NP′,迭代次数G′,交叉概率CR,变异算子F;
3)种群初始化:迭代Rosetta协议第一、二、三阶段,产生具有NP个个体的种群P={P1,P2,...,PNP},其中Pn表示种群P中的第n个个体,n∈{1,2,...,NP};
4)设g=1,其中g∈{1,2,...,G};
5)设n=1,其中n∈{1,2,...,NP};
6)变异操作,过程如下:
6.1)从种群P中随机选择三个互不相同的个体Pselect1、Pselect2、Pselect3
6.2)在[0,L-3]内生成两个不同的均匀随机整数rand1和rand2,其中L表示氨基酸序列的长度;
6.3)将Pselect1的第rand1至rand1+2号残基的二面角值替换成Pselect2对应残基的二面角值,将Pselect1的第rand2至rand2+2号残基的二面角值替换成Pselect3对应残基的二面角值,形成变异后的个体Pmutate
7)交叉操作,过程如下:
7.1)在[0,L-3]内生成与rand1和rand2不同的均匀随机整数rand3;
7.2)将Pmutate的第rand3至rand3+2号残基的二面角值替换成Pn对应残基的二面角值,形成交叉后的个体Pcross
8)利用Psipred算法获取Pcross的二级结构信息,随机选择一段二级结构为loop且长度大于4的区域,记作[b,e],其中b和e分别表示该区域第一个残基和最后一个残基的残基号;
9)利用Rosetta协议第四阶段使用的片段组装技术对Pcross的[b,e]区域执行一次片段组装,得到片段组装后的个体Passem
10)对Passem的[b,e]区域进行局部扰动,过程如下:
10.1)以Passem第b至e号残基二面角
Figure BDA0001782900820000034
和ψ对应的键作为旋转轴,取键方向上的单位向量得到旋转轴坐标,记作Ω={ω12,...,ωS},其中S表示旋转轴数量,ωs=(xs,ys,zs)表示第s个旋转轴的坐标,s∈{1,2,...,S};
10.2)记旋转角度Φ={φ12,...,φS},其中φs表示第s个旋转轴对应的旋转角度,即Passem的[b,e]区域第s个二面角的扰动角度;
10.3)以Passem第e至L号残基的Cα原子作为旋转点,记作X={χ12,...,χK},其中K表示旋转点数量,χk=(xk,yk,zk)表示第k个旋转点的坐标,k∈{1,2,...,K};
10.4)模型评估,过程如下:
10.4.1)将X中的旋转点χk依次按照旋转角φs绕旋转轴ws旋转,其中k∈{1,2,...,K},s∈{S,S-1,...,1};得到旋转后的X′={χ′1,χ′2,...,χ′K},χ′k=(x′k,y′k,z′k);
10.4.2)打分函数,按如下公式计算Φ对应的得分:
Figure BDA0001782900820000031
10.5)求解最优的Φ,使其得分最低,过程如下:
10.5.1)初始化:生成初始种群Γ={Φ12,...,ΦNP′},其中
Figure BDA0001782900820000032
10.5.2)设g′=1,其中g′∈{1,2,...,G′};
10.5.3)设n′=1,其中n′∈{1,2,...,NP′};
10.5.4)变异操作,过程如下:
10.5.4.1)从种群Γ中选择得分最低的个体,记作Φbest;再随机选择两个互不相同且与Φbest不同的个体,记作Φselect1、Φselect2
10.5.4.2)按如下方式生成变异后的个体Φmutate
Figure BDA0001782900820000033
10.5.5)交叉操作,过程如下:
10.5.5.1)在[1,S]内生成均匀随机整数srand
10.5.5.2)生成S个均匀随机小数Rs,Rs∈[0,1],s∈{1,2,...,S};
10.5.5.3)按如下方式生成交叉后的个体Φcross
Figure BDA0001782900820000041
10.5.6)选择操作,过程如下:
10.5.6.1)根据步骤10.4)计算Φn′和Φcross的得分Dn′和Dcross
10.5.6.2)若Ecross<En′,用Φcross替换种群Γ中的个体Φn′
10.5.7)n′=n′+1;若n′≤NP′,转至步骤10.5.4);
10.5.8)g′=g′+1;若g′≤G′,转至步骤10.5.3);
10.5.9)从种群中选择五个能量最低的个体作为候选扰动角度,记作H={Φ12345};
10.6)选择扰动,过程如下:
10.6.1)设i=1,其中i∈{1,2,3,4,5};
10.6.2)将H中的第i个个体Φi的扰动角度添加到Passem对应的二面角上,形成扰动后的个体Pperturb
10.6.3)用Rosetta score3能量函数计算Passem和Pperturb的能量Eassem和Eperturb,并按照如下公式计算接收扰动的概率:
Figure BDA0001782900820000042
10.6.4)生成均匀随机小数rand4,rand4∈[0,1];若pacc<rand4,令Ptrial=Pperturb,转至步骤11);否则,转至步骤10.6.5);
10.6.5)i=i+1;若i≤5,转至步骤10.6.2);否则,令Ptrial=Passem
11)用Rosetta score3能量函数计算Ptrial和Pn的能量,根据Metropolis准则决定是否用Ptrial替换种群P中的个体Pn
12)n=n+1;若n≤NP,转至步骤6);
13)g=g+1;若g≤G,转至步骤5);
14)利用SPICKER聚类算法输出最终的预测结果。
本发明的有益效果为:在差分进化算法的框架下,利用种群中个体间的信息交换增强算法的探索能力;同时,利用差分进化算法实现对loop区域的微调,增加loop区域结构的多样性,从而在已有的结构的基础上进一步增强对loop区域的探索,从而提高整体的探索效率和预测精度。
附图说明
图1是一种基于差分进化局部扰动的蛋白质构象空间优化方法对蛋白质4UEX进行结构预测时的构象更新示意图。
图2是一种基于差分进化局部扰动的蛋白质构象空间优化方法对蛋白质4UEX进行结构预测得到的三维结构图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1和图2,一种基于差分进化局部扰动的蛋白质构象空间优化方法,包括以下步骤:
1)输入预测蛋白质的序列信息;
2)设置参数,过程如下:
2.1)构象搜索差分进化参数:种群规模NP,迭代次数G;
2.2)二面角扰动差分进化参数:种群规模NP′,迭代次数G′,交叉概率CR,变异算子F;
3)种群初始化:迭代Rosetta协议第一、二、三阶段,产生具有NP个个体的种群P={P1,P2,...,PNP},其中Pn表示种群P中的第n个个体,n∈{1,2,...,NP};
4)设g=1,其中g∈{1,2,...,G};
5)设n=1,其中n∈{1,2,...,NP};
6)变异操作,过程如下:
6.1)从种群P中随机选择三个互不相同的个体Pselect1、Pselect2、Pselect3
6.2)在[0,L-3]内生成两个不同的均匀随机整数rand1和rand2,其中L表示氨基酸序列的长度;
6.3)将Pselect1的第rand1至rand1+2号残基的二面角值替换成Pselect2对应残基的二面角值,将Pselect1的第rand2至rand2+2号残基的二面角值替换成Pselect3对应残基的二面角值,形成变异后的个体Pmutate
7)交叉操作,过程如下:
7.1)在[0,L-3]内生成与rand1和rand2不同的均匀随机整数rand3;
7.2)将Pmutate的第rand3至rand3+2号残基的二面角值替换成Pn对应残基的二面角值,形成交叉后的个体Pcross
8)利用Psipred算法获取Pcross的二级结构信息,随机选择一段二级结构为loop且长度大于4的区域,记作[b,e],其中b和e分别表示该区域第一个残基和最后一个残基的残基号;
9)利用Rosetta协议第四阶段使用的片段组装技术对Pcross的[b,e]区域执行一次片段组装,得到片段组装后的个体Passem
10)对Passem的[b,e]区域进行局部扰动,过程如下:
10.1)以Passem第b至e号残基二面角
Figure BDA0001782900820000063
和ψ对应的键作为旋转轴,取键方向上的单位向量得到旋转轴坐标,记作Ω={ω12,...,ωS},其中S表示旋转轴数量,ωs=(xs,ys,zs)表示第s个旋转轴的坐标,s∈{1,2,...,S};
10.2)记旋转角度Φ={φ12,...,φS},其中φs表示第s个旋转轴对应的旋转角度,即Passem的[b,e]区域第s个二面角的扰动角度;
10.3)以Passem第e至L号残基的Cα原子作为旋转点,记作X={χ12,...,χK},其中K表示旋转点数量,χk=(xk,yk,zk)表示第k个旋转点的坐标,k∈{1,2,...,K};
10.4)模型评估,过程如下:
10.4.1)将X中的旋转点χk依次按照旋转角φs绕旋转轴ws旋转,其中k∈{1,2,...,K},s∈{S,S-1,...,1};得到旋转后的X′={χ′1,χ′2,...,χ′K},χ′k=(x′k,yk′,z′k);
10.4.2)打分函数,按如下公式计算Φ对应的得分:
Figure BDA0001782900820000061
10.5)求解最优的Φ,使其得分最低,过程如下:
10.5.1)初始化:生成初始种群Γ={Φ12,...,ΦNP′},其中
Figure BDA0001782900820000062
10.5.2)设g′=1,其中g′∈{1,2,...,G′};
10.5.3)设n′=1,其中n′∈{1,2,...,NP′};
10.5.4)变异操作,过程如下:
10.5.4.1)从种群Γ中选择得分最低的个体,记作Φbest;再随机选择两个互不相同且与Φbest不同的个体,记作Φselect1、Φselect2
10.5.4.2)按如下方式生成变异后的个体Φmutate
Figure BDA0001782900820000071
10.5.5)交叉操作,过程如下:
10.5.5.1)在[1,S]内生成均匀随机整数srand
10.5.5.2)生成S个均匀随机小数Rs,Rs∈[0,1],s∈{1,2,...,S};
10.5.5.3)按如下方式生成交叉后的个体Φcross
Figure BDA0001782900820000072
10.5.6)选择操作,过程如下:
10.5.6.1)根据步骤10.4)计算Φn′和Φcross的得分Dn′和Dcross
10.5.6.2)若Ecross<En′,用Φcross替换种群Γ中的个体Φn′
10.5.7)n′=n′+1;若n′≤NP′,转至步骤10.5.4);
10.5.8)g′=g′+1;若g′≤G′,转至步骤10.5.3);
10.5.9)从种群中选择五个能量最低的个体作为候选扰动角度,记作H={Φ12345};
10.6)选择扰动,过程如下:
10.6.1)设i=1,其中i∈{1,2,3,4,5};
10.6.2)将H中的第i个个体Φi的扰动角度添加到Passem对应的二面角上,形成扰动后的个体Pperturb
10.6.3)用Rosetta score3能量函数计算Passem和Pperturb的能量Eassem和Eperturb,并按照如下公式计算接收扰动的概率:
Figure BDA0001782900820000073
10.6.4)生成均匀随机小数rand4,rand4∈[0,1];若pacc<rand4,令Ptrial=Pperturb,转至步骤11);否则,转至步骤10.6.5);
10.6.5)i=i+1;若i≤5,转至步骤10.6.2);否则,令Ptrial=Passem
11)用Rosetta score3能量函数计算Ptrial和Pn的能量,根据Metropolis准则决定是否用Ptrial替换种群P中的个体Pn
12)n=n+1;若n≤NP,转至步骤6);
13)g=g+1;若g≤G,转至步骤5);
14)利用SPICKER聚类算法输出最终的预测结果。
本实施例以序列长度为81的蛋白质4UEX为实施例,一种基于差分进化局部扰动的蛋白质构象空间优化方法,包括以下步骤:
1)输入预测蛋白质4UEX的序列信息;
2)设置参数,过程如下:
2.1)构象搜索差分进化参数:种群规模NP=100,迭代次数G=100;
2.2)二面角扰动差分进化参数:种群规模NP′=100,迭代次数G′=1000,交叉概率CR=0.1,变异算子F=0.5;
3)种群初始化:迭代Rosetta协议第一、二、三阶段,产生具有NP个个体的种群P={P1,P2,...,PNP},其中Pn表示种群P中的第n个个体,n∈{1,2,...,NP};
4)设g=1,其中g∈{1,2,...,G};
5)设n=1,其中n∈{1,2,...,NP};
6)变异操作,过程如下:
6.1)从种群P中随机选择三个互不相同的个体Pselect1、Pselect2、Pselect3
6.2)在[0,L-3]内生成两个不同的均匀随机整数rand1和rand2,其中L表示氨基酸序列的长度;
6.3)将Pselect1的第rand1至rand1+2号残基的二面角值替换成Pselect2对应残基的二面角值,将Pselect1的第rand2至rand2+2号残基的二面角值替换成Pselect3对应残基的二面角值,形成变异后的个体Pmutate
7)交叉操作,过程如下:
7.1)在[0,L-3]内生成与rand1和rand2不同的均匀随机整数rand3;
7.2)将Pmutate的第rand3至rand3+2号残基的二面角值替换成Pn对应残基的二面角值,形成交叉后的个体Pcross
8)利用Psipred算法获取Pcross的二级结构信息,随机选择一段二级结构为loop且长度大于4的区域,记作[b,e],其中b和e分别表示该区域第一个残基和最后一个残基的残基号;
9)利用Rosetta协议第四阶段使用的片段组装技术对Pcross的[b,e]区域执行一次片段组装,得到片段组装后的个体Passem
10)对Passem的[b,e]区域进行局部扰动,过程如下:
10.1)以Passem第b至e号残基二面角
Figure BDA0001782900820000093
和ψ对应的键作为旋转轴,取键方向上的单位向量得到旋转轴坐标,记作Ω={ω12,...,ωS},其中S表示旋转轴数量,ωs=(xs,ys,zs)表示第s个旋转轴的坐标,s∈{1,2,...,S};
10.2)记旋转角度Φ={φ12,...,φS},其中φs表示第s个旋转轴对应的旋转角度,即Passem的[b,e]区域第s个二面角的扰动角度;
10.3)以Passem第e至L号残基的Cα原子作为旋转点,记作X={χ12,...,χK},其中K表示旋转点数量,χk=(xk,yk,zk)表示第k个旋转点的坐标,k∈{1,2,...,K};
10.4)模型评估,过程如下:
10.4.1)将X中的旋转点χk依次按照旋转角φs绕旋转轴ws旋转,其中k∈{1,2,...,K},s∈{S,S-1,...,1};得到旋转后的X′={χ′1,χ′2,...,χ′K},χ′k=(x′k,y′k,z′k);
10.4.2)打分函数,按如下公式计算Φ对应的得分:
Figure BDA0001782900820000091
10.5)求解最优的Φ,使其得分最低,过程如下:
10.5.1)初始化:生成初始种群Γ={Φ12,...,ΦNP′},其中
Figure BDA0001782900820000092
10.5.2)设g′=1,其中g′∈{1,2,...,G′};
10.5.3)设n′=1,其中n′∈{1,2,...,NP′};
10.5.4)变异操作,过程如下:
10.5.4.1)从种群Γ中选择得分最低的个体,记作Φbest;再随机选择两个互不相同且与Φbest不同的个体,记作Φselect1、Φselect2
10.5.4.2)按如下方式生成变异后的个体Φmutate
Figure BDA0001782900820000101
10.5.5)交叉操作,过程如下:
10.5.5.1)在[1,S]内生成均匀随机整数srand
10.5.5.2)生成S个均匀随机小数Rs,Rs∈[0,1],s∈{1,2,...,S};
10.5.5.3)按如下方式生成交叉后的个体Φcross
Figure BDA0001782900820000102
10.5.6)选择操作,过程如下:
10.5.6.1)根据步骤10.4)计算Φn′和Φcross的得分Dn′和Dcross
10.5.6.2)若Ecross<En′,用Φcross替换种群Γ中的个体Φn′
10.5.7)n′=n′+1;若n′≤NP′,转至步骤10.5.4);
10.5.8)g′=g′+1;若g′≤G′,转至步骤10.5.3);
10.5.9)从种群中选择五个能量最低的个体作为候选扰动角度,记作H={Φ12345};
10.6)选择扰动,过程如下:
10.6.1)设i=1,其中i∈{1,2,3,4,5};
10.6.2)将H中的第i个个体Φi的扰动角度添加到Passem对应的二面角上,形成扰动后的个体Pperturb
10.6.3)用Rosetta score3能量函数计算Passem和Pperturb的能量Eassem和Eperturb,并按照如下公式计算接收扰动的概率:
Figure BDA0001782900820000103
10.6.4)生成均匀随机小数rand4,rand4∈[0,1];若pacc<rand4,令Ptrial=Pperturb,转至步骤11);否则,转至步骤10.6.5);
10.6.5)i=i+1;若i≤5,转至步骤10.6.2);否则,令Ptrial=Passem
11)用Rosetta score3能量函数计算Ptrial和Pn的能量,根据Metropolis准则决定是否用Ptrial替换种群P中的个体Pn
12)n=n+1;若n≤NP,转至步骤6);
13)g=g+1;若g≤G,转至步骤5);
14)利用SPICKER聚类算法输出最终的预测结果。
以氨基酸序列长度为81的蛋白质4UEX为实施例,运用以上方法得到了该蛋白质的近天然态构象,其构象更新示意图如图1所示,预测的蛋白质的均方根偏差为
Figure BDA0001782900820000111
预测结构如图2所示。
以上阐述是本发明给出的一个实施的预测效果,本发明不仅适合上述实施例,在不偏离本发明基本思想及不超出本发明实质内容的前提下可对其做种种改进加以实施。

Claims (1)

1.一种基于差分进化局部扰动的蛋白质构象空间优化方法,其特征在于,所述构象空间优化方法包括以下步骤:
1)输入预测蛋白质的序列信息;
2)设置参数,过程如下:
2.1)构象搜索差分进化参数:种群规模NP,迭代次数G;
2.2)二面角扰动差分进化参数:种群规模NP′,迭代次数G′,交叉概率CR,变异算子F;
3)种群初始化:迭代Rosetta协议第一、二、三阶段,产生具有NP个个体的种群P={P1,P2,...,PNP},其中Pn表示种群P中的第n个个体,n∈{1,2,...,NP};
4)设g=1,其中g∈{1,2,...,G};
5)设n=1,其中n∈{1,2,...,NP};
6)变异操作,过程如下:
6.1)从种群P中随机选择三个互不相同的个体Pselect1、Pselect2、Pselect3
6.2)在[0,L-3]内生成两个不同的均匀随机整数rand1和rand2,其中L表示氨基酸序列的长度;
6.3)将Pselect1的第rand1至rand1+2号残基的二面角值替换成Pselect2对应残基的二面角值,将Pselect1的第rand2至rand2+2号残基的二面角值替换成Pselect3对应残基的二面角值,形成变异后的个体Pmutate
7)交叉操作,过程如下:
7.1)在[0,L-3]内生成与rand1和rand2不同的均匀随机整数rand3;
7.2)将Pmutate的第rand3至rand3+2号残基的二面角值替换成Pn对应残基的二面角值,形成交叉后的个体Pcross
8)利用Psipred算法获取Pcross的二级结构信息,随机选择一段二级结构为loop且长度大于4的区域,记作[b,e],其中b和e分别表示该区域第一个残基和最后一个残基的残基号;
9)利用Rosetta协议第四阶段使用的片段组装技术对Pcross的[b,e]区域执行一次片段组装,得到片段组装后的个体Passem
10)对Passem的[b,e]区域进行局部扰动,过程如下:
10.1)以Passem第b至e号残基二面角
Figure FDA0002976474930000024
和ψ对应的键作为旋转轴,取键方向上的单位向量得到旋转轴坐标,记作Ω={ω12,...,ωS},其中S表示旋转轴数量,ωs=(xs,ys,zs)表示第s个旋转轴的坐标,s∈{1,2,...,S};
10.2)记旋转角度Φ={φ12,...,φS},其中φs表示第s个旋转轴对应的旋转角度,即Passem的[b,e]区域第s个二面角的扰动角度;
10.3)以Passem第e至L号残基的Cα原子作为旋转点,记作X={χ12,...,χK},其中K表示旋转点数量,χk=(xk,yk,zk)表示第k个旋转点的坐标,k∈{1,2,...,K};
10.4)模型评估,过程如下:
10.4.1)将X中的旋转点χk依次按照旋转角φs绕旋转轴ws旋转,其中k∈{1,2,...,K},s∈{S,S-1,...,1};得到旋转后的X′={χ′1,χ′2,...,χ′K},χ′k=(x′k,y′k,z′k);
10.4.2)打分函数,按如下公式计算Φ对应的得分:
Figure FDA0002976474930000021
10.5)求解最优的Φ,使其得分最低,过程如下:
10.5.1)初始化:生成初始种群Γ={Φ12,...,ΦNP′},其中
Figure FDA0002976474930000022
10.5.2)设g′=1,其中g′∈{1,2,...,G′};
10.5.3)设n′=1,其中n′∈{1,2,...,NP′};
10.5.4)变异操作,过程如下:
10.5.4.1)从种群Γ中选择得分最低的个体,记作Φbest;再随机选择两个互不相同且与Φbest不同的个体,记作Φselect1、Φselect2
10.5.4.2)按如下方式生成变异后的个体Φmutate
Figure FDA0002976474930000023
10.5.5)交叉操作,过程如下:
10.5.5.1)在[1,S]内生成均匀随机整数srand
10.5.5.2)生成S个均匀随机小数Rs,Rs∈[0,1],s∈{1,2,...,S};
10.5.5.3)按如下方式生成交叉后的个体Φcross
Figure FDA0002976474930000031
10.5.6)选择操作,过程如下:
10.5.6.1)根据步骤10.4)计算Φn′和Φcross的得分Dn′和Dcross
10.5.6.2)若Dcross<Dn′,用Φcross替换种群Γ中的个体Φn′
10.5.7)n′=n′+1;若n′≤NP′,转至步骤10.5.4);
10.5.8)g′=g′+1;若g′≤G′,转至步骤10.5.3);
10.5.9)从种群中选择五个能量最低的个体作为候选扰动角度,记作Η={Φ12345};
10.6)选择扰动,过程如下:
10.6.1)设i=1,其中i∈{1,2,3,4,5};
10.6.2)将H中的第i个个体Φi的扰动角度添加到Passem对应的二面角上,形成扰动后的个体Pperturb
10.6.3)用Rosetta score3能量函数计算Passem和Pperturb的能量Eassem和Eperturb,并按照如下公式计算接收扰动的概率:
Figure FDA0002976474930000032
10.6.4)生成均匀随机小数rand4,rand4∈[0,1];若pacc<rand4,令Ptrial=Pperturb,转至步骤11);否则,转至步骤10.6.5);
10.6.5)i=i+1;若i≤5,转至步骤10.6.2);否则,令Ptrial=Passem
11)用Rosetta score3能量函数计算Ptrial和Pn的能量,根据Metropolis准则决定是否用Ptrial替换种群P中的个体Pn
12)n=n+1;若n≤NP,转至步骤6);
13)g=g+1;若g≤G,转至步骤5);
14)利用SPICKER聚类算法输出最终的预测结果。
CN201811000740.XA 2018-08-30 2018-08-30 一种基于差分进化局部扰动的蛋白质构象空间优化方法 Active CN109360596B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811000740.XA CN109360596B (zh) 2018-08-30 2018-08-30 一种基于差分进化局部扰动的蛋白质构象空间优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811000740.XA CN109360596B (zh) 2018-08-30 2018-08-30 一种基于差分进化局部扰动的蛋白质构象空间优化方法

Publications (2)

Publication Number Publication Date
CN109360596A CN109360596A (zh) 2019-02-19
CN109360596B true CN109360596B (zh) 2021-08-03

Family

ID=65350122

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811000740.XA Active CN109360596B (zh) 2018-08-30 2018-08-30 一种基于差分进化局部扰动的蛋白质构象空间优化方法

Country Status (1)

Country Link
CN (1) CN109360596B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110189794B (zh) * 2019-04-16 2021-01-01 浙江工业大学 一种残基接触引导loop扰动的群体蛋白质结构预测方法
CN110706739B (zh) * 2019-08-26 2021-10-29 浙江工业大学 一种基于多模态内外交叉的蛋白质构象空间采样方法
CN110689929B (zh) * 2019-08-29 2021-12-17 浙江工业大学 一种基于接触概率辅助的蛋白质atp对接方法
CN112085246A (zh) * 2020-07-22 2020-12-15 浙江工业大学 一种基于残基对距离约束的蛋白质结构预测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103714265A (zh) * 2013-12-23 2014-04-09 浙江工业大学 一种基于蒙特卡洛局部抖动和片段组装的蛋白质三维结构预测方法
CN104182653A (zh) * 2014-08-25 2014-12-03 浙江工业大学 一种基于局部抽象凸低估支撑面的群体构象空间优化方法
CN104933327A (zh) * 2015-06-08 2015-09-23 浙江工业大学 一种局部增强的差分进化蛋白质构象空间搜索方法
CN106503484A (zh) * 2016-09-23 2017-03-15 浙江工业大学 一种基于抽象凸估计的多阶段差分进化蛋白质结构预测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10468119B2 (en) * 2015-07-28 2019-11-05 Yeda Research And Development Co. Ltd. Stable proteins and methods for designing same

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103714265A (zh) * 2013-12-23 2014-04-09 浙江工业大学 一种基于蒙特卡洛局部抖动和片段组装的蛋白质三维结构预测方法
CN104182653A (zh) * 2014-08-25 2014-12-03 浙江工业大学 一种基于局部抽象凸低估支撑面的群体构象空间优化方法
CN104933327A (zh) * 2015-06-08 2015-09-23 浙江工业大学 一种局部增强的差分进化蛋白质构象空间搜索方法
CN106503484A (zh) * 2016-09-23 2017-03-15 浙江工业大学 一种基于抽象凸估计的多阶段差分进化蛋白质结构预测方法

Also Published As

Publication number Publication date
CN109360596A (zh) 2019-02-19

Similar Documents

Publication Publication Date Title
CN109360596B (zh) 一种基于差分进化局部扰动的蛋白质构象空间优化方法
Deng et al. Protein structure prediction
CN107609342B (zh) 一种基于二级结构空间距离约束的蛋白质构象搜索方法
CN103714265B (zh) 一种基于蒙特卡洛局部抖动和片段组装的蛋白质三维结构预测方法
Jia et al. RNA-MethylPred: a high-accuracy predictor to identify N6-methyladenosine in RNA
CN107633159B (zh) 一种基于距离相似度的蛋白质构象空间搜索方法
CN109086566B (zh) 一种基于片段重采样的群体蛋白质结构预测方法
CN104951670B (zh) 一种基于距离谱的群体构象空间优化方法
CN109215733B (zh) 一种基于残基接触信息辅助评价的蛋白质结构预测方法
Qiu et al. Prediction of protein–protein interaction sites using patch-based residue characterization
Ashtawy et al. Boosted neural networks scoring functions for accurate ligand docking and ranking
Niu et al. HIV-1 protease cleavage site prediction based on two-stage feature selection method
Sun et al. Smolign: a spatial motifs-based protein multiple structural alignment method
Hao et al. A novel method using abstract convex underestimation in ab-initio protein structure prediction for guiding search in conformational feature space
Tan et al. Statistical potentials for 3D structure evaluation: from proteins to RNAs
CN108595910B (zh) 一种基于多样性指标的群体蛋白质构象空间优化方法
CN109378034B (zh) 一种基于距离分布估计的蛋白质预测方法
CN108920894B (zh) 一种基于简约抽象凸估计的蛋白质构象空间优化方法
Olson et al. Enhancing sampling of the conformational space near the protein native state
Shi et al. Identify essential genes based on clustering based synthetic minority oversampling technique
Zhang et al. Protein structure prediction using population-based algorithm guided by information entropy
CN109243525B (zh) 一种基于种群熵的阶段性蛋白质结构预测方法
Mintseris et al. Optimizing protein representations with information theory
CN110197700B (zh) 一种基于差分进化的蛋白质atp对接方法
CN109411013B (zh) 一种基于个体特定变异策略的群体蛋白质结构预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant