CN105912885B - 一种基于群体Lipschitz下界估计的蛋白质结构预测方法 - Google Patents
一种基于群体Lipschitz下界估计的蛋白质结构预测方法 Download PDFInfo
- Publication number
- CN105912885B CN105912885B CN201610219089.XA CN201610219089A CN105912885B CN 105912885 B CN105912885 B CN 105912885B CN 201610219089 A CN201610219089 A CN 201610219089A CN 105912885 B CN105912885 B CN 105912885B
- Authority
- CN
- China
- Prior art keywords
- mrow
- conformation
- lower bound
- target
- trial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000455 protein structure prediction Methods 0.000 title claims abstract description 15
- 238000012360 testing method Methods 0.000 claims abstract description 36
- 239000012634 fragment Substances 0.000 claims abstract description 26
- 238000000034 method Methods 0.000 claims abstract description 19
- 150000001413 amino acids Chemical class 0.000 claims description 8
- 230000014509 gene expression Effects 0.000 claims description 4
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 claims 2
- 239000002253 acid Substances 0.000 claims 1
- 229910021529 ammonia Inorganic materials 0.000 claims 1
- 238000011156 evaluation Methods 0.000 abstract description 6
- 230000007115 recruitment Effects 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 23
- 108090000623 proteins and genes Proteins 0.000 description 17
- 102000004169 proteins and genes Human genes 0.000 description 17
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000005457 optimization Methods 0.000 description 5
- 235000013399 edible fruits Nutrition 0.000 description 3
- 230000008827 biological function Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000329 molecular dynamics simulation Methods 0.000 description 2
- 108020005087 unfolded proteins Proteins 0.000 description 2
- 108010022579 ATP dependent 26S protease Proteins 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
Landscapes
- Spectroscopy & Molecular Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
一种基于群体Lipschitz下界估计的蛋白质结构预测方法,首先,对整个初始构象种群构建Lipschitz下界估计支撑面,从而建立原能量函数模型的下界估计模型;然后,基于片段组装技术产生测试构象,进而根据下界估计模型获取测试构象的能量下界估计值,根据能量下界估计值判断是否需要对测试构象进行实际能量函数评价,并指导种群更新,从而有效减少目标函数评价次数,降低计算代价;最后,根据进化信息对较优的测试构象构建Lipschitz下界估计支撑面,使得下界估计模型向原能量函数模型不断收紧,从而获得更加精确的下界估计信息。
Description
技术领域
本发明涉及一种生物学信息学、智能优化、计算机应用领域,尤其涉及的是,一种基于群体Lipschitz下界估计的蛋白质预测方法。
背景技术
生物细胞中包含许多蛋白质(由20多种氨基酸所形成的长链),这些大分子对于完成生物功能至关重要。蛋白质分子从分子水平上揭示了其结构和功能之间的重要关系。不同的蛋白质在生物体中有着不同的功能,而蛋白的功能通常由其空间结构直接决定。尤其是蛋白质的三维结构是理解和转换生物功能的关键。因此,蛋白质三维结构预测对新蛋白的设计、药物制造、蛋白质之间的相互作用建模以及蛋白质稳定性预测至关重要。
蛋白质结构预测问题是计算生物学领域的一项挑战性工作。蛋白质三维结构可以通过一些实验手段测得,例如,核磁共振和X光晶体衍射。然而由于实验测定比较耗时和昂贵,对于某些不易结晶的蛋白质来说这两种实验方法不适用。蛋白质结构从头预测方法仅通过所给氨基酸序列就可以预测得到三维结构,因此被广泛应用于各种蛋白质的结构预测。在从头预测中,能量函数被用来评价构象的质量,并且通过有效的算法来搜索构象。由于从头预测方法遵循Anfinsen的热力学假说,即能量函数的全局最小解所对应的构象被认为就是天然态结构,因此能量函数在搜索过程中引导算法向查询序列的低能量构象搜索。可以看出,蛋白质结构从头预测方法涉及能量函数的优化问题。如何设计有效的方法来搜索能量函数的全局最小解是一项挑战性工作。
为了在构象空间中采样得到低能量构象,国内外专家相继提出了各种优化技术。这些技术包括进化算法(EAs)、蒙特卡洛(MC)、分子动力学(MD)和构象空间退火(CSA)等。这些方法在蛋白质结构预测中得到了广泛应用,同时也达到了一定的效果。然而,蛋白质结构预测的能量函数计算代价通常很昂贵,该能量函数自由度很高,能量函数曲面极其复杂,通常包含了大量的局部最优解和不可行构象区域。有时对其评价还需要调用到第三发能量包,导致评价一次达到数秒,甚至数分钟。从而导致算法计算代价极高,搜索效率低。
因此,现有的构象空间优化方法在计算代价和搜索效率方面存在着缺陷,需要改进。
发明内容
为了克服现有的蛋白质结构预测方法在计算代价和搜索效率方面的不足,本发明提出一种计算代价较低、搜索效率较高的基于群体Lipschitz下界估计的蛋白质结构预测方法。
本发明解决其技术问题所采用的技术方案是:
一种基于群体Lipschitz下界估计的蛋白质结构预测方法,所述方法包括以下步骤:
1)给定输入序列信息;
2)设置参数:种群大小NP,交叉因子CR,常数M,最大迭代次数;
3)种群初始化:由输入序列产生初始构象种群 其中,N表示维数,表示第i个构象Ci的第N维元素,并初始化迭代次数G=0;
4)对初始种群中的每一个构象Ci构建Lipschitz下界估计支撑面li:
其中,f(Ci)为构象Ci的能量函数值,为辅助变量,M为常数;
5)针对种群中的每个构象个体Ci,i∈{1,2,3,…,NP},令Ctarget=Ci,Ctarget表示目标构象个体,执行以下操作得到变异构象Cmutant:
5.1)随机生成正整数rand1,rand2,rand3∈{1,2,3,......NP},且rand1≠rand2≠rand3≠i;再生成4个随机整数randrange1,randrange2,randrange3,randrange4;其中randrange1≠randrange2,randrange3≠randrange4∈{1,2,…,L},L为序列长度;
5.2)令a=min(randrange1,randrange2),b=max(randrange1,randrange2),k∈[a,b];令c=min(randrange3,randrange4),d=max(randrange3,randrange4),p∈[c,d];其中min表示取两个数的最小值,max表示取两个数的最大值;
5.3)用Crand2上位置a到位置b的片段的氨基酸k所对应的二面角phi、psi、omega替换Crand1的相同位置所对应的二面角phi、psi、omega;再使用Crand3上位置c到位置d的片段的氨基酸p所对应的二面角phi、psi、omega替换Crand1上相同位置所对应的二面角phi、psi、omega,然后将所得Crand1进行片段组装得到变异构象个体Cmutant;
6)对变异构象Cmutant执行交叉操作生成测试构象Ctrial:
6.1)生成随机数rand4,rand5,其中rand4∈(0,1),rand5∈(1,L);
6.2)根据式(2)执行交叉过程:
其中Cmutant,rand5表示变异构象中的rand5片段,若随机数rand4≤CR,变异构象Cmutant的片段rand5替换为目标构象Ctarget中对应的片段,否则Ctrial直接等于变异构象Cmutant;
7)计算测试构象Ctrial的下界估计值
其中max表示求最大值,min表示求最小值,为测试构象向量的第j维元素,为支撑向量lk的第j维元素;
8)根据如下操作决定测试构象Ctrial是否替换目标构象Ctarget:
8.1)计算目标构象的能量函数值f(Ctarget);
8.2)如果则目标构象Ctarget保持不变,并直接进入下一次迭代;
8.3)如果则计算测试构象Ctrial的实际能量函数值f(Ctrial),如果f(Ctrial)<f(Ctarget),则测试构象Ctrial替换目标构象Ctarget并继续步骤8.4);
8.4)根据式(1)对测试构象Ctrial构建Lipschitz下界估计支撑面;
9)判断是否满足终止条件,若满足则输出结果并退出,否则返回步骤5)。
进一步,所述步骤9)中,对种群中的每一个个体都执行完步骤5)—8)以后,迭代次数G=G+1,终止条件为迭代次数G达到预设最大迭代次数。
本发明的技术构思为:首先,对整个初始构象种群构建Lipschitz下界估计支撑面,从而建立原能量函数模型的下界估计模型;然后,基于片段组装技术产生测试构象,进而根据下界估计模型获取测试构象的能量下界估计值,根据能量下界估计值判断是否需要对测试构象进行实际能量函数评价,并指导种群更新,从而有效减少目标函数评价次数,降低计算代价;最后,根据进化信息对较优的测试构象构建Lipschitz下界估计支撑面,使得下界估计模型向原能量函数模型不断收紧,从而获得更加精确的下界估计信息。
本发明的有益效果表现在:一方面,根据下界估计值指导种群更新,减少不必要的能量函数评价,降低算法计算代价,提高搜索效率;另一方面,根据进化信息更新下界支撑面,使得下界估计模型向原能量函数模型不断收紧。
附图说明
图1是基于群体Lipschitz下界估计的蛋白质结构预测方法对蛋白质1FD4进行结构预测时的构象更新示意图。
图2是基于群体Lipschitz下界估计的蛋白质结构预测方法对蛋白质1FD4进行结构预测时得到的构象分布图;
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1和图2,一种基于群体Lipschitz下界估计的蛋白质结构预测方法,包括以下步骤:
1)给定输入序列信息;
2)设置参数:种群大小NP,交叉因子CR,常数M,最大迭代次数;
3)种群初始化:由输入序列产生初始构象种群 其中,N表示维数,表示第i个构象Ci的第N维元素,并初始化迭代次数G=0;
4)对初始种群中的每一个构象Ci构建Lipschitz下界估计支撑面li:
其中,f(Ci)维构象Ci的能量函数值,为辅助变量,M为常数;
5)针对种群中的每个构象个体Ci,i∈{1,2,3,…,NP},令Ctarget=Ci,Ctarget表示目标构象个体,执行以下操作得到变异构象Cmutant:
5.1)随机生成正整数rand1,rand2,rand3∈{1,2,3,......NP},且rand1≠rand2≠rand3≠i;再生成4个随机整数randrange1,randrange2,randrange3,randrange4;其中randrange1≠randrange2,randrange3≠randrange4∈{1,2,…,L},L为序列长度;
5.2)令a=min(randrange1,randrange2),b=max(randrange1,randrange2),k∈[a,b];令c=min(randrange3,randrange4),d=max(randrange3,randrange4),p∈[c,d];其中min表示取两个数的最小值,max表示取两个数的最大值;
5.3)用Crand2上位置a到位置b的片段的氨基酸k所对应的二面角phi、psi、omega替换Crand1的相同位置所对应的二面角phi、psi、omega;再使用Crand3上位置c到位置d的片段的氨基酸p所对应的二面角phi、psi、omega替换Crand1上相同位置所对应的二面角phi、psi、omega,然后将所得Crand1进行片段组装得到变异构象个体Cmutant;
6)对变异构象Cmutant执行交叉操作生成测试构象Ctrial:
6.1)生成随机数rand4,rand5,其中rand4∈(0,1),rand5∈(1,L);
6.2)根据式(2)执行交叉过程:
其中Cmutant,rand5表示变异构象中的rand5片段,若随机数rand4≤CR,变异构象Cmutant的片段rand5替换为目标构象Ctarget中对应的片段,否则Ctrial直接等于变异构象Cmutant;
7)计算测试构象Ctrial的下界估计值
其中max表示求最大值,min表示求最小值,为测试构象向量的第j维元素,为支撑向量lk的第j维元素;
8)根据如下操作决定测试构象Ctrial是否替换目标构象Ctarget:
8.1)计算目标构象的能量函数值f(Ctarget);
8.2)如果则目标构象Ctarget保持不变,并直接进入下一次迭代;
8.3)如果则计算测试构象Ctrial的实际能量函数值f(Ctrial),如果f(Ctrial)<f(Ctarget),则测试构象Ctrial替换目标构象Ctarget并继续步骤8.4);
8.4)根据式(1)对测试构象Ctrial构建Lipschitz下界估计支撑面;
9)判断是否满足终止条件,若满足则输出结果并退出,否则返回步骤5)。
进一步,所述步骤9)中,对种群中的每一个个体都执行完步骤5)—8)以后,迭代次数G=G+1,终止条件为迭代次数G达到预设最大迭代次数。
本实施例序列长度为46的α/β折叠蛋白质1FD4为实施例,一种基于群体Lipschitz下界估计的蛋白质结构预测方法,其中包含以下步骤:
1)给定输入序列信息;
2)设置参数:种群大小NP=50,算法的最大迭代次数=10000,交叉因子CR=0.5,常数M=1000;
3)种群初始化:由输入序列产生初始构象种群 其中,N表示维数,表示第i个构象Ci的第N维元素,并初始化迭代次数G=0;
4)对初始种群中的每一个构象Ci构建Lipschitz下界估计支撑面li:
其中,f(Ci)维构象Ci的能量函数值,为辅助变量,M为常数;
5)针对种群中的每个构象个体Ci,i∈{1,2,3,…,NP},令Ctarget=Ci,Ctarget表示目标构象个体,执行以下操作得到变异构象Cmutant:
5.1)随机生成正整数rand1,rand2,rand3∈{1,2,3,......NP},且rand1≠rand2≠rand3≠i;再生成4个随机整数randrange1,randrange2,randrange3,randrange4;其中randrange1≠randrange2,randrange3≠randrange4∈{1,2,…,L},L为序列长度;
5.2)令a=min(randrange1,randrange2),b=max(randrange1,randrange2),k∈[a,b];令c=min(randrange3,randrange4),d=max(randrange3,randrange4),p∈[c,d];其中min表示取两个数的最小值,max表示取两个数的最大值;
5.3)用Crand2上位置a到位置b的片段的氨基酸k所对应的二面角phi、psi、omega替换Crand1的相同位置所对应的二面角phi、psi、omega;再使用Crand3上位置c到位置d的片段的氨基酸p所对应的二面角phi、psi、omega替换Crand1上相同位置所对应的二面角phi、psi、omega,然后将所得Crand1进行片段组装得到变异构象个体Cmutant;
6)对变异构象Cmutant执行交叉操作生成测试构象Ctrial:
6.1)生成随机数rand4,rand5,其中rand4∈(0,1),rand5∈(1,L);
6.2)根据式(2)执行交叉过程:
其中Cmutant,rand5表示变异构象中的rand5片段,若随机数rand4≤CR,变异构象Cmutant的片段rand5替换为目标构象Ctarget中对应的片段,否则Ctrial直接等于变异构象Cmutant;
7)计算测试构象Ctrial的下界估计值
其中max表示求最大值,min表示求最小值,为测试构象向量的第j维元素,为支撑向量lk的第j维元素;
8)根据如下操作决定测试构象Ctrial是否替换目标构象Ctarget:
8.1)计算目标构象的能量函数值f(Ctarget);
8.2)如果则目标构象Ctarget保持不变,并直接进入下一次迭代;
8.3)如果,则计算测试构象Ctrial的实际能量函数值f(Ctrial),如果f(Ctrial)<f(Ctarget),则测试构象Ctrial替换目标构象Ctarget并继续步骤8.4);
8.4)根据式(1)对测试构象Ctrial构建Lipschitz下界估计支撑面;
9)对种群中的每一个个体都执行完步骤5)—8)以后,迭代次数G=G+1,判断是否满足终止条件G=10000,若满足则输出结果并退出,否则返回步骤5)。
以序列长度为46的α/β折叠蛋白质1FD4为实施例,运用以上方法得到了该蛋白质的近天然态构象,最小均方根偏差为平均均方根偏差为构象更新图如图1所示,构象分布图如图2所示。
以上阐述的是本发明给出的一个实施例表现出来的优良优化效果,显然本发明不仅适合上述实施例,而且可以应用到实际工程中的各个领域(如电力系统,路径规划等优化问题),同时在不偏离本发明基本精神及不超出本发明实质内容所涉及内容的前提下可对其做种种变化加以实施。
Claims (2)
1.一种基于群体Lipschitz下界估计的蛋白质结构预测方法,其特征在于:所述蛋白质结构预测方法包括以下步骤:
1)给定输入序列信息;
2)设置参数:种群大小NP,交叉因子CR,常数M,最大迭代次数;
3)种群初始化:由输入序列产生初始构象种群 其中,N表示维数,表示第i个构象Ci的第N维元素,并初始化迭代次数G=0;
4)对初始种群中的每一个构象Ci构建Lipschitz下界估计支撑面li:
<mrow>
<msup>
<mi>l</mi>
<mi>i</mi>
</msup>
<mo>=</mo>
<mrow>
<mo>(</mo>
<mfrac>
<mrow>
<mi>f</mi>
<mrow>
<mo>(</mo>
<msup>
<mi>C</mi>
<mi>i</mi>
</msup>
<mo>)</mo>
</mrow>
</mrow>
<mi>M</mi>
</mfrac>
<mo>-</mo>
<msubsup>
<mi>x</mi>
<mn>1</mn>
<mi>i</mi>
</msubsup>
<mo>,</mo>
<mfrac>
<mrow>
<mi>f</mi>
<mrow>
<mo>(</mo>
<msup>
<mi>C</mi>
<mi>i</mi>
</msup>
<mo>)</mo>
</mrow>
</mrow>
<mi>M</mi>
</mfrac>
<mo>-</mo>
<msubsup>
<mi>x</mi>
<mn>2</mn>
<mi>i</mi>
</msubsup>
<mo>,</mo>
<mo>...</mo>
<mo>,</mo>
<mfrac>
<mrow>
<mi>f</mi>
<mrow>
<mo>(</mo>
<msup>
<mi>C</mi>
<mi>i</mi>
</msup>
<mo>)</mo>
</mrow>
</mrow>
<mi>M</mi>
</mfrac>
<mo>-</mo>
<msubsup>
<mi>x</mi>
<mrow>
<mi>N</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
<mi>i</mi>
</msubsup>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,f(Ci)维构象Ci的能量函数值,为辅助变量,M为常数;
5)针对种群中的每个构象个体Ci,i∈{1,2,3,…,NP},令Ctarget=Ci,Ctarget表示目标构象个体,执行以下操作得到变异构象Cmutant:
5.1)随机生成正整数rand1,rand2,rand3∈{1,2,3,......NP},且rand1≠rand2≠rand3≠i;再生成4个随机整数randrange1,randrange2,randrange3,randrange4;其中randrange1≠randrange2,randrange3≠randrange4∈{1,2,…,L},L为序列长度;
5.2)令a=min(randrange1,randrange2),b=max(randrange1,randrange2),k∈[a,b];令c=min(randrange3,randrange4),d=max(randrange3,randrange4),p∈[c,d];其中min表示取两个数的最小值,max表示取两个数的最大值;
5.3)用Crand2上位置a到位置b的片段的氨基酸k所对应的二面角phi、psi、omega替换Crand1的相同位置所对应的二面角phi、psi、omega;再使用Crand3上位置c到位置d的片段的氨基酸p所对应的二面角phi、psi、omega替换Crand1上相同位置所对应的二面角phi、psi、omega,然后将所得Crand1进行片段组装得到变异构象个体Cmutant;
6)对变异构象Cmutant执行交叉操作生成测试构象Ctrial:
6.1)生成随机数rand4,rand5,其中rand4∈(0,1),rand5∈(1,L);
6.2)根据式(2)执行交叉过程:
<mrow>
<msub>
<mi>C</mi>
<mrow>
<mi>t</mi>
<mi>r</mi>
<mi>a</mi>
<mi>i</mi>
<mi>l</mi>
</mrow>
</msub>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<msub>
<mi>C</mi>
<mrow>
<mi>m</mi>
<mi>u</mi>
<mi>tan</mi>
<mi>t</mi>
<mo>,</mo>
<mi>r</mi>
<mi>a</mi>
<mi>n</mi>
<mi>d</mi>
<mn>5</mn>
</mrow>
</msub>
<mo>&LeftArrow;</mo>
<msub>
<mi>C</mi>
<mrow>
<mi>t</mi>
<mi>arg</mi>
<mi>e</mi>
<mi>t</mi>
<mo>,</mo>
<mi>r</mi>
<mi>a</mi>
<mi>n</mi>
<mi>d</mi>
<mn>5</mn>
</mrow>
</msub>
<mo>,</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>i</mi>
<mi>f</mi>
<mrow>
<mo>(</mo>
<mi>r</mi>
<mi>a</mi>
<mi>n</mi>
<mi>d</mi>
<mn>4</mn>
<mo>&le;</mo>
<mi>C</mi>
<mi>R</mi>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msub>
<mi>C</mi>
<mrow>
<mi>m</mi>
<mi>u</mi>
<mi>tan</mi>
<mi>t</mi>
<mo>,</mo>
<mi>r</mi>
<mi>a</mi>
<mi>n</mi>
<mi>d</mi>
<mn>5</mn>
</mrow>
</msub>
<mo>,</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>o</mi>
<mi>t</mi>
<mi>h</mi>
<mi>e</mi>
<mi>r</mi>
<mi>w</mi>
<mi>i</mi>
<mi>s</mi>
<mi>e</mi>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>2</mn>
<mo>)</mo>
</mrow>
</mrow>
其中Cmutant,rand5表示变异构象中的rand5片段,若随机数rand4≤CR,变异构象Cmutant的片段rand5替换为目标构象Ctarget中对应的片段,否则Ctrial直接等于变异构象Cmutant;
7)计算测试构象Ctrial的下界估计值
<mrow>
<mover>
<mi>f</mi>
<mo>&OverBar;</mo>
</mover>
<mrow>
<mo>(</mo>
<msub>
<mi>C</mi>
<mrow>
<mi>t</mi>
<mi>r</mi>
<mi>i</mi>
<mi>a</mi>
<mi>l</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<munder>
<mrow>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
</mrow>
<mrow>
<mi>k</mi>
<mo>&le;</mo>
<mi>N</mi>
<mi>P</mi>
</mrow>
</munder>
<munder>
<mrow>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
</mrow>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
<mo>,</mo>
<mo>...</mo>
<mi>N</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</munder>
<mi>M</mi>
<mrow>
<mo>(</mo>
<msubsup>
<mi>l</mi>
<mi>j</mi>
<mi>k</mi>
</msubsup>
<mo>+</mo>
<msubsup>
<mi>x</mi>
<mrow>
<mi>t</mi>
<mi>r</mi>
<mi>i</mi>
<mi>a</mi>
<mi>l</mi>
</mrow>
<mi>j</mi>
</msubsup>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>3</mn>
<mo>)</mo>
</mrow>
</mrow>
其中max表示求最大值,min表示求最小值,为测试构象向量的第j维元素, 为支撑向量lk的第j维元素;
8)根据如下操作决定测试构象Ctrial是否替换目标构象Ctarget:
8.1)计算目标构象的能量函数值f(Ctarget);
8.2)如果则目标构象Ctarget保持不变,并直接进入下一次迭代;
8.3)如果则计算测试构象Ctrial的实际能量函数值f(Ctrial),如果f(Ctrial)<f(Ctarget),则测试构象Ctrial替换目标构象Ctarget并继续步骤8.4);
8.4)根据式(1)对测试构象Ctrial构建Lipschitz下界估计支撑面;
9)判断是否满足终止条件,若满足则输出结果并退出,否则返回步骤5)。
2.如权利要求1所述的一种基于群体Lipschitz下界估计的蛋白质结构预测方法,其特征在于:所述步骤9)中,对种群中的每一个个体都执行完步骤5)—8)以后,迭代次数G=G+1,终止条件为迭代次数G达到预设最大迭代次数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610219089.XA CN105912885B (zh) | 2016-04-08 | 2016-04-08 | 一种基于群体Lipschitz下界估计的蛋白质结构预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610219089.XA CN105912885B (zh) | 2016-04-08 | 2016-04-08 | 一种基于群体Lipschitz下界估计的蛋白质结构预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105912885A CN105912885A (zh) | 2016-08-31 |
CN105912885B true CN105912885B (zh) | 2018-04-20 |
Family
ID=56745793
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610219089.XA Active CN105912885B (zh) | 2016-04-08 | 2016-04-08 | 一种基于群体Lipschitz下界估计的蛋白质结构预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105912885B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106503484B (zh) * | 2016-09-23 | 2019-07-05 | 浙江工业大学 | 一种基于抽象凸估计的多阶段差分进化蛋白质结构预测方法 |
CN109300503B (zh) * | 2018-08-29 | 2021-08-03 | 浙江工业大学 | 一种全局和局部下界估计协同的群体蛋白质结构预测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104200073A (zh) * | 2014-08-19 | 2014-12-10 | 浙江工业大学 | 一种基于局部Lipschitz估计的自适应群体全局优化方法 |
CN105224987A (zh) * | 2015-09-22 | 2016-01-06 | 浙江工业大学 | 一种基于动态Lipschitz下界估计的变策略群体全局优化方法 |
CN105303234A (zh) * | 2015-10-09 | 2016-02-03 | 浙江工业大学 | 一种基于最优个体Lipschitz支撑面的群体全局优化方法 |
-
2016
- 2016-04-08 CN CN201610219089.XA patent/CN105912885B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104200073A (zh) * | 2014-08-19 | 2014-12-10 | 浙江工业大学 | 一种基于局部Lipschitz估计的自适应群体全局优化方法 |
CN105224987A (zh) * | 2015-09-22 | 2016-01-06 | 浙江工业大学 | 一种基于动态Lipschitz下界估计的变策略群体全局优化方法 |
CN105303234A (zh) * | 2015-10-09 | 2016-02-03 | 浙江工业大学 | 一种基于最优个体Lipschitz支撑面的群体全局优化方法 |
Non-Patent Citations (4)
Title |
---|
一种基于片段组装的蛋白质构象空间优化算法;郝小虎 等;《计算机科学》;20150331;第42卷(第3期);第237-240页 * |
一种新的蛋白质结构预测多模态优化算法;程正华 等;《计算机科学》;20130930;第40卷(第9期);第212-215、229页 * |
动态步长蛋白质构象空间搜索方法;张贵军 等;《吉林大学学报(工学版)》;20160331;第46卷(第2期);第585-594页 * |
基于抽象凸下界估计的群体全局优化算法;张贵军 等;《控制与决策》;20150630;第30卷(第6期);第1116-1120页 * |
Also Published As
Publication number | Publication date |
---|---|
CN105912885A (zh) | 2016-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106778059A (zh) | 一种基于Rosetta局部增强的群体蛋白质结构预测方法 | |
CN107609342A (zh) | 一种基于二级结构空间距离约束的蛋白质构象搜索方法 | |
CN110910951A (zh) | 一种基于渐进式神经网络预测蛋白质与配体结合自由能的方法 | |
CN101339181B (zh) | 基于遗传算法的有机化合物燃爆特性预测方法 | |
CN106055920B (zh) | 一种基于阶段性多策略副本交换的蛋白质结构预测方法 | |
Chu et al. | The multiscale challenge for biomolecular systems: coarse-grained modeling | |
CN105205348A (zh) | 一种基于距离约束选择策略的群体构象空间优化方法 | |
CN105808973A (zh) | 一种基于阶段性多策略的群体构象空间采样方法 | |
CN105912885B (zh) | 一种基于群体Lipschitz下界估计的蛋白质结构预测方法 | |
Krakoviack et al. | Relating monomer to centre-of-mass distribution functions in polymer solutions | |
Cavuslar et al. | A tabu search approach for the NMR protein structure-based assignment problem | |
Patel et al. | A water-explicit lattice model of heat-, cold-, and pressure-induced protein unfolding | |
CN105975806A (zh) | 一种基于距离约束副本交换的蛋白质结构预测方法 | |
CN109360601B (zh) | 一种基于排挤策略的多模态蛋白质结构预测方法 | |
Melo et al. | GSAFold: a new application of GSA to protein structure prediction | |
Baranek et al. | Influence of electronic correlation on structural, dynamic, and elastic properties of Mg2Si | |
Weber et al. | Conformational statistics of n-butane in the condensed phase and the effects of temperature | |
US20130046482A1 (en) | System and method for associating a moduli space with a molecule | |
Miloserdov | Classifying amorphous polymers for membrane technology basing on accessible surface area of their conformations | |
Ramı́rez et al. | Conformational kinetics in liquid n-butane by transition path sampling | |
CN109346128A (zh) | 一种基于残基信息动态选择策略的蛋白质结构预测方法 | |
CN109360597A (zh) | 一种基于全局和局部策略协作的群体蛋白质结构预测方法 | |
Mak | Loops MC: an all-atom Monte Carlo simulation program for RNAs based on inverse kinematic loop closure | |
CN109243526B (zh) | 一种基于特定片段交叉的蛋白质结构预测方法 | |
Poland | DNA melting profiles from a matrix method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |