CN107633159B - 一种基于距离相似度的蛋白质构象空间搜索方法 - Google Patents

一种基于距离相似度的蛋白质构象空间搜索方法 Download PDF

Info

Publication number
CN107633159B
CN107633159B CN201710717391.2A CN201710717391A CN107633159B CN 107633159 B CN107633159 B CN 107633159B CN 201710717391 A CN201710717391 A CN 201710717391A CN 107633159 B CN107633159 B CN 107633159B
Authority
CN
China
Prior art keywords
individual
individuals
target
energy
num
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710717391.2A
Other languages
English (en)
Other versions
CN107633159A (zh
Inventor
张贵军
王小奇
周晓根
王柳静
郝小虎
马来发
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201710717391.2A priority Critical patent/CN107633159B/zh
Publication of CN107633159A publication Critical patent/CN107633159A/zh
Application granted granted Critical
Publication of CN107633159B publication Critical patent/CN107633159B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

一种基于距离相似度的蛋白质构象空间搜索方法,在遗传算法的基本框架下,对每个目标个体完成交叉和变异操作;计算出目标个体残基间的空间距离值,并由这些空间距离值构成目标特征向量;然后,求出目标个体的特征向量与先验知识中目标蛋白的初始特征向量的Manhattan距离;同理,计算得到变异个体对应的变异特征向量以及对应的Manhattan距离;最后,根据Manhattan距离值和能量值选出优势个体,更新种群。本发明提出一种预测精度高、计算代价低的基于距离相似度的蛋白质构象空间搜索方法。

Description

一种基于距离相似度的蛋白质构象空间搜索方法
技术领域
本发明涉及一种生物学信息学、智能优化、计算机应用领域,尤其涉及的是,一种基于距离相似度的蛋白质构象空间搜索方法。
背景技术
蛋白质是生命体的重要组成部分和生命活动的主要执行者。据估计,生命体的细胞中大约15-20%是蛋白质,是含量最高的有机物。蛋白质是由氨基酸以肽键相连而成的一条蛋白质序列,这些伸展链只有在折叠成特定的结构之后方能行使特定的生物学功能,因此了解蛋白质的三维结构是研究其生物功能及活性机理的基础。然而至今为止,人们仍不清楚蛋白质究竟如何由其一维序列折叠形成具有特定生物功能的三维结构。相对于翻译过程中的三联体遗传密码,蛋白质序列与其空间结构的对应关系常被称之为第二遗传密码。
目前蛋白质结构数据库PDB中所存储的蛋白质三维结构主要通过X射线晶体衍射、核磁共振成像和三维电镜重构技术得到。尽管上述三种研究方法已经比较成熟,但这些实验方法代价太高,且有各自的应用局限。因此在理论探索和应用需求的双重推动下,根据Anfinsen法则,以序列为起点利用计算机技术设计适当的算法发展起来的蛋白质三级结构预测方法中,同源建模和穿线方法可以统称为基于模板的结构预测方法。不同于同源建模以及穿线方法,从头预测方法不依赖于任何已知结构,而是以第一性原理构建蛋白质折叠力场,再通过相应的构象搜索优化方法搜寻目标蛋白的天然结构。
蛋白质构象空间优化的本质复杂性,使其成为蛋白质从头预测领域中一个极具挑战性的研究课题。目前主要的技术瓶颈在于两个方面,第一方面在于采样方法,现有技术对构象空间采样能力不强,另一方面由于能量函数不精确,所以在获得能量最优的构象时,并不能挑选出好的构象。
因此,现有的构象空间优化方法在预测精度和采样效率方面存在着缺陷,需要改进。
发明内容
为了克服现有的蛋白质结构预测构象空间优化方法存在采样效率较低、预测精度较低的不足,本发明提出一种采样效率较高、预测精度高的基于距离相似度的蛋白质构象空间搜索方法。
本发明解决其技术问题所采用的技术方案是:
一种基于距离相似度的蛋白质构象空间搜索方法,所述方法包括以下步骤:
1)给定输入序列信息;
2)参数初始化:设置种群规模Pop_size,最大迭代次数Gmax,交叉因子CR,初始种群搜索轨迹长度iteration,交叉片段长度fragment,变异计数器 counter,变异计数器的最大计数值counter_max,每个个体 xi,i∈{1,2,...,Pop_size}的能量计算选用RosettaScore3函数即E(xi),温度常数T,序列间隔num,先验知识中目标蛋白残基间的空间距离构成的初始特征向量V={v1,1+num,…,vk,k+num},k∈[1,length-num],其中vk,k+num是第k个残基相应的α原子和第k+num个残基相应的α原子之间的欧式距离,length为序列长度,选择概率Ps
3)初始化种群:启动Pop_size条Monte Carlo轨迹,每条轨迹搜索iteration次,即生成Pop_size个初始个体;
4)对每个目标个体xi,i=1,.2..,Pop_size进行如下操作:
4.1)随机选取个体xj,j∈{1,2,...,Pop_size}且j≠i,随机生成rand∈[0,1],若, rand≤CR则对个体xi和xj进行如下操作:
4.1.1)随机生成整数begin∈[1,length-fragment]作为交叉起始点,进而得到交叉区间[begin,end],其中begin+fragment=end为交叉终止点;
4.1.2)在交叉区间[begin,end]内依次交换个体xi和xj相应的扭转角度,生成新个体x′i,x′j
否则x′i=xi,x′j=xj,转至步骤4.2);
4.2)对个体x′i,x′j进行如下的变异操作生成变异个体x″i,x″j
4.2.1)对个体x′i进行片段组装,利用Rosetta Score3函数E(xi)分别计算组装前后的能量值Ei和E′j
4.2.2)利用Monte Carlo机制即根据公式P(ΔE)=min{1,e-ΔE/T}>random判断是否接收该片段的插入,其中random∈[0,1]的随机数,ΔE是个体x′i的在组装前后的能量变化值即ΔE=E′j-Ei
4.2.3)如果接受则转至步骤4.2.5),否则转至4.2.4);
4.2.4)变异计数器counter开始计数;若counter≤counter_max则依次执行步骤4.2.1)、4.2.2)和4.2.3)直到成功变异生成个体x″i为止;否则执行步骤4.2.1)生成变异个体x″i;最后,计数器counter清零;
4.2.5)对个体x′j依次执行步骤4.2.1)、4.2.2)和4.2.3),生成变异个体x″j
4.3)根据目标个体xi和变异个体x″i、x″j的能量和距离相似度进行选择,选出优势个体并更新种群,过程如下:
4.3.1)依次计算出目标个体xi的第k个残基相应的α原子和第k+num个残基相应的α原子之间的欧式距离
Figure GDA0002361193300000031
进而得出目标特征向量
Figure GDA0002361193300000032
4.3.2)计算目标个体xi的距离相似度
Figure GDA0002361193300000038
其中
Figure GDA0002361193300000033
4.3.3)对个体x″i执行步骤4.3.1)得出个体x″i对应的变异特征向量
Figure GDA0002361193300000034
并根据
Figure GDA0002361193300000035
计算出个体x″i相应的距离相似度sim_mutation_1;
4.3.4)对个体x″j依次执行步骤4.3.1)得出个体x″j对应的特变异征向量
Figure GDA0002361193300000036
并根据
Figure GDA0002361193300000037
计算出个体x″j对应的距离相似度sim_mutation_2;
4.3.5)根据Rosetta Score3函数分别计算出目标个体xi和个体x″i、x″j的能量值分别为energy_object,energy_mutation_1,energy_mutation_2;
4.3.6)在个体xi和个体x″i、x″j中,如果某一个体Y∈{xi,x″i,x″j}的能量值和距离相似度均小于其他两个个体的能量值和距离相似度,则该个体为优势个体;如果某一个体Y′∈{xi,x″i,x″j}能量值小于其他两个个体的能量值,则随机生成rand_pro1∈(0,1),如果rand_pro1≤Ps则将该个体设为优势个体;同理,如果某一个体Y″∈{xi,x″i,x″j}的对应相似度是最小的,则随机生成rand_pro2∈(0,1),如果rand_pro2≤Ps则将该个体设为优势个体;最后,优势个体替代目标个体,更新种群;
5)判断是否达到最大迭代代数Gmax,若达到,则输出结果,否则转至步骤4)。
本发明的技术构思为:在遗传算法的基本框架下,对每个目标个体完成交叉和变异操作;计算出目标个体残基间的空间距离值,并由这些空间距离值构成目标特征向量;然后,求出目标个体的特征向量与先验知识中目标蛋白的初始特征向量的Manhattan距离;同理,计算得到变异个体对应的变异特征向量以及对应的 Manhattan距离;最后,根据Manhattan距离值和能量值选出优势个体,更新种群。
本发明的有益效果表现在:一方面通过加入残基间的空间距离信息指导种群更新,降低了由于能量函数不精确带来的误差,进而大大提高了预测精度;另一方面,在遗传算法的框架下,通过个体间的信息交互,有效地加快了收敛速度。
附图说明
图1是基于距离相似度的蛋白质构象空间搜索方法的基本流程图。
图2是基于距离相似度的蛋白质构象空间搜索方法对蛋白质1AIL进行结构预测时的构象更新示意图。
图3是基于距离相似度的蛋白质构象空间搜索方法对蛋白质1AIL进行结构预测得到的三维结构图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1,一种基于距离相似度的蛋白质构象空间搜索方法,所述方法包括以下步骤:
1)给定输入序列信息;
2)参数初始化:设置种群规模Pop_size,最大迭代次数Gmax,交叉因子CR,初始种群搜索轨迹长度iteration,交叉片段长度fragment,变异计数器 counter,变异计数器的最大计数值counter_max,每个个体xi,i∈{1,2,...,Pop_size}的能量计算选用RosettaScore3函数即E(xi),温度常数T,序列间隔num,先验知识中目标蛋白残基间的空间距离构成的初始特征向量V={v1,1+num,…,vk,k+num},k∈[1,length-num],其中vk,k+num是第k个残基相应的α原子和第k+num个残基相应的α原子之间的欧式距离,length为序列长度,选择概率Ps
3)初始化种群:启动Pop_size条Monte Carlo轨迹,每条轨迹搜索iteration次,即生成Pop_size个初始个体;
4)对每个目标个体xi,i=1,.2..,Pop_size进行如下操作:
4.1)随机选取个体xj,j∈{1,2,...,Pop_size}且j≠i,随机生成rand∈[0,1],若rand≤CR,则对个体xi和xj进行如下操作:
4.1.1)随机生成整数begin∈[1,length-fragment]作为交叉起始点,进而得到交叉区间[begin,end],其中begin+fragment=end为交叉终止点;
4.1.2)在交叉区间[begin,end]内依次交换个体xi和xj相应的扭转角度,生成新个体x′i,x′j
否则x′i=xi,x′j=xj,转至步骤4.2);
4.2)对个体x′i,x′j进行如下的变异操作生成变异个体x″i,x″j
4.2.1)对个体x′i进行片段组装,利用Rosetta Score3函数E(xi)分别计算组装前后的能量值Ei和E′j
4.2.2)利用Monte Carlo机制即根据公式P(ΔE)=min{1,e-ΔE/T}>random判断是否接收该片段的插入,其中random∈[0,1]的随机数,ΔE是个体x′i的在组装前后的能量变化值即ΔE=E′j-Ei
4.2.3)如果接受则转至步骤4.2.5)否则转至4.2.4);
4.2.4)变异计数器counter开始计数;若counter≤counter_max则依次执行步骤4.2.1)、4.2.2)和4.2.3)直到成功变异生成个体x″i为止;否则执行步骤4.2.1)生成变异个体x″i;最后,计数器counter清零;
4.2.5)对个体x′j依次执行步骤4.2.1)、4.2.2)和4.2.3),生成变异个体x″j
4.3)根据目标个体xi和变异个体x″i、x″j的能量和距离相似度进行选择,选出优势个体并更新种群,过程如下:
4.3.1)依次计算出目标个体xi的第k个残基相应的α原子和第k+num个残基相应的α原子之间的欧式距离
Figure GDA0002361193300000061
进而得出目标特征向量
Figure GDA0002361193300000062
4.3.2)计算目标个体xi的距离相似度
Figure GDA0002361193300000063
其中
Figure GDA0002361193300000064
4.3.3)对个体x″i执行步骤4.3.1)得出个体x″i对应的变异特征向量
Figure GDA0002361193300000065
并根据
Figure GDA0002361193300000066
计算出个体x″i相应的距离相似度sim_mutation_1;
4.3.4)对个体x″j依次执行步骤4.3.1)得出个体x″j对应的特变异征向量
Figure GDA0002361193300000067
并根据
Figure GDA0002361193300000068
计算出个体x″j对应的距离相似度sim_mutation_2;
4.3.5)根据Rosetta Score3函数分别计算出目标个体xi和个体x″i、x″j的能量值分别为energy_object,energy_mutation_1,energy_mutation_2;
4.3.6)在个体xi和个体x″i、x″j中,如果某一个体Y∈{xi,x″i,x″j}的能量值和距离相似度均小于其他两个个体的能量值和距离相似度,则该个体为优势个体;如果某一个体Y′∈{xi,x″i,x″j}能量值小于其他两个个体的能量值,则随机生成rand_pro1∈(0,1),如果rand_pro1≤Ps则将该个体设为优势个体;同理,如果某一个体Y″∈{xi,x″i,x″j}的对应相似度是最小的,则随机生成rand_pro2∈(0,1),如果rand_pro2≤Ps则将该个体设为优势个体;最后,优势个体替代目标个体,更新种群;
5)判断是否达到最大迭代代数Gmax,若达到,则输出结果,否则转至步骤4)。
本实施例序列长度为73的α折叠蛋白质1AIL为实施例,一种基于距离相似度的蛋白质构象空间搜索方法,其中包含以下步骤:
1)给定输入序列信息;
2)参数初始化:设置种群规模Pop_size=200,最大迭代次数Gmax=2000,交叉因子CR=0.2,初始种群搜索轨迹长度iteration=2000,交叉片段长度 fragment=10,变异计数器counter=0,变异计数器的最大计数值 counter_max=180,每个个体xi,i∈{1,2,...,Pop_size}的能量计算选用Rosetta Score3函数即E(xi),温度常数T=1.0,序列间隔num=12,先验知识中目标蛋白残基间的空间距离构成的初始特征向量
V={17.1464,19.129,18.6282,17.9766,18.5772,18.7352,18.3429,18.3492,18.6279, 18.8569,18.5884,18.3507,18.7652,19.0128,15.4944,13.0087,16.5593,16.7067, 12.3491,9.90485,11.2865,13.2189,11.1662,11.5657,16.0647,18.3544,17.7165, 15.4455,19.0615,18.6153,17.9831,18.5417,18.9288,18.5712,17.75,18.3225,18.973, 18.6613,17.6526,14.6372,14.5429,11.9636,11.586,13.0452,13.7966,13.2067, 14.0456,17.2461,18.133,19.1153,20.283,16.4519,18.455,18.2959,18.9458,19.005, 18.3367,18.6687},选择概率Ps=0.5;
3)初始化种群:启动Pop_size条Monte Carlo轨迹,每条轨迹搜索iteration次,即生成Pop_size个初始个体;
4)对每个目标个体xi,i=1,.2..,Pop_size进行如下操作:
4.1)随机选取个体xj,j∈{1,2,...,Pop_size}且j≠i,随机生成rand∈[0,1],若rand≤CR则对个体xi和xj进行如下操作:
4.1.1)随机生成整数begin∈[1,length-fragment]作为交叉起始点,进而得到交叉区间[begin,end],其中begin+fragment=end为交叉终止点;
4.1.2)在交叉区间[begin,end]内依次交换交个体xi和xj相应的扭转角度,生成新个体x′i,x′j
否则x′i=xi,x′j=xj,转至步骤4.2);
4.2)对个体x′i,x′j进行如下的变异操作生成变异个体x″i,x″j
4.2.1)对个体x′i进行片段组装,利用Rosetta Score3函数E(xi)分别计算组装前后的能量值Ei和E′j
4.2.2)利用Monte Carlo机制即根据公式P(ΔE)=min{1,e-ΔE/T}>random判断是否接收该片段的插入,其中random∈[0,1]的随机数,ΔE是个体x′i的在组装前后的能量变化值即ΔE=E′j-Ei
4.2.3)如果接受则转至步骤4.2.5)否则转至4.2.4);
4.2.4)变异计数器counter开始计数;若counter≤counter_max则依次执行步骤4.2.1)、4.2.2)和4.2.3)直到成功变异生成个体x″i为止;否则执行步骤4.2.1)生成变异个体x″i;最后,计数器counter清零;
4.2.5)对个体x′j依次执行步骤4.2.1)、4.2.2)和4.2.3),生成变异个体x″j
4.3)根据目标个体xi和变异个体x″i、x″j的能量和距离相似度进行选择,选出优势个体并更新种群,过程如下:
4.3.1)依次计算出目标个体xi的第k个残基相应的α原子和第k+num个残基相应的α原子之间的欧式距离
Figure GDA0002361193300000081
进而得出目标特征向量
Figure GDA0002361193300000082
4.3.2)计算目标个体xi的距离相似度
Figure GDA0002361193300000083
其中
Figure GDA0002361193300000084
4.3.3)对个体x″i执行步骤4.3.1)得出个体x″i对应的变异特征向量
Figure GDA0002361193300000085
并根据
Figure GDA0002361193300000086
计算出个体x″i相应的距离相似度sim_mutation_1;
4.3.4)对个体x″j依次执行步骤4.3.1)得出个体x″j对应的特变异征向量
Figure GDA0002361193300000087
并根据
Figure GDA0002361193300000088
计算出个体x″j对应的距离相似度sim_mutation_2;
4.3.5)根据Rosetta Score3函数分别计算出目标个体xi和个体x″i、x″j的能量值分别为energy_object,energy_mutation_1,energy_mutation_2;
4.3.6)在个体xi和个体x″i、x″j中,如果某一个体Y∈{xi,x″i,x″j}的能量值和距离相似度均小于其他两个个体的能量值和距离相似度,则该个体为优势个体;如果某一个体Y′∈{xi,x″i,x″j}能量值小于其他两个个体的能量值,则随机生成rand_pro1∈(0,1),如果rand_pro1≤Ps则将该个体设为优势个体;同理,如果某一个体Y″∈{xi,x″i,x″j}的对应相似度是最小的,则随机生成rand_pro2∈(0,1),如果rand_pro2≤Ps则将该个体设为优势个体;最后,优势个体替代目标个体,更新种群;
5)判断是否达到最大迭代代数Gmax,若达到,则输出结果,否则转至步骤4)。
以序列长度为73的α折叠蛋白质1AIL为实施例,运用以上方法得到了该蛋白质的近天然态构象,最小均方根偏差为
Figure GDA0002361193300000091
平均均方根偏差为
Figure GDA0002361193300000092
预测结构如图3所示。
以上说明是本发明以1AIL蛋白质为实例所得出的优化效果,并非限定本发明的实施范围,在不偏离本发明基本内容所涉及范围的前提下对其做各种变形和改进,不应排除在本发明的保护范围之外。

Claims (1)

1.一种基于距离相似度的蛋白质构象空间搜索方法,其特征在于:所述构象空间搜索方法包括以下步骤:
1)给定输入序列信息;
2)参数初始化:设置种群规模Pop_size,最大迭代次数Gmax,交叉因子CR,初始种群搜索轨迹长度iteration,交叉片段长度fragment,变异计数器counter,变异计数器的最大计数值counter_max,每个个体xi,i∈{1,2,...,Pop_size}的能量计算选用Rosetta Score3函数即E(xi),温度常数T,序列间隔num,先验知识中目标蛋白残基间的空间距离构成的初始特征向量V={v1,1+num,…,vk,k+num},k∈[1,length-num],其中vk,k+num是第k个残基相应的α原子和第k+num个残基相应的α原子之间的欧式距离,length为序列长度,选择概率Ps
3)初始化种群:启动Pop_size条Monte Carlo轨迹,每条轨迹搜索iteration次,即生成Pop_size个初始个体;
4)对每个目标个体xi,i=1,.2..,Pop_size进行如下操作:
4.1)随机选取个体xj,j∈{1,2,...,Pop_size}且j≠i,随机生成rand∈[0,1],若rand≤CR,则对个体xi和xj进行如下操作:
4.1.1)随机生成整数begin∈[1,length-fragment]作为交叉起始点,进而得到交叉区间[begin,end],其中begin+fragment=end为交叉终止点;
4.1.2)在交叉区间[begin,end]内依次交换个体xi和xj相应的扭转角度,生成新个体x′i,x′j
否则x′i=xi,x′j=xj,转至步骤4.2)
4.2)对个体x′i,x′j进行如下的变异操作生成变异个体x″i,x″j
4.2.1)对个体x′i进行片段组装,利用Rosetta Score3函数E(xi)分别计算组装前后的能量值Ei和E′j
4.2.2)利用Monte Carlo机制即根据公式P(ΔE)=min{1,e-ΔE/T}>random判断是否接收该片段的插入,其中random∈[0,1]的随机数,ΔE是个体x′i的在组装前后的能量变化值即ΔE=E′j-Ei
4.2.3)如果接受则转至步骤4.2.5)否则转至4.2.4);
4.2.4)变异计数器counter开始计数;若counter≤counter_max则依次执行步骤4.2.1)、4.2.2)和4.2.3)直到成功变异生成个体x″i为止;否则执行步骤4.2.1)生成变异个体x″i;最后,计数器counter清零;
4.2.5)对个体x′j依次执行步骤4.2.1)、4.2.2)和4.2.3),生成变异个体x″j
4.3)根据目标个体xi和变异个体x″i、x″j的能量和距离相似度进行选择,选出优势个体并更新种群,过程如下:
4.3.1)依次计算出目标个体xi的第k个残基相应的α原子和第k+num个残基相应的α原子之间的欧式距离
Figure FDA0002361193290000021
进而得出目标特征向量
Figure FDA0002361193290000022
4.3.2)计算目标个体xi的距离相似度
Figure FDA0002361193290000023
其中
Figure FDA0002361193290000024
4.3.3)对个体x″i执行步骤4.3.1)得出个体x″i对应的变异特征向量
Figure FDA0002361193290000025
并根据
Figure FDA0002361193290000026
计算出个体x″i相应的距离相似度sim_mutation_1;
4.3.4)对个体x″j依次执行步骤4.3.1)得出个体x″j对应的特变异征向量
Figure FDA0002361193290000027
并根据
Figure FDA0002361193290000028
计算出个体x″j
对应的距离相似度sim_mutation_2;
4.3.5)根据Rosetta Score3函数分别计算出目标个体xi和个体x″i、x″j的能量值分别为energy_object,energy_mutation_1,energy_mutation_2;
4.3.6)在个体xi和个体x″i、x″j中,如果某一个体Y∈{xi,x″i,x″j}的能量值和距离相似度均小于其他两个个体的能量值和距离相似度,则该个体为优势个体;如果某一个体Y′∈{xi,x″i,x″j}能量值小于其他两个个体的能量值,则随机生成rand_pro1∈(0,1),如果rand_pro1≤Ps则将该个体设为优势个体;同理,如果某一个体Y″∈{xi,x″i,x″j}的对应相似度是最小的,则随机生成rand_pro2∈(0,1),如果rand_pro2≤Ps则将该个体设为优势个体;最后,优势个体替代目标个体,更新种群;
5)判断是否达到最大迭代代数Gmax,若达到,则输出结果,否则转至步骤4)。
CN201710717391.2A 2017-08-21 2017-08-21 一种基于距离相似度的蛋白质构象空间搜索方法 Active CN107633159B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710717391.2A CN107633159B (zh) 2017-08-21 2017-08-21 一种基于距离相似度的蛋白质构象空间搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710717391.2A CN107633159B (zh) 2017-08-21 2017-08-21 一种基于距离相似度的蛋白质构象空间搜索方法

Publications (2)

Publication Number Publication Date
CN107633159A CN107633159A (zh) 2018-01-26
CN107633159B true CN107633159B (zh) 2020-06-02

Family

ID=61100536

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710717391.2A Active CN107633159B (zh) 2017-08-21 2017-08-21 一种基于距离相似度的蛋白质构象空间搜索方法

Country Status (1)

Country Link
CN (1) CN107633159B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109033744B (zh) * 2018-06-19 2021-08-03 浙江工业大学 一种基于残基距离和接触信息的蛋白质结构预测方法
CN109086566B (zh) * 2018-07-12 2021-06-18 浙江工业大学 一种基于片段重采样的群体蛋白质结构预测方法
CN109086565B (zh) * 2018-07-12 2021-11-23 浙江工业大学 一种基于残基间接触约束的蛋白质结构预测方法
CN109360600B (zh) * 2018-08-28 2021-05-18 浙江工业大学 一种基于残基特征距离的蛋白质结构预测方法
CN109215734B (zh) * 2018-08-28 2021-06-18 浙江工业大学 一种基于多轨迹和残基接触信息的蛋白质结构预测方法
CN109326320B (zh) * 2018-08-29 2021-06-18 浙江工业大学 一种系综构象选择策略自适应的蛋白质结构预测方法
CN109390035B (zh) * 2018-08-29 2021-04-06 浙江工业大学 一种基于局部结构比对的蛋白质构象空间优化方法
CN109215733B (zh) * 2018-08-30 2021-05-18 浙江工业大学 一种基于残基接触信息辅助评价的蛋白质结构预测方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101082944A (zh) * 2007-06-01 2007-12-05 哈尔滨工程大学 基于综合算法的蛋白质折叠过程的计算机模拟方法
CN101436230A (zh) * 2008-12-25 2009-05-20 哈尔滨工程大学 蛋白质折叠仿真中的模蛇方法
CN102402649A (zh) * 2010-09-17 2012-04-04 苏州大学 蛋白质三维结构的预测方法及预测装置
CN104732115A (zh) * 2014-11-25 2015-06-24 浙江工业大学 一种基于简约空间抽象凸下界估计的蛋白质构象优化方法
CN105808973A (zh) * 2016-03-03 2016-07-27 浙江工业大学 一种基于阶段性多策略的群体构象空间采样方法
CN105825075A (zh) * 2016-03-11 2016-08-03 大连大学 基于nga-ts算法的蛋白质结构预测方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030083821A1 (en) * 2001-09-28 2003-05-01 Hannah Eric C. Fast secondary structure discovery method for protein folding
US20050130224A1 (en) * 2002-05-31 2005-06-16 Celestar Lexico- Sciences, Inc. Interaction predicting device
US20070122864A1 (en) * 2003-11-05 2007-05-31 The Regents Of The University Of California Methods for the determination of protein three-dimensional structure employing hydrogen exchange analysis to refine computational structure prediction

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101082944A (zh) * 2007-06-01 2007-12-05 哈尔滨工程大学 基于综合算法的蛋白质折叠过程的计算机模拟方法
CN101436230A (zh) * 2008-12-25 2009-05-20 哈尔滨工程大学 蛋白质折叠仿真中的模蛇方法
CN102402649A (zh) * 2010-09-17 2012-04-04 苏州大学 蛋白质三维结构的预测方法及预测装置
CN104732115A (zh) * 2014-11-25 2015-06-24 浙江工业大学 一种基于简约空间抽象凸下界估计的蛋白质构象优化方法
CN105808973A (zh) * 2016-03-03 2016-07-27 浙江工业大学 一种基于阶段性多策略的群体构象空间采样方法
CN105825075A (zh) * 2016-03-11 2016-08-03 大连大学 基于nga-ts算法的蛋白质结构预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A Population-based Conformational Optimal Algorithm Using Replica-exchange in Ab-initio Protein Structure Prediction;Guijun Zhang 等;《2016 Chinese Control and Decision Conference (CCDC)》;20160808;全文 *
Fa'bio L. Custo'dio 等.Full-Atom Ab Initio Protein Structure Prediction with a Genetic Algorithm using a Similarity-based Surrogate Model.《IEEE Congress on Evolutionary Computation》.2010,全文. *

Also Published As

Publication number Publication date
CN107633159A (zh) 2018-01-26

Similar Documents

Publication Publication Date Title
CN107633159B (zh) 一种基于距离相似度的蛋白质构象空间搜索方法
Deng et al. Protein structure prediction
CN107609342B (zh) 一种基于二级结构空间距离约束的蛋白质构象搜索方法
CN107633157B (zh) 一种基于分布估计和副本交换策略的蛋白质构象空间优化方法
CN108062457B (zh) 一种结构特征向量辅助选择的蛋白质结构预测方法
CN109086566B (zh) 一种基于片段重采样的群体蛋白质结构预测方法
CN108647486B (zh) 一种基于构象多样性策略的蛋白质三维结构预测方法
CN104933327B (zh) 一种局部增强的差分进化蛋白质构象空间搜索方法
CN108846256B (zh) 一种基于残基接触信息的群体蛋白质结构预测方法
CN109360596B (zh) 一种基于差分进化局部扰动的蛋白质构象空间优化方法
CN109101785B (zh) 一种基于二级结构相似性选择策略的蛋白质结构预测方法
CN109378034B (zh) 一种基于距离分布估计的蛋白质预测方法
CN109360598B (zh) 一种基于两阶段采样的蛋白质结构预测方法
CN109300506B (zh) 一种基于特定距离约束的蛋白质结构预测方法
CN109360597B (zh) 一种基于全局和局部策略协作的群体蛋白质结构预测方法
CN108595910B (zh) 一种基于多样性指标的群体蛋白质构象空间优化方法
CN108920894B (zh) 一种基于简约抽象凸估计的蛋白质构象空间优化方法
CN109300505B (zh) 一种基于有偏采样的蛋白质结构预测方法
CN109360600B (zh) 一种基于残基特征距离的蛋白质结构预测方法
CN109300504B (zh) 一种基于多变异精英选择的蛋白质结构预测方法
CN109378033B (zh) 一种基于转移熵的策略自适应蛋白质构象空间优化方法
CN109326319B (zh) 一种基于二级结构知识的蛋白质构象空间优化方法
CN109243525B (zh) 一种基于种群熵的阶段性蛋白质结构预测方法
CN109411013B (zh) 一种基于个体特定变异策略的群体蛋白质结构预测方法
CN109461471B (zh) 一种基于锦标赛机制的自适应蛋白质结构预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant