CN105975806A - 一种基于距离约束副本交换的蛋白质结构预测方法 - Google Patents

一种基于距离约束副本交换的蛋白质结构预测方法 Download PDF

Info

Publication number
CN105975806A
CN105975806A CN201610268630.6A CN201610268630A CN105975806A CN 105975806 A CN105975806 A CN 105975806A CN 201610268630 A CN201610268630 A CN 201610268630A CN 105975806 A CN105975806 A CN 105975806A
Authority
CN
China
Prior art keywords
individual
target
temperature layer
population
trail
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610268630.6A
Other languages
English (en)
Inventor
张贵军
俞旭锋
周晓根
郝小虎
王柳静
张丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201610268630.6A priority Critical patent/CN105975806A/zh
Publication of CN105975806A publication Critical patent/CN105975806A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment

Landscapes

  • Spectroscopy & Molecular Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于距离约束副本交换的蛋白质结构预测方法,首先在每个温度层通过对查询序列进行随机的折叠和变换生成一个初始种群;在种群更新中,以Rosetta Score3为优化目标函数,基于Anfinsen提出的蛋白质天然态结构时自由能最低的结构,在每一个温度层中依次将种群中的每个个体作为目标个体,然后随机选取和目标个体不一样的两个个体进行变异、交叉产生变异个体,再将另一个个体随机选取一段与变异个体进行交换产生测试个体,再将测试个体与目标个体进行能量值比较,对于能量升高的测试个体引入距离谱的知识,将相邻的温度层的对应个体进行副本交换。本发明构象空间采样能力较好、预测精度高。

Description

一种基于距离约束副本交换的蛋白质结构预测方法
技术领域
本发明涉及生物信息学、计算机应用领域,尤其涉及的是一种基于距离约束副本交换的蛋白质结构预测方法。
背景技术
蛋白质分子在生物细胞化学反应过程中起着至关重要的作用。它们的结构模型和生物活性状态对我们理解和治愈多种疾病有重要的意义。蛋白质只有折叠成特定的三维结构才能产生其特有的生物学功能。因此,要了解蛋白质的功能,就必须获得其三维空间结构。
蛋白质三级结构预测是生物信息学的一个重要任务。蛋白质构象优化问题现在面临最大的挑战是对极其复杂的蛋白质能量函数曲面进行搜索。蛋白质能量模型考虑了分子体系成键作用以及范德华力、静电、氢键、疏水等非成键作用,致使其形成的能量曲面极其粗糙,构象对应局部极小解数目随序列长度的增加呈指数增长。而蛋白质构象预测算法能够找到蛋白质稳定结构的机理是,大量的蛋白质亚稳定结构构成了低能量区域,所以能否找到蛋白质全局最稳定结构的关键是算法能够找到大量的蛋白质亚稳定结构,即增加算法的种群多样性。因此,针对更加精确的蛋白质力场模型,选取有效的构象空间优化算法,使新的蛋白质结构预测算法更具有普遍性和高效性成为生物信息学中蛋白质结构预测的焦点问题。
目前,蛋白质结构预测方法大致可以分为两类,基于模板的方法和不基于模板的方法。其中,不基于模板的从头预测(Ab-inito)方法应用最为广泛。它适用于同源性小于25%的大多数蛋白质,仅从序列产生全新结构,对蛋白质分子设计及蛋白质折叠的研究等具有重要意义。当前有以下几种比较成功的从头预测方法:张阳与Jeffrey Skolnick合作的TASSER(Threading/Assembly/Refinement)方法、David Baker及团队设计的Rosetta方法、Shehu等设计的FeLTr方法等。但是到目前还没有一种十分完善的方法来预测蛋白质的三维结构,即使获得了很好的预测结果,但也只是针对某些蛋白质而言的,目前主要的技术瓶颈在于两个方面,第一方面在于采样方法,现有技术对构象空间采样能力不强,另一方面在于构象更新方法,现有技术对构象的更新精度仍然不足。
因此,现有的构象空间优化方法存在采样效率、复杂度及预测精度方面存在不足,需要改进。
发明内容
为了克服现有群体构象空间优化方法的构象空间搜索维数较高、收敛速度较慢、预测精度较低的不足,本发明提出一种构象空间采样能力较好、预测精度高的基于距离约束副本交换的蛋白质结构预测方法。
本发明解决其技术问题所采用的技术方案是:
一种基于距离约束副本交换的蛋白质结构预测方法,所述优化方法包括以下步骤:
1)给定输入序列信息;
2)根据序列信息从QUARK服务器上获取距离谱文件DP,rpk为距离谱中记录下的残基对,Dk为该残基对之间的距离,其中k∈(1,N),N为距离谱中残基对数量;
3)初始化:设置群体规模popSize,交叉概率CR,8个温度层T,能量函数选用Rosetta Score3,首先在每个温度层通过对查询序列随机的折叠和变换,生成一个规模为popSize的初始种群,初始群体为PT={xi|i∈I},计算能量函数值fT(xi),i∈I,并设其中i为种群个体编号,I为种群个体编号集合,I={1,2,...,popSize},为对应温度层能量函数值中的最小值,T为温度层;
4)开始迭代,依次对每个温度层种群中的每个个体进行以下操作:
4.1)设i=1,其中i∈{1,2,3,…,NP};令Ptarget=Pi,其中i为序号,Ptarget表示目标个体;
4.2)随机生成正整数rand1,rand2,rand3∈{1,2,3,......NP},且rand1≠rand2≠rand3≠i;再生成4个随机整数randrange1,randrange2,randrange3,randrange4;其中randrange1≠randrange2,randrange3≠randrange4∈{1,2,…,Length},Length为序列长度;
4.3)针对个体Prand1做变异操作;
4.3.1)令a=min(randrange1,randrange2),b=max(randrange1,randrange2),k∈[a,b];令c=min(randrange3,randrange4),d=max(randrange3,randrange4),p∈[c,d];其中min表示取两个数的最小值,max表示取两个数的最大值;
4.3.2)用Prand2上位置a到位置b的片段的氨基酸所对应的二面角phi、psi、omega替换Prand1的相同位置所对应的二面角phi、psi、omega;再使用Prand3上位置c到位置d的片段的氨基酸所对应的二面角phi、psi、omega替换Prand1上相同位置所对应的二面角phi、psi、omega,再将所得Prand1进行片段组装得到变异个体Pmutant
4.4)针对变异个体Pmutant做交叉操作;
4.4.1)生成随机数rand4,rand5,其中rand4∈(0,1),rand5∈(1,Length);
4.4.2)若随机数rand4<=CR,则使用目标个体Ptarget的片段rand5替换变异个体Pmutant中对应的片段生成测试个体Ptrail,否则Ptrail直接等于变异个体Pmutant
4.5)针对每个温度层中的目标个体Ptarget和测试个体Ptrail进行选择操作;
4.5.1)计算Ptarget和Ptrail的能量:E(Ptarget)和E(Ptrail);
4.5.2)若E(Ptarget)>E(Ptrail)则用Ptrail替换Ptarget,并且进入4.6);否则继续执行4.5.3);
4.5.3)计算目标个体Ptarget和测试个体Ptrail在残基对rpi的距离相对于距离谱中Di之间的距离差
4.5.4)判断的值,若大于6,则令其等于6,从而去除一些距离差值较大的异常数值;
4.5.5)计算距离谱中所有位置的目标个体和测试个体的距离差值总和 &dtri; D t arg e t = &Sigma; i = 1 N &dtri; targetD i , &dtri; D t r a i l = &Sigma; i = 1 N &dtri; trailD i ;
4.5.6)若则进入5);
4.5.7)若则产生一个(0,1)之间的随机数rand6,若rand6小于0.2,则用Ptrail替换Ptarget,否则进行5);
5)在每个温度层都进行变异、交叉和选择更新完种群后,将相邻的温度层的对应个体进行副本交换:
5.1)首先选择种群中第i个个体,i∈I(i=1,2,…,popSize);
5.2)选择两个相邻的温度层Tj和Tj+1,j=1,2,…,7;
5.3)产生一个随机数randx∈(0,1),和判别数judge
j u d g e = e ( 1 ( K &times; ( T j + I ) ) - 1 K &times; T j ) &times; ( f ( x T j + 1 i ) - f ( x T j i ) ) ) - - - ( 1 )
其中(i=1,2,···,popSize)为种群个体的能量值,K为玻尔兹曼常数,Tj(j=1,2,…,7)为第j个温度层的开尔文温度,j为索引编号,e为自然常数;
5.4)若randx<judge,将相邻温度层中的个体进行交换;
6)判断是否满足终止条件,如不满足则转至4);若满足则输出结果。
进一步,所述步骤3)中,设置最大迭代次数iteration;所述步骤6)中,对每个温度层种群中的每个个体都执行完步骤4)-5)以后,迭代次数G=G+1,终止条件为迭代次数G达到预设最大迭代次数iteration。
本发明的技术构思为:在基本DE算法的框架下,首先在每个温度层通过对查询序列进行随机的折叠和变换生成一个初始种群;在种群更新中,以Rosetta Score3为优化目标函数,基于Anfinsen提出的蛋白质天然态结构时自由能最低的结构,在每一个温度层中依次将种群中的每个个体作为目标个体,然后随机选取和目标个体不一样的两个个体进行变异、交叉产生变异个体,再将另一个个体随机选取一段与变异个体进行交换产生测试个体,再将测试个体与目标个体进行能量值比较,对于能量升高的测试个体引入距离谱的知识,使得种群中保留能量虽高但结构更为合理的构象。在更新完种群后,将相邻两个温度层之间种群个体进行副本交换来增加种群的多样性,通过不断更新种群以及副本交换获得一系列亚稳态构象。本发明提供了一种预测精度较高、复杂度较低的构象空间优化方法。
附图说明:
图1是测试序列2IMU在种群更新过程中RMSD和能量值的关系示意图。
图2是测试序列2IMU在本算法预测所得诱导构象与基本差分进化预测所得构象的采样概率分布图。
具体实施方式:
下面结合附图对本发明作进一步描述。
参照图1和图2,一种基于距离约束副本交换的蛋白质结构预测方法,所述构象空间优化方法包括以下步骤:
1)给定输入序列信息;
2)根据序列信息从QUARK服务器上获取距离谱文件DP,rpk为距离谱中记录下的残基对,Dk为该残基对之间的距离,其中k∈(1,N),N为距离谱中残基对数量;
3)初始化:设置群体规模popSize,交叉概率CR,8个温度层T,能量函数选用Rosetta Score3,首先在每个温度层通过对查询序列随机的折叠和变换,生成一个规模为popSize的初始种群,初始群体为PT={xi|i∈I},计算能量函数值fT(xi),i∈I,并设其中i为种群个体编号,I为种群个体编号集合,I={1,2,...,popSize},为对应温度层能量函数值中的最小值,T为温度层;
4)开始迭代,依次对每个温度层种群中的每个个体进行以下操作:
4.1)设i=1,其中i∈{1,2,3,…,NP};令Ptarget=Pi,其中i为序号,Ptarget表示目标个体;
4.2)随机生成正整数rand1,rand2,rand3∈{1,2,3,......NP},且rand1≠rand2≠rand3≠i;再生成4个随机整数randrange1,randrange2,randrange3,randrange4;其中randrange1≠randrange2,randrange3≠randrange4∈{1,2,…,Length},Length为序列长度;
4.3)针对个体Prand1做变异操作;
4.3.1)令a=min(randrange1,randrange2),b=max(randrange1,randrange2),k∈[a,b];令c=min(randrange3,randrange4),d=max(randrange3,randrange4),p∈[c,d];其中min表示取两个数的最小值,max表示取两个数的最大值;
4.3.2)用Prand2上位置a到位置b的片段的氨基酸所对应的二面角phi、psi、omega替换Prand1的相同位置所对应的二面角phi、psi、omega;再使用Prand3上位置c到位置d的片段的氨基酸所对应的二面角phi、psi、omega替换Prand1上相同位置所对应的二面角phi、psi、omega,再将所得Prand1进行片段组装得到变异个体Pmutant
4.4)针对变异个体Pmutant做交叉操作;
4.4.1)生成随机数rand4,rand5,其中rand4∈(0,1),rand5∈(1,Length);
4.4.2)若随机数rand4<=CR,则使用目标个体Ptarget的片段rand5替换变异个体Pmutant中对应的片段生成测试个体Ptrail,否则Ptrail直接等于变异个体Pmutant;;
4.5)针对每个温度层中的目标个体Ptarget和测试个体Ptrail进行选择操作;
4.5.1)计算Ptarget和Ptrail的能量:E(Ptarget)和E(Ptrail);
4.5.2)若E(Ptarget)>E(Ptrail)则用Ptrail替换Ptarget,并且进入4.6);否则继续执行4.5.3);
4.5.3)计算目标个体Ptarget和测试个体Ptrail在残基对rpi的距离相对于距离谱中Di之间的距离差
4.5.4)判断的值,若大于6,则令其等于6,从而去除一些距离差值较大的异常数值;
4.5.5)计算距离谱中所有位置的目标个体和测试个体的距离差值总和 &dtri; D t arg e t = &Sigma; i = 1 N &dtri; targetD i , &dtri; D t r a i l = &Sigma; i = 1 N &dtri; trailD i ;
4.5.6)若则进入5);
4.5.7)若则产生一个(0,1)之间的随机数rand6,若rand6小于0.2,则用Ptrail替换Ptarget,否则进行5);
5)在每个温度层都进行变异、交叉和选择更新完种群后,将相邻的温度层的对应个体进行副本交换:
5.1)首先选择种群中第i个个体,i∈I(i=1,2,…,popSize);
5.2)选择两个相邻的温度层Tj和Tj+1,j=1,2,…,7;
5.3)产生一个随机数randx∈(0,1),和判别数judge
j u d g e = e ( 1 ( K &times; ( T j + I ) ) - 1 K &times; T j ) &times; ( f ( x T j + 1 i ) - f ( x T j i ) ) ) - - - ( 1 )
其中(i=1,2,···,popSize)为种群个体的能量值,K为玻尔兹曼常数,Tj(j=1,2,…,7)为第j个温度层的开尔文温度,j为索引编号,e为自然常数;
5.4)若randx<judge,将相邻温度层中的个体进行交换;
6)判断是否满足终止条件到达迭代次数iteration,如不满足则转至4);若满足则输出结果。
进一步,所述步骤3)中,设置最大迭代次数iteration;所述步骤6)中,对每个温度层种群中的每个个体都执行完步骤4)-5)以后,迭代次数G=G+1,终止条件为迭代次数G达到预设最大迭代次数iteration。
本实施例以序列长度为46的蛋白质2IMU为实施例,一种基于距离约束副本交换的蛋白质结构预测方法,其中包含以下步骤:
1)输入蛋白质序列2IMU;
2)根据序列信息从QUARK服务器上获取距离谱文件DP,rpk为距离谱中记录下的残基对,Dk为该残基对之间的距离,其中k∈(1,N),N为距离谱中残基对数量,测试序列2IMU的距离谱的N=38;
3)初始化:设置群体规模popSize=50,交叉概率CR=0.5,8个温度层T,每个温度层的温度参数分别为200,239,286,342,409,489,585,700,单位为开尔文,最大迭代次数iteration=10000,能量函数选用Rosetta Score3,首先在每个温度层通过对查询序列随机的折叠和变换,生成一个规模为popSize的初始种群,初始群体为PT={xi|i∈I},计算能量函数值fT(xi),i∈I,并设其中i为种群个体编号,I为种群个体编号集合,I={1,2,...,popSize},为对应温度层能量函数值中的最小值,T为温度层;
4)开始迭代,依次对每个温度层种群中的每个个体进行以下操作:
4.1)设i=1,其中i∈{1,2,3,…,NP};令Ptarget=Pi,其中i为序号,Ptarget表示目标个体;
4.2)随机生成正整数rand1,rand2,rand3∈{1,2,3,......NP},且rand1≠rand2≠rand3≠i;再生成4个随机整数randrange1,randrange2,randrange3,randrange4;其中randrange1≠randrange2,randrange3≠randrange4∈{1,2,…,Length},Length为序列长度;
4.3)针对个体Prand1做变异操作;
4.3.1)令a=min(randrange1,randrange2),b=max(randrange1,randrange2),k∈[a,b];令c=min(randrange3,randrange4),d=max(randrange3,randrange4),p∈[c,d];其中min表示取两个数的最小值,max表示取两个数的最大值;
4.3.2)用Prand2上位置a到位置b的片段的氨基酸所对应的二面角phi、psi、omega替换Prand1的相同位置所对应的二面角phi、psi、omega;再使用Prand3上位置c到位置d的片段的氨基酸所对应的二面角phi、psi、omega替换Prand1上相同位置所对应的二面角phi、psi、omega,再将所得Prand1进行片段组装得到变异个体Pmutant
4.4)针对变异个体Pmutant做交叉操作;
4.4.1)生成随机数rand4,rand5,其中rand4∈(0,1),rand5∈(1,Length);
4.4.2)若随机数rand4<=CR,则使用目标个体Ptarget的片段rand5替换变异个体Pmutant中对应的片段生成测试个体Ptrail,否则Ptrail直接等于变异个体Pmutant
4.5)针对每个温度层中的目标个体Ptarget和测试个体Ptrail进行选择操作;
4.5.1)计算Ptarget和Ptrail的能量:E(Ptarget)和E(Ptrail);
4.5.2)若E(Ptarget)>E(Ptrail)则用Ptrail替换Ptarget,并且进入4.6);否则继续执行4.5.3);
4.5.3)计算目标个体Ptarget和测试个体Ptrail在残基对rpi的距离相对于距离谱中Di之间的距离差
4.5.4)判断的值,若大于6,则令其等于6,从而去除一些距离差值较大的异常数值;
4.5.5)计算距离谱中所有位置的目标个体和测试个体的距离差值总和 &dtri; D t arg e t = &Sigma; i = 1 N &dtri; targetD i , &dtri; D t r a i l = &Sigma; i = 1 N &dtri; trailD i ;
4.5.6)若则进入5);
4.5.7)若则产生一个(0,1)之间的随机数rand6,若rand6小于0.2,则用Ptrail替换Ptarget,否则进行5);
5)在每个温度层都进行变异、交叉和选择更新完种群后,将相邻的温度层的对应个体进行副本交换:
5.1)首先选择种群中第i个个体,i∈I(i=1,2,…,popSize);
5.2)选择两个相邻的温度层Tj和Tj+1,j=1,2,…,7;
5.3)产生一个随机数randx∈(0,1),和判别数judge
j u d g e = e ( 1 ( K &times; ( T j + I ) ) - 1 K &times; T j ) &times; ( f ( x T j + 1 i ) - f ( x T j i ) ) ) - - - ( 1 )
其中(i=1,2,···,popSize)为种群个体的能量值,K为玻尔兹曼常数,Tj(j=1,2,…,7)为第j个温度层的开尔文温度,j为索引编号,e为自然常数;
5.4)若randx<judge,将相邻温度层中的个体进行交换;
6)对每个温度层种群中的每个个体都执行完步骤4)-5)以后,迭代次数G=G+1,终止条件为迭代次数G达到预设最大迭代次数iteration,判断是否满足终止条件,如不满足则转至4);若满足则输出结果。
以上阐述的是本发明给出的一个实施例表现出来的优良效果,显然本发明不仅适合上述实施例,在不偏离本发明基本精神及不超出本发明实质内容所涉及内容的前提下可对其做种种变化加以实施。

Claims (2)

1.一种基于距离约束副本交换的蛋白质结构预测方法,其特征在于:所述预测方法包括以下步骤:
1)给定输入序列信息;
2)根据序列信息从QUARK服务器上获取距离谱文件DP,rpk为距离谱中记录下的残基对,Dk为该残基对之间的距离,其中k∈(1,N),N为距离谱中残基对数量;
3)初始化:设置群体规模popSize,交叉概率CR,8个温度层T,能量函数选用RosettaScore3,首先在每个温度层通过对查询序列随机的折叠和变换,生成一个规模为popSize的初始种群,初始群体为PT={xi|i∈I},计算能量函数值fT(xi),i∈I,并设其中i为种群个体编号,I为种群个体编号集合,I={1,2,...,popSize},为对应温度层能量函数值中的最小值,T为温度层;
4)开始迭代,依次对每个温度层种群中的每个个体进行以下操作:
4.1)设i=1,其中i∈{1,2,3,…,NP};令Ptarget=Pi,其中i为序号,Ptarget表示目标个体;
4.2)随机生成正整数rand1,rand2,rand3∈{1,2,3,......NP},且rand1≠rand2≠rand3≠i;再生成4个随机整数randrange1,randrange2,randrange3,randrange4;其中randrange1≠randrange2,randrange3≠randrange4∈{1,2,…,Length},Length为序列长度;
4.3)针对个体Prand1做变异操作;
4.3.1)令a=min(randrange1,randrange2),b=max(randrange1,randrange2),k∈[a,b];令c=min(randrange3,randrange4),d=max(randrange3,randrange4),p∈[c,d];其中min表示取两个数的最小值,max表示取两个数的最大值;
4.3.2)用Prand2上位置a到位置b的片段的氨基酸所对应的二面角phi、psi、omega替换Prand1的相同位置所对应的二面角phi、psi、omega;再使用Prand3上位置c到位置d的片段的氨基酸所对应的二面角phi、psi、omega替换Prand1上相同位置所对应的二面角phi、psi、omega,再将所得Prand1进行片段组装得到变异个体Pmutant
4.4)针对变异个体Pmutant做交叉操作;
4.4.1)生成随机数rand4,rand5,其中rand4∈(0,1),rand5∈(1,Length);
4.4.2)若随机数rand4<=CR,则使用目标个体Ptarget的片段rand5替换变异个体Pmutant中对应的片段生成测试个体Ptrail,否则Ptrail直接等于变异个体Pmutant
4.5)针对每个温度层中的目标个体Ptarget和测试个体Ptrail进行选择操作;
4.5.1)计算Ptarget和Ptrail的能量:E(Ptarget)和E(Ptrail);
4.5.2)若E(Ptarget)>E(Ptrail)则用Ptrail替换Ptarget,并且进入4.6);否则继续执行4.5.3);
4.5.3)计算目标个体Ptarget和测试个体Ptrail在残基对rpi的距离相对于距离谱中Di之间的距离差▽targetDi和▽trailDi
4.5.4)判断▽targetDi和▽trailDi的值,若大于6,则令其等于6,从而去除一些距离差值较大的异常数值;
4.5.5)计算距离谱中所有位置的目标个体和测试个体的距离差值总和
&dtri; D t arg e t = &Sigma; i = 1 N &dtri; targetD i , &dtri; D t r a i l = &Sigma; i = 1 N &dtri; trailD i ;
4.5.6)若▽Dtrail>▽Dtarget,则进入5);
4.5.7)若▽Dtrail<▽Dtarget,则产生一个(0,1)之间的随机数rand6,若rand6小于0.2,则用Ptrail替换Ptarget,否则进行5);
5)在每个温度层都进行变异、交叉和选择更新完种群后,将相邻的温度层的对应个体进行副本交换:
5.1)首先选择种群中第i个个体,i∈I(i=1,2,…,popSize);
5.2)选择两个相邻的温度层Tj和Tj+1,j=1,2,…,7;
5.3)产生一个随机数randx∈(0,1),和判别数judge
j u d g e = e ( 1 ( K &times; ( T j + I ) ) - 1 K &times; T j ) &times; ( f ( x T j + 1 i ) - f ( x T j i ) ) ) - - - ( 1 )
其中,(i=1,2,···,popSize)为种群个体的能量值,K为玻尔兹曼常数,Tj(j=1,2,…,7)为第j个温度层的开尔文温度,j为索引编号,e为自然常数;
5.4)若randx<judge,将相邻温度层中的个体进行交换;
6)判断是否满足终止条件,如不满足则转至4);若满足则输出结果。
2.如权利要求1所述的一种基于距离约束副本交换的蛋白质结构预测方法,其特征在于:所述步骤3)中,设置最大迭代次数iteration;所述步骤6)中,对每个温度层种群中的每个个体都执行完步骤4)-5)以后,迭代次数G=G+1,终止条件为迭代次数G达到预设最大迭代次数iteration。
CN201610268630.6A 2016-04-26 2016-04-26 一种基于距离约束副本交换的蛋白质结构预测方法 Pending CN105975806A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610268630.6A CN105975806A (zh) 2016-04-26 2016-04-26 一种基于距离约束副本交换的蛋白质结构预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610268630.6A CN105975806A (zh) 2016-04-26 2016-04-26 一种基于距离约束副本交换的蛋白质结构预测方法

Publications (1)

Publication Number Publication Date
CN105975806A true CN105975806A (zh) 2016-09-28

Family

ID=56993120

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610268630.6A Pending CN105975806A (zh) 2016-04-26 2016-04-26 一种基于距离约束副本交换的蛋白质结构预测方法

Country Status (1)

Country Link
CN (1) CN105975806A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107633157A (zh) * 2017-08-29 2018-01-26 浙江工业大学 一种基于分布估计和副本交换策略的蛋白质构象空间优化方法
CN109002691A (zh) * 2018-07-12 2018-12-14 浙江工业大学 一种基于玻尔兹曼更新策略的蛋白质结构预测方法
CN109300506A (zh) * 2018-08-29 2019-02-01 浙江工业大学 一种基于特定距离约束的蛋白质结构预测方法
CN109378034A (zh) * 2018-08-28 2019-02-22 浙江工业大学 一种基于距离分布估计的蛋白质预测方法
CN109461472A (zh) * 2018-08-30 2019-03-12 浙江工业大学 一种基于副本交换和有偏分布估计的蛋白质构象空间优化方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104200130A (zh) * 2014-07-23 2014-12-10 浙江工业大学 一种基于树结构副本交换和片段组装的蛋白质结构预测方法
CN104866733A (zh) * 2015-04-03 2015-08-26 浙江工业大学 一种基于副本交换的群体构象空间优化方法
CN104933328A (zh) * 2015-06-08 2015-09-23 浙江工业大学 一种基于副本交换的变步长蛋白质构象空间搜索方法
CN104951670A (zh) * 2015-06-08 2015-09-30 浙江工业大学 一种基于距离谱的群体构象空间优化方法
CN105046101A (zh) * 2015-06-08 2015-11-11 浙江工业大学 一种基于副本交换和局部增强策略的群体构象空间搜索方法
CN105205348A (zh) * 2015-09-22 2015-12-30 浙江工业大学 一种基于距离约束选择策略的群体构象空间优化方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104200130A (zh) * 2014-07-23 2014-12-10 浙江工业大学 一种基于树结构副本交换和片段组装的蛋白质结构预测方法
CN104866733A (zh) * 2015-04-03 2015-08-26 浙江工业大学 一种基于副本交换的群体构象空间优化方法
CN104933328A (zh) * 2015-06-08 2015-09-23 浙江工业大学 一种基于副本交换的变步长蛋白质构象空间搜索方法
CN104951670A (zh) * 2015-06-08 2015-09-30 浙江工业大学 一种基于距离谱的群体构象空间优化方法
CN105046101A (zh) * 2015-06-08 2015-11-11 浙江工业大学 一种基于副本交换和局部增强策略的群体构象空间搜索方法
CN105205348A (zh) * 2015-09-22 2015-12-30 浙江工业大学 一种基于距离约束选择策略的群体构象空间优化方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107633157A (zh) * 2017-08-29 2018-01-26 浙江工业大学 一种基于分布估计和副本交换策略的蛋白质构象空间优化方法
CN107633157B (zh) * 2017-08-29 2020-10-27 浙江工业大学 一种基于分布估计和副本交换策略的蛋白质构象空间优化方法
CN109002691A (zh) * 2018-07-12 2018-12-14 浙江工业大学 一种基于玻尔兹曼更新策略的蛋白质结构预测方法
CN109002691B (zh) * 2018-07-12 2021-11-23 浙江工业大学 一种基于玻尔兹曼更新策略的蛋白质结构预测方法
CN109378034A (zh) * 2018-08-28 2019-02-22 浙江工业大学 一种基于距离分布估计的蛋白质预测方法
CN109378034B (zh) * 2018-08-28 2021-06-18 浙江工业大学 一种基于距离分布估计的蛋白质预测方法
CN109300506A (zh) * 2018-08-29 2019-02-01 浙江工业大学 一种基于特定距离约束的蛋白质结构预测方法
CN109300506B (zh) * 2018-08-29 2021-05-18 浙江工业大学 一种基于特定距离约束的蛋白质结构预测方法
CN109461472A (zh) * 2018-08-30 2019-03-12 浙江工业大学 一种基于副本交换和有偏分布估计的蛋白质构象空间优化方法
CN109461472B (zh) * 2018-08-30 2021-02-26 浙江工业大学 一种基于副本交换和有偏分布估计的蛋白质构象空间优化方法

Similar Documents

Publication Publication Date Title
CN105975806A (zh) 一种基于距离约束副本交换的蛋白质结构预测方法
Chen et al. Alchemy: A quantum chemistry dataset for benchmarking ai models
Cruz et al. RNA-Puzzles: a CASP-like evaluation of RNA three-dimensional structure prediction
CN105205348A (zh) 一种基于距离约束选择策略的群体构象空间优化方法
Mielniczuk et al. Stopping rules for mutual information-based feature selection
CN105760710A (zh) 一种基于两阶段差分进化算法的蛋白质结构预测方法
CN106055920B (zh) 一种基于阶段性多策略副本交换的蛋白质结构预测方法
Hua et al. Mudiff: Unified diffusion for complete molecule generation
CN104866733A (zh) 一种基于副本交换的群体构象空间优化方法
CN106096326A (zh) 一种基于质心变异策略的差分进化蛋白质结构预测方法
Heaps et al. Bayesian modelling of compositional heterogeneity in molecular phylogenetics
CN104951670A (zh) 一种基于距离谱的群体构象空间优化方法
Pollastri et al. Modular dag–rnn architectures for assembling coarse protein structures
Wu et al. Evolutionary multitasking for bidirectional adaptive codec: A case study on vehicle routing problem with time windows
US6370479B1 (en) Method and apparatus for extracting and evaluating mutually similar portions in one-dimensional sequences in molecules and/or three-dimensional structures of molecules
Bhambri et al. A novel method for the design of phylogenetic tree
Katsoulakis et al. Coarse-graining schemes for stochastic lattice systems with short and long-range interactions
Kress et al. Low-order moment expansions to tight binding for interatomic potentials: Successes and failures
Einav et al. Quantitatively visualizing bipartite datasets
Tan et al. Cross-Gate MLP with Protein Complex Invariant Embedding is A One-Shot Antibody Designer
Wang et al. A Method For The RNA-Protein Complexes Recognition
CN116758977A (zh) 一种基于活性片段的靶向配体生成方法
Zerihun RNA structure prediction guided by co-evolutionary information-method development and applications
Vullo et al. A bi-recursive neural network architecture for the prediction of protein coarse contact maps
Li et al. Long-Short-Range Message-Passing: A Fragmentation-Based Framework to Capture Non-Local Atomistic Interactions

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160928

RJ01 Rejection of invention patent application after publication