CN107633157B - 一种基于分布估计和副本交换策略的蛋白质构象空间优化方法 - Google Patents

一种基于分布估计和副本交换策略的蛋白质构象空间优化方法 Download PDF

Info

Publication number
CN107633157B
CN107633157B CN201710756001.2A CN201710756001A CN107633157B CN 107633157 B CN107633157 B CN 107633157B CN 201710756001 A CN201710756001 A CN 201710756001A CN 107633157 B CN107633157 B CN 107633157B
Authority
CN
China
Prior art keywords
probability
fragment
individuals
total
individual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710756001.2A
Other languages
English (en)
Other versions
CN107633157A (zh
Inventor
张贵军
王小奇
郝小虎
周晓根
谢腾宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201710756001.2A priority Critical patent/CN107633157B/zh
Publication of CN107633157A publication Critical patent/CN107633157A/zh
Application granted granted Critical
Publication of CN107633157B publication Critical patent/CN107633157B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于分布估计和副本交换策略的蛋白质构象空间优化方法。在遗传算法的基本框架下,首先,在每个副本层启动多条Monte Carlo轨迹形成初始化种群,利用分布估计策略构建残基采样概率分布模型和片段搜索概率分布模型;然后,根据构建的概率分布模型指导个体的空间采样产生新变异个体,并按设定的交叉概率进行交叉,根据能量值选择优势个体更新种群;最后,对相邻副本层的个体进行副本交换,从而有效地增强了构象的多样性,最终得到一系列近天然态的构象。本发明提出一种预测精度高、计算代价低的基于分布估计和副本交换策略的蛋白质构象空间优化方法。

Description

一种基于分布估计和副本交换策略的蛋白质构象空间优化 方法
技术领域
本发明涉及一种生物学信息学、人工智能优化、计算机应用领域,尤其涉及的是,一种基于分布估计和副本交换策略的蛋白质构象空间优化方法。
背景技术
生物学研究表明,特定的氨基酸序列通过紧密的折叠形成特定的三维结构,并且蛋白质的作用机制及生物功能主要取决于蛋白质的空间结构信息。因此,预测蛋白质的三维结构是生物学领域的一项重要课题。
根据Anfinsen法则,可以以蛋白质的氨基酸序为起点预测其三维结构。在理论探索和应用需求的双重推动下,结合信息技术的蛋白质三级结构预测方法自20世纪末蓬勃发展。基于模板的结构预测方法和从头预测法是目前最为主要的两种方法;其中基于模板的结构预测方法包括同源建模法和穿线法,虽然这两种方法简单易操作、预测精度高,但都需要PDB数据库中已知的蛋白质结构作为模板,因此这两种方法都不能得到全新的结构。与之相比,从头预测法不需要任何已知结构信息,直接基于Anfinsen法则建立蛋白质知识能量模型,然后,再通过相应的构象搜索优化方法搜寻得到目标蛋白的天然结构。
现有技术公开了使用差分进化算法、模拟退火算法等算法应用于力场模型的优化,对蛋白质三维结构进行预测。这些算法虽然结构简单,易于实现,收敛速度快,但是,这些算法的预测精度较低以及解的不确定性,限制了它们在实际问题中的应用。
因此,现有的构象空间优化方法在预测精度和采样效率方面存在着缺陷,需要改进。
发明内容
为了克服现有的蛋白质结构预测构象空间优化方法采样效率和预测精度低的缺点,本发明提出一种基于分布估计和副本交换策略的蛋白质构象空间优化方法。
本发明解决其技术问题所采用的技术方案是:
一种基于分布估计和副本交换策略的蛋白质构象空间优化方法,所述方法包括以下步骤:
1)输入序列信息;
2)参数初始化:设置种群规模NP,确定交叉率Pc,初始种群迭代次数iteration,选用Rosetta Score3能量函数E(xi),xi为个体,i=1,2,...,NP,概率模型选择常数λ,δ,μ,τ,副本层数I,第一个副本层温度常数T1,温度梯度k∈(0,1);
3)构建概率分布模型:在每个副本层,启动NP条Monte Carlo轨迹,每条轨迹搜索iteration次,即完成种群初始化,同时完成概率模型的构建,过程如下:
3.1)在每次迭代中,统计每个个体xi的残基position被成功采样的次数
Figure BDA0001392175450000021
根据公式
Figure BDA0001392175450000022
得到个体xi的残基position被采样的总次数,其中,
Figure BDA0001392175450000023
是当前个体,t是当前迭代次数,由此得到残基position被采样的概率;
3.2)迭代结束后,根据公式
Figure BDA0001392175450000024
计算出个体xi中残基position总的采样的概率,并构建残基采样概率分布模型M={P1,P2,P3,…,Plast},last=residue_total-9,其中residue_total是片段总长度;
3.3)在每次迭代中,根据公式
Figure BDA0001392175450000025
得到残基position处每个片段被接受的次数
Figure BDA0001392175450000026
3.4)迭代结束后,根据公式
Figure BDA0001392175450000027
计算出每个片段被接受的概率,其中P′frag_key是在采样中片段frag_key被接受的概率,其中
Figure BDA0001392175450000028
代表个体xi中残基position对应的片段frag_key被接受的总次数,构建片段采样概率分布模型Γ={P′1,P′2,...,P′frag_total},其中frag_total是片段库中每个窗口拥有的片段总数;
4)在每个副本层对初始种群中的每个个体进行如下操作:
4.1)根据建立的概率模型对每个目标个体xi和随机选取的个体xj,j∈(j=1,...,NP)且j≠i进行变异操作,过程如下:
4.1.1)根据残基采样概率分布模型M指导残基位置的采样,即随机选择残基位置position,如果Pposition∈[a,b]则则转至步骤4.1.3),否则按设定的概率δ进行采样,其中b为残基采样概率分布模型M中最大的采样概率,即b=max{P1,P2,...,Pl},a=λ*b,l是目标序列的最后一个片段插入点;
4.1.2)根据片段搜索概率分布模型Γ指导片段空间的选择,即残基位置position确定后,在片段库中随机选择一个相应的片段,如果该片段的分布概率满足Pfrag_key∈[c,d],则转至步骤4.1.3),否则按设定的概率μ进行采样,其中d=max{P′1,P′2,...,P′frag_total},c=τd;
4.1.3)生成变异个体x′i和x′j
4.2)对变异生成的新个体′i,x′j按概率Pc对个体x′i和x′j进行如下操作:
4.2.1)随机选择交叉起始点cross_begin,1≤cross_begin≤total_residue-frag_length和交叉片段长度frag_length,frag_length∈[3,10]的随机数,其中total_residue为残基总数,根据公式cross_begin+frag_length=cross_end确定出交叉终止点cross_end;
4.2.2)交换个体x′i和x′j在每个交叉位点position_cross,frag_length≤position_cross≤cross_end处的扭转角,分别生成新个体x″i,x″j
4.3)根据Rosetta Score3函数E(xi)分别计算目标个体xi和变异个体x″i、x″j的能量E(xi)、E(x″i)和E(x″j);
4.4)若E(xi)>min{E(x″i),E(x″j)}则用变异个体x″i和x″j中能量较小者替代目标个体xi,即更新种群,否则种群保持不变;
5)当所有副本层的种群都完成一次更新,进行副本交换操作,过程如下:
5.1)随机选择两个相邻的温度层Tj和Tj+1,j=1,2,...,I-1;
5.2)选择交换个体
Figure BDA0001392175450000041
Figure BDA0001392175450000042
其中i=1,2,...,NP,j=1,2,...,I-1;
5.3)根据公式
Figure BDA0001392175450000043
计算交换判别因子,其中,kB是波尔兹曼常数,Tj=T1-(j-1)*k是为第j个温度层的开尔文温度,
Figure BDA0001392175450000044
为种群个体
Figure BDA0001392175450000045
的能量值;
5.4)产生一个随机数Pm∈(0,1),若Pm<judge,则,将相邻温度层中的个体
Figure BDA0001392175450000046
Figure BDA0001392175450000047
进行交换;
6)判断是否满足终止条件,如不满足则转至4);如满足终止条件,则输出结果。
进一步,所述步骤2)中,设置最大迭代代数Gmax,所述步骤6)中,终止条件为种群迭代次数到达最大迭代次数Gmax
本发明的技术构思为:在遗传算法的基本框架下,首先,在每个副本层启动多条Monte Carlo轨迹形成初始化种群,利用分布估计策略构建残基采样概率分布模型和片段搜索概率分布模型;然后,根据构建的概率分布模型指导个体的空间采样产生新变异个体,并按设定的交叉概率进行交叉、根据能量选择优势个体更新种群;最后,对相邻副本层的个体进行副本交换,从而有效地增强了构象的多样性,最终得到一系列近天然态的构象。
本发明的有益效果表现在:一方面,根据分布估计策略建立了概率分布模型,因此不需要修改片段库就可以实现片段的有效选择,从而不仅可以提高采样效率,而且增加了算法的预测精度;另一方面,在遗传算法的框架下,利用副本交换策略有效的增强了种群的多样性。
附图说明
图1是基于分布估计和副本交换策略的蛋白质构象空间优化方法的基本流程图。
图2是基于分布估计和副本交换策略的蛋白质构象空间优化方法对蛋白质1AIL进行结构预测时的构象更新示意图。
图3是基于分布估计和副本交换策略的蛋白质构象空间优化方法对蛋白质1AIL进行结构预测得到的三维结构图。
下面结合附图对本发明作进一步描述。
参照图1,一种基于分布估计和副本交换策略的蛋白质构象空间优化方法,所述方法包括以下步骤:
1)输入序列信息;
2)参数初始化:设置种群规模NP,确定交叉率Pc,初始种群迭代次数iteration,选用Rosetta Score3能量函数E(xi),xi为个体,i=1,2,...,NP,概率模型选择常数λ,δ,μ,τ,副本层数I,第一个副本层温度常数T1,温度梯度k∈(0,1);
3)构建概率分布模型:在每个副本层,启动NP条Monte Carlo轨迹,每条轨迹搜索iteration次,即完成种群初始化,同时完成概率模型的构建,过程如下:
3.1)在每次迭代中,统计每个个体xi的残基position被成功采样的次数
Figure BDA0001392175450000051
根据公式
Figure BDA0001392175450000052
得到个体xi的残基position被采样的总次数,其中,
Figure BDA0001392175450000053
是当前个体,t是当前迭代次数,由此得到残基position被采样的概率;
3.2)迭代结束后,根据公式
Figure BDA0001392175450000054
计算出个体xi中残基position总的采样的概率,并构建残基采样概率分布模型M={P1,P2,P3,…,Plast},last=residue_total-9,其中residue_total是片段总长度;
3.3)在每次迭代中,根据公式
Figure BDA0001392175450000055
得到残基position处每个片段被接受的次数
Figure BDA0001392175450000056
3.4)迭代结束后,根据公式
Figure BDA0001392175450000057
计算出每个片段被接受的概率,其中P′frag_key是在采样中片段frag_key被接受的概率,其中
Figure BDA0001392175450000058
代表个体xi中残基position对应的片段frag_key被接受的总次数,构建片段采样概率分布模型Γ={P′1,P′2,...,P′frag_total},其中frag_total是片段库中每个窗口拥有的片段总数;
4)在每个副本层对初始种群中的每个个体进行如下操作:
4.1)根据建立的概率模型对每个目标个体xi和随机选取的个体xj,j∈(j=1,...,NP)且j≠i进行变异操作,过程如下:
4.1.1)根据残基采样概率分布模型M指导残基位置的采样,即随机选择残基位置position,如果Pposition∈[a,b]则则转至步骤4.1.3),否则按设定的概率δ进行采样,其中b为残基采样概率分布模型M中最大的采样概率,即b=max{P1,P2,...,Pl},a=λ*b,l是目标序列的最后一个片段插入点;
4.1.2)根据片段搜索概率分布模型Γ指导片段空间的选择,即残基位置position确定后,在片段库中随机选择一个相应的片段,如果该片段的分布概率满足Pfrag_key∈[c,d],则转至步骤4.1.3),否则按设定的概率μ进行采样,其中d=max{P′1,P′2,...,Pfrag_total},c=τd;
4.1.3)生成变异个体x′i和x′j
4.2)对变异生成的新个体x′i,x′j按概率Pc对个体x′i和x′j进行如下操作:
4.2.1)随机选择交叉起始点cross_begin,1≤cross_begin≤total_residue-frag_length和交叉片段长度frag_length,frag_length∈[3,10]的随机数,其中total_residue为残基总数,根据公式cross_begin+frag_length=cross_end确定出交叉终止点cross_end;
4.2.2)交换个体x′i和x′j在每个交叉位点position_cross,frag_length≤position_cross≤cross_end处的扭转角,分别生成新个体x″i,x″j
4.3)根据Rosetta Score3函数E(xi)分别计算目标个体xi和变异个体x″i、x″j的能量E(xi)、E(x″i)和E(x″j);
4.4)若E(xi)>min{E(x″i),E(x″j)}则用变异个体x″i和x″j中能量较小者替代目标个体xi,即更新种群,否则种群保持不变;
5)当所有副本层的种群都完成一次更新,进行副本交换操作,过程如下:
5.1)随机选择两个相邻的温度层Tj和Tj+1,j=1,2,...,I-1;
5.2)选择交换个体
Figure BDA0001392175450000061
Figure BDA0001392175450000062
其中i=1,2,...,NP,j=1,2,...,I-1;
5.3)根据公式
Figure BDA0001392175450000071
计算交换判别因子,其中,kB是波尔兹曼常数,Tj=T1-(j-1)*k是为第j个温度层的开尔文温度,
Figure BDA0001392175450000072
为种群个体
Figure BDA0001392175450000073
的能量值;
5.4)产生一个随机数Pm∈(0,1),若Pm<judge,则,将相邻温度层中的个体
Figure BDA0001392175450000074
Figure BDA0001392175450000075
进行交换;
6)判断是否满足终止条件,如不满足则转至4);如满足终止条件,则输出结果。
进一步,所述步骤2)中,设置最大迭代代数Gmax,所述步骤6)中,终止条件为种群迭代次数到达最大迭代次数Gmax
本实施例序列长度为73的α折叠蛋白质1AIL为实施例,一种基于分布估计和副本交换策略的蛋白质构象空间优化方法,所述方法包括以下步骤:
1)给定输入序列信息;
2)参数初始化:设置种群规模NP=100,最大迭代数Gmax=200,确定交叉率Pc=0.5,初始种群迭代次数iteration=8000,每个个体xi的能量计算选用Rosetta Score3函数即E(xi),i=1,2,...,NP,概率模型选择常数λ=0.6,δ=0.5,τ=0.8,μ=0.6,副本层数I=5,第一个副本层温度常数T1=3.5,温度梯度k=0.5;
3)构建概率分布模型:在每个副本层,启动NP条Monte Carlo轨迹,每条轨迹搜索iteration次,即完成种群初始化,同时完成概率模型的构建,过程如下:
3.1)在每次迭代中,统计每个个体xi的残基position被成功采样的次数
Figure BDA0001392175450000076
根据公式
Figure BDA0001392175450000077
得到个体xi的残基position被采样的总次数,其中,
Figure BDA0001392175450000078
是当前个体,t是当前迭代次数,由此得到残基position被采样的概率;
3.2)迭代结束后,根据公式
Figure BDA0001392175450000079
计算出个体xi中残基position总的采样的概率,并构建残基采样概率分布模型M={P1,P2,P3,…,Plast},last=residue_total-9,其中residue_total是片段总长度;
3.3)在每次迭代中,根据公式
Figure BDA0001392175450000081
得到残基position处每个片段被接受的次数
Figure BDA0001392175450000082
3.4)迭代结束后,根据公式
Figure BDA0001392175450000083
计算出每个片段被接受的概率,其中P′frag_key是在采样中片段frag_key被接受的概率,其中
Figure BDA0001392175450000084
代表个体xi中残基position对应的片段frag_key被接受的总次数,构建片段采样概率分布模型Γ={P′1,P′2,...,P′frag_total},其中frag_total是片段库中每个窗口拥有的片段总数;
4)在每个副本层对初始种群中的每个个体进行如下操作:
4.1)根据建立的概率模型对每个目标个体xi和随机选取的个体xj,j∈(j=1,...,NP)且j≠i进行变异操作,过程如下:
4.1.1)根据残基采样概率分布模型M指导残基位置的采样,即随机选择残基位置position,如果Pposition∈[a,b]则则转至步骤4.1.3),否则按设定的概率δ进行采样,其中b为残基采样概率分布模型M中最大的采样概率,即b=max{P1,P2,...,Pl},a=λ*b,l是目标序列的最后一个片段插入点;
4.1.2)根据片段搜索概率分布模型Γ指导片段空间的选择,即残基位置position确定后,在片段库中随机选择一个相应的片段,如果该片段的分布概率满足Pfrag_key∈[c,d],则转至步骤4.1.3),否则按设定的概率μ进行采样,其中d=max{P′1,P′2,...,P′frag_total},c=τd;
4.1.3)生成变异个体x′i和x′j
4.2)对变异生成的新个体x′i,x′j按概率Pc对个体x′i和x′j进行如下操作:
4.2.1)随机选择交叉起始点cross_begin,1≤cross_begin≤total_residue-frag_length和交叉片段长度frag_length,frag_length∈[3,10]的随机数,其中total_residue为残基总数,根据公式cross_begin+frag_length=cross_end确定出交叉终止点cross_end;
4.2.2)交换个体x′i和x′j在每个交叉位点position_cross,frag_length≤position_cross≤cross_end处的扭转角,分别生成新个体x″i,x″j
4.3)根据Rosetta Score3函数E(xi)分别计算目标个体xi和变异个体x″i、x″j的能量E(xi)、E(x″i)和E(x″j);
4.4)若E(xi)>min{E(x″i),E(x″j)}则用变异个体x″i和x″j中能量较小者替代目标个体xi,即更新种群,否则种群保持不变;
5)当所有副本层的种群都完成一次更新,进行副本交换操作,过程如下:
5.1)随机选择两个相邻的温度层Tj和Tj+1,j=1,2,...,I-1;
5.2)选择交换个体
Figure BDA0001392175450000091
Figure BDA0001392175450000092
其中i=1,2,...,NP,j=1,2,...,I-1;
5.3)根据公式
Figure BDA0001392175450000093
计算交换判别因子,其中,kB是波尔兹曼常数,Tj=T1-(j-1)*k是为第j个温度层的开尔文温度,
Figure BDA0001392175450000094
为种群个体
Figure BDA0001392175450000095
的能量值;
5.4)产生一个随机数Pm∈(0,1),若Pm<judge,则,将相邻温度层中的个体
Figure BDA0001392175450000096
Figure BDA0001392175450000097
进行交换;
6)判断是否到达最大迭代次数Gmax,如未到达则转至4);如到达最大迭代次数Gmax,则输出结果。
以序列长度为73的α折叠蛋白质1AIL为实施例,运用以上方法得到了该蛋白质的近天然态构象,最小均方根偏差为
Figure BDA0001392175450000098
平均均方根偏差为
Figure BDA0001392175450000099
预测结构如图3所示。
以上说明是本发明以1AIL蛋白质为实例所得出的优化效果,并非限定本发明的实施范围,在不偏离本发明基本内容所涉及范围的前提下对其做各种变形和改进,不应排除在本发明的保护范围之外。

Claims (2)

1.一种基于分布估计和副本交换策略的蛋白质构象空间优化方法,其特征在于:所述构象空间搜索方法包括以下步骤:
1)给定输入序列信息;
2)参数初始化:设置种群规模NP,确定交叉率Pc,初始种群迭代次数iteration,选用Rosetta Score3能量函数E(xi),xi为个体,i=1,2,...,NP,概率模型选择常数λ,δ,μ,τ,副本层数I,第一个副本层温度常数T1,温度梯度k∈(0,1);
3)构建概率分布模型:在每个副本层,启动NP条Monte Carlo轨迹,每条轨迹搜索iteration次,即完成种群初始化,同时完成概率模型的构建,过程如下:
3.1)在每次迭代中,统计每个个体xi的残基position被成功采样的次数
Figure FDA0002554568930000011
根据公式
Figure FDA0002554568930000012
得到个体xi的残基position被采样的总次数,其中,
Figure FDA0002554568930000013
是当前个体,t是当前迭代次数,由此得到残基position被采样的概率;
3.2)迭代结束后,根据公式
Figure FDA0002554568930000014
计算出个体xi中残基position总的采样的概率,并构建残基采样概率分布模型M={P1,P2,P3,…,Plast},last=residue_total-9,其中residue_total是片段总长度;
3.3)在每次迭代中,根据公式
Figure FDA0002554568930000015
得到残基position处每个片段被接受的次数
Figure FDA0002554568930000016
3.4)迭代结束后,根据公式
Figure FDA0002554568930000017
计算出每个片段被接受的概率,其中P′frag_key是在采样中片段frag_key被接受的概率,其中
Figure FDA0002554568930000018
代表个体xi中残基position对应的片段frag_key被接受的总次数,构建片段采样概率分布模型Γ={P′1,P′2,...,P′frag_total},其中frag_total是片段库中每个窗口拥有的片段总数;
4)在每个副本层对初始种群中的每个个体进行如下操作:
4.1)根据建立的概率模型对每个目标个体xi和随机选取的个体xj,j∈(j=1,...,NP)且j≠i进行变异操作,过程如下:
4.1.1)根据残基采样概率分布模型M指导残基位置的采样,即随机选择残基position,如果Pposition∈[a,b]则转至步骤4.1.3),否则按设定的概率δ进行采样,其中b为残基采样概率分布模型M中最大的采样概率,即b=max{P1,P2,...,Pl},a=λ*b,l是目标序列的最后一个片段插入点;
4.1.2)根据片段搜索概率分布模型Γ指导片段空间的选择,即残基position确定后,在片段库中随机选择一个相应的片段,如果该片段的分布概率满足Pfrag_key∈[c,d],则转至步骤4.1.3),否则按设定的概率μ进行采样,其中d=max{P′1,P′2,...,P′frag_total},c=τd;
4.1.3)生成变异个体x′i和x′j
4.2)对变异生成的新个体x′i,x′j按概率Pc对个体x′i和x′j进行如下操作:
4.2.1)随机选择交叉起始点cross_begin,1≤cross_begin≤total_residue-frag_length和交叉片段长度frag_length,frag_length∈[3,10]的随机数,其中total_residue为残基总数,根据公式cross_begin+frag_length=cross_end确定出交叉终止点cross_end;
4.2.2)交换个体x′i和x′j在每个交叉位点position_cross,frag_length≤position_cross≤cross_end处的扭转角,分别生成新个体x″i,x″j
4.3)根据Rosetta Score3函数E(xi)分别计算目标个体xi和变异个体x″i、x″j的能量E(xi)、E(x″i)和E(x″j);
4.4)若E(xi)>min{E(x″i),E(x″j)}则用变异个体x″i和x″j中能量较小者替代目标个体xi,即更新种群,否则种群保持不变;
5)当所有副本层的种群都完成一次更新,进行副本交换操作,过程如下:
5.1)随机选择两个相邻的温度层Tj和Tj+1,j=1,2,...,I-1;
5.2)选择交换个体
Figure FDA0002554568930000031
Figure FDA0002554568930000032
其中i=1,2,...,NP,j=1,2,...,I-1;
5.3)根据公式
Figure FDA0002554568930000033
计算交换判别因子,其中,kB是波尔兹曼常数,Tj=T1-(j-1)*k是为第j个温度层的开尔文温度,
Figure FDA0002554568930000034
为种群个体
Figure FDA0002554568930000035
的能量值;
5.4)产生一个随机数Pm∈(0,1),若Pm<judge,则,将相邻温度层中的个体
Figure FDA0002554568930000036
Figure FDA0002554568930000037
进行交换;
6)判断是否满足终止条件,如不满足则转至4);如满足终止条件,则输出结果。
2.如权利要求1所述的一种基于分布估计和副本交换策略的蛋白质构象空间优化方法,其特征在于:所述步骤2)中,设置最大迭代代数Gmax,所述步骤6)中,终止条件为种群迭代次数到达最大迭代次数Gmax
CN201710756001.2A 2017-08-29 2017-08-29 一种基于分布估计和副本交换策略的蛋白质构象空间优化方法 Active CN107633157B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710756001.2A CN107633157B (zh) 2017-08-29 2017-08-29 一种基于分布估计和副本交换策略的蛋白质构象空间优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710756001.2A CN107633157B (zh) 2017-08-29 2017-08-29 一种基于分布估计和副本交换策略的蛋白质构象空间优化方法

Publications (2)

Publication Number Publication Date
CN107633157A CN107633157A (zh) 2018-01-26
CN107633157B true CN107633157B (zh) 2020-10-27

Family

ID=61101604

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710756001.2A Active CN107633157B (zh) 2017-08-29 2017-08-29 一种基于分布估计和副本交换策略的蛋白质构象空间优化方法

Country Status (1)

Country Link
CN (1) CN107633157B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108647486B (zh) * 2018-03-22 2021-06-18 浙江工业大学 一种基于构象多样性策略的蛋白质三维结构预测方法
CN108920894B (zh) * 2018-06-08 2021-06-18 浙江工业大学 一种基于简约抽象凸估计的蛋白质构象空间优化方法
CN109378034B (zh) * 2018-08-28 2021-06-18 浙江工业大学 一种基于距离分布估计的蛋白质预测方法
CN109300504B (zh) * 2018-08-29 2021-05-18 浙江工业大学 一种基于多变异精英选择的蛋白质结构预测方法
CN109461472B (zh) * 2018-08-30 2021-02-26 浙江工业大学 一种基于副本交换和有偏分布估计的蛋白质构象空间优化方法
JP7108185B2 (ja) * 2018-11-22 2022-07-28 富士通株式会社 最適化装置および最適化装置の制御方法
CN113674808B (zh) * 2021-08-18 2024-03-01 合肥工业大学 一种超稳态玻璃结构的制备方法
CN114927161A (zh) * 2022-05-16 2022-08-19 抖音视界(北京)有限公司 分子分析的方法、装置、电子设备和计算机存储介质
CN116864015B (zh) * 2023-06-29 2024-04-26 浙江洛兮医疗科技有限公司 一种基于副本交换分子动力学的蛋白质构象变化分析方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103413068A (zh) * 2013-08-28 2013-11-27 苏州大学 一种基于结构拓扑的g蛋白偶联受体跨膜螺旋三维结构的预测方法
CN104866733A (zh) * 2015-04-03 2015-08-26 浙江工业大学 一种基于副本交换的群体构象空间优化方法
CN105975806A (zh) * 2016-04-26 2016-09-28 浙江工业大学 一种基于距离约束副本交换的蛋白质结构预测方法
CN106055920A (zh) * 2016-06-02 2016-10-26 浙江工业大学 一种基于阶段性多策略副本交换的蛋白质结构预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103413068A (zh) * 2013-08-28 2013-11-27 苏州大学 一种基于结构拓扑的g蛋白偶联受体跨膜螺旋三维结构的预测方法
CN104866733A (zh) * 2015-04-03 2015-08-26 浙江工业大学 一种基于副本交换的群体构象空间优化方法
CN105975806A (zh) * 2016-04-26 2016-09-28 浙江工业大学 一种基于距离约束副本交换的蛋白质结构预测方法
CN106055920A (zh) * 2016-06-02 2016-10-26 浙江工业大学 一种基于阶段性多策略副本交换的蛋白质结构预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Xiaohu Huang,Guijun Zhang.Double Estimation of Distribution Guided Sampling Algorithm for De-novo Protein Structure Prediction.《Proceedings of the 36th Chinese Control Conference》.2017, *
基于Monte Carlo局部增强的多模态优化算法;陈先跑 等;《计算机科学》;20150630;第42卷(第6A期);第61-66页 *
基于副本交换的局部增强差分进化蛋白质结构从头预测方法;李章维 等;《计算机科学》;20170531;第44卷(第5期);第211-216页 *

Also Published As

Publication number Publication date
CN107633157A (zh) 2018-01-26

Similar Documents

Publication Publication Date Title
CN107633157B (zh) 一种基于分布估计和副本交换策略的蛋白质构象空间优化方法
CN107609342B (zh) 一种基于二级结构空间距离约束的蛋白质构象搜索方法
Deng et al. Protein structure prediction
Du et al. Molgensurvey: A systematic survey in machine learning models for molecule design
JP2022501695A (ja) 予測タンパク質構造と実際のタンパク質構造との間の類似性を推定するジオメトリニューラルネットワークを使用してタンパク質構造を予測すること
CN108846256B (zh) 一种基于残基接触信息的群体蛋白质结构预测方法
CN110148437B (zh) 一种残基接触辅助策略自适应的蛋白质结构预测方法
Zhang et al. Enhancing protein conformational space sampling using distance profile-guided differential evolution
CN109360596B (zh) 一种基于差分进化局部扰动的蛋白质构象空间优化方法
Simoncini et al. Efficient sampling in fragment-based protein structure prediction using an estimation of distribution algorithm
CN115132270A (zh) 药物筛选方法及系统
JP7236253B2 (ja) 情報処理方法および学習モデル
KR20230125038A (ko) 단백질 구조 임베딩에 조건화된 생성형 모델을 사용한단백질 아미노산 서열 예측
Zhou et al. FebRNA: An automated fragment-ensemble-based model for building RNA 3D structures
CN109378034B (zh) 一种基于距离分布估计的蛋白质预测方法
CN111180004B (zh) 一种多元接触信息的子种群策略蛋白质结构预测方法
Hao et al. Conformational space sampling method using multi-subpopulation differential evolution for de novo protein structure prediction
Zhang et al. Two-stage distance feature-based optimization algorithm for de novo protein structure prediction
CN109360598B (zh) 一种基于两阶段采样的蛋白质结构预测方法
CN109360597B (zh) 一种基于全局和局部策略协作的群体蛋白质结构预测方法
CN109346128B (zh) 一种基于残基信息动态选择策略的蛋白质结构预测方法
CN109300505B (zh) 一种基于有偏采样的蛋白质结构预测方法
Castro et al. Guided generative protein design using regularized transformers
CN109326319B (zh) 一种基于二级结构知识的蛋白质构象空间优化方法
CN109360600B (zh) 一种基于残基特征距离的蛋白质结构预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant