CN106778059A - 一种基于Rosetta局部增强的群体蛋白质结构预测方法 - Google Patents

一种基于Rosetta局部增强的群体蛋白质结构预测方法 Download PDF

Info

Publication number
CN106778059A
CN106778059A CN201611176255.9A CN201611176255A CN106778059A CN 106778059 A CN106778059 A CN 106778059A CN 201611176255 A CN201611176255 A CN 201611176255A CN 106778059 A CN106778059 A CN 106778059A
Authority
CN
China
Prior art keywords
conformation
rosetta
individuality
trial
fragment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611176255.9A
Other languages
English (en)
Other versions
CN106778059B (zh
Inventor
张贵军
周晓根
郝小虎
王柳静
俞旭锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201611176255.9A priority Critical patent/CN106778059B/zh
Publication of CN106778059A publication Critical patent/CN106778059A/zh
Application granted granted Critical
Publication of CN106778059B publication Critical patent/CN106778059B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biotechnology (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

一种基于Rosetta局部增强的群体蛋白质结构预测方法,首先,将结构预测中的整个算法搜索过程分为四个阶段,对每个阶段设置片段长度进行片段组装,并选用不同的能量函数来衡量构象个体的质量;然后,基于二级结构信息,采用不同的变异策略利用loop区域信息来生成测试构象,并通过随机交换loop区域信息实现交叉过程,保持种群多样性,同时对每个阶段的测试构象和目标构象执行Rosetta局部增强;最后,提取构象的特征向量来衡量各构象个体的多样性,从而以能量函数为主要衡量指标,并以多样性为辅助衡量指标来指导构象种群更新。本发明搜索能力强、能量保持种群多样性、预测精度高。

Description

一种基于Rosetta局部增强的群体蛋白质结构预测方法
技术领域
本发明涉及一种生物学信息学、智能优化、计算机应用领域,尤其涉及的是,一种基于Rosetta局部增强的群体蛋白质结构预测方法。
背景技术
蛋白质是细胞功能的核心,与大部分核心生命过程息息相关。事实上,蛋白质只有折叠成特定的三维结构(即蛋白质三级结构)之后才能产生其特定的生物学功能。因此,为了解蛋白质的功能,就必须获得其三维空间结构,从而通过了解蛋白质的三维结构推动功能材料设计和新型药物研制的发展,帮助人们理解生命的基本过程,包括对阿尔兹海默症、帕金森病以及II型糖尿病等蛋白质折叠病的认识。
目前常用的蛋白质结构测定方法有X射线衍射和核磁共振(NMR),这两种方法虽然预测精度高,但是对于X射线衍射来说,难以培养晶体且晶体结构测定的周期较长,核磁共振对样品的需要量大、纯度要求高,目前只能用于小分子蛋白质结构的测定。因此,以计算机为工具,利用适当的优化算法,直接通过氨基酸序列预测蛋白质三维结构,进而设计具有潜在药物价值的新功能蛋白质与多肽分子是生命科学领域需要解决的一个根本问题。该问题的最终解决关键在于:如何利用现有技术,设计一种高效的蛋白质构象空间优化算法。
经过40多年的发展,尤其是进入21世纪以来,分子动力学模拟(MD)、蒙特卡罗(MC)、构象空间退火(CSA)、进化类优化算法(EA)等随机优化算法在从头预测领域得到了成功应用;格点系统搜索(SGS)、分枝定界(BB)等确定性全局优化算法,理论研究超前于其数值应用,其极高的计算复杂度,限制了它们在中等规模以上蛋白构象优化方面的应用。基于MC及CSA系列改进算法,Baker团队开发的Rosetta从头预测服务器、Zhang团队开发的I-TASSER及QUARK从头预测服务器目前已经成为国际领先的预测软件。上述方法在预测一些序列长度较短的小蛋白来说,能够有效的得到三维结构。然而,由于蛋白质能量模型考虑分子体系成键作用以及范德华力、静电、氢键、疏水等非成键作用,致使其形成的能量曲面极其粗糙,构象对应局部极小解数目随序列长度的增加呈指数增长,对于这些传统方法进行预测显得力不从心,其原因在于极大的构象搜索空间会导致算法在预测过程中搜索能力渐渐下降,同时群体的多样性也变得越来越小,从而导致算法失去搜索的动力,影响最终的预测精度。
因此,现有的群体蛋白质结构预测方法在搜索能力和种群多样性保持方面存在着缺陷,需要改进。
发明内容
为了克服现有的群体蛋白质结构预测方法在搜索能力和种群多样性方面的不足,本发明提出一种搜索能力强,且能够保持种群多样性的基于Rosetta局部增强的群体蛋白质结构预测方法。
本发明解决其技术问题所采用的技术方案是:
一种基于Rosetta局部增强的群体蛋白质结构预测方法,所述方法包括以下步骤:
1)输入待测蛋白质的氨基酸序列信息;
2)初始化:设置种群规模NP,交叉概率CR,策略选择因子CS,多样性接受概率RS,Rosetta轨迹长度T,片段长度L1,L2
3)根据序列信息以片段长度L1进行随机片段组装生成初始构象种群P={C1,C2,...,CNP},其中,Ci的表示当前种群中的第i个构象个体,并根据能量函数RosettaScore0计算各构象个体的能量,同时初始化迭代次数G=0;
4)采用能量函数Rosetta Score0评价构象的质量,以片段长度L1对初始种群中的每个构象个体执行轨迹长度为T的Rosetta局部增强,并计算每个构象的特征向量;
5)对步骤4)中增强后的每个构象个体Ci,i∈{1,2,…,NP}作如下处理:
5.1)设置能量函数和片段长度:
5.1.1)如果当前迭代次数0<G≤Gmax/3,则片段长度l=L1,且选用能量函数Rosetta Score1;
5.1.2)如果当前迭代次数Gmax/3<G≤2Gmax/3,则片段长度l=L1,且选用能量函数Rosetta Score2;
5.1.3)如果当前迭代次数G>2Gmax/3,则片段长度l=L2,且选用能量函数RosettaScore3
5.2)如果当前迭代次数G为Gmax/3的整数倍,则对以片段长度l对构象个体Ci执行轨迹长度为T的Rosetta局部增强,并根据步骤5.1)中设置的能量函数进行评价;
5.3)计算目标构象Ci的特征向量,以及Ci与当前种群中其他构象之间的特征向量欧氏距离,并以最小距离为Ci的多样性值Di
5.4)根据序列信息,利用DSSP得到待测蛋白的loop区域,并随机生成一个0到1之间的随机数p;
5.5)如果p<CS,则从当前种群中选取三个互不相同的构象个体Ca、Cb和Cc,其中,a≠b≠c≠i,a,b,c∈[1,NP],从构象个体Cb和Cc中各随机选取一个片段替换Ca中对应位置的片段,并从Ca中随机选取一个不包含loop区
域的窗口进行片段组装生成变异构象Cmutant
5.6)如果p≥1-CS,则选出当前能量值最低的构象个体Cbest,并从当前种群中选取两个互不相同的构象个体Ca和Cb,其中,a≠b≠i,a,b∈[1,NP],从构象个体Ca和Cb中各随机选取一个片段替换Cbest中对应位置的片段,并从Cbest中随机选取一个不包含loop区域的窗口进行片段组装生成变异构象Cmutant
5.7)随机生成一个0与1之间随机数p′,如果p′>CR,则随机选取一个loop区域,替换目标构象个体Ci与变异构象个体Cmutant在该区域的二面角,从而生成测试构象Ctrial,否则Ctrial直接等于变异构象Cmutant;以片段长度l对测试构象个体Ctrial执行轨迹长度为T的Rosetta局部增强;
5.8)计算增强后测试构象的特征向量,并计算测试构象的特征向量与当前种群中各构象个体的特征向量之间的距离,以最小距离为测试构象的多样性值Dtrial
5.9)计算测试构象Ctrial的能量函数值Etrial,并进行如下操作:
5.9.1)如果Etrial小于当前目标构象个体Ci的能量函数值Ei,则测试构象Ctrial替换目标构象Ci
5.9.2)如果Etrial大于当前目标构象个体Ci的能量函数值Ei,且测试构象的多样性值Dtrial大于目标构象的多样性值Di,则随机生成一个0与1之间随机数,如果p″>RS,则测试构象Ctrial替换目标构象Ci
6)判断是否满足终止条件,若满足则输出结果并退出,否则返回步骤5)。
进一步,所述步骤2)中,设置最大迭代次数Gmax,所述步骤6)中,对种群中的每个构象个体都执行完步骤5)以后,迭代次数G=G+1,终止条件为迭代次数G达到预设最大迭代次数Gmax
本发明的技术构思为:首先,将结构预测中的整个算法搜索过程分为四个阶段,对每个阶段设置片段长度进行片段组装,并选用不同的能量函数来衡量构象个体的质量;然后,基于二级结构信息,采用不同的变异策略利用loop区域信息来生成测试构象,并通过随机交换loop区域信息实现交叉过程,保持种群多样性,同时对每个阶段的测试构象和目标构象执行Rosetta局部增强;最后,提取构象的特征向量来衡量各构象个体的多样性,从而以能量函数为主要衡量指标,并以多样性为辅助衡量指标来指导构象种群更新。
本发明的有益效果表现在:一方面,基于二级结构信息,根据loop区域的残基操作来实现不同策略的测试构象生成,并对每个测试构象进行Rosetta局部增强,从而提高算法的搜索能力;其次,针对不同阶段的Rosetta局部增强,采用不同的片段长度进行片段组装,并采用不同的能量函数衡量构象的质量,从而提高搜索效率;另一方面,在选择过程中,基于各构象个体之间的特征向量距离来衡量构象的多样性,并将其作为辅助指标来衡量构象的质量,从而在搜索过程充分保持种群多样性,进而提高预测精度。
附图说明
图1是基于Rosetta局部增强的群体蛋白质结构预测方法的流程图。
图2是基于Rosetta局部增强的群体蛋白质结构预测方法对蛋白质1AIL进行结构预测时的构象更新示意图。
图3是基于Rosetta局部增强的群体蛋白质结构预测方法对蛋白质1AIL进行结构预测时得到的构象分布图。
图4是基于基于Rosetta局部增强的群体蛋白质结构预测方法对蛋白质1AIL进行结构预测得到的三维结构图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1~图4,一种基于Rosetta局部增强的群体蛋白质结构预测方法,包括以下步骤:
1)输入待测蛋白质的氨基酸序列信息;
2)初始化:设置种群规模NP,交叉概率CR,策略选择因子CS,多样性接受概率RS,Rosetta轨迹长度T,片段长度L1,L2
3)根据序列信息以片段长度L1进行随机片段组装生成初始构象种群P={C1,C2,...,CNP},其中,Ci的表示当前种群中的第i个构象个体,并根据能量函数RosettaScore0计算各构象个体的能量,同时初始化迭代次数G=0;
4)采用能量函数Rosetta Score0评价构象的质量,以片段长度L1对初始种群中的每个构象个体执行轨迹长度为T的Rosetta局部增强,并计算每个构象的特征向量;
5)对步骤4)中增强后的每个构象个体Ci,i∈{1,2,…,NP}作如下处理:
5.1)设置能量函数和片段长度:
5.1.1)如果当前迭代次数0<G≤Gmax/3,则片段长度l=L1,且选用能量函数Rosetta Score1;
5.1.2)如果当前迭代次数Gmax/3<G≤2Gmax/3,则片段长度l=L1,且选用能量函数Rosetta Score2;
5.1.3)如果当前迭代次数G>2Gmax/3,则片段长度l=L2,且选用能量函数RosettaScore3
5.2)如果当前迭代次数G为Gmax/3的整数倍,则对以片段长度l对构象个体Ci执行轨迹长度为T的Rosetta局部增强,并根据步骤5.1)中设置的能量函数进行评价;
5.3)计算目标构象Ci的特征向量,以及Ci与当前种群中其他构象之间的特征向量欧氏距离,并以最小距离为Ci的多样性值Di
5.4)根据序列信息,利用DSSP得到待测蛋白的loop区域,并随机生成一个0到1之间的随机数p;
5.5)如果p<CS,则从当前种群中选取三个互不相同的构象个体Ca、Cb和Cc,其中,a≠b≠c≠i,a,b,c∈[1,NP],从构象个体Cb和Cc中各随机选取一个片段替换Ca中对应位置的片段,并从Ca中随机选取一个不包含loop区域的窗口进行片段组装生成变异构象Cmutant
5.6)如果p≥1-CS,则选出当前能量值最低的构象个体Cbest,并从当前种群中选取两个互不相同的构象个体Ca和Cb,其中,a≠b≠i,a,b∈[1,NP],从构象个体Ca和Cb中各随机选取一个片段替换Cbest中对应位置的片段,并从Cbest中随机选取一个不包含loop区域的窗口进行片段组装生成变异构象Cmutant
5.7)随机生成一个0与1之间随机数p′,如果p′>CR,则随机选取一个loop区域,替换目标构象个体Ci与变异构象个体Cmutant在该区域的二面角,从而生成测试构象Ctrial,否则Ctrial直接等于变异构象Cmutant;以片段长度l对测试构象个体Ctrial执行轨迹长度为T的Rosetta局部增强;
5.8)计算增强后测试构象的特征向量,并计算测试构象的特征向量与当前种群中各构象个体的特征向量之间的距离,以最小距离为测试构象的多样性值Dtrial
5.9)计算测试构象Ctrial的能量函数值Etrial,并进行如下操作:
5.9.1)如果Etrial小于当前目标构象个体Ci的能量函数值Ei,则测试构象Ctrial替换目标构象Ci
5.9.2)如果Etrial大于当前目标构象个体Ci的能量函数值Ei,且测试构象的多样性值Dtrial大于目标构象的多样性值Di,则随机生成一个0与1之间随机数,如果p″>RS,则测试构象Ctrial替换目标构象Ci
6)判断是否满足终止条件,若满足则输出结果并退出,否则返回步骤5)。
进一步,所述步骤2)中,设置最大迭代次数Gmax,所述步骤6)中,对种群中的每个构象个体都执行完步骤5)以后,迭代次数G=G+1,终止条件为迭代次数G达到预设最大迭代次数Gmax
本实施例序列长度为56的α/β折叠蛋白质1GB1为实施例,一种基于Rosetta局部增强的群体蛋白质结构预测方法,其中包含以下步骤:
1)输入待测蛋白质的氨基酸序列信息;
2)初始化:设置种群规模NP=100,交叉概率CR=0.5,策略选择因子CS=0.5,多样性接受概率RS=0.5,Rosetta轨迹长度T=1000,最大迭代次数Gmax=1200,片段长度L1=3,L2=9;
3)根据序列信息以片段长度L1进行随机片段组装生成初始构象种群P={C1,C2,...,CNP},其中,Ci的表示当前种群中的第i个构象个体,并根据能量函数RosettaScore0计算各构象个体的能量,同时初始化迭代次数G=0;
4)采用能量函数Rosetta Score0评价构象的质量,以片段长度L1对初始种群中的每个构象个体执行轨迹长度为T的Rosetta局部增强,并计算每个构象的特征向量;
5)对步骤4)中增强后的每个构象个体Ci,i∈{1,2,…,NP}作如下处理:
5.1)设置能量函数和片段长度:
5.1.1)如果当前迭代次数0<G≤Gmax/3,则片段长度l=L1,且选用能量函数Rosetta Score1;
5.1.2)如果当前迭代次数Gmax/3<G≤2Gmax/3,则片段长度l=L1,且选用能量函数Rosetta Score2;
5.1.3)如果当前迭代次数G>2Gmax/3,则片段长度l=L2,且选用能量函数RosettaScore3
5.2)如果当前迭代次数G为Gmax/3的整数倍,则对以片段长度l对构象个体Ci执行轨迹长度为T的Rosetta局部增强,并根据步骤5.1)中设置的能量
函数进行评价;
5.3)计算目标构象Ci的特征向量,以及Ci与当前种群中其他构象之间的特征向量欧氏距离,并以最小距离为Ci的多样性值Di
5.4)根据序列信息,利用DSSP得到待测蛋白的loop区域,并随机生成一个0到1之间的随机数p;
5.5)如果p<CS,则从当前种群中选取三个互不相同的构象个体Ca、Cb和Cc,其中,a≠b≠c≠i,a,b,c∈[1,NP],从构象个体Cb和Cc中各随机选取一个片段替换Ca中对应位置的片段,并从Ca中随机选取一个不包含loop区域的窗口进行片段组装生成变异构象Cmutant
5.6)如果p≥1-CS,则选出当前能量值最低的构象个体Cbest,并从当前种群中选取两个互不相同的构象个体Ca和Cb,其中,a≠b≠i,a,b∈[1,NP],从构象个体Ca和Cb中各随机选取一个片段替换Cbest中对应位置的片段,并从Cbest中随机选取一个不包含loop区域的窗口进行片段组装生成变异
构象Cmutant
5.7)随机生成一个0与1之间随机数p′,如果p′>CR,则随机选取一个loop区域,替换目标构象个体Ci与变异构象个体Cmutant在该区域的二面角,从而生成测试构象Ctrial,否则Ctrial直接等于变异构象Cmutant;以片段长度l对测试构象个体Ctrial执行轨迹长度为T的Rosetta局部增强;
5.8)计算增强后测试构象的特征向量,并计算测试构象的特征向量与当前种群中各构象个体的特征向量之间的距离,以最小距离为测试构象的多样性值
Dtrial
5.9)计算测试构象Ctrial的能量函数值Etrial,并进行如下操作:
5.9.1)如果Etrial小于当前目标构象个体Ci的能量函数值Ei,则测试构象Ctrial替换目标构象Ci
5.9.2)如果Etrial大于当前目标构象个体Ci的能量函数值Ei,且测试构象的多样性值Dtrial大于目标构象的多样性值Di,则随机生成一个0与1之间随机数,如果p″>RS,则测试构象Ctrial替换目标构象Ci
6)当对种群中的每个构象都执行了步骤5)以后,G=G+1,若G>Gmax则输出结
果并退出,否则返回步骤5)。
以序列长度为56的α/β折叠蛋白质1GB1为实施例,运用以上方法得到了该蛋白质的近天然态构象,最小均方根偏差为平均均方根偏差为预测结构如图4所示。
以上说明是本发明以1GB1蛋白质为实例所得出的优化效果,并非限定本发明的实施范围,在不偏离本发明基本内容所涉及范围的的前提下对其做各种变形和改进,不应排除在本发明的保护范围之外。

Claims (2)

1.一种基于Rosetta局部增强的群体蛋白质结构预测方法,其特征在于:所述蛋白质结构预测方法包括以下步骤:
1)输入待测蛋白质的氨基酸序列信息;
2)初始化:设置种群规模NP,交叉概率CR,策略选择因子CS,多样性接受概率RS,Rosetta轨迹长度T,片段长度L1,L2
3)根据序列信息以片段长度L1进行随机片段组装生成初始构象种群P={C1,C2,...,CNP},其中,Ci的表示当前种群中的第i个构象个体,并根据能量函数Rosetta Score0计算各构象个体的能量,同时初始化迭代次数G=0;4)采用能量函数Rosetta Score0评价构象的质量,以片段长度L1对初始种群中的每个构象个体执行轨迹长度为T的Rosetta局部增强,并计算每个构象的特征向量;
5)对步骤4)中增强后的每个构象个体Ci,i∈{1,2,…,NP}作如下处理:
5.1)设置能量函数和片段长度:
5.1.1)如果当前迭代次数0<G≤Gmax/3,则片段长度l=L1,且选用能量函数RosettaScore1;
5.1.2)如果当前迭代次数Gmax/3<G≤2Gmax/3,则片段长度l=L1,且选用能量函数Rosetta Score2;
5.1.3)如果当前迭代次数G>2Gmax/3,则片段长度l=L2,且选用能量函数RosettaScore3
5.2)如果当前迭代次数G为Gmax/3的整数倍,则对以片段长度l对构象个体Ci执行轨迹长度为T的Rosetta局部增强,并根据步骤5.1)中设置的能量函数进行评价;
5.3)计算目标构象Ci的特征向量,以及Ci与当前种群中其他构象之间的特征向量欧氏距离,并以最小距离为Ci的多样性值Di
5.4)根据序列信息,利用DSSP得到待测蛋白的loop区域,并随机生成一个0到1之间的随机数p;
5.5)如果p<CS,则从当前种群中选取三个互不相同的构象个体Ca、Cb和Cc,其中,a≠b≠c≠i,a,b,c∈[1,NP],从构象个体Cb和Cc中各随机选取一个片段替换Ca中对应位置的片段,并从Ca中随机选取一个不包含loop区域的窗口进行片段组装生成变异构象Cmutant
5.6)如果p≥1-CS,则选出当前能量值最低的构象个体Cbest,并从当前种群中选取两个互不相同的构象个体Ca和Cb,其中,a≠b≠i,a,b∈[1,NP],从构象个体Ca和Cb中各随机选取一个片段替换Cbest中对应位置的片段,并从Cbest中随机选取一个不包含loop区域的窗口进行片段组装生成变异构象Cmutant
5.7)随机生成一个0与1之间随机数p′,如果p′>CR,则随机选取一个loop区域,替换目标构象个体Ci与变异构象个体Cmutant在该区域的二面角,从而生成测试构象Ctrial,否则Ctrial直接等于变异构象Cmutant;以片段长度l对测试构象个体Ctrial执行轨迹长度为T的Rosetta局部增强;
5.8)计算增强后测试构象的特征向量,并计算测试构象的特征向量与当前种群中各构象个体的特征向量之间的距离,以最小距离为测试构象的多样性值Dtrial
5.9)计算测试构象Ctrial的能量函数值Etrial,并进行如下操作:
5.9.1)如果Etrial小于当前目标构象个体Ci的能量函数值Ei,则测试构象Ctrial替换目标构象Ci
5.9.2)如果Etrial大于当前目标构象个体Ci的能量函数值Ei,且测试构象的多样性值Dtrial大于目标构象的多样性值Di,则随机生成一个0与1之间随机数,如果p″>RS,则测试构象Ctrial替换目标构象Ci
6)判断是否满足终止条件,若满足则输出结果并退出,否则返回步骤5)。
2.如权利要求1所述的一种基于Rosetta局部增强的群体蛋白质结构预测方法,其特征在于:所述步骤2)中,设置最大迭代次数Gmax,所述步骤6)中,对种群中的每个构象个体都执行完步骤5)以后,迭代次数G=G+1,终止条件为迭代次数G达到最大迭代次数Gmax
CN201611176255.9A 2016-12-19 2016-12-19 一种基于Rosetta局部增强的群体蛋白质结构预测方法 Active CN106778059B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611176255.9A CN106778059B (zh) 2016-12-19 2016-12-19 一种基于Rosetta局部增强的群体蛋白质结构预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611176255.9A CN106778059B (zh) 2016-12-19 2016-12-19 一种基于Rosetta局部增强的群体蛋白质结构预测方法

Publications (2)

Publication Number Publication Date
CN106778059A true CN106778059A (zh) 2017-05-31
CN106778059B CN106778059B (zh) 2019-07-30

Family

ID=58889652

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611176255.9A Active CN106778059B (zh) 2016-12-19 2016-12-19 一种基于Rosetta局部增强的群体蛋白质结构预测方法

Country Status (1)

Country Link
CN (1) CN106778059B (zh)

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107229840A (zh) * 2017-06-01 2017-10-03 浙江工业大学 一种基于菌群优化算法的蛋白质结构从头预测方法
CN107491664A (zh) * 2017-08-29 2017-12-19 浙江工业大学 一种基于信息熵的蛋白质结构从头预测方法
CN107609345A (zh) * 2017-08-29 2018-01-19 浙江工业大学 一种基于模板自适应选择的多域蛋白结构组装方法
CN108062457A (zh) * 2018-01-15 2018-05-22 浙江工业大学 一种结构特征向量辅助选择的蛋白质结构预测方法
CN108334746A (zh) * 2018-01-15 2018-07-27 浙江工业大学 一种基于二级结构相似度的蛋白质结构预测方法
CN108595910A (zh) * 2018-05-09 2018-09-28 浙江工业大学 一种基于多样性指标的群体蛋白质构象空间优化方法
CN108629151A (zh) * 2018-03-22 2018-10-09 浙江工业大学 一种基于拉氏图的群体蛋白质结构预测方法
CN108647486A (zh) * 2018-03-22 2018-10-12 浙江工业大学 一种基于构象多样性策略的蛋白质三维结构预测方法
CN108647488A (zh) * 2018-05-09 2018-10-12 浙江工业大学 一种基于局部扰动的群体蛋白质构象空间优化方法
CN108763860A (zh) * 2018-06-07 2018-11-06 浙江工业大学 一种基于Loop信息采样的群体蛋白质构象空间优化方法
CN108804868A (zh) * 2018-03-30 2018-11-13 浙江工业大学 一种基于二面角熵值的蛋白质两阶段构象空间优化方法
CN109033744A (zh) * 2018-06-19 2018-12-18 浙江工业大学 一种基于残基距离和接触信息的蛋白质结构预测方法
CN109147867A (zh) * 2018-08-28 2019-01-04 浙江工业大学 一种基于动态片段长度的群体蛋白质结构预测方法
CN109215733A (zh) * 2018-08-30 2019-01-15 浙江工业大学 一种基于残基接触信息辅助评价的蛋白质结构预测方法
CN109215734A (zh) * 2018-08-28 2019-01-15 浙江工业大学 一种基于多轨迹和残基接触信息的蛋白质结构预测方法
CN109215732A (zh) * 2018-08-28 2019-01-15 浙江工业大学 一种基于残基接触信息自学习的蛋白质结构预测方法
CN109243526A (zh) * 2018-07-12 2019-01-18 浙江工业大学 一种基于特定片段交叉的蛋白质结构预测方法
CN109256177A (zh) * 2018-07-12 2019-01-22 浙江工业大学 一种基于子种群协同进化的蛋白质结构预测方法
CN109300505A (zh) * 2018-08-29 2019-02-01 浙江工业大学 一种基于有偏采样的蛋白质结构预测方法
CN109326318A (zh) * 2018-07-12 2019-02-12 浙江工业大学 一种基于Loop区域高斯扰动的群体蛋白质结构预测方法
CN109346128A (zh) * 2018-08-01 2019-02-15 浙江工业大学 一种基于残基信息动态选择策略的蛋白质结构预测方法
CN109360600A (zh) * 2018-08-28 2019-02-19 浙江工业大学 一种基于残基特征距离的蛋白质结构预测方法
CN109390035A (zh) * 2018-08-29 2019-02-26 浙江工业大学 一种基于局部结构比对的蛋白质构象空间优化方法
CN109448785A (zh) * 2018-08-29 2019-03-08 浙江工业大学 一种使用拉氏图增强Loop区域结构的蛋白质结构预测方法
CN109461471A (zh) * 2018-08-30 2019-03-12 浙江工业大学 一种基于锦标赛机制的自适应蛋白质结构预测方法
CN109509510A (zh) * 2018-07-12 2019-03-22 浙江工业大学 一种基于多种群系综变异策略的蛋白质结构预测方法
CN109872770A (zh) * 2019-01-09 2019-06-11 浙江工业大学 一种结合排挤度评价的多变异策略蛋白质结构预测方法
CN110189794A (zh) * 2019-04-16 2019-08-30 浙江工业大学 一种残基接触引导loop扰动的群体蛋白质结构预测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001071347A1 (en) * 2000-03-23 2001-09-27 California Institute Of Technology Method and apparatus for predicting ligand binding interactions
CN103714265A (zh) * 2013-12-23 2014-04-09 浙江工业大学 一种基于蒙特卡洛局部抖动和片段组装的蛋白质三维结构预测方法
WO2014159308A1 (en) * 2013-03-14 2014-10-02 University Of Florida Research Foundation, Incorporated Pharmacogenic therapies targeting the metal-ion transcriptional regulation machinery in bacteria
CN105046101A (zh) * 2015-06-08 2015-11-11 浙江工业大学 一种基于副本交换和局部增强策略的群体构象空间搜索方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001071347A1 (en) * 2000-03-23 2001-09-27 California Institute Of Technology Method and apparatus for predicting ligand binding interactions
WO2014159308A1 (en) * 2013-03-14 2014-10-02 University Of Florida Research Foundation, Incorporated Pharmacogenic therapies targeting the metal-ion transcriptional regulation machinery in bacteria
CN103714265A (zh) * 2013-12-23 2014-04-09 浙江工业大学 一种基于蒙特卡洛局部抖动和片段组装的蛋白质三维结构预测方法
CN105046101A (zh) * 2015-06-08 2015-11-11 浙江工业大学 一种基于副本交换和局部增强策略的群体构象空间搜索方法

Cited By (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107229840A (zh) * 2017-06-01 2017-10-03 浙江工业大学 一种基于菌群优化算法的蛋白质结构从头预测方法
CN107491664A (zh) * 2017-08-29 2017-12-19 浙江工业大学 一种基于信息熵的蛋白质结构从头预测方法
CN107609345A (zh) * 2017-08-29 2018-01-19 浙江工业大学 一种基于模板自适应选择的多域蛋白结构组装方法
CN107491664B (zh) * 2017-08-29 2020-08-18 浙江工业大学 一种基于信息熵的蛋白质结构从头预测方法
CN108334746B (zh) * 2018-01-15 2021-06-18 浙江工业大学 一种基于二级结构相似度的蛋白质结构预测方法
CN108062457B (zh) * 2018-01-15 2021-06-18 浙江工业大学 一种结构特征向量辅助选择的蛋白质结构预测方法
CN108334746A (zh) * 2018-01-15 2018-07-27 浙江工业大学 一种基于二级结构相似度的蛋白质结构预测方法
CN108062457A (zh) * 2018-01-15 2018-05-22 浙江工业大学 一种结构特征向量辅助选择的蛋白质结构预测方法
CN108629151A (zh) * 2018-03-22 2018-10-09 浙江工业大学 一种基于拉氏图的群体蛋白质结构预测方法
CN108647486A (zh) * 2018-03-22 2018-10-12 浙江工业大学 一种基于构象多样性策略的蛋白质三维结构预测方法
CN108647486B (zh) * 2018-03-22 2021-06-18 浙江工业大学 一种基于构象多样性策略的蛋白质三维结构预测方法
CN108629151B (zh) * 2018-03-22 2021-06-18 浙江工业大学 一种基于拉氏图的群体蛋白质结构预测方法
CN108804868A (zh) * 2018-03-30 2018-11-13 浙江工业大学 一种基于二面角熵值的蛋白质两阶段构象空间优化方法
CN108804868B (zh) * 2018-03-30 2021-05-18 浙江工业大学 一种基于二面角熵值的蛋白质两阶段构象空间优化方法
CN108595910A (zh) * 2018-05-09 2018-09-28 浙江工业大学 一种基于多样性指标的群体蛋白质构象空间优化方法
CN108647488B (zh) * 2018-05-09 2021-05-18 浙江工业大学 一种基于局部扰动的群体蛋白质构象空间优化方法
CN108595910B (zh) * 2018-05-09 2021-08-03 浙江工业大学 一种基于多样性指标的群体蛋白质构象空间优化方法
CN108647488A (zh) * 2018-05-09 2018-10-12 浙江工业大学 一种基于局部扰动的群体蛋白质构象空间优化方法
CN108763860B (zh) * 2018-06-07 2021-08-03 浙江工业大学 一种基于Loop信息采样的群体蛋白质构象空间优化方法
CN108763860A (zh) * 2018-06-07 2018-11-06 浙江工业大学 一种基于Loop信息采样的群体蛋白质构象空间优化方法
CN109033744B (zh) * 2018-06-19 2021-08-03 浙江工业大学 一种基于残基距离和接触信息的蛋白质结构预测方法
CN109033744A (zh) * 2018-06-19 2018-12-18 浙江工业大学 一种基于残基距离和接触信息的蛋白质结构预测方法
CN109243526A (zh) * 2018-07-12 2019-01-18 浙江工业大学 一种基于特定片段交叉的蛋白质结构预测方法
CN109509510A (zh) * 2018-07-12 2019-03-22 浙江工业大学 一种基于多种群系综变异策略的蛋白质结构预测方法
CN109509510B (zh) * 2018-07-12 2021-06-18 浙江工业大学 一种基于多种群系综变异策略的蛋白质结构预测方法
CN109326318A (zh) * 2018-07-12 2019-02-12 浙江工业大学 一种基于Loop区域高斯扰动的群体蛋白质结构预测方法
CN109256177A (zh) * 2018-07-12 2019-01-22 浙江工业大学 一种基于子种群协同进化的蛋白质结构预测方法
CN109256177B (zh) * 2018-07-12 2021-04-06 浙江工业大学 一种基于子种群协同进化的蛋白质结构预测方法
CN109326318B (zh) * 2018-07-12 2021-05-18 浙江工业大学 一种基于Loop区域高斯扰动的群体蛋白质结构预测方法
CN109243526B (zh) * 2018-07-12 2021-08-03 浙江工业大学 一种基于特定片段交叉的蛋白质结构预测方法
CN109346128A (zh) * 2018-08-01 2019-02-15 浙江工业大学 一种基于残基信息动态选择策略的蛋白质结构预测方法
CN109346128B (zh) * 2018-08-01 2021-06-18 浙江工业大学 一种基于残基信息动态选择策略的蛋白质结构预测方法
CN109360600B (zh) * 2018-08-28 2021-05-18 浙江工业大学 一种基于残基特征距离的蛋白质结构预测方法
CN109147867A (zh) * 2018-08-28 2019-01-04 浙江工业大学 一种基于动态片段长度的群体蛋白质结构预测方法
CN109215732B (zh) * 2018-08-28 2021-04-06 浙江工业大学 一种基于残基接触信息自学习的蛋白质结构预测方法
CN109215734A (zh) * 2018-08-28 2019-01-15 浙江工业大学 一种基于多轨迹和残基接触信息的蛋白质结构预测方法
CN109215732A (zh) * 2018-08-28 2019-01-15 浙江工业大学 一种基于残基接触信息自学习的蛋白质结构预测方法
CN109360600A (zh) * 2018-08-28 2019-02-19 浙江工业大学 一种基于残基特征距离的蛋白质结构预测方法
CN109147867B (zh) * 2018-08-28 2021-06-18 浙江工业大学 一种基于动态片段长度的群体蛋白质结构预测方法
CN109448785A (zh) * 2018-08-29 2019-03-08 浙江工业大学 一种使用拉氏图增强Loop区域结构的蛋白质结构预测方法
CN109390035B (zh) * 2018-08-29 2021-04-06 浙江工业大学 一种基于局部结构比对的蛋白质构象空间优化方法
CN109300505B (zh) * 2018-08-29 2021-05-18 浙江工业大学 一种基于有偏采样的蛋白质结构预测方法
CN109300505A (zh) * 2018-08-29 2019-02-01 浙江工业大学 一种基于有偏采样的蛋白质结构预测方法
CN109390035A (zh) * 2018-08-29 2019-02-26 浙江工业大学 一种基于局部结构比对的蛋白质构象空间优化方法
CN109461471B (zh) * 2018-08-30 2020-12-01 浙江工业大学 一种基于锦标赛机制的自适应蛋白质结构预测方法
CN109461471A (zh) * 2018-08-30 2019-03-12 浙江工业大学 一种基于锦标赛机制的自适应蛋白质结构预测方法
CN109215733B (zh) * 2018-08-30 2021-05-18 浙江工业大学 一种基于残基接触信息辅助评价的蛋白质结构预测方法
CN109215733A (zh) * 2018-08-30 2019-01-15 浙江工业大学 一种基于残基接触信息辅助评价的蛋白质结构预测方法
CN109872770A (zh) * 2019-01-09 2019-06-11 浙江工业大学 一种结合排挤度评价的多变异策略蛋白质结构预测方法
CN109872770B (zh) * 2019-01-09 2020-10-30 浙江工业大学 一种结合排挤度评价的多变异策略蛋白质结构预测方法
CN110189794A (zh) * 2019-04-16 2019-08-30 浙江工业大学 一种残基接触引导loop扰动的群体蛋白质结构预测方法
CN110189794B (zh) * 2019-04-16 2021-01-01 浙江工业大学 一种残基接触引导loop扰动的群体蛋白质结构预测方法

Also Published As

Publication number Publication date
CN106778059B (zh) 2019-07-30

Similar Documents

Publication Publication Date Title
CN106778059A (zh) 一种基于Rosetta局部增强的群体蛋白质结构预测方法
CN107609342A (zh) 一种基于二级结构空间距离约束的蛋白质构象搜索方法
Alipanahi et al. Determining protein structures from NOESY distance constraints by semidefinite programming
CN106055920B (zh) 一种基于阶段性多策略副本交换的蛋白质结构预测方法
CN110148437A (zh) 一种残基接触辅助策略自适应的蛋白质结构预测方法
CN106650305B (zh) 一种基于局部抽象凸支撑面的多策略群体蛋白质结构预测方法
CN108062457B (zh) 一种结构特征向量辅助选择的蛋白质结构预测方法
CN114503203A (zh) 使用自注意力神经网络的由氨基酸序列的蛋白质结构预测
CN103077226B (zh) 一种多模态蛋白质构象空间搜索方法
Wong et al. Generalizing and learning protein-DNA binding sequence representations by an evolutionary algorithm
CN109524058A (zh) 一种基于差分进化的蛋白质二聚体结构预测方法
CN107491664A (zh) 一种基于信息熵的蛋白质结构从头预测方法
CN109086566A (zh) 一种基于片段重采样的群体蛋白质结构预测方法
CN106096326A (zh) 一种基于质心变异策略的差分进化蛋白质结构预测方法
Al-Haija et al. Supervised regression study for electron microscopy data
Demetci et al. Scotv2: Single-cell multiomic alignment with disproportionate cell-type representation
CN108647486A (zh) 一种基于构象多样性策略的蛋白质三维结构预测方法
CN109360601B (zh) 一种基于排挤策略的多模态蛋白质结构预测方法
CN109872770A (zh) 一种结合排挤度评价的多变异策略蛋白质结构预测方法
CN109360597B (zh) 一种基于全局和局部策略协作的群体蛋白质结构预测方法
CN108920894A (zh) 一种基于简约抽象凸估计的蛋白质构象空间优化方法
CN109346128A (zh) 一种基于残基信息动态选择策略的蛋白质结构预测方法
CN109346126A (zh) 一种下界估计策略自适应蛋白质结构预测方法
CN109509510A (zh) 一种基于多种群系综变异策略的蛋白质结构预测方法
CN109326318B (zh) 一种基于Loop区域高斯扰动的群体蛋白质结构预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant