CN109101785A - 一种基于二级结构相似性选择策略的蛋白质结构预测方法 - Google Patents
一种基于二级结构相似性选择策略的蛋白质结构预测方法 Download PDFInfo
- Publication number
- CN109101785A CN109101785A CN201810762913.5A CN201810762913A CN109101785A CN 109101785 A CN109101785 A CN 109101785A CN 201810762913 A CN201810762913 A CN 201810762913A CN 109101785 A CN109101785 A CN 109101785A
- Authority
- CN
- China
- Prior art keywords
- conformation
- secondary structure
- protein
- prediction
- variation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000455 protein structure prediction Methods 0.000 title claims abstract description 15
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 13
- 238000000034 method Methods 0.000 claims description 27
- 230000008569 process Effects 0.000 claims description 10
- 230000035772 mutation Effects 0.000 claims description 4
- 230000007115 recruitment Effects 0.000 claims description 4
- 238000005070 sampling Methods 0.000 abstract description 6
- 239000012634 fragment Substances 0.000 abstract description 5
- 230000008929 regeneration Effects 0.000 abstract description 2
- 238000011069 regeneration method Methods 0.000 abstract description 2
- 108090000623 proteins and genes Proteins 0.000 description 48
- 102000004169 proteins and genes Human genes 0.000 description 48
- 230000006870 function Effects 0.000 description 11
- 150000001413 amino acids Chemical class 0.000 description 7
- 238000005457 optimization Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- XEEYBQQBJWHFJM-UHFFFAOYSA-N iron Substances [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 3
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 239000010949 copper Substances 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000002050 diffraction method Methods 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 239000011572 manganese Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 108020005087 unfolded proteins Proteins 0.000 description 2
- 239000011701 zinc Substances 0.000 description 2
- QCVGEOXPDFCNHA-UHFFFAOYSA-N 5,5-dimethyl-2,4-dioxo-1,3-oxazolidine-3-carboxamide Chemical compound CC1(C)OC(=O)N(C(N)=O)C1=O QCVGEOXPDFCNHA-UHFFFAOYSA-N 0.000 description 1
- ZCYVEMRRCGMTRW-UHFFFAOYSA-N 7553-56-2 Chemical compound [I] ZCYVEMRRCGMTRW-UHFFFAOYSA-N 0.000 description 1
- ZOXJGFHDIHLPTG-UHFFFAOYSA-N Boron Chemical compound [B] ZOXJGFHDIHLPTG-UHFFFAOYSA-N 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 102000002322 Egg Proteins Human genes 0.000 description 1
- 108010000912 Egg Proteins Proteins 0.000 description 1
- 102000001554 Hemoglobins Human genes 0.000 description 1
- 108010054147 Hemoglobins Proteins 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- PWHULOQIROXLJO-UHFFFAOYSA-N Manganese Chemical compound [Mn] PWHULOQIROXLJO-UHFFFAOYSA-N 0.000 description 1
- ZOKXTWBITQBERF-UHFFFAOYSA-N Molybdenum Chemical compound [Mo] ZOKXTWBITQBERF-UHFFFAOYSA-N 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 239000005864 Sulphur Substances 0.000 description 1
- 238000005411 Van der Waals force Methods 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- -1 amino, carboxyl Chemical group 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 229910052796 boron Inorganic materials 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 150000001721 carbon Chemical group 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000009833 condensation Methods 0.000 description 1
- 230000005494 condensation Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 235000014103 egg white Nutrition 0.000 description 1
- 210000000969 egg white Anatomy 0.000 description 1
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000008595 infiltration Effects 0.000 description 1
- 238000001764 infiltration Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000011630 iodine Substances 0.000 description 1
- 229910052740 iodine Inorganic materials 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 238000001646 magnetic resonance method Methods 0.000 description 1
- 229910052748 manganese Inorganic materials 0.000 description 1
- 229910052750 molybdenum Inorganic materials 0.000 description 1
- 239000011733 molybdenum Substances 0.000 description 1
- 238000010995 multi-dimensional NMR spectroscopy Methods 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 239000005416 organic matter Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000036299 sexual function Effects 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种基于二级结构相似性选择策略的蛋白质结构预测方法,包括以下步骤:首先预测查询序列的二级结构信息,构建片段库;其次建立基于二级结构信息的相似性函数,设计交叉变异策略;最后根据二级结构相似性得分更新种群,利用二级结构相似性能够有效地提高算法采样能力和预测精度。本发明提供一种预测精度较高的蛋白质结构预测方法。
Description
技术领域
本发明涉及生物信息学、智能信息处理、计算机应用领域、蛋白质三级结构预测,尤其涉及的是一种基于二级结构相似性选择策略的蛋白质结构预测方法。
背景技术
蛋白质是组成人体一切细胞、组织的重要成分。机体所有重要的组成部分都需要有蛋白质的参与。一般说,蛋白质约占人体全部质量的18%,最重要的还是其与生命现象有关。
蛋白质(protein)是生命的物质基础,是有机大分子,是构成细胞的基本有机物,是生命活动的主要承担者。没有蛋白质就没有生命。氨基酸是蛋白质的基本组成单位。它是与生命及与各种形式的生命活动紧密联系在一起的物质。机体中的每一个细胞和所有重要组成部分都有蛋白质参与。蛋白质占人体重量的16%~20%,即一个60kg重的成年人其体内约有蛋白质9.6~12kg。人体内蛋白质的种类很多,性质、功能各异,但都是由20多种氨基酸(Amino acid)按不同比例组合而成的,并在体内不断进行代谢与更新。
蛋白质是生命体的重要组成部分,是生命活动的承担者。蛋白质的基本组成单元是氨基酸,自然界中常见的氨基酸有20多种,蛋白质是由C(碳)、H(氢)、O(氧)、N(氮)组成,一般蛋白质可能还会含有P(磷)、S(硫)、Fe(铁)、Zn(锌)、Cu(铜)、B(硼)、Mn(锰)、I(碘)、Mo(钼)等,氨基酸是由中心碳原子及其相连的氨基、羧基、氢原子以及氨基酸的侧链组成,氨基酸经过脱水缩合形成肽键,由肽键连接起来的氨基酸形成一条长链,即为蛋白质。
蛋白质分子在生物细胞化学反应过程中起着至关重要的作用。它们的结构模型和生物活性状态对我们理解和治愈多种疾病有重要的意义。蛋白质只有折叠成特定的三维结构才能产生其特有的生物学功能。要了解蛋白质的功能,就必须获得其三维空间结构。因此,获得蛋白质的三维结构对人类来说是至关重要的,1961年,Anfinsen提出了氨基酸序列决定蛋白质三维结构这一开创新的理论。而三维结构直接决定了蛋白质的生物性功能,所以人们对蛋白质的三维结构产生了浓厚兴趣并展开研究。国外学者肯德鲁和佩鲁茨对肌血蛋白和血红蛋白进行了结构分析,得到其蛋白质三维结构,是人类第一次测定蛋白质的三维结构,二人借此夺得年诺贝尔化学奖。此外,英国晶体学家Bernal与1958年提出了蛋白质四级结构的概念,将其定义为蛋白质一级结构、二级结构以及三级结构的延伸发展。多维核磁共振方法和射线晶体方法是近些年来发展起来的两个最主要的测定蛋白质结构的实验方法。多维核磁共振方法是将蛋白质放在水中,利用核磁共振直接测定其三维结构的方法。而射线晶体方法是目前为止最有效的蛋白质三维结构测定手段。到前为止,使用这两种方法测定的蛋白质占了已测蛋白质中的绝大比例。由于釆用实验方法的条件有限、时间有限,需要花费大量的人力和物力,而且测定的速度远远跟不上序列的测定速度,所以急需一种既不依赖化学实验,又具有一定准确率的预测方法。这样如何简便、快速、高效地对未知蛋白质进行三维结构预测,成为研究者的棘手问题。在理论探索和应用需求的双重推动下,依据提出的蛋白质一级结构决定蛋白质三维结构的理论,利用计算机设计适当的算法,以序列为起点,三维结构为目标的蛋白质结构预测自20世纪末蓬勃发展。
以序列为起点,利用计算机和优化算法预测蛋白质的三维结构被称之为从头预测。从头预测方法直接基于蛋白质物理或知识能量模型,利用优化算法在构象空间搜索全局最低能量构象解。构象空间优化(或称采样)方法是目前制约蛋白质结构从头预测精度最关键的因素之一。优化算法应用于从头预测采样过程必须首先解决以下三个方面的问题:(1)能量模型的复杂性。蛋白质能量模型考虑分子体系成键作用以及范德华力、静电、氢键、疏水等非成键作用,致使其形成的能量曲面极其粗糙,局部极小解数量随着序列长度的增加呈指数增长;能量模型的漏斗特性也必然会产生局部高能量障碍,导致算法极易陷入局部解。(2)能量模型高维特性。就目前而言,从头预测方法只能应对尺寸较小的目标蛋白,一般不超过100。对尺寸超过150残基以上的目标蛋白,现有优化方法均无能为力。这也就进一步说明了随着尺寸规模的增加,必然造成维数灾问题,完成如此浩瀚的构象搜索过程所涉及的计算量是目前最先进的计算机也难以承受的。(3)能量模型的不精确性。对于蛋白质这类复杂的生物大分子,除了考虑各种物理成键和知识推理的作用之外,还要考虑它与周围溶剂分子的相互作用,目前还无法给出精确的物理描述。考虑到计算代价问题,近十年来研究者陆续提出了一些基于物理的力场简化模型(AMBER,CHARMM等)、基于知识的力场简化模型(Rosetta,QUARK等)。然而,我们还远远无法构建起能引导目标序列朝正确方向折叠的足够精确力场,导致数学上的最优解并不一定对应于目标蛋白的天然态结构;此外,模型的不精确性也必然会导致无法对算法性能进行客观地分析,从而阻碍了高性能算法在蛋白质结构从头预测领域中的应用。
因此,现在的蛋白质结构预测方法在预测精度和能量函数方面存在着缺陷,需要改进。
发明内容
为了克服现有的蛋白质结构预测方法能量函数不精确和预测精度较低的缺陷,本发明提供一种预测精度较高的基于二级结构相似性选择策略的蛋白质结构预测方法。
本发明解决其技术问题所采用的技术方案是:
一种基于二级结构相似性选择策略的蛋白质结构预测方法,所述方法包括以下步骤:
1)设置种群规模NP、迭代次数G、交叉概率CR、玻尔兹曼温度因子KT,输入查询序列,片段库,预测的二级结构信息,迭代次数g=0;
2)对种群所有构象进行初始化,对种群中每个构象进行片段组装,直到构象的每个残基的二面角至少被替换过一次;
3)构象交叉,操作如下:
3.1)选第i,i∈[1,NP]个构象Ci为目标构象,产生一个随机数r,r∈[0,1],如果r小于CR,则跳到3.2),否则跳至步骤4);
3.2)随机选择一个构象Cj,j≠i,根据Ci残基位置随机选择一个交叉点p,产生一个随机数r′,r′∈[3,9];
3.3)针对构象Ci和Cj,从交叉点p开始互换r′个二面角对,产生两个构象C′i和C′j,并用Rosetta能量函数“score3”分别计算其能量值;
4)构象变异,对构象C′i和C′j,变异过程如下:
4.1)对构象C′i和C′j进行9残基片段组装,生成两个构象C″i和C″j,并用Rosetta能量函数“score3”分别计算其能量值,若变异后的能量值比变异前能量值变小,则接收变异构象C″i和C″j,若能量值变大,则以Boltzmann概率接收变异后个体C″i和C″j,其中ΔE为片段组装前后构象的能量差值;
4.2)分别对构象Ci、C″i和C″j求二级结构相似性分值Ess:
其中L是查询序列长度,是查询序列query第l个残基预测的二级结构,是测试构象第l个残基的二级结构,其值由计算二级结构算法DSSP求得;
4.3)从构象Ci、C″i和C″j中选择二级结构相似得分E′ss最高的构象作为变异成功构象;
5)基于二级结构相似性进行选择,过程如下:
5.1)对种群中的每个构象求二级结构相似性分值Ess,并求出最小的二级结构相似性分值E″ss;
5.2)如果E′ss大于E″ss,则用E′ss对应得构象替换E″ss对应得构象实现种群更新;
6)g=g+1,判断是否达到最大得迭代次数G,若不满足条件终止条件,则i+1返回步骤3),否则输出最后预测结果。
本发明的技术构思为:一种基于二级结构相似性选择策略的蛋白质结构预测方法,包括以下步骤:首先预测查询序列的二级结构信息,构建片段库;其次建立基于二级结构信息的相似性函数,设计交叉变异策略;最后根据二级结构相似性得分更新种群,利用二级结构相似性能够有效地提高算法采样能力和预测精度。
本发明的有益效果为:构象空间采样能力较强、能够有效地减小构象搜索空间、精度较高。
附图说明
图1是蛋白质1GB1构象采样能力分布图。
图2是蛋白质1GB1利用基于二级结构相似性蛋白质三级结构预测方法预测得到的三维结构示意图。
具体实施方式
下面结合附图对本发明做进一步描述。
参照图1和图2,一种基于二级结构相似性选择策略的蛋白质结构预测方法,包括以下步骤:
1)设置种群规模NP、迭代次数G、交叉概率CR、玻尔兹曼温度因子KT,输入查询序列,片段库,预测的二级结构信息,迭代次数g=0;
2)对种群所有构象进行初始化,对种群中每个构象进行片段组装,直到构象的每个残基的二面角至少被替换过一次;
3)构象交叉,操作如下:
3.1)选第i,i∈[1,NP]个构象Ci为目标构象,产生一个随机数r,r∈[0,1],如果r小于CR,则跳到3.2),否则跳至步骤4);
3.2)随机选择一个构象Cj,j≠i,根据Ci残基位置随机选择一个交叉点p,产生一个随机数r′,r′∈[3,9];
3.3)针对构象Ci和Cj,从交叉点p开始互换r′个二面角对,产生两个构象C′i和C′j,并用Rosetta能量函数“score3”分别计算其能量值;
4)构象变异,对构象C′i和C′j,变异过程如下:
4.1)对构象C′i和C′j进行9残基片段组装,生成两个构象C″i和C″j,并用Rosetta能量函数“score3”分别计算其能量值,若变异后的能量值比变异前能量值变小,则接收变异构象C″i和C″j,若能量值变大,则以Boltzmann概率接收变异后个体C″i和C″j,其中ΔE为片段组装前后构象的能量差值;
4.2)分别对构象Ci、C″i和C″j求二级结构相似性分值Ess:
其中L是查询序列长度,是查询序列query第l个残基预测的二级结构,是测试构象第l个残基的二级结构,其值由计算二级结构算法DSSP求得;
4.3)从构象Ci、C″i和C″j中选择二级结构相似得分E′ss最高的构象作为变异成功构象;
5)基于二级结构相似性进行选择,过程如下:
5.1)对种群中的每个构象求二级结构相似性分值Ess,并求出最小的二级结构相似性分值E″ss;
5.2)如果E′ss大于E″ss,则用E′ss对应得构象替换E″ss对应得构象实现种群更新;
6)g=g+1,判断是否达到最大得迭代次数G,若不满足条件终止条件,则i+1返回步骤3),否则输出最后预测结果。
本实施例以序列长度为56的α/β折叠蛋白质1GB1为实施例,一种基于二级结构相似性选择策略的蛋白质结构预测方法,所述方法包括以下步骤:
1)设置种群规模100、迭代次数1000、交叉概率0.5、玻尔兹曼温度因子2,输入查询序列,片段库,预测的二级结构信息,迭代次数g=0;
2)对种群所有构象进行初始化,对种群中每个构象进行片段组装,直到构象的每个残基的二面角至少被替换过一次;
3)构象交叉,操作如下:
3.1)选第i,i∈[1,NP]个构象Ci为目标构象,产生一个随机数r,r∈[0,1],如果r小于0.5,则跳到3.2),否则跳至步骤4);
3.2)随机选择一个构象Cj,j≠i,根据Ci残基位置随机选择一个交叉点p,产生一个随机数r′,r′∈[3,9];
3.3)针对构象Ci和Cj,从交叉点p开始互换r′个二面角对,产生两个构象C′i和C′j,并用Rosetta能量函数“score3”分别计算其能量值;
4)构象变异,对构象C′i和C′j,变异过程如下:
4.1)对构象C′i和C′j进行9残基片段组装,生成两个构象C″i和C″j,并用Rosetta能量函数“score3”分别计算其能量值,若变异后的能量值比变异前能量值变小,则接收变异构象C″i和C″j,若能量值变大,则以Boltzmann概率接收变异后个体C″i和C″j,其中ΔE为片段组装前后构象的能量差值;
4.2)分别对构象Ci、C″i和C″j求二级结构相似性分值Ess:
其中L是查询序列长度,是查询序列query第l个残基预测的二级结构,是测试构象第l个残基的二级结构,其值由计算二级结构算法DSSP求得;
4.3)从构象Ci、C″i和C″j中选择二级结构相似得分E′ss最高的构象作为变异成功构象;
5)基于二级结构相似性进行选择,过程如下:
5.1)对种群中的每个构象求二级结构相似性分值Ess,并求出最小的二级结构相似性分值E″ss;
5.2)如果E′ss大于E″ss,则用E′ss对应得构象替换E″ss对应得构象实现种群更新;
6)g=g+1,判断是否达到最大得迭代次数G,若不满足条件终止条件,则i+1返回步骤3),否则输出最后预测结果。
以序列长度为56的α/β折叠蛋白质1GB1为实施例,运用以上方法得到了该蛋白质的近天然态构象,最小均方根偏差为平均均方根偏差为预测结构如图2所示。
以上说明是本发明以1GB1蛋白质为实例所得出的优良效果,显然本发明不仅适合上述实施例,在不偏离本发明基本内容所涉及范围的前提下对其做各种变形和改进,不应排除在本发明的保护范围之外。
Claims (1)
1.一种基于二级结构相似性选择策略的蛋白质结构预测方法,其特征在于:所述包括以下步骤:
1)设置种群规模NP、迭代次数G、交叉概率CR、玻尔兹曼温度因子KT,输入查询序列,片段库,预测的二级结构信息,迭代次数g=0;
2)对种群所有构象进行初始化,对种群中每个构象进行片段组装,直到构象的每个残基的二面角至少被替换过一次;
3)构象交叉,操作如下:
3.1)选第i,i∈[1,NP]个构象Ci为目标构象,产生一个随机数r,r∈[0,1],如果r小于CR,则跳到3.2),否则跳至步骤4);
3.2)随机选择一个构象Cj,j≠i,根据Ci残基位置随机选择一个交叉点p,产生一个随机数r′,r′∈[3,9];
3.3)针对构象Ci和Cj,从交叉点p开始互换r′个二面角对,产生两个构象C′i和C′j,并用Rosetta能量函数“score3”分别计算其能量值;
4)构象变异,对构象C′i和C′j,变异过程如下:
4.1)对构象C′i和C′j进行9残基片段组装,生成两个构象C″i和C″j,并用Rosetta能量函数“score3”分别计算其能量值,若变异后的能量值比变异前能量值变小,则接收变异构象C″i和C″j,若能量值变大,则以Boltzmann概率接收变异后个体C″i和C″j,其中ΔE为片段组装前后构象的能量差值;
4.2)分别对构象Ci、C″i和C″j求二级结构相似性分值Ess:
其中L是查询序列长度,是查询序列query第l个残基预测的二级结构,是测试构象第l个残基的二级结构,其值由计算二级结构算法DSSP求得;
4.3)从构象Ci、C″i和C″j中选择二级结构相似得分E′ss最高的构象作为变异成功构象;
5)基于二级结构相似性进行选择,过程如下:
5.1)对种群中的每个构象求二级结构相似性分值Ess,并求出最小的二级结构相似性分值E″ss;
5.2)如果E′ss大于E″ss,则用E′ss对应得构象替换E″ss对应得构象实现种群更新;
6)g=g+1,判断是否达到最大得迭代次数G,若不满足条件终止条件,则i+1返回步骤3),否则输出最后预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810762913.5A CN109101785B (zh) | 2018-07-12 | 2018-07-12 | 一种基于二级结构相似性选择策略的蛋白质结构预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810762913.5A CN109101785B (zh) | 2018-07-12 | 2018-07-12 | 一种基于二级结构相似性选择策略的蛋白质结构预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109101785A true CN109101785A (zh) | 2018-12-28 |
CN109101785B CN109101785B (zh) | 2021-06-18 |
Family
ID=64846157
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810762913.5A Active CN109101785B (zh) | 2018-07-12 | 2018-07-12 | 一种基于二级结构相似性选择策略的蛋白质结构预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109101785B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110729023A (zh) * | 2019-08-29 | 2020-01-24 | 浙江工业大学 | 一种基于二级结构元素接触辅助的蛋白质结构预测方法 |
CN111951885A (zh) * | 2020-08-11 | 2020-11-17 | 湖南大学 | 一种基于局部有偏的蛋白质结构预测方法 |
CN114121146A (zh) * | 2021-11-29 | 2022-03-01 | 山东建筑大学 | 一种基于并行和蒙特卡罗策略的rna三级结构预测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106599611A (zh) * | 2016-12-09 | 2017-04-26 | 中南大学 | 蛋白质功能标注方法及系统 |
WO2017158371A1 (en) * | 2016-03-18 | 2017-09-21 | University Of Bath | Protein structure analysis based on red-edge excitation shift (rees) spectroscopy |
CN107609342A (zh) * | 2017-08-11 | 2018-01-19 | 浙江工业大学 | 一种基于二级结构空间距离约束的蛋白质构象搜索方法 |
US20180071400A1 (en) * | 2016-09-02 | 2018-03-15 | New York University | Immunogenic polypeptides |
-
2018
- 2018-07-12 CN CN201810762913.5A patent/CN109101785B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017158371A1 (en) * | 2016-03-18 | 2017-09-21 | University Of Bath | Protein structure analysis based on red-edge excitation shift (rees) spectroscopy |
US20180071400A1 (en) * | 2016-09-02 | 2018-03-15 | New York University | Immunogenic polypeptides |
CN106599611A (zh) * | 2016-12-09 | 2017-04-26 | 中南大学 | 蛋白质功能标注方法及系统 |
CN107609342A (zh) * | 2017-08-11 | 2018-01-19 | 浙江工业大学 | 一种基于二级结构空间距离约束的蛋白质构象搜索方法 |
Non-Patent Citations (2)
Title |
---|
MA Y: ""Protein Secondary Structure Prediction Based on Data Partition and Semi-Random Subspace Method"", 《SCIENTIFIC REPORTS》 * |
周鹏杰: ""基于可持续更新模板库的蛋白质二级结构预测器"", 《计算机生物学》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110729023A (zh) * | 2019-08-29 | 2020-01-24 | 浙江工业大学 | 一种基于二级结构元素接触辅助的蛋白质结构预测方法 |
CN110729023B (zh) * | 2019-08-29 | 2021-04-06 | 浙江工业大学 | 一种基于二级结构元素接触辅助的蛋白质结构预测方法 |
CN111951885A (zh) * | 2020-08-11 | 2020-11-17 | 湖南大学 | 一种基于局部有偏的蛋白质结构预测方法 |
CN114121146A (zh) * | 2021-11-29 | 2022-03-01 | 山东建筑大学 | 一种基于并行和蒙特卡罗策略的rna三级结构预测方法 |
CN114121146B (zh) * | 2021-11-29 | 2023-10-03 | 山东建筑大学 | 一种基于并行和蒙特卡罗策略的rna三级结构预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109101785B (zh) | 2021-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109101785A (zh) | 一种基于二级结构相似性选择策略的蛋白质结构预测方法 | |
CN105740626B (zh) | 一种基于机器学习的药物活性预测方法 | |
CN107729717B (zh) | 一种计算机模拟获取g蛋白偶联受体中间态结构的方法 | |
CN104915561A (zh) | 疾病特征智能匹配方法 | |
CN106233332A (zh) | 瘠瘦组织体积量化 | |
CN109086565A (zh) | 一种基于残基间接触约束的蛋白质结构预测方法 | |
Holliday et al. | Right for the wrong reasons: Reflections on modern human origins in the post-Neanderthal genome era | |
Taylor et al. | Patterns of intersecting fiber arrays revealed in whole muscle with generalized Q-space imaging | |
Colombo et al. | Machine learning approaches for prediction of bipolar disorder based on biological, clinical and neuropsychological markers: A systematic review and meta-analysis | |
Maheshwari et al. | Machine learning applied to diabetes dataset using Quantum versus Classical computation | |
Bazinet et al. | Assortative mixing in micro-architecturally annotated brain connectomes | |
CN108647486A (zh) | 一种基于构象多样性策略的蛋白质三维结构预测方法 | |
CN109360599A (zh) | 一种基于残基接触信息交叉策略的蛋白质结构预测方法 | |
Chen et al. | Imaging of the spinal cord in multiple sclerosis: past, present, future | |
Bøgh et al. | Initial Experience on Hyperpolarized [1-13C] Pyruvate MRI Multicenter Reproducibility—Are Multicenter Trials Feasible? | |
Tripathi et al. | Diffusion tensor and dynamic contrast-enhanced magnetic resonance imaging correlate with molecular markers of inflammation in the synovium | |
Wei et al. | “No Pain No Gain”: evidence from a parcel-wise brain morphometry study on the volitional quality of elite athletes | |
Radke et al. | Chemical Exchange Saturation Transfer for Lactate-Weighted Imaging at 3 T MRI: Comprehensive in Silico, in vitro, in situ, and in vivo evaluations | |
CN109378035A (zh) | 一种基于二级结构动态选择策略的蛋白质结构预测方法 | |
Sanader Maršić et al. | Insights into interactions between interleukin-6 and dendritic polyglycerols | |
CN109002691A (zh) | 一种基于玻尔兹曼更新策略的蛋白质结构预测方法 | |
CN109326320A (zh) | 一种系综构象选择策略自适应的蛋白质结构预测方法 | |
CN109300506A (zh) | 一种基于特定距离约束的蛋白质结构预测方法 | |
CN105842641A (zh) | 一种基于1h-19f-31p原子核的多通道三维核磁共振成像方法 | |
Lecina et al. | 768-km Multi-Stage Ultra-Trail Case Study-Muscle Damage, Biochemical Alterations and Strength Loss on Lower Limbs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20181228 Assignee: ZHEJIANG ORIENT GENE BIOTECH CO.,LTD. Assignor: JIANG University OF TECHNOLOGY Contract record no.: X2023980053610 Denomination of invention: A protein structure prediction method based on secondary structure similarity selection strategy Granted publication date: 20210618 License type: Common License Record date: 20231222 |
|
EE01 | Entry into force of recordation of patent licensing contract |