CN110634531A - 一种基于双层偏置搜索的蛋白质结构预测方法 - Google Patents

一种基于双层偏置搜索的蛋白质结构预测方法 Download PDF

Info

Publication number
CN110634531A
CN110634531A CN201910743322.8A CN201910743322A CN110634531A CN 110634531 A CN110634531 A CN 110634531A CN 201910743322 A CN201910743322 A CN 201910743322A CN 110634531 A CN110634531 A CN 110634531A
Authority
CN
China
Prior art keywords
energy
individual
subinterval
population
new
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910743322.8A
Other languages
English (en)
Other versions
CN110634531B (zh
Inventor
张贵军
夏瑜豪
赵凯龙
刘俊
彭春祥
周晓根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201910743322.8A priority Critical patent/CN110634531B/zh
Publication of CN110634531A publication Critical patent/CN110634531A/zh
Application granted granted Critical
Publication of CN110634531B publication Critical patent/CN110634531B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/20Protein or domain folding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Complex Calculations (AREA)

Abstract

一种基于双层偏置搜索的蛋白质结构预测方法,在遗传算法框架下,首先,种群初始化,根据构象的能量高低将其分配到不同的能量区间;然后,根据能量以及空间结构差异性双层选择指标有偏地选择父代和淘汰构象,不仅能够缓解能量函数不精确的问题,而且可以根据有偏采样搜索到结构更为合理的构象,在提高采样效率的同时,提升了预测精度。本发明提供一种预测精度较高的基于双层偏置搜索的蛋白质结构预测方法。

Description

一种基于双层偏置搜索的蛋白质结构预测方法
技术领域
本发明涉及生物信息学、计算机应用领域,尤其涉及的是一种基于双层偏置搜索的蛋白质结构预测方法。
背景技术
蛋白质分子是细胞中许多生化过程的核心。蛋白质只有折叠成特定的三维结构才能行使其生物学功能。因此,要了解蛋白质的功能,就必须获得其三维结构。由此,人们开始了对蛋白质三维结构的不断探索。
近几年来,测定蛋白质的三维结构主要采用生物湿实验的方法,例如:X射线衍射、核磁共振、冷冻电镜。但是,这些实验方法需要花费大量的人力、物力、财力,而且测定的速度远远跟不上序列获取的速度。因此,急需一种高效、快速、简便的方法对未知蛋白质进行结构预测。并且,Anfinsen在1961年提出,蛋白质链中氨基酸的序列决定了其具有生物活性的空间排列。因此,人们提出了一种利用计算机技术根据蛋白质的氨基酸序列预测蛋白质三维结构的方法。根据氨基酸序列预测蛋白质三维结构的方法主要有同源建模法和从头预测法。从头预测方法直接基于蛋白质的物理或知识能量模型,利用优化算法在构象空间中搜索全局最优解。
但是,蛋白质的构象空间极其庞大且复杂,现有的方法往往存在两大缺陷:一方面由于能量函数不精确,导致无法准确地找到令人满意的结果;另一方面在于目前的优化方法采样能力不足,极其容易陷入局部极小值,从而影响整体的预测精度。
因此,现有的蛋白质结构预测方法存在能量函数不精确、采样效率低、预测精度不足等问题,需要改进。
发明内容
为了克服现有的蛋白质结构预测方法采样效率低、种群多样性差、预测精度不足等问题,本发明提供一种基于双层偏置搜索的蛋白质结构预测方法,在基本遗传算法框架下,利用能量和空间结构差异性构成的双层搜索策略,对构象进行有偏搜索及排挤,从而提高了采样效率,增加了种群多样性,改善了整体的预测精度。
本发明解决其技术问题所采用的技术方案是:
一种基于双层偏置搜索的蛋白质结构预测方法,所述方法包括以下步骤:
1)输入目标蛋白质的序列信息;
2)根据目标蛋白质序列从ROBETTA服务器(http://www.robetta.org/)上获取3片段和9片段的片段库文件;
3)设置参数:种群规模NP,最大迭代次数G,能量区间划分个数M,温度因子β;
4)种群初始化:利用Rosetta协议第一阶段产生种群规模为NP的种群C={C1,C2,...,CNP},其中Ci,i=1,2,...,NP为第i个个体;
5)设置g=1,g∈{1,2,...,G};
6)设置n=1,n∈{1,2,...,NP};
7)记Ci为种群中第i个个体,i∈{1,2,...,NP+n-1},并进行如下操作:
7.1)用Rosetta score3能量函数计算种群中每个个体的能量,个体Ci的能量为score3(Ci);
7.2)记Emin和Emax分别为种群中的最低能量和最高能量,设置能量区间[Emin,Emax],将能量区间等分成M个子区间,每个子区间长度为ΔE,第m个子区间表示为[Emin+(m-1)ΔE,Emin+mΔE],m∈{1,2,...,M},记Ωm为第m个子区间对应的构象集合,并设置
Figure BDA0002164724830000022
7.3)将种群中的每个个体按能量值分配到相应的子区间内,若score3(Ci)∈[Emin+(m-1)ΔE,Emin+mΔE],则Ωm=Ωm∪{Ci};
8)父代选择操作,过程如下:
8.1)记Cm,j为第m个能量子区间中的第j个个体,j∈{1,2,...,|Ωm|},按如下公式计算每个能量子区间中的构象平均能量
Figure BDA0002164724830000023
Figure BDA0002164724830000024
8.2)按如下公式计算每个能量子区间的选择概率,ε是一个很小的常数:
Figure BDA0002164724830000031
8.3)按公式(2)计算的概率选择一个能量子区间;
8.4)在选择的子区间内,将每个构象的质心原子、离ctd最近的原子、离ctd最远的原子、离fct最远的原子的坐标分别表示为
Figure BDA0002164724830000032
Figure BDA0002164724830000033
Figure BDA0002164724830000034
表示ctd指向cst的三维空间向量,
Figure BDA0002164724830000035
表示ctd指向fct的三维空间向量,
Figure BDA0002164724830000036
表示ctd指向ftf的三维空间向量,按如下公式计算选择的子区间内每个构象的结构差异性,并记Cm,max为具有最大结构差异性数值Dm,max的构象:
Figure BDA0002164724830000037
8.5)按如下公式计算子区间内每个个体的选择概率,ε是一个很小的常数:
Figure BDA0002164724830000038
8.6)按公式(4)计算的概率选择一个个体,记作Cselected
9)变异操作,过程如下:
9.1)在最大差异性构象Cm,max中随机选取一个3片段,替换到选择个体Cselected的对应位置上,生成新的构象Cnew
9.2)利用Rosetta对新构象Cnew进行一次片段组装,生成构象Cnew′
9.3)若score3(Cnew′)<score3(Cnew),则C=C∪{Cnew′};否则计算接收概率
Figure BDA0002164724830000039
并生成均匀随机小数rand,rand∈[0,1],若rand<Paccept,则C=C∪{Cnew′};否则C=C∪{Cnew};
9.4)设置n=n+1;
10)若n>NP,则继续步骤11);否则转至步骤7);
11)淘汰个体选择操作,过程如下:
11.1)执行步骤7);
11.2)执行步骤8.1);
11.3)按如下公式计算每个能量子区间的选择概率,ε是一个很小的常数:
Figure BDA0002164724830000041
11.4)按公式(5)计算的概率选择一个能量子区间;
11.5)执行步骤8.4);
11.6)按如下公式计算子区间内每个个体的选择概率,ε是一个很小的常数:
Figure BDA0002164724830000042
11.7)按公式(6)计算的概率选择一个个体,将其从种群中剔除;
11.8)设置n=n-1;
12)若n=1,设置g=g+1;否则转至步骤11);
13)若g>G,输出最后一代种群C,并选择能量最低的构象作为预测结果;否则转至步骤6)。
本发明的技术构思为:在遗传算法框架下,首先,种群初始化,根据构象的能量高低将其分配到不同的能量区间;其次,根据能量以及空间结构差异性双层选择指标有偏地选择父代进行变异和片段组装得到新构象加入种群;然后,根据两个选择概率函数淘汰构象,实现种群更新;最后,输出最终一代种群。基于双层偏置搜索的蛋白质结构预测方法不仅能够缓解能量函数不精确的问题,而且可以根据有偏采样搜索到结构更为合理的构象,在提高采样效率的同时,提升了预测精度。
本发明的有益效果为:根据双层偏置搜索策略提高了采样效率;使用能量以及空间结构差异性函数缓解了仅以单一能量函数评价构象的缺陷,增加了种群多样性,从而提高了整体预测精度。
附图说明
图1是一种基于双层偏置搜索的蛋白质结构预测方法对蛋白质1C8C进行结构预测时的构象更新示意图。
图2是一种基于双层偏置搜索的蛋白质结构预测方法对蛋白质1C8C进行结构预测得到的三维结构图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1和图2,一种基于双层偏置搜索的蛋白质结构预测方法,所述方法包括以下步骤:
1)输入目标蛋白质的序列信息;
2)根据目标蛋白质序列从ROBETTA服务器(http://www.robetta.org/)上获取3片段和9片段的片段库文件;
3)设置参数:种群规模NP,最大迭代次数G,能量区间划分个数M,温度因子β;
4)种群初始化:利用Rosetta协议第一阶段产生种群规模为NP的种群C={C1,C2,...,CNP},其中Ci,i=1,2,...,NP为第i个个体;
5)设置g=1,g∈{1,2,...,G};
6)设置n=1,n∈{1,2,...,NP};
7)记Ci为种群中第i个个体,i∈{1,2,...,NP+n-1},并进行如下操作:
7.1)用Rosetta score3能量函数计算种群中每个个体的能量,个体Ci的能量为score3(Ci);
7.2)记Emin和Emax分别为种群中的最低能量和最高能量,设置能量区间[Emin,Emax],将能量区间等分成M个子区间,每个子区间长度为ΔE,
Figure BDA0002164724830000051
第m个子区间表示为[Emin+(m-1)ΔE,Emin+mΔE],m∈{1,2,...,M},记Ωm为第m个子区间对应的构象集合,并设置
7.3)将种群中的每个个体按能量值分配到相应的子区间内,若score3(Ci)∈[Emin+(m-1)ΔE,Emin+mΔE],则Ωm=Ωm∪{Ci};
8)父代选择操作,过程如下:
8.1)记Cm,j为第m个能量子区间中的第j个个体,j∈{1,2,...,|Ωm|},按如下公式计算每个能量子区间中的构象平均能量
Figure BDA0002164724830000061
Figure BDA0002164724830000062
8.2)按如下公式计算每个能量子区间的选择概率,ε是一个很小的常数:
Figure BDA0002164724830000063
8.3)按公式(2)计算的概率选择一个能量子区间;
8.4)在选择的子区间内,将每个构象的质心原子、离ctd最近的原子、离ctd最远的原子、离fct最远的原子的坐标分别表示为
Figure BDA0002164724830000064
Figure BDA0002164724830000065
Figure BDA0002164724830000066
表示ctd指向cst的三维空间向量,表示ctd指向fct的三维空间向量,表示ctd指向ftf的三维空间向量,按如下公式计算选择的子区间内每个构象的结构差异性,并记Cm,max为具有最大结构差异性数值Dm,max的构象:
Figure BDA0002164724830000069
8.5)按如下公式计算子区间内每个个体的选择概率,ε是一个很小的常数:
Figure BDA00021647248300000610
8.6)按公式(4)计算的概率选择一个个体,记作Cselected
9)变异操作,过程如下:
9.1)在最大差异性构象Cm,max中随机选取一个3片段,替换到选择个体Cselected的对应位置上,生成新的构象Cnew
9.2)利用Rosetta对新构象Cnew进行一次片段组装,生成构象Cnew′
9.3)若score3(Cnew′)<score3(Cnew),则C=C∪{Cnew′};否则计算接收概率
Figure BDA0002164724830000071
并生成均匀随机小数rand,rand∈[0,1],若rand<Paccept,则C=C∪{Cnew′};否则C=C∪{Cnew};
9.4)设置n=n+1;
10)若n>NP,则继续步骤11);否则转至步骤7);
11)淘汰个体选择操作,过程如下:
11.1)执行步骤7);
11.2)执行步骤8.1);
11.3)按如下公式计算每个能量子区间的选择概率,ε是一个很小的常数:
Figure BDA0002164724830000072
11.4)按公式(5)计算的概率选择一个能量子区间;
11.5)执行步骤8.4);
11.6)按如下公式计算子区间内每个个体的选择概率,ε是一个很小的常数:
Figure BDA0002164724830000073
11.7)按公式(6)计算的概率选择一个个体,将其从种群中剔除;
11.8)设置n=n-1;
12)若n=1,设置g=g+1;否则转至步骤11);
13)若g>G,输出最后一代种群C,并选择能量最低的构象作为预测结果;否则转至步骤6)。
本实施例以序列长度为80的蛋白质1C8C为实施例,一种基于双层偏置搜索的蛋白质结构预测方法,所述方法包括以下步骤:
1)输入目标蛋白质1C8C的序列信息;
2)根据目标蛋白质序列从ROBETTA服务器(http://www.robetta.org/)上获取3片段和9片段的片段库文件;
3)设置参数:种群规模NP=1000,最大迭代次数G=100,能量区间划分个数M=100,温度因子β=2;
4)种群初始化:利用Rosetta协议第一阶段产生种群规模为NP的种群C={C1,C2,...,CNP},其中Ci,i=1,2,...,NP为第i个个体;
5)设置g=1,g∈{1,2,...,G};
6)设置n=1,n∈{1,2,...,NP};
7)记Ci为种群中第i个个体,i∈{1,2,...,NP+n-1},并进行如下操作:
7.1)用Rosetta score3能量函数计算种群中每个个体的能量,个体Ci的能量为score3(Ci);
7.2)记Emin和Emax分别为种群中的最低能量和最高能量,设置能量区间[Emin,Emax],将能量区间等分成M个子区间,每个子区间长度为ΔE,
Figure BDA0002164724830000081
第m个子区间表示为[Emin+(m-1)ΔE,Emin+mΔE],m∈{1,2,...,M},记Ωm为第m个子区间对应的构象集合,并设置
Figure BDA0002164724830000082
7.3)将种群中的每个个体按能量值分配到相应的子区间内,若score3(Ci)∈[Emin+(m-1)ΔE,Emin+mΔE],则Ωm=Ωm∪{Ci};
8)父代选择操作,过程如下:
8.1)记Cm,j为第m个能量子区间中的第j个个体,j∈{1,2,...,|Ωm|},按如下公式计算每个能量子区间中的构象平均能量
Figure BDA0002164724830000083
Figure BDA0002164724830000084
8.2)按如下公式计算每个能量子区间的选择概率,ε是一个很小的常数:
Figure BDA0002164724830000085
8.3)按公式(2)计算的概率选择一个能量子区间;
8.4)在选择的子区间内,将每个构象的质心原子、离ctd最近的原子、离ctd最远的原子、离fct最远的原子的坐标分别表示为
Figure BDA0002164724830000086
Figure BDA0002164724830000087
Figure BDA0002164724830000091
表示ctd指向cst的三维空间向量,表示ctd指向fct的三维空间向量,
Figure BDA0002164724830000093
表示ctd指向ftf的三维空间向量,按如下公式计算选择的子区间内每个构象的结构差异性,并记Cm,max为具有最大结构差异性数值Dm,max的构象:
Figure BDA0002164724830000094
8.5)按如下公式计算子区间内每个个体的选择概率,ε是一个很小的常数:
Figure BDA0002164724830000095
8.6)按公式(4)计算的概率选择一个个体,记作Cselected
9)变异操作,过程如下:
9.1)在最大差异性构象Cm,max中随机选取一个3片段,替换到选择个体Cselected的对应位置上,生成新的构象Cnew
9.2)利用Rosetta对新构象Cnew进行一次片段组装,生成构象Cnew′
9.3)若score3(Cnew′)<score3(Cnew),则C=C∪{Cnew′};否则计算接收概率
Figure BDA0002164724830000096
并生成均匀随机小数rand,rand∈[0,1],若rand<Paccept,则C=C∪{Cnew′};否则C=C∪{Cnew};
9.4)设置n=n+1;
10)若n>NP,则继续步骤11);否则转至步骤7);
11)淘汰个体选择操作,过程如下:
11.1)执行步骤7);
11.2)执行步骤8.1);
11.3)按如下公式计算每个能量子区间的选择概率,ε是一个很小的常数:
Figure BDA0002164724830000101
11.4)按公式(5)计算的概率选择一个能量子区间;
11.5)执行步骤8.4);
11.6)按如下公式计算子区间内每个个体的选择概率,ε是一个很小的常数:
Figure BDA0002164724830000102
11.7)按公式(6)计算的概率选择一个个体,将其从种群中剔除;
11.8)设置n=n-1;
12)若n=1,设置g=g+1;否则转至步骤11);
13)若g>G,输出最后一代种群C,并选择能量最低的构象作为预测结果;否则转至步骤6)。
以序列长度为80的蛋白质1C8C为实施例,运用以上方法得到了该蛋白质的近天然态构象,其构象更新示意图如图1所示,运行100代后所得到的结构与天然态结构之间的平均均方根偏差为
Figure BDA0002164724830000103
最小均方根偏差为
Figure BDA0002164724830000104
预测得到的三维结构如图2所示。
以上阐述的是本发明给出的一个实施例展现出来的一个优良结果,显然本发明不仅适合上述实施例,在不偏离本发明基本思想及不超出本发明实质内容的前提下可对其做种种改进加以实施。

Claims (1)

1.一种基于双层偏置搜索的蛋白质结构预测方法,其特征在于:所述方法包括以下步骤:
1)输入目标蛋白质的序列信息;
2)根据目标蛋白质序列从ROBETTA服务器上获取3片段和9片段的片段库文件;
3)设置参数:种群规模NP,最大迭代次数G,能量区间划分个数M,温度因子β;
4)种群初始化:利用Rosetta协议第一阶段产生种群规模为NP的种群C={C1,C2,...,CNP},其中Ci,i=1,2,...,NP为第i个个体;
5)设置g=1,g∈{1,2,...,G};
6)设置n=1,n∈{1,2,...,NP};
7)记Ci为种群中第i个个体,i∈{1,2,...,NP+n-1},并进行如下操作:
7.1)用Rosetta score3能量函数计算种群中每个个体的能量,个体Ci的能量为score3(Ci);
7.2)记Emin和Emax分别为种群中的最低能量和最高能量,设置能量区间[Emin,Emax],将能量区间等分成M个子区间,每个子区间长度为ΔE,
Figure FDA0002164724820000011
第m个子区间表示为[Emin+(m-1)ΔE,Emin+mΔE],m∈{1,2,...,M},记Ωm为第m个子区间对应的构象集合,并设置
Figure FDA0002164724820000012
7.3)将种群中的每个个体按能量值分配到相应的子区间内,若score3(Ci)∈[Emin+(m-1)ΔE,Emin+mΔE],则Ωm=Ωm∪{Ci};
8)父代选择操作,过程如下:
8.1)记Cm,j为第m个能量子区间中的第j个个体,j∈{1,2,...,|Ωm|},按如下公式计算每个能量子区间中的构象平均能量
Figure FDA0002164724820000013
8.2)按如下公式计算每个能量子区间的选择概率,ε是一个很小的常数:
Figure FDA0002164724820000021
8.3)按公式(2)计算的概率选择一个能量子区间;
8.4)在选择的子区间内,将每个构象的质心原子、离ctd最近的原子、离ctd最远的原子、离fct最远的原子的坐标分别表示为
Figure FDA0002164724820000022
表示ctd指向cst的三维空间向量,
Figure FDA0002164724820000025
表示ctd指向fct的三维空间向量,
Figure FDA0002164724820000026
表示ctd指向ftf的三维空间向量,按如下公式计算选择的子区间内每个构象的结构差异性,并记Cm,max为具有最大结构差异性数值Dm,max的构象:
Figure FDA0002164724820000027
8.5)按如下公式计算子区间内每个个体的选择概率,ε是一个很小的常数:
Figure FDA0002164724820000028
8.6)按公式(4)计算的概率选择一个个体,记作Cselected
9)变异操作,过程如下:
9.1)在最大差异性构象Cm,max中随机选取一个3片段,替换到选择个体Cselected的对应位置上,生成新的构象Cnew
9.2)利用Rosetta对新构象Cnew进行一次片段组装,生成构象Cnew′
9.3)若score3(Cnew′)<score3(Cnew),则C=C∪{Cnew′};否则计算接收概率
Figure FDA0002164724820000029
并生成均匀随机小数rand,rand∈[0,1],若rand<Paccept,则C=C∪{Cnew′};否则C=C∪{Cnew};
9.4)设置n=n+1;
10)若n>NP,则继续步骤11);否则转至步骤7);
11)淘汰个体选择操作,过程如下:
11.1)执行步骤7);
11.2)执行步骤8.1);
11.3)按如下公式计算每个能量子区间的选择概率,ε是一个很小的常数:
Figure FDA0002164724820000031
11.4)按公式(5)计算的概率选择一个能量子区间;
11.5)执行步骤8.4);
11.6)按如下公式计算子区间内每个个体的选择概率,ε是一个很小的常数:
Figure FDA0002164724820000032
11.7)按公式(6)计算的概率选择一个个体,将其从种群中剔除;
11.8)设置n=n-1;
12)若n=1,设置g=g+1;否则转至步骤11);
13)若g>G,输出最后一代种群C,并选择能量最低的构象作为预测结果;否则转至步骤6)。
CN201910743322.8A 2019-08-13 2019-08-13 一种基于双层偏置搜索的蛋白质结构预测方法 Active CN110634531B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910743322.8A CN110634531B (zh) 2019-08-13 2019-08-13 一种基于双层偏置搜索的蛋白质结构预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910743322.8A CN110634531B (zh) 2019-08-13 2019-08-13 一种基于双层偏置搜索的蛋白质结构预测方法

Publications (2)

Publication Number Publication Date
CN110634531A true CN110634531A (zh) 2019-12-31
CN110634531B CN110634531B (zh) 2021-06-18

Family

ID=68970296

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910743322.8A Active CN110634531B (zh) 2019-08-13 2019-08-13 一种基于双层偏置搜索的蛋白质结构预测方法

Country Status (1)

Country Link
CN (1) CN110634531B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150005239A (ko) * 2013-07-05 2015-01-14 인하대학교 산학협력단 포스포트랜스아세틸라제 억제 활성을 가지는 화합물을 포함하는 세균 감염 질환 예방 또는 치료용 약제학적 조성물
CN106096326A (zh) * 2016-06-02 2016-11-09 浙江工业大学 一种基于质心变异策略的差分进化蛋白质结构预测方法
CN109360597A (zh) * 2018-08-01 2019-02-19 浙江工业大学 一种基于全局和局部策略协作的群体蛋白质结构预测方法
CN109378034A (zh) * 2018-08-28 2019-02-22 浙江工业大学 一种基于距离分布估计的蛋白质预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150005239A (ko) * 2013-07-05 2015-01-14 인하대학교 산학협력단 포스포트랜스아세틸라제 억제 활성을 가지는 화합물을 포함하는 세균 감염 질환 예방 또는 치료용 약제학적 조성물
CN106096326A (zh) * 2016-06-02 2016-11-09 浙江工业大学 一种基于质心变异策略的差分进化蛋白质结构预测方法
CN109360597A (zh) * 2018-08-01 2019-02-19 浙江工业大学 一种基于全局和局部策略协作的群体蛋白质结构预测方法
CN109378034A (zh) * 2018-08-28 2019-02-22 浙江工业大学 一种基于距离分布估计的蛋白质预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
XIAOHU HAO等: "《Double Estimation of Distribution Guided Sampling Algorithm for De-novo Protein Structure Prediction》", 《PROCEEDINGS OF THE 36TH CHINESE CONTROL CONFERENCE》 *

Also Published As

Publication number Publication date
CN110634531B (zh) 2021-06-18

Similar Documents

Publication Publication Date Title
Wang et al. Analysis of deep learning methods for blind protein contact prediction in CASP12
Pei et al. PROMALS3D: multiple protein sequence alignment enhanced with evolutionary and three-dimensional structural information
Ali et al. DBPPred-PDSD: Machine learning approach for prediction of DNA-binding proteins using Discrete Wavelet Transform and optimized integrated features space
Bahrami et al. Probabilistic interaction network of evidence algorithm and its application to complete labeling of peak lists from protein NMR spectroscopy
CN108846256B (zh) 一种基于残基接触信息的群体蛋白质结构预测方法
CN106055920B (zh) 一种基于阶段性多策略副本交换的蛋白质结构预测方法
CN109360596B (zh) 一种基于差分进化局部扰动的蛋白质构象空间优化方法
Chen et al. Multiple classifier integration for the prediction of protein structural classes
Wu et al. Accurate prediction of protein relative solvent accessibility using a balanced model
CN109360601B (zh) 一种基于排挤策略的多模态蛋白质结构预测方法
Zhou et al. Enhancing efficiency of protein language models with minimal wet-lab data through few-shot learning
Chelur et al. Birds-binding residue detection from protein sequences using deep resnets
Zhou et al. IRIS: a method for predicting in vivo RNA secondary structures using PARIS data
Zhou et al. Accurate and definite mutational effect prediction with lightweight equivariant graph neural networks
CN110634531B (zh) 一种基于双层偏置搜索的蛋白质结构预测方法
CN109360597B (zh) 一种基于全局和局部策略协作的群体蛋白质结构预测方法
CN109378034B (zh) 一种基于距离分布估计的蛋白质预测方法
Geethu et al. Improved 3-D protein structure predictions using deep ResNet model
CN109147867B (zh) 一种基于动态片段长度的群体蛋白质结构预测方法
Zeng et al. Improving human essential protein prediction using only protein sequences via ensemble learning
Ispano et al. An overview of protein function prediction methods: a deep learning perspective
CN109243526B (zh) 一种基于特定片段交叉的蛋白质结构预测方法
CN109390035B (zh) 一种基于局部结构比对的蛋白质构象空间优化方法
CN110706741B (zh) 一种基于序列小生境的多模态蛋白质结构预测方法
Rahmani et al. An extension of Wang’s protein design model using Blosum62 substitution matrix

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant