CN110634531A - 一种基于双层偏置搜索的蛋白质结构预测方法 - Google Patents
一种基于双层偏置搜索的蛋白质结构预测方法 Download PDFInfo
- Publication number
- CN110634531A CN110634531A CN201910743322.8A CN201910743322A CN110634531A CN 110634531 A CN110634531 A CN 110634531A CN 201910743322 A CN201910743322 A CN 201910743322A CN 110634531 A CN110634531 A CN 110634531A
- Authority
- CN
- China
- Prior art keywords
- energy
- individual
- subinterval
- population
- new
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/20—Protein or domain folding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/30—Data warehousing; Computing architectures
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Bioethics (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Complex Calculations (AREA)
Abstract
一种基于双层偏置搜索的蛋白质结构预测方法,在遗传算法框架下,首先,种群初始化,根据构象的能量高低将其分配到不同的能量区间;然后,根据能量以及空间结构差异性双层选择指标有偏地选择父代和淘汰构象,不仅能够缓解能量函数不精确的问题,而且可以根据有偏采样搜索到结构更为合理的构象,在提高采样效率的同时,提升了预测精度。本发明提供一种预测精度较高的基于双层偏置搜索的蛋白质结构预测方法。
Description
技术领域
本发明涉及生物信息学、计算机应用领域,尤其涉及的是一种基于双层偏置搜索的蛋白质结构预测方法。
背景技术
蛋白质分子是细胞中许多生化过程的核心。蛋白质只有折叠成特定的三维结构才能行使其生物学功能。因此,要了解蛋白质的功能,就必须获得其三维结构。由此,人们开始了对蛋白质三维结构的不断探索。
近几年来,测定蛋白质的三维结构主要采用生物湿实验的方法,例如:X射线衍射、核磁共振、冷冻电镜。但是,这些实验方法需要花费大量的人力、物力、财力,而且测定的速度远远跟不上序列获取的速度。因此,急需一种高效、快速、简便的方法对未知蛋白质进行结构预测。并且,Anfinsen在1961年提出,蛋白质链中氨基酸的序列决定了其具有生物活性的空间排列。因此,人们提出了一种利用计算机技术根据蛋白质的氨基酸序列预测蛋白质三维结构的方法。根据氨基酸序列预测蛋白质三维结构的方法主要有同源建模法和从头预测法。从头预测方法直接基于蛋白质的物理或知识能量模型,利用优化算法在构象空间中搜索全局最优解。
但是,蛋白质的构象空间极其庞大且复杂,现有的方法往往存在两大缺陷:一方面由于能量函数不精确,导致无法准确地找到令人满意的结果;另一方面在于目前的优化方法采样能力不足,极其容易陷入局部极小值,从而影响整体的预测精度。
因此,现有的蛋白质结构预测方法存在能量函数不精确、采样效率低、预测精度不足等问题,需要改进。
发明内容
为了克服现有的蛋白质结构预测方法采样效率低、种群多样性差、预测精度不足等问题,本发明提供一种基于双层偏置搜索的蛋白质结构预测方法,在基本遗传算法框架下,利用能量和空间结构差异性构成的双层搜索策略,对构象进行有偏搜索及排挤,从而提高了采样效率,增加了种群多样性,改善了整体的预测精度。
本发明解决其技术问题所采用的技术方案是:
一种基于双层偏置搜索的蛋白质结构预测方法,所述方法包括以下步骤:
1)输入目标蛋白质的序列信息;
2)根据目标蛋白质序列从ROBETTA服务器(http://www.robetta.org/)上获取3片段和9片段的片段库文件;
3)设置参数:种群规模NP,最大迭代次数G,能量区间划分个数M,温度因子β;
4)种群初始化:利用Rosetta协议第一阶段产生种群规模为NP的种群C={C1,C2,...,CNP},其中Ci,i=1,2,...,NP为第i个个体;
5)设置g=1,g∈{1,2,...,G};
6)设置n=1,n∈{1,2,...,NP};
7)记Ci为种群中第i个个体,i∈{1,2,...,NP+n-1},并进行如下操作:
7.1)用Rosetta score3能量函数计算种群中每个个体的能量,个体Ci的能量为score3(Ci);
7.2)记Emin和Emax分别为种群中的最低能量和最高能量,设置能量区间[Emin,Emax],将能量区间等分成M个子区间,每个子区间长度为ΔE,第m个子区间表示为[Emin+(m-1)ΔE,Emin+mΔE],m∈{1,2,...,M},记Ωm为第m个子区间对应的构象集合,并设置
7.3)将种群中的每个个体按能量值分配到相应的子区间内,若score3(Ci)∈[Emin+(m-1)ΔE,Emin+mΔE],则Ωm=Ωm∪{Ci};
8)父代选择操作,过程如下:
8.2)按如下公式计算每个能量子区间的选择概率,ε是一个很小的常数:
8.3)按公式(2)计算的概率选择一个能量子区间;
8.4)在选择的子区间内,将每个构象的质心原子、离ctd最近的原子、离ctd最远的原子、离fct最远的原子的坐标分别表示为 表示ctd指向cst的三维空间向量,表示ctd指向fct的三维空间向量,表示ctd指向ftf的三维空间向量,按如下公式计算选择的子区间内每个构象的结构差异性,并记Cm,max为具有最大结构差异性数值Dm,max的构象:
8.5)按如下公式计算子区间内每个个体的选择概率,ε是一个很小的常数:
8.6)按公式(4)计算的概率选择一个个体,记作Cselected;
9)变异操作,过程如下:
9.1)在最大差异性构象Cm,max中随机选取一个3片段,替换到选择个体Cselected的对应位置上,生成新的构象Cnew;
9.2)利用Rosetta对新构象Cnew进行一次片段组装,生成构象Cnew′;
9.3)若score3(Cnew′)<score3(Cnew),则C=C∪{Cnew′};否则计算接收概率并生成均匀随机小数rand,rand∈[0,1],若rand<Paccept,则C=C∪{Cnew′};否则C=C∪{Cnew};
9.4)设置n=n+1;
10)若n>NP,则继续步骤11);否则转至步骤7);
11)淘汰个体选择操作,过程如下:
11.1)执行步骤7);
11.2)执行步骤8.1);
11.3)按如下公式计算每个能量子区间的选择概率,ε是一个很小的常数:
11.4)按公式(5)计算的概率选择一个能量子区间;
11.5)执行步骤8.4);
11.6)按如下公式计算子区间内每个个体的选择概率,ε是一个很小的常数:
11.7)按公式(6)计算的概率选择一个个体,将其从种群中剔除;
11.8)设置n=n-1;
12)若n=1,设置g=g+1;否则转至步骤11);
13)若g>G,输出最后一代种群C,并选择能量最低的构象作为预测结果;否则转至步骤6)。
本发明的技术构思为:在遗传算法框架下,首先,种群初始化,根据构象的能量高低将其分配到不同的能量区间;其次,根据能量以及空间结构差异性双层选择指标有偏地选择父代进行变异和片段组装得到新构象加入种群;然后,根据两个选择概率函数淘汰构象,实现种群更新;最后,输出最终一代种群。基于双层偏置搜索的蛋白质结构预测方法不仅能够缓解能量函数不精确的问题,而且可以根据有偏采样搜索到结构更为合理的构象,在提高采样效率的同时,提升了预测精度。
本发明的有益效果为:根据双层偏置搜索策略提高了采样效率;使用能量以及空间结构差异性函数缓解了仅以单一能量函数评价构象的缺陷,增加了种群多样性,从而提高了整体预测精度。
附图说明
图1是一种基于双层偏置搜索的蛋白质结构预测方法对蛋白质1C8C进行结构预测时的构象更新示意图。
图2是一种基于双层偏置搜索的蛋白质结构预测方法对蛋白质1C8C进行结构预测得到的三维结构图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1和图2,一种基于双层偏置搜索的蛋白质结构预测方法,所述方法包括以下步骤:
1)输入目标蛋白质的序列信息;
2)根据目标蛋白质序列从ROBETTA服务器(http://www.robetta.org/)上获取3片段和9片段的片段库文件;
3)设置参数:种群规模NP,最大迭代次数G,能量区间划分个数M,温度因子β;
4)种群初始化:利用Rosetta协议第一阶段产生种群规模为NP的种群C={C1,C2,...,CNP},其中Ci,i=1,2,...,NP为第i个个体;
5)设置g=1,g∈{1,2,...,G};
6)设置n=1,n∈{1,2,...,NP};
7)记Ci为种群中第i个个体,i∈{1,2,...,NP+n-1},并进行如下操作:
7.1)用Rosetta score3能量函数计算种群中每个个体的能量,个体Ci的能量为score3(Ci);
7.2)记Emin和Emax分别为种群中的最低能量和最高能量,设置能量区间[Emin,Emax],将能量区间等分成M个子区间,每个子区间长度为ΔE,第m个子区间表示为[Emin+(m-1)ΔE,Emin+mΔE],m∈{1,2,...,M},记Ωm为第m个子区间对应的构象集合,并设置
7.3)将种群中的每个个体按能量值分配到相应的子区间内,若score3(Ci)∈[Emin+(m-1)ΔE,Emin+mΔE],则Ωm=Ωm∪{Ci};
8)父代选择操作,过程如下:
8.2)按如下公式计算每个能量子区间的选择概率,ε是一个很小的常数:
8.3)按公式(2)计算的概率选择一个能量子区间;
8.4)在选择的子区间内,将每个构象的质心原子、离ctd最近的原子、离ctd最远的原子、离fct最远的原子的坐标分别表示为 表示ctd指向cst的三维空间向量,表示ctd指向fct的三维空间向量,表示ctd指向ftf的三维空间向量,按如下公式计算选择的子区间内每个构象的结构差异性,并记Cm,max为具有最大结构差异性数值Dm,max的构象:
8.5)按如下公式计算子区间内每个个体的选择概率,ε是一个很小的常数:
8.6)按公式(4)计算的概率选择一个个体,记作Cselected;
9)变异操作,过程如下:
9.1)在最大差异性构象Cm,max中随机选取一个3片段,替换到选择个体Cselected的对应位置上,生成新的构象Cnew;
9.2)利用Rosetta对新构象Cnew进行一次片段组装,生成构象Cnew′;
9.3)若score3(Cnew′)<score3(Cnew),则C=C∪{Cnew′};否则计算接收概率并生成均匀随机小数rand,rand∈[0,1],若rand<Paccept,则C=C∪{Cnew′};否则C=C∪{Cnew};
9.4)设置n=n+1;
10)若n>NP,则继续步骤11);否则转至步骤7);
11)淘汰个体选择操作,过程如下:
11.1)执行步骤7);
11.2)执行步骤8.1);
11.3)按如下公式计算每个能量子区间的选择概率,ε是一个很小的常数:
11.4)按公式(5)计算的概率选择一个能量子区间;
11.5)执行步骤8.4);
11.6)按如下公式计算子区间内每个个体的选择概率,ε是一个很小的常数:
11.7)按公式(6)计算的概率选择一个个体,将其从种群中剔除;
11.8)设置n=n-1;
12)若n=1,设置g=g+1;否则转至步骤11);
13)若g>G,输出最后一代种群C,并选择能量最低的构象作为预测结果;否则转至步骤6)。
本实施例以序列长度为80的蛋白质1C8C为实施例,一种基于双层偏置搜索的蛋白质结构预测方法,所述方法包括以下步骤:
1)输入目标蛋白质1C8C的序列信息;
2)根据目标蛋白质序列从ROBETTA服务器(http://www.robetta.org/)上获取3片段和9片段的片段库文件;
3)设置参数:种群规模NP=1000,最大迭代次数G=100,能量区间划分个数M=100,温度因子β=2;
4)种群初始化:利用Rosetta协议第一阶段产生种群规模为NP的种群C={C1,C2,...,CNP},其中Ci,i=1,2,...,NP为第i个个体;
5)设置g=1,g∈{1,2,...,G};
6)设置n=1,n∈{1,2,...,NP};
7)记Ci为种群中第i个个体,i∈{1,2,...,NP+n-1},并进行如下操作:
7.1)用Rosetta score3能量函数计算种群中每个个体的能量,个体Ci的能量为score3(Ci);
7.2)记Emin和Emax分别为种群中的最低能量和最高能量,设置能量区间[Emin,Emax],将能量区间等分成M个子区间,每个子区间长度为ΔE,第m个子区间表示为[Emin+(m-1)ΔE,Emin+mΔE],m∈{1,2,...,M},记Ωm为第m个子区间对应的构象集合,并设置
7.3)将种群中的每个个体按能量值分配到相应的子区间内,若score3(Ci)∈[Emin+(m-1)ΔE,Emin+mΔE],则Ωm=Ωm∪{Ci};
8)父代选择操作,过程如下:
8.2)按如下公式计算每个能量子区间的选择概率,ε是一个很小的常数:
8.3)按公式(2)计算的概率选择一个能量子区间;
8.4)在选择的子区间内,将每个构象的质心原子、离ctd最近的原子、离ctd最远的原子、离fct最远的原子的坐标分别表示为 表示ctd指向cst的三维空间向量,表示ctd指向fct的三维空间向量,表示ctd指向ftf的三维空间向量,按如下公式计算选择的子区间内每个构象的结构差异性,并记Cm,max为具有最大结构差异性数值Dm,max的构象:
8.5)按如下公式计算子区间内每个个体的选择概率,ε是一个很小的常数:
8.6)按公式(4)计算的概率选择一个个体,记作Cselected;
9)变异操作,过程如下:
9.1)在最大差异性构象Cm,max中随机选取一个3片段,替换到选择个体Cselected的对应位置上,生成新的构象Cnew;
9.2)利用Rosetta对新构象Cnew进行一次片段组装,生成构象Cnew′;
9.3)若score3(Cnew′)<score3(Cnew),则C=C∪{Cnew′};否则计算接收概率并生成均匀随机小数rand,rand∈[0,1],若rand<Paccept,则C=C∪{Cnew′};否则C=C∪{Cnew};
9.4)设置n=n+1;
10)若n>NP,则继续步骤11);否则转至步骤7);
11)淘汰个体选择操作,过程如下:
11.1)执行步骤7);
11.2)执行步骤8.1);
11.3)按如下公式计算每个能量子区间的选择概率,ε是一个很小的常数:
11.4)按公式(5)计算的概率选择一个能量子区间;
11.5)执行步骤8.4);
11.6)按如下公式计算子区间内每个个体的选择概率,ε是一个很小的常数:
11.7)按公式(6)计算的概率选择一个个体,将其从种群中剔除;
11.8)设置n=n-1;
12)若n=1,设置g=g+1;否则转至步骤11);
13)若g>G,输出最后一代种群C,并选择能量最低的构象作为预测结果;否则转至步骤6)。
以序列长度为80的蛋白质1C8C为实施例,运用以上方法得到了该蛋白质的近天然态构象,其构象更新示意图如图1所示,运行100代后所得到的结构与天然态结构之间的平均均方根偏差为最小均方根偏差为预测得到的三维结构如图2所示。
以上阐述的是本发明给出的一个实施例展现出来的一个优良结果,显然本发明不仅适合上述实施例,在不偏离本发明基本思想及不超出本发明实质内容的前提下可对其做种种改进加以实施。
Claims (1)
1.一种基于双层偏置搜索的蛋白质结构预测方法,其特征在于:所述方法包括以下步骤:
1)输入目标蛋白质的序列信息;
2)根据目标蛋白质序列从ROBETTA服务器上获取3片段和9片段的片段库文件;
3)设置参数:种群规模NP,最大迭代次数G,能量区间划分个数M,温度因子β;
4)种群初始化:利用Rosetta协议第一阶段产生种群规模为NP的种群C={C1,C2,...,CNP},其中Ci,i=1,2,...,NP为第i个个体;
5)设置g=1,g∈{1,2,...,G};
6)设置n=1,n∈{1,2,...,NP};
7)记Ci为种群中第i个个体,i∈{1,2,...,NP+n-1},并进行如下操作:
7.1)用Rosetta score3能量函数计算种群中每个个体的能量,个体Ci的能量为score3(Ci);
7.2)记Emin和Emax分别为种群中的最低能量和最高能量,设置能量区间[Emin,Emax],将能量区间等分成M个子区间,每个子区间长度为ΔE,第m个子区间表示为[Emin+(m-1)ΔE,Emin+mΔE],m∈{1,2,...,M},记Ωm为第m个子区间对应的构象集合,并设置
7.3)将种群中的每个个体按能量值分配到相应的子区间内,若score3(Ci)∈[Emin+(m-1)ΔE,Emin+mΔE],则Ωm=Ωm∪{Ci};
8)父代选择操作,过程如下:
8.2)按如下公式计算每个能量子区间的选择概率,ε是一个很小的常数:
8.3)按公式(2)计算的概率选择一个能量子区间;
8.4)在选择的子区间内,将每个构象的质心原子、离ctd最近的原子、离ctd最远的原子、离fct最远的原子的坐标分别表示为 表示ctd指向cst的三维空间向量,表示ctd指向fct的三维空间向量,表示ctd指向ftf的三维空间向量,按如下公式计算选择的子区间内每个构象的结构差异性,并记Cm,max为具有最大结构差异性数值Dm,max的构象:
8.5)按如下公式计算子区间内每个个体的选择概率,ε是一个很小的常数:
8.6)按公式(4)计算的概率选择一个个体,记作Cselected;
9)变异操作,过程如下:
9.1)在最大差异性构象Cm,max中随机选取一个3片段,替换到选择个体Cselected的对应位置上,生成新的构象Cnew;
9.2)利用Rosetta对新构象Cnew进行一次片段组装,生成构象Cnew′;
9.3)若score3(Cnew′)<score3(Cnew),则C=C∪{Cnew′};否则计算接收概率并生成均匀随机小数rand,rand∈[0,1],若rand<Paccept,则C=C∪{Cnew′};否则C=C∪{Cnew};
9.4)设置n=n+1;
10)若n>NP,则继续步骤11);否则转至步骤7);
11)淘汰个体选择操作,过程如下:
11.1)执行步骤7);
11.2)执行步骤8.1);
11.3)按如下公式计算每个能量子区间的选择概率,ε是一个很小的常数:
11.4)按公式(5)计算的概率选择一个能量子区间;
11.5)执行步骤8.4);
11.6)按如下公式计算子区间内每个个体的选择概率,ε是一个很小的常数:
11.7)按公式(6)计算的概率选择一个个体,将其从种群中剔除;
11.8)设置n=n-1;
12)若n=1,设置g=g+1;否则转至步骤11);
13)若g>G,输出最后一代种群C,并选择能量最低的构象作为预测结果;否则转至步骤6)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910743322.8A CN110634531B (zh) | 2019-08-13 | 2019-08-13 | 一种基于双层偏置搜索的蛋白质结构预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910743322.8A CN110634531B (zh) | 2019-08-13 | 2019-08-13 | 一种基于双层偏置搜索的蛋白质结构预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110634531A true CN110634531A (zh) | 2019-12-31 |
CN110634531B CN110634531B (zh) | 2021-06-18 |
Family
ID=68970296
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910743322.8A Active CN110634531B (zh) | 2019-08-13 | 2019-08-13 | 一种基于双层偏置搜索的蛋白质结构预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110634531B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150005239A (ko) * | 2013-07-05 | 2015-01-14 | 인하대학교 산학협력단 | 포스포트랜스아세틸라제 억제 활성을 가지는 화합물을 포함하는 세균 감염 질환 예방 또는 치료용 약제학적 조성물 |
CN106096326A (zh) * | 2016-06-02 | 2016-11-09 | 浙江工业大学 | 一种基于质心变异策略的差分进化蛋白质结构预测方法 |
CN109360597A (zh) * | 2018-08-01 | 2019-02-19 | 浙江工业大学 | 一种基于全局和局部策略协作的群体蛋白质结构预测方法 |
CN109378034A (zh) * | 2018-08-28 | 2019-02-22 | 浙江工业大学 | 一种基于距离分布估计的蛋白质预测方法 |
-
2019
- 2019-08-13 CN CN201910743322.8A patent/CN110634531B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150005239A (ko) * | 2013-07-05 | 2015-01-14 | 인하대학교 산학협력단 | 포스포트랜스아세틸라제 억제 활성을 가지는 화합물을 포함하는 세균 감염 질환 예방 또는 치료용 약제학적 조성물 |
CN106096326A (zh) * | 2016-06-02 | 2016-11-09 | 浙江工业大学 | 一种基于质心变异策略的差分进化蛋白质结构预测方法 |
CN109360597A (zh) * | 2018-08-01 | 2019-02-19 | 浙江工业大学 | 一种基于全局和局部策略协作的群体蛋白质结构预测方法 |
CN109378034A (zh) * | 2018-08-28 | 2019-02-22 | 浙江工业大学 | 一种基于距离分布估计的蛋白质预测方法 |
Non-Patent Citations (1)
Title |
---|
XIAOHU HAO等: "《Double Estimation of Distribution Guided Sampling Algorithm for De-novo Protein Structure Prediction》", 《PROCEEDINGS OF THE 36TH CHINESE CONTROL CONFERENCE》 * |
Also Published As
Publication number | Publication date |
---|---|
CN110634531B (zh) | 2021-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Analysis of deep learning methods for blind protein contact prediction in CASP12 | |
Pei et al. | PROMALS3D: multiple protein sequence alignment enhanced with evolutionary and three-dimensional structural information | |
Ali et al. | DBPPred-PDSD: Machine learning approach for prediction of DNA-binding proteins using Discrete Wavelet Transform and optimized integrated features space | |
Bahrami et al. | Probabilistic interaction network of evidence algorithm and its application to complete labeling of peak lists from protein NMR spectroscopy | |
CN108846256B (zh) | 一种基于残基接触信息的群体蛋白质结构预测方法 | |
CN106055920B (zh) | 一种基于阶段性多策略副本交换的蛋白质结构预测方法 | |
CN109360596B (zh) | 一种基于差分进化局部扰动的蛋白质构象空间优化方法 | |
Chen et al. | Multiple classifier integration for the prediction of protein structural classes | |
Wu et al. | Accurate prediction of protein relative solvent accessibility using a balanced model | |
CN109360601B (zh) | 一种基于排挤策略的多模态蛋白质结构预测方法 | |
Zhou et al. | Enhancing efficiency of protein language models with minimal wet-lab data through few-shot learning | |
Chelur et al. | Birds-binding residue detection from protein sequences using deep resnets | |
Zhou et al. | IRIS: a method for predicting in vivo RNA secondary structures using PARIS data | |
Zhou et al. | Accurate and definite mutational effect prediction with lightweight equivariant graph neural networks | |
CN110634531B (zh) | 一种基于双层偏置搜索的蛋白质结构预测方法 | |
CN109360597B (zh) | 一种基于全局和局部策略协作的群体蛋白质结构预测方法 | |
CN109378034B (zh) | 一种基于距离分布估计的蛋白质预测方法 | |
Geethu et al. | Improved 3-D protein structure predictions using deep ResNet model | |
CN109147867B (zh) | 一种基于动态片段长度的群体蛋白质结构预测方法 | |
Zeng et al. | Improving human essential protein prediction using only protein sequences via ensemble learning | |
Ispano et al. | An overview of protein function prediction methods: a deep learning perspective | |
CN109243526B (zh) | 一种基于特定片段交叉的蛋白质结构预测方法 | |
CN109390035B (zh) | 一种基于局部结构比对的蛋白质构象空间优化方法 | |
CN110706741B (zh) | 一种基于序列小生境的多模态蛋白质结构预测方法 | |
Rahmani et al. | An extension of Wang’s protein design model using Blosum62 substitution matrix |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |