CN105760710A - 一种基于两阶段差分进化算法的蛋白质结构预测方法 - Google Patents

一种基于两阶段差分进化算法的蛋白质结构预测方法 Download PDF

Info

Publication number
CN105760710A
CN105760710A CN201610139379.3A CN201610139379A CN105760710A CN 105760710 A CN105760710 A CN 105760710A CN 201610139379 A CN201610139379 A CN 201610139379A CN 105760710 A CN105760710 A CN 105760710A
Authority
CN
China
Prior art keywords
individual
target
conformation
population
trail
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610139379.3A
Other languages
English (en)
Inventor
张贵军
俞旭锋
周晓根
郝小虎
王柳静
李章维
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201610139379.3A priority Critical patent/CN105760710A/zh
Publication of CN105760710A publication Critical patent/CN105760710A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment

Abstract

一种基于两阶段差分进化算法的蛋白质结构预测方法,在差分进化算法(DE)的框架下,首先,对输入的查询序列进行随机的折叠、扰动,生成具有多样化折叠类型的初始构象种群;然后,根据迭代次数将构象搜索分为两个阶段,第一个阶段从种群中随机选取一个构象作为目标个体,第二个阶段根据能量将种群分为两个部分,从能量低的前50%的种群中随机选取一个个体作为目标个体;之后,随机选取与目标个体不一样的三个构象个体经过变异、交叉和片段组装策略生成测试个体;在种群更新时,根据构象的能量判断是否接受测试个体;在两阶段策略的指导下,通过不断更新种群获得预测精度较高、复杂度较低的一系列亚稳态构象。本发明预测精度较高、复杂度较低。

Description

一种基于两阶段差分进化算法的蛋白质结构预测方法
技术领域
本发明涉及生物信息学、计算机应用领域,尤其涉及的是一种基于两阶段差分进化算法的蛋白质结构预测方法。
背景技术
蛋白质分子在生物细胞化学反应过程中起着至关重要的作用。它们的结构模型和生物活性状态对我们理解和治愈多种疾病有重要的意义。蛋白质只有折叠成特定的三维结构才能产生其特有的生物学功能。因此,要了解蛋白质的功能,就必须获得其三维空间结构。
生物信息学是生命科学和计算机科学交叉领域的一个研究热点。生物信息学研究成果目前已经被广泛应用于基因发现和预测、基因数据的存储管理、数据检索与挖掘、基因表达数据分析、蛋白质结构预测、基因和蛋白质同源关系预测、序列分析与比对等。目前,根据Anfinsen假设,直接从氨基酸序列出发,基于势能模型,采用全局优化方法,搜索分子系统的最小能量状态,从而高通量、廉价地预测肽链的天然构象,已经成为生物信息学最重要的研究课题之一。对于序列相似度低或多肽(<10个残基的小蛋白)来说,从头预测方法是唯一的选择。从头预测方法必须考虑以下两个因素:(1)蛋白质结构能量函数;(2)构象空间搜索方法。第一个因素本质上属于分子力学问题,主要是为了能够计算得到每个蛋白质结构对应的能量值。目前已经存在一些有效的结构能量函数,如简单网格模型HP及更实际的经验力场模型MM3,AMBER,CHARMM,GROMOS,DISCOVER,ECEPP/3等;第二个因素本质上属于全局优化问题,通过选择一种合适的优化方法,对构象空间进行快速搜索,得到与某一全局最小能量对应的构象。其中,蛋白质构象空间优化属于一类非常难解的NP-Hard问题。2005年,D.Baker在Science中指出,构象空间优化方法是制约蛋白质从头预测方法预测精度的一个瓶颈因素。
因此,现有的蛋白质结构预测方法存在采样效率、复杂度及预测精度方面存在不足,需要改进。
发明内容
为了克服现有蛋白质结构预测存在采样效率低、复杂度较高及预测精度较低的不足,本发明提出一种预测精度较高、复杂度较低的基于两阶段差分进化算法的蛋白质结构预测方法。
本发明解决其技术问题所采用的技术方案是:
一种基于两阶段差分进化算法的蛋白质结构预测方法,所述预测方法包括以下步骤:
1)给定查询序列信息;
2)初始化:设置群体规模NP,变异因子F,交叉概率CR,迭代次数iteration,片段长度为L,能量函数选用RosettaScore3,首先通过对查询序列随机的折叠和变换,生成一个规模为NP的初始种群,初始群体为P={xi|i∈I},计算初始种群个体的能量值f(xi),i∈I,其中i为种群个体编号,I为种群个体编号集合,I={1,2,...,NP};
3)开始迭代,令g=1,g为迭代计数器,依次对种群中每个个体进行以下操作:
3.1)如果g<iteration/2,则执行如下操作:
随机选取种群中的一个构象个体Pi,i∈{1,2,3,…,NP},令Ptarget=Pi,Ptarget表示目标构象个体,跳转至3.3),执行以下操作得到变异构象Pmutant
3.2)如果iteration/2<g<iteration,则执行如下操作:
根据能量对整个种群中的构象进行降序排列,然后从能量低的前50%的NP个构象个体中随机选出一个构象记为Ppbest,令Ptarget=Ppbest,Ptarget表示目标构象个体,执行以下操作得到变异构象Pmutant
3.3)随机生成正整数rand1,rand2,rand3∈{1,2,3,......NP},且rand1≠rand2≠rand3≠i;再生成4个随机整数randrange1,randrange2,randrange3,randrange4;其中randrange1≠randrange2,randrange3≠randrange4∈{1,2,…,Length},Length为序列长度;
3.4)令a=min(randrange1,randrange2),b=max(randrange1,randrange2),k∈[a,b];令c=min(randrange3,randrange4),d=max(randrange3,randrange4),p∈[c,d];其中min表示取两个数的最小值,max表示取两个数的最大值;
3.5)用Prand2上位置a到位置b的片段的氨基酸所对应的二面角phi、psi、omega替换Prand1的相同位置所对应的二面角phi、psi、omega;再使用Prand3上位置c到位置d的片段的氨基酸所对应的二面角phi、psi、omega替换Prand1上相同位置所对应的二面角phi、psi、omega,再将所得Prand1进行片段组装得到测试个体Ptrail
3.6)针对测试个体Ptrail做交叉操作,过程如下:
3.6.1)生成随机数rand4,rand5,其中rand4∈(0,1),rand5∈(1,Length);
3.6.2)根据执行交叉过程:
若随机数rand4<=CR,个体Ptrail的片段rand5替换为个体Ptarget中对应的片段,否则直接继承个体Ptrail
3.7)针对目标个体Ptarget和测试个体Ptrail进行选择操作,过程如下:
3.7.1)计算Ptarget和Ptrail的能量:E(Ptarget)和E(Ptrail);
3.7.2)若E(Ptarget)>E(Ptrail)则用Ptrail替换Ptarget,进入3.8);
3.8)i=i+1;
3.9)迭代的运行3.1)~3.8),至满足终止条件。
本发明的技术构思为:在差分进化算法(DE)的框架下,首先,对输入的查询序列进行随机的折叠、扰动,生成具有多样化折叠类型的初始构象种群;然后,根据迭代次数将构象搜索分为两个阶段,第一个阶段从种群中随机选取一个构象作为目标个体,第二个阶段根据能量将种群分为两个部分,从能量低的前50%的种群中随机选取一个个体作为目标个体;之后,随机选取与目标个体不一样的三个构象个体经过变异、交叉和片段组装策略生成测试个体;在种群更新时,以RosettaScore3为优化目标函数,基于Anfinsen提出的蛋白质天然态结构是自由能最低的结构,根据构象的能量判断是否接受测试个体;在两阶段策略的指导下,通过不断更新种群获得一系列亚稳态构象。
本发明的有益效果为:预测精度较高、复杂度较低。
附图说明
图1是测试序列在种群更新过程中RMSD和能量值的关系示意图。
图2是1ENH算法预测所得蛋白质三维结构示意图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1~图2,一种基于两阶段差分进化算法的蛋白质结构预测方法,包括以下步骤:
1)给定查询序列信息;
2)初始化:设置群体规模NP,变异因子F,交叉概率CR,迭代次数iteration,片段长度为L,能量函数选用RosettaScore3,首先通过对查询序列随机的折叠和变换,生成一个规模为NP的初始种群,初始群体为P={xi|i∈I},计算初始种群个体的能量值f(xi),i∈I,其中i为种群个体编号,I为种群个体编号集合,I={1,2,...,NP};
3)开始迭代,令g=1,g为迭代计数器,依次对种群中每个个体进行以下操作:
3.1)如果g<iteration/2,则执行如下操作:
随机选取种群中的一个构象个体Pi,i∈{1,2,3,…,NP},令Ptarget=Pi,Ptarget表示目标构象个体,跳转至3.3),执行以下操作得到变异构象Pmutant
3.2)如果iteration/2<g<iteration,则执行如下操作:
根据能量对整个种群中的构象进行降序排列,然后从能量低的前50%的NP个构象个体中随机选出一个构象记为Ppbest,令Ptarget=Ppbest,Ptarget表示目标构象个体,执行以下操作得到变异构象Pmutant
3.3)随机生成正整数rand1,rand2,rand3∈{1,2,3,......NP},且rand1≠rand2≠rand3≠i;再生成4个随机整数randrange1,randrange2,randrange3,randrange4;其中randrange1≠randrange2,randrange3≠randrange4∈{1,2,…,Length},Length为序列长度;
3.4)令a=min(randrange1,randrange2),b=max(randrange1,randrange2),k∈[a,b];令c=min(randrange3,randrange4),d=max(randrange3,randrange4),p∈[c,d];其中min表示取两个数的最小值,max表示取两个数的最大值;
3.5)用Prand2上位置a到位置b的片段的氨基酸所对应的二面角phi、psi、omega替换Prand1的相同位置所对应的二面角phi、psi、omega;再使用Prand3上位置c到位置d的片段的氨基酸所对应的二面角phi、psi、omega替换Prand1上相同位置所对应的二面角phi、psi、omega,再将所得Prand1进行片段组装得到测试个体Ptrail
3.6)针对测试个体Ptrail做交叉操作,过程如下:
3.6.1)生成随机数rand4,rand5,其中rand4∈(0,1),rand5∈(1,Length);
3.6.2)根据执行交叉过程:
若随机数rand4<=CR,个体Ptrail的片段rand5替换为个体Ptarget中对应的片段,否则直接继承个体Ptrail
3.7)针对目标个体Ptarget和测试个体Ptrail进行选择操作,过程如下:
3.7.1)计算Ptarget和Ptrail的能量:E(Ptarget)和E(Ptrail);
3.7.2)若E(Ptarget)>E(Ptrail)则用Ptrail替换Ptarget,进入3.8);
3.8)i=i+1;
3.9)迭代的运行3.1)~3.8),至满足终止条件。
本实施例以序列长度为54的蛋白质1ENH为实施例,一种基于两阶段差分进化算法的蛋白质结构预测方法,其中包含以下步骤:
1)给定查询序列信息;
2)初始化:设置群体规模NP=30,变异因子F=0.5,交叉概率CR=0.5,迭代次数iteration=50000,片段长度为L=3,能量函数选用RosettaScore3,首先通过对查询序列随机的折叠和变换,生成一个规模为NP的初始种群,初始群体为P={xi|i∈I},计算初始种群个体的能量值f(xi),i∈I,其中i为种群个体编号,I为种群个体编号集合,I={1,2,...,NP};
3)开始迭代,令g=1,g为迭代计数器,依次对种群中每个个体进行以下操作:
3.1)如果g<iteration/2,则执行如下操作:
随机选取种群中的一个构象个体Pi,i∈{1,2,3,…,NP},令Ptarget=Pi,Ptarget表示目标构象个体,跳转至3.3),执行以下操作得到变异构象Pmutant
3.2)如果iteration/2<g<iteration,则执行如下操作:
根据能量对整个种群中的构象进行降序排列,然后从能量低的前50%的NP个构象个体中随机选出一个构象记为Ppbest,令Ptarget=Ppbest,Ptarget表示目标构象个体,执行以下操作得到变异构象Pmutant
3.3)随机生成正整数rand1,rand2,rand3∈{1,2,3,......NP},且rand1≠rand2≠rand3≠i;再生成4个随机整数randrange1,randrange2,randrange3,randrange4;其中randrange1≠randrange2,randrange3≠randrange4∈{1,2,…,Length},Length为序列长度;
3.4)令a=min(randrange1,randrange2),b=max(randrange1,randrange2),k∈[a,b];令c=min(randrange3,randrange4),d=max(randrange3,randrange4),p∈[c,d];其中min表示取两个数的最小值,max表示取两个数的最大值;
3.5)用Prand2上位置a到位置b的片段的氨基酸所对应的二面角phi、psi、omega替换Prand1的相同位置所对应的二面角phi、psi、omega;再使用Prand3上位置c到位置d的片段的氨基酸所对应的二面角phi、psi、omega替换Prand1上相同位置所对应的二面角phi、psi、omega,再将所得Prand1进行片段组装得到测试个体Ptrail
3.6)针对测试个体Ptrail做交叉操作;
3.6.1)生成随机数rand4,rand5,其中rand4∈(0,1),rand5∈(1,Length);
3.6.2)根据执行交叉过程:
若随机数rand4<=CR,个体Ptrail的片段rand5替换为个体Ptarget中对应的片段,否则直接继承个体Ptrail
3.7)针对目标个体Ptarget和测试个体Ptrail进行选择操作;
3.7.1)计算Ptarget和Ptrail的能量:E(Ptarget)和E(Ptrail);
3.7.2)若E(Ptarget)>E(Ptrail)则用Ptrail替换Ptarget,进入3.8);
3.8)i=i+1;
3.9)迭代的运行3.1)~3.8),至满足终止条件。
以序列长度为54的蛋白质1ENH为实施例,运用以上方法得到了该蛋白质的近天然态构象,构象系综中构象更新图如图1所示,算法预测所得蛋白质三维结构展示如图2所示。
以上阐述的是本发明给出的一个实施例表现出来的优良效果,显然本发明不仅适合上述实施例,在不偏离本发明基本精神及不超出本发明实质内容所涉及内容的前提下可对其做种种变化加以实施。

Claims (1)

1.一种基于两阶段差分进化算法的蛋白质结构预测方法,其特征在于:所述预测方法包括以下步骤:
1)给定查询序列信息;
2)初始化:设置群体规模NP,变异因子F,交叉概率CR,迭代次数iteration,片段长度为L,能量函数选用RosettaScore3,首先通过对查询序列随机的折叠和变换,生成一个规模为NP的初始种群,初始群体为P={xi|i∈I},计算初始种群个体的能量值f(xi),i∈I,其中i为种群个体编号,I为种群个体编号集合,I={1,2,...,NP};
3)开始迭代,令g=1,g为迭代计数器,依次对种群中每个个体进行以下操作:
3.1)如果g<iteration/2,则执行如下操作:
随机选取种群中的一个构象个体Pi,i∈{1,2,3,…,NP},令Ptarget=Pi,Ptarget表示目标构象个体,跳转至3.3),执行以下操作得到变异构象Pmutant
3.2)如果iteration/2<g<iteration,则执行如下操作:
根据能量对整个种群中的构象进行降序排列,然后从能量低的前50%的NP个构象个体中随机选出一个构象记为Ppbest,令Ptarget=Ppbest,Ptarget表示目标构象个体,执行以下操作得到变异构象Pmutant
3.3)随机生成正整数rand1,rand2,rand3∈{1,2,3,......NP},且rand1≠rand2≠rand3≠i;再生成4个随机整数randrange1,randrange2,randrange3,randrange4;其中randrange1≠randrange2,randrange3≠randrange4∈{1,2,…,Length},Length为序列长度;
3.4)令a=min(randrange1,randrange2),b=max(randrange1,randrange2),k∈[a,b];令c=min(randrange3,randrange4),d=max(randrange3,randrange4),p∈[c,d];其中min表示取两个数的最小值,max表示取两个数的最大值;
3.5)用Prand2上位置a到位置b的片段的氨基酸所对应的二面角phi、psi、omega替换Prand1的相同位置所对应的二面角phi、psi、omega;再使用Prand3上位置c到位置d的片段的氨基酸所对应的二面角phi、psi、omega替换Prand1上相同位置所对应的二面角phi、psi、omega,再将所得Prand1进行片段组装得到测试个体Ptrail
3.6)针对测试个体Ptrail做交叉操作,过程如下:
3.6.1)生成随机数rand4,rand5,其中rand4∈(0,1),rand5∈(1,Length);
3.6.2)根据执行交叉过程:若随机数rand4<=CR,个体Ptrail的片段rand5替换为个体Ptarget中对应的片段,否则直接继承个体Ptrail
3.7)针对目标个体Ptarget和测试个体Ptrail进行选择操作,过程如下:
3.7.1)计算Ptarget和Ptrail的能量:E(Ptarget)和E(Ptrail);
3.7.2)若E(Ptarget)>E(Ptrail)则用Ptrail替换Ptarget,进入3.8);
3.8)i=i+1;
3.9)迭代的运行3.1)~3.8),至满足终止条件。
CN201610139379.3A 2016-03-11 2016-03-11 一种基于两阶段差分进化算法的蛋白质结构预测方法 Pending CN105760710A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610139379.3A CN105760710A (zh) 2016-03-11 2016-03-11 一种基于两阶段差分进化算法的蛋白质结构预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610139379.3A CN105760710A (zh) 2016-03-11 2016-03-11 一种基于两阶段差分进化算法的蛋白质结构预测方法

Publications (1)

Publication Number Publication Date
CN105760710A true CN105760710A (zh) 2016-07-13

Family

ID=56333070

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610139379.3A Pending CN105760710A (zh) 2016-03-11 2016-03-11 一种基于两阶段差分进化算法的蛋白质结构预测方法

Country Status (1)

Country Link
CN (1) CN105760710A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106372456A (zh) * 2016-08-26 2017-02-01 浙江工业大学 一种基于深度学习Residue2vec的蛋白质结构预测方法
CN106951738A (zh) * 2017-04-20 2017-07-14 北京工业大学 一种蛋白质折叠类型分类方法
CN107704726A (zh) * 2017-10-13 2018-02-16 齐齐哈尔大学 一种利用粒子群模拟退火算法来进行蛋白质折叠预测的方法
CN109243525A (zh) * 2018-07-12 2019-01-18 浙江工业大学 一种基于种群熵的阶段性蛋白质结构预测方法
CN109360599A (zh) * 2018-08-28 2019-02-19 浙江工业大学 一种基于残基接触信息交叉策略的蛋白质结构预测方法
CN109390033A (zh) * 2018-08-29 2019-02-26 浙江工业大学 一种基于片段自适应选择的群体蛋白质结构预测方法
CN109524058A (zh) * 2018-11-07 2019-03-26 浙江工业大学 一种基于差分进化的蛋白质二聚体结构预测方法
CN109872770A (zh) * 2019-01-09 2019-06-11 浙江工业大学 一种结合排挤度评价的多变异策略蛋白质结构预测方法
CN111755065A (zh) * 2020-06-15 2020-10-09 重庆邮电大学 一种基于虚拟网络映射和云并行计算的蛋白质构象预测加速方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104881688A (zh) * 2015-06-11 2015-09-02 电子科技大学 一种两阶段的基于差分进化和模糊c-均值的聚类算法
CN105205348A (zh) * 2015-09-22 2015-12-30 浙江工业大学 一种基于距离约束选择策略的群体构象空间优化方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104881688A (zh) * 2015-06-11 2015-09-02 电子科技大学 一种两阶段的基于差分进化和模糊c-均值的聚类算法
CN105205348A (zh) * 2015-09-22 2015-12-30 浙江工业大学 一种基于距离约束选择策略的群体构象空间优化方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘荣辉等: "两段式差分进化算法及函数优化", 《华中科技大学学报(自然科学版)》 *
张大斌等: "基于两阶段变异交叉策略的差分进化算法", 《计算机工程》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106372456B (zh) * 2016-08-26 2019-01-22 浙江工业大学 一种基于深度学习的蛋白质结构预测方法
CN106372456A (zh) * 2016-08-26 2017-02-01 浙江工业大学 一种基于深度学习Residue2vec的蛋白质结构预测方法
CN106951738A (zh) * 2017-04-20 2017-07-14 北京工业大学 一种蛋白质折叠类型分类方法
CN107704726A (zh) * 2017-10-13 2018-02-16 齐齐哈尔大学 一种利用粒子群模拟退火算法来进行蛋白质折叠预测的方法
CN109243525A (zh) * 2018-07-12 2019-01-18 浙江工业大学 一种基于种群熵的阶段性蛋白质结构预测方法
CN109360599B (zh) * 2018-08-28 2021-06-18 浙江工业大学 一种基于残基接触信息交叉策略的蛋白质结构预测方法
CN109360599A (zh) * 2018-08-28 2019-02-19 浙江工业大学 一种基于残基接触信息交叉策略的蛋白质结构预测方法
CN109390033A (zh) * 2018-08-29 2019-02-26 浙江工业大学 一种基于片段自适应选择的群体蛋白质结构预测方法
CN109390033B (zh) * 2018-08-29 2020-10-30 浙江工业大学 一种基于片段自适应选择的群体蛋白质结构预测方法
CN109524058B (zh) * 2018-11-07 2021-02-26 浙江工业大学 一种基于差分进化的蛋白质二聚体结构预测方法
CN109524058A (zh) * 2018-11-07 2019-03-26 浙江工业大学 一种基于差分进化的蛋白质二聚体结构预测方法
CN109872770A (zh) * 2019-01-09 2019-06-11 浙江工业大学 一种结合排挤度评价的多变异策略蛋白质结构预测方法
CN109872770B (zh) * 2019-01-09 2020-10-30 浙江工业大学 一种结合排挤度评价的多变异策略蛋白质结构预测方法
CN111755065A (zh) * 2020-06-15 2020-10-09 重庆邮电大学 一种基于虚拟网络映射和云并行计算的蛋白质构象预测加速方法

Similar Documents

Publication Publication Date Title
CN105760710A (zh) 一种基于两阶段差分进化算法的蛋白质结构预测方法
Wei et al. Protein–protein interaction sites prediction by ensembling SVM and sample-weighted random forests
CN103413067B (zh) 一种基于抽象凸下界估计的蛋白质结构预测方法
Whelan et al. Molecular phylogenetics: state-of-the-art methods for looking into the past
Ding et al. Protein design via deep learning
Hu et al. Mining Protein Contact Maps.
CN104866733B (zh) 一种基于副本交换的群体构象空间优化方法
Chen et al. Labeling network motifs in protein interactomes for protein function prediction
CN106055920B (zh) 一种基于阶段性多策略副本交换的蛋白质结构预测方法
CN103473482A (zh) 基于差分进化和构象空间退火的蛋白质三维结构预测方法
Devaurs et al. Characterizing energy landscapes of peptides using a combination of stochastic algorithms
CN104951670B (zh) 一种基于距离谱的群体构象空间优化方法
Wang et al. G-DipC: an improved feature representation method for short sequences to predict the type of cargo in cell-penetrating peptides
Chen et al. Predicting coding potential of RNA sequences by solving local data imbalance
CN106503486A (zh) 一种基于多阶段子群协同进化策略的差分进化蛋白质结构从头预测方法
CN105975806A (zh) 一种基于距离约束副本交换的蛋白质结构预测方法
Zhang et al. Mining tertiary structural motifs for assessment of designability
Morehead et al. EGR: Equivariant graph refinement and assessment of 3D protein complex structures
Yousif et al. A survey of exact motif finding algorithms
Dong et al. Methods for optimizing the structure alphabet sequences of proteins
Odibat et al. A generalized framework for mining arbitrarily positioned overlapping co-clusters
Hentabli et al. LINGO-DOSM: LINGO for descriptors of outline shape of molecules
CN106407738A (zh) 一种基于种群拥挤度识别的差分进化蛋白质结构预测方法
Zaki Mining data in bioinformatics
Fan et al. Improved protein relative solvent accessibility prediction using deep multi-view feature learning framework

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160713

RJ01 Rejection of invention patent application after publication