CN103413067B - 一种基于抽象凸下界估计的蛋白质结构预测方法 - Google Patents
一种基于抽象凸下界估计的蛋白质结构预测方法 Download PDFInfo
- Publication number
- CN103413067B CN103413067B CN201310329575.3A CN201310329575A CN103413067B CN 103413067 B CN103413067 B CN 103413067B CN 201310329575 A CN201310329575 A CN 201310329575A CN 103413067 B CN103413067 B CN 103413067B
- Authority
- CN
- China
- Prior art keywords
- angle
- model
- sigma
- atom
- interfacial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Peptides Or Proteins (AREA)
Abstract
一种基于抽象凸下界估计的蛋白质结构预测方法,包括以下步骤:首先针对蛋白质高维构象空间采样难题,采用一系列变换方法将ECEPP/3力场模型转换为单位单纯性约束条件下的递增射线凸函数;基于抽象凸理论,证明并分析给出了递增射线凸函数的支撑超平面集;然后,在差分进化群体算法框架下,基于群体极小化构象次微分知识构建下界低估支撑面;进而,通过低估支撑面极值点快速枚举方法,逐步减小构象采样空间以提高采样效率;同时,利用下界低估支撑面快速廉价地估计原势能模型能量值,有效减少势能模型目标函数的评价次数;最后,甲硫氨酸—脑啡肽(TYR1-GLY2-GLY3-PHE4-MET5)构象空间优化实例验证了本发明的有效性。本发明提供一种可靠性高、复杂性较低、计算效率高的基于抽象凸下界估计的蛋白质结构预测方法。
Description
技术领域
本发明涉及一种生物信息学、计算机应用领域,尤其涉及的是,一种基于抽象凸下界估计的蛋白质结构预测方法。
背景技术
生物信息学是生命科学和计算机科学交叉领域的一个研究热点。生物信息学研究成果已经被广泛应用于基因发现和预测、基因数据的存储管理、数据检索与挖掘、基因表达数据分析、蛋白质结构预测、基因和蛋白质同源关系预测、序列分析与比对等。而蛋白质三维结构预测又是生物信息学领域的一个重要分支。著名的Anfinsen实验表明蛋白质的一级结构决定其三维结构,即肽链中的氨基酸残基序列决定其空间结构。从热力学的角度来讲,肽链分子天然构型对应于其物理能量的最小状态。目前,根据Anfinsen假设,直接从氨基酸序列出发,基于势能模型,采用全局优化方法,搜索分子系统的最小能量状态,从而能够高通量、廉价地预测肽链的天然构像,已经成为生物信息学最重要的研究课题之一。经过40多年的发展,对于序列相似度较高的情况(>50%),预测精度能够达到左右;但是序列相似度<30%的情况下并不理想;尤其是对于序列相似度低、或多肽(<10个残基的小蛋白)来说,从头预测方法则是唯一的选择。
从头预测方法是选择一种力场势能模型作为目标函数,利用全局优化算法在势能曲面上搜索全局最小能量解,在数学上属于一类极其复杂的非凸多极值优化问题。针对力场模型优化问题,1987年Li开创性地提出了一种蒙特卡洛能量最小化方法(MonteCarloMinimization,MCM),采用MetropolisMonteCarlo采样策略,结合局部最小化方法,优化得到了脑啡肽(包含5个残基)的最低能量结构;1997年Lee提出的构象空间退火(ConformationalSpaceAnnealing,CSA)算法,基于“种子”概念生成构象群体,结合遗传算法和构象集结过程,除了得到脑啡肽的最小能量构象之外,还得到了一系列次稳态构象;1999年Wales提出的Basin-Hopping(BH)方法本质上就是结合局部优化方法的蒙特卡洛退火优化,2005年Bradley在结合蒙特卡洛优化方法开发了分子建模Rosetta程序,成功预测CASP6中T0281目标蛋白(包含70个残基)的Cα-RMSD为对某些小目标蛋白(<85个残基),甚至得到误差精度小于的高分辨率三维解析结构;2006年,Zhan采用Basin-Paving(BP)方法得到了脑啡肽在ECEPP/2、ECEPP/3两种力场模型下最小能量构象;2009年Roosi提出几种BP改进策略,并给出了比较结果。另外,其它随机全局优化算法,如遗传算法(GeneticAlgorithms,GA)、差分进化(DifferentialEvolution,DE)算法也应用于力场模型的优化,但是由于模型的复杂性,这些算法极容易陷入某个局优解;同时由于随机算法缺乏全局收敛理论依据及解的不确定性,进一步限制了它们在实际问题中的应用。
因此,现有的技术在确定蛋白质稳定构象方面存在着缺陷,需要改进。
发明内容
为了克服已有方法复杂度高,易陷入局部极值点而不易得到全局最优稳定构象的不足,本发明在降低力场模型复杂性的同时,结合抽象凸理论,提出了一种基于抽象凸下界估计的蛋白质结构预测方法。
本发明解决其技术问题所采用的技术方案是:一种基于抽象凸下界估计的蛋白质结构预测方法,包括以下步骤:
1)选取合适的力场模型。
力场模型是依赖于原子三维坐标的经验势能函数,由于其忽略了电子的相互作用,使得分子力场模型结构相对简单,计算速度较快,辅以成熟的力场参数,可达到很高的精度,能够用于生物大分子的结构预测。力场模型总势能通常被经验性的划分成若干项,本发明采用ECEPP/3力场模型能量函数的表示形式如下:
式中表示肽链中原子个数,为第i个原子的坐标Ebond为键长贡献项(1-2相互作用),BOND为键长集合,b为1-2原子之间的距离,b0为1-2原子之间平衡状态下键长,kb为键长强度;Eangle为键角贡献项(1-3相互作用),ANGLE为键角集合,a为两键矢量之间的夹角,a0为平衡状态下键角,ka为键角的强度;Etorsion为正常二面角贡献项(1-4相互作用),采用余弦函数的形式描述,TOR为正常二面角集合,MUL为二面角多样性集合,τ为正常二面角,m为多样性,Vm,τ为二面角τ对应于多样性m的势垒高度,γm,τ为二面角τ对应于多样性m的初始相位;Eelectrostatic为静电力(库仑力)贡献项,ES为静电作用力原子集合,qi为原子i的部分电荷,qj为原子j的部分电荷,ε为介电常数;Evdw为范德华力相互作用贡献项(6-12作用力),采用Lennard-Jones势描述,VDW为范德华作用力集合,rij为原子i与原子j之间的欧氏距离,参数Aij和Bij依赖于特定原子类型和相互作用的特征;Ehydrogen为氢键相互作用贡献项(10-12作用力),HB为氢键作用力集合,Cij和Dij依赖于相互作用特征;Eother为其它额外的能量贡献项。
2)将力场模型转换为单位单纯形约束下的目标函数,并通过局部优化的方法获得其简化的势能模型。
模型(I)中b,a,τ,rij等变量均为个原子坐标的函数,经过平移及旋转变换后问题维数为给定肽链中所有原子坐标,可计算得到能量值。通常在生物学条件下,键长偏差小于键角偏差小于2°。因此,考虑肽链分子的键长、键角均固定在平衡状态,设置Ebond=Eangle=Eother=0,可将其维数降至其中为肽链分子中共价键总数,为肽链分子中独立键角总数。与此同时,该简化过程也引入高价(最高12价)的非线性等式约束条件。为了消除高价非线性等式约束条件,设 代入模型(I),可得到:
式中为肽链二面角向量;N为肽链中二面角的自由度(即优化问题维数),NRES表示肽链长度(或残基)个数,为第i个残基侧链二面角的个数;且满足 为第i个残基主链C–N–Cα–C四个原子之间的二面角,ψi为第i个残基主链N–Cα–C–N四个原子之间的二面角,ωi为第i个残基主链Cα–C–N–Cα四个原子之间的二面角,为第i个残基侧链第个二面角变量。
2.1)将力场模型转换为单位单纯形。
设常数其中τt(t=1,2,...,N)为模型(II)中二面角变量,N为二面角自由度(即优化问题维数);则由模型(II)约束条件可知: 采用下列投影变换:
将模型(II)边界约束可行域一对一地映射成单位单纯形将式(2)代入模型(II)可得:
minf3(x)=f2(2πNx1-π,2πNx2-π,...,2πNxN-π),x∈S.(III)
近一步,应用局部优化方法,得到以下松弛模型:
其中为以x为初始点在模型(III)势能曲面上应用局部最小化算法得到的局优解。
显然,模型(IV)为模型(III)松弛势能曲面,即minf3(x)=minf4(x)。图1给出了脑啡肽以ψ1(即τ2,酪氨酸残基中N–Cα–C–N四个原子形成的二面角)为自变量,其余23个二面角固定在平衡态时模型(III)和模型(IV)的势能曲线。
3)参数初始化:设置群体规模popSize,变异因子F为0.5,交叉因子CR为0.1,低估概率underFactor,常数M,支撑向量规模K=N+1,支撑向量阈值KT,初始群体 其中 称为单位单纯形,计算f5(xi),i∈I,其中f5为简化势能模型对应的目标函数并设 为区域I上的最小值,其中I={1,2,...,popSize};
4)对每一个目标个体xi∈S(i=1,2,…,popSize)作如下处理:
4.1)任意选取三个个体{xa,xb,xc|a,b,c∈{1,2,...,popSize},a≠b≠c≠i};
4.2)对{xa,xb,xc}执行变异操作生成变异个体
4.3)对目标个体xi和变异个体执行交叉操作,生成测试个体
4.3.1)设置j=1;
4.3.2) j=1,2,...,N+1;其中randb(j)产生0到1之间的随机数;rnbr(i)产生1到N+1之间的任一个整数;
4.3.3)j=j+1;
4.3.4)如果j<N+1;转至步骤4.3.2);
4.4)i=i+1;如果i<popSize,转至步骤4.1);
5)对目标个体xi∈S和测试个体逐个更新操作:
5.1)设置i=1;
5.2)查询包含的子区域计算其中为低估支撑面在子区域中唯一的最优解,为唯一对应于子区域的支撑向量矩阵对角项;
5.3)如果转至5.9);
5.4)如果K<KT,转至5.8);
5.5)如果random(0,1)<underFactor,转至5.8);
5.6)计算
5.7)如果转至5.9);
5.8)计算如果则置K=K+1,更新树结构TK;
5.9)i=i+1;如果i≤popSize,转至5.2);
6)置
7)判断是否满足终止条件,如不满足转至步骤3);
8)输出结果,退出。
附图说明
图1、脑啡肽模型III与模型IV势能曲线比较(其余23个二面角固定在平衡状态);
图2、脑啡肽稳定构象(能量值-11.7073Kcal/mol);
图3、脑啡肽最优构象解对应的24个二面角的值;
具体实施方式
下面结合附图对本发明作进一步描述,参照图1~图3,以脑啡肽为实施例,一种基于抽象凸下界估计的蛋白质结构预测方法,其中包含以下步骤:
1)选取合适的力场模型:力场模型是依赖于原子三维坐标的经验势能函数,由于其忽略了电子的相互作用,使得分子力场模型结构相对简单,计算速度较快,辅以成熟的力场参数,可达到很高的精度,能够用于生物大分子的结构预测。力场模型总势能通常被经验性的划分成若干项,本发明采用ECEPP/3力场模型能量函数的表示形式如下:
式中表示肽链中原子个数,为第i个原子的坐标Ebond为键长贡献项(1-2相互作用),BOND为键长集合,b为1-2原子之间的距离,b0为1-2原子之间平衡状态下键长,kb为键长强度;Eangle为键角贡献项(1-3相互作用),ANGLE为键角集合,a为两键矢量之间的夹角,a0为平衡状态下键角,ka为键角的强度;Etorsion为正常二面角贡献项(1-4相互作用),采用余弦函数的形式描述,TOR为正常二面角集合,MUL为二面角多样性集合,τ为正常二面角,m为多样性,Vm,τ为二面角τ对应于多样性m的势垒高度,γm,τ为二面角τ对应于多样性m的初始相位;Eelectrostatic为静电力(库仑力)贡献项,ES为静电作用力原子集合,qi为原子i的部分电荷,qj为原子j的部分电荷,ε为介电常数;Evdw为范德华力相互作用贡献项(6-12作用力),采用Lennard-Jones势描述,VDW为范德华作用力集合,rij为原子i与原子j之间的欧氏距离,参数Aij和Bij依赖于特定原子类型和相互作用的特征;Ehydrogen为氢键相互作用贡献项(10-12作用力),HB为氢键作用力集合,Cij和Dij依赖于相互作用特征;Eother为其它额外的能量贡献项。
2)将力场模型转换为单位单纯形约束下的目标函数,并通过局部优化的方法获得其简化的势能模型。
模型(I)中b,a,τ,rij等变量均为个原子坐标的函数,经过平移及旋转变换后问题维数为给定肽链中所有原子坐标,可计算得到能量值。通常在生物学条件下,键长偏差小于键角偏差小于2°。因此,考虑肽链分子的键长、键角均固定在平衡状态,设置Ebond=Eangle=Eother=0,可将其维数降至其中为肽链分子中共价键总数,为肽链分子中独立键角总数。与此同时,该简化过程也引入高价(最高12价)的非线性等式约束条件。为了消除高价非线性等式约束条件,设 代入模型(I),可得到:
式中为肽链二面角向量;N为肽链中二面角的自由度(即优化问题维数),NRES表示肽链长度(或残基)个数,为第i个残基侧链二面角的个数;且满足为第i个残基主链C–N–Cα–C四个原子之间的二面角,ψi为第i个残基主链N–Cα–C–N四个原子之间的二面角,ωi为第i个残基主链Cα–C–N–Cα四个原子之间的二面角,为第i个残基侧链第个二面角变量。
2.1)将力场模型转换为单位单纯形。
设其中τt(t=1,2,...,N)为模型(II)中二面角变量,N为二面角自由度(即优化问题维数);则由模型(II)约束条件可知: 采用下列投影变换:
将模型(II)边界约束可行域一对一地映射成单位单纯形将式(2)代入模型(II)可得:
minf3(x)=f2(2πNx1-π,2πNx2-π,...,2πNxN-π),x∈S.(III)
近一步,应用局部优化方法,得到以下松弛模型:
其中为以x为初始点在模型(III)势能曲面上应用局部最小化算法得到的局优解。
显然,模型(IV)为模型(III)松弛势能曲面,即minf3(x)=minf4(x)。
为了获取势能函数低估模型,在抽象凸理论的基础上,引入以下定理。
定理1:设使得模型(III)目标函数f3:S→R满足:
其中 如果 则f3:S→R+在y∈S处的支撑函数hy(x)为:
其中l=f3(y)/y,索引集合Θ(l)={i:li>0}。
证明:首先证明f3:S→R+为严格递增射线凸函数(SICAR)。
考虑下列函数
(i)根据引理3, 故 如果x1>x2,则g(x1)>g(x2),即为严格递增函数;设由式(5)可知g(x)=f3(x),即f3:S→R+为严格递增函数;
(ii)定义f3y(λ)≡{f3(λy)|y∈S,λ∈(0,+∞)},设有g(y)=f3(y),由式(5)可得出:
即(f3)y(λ)是在y∈S点关于λ∈(0,+∞)的凸函数。
根据定义1,由(i)、(ii)可知:f3:S→R+为严格递增射线凸函数(SICAR);
根据引理1,可知f3:S→R+在y∈S点的H-次微分为:
基于凸分析理论可知 非空,且 其中:
故:
将上式代入(8),得到在y点的支撑向量:
根据式(7)、(12),hy(x)为关于y点的支撑函数为:
证毕。
推论1:设hy(x)为模型(III)f3(x)关于y点的支撑函数,则可得到:
f3(x)=hy(x),x=y.(15)
证明:由式(13)可知,
不失一般性,假定根据式(12)可得出:
假设:
则对于 满足:
由于f3:S→R+为严格递增射线凸函数(ICAR),由函数的递增性可知:
特别地:当x=y时,由式(16)可知:f3(x)=hy(x).
证毕。
推论2:设y1,y2,...,yK∈S,则
为f3:S→R+的支撑函数族;则:
证明:由推论1可知:
故可得到:
设x=yξ,ξ∈{1,2,...,K},由式(15)可知:
f3(yξ)=hξ(yξ).(22)
另外,由式(21)可知:
由式(22)、(23)可知:
f3(yξ)=HK(yξ),ξ∈{1,2,...,K}.(24)
证毕。
定理2:设模型(III)目标函数f3:S→R满足式(3)。假设则给定y∈S,
为模型(III)目标函数f3:S→R在处的支撑弱函数。其中f4:S→R为模型(IV)目标函数,Θ(y)={i:yi>0}。
证明:由于f4(x)≤f3(x),故:
证毕。
注:定理2表明虽然不是松弛曲面f4:S→R的支撑弱函数,但仍然为模型(III)目标函数f3:S→R的下界估计曲面。
定理3:给定下列势能模型:
其中f4:S→R为模型(IV)目标函数,M>0为常数。如果选取式中满足式(3),f3:S→R为模型(III)目标函数,则给定y∈S:
为模型(V)的支撑弱函数,式中Θ(y)={i:yi>0}。
注:由于f5:S→R+仅仅是在模型(IV)f4:S→R上增加了常数项,故二者的最优解是等价的,又因为故模型(III)、(IV)、(V)的最优解是等价的。
推论3:设x1,x2,...,xK∈S,则
为模型(V)f5:S→R+的支撑函数族。式中Θ(l)={i:li>0}。
3)参数初始化:设置群体规模popSize,变异因子F为0.5,交叉概率CR为0.1,低估概率underFactor,常数M,支撑向量规模K=N+1,支撑向量阈值KT,初始群体 计算f5(xi),i∈I。并设 其中I={1,2,...,popSize}。
4)对每一个目标个体xi∈S(i=1,2,…,popSize)作如下处理:
4.1)任意选取三个个体{xa,xb,xc|a,b,c∈{1,2,...,popSize},a≠b≠c≠i};
4.2)对{xa,xb,xc}执行变异操作生成变异个体
4.3)对目标个体xi和变异个体执行交叉操作,生成测试个体
4.3.1)设置j=1;
4.3.2) j=1,2,...,N+1;其中randb(j)产生0到1之间的随机数;rnbr(i)产生1到N+1之间的任一个整数;
4.3.3)j=j+1;
4.3.4)如果j<N+1;转至步骤4.3.2);
4.4)i=i+1;如果i<popSize,转至步骤2.2);
5)对目标个体xi∈S和测试个体逐个更新操作:
5.1)设置i=1;
5.2)查询包含的子区域计算其中为低估支撑面在子区域中唯一的最优解,为唯一对应于子区域的支撑向量矩阵对角项。
为了查询给定区域的最优解,引入以下定理。
考虑N+1维支持向量矩阵L:
假定L满足以下两个条件:
(I)
(II) 则 使得
所有的局优解对应于满足上述两个条件的所有矩阵的集合,对于上述L的局优值d(L)和局优解xmin(L)可分别表示为:
xmin(L)=d(L)Trace(L)(31)
枚举所有满足条件(I)、(II)的矩阵L,可以得到所有的局优解,其计算复杂度为而且满足上述两个条件的矩阵L位于一个定向的无环图上,通过检查图的叶节点VK-1(对应于的所有局优解)可发现满足条件(I)、(II)的所有组合,这样计算复杂度简化至O(N|VK-1|)),|VK-1|表示局优解的数量;同时新的支撑向量lK且满足(I)、(II)的矩阵L可从VK-1中刚删掉的叶节点得到(v=lK时可能导致VK-1某些叶节点不满足(II)条件)。通过从旧节点中生成新的组合可创建一个树图TK,假设TK为平衡树,在算法中保存整棵树结构可使计算复杂度降至logN+1(|VK|)。而且,在可行域S上每一个局优解唯一确定一个子区域Su(u=1,2,...,U),且子区域之间互不交叉,即:
对每一个子区域Su(u=1,2,...,U),有
其中为满足条件(I)、(II)的支撑向量矩阵。
显然, 设 如果 则子区域Su肯定不会包含全局最优解,从而不必计算f5(x),x∈Su而将该区域可靠排除;另一方面式(32)也给出了f5(x),x∈Su相对廉价的下界估计值,当K→∞时,
5.3)如果转至5.9);
5.4)如果K<KT,转至5.8);
5.5)如果random(0,1)<underFactor,转至5.8);
5.6)计算 其中为给定区域的有效下界估计值;
5.7)如果转至5.9);
5.8)计算如果则置K=K+1,更新树结构TK;
5.9)i=i+1;如果i≤popSize,转至5.2);
6)置
7)判断是否满足终止条件,如不满足转至步骤3);
8)输出结果,退出。
以脑啡肽为实施例,运用以上方法得到了其最优构象值为-11.7073Kcal/mol。脑啡肽稳态结构如图2所示,稳态结构下对应的24个二面角如图3所示。
以上阐述的是本发明给出的一个实施例表现出来的优良优化效果,显然本发明不仅适合上述实施例,在不偏离本发明基本精神及不超出本发明实质内容所涉及内容的前提下可对其做种种变化加以实施。
Claims (3)
1.一种基于抽象凸下界估计的蛋白质结构预测方法,包括以下步骤:
1)选取合适的力场模型,本发明采用ECEPP/3力场模型能量函数的表示形式如下:
式中表示肽链中原子个数,为第i个原子的坐标Ebond为键长贡献项,BOND为键长集合,b为1-2原子之间的距离,b0为1-2原子之间平衡状态下键长,kb为键长强度;Eangle为键角贡献项,ANGLE为键角集合,a为两键矢量之间的夹角,a0为平衡状态下键角,ka为键角的强度;Etorsion为正常二面角贡献项,采用余弦函数的形式描述,TOR为正常二面角集合,MUL为二面角多样性集合,τ为正常二面角,m为多样性,Vm,τ为二面角τ对应于多样性m的势垒高度,γm,τ为二面角τ对应于多样性m的初始相位;Eelectrostatic为静电力贡献项,ES为静电作用力原子集合,qi为原子i的部分电荷,qj为原子j的部分电荷,ε为介电常数;Evdw为范德华力相互作用贡献项,采用Lennard-Jones势描述,VDW为范德华作用力集合,rij为原子i与原子j之间的欧氏距离,参数Aij和Bij依赖于特定原子类型和相互作用的特征;Ehydrogen为氢键相互作用贡献项,HB为氢键作用力集合,Cij和Dij依赖于相互作用特征;Eother为其它额外的能量贡献项;
2)将力场模型转换为单位单纯形约束下的目标函数,并通过局部优化的方法获得其简化的势能模型;
3)参数初始化:设置群体规模popSize,变异因子F为0.5,交叉因子CR为0.1,低估概率underFactor,常数M,支撑向量规模K=N+1,N为肽链中二面角的自由度,支撑向量阈值KT,初始群体其中称为单位单纯形,计算f5(xi),i∈I,其中f5为简化势能模型对应的目标函数并设 为区域I上的最小值,其中I={1,2,...,popSize};
4)对每一个目标个体xi∈S,i=1,2,…,popSize,作如下处理:
4.1)任意选取三个个体{xa,xb,xc|a,b,c∈{1,2,...,popSize},a≠b≠c≠i};
4.2)对{xa,xb,xc}执行变异操作生成变异个体
4.3)对目标个体xi和变异个体执行交叉操作,生成测试个体
4.3.1)设置j=1;
4.3.2)其中randb(j)产生0到1之间的随机数;rnbr(i)产生1到N+1之间的任一个整数;
4.3.3)j=j+1;
4.3.4)如果j<N+1;转至步骤4.3.2);
4.4)i=i+1;如果i<popSize,转至步骤4.1);
5)对目标个体xi∈S和测试个体i=1,2,…,popSize,逐个更新操作:
5.1)设置i=1;
5.2)查询包含的子区域计算其中为低估支撑面在子区域中唯一的最优解,为唯一对应于子区域的支撑向量矩阵对角项;
5.3)如果转至5.9);
5.4)如果K<KT,转至5.8);
5.5)如果random(0,1)<underFactor,转至5.8);
5.6)计算其中为给定区域中的唯一最优解;
5.7)如果转至5.9);
5.8)计算如果则置K=K+1,更新树结构TK;
5.9)i=i+1;如果i≤popSize,转至5.2);
6)置
7)判断是否满足终止条件,如不满足转至步骤3);
8)输出结果,退出。
2.如权利要求1所述的基于抽象凸下界估计的蛋白质结构预测方法,其特征在于:步骤2)中模型变换方法为,模型(I)中b,a,τ,rij变量均为个原子坐标的函数,经过平移及旋转变换后问题维数为给定肽链中所有原子坐标,可计算得到能量值;通常在生物学条件下,键长偏差小于键角偏差小于2°;因此,考虑肽链分子的键长、键角均固定在平衡状态,设置Ebond=Eangle=Eother=0,可将其维数降至其中为肽链分子中共价键总数,为肽链分子中独立键角总数;与此同时,该简化过程也引入高价的非线性等式约束条件;为了消除高价非线性等式约束条件,设代入模型(I),可得到:
式中为肽链二面角向量;N为肽链中二面角的自由度,即优化问题维数,NRES表示残基个数,为第i个残基侧链二面角的个数;且满足 为第i个残基主链C–N–Cα–C四个原子之间的二面角,ψi为第i个残基主链N–Cα–C–N四个原子之间的二面角,ωi为第i个残基主链Cα–C–N–Cα四个原子之间的二面角,为第i个残基侧链第个二面角变量。
3.如权利要求2所述的基于抽象凸下界估计的蛋白质结构预测方法,其特征在于:将给定的力场模型转换为单位单纯形,并获得简化的力场模型:
设τ′t=τt+π,常数其中τt为模型(II)中二面角变量,t=1,2,...,N,N为二面角自由度,即优化问题维数;则由模型(II)约束条件可知:τ′t≥0,t=1,2,...,N;采用下列投影变换:
将模型(II)边界约束可行域一对一地映射成单位单纯形将式(2)代入模型(II)可得:
minf3(x)=f2(2πNx1-π,2πNx2-π,...,2πNxN-π),x∈S.(III)
近一步,应用局部优化方法,得到以下松弛模型:
其中为以x为初始点在模型(III)势能曲面上应用局部最小化算法得到的局优解;
显然,模型(IV)为模型(III)松弛势能曲面,即minf3(x)=minf4(x)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310329575.3A CN103413067B (zh) | 2013-07-30 | 2013-07-30 | 一种基于抽象凸下界估计的蛋白质结构预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310329575.3A CN103413067B (zh) | 2013-07-30 | 2013-07-30 | 一种基于抽象凸下界估计的蛋白质结构预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103413067A CN103413067A (zh) | 2013-11-27 |
CN103413067B true CN103413067B (zh) | 2016-06-15 |
Family
ID=49606078
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310329575.3A Active CN103413067B (zh) | 2013-07-30 | 2013-07-30 | 一种基于抽象凸下界估计的蛋白质结构预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103413067B (zh) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103984878B (zh) * | 2014-04-08 | 2017-01-18 | 浙江工业大学 | 一种基于树搜索和片段组装的蛋白质结构预测方法 |
CN104200130B (zh) * | 2014-07-23 | 2017-08-11 | 浙江工业大学 | 一种基于树结构副本交换和片段组装的蛋白质结构预测方法 |
CN104102955B (zh) * | 2014-07-23 | 2017-09-05 | 杭州中威智能科技有限公司 | 基于抽象凸估计选择差分进化算法的电力线路规划方法 |
CN104182653A (zh) * | 2014-08-25 | 2014-12-03 | 浙江工业大学 | 一种基于局部抽象凸低估支撑面的群体构象空间优化方法 |
CN104732115B (zh) * | 2014-11-25 | 2017-06-30 | 浙江工业大学 | 一种基于简约空间抽象凸下界估计的蛋白质构象优化方法 |
CN104866733B (zh) * | 2015-04-03 | 2017-10-13 | 浙江工业大学 | 一种基于副本交换的群体构象空间优化方法 |
CN104951669B (zh) * | 2015-06-08 | 2017-09-05 | 浙江工业大学 | 一种用于蛋白质结构预测的距离谱构建方法 |
CN106650305B (zh) * | 2016-10-10 | 2019-01-22 | 浙江工业大学 | 一种基于局部抽象凸支撑面的多策略群体蛋白质结构预测方法 |
CN106778057B (zh) * | 2016-11-15 | 2019-01-29 | 浙江工业大学 | 一种基于量子进化算法的蛋白质构象空间优化方法 |
CN108647488B (zh) * | 2018-05-09 | 2021-05-18 | 浙江工业大学 | 一种基于局部扰动的群体蛋白质构象空间优化方法 |
CN109256180B (zh) * | 2018-07-03 | 2022-02-11 | 南昌立德生物技术有限公司 | 一种计算机辅助先导药物优化设计的敏感性分析算法 |
CN109346126B (zh) * | 2018-08-29 | 2020-10-30 | 浙江工业大学 | 一种下界估计策略自适应蛋白质结构预测方法 |
CN109448786B (zh) * | 2018-08-29 | 2021-04-06 | 浙江工业大学 | 一种下界估计动态策略蛋白质结构预测方法 |
CN109326321B (zh) * | 2018-08-30 | 2021-06-18 | 浙江工业大学 | 一种基于抽象凸估计的k-近邻蛋白质结构预测方法 |
CN109147877A (zh) * | 2018-09-27 | 2019-01-04 | 大连大学 | 一种通过深度学习计算乙烷分子能量的方法 |
CN109326334A (zh) * | 2018-09-27 | 2019-02-12 | 大连大学 | 一种通过深度学习计算甲醇分子能量的方法 |
CN109524058B (zh) * | 2018-11-07 | 2021-02-26 | 浙江工业大学 | 一种基于差分进化的蛋白质二聚体结构预测方法 |
CN111180021B (zh) * | 2019-12-26 | 2022-11-08 | 清华大学 | 一种蛋白质结构势能函数的预测方法 |
CN113782114B (zh) * | 2021-09-17 | 2024-02-09 | 北京航空航天大学 | 一种基于机器学习的寡肽药先导物的自动挖掘方法 |
CN114877006B (zh) * | 2022-04-07 | 2023-03-24 | 深圳市朝上科技有限责任公司 | 一种由阶梯型活塞缸构成的磁流变阻尼器 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102915407A (zh) * | 2012-10-23 | 2013-02-06 | 福建师范大学 | 基于混沌蜂群算法的蛋白质三维结构预测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101113903B1 (ko) * | 2010-03-31 | 2012-03-06 | (주)퀀텀바이오솔루션즈 | 양자역학 스코어링을 포함하는 단백질-리간드 도킹 구조의 예측방법 |
-
2013
- 2013-07-30 CN CN201310329575.3A patent/CN103413067B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102915407A (zh) * | 2012-10-23 | 2013-02-06 | 福建师范大学 | 基于混沌蜂群算法的蛋白质三维结构预测方法 |
Non-Patent Citations (3)
Title |
---|
De novo protein structure predicition by dynamic fragment assembly and conformational space annealing;Juyong L等;《Proteins:Structure,Function,and Bioinformatics》;20111231;第78卷(第8期);第2403-2417页 * |
Energy paramters inpolypeptides ,10. Improved geometrical parameters and nonbonded interactions for use in the ECEPP/3 algorithm,with application to proline-containing peptides;George Nemethy等;《Physical Chemistry》;19921231;第96卷(第15期);第6472-6484页 * |
Global minimum potential energy conformations of small molecules date;Maranas C D等;《Global Opticalmization》;19941231;第4卷(第2期);第135-170页 * |
Also Published As
Publication number | Publication date |
---|---|
CN103413067A (zh) | 2013-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103413067B (zh) | 一种基于抽象凸下界估计的蛋白质结构预测方法 | |
Deng et al. | Protein structure prediction | |
Wei et al. | Improved prediction of protein–protein interactions using novel negative samples, features, and an ensemble classifier | |
Cho et al. | Diffusion component analysis: unraveling functional topology in biological networks | |
CN103714265B (zh) | 一种基于蒙特卡洛局部抖动和片段组装的蛋白质三维结构预测方法 | |
CN105760710A (zh) | 一种基于两阶段差分进化算法的蛋白质结构预测方法 | |
CN102890703B (zh) | 一种网络异质多维标度方法 | |
CN106599611A (zh) | 蛋白质功能标注方法及系统 | |
CN104866733B (zh) | 一种基于副本交换的群体构象空间优化方法 | |
Zhang et al. | Predicting linear B-cell epitopes by using sequence-derived structural and physicochemical features | |
Li et al. | Integrating end-to-end learning with deep geometrical potentials for ab initio RNA structure prediction | |
Xiao et al. | Prediction enhancement of residue real-value relative accessible surface area in transmembrane helical proteins by solving the output preference problem of machine learning-based predictors | |
Chen et al. | Prediction of protein long-range contacts using an ensemble of genetic algorithm classifiers with sequence profile centers | |
Sun et al. | DeepHelicon: accurate prediction of inter-helical residue contacts in transmembrane proteins by residual neural networks | |
Zhang et al. | FM-based: algorithm research on rural tourism recommendation combining seasonal and distribution features | |
Chen et al. | Predicting coding potential of RNA sequences by solving local data imbalance | |
CN104951670A (zh) | 一种基于距离谱的群体构象空间优化方法 | |
Yu et al. | SOMPNN: an efficient non-parametric model for predicting transmembrane helices | |
Zhao et al. | Adversarial modality alignment network for cross-modal molecule retrieval | |
Li et al. | TERMinator: A neural framework for structure-based protein design using tertiary repeating motifs | |
Liu et al. | De novo protein structure prediction by incremental inter-residue geometries prediction and model quality assessment using deep learning | |
Lin et al. | Deep transfer learning for inter-chain contact predictions of transmembrane protein complexes | |
CN116343911B (zh) | 基于三维空间生物反应的药物靶标亲和度预测方法及系统 | |
Hu et al. | Accurate prediction of protein-ATP binding residues using position-specific frequency matrix | |
Sekhar et al. | Protein tertiary structure prediction by integrating ant colony optimization with path relinking and structure knowledge |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |