CN102479295A - 一种计算机预测蛋白功能的方法 - Google Patents

一种计算机预测蛋白功能的方法 Download PDF

Info

Publication number
CN102479295A
CN102479295A CN2010105672789A CN201010567278A CN102479295A CN 102479295 A CN102479295 A CN 102479295A CN 2010105672789 A CN2010105672789 A CN 2010105672789A CN 201010567278 A CN201010567278 A CN 201010567278A CN 102479295 A CN102479295 A CN 102479295A
Authority
CN
China
Prior art keywords
protein
function
fragment
statistics
obs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010105672789A
Other languages
English (en)
Other versions
CN102479295B (zh
Inventor
李国辉
徐贝思
张鼎林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Institute of Chemical Physics of CAS
Original Assignee
Dalian Institute of Chemical Physics of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian Institute of Chemical Physics of CAS filed Critical Dalian Institute of Chemical Physics of CAS
Priority to CN201010567278.9A priority Critical patent/CN102479295B/zh
Publication of CN102479295A publication Critical patent/CN102479295A/zh
Application granted granted Critical
Publication of CN102479295B publication Critical patent/CN102479295B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种计算机预测蛋白功能的方法,包括以下步骤:对生物大分子的原子之间的距离进行半粗粒化统计,得到生物大分子之间相互作用的半粗粒化统计势函数;利用半粗粒化统计势函数在目标蛋白周围空间找到相互作用的热点区域;结合分子碎片生长方法,在热点区域寻找可有与目标蛋白紧密结合的蛋白质、DNA或RNA序列片段;计算蛋白质、DNA或RNA序列片段与目标蛋白结合的强度并排序;选取规定数量的序列片段及其结构,在相关的生物功能数据库中进行搜索,查找相应的生物功能,预测到目标蛋白可能具有的功能。本发明具有已有粗粒化统计势函数计算速度快的优点,而且也将与分子碎片生长方法结合的更加紧密、具有目前已有粗粒化统计势所不具备的准确性。

Description

一种计算机预测蛋白功能的方法
技术领域
本发明涉及的是一种生物信息技术,具体的说是一种计算机预测蛋白功能的方法。
背景技术
预测蛋白功能的计算方法主要有四种:
一类是基于结构相似性的方法。这类方法利用三维结构的相似程度,分析目标蛋白最可能有功能的结构单元,在已知蛋白质数据库中搜索与这些结构单元相似的蛋白质的功能数据,从而达到预测目标蛋白功能的目标。有些算法可以不用考虑拓扑结构,而只考虑空间结构。
一类是基于三维基序的方法。这些方法更多的是试图找到蛋白质中具有功能的结构元素,比如在很多DNA结合蛋白中都有发现的Helix-Turn-Helix(HTH)基序。这样,人们就可以通过类似的数据库近似得到具有这些基序的蛋白质的功能。比如用TESS算法在酶的活性位点建立起来的PROCAT数据库;直接利用蛋白质结构数据库(Protein Database Bank,简称PDB)文件中的site信息建立的PDBSite库等。
一类是基于表面的方法。这类方法通常会根据各原子的三维坐标和互相之间的距离来产生蛋白质的表面,而认为这些表面的形状及相互之间吻合的程度是决定蛋白质功能的主要因素。当然,也有研究表明某些蛋白质的功能是由表面的疏水性质或者静电性质决定的。这类方法通常被叫做分子对接方法,在计算机辅助药物设计中有着广泛的应用。
还有一类是基于学习的方法。这类方法包括数据挖掘、人工智能,各种方法层出不穷,比如使用支持向量机,决策树,人工神经网络等等等等。他们用各种方式试图找到蛋白质的功能信息和蛋白质的序列结构等信息之间的关联(显示的或隐式的),以达到预测的目的。
基于知识的统计势函数是以已知稳定结构的一些特性统计平均为基础的势能函数,基本假设是,测到的稳定结构的势能最低。这样在稳定结构中统计到的各种特性数量,并通过一些类似波尔兹曼分布函数的方法得到各种特性的势能,然后对其他结构进行打分。与传统的以物理为基础势能函数相比,它们不太关心计算势能时候的具体物理规律,而是更关心它们需要用来计算势能的特性是否能被统计平均。比如有的统计势以二面角做统计,有的以溶液的表面做统计,有以接触对做统计的,有以距离对做统计的。以距离对做统计的基于知识的统计势函数其基本计算方法如下:对假定的目标蛋白对目标蛋白把所有原子在以rcut为半径的球体内部分为很多的球壳(r,r+Δr],这样统计目标蛋白中原子类型i的球体中原子类型为j原子在不同球壳中出现的数量为Nobs(i,j,r)。通过它与期望的分布值比较,可以得到原子对i,j在(r,r+Δr)距离的能量值:
u ( i , j , r ) = - RT ln N obs ( i , j , r ) N exp ( i , j , r )
基于知识的统计势函数按照参照态Nexp(i,j,r)的不同而不同。
目前现有的能够同时在更大的序列和结构范围内寻找与目标蛋白可能结合的蛋白质、DNA和RNA片段方法主要有两类,一类是基于随机性的方法,比如蒙特卡洛、遗传算法等,另外一类是基于确定性的方法,例如dead-end-elimination,branch-and-bound等,但是它们都只能在给定的序列长度以及固定的蛋白质骨架下进行序列和构象搜索,而且不能够对DNA和RNA进行序列和构象搜索。
分子碎片生长法是比较经典的计算机辅助药物设计的方法之一,被广泛用来进行小分子的全新设计和改造。分子碎片生长方法具备所有已有蛋白质序列和构象搜索方案所不具备的独特的优点。一个就是能够同时在序列的长度和组成以及结构空间进行搜索,另外一个优点就是完全不依赖于目标蛋白质的构象数目,克服了基于结构相似性分析的蛋白质功能预测方法的主要缺陷,而且蛋白质的构象可以是实验得到的,也可以是通过分子动力学模拟或者其他理论计算方法产生的。
聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。它是一种重要的人类行为。聚类分析的目标就是在相似的基础上收集数据来分类。基于网格的聚类方法首先将对象空间划分为有限个单元以构成网格结构,然后利用网格结构完成聚类。
同源建模是利用序列相似的蛋白质(已知结构)的结构作为“模板”,以得到未知结构蛋白存在时比较可能的结构。如果能够获得比较好的所要预测结构的蛋白和已知蛋白序列的比对结果,则能够获得精确的结构模型。
使用全原子的统计势能函数计算量大,不利于构象空间的搜索,而粗粒化的统计势能函数丢失的信息比较多。
发明内容
针对现有技术中预测蛋白功能的计算方法存在计算量大,不利于构象空间的搜索以及丢失的信息比较多等不足之处,本发明要解决的技术问题是提供一种减少计算量、将与分子碎片生长方法结合的更加紧密的计算机预测蛋白功能方法。
为解决上述技术问题,本发明采用的技术方案是:
本发明计算机预测蛋白功能的方法包括以下步骤:
对生物大分子的原子之间的距离进行半粗粒化统计,得到生物大分子之间相互作用的半粗粒化统计势函数;
利用半粗粒化统计势函数在目标蛋白周围空间找到相互作用的热点区域;
结合分子碎片生长方法,在热点区域寻找可有与目标蛋白紧密结合的蛋白质、DNA或RNA序列片段;
计算蛋白质、DNA或RNA序列片段与目标蛋白结合的强度并排序;
选取规定数量的序列片段及其结构,在相关的生物功能数据库中进行搜索,查找相应的生物功能,预测到目标蛋白可能具有的功能。
所述半粗粒化统计势函数通过以下过程得到:
读入蛋白质三维结构,按照相应原子在其所在氨基酸残基或DNA碱基或RNA碱基类型上的拓扑位置给定其原子类型
利用给定类型统计原子对之间的距离分布,通过与期望的分布值比较,得到半粗粒化统计势函数,通过以下公式将分布值转化成统计势函数:
u &OverBar; ( i , j , r ) = - RT ln P c ( i , j , r ) ( r &alpha; &Delta;r ) f V ( r ) &Sigma; r ( r &alpha; &Delta;r ) f V ( r ) , r < r cut , 0 , r &GreaterEqual; r cut ,
其中,R为理想气体常数,T为温度取值300K,r为原子对之间的距离,Δr为统计区间宽度,rcut为截断距离。α和N0为经验参数分别取值1.61和75。把距离在
Figure BSA00000368000700032
区间内的原子对按照其相应目标蛋白中的原子类型i和相应预测蛋白、DNA或RNA中的粗粒化原子类型j统计为Nobs(i,j,r)。为Nobs(i,j,r)中原子类型对相应的两个原子一个是全原子模型并且另一个是粗粒化模型的部分。则中间变量
f V ( r ) = &Sigma; i , j N obs Protein - CG ( i , j , r ) / &Sigma; i , j N obs ( i , j , r ) , 中间变量
P ( i , j , r ) = N obs c ( i , j , r ) / &Sigma; r N obs c ( i , j , r ) , 中间变量
N obs c ( i , j , r ) = N obs ( i , j , r ) + N 0 &Sigma; i , j N obs Protein - CG ( i , j , r ) &Sigma; i , j , r N obs Protein - CG ( i , j , r )
所述分子碎片生长方法为:
以构成天然蛋白质的20种氨基酸,构成DNA的4种脱氧核苷酸以及构成RNA的4种核苷酸做为片段前体;
对片段前体进行修改后形成生长使用的片段;
父代的一个分子选择一个片段,连接片段,调整新连接片段的构象,使每一个构象都对应一个子代分子;
通过计算每个子代分子和目标蛋白质之间的结合能量,按照带权随机法选择一批子代进行下一代的繁殖。
在目标蛋白周围把空间划分为以立方体为结构单元的格点,以格点位置为假想各种粗粒化粒子的坐标,在每个格点上使用各种粗粒化类型并使用导出的半粗粒化统计势能函数评价格点和目标蛋白之间的能量,其中能量最低的值留做此格点的能量;
使用能量阀值删掉能量比较低的点,再删掉相对孤立的点,对剩下的点进行聚类分析——将剩下的点按照空间位置关系分成彼此不相连的子集。能量最低的点集作为最优预测位点。以得到的最优预测位点为第一个种子片段的位置,对种子的空间取向进行搜索来找到能量最低的方向,然后指定生长分子的长度以及想要得到的最终生长出来的分子数量等信息,在目标蛋白周围长出所有可能的分子;
分析长出来的分子的特征,通过已有生物功能数据库预测目标蛋白可能具有的功能。
本发明具有以下有益效果及优点:
1.本发明使用半粗粒化的统计势能函数,在半粗粒化的统计势能函数里,目标蛋白将使用全原子模型,而与之结合的蛋白质、DNA或RNA将使用粗粒化模型,这样统计出原子-残基(碱基)对在距离上的分布以计算相应的能量;采用半粗粒化统计势函数不仅减少计算量、具有已有粗粒化统计势函数计算速度快的优点,而且也将与分子碎片生长方法结合的更加紧密、具有目前已有粗粒化统计势所不具备的准确性。
附图说明
图1为本发明方法流程图;
图2为新分子形成过程图示意图。
具体实施方式
如图1所示,本发明计算机预测蛋白功能的方法包括以下步骤:
对生物大分子的原子之间的距离进行半粗粒化统计,得到生物大分子之间相互作用的半粗粒化统计势函数;
利用半粗粒化统计势函数在目标蛋白周围空间找到相互作用的热点区域;
结合分子碎片生长方法,在热点区域寻找可有与目标蛋白紧密结合的蛋白质、DNA或RNA序列片段;
计算蛋白质、DNA或RNA序列片段与目标蛋白结合的强度并排序;
选取规定数量的序列片段及其结构,在相关的生物功能数据库中进行搜索,查找相应的生物功能,预测到目标蛋白可能具有的功能。
自然界一共存在20种氨基酸,DNA链包括4种碱基,RNA也包括4种碱基。DNA与RNA不同的地方在于每个DNA的主链5碳糖结构上比RNA少一个氧原子,而且在DNA中有胸腺嘧啶而RNA中没有胸腺嘧啶但是有尿嘧啶。
在多肽链生长的过程中,碎片库由20种氨基酸残基构成。每种氨基酸残基的活性位点即为主链上羧基的C原子或者主链上的N原子。生成肽键的时候,通过重新设定某些原子的坐标,要将构成肽键的原子设置到一个平面上。每一个氨基酸中都有主链和侧链,大部分单键都是可以旋转的。构象的数量非常大。采取的办法是,主链上可以旋转的键采取均匀取值(比如10,20,30,40,...,360),侧链中可以旋转的键直接到已经有的数据库(天然氨基酸构象出现几率的数据库)中搜索。选择的原则还是出现几率大的被选择的几率就大。种子一开始的方向决定开始了生长的方向。随机转动种子的方向,随机选择10000个方向,然后使用统计势能打分函数对所有的方向进行评价,保留分最高的一个。为了不漏掉结合能量最低位点相近的位点,采用多个位点放种子并列生长的办法,最后将所有种子的结构放在一起进行评价。然后按照分值进行排序,能量低的放在前面。
在RNA生长的过程,选择构成RNA的四个碱基作为碎片库基础。每种碱基的活性位点即为碱基上的P原子,新碎片的O3’会被接到旧分子的P原子上。主链的旋转按照转动的角度均匀取值,侧链转动的角度随机取值。生长失败的时候,可以适当调整生长点所在键的方向。
在DNA生长过程,选择构成DNA的四个碱基作为碎片库基础。每种碱基的活性位点即为碱基上的P原子,新碎片的O3’会被接到旧分子的P原子上。DNA是双螺旋的,所以不需要旋转。因为DNA的结构比较硬,不像蛋白质和RNA相对柔软。因此在生长的过程中,每个种子带上特定的方向都对应一个结果,将所有的结果综合在一起按照分值的排序来找到最可能的方向。
所述半粗粒化统计势函数通过以下过程得到:
读入蛋白质三维结构,按照相应原子在其所在氨基酸残基或DNA碱基或RNA碱基类型上的拓扑位置给定其原子类型
利用给定类型统计原子对之间的距离分布,通过与期望的分布值比较,得到半粗粒化统计势函数,通过以下公式将分布值转化成统计势函数:
u &OverBar; ( i , j , r ) = - RT ln P c ( i , j , r ) ( r &alpha; &Delta;r ) f V ( r ) &Sigma; r ( r &alpha; &Delta;r ) f V ( r ) , r < r cut , 0 , r &GreaterEqual; r cut ,
本实施例中,读入蛋白质三维结构,以Protein Database Bank三维结构文件为例,按照相应原子在其所在氨基酸残基或DNA碱基或RNA碱基类型上的拓扑位置给定其原子类型。目标蛋白使用全原子模型,按照说明说表1给定其原子类型。预测蛋白、DNA、RNA使用粗粒化模型,其粗粒化原子类型为其侧链的几何中心。
对于需要预测功能的目标蛋白使用全原子结构模型,原子结构坐标数据主要从蛋白质结构数据库PDB获得,对于在PDB里不存在的目标蛋白结构,可以使用同源建模的方式获得。其相应原子类型如表1所示。
Figure BSA00000368000700061
Figure BSA00000368000700071
导出半粗粒化统计势函数:
对用于训练势函数的蛋白,遍历所有原子间距离在rcut以内的原子对,把距离在(r,r+Δr]区间内的原子对按照其相应目标蛋白中的原子类型i和相应预测蛋白、DNA或RNA中的粗粒化原子类型j统计为Nobs(i,j,r)。通过它与我们期望的分布值比较,我们可以得到原子类型对i,j在(r,r+Δr]距离的能量值为:
u &OverBar; ( i , j , r ) = - RT ln P c ( i , j , r ) ( r &alpha; &Delta;r ) f V ( r ) &Sigma; r ( r &alpha; &Delta;r ) f V ( r ) , r < r cut , 0 , r &GreaterEqual; r cut ,
其中,R为理想气体常数,T为温度取值300K,r为原子对之间的距离,Δr为统计区间宽度,rcut为截断距离。α和N0为经验参数分别取值1.61和75;把距离在
Figure BSA00000368000700082
区间内的原子对按照其相应目标蛋白中的原子类型i和相应预测蛋白、DNA或RNA中的粗粒化原子类型j统计为Nobs(i,j,r)。
Figure BSA00000368000700083
为Nobs(i,j,r)中原子类型对相应的两个原子一个是全原子模型并且另一个是粗粒化模型的部分。则中间变量
f V ( r ) = &Sigma; i , j N obs Protein - CG ( i , j , r ) / &Sigma; i , j N obs ( i , j , r ) , 中间变量
P ( i , j , r ) = N obs c ( i , j , r ) / &Sigma; r N obs c ( i , j , r ) , 中间变量
N obs c ( i , j , r ) = N obs ( i , j , r ) + N 0 &Sigma; i , j N obs Protein - CG ( i , j , r ) &Sigma; i , j , r N obs Protein - CG ( i , j , r )
在得到了各种原子类型之间在某个距离区间的能量值以后,遍历所有原子间距离在rcut以内的原子对,我们就可以得到整个结构的总能量:
Figure BSA00000368000700087
(1)用于训练的蛋白由PDB获得,按照蛋白、DNA或RNA分为三类。每类都为PDB库里所有相应的结构,并去除35%同源性,其PDB ID列表如表2所示。
Figure BSA00000368000700091
Figure BSA00000368000700101
所述分子碎片生长方法为:
利用构成天然蛋白质的20种氨基酸,构成DNA的4种脱氧核苷酸,构成RNA的4种核苷酸为片段前体。对前体进行修改后形成生长使用的片段。整个过程按照进化选择方式进行控制。繁殖的方法是:父代的一个分子选择一个片段,然后连接片段,其次调整新连接片段的构象——每一个构象都对应了一个子代分子。然后通过计算每个子代分子和目标蛋白质之间的结合能量。按照带权随机法选择一批子代进行下一代的繁殖。
如图2所示,新的分子碎片(上右)半胱氨酸按照旧分子的取向(上左)接到旧分子的活性位点上,形成新的分子(下)。按照能量高低留下一定比例的新碎片,并在下一次生长中按照能量给予一定的几率选取。
所述选取规定数量的序列片段及其结构,在相关的生物功能数据库中进行搜索,查找相应的生物功能,预测到目标蛋白可能具有的功能包括以下步骤:
在目标蛋白周围以
Figure BSA00000368000700111
为边长,把空间划分为以立方体为结构单元的格点,以格点位置为假想各种粗粒化粒子的坐标,在每个格点上使用各种粗粒化格点类型并使用导出的半粗粒化统计势能函数评价格点和目标蛋白之间的能量,其中能量最低的值留做此格点的能量;
使用能量阀值删掉能量比较低的点,再删掉相对孤立的点,对剩下的点进行聚类分析——将剩下的点按照空间位置关系分成彼此不相连的子集。能量最低的点集作为最优预测位点。以得到的最优预测位点为第一个种子片段的位置,对种子的空间取向进行搜索来找到能量最低的方向,然后指定生长分子的长度以及想要得到的最终生长出来的分子数量等信息,在目标蛋白周围长出所有可能的分子;
分析长出来的分子的特征,通过已有生物功能数据库预测目标蛋白可能具有的功能。

Claims (4)

1.一种计算机预测蛋白功能的方法,其特征在于包括以下步骤:
对生物大分子的原子之间的距离进行半粗粒化统计,得到生物大分子之间相互作用的半粗粒化统计势函数;
利用半粗粒化统计势函数在目标蛋白周围空间找到相互作用的热点区域;
结合分子碎片生长方法,在热点区域寻找可有与目标蛋白紧密结合的蛋白质、DNA或RNA序列片段;
计算蛋白质、DNA或RNA序列片段与目标蛋白结合的强度并排序;
选取规定数量的序列片段及其结构,在相关的生物功能数据库中进行搜索,查找相应的生物功能,预测到目标蛋白可能具有的功能。
2.按权利要求1所述的计算机预测蛋白功能的方法,其特征在于:
所述半粗粒化统计势函数通过以下过程得到:
读入蛋白质三维结构,按照相应原子在其所在氨基酸残基或DNA碱基或RNA碱基类型上的拓扑位置给定其原子类型
利用给定类型统计原子对之间的距离分布,通过与期望的分布值比较,得到半粗粒化统计势函数,通过以下公式将分布值转化成统计势函数:
u &OverBar; ( i , j , r ) = - RT ln P c ( i , j , r ) ( r &alpha; &Delta;r ) f V ( r ) &Sigma; r ( r &alpha; &Delta;r ) f V ( r ) , r < r cut , 0 , r &GreaterEqual; r cut ,
其中,R为理想气体常数,T为温度取值300K,r为原子对之间的距离,Δr为统计区间宽度,rcut为截断距离。α和N0为经验参数分别取值1.61和75。把距离在
Figure FSA00000368000600012
区间内的原子对按照其相应目标蛋白中的原子类型i和相应预测蛋白、DNA或RNA中的粗粒化原子类型j统计为Nobs(i,j,r)。
Figure FSA00000368000600013
为Nobs(i,j,r)中原子类型对相应的两个原子一个是全原子模型并且另一个是粗粒化模型的部分。则中间变量
f V ( r ) = &Sigma; i , j N obs Protein - CG ( i , j , r ) / &Sigma; i , j N obs ( i , j , r ) , 中间变量
P ( i , j , r ) = N obs c ( i , j , r ) / &Sigma; r N obs c ( i , j , r ) , 中间变量
N obs c ( i , j , r ) = N obs ( i , j , r ) + N 0 &Sigma; i , j N obs Protein - CG ( i , j , r ) &Sigma; i , j , r N obs Protein - CG ( i , j , r )
3.按权利要求2所述的计算机预测蛋白功能的方法,其特征在于:所述分子碎片生长方法为:
以构成天然蛋白质的20种氨基酸,构成DNA的4种脱氧核苷酸以及构成RNA的4种核苷酸做为片段前体;
对片段前体进行修改后形成生长使用的片段;
父代的一个分子选择一个片段,连接片段,调整新连接片段的构象,使每一个构象都对应一个子代分子;
通过计算每个子代分子和目标蛋白质之间的结合能量,按照带权随机法选择一批子代进行下一代的繁殖。
4.按权利要求2所述的计算机预测蛋白功能的方法,其特征在于:
在目标蛋白周围把空间划分为以立方体为结构单元的格点,以格点位置为假想各种粗粒化粒子的坐标,在每个格点上使用各种粗粒化类型并使用导出的半粗粒化统计势能函数评价格点和目标蛋白之间的能量,其中能量最低的值留做此格点的能量;
使用能量阀值删掉能量比较低的点,再删掉相对孤立的点,对剩下的点进行聚类分析——将剩下的点按照空间位置关系分成彼此不相连的子集。能量最低的点集作为最优预测位点。以得到的最优预测位点为第一个种子片段的位置,对种子的空间取向进行搜索来找到能量最低的方向,然后指定生长分子的长度以及想要得到的最终生长出来的分子数量等信息,在目标蛋白周围长出所有可能的分子;
分析长出来的分子的特征,通过已有生物功能数据库预测目标蛋白可能具有的功能。
CN201010567278.9A 2010-11-30 2010-11-30 一种计算机预测蛋白功能的方法 Expired - Fee Related CN102479295B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010567278.9A CN102479295B (zh) 2010-11-30 2010-11-30 一种计算机预测蛋白功能的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010567278.9A CN102479295B (zh) 2010-11-30 2010-11-30 一种计算机预测蛋白功能的方法

Publications (2)

Publication Number Publication Date
CN102479295A true CN102479295A (zh) 2012-05-30
CN102479295B CN102479295B (zh) 2015-01-07

Family

ID=46091937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010567278.9A Expired - Fee Related CN102479295B (zh) 2010-11-30 2010-11-30 一种计算机预测蛋白功能的方法

Country Status (1)

Country Link
CN (1) CN102479295B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886226A (zh) * 2012-12-21 2014-06-25 中国科学院大连化学物理研究所 基于三维空间静电势重构的新型蛋白质粗粒化计算方法
CN104715164A (zh) * 2013-12-12 2015-06-17 中国科学院大连化学物理研究所 与蛋白质相互作用的dna骨架位置预测方法
CN106295243A (zh) * 2016-08-10 2017-01-04 华中科技大学 一种蛋白质‑rna复合物结构预测方法
CN108932400A (zh) * 2017-05-24 2018-12-04 北京工业大学 一种考虑界面信息的有效的蛋白质-rna复合物结构预测方法
CN111816250A (zh) * 2020-06-17 2020-10-23 华中科技大学 将大分子复合物结构映射到基因组和突变数据库的方法
CN113362900A (zh) * 2021-06-15 2021-09-07 邵阳学院 一种预测n4-乙酰胞苷的混合模型
CN114094150A (zh) * 2020-06-29 2022-02-25 中国科学院大连化学物理研究所 一种基于机器学习的液流电池电堆最优操作条件预测方法
CN114121146A (zh) * 2021-11-29 2022-03-01 山东建筑大学 一种基于并行和蒙特卡罗策略的rna三级结构预测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101082944A (zh) * 2007-06-01 2007-12-05 哈尔滨工程大学 基于综合算法的蛋白质折叠过程的计算机模拟方法
CN101122933A (zh) * 2007-09-10 2008-02-13 山东大学 一种利用计算机模拟计算蛋白质与dna之间作用力的方法
CN101294970A (zh) * 2007-04-25 2008-10-29 中国医学科学院基础医学研究所 蛋白质三维结构的预测方法
CN101794351A (zh) * 2010-03-09 2010-08-04 哈尔滨工业大学 一种基于大间隔最近中心点的蛋白质二级结构的工程预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101294970A (zh) * 2007-04-25 2008-10-29 中国医学科学院基础医学研究所 蛋白质三维结构的预测方法
CN101082944A (zh) * 2007-06-01 2007-12-05 哈尔滨工程大学 基于综合算法的蛋白质折叠过程的计算机模拟方法
CN101122933A (zh) * 2007-09-10 2008-02-13 山东大学 一种利用计算机模拟计算蛋白质与dna之间作用力的方法
CN101794351A (zh) * 2010-03-09 2010-08-04 哈尔滨工业大学 一种基于大间隔最近中心点的蛋白质二级结构的工程预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
徐贝思: "聚电解质及生物大分子的相转变和分子间相互作用的研究", 《中国博士学位论文全文数据库 工程科技Ⅰ辑》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886226A (zh) * 2012-12-21 2014-06-25 中国科学院大连化学物理研究所 基于三维空间静电势重构的新型蛋白质粗粒化计算方法
CN104715164A (zh) * 2013-12-12 2015-06-17 中国科学院大连化学物理研究所 与蛋白质相互作用的dna骨架位置预测方法
CN104715164B (zh) * 2013-12-12 2017-11-21 中国科学院大连化学物理研究所 与蛋白质相互作用的dna骨架位置预测方法
CN106295243A (zh) * 2016-08-10 2017-01-04 华中科技大学 一种蛋白质‑rna复合物结构预测方法
CN106295243B (zh) * 2016-08-10 2019-01-29 华中科技大学 一种蛋白质-rna复合物结构预测方法
CN108932400B (zh) * 2017-05-24 2021-07-23 北京工业大学 一种考虑界面信息的有效的蛋白质-rna复合物结构预测方法
CN108932400A (zh) * 2017-05-24 2018-12-04 北京工业大学 一种考虑界面信息的有效的蛋白质-rna复合物结构预测方法
CN111816250A (zh) * 2020-06-17 2020-10-23 华中科技大学 将大分子复合物结构映射到基因组和突变数据库的方法
CN114094150A (zh) * 2020-06-29 2022-02-25 中国科学院大连化学物理研究所 一种基于机器学习的液流电池电堆最优操作条件预测方法
CN114094150B (zh) * 2020-06-29 2023-11-17 中国科学院大连化学物理研究所 一种基于机器学习的液流电池电堆最优操作条件预测方法
CN113362900A (zh) * 2021-06-15 2021-09-07 邵阳学院 一种预测n4-乙酰胞苷的混合模型
CN114121146A (zh) * 2021-11-29 2022-03-01 山东建筑大学 一种基于并行和蒙特卡罗策略的rna三级结构预测方法
CN114121146B (zh) * 2021-11-29 2023-10-03 山东建筑大学 一种基于并行和蒙特卡罗策略的rna三级结构预测方法

Also Published As

Publication number Publication date
CN102479295B (zh) 2015-01-07

Similar Documents

Publication Publication Date Title
CN102479295B (zh) 一种计算机预测蛋白功能的方法
Yang et al. Spatio-temporal characteristics of rural settlements and land use in the Bohai Rim of China
Blair et al. Cryptic diversity in the Mexican highlands: thousands of UCE loci help illuminate phylogenetic relationships, species limits and divergence times of montane rattlesnakes (Viperidae: Crotalus)
CN102663214B (zh) 一种集成药物靶标预测系统的构建和预测方法
Li et al. Pattern of spatial evolution of rural settlements in the Jizhou District of China during 1962–2030
CN105930688B (zh) 基于改进pso算法的蛋白质功能模块检测方法
CN105868583A (zh) 一种基于序列使用代价敏感集成和聚类预测表位的方法
CN106446281A (zh) 一种结合陆域因素和水体因素进行流域四级分区的方法
CN103455612B (zh) 基于两阶段策略的非重叠与重叠网络社区检测方法
CN105046080B (zh) 一种岩体质量评价方法
Reese et al. Dynamic Communities on the Mesa Verde Cuesta
CN103500293A (zh) 一种非核糖体蛋白质-rna复合物近天然结构的筛选方法
de la Peña et al. Lithic technological and spatial analysis of the final Pleistocene at Border Cave, South Africa
Duan et al. Optimal planning and management of land use in river source region: A case study of Songhua River Basin, China
Marinescu et al. Evaluation of urban fragmentation in Craiova city, Romania
Nielsen et al. The layout and internal development of celtic fields: structural and relative chronological analyses of three danish field systems
Horesh et al. Designing an A* algorithm for calculating edit distance between rooted-unordered trees
CN110097076A (zh) 一种基于gpu架构的矢量道路网络匹配并行计算方法及装置
Brantingham Astride the Movius Line: Late Pleistocene lithic technological variability in northeast Asia
CN107630104A (zh) 一种用于鉴定霍山石斛或铁皮石斛的系统发育树及鉴定方法
Mann et al. Classifying proteinlike sequences in arbitrary lattice protein models using LatPack
CN109326318B (zh) 一种基于Loop区域高斯扰动的群体蛋白质结构预测方法
Thakur Urban Settlements in Eastern India
Lyu et al. Intelligent clustering analysis model for mining area mineral resource prediction
CN107944710A (zh) 一种基于支持向量机的村庄用地复垦规划方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150107

Termination date: 20191130

CF01 Termination of patent right due to non-payment of annual fee