CN105468934A - 一种基于Bolzmann概率密度函数的蛋白质残基间距离模型构建方法 - Google Patents

一种基于Bolzmann概率密度函数的蛋白质残基间距离模型构建方法 Download PDF

Info

Publication number
CN105468934A
CN105468934A CN201510796279.3A CN201510796279A CN105468934A CN 105468934 A CN105468934 A CN 105468934A CN 201510796279 A CN201510796279 A CN 201510796279A CN 105468934 A CN105468934 A CN 105468934A
Authority
CN
China
Prior art keywords
sequence
protein
fragment
distance
residue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510796279.3A
Other languages
English (en)
Other versions
CN105468934B (zh
Inventor
张贵军
俞旭锋
周晓根
郝小虎
陈凯
徐东伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xuaner Biology Shanghai Co ltd
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201510796279.3A priority Critical patent/CN105468934B/zh
Publication of CN105468934A publication Critical patent/CN105468934A/zh
Application granted granted Critical
Publication of CN105468934B publication Critical patent/CN105468934B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment

Landscapes

  • Spectroscopy & Molecular Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

一种基于Bolzmann概率密度函数的蛋白质残基间距离模型构建方法,包括以下步骤:首先,下载蛋白质数据库中结构已知的蛋白质文件,通过比较序列相似度去除同源性大于30%的序列构成非冗余模板库;其次,通过一个滑动窗口对模板库中的蛋白质结构与查询序列进行相似度比较,选出查询序列每个位置中得分最高的前200个片段构成片段库文件;然后选取查询序列两个位置上片段库中来自于同一模板片段结构的距离构成距离谱;最后根据概率密度函数计算距离谱中残基对的概率密度统计,利用残基间的概率密度统计有效的加强了对蛋白质构象空间的采样,得到精度更高的近天然态构象。

Description

一种基于Bolzmann概率密度函数的蛋白质残基间距离模型构建方法
技术领域
本发明涉及生物信息学、计算机应用领域,尤其涉及的是一种基于Bolzmann概率密度函数的蛋白质残基间距离模型构建方法。
背景技术
蛋白质分子在生物细胞化学反应过程中起着至关重要的作用。它们的结构模型和生物活性状态对我们理解和治愈多种疾病有重要的意义。蛋白质只有折叠成特定的三维结构才能产生其特有的生物学功能。因此,要了解蛋白质的功能,就必须获得其三维空间结构。
蛋白质三级结构预测是生物信息学的一个重要任务。蛋白质构象优化问题现在面临最大的挑战是对极其复杂的蛋白质能量函数曲面进行搜索。蛋白质能量模型考虑了分子体系成键作用以及范德华力、静电、氢键、疏水等非成键作用,致使其形成的能量曲面极其粗糙,构象对应局部极小解数目随序列长度的增加呈指数增长。而蛋白质构象预测算法能够找到蛋白质稳定结构的机理是,大量的蛋白质亚稳定结构构成了低能量区域,所以能否找到蛋白质全局最稳定结构的关键是算法能够找到大量的蛋白质亚稳定结构,即增加算法的种群多样性。因此,针对更加精确的蛋白质力场模型,选取有效的构象空间优化算法,使新的蛋白质结构预测算法更具有普遍性和高效性成为生物信息学中蛋白质结构预测的焦点问题。
目前,蛋白质结构预测方法大致可以分为两类,基于模板的方法和不基于模板的方法。其中,不基于模板的从头预测(Ab-inito)方法应用最为广泛。它适用于同源性小于25%的大多数蛋白质,仅从序列产生全新结构,对蛋白质分子设计及蛋白质折叠的研究等具有重要意义。当前有以下几种比较成功的从头预测方法:张阳与JeffreySkolnick合作的TASSER(Threading/Assembly/Refinement)方法、DavidBaker及团队设计的Rosetta方法、Shehu等设计的FeLTr方法等。但是到目前还没有一种十分完善的方法来预测蛋白质的三维结构,即使获得了很好的预测结果,但也只是针对某些蛋白质而言的,目前主要的技术瓶颈在于两个方面,第一方面在于采样方法,现有技术对构象空间采样能力不强,另一方面在于构象更新方法,现有技术对构象的更新精度仍然不足。
因此,现有的构象空间搜索方法存在不足,需要改进。
发明内容
为了克服现有构象空间搜索方法的对构象空间采样能力不强、精度较低的不足,本发明提出一种增强构象空间采样能力、提升精度的基于Bolzmann概率密度函数的蛋白质残基间距离模型构建方法,
本发明解决其技术问题所采用的技术方案是:
一种基于Bolzmann概率密度函数的蛋白质残基间距离模型构建方法,所述模型构建方法包括以下步骤:
1)构建非冗余模板库;
1.1)从蛋白质数据库网站上下载分辨率小于的高精度蛋白质,其中为距离单位,
1.2)将含有多条多肽链的蛋白质分裂成单链,并保留最长的链与其他链比较序列相似度,去除相似度大于30%的冗余多肽链;
1.3)将余下的多肽链两两求序列相似度Imn,统计每一条链的累计相似度其中m,n为多肽链的序号,N为剩余所有链的总数;
1.4)对N条链根据累计相似度进行递减排列,从累计相似度最大的链开始依次与其他链比较去除序列相似度大于30%的链,得到非冗余蛋白质模板库;
2)输入查询序列;
3)生成片段库;
3.1)构建结构相似度函数f(i,j),其中i为查询序列残基位置,j为片段结构;
3.1.1)查询序列通过PSI-BLAST比对20个氨基酸得到序列频率谱得分项Pq(i,k),其中i为查询序列残基位置,k为20个氨基酸类型,q为查询序列标示符;
3.1.2)Lq(i,k)和Lt(j,k)是通过PSI-BLAST得到的查询序列和模板序列对数谱;
3.1.3)通过PSSpred计算得到模板结构的二级结构预测sst
3.1.4)通过神经网络程序对序列谱进行训练得到查询序列二级结构预测指标ssq
3.1.5)通过EDTSurf计算得到模板蛋白质溶剂可达性参数sat
3.1.6)通过神经网络程序预测得到查询序列溶剂可及性指标saq
3.1.7)通过二层神经网络程序训练序列谱和二级结构可以预测得到查询序列的二面角ψq
3.1.8)质心原子二面角可以通过查询蛋白质字典得到ψt为模板结构;
3.1.9)SPt(j,k)为模板结构中每一个残基相对20个残基类型的频率矩阵。
3.1.10)结构相似度函数
其中w1,w2,w3,w4,w5为权重值;
3.2)通过无间隙穿线法以3个残基为单体单元,将非冗余模板库中的片段结构与查询序列进行匹配,根据结构相似度函数f(i,j)对片段结构打分;
3.3)在查询序列与模板片段结构匹配时使用一个滑动窗口,比对查询序列i个位置和第j个片段的相似度得分f(i,j),选出每个位置上得分最高的前K个片段构成片段库;
4)得到距离谱;
4.1)遍历查询序列残基位置上K个相似度较高的片段,是查询序列第i个位置上的片段,是查询序列第j位置上的片段;
4.2)用aik和ajl表示i和j上选出的来自于同一模板结构的片段结构;
4.3)计算aik和ajl在原模板结构中的距离dij
4.4)统计查询序列残基对来自于同个模板片段间的距离,在这里只统计小于的残基对之间距离(残基对间作用力随着距离增大而减小),画出直方图得到距离谱,直方图横坐标的距离间隔为当模板中残基对之间的距离在某个区间内,则该区间总数就加1;
5)根据Bolzmann概率密度函数计算目标个体的接收概率,其中x为残基对间的距离序号,k为玻尔兹曼常数,T为温度,ΔD(x)为目标个体残基间欧式距离与距离谱的差值;
6)算出蛋白质折叠过程中构象的残基对之间距离,通过概率密度函数得到基于残基距离的接受概率其中h为距离谱中记录项序号,M为记录项总和。
本发明的技术构思为:一种基于Bolzmann概率密度函数的蛋白质残基间距离模型构建方法,首先,下载蛋白质数据库中结构已知的蛋白质文件,通过比较序列相似度去除同源性大于30%的序列构成非冗余模板库;其次,通过一个滑动窗口对模板库中的蛋白质结构与查询序列进行相似度比较,选出查询序列每个位置中得分最高的前200个片段构成片段库文件;然后选取查询序列两个位置上片段库中来自于同一模板片段结构的距离构成距离谱;最后根据Bolzmann概率密度函数计算距离谱中残基对的概率密度统计,利用残基间的概率密度统计有效的加强了对蛋白质构象空间的采样,得到精度更高的近天然态构象。
本发明的有益效果为:构象空间采样能力较强、精度较高。
附图说明
图1是蛋白质1VII中第13个残基和第18个残基间的距离谱。
图2是蛋白质1VII中第13个残基和第18个残基间距离的Bolzmann概率密度统计图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1和图2,一种基于蛋白质残基间距离的概率密度函数约束条件构建方法,包括以下步骤:
1)构建非冗余模板库;
1.1)从蛋白质数据库(PDB)网站上下载分辨率小于的高精度蛋白质,其中为距离单位,
1.2)将含有多条多肽链的蛋白质分裂成单链,并保留最长的链与其他链比较序列相似度,去除相似度大于30%的冗余多肽链;
1.3)将余下的多肽链两两求序列相似度Imn,统计每一条链的累计相似度其中m,n为多肽链的序号,N为剩余所有链的总数;
1.4)对N条链根据累计相似度进行递减排列,从累计相似度最大的链开始依次与其他链比较去除序列相似度大于30%的链,得到非冗余蛋白质模板库;
2)输入查询序列;
3)生成片段库;
3.1)构建结构相似度函数f(i,j),其中i为查询序列残基位置,j为片段结构;
3.1.1)查询序列通过PSI-BLAST比对20个氨基酸得到序列频率谱得分项Pq(i,k),其中i为查询序列残基位置,k为20个氨基酸类型,q为查询序列标示符;
3.1.2)Lq(i,k)和Lt(j,k)是通过PSI-BLAST得到的查询序列和模板序列对数谱;
3.1.3)通过PSSpred计算得到模板结构的二级结构预测sst
3.1.4)通过神经网络程序对序列谱进行训练得到查询序列二级结构预测指标ssq;
3.1.5)通过EDTSurf计算得到模板蛋白质溶剂可达性参数sat;
3.1.6)通过神经网络程序预测得到查询序列溶剂可及性指标saq
3.1.7)通过二层神经网络程序训练序列谱和二级结构可以预测得到查询序列的二面角ψq
3.1.8)质心原子二面角可以通过查询蛋白质字典得到ψt为模板结构;
3.1.9)SPt(j,k)为模板结构中每一个残基相对20个残基类型的频率矩阵。
3.1.10)结构相似度函数
其中w1,w2,w3,w4,w5为权重值;
3.2)通过无间隙穿线法以3个残基为单体单元,将非冗余模板库中的片段结构与查询序列进行匹配,根据结构相似度函数f(i,j)对片段结构打分;
3.3)在查询序列与模板片段结构匹配时使用一个滑动窗口,比对查询序列i个位置和第j个片段的相似度得分f(i,j),选出每个位置上得分最高的前K个片段构成片段库;
4)得到距离谱;
4.1)遍历查询序列残基位置上K个相似度较高的片段,K为预设数值,是查询序列第i个位置上的片段,是查询序列第j位置上的片段;
4.2)用aik和ajl表示i和j上选出的来自于同一模板结构的片段结构;
4.3)计算aik和ajl在原模板结构中的距离dij
4.4)统计查询序列残基对来自于同个模板片段间的距离,在这里只统计小于的残基对之间距离(残基对间作用力随着距离增大而减小),画出直方图得到距离谱,直方图横坐标的距离间隔为当模板中残基对之间的距离在某个区间内,则该区间总数就加1;
5)根据Bolzmann概率密度函数计算目标个体的接收概率,其中x为残基对间的距离序号,k为玻尔兹曼常数,T为温度,ΔD(x)为目标个体残基间欧式距离与距离谱的差值;
6)算出蛋白质折叠过程中构象的残基对之间距离,通过概率密度函数得到基于残基距离的接受概率其中h为距离谱中记录项序号,M为记录项总和。
本实施例以序列长度为36的蛋白质1VII为实施例,一种基于Bolzmann概率密度函数的蛋白质残基间距离模型构建方法,其中包含以下步骤:
1)构建非冗余模板库;
1.1)从蛋白质数据库(PDB)网站上下载分辨率小于的高精度蛋白质;
1.2)将含有多条多肽链的蛋白质分裂成单链,并保留最长的链与其他链比较序列相似度,去除相似度大于30%的冗余多肽链;
1.3)将余下的多肽链两两求序列相似度Imn,统计每一条链的累计相似度其中m,n为多肽链的序号,N为剩余所有链的总数N=35627;
1.4)对N条链根据累计相似度进行递减排列,从累计相似度最大的链开始依次与其他链比较去除序列相似度大于30%的链,得到非冗余蛋白质模板库;
2)输入查询序列;
3)生成片段库;
3.1)构建结构相似度函数f(i,j),其中i为查询序列残基位置,j为片段结构;
3.1.1)查询序列通过PSI-BLAST比对20个氨基酸得到序列频率谱得分项Pq(i,k),其中i为查询序列残基位置,k为20个氨基酸类型,q为查询序列标示符;
3.1.2)Lq(i,k)和Lt(j,k)是通过PSI-BLAST得到的查询序列和模板序列对数谱;
3.1.3)通过PSSpred计算得到模板结构的二级结构预测sst
3.1.4)通过神经网络程序对序列谱进行训练得到查询序列二级结构预测指标ssq
3.1.5)通过EDTSurf计算得到模板蛋白质溶剂可达性参数sat
3.1.6)通过神经网络程序预测得到查询序列溶剂可及性指标saq
3.1.7)通过二层神经网络程序训练序列谱和二级结构可以预测得到查询序列的二面角ψq
3.1.8)质心原子二面角可以通过查询蛋白质字典得到ψt为模板结构;
3.1.9)SPt(j,k)为模板结构中每一个残基相对20个残基类型的频率矩阵。
3.1.10)结构相似度函数
其中w1=2,w2=6,w3=2.5,w4=12,w5=10为权重值;
3.2)通过无间隙穿线法以3个残基为单体单元,将非冗余模板库中的片段结构与查询序列进行匹配,根据结构相似度函数f(i,j)对片段结构打分;
3.3)在查询序列与模板片段结构匹配时使用一个滑动窗口,比对查询序列i个位置和第j个片段的相似度得分f(i,j),选出每个位置上得分最高的前200个片段构成片段库;
4)得到距离谱;
4.1)遍历查询序列残基位置上200(取K为200)个相似度较高的片段,是查询序列第i个位置上的片段,是查询序列第j位置上的片段;
4.2)用aik和ajl表示i和j上选出的来自于同一模板结构的片段结构;
4.3)计算aik和ajl在原模板结构中的距离dij
4.4)统计查询序列残基对来自于同个模板片段间的距离,在这里只统计小于的残基对之间距离(残基对间作用力随着距离增大而减小),画出直方图得到距离谱,直方图横坐标的距离间隔为当模板中残基对之间的距离在某个区间内,则该区间总数就加1;
5)根据Bolzmann概率密度函数计算目标个体的接收概率,其中x为残基对间的距离序号,k为玻尔兹曼常数,T为温度,ΔD(x)为目标个体残基间欧式距离与距离谱的差值;
6)算出蛋白质折叠过程中构象的残基对之间距离,通过概率密度函数得到基于残基距离的接受概率其中h为距离谱中记录项序号,M为记录项总和。
以序列长度为36的蛋白质1VII为实施例,运用以上方法得到了该蛋白质的距离谱和残基间的概率密度函数,残基对间距离谱图如图1所示,1VII的Bolzmann概率密度函数距离模型展示如图2所示。
以上阐述的是本发明给出的一个实施例表现出来的优良效果,显然本发明不仅适合上述实施例,在不偏离本发明基本精神及不超出本发明实质内容所涉及内容的前提下可对其做种种变化加以实施。

Claims (1)

1.一种基于Bolzmann概率密度函数的蛋白质残基间距离模型构建方法,其特征在于:所述距离模型构建方法包括以下步骤:
1)构建非冗余模板库;
1.1)从蛋白质数据库网站上下载分辨率小于的高精度蛋白质,其中为距离单位,米;
1.2)将含有多条多肽链的蛋白质分裂成单链,并保留最长的链与其他链比较序列相似度,去除相似度大于30%的冗余多肽链;
1.3)将余下的多肽链两两求序列相似度Imn,统计每一条链的累计相似度其中m,n为多肽链的序号,N为剩余所有链的总数;
1.4)对N条链根据累计相似度进行递减排列,从累计相似度最大的链开始依次与其他链比较去除序列相似度大于30%的链,得到非冗余蛋白质模板库;
2)输入查询序列;
3)生成片段库;
3.1)构建结构相似度函数f(i,j),其中i为查询序列残基位置,j为片段结构;
3.1.1)查询序列通过PSI-BLAST比对20个氨基酸得到序列频率谱得分项Pq(i,k),其中i为查询序列残基位置,k为20个氨基酸类型,q为查询序列标示符;
3.1.2)Lq(i,k)和Lt(j,k)是通过PSI-BLAST得到的查询序列和模板序列对数谱;
3.1.3)通过PSSpred计算得到模板结构的二级结构预测sst
3.1.4)通过神经网络程序对序列谱进行训练得到查询序列二级结构预测指标ssq
3.1.5)通过EDTSurf计算得到模板蛋白质溶剂可达性参数sat
3.1.6)通过神经网络程序预测得到查询序列溶剂可及性指标saq
3.1.7)通过二层神经网络程序训练序列谱和二级结构可以预测得到查询序列的二面角ψq
3.1.8)质心原子二面角可以通过查询蛋白质字典得到ψt为模板结构;
3.1.9)SPt(j,k)为模板结构中每一个残基相对20个残基类型的频率矩阵。
3.1.10)结构相似度函数
其中w1,w2,w3,w4,w5为权重值;
3.2)通过无间隙穿线法以3个残基为单体单元,将非冗余模板库中的片段结构与查询序列进行匹配,根据结构相似度函数f(i,j)对片段结构打分;
3.3)在查询序列与模板片段结构匹配时使用一个滑动窗口,比对查询序列i个位置和第j个片段的相似度得分f(i,j),选出每个位置上得分最高的前K个片段构成片段库;
4)得到距离谱;
4.1)遍历查询序列残基位置上K个相似度较高的片段,是查询序列第i个位置上的片段,是查询序列第j位置上的片段;
4.2)用aik和ajl表示i和j上选出的来自于同一模板结构的片段结构;
4.3)计算aik和ajl在原模板结构中的距离dij
4.4)统计查询序列残基对来自于同个模板片段间的距离,在这里只统计小于的残基对之间距离,画出直方图得到距离谱,直方图横坐标的距离间隔为当模板中残基对之间的距离在某个区间内,则该区间总数就加1;
5)根据Bolzmann概率密度函数计算目标个体的接收概率,其中x为残基对间的距离序号,k为玻尔兹曼常数,T为温度,ΔD(x)为目标个体残基间欧式距离与距离谱的差值;
6)算出蛋白质折叠过程中构象的残基对之间距离,通过概率密度函数得到基于残基距离的接受概率其中h为距离谱中记录项序号,M为记录项总和。
CN201510796279.3A 2015-11-18 2015-11-18 一种基于Bolzmann概率密度函数的蛋白质残基间距离模型构建方法 Active CN105468934B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510796279.3A CN105468934B (zh) 2015-11-18 2015-11-18 一种基于Bolzmann概率密度函数的蛋白质残基间距离模型构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510796279.3A CN105468934B (zh) 2015-11-18 2015-11-18 一种基于Bolzmann概率密度函数的蛋白质残基间距离模型构建方法

Publications (2)

Publication Number Publication Date
CN105468934A true CN105468934A (zh) 2016-04-06
CN105468934B CN105468934B (zh) 2017-12-05

Family

ID=55606624

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510796279.3A Active CN105468934B (zh) 2015-11-18 2015-11-18 一种基于Bolzmann概率密度函数的蛋白质残基间距离模型构建方法

Country Status (1)

Country Link
CN (1) CN105468934B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106951738A (zh) * 2017-04-20 2017-07-14 北京工业大学 一种蛋白质折叠类型分类方法
CN107330303A (zh) * 2017-06-12 2017-11-07 浙江工业大学 一种多域蛋白模板无缝比对方法
CN110111837A (zh) * 2019-03-22 2019-08-09 中南大学 基于两阶段结构比对的蛋白质相似性的搜索方法及系统
CN110164507A (zh) * 2019-05-31 2019-08-23 郑州大学第一附属医院 一种蛋白质相似度及相似蛋白质的确定方法和系统
CN112585685A (zh) * 2018-09-21 2021-03-30 渊慧科技有限公司 确定蛋白结构的机器学习

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130303387A1 (en) * 2012-05-09 2013-11-14 Sloan-Kettering Institute For Cancer Research Methods and apparatus for predicting protein structure
CN103473482A (zh) * 2013-07-15 2013-12-25 浙江工业大学 基于差分进化和构象空间退火的蛋白质三维结构预测方法
CN103714265A (zh) * 2013-12-23 2014-04-09 浙江工业大学 一种基于蒙特卡洛局部抖动和片段组装的蛋白质三维结构预测方法
US20140100834A1 (en) * 2012-10-04 2014-04-10 Macromoltek Computational methods for analysis and molecular design of antibodies, antibody humanization, and epitope mapping coupled to a user-interactive web browser with embedded three- dimensional rendering

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130303387A1 (en) * 2012-05-09 2013-11-14 Sloan-Kettering Institute For Cancer Research Methods and apparatus for predicting protein structure
US20140100834A1 (en) * 2012-10-04 2014-04-10 Macromoltek Computational methods for analysis and molecular design of antibodies, antibody humanization, and epitope mapping coupled to a user-interactive web browser with embedded three- dimensional rendering
CN103473482A (zh) * 2013-07-15 2013-12-25 浙江工业大学 基于差分进化和构象空间退火的蛋白质三维结构预测方法
CN103714265A (zh) * 2013-12-23 2014-04-09 浙江工业大学 一种基于蒙特卡洛局部抖动和片段组装的蛋白质三维结构预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MANOJ BHASIN ET AL: "ESLpred: SVM-based method for subcellular localization of eukaryotic proteins using dipeptide composition and PSI-BLAST", 《NUCLEIC ACIDS RESEARCH》 *
MINDAUGAS MARGELEVICIUS ET AL: "PSI-BLAST-ISS: an intermediate sequence search tool for estimation of the position-specific alignment reliability", 《BMC BIOINFORMATICS》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106951738A (zh) * 2017-04-20 2017-07-14 北京工业大学 一种蛋白质折叠类型分类方法
CN107330303A (zh) * 2017-06-12 2017-11-07 浙江工业大学 一种多域蛋白模板无缝比对方法
CN107330303B (zh) * 2017-06-12 2020-06-30 浙江工业大学 一种多域蛋白模板无缝比对方法
CN112585685A (zh) * 2018-09-21 2021-03-30 渊慧科技有限公司 确定蛋白结构的机器学习
CN112585684A (zh) * 2018-09-21 2021-03-30 渊慧科技有限公司 确定蛋白结构的机器学习
CN110111837A (zh) * 2019-03-22 2019-08-09 中南大学 基于两阶段结构比对的蛋白质相似性的搜索方法及系统
CN110111837B (zh) * 2019-03-22 2022-12-06 中南大学 基于两阶段结构比对的蛋白质相似性的搜索方法及系统
CN110164507A (zh) * 2019-05-31 2019-08-23 郑州大学第一附属医院 一种蛋白质相似度及相似蛋白质的确定方法和系统

Also Published As

Publication number Publication date
CN105468934B (zh) 2017-12-05

Similar Documents

Publication Publication Date Title
Kloczkowski et al. Combining the GOR V algorithm with evolutionary information for protein secondary structure prediction from amino acid sequence
Xu et al. Toward optimal fragment generations for ab initio protein structure assembly
Nanni et al. Prediction of protein structure classes by incorporating different protein descriptors into general Chou’s pseudo amino acid composition
CN105468934A (zh) 一种基于Bolzmann概率密度函数的蛋白质残基间距离模型构建方法
Guo et al. DNSS2: Improved ab initio protein secondary structure prediction using advanced deep learning architectures
Jin et al. De novo design of foldable proteins with smooth folding funnel: automated negative design and experimental verification
Zhang et al. Adaptive compressive learning for prediction of protein–protein interactions from primary sequence
Dong et al. Identification of DNA-binding proteins by auto-cross covariance transformation
Choo et al. Recent applications of hidden Markov models in computational biology
Qu et al. Improving protein secondary structure prediction using a multi-modal BP method
CN106372456A (zh) 一种基于深度学习Residue2vec的蛋白质结构预测方法
CN110033822B (zh) 蛋白质编码方法及蛋白质翻译后修饰位点预测方法及系统
Wang et al. Improved fragment sampling for ab initio protein structure prediction using deep neural networks
Liu et al. iRNA5hmC: the first predictor to identify RNA 5-hydroxymethylcytosine modifications using machine learning
Lv et al. AMPpred-EL: An effective antimicrobial peptide prediction model based on ensemble learning
CN105808972A (zh) 一种基于谱知识从局部到全局的蛋白质结构预测方法
Mooney et al. Protein structural motif prediction in multidimensional ø-ψ space leads to improved secondary structure prediction
Zhou et al. Identify ncRNA subcellular localization via graph regularized $ k $ k-local hyperplane distance nearest neighbor model on multi-kernel learning
Rani et al. Cluster analysis method for multiple sequence alignment
Shen et al. Detecting protein candidate fragments using a structural alphabet profile comparison approach
Xu et al. LncPred-IEL: a long non-coding RNA prediction method using iterative ensemble learning
Comin et al. Fast entropic profiler: An information theoretic approach for the discovery of patterns in genomes
Lampros et al. Sequence-based protein structure prediction using a reduced state-space hidden Markov model
Liang et al. Prediction of protein structural class based on different autocorrelation descriptors of position-specific scoring matrix
Gupta et al. DAVI: Deep learning-based tool for alignment and single nucleotide variant identification

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20201119

Address after: 274300 west section of north outer ring road, Shan county, Heze City, Shandong Province

Patentee after: Shanxian Xinkai Glass Fiber Co.,Ltd.

Address before: 310018 Room 1004-1006, 17 Block 57, Baiyang Street Science Park Road, Hangzhou Economic and Technological Development Zone, Zhejiang Province

Patentee before: Zhejiang Qibo Intellectual Property Operation Co.,Ltd.

Effective date of registration: 20201119

Address after: 310018 Room 1004-1006, 17 Block 57, Baiyang Street Science Park Road, Hangzhou Economic and Technological Development Zone, Zhejiang Province

Patentee after: Zhejiang Qibo Intellectual Property Operation Co.,Ltd.

Address before: The city Zhaohui six districts Chao Wang Road Hangzhou City, Zhejiang province 310014 18

Patentee before: ZHEJIANG University OF TECHNOLOGY

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220824

Address after: 201600 14th floor, building 1, No. 339, Jiuxin Road, Jiuting Town, Songjiang District, Shanghai

Patentee after: Xuaner Biology (Shanghai) Co.,Ltd.

Address before: 274300 west section of north outer ring road, Shan county, Heze City, Shandong Province

Patentee before: Shanxian Xinkai Glass Fiber Co.,Ltd.

TR01 Transfer of patent right