CN109801674B - 一种基于异构生物网络融合的关键蛋白质识别方法 - Google Patents

一种基于异构生物网络融合的关键蛋白质识别方法 Download PDF

Info

Publication number
CN109801674B
CN109801674B CN201910092676.0A CN201910092676A CN109801674B CN 109801674 B CN109801674 B CN 109801674B CN 201910092676 A CN201910092676 A CN 201910092676A CN 109801674 B CN109801674 B CN 109801674B
Authority
CN
China
Prior art keywords
protein
domain
network
proteins
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910092676.0A
Other languages
English (en)
Other versions
CN109801674A (zh
Inventor
赵碧海
胡赛
王雷
李学勇
张志宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changsha University
Original Assignee
Changsha University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changsha University filed Critical Changsha University
Priority to CN201910092676.0A priority Critical patent/CN109801674B/zh
Publication of CN109801674A publication Critical patent/CN109801674A/zh
Application granted granted Critical
Publication of CN109801674B publication Critical patent/CN109801674B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于异构生物网络融合的关键蛋白质识别方法,包括以下步骤:获取酵母蛋白质相互作用网络拓扑结构、蛋白质结构域信息、蛋白质同源信息以及蛋白质亚细胞定位信息;分别建立蛋白质‑蛋白质互作网络P_G、结构域‑结构域互作网络D_G和蛋白质‑结构域关系网络PD_G;融合三网络PD_G三个网络,建立异构网络HG;建立蛋白质和结构域的初始化得分向量h 0;基于随机游走模型,迭代地计算蛋白质和结构域的得分向量h t ,直到稳定状态;根据稳定状态时蛋白质的得分进行排序,识别关键蛋白质。本发明改进了关键蛋白质识别方法研究中多源生物数据的融合方式,大大提高了关键蛋白质的识别准确率。

Description

一种基于异构生物网络融合的关键蛋白质识别方法
技术领域
本发明涉及系统生物学领域,具体涉及一种基于异构生物网络融合的关键蛋白质识别方法。
背景技术
被剔除后造成有关蛋白质复合物功能丧失,并导致生物体无法生存或发育的蛋白质称为关键蛋白质,识别关键蛋白质有助于理解细胞生存和发展的最低需求,对合成生物学起到至关重要的作用。研究关键蛋白质为医学等相关学科提供有价值的信息,特别是在疾病诊疗、药物设计上有重要的应用前景。在生物学中,关键蛋白质主要是通过生物医学实验识别,这些方法代价高、效率低、适用的物种有限,因此提出高效的识别关键蛋白质的计算方法成为人们关注的热点问题之一。
目前,关键蛋白质识别的计算方法大致可以分为基于机器学习的方法、基于网络拓扑结构的方法和基于多元生物信息融合的方法三种。
(1)基于机器学习的方法
Chen等结合蛋白质进化率、蛋白质尺寸、度中心性等,采用神经网络和SVM成功地预测了酵母的关键蛋白质;Saha等做了类似的研究工作,他们的分类器结合k-最近邻居和SVM算法;Gustafson等选择大量关键性相关属性,包括上游尺寸、旁系同源等序列特性和网络拓扑特性;Hwang等结合ORF长度、链和PHY等序列特征,以及共同功能度等拓扑特征建立SVM分类器;Acencio等通过整合酵母相互作用网络、调控网络和代谢网络构造整合网络,然后用个体特征和整合特征训练基于决策树的元分类器。
这类方法面临的挑战是如何根据已知的关键蛋白质训练分类器并应用于其他未知物种。许多研究者仅依靠已知关键蛋白质的同源映射,同源映射基于已知关键蛋白质的同源蛋白质也很有可能是关键蛋白质的概念。但是这种方法有一些限制:首先,同源映射限制在保守的直系同源物种之间进行,通常占目标基因组的小部分;其次,关键蛋白质倾向于保守性,但是存在大量保守的关键蛋白质和非关键蛋白质在参考物种中没有直系同源。
(2)基于网络拓扑结构的方法
H.Jeong等提出中心性-致死性法则,指出蛋白质的关键性与网络拓扑结构紧密相关;Zotenko等发现,虽然高度连通节点倾向表现出关键性,但是网络中仍然存在很大一部分节点具有很高的度,却不是关键蛋白质;Li等提出了基于局部连通性的关键蛋白质识别方法LAC。
Ning等提出一种基于蛋白质网络反向最近邻居的中心性测度;Lin等着眼于对邻居节点属性的研究,提出最大邻居分量和最大邻居分量密度的概念;Tew等结合功能相似性,提出邻居节点功能中心性方法;Hart等指出关键性是复合物的一种属性;Song等考虑复合物和生物过程内外的物理相互作用,深入理解了蛋白质的关键性;Wang等提出基于边聚集系数的中心性方法预测关键蛋白质;Estrada采用蛋白质的二分性预测关键蛋白质,发现越不具备二分性的蛋白质越有可能是关键蛋白质;Yu等发现,网络中的瓶颈节点往往是关键蛋白质。此外,基于节点删除的策略也是一种衡量节点重要性的方法;Chua等提出结合现有中心性测度方法识别关键蛋白质;Rio等分析了18个不同的重构代谢网络上的16种不同的中心性测度,发现任意结合两种都能提高预测性能;Qi等基于局部相互作用稠密度,提出拓扑中心性方法LID。
上述这类方法同样存在一些限制:首先,相互作用数据包含大量的假阳性和假阴性,这将影响关键蛋白质识别的准确性;其次,大多数的方法很少分析其他已知关键蛋白质的内在属性,而只是使用网络的拓扑属性。
(3)基于多元生物信息融合的方法
为克服基于网络拓扑结构方法的局限,研究者们结合网络拓扑特性和其他的生物信息识别关键蛋白质。Ren等结合网络拓扑特性和复合物信息提出复合物中心性;Li等结合相互作用数据和基因表达数据提出名为Pec的关键蛋白质预测方法;Zhang等通过改进Pec,提出名为CoEWC的关键蛋白质挖掘方法,该方法结合网络拓扑特征和共表达的特性;Zhao等结合基因表达数据和网络拓扑属性,提出名为POEM的关键蛋白质识别方法;Peng等结合同源信息和相互作用网络,提出迭代的关键蛋白质预测方法ION。
但,基于多元生物信息融合的方法来识别关键蛋白质也存在一定局限性。因此,有必要改进异构生物网络融合的方式,设计一种全新的关键蛋白质识别方法。
发明内容
本发明需要解决的技术问题是提供一种基于异构生物网络融合的关键蛋白质识别方法,以解决现有技术中存在的关键蛋白质预测性能差的技术缺陷。
为解决上述技术问题,本发明所采取的技术方案如下。
一种基于异构生物网络融合的关键蛋白质识别方法,包括以下步骤:
S1:获取酵母蛋白质相互作用网络拓扑结构、蛋白质结构域信息、蛋白质同源信息以及蛋白质亚细胞定位信息;
S2:根据蛋白质相互作用网络拓扑结构和蛋白质结构域信息,分别建立蛋白质-蛋白质互作网络P_G、结构域-结构域互作网络D_G和蛋白质-结构域关系网络PD_G;
S3:融合蛋白质-蛋白质互作网络P_G、结构域-结构域互作网络D_G和蛋白质-结构域关系网络PD_G三个网络,建立异构网络HG;
S4:根据蛋白质同源信息和亚细胞定位信息,建立蛋白质和结构域的初始化得分向量h0
S5:基于随机游走模型,迭代地计算蛋白质和结构域的得分向量ht,直到稳定状态;
S6:根据稳定状态时蛋白质的得分进行排序,输出排在前K%的蛋白质为识别的关键蛋白质。
优选地,通过聚集系数对蛋白质相互作用网络进行加权获得,蛋白质-蛋白质互作网络加权的计算公式如下:
Figure BDA0001963710930000041
Ni和Nj分别表示蛋白质pi和蛋白质pj的邻居节点的集合,Ni∩Nj表示蛋白质pi和蛋白质pj的共同邻居节点集合。
优选地,步骤S2中所述结构域-结构域互作网络D_G根据蛋白质-蛋白质互作网络P_G及其蛋白质与结构域之间的关系建立,结构域与结构域之间相互作用的权值计算公式如下:
Figure BDA0001963710930000042
Figure BDA0001963710930000043
其中,P(di)和P(dj)分别表示包含结构域di和结构域dj的蛋白质集合,S(py,P(dj))表示蛋白质py和蛋白质集P(dj)之间的语义相似性。
优选地,步骤S2中所述蛋白质-结构域关系网络PD_G根据结构域信息直接建立,若蛋白质pi包含结构域dj,则MPD(i,j)=1,否则,MPD(i,j)=0。
优选地,步骤S3中所述的异构网络HG通过邻接矩阵HM表示,然后通过归一化操作,建立分块转移矩阵。
上述邻接矩阵HM表示为:
Figure BDA0001963710930000044
其中MP表示蛋白质-蛋白质互作网络P_G对应的邻接矩阵,MD表示结构域-结构域互作网络D_G对应的邻接矩阵,MPD表示蛋白质-结构域关系网络对应的邻接矩阵。
优选地,建立分块转移矩阵的计算公式如下:
从蛋白质pi到蛋白质pj的转移概率为
Figure BDA0001963710930000051
从蛋白质di到蛋白质dj的转移概率为
Figure BDA0001963710930000052
从蛋白质pi到结构域dj的转移概率为
Figure BDA0001963710930000053
从蛋白质pi到蛋白质pj的转移概率为
Figure BDA0001963710930000054
其中,β为参数,表示从蛋白质-蛋白质互作网络P_G移动到结构域-结构域互作网络D_G的移动概率。
优选地,步骤S4中所述蛋白质和结构域的初始化得分向量h0的构建步骤如下:
S401:计算亚细胞位置的重要性得分:
Figure BDA0001963710930000055
其中,|pi|表示与第i个亚细胞位置相互作用的蛋白质数量,n表示亚细胞位置的数量;
S402:计算蛋白质的位置得分:
Figure BDA0001963710930000056
其中,S(pi)表示与蛋白质pi相互作用的亚细胞位置列表;
S403:根据同源信息计算蛋白质的保守性得分:
Figure BDA0001963710930000061
S404:蛋白质pi的初始化得分计算公式如下:
h0(pi)=S_Score(pi)+I_Score(pi)
S405:结构域dj的初始化得分计算公式如下:
Figure BDA0001963710930000062
其中,S_P(dj)表示包含结构域dj的蛋白质列表。
优选地,步骤S5中采用随机游走算法迭代计算蛋白质和结构域的得分向量ht的方法主要包括以下步骤:
S501:得分向量h的得分如下:
hi+1=(1-α)HMhi+αh0
其中,参数α用来来调节初始得分与上次迭代得分的比重,h0为跳转概率。
S502:如果||hi-hi-1||≤ε,使i=i+1使返回S501继续进行迭代,否则,迭代终止。
由于采用了以上技术方案,本发明所取得技术进步如下。
本发明改进了关键蛋白质识别方法研究中多源生物数据的融合方式,结合蛋白质相互作用网络和蛋白质结构域信息建立加权的蛋白质-蛋白质互作网络、结构域-结构域互作网络以及蛋白质-结构域关系网络;融合三个异构网络,基于随机游走模型,设计了新的关键蛋白质识别方法。本发明在建立蛋白质初始化得分向量时,考虑关键蛋白质的保守特性和结构特性,结合同源信息和亚细胞定位信息,来识别关键蛋白质,大大提高了关键蛋白质的识别准确率。
附图说明
图1是本发明的流程图;
图2是本发明融合异构生物网络的示意图;
图3是本发明提出的方法与其他十种关键蛋白质预测方法DC、IC、BC、CC、SC、NC、CoEWC、Pec、POEM、ION分别预测前1%,5%,10%,15%,20%,25%个关键蛋白质的准确度比较图。
具体实施方式
下面将结合附图和具体实施例对本发明进行进一步详细说明。
一种基于异构生物网络融合的关键蛋白质识别方法,该方法的流程如图1所示,主要是结合蛋白质相互作用网络和蛋白质结构域信息建立加权的蛋白质-蛋白质互作网络、结构域-结构域互作网络以及蛋白质-结构域关系网络;融合三个异构网络,结合同源信息和亚细胞定位信息,建立蛋白质和结构域的初始化得分向量,基于随机游走模型,来识别关键蛋白质。
本实施例以酵母蛋白质为例,在酵母蛋白质相互作用网络运行本方法,来验证本发明的有效性。具体方法包括以下详细步骤。
S1:获取酵母蛋白质相互作用网络拓扑结构、蛋白质结构域信息、蛋白质同源信息以及蛋白质亚细胞定位信息。
蛋白质相互作用网络来源于酿酒酵母(面包酵母)DIP数据库,由5,023个蛋白质和22,570条边组成;已经通过基因敲除实验被很好地特征化,并被广泛应用于关键蛋白质的评估。
上述三种数据均源于Internet网上的公共数据库。其中,蛋白质结构域数据从Pfam数据库下载得到,包含1107个不同的结构域,涉及PPI网络中的3,056个蛋白质;蛋白质亚细胞定位数据从COMPARTMENTS数据库中获取,版本为2014-4-20;蛋白质的直系同源信息来自于InParanoid数据库,版本号是7;InParanoid数据库包含了100个物种(99个真核生物和1个原核生物)间的直系同源蛋白质数据。
S2:根据蛋白质相互作用网络拓扑结构和蛋白质结构域信息,分别建立蛋白质-蛋白质互作网络P_G、结构域-结构域互作网络D_G和蛋白质-结构域关系网络PD_G。
(1)建立蛋白质-蛋白质互作网络P_G
聚集系数用于刻画网络中某个节点与其邻居之间的亲疏程度,也是复杂网络中最重要的拓扑特征之一。本发明采用聚集系数对蛋白质相互作用网络进行加权获得,蛋白质-蛋白质互作网络加权的计算公式如下:
Figure BDA0001963710930000081
Ni和Nj分别表示蛋白质pi和蛋白质pj的邻居节点的集合,Ni∩Nj表示蛋白质pi和蛋白质pj的共同邻居节点集合。
(2)建立结构域-结构域互作网络D_G
D_G网络根据蛋白质-蛋白质互作网络P_G及其蛋白质与结构域之间的关系建立,结构域与结构域之间的权重计算公式如下:
Figure BDA0001963710930000082
Figure BDA0001963710930000083
其中,P(di)和P(dj)分别表示包含结构域di和结构域dj的蛋白质集合,S(py,P(dj))表示蛋白质py和蛋白质集P(dj)之间的语义相似性。
(3)建立蛋白质-结构域关系网络PD_G
蛋白质-结构域关系网络PD_G根据结构域信息直接建立。若蛋白质pi包含结构域dj,则MPD(i,j)=1,否则,MPD(i,j)=0。
S3:融合P_G、D_G和PD_G三个网络,建立异构网络HG,异构网络HG的示意图如图2所示。
异构网络HG可以通过邻接矩阵HM表示为:
Figure BDA0001963710930000084
其中MP表示蛋白质-蛋白质互作网络P_G对应的邻接矩阵,MD表示结构域-结构域互作网络D_G对应的邻接矩阵,MPD表示蛋白质-结构域关系网络对应的邻接矩阵。
然后通过归一化操作,建立分块转移矩阵,分块转移矩阵的计算公式如下:
从蛋白质pi到蛋白质pj的转移概率为
Figure BDA0001963710930000091
从蛋白质di到蛋白质dj的转移概率为
Figure BDA0001963710930000092
从蛋白质pi到结构域dj的转移概率为
Figure BDA0001963710930000093
从蛋白质pi到蛋白质pj的转移概率为
Figure BDA0001963710930000094
其中,β为参数,表示从蛋白质-蛋白质互作网络P_G移动到结构域-结构域互作网络D_G的移动概率。
S4:根据蛋白质同源信息和亚细胞定位信息,建立蛋白质和结构域的初始化得分向量h0。具体方法如下。
(1)计算亚细胞位置的重要性得分:
Figure BDA0001963710930000095
其中,|pi|表示与第i个亚细胞位置相互作用的蛋白质数量,n表示亚细胞位置的数量。
(2)计算蛋白质的位置得分:
Figure BDA0001963710930000096
其中,S(pi)表示与蛋白质pi相互作用的亚细胞位置列表。
(3)根据同源信息计算蛋白质的保守性得分:
Figure BDA0001963710930000101
(4)蛋白质pi的初始化得分计算公式如下:
h0(pi)=S_Score(pi)+I_Score(pi)
(5)结构域dj的初始化得分计算公式如下:
Figure BDA0001963710930000102
其中,S_P(dj)表示包含结构域dj的蛋白质列表。
S5:基于随机游走模型,迭代地计算蛋白质和结构域的得分向量ht,直到稳定状态。迭代步骤如下:
(1)计算蛋白质和结构域的得分向量h的得分如下:
hi+1=(1-α)HMhi+αh0
其中,参数α用来来调节初始得分与上次迭代得分的比重,h0为跳转概率。
(2)如果||hi-hi-1||≥ε,使i=i+1使返回上一步继续进行迭代,否则,迭代终止。
其中ε是一个控制迭代终止的参数,本发明中,默认地设置为10-5
S6:根据稳定状态时蛋白质的得分进行排序,输出排在前K%的蛋白质为识别的关键蛋白质。
上述为本发明应用于酵母蛋白质的关键蛋白质识别过程中,为验证本发明的准确性,同时还采用了其他十种关键蛋白质预测方法DC、IC、BC、CC、SC、NC、CoEWC、Pec、POEM、ION进行酵母蛋白质的关键蛋白质识别,通过分别预测前1%、5%、10%、15%、20%、25%个关键蛋白质,可对是一种关键蛋白质识别方法的准确度进行比较,具体如图3所示。
从图3中可以看出,本发明用于识别关键蛋白质的方法相对于其他方法具有较高的准确度。

Claims (8)

1.一种基于异构生物网络融合的关键蛋白质识别方法,其特征在于,包括以下步骤:
S1:获取酵母蛋白质相互作用网络拓扑结构、蛋白质结构域信息、蛋白质同源信息以及蛋白质亚细胞定位信息;
S2:根据蛋白质相互作用网络拓扑结构和蛋白质结构域信息,分别建立蛋白质-蛋白质互作网络P_G、结构域-结构域互作网络D_G和蛋白质-结构域关系网络PD_G;
S3:融合蛋白质-蛋白质互作网络P_G、结构域-结构域互作网络D_G和蛋白质-结构域关系网络PD_G三个网络,建立异构网络HG;
所述的异构网络HG通过邻接矩阵HM表示,然后通过归一化操作,建立分块转移矩阵,所述邻接矩阵HM为:
Figure FDA0003584529380000011
其中MP表示蛋白质-蛋白质互作网络P_G对应的邻接矩阵,MD表示结构域-结构域互作网络D_G对应的邻接矩阵,MPD表示蛋白质-结构域关系网络对应的邻接矩阵;
S4:根据蛋白质同源信息和亚细胞定位信息,建立蛋白质和结构域的初始化得分向量h0
S5:基于随机游走模型,迭代地计算蛋白质和结构域的得分向量ht,直到稳定状态;
S6:根据稳定状态时蛋白质的得分进行排序,输出排在前K%的蛋白质为识别的关键蛋白质。
2.根据权利要求1所述的一种基于异构生物网络融合的关键蛋白质识别方法,其特征在于,步骤S2中建立蛋白质-蛋白质互作网络P_G时,通过聚集系数对蛋白质相互作用网络进行加权获得,蛋白质-蛋白质互作网络加权的计算公式如下:
Figure FDA0003584529380000021
Ni和Nj分别表示蛋白质pi和蛋白质pj的邻居节点的集合,Ni∩Nj表示蛋白质pi和蛋白质pj的共同邻居节点集合。
3.根据权利要求1所述的一种基于异构生物网络融合的关键蛋白质识别方法,其特征在于,步骤S2中所述结构域-结构域互作网络D_G根据蛋白质-蛋白质互作网络P_G及其蛋白质与结构域之间的关系建立,结构域与结构域之间相互作用的权值计算公式如下:
Figure FDA0003584529380000022
其中,P(di)和P(dj)分别表示包含结构域di和结构域dj的蛋白质集合,S(py,P(dj))表示蛋白质py和蛋白质集P(dj)之间的语义相似性。
4.根据权利要求3所述的一种基于异构生物网络融合的关键蛋白质识别方法,其特征在于,蛋白质py和蛋白质集P(dj)之间的语义相似性计算公式如下:
Figure FDA0003584529380000023
5.根据权利要求1所述的一种基于异构生物网络融合的关键蛋白质识别方法,其特征在于,步骤S2中所述蛋白质-结构域关系网络PD_G根据结构域信息直接建立,若蛋白质pi包含结构域dj,则MPD(i,j)=1,否则,MPD(i,j)=0。
6.根据权利要求1所述的一种基于异构生物网络融合的关键蛋白质识别方法,其特征在于,建立分块转移矩阵的计算公式如下:
从蛋白质pi到蛋白质pj的转移概率为
Figure FDA0003584529380000024
从结构域di到结构域dj的转移概率为
Figure FDA0003584529380000031
从蛋白质pi到结构域dj的转移概率为
Figure FDA0003584529380000032
从结构域di到蛋白质pj的转移概率为
Figure FDA0003584529380000033
其中,β为参数,表示从蛋白质-蛋白质互作网络P_G移动到结构域-结构域互作网络D_G的移动概率。
7.根据权利要求1所述的一种基于异构生物网络融合的关键蛋白质识别方法,其特征在于,步骤S4中所述蛋白质和结构域的初始化得分向量h0的构建步骤如下:
S401:计算亚细胞位置的重要性得分:
Figure FDA0003584529380000034
其中,|PN(i)|表示与第i个亚细胞位置相互作用的蛋白质数量,m表示亚细胞位置的数量;
S402:计算蛋白质的位置得分:
Figure FDA0003584529380000035
其中,S(pi)表示与蛋白质pi相互作用的亚细胞位置列表;
S403:根据同源信息计算蛋白质的保守性得分:
Figure FDA0003584529380000036
S404:蛋白质pi的初始化得分计算公式如下:
h0(pi)=S_Score(pi)+I_Score(pi)
S405:结构域dj的初始化得分计算公式如下:
Figure FDA0003584529380000041
其中,S_P(dj)表示包含结构域dj的蛋白质列表。
8.根据权利要求1所述的一种基于异构生物网络融合的关键蛋白质识别方法,其特征在于,步骤S5中采用随机游走算法迭代计算蛋白质和结构域的得分向量ht的方法主要包括以下步骤:
S501:得分向量ht的得分如下:
ht+1=(1-α)HMht+αh00
其中,参数α用来调节初始得分与上次迭代得分的比重,h00为跳转概率;
S502:如果||ht-ht-1||≥ε,使t=t+1,并返回S501继续进行迭代,否则,迭代终止。
CN201910092676.0A 2019-01-30 2019-01-30 一种基于异构生物网络融合的关键蛋白质识别方法 Active CN109801674B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910092676.0A CN109801674B (zh) 2019-01-30 2019-01-30 一种基于异构生物网络融合的关键蛋白质识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910092676.0A CN109801674B (zh) 2019-01-30 2019-01-30 一种基于异构生物网络融合的关键蛋白质识别方法

Publications (2)

Publication Number Publication Date
CN109801674A CN109801674A (zh) 2019-05-24
CN109801674B true CN109801674B (zh) 2022-06-14

Family

ID=66560606

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910092676.0A Active CN109801674B (zh) 2019-01-30 2019-01-30 一种基于异构生物网络融合的关键蛋白质识别方法

Country Status (1)

Country Link
CN (1) CN109801674B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110660448B (zh) * 2019-09-20 2022-02-01 长沙学院 一种基于蛋白质的拓扑与功能特征的关键蛋白识别方法
CN110910953B (zh) * 2019-11-28 2022-09-13 长沙学院 一种基于蛋白质-域异构网络的关键蛋白预测方法
CN111312330A (zh) * 2020-02-13 2020-06-19 兰州理工大学 一种基于蛋白质节点特性的关键蛋白质识别方法及系统
CN111370068B (zh) * 2020-03-09 2022-11-04 中南大学 一种蛋白质异构体对相互作用预测方法及装置
CN111584010B (zh) * 2020-04-01 2022-05-27 昆明理工大学 一种基于胶囊神经网络和集成学习的关键蛋白质识别方法
CN112582027B (zh) * 2020-12-15 2022-04-29 武汉大学 一种基于生物蛋白质信息网络比对的同源蛋白质检测方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000070351A2 (en) * 1999-05-14 2000-11-23 Mcgill University Protein-protein interactions and methods for identifying them
CN104156634A (zh) * 2014-08-14 2014-11-19 中南大学 基于亚细胞定位特异性的关键蛋白质识别方法
CN106372458A (zh) * 2016-08-31 2017-02-01 中南大学 基于邻居接近中心性和直系同源信息的关键蛋白质识别方法
CN106399287A (zh) * 2016-10-14 2017-02-15 中国农业科学院作物科学研究所 一种水稻mit1基因、其编码蛋白及应用
CN106662567A (zh) * 2014-05-09 2017-05-10 纽约市哥伦比亚大学理事会 用于使用网络失调鉴定药物作用机制的方法和系统
CN107885971A (zh) * 2017-10-30 2018-04-06 陕西师范大学 采用改进花授粉算法识别关键蛋白质的方法
CN108319812A (zh) * 2018-02-05 2018-07-24 陕西师范大学 一种基于布谷鸟搜索算法识别关键蛋白质的方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000070351A2 (en) * 1999-05-14 2000-11-23 Mcgill University Protein-protein interactions and methods for identifying them
CN106662567A (zh) * 2014-05-09 2017-05-10 纽约市哥伦比亚大学理事会 用于使用网络失调鉴定药物作用机制的方法和系统
CN104156634A (zh) * 2014-08-14 2014-11-19 中南大学 基于亚细胞定位特异性的关键蛋白质识别方法
CN106372458A (zh) * 2016-08-31 2017-02-01 中南大学 基于邻居接近中心性和直系同源信息的关键蛋白质识别方法
CN106399287A (zh) * 2016-10-14 2017-02-15 中国农业科学院作物科学研究所 一种水稻mit1基因、其编码蛋白及应用
CN107885971A (zh) * 2017-10-30 2018-04-06 陕西师范大学 采用改进花授粉算法识别关键蛋白质的方法
CN108319812A (zh) * 2018-02-05 2018-07-24 陕西师范大学 一种基于布谷鸟搜索算法识别关键蛋白质的方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
A new method for predicting protein functions from dynamic weighted interactome networks;Bihai Zhao 等;《IEEE Transactions on NanoBioscience》;20160301;第15卷(第2期);全文 *
Artificial Fish Swarm Optimization Based Method to Identify Essential Proteins;Xiujuan Lei 等;《IEEE/ACM Transactions on Computational Biology and Bioinformatics》;20180815;第17卷(第2期);全文 *
Prediction of protein-protein interactions by label propagation with protein evolutionary and chemical information derived from heterogeneous network;Yu-TingWen 等;《Theoretical Biology》;20171007;第430卷;全文 *
加权优先级网络在蛋白质功能预测中的应用研究;潘怡 等;《小型微型计算机系统》;20170930(第9期);全文 *
基于PPI网络的关键蛋白质的高效预测算法;洪海燕 等;《计算机科学》;20161130;第43卷(第11A期);全文 *

Also Published As

Publication number Publication date
CN109801674A (zh) 2019-05-24

Similar Documents

Publication Publication Date Title
CN109801674B (zh) 一种基于异构生物网络融合的关键蛋白质识别方法
CN108319812B (zh) 一种基于布谷鸟搜索算法识别关键蛋白质的方法
CN109637579B (zh) 一种基于张量随机游走的关键蛋白质识别方法
CN112837753B (zh) 一种基于多模态堆叠自动编码机的microRNA-疾病关联预测方法
CN107784196B (zh) 基于人工鱼群优化算法识别关键蛋白质的方法
CN111599406B (zh) 结合网络聚类方法的全局多网络比对方法
CN111145830A (zh) 基于网络传播的蛋白质功能预测方法
CN104992078B (zh) 一种基于语义密度的蛋白质网络复合物识别方法
CN107885971B (zh) 采用改进花授粉算法识别关键蛋白质的方法
CN108229643B (zh) 一种采用果蝇优化算法识别关键蛋白质的方法
CN107092812A (zh) 一种在ppi网络中基于遗传算法识别关键蛋白质的方法
CN109686403A (zh) 基于不确定蛋白质相互作用网络中关键蛋白质识别方法
CN110660448B (zh) 一种基于蛋白质的拓扑与功能特征的关键蛋白识别方法
Dai Imbalanced protein data classification using ensemble FTM-SVM
CN109727637A (zh) 基于混合蛙跳算法识别关键蛋白质的方法
CN111738346A (zh) 一种生成式对抗网络估值的不完整数据聚类方法
CN114093448B (zh) 一种疾病风险预测模型的构建方法
CN111584010B (zh) 一种基于胶囊神经网络和集成学习的关键蛋白质识别方法
CN111128292B (zh) 一种基于蛋白质成簇特性和活性共表达的关键蛋白质识别方法
Babu et al. A simplex method-based bacterial colony optimization algorithm for data clustering analysis
CN109616153B (zh) 一种采用改进的hits算法识别关键蛋白质的方法
Xu et al. An improvement of loop closure detection based on bow for ratslam
Li et al. Deep contextual representation learning for identifying essential proteins via integrating multisource protein features
CN114707066A (zh) 基于社区感知和自适应随机游走的景点推荐方法及系统
CN110430077B (zh) 基于网络结构特征的匿名路由器识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant