CN110660448B - 一种基于蛋白质的拓扑与功能特征的关键蛋白识别方法 - Google Patents

一种基于蛋白质的拓扑与功能特征的关键蛋白识别方法 Download PDF

Info

Publication number
CN110660448B
CN110660448B CN201910891225.3A CN201910891225A CN110660448B CN 110660448 B CN110660448 B CN 110660448B CN 201910891225 A CN201910891225 A CN 201910891225A CN 110660448 B CN110660448 B CN 110660448B
Authority
CN
China
Prior art keywords
protein
network
following formula
ppi
proteins
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910891225.3A
Other languages
English (en)
Other versions
CN110660448A (zh
Inventor
王雷
邹赛
朱贤友
陈治平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing College of Electronic Engineering
Changsha University
Original Assignee
Chongqing College of Electronic Engineering
Changsha University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing College of Electronic Engineering, Changsha University filed Critical Chongqing College of Electronic Engineering
Priority to CN201910891225.3A priority Critical patent/CN110660448B/zh
Publication of CN110660448A publication Critical patent/CN110660448A/zh
Application granted granted Critical
Publication of CN110660448B publication Critical patent/CN110660448B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Physiology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

越来越多的研究表明,酿酒酵母中已发现了大量的蛋白‑蛋白相互作用(PPI)数据,对酵母关键蛋白质识别具有重大意义。到目前为止,已经有一系列从PPI网络预测关键蛋白质的计算方法。然而,这些计算方法的预测精度不能令人十分满意。本发明通过对蛋白基因表达数据进行皮尔逊相关系数(PCC)处理,将原始的PPI网络首先转化为加权的PPI网络。然后,根据加权PPI网络和同源蛋白的信息,提取加权PPI网络中每个蛋白的一些关键网络拓扑特征和蛋白功能特征。根据这些新提取的蛋白质拓扑特征和功能特征,构建一种迭代方法用于基本蛋白质的预测。本发明通过整合蛋白质的功能和网络拓扑特性,有效提高基本蛋白质的预测精度,显著优于现有预测方法的预测精度。

Description

一种基于蛋白质的拓扑与功能特征的关键蛋白识别方法
技术领域
本发明涉及生物信息领域,具体涉及一种基于蛋白质的拓扑与功能特征的关键蛋白识别方法。
背景技术
越来越多的证据表明,关键蛋白质对生物体的发育和生存至关重要,缺乏这些关键蛋白质会导致蛋白质复合物的生物功能丧失,导致生物体的死亡。基本关键蛋白质的预测在生物信息学研究中起着至关重要的作用,它不仅对生命科学的研究具有重要意义,而且在药物设计和疾病治疗中具有重要的应用价值。近年来,人们陆续提出了一些基本蛋白质预测的计算方法。然而,现有技术中基本蛋白的鉴定精度还不是很高。因此,设计有效的预测方法来识别潜在的关键蛋白质是一项重要且具有挑战性的任务。
发明内容
为了解决上述问题,本发明提供一种能够有效预测识别潜在的关键蛋白质的基于蛋白质的拓扑与功能特征的关键蛋白识别方法,包括以下步骤
S1:对基因表达数据采用PPC建立原始PPI网络中蛋白节点间的权重,然后将原始PPI网络转换为加权PPI网络;
S2:基于加权PPI网络和同源蛋白信息,分别提取加权PPI网络中各蛋白的关键网络拓扑特征和蛋白功能特征;
包括以下步骤:
S201:采用以下公式表示蛋白质p节点相互作用的邻居节点集合,
NG(p)={q|weight(p,q)>0,q∈V},
weight(p,q)表示节点p和q的权值;
S202:基于三角形的稳定性,对加权PPI网络中的蛋白质p计算能够构建的三角形的数量,采用以下公式表示:
Tris(p,q)=|NG(p)∩NG(q)|+1,
Tris(p)=∑q∈NG(p)Tris(p,q),
其中,|NG(p)∩NG(q)|表示集合NG(p)∩NG(q)中元素的个数;
S203:为蛋白质p提取第一个网络拓扑特征TF1,采用以下公式所示:
Figure GDA0003385268720000021
其中,|NG(p)|表示集合NG(p)中元素的个数;
S204:提取另一个网络拓扑特征TF2,采用以下公式表示:
Figure GDA0003385268720000022
其中,NGe(p)表示集合NG(p)中边的数量,NGTris(p)表示集合NG(p) 中三角形的数量,计算公式采用以下公式表示:
NGe(p)=∑q∈NG(p)|NG(q)|,
NGTris(p)=∑q∈NG(p)|Tris(q)|;
S205:从同源蛋白的信息中提取其第一个功能特征FF1(p),采用以下公式表示:
Figure GDA0003385268720000023
I(p)表示直系同源蛋白得分函数;
S206:基于S205步骤为每个蛋白质p提取其另一个功能特征FF2(p),采用以下公式表示,
FF2(p)=(∑q∈NG(p)weight(p,q))/|NG(p)|
S3:采用基于蛋白质的拓扑与功能特征的改正的PageRank算法识别基本蛋白质。
进一步的,所述步骤S1包括以下步骤:
S101:从公共数据库PPIs的数据集D下载相关蛋白质数据,并用G=(V,E) 表示一个原始PPI网络,G表示PPI网络,V={p1,p2,…,pN}代表一组不同的蛋白质并在PPI网络中表示节点,E表示节点的边,p表示蛋白质,N为蛋白质的个数,当且仅当p和q二个蛋白质节点存在相互作用时,才在PPI网络中构建边并获得邻接矩阵A=(aij)N×N,若e(pi,pj)存在则aij=1,否则aij=0,aij表示邻接矩阵的一个元素;
S102:基于皮尔逊相关系数,将基因表达数据符加到PPI网络上,形成加权PPI网络,采用以下公式表示:
Figure GDA0003385268720000031
其中,蛋白质p在不同时刻,用基因展示为Exp(p)={Exp(p,1), Exp(p,2),…,Exp(p,n)},Exp(p,i)是蛋白质p在i时刻的表达形式,
Figure GDA0003385268720000032
是蛋白质p在所有时刻的平均表达形式,σ(p)是蛋白质p标准差。
进一步的,所述步骤S3包括以下步骤:
S301:通过网络拓补特征集{TFi1,TFi2,…,TFiM},采用以下公式获得N×M 维特征矩阵TF,
Figure GDA0003385268720000041
S302:对S301N×M维特征矩阵TF正规化,得到一个转置矩阵B,采用以下公式表示:
B=[bij]N×M
其中,
Figure GDA0003385268720000042
S303:基于S302,采用熵ej来表示蛋白质的第j个特征的稳定性,采用以下公式表示:
Figure GDA0003385268720000043
S304:基于S303,采用以下公式计算所有不同的网络拓扑特征M的权重,
Figure GDA0003385268720000044
其中,wj表示蛋白质的第j个特征的权重;
S305:基于S304,采用以下公式计算网络拓扑特征的分数,
Figure GDA0003385268720000045
其中,TFscore(i)表示蛋白质pi,的网络拓扑特征的分数;
S306:基于S305,对PPI网络中的N个蛋白质,采用以下公式构建蛋白质相互作用矩阵H=[hij]N×N
Figure GDA0003385268720000046
S307:基于S205和S206,采用以下公式计算蛋白质pi,蛋白质功能特征总分,
FFscore(i)=(FF1(pi)+FF2(pi))/2,
S308:基于S307,采用以下公式计算PPI网络中N个蛋白质的初始分数,
T(0)=(FFscore(1),FFscore(2),…,FFscore(N));
S309:采用以下公式迭代计算所有蛋白质的临界分数,
T(t+1)=α*H*T(t)+(1-α)*T(0);
其中,参数α表示用来调整初始分数的比例T(0)和最后一个迭代得分T (t),参数0≤α≤1。
本发明的有益效果是,通过将生物数据整合到PPI网络中,提高了基本蛋白识别方法的预测精度。
附图说明
图1为本发明一实施方式流程图。
具体实施方式
目前对关键蛋白质的预测方法大致分为两大类。第一类方法主要依赖于 PPI网络的拓扑特征。虽然一些学者提出了一些相关方法,与传统生物实验相比,取得了很大的进步;然而,由于不完整的PPI数据及生物实验包含的噪声 (假阳性和假阴性的数据),第一类的方法不能达到令人满意的识别精度。
因此,与第一类方法不同,第二类方法的目的是通过将PPI网络与多个生物数据相结合来提高预测精度。例如,BihaiZhao等2019年在BMC Bioinformatics期刊上发表了“Aniteration method for identifying yeast essential proteins fromheterogeneous network.”,设计了一种迭代方法 RWHN,将PPI网络与蛋白域、亚细胞定位信息和同源信息相结合,从异构网络中识别酵母关键蛋白质。
将生物数据整合到PPI网络中,提高基本蛋白识别方法的预测精度。因此,本发明结合蛋白质的功能和网络拓扑特征,提出了一种新的检测基本蛋白质的迭代方法。考虑到目前已知的PPIs数据集不完整,本发明将首先对蛋白基因表达数据采用PCC(PearsonCorrelation Coefficient)将原始PPI网络转换为加权PPI网络。然后,在加权PPI网络的基础上,结合同源蛋白的信息,进一步提取加权PPI网络中每个蛋白的一些关键网络拓扑特征和蛋白功能特征。最后,基于这些新获得的蛋白质拓扑结构和功能特征,构建一种迭代方法预测关键蛋白质,来提高预测的精度。
下面对本发明涉及的英语缩写进行解释:
PCC:皮尔逊相关系数(Pearson Correlation Coefficient)。
PPI:蛋白互作网络(protein protein interaction network)。
PageRank算法:PageRank是Google公司提出的算法,可以用于衡量特定网页相对于搜索引擎索引中的其他网页而言的重要程度。它由Larry Page 和Sergey Brin在20世纪90年代后期发明。
本发明的目的在于克服现有技术的不足,提供一种基于拓扑结构和功能特征进行PPI网络加权的酵母关键蛋白质识别方法。本方法有助于提高了基本蛋白质的识别率和准确率。
本发明一具体实施例是这样实现的:
S1:对基因表达数据采用PPC建立原始PPI网络中蛋白节点间的权重,然后将原始PPI网络转换为加权PPI网络。
S2:基于加权PPI网络和同源蛋白信息,分别提取加权PPI网络中各蛋白的关键网络拓扑特征和蛋白功能特征。
S3:根据蛋白质的拓扑结构和功能特点,采用PageRank算法,设计迭代方法来识别基本蛋白质。
进一步的,所述步骤S1包括以下步骤:
S101:让G=(V,E)表示一个原始PPI网络,它从公共数据库PPIs的数据集 D下载。V={p1,p2,…,pN}代表一组不同的蛋白质,在PPI网络中表示节点。 E表示节点的边。当且公当p和q二个节点存在相互作用,才能在PPI网络中构建边。从而获得邻接矩阵A=(aij)N×N。如果aij=1,表示边e(pi,pj)存在,否则aij=0.
S102:基于皮尔逊相关系数(Pearson Correlation Coefficient,PCC),将基因表达数据符加到PPI网络上,形成加权PPI网络,如(1)所示:
Figure GDA0003385268720000071
其中,蛋白质p在不同时刻,能够用基因展示为Exp(p)={Exp(p,1), Exp(p,2),…,Exp(p,n)}。Exp(p,i)是蛋白质p在i时刻的表达形式,
Figure GDA0003385268720000072
是蛋白质p在所有时刻的平均表达形式,σ(p)是蛋白质p标准差。
进一步的,所述步骤S2包括以下步骤:
S201:用(2)式表示蛋白质p节点相互作用的邻居节点集合。weight(p,q) 表示节点p和q的权值。
NG(p)={q|weight(p,q)>0,q∈V} (2)
S202:基于三角形的稳定性,对加权PPI网络中的蛋白质p计算能够构建的三角形的数量,如(3),(4)式所示:
Tris(p,q)=|NG(p)∩NG(q)|+1 (3)
Tris(p)=∑q∈NG(p)Tris(p,q) (4)
其中,|NG(p)∩NG(q)|表示集合NG(p)∩NG(q)中元素的个数。
S203:基于(3),(4)式,本发明为蛋白质p提取第一个网络拓扑特征 TF1,如(5)式所示:
Figure GDA0003385268720000081
其中,|NG(p)|表示集合NG(p)中元素的个数。
S204:基于一个蛋白质为关键蛋白质,则它的邻居很可能关键蛋白质这个假设,提取另一个网络拓扑特征TF2,如(6)式所示:
Figure GDA0003385268720000082
其中,NGe(p)表示集合NG(p)中边的数量。NGTris(p)表示集合NG(p) 中三角形的数量,计算公式如(7),(8)式所示:
NGe(p)=∑q∈NG(p)|NG(q)| (7)
NGTris(p)=∑q∈NG(p)|Tris(q)| (8)
S205:假定蛋白质p的直系同源为I(p),本发明从同源蛋白的信息中提取其第一个功能特征FF1(p),如(9)式所示:
Figure GDA0003385268720000083
S206:基于S205本发明为每个蛋白质p提取其另一个功能特征FF2(p),如(10)式所示:
FF2(p)=(∑q∈NG(p)weight(p,q))/|NG(p)| (10)
进一步的,所述步骤S3包括以下步骤:
S301:通过网络拓补特征集{TFi1,TFi2,…,TFiM},采用(11)式,获得N×M 维特征矩阵TF。
Figure GDA0003385268720000091
S302:对S301特征矩阵TF正规化,本发明得到一个转置矩阵B,如(12) 所示:
B=[bij]N×M (12)
其中,
Figure GDA0003385268720000092
S303:基于S302,采用熵ej来表示蛋白质的第j个特征的稳定性,计算公式如(13)所示:
Figure GDA0003385268720000093
S304:基于S303,采用(14)式,计算所有不同的网络拓扑特征M的权重。
Figure GDA0003385268720000094
其中,wj表示蛋白质的第j个特征的权重。
S305:基于S304,采用(15)式,计算网络拓扑特征的分数
Figure GDA0003385268720000095
其中,TFscore(i)表示蛋白质pi,的网络拓扑特征的分数
S306:基于S305,对PPI网络中的N个蛋白质,采用(16)式构建蛋白质相互作用矩阵H=[hij]N×N
Figure GDA0003385268720000101
S307:基于S205和S206,采用(17)式计算蛋白质pi,蛋白质功能特征总分。
FFscore(i)=(FF1(pi)+FF2(pi))/2 (17)
S308:基于S307,采用(18)式计算PPI网络中N个蛋白质的初始分数。
T(0)=(FFscore(1),FFscore(2),…,FFscore(N)) (18)
S309:本发明采用式(19)迭代计算所有蛋白质的临界分数。
T(t+1)=α*H*T(t)+(1-α)*T(0) (19)
其中,参数α(0≤α≤1)是用来调整初始分数的比例T(0)和最后一个迭代得分T(t)。
本发明的有益效果是,通过整合蛋白质的功能和网络拓扑特性,有效提高基本蛋白质的预测精度,显著优于现有预测方法的预测精度。

Claims (3)

1.一种基于蛋白质的拓扑与功能特征的关键蛋白识别方法,其特征在于,包括以下步骤,
S1:对基因表达数据采用PPC建立原始PPI网络中蛋白节点间的权重,然后将原始PPI网络转换为加权PPI网络;
S2:基于加权PPI网络和同源蛋白信息,分别提取加权PPI网络中各蛋白的关键网络拓扑特征和蛋白功能特征,包括以下步骤:
S201:采用以下公式表示蛋白质p节点相互作用的邻居节点集合,
NG(p)={q|weight(p,q)>0,q∈V},
weight(p,q)表示节点p和q的权值;
S202:基于三角形的稳定性,对加权PPI网络中的蛋白质p计算能够构建的三角形的数量,采用以下公式表示:
Tris(p,q)=|NG(p)∩NG(q)|+1,
Tris(p)=∑q∈NG(p)Tris(p,q),
其中,|NG(p)∩NG(q)|表示集合NG(p)∩NG(q)中元素的个数;
S203:为蛋白质p提取第一个网络拓扑特征TF1,采用以下公式所示:
Figure FDA0003385268710000011
其中,|NG(p)|表示集合NG(p)中元素的个数;
S204:提取另一个网络拓扑特征TF2,采用以下公式表示:
Figure FDA0003385268710000012
其中,NGe(p)表示集合NG(p)中边的数量,NGTris(p)表示集合NG(p)中三角形的数量,计算公式采用以下公式表示:
NGe(p)=∑q∈NG(p)|NG(q)|,
NGTris(p)=∑q∈NG(p)|Tris(q)|;
S205:从同源蛋白的信息中提取其第一个功能特征FF1(p),采用以下公式表示:
Figure FDA0003385268710000021
I(p)表示直系同源蛋白得分函数;
S206:基于S205步骤为每个蛋白质p提取其另一个功能特征FF2(p),采用以下公式表示,
FF2(p)=(∑q∈NG(p)weight(p,q))/|NG(p)|;
S3:采用基于蛋白质的拓扑与功能特征的改正的PageRank算法识别基本蛋白质。
2.如权利要求1所述的一种基于蛋白质的拓扑与功能特征的关键蛋白识别方法,其特征在于,所述步骤S1包括以下步骤:
S101:从公共数据库PPIs的数据集D下载相关蛋白质数据,并用G=(V,E)表示一个原始PPI网络,G表示PPI网络,V={p1,p2,…,pN}代表一组不同的蛋白质并在PPI网络中表示节点,E表示节点的边,p表示蛋白质,N为蛋白质的个数,当且仅当p和q二个蛋白质节点存在相互作用时,才在PPI网络中构建边并获得邻接矩阵A=(aij)N×N,若e(pi,pj)存在则aij=1,否则aij=0,aij表示邻接矩阵的一个元素;
S102:基于皮尔逊相关系数,将基因表达数据符加到PPI网络上,形成加权PPI网络,采用以下公式表示:
Figure FDA0003385268710000031
其中,蛋白质p在不同时刻,用基因展示为Exp(p)={Exp(p,1),Exp(p,2),…,Exp(p,n)},Exp(p,i)是蛋白质p在i时刻的表达形式,
Figure FDA0003385268710000032
是蛋白质p在所有时刻的平均表达形式,σ(p)是蛋白质p标准差。
3.如权利要求1所述的一种基于蛋白质的拓扑与功能特征的关键蛋白识别方法,其特征在于,所述步骤S3包括以下步骤:
S301:通过网络拓扑 特征集{TFi1,TFi2,…,TFiM},采用以下公式获得N×M维特征矩阵TF,
Figure FDA0003385268710000033
S302:对S301N×M维特征矩阵TF正规化,得到一个转置矩阵B,采用以下公式表示:
B=[bij]N×M
其中,
Figure FDA0003385268710000034
S303:基于S302,采用熵ej来表示蛋白质的第j个特征的稳定性,采用以下公式表示:
Figure FDA0003385268710000035
S304:基于S303,采用以下公式计算所有不同的网络拓扑特征M的权重,
Figure FDA0003385268710000036
其中,wj表示蛋白质的第j个特征的权重;
S305:基于S304,采用以下公式计算网络拓扑特征的分数,
Figure FDA0003385268710000041
其中,TFscore(i)表示蛋白质pi,的网络拓扑特征的分数;
S306:基于S305,对PPI网络中的N个蛋白质,采用以下公式构建蛋白质相互作用矩阵H=[hij]N×N
Figure FDA0003385268710000042
S307:基于S205和S206,采用以下公式计算蛋白质pi,蛋白质功能特征总分,
FFscore(i)=(FF1(pi)+FF2(pi))/2,
S308:基于S307,采用以下公式计算PPI网络中N个蛋白质的初始分数,
T(0)=(FFscore(1),FFscore(2),…,FFscore(N));
S309:采用以下公式迭代计算所有蛋白质的临界分数,
T(t+1)=α*H*T(t)+(1-α)*T(0);
其中,参数α表示用来调整初始分数的比例T(0)和最后一个迭代得分T(t),参数0≤α≤1。
CN201910891225.3A 2019-09-20 2019-09-20 一种基于蛋白质的拓扑与功能特征的关键蛋白识别方法 Active CN110660448B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910891225.3A CN110660448B (zh) 2019-09-20 2019-09-20 一种基于蛋白质的拓扑与功能特征的关键蛋白识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910891225.3A CN110660448B (zh) 2019-09-20 2019-09-20 一种基于蛋白质的拓扑与功能特征的关键蛋白识别方法

Publications (2)

Publication Number Publication Date
CN110660448A CN110660448A (zh) 2020-01-07
CN110660448B true CN110660448B (zh) 2022-02-01

Family

ID=69038299

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910891225.3A Active CN110660448B (zh) 2019-09-20 2019-09-20 一种基于蛋白质的拓扑与功能特征的关键蛋白识别方法

Country Status (1)

Country Link
CN (1) CN110660448B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111667881B (zh) * 2020-06-04 2023-06-06 大连民族大学 一种基于多网络拓扑结构的蛋白质功能预测方法
CN115631808B (zh) * 2022-10-25 2023-08-01 贵州大学 一种分子靶点快速预测及关联机理分析方法
CN116092577B (zh) * 2023-01-09 2024-01-05 中国海洋大学 一种基于多源异质信息聚合的蛋白质功能预测方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102945333A (zh) * 2012-12-04 2013-02-27 中南大学 一种基于先验知识和网络拓扑特性的关键蛋白预测方法
CN105279397A (zh) * 2015-10-26 2016-01-27 华东交通大学 一种识别蛋白质相互作用网络中关键蛋白质的方法
CN106372458A (zh) * 2016-08-31 2017-02-01 中南大学 基于邻居接近中心性和直系同源信息的关键蛋白质识别方法
CN108804870A (zh) * 2018-05-23 2018-11-13 扬州大学 基于Markov随机游走的关键蛋白质识别方法
CN109637579A (zh) * 2018-12-18 2019-04-16 长沙学院 一种基于张量随机游走的关键蛋白质识别方法
CN109801674A (zh) * 2019-01-30 2019-05-24 长沙学院 一种基于异构生物网络融合的关键蛋白质识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110287953A1 (en) * 2010-05-21 2011-11-24 Chi-Ying Huang Method for discovering potential drugs

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102945333A (zh) * 2012-12-04 2013-02-27 中南大学 一种基于先验知识和网络拓扑特性的关键蛋白预测方法
CN105279397A (zh) * 2015-10-26 2016-01-27 华东交通大学 一种识别蛋白质相互作用网络中关键蛋白质的方法
CN106372458A (zh) * 2016-08-31 2017-02-01 中南大学 基于邻居接近中心性和直系同源信息的关键蛋白质识别方法
CN108804870A (zh) * 2018-05-23 2018-11-13 扬州大学 基于Markov随机游走的关键蛋白质识别方法
CN109637579A (zh) * 2018-12-18 2019-04-16 长沙学院 一种基于张量随机游走的关键蛋白质识别方法
CN109801674A (zh) * 2019-01-30 2019-05-24 长沙学院 一种基于异构生物网络融合的关键蛋白质识别方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
A new essential protein discovery method based;Min Li,Hanhui Zhang,Jian-xin Wang,Yi Pan;《BMC Systems Biology》;20121010;全文 *
Essential Protein Identification Based on Essential Protein-Protein Interaction;Yuexu Jiang,Yan Wang,Wei Pang,Liang Chen,Huiyan Sun,;《2014 IEEE International Conference on Bioinformatics and Biomedicine》;20150115;全文 *
基于动态PPI网络的关键蛋白质检测方法研究;况玲;《中国优秀博硕士学位论文全文数据库(硕士)基础科学辑》;20190115;全文 *
基于蛋白质相互作用加权网络的关键蛋白质识别算法研究;刘舜民;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20140715;第27-39页,图4.2 *
基于随机游走模型的蛋白质网络研究;彭玮;《中国优秀博硕士学位论文全文数据库(博士)基础科学辑》;20150215;第23-57页 *

Also Published As

Publication number Publication date
CN110660448A (zh) 2020-01-07

Similar Documents

Publication Publication Date Title
CN110660448B (zh) 一种基于蛋白质的拓扑与功能特征的关键蛋白识别方法
CN111783419B (zh) 地址相似度计算方法、装置、设备和存储介质
CN108132968B (zh) 网络文本与图像中关联语义基元的弱监督学习方法
CN108319812B (zh) 一种基于布谷鸟搜索算法识别关键蛋白质的方法
CN107577924B (zh) 一种基于深度学习的长链非编码rna亚细胞位置预测方法
CN110097060B (zh) 一种面向树干图像的开集识别方法
CN104834747A (zh) 基于卷积神经网络的短文本分类方法
CN109801674B (zh) 一种基于异构生物网络融合的关键蛋白质识别方法
CN112214335B (zh) 基于知识图谱和相似度网络的Web服务发现方法
CN111324765A (zh) 基于深度级联跨模态相关性的细粒度草图图像检索方法
CN109637579B (zh) 一种基于张量随机游走的关键蛋白质识别方法
JP6892606B2 (ja) 位置特定装置、位置特定方法及びコンピュータプログラム
CN113488104B (zh) 基于局部和全局的网络中心性分析的癌症驱动基因预测方法及系统
CN112559658B (zh) 一种地址匹配方法及装置
CN111476261A (zh) 一种社区增强的图卷积神经网络方法
CN106250925B (zh) 一种基于改进的典型相关分析的零样本视频分类方法
CN111145830A (zh) 基于网络传播的蛋白质功能预测方法
CN113361627A (zh) 一种面向图神经网络的标签感知协同训练方法
CN110751027A (zh) 一种基于深度多示例学习的行人重识别方法
Yong et al. Discovery of small protein complexes from PPI networks with size-specific supervised weighting
CN113628059A (zh) 一种基于多层图注意力网络的关联用户识别方法及装置
CN114999635A (zh) 一种基于图卷积神经网络和node2vec的circRNA-疾病关联关系预测方法
Chu et al. Visualization feature and CNN based homology classification of malicious code
CN110569355A (zh) 一种基于词块的观点目标抽取和目标情感分类联合方法及系统
CN111584010B (zh) 一种基于胶囊神经网络和集成学习的关键蛋白质识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant