CN109166604A - 一种融合多数据特征预测关键蛋白质的计算方法 - Google Patents

一种融合多数据特征预测关键蛋白质的计算方法 Download PDF

Info

Publication number
CN109166604A
CN109166604A CN201810958860.4A CN201810958860A CN109166604A CN 109166604 A CN109166604 A CN 109166604A CN 201810958860 A CN201810958860 A CN 201810958860A CN 109166604 A CN109166604 A CN 109166604A
Authority
CN
China
Prior art keywords
protein
data
matter
key
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810958860.4A
Other languages
English (en)
Other versions
CN109166604B (zh
Inventor
张伟
徐佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China Jiaotong University
Original Assignee
East China Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China Jiaotong University filed Critical East China Jiaotong University
Priority to CN201810958860.4A priority Critical patent/CN109166604B/zh
Publication of CN109166604A publication Critical patent/CN109166604A/zh
Application granted granted Critical
Publication of CN109166604B publication Critical patent/CN109166604B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种融合多数据源预测关键蛋白质的计算方法。该方法通过分析关键蛋白质所体现的聚集性、共表达性、功能相似性、位置一致性的特征,有效融合蛋白质相互作用网络的边聚类系数、基因表达值的皮尔逊相关系数、基因本体术语的语义相似性指数以及蛋白质亚细胞定位统计特征。本发明方法简单易用,输入蛋白质相互作用关系数据、基因表达谱数据、基因本体术语信息数据以及蛋白质亚细胞定位数据信息这四种数据,经测试验证,和已有方法相比本发明提出的方法可以显著提高蛋白质相互作用网络中关键蛋白的预测精度和效率。

Description

一种融合多数据特征预测关键蛋白质的计算方法
技术领域
本发明涉及数学与生物学交叉领域,具体涉及基于生物多种数据源来识别蛋白质相互作用网络中关键蛋白质的计算方法。
背景技术
蛋白质是构成细胞的基因有机物质,是生命活动的主要参与者,在维持正常生理活动中扮演着非常重要的角色。关键蛋白质是在维持生物体正常生命活动所必须的蛋白质,一旦这类蛋白质发生异常将会导致生物体正常生理活动失调甚至引起疾病。研究表明,关键蛋白质与致病基因、药物靶标设计以及个性化医疗治疗都有密不可分的联系,有效识别关键蛋白质有助于对疾病的致病机理和药物分子靶标的研究。
传统的生物学实验一般采用基因敲除、RNA干扰等方法来识别关键蛋白质,由于生物学实验周期长、花费高、效率低、而且只能在有限的物种上面进行实验,很难满足当前生物领域快速发展的需求。随着近些年来高通量生物学技术的快速发展,人们可以获得大量的高通量数据,例如:蛋白质相互作用数据、基因功能注释信息数据、基因时序表达数据、蛋白质子细胞定位数据等等,这为从计算的角度预测关键蛋白质提供了条件。基于这些数据,如何从数学角度有效挖掘这些数据之间蕴含的内在特性,设计数学计算方法来从计算角度预测关键蛋白质是目前比较热门的研究领域。
已有的研究成果显示,一个蛋白质是否为关键蛋白质取决于这个蛋白质在生物分子网络中所对应节点的拓扑结构和生物学特性。
近些年来国内外学者提出了很多预测关键蛋白质的计算方法,从早期的基于蛋白质相互作用网络拓扑结构特征的方法,如连接度中心性(Degree Centrality,DC),介数中心性(Betweenness centrality,BC),边聚类系数中心性(Edge Clustering Coefficientcentrality,ECC),子图中心性(Subgraph Centrality,SC),特征向量中心性(EigenvectorCentrality,EC)和邻居中心性(Neighbor Centrality,NC)等来将蛋白质按照这些数值的大小排序,从而进行关键蛋白质预测。这些基于拓扑结构特征的方法预测精度依赖于蛋白质相互作用网络数据的可靠性,而目前通过高通量技术得到的蛋白质相互作用含有较大的假阳性等噪声数据,很大程度限制了基于网络拓扑结构特征方法的预测精度。随着多种生物学数据的涌现,研究者发现有效结合多种数据信息可以减少蛋白质相互作用网络数据中噪声对预测精度的影响、显著提高关键蛋白质的预测效率。例如:结合网络拓扑结构和基因表达数据等的方法有Pec,CoEWC等、结合网络结构和GO术语的注释信息数据的有GEG,TEO方法、结合网络结构和蛋白质亚细胞定位数据信息的CIC,SCP方法以及结合网络结构与蛋白质直系同源信息数据的ION方法等。
虽然上述综合多数据源方法在预测关键蛋白质精度上有所提高,但是,目前预测关键蛋白质的精度和效率仍有待提高。
发明内容
为解决背景技术中提到的问题,本发明旨在提供一种新的基于多数据源融合的方法来预测蛋白质相互作用网络中关键蛋白质。
本发明采用以下技术方案:
一种基于多数据源融合预测关键蛋白质的计算方法,具体操作按照以下步骤进行:
(1)基于蛋白质相互作用网络,计算相互作用连边的聚类系数;
(2)计算蛋白质相互作用网络中每条连边(u,v)的两个蛋白质u,v对应基因的共表达相关性,基于已有基因的时序表达数据,采用皮尔逊相关系数计算所有相互作用蛋白质对的共表达相关系数;
(3)根据蛋白质相互作用数据中的任意一对蛋白质相互作用关系的两个蛋白,找出这两个蛋白在对应基因本体(GO)被注解术语注释编号(GO-id),然后根据基因语义相似性计算方法计算这一对蛋白质之间的功能相似性,依次类推,计算所有相互作用蛋白质对的功能相似性值;
(4)统计已知关键蛋白质的亚细胞定位信息,计算已知关键蛋白质所处亚细胞定位的概率;统计蛋白质相互作用网络中每条连边(u,v)对应蛋白质u,v的亚细胞定位信息,计算网络中每条连边对应蛋白质组的亚细胞定位信息的交集;
(5)由上述步骤得到的网络边聚类系数,共表达相关性,功能相似性数据和蛋白质亚细胞定位统计数据按照公式(4)计算每个蛋白质的关键值,并将关键值从大到小进行排序,值越大说明这个蛋白质为关键蛋白质的可能性越大。
本发明公开了一种融合多数据源(蛋白质相互作用网络数据、基因表达数据、GO术语的语义信息数据以及蛋白质亚细胞定位数据信息)来预测关键蛋白质的计算方法。本方法有效挖掘关键蛋白质内在特性,将关键蛋白质在网络中的拓扑属性、关键蛋白质之间共表达相关性、功能相似性以及亚细胞定位的统计特性有效的结合在一起,提出了新的预测关键蛋白质的计算方法。
本发明的技术效果是:本发明与现有的技术相比,在考虑蛋白质相互作用网络拓扑结构特性的基础上,结合基因表达时序数据、基因本体语义功能注释信息数据和蛋白质亚细胞定位信息数据,整合这四组数据来预测关键蛋白,能有效的减少单个数据源数据噪声对预测准确性的影响,本发明提出的方法在预测准确度上与已有方法相比具有明显优势,能有效解决了生物实验的昂贵成本和时间周期长等问题,可为生物学家进行生物学验证提供可靠依据。
附图说明
图1为本发明TEGS方法与其它六种中心性度量方法DC、BC、NC、Pec、WDC、TEO在测试数据下预测正确的关键蛋白个数比较图,其中N分别取100、200、300、400、500、600对应的子图表示预测的前N个关键蛋白质中各种方法预测正确的关键蛋白质个数比较。
图2为本发明TEGS方法与其它六种中心性度量DC、BC、NC、Pec、WDC、TEO在测试数据下Jackknife方法的jackknife曲线图。X轴表示按照各个关键蛋白质预测方法排序,排在前面的蛋白质个数;Y轴表示预测正确的关键蛋白质累计数目。
图3为本发明TEGS方法与其它六种中心性度量DC、BC、NC、Pec、WDC、TEO在测试数据下precision-recall曲线比较图。
具体实施方式
下面将结合附图和具体实施方式详细说明本发明所具有的有益效果,旨在帮助阅读者更好地理解本发明的实质,但不能对本发明的实施和保护范围构成任何限定。
鉴于酵母的蛋白质相互作用关系数据和关键蛋白质数据是目前所有物种中最为完整的,为了测试本发明的有效性,采用酵母数据用于接下来的验证分析。本发明中用于测试的酵母蛋白质相互作用关系数据来源于DIP数据库2010年10月的数据,剔除掉重复的和自相互作用数据后,最终得到一个包含5093个蛋白质和24743条连边的蛋白质相互作用网络数据;
从GEO(Gene Expression Omnibus)数据库中下载酵母的基因表达数据(GSE3431),该基因表达数据包含6,777个基因产物对应的36个时间点的表达值;
从Gene Ontology Consortium数据库中下载酵母的GO注释语义信息数据,截止日期是2015-3-4;
酵母蛋白质的亚细胞定位数据来源于COMPARTMENTS数据库,该数据中酵母蛋白质分别被11种亚细胞定位注释,分别为细胞骨架、细胞核、内质网、细胞质、高尔基体、线粒体、核内体、细胞膜、溶酶体、细胞外基质和液泡。
已知酵母的关键蛋白质一共包含1285个关键蛋白,这些数据从MIPS(MunichInformation center for Protein Sequences)、SGD(Saccharomyces Genome Database)、DEG(Database of Essential Genes)和SGDP(Saccharomyces Genome Deletion Project)这四个数据库中搜集得到。经过统计,实验所用的酵母蛋白质相互作用网络数据中共有5093个蛋白,其中1167个是关键蛋白,剩下的3926个蛋白质被视为非关键蛋白质。
通过对已知数据的分析发现蛋白质相互作用网络中的关键蛋白总是会形成连接紧密的子网,从拓扑结构来看它们之间的聚类系数较高,而且处在同一个连接子网里面的关键蛋白之间的共表达的概率很高;从基因表达值之间的关系来看,它们之间的相关系数较高;连接紧密的子网通常是由一个或者多个复合物组成共同执行某个特定的生物功能,因此它们之间的拥有较高的功能相似性。另外,为了减少假阳性数据的影响,认为只有当两个蛋白质都处在同一子细胞位置时才可能有相互作用关系。
鉴于此,本发明通过综合PPI网络拓扑结构、基因时序表达值、GO语义注释信息、蛋白质亚细胞定位数据提出了一个新的识别蛋白质相互作用网络中关键蛋白的计算方法TEGS。在给定的测试酵母蛋白质相互作用网络数据下,计算每个蛋白质的关键性指数(TEGS),具体实施步骤如下:
步骤1:边聚类系数(edge clustering coefficient(ECC))从网络拓扑结构上刻画了网络中相连两个节点u,v之间的疏密程度,已有研究表明,关键蛋白质之间相对连接比较紧密,因此采用ECC来刻画两个蛋白质之间拓扑上紧密程度。网络中节点u和节点v之间的边聚类系数(edge clustering coefficient(ECC))的定义如下:
其中du和dv分别为节点u和v的度。表示由边(u,v)构成的在这个网络中三个节点相连组成三角形子网的个数。
步骤2.为了刻画网络中相互作用的蛋白质之间共表达性,采用统计学中皮尔逊相关系数(Pearson correlation coefficient(PCC))来计算两蛋白对应基因表达值的相关性,一对基因(X和Y)之间的表达相关性计算皮尔逊相关系数定义如下:
其中n是基因表达值数据的样本数目;Xi是第i个基因的表达水平,std(X)表示基因表达值X的标准差。
步骤3.为了刻画两个蛋白质之间功能相似性,我们采用基因本体(GeneOntology,GO)被注解术语对的基因语义相似性来度量两个相连蛋白质功能之间的相似程度。基因本体包含三个独立部分,分别是生物过程(Biological Process(BP)),细胞组成(Cellular Component(CC))和分子功能(Molecular function(MF))。之前的研究表明,生物过程信息比其它两种信息在预测关键蛋白质时更有优势,因此仅考虑在生物过程下的语义相似性,采用基于James Z Wang等人提出的计算方法(Wang JZ,Du Z,Payattakool R,YuPS,Chen CF:A new method to measure the semantic similarity of GOterms.Bioinformatics 2007,23(10):1274-1281.)的R中工具箱GOsim来计算两个相连蛋白质u,v之间功能相似性GOsim(u,v)。
步骤4.由于酵母蛋白质被11种亚细胞定位注释,将亚细胞定位分别用1到11这11个数字分别表示,每个蛋白质u的亚细胞定位信息为SL(u)∈{1,2,…11,0}(其中0表示该蛋白质没有被任何一个亚细胞定位注释);统计已知的关键蛋白质对应的亚细胞定位数据,计算关键蛋白质中被一种亚细胞定位注释的个数和占整个已知关键蛋白质组的比例,得到每个亚细胞位置i=1,2,…,11出现关键蛋白质的概率SLI(i),i=1,2,…,11。然后计算测试蛋白质相互作用网络中蛋白质u的亚细胞定位关键性即该蛋白质被注释的所有亚细胞定位出现关键蛋白质概率之和。
另外,基于测试的酵母蛋白质相互作用网络数据,统计网络中每条连边(u,v)对应蛋白质u,v的亚细胞定位信息SL(u),SL(v)并计算其交集中元素个数
步骤5.基于上述步骤中计算得到的边聚类系数、共表达相关性、功能相似性、蛋白质亚细胞定位统计特征,定义新的识别关键蛋白质的方法TEGS如下:对于蛋白质相互作用网络中的蛋白u,TEGS(u)的计算公式如下:
其中Nu表示节点u的所有邻居节点集合,α为[0,1]之间的常数,用于调节两种类型信息的比例,测试数据中取α=0.2。将测试酵母蛋白质相互作用网络中蛋白质按照TEGS指数从大到小排序,认为排名越靠前的蛋白质是关键蛋白质的概率越大,输出结果。然后与已知的酵母关键蛋白质进行对比,计算预测的排名前N个蛋白质中关键蛋白质个数。
为了评估本发明方法的有效性,将本发明方法TEGS与几种代表性方法(DC、BC、NC、Pec、WDC、TEO)在酵母蛋白质相互作用测试数据下进行比较,采用已有的1285个酵母关键蛋白质作为标准集,比较各种方法的优劣。
A.基于预测正确个数的柱状图比较
图1结果显示,本发明TEGS方法与其它六种中心性度量方法DC、BC、NC、Pec、WDC、TEO在预测排名前N(N=100,200,300,400,500,600)的蛋白质作为候选关键蛋白质时,真正预测正确的蛋白质个数除了TEO方法在前100个预测的蛋白质中有优势之外,TEGS方法预测正确的关键蛋白质个数在取前200,300,400,500,600时明显优于其它方法。本发明方法TEGS在前600个预测的关键蛋白质中,预测正确的个数高达397个,准确度为0.662。
B.基于jackknife方法的结果比较
采用jackknife方法来验证TEGS方法及其它六种方法在测试数据下的结果。图2为TEGS方法与其它六种中心性度量DC、BC、NC、Pec、WDC、TEO在测试数据下jackknife曲线图。X轴表示按照各个关键蛋白质预测方法排序,排在前面的蛋白质个数;Y轴表示预测正确的关键蛋白质累计数目。图中线下的面积体现方法性能好坏,面积越大,精确度越高,从图2中可以看出本发明方法TEGS预测关键蛋白质准确度明显高于其它方法。
C.基于precision-recall曲线结果比较
为了进一步测试本发明方法的有效性,采用precision-recall曲线来验证TEGS方法与其它六种方法的性能。图3中展现了本发明TEGS方法与其它六种中心性度量DC、BC、NC、Pec、WDC、TEO在测试数据下precision-recall曲线比较。从图3中可以看出TEGS方法预测关键蛋白质的精确度明显优于其它方法。
以上所述的仅仅是对本发明的实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。

Claims (1)

1.一种融合多数据特征预测关键蛋白质的计算方法,包括如下步骤:
步骤1:基于已有蛋白质相互作用关系数据,构建蛋白质相互作用关系的邻接矩阵,采用以下的边聚类系数公式计算连边(u,v)的聚类系数:
其中du和dv分别为节点u和v的度,表示由边(u,v)构成的在这个网络中三个节点相连组成三角形个数;
步骤2:根据基因时序表达数据计算基因之间的表达相关性,具体采用皮尔逊相关系数公式计算每对蛋白质相互作用关系下对应的基因对之间两基因之间的表达相关性,一对基因X和Y之间的表达相关性计算皮尔逊相关系数定义如下:
其中n是基因表达值数据的样本数目;Xi是第i个基因的表达水平,std(X)表示X的标准差;
步骤3:基于下载酵母基因本体术语注释信息数据,找出蛋白质相互作用关系数据中每个蛋白质u对应的基因本体术语的编号信息(GO-id(u)),这样每一对相互作用的两个蛋白质(u,v)对应的一对基因本体术语在生物过程信息下的编号(GO-id(u),GO-id(v));采用统计软件R中工具箱GOSim来计算蛋白质相互作用关系数据对应的基因本体术语在生物过程下的相似度GOsim(u,v);
步骤4:基于下载的酵母蛋白质亚细胞定位数据,将11种亚细胞定位分别用1到11这些数字分别表示,每个蛋白质u的亚细胞定位信息为SL(u)∈{1,2,…11,0},其中0表示该蛋白质没有被任何一个亚细胞定位注释;统计已知的关键蛋白质对应的亚细胞定位数据,计算关键蛋白质中被一种亚细胞定位注释的个数和占整个已知关键蛋白质组的比例,得到每个亚细胞位置出现关键蛋白质的概率SLI(i),i=1,2,…,11;然后计算测试蛋白质相互作用网络中蛋白质u的亚细胞定位关键性即该蛋白质被注释的所有亚细胞定位出现关键蛋白质概率之和;
另外,基于测试的酵母蛋白质相互作用网络数据,统计网络中每条连边(u,v)对应蛋白质u,v的亚细胞定位信息SL(u),SL(v)并计算其交集中元素个数
步骤5:基于上述步骤中计算得到的边聚类系数、共表达相关性、功能相似性、蛋白质亚细胞定位统计特征,定义新的识别关键蛋白质的方法TEGS如下,对于蛋白质相互作用网络中的蛋白u,TEGS(u)的计算公式如下:
其中N(u)表示节点u的所有邻居节点集合,α为[0,1]之间的常数。
步骤6:将上述计算得到的每个蛋白质的TEGS值进行由大到小排序,TEGS值越大排序越靠前的蛋白质是关键蛋白质的概率越大。
CN201810958860.4A 2018-08-22 2018-08-22 一种融合多数据特征预测关键蛋白质的计算方法 Active CN109166604B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810958860.4A CN109166604B (zh) 2018-08-22 2018-08-22 一种融合多数据特征预测关键蛋白质的计算方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810958860.4A CN109166604B (zh) 2018-08-22 2018-08-22 一种融合多数据特征预测关键蛋白质的计算方法

Publications (2)

Publication Number Publication Date
CN109166604A true CN109166604A (zh) 2019-01-08
CN109166604B CN109166604B (zh) 2021-07-02

Family

ID=64896469

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810958860.4A Active CN109166604B (zh) 2018-08-22 2018-08-22 一种融合多数据特征预测关键蛋白质的计算方法

Country Status (1)

Country Link
CN (1) CN109166604B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110797089A (zh) * 2019-10-30 2020-02-14 华东交通大学 一种基于单细胞rna测序数据识别细胞类型的方法
CN111128292A (zh) * 2019-12-25 2020-05-08 湖南师范大学 一种基于蛋白质成簇特性和活性共表达的关键蛋白质识别方法
CN111312330A (zh) * 2020-02-13 2020-06-19 兰州理工大学 一种基于蛋白质节点特性的关键蛋白质识别方法及系统
CN111724857A (zh) * 2020-07-07 2020-09-29 中国计量科学研究院 一种免疫分析中蛋白质溯源有效性及互换性评价方法
CN113436729A (zh) * 2021-07-08 2021-09-24 湖南大学 一种基于异构图卷积神经网络的合成致死相互作用预测方法
CN114067906A (zh) * 2021-11-15 2022-02-18 扬州大学 一种融合多源生物信息的关键蛋白质识别方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103559426A (zh) * 2013-11-06 2014-02-05 北京工业大学 一种针对多视图数据融合的蛋白质功能模块挖掘方法
WO2017081687A1 (en) * 2015-11-10 2017-05-18 Ofek - Eshkolot Research And Development Ltd Protein design method and system
CN107885971A (zh) * 2017-10-30 2018-04-06 陕西师范大学 采用改进花授粉算法识别关键蛋白质的方法
CN108009403A (zh) * 2017-11-24 2018-05-08 中国地质大学(武汉) 基于多源数据融合及多目标优化的蛋白质复合物识别方法
CN108229643A (zh) * 2018-02-05 2018-06-29 陕西师范大学 一种采用果蝇优化算法识别关键蛋白质的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103559426A (zh) * 2013-11-06 2014-02-05 北京工业大学 一种针对多视图数据融合的蛋白质功能模块挖掘方法
WO2017081687A1 (en) * 2015-11-10 2017-05-18 Ofek - Eshkolot Research And Development Ltd Protein design method and system
CN107885971A (zh) * 2017-10-30 2018-04-06 陕西师范大学 采用改进花授粉算法识别关键蛋白质的方法
CN108009403A (zh) * 2017-11-24 2018-05-08 中国地质大学(武汉) 基于多源数据融合及多目标优化的蛋白质复合物识别方法
CN108229643A (zh) * 2018-02-05 2018-06-29 陕西师范大学 一种采用果蝇优化算法识别关键蛋白质的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JIANCHENG ZHONG 等: "A Feature Selection Method for Prediction Essential Protein", 《TSINGHUA SCIENCE & TECHNOLOGY》 *
李娟娟: "基于多特征融合和集成的蛋白质相互作用预测", 《中国优秀硕士学位论文全文数据库 基础科学辑》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110797089A (zh) * 2019-10-30 2020-02-14 华东交通大学 一种基于单细胞rna测序数据识别细胞类型的方法
CN110797089B (zh) * 2019-10-30 2023-05-16 华东交通大学 一种基于单细胞rna测序数据识别细胞类型的方法
CN111128292A (zh) * 2019-12-25 2020-05-08 湖南师范大学 一种基于蛋白质成簇特性和活性共表达的关键蛋白质识别方法
CN111128292B (zh) * 2019-12-25 2023-05-05 湖南师范大学 一种基于蛋白质成簇特性和活性共表达的关键蛋白质识别方法
CN111312330A (zh) * 2020-02-13 2020-06-19 兰州理工大学 一种基于蛋白质节点特性的关键蛋白质识别方法及系统
CN111724857A (zh) * 2020-07-07 2020-09-29 中国计量科学研究院 一种免疫分析中蛋白质溯源有效性及互换性评价方法
CN113436729A (zh) * 2021-07-08 2021-09-24 湖南大学 一种基于异构图卷积神经网络的合成致死相互作用预测方法
CN114067906A (zh) * 2021-11-15 2022-02-18 扬州大学 一种融合多源生物信息的关键蛋白质识别方法
CN114067906B (zh) * 2021-11-15 2024-04-05 扬州大学 一种融合多源生物信息的关键蛋白质识别方法

Also Published As

Publication number Publication date
CN109166604B (zh) 2021-07-02

Similar Documents

Publication Publication Date Title
CN109166604A (zh) 一种融合多数据特征预测关键蛋白质的计算方法
Hu et al. A survey on computational models for predicting protein–protein interactions
CN105279397B (zh) 一种识别蛋白质相互作用网络中关键蛋白质的方法
Zhang Protein interaction networks: computational analysis
CN107885971B (zh) 采用改进花授粉算法识别关键蛋白质的方法
Chen et al. Labeling network motifs in protein interactomes for protein function prediction
CN112800231B (zh) 电力数据校验方法、装置、计算机设备和存储介质
CN105117618B (zh) 一种基于牵连犯罪原则和网络拓扑结构特征的药物‑靶标相互作用识别方法
Zhang et al. Predicting essential proteins by integrating network topology, subcellular localization information, gene expression profile and go annotation data
Lei et al. Detecting protein complexes from DPINs by density based clustering with Pigeon-Inspired Optimization Algorithm
CN106372458A (zh) 基于邻居接近中心性和直系同源信息的关键蛋白质识别方法
CN112926635A (zh) 一种基于迭代自适应近邻传播算法的目标聚类方法
CN110136779A (zh) 一种生物网络关键差异节点的样本特征提取及预测方法
Chen et al. Identifying protein complexes based on multiple topological structures in PPI networks
CN108804871A (zh) 基于最大邻居子网的关键蛋白质识别方法
CN111128292B (zh) 一种基于蛋白质成簇特性和活性共表达的关键蛋白质识别方法
Lei et al. Clustering PPI data based on Improved functional-flow model through Quantum-behaved PSO
Xiaoqin et al. Essential protein prediction based on Shuffled frog‐leaping algorithm
Rider et al. Networks' characteristics are important for systems biology
Yu et al. A supervised approach to detect protein complex by combining biological and topological properties
Lei et al. A random walk based approach for improving protein-protein interaction network and protein complex prediction
Lei et al. Identifying Essential Proteins in Dynamic PPI Network with Improved FOA
Li et al. Efficient Multi-source Contact Event Query Processing for Moving Objects
Lei et al. Predicting essential proteins based on gene expression data, subcellular localization and PPI data
Yu et al. Complex detection based on integrated properties

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant