CN106372458A - 基于邻居接近中心性和直系同源信息的关键蛋白质识别方法 - Google Patents
基于邻居接近中心性和直系同源信息的关键蛋白质识别方法 Download PDFInfo
- Publication number
- CN106372458A CN106372458A CN201610781892.2A CN201610781892A CN106372458A CN 106372458 A CN106372458 A CN 106372458A CN 201610781892 A CN201610781892 A CN 201610781892A CN 106372458 A CN106372458 A CN 106372458A
- Authority
- CN
- China
- Prior art keywords
- protein
- proteins
- neighbor
- key
- centrality
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012509 protein identification method Methods 0.000 title claims abstract description 10
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 115
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 112
- 238000000034 method Methods 0.000 claims abstract description 46
- 230000006916 protein interaction Effects 0.000 claims description 28
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000002474 experimental method Methods 0.000 abstract description 7
- 238000011160 research Methods 0.000 abstract description 5
- 230000035945 sensitivity Effects 0.000 abstract description 3
- 230000004850 protein–protein interaction Effects 0.000 abstract 2
- 238000001814 protein method Methods 0.000 abstract 1
- 241000894007 species Species 0.000 description 21
- 230000003993 interaction Effects 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 3
- 241000206602 Eukaryota Species 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 3
- 241000282414 Homo sapiens Species 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000003209 gene knockout Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 101100136092 Drosophila melanogaster peng gene Proteins 0.000 description 1
- 108010058643 Fungal Proteins Proteins 0.000 description 1
- 101710172804 K protein Proteins 0.000 description 1
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 1
- 108010031271 Saccharomyces cerevisiae Proteins Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 239000003596 drug target Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 238000013090 high-throughput technology Methods 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
Landscapes
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Analytical Chemistry (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种融合网络邻居接近中心性和直系同源蛋白质信息的关键蛋白预测方法(NCCO)。通过对蛋白质相互作用网络的拓扑特征的分析,我们发现网络中存在大量的三角形,许多关键蛋白质出现在这些三角形中。根据这个发现,我们提出邻居接近中心性。考虑到蛋白质进化保守性的重要性,我们把邻居接近中心性和反映进化保守性的直系同源蛋白质信息进行结合,然后提出了新的识别关键蛋白质方法NCCO。本发明简单易用,输入的数据只要蛋白质相互作用数据和直系同源蛋白质数目数据,和已有的经典方法相比,本发明提出的方法在预测的准确度、与已知关键蛋白质匹配的敏感度和特异性等方面都有明显提高,可供生物学家进行实验,并且有进一步研究的价值。
Description
技术领域
本发明属于系统生物学领域,涉及融合蛋白质相互作用网络和直系同源蛋白质信息的关键蛋白质的识别。
背景技术
众所周知,蛋白质是生命活动的主要参与者,种类繁多,作用各不相同,重要性也不一样。有一类蛋白质在生命活动中非常重要,对细胞的生存和发育而言必不可少,这类蛋白质被认为是关键蛋白质。识别关键蛋白意义重大。细菌病毒的关键蛋白是抗生素的候选药物标靶,识别关键蛋白有助于药物开发。研究表明,关键蛋白也与致病基因有关,识别关键蛋白也有助于疾病研究。并且,生成一个只有关键基因的细胞,可以理解细胞生存的最小需求。
目前,识别关键蛋白质的生物实验方法,例如单个基因敲除,RNA干扰和有条件基因敲除等,时间周期长,效率低,费用高,而且只能在少量物种上施行。因此,迫切需要有效的新方法来降低实验的时间和经济成本,提高实验效率,能在多个物种上施行。
随着高通量技术的出现和蛋白质相互作用数据的积累,利用蛋白质相互作用网络拓扑特征来识别关键蛋白质成了目前的研究热点。一些基于蛋白质相互作用网络的经典中心性方法被提出来,主要有度中心性(Degree Centrality,DC),介数中心性(BetweennessCentrality,BC),接近性中心性(Closeness Centrality,CC),子图中心性(SubgraphCentrality,SC),特征向量中心(Eigenvector Centrality,EC),信息中心性(InformationCentrality,IC)和邻居中心性(Neighbor Centrality,NC)等。这类方法根据蛋白质在相互作用网络中的重要性来判断是否是关键蛋白。
这类中心性方法的预测准确度依赖于蛋白质相互作用数据的可靠性。然而,目前蛋白质相互作用数据既不完整也不可靠,包含了很多假阳性和假阴性,这都影响了关键蛋白质识别的准确度。随着可以利用的生物信息的增多,通过融合多种信息来提高识别关键蛋白的准确度的方法正在得到蓬勃发展。例如,Li等人加入基因的功能注释,构建了一个加权的蛋白质相互作用网络;通过加入基因表达信息到蛋白质相互作用网络中,他们提出了一个新的关键蛋白识别方法PeC。Peng等人把直系同源蛋白质信息和蛋白质相互作用网络结合,提出一个迭代的识别关键蛋白方法ION。LUO等通过加入蛋白质复合物信息到相互作用网络中,分别提出了CSC和LIDC方法。
上述方法都是基于多信息融合识别关键蛋白的方法,在识别准确度上有一定的提高,但是,识别关键蛋白的准确度仍需要提高。
发明内容
本发明旨在克服现有技术的不足,提供一种基于邻居接近中心性和直系同源信息的关键蛋白质识别方法。
为了达到上述目的,本发明提供的技术方案为:
所述基于邻居接近中心性和直系同源信息的关键蛋白质识别方法包括以下步骤:
(1)计算每一个蛋白质节点的接近中心性CC;计算公式为:
其中,N代表蛋白质相互作用网络中蛋白质个数,d(u,v)代表节点u和v之间的最短路径;
(2)计算蛋白质相互作用网络中每个蛋白质的邻居接近中心性得分;计算公式为:
其中,triSCC(u,v)代表基于边(u,v)建立的三角形的三个节点的接近中心性得分之和,即triSCC(u,v)=CC(u)+CC(v)+CC(w);Ku和Kv分别代表节点u和v的度;min()是取最小值函数;Nu代表u的所有邻居节点;
(3)计算直系同源得分:为了形式化定义,先给出以下概念:让S代表参考物种集合,s(物种)是S的元素,|S|代表S的元素个数;让S代表参考物种集合,如果在V中存在物种s,让Xs代表V的子集;让OS(u)代表节点vu在多少个参考物种上有直系同源,vu∈V(u=1,…,N);计算公式为:
OS(u)=∑m∈STu;
(4)采用结合模型给出最终得分;计算公式为:
PF(u)=∑vDMu;
(5)输出结果:对所有蛋白质按关键性最终得分排序,关键性最终得分PF越高的越可能为关键蛋白质。
本发明公开了一种融合邻居接近中心性(NCC)和直系同源蛋白质信息的关键蛋白预测方法NCCO。通过分析蛋白质相互作用网络的拓扑结构,我们发现网络中存在大量的三角形,许多关键蛋白质出现在这些三角形中。根据这个发现,我们提出了邻居接近中心性。考虑到蛋白质进化保守性的重要性,我们把邻居接近中心性和反映进化保守性的直系同源蛋白质信息进行结合,然后提出了新的识别关键蛋白质方法NCCO。本发明简单易用,输入的数据只要蛋白质相互作用数据和直系同源蛋白质数目数据,和已有的经典方法相比,本发明提出的方法在预测的准确度、与已知关键蛋白质匹配的敏感度和特异性等方面都有明显提高,可供生物学家进行实验,并且有进一步研究的价值。
附图说明
图1:在酵母蛋白质相互作用网络上不同比例的具有较高排序得分的蛋白质作为预测的关键蛋白质时,方法NCC,NCCO和10种其它现存经典方法识别关键蛋白质的数量的比较图;(a),(b),(c),(d),(e),(f)分别为取前面100,200,300,400,500,600个蛋白质时被各种方法预测到的关键蛋白个数;
图2:方法NCC,NCCO和10种其它现存经典方法基于precision-recall曲线以及其下面积(AUC)的比较图;
图3:方法NCC,NCCO和10种其它现存经典方法基于jackknife曲线评价的比较图。
具体实施方式
(1)存在于蛋白质相互作用网络中的三角形中的关键蛋白/非关键蛋白比例统计分析
考虑到酵母的蛋白质相互作用网络和关键蛋白质数据在众多物种中最为完整和可靠,我们的实验全部基于酵母数据。蛋白质相互作用网络下载于DIP数据库2010年10月的数据。除去自相互作用和重复的相互作用,总共有5093个蛋白质,24743条边。关键蛋白质信息来源于MIPS,SGD,DEG和SGDP四个数据库。在5093个蛋白质中1167个为关键蛋白质,剩余3926个蛋白质看作非关键蛋白质。蛋白质保守性可以通过直系同源蛋白质数目进行反映。直系同源数据下载自InParanoid数据库第七版。InParanoid数据库包含了100个物种(99个真核生物和1个原核生物)间的直系同源蛋白质数据。物种间蛋白质的直系同源关系是通过INPARANIOD程序计算两个物种中任意两个蛋白质之间的序列相似性得到的。
根据观察发现,大量的三角形存在于蛋白质相互作用网络中,并且很多关键蛋白出现在这些三角形中,为此,我们做了详细的统计分析。在蛋白质相互作用网络中,共有24743条边,共构成18249个三角形,共有2388个蛋白质出现在这些三角形中,其中有813个是关键蛋白,占关键蛋白总数的69.67%(=813/1167),三角形中关键蛋白浓度为34%(=813/2388),高于整个网络的关键蛋白浓度22.9%(=1167/5093)。并且易知,处在三角形中的蛋白质的接近中心性(Closeness Centrality)值通常比不在三角形中的要高。
(2)蛋白质保守性特性分析
蛋白质的直系同源属性可以反映其保守性特性。本团队前期工作已做了蛋白质的关键性与其直系同源属性之间的关联分析,检查所有在酿酒酵母蛋白质相互作用网络中的蛋白质是否在99个参考物种中存在直系同源蛋白质。这99个参考物种包括人类(H.sapiens)等真核生物以及一个原核生物大肠杆菌(E.coli)。5093个酿酒酵母蛋白质中4511个蛋白质在至少一个参考物种中存在直系同源蛋白质。而且1167个已知的关键蛋白质中有1118个在至少一个参考物种中存在直系同源蛋白质。也就意味着96%(=1118/1167)的关键蛋白质在进化上是保守的。
(3)基于邻居接近中心性和蛋白质保守性特性的蛋白质关键性综合得分计算
基于邻居接近中心性(NCC)和蛋白质保守性特性的关键蛋白质识别方法(NCCO)如下。首先,计算蛋白质相互作用网络中的每一个蛋白质的接近中心性得分(CC);然后,计算蛋白质相互作用网络中每个蛋白质的邻居接近中心性(NCC);接下来,计算相互作用网络中的每一个蛋白质的直系同源得分;最后,利用结合模型结合NCC和直系同源得分。
计算每个蛋白质的关键性综合得分,具体步骤如下:
步骤1:考察信息等在网络中的传递现象,边缘节点必然依赖较多的其他节点,而中心节点则较少地依赖于其它节点。接近中心性(CC)就是表征一个节点在网络拓扑中被其它节点依赖的程度,反映节点在拓扑结构中的中心地位的一个指标。接近中心性计算公式如下:
N代表蛋白质相互作用网络中蛋白质个数,d(u,v)代表节点u和v之间的最短路径。
步骤2:计算蛋白质相互作用网络中每个蛋白质的邻居接近中心性得分。计算公式如下:
其中,triSCC(u,v)代表基于边(u,v)建立的三角形的三个节点的接近中心性得分之和,即triSCC(u,v)=CC(u)+CC(v)+CC(w);Ku和Kv分别代表节点u和v的度;min()是取最小值函数;Nu代表u的所有邻居节点。
步骤3:计算直系同源得分。为了形式化定义,先给出以下概念。让S代表参考物种集合,s(物种)是S的元素,|S|代表S的元素个数。V代表PPI网络中蛋白质集合,如果在V中存在物种s,让Xs代表V的子集。让OS(u)代表节点vu在多少个参考物种上有直系同源,vu∈V(u=1,…,N)。计算公式如下:
OS(u)=∑m∈STu (3)
其中,
步骤4:采用结合模型给出最终得分。计算公式如下:
PF(u)=ΣvDMu (4)
其中,
基于邻居接近中心性(NCC)和直系同源关键蛋白质识别方法(NCCO)的有效性验证
为了评估NCCO方法的有效性,我们将NCCO方法分别与几种代表性的中心性方法结合,如DC,BC,CC,SC,EC,IC,NC,PeC,ION和CSC。我们的实验基于如下三个数据集。酵母的蛋白质相互作用网络数据来自于DIP数据库2010年10月的数据,包含有5093个蛋白质,24743条边。直系同源数据下载自InParanoid数据库第七版。InParanoid数据库包含了100个物种(99个真核生物和1个原核生物)间的直系同源蛋白质数据。物种间蛋白质的直系同源关系是通过INPARANIOD程序计算两个蛋白质之间的序列相似性得到的。来源于MIPS,SGD,DEG和SGDP四个数据库的1167个关键蛋白质作为标准集,用来比较预测结果的准确性。
a.基于柱状图比较实验结果
首先按蛋白质最终得分对所有蛋白质进行降序排列,选取排在前面的100,200,300,400,500,600个蛋白质作为候选关键蛋白质。再依据已知的关键蛋白质集合,对比预测结果。预测正确的蛋白质数量作为评价各个方法性能的标准。图1表明,相比于其它方法的预测结果,NCCO较大提高了正确预测的关键蛋白质数量,并且NCC和纯粹的中心性方法(DC,IC,EC SC,BC和CC,)比较也具备明显优势。当选择排序得分排在前100的蛋白质作为预测的关键蛋白质时,NCC预测到58个关键蛋白,比纯粹的中心性DC,IC,EC,SC,BC,CC和NC都要高,NCCO则预测到了多达86个关键蛋白。当选择前面200,300,400,500,600个蛋白质时,我们发现NCC和纯粹的中心性方法(DC,IC,EC SC,BC和CC,)比较一直具备明显优势,而NCCO的表现则全面超过所有方法。
b.基于precision-recall(准确率-召回率)曲线比较实验结果
我们用precision-recall曲线以及其下的面积(AUC)进一步验证NCC,NCCO方法和其它10种方法的性能。将蛋白质相互作用网络中所有的蛋白质依据各个方法计算的关键性得分降序排序,排在前面的K个蛋白质作为预测的关键蛋白质(阳性数据集),细胞中剩下的蛋白质作为非关键蛋白质(阴性数据集)。阈值K的范围从1到5093。随着K取值的不同,分别计算各个方法相应的Sensitivity和1-Specificity值,从而得到precision-recall曲线,如图2所示。从图2,我们可以看出NCCO的precision-recall曲线和ION的比较接近,但AUC略大于ION的AUC,明显大于其它方法的AUC。另外,我们还可以观察到,NCC的AUC明显大于DC,IC,EC SC,BC和CC的AUC。
c.基于jackknife方法比较实验结果
我们用jackknife方法来进一步验证NCC,NCCO方法以及其他10种方法的预测性能。实验结果如图3所示。X轴表示的是按照各个关键蛋白质预测方法排序,排在前面的蛋白质数量。Y轴表示的是识别的正确关键蛋白质的累积数量。图中线下的面积用来比较各个方法的性能。从图3中我们看出NCCO预测关键蛋白质的准确性明显高于所有其它方法,并且NCC也明显高于纯粹的中心性方法DC,IC,EC SC,BC和CC。
Claims (1)
1.基于邻居接近中心性和直系同源信息的关键蛋白质识别方法,其特征在于,所述方法包括以下步骤:
(1)计算每一个蛋白质节点的接近中心性CC;计算公式为:
其中,N代表蛋白质相互作用网络中蛋白质个数,d(u,v)代表节点u和v之间的最短路径;
(2)计算蛋白质相互作用网络中每个蛋白质的邻居接近中心性得分;计算公式为:
其中,triSCC(u,v)代表基于边(u,v)建立的三角形的三个节点的接近中心性得分之和,即triSCC(u,v)=CC(u)+CC(v)+CC(w);Ku和Kv分别代表节点u和v的度;min()是取最小值函数;Nu代表u的所有邻居节点;
(3)计算直系同源得分:让S代表参考物种集合,s(物种)是S的元素,|S|代表S的元素个数;让S代表参考物种集合,如果在V中存在物种s,让Xs代表V的子集;让OS(u)代表节点vu在多少个参考物种上有直系同源,vu∈V(u=1,…,N);计算公式为:
OS(u)=∑m∈STu;
(4)采用结合模型给出最终得分;计算公式为:
PF(u)=∑vDMu;
(5)输出结果:对所有蛋白质按关键性最终得分排序,关键性最终得分PF越高的越可能为关键蛋白质。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610781892.2A CN106372458A (zh) | 2016-08-31 | 2016-08-31 | 基于邻居接近中心性和直系同源信息的关键蛋白质识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610781892.2A CN106372458A (zh) | 2016-08-31 | 2016-08-31 | 基于邻居接近中心性和直系同源信息的关键蛋白质识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106372458A true CN106372458A (zh) | 2017-02-01 |
Family
ID=57899719
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610781892.2A Pending CN106372458A (zh) | 2016-08-31 | 2016-08-31 | 基于邻居接近中心性和直系同源信息的关键蛋白质识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106372458A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107977548A (zh) * | 2017-12-05 | 2018-05-01 | 东软集团股份有限公司 | 预测蛋白质间相互作用的方法、装置、介质及电子设备 |
CN108319812A (zh) * | 2018-02-05 | 2018-07-24 | 陕西师范大学 | 一种基于布谷鸟搜索算法识别关键蛋白质的方法 |
CN108804871A (zh) * | 2017-05-02 | 2018-11-13 | 中南大学 | 基于最大邻居子网的关键蛋白质识别方法 |
CN109637579A (zh) * | 2018-12-18 | 2019-04-16 | 长沙学院 | 一种基于张量随机游走的关键蛋白质识别方法 |
CN109801674A (zh) * | 2019-01-30 | 2019-05-24 | 长沙学院 | 一种基于异构生物网络融合的关键蛋白质识别方法 |
CN110660448A (zh) * | 2019-09-20 | 2020-01-07 | 长沙学院 | 一种基于蛋白质的拓扑与功能特征的关键蛋白识别方法 |
CN112582027A (zh) * | 2020-12-15 | 2021-03-30 | 武汉大学 | 一种基于生物蛋白质信息网络比对的同源蛋白质检测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102176223A (zh) * | 2011-01-12 | 2011-09-07 | 中南大学 | 基于关键蛋白质和局部适应的蛋白质复合物识别方法 |
CN102841985A (zh) * | 2012-08-09 | 2012-12-26 | 中南大学 | 一种基于结构域特征的关键蛋白质识别方法 |
CN102945333A (zh) * | 2012-12-04 | 2013-02-27 | 中南大学 | 一种基于先验知识和网络拓扑特性的关键蛋白预测方法 |
-
2016
- 2016-08-31 CN CN201610781892.2A patent/CN106372458A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102176223A (zh) * | 2011-01-12 | 2011-09-07 | 中南大学 | 基于关键蛋白质和局部适应的蛋白质复合物识别方法 |
CN102841985A (zh) * | 2012-08-09 | 2012-12-26 | 中南大学 | 一种基于结构域特征的关键蛋白质识别方法 |
CN102945333A (zh) * | 2012-12-04 | 2013-02-27 | 中南大学 | 一种基于先验知识和网络拓扑特性的关键蛋白预测方法 |
Non-Patent Citations (1)
Title |
---|
李美满等: "一种基于复合物参与度的关键蛋白质预测方法", 《湘潭大学自然科学学报》 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108804871A (zh) * | 2017-05-02 | 2018-11-13 | 中南大学 | 基于最大邻居子网的关键蛋白质识别方法 |
CN108804871B (zh) * | 2017-05-02 | 2021-06-25 | 中南大学 | 基于最大邻居子网的关键蛋白质识别方法 |
CN107977548B (zh) * | 2017-12-05 | 2020-04-07 | 东软集团股份有限公司 | 预测蛋白质间相互作用的方法、装置、介质及电子设备 |
CN107977548A (zh) * | 2017-12-05 | 2018-05-01 | 东软集团股份有限公司 | 预测蛋白质间相互作用的方法、装置、介质及电子设备 |
CN108319812B (zh) * | 2018-02-05 | 2021-07-23 | 陕西师范大学 | 一种基于布谷鸟搜索算法识别关键蛋白质的方法 |
CN108319812A (zh) * | 2018-02-05 | 2018-07-24 | 陕西师范大学 | 一种基于布谷鸟搜索算法识别关键蛋白质的方法 |
CN109637579A (zh) * | 2018-12-18 | 2019-04-16 | 长沙学院 | 一种基于张量随机游走的关键蛋白质识别方法 |
CN109637579B (zh) * | 2018-12-18 | 2022-04-15 | 长沙学院 | 一种基于张量随机游走的关键蛋白质识别方法 |
CN109801674A (zh) * | 2019-01-30 | 2019-05-24 | 长沙学院 | 一种基于异构生物网络融合的关键蛋白质识别方法 |
CN109801674B (zh) * | 2019-01-30 | 2022-06-14 | 长沙学院 | 一种基于异构生物网络融合的关键蛋白质识别方法 |
CN110660448A (zh) * | 2019-09-20 | 2020-01-07 | 长沙学院 | 一种基于蛋白质的拓扑与功能特征的关键蛋白识别方法 |
CN110660448B (zh) * | 2019-09-20 | 2022-02-01 | 长沙学院 | 一种基于蛋白质的拓扑与功能特征的关键蛋白识别方法 |
CN112582027A (zh) * | 2020-12-15 | 2021-03-30 | 武汉大学 | 一种基于生物蛋白质信息网络比对的同源蛋白质检测方法 |
CN112582027B (zh) * | 2020-12-15 | 2022-04-29 | 武汉大学 | 一种基于生物蛋白质信息网络比对的同源蛋白质检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106372458A (zh) | 基于邻居接近中心性和直系同源信息的关键蛋白质识别方法 | |
Wang et al. | Identification of essential proteins based on edge clustering coefficient | |
Ciriello et al. | AlignNemo: a local network alignment method to integrate homology and topology | |
Xia et al. | An ensemble approach to protein fold classification by integration of template-based assignment and support vector machine classifier | |
CN108319812B (zh) | 一种基于布谷鸟搜索算法识别关键蛋白质的方法 | |
CN109166604B (zh) | 一种融合多数据特征预测关键蛋白质的计算方法 | |
CN104992078B (zh) | 一种基于语义密度的蛋白质网络复合物识别方法 | |
CN107885971B (zh) | 采用改进花授粉算法识别关键蛋白质的方法 | |
CN107784196B (zh) | 基于人工鱼群优化算法识别关键蛋白质的方法 | |
Gu et al. | Module overlapping structure detection in PPI using an improved link similarity-based Markov clustering algorithm | |
CN109509509B (zh) | 基于动态加权蛋白质相互作用网络的蛋白质复合物挖掘方法 | |
Wang et al. | An ensemble learning framework for detecting protein complexes from PPI networks | |
Liu et al. | A Network Hierarchy-Based method for functional module detection in protein–protein interaction networks | |
CN111128292B (zh) | 一种基于蛋白质成簇特性和活性共表达的关键蛋白质识别方法 | |
Wang et al. | An improved memetic algorithm for detecting protein complexes in protein interaction networks | |
CN108198084A (zh) | 一种复杂网络重叠社区发现方法 | |
Zhao et al. | Detecting overlapping protein complexes in weighted PPI network based on overlay network chain in quotient space | |
Shen et al. | Identifying protein complexes based on brainstorming strategy | |
Gómez-Vela et al. | Structure optimization for large gene networks based on greedy strategy | |
Chua et al. | A unified scoring scheme for detecting essential proteins in protein interaction networks | |
Chan et al. | Soft computing methods to predict gene regulatory networks: An integrative approach on time-series gene expression data | |
Cao et al. | Identification of overlapping protein complexes by fuzzy K-medoids clustering algorithm in yeast protein-protein interaction networks | |
CN113450872B (zh) | 磷酸化位点特异激酶的预测方法 | |
Celestini et al. | Critical nodes reveal peculiar features of human essential genes and protein interactome | |
US20240145029A1 (en) | System and method for determining and prioritizing a plurality of secondary target protein |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170201 |