CN109033746A - 一种基于节点向量的蛋白质复合物识别方法 - Google Patents

一种基于节点向量的蛋白质复合物识别方法 Download PDF

Info

Publication number
CN109033746A
CN109033746A CN201810693748.2A CN201810693748A CN109033746A CN 109033746 A CN109033746 A CN 109033746A CN 201810693748 A CN201810693748 A CN 201810693748A CN 109033746 A CN109033746 A CN 109033746A
Authority
CN
China
Prior art keywords
protein
node
subgraph
reciprocation
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810693748.2A
Other languages
English (en)
Other versions
CN109033746B (zh
Inventor
杨志豪
刘晓霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University of Technology
Original Assignee
Dalian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University of Technology filed Critical Dalian University of Technology
Priority to CN201810693748.2A priority Critical patent/CN109033746B/zh
Publication of CN109033746A publication Critical patent/CN109033746A/zh
Application granted granted Critical
Publication of CN109033746B publication Critical patent/CN109033746B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于节点向量的蛋白质复合物识别方法,该方法包括以下步骤:S1、采集包含蛋白质交互作用关系的蛋白质对数据集:S2、构建蛋白质交互作用关系网络;S3、网络节点向量化;S4、网络边加权;S5、选取种子节点;S6、种子节点扩张从而形成候选蛋白质复合物子图;S7、过滤候选蛋白质复合物子图并输出最终识别得到的蛋白质复合物子图。本发明适用于从已有的蛋白质交互作用关系中识别蛋白质复合物的工作,不限于蛋白质交互作用关系的来源,能够有效的识别蛋白质复合物,将有助于在蛋白质水平上揭示疾病等生命活动的基本机理。

Description

一种基于节点向量的蛋白质复合物识别方法
技术领域
本发明涉及网络数据挖掘方法领域,尤其是一种基于节点向量的蛋白质复合物识别方法。
背景技术
蛋白质复合物是一组蛋白质通过交互作用构成的一个整体以完成某种生物功能。了解蛋白质复合物的结构和功能是探索各种生命活动机制的基础,能够帮助人类在蛋白质水平上揭示疾病等生命活动的基本机理,获得关于疾病发生、细胞代谢等一系列生理过程的全面而整体的认识。蛋白质复合物识别是蛋白质复合物研究的第一步,也是蛋白质相关研究的重要基础,因此,如何有效识别蛋白质复合物具有重大的理论价值和使用价值。
当前通过实验测定的方法识别蛋白质复合物主要基于亲和纯化技术和免疫共沉淀技术,而这些方法实验步骤多、耗时且成本昂贵。随着蛋白质交互作用关系数据的飞速增加,基于蛋白质交互作用网络自动识别蛋白质复合物的计算方法成为了通过实验识别蛋白质复合物的有效补充。在蛋白质交互作用关系网络中,节点表示蛋白质,边表示蛋白质交互作用。蛋白质复合物在蛋白质交互作用关系网络中通常表现为相对独立的稠密子图,构成复合物的蛋白质之间关系紧密,具有相同的拓扑和生物特征。使用计算的方法识别蛋白质复合物与实验方法相比具有成本低、效率高的优势,将为进一步推动生命科学的发展助力,然而目前大多数研究不能在充分挖掘蛋白质交互作用网络的拓扑特点的同时把握蛋白质复合物在蛋白质交互作用网络中的特性,其识别性能并不高。
发明内容
本发明的目的是提供一种可靠性强、性能高,适用于从现有蛋白质交互作用关系中识别蛋白质复合物的基于节点向量的蛋白质复合物识别方法。
本发明解决现有技术问题所采用的技术方案:一种基于节点向量的蛋白质复合物识别方法,该方法包括以下步骤:
S1、采集包含蛋白质交互作用关系的蛋白质对数据集:从已有的蛋白质交互作用关系数据库中采集具有蛋白质交互作用关系的蛋白质对,去除重复以及具有自连接蛋白质交互作用关系的蛋白质对,并将所述蛋白质对以统一格式存储为蛋白质对数据集;
S2、构建蛋白质交互作用关系网络:使用蛋白质对数据集构建蛋白质交互作用关系网络G(V,E,W),其中,V为节点的集合、E为边的集合、W为边的权重集:将蛋白质对数据集中每个蛋白质对中的蛋白质作为蛋白质交互作用关系网络G(V,E,W)的节点;节点间的边为该蛋白质对的蛋白质交互作用关系;将每条边的初始权重设为1;
S3、网络节点向量化:利用无监督训练模型对蛋白质交互关系网络进行图嵌入:将蛋白质交互作用网络中的每个节点表示为向量形式,作为蛋白质向量;具体方法为:对于蛋白质交互作用网络中的每个节点定义一个d维实数向量,每一维实数向量为一个变量,每个节点与从当前节点出发通过k步随机游走到达的m个节点形成节点序列,该节点序列作为当前节点的上下文,其中d、k、m为自然数;使用Skip-Gram模型,并将d维实数向量作为模型的输入变量,通过损失函数和求导公式对Skip-Gram模型中的参数与输入变量进行更新,以使当前节点的蛋白质向量与其所在节点序列中的各节点的蛋白质向量的余弦相似度在0.8到1之间;最后,将更新后得到的d维实数向量作为当前节点的蛋白质向量;
S4、网络边加权:将蛋白质交互关系网络中,每条边两端的蛋白质向量之间的夹角余弦值对该条边权值的初始权重进行更新,得到加权蛋白质交互关系网络;
S5、选取种子节点:计算每个节点vt的度deg(vt),其中,t∈{1,…,|V|},V为节点的集合,|V|为蛋白质交互作用关系网络中节点的总个数;同时求出整个网络的平均度averagedegree(G(V,E,W)),提取节点度等于或大于蛋白质交互作用关系网络平均度的节点作为种子节点加入种子节点集合中,种子节点集合表示为seedset;其中,通过以下公式计算蛋白质交互作用关系网络的平均度averagedegree(G(V,E,W)):
S6、种子节点扩张从而形成候选蛋白质复合物子图:包括以下步骤:
a1、选取种子节点集合seedset中的一个种子节点vi作为当前种子节点,i∈{1,…,len(seedset)},其中len(seedset)为种子节点集合的大小;为当前种子节点初始化一个子图clusteri,此时子图中只包含vi,并设置当前子图初始分值为0,然后对步骤S4得到的蛋白质交互作用加权网络,使用别名采样方法为当前种子节点选择候选节点,加入当前候选节点并更新子图clusteri及其分值score(clusteri);给定一个子图clusteri,其分值的计算方法为:
其中 为子图clusteri中边的集合,表示子图clusteri中点的集合;其中表示由子图clusteri中所有节点构成的带权重的邻接矩阵中第m行第n列的数值,表示由子图clusteri中所有节点构成的度权重矩阵中第m行第m列的数值;
a2、从更新的子图clusteri中随机选择一个节点作为待扩张节点,采用基于网络权值的别名采样方法为当前待扩张节点选择候选节点,如果加入候选节点可以使当前子图的分值升高,即加入候选节点后的子图分值高于当前子图分值,则加入当前候选节点并更新子图clusteri及其分值score(clusteri):
a3、从当前子图clusteri中选取边缘节点,如果删除边缘节点可以使当前子图的分值升高,即删除所选边缘节点后的子图分值高于当前子图分值,则删除所选边缘节点并更新子图clusteri及其分值score(clusteri);
a4、重复步骤a2和a3,直到子图clusteri及其分值不再发生变化;
a5、输出当前种子节点vi对应的子图clusteri及其分值作为候选蛋白质复合物子图,并从种子节点集合seedset中删除当前种子节点vi
a6、重复a1-a5步骤,直到seedset为空;得到候选蛋白质复合物子图;
S7、过滤候选蛋白质复合物子图并输出最终识别得到的蛋白质复合物子图:
包括以下步骤:
b1、将所有候选蛋白质复合物子图按照其分值降序排序,得到排序后的候选蛋白质复合物子图集合C={C1,C2,C3,…Cn},其中n,其中n为识别出的候选蛋白质复合物子图的个数,对任意一个候选蛋白质复合物子图Ca,a∈{1,…,n},计算该候选蛋白质复合物子图Ca与子图分值低于Ca的候选蛋白质复合物子图Cb的重合度b∈{1,…,n},重合度计算公式为:如果Ca与Cb的重合度大于预设合并阈值,则计算合并Ca与Cb后子图的分值,如果分值大于Ca,则将Ca更新为Ca∪Cb并删除Cb,如果分值小于Ca,则删除Cb,重复此步骤直到没有候选复合物需要合并;
b2、输出更新后的节点个数大于或等于预设阈值的所有候选蛋白质复合物子图作为最终识别的蛋白质复合物子图,输出识别所得的所有蛋白质复合物子图即得到最终的蛋白质复合物。
步骤S3中的损失函数为:其中f(v)是将节点v映射为成d维向量的函数,NS(vk)是包含节点vk的节点序列。
在步骤S3中,d∈{32,64,128,256},k∈{10,20,30},m∈{10,20,30,40,50}。
在步骤b1中,预设合并阈值为0.9。
步骤b2中,预设阈值为3。
本发明的有益效果在于:本发明通过使用无监督方法获取蛋白质交互关系网络的节点向量表示并使用节点向量表示为蛋白质交互关系网络加权,能够更有效的区分哪些蛋白质交互作用关系更有可能形成蛋白质复合物。本发明利用种子节点扩张的方法形成候选蛋白质复合物子图,在扩张过程中不仅包含加入节点同时也考虑是否需要删除边缘节点来形成分值更高的子团,能够充分保证最终所形成的蛋白质复合物更加接近真实蛋白质复合物。本发明同时考虑了网络整体特征和节点之间的局部特征,并基于蛋白质复合物在蛋白质交互作用网络中的拓扑特征,提出基于子图密度和子图内外权重比例的打分策略为候选蛋白质复合物打分。本发明能够从蛋白质交互作用网络中有效自动识别蛋白质复合物,以帮助生物学家减轻实验成本,节省了人力物力。
附图说明
图1为本发明的整体流程示意图。
图2为将蛋白质交互作用网络中的节点表示为向量示意图。
图3为本发明所识别出的一个蛋白质复合物子图。
具体实施方式
以下结合附图及具体实施方式对本发明进行说明:
图1是本发明一种基于节点向量的蛋白质复合物识别方法的流程示意图。如图1所示,一种基于节点向量的蛋白质复合物识别方法,包括以下步骤:
S1、采集包含蛋白质交互作用关系的蛋白质对数据集:从已有的蛋白质交互作用关系数据库中采集具有蛋白质交互作用关系的蛋白质对,去除重复以及具有自连接蛋白质交互作用关系的蛋白质对,并将所述蛋白质对以统一格式存储为蛋白质对数据集;
S2、构建蛋白质交互作用关系网络:使用蛋白质对数据集构建蛋白质交互作用关系网络G(V,E,W),其中,V为节点的集合、E为边的集合、W为边的权重集:将蛋白质对数据集中每个蛋白质对中的蛋白质作为蛋白质交互作用关系网络G(V,E,W)的节点;节点间的边为该蛋白质对的蛋白质交互作用关系;将每条边的初始权重设为1;
S3、网络节点向量化:利用无监督训练模型对蛋白质交互关系网络进行图嵌入:将蛋白质交互作用网络中的每个节点表示为向量形式,作为蛋白质向量;具体方法为:对于蛋白质交互作用网络中的每个节点定义一个d维实数向量,每一维实数向量为一个变量,每个节点与从当前节点出发通过k步随机游走到达的m个节点形成节点序列,该节点序列作为当前节点的上下文,其中d、k、m为自然数;使用Skip-Gram模型,并将d维实数向量作为模型的输入变量,通过损失函数和求导公式对Skip-Gram模型中的参数与输入变量进行更新,以使当前节点的蛋白质向量与其所在节点序列中的各节点的蛋白质向量的余弦相似度在0.8到1之间;最后,将更新后得到的d维实数向量作为当前节点的蛋白质向量;
S4、网络边加权:将蛋白质交互关系网络中,每条边两端的蛋白质向量之间的夹角余弦值对该条边权值的初始权重进行更新,得到加权蛋白质交互关系网络;
S5、选取种子节点:计算每个节点vt的度deg(vt),其中,t∈{1,…,|V|},V为节点的集合,|V|为蛋白质交互作用关系网络中节点的总个数;同时求出整个网络的平均度averagedegree(G(V,E,W)),提取节点度等于或大于蛋白质交互作用关系网络平均度的节点作为种子节点加入种子节点集合中,种子节点集合表示为seedset;其中,通过以下公式计算蛋白质交互作用关系网络的平均度averagedegree(G(V,E,W)):
S6、种子节点扩张从而形成候选蛋白质复合物子图:包括以下步骤:
a1、选取种子节点集合seedset中的一个种子节点vi作为当前种子节点,i∈{1,…,len(seedset)},其中len(seedset)为种子节点集合的大小,为当前种子节点初始化一个子图clusteri,此时子图中只包含vi,并设置当前子图初始分值为0,然后对步骤S4得到的蛋白质交互作用加权网络,使用别名采样方法为当前种子节点选择候选节点,加入当前候选节点并更新子图clusteri及其分值score(clusteri);给定一个子图clusteri,其分值的计算方法为:
其中 为子图clusteri中边的集合,表示子图clusteri中点的集合;其中表示有子图clusteri中所有节点构成的带权重的邻接矩阵中第m行第n列的数值,表示由子图clusteri中所有节点构成的度权重矩阵第m行第m列的数值;
a2、从更新的子图clusteri中随机选择一个节点作为待扩张节点,采用基于网络权值的别名采样方法为当前待扩张节点选择候选节点,如果加入候选节点可以使当前子图的分值升高,即加入候选节点后的子图分值高于当前子图分值,则加入当前候选节点并更新子图clusteri及其分值score(clusteri):
a3、从当前子图clusteri中选取边缘节点,如果删除边缘节点可以使当前子图的分值升高,即删除所选边缘节点后的子图分值高于当前子图分值,则删除所选边缘节点并更新子图clusteri及其分值score(clusteri);
a4、重复步骤a2和a3,直到子图clusteri及其分值不再发生变化;
a5、输出当前种子节点vi对应的子图clusteri及其分值作为候选蛋白质复合物子图,并从种子节点集合seedset中删除当前种子节点vi
a6、重复a1-a5步骤,直到seedset为空;得到候选蛋白质复合物子图。
S7、过滤候选蛋白质复合物子图并输出最终识别得到的蛋白质复合物子图:
包括以下步骤:
b1、将所有候选蛋白质复合物子图按照其分值降序排序,得到排序后的候选蛋白质复合物子图集合C={C1,C2,C3,…Cn},其中n,其中n为识别出的候选蛋白质复合物子图的个数,对任意一个候选蛋白质复合物子图Ca,a∈{1,…,n},计算该候选蛋白质复合物子图Ca与子图分值低于Ca的候选蛋白质复合物子图Cb的重合度b∈{1,…,n},重合度计算公式为:如果Ca与Cb的重合度大于预设合并阈值,则计算合并Ca与Cb后子图的分值,如果分值大于Ca,则将Ca更新为Ca∪Cb并删除Cb,如果分值小于Ca,则删除Cb,重复此步骤直到没有候选复合物需要合并;
b2、输出更新后的节点个数大于或等于3的所有候选蛋白质复合物子图作为最终识别的蛋白质复合物子图,输出识别所得的所有蛋白质复合物子图即得到最终的蛋白质复合物。
实验结果与分析
本部分通过在实际蛋白质相互作用关系数据所构建的蛋白质相互作用网络上进行蛋白质复合物识别的结果,验证了本发明算法的有效性、实用性和正确性。首先介绍实验所使用的蛋白质相互作用作用关系数据;其次介绍实验结的评价指标;最后使用相关评价指标来评估本文提出的蛋白质复合物识别算法的有效性。
实验数据:
生物高通量实验产生了大量的蛋白质相互作用关系,形成了多种蛋白质关系数据库,本发明采用目前使用较多,且收到研究人员广泛关注的六种酵母菌蛋白质交互作用关系数据:DIP,BioGrid,Krogan Core,Krogan extend,Collins,Gavin,这六个蛋白质相互作用数据集是从对应的数据库下载获取,这些蛋白质交互作用关系网络的详细信息统计见表1:
表1蛋白质交互作用关系网络详细信息统计表
数据集 节点数 边数
DIP 4928 17201
BioGrid 5640 59748
KroganCore 2708 7123
Kroganextend 3672 14317
Collins 1622 9074
Gavin 1855 7669
采用准确率(Precision),召回率(Recall),准确率和召回率的调和平均数(F-measure),以及功能富集(P-value)四个指标对本发明的识别算法进行评价,与MCL、CMC、RRW和ClusterONE四种当前先进蛋白质复合物识别算法比较结果表明,本发明提出的蛋白质复合物识别算法获得最好的F-measure值。同时通过统计不同蛋白质复合物识别方法所识别出的蛋白质复合物的P-value值表明,本发明提出的算法识别出的蛋白质复合物的P-value值整体小于其他四种识别方法所识别出的蛋白质复合物的P-value值,从而可知本发明所识别出的蛋白质复合物较其他方法识别出的蛋白质复合物更具有一定的生物学意义。因此,实验结果表明本发明提出的蛋白质复合物识别方法是有效的。
图3为本发明所识别出的一个蛋白质复合物。
以上内容是结合具体的优选技术方案对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (5)

1.一种基于节点向量的蛋白质复合物识别方法,其特征在于,该方法包括以下步骤:
S1、采集包含蛋白质交互作用关系的蛋白质对数据集:从已有的蛋白质交互作用关系数据库中采集具有蛋白质交互作用关系的蛋白质对,去除重复以及具有自连接蛋白质交互作用关系的蛋白质对,并将所述蛋白质对以统一格式存储为蛋白质对数据集;
S2、构建蛋白质交互作用关系网络:使用蛋白质对数据集构建蛋白质交互作用关系网络G(V,E,W),其中,V为节点的集合、E为边的集合、W为边的权重集:将蛋白质对数据集中每个蛋白质对中的蛋白质作为蛋白质交互作用关系网络G(V,E,W)的节点;节点间的边为该蛋白质对的蛋白质交互作用关系;将每条边的初始权重设为1;
S3、网络节点向量化:利用无监督训练模型对蛋白质交互关系网络进行图嵌入:将蛋白质交互作用网络中的每个节点表示为向量形式,作为蛋白质向量;具体方法为:对于蛋白质交互作用网络中的每个节点定义一个d维实数向量,每一维实数向量为一个变量,每个节点与从当前节点出发通过k步随机游走到达的m个节点形成节点序列,该节点序列作为当前节点的上下文,其中d、k、m为自然数;使用Skip-Gram模型,并将d维实数向量作为模型的输入变量,通过损失函数和求导公式对Skip-Gram模型中的参数与输入变量进行更新,以使当前节点的蛋白质向量与其所在节点序列中的各节点的蛋白质向量的余弦相似度在0.8到1之间;最后,将更新后得到的d维实数向量作为当前节点的蛋白质向量;
S4、网络边加权:将蛋白质交互关系网络中,每条边两端的蛋白质向量之间的夹角余弦值对该条边权值的初始权重进行更新,得到加权蛋白质交互关系网络;
S5、选取种子节点:计算每个节点vt的度deg(vt),其中,t∈{1,…,|V|},V为节点的集合,|V|为蛋白质交互作用关系网络中节点的总个数;同时求出整个网络的平均度averagedegree(G(V,E,W)),提取节点度等于或大于蛋白质交互作用关系网络平均度的节点作为种子节点加入种子节点集合中,种子节点集合表示为seedset;其中,通过以下公式计算蛋白质交互作用关系网络的平均度averagedegree(G(V,E,W)):
S6、种子节点扩张从而形成候选蛋白质复合物子图:包括以下步骤:
a1、选取种子节点集合seedset中的一个种子节点vi作为当前种子节点,i∈{1,…,len(seedset)},其中len(seedset)为种子节点集合的大小;为当前种子节点初始化一个子图clusteri,此时子图中只包含vi,并设置当前子图初始分值为0,然后对步骤S4得到的蛋白质交互作用加权网络,使用别名采样方法为当前种子节点选择候选节点,加入当前候选节点并更新子图clusteri及其分值score(clusteri);给定一个子图clusteri,其分值的计算方法为:
其中 为子图clusteri中边的集合,表示子图clusteri中点的集合;其中表示由子图clusteri中所有节点构成的带权重的邻接矩阵中第m行第n列的数值,表示由子图clusteri中所有节点构成的度权重矩阵中第m行第m列的数值;
a2、从更新的子图clusteri中随机选择一个节点作为待扩张节点,采用基于网络权值的别名采样方法为当前待扩张节点选择候选节点,如果加入候选节点可以使当前子图的分值升高,即加入候选节点后的子图分值高于当前子图分值,则加入当前候选节点并更新子图clusteri及其分值score(clusteri):
a3、从当前子图clusteri中选取边缘节点,如果删除边缘节点可以使当前子图的分值升高,即删除所选边缘节点后的子图分值高于当前子图分值,则删除所选边缘节点并更新子图clusteri及其分值score(clusteri);
a4、重复步骤a2和a3,直到子图clusteri及其分值不再发生变化;
a5、输出当前种子节点vi对应的子图clusteri及其分值作为候选蛋白质复合物子图,并从种子节点集合seedset中删除当前种子节点vi
a6、重复a1-a5步骤,直到seedset为空;得到候选蛋白质复合物子图;
S7、过滤候选蛋白质复合物子图并输出最终识别得到的蛋白质复合物子图:包括以下步骤:
b1、将所有候选蛋白质复合物子图按照其分值降序排序,得到排序后的候选蛋白质复合物子图集合C={C1,C2,C3,…Cn},其中n,其中n为识别出的候选蛋白质复合物子图的个数,对任意一个候选蛋白质复合物子图Ca,a∈{1,…,n},计算该候选蛋白质复合物子图Ca与子图分值低于Ca的候选蛋白质复合物子图Cb的重合度b∈{1,…,n},重合度计算公式为:a,b∈{1,…,n},如果Ca与Cb的重合度大于预设合并阈值,则计算合并Ca与Cb后子图的分值,如果分值大于Ca,则将Ca更新为Ca∪Cb并删除Cb,如果分值小于Ca,则删除Cb,重复此步骤直到没有候选复合物需要合并;
b2、输出更新后的节点个数大于或等于预设阈值的所有候选蛋白质复合物子图作为最终识别的蛋白质复合物子图,输出识别所得的所有蛋白质复合物子图即得到最终的蛋白质复合物。
2.根据权利要求1所属的一种基于节点向量的蛋白质复合物识别方法,其特征在于,步骤S3中的损失函数为:其中f(v)是将节点v映射为成d维向量的函数,NS(vk)是包含节点vk的节点序列。
3.根据权利要求1所述的一种基于节点向量的蛋白质复合物识别方法,其特征在于,在步骤S3中,d∈{32,64,128,256},k∈{10,20,30},m∈{10,20,30,40,50}。
4.根据权利要求1所述的一种基于节点向量的蛋白质复合物识别方法,其特征在于,在步骤b1中,预设合并阈值为0.9。
5.根据权利要求1所述的一种基于节点向量的蛋白质复合物识别方法,其特征在于,步骤b2中,预设阈值为3。
CN201810693748.2A 2018-06-29 2018-06-29 一种基于节点向量的蛋白质复合物识别方法 Active CN109033746B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810693748.2A CN109033746B (zh) 2018-06-29 2018-06-29 一种基于节点向量的蛋白质复合物识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810693748.2A CN109033746B (zh) 2018-06-29 2018-06-29 一种基于节点向量的蛋白质复合物识别方法

Publications (2)

Publication Number Publication Date
CN109033746A true CN109033746A (zh) 2018-12-18
CN109033746B CN109033746B (zh) 2020-01-14

Family

ID=65520867

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810693748.2A Active CN109033746B (zh) 2018-06-29 2018-06-29 一种基于节点向量的蛋白质复合物识别方法

Country Status (1)

Country Link
CN (1) CN109033746B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110706740A (zh) * 2019-09-29 2020-01-17 长沙理工大学 基于模块分解的蛋白质功能预测的方法、装置、设备
CN111724855A (zh) * 2020-05-07 2020-09-29 大连理工大学 一种基于最小生成树Prim的蛋白质复合物识别方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101246520A (zh) * 2008-03-18 2008-08-20 中南大学 基于距离判定的蛋白质复合物识别方法
CN102176223A (zh) * 2011-01-12 2011-09-07 中南大学 基于关键蛋白质和局部适应的蛋白质复合物识别方法
US8504304B2 (en) * 2004-11-12 2013-08-06 Bristol-Myers Squibb Company Protein-ligand NOE matching for high-throughput structure determination
CN105590039A (zh) * 2015-03-05 2016-05-18 华中师范大学 一种基于bso优化的蛋白质复合物识别方法
CN106778063A (zh) * 2016-12-02 2017-05-31 上海电机学院 一种基于图模型的蛋白质复合物识别方法
CN108009403A (zh) * 2017-11-24 2018-05-08 中国地质大学(武汉) 基于多源数据融合及多目标优化的蛋白质复合物识别方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8504304B2 (en) * 2004-11-12 2013-08-06 Bristol-Myers Squibb Company Protein-ligand NOE matching for high-throughput structure determination
CN101246520A (zh) * 2008-03-18 2008-08-20 中南大学 基于距离判定的蛋白质复合物识别方法
CN102176223A (zh) * 2011-01-12 2011-09-07 中南大学 基于关键蛋白质和局部适应的蛋白质复合物识别方法
CN105590039A (zh) * 2015-03-05 2016-05-18 华中师范大学 一种基于bso优化的蛋白质复合物识别方法
CN106778063A (zh) * 2016-12-02 2017-05-31 上海电机学院 一种基于图模型的蛋白质复合物识别方法
CN108009403A (zh) * 2017-11-24 2018-05-08 中国地质大学(武汉) 基于多源数据融合及多目标优化的蛋白质复合物识别方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
DAISUKE TATSUKE,ET AL: "《Sampling strategy for protein complex prediction using cluster size frequency》", 《GENE》 *
胡赛等: "《多关系蛋白质网络构建及其应用研究》", 《自动化学报》 *
赵碧海,等: "《一种改进的基于加权网络的蛋白质复合物识别算法》", 《计算机科学》 *
郑文萍,等: "《基于遗传算法的蛋白质复合物识别算法》", 《计算机科学与探索》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110706740A (zh) * 2019-09-29 2020-01-17 长沙理工大学 基于模块分解的蛋白质功能预测的方法、装置、设备
CN110706740B (zh) * 2019-09-29 2022-03-22 长沙理工大学 基于模块分解的蛋白质功能预测的方法、装置、设备
CN111724855A (zh) * 2020-05-07 2020-09-29 大连理工大学 一种基于最小生成树Prim的蛋白质复合物识别方法

Also Published As

Publication number Publication date
CN109033746B (zh) 2020-01-14

Similar Documents

Publication Publication Date Title
Wei et al. Superpixel hierarchy
CN107563381B (zh) 基于全卷积网络的多特征融合的目标检测方法
CN109949368A (zh) 一种基于图像检索的人体三维姿态估计方法
CN100595782C (zh) 一种融合光谱信息和多点模拟空间信息的分类方法
CN109145171A (zh) 一种多尺度地图数据更新方法
CN113326377B (zh) 一种基于企业关联关系的人名消歧方法及系统
CN105956093B (zh) 一种基于多视图锚点图哈希技术的个性化推荐方法
CN106557579A (zh) 一种基于卷积神经网络的车辆型号检索系统及方法
CN108984642A (zh) 一种基于哈希编码的印花织物图像检索方法
CN109344263A (zh) 一种地址匹配方法
CN108009575A (zh) 一种用于复杂网络的社区发现方法
CN102571431B (zh) 针对复杂网络的基于群思想改进的Fast-Newman聚类方法
CN110347881A (zh) 一种基于路径回溯图嵌入的群体发现方法
CN104715024A (zh) 一种多媒体热点分析方法
CN110442994A (zh) 一种基于图论的3d打印切片处理方法
CN109271427A (zh) 一种基于近邻密度和流形距离的聚类方法
CN104268629A (zh) 一种基于先验信息和网络固有信息的复杂网络社区检测方法
CN109740106A (zh) 基于图卷积神经网络的大规模网络介数逼近方法、存储装置及存储介质
CN107146251A (zh) 一种三维人脸模型的对称性分析方法
CN113223042A (zh) 一种遥感影像深度学习样本智能采集方法及设备
CN109325510A (zh) 一种基于网格统计的图像特征点匹配方法
CN108399268A (zh) 一种基于博弈论的增量式异构图聚类方法
CN109033746A (zh) 一种基于节点向量的蛋白质复合物识别方法
CN107451617A (zh) 一种图转导半监督分类方法
CN103164487B (zh) 一种基于密度与几何信息的数据聚类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant