CN103106279A - 一种同时基于节点属性以及结构关系相似度的聚类方法 - Google Patents

一种同时基于节点属性以及结构关系相似度的聚类方法 Download PDF

Info

Publication number
CN103106279A
CN103106279A CN2013100559779A CN201310055977A CN103106279A CN 103106279 A CN103106279 A CN 103106279A CN 2013100559779 A CN2013100559779 A CN 2013100559779A CN 201310055977 A CN201310055977 A CN 201310055977A CN 103106279 A CN103106279 A CN 103106279A
Authority
CN
China
Prior art keywords
node
attribute
matrix
omega
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013100559779A
Other languages
English (en)
Other versions
CN103106279B (zh
Inventor
贝毅君
张炳威
林臻
郑小林
赵晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201310055977.9A priority Critical patent/CN103106279B/zh
Publication of CN103106279A publication Critical patent/CN103106279A/zh
Application granted granted Critical
Publication of CN103106279B publication Critical patent/CN103106279B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了同时基于节点属性以及结构关系相似度的聚类方法,首先,根据节点属性和拓扑结构关系提出了统一距离估算模型。然后,针对节点属性以及结构的权重设定问题,提出了权重自调整算法。接着,提出了基于十字链表的稀疏矩阵计算和存储优化方法以提高本聚类方法的性能。最后,不断变化的网络对聚类方法造成大量重复计算以及不能实时更新聚类结果的问题,提出了自适应的聚类方法。本发明解决了复杂网络统一模型和性能问题,以及避免了大量重复计算并且满足了实时获取聚类结果的要求,提高了本聚类方法的实际应用性。

Description

一种同时基于节点属性以及结构关系相似度的聚类方法
技术领域
本发明涉及聚类分析技术领域,具体涉及一种同时基于节点属性以及结构关系相似度的聚类方法。
背景技术
图是现代计算机研究领域的重要数据结构。随着科学技术地不断发展,越来越多的数据以图作为表达形式,例如生物网络、社会网络以及蛋白质网络等等。特别的,如今社会网络图已变成最复杂的网络之一。如何有效地管理和挖掘海量的图数据已变成图数据库研究的核心问题,特别是针对有效的社交网络数据挖掘,发现用户特征和进行有效的聚类问题,已经变成了新时期的关键问题。社交网络中的聚类问题,是根据用户特征和用户之间的关系对用户进行划分群组的问题。社交网络的聚类技术在用户检测,用户推荐等领域有着举足轻重的地位,如腾讯的朋友圈、豆瓣的兴趣小组,以及Linkedin、facebook等对新成员的关系推荐等,而同时,这也是非常具有挑战性的研究工作。
公告号为CN102184215B的中国专利公开了一种基于数据场的自动聚类方法,通过将每个空间数据看成一个具有质量的数据点,空间数据之间彼此相互影响形成一个数据场,数据场的势值则表现为所有数据点在该处的影响力的总和,数据场势值的一阶偏导势值为零的点即为数据叠加作用最为密集的区域,即数据的簇中心,进而根据这些簇中心向两侧搜索并确定簇的边缘,最终将完整的簇标记出来。
公告号为CN102184216B的中国专利公开了一种基于数据场划分网格的自动聚类方法,将划分所得每个网格看成一个具有质量的数据点,它们之间彼此相互影响形成数据场,所有数据点之间的相互叠加作用表现为数据场的势值,首先通过搜索数据场势值的局部极大值来发现数据的簇中心,进而根据簇中心相周围搜索并确定簇的边缘,最终将整个簇搜索出来,可以被应用于图像处理、社区发展、异常检测、市场研究等领域。
基于节点属性和拓扑结构的图聚类问题跟传统的关系型数据库的聚类问题有着重要的区别,传统聚类方法只包括用户的属性特征或者用户之间的关系,而不能建立一个统一的挖掘模型。基于节点属性的方法只关注共同的属性特征,却使得用户都是一个个孤立的个体。而基于拓扑结构的聚类过程忽略了属性特性,使得不同属性的个体不能根据属性特征选择更适合的群体,比如根据min cut或者根据min ratio方法最小化集群间的结构关系的聚类挖掘。同时,面对不断变化的海量数据计算,如何有效的管理和处理数据,以及如何根据环境调整结果避免重复计算也变的非常重要。
由于分割节点属性和拓扑结构的聚类方法并不能解决复杂网络的聚类问题,以及变化的环境对聚类过程的影响,有必要提出一个更加全面的聚类算法解决复杂网络的聚类问题,使决策者或者最新最快的信息,及时做出正确的决策。
发明内容
本发明提供了一种同时基于节点属性以及结构关系相似度的聚类方法,该聚类方法应用于社会网络时,能够同时兼顾各个实体的属性信息和关系信息,聚类结果更加合理。
一种同时基于节点属性以及结构关系相似度的聚类方法,包括以下步骤:
(1)以社会化网络图中的每一个实体为基础创建一个普通节点,提取各个实体的属性信息创建属性节点,以各个实体之间的关系为基础创建结构关系,得到增广网络图;
其中,属性节点包括属性类别和属性值;
属性节点的类别数为m,定义每个类别的属性节点的权重为ω1,ω2,……,ωm
定义结构关系的权重为ω0
(2)根据步骤(1)得到的增广网络图中节点之间的相似性建立统一距离估算模型,包括如下步骤:
(2.1)根据每个属性节点的权重以及结构关系的权重,得到普通节点Vi到普通节点Vj之间通过结构关系的转移概率
Figure BDA00002848018400031
所有的转移概率
Figure BDA00002848018400032
组成矩阵Pv
普通节点Vi和普通节点Vj分别代表任意两个不同的普通节点;
(2.2)根据每个属性节点的权重以及结构关系的权重,得到普通节点Vi与属性值为k的属性节点Uk之间的转移概率
Figure BDA00002848018400033
所有的转移概率
Figure BDA00002848018400034
组成;
(2.3)根据每个属性节点与普通节点之间的关系,得到属性值为k的属性节点Uk与普通节点Vi的转移概率
Figure BDA00002848018400035
所有的转移概率
Figure BDA00002848018400036
组成矩阵B;
(2.4)根据马尔科夫链模型,定义网络图中每一个节点到所有跟它连接的节点之间的转移概率之和为1;
Figure BDA00002848018400037
其中C1代表跟节点i直接相连的节点集合,p(i,j)为节点i到节点j的转移概率;
同时设置过滤度f=1%,如果两个节点之间的转移概率低于过滤度f,则直接把两节点间转移概率设为0;
(2.5)由所述的矩阵Pv、矩阵A和矩阵B,得到概率矩阵P;
概率矩阵P为 P V A B 0 , 其中0为零矩阵;
(2.6)根据随机漫步模型由概率矩阵P得到节点间访问概率的相关性矩阵M1,然后由相关性矩阵M1得到稀疏矩阵Rl
其中Rl中每一个元素为相关性矩阵Ml中相应位置元素的倒数;
(2.7)由所述的稀疏矩阵Rl得到每个节点的密度函数Di
所述的节点包括普通节点和属性节点;
(3)获得聚类集合,包括:
(3.1)输入一个带节点属性的社交网络图、两节点之间随机访问的长度限制l、访问接受率c,参数δ以及待输出聚类的个数n;
(3.2)初始化属性以及结构关系的权重,ω01=……=ωm=1.0;
(3.3)按照密度函数Di由大到小的顺序,对所有节点进行排序,取前n个节点作为聚类中心
(3.4)把每个增广网络图中的节点分配到离自己最近的聚类中心的集群中;
(3.5)根据重新投票机制选择新的聚类中心,方法如下:
选取同一集群中到所有其他节点的距离之和跟集群中每一个节点到其他节点之和的平均值最接近的节点作为新的聚类中心,即 C t + 1 = min ( | Sum i V - Sum j ∈ v V ‾ ) , 其中 Sum i V = Σ j ∈ V d ( i , j ) ;
(3.6)根据熵值分布更新属性权重,同时比较聚类中心是否发生改变,若聚类中心不发生改变,将得到的n个聚类集合作为最终结果输出;如发生改变,则回到步骤(3.3)。
作为优选,步骤(2.1)中,,所述的转移概率
Figure BDA00002848018400043
的计算方法如下:
p ( v i , v j ) = ω 0 / ( ω 0 * N 0 + ω 1 * N 1 + . . . . . . + ω m * N m ) ;
其中,Ni(i=1~m)代表具有属性类别i的所有节点与节点Vi之间存在的关系的总数;
Ni(i=0)代表与节点Vi(起始点)直接相连的普通节点的总数;
步骤(2.2)中,所述的转移概率
Figure BDA00002848018400045
的计算方法如下:
p ( v i , u k ) = ω j / ( ω 0 * N 0 + ω 1 * N 1 + . . . . . . + ω m * N m ) ;
步骤(2.3)中,所述转移概率
Figure BDA00002848018400047
的计算方法如下:
p ( u k , v i ) = 1 / N j ;
其中,Nj代表具有属性类别j的所有节点的个数。
作为优选,步骤(2.6)中,相关性矩阵M1的计算方法如下:
M 1 = Σ k = 1 1 c ( 1 - c ) k P k ≠ 0
c为自定义参数,即访问接受率。
作为优选,所述的密度函数Di的计算方法如下:
D i = Σ j ∈ V f i j = Σ j ∈ V ( 1 - e - d 2 ( j , i ) / 2 δ 2 ) ;
其中,Di代表节点i被所有其他节点影响的总和;
影响度代表节点i被节点j影响的程度;
d(j,i)表示矩阵R1中j行i列的元素;
δ为自定义参数。
作为优选,步骤(3.6)中,所述属性权重的更新方法为 ω i t + 1 = 1 / 2 ( ω i t + Δω i t ) ;
其中,
Δω i t = Σ i = 1 m ω i * ( Σ p = 1 m entropy p - entropy i ) / Σ p = 1 m entropy p ;
entropy i = ω i * Σ j = 1 k ( | V j | / | V | * entropy ( a i , V j ) ) ;
entropy ( a i , V j ) = - Σ n = 1 n i ( p ijn * log 2 p ijn ) ;
pijn代表属性值ain在集合Vj中的比例;
ain代表属性类别为ai的第n个属性值。
作为优选,步骤(3.6)中,比较聚类中心是否发生改变通过聚类目标函数是否收敛进行判断,目标函数代表聚类的评估函数,显示和描述聚类的效果,其中目标函数为
E = Σ i = 1 k e ( V i ) - Σ i = 1 , j = 1 , i ≠ j k e ( V i , V j ) , 其中 e ( V i ) = Σ m ∈ V i , n ∈ V i , m ≠ n ( d ( m , n ) d ( n , m ) ) / 2 | V i | ,
e ( V i , V j ) = Σ m ∈ V i , n ∈ V j ( d ( m , n ) + d ( n , m ) ) / ( | V i | + | V j | ) .
d(m,n)表示矩阵R1中m行n列的元素;
d(n,m)表示矩阵R1中n行m列的元素;
目标是最大化集群内的有效关系,即
Figure BDA00002848018400059
最小化集群间的关系,即 Σ i = 1 , j = 1 , i ≠ j k e ( V i , V j ) .
本发明还提出自适应的聚类算法过程。通过只修改部分受影响节点之间的距离,避免所有数据重新计算的过程,改善变化的环境对聚类过程的影响程度。而传统的静态聚类方法并不能对动态数据进行有效的处理。
当社会化网络图中的信息发生改变时,在增广网络图中体现为在两个节点之间形成一条边或者更改节点的属性;而当节点的属性发生变化的时候,相当于在普通节点和属性节点之间形成一条边。因此社会化网络图中的信息发生改变相当于在增广网络图中节点Vi和节点Vj之间添加一条边。
此处节点包括普通节点和属性节点。
作为优选,当节点Vi和节点Vj之间添加一条边时,进行如下操作:
(a)把与节点Vi直接相连的普通节点以及属性节点添加到新的集合
Figure BDA00002848018400061
中,同时把与节点Vj直接相连的普通节点以及属性节点添加到集合
Figure BDA00002848018400062
并记该步为step=1;
(b)按照步骤(2.1)~(2.5)的方法,修改节点Vi到集合
Figure BDA00002848018400063
中的节点的转移概率值,同时修改节点Vj到集合
Figure BDA00002848018400064
中的节点的转移概率;
(c)计算step=2,……,l,选择每一步受影响的节点的集合,并修改相应的转移概率,直到修改完所有受影响的转移概率,最后产生一个新的距离矩阵稀疏矩阵R1,其中l为自定义参数;
(d)重新计算密度函数Di,并对受到影响的节点重新分配聚类集合;
(e)更新聚类中心,如果聚类中心没有发生变化,聚类过程结束;否则,重新进行步骤(3)中的(3.3)~(3.6)的过程,输出新的n个聚类集合。
同现有技术相比,本发明的有益效果体现在:根据节点属性和拓扑结构关系提出了统一距离估算模型,聚类方法更加全面合理;提出了基于十字链表的稀疏矩阵计算和存储优化方法,提高了本聚类方法的性能;提出了自适应的聚类方法。避免了不断变化的网络对聚类方法造成大量重复计算以及不能实时更新聚类结果的问题。
附图说明
图1是本发明的聚类方法的算法流程图;
图2是本发明的有向社会化网络图;
图3是统一概率转移模型的概率矩阵P;
图4是L=2下的统一距离估算模型的稀疏矩阵Rl
具体实施方式
采用本发明本提供的大型社交网络图中基于节点属性及拓扑结构的图聚类方法,把节点聚类成紧密连接并且节点属性相似度高的群组。算法的流程如图1所示。具体的实施步骤如下:
第一步,初始化每个属性类别的权重(ω12,……,ωm)和结构关系的权重ω0为初始值1。其中初始的网络图结构如图2。
第二步,根据社交网络图中节点之间的相似性建立统一距离估算模型。首先在原社交网络图中添加属性节点,属性节点的Label为属性值的Label,如图1中的属性节点JAVA、XML和ORANGE、APPLE。同时计算转移概率内容如下,根据马尔科夫链模型和转移概率模型计算转移概率统一估算模型P,如图3。
其中左上角PV为网络关系结构的概率矩阵,代表节点直接通过连接边可访问到另一个节点的概率;右上角A为普通节点到属性节点的转移概率矩阵;左下角B为属性节点到普通节点的概率矩阵;右下角为零矩阵。另外,该评估模型的指数次模型Pl,可用以描述节点i到节点j之间路径长度在1到l之间的转移概率矩阵。
接着,第二步根据随机漫步模型计算节点间访问概率相关性矩阵M=c(1-c)P,其中P为概率矩阵,
Figure BDA00002848018400071
同时计算矩阵RL。如设定随机漫步长度L=2,c=1,则距离矩阵结果为,如图4:。
第三步,设定聚类集群个数为3个,计算初始聚类中心得初始中心节点为ID=6,7,8的节点。同时,分配所有节点到聚类中心中,密度函数参数δ=10。可以得到第一次分配的结果为:
Figure BDA00002848018400072
第四步,更新聚类中心节点并更新属性权重,重复迭代进行上述方法的聚类过程。根据上述方法,可以得到第一轮迭代到第二轮迭代聚类中心的变化为从6,7,8变为了2,9,14;而属性权重的变化为从computer:1.0,fruit:1.0变为了computer:0.783,fruit:1.217。根据迭代过程不断对聚类结果进行判定和重新安排,使得目标函数趋于收敛。根据网络图的差异,可能会出现多次迭代后仍然有更优解的情况,即聚类过程仍然没有达到收敛,在上述参数的条件下聚类3轮后收敛,结果为:
Figure BDA00002848018400081
当然如果情况并不是理想的聚类结果,通过调整参数值,可以找到更优的解。
第五步,在不断变化的社交网络环境中,面对网络图可能变化的聚类环境时,传统的静态聚类方法并不能对动态数据进行有效的处理。自适应方法的步骤如下:
a)假设节点1和节点2添加一条有向边,从节点1指向节点2,则在L=3的情况下,需要首先更新概率转移模型中从节点1出发的概率,即所有从节点1出发到节点2,4,16,17记为集合C1的转移概率都变为0.25,
b)开始计算step=2,……,l,选择每一步受影响的节点的集合,并修改相应的转移概率。如step=2时,修改节点1到节点1,2,4,5,6,7,9,12,14,15,16,17,18的概率,以及节点4到节点2的概率。每一步修改直接通过step数可访问的普通节点和属性节点的转移概率。直到修改完所有受影响的转移概率,最后产生一个新的距离矩阵。由于例子中的节点跟属性关系比较稠密,使得通过step=2可访问的节点个数较多,修改的概率的扩散度也比较大,但是因为只需要修改从节点1出发的节点的转移概率,使得即使需要重新计算所有从1出发到任何节点的转移概率,修改的比例跟重新计算所有概率相比也是微乎其微的。在L=3的情况下,所有需要修改的概率为:
step=1时,节点1可通过一步就可访问的节点集合C1=2,4,16,17的概率;
step=2时,节点1通过两步可访节点C2的概率以及节点4,16,17到2,4,16,17的概率;
step=3时,节点1通过三步可访问节点C3的概率以及节点4,16,17到集合C2的概率以及节点1,2,4,5,6,7,9,12,14到集合C1的概率;
d)重新计算3)的d)中的受影响的节点的密度函数,并给受影响节点重新分配聚类集合;
e)更新聚类中心,如果聚类中心没有发生变化,聚类过程结束;否则,重新进行3)中e)到i)过程进行聚类,直到聚类结束。
最后通过5轮迭代收敛的聚类结果为:
Figure BDA00002848018400091
本发明根据节点属性和拓扑结构关系提出了统一距离估算模型,聚类方法更加全面合理。

Claims (7)

1.一种同时基于节点属性以及结构关系相似度的聚类方法,其特征在于,包括以下步骤:
(1)以社会化网络图中的每一个实体为基础创建一个普通节点,提取各个实体的属性信息创建属性节点,以各个实体之间的关系为基础创建结构关系,得到增广网络图;
其中,属性节点包括属性类别和属性值;
定义每个类别的属性节点的权重为ω1,ω2……,ωm
定义结构关系的权重为ω0
(2)根据步骤(1)得到的增广网络图中节点之间的相似性建立统一距离估算模型,包括如下步骤:
(2.1)根据每个属性节点的权重以及结构关系的权重,得到普通节点Vi到普通节点Vj之间通过结构关系的转移概率
Figure FDA00002848018300011
所有的转移概率组成矩阵Pv
普通节点Vi和普通节点Vj分别代表任意两个不同的普通节点;
(2.2)根据每个属性节点的权重以及结构关系的权重,得到普通节点Vi与属性值为k的属性节点Uk之间的转移概率
Figure FDA00002848018300013
所有的转移概率
Figure FDA00002848018300014
组成矩阵A;
(2.3)根据每个属性节点与普通节点之间的关系,得到属性值为k的属性节点Uk与普通节点Vi的转移概率
Figure FDA00002848018300015
所有的转移概率
Figure FDA00002848018300016
组成矩阵B;
(2.4)根据马尔科夫链模型,定义网络图中每一个节点到所有跟它连接的节点之间的转移概率之和为1;
同时设置过滤度f=1%,如果两个节点之间的转移概率低于过滤度f,则直接把两节点间转移概率设为0;
(2.5)由所述的矩阵Pv、矩阵A和矩阵B,得到概率矩阵P;
概率矩阵P为 P V A B 0 , 其中0为零矩阵;
(2.6)根据随机漫步模型由概率矩阵P得到节点间访问概率的相关性矩阵M1,然后由相关性矩阵M1得到稀疏矩阵R1
其中Rl中每一个元素为相关性矩阵M1中相应位置元素的倒数;
(2.7)由所述的稀疏矩阵R1得到每个节点的密度函数Di
所述的节点包括普通节点和属性节点;
(3)获得聚类集合,包括如下步骤:
(3.1)输入一个带节点属性的社会化网络图、两节点之间随机访问的长度限制l、访问接受率c,参数δ以及待输出聚类的个数n;
(3.2)初始化属性以及结构关系的权重ω01=……=ωm=1.0;
(3.3)按照密度函数Di由大到小的顺序对所有节点进行排序,然后取前n个节点作为聚类中心;
(3.4)把每个增广网络图中的节点分配到离自己最近的聚类中心的集群中;
(3.5)根据重新投票机制选择新的聚类中心;
(3.6)根据熵值分布更新属性权重,同时比较聚类中心是否发生改变,若聚类中心不发生改变,将得到的n个聚类集合作为最终结果输出;如发生改变,则回到步骤(3.3)。
2.根据权利要求1所述的同时基于节点属性以及结构关系相似度的聚类方法,其特征在于,步骤(2.1)中,所述的转移概率
Figure FDA00002848018300022
的计算方法如下:
p ( v i , v j ) = ω 0 / ( ω 0 * N 0 + ω 1 * N 1 + . . . . . . + ω m * N m ) ;
其中,Ni(i=1~m)代表具有属性类别i的所有节点与节点Vi之间存在的关系的总数;
Ni(i=0)代表与节点Vi(起始点)直接相连的普通节点的总数;
步骤(2.2)中,所述的转移概率
Figure FDA00002848018300024
的计算方法如下:
p ( v i , u k ) = ω j / ( ω 0 * N 0 + ω 1 * N 1 + . . . . . . + ω m * N m ) ;
步骤(2.3)中,所述转移概率
Figure FDA00002848018300026
的计算方法如下:
p ( u k , v i ) = 1 / N j ;
其中,Nj代表具有属性类别j的所有节点的个数。
3.根据权利要求1所述的同时基于节点属性以及结构关系相似度的聚类方法,其特征在于,步骤(2.6)中,相关性矩阵M1的计算方法如下:
M 1 = Σ k = 1 1 c ( 1 - c ) k P k ≠ 0
c为自定义参数,即访问接受率。
4.根据权利要求1所述的同时基于节点属性以及结构关系相似度的聚类方法,其特征在于,步骤(2.7)中,所述的密度函数di的计算方法如下:
D i = Σ j ∈ V f i j = Σ j ∈ V ( 1 - e - d 2 ( j , i ) / 2 δ 2 ) ;
其中,Di代表节点i被所有其他节点影响的总和;
影响度
Figure FDA00002848018300034
代表节点i被节点j影响的程度;
d(j,i)表示矩阵R1中j行i列的元素;
δ为自定义参数。
5.根据权利要求1所述的同时基于节点属性以及结构关系相似度的聚类方法,其特征在于,步骤(3.5)中,所述的新的聚类中心的选取的方法如下:
选取同一集群中到所有其他节点的距离之和跟集群中每一个节点到其他节点之和的平均值最接近的节点作为新的聚类中心;即 C t + 1 = min ( | Sum i V - Sum j ∈ v V ‾ ) , 其中 Sum i V = Σ j ∈ V d ( i , j ) .
6.根据权利要求1所述的同时基于节点属性以及结构关系相似度的聚类方法,其特征在于,步骤(3.6)中,所述属性权重的更新方法为 ω i t + 1 = 1 / 2 ( ω i t + Δω i t ) ;
其中,
Δω i t = Σ i = 1 m ω i * ( Σ p = 1 m entropy p - entropy i ) / Σ p = 1 m entropy p ;
entropy i = ω i * Σ j = 1 k ( | V j | / | V | * entropy ( a i , V j ) ) ;
entropy ( a i , V j ) = - Σ n = 1 n i ( p ijn * log 2 p ijn ) ;
pijn代表属性值ain在集合Vj中的比例;
ain代表属性类别为ai的第n个属性值。
7.根据权利要求1~6任一项所述的同时基于节点属性以及结构关系相似度的聚类方法,其特征在于,当节点Vi和节点Vj之间添加一条边时,进行如下操作:
(a)把与节点Vi直接相连的普通节点以及属性节点添加到新的集合
Figure FDA00002848018300042
中,同时把与节点Vi直接相连的普通节点以及属性节点添加到集合
Figure FDA00002848018300043
并记该步为step=1;
(b)按照步骤(2.1)~(2.5)的方法,修改节点Vi到集合中的节点的转移概率值,同时修改节点Vj到集合
Figure FDA00002848018300045
中的节点的转移概率;
(c)按照步骤(a)~(b)的方法,进行step=o的操作,选择每一步受影响的节点的集合,并修改相应的转移概率,直到修改完所有受影响的转移概率,最后产生一个新的距离矩阵稀疏矩阵R1,其中l为自定义参数;
o的取值依次为2~l,代表节点之间的访问距离;
(d)重新计算密度函数Di,并对受到影响的节点重新分配聚类集合;
(e)更新聚类中心,如果聚类中心没有发生变化,聚类过程结束;否则,重新进行步骤(3)中的(3.3)~(3.6)的过程,输出新的n个聚类集合。
CN201310055977.9A 2013-02-21 2013-02-21 一种同时基于节点属性以及结构关系相似度的聚类方法 Expired - Fee Related CN103106279B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310055977.9A CN103106279B (zh) 2013-02-21 2013-02-21 一种同时基于节点属性以及结构关系相似度的聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310055977.9A CN103106279B (zh) 2013-02-21 2013-02-21 一种同时基于节点属性以及结构关系相似度的聚类方法

Publications (2)

Publication Number Publication Date
CN103106279A true CN103106279A (zh) 2013-05-15
CN103106279B CN103106279B (zh) 2018-06-15

Family

ID=48314134

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310055977.9A Expired - Fee Related CN103106279B (zh) 2013-02-21 2013-02-21 一种同时基于节点属性以及结构关系相似度的聚类方法

Country Status (1)

Country Link
CN (1) CN103106279B (zh)

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103414583A (zh) * 2013-07-26 2013-11-27 浙江工业大学 一种低复杂度的网络平均路径优化方法
CN104008165A (zh) * 2014-05-29 2014-08-27 华东师范大学 一种基于网络拓扑结构和节点属性的社团检测方法
CN104021199A (zh) * 2014-06-16 2014-09-03 西安电子科技大学 基于节点支配能力相似性的功能模块检测方法
CN104035978A (zh) * 2014-05-26 2014-09-10 南京泰锐斯通信科技有限公司 社团发现方法及系统
CN104035983A (zh) * 2014-05-29 2014-09-10 西安理工大学 基于属性权重相似度的分类变量聚类方法
CN104052651A (zh) * 2014-06-03 2014-09-17 西安交通大学 一种建立社交组的方法和装置
CN104182386A (zh) * 2013-05-27 2014-12-03 华东师范大学 词对关系相似度的计算方法
CN104376015A (zh) * 2013-08-15 2015-02-25 腾讯科技(深圳)有限公司 关系网络中节点的处理方法及装置
CN106127246A (zh) * 2016-06-23 2016-11-16 金维度信息科技(北京)有限公司 一种泛相关稀疏矩阵空间的信息融合与自适应匹配方法
CN106339395A (zh) * 2015-07-08 2017-01-18 Tcl集团股份有限公司 一种视频推荐的方法、系统及电子设备
CN107222394A (zh) * 2017-06-16 2017-09-29 上海斐讯数据通信技术有限公司 一种社交网络的用户访问控制方法及系统
CN107346517A (zh) * 2016-05-05 2017-11-14 腾讯科技(深圳)有限公司 用户关系网络中的用户交互参数获取方法及获取装置
CN107430633A (zh) * 2015-11-03 2017-12-01 慧与发展有限责任合伙企业 与数据存储系统相关联的经相关优化的代表性内容
CN107786943A (zh) * 2017-11-15 2018-03-09 北京腾云天下科技有限公司 一种用户分群方法及计算设备
CN108090326A (zh) * 2018-02-09 2018-05-29 国家卫生计生委科学技术研究所 单细胞网络调控关系的构建方法
CN108235359A (zh) * 2016-12-22 2018-06-29 上海掌门科技有限公司 一种用于确定与无线连接相关的属性信息的方法与设备
CN109543712A (zh) * 2018-10-16 2019-03-29 哈尔滨工业大学 时态数据集上的实体识别方法
CN109711478A (zh) * 2018-12-29 2019-05-03 中山大学 一种基于时序密度聚类的大规模数据群组搜索方法
CN109905399A (zh) * 2019-03-14 2019-06-18 哈尔滨工程大学 一种基于自我网络结构演化的社交媒体个体异常用户检测方法
US10586347B1 (en) 2018-09-17 2020-03-10 Datalog, LLC Log scaling system and related methods
CN110874607A (zh) * 2018-08-31 2020-03-10 浙江大学 一种网络节点的聚类方法及装置
CN111492632A (zh) * 2017-12-22 2020-08-04 瑞典爱立信有限公司 用于预测网络节点的状态改变的系统和方法
CN111598335A (zh) * 2020-05-15 2020-08-28 长春理工大学 一种基于改进谱聚类算法的交通区域划分方法
CN112836063A (zh) * 2021-01-27 2021-05-25 四川新网银行股份有限公司 一种实现特征溯源的方法
CN113516105A (zh) * 2021-09-07 2021-10-19 腾讯科技(深圳)有限公司 一种车道检测方法、装置及计算机可读存储介质
CN117292162A (zh) * 2023-11-27 2023-12-26 烟台大学 一种多视图图像聚类的目标跟踪方法、系统、设备及介质
CN117407739A (zh) * 2023-09-13 2024-01-16 大连理工大学 一种基于图嵌入的动态权重节点聚类方法
CN117407739B (zh) * 2023-09-13 2024-05-07 大连理工大学 一种基于图嵌入的动态权重节点聚类方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101931638A (zh) * 2009-06-25 2010-12-29 李冰 一种建立向互联网用户推荐数据内容服务的方法
CN102662974A (zh) * 2012-03-12 2012-09-12 浙江大学 一种基于邻接节点树的网络图索引方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101931638A (zh) * 2009-06-25 2010-12-29 李冰 一种建立向互联网用户推荐数据内容服务的方法
CN102662974A (zh) * 2012-03-12 2012-09-12 浙江大学 一种基于邻接节点树的网络图索引方法

Cited By (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104182386A (zh) * 2013-05-27 2014-12-03 华东师范大学 词对关系相似度的计算方法
CN103414583B (zh) * 2013-07-26 2016-06-15 浙江工业大学 一种低复杂度的网络平均路径优化方法
CN103414583A (zh) * 2013-07-26 2013-11-27 浙江工业大学 一种低复杂度的网络平均路径优化方法
US10169386B2 (en) 2013-08-15 2019-01-01 Tencent Technology (Shenzhen) Company Limited Devices and methods for processing network nodes
CN104376015B (zh) * 2013-08-15 2020-03-17 腾讯科技(深圳)有限公司 关系网络中节点的处理方法及装置
CN104376015A (zh) * 2013-08-15 2015-02-25 腾讯科技(深圳)有限公司 关系网络中节点的处理方法及装置
CN104035978A (zh) * 2014-05-26 2014-09-10 南京泰锐斯通信科技有限公司 社团发现方法及系统
CN104035978B (zh) * 2014-05-26 2017-06-30 南京泰锐斯通信科技有限公司 社团发现方法及系统
CN104035983A (zh) * 2014-05-29 2014-09-10 西安理工大学 基于属性权重相似度的分类变量聚类方法
CN104008165B (zh) * 2014-05-29 2017-05-24 华东师范大学 一种基于网络拓扑结构和节点属性的社团检测方法
CN104008165A (zh) * 2014-05-29 2014-08-27 华东师范大学 一种基于网络拓扑结构和节点属性的社团检测方法
CN104052651A (zh) * 2014-06-03 2014-09-17 西安交通大学 一种建立社交组的方法和装置
CN104052651B (zh) * 2014-06-03 2017-09-12 西安交通大学 一种建立社交组的方法和装置
CN104021199B (zh) * 2014-06-16 2017-04-19 西安电子科技大学 基于节点支配能力相似性的功能模块检测方法
CN104021199A (zh) * 2014-06-16 2014-09-03 西安电子科技大学 基于节点支配能力相似性的功能模块检测方法
CN106339395A (zh) * 2015-07-08 2017-01-18 Tcl集团股份有限公司 一种视频推荐的方法、系统及电子设备
CN107430633A (zh) * 2015-11-03 2017-12-01 慧与发展有限责任合伙企业 与数据存储系统相关联的经相关优化的代表性内容
CN107346517A (zh) * 2016-05-05 2017-11-14 腾讯科技(深圳)有限公司 用户关系网络中的用户交互参数获取方法及获取装置
CN106127246A (zh) * 2016-06-23 2016-11-16 金维度信息科技(北京)有限公司 一种泛相关稀疏矩阵空间的信息融合与自适应匹配方法
CN106127246B (zh) * 2016-06-23 2021-05-28 金维度信息科技(北京)有限公司 一种泛相关稀疏矩阵空间的信息融合与自适应匹配方法
CN108235359A (zh) * 2016-12-22 2018-06-29 上海掌门科技有限公司 一种用于确定与无线连接相关的属性信息的方法与设备
CN107222394A (zh) * 2017-06-16 2017-09-29 上海斐讯数据通信技术有限公司 一种社交网络的用户访问控制方法及系统
CN107222394B (zh) * 2017-06-16 2020-07-17 深圳量子云科技有限公司 一种社交网络的用户访问控制方法及系统
CN107786943B (zh) * 2017-11-15 2020-09-01 北京腾云天下科技有限公司 一种用户分群方法及计算设备
CN107786943A (zh) * 2017-11-15 2018-03-09 北京腾云天下科技有限公司 一种用户分群方法及计算设备
US11570238B2 (en) 2017-12-22 2023-01-31 Telefonaktiebolaget Lm Ericsson (Publ) System and method for predicting the state changes of network nodes
CN111492632B (zh) * 2017-12-22 2023-04-28 瑞典爱立信有限公司 用于预测网络节点的状态改变的系统和方法
CN111492632A (zh) * 2017-12-22 2020-08-04 瑞典爱立信有限公司 用于预测网络节点的状态改变的系统和方法
CN108090326A (zh) * 2018-02-09 2018-05-29 国家卫生计生委科学技术研究所 单细胞网络调控关系的构建方法
CN110874607A (zh) * 2018-08-31 2020-03-10 浙江大学 一种网络节点的聚类方法及装置
US10586347B1 (en) 2018-09-17 2020-03-10 Datalog, LLC Log scaling system and related methods
US11694138B2 (en) 2018-09-17 2023-07-04 Datalog, LLC Log scaling system and related methods
US10825192B2 (en) 2018-09-17 2020-11-03 Datalog, LLC Log scaling system and related methods
US11393120B2 (en) 2018-09-17 2022-07-19 Datalog, LLC Log scaling system and related methods
CN109543712A (zh) * 2018-10-16 2019-03-29 哈尔滨工业大学 时态数据集上的实体识别方法
CN109711478A (zh) * 2018-12-29 2019-05-03 中山大学 一种基于时序密度聚类的大规模数据群组搜索方法
CN109905399B (zh) * 2019-03-14 2021-06-01 哈尔滨工程大学 一种基于自我网络结构演化的社交媒体个体异常用户检测方法
CN109905399A (zh) * 2019-03-14 2019-06-18 哈尔滨工程大学 一种基于自我网络结构演化的社交媒体个体异常用户检测方法
CN111598335A (zh) * 2020-05-15 2020-08-28 长春理工大学 一种基于改进谱聚类算法的交通区域划分方法
CN112836063A (zh) * 2021-01-27 2021-05-25 四川新网银行股份有限公司 一种实现特征溯源的方法
CN113516105A (zh) * 2021-09-07 2021-10-19 腾讯科技(深圳)有限公司 一种车道检测方法、装置及计算机可读存储介质
CN113516105B (zh) * 2021-09-07 2021-12-17 腾讯科技(深圳)有限公司 一种车道检测方法、装置及计算机可读存储介质
CN117407739A (zh) * 2023-09-13 2024-01-16 大连理工大学 一种基于图嵌入的动态权重节点聚类方法
CN117407739B (zh) * 2023-09-13 2024-05-07 大连理工大学 一种基于图嵌入的动态权重节点聚类方法
CN117292162A (zh) * 2023-11-27 2023-12-26 烟台大学 一种多视图图像聚类的目标跟踪方法、系统、设备及介质
CN117292162B (zh) * 2023-11-27 2024-03-08 烟台大学 一种多视图图像聚类的目标跟踪方法、系统、设备及介质

Also Published As

Publication number Publication date
CN103106279B (zh) 2018-06-15

Similar Documents

Publication Publication Date Title
CN103106279A (zh) 一种同时基于节点属性以及结构关系相似度的聚类方法
CN107330115B (zh) 一种信息推荐方法及装置
CN108399748B (zh) 一种基于随机森林与聚类算法的道路旅行时间预测方法
Amiri et al. Community detection in complex networks: Multi–objective enhanced firefly algorithm
CN111881342A (zh) 一种基于图孪生网络的推荐方法
CN104298778B (zh) 一种基于关联规则树的轧钢产品质量的预测方法及系统
CN106022614A (zh) 一种基于最近邻聚类的神经网络数据挖掘方法
CN107103000A (zh) 一种基于关联规则与贝叶斯网络集成的推荐技术
Lin et al. Website reorganization using an ant colony system
CN112184391A (zh) 一种推荐模型的训练方法、介质、电子设备和推荐模型
CN103020163A (zh) 一种网络中基于节点相似度的网络社区划分方法
CN113779169B (zh) 时空数据流模型自增强方法
CN113780002A (zh) 基于图表示学习和深度强化学习的知识推理方法及装置
WO2023020257A1 (zh) 数据预测方法、装置及存储介质
CN106649731A (zh) 一种基于大规模属性网络的节点相似性搜索方法
CN106780067A (zh) 一种考虑节点局部标注特性的符号预测方法
CN103577899B (zh) 一种基于可靠性预测与QoS相结合的服务组合方法
Wang et al. An efficient bi-objective optimization workflow using the distributed quasi-Newton method and its application to well-location optimization
Wickman et al. A Generic Graph Sparsification Framework using Deep Reinforcement Learning
Oh et al. An economic feasibility assessment framework for underutilised crops using Support Vector Machine
US20220019925A1 (en) Architecture and method for providing insights in networks domain
Liu et al. An obsolescence forecasting method based on improved radial basis function neural network
Baker et al. Machine learning: factorization machines and normalized discounted cumulative gain for tourism recommender system optimisation
CN105761152A (zh) 社交网络中一种基于三元组的参与话题预测方法
CN115658971A (zh) 基于注意力机制的多层异质网络节点重要度评估方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180615

Termination date: 20190221

CF01 Termination of patent right due to non-payment of annual fee