CN106296425A - 基于带权重联合非负矩阵分解的属性图聚类方法及系统 - Google Patents

基于带权重联合非负矩阵分解的属性图聚类方法及系统 Download PDF

Info

Publication number
CN106296425A
CN106296425A CN201610630567.6A CN201610630567A CN106296425A CN 106296425 A CN106296425 A CN 106296425A CN 201610630567 A CN201610630567 A CN 201610630567A CN 106296425 A CN106296425 A CN 106296425A
Authority
CN
China
Prior art keywords
matrix
lambda
object function
function
attributed graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610630567.6A
Other languages
English (en)
Inventor
叶允明
王国瑞
徐晓飞
王岢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Graduate School Harbin Institute of Technology
Original Assignee
Shenzhen Graduate School Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Graduate School Harbin Institute of Technology filed Critical Shenzhen Graduate School Harbin Institute of Technology
Priority to CN201610630567.6A priority Critical patent/CN106296425A/zh
Publication of CN106296425A publication Critical patent/CN106296425A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Abstract

本发明提供了一种基于带权重联合非负矩阵分解的属性图聚类方法及系统,该属性图聚类方法包括构建融合拓扑关系与节点属性等特征统一目标函数及矩阵聚类:构建目标函数:该算法将拓扑关系和节点属性特征融合在统一目标函数中,并对每个属性特征进行加权;目标函数求解:通过对目标函数的求解,分解出包含拓扑关系和节点属性特征等信息的矩阵;矩阵聚类:对包含拓扑关系和节点属性特征等信息的矩阵进行聚类,然后把聚类后的结果返回给系统用户。本发明的有益效果是本发明的基于带权重联合非负矩阵分解的属性图聚类方法及系统,有效地融合了拓扑关系和节点属性等特征,并产生了更高的聚类性能。

Description

基于带权重联合非负矩阵分解的属性图聚类方法及系统
技术领域
本发明涉及基于社交网络的数据处理方法及系统,尤其涉及基于带权重联合非负矩阵分解的属性图聚类方法及系统。
背景技术
随着互联网技术的不断发展以及人们对社交需求的日益增长,微博、人人和QQ等网络社交媒体应用已经普遍流行于人们日常生活中,从而形成了大规模的网络社区。图挖掘是从海量社会网络数据获取有用信息的一个重要手段,而如何为用户返回对用户有实用价值的结果,是图挖掘发展和吸引用户的一个重要决定因素。
图挖掘的目的是把具有较强联系的节点划分到同一个簇中,而把联系较弱的节点划分到不同的簇中。在现实社会网络中,节点间除了具有拓扑关系,大部分情况下节点自身也带有属性特征。针对该类社会网络的挖掘,通常称为属性图聚类,因此可以将社会网络挖掘问题转化为属性图聚类问题。
属性图聚类是一种机器学习任务:图的节点之间的拓扑关系与节点自身属性作为输入,生成一个同时考虑这两部分特征的聚类结果作为输出。属性图聚类的提出在广告投放、社区探测和个性化推荐等领域都引起研究工作者的兴趣与深入研究。研究人员在研究社会网络中发掘各种新问题新技术并在历届的数据挖掘相关会议上发表探讨,近些年来,属性图聚类成为一个热门的研究问题。
但是,目前技术在属性图聚类中缺乏基于非负矩阵分解的相关聚类方法。
发明内容
为了解决现有技术中的问题,本发明提供了一种带权重联合非负矩阵分解的属性图聚类方法及系统。
本发明提供了一种带权重联合非负矩阵分解的属性图聚类方法,包括如下步骤:
构建目标函数:给定一个属性图,根据属性图的拓扑关系与节点属性特征设计一个统一的目标函数,使用对称非负矩阵去逼近拓扑关系的邻接矩阵,对节点属性矩阵进行加权,并使用传统非负矩阵分解去逼近加权后的节点属性矩阵,然后将这两部分融合在统一的目标函数中;
目标函数求解:根据构建的目标函数,对函数进行迭代求解,直至收敛,其中能够分解出一个包含拓扑关系与节点属性等信息的矩阵;
矩阵聚类:根据目标函数求解得到的包含拓扑关系与节点属性等信息的矩阵,对其进行聚类,把聚类结果提供给系统用户。
作为本发明的进一步改进,在所述构建目标函数步骤中,首先给定一个具有n个节点与m个属性特征的单属性图G=(V,E,A),假设这n个节点之间拓扑关系的邻接矩阵为它们的m个不同的属性特征组成的属性矩阵为其中表示非负实数集。然后给定两个矩阵分解因子其中k表示聚类簇的数目。与此同时,为了对这m个不同的属性赋予不同的权重,这里提供一个对角矩阵来对不同的属性进行加权。接着就可以得到两个近似函数,S≈VVT和AΛ≈VUT,其中第一个近似函数表示对邻接矩阵进行逼近,第二个近似函数表示对加权的属性矩阵进行逼近。最后提供一个平衡因子来对这两个特征维度进行融合,就得到了一个新的目标函数:
m i n U , V , Λ ≥ 0 1 2 ( | | S - VV T | | F 2 + λ · | | A Λ - VU T | | F 2 ) .
作为本发明的进一步改进,在所述目标函数求解步骤中,首先将目标函数表示成矩阵迹函数的形式:
J = 1 2 T r [ ( S - VV T ) ( S - VV T ) T ] + λ 2 · T r [ ( A Λ - VU T ) ( A Λ - VU T ) T ] = 1 2 [ T r ( SS T ) + T r ( VV T VV T ) - 2 · T r ( SVV T ) ] + λ 2 · [ T r ( AΛ 2 A T ) + T r ( VU T UV T ) - 2 · T r ( AΛUV T ) ]
其中Tr(·)表示矩阵的迹函数。为了上述的目标函数进行优化,这里采用拉格朗日乘子法对它进行优化。首先引入三个拉格朗日乘子矩阵:α、β和γ,它们分别对应矩阵分解因子V、矩阵分解因子U以及权重对角阵Λ的非负约束。然后就可以构造形式如下的拉格朗日函数:
L=J+Tr(αV)+Tr(βU)+Tr(γΛ)
对上述拉格朗日函数分别求对矩阵分解因子V、矩阵分解因子U以及权重对角阵Λ的导数,推导出这几个矩阵的迭代公式。根据迭代公式,对目标函数进行迭代,直至收敛,其中矩阵分解因子V包含了拓扑关系与节点属性特征等信息。
作为本发明的进一步改进,在所述矩阵聚类步骤中,针对通过联合矩阵分解而得到的包含拓扑关系与节点属性特征信息的矩阵V进行聚类,并将聚类后的结果返回给系统用户。
本发明还公开了一种基于带权重联合非负矩阵分解的属性图聚类系统,包括:
构建目标函数模块:用于给定一个属性图,根据属性图的拓扑关系与节点属性特征设计一个统一的目标函数,使用对称非负矩阵去逼近拓扑关系的邻接矩阵,对节点属性矩阵进行加权,并使用传统非负矩阵分解去逼近加权后的节点属性矩阵,然后将这两部分融合在统一的目标函数中;
目标函数求解模块:用于根据构建的目标函数,对函数进行迭代求解,直至收敛,其中能够分解出一个包含拓扑关系与节点属性等信息的矩阵;
矩阵聚类模块:用于根据目标函数求解得到的包含拓扑关系与节点属性等信息的矩阵,对其进行聚类,把聚类结果提供给系统用户。
作为本发明的进一步改进,在所述构建目标函数模块中,首先给定一个具有n个节点与m个属性特征的单属性图G=(V,E,A),假设这n个节点之间拓扑关系的邻接矩阵为它们的m个不同的属性特征组成的属性矩阵为其中表示非负实数集。然后给定两个矩阵分解因子其中k表示聚类簇的数目。与此同时,为了对这m个不同的属性赋予不同的权重,这里提供一个对角矩阵来对不同的属性进行加权。接着就可以得到两个近似函数,S≈VVT和AΛ≈VUT,其中第一个近似函数表示对邻接矩阵进行逼近,第二个近似函数表示对加权的属性矩阵进行逼近。最后提供一个平衡因子来对这两个特征维度进行融合,就得到了一个新的目标函数:
m i n U , V , Λ ≥ 0 1 2 ( | | S - VV T | | F 2 + λ · | | A Λ - VU T | | F 2 ) .
作为本发明的进一步改进,在所述目标函数求解模块中,首先将目标函数表示成矩阵迹函数的形式:
J = 1 2 T r [ ( S - VV T ) ( S - VV T ) T ] + λ 2 · T r [ ( A Λ - VU T ) ( A Λ - VU T ) T ] = 1 2 [ T r ( SS T ) + T r ( VV T VV T ) - 2 · T r ( SVV T ) ] + λ 2 · [ T r ( AΛ 2 A T ) + T r ( VU T UV T ) - 2 · T r ( AΛUV T ) ]
其中Tr(·)表示矩阵的迹函数。为了上述的目标函数进行优化,这里采用拉格朗日乘子法对它进行优化。首先引入三个拉格朗日乘子矩阵:α、β和γ,它们分别对应矩阵分解因子V、矩阵分解因子U以及权重对角阵Λ的非负约束。然后就可以构造形式如下的拉格朗日函数:
L=J+Tr(αV)+Tr(βU)+Tr(γΛ)
对上述拉格朗日函数分别求对矩阵分解因子V、矩阵分解因子U以及权重对角阵Λ的导数,推导出这几个矩阵的迭代公式。根据迭代公式,对目标函数进行迭代,直至收敛,其中矩阵分解因子V包含了拓扑关系与节点属性特征等信息。
作为本发明的进一步改进,在所述矩阵聚类模块中,针对通过联合矩阵分解而得到的包含拓扑关系与节点属性特征信息的矩阵V进行聚类,并将聚类后的结果返回给系统用户。
作为本发明的进一步改进,该属性图聚类系统采用联合非负矩阵分解框架设计,采用对称非负矩阵分解对邻接矩阵进行逼近,采用传统非负矩阵分解对加权后的属性矩阵进行逼近,然后对包含拓扑关系和节点属性特征信息的矩阵进行聚类。
作为本发明的进一步改进,分解出包含拓扑关系和节点属性特征信息的矩阵,对其进行聚类,返回聚类结果。
本发明的有益效果是:本发明的基于带权重联合非负矩阵分解的属性图聚类方法及系统,使用基于非负矩阵分解的相关聚类方法对属性图进行聚类,有效地融合了拓扑关系和节点属性等特征,并产生了更高的聚类性能。
附图说明
图1是本发明的属性图聚类方法的流程图。
图2是本发明的原始数据示意图。
图3是本发明的构建目标函数示意图。
图4为本发明的模块图。
图5为本发明的构建目标函数流程图。
图6为本发明的目标函数求解流程图。
具体实施方式
如图1所示,本发明公开了一种基于带权重联合非负矩阵分解的属性图聚类方法,包括如下步骤:
100构建目标函数:针对输入的属性图,根据图中节点之间拓扑关系与节点属性构建相应的矩阵,对每个矩阵进行矩阵分解,并将它们融合在统一的目标函数中。
具体实施过程如下:基于带权重联合非负矩阵分解的属性图算法的主要思想是,对于给定的属性图,根据邻接矩阵与属性矩阵,可以得到一个使用非负矩阵分解融合这两部分的统一目标函数。在属性图聚类时,要同时考虑拓扑结构与属性特征,即子图的紧密度较高并且节点属性相似度较高。
在一个属性图中,节点之间的拓扑关系组成一个邻接矩阵,节点自身属性特征组成一个属性矩阵,如图2,其中sij表示在第i个节点与j个节点之间是否存在连接关系,表示第i个节点的低j个属性的取值,n为节点数目,m为属性数目。图3为根据邻接矩阵和属性矩阵,构建目标函数的示意图。图中表示对属性矩阵进行加权的对角阵,矩阵是用来对邻接矩阵属性矩阵进行分解的因子,其中S≈VVT和AΛ≈VUT,k表示聚类簇数目,n为节点数目,m为属性数目。然后构建统一目标函数为调节两个矩阵分解部分的参数。由于用户需要考虑拓扑关系和节点属性两方面信息的聚类结果,目标优化是使得上述目标函数达到逼近误差最小。本文发明实施过程,为了统一拓扑关系与节点属性的量纲,需要对邻接矩阵与属性矩阵进行归一化处理,归一化方法可表示为:
S = S Σ a = 1 n Σ b = 1 n S a , b
A = A Σ a = 1 n Σ b = 1 n A a , b
公式中,n为节点数目,m为属性数目。
101目标函数求解:目标函数求解是本发明中最重要的一步.目标函数求解的目的是对图3中描述的目标函数进行求解,解出相关矩阵的迭代公式,本发明采用的是拉格朗日乘子法对目标函数进行求解。
具体实施过程如下:目标函数求解的目的是对目标函数进行迭代以达到逼近误差最小,拉格朗日乘子法和随机梯度下降法是常用的办法。拉格朗日乘子法有计算方便,简单易用等优点。因此,本发明实施中采用拉格朗日乘子法对目标函数进行求解。首先将目标函数表示成矩阵迹函数的形式,就得到了如下迹函数表示的目标函数:
J = 1 2 T r [ ( S - VV T ) ( S - VV T ) T ] + λ 2 · T r [ ( A Λ - VU T ) ( A Λ - VU T ) T ] = 1 2 [ T r ( SS T ) + T r ( VV T VV T ) - 2 · T r ( SVV T ) ] + λ 2 · [ T r ( AΛ 2 A T ) + T r ( VU T UV T ) - 2 · T r ( AΛUV T ) ]
其中Tr(·)表示矩阵的迹函数。为了上述公式的目标函数进行优化,这里采用拉格朗日乘子法对它进行优化。首先引入三个拉格朗日乘子矩阵:α、β和γ,它们分别对应矩阵分解因子V、矩阵分解因子U以及权重对角阵Λ的非负约束。然后就可以构造形式如下的拉格朗日函数:
L=J+Tr(αTV)+Tr(βTU)+Tr(γTΛ)
接下来,分别求函数L对矩阵分解因子V、矩阵分解因子U以及权重对角阵Λ的偏导数:
∂ L ∂ V = - ( S V + S T V + λ · A Λ U ) + ( 2 VV T V + λ · VU T U + α )
∂ L ∂ U = - λ · V T A Λ + λ · V T VU T + β
∂ L ∂ Λ = - λ · A T VU T + λ · A T A Λ + γ
根据Karush-Kuhn-Tucker(KKT)条件,很明显可以得出如下结果:对于和αi,jVi,j=0。类似地,也可以得到和βi,jUi,j=0,以及和γi,jΛi,j=0。根据这些条件,就可以推导出如下关于矩阵分解因子V、矩阵分解因子U以及权重对角阵Λ的迭代公式:
V i , j → V i , j ( S V + S T V + λ · A Λ U ) i , j ( 2 VV T V + λ · VU T U ) i , j
U i , j ← U i , j ( V T A Λ ) i , j ( V T VU T ) i , j
Λ i , j ← Λ i , j ( A T VU T ) i , j ( A T A Λ ) i , j
很明显,通过上述的迭代方式,这几个矩阵仍然是非负的。另外,在每次迭代过程中,都对属性权重对角阵Λ进行归一化,归一化方法如下:
Λ = Λ Σ i = 1 m Λ i , i
经拉格朗日乘子法求解与经梯度下降法求解具有相同的效力,每次迭代的前进方向是由其梯度相反方向决定,使得每次迭代都能使目标函数逐步收敛,直到满足算法结束条件,算法终止。
102矩阵聚类:即根据101步骤中迭代生成的包含拓扑关系与节点属性特征信息的矩阵V进行聚类,然后把聚类结果返回给系统用户。
具体实施过程如下:在矩阵聚类步骤中,本发明采用K-Means或其他聚类方法,对矩阵进行聚类,然后返回聚类结果C1,K,Ck,其中n表示节点数目,k表示聚类簇数目。
在本发明中还构建一种基于带权重联合非负矩阵分解的属性图聚类系统,包括三个模块,包括构建目标函数模块,目标函数求解模块,矩阵聚类模块三部分。所述构建目标函数模块是根据输入的属性图的拓扑关系与节点属性,分别用相应的非负矩阵分解方法对其进行逼近,然后将两部分非负矩阵分解内容融合到一个统一的目标函数中。所述目标函数求解模块是根据目标函数,采用拉格朗日乘子法或随机梯度下降法,解出相关矩阵的迭代公式。所述矩阵聚类模块是根据目标函数求解得到的包含拓扑关系与节点属性特征信息的矩阵,对其进行聚类,然后把聚类结果返回给系统用户。
具体实施过程如下:该属性图聚类系统采用联合非负矩阵分解框架设计,图4为系统模块框图,系统分为三个模块,包括包括构建目标函数模块,目标函数求解模块和矩阵聚类模块。
在构建目标函数模块中,系统为该模块设计了一个能够对节点属性部分进行加权,并且能够融合拓扑关系和节点属性特征信息的联合非负矩阵分解模型。如图5,系统为将该模块涉及的非负矩阵分解部分融合在一起,提供了一个调节参数λ,并对节点属性部分进行加权。
在目标函数求解模块中,系统为该模块设计了一个迭代的流程,如图6。系统为参与联合非负矩阵分解的各个待求解矩阵提供一个迭代方式,该迭代方式是并行执行的。每一轮迭代过程中,都将对所需求解的矩阵进行更新。在图6中,如下公式的含义为:更新权重对角阵(推导过程见101目标函数求解);公式含义为:对节点的各个属性的权重作归一化处理,使其始终落在同一区间内。V、U两个矩阵的迭代方法也是类似的,只不过不需要归一化。
在矩阵聚类模块中,系统采用常见的聚类算法如K-Means等,对包含拓扑关系与节点属性特征信息的矩阵进行聚类。
本发明的提出了一种基于带权重联合非负矩阵分解的属性图聚类方法及系统。系统设计部分可分为三个模块:目标函数模块,目标函数求解模块,矩阵聚类模块。本发明的基于带权重联合非负矩阵分解的属性图聚类方法及系统,将属性图聚类问题转化为非负矩阵分解求解问题和一般矩阵聚类问题,可以有效地提高属性图聚类的质量。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (10)

1.一种基于带权重联合非负矩阵分解的属性图聚类方法,其特征在于,包括如下步骤:
构建目标函数:给定一个属性图,根据属性图的拓扑关系与节点属性特征设计一个统一的目标函数,使用对称非负矩阵去逼近拓扑关系的邻接矩阵,对节点属性矩阵进行加权,并使用传统非负矩阵分解去逼近加权后的节点属性矩阵,然后将这两部分融合在统一的目标函数中;
目标函数求解:根据构建的目标函数,对函数进行迭代求解,直至收敛,其中能够分解出一个包含拓扑关系与节点属性等信息的矩阵;
矩阵聚类:根据目标函数求解得到的包含拓扑关系与节点属性等信息的矩阵,对其进行聚类,把聚类结果提供给系统用户。
2.根据权利要求1所述的属性图聚类方法,其特征在于:在所述构建目标函数步骤中,首先给定一个具有n个节点与m个属性特征的单属性图G=(V,E,A),假设这n个节点之间拓扑关系的邻接矩阵为它们的m个不同的属性特征组成的属性矩阵为其中表示非负实数集;然后给定两个矩阵分解因子其中k表示聚类簇的数目;与此同时,为了对这m个不同的属性赋予不同的权重,这里提供一个对角矩阵来对不同的属性进行加权;接着就可以得到两个近似函数,S≈VVT和AΛ≈VUT,其中第一个近似函数表示对邻接矩阵进行逼近,第二个近似函数表示对加权的属性矩阵进行逼近;最后提供一个平衡因子来对这两个特征维度进行融合,就得到了一个新的目标函数:
m i n U , V , Λ ≥ 0 1 2 ( | | S - VV T | | F 2 + λ · | | A Λ - VU T | | F 2 ) .
3.根据权利要求1所述的属性图聚类方法,其特征在于:在所述目标函数求解步骤中,首先将目标函数表示成矩阵迹函数的形式:
J = 1 2 T r [ ( S - VV T ) ( S - VV T ) T ] + λ 2 · T r [ ( A Λ - VU T ) ( A Λ - VU T ) T ] = 1 2 [ T r ( SS T ) + T r ( VV T VV T ) - 2 · T r ( SVV T ) ] + λ 2 · [ T r ( AΛ 2 A T ) + T r ( VU T UV T ) - 2 · T r ( AΛUV T ) ]
其中Tr(·)表示矩阵的迹函数,为了上述的目标函数进行优化,这里采用拉格朗日乘子法对它进行优化,首先引入三个拉格朗日乘子矩阵:α、β和γ,它们分别对应矩阵分解因子V、矩阵分解因子U以及权重对角阵Λ的非负约束,然后就可以构造形式如下的拉格朗日函数:
L=J+Tr(αV)+Tr(βU)+Tr(γΛ)
对上述拉格朗日函数分别求对矩阵分解因子V、矩阵分解因子U以及权重对角阵Λ的导数,推导出这几个矩阵的迭代公式,根据迭代公式,对目标函数进行迭代,直至收敛,其中矩阵分解因子V包含了拓扑关系与节点属性特征等信息。
4.根据权利要求1所述的属性图聚类方法,其特征在于:在所述矩阵聚类步骤中,针对通过联合矩阵分解而得到的包含拓扑关系与节点属性特征信息的矩阵V进行聚类,并将聚类后的结果返回给系统用户。
5.一种基于带权重联合非负矩阵分解的属性图聚类系统,其特征在于,包括:构建目标函数模块:用于给定一个属性图,根据属性图的拓扑关系与节点属性特征设计一个统一的目标函数,使用对称非负矩阵去逼近拓扑关系的邻接矩阵,对节点属性矩阵进行加权,并使用传统非负矩阵分解去逼近加权后的节点属性矩阵,然后将这两部分融合在统一的目标函数中;
目标函数求解模块:用于根据构建的目标函数,对函数进行迭代求解,直至收敛,其中能够分解出一个包含拓扑关系与节点属性等信息的矩阵;
矩阵聚类模块:用于根据目标函数求解得到的包含拓扑关系与节点属性等信息的矩阵,对其进行聚类,把聚类结果提供给系统用户。
6.根据权利要求5所述的属性图聚类系统,其特征在于:在所述构建目标函数模块中,首先给定一个具有n个节点与m个属性特征的单属性图G=(V,E,A),假设这n个节点之间拓扑关系的邻接矩阵为它们的m个不同的属性特征组成的属性矩阵为其中表示非负实数集;然后给定两个矩阵分解因子其中k表示聚类簇的数目;与此同时,为了对这m个不同的属性赋予不同的权重,这里提供一个对角矩阵来对不同的属性进行加权;接着就可以得到两个近似函数,S≈VVT和AΛ≈VUT,其中第一个近似函数表示对邻接矩阵进行逼近,第二个近似函数表示对加权的属性矩阵进行逼近;最后提供一个平衡因子来对这两个特征维度进行融合,就得到了一个新的目标函数:
m i n U , V , Λ ≥ 0 1 2 ( | | S - VV T | | F 2 + λ · | | A Λ - VU T | | F 2 ) .
7.根据权利要求5所述的属性图聚类系统,其特征在于:在所述目标函数求解模块中,首先将目标函数表示成矩阵迹函数的形式:
J = 1 2 T r [ ( S - VV T ) ( S - VV T ) T ] + λ 2 · T r [ ( A Λ - VU T ) ( A Λ - VU T ) T ] = 1 2 [ T r ( SS T ) + T r ( VV T VV T ) - 2 · T r ( SVV T ) ] + λ 2 · [ T r ( AΛ 2 A T ) + T r ( VU T UV T ) - 2 · T r ( AΛUV T ) ]
其中Tr(·)表示矩阵的迹函数,为了上述的目标函数进行优化,这里采用拉格朗日乘子法对它进行优化,首先引入三个拉格朗日乘子矩阵:α、β和γ,它们分别对应矩阵分解因子V、矩阵分解因子U以及权重对角阵Λ的非负约束。然后就可以构造形式如下的拉格朗日函数:
L=J+Tr(αV)+Tr(βU)+Tr(γΛ)
对上述拉格朗日函数分别求对矩阵分解因子V、矩阵分解因子U以及权重对角阵Λ的导数,推导出这几个矩阵的迭代公式。根据迭代公式,对目标函数进行迭代,直至收敛,其中矩阵分解因子V包含了拓扑关系与节点属性特征等信息。
8.根据权利要求5所述的属性图聚类系统,其特征在于:在所述矩阵聚类模块中,针对通过联合矩阵分解而得到的包含拓扑关系与节点属性特征信息的矩阵V进行聚类,并将聚类后的结果返回给系统用户。
9.根据权利要求5至8任一项所述的属性图聚类系统,其特征在于:该属性图聚类系统采用联合非负矩阵分解框架设计,采用对称非负矩阵分解对邻接矩阵进行逼近,采用传统非负矩阵分解对加权后的属性矩阵进行逼近,然后对包含拓扑关系和节点属性特征信息的矩阵进行聚类。
10.根据权利要求9所述的属性图聚类系统,其特征在于:分解出包含拓扑关系和节点属性特征信息的矩阵,对其进行聚类,返回聚类结果。
CN201610630567.6A 2016-08-03 2016-08-03 基于带权重联合非负矩阵分解的属性图聚类方法及系统 Pending CN106296425A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610630567.6A CN106296425A (zh) 2016-08-03 2016-08-03 基于带权重联合非负矩阵分解的属性图聚类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610630567.6A CN106296425A (zh) 2016-08-03 2016-08-03 基于带权重联合非负矩阵分解的属性图聚类方法及系统

Publications (1)

Publication Number Publication Date
CN106296425A true CN106296425A (zh) 2017-01-04

Family

ID=57664875

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610630567.6A Pending CN106296425A (zh) 2016-08-03 2016-08-03 基于带权重联合非负矩阵分解的属性图聚类方法及系统

Country Status (1)

Country Link
CN (1) CN106296425A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108415883A (zh) * 2018-02-13 2018-08-17 中国科学院西安光学精密机械研究所 基于子空间聚类的凸非负矩阵分解方法
CN108510299A (zh) * 2017-02-28 2018-09-07 腾讯科技(北京)有限公司 确定多媒体资源投放策略的方法及装置
CN108737491A (zh) * 2018-03-23 2018-11-02 腾讯科技(深圳)有限公司 信息推送方法和装置以及存储介质、电子装置
CN108984551A (zh) * 2017-05-31 2018-12-11 广州智慧城市发展研究院 一种基于多类别联合软聚类的推荐方法及系统
CN110837863A (zh) * 2019-11-07 2020-02-25 仲恺农业工程学院 一种基于正交鲁棒非负矩阵分解的图节点聚类方法
CN110957002A (zh) * 2019-12-17 2020-04-03 电子科技大学 一种基于协同矩阵分解的药物靶点相互作用关系预测方法
CN111767941A (zh) * 2020-05-15 2020-10-13 上海大学 一种基于对称非负矩阵分解的改进谱聚类及并行化方法
CN113407784A (zh) * 2021-05-28 2021-09-17 桂林电子科技大学 一种基于社交网络的社团划分方法、系统及存储介质

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108510299A (zh) * 2017-02-28 2018-09-07 腾讯科技(北京)有限公司 确定多媒体资源投放策略的方法及装置
CN108984551A (zh) * 2017-05-31 2018-12-11 广州智慧城市发展研究院 一种基于多类别联合软聚类的推荐方法及系统
CN108415883A (zh) * 2018-02-13 2018-08-17 中国科学院西安光学精密机械研究所 基于子空间聚类的凸非负矩阵分解方法
CN108415883B (zh) * 2018-02-13 2020-06-16 中国科学院西安光学精密机械研究所 基于子空间聚类的凸非负矩阵分解方法
CN108737491A (zh) * 2018-03-23 2018-11-02 腾讯科技(深圳)有限公司 信息推送方法和装置以及存储介质、电子装置
CN108737491B (zh) * 2018-03-23 2020-09-01 腾讯科技(深圳)有限公司 信息推送方法和装置以及存储介质、电子装置
CN110837863A (zh) * 2019-11-07 2020-02-25 仲恺农业工程学院 一种基于正交鲁棒非负矩阵分解的图节点聚类方法
CN110957002A (zh) * 2019-12-17 2020-04-03 电子科技大学 一种基于协同矩阵分解的药物靶点相互作用关系预测方法
CN111767941A (zh) * 2020-05-15 2020-10-13 上海大学 一种基于对称非负矩阵分解的改进谱聚类及并行化方法
CN111767941B (zh) * 2020-05-15 2022-11-18 上海大学 一种基于对称非负矩阵分解的改进谱聚类及并行化方法
CN113407784A (zh) * 2021-05-28 2021-09-17 桂林电子科技大学 一种基于社交网络的社团划分方法、系统及存储介质

Similar Documents

Publication Publication Date Title
CN106296425A (zh) 基于带权重联合非负矩阵分解的属性图聚类方法及系统
CN108920544A (zh) 一种基于知识图谱的个性化职位推荐方法
CN106779087A (zh) 一种通用机器学习数据分析平台
CN111553587A (zh) 一种基于对抗学习模型的新能源场景生成方法及系统
CN109165799A (zh) 基于遗传算法的走班教学排课系统
CN108229578B (zh) 基于数据、信息和知识三层图谱架构的图像数据目标识别方法
CN105893483A (zh) 大数据挖掘过程模型总体框架的构造方法
CN106203625A (zh) 一种基于多重预训练的深层神经网络训练方法
CN105976048A (zh) 一种基于改进人工蜂群算法的输电网扩展规划方法
CN111950708B (zh) 一种发现大学生日常生活习惯的神经网络结构与方法
CN106649540A (zh) 一种视频推荐方法及系统
CN106294715A (zh) 一种基于属性约简的关联规则挖掘方法及装置
CN106776928A (zh) 基于内存计算框架、融合社交环境及时空数据的位置推荐方法
Jiang et al. Federated learning algorithm based on knowledge distillation
CN106411572A (zh) 一种结合节点信息和网络结构的社区发现方法
CN104050547A (zh) 一种油田开发规划方案非线性优选决策方法
CN106202377A (zh) 一种基于随机梯度下降的在线协同排序方法
CN108984830A (zh) 一种基于模糊网络分析的建筑能效评价方法及装置
Doğan et al. Determinants of internal migration in Turkey: A panel data analysis approach
CN104217013A (zh) 基于项加权和项集关联度的课程正负模式挖掘方法及系统
CN108536844A (zh) 一种文本增强的网络表示学习方法
CN103995886B (zh) 一种多维度产品设计知识推送框架与构建方法
CN105447767A (zh) 一种基于联合矩阵分解模型的电力用户细分方法
CN107276807A (zh) 一种基于社区动态紧密度的层次化网络社区树剪枝方法
CN116957869A (zh) 一种基于资源模式匹配及协同的教育平台

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170104

RJ01 Rejection of invention patent application after publication