CN110334285B - 一种基于结构平衡约束的符号网络社区发现方法 - Google Patents
一种基于结构平衡约束的符号网络社区发现方法 Download PDFInfo
- Publication number
- CN110334285B CN110334285B CN201910598613.2A CN201910598613A CN110334285B CN 110334285 B CN110334285 B CN 110334285B CN 201910598613 A CN201910598613 A CN 201910598613A CN 110334285 B CN110334285 B CN 110334285B
- Authority
- CN
- China
- Prior art keywords
- community
- network
- node
- matrix
- constraint
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 239000011159 matrix material Substances 0.000 claims abstract description 45
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 7
- 238000005192 partition Methods 0.000 description 3
- 238000005065 mining Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Business, Economics & Management (AREA)
- Software Systems (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及社交网络服务技术领域,公开了一种基于结构平衡约束的符号网络社区发现方法,包括步骤:将符号网络以图的形式表示,构建符号网络邻接矩阵、设置结构平衡约束信息,基于半非负矩阵分解构建社区发现模型,求解社区发现模型,获得社区发现结果。本发明的方法基于结构平衡理论获取节点的结构平衡约束关系,然后作为正则约束项纳入基于半非负矩阵分解的符号网络社区发现模型进行节点社区指示矩阵的求解,最后通过判断节点社区归属强度大小获得社区划分结果,从而进一步提高社区发现质量。
Description
技术领域
本发明涉及社交网络服务技术领域,具体涉及一种基于结构平衡约束的符号网络社区发现方法。
背景技术
符号网络是一种节点关系存在正负两种类型的复杂网络,例如社交网络就存在信任-不信任、赞成-反对以及喜欢-不喜欢等具有相反性质的用户关系。符号网络社区发现的途径是对网络节点进行分区划分,同一分区内的节点之间要求尽可能是正关系,并且链接紧密;不同分区之间的节点则要求尽可能是负关系,并且链接稀疏。符号网络社区发现不仅可以帮助理解符号网络的结构特征和演变趋势,而且还具有重要的应用价值,例如可以应用于挖掘政治社交网络的联盟和敌对团体、挖掘电商社交网络的相似用户群体并进行社会化营销。
目前符号网络社区发现问题已经吸引了许多研究人员的关注并提出了一些解决方法,其中包括基于谱聚类的方法、基于符号模块度优化的方法、基于博弈论的方法以及基于统计推理的方法。虽然现有方法都在一定程度上可以解决符号网络的社区发现问题,但都忽视了结构平衡理论这一符号网络中的重要基础理论对于提高社区发现性能的影响,因此现有符号网络社区发现方法仍然有改进的空间。
发明内容
针对背景技术所存在的不足,本发明进行针对性设计,提供了一种基于结构平衡约束的符号网络社区发现方法,基于结构平衡理论获取节点的结构平衡约束关系,然后作为正则约束项纳入基于半非负矩阵分解的符号网络社区发现模型进行节点社区指示矩阵的求解,最后通过判断节点社区归属强度大小获得社区划分结果,从而进一步提高社区发现质量。
为实现上述目的,本发明提供如下技术方案:
一种基于结构平衡约束的符号网络社区发现方法,具体包括如下步骤:
步骤1:符号网络形式化表示为无向图G=(V,E+,E-);其中V={v0,v1,...,vn-1}表示n个网络节点的集合,E+表示网络节点之间正连接边的集合,E-表示网络节点之间负连接边的集合,其中,即两个节点之间不可能同时存在正连接边和负连接边;
步骤2:构建符号网络邻接矩阵A和结构平衡约束信息矩阵M;
构建一个n×n的邻接矩阵A=[aij]n×n表示节点之间的连接边信息,其中n为所述符号网络中节点的数量;
构建一个约束矩阵M=[m is]n×n表示所有正关系约束对,当vi和vs之间存在大概率的正关系约束时,则mis=1,否则mis=0;
步骤3:基于半非负矩阵分解构建社区发现模型;
步骤4:求解社区发现模型获得W和H矩阵;
步骤5:根据H获得社区发现结果。
符号网络的结构平衡理论认为:三个网络节点构成的三角形结构如果三条边的符号之积为正,则该三角形是结构平衡的,否则是结构不平衡的。而这个判定规则可以简单概括为以下2个直观认识:1)朋友的朋友是我的朋友;2)敌人的敌人是我的朋友。目前已有不少研究人员对真实的带符号社交网络进行实证分析,结果表明带符号社交网络存在的结构平衡三角形数量要显著多于结构不平衡的数量,而且满足结构平衡的三角形所占的比例随时间日益增加,而不满足结构平衡的三角形所占的比例随时间降低,这也充分说明结构平衡理论适用于现实世界的符号网络。
进一步所采取的措施是:步骤2中,根据结构平衡理论对符号网络中不存在连接边的节点对进行结构平衡约束信息的设置:对于任意三个网络节点构成的三元组<vi,vj,vs>,如果其中连接边满足
进一步采取的措施是:步骤3中,假设社区数目为k,令W=[wil]n×k∈Rn×k表示节点社区特征矩阵,表示节点与社区的归属关系矩阵,其中wil表示社区l中第i个节点的特征向量,hjl表示节点j与社区l的归属关系,R表示任意实数集合,R+表示正实数集合和0;基于半非负矩阵分解模型,直接分解符号网络的邻接矩阵A为W和HT的近似乘积,同时将M表达的约束信息转化为对H的正则约束项,设计如下社区发现模型:
其中L为M的拉普拉斯矩阵,λ为正则项参数,tr(·)为矩阵的迹,F为Frobenius范数,即欧式距离。
进一步的措施是:步骤4中,采用交替迭代更新W和H的方式求解社区发现模型,首先将目标函数H(W,H)写为矩阵迹的形式:
J(W,H)=tr(AAT-2AHWT+WHTHWT)+λtr(HTLH)
对于H,将H的求解转换为对H(W,H)的受限约束求极值,并引入拉格朗日乘数α∈Rn ×k构建如下拉格朗日函数:
L(W,H)=J(W,H)+tr(αHT)
求得L(W,H)关于H的导数为:
通过引入Karush-Kuhn-Tucker(KKT)条件,求得H的迭代更新规则为:
其中hjl表示节点j与社区1的归属关系,
具体为:假定待发现的k个社区为C={c0,c1,...,ck-1},对于任意一个用户节点vi,基于节点i与社区1的归属强度hil,采用式将节点W具有最大归属强度的社区编号赋值给p,则有cp=cp∪{vi},即将网络节点vi划分为社区l。
通过这样的设计,本发明的一种基于结构平衡约束的符号网络社区发现方法,与现有技术相比,具备以下有益效果:使用半非负矩阵分解模型直接分解符号网络邻接矩阵获得社区归属指示矩阵,同时可以利用结构平衡理论获得节点社区归属表示的约束信息,从而进一步提高社区发现质量。
附图说明
图1为本发明方法的流程图;
图2为一个符号网络示例;
图3为对符号网络示例进行社区发现的结果。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为根据本发明优选实施方式的一种基于结构平衡约束的符号网络社区发现方法的流程图,如图1所示,本发明方法的步骤如下:
步骤1:将符号网络以图的形式表示。对在线社交网络示例形式化表示为G=(V,E+,E-),其中V=(v0,v1,v2,v3,v4,v5,v6,v7),E+={e01,e02,e13,e34,e46,e56},E-={e14,e25,e35},n=7。
步骤2:构建符号网络邻接矩阵,设置结构平衡约束信息。
步骤1中对应的邻接矩阵A为:
根据结构平衡理论,v2和v3,v0和v3,v1和v2具有很大可能的正约束关系,为此可以构建如下结构平衡约束信息矩阵:
步骤3:基于半非负矩阵分解构建社区发现模型。设定社区数k=2,令用于表示用户节点与社区的归属关系矩阵,W=[wil]7×2∈R7×2社区特征矩阵,由于符号网络中的社区要求成员节点之间尽可能是正关系(即朋友关系),因此对于节点vi和vs,如果mis=1,那么vi和vs具有很大可能性在同一个社区,实际表现为他们对应的节点社区指示向量hi和hs非常相似,即它们的欧式距离应尽可能小,趋近于0。基于半非负矩阵分解模型直接分解符号网络的邻接矩阵A为W和HT的近似乘积,同时将M表达的约束信息转化为对H的正则约束项,可以设计如下社区发现模型:
其中L为M的拉普拉斯矩阵,λ为正则项参数,tr(.)为矩阵的迹,F为Frobenius范数,即欧式距离。
步骤4:求解社区发现模型。通过如下迭代更新规则求解:
步骤5:获取社区发现结果。设置迭代次数t=100,收敛阈值ω=15,随机初始化W和H,本实施例的W和H的随机初始化结果为:
迭代收敛后获得的W和H的结果为:
根据H可直接判断待发现的2个社区c0和c1的成员,例如对于用户节点v0,其在H中对应的社区归属度分布向量为[0.37,0.63],0.63>0.37,所以c1=c1∪{v0},同理,可判断其余节点的社区归属关系,最终的社区划分结果为:c0={v4,v5,v6},c1={v0,v1,v2,v3},结果如图3所示。
本发明的方法基于结构平衡理论获取节点的结构平衡约束关系,然后作为正则约束项纳入基于半非负矩阵分解的符号网络社区发现模型进行节点社区指示矩阵的求解,最后通过判断节点社区归属强度大小获得社区划分结果,从而进一步提高社区发现质量。
以上所述,仅用以说明本发明的技术方案而非限制,本领域普通技术人员对本发明的技术方案所做的其它修改或者等同替换,只要不脱离本发明技术方案的精神和范围,均应涵盖在本发明的权利要求范围当中。
Claims (5)
1.一种基于结构平衡约束的符号网络社区发现方法,其特征在于,具体包括如下步骤:
步骤1:符号网络形式化表示为无向图G=(V,E+,E-);其中V={v0,v1,...,vn-1}表示n个网络节点的集合,E+表示网络节点之间正连接边的集合,E-表示网络节点之间负连接边的集合,其中,即两个节点之间不可能同时存在正连接边和负连接边;
步骤2:构建符号网络邻接矩阵A和结构平衡约束信息矩阵M;
构建一个n×n的邻接矩阵A=[aij]n×n表示节点之间的连接边信息,其中n为所述符号网络中节点的数量;
构建一个约束矩阵M=[mis]n×n表示所有正关系约束对,当vi和vs之间存在大概率的正关系约束时,则mis=1,否则mis=0;
步骤3:基于半非负矩阵分解构建社区发现模型;
步骤4:求解社区发现模型获得W和H矩阵;
步骤5:根据H获得社区发现结果;
步骤3中,假设社区数目为k,令W=[wil]n×k∈Rn×k表示节点社区特征矩阵,表示节点与社区的归属关系矩阵,其中wil表示社区l中第i个节点的特征向量,hjl表示节点j与社区l的归属关系,R表示任意实数集合,R+表示正实数集合和0;
基于半非负矩阵分解模型,直接分解符号网络的邻接矩阵A为W和HT的近似乘积,同时将M表达的约束信息转化为对H的正则约束项,设计如下社区发现模型:
其中L为M的拉普拉斯矩阵,λ为正则项参数,tr(·)为矩阵的迹,F为Frobenius范数,即欧式距离
5.根据权利要求1所述的一种基于结构平衡约束的符号网络社区发现方法,其特征在于:步骤4中,采用交替迭代更新W和H的方式求解社区发现模型,首先将目标函数J(W,H)写为矩阵迹的形式:
J(W,H)=tr(AAT-2AHWT+WHTHWT)+λtr(HTLH)
对于H,将H的求解转换为对J(W,H)的受限约束求极值,并引入拉格朗日乘数α∈Rn×k构建如下拉格朗日函数:
L(W,H)=J(W,H)+tr(αHT)
求得L(W,H)关于H的导数为:
通过引入Karush-Kuhn-Tucker(KKT)条件,求得H的迭代更新规则为:
其中hjl表示节点j与社区l的归属关系,
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910598613.2A CN110334285B (zh) | 2019-07-04 | 2019-07-04 | 一种基于结构平衡约束的符号网络社区发现方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910598613.2A CN110334285B (zh) | 2019-07-04 | 2019-07-04 | 一种基于结构平衡约束的符号网络社区发现方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110334285A CN110334285A (zh) | 2019-10-15 |
CN110334285B true CN110334285B (zh) | 2021-08-06 |
Family
ID=68143136
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910598613.2A Active CN110334285B (zh) | 2019-07-04 | 2019-07-04 | 一种基于结构平衡约束的符号网络社区发现方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110334285B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110837863A (zh) * | 2019-11-07 | 2020-02-25 | 仲恺农业工程学院 | 一种基于正交鲁棒非负矩阵分解的图节点聚类方法 |
CN111310996B (zh) * | 2020-02-13 | 2023-06-20 | 山东师范大学 | 基于图自编码网络的用户信任关系预测方法及系统 |
CN112269923B (zh) * | 2020-10-14 | 2023-06-20 | 西华大学 | 一种基于结构洞的网络舆情控制方法 |
CN113408090B (zh) * | 2021-05-31 | 2023-10-27 | 上海师范大学 | 一种基于符号网络的节点关系获取方法及存储介质 |
CN116563049B (zh) * | 2023-04-24 | 2024-10-18 | 华南师范大学 | 一种有向带权符号社交网络社区发现方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6047331A (en) * | 1997-02-19 | 2000-04-04 | Massachusetts Institute Of Technology | Method and apparatus for automatic protection switching |
US6842746B1 (en) * | 1998-05-15 | 2005-01-11 | Nutech Solutions, Inc. | Method and system for operations management |
CN106204298A (zh) * | 2016-07-15 | 2016-12-07 | 长江大学 | 一种大数据环境下的临时社交网络确定方法及系统 |
CN108334580A (zh) * | 2018-01-25 | 2018-07-27 | 重庆邮电大学 | 一种结合链接和属性信息的社区发现方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109859063B (zh) * | 2019-01-18 | 2023-05-05 | 河北工业大学 | 一种社区发现方法、装置、存储介质及终端设备 |
-
2019
- 2019-07-04 CN CN201910598613.2A patent/CN110334285B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6047331A (en) * | 1997-02-19 | 2000-04-04 | Massachusetts Institute Of Technology | Method and apparatus for automatic protection switching |
US6842746B1 (en) * | 1998-05-15 | 2005-01-11 | Nutech Solutions, Inc. | Method and system for operations management |
CN106204298A (zh) * | 2016-07-15 | 2016-12-07 | 长江大学 | 一种大数据环境下的临时社交网络确定方法及系统 |
CN108334580A (zh) * | 2018-01-25 | 2018-07-27 | 重庆邮电大学 | 一种结合链接和属性信息的社区发现方法 |
Non-Patent Citations (2)
Title |
---|
Community Detection Based on Regularized Semi-Nonnegative Matrix Tri-Factorization in Signed Networks;Zhen Li et al;《Mobile Netw Appl》;20180228;第71-79页 * |
符号社会网络中正负关系预测算法研究综述;蓝梦微等;《计算机研究与发展》;20150228;第52卷(第2期);第410-420页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110334285A (zh) | 2019-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110334285B (zh) | 一种基于结构平衡约束的符号网络社区发现方法 | |
CN110334742B (zh) | 一种用于文档分类的基于强化学习的通过添加虚假节点的图对抗样本生成方法 | |
CN106411572B (zh) | 一种结合节点信息和网络结构的社区发现方法 | |
CN104598605A (zh) | 一种社交网络中的用户影响力评估方法 | |
CN101695152B (zh) | 室内定位的方法及其系统 | |
CN110263236B (zh) | 基于动态多视图学习模型的社交网络用户多标签分类方法 | |
CN110322003B (zh) | 一种用于文档分类的基于梯度的通过添加虚假节点的图对抗样本生成方法 | |
CN111932386A (zh) | 用户账号确定方法及装置、信息推送方法及装置、电子设备 | |
CN113807520A (zh) | 基于图神经网络的知识图谱对齐模型的训练方法 | |
CN114882335B (zh) | 基于联邦学习框架面向感算云一体化的智能图像传感装置 | |
CN102571431A (zh) | 针对复杂网络的基于群思想改进的Fast-Newman聚类方法 | |
CN113469261A (zh) | 基于感染图卷积网络的源识别方法及系统 | |
CN115859143A (zh) | 基于邻域节点结构编码的图神经网络异常检测方法与装置 | |
CN104484365B (zh) | 一种多源异构在线社会网络中网络主体之间社会关系的预测方法与系统 | |
CN118709064A (zh) | 基于谱域图神经网络的用户异常评论检测方法 | |
CN110610434A (zh) | 基于人工智能的社区发现方法 | |
CN117853596A (zh) | 无人机遥感测绘方法及系统 | |
CN111738514A (zh) | 利用局部距离和节点秩优化函数的社交网络社区发现方法 | |
CN112836629A (zh) | 一种图像分类方法 | |
CN112131486B (zh) | 基于图卷积神经网络的电商网络平台用户社区发现方法 | |
CN113902091A (zh) | 一种基于非线性非负矩阵分解的社区发现方法 | |
CN113807370A (zh) | 数据处理方法、装置、设备、存储介质及计算机程序产品 | |
CN113792802A (zh) | 基于聚类系数的叠加随机游走重力模型链路预测方法 | |
CN111738515B (zh) | 基于局部距离和节点秩优化函数的社交网络社区发现方法 | |
CN116192650B (zh) | 一种基于子图特征的链路预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |