CN110569415B - 一种基于网络表征学习和邻居合力的微博用户社区发现方法 - Google Patents

一种基于网络表征学习和邻居合力的微博用户社区发现方法 Download PDF

Info

Publication number
CN110569415B
CN110569415B CN201910802017.1A CN201910802017A CN110569415B CN 110569415 B CN110569415 B CN 110569415B CN 201910802017 A CN201910802017 A CN 201910802017A CN 110569415 B CN110569415 B CN 110569415B
Authority
CN
China
Prior art keywords
node
nodes
network
microblog
community
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910802017.1A
Other languages
English (en)
Other versions
CN110569415A (zh
Inventor
杨旭华
王晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201910802017.1A priority Critical patent/CN110569415B/zh
Publication of CN110569415A publication Critical patent/CN110569415A/zh
Application granted granted Critical
Publication of CN110569415B publication Critical patent/CN110569415B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于网络表征学习和邻居合力的微博用户社区发现方法,根据现有微博数据,建立微博网络,基于网络表征学习方法把微博网络转化为欧氏空间向量;计算微博网络中节点的质量以及节点的邻居合力;通过邻居合力计算微博网络中节点的邻居合力中心性,设定为初始社区的中心节点,其余节点设定为普通节点;将普通节点归属到与其最近的中心节点所代表的社区形成微博网络的初始社区结构;根据模块度最优的原则合并初始社区,形成最终的微博网络社区结构。本发明综合考虑网络节点的邻居合力和节点间的距离,提高了社区发现的速度和精度。

Description

一种基于网络表征学习和邻居合力的微博用户社区发现方法
技术领域
本发明涉及网络科学领域,特别是一种基于网络表征学习和邻居合力的微博用户社区发现方法。
背景技术
互联网的飞速发展极大地推动了社会信息的网络化进程,以微博为代表的社交网络已经成为人们日常工作和生活的重要组成部分。微博具有很强的原创性、快捷性、交互性,为每一个网络用户都提供了自我展示的平台,因而迅速吸引了大量用户。微博中的用户社区是微博社交网络中的一种非实体网络,社区内部的成员往往具有相同或相似的兴趣爱好。
从复杂的社交网络中发现所包含的网络社区可以引导用户找到与自己拥有相同兴趣爱好的其他用户,可以帮助微博平台根据同一社区内用户的兴趣爱好准确地将广告投放给用户,也可以为用户提供更加准确的个性化推荐。同时,准确地发现微博的用户社区对网络舆情的高效监管具有重要意义。社区发现旨在找出网络中的固有社区结构,但由于社交网络的复杂性,人工的找出网络中的社区结构难度大且效率低。
目前已经有许多社区发现的方法应用于社交网络,如层次聚类方法,标签传播方法,随机游走方法等。这些方法对于复杂的社区结构的发现效率较低且不够准确,常常将其他社区的用户划分到同一社区。为了更准确快速地在网络中发现用户社区结构,本发明提出了一种基于网络表征学习和邻居合力的微博用户社区发现方法,利用网络表征学习方法转化微博网络拓扑结构,通过网络节点的邻居合力找取社区中心并划分社区。
发明内容
为了克服目前在社交网络的社区发现方法存在的效率较低和准确性不高等方面的不足,本发明提出了一种快速高效的基于网络表征学习和邻居合力的微博用户社区发现方法。
本发明解决其技术问题所采用的技术方案是:
一种基于网络表征学习和邻居合力的微博用户社区发现方法,包括如下步骤:
步骤一:根据现有的微博数据,一个用户用一个节点表示;如果两个用户存在彼此之间的关注,则两个用户之间有一条连边;构建具有N个节点的微博网络模型G(V,E),V表示节点,E表示节点之间连边;
步骤二:采用DeepWalk网络表征学习方法将具有N个节点的微博网络G转化为欧氏空间的N个r维向量,一个网络节点及其连边信息对应一个向量,其中第i个向量表示为
Figure GDA0002981560410000021
r为大于或等于2的整数;
步骤三:任意选取微博网络中两个节点i和j,计算这两个节点的距离,该距离为相应的向量
Figure GDA0002981560410000022
Figure GDA0002981560410000023
之间的欧式距离;遍历整个微博网络,计算所有节点对之间的距离;
步骤四:将微博网络中的节点看成有质量的节点,计算微博网络中任意节点i的质量
Figure GDA0002981560410000024
其中,mi表示节点i的质量,k表示节点i在微博网络G中的直接邻居节点的数量;Dij表示节点i与节点j之间的距离;
步骤五:计算任意节点i的邻居合力
Figure GDA0002981560410000025
其中
Figure GDA0002981560410000026
表示节点i的邻居合力,k表示节点i在微博网络G中的直接邻居节点的数量,
Figure GDA0002981560410000027
为单位向量,其方向为节点i指向节点j;
步骤六:计算任意节点i的邻居合力中心性
Figure GDA0002981560410000028
NFCi表示节点i的邻居合力中心性值,k表示节点i在微博网络G中的直接邻居节点的数量,
Figure GDA0002981560410000029
表示节点i的直接邻居j受到的邻居合力,
Figure GDA00029815604100000210
表示节点j到节点i的距离向量;
步骤七:遍历微博网络,计算所有节点的邻居合力中心性NFC的值,将NFC>0的节点放入中心节点集合cluster中,将NFC≤0的节点放入普通节点集合uncluster中;
步骤八:任意选取普通节点集合uncluster中的一个节点,将其归属到与cluster集合中距离最近的节点所代表的社区,若其与cluster集合中距离最近的节点不止一个,将这个节点归属到NFC值更大的节点所代表的社区;遍历集合uncluster,用同样方法将所有普通节点都归属到集合cluster中节点所代表的相应社区,从而获得微博网络的初始社区划分,初始社区的数量为集合cluster当中的中心节点的数量;
步骤九:给微博网络中当前的社区编号1,2,3...,H,H表示微博网络现有的社区数量,根据现有微博网络的社区结构,计算微博网络的模块度
Figure GDA0002981560410000031
其中,lc表示社区c内部所包含的边数,dc表示社区c中所有节点的度值之和,E表示微博网络中边的总数;
步骤十:任意选取微博网络G中的两个编号为m、n的社区,将二者合并,计算合并后微博网络的模块度,并将求得的模块度存入矩阵R中,Rmn表示社区m与社区n合并后的微博网络的模块度;其中,矩阵R为一个上三角矩阵;解除本次社区合并,用同样的方法计算任意两个社区合并后的微博网络的模块度,并将其记录到矩阵R中;
步骤十一:找到矩阵R中数值最大的元素Rmax,以及对应的行列号m、n;比较Rmax与Q的大小,若Rmax>Q,则将社区m与社区n合并,更新微博网络的社区结构;重复进行步骤九、步骤十、步骤十一,如果Rmax≤Q,则当前的社区结构为最终的微博网络用户社区结构。
本发明的技术构思为:基于网络表征学习方法把微博网络拓扑结构转化为欧氏空间向量,通过网络节点的邻居合力中心性确定初始社区中心,利用模块度优化社区,提高了网络社区发现的准确性。
本发明的有益效果为:运用了网络表征学习,综合考虑了网络节点的邻居合力和节点间的距离,提高了社区发现的速度;并通过优化模块度,提高了社区发现的速度和精度。
附图说明
图1为一个简单的微博网络示意图,图中的节点表示微博网络的用户,1,2,3,...,14为相应的用户编号,如果用户之间有相互的关注,则两节点之间有一条连边。
具体实施方式
下面结合附图对本发明做进一步说明。
参照图1,一种基于网络表征学习和邻居合力的微博用户社区发现方法,包括如下步骤:
步骤一:根据现有的微博数据,一个用户用一个节点表示,即图1中的圆,1,2,3,...,14为相应的用户编号;如果两个用户存在彼此之间的关注,则两个用户之间有一条连边,如图1中的节点1与节点2因为相互关注,所以两节点之间有一条连边;构建具有N个节点的微博网络模型G(V,E),V表示节点,E表示节点之间连边;
步骤二:采用DeepWalk网络表征学习方法将具有N个节点的微博网络G转化为欧氏空间的N个r维向量,一个网络节点及其连边信息对应一个向量,其中第i个向量表示为
Figure GDA0002981560410000041
r为大于或等于2的整数;
步骤三:任意选取微博网络中两个节点i和j,计算这两个节点的距离,该距离为相应的向量
Figure GDA0002981560410000042
Figure GDA0002981560410000043
之间的欧式距离;遍历整个微博网络,计算所有节点对之间的距离;
步骤四:将微博网络中的节点看成有质量的节点,计算微博网络中任意节点i的质量
Figure GDA0002981560410000044
其中,mi表示节点i的质量,k表示节点i在微博网络G中的直接邻居节点的数量;Dij表示节点i与节点j之间的距离;
步骤五:计算任意节点i的邻居合力
Figure GDA0002981560410000051
其中
Figure GDA0002981560410000052
表示节点i的邻居合力,k表示节点i在微博网络G中的直接邻居节点的数量,
Figure GDA0002981560410000053
为单位向量,其方向为节点i指向节点j;
步骤六:计算任意节点i的邻居合力中心性
Figure GDA0002981560410000054
NFCi表示节点i的邻居合力中心性值,k表示节点i在微博网络G中的直接邻居节点的数量,
Figure GDA0002981560410000055
表示节点i的直接邻居j受到的邻居合力,
Figure GDA0002981560410000056
表示节点j到节点i的距离向量;
步骤七:遍历微博网络,计算所有节点的邻居合力中心性NFC的值,将NFC>0的节点放入中心节点集合cluster中,将NFC≤0的节点放入普通节点集合uncluster中;
步骤八:任意选取普通节点集合uncluster中的一个节点,将其归属到与cluster集合中距离最近的节点所代表的社区,若其与cluster集合中距离最近的节点不止一个,将这个节点归属到NFC值更大的节点所代表的社区;遍历集合uncluster,用同样方法将所有普通节点都归属到集合cluster中节点所代表的相应社区,从而获得微博网络的初始社区划分,初始社区的数量为集合cluster当中的中心节点的数量;
步骤九:给微博网络中当前的社区编号1,2,3...,H,H表示微博网络现有的社区数量,根据现有微博网络的社区结构,计算微博网络的模块度
Figure GDA0002981560410000057
其中,lc表示社区c内部所包含的边数,dc表示社区c中所有节点的度值之和,E表示微博网络中边的总数;
步骤十:任意选取微博网络G中的两个编号为m、n的社区,将二者合并,计算合并后微博网络的模块度,并将求得的模块度存入矩阵R中,Rmn表示社区m与社区n合并后的微博网络的模块度;其中,矩阵R为一个上三角矩阵;解除本次社区合并,用同样的方法计算任意两个社区合并后的微博网络的模块度,并将其记录到矩阵R中;
步骤十一:找到矩阵R中数值最大的元素Rmax,以及对应的行列号m、n;比较Rmax与Q的大小,若Rmax>Q,则将社区m与社区n合并,更新微博网络的社区结构;重复进行步骤九、步骤十、步骤十一,如果Rmax≤Q,则当前的社区结构为最终的微博网络用户社区结构。
如上所述,本专利实施的具体实现步骤使本发明更加清晰。在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。

Claims (1)

1.一种基于网络表征学习和邻居合力的微博用户社区发现方法,其特征在于,所述方法包括以下步骤:
步骤一:根据现有的微博数据,一个用户用一个节点表示;如果两个用户存在彼此之间的关注,则两个用户之间有一条连边;构建具有N个节点的微博网络模型G(V,E),V表示节点,E表示节点之间连边;
步骤二:采用DeepWalk网络表征学习方法将具有N个节点的微博网络G转化为欧氏空间的N个r维向量,一个网络节点及其连边信息对应一个向量,其中第i个向量表示为
Figure FDA0002988651670000011
r为大于或等于2的整数;
步骤三:任意选取微博网络中两个节点i和j,计算这两个节点的距离,该距离为相应的向量
Figure FDA0002988651670000012
Figure FDA0002988651670000013
之间的欧式距离;遍历整个微博网络,计算所有节点对之间的距离;
步骤四:将微博网络中的节点看成有质量的节点,计算微博网络中任意节点i的质量
Figure FDA0002988651670000014
其中,mi表示节点i的质量,k表示节点i在微博网络G中的直接邻居节点的数量;Dij表示节点i与节点j之间的距离;
步骤五:计算任意节点i的邻居合力
Figure FDA0002988651670000015
其中
Figure FDA0002988651670000016
表示节点i的邻居合力,k表示节点i在微博网络G中的直接邻居节点的数量,
Figure FDA0002988651670000017
为单位向量,其方向为节点i指向节点j;
步骤六:计算任意节点i的邻居合力中心性
Figure FDA0002988651670000018
NFCi表示节点i的邻居合力中心性值,k表示节点i在微博网络G中的直接邻居节点的数量,
Figure FDA0002988651670000019
表示节点i的直接邻居j受到的邻居合力,
Figure FDA00029886516700000110
表示节点j到节点i的距离向量;
步骤七:遍历微博网络,计算所有节点的邻居合力中心性NFC的值,将NFC>0的节点放入中心节点集合cluster中,将NFC≤0的节点放入普通节点集合uncluster中;
步骤八:任意选取普通节点集合uncluster中的一个节点,将其归属到与cluster集合中距离最近的节点所代表的社区,若其与cluster集合中距离最近的节点不止一个,将这个节点归属到NFC值更大的节点所代表的社区;遍历集合uncluster,用同样方法将所有普通节点都归属到集合cluster中节点所代表的相应社区,从而获得微博网络的初始社区划分,初始社区的数量为集合cluster当中的中心节点的数量;
步骤九:给微博网络中当前的社区编号1,2,3...,H,H表示微博网络现有的社区数量,根据现有微博网络的社区结构,计算微博网络的模块度
Figure FDA0002988651670000021
其中,lc表示社区c内部所包含的边数,dc表示社区c中所有节点的度值之和,E表示微博网络中边的总数;
步骤十:任意选取微博网络G中的两个编号为m、n的社区,将二者合并,计算合并后微博网络的模块度,并将求得的模块度存入矩阵R中,Rmn表示社区m与社区n合并后的微博网络的模块度;其中,矩阵R为一个上三角矩阵;解除本次社区合并,用同样的方法计算任意两个社区合并后的微博网络的模块度,并将其记录到矩阵R中;
步骤十一:找到矩阵R中数值最大的元素Rαβ,以及对应的行列号α、β;比较Rαβ与Q的大小,若Rαβ>Q,则将社区α与社区β合并,更新微博网络的社区结构;重复进行步骤九、步骤十、步骤十一,如果Rαβ≤Q,则当前的社区结构为最终的微博网络用户社区结构。
CN201910802017.1A 2019-08-28 2019-08-28 一种基于网络表征学习和邻居合力的微博用户社区发现方法 Active CN110569415B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910802017.1A CN110569415B (zh) 2019-08-28 2019-08-28 一种基于网络表征学习和邻居合力的微博用户社区发现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910802017.1A CN110569415B (zh) 2019-08-28 2019-08-28 一种基于网络表征学习和邻居合力的微博用户社区发现方法

Publications (2)

Publication Number Publication Date
CN110569415A CN110569415A (zh) 2019-12-13
CN110569415B true CN110569415B (zh) 2021-06-18

Family

ID=68776517

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910802017.1A Active CN110569415B (zh) 2019-08-28 2019-08-28 一种基于网络表征学习和邻居合力的微博用户社区发现方法

Country Status (1)

Country Link
CN (1) CN110569415B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112084418B (zh) * 2020-07-29 2023-07-28 浙江工业大学 一种基于邻居信息和属性网络表征学习的微博用户社团发现方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105849764A (zh) * 2013-10-25 2016-08-10 西斯摩斯公司 用于识别社交数据网络中的影响者及其社区的系统和方法
CN109166047A (zh) * 2018-08-04 2019-01-08 福州大学 基于密度聚类的增量动态社区发现方法
CN109189867A (zh) * 2018-10-23 2019-01-11 中山大学 基于公司知识图谱的关系发现方法、装置及存储介质
CN109255376A (zh) * 2018-08-28 2019-01-22 浙江工业大学 一种基于自适应度惩罚和社区信息的预测网络连边的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10664744B2 (en) * 2015-10-13 2020-05-26 Facebook, Inc. End-to-end memory networks

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105849764A (zh) * 2013-10-25 2016-08-10 西斯摩斯公司 用于识别社交数据网络中的影响者及其社区的系统和方法
CN109166047A (zh) * 2018-08-04 2019-01-08 福州大学 基于密度聚类的增量动态社区发现方法
CN109255376A (zh) * 2018-08-28 2019-01-22 浙江工业大学 一种基于自适应度惩罚和社区信息的预测网络连边的方法
CN109189867A (zh) * 2018-10-23 2019-01-11 中山大学 基于公司知识图谱的关系发现方法、装置及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于重叠社团划分的大规模道路网络双层路由算法;杨旭华 等;《计算机科学》;20150630;全文 *

Also Published As

Publication number Publication date
CN110569415A (zh) 2019-12-13

Similar Documents

Publication Publication Date Title
CN110955834B (zh) 一种知识图谱驱动的个性化精准推荐方法
CN109635989B (zh) 一种基于多源异构数据融合的社交网络链路预测方法
CN105677648B (zh) 一种基于标签传播算法的社团发现方法及系统
CN101916256A (zh) 综合行动者兴趣与网络拓扑的社区发现方法
CN112149000B (zh) 一种基于网络嵌入的在线社交网络用户社区发现方法
CN107391542A (zh) 一种基于文件知识图谱的开源软件社区专家推荐方法
CN112269922B (zh) 一种基于网络表示学习的社区舆论关键人物发现方法
CN113094593B (zh) 社交网络事件推荐方法、系统、设备及存储介质
CN110263236A (zh) 基于动态多视图学习模型的社交网络用户多标签分类方法
CN110234155A (zh) 一种基于改进topsis的超密集网络接入选择方法
CN114117945B (zh) 基于用户-服务交互图的深度学习云服务QoS预测方法
CN116340646A (zh) 一种基于超图基序优化多元用户表示的推荐方法
CN110569415B (zh) 一种基于网络表征学习和邻居合力的微博用户社区发现方法
CN110825935A (zh) 社区核心人物挖掘方法、系统、电子设备及可读存储介质
CN107357858B (zh) 一种基于地理位置的网络重构方法
CN107346333B (zh) 一种基于链路预测的在线社交网络好友推荐方法与系统
CN112836822A (zh) 基于宽度学习的联邦学习策略优化方法和装置
CN115775026A (zh) 一种基于组织相似度的联邦学习方法
CN112084418B (zh) 一种基于邻居信息和属性网络表征学习的微博用户社团发现方法
CN108614932B (zh) 基于边图的线性流重叠社区发现方法、系统及存储介质
CN105159918A (zh) 一种基于信任关联度的微博网络社区发现方法
CN106157150B (zh) 信息处理方法与信息处理装置
Yuan et al. A mixing evolution model for bidirectional microblog user networks
CN116304773A (zh) 基于图神经网络的社区发现方法
CN112131486B (zh) 基于图卷积神经网络的电商网络平台用户社区发现方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant