CN110569415B - 一种基于网络表征学习和邻居合力的微博用户社区发现方法 - Google Patents
一种基于网络表征学习和邻居合力的微博用户社区发现方法 Download PDFInfo
- Publication number
- CN110569415B CN110569415B CN201910802017.1A CN201910802017A CN110569415B CN 110569415 B CN110569415 B CN 110569415B CN 201910802017 A CN201910802017 A CN 201910802017A CN 110569415 B CN110569415 B CN 110569415B
- Authority
- CN
- China
- Prior art keywords
- node
- nodes
- network
- microblog
- community
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 239000013598 vector Substances 0.000 claims abstract description 23
- 238000012512 characterization method Methods 0.000 claims abstract description 5
- 239000011159 matrix material Substances 0.000 claims description 15
- 238000010586 diagram Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000005295 random walk Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于网络表征学习和邻居合力的微博用户社区发现方法,根据现有微博数据,建立微博网络,基于网络表征学习方法把微博网络转化为欧氏空间向量;计算微博网络中节点的质量以及节点的邻居合力;通过邻居合力计算微博网络中节点的邻居合力中心性,设定为初始社区的中心节点,其余节点设定为普通节点;将普通节点归属到与其最近的中心节点所代表的社区形成微博网络的初始社区结构;根据模块度最优的原则合并初始社区,形成最终的微博网络社区结构。本发明综合考虑网络节点的邻居合力和节点间的距离,提高了社区发现的速度和精度。
Description
技术领域
本发明涉及网络科学领域,特别是一种基于网络表征学习和邻居合力的微博用户社区发现方法。
背景技术
互联网的飞速发展极大地推动了社会信息的网络化进程,以微博为代表的社交网络已经成为人们日常工作和生活的重要组成部分。微博具有很强的原创性、快捷性、交互性,为每一个网络用户都提供了自我展示的平台,因而迅速吸引了大量用户。微博中的用户社区是微博社交网络中的一种非实体网络,社区内部的成员往往具有相同或相似的兴趣爱好。
从复杂的社交网络中发现所包含的网络社区可以引导用户找到与自己拥有相同兴趣爱好的其他用户,可以帮助微博平台根据同一社区内用户的兴趣爱好准确地将广告投放给用户,也可以为用户提供更加准确的个性化推荐。同时,准确地发现微博的用户社区对网络舆情的高效监管具有重要意义。社区发现旨在找出网络中的固有社区结构,但由于社交网络的复杂性,人工的找出网络中的社区结构难度大且效率低。
目前已经有许多社区发现的方法应用于社交网络,如层次聚类方法,标签传播方法,随机游走方法等。这些方法对于复杂的社区结构的发现效率较低且不够准确,常常将其他社区的用户划分到同一社区。为了更准确快速地在网络中发现用户社区结构,本发明提出了一种基于网络表征学习和邻居合力的微博用户社区发现方法,利用网络表征学习方法转化微博网络拓扑结构,通过网络节点的邻居合力找取社区中心并划分社区。
发明内容
为了克服目前在社交网络的社区发现方法存在的效率较低和准确性不高等方面的不足,本发明提出了一种快速高效的基于网络表征学习和邻居合力的微博用户社区发现方法。
本发明解决其技术问题所采用的技术方案是:
一种基于网络表征学习和邻居合力的微博用户社区发现方法,包括如下步骤:
步骤一:根据现有的微博数据,一个用户用一个节点表示;如果两个用户存在彼此之间的关注,则两个用户之间有一条连边;构建具有N个节点的微博网络模型G(V,E),V表示节点,E表示节点之间连边;
步骤四:将微博网络中的节点看成有质量的节点,计算微博网络中任意节点i的质量
其中,mi表示节点i的质量,k表示节点i在微博网络G中的直接邻居节点的数量;Dij表示节点i与节点j之间的距离;
步骤五:计算任意节点i的邻居合力
步骤六:计算任意节点i的邻居合力中心性
步骤七:遍历微博网络,计算所有节点的邻居合力中心性NFC的值,将NFC>0的节点放入中心节点集合cluster中,将NFC≤0的节点放入普通节点集合uncluster中;
步骤八:任意选取普通节点集合uncluster中的一个节点,将其归属到与cluster集合中距离最近的节点所代表的社区,若其与cluster集合中距离最近的节点不止一个,将这个节点归属到NFC值更大的节点所代表的社区;遍历集合uncluster,用同样方法将所有普通节点都归属到集合cluster中节点所代表的相应社区,从而获得微博网络的初始社区划分,初始社区的数量为集合cluster当中的中心节点的数量;
步骤九:给微博网络中当前的社区编号1,2,3...,H,H表示微博网络现有的社区数量,根据现有微博网络的社区结构,计算微博网络的模块度
其中,lc表示社区c内部所包含的边数,dc表示社区c中所有节点的度值之和,E表示微博网络中边的总数;
步骤十:任意选取微博网络G中的两个编号为m、n的社区,将二者合并,计算合并后微博网络的模块度,并将求得的模块度存入矩阵R中,Rmn表示社区m与社区n合并后的微博网络的模块度;其中,矩阵R为一个上三角矩阵;解除本次社区合并,用同样的方法计算任意两个社区合并后的微博网络的模块度,并将其记录到矩阵R中;
步骤十一:找到矩阵R中数值最大的元素Rmax,以及对应的行列号m、n;比较Rmax与Q的大小,若Rmax>Q,则将社区m与社区n合并,更新微博网络的社区结构;重复进行步骤九、步骤十、步骤十一,如果Rmax≤Q,则当前的社区结构为最终的微博网络用户社区结构。
本发明的技术构思为:基于网络表征学习方法把微博网络拓扑结构转化为欧氏空间向量,通过网络节点的邻居合力中心性确定初始社区中心,利用模块度优化社区,提高了网络社区发现的准确性。
本发明的有益效果为:运用了网络表征学习,综合考虑了网络节点的邻居合力和节点间的距离,提高了社区发现的速度;并通过优化模块度,提高了社区发现的速度和精度。
附图说明
图1为一个简单的微博网络示意图,图中的节点表示微博网络的用户,1,2,3,...,14为相应的用户编号,如果用户之间有相互的关注,则两节点之间有一条连边。
具体实施方式
下面结合附图对本发明做进一步说明。
参照图1,一种基于网络表征学习和邻居合力的微博用户社区发现方法,包括如下步骤:
步骤一:根据现有的微博数据,一个用户用一个节点表示,即图1中的圆,1,2,3,...,14为相应的用户编号;如果两个用户存在彼此之间的关注,则两个用户之间有一条连边,如图1中的节点1与节点2因为相互关注,所以两节点之间有一条连边;构建具有N个节点的微博网络模型G(V,E),V表示节点,E表示节点之间连边;
步骤四:将微博网络中的节点看成有质量的节点,计算微博网络中任意节点i的质量
其中,mi表示节点i的质量,k表示节点i在微博网络G中的直接邻居节点的数量;Dij表示节点i与节点j之间的距离;
步骤五:计算任意节点i的邻居合力
步骤六:计算任意节点i的邻居合力中心性
步骤七:遍历微博网络,计算所有节点的邻居合力中心性NFC的值,将NFC>0的节点放入中心节点集合cluster中,将NFC≤0的节点放入普通节点集合uncluster中;
步骤八:任意选取普通节点集合uncluster中的一个节点,将其归属到与cluster集合中距离最近的节点所代表的社区,若其与cluster集合中距离最近的节点不止一个,将这个节点归属到NFC值更大的节点所代表的社区;遍历集合uncluster,用同样方法将所有普通节点都归属到集合cluster中节点所代表的相应社区,从而获得微博网络的初始社区划分,初始社区的数量为集合cluster当中的中心节点的数量;
步骤九:给微博网络中当前的社区编号1,2,3...,H,H表示微博网络现有的社区数量,根据现有微博网络的社区结构,计算微博网络的模块度
其中,lc表示社区c内部所包含的边数,dc表示社区c中所有节点的度值之和,E表示微博网络中边的总数;
步骤十:任意选取微博网络G中的两个编号为m、n的社区,将二者合并,计算合并后微博网络的模块度,并将求得的模块度存入矩阵R中,Rmn表示社区m与社区n合并后的微博网络的模块度;其中,矩阵R为一个上三角矩阵;解除本次社区合并,用同样的方法计算任意两个社区合并后的微博网络的模块度,并将其记录到矩阵R中;
步骤十一:找到矩阵R中数值最大的元素Rmax,以及对应的行列号m、n;比较Rmax与Q的大小,若Rmax>Q,则将社区m与社区n合并,更新微博网络的社区结构;重复进行步骤九、步骤十、步骤十一,如果Rmax≤Q,则当前的社区结构为最终的微博网络用户社区结构。
如上所述,本专利实施的具体实现步骤使本发明更加清晰。在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。
Claims (1)
1.一种基于网络表征学习和邻居合力的微博用户社区发现方法,其特征在于,所述方法包括以下步骤:
步骤一:根据现有的微博数据,一个用户用一个节点表示;如果两个用户存在彼此之间的关注,则两个用户之间有一条连边;构建具有N个节点的微博网络模型G(V,E),V表示节点,E表示节点之间连边;
步骤四:将微博网络中的节点看成有质量的节点,计算微博网络中任意节点i的质量
其中,mi表示节点i的质量,k表示节点i在微博网络G中的直接邻居节点的数量;Dij表示节点i与节点j之间的距离;
步骤五:计算任意节点i的邻居合力
步骤六:计算任意节点i的邻居合力中心性
步骤七:遍历微博网络,计算所有节点的邻居合力中心性NFC的值,将NFC>0的节点放入中心节点集合cluster中,将NFC≤0的节点放入普通节点集合uncluster中;
步骤八:任意选取普通节点集合uncluster中的一个节点,将其归属到与cluster集合中距离最近的节点所代表的社区,若其与cluster集合中距离最近的节点不止一个,将这个节点归属到NFC值更大的节点所代表的社区;遍历集合uncluster,用同样方法将所有普通节点都归属到集合cluster中节点所代表的相应社区,从而获得微博网络的初始社区划分,初始社区的数量为集合cluster当中的中心节点的数量;
步骤九:给微博网络中当前的社区编号1,2,3...,H,H表示微博网络现有的社区数量,根据现有微博网络的社区结构,计算微博网络的模块度
其中,lc表示社区c内部所包含的边数,dc表示社区c中所有节点的度值之和,E表示微博网络中边的总数;
步骤十:任意选取微博网络G中的两个编号为m、n的社区,将二者合并,计算合并后微博网络的模块度,并将求得的模块度存入矩阵R中,Rmn表示社区m与社区n合并后的微博网络的模块度;其中,矩阵R为一个上三角矩阵;解除本次社区合并,用同样的方法计算任意两个社区合并后的微博网络的模块度,并将其记录到矩阵R中;
步骤十一:找到矩阵R中数值最大的元素Rαβ,以及对应的行列号α、β;比较Rαβ与Q的大小,若Rαβ>Q,则将社区α与社区β合并,更新微博网络的社区结构;重复进行步骤九、步骤十、步骤十一,如果Rαβ≤Q,则当前的社区结构为最终的微博网络用户社区结构。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910802017.1A CN110569415B (zh) | 2019-08-28 | 2019-08-28 | 一种基于网络表征学习和邻居合力的微博用户社区发现方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910802017.1A CN110569415B (zh) | 2019-08-28 | 2019-08-28 | 一种基于网络表征学习和邻居合力的微博用户社区发现方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110569415A CN110569415A (zh) | 2019-12-13 |
CN110569415B true CN110569415B (zh) | 2021-06-18 |
Family
ID=68776517
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910802017.1A Active CN110569415B (zh) | 2019-08-28 | 2019-08-28 | 一种基于网络表征学习和邻居合力的微博用户社区发现方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110569415B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112084418B (zh) * | 2020-07-29 | 2023-07-28 | 浙江工业大学 | 一种基于邻居信息和属性网络表征学习的微博用户社团发现方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105849764A (zh) * | 2013-10-25 | 2016-08-10 | 西斯摩斯公司 | 用于识别社交数据网络中的影响者及其社区的系统和方法 |
CN109166047A (zh) * | 2018-08-04 | 2019-01-08 | 福州大学 | 基于密度聚类的增量动态社区发现方法 |
CN109189867A (zh) * | 2018-10-23 | 2019-01-11 | 中山大学 | 基于公司知识图谱的关系发现方法、装置及存储介质 |
CN109255376A (zh) * | 2018-08-28 | 2019-01-22 | 浙江工业大学 | 一种基于自适应度惩罚和社区信息的预测网络连边的方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10664744B2 (en) * | 2015-10-13 | 2020-05-26 | Facebook, Inc. | End-to-end memory networks |
-
2019
- 2019-08-28 CN CN201910802017.1A patent/CN110569415B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105849764A (zh) * | 2013-10-25 | 2016-08-10 | 西斯摩斯公司 | 用于识别社交数据网络中的影响者及其社区的系统和方法 |
CN109166047A (zh) * | 2018-08-04 | 2019-01-08 | 福州大学 | 基于密度聚类的增量动态社区发现方法 |
CN109255376A (zh) * | 2018-08-28 | 2019-01-22 | 浙江工业大学 | 一种基于自适应度惩罚和社区信息的预测网络连边的方法 |
CN109189867A (zh) * | 2018-10-23 | 2019-01-11 | 中山大学 | 基于公司知识图谱的关系发现方法、装置及存储介质 |
Non-Patent Citations (1)
Title |
---|
基于重叠社团划分的大规模道路网络双层路由算法;杨旭华 等;《计算机科学》;20150630;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN110569415A (zh) | 2019-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110955834B (zh) | 一种知识图谱驱动的个性化精准推荐方法 | |
CN109635989B (zh) | 一种基于多源异构数据融合的社交网络链路预测方法 | |
CN105677648B (zh) | 一种基于标签传播算法的社团发现方法及系统 | |
CN101916256A (zh) | 综合行动者兴趣与网络拓扑的社区发现方法 | |
CN112149000B (zh) | 一种基于网络嵌入的在线社交网络用户社区发现方法 | |
CN107391542A (zh) | 一种基于文件知识图谱的开源软件社区专家推荐方法 | |
CN112269922B (zh) | 一种基于网络表示学习的社区舆论关键人物发现方法 | |
CN113094593B (zh) | 社交网络事件推荐方法、系统、设备及存储介质 | |
CN110263236A (zh) | 基于动态多视图学习模型的社交网络用户多标签分类方法 | |
CN110234155A (zh) | 一种基于改进topsis的超密集网络接入选择方法 | |
CN114117945B (zh) | 基于用户-服务交互图的深度学习云服务QoS预测方法 | |
CN116340646A (zh) | 一种基于超图基序优化多元用户表示的推荐方法 | |
CN110569415B (zh) | 一种基于网络表征学习和邻居合力的微博用户社区发现方法 | |
CN110825935A (zh) | 社区核心人物挖掘方法、系统、电子设备及可读存储介质 | |
CN107357858B (zh) | 一种基于地理位置的网络重构方法 | |
CN107346333B (zh) | 一种基于链路预测的在线社交网络好友推荐方法与系统 | |
CN112836822A (zh) | 基于宽度学习的联邦学习策略优化方法和装置 | |
CN115775026A (zh) | 一种基于组织相似度的联邦学习方法 | |
CN112084418B (zh) | 一种基于邻居信息和属性网络表征学习的微博用户社团发现方法 | |
CN108614932B (zh) | 基于边图的线性流重叠社区发现方法、系统及存储介质 | |
CN105159918A (zh) | 一种基于信任关联度的微博网络社区发现方法 | |
CN106157150B (zh) | 信息处理方法与信息处理装置 | |
Yuan et al. | A mixing evolution model for bidirectional microblog user networks | |
CN116304773A (zh) | 基于图神经网络的社区发现方法 | |
CN112131486B (zh) | 基于图卷积神经网络的电商网络平台用户社区发现方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |