CN103051476A - 基于拓扑分析的网络社区发现方法 - Google Patents

基于拓扑分析的网络社区发现方法 Download PDF

Info

Publication number
CN103051476A
CN103051476A CN2012105651391A CN201210565139A CN103051476A CN 103051476 A CN103051476 A CN 103051476A CN 2012105651391 A CN2012105651391 A CN 2012105651391A CN 201210565139 A CN201210565139 A CN 201210565139A CN 103051476 A CN103051476 A CN 103051476A
Authority
CN
China
Prior art keywords
community
community network
network
matrix
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012105651391A
Other languages
English (en)
Other versions
CN103051476B (zh
Inventor
王益文
姚敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201210565139.1A priority Critical patent/CN103051476B/zh
Publication of CN103051476A publication Critical patent/CN103051476A/zh
Application granted granted Critical
Publication of CN103051476B publication Critical patent/CN103051476B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及用于分析节点之间相互关系的方法,公开了一种基于拓扑分析的网络社区发现方法,通过拓扑分析处理社会网络,达到社区发现的结果。本发明的优点在于,采用确定的计算步骤获得社区发现的效果,无需诸如节点标签、连接边标签等额外信息,仅仅使用最为基本的拓扑连接信息和确定的步骤即可达到社区发现的结果,普适性较高,社区发现结果的正确率较高,具有较高的应用价值。

Description

基于拓扑分析的网络社区发现方法
技术领域
本发明涉及用于分析节点之间相互关系的方法,特别涉及一种基于拓扑分析的网络社区发现方法。
背景技术
社会网络是由一些个人或组织以及它们之间的联系所构成的集合,这种关系可能是同事、朋友、亲属等各种关系。现实世界中的社会网络,不仅包括狭义的社会网络,还包括技术、生物和经济等网络实例,如电力网格、电话交换网、万维网、科学家合著关系网和引用关系网。随着网络技术的发展,特别是像Facebook、Twitter,以及国内的人人网,开心网等在线社会网络网站的涌现,越来多的个人用户加入到由这些虚拟关系所构筑的网络中,我们称这样的网络为社会网络。
社会网络的研究特别是社区发现的研究对我们研究人类社会有特别重要的意义。可以帮助我们更好理解发现社会网络的成长历程与未来发展发现。特别是在线社会网络的迅猛发展,使得社会网络数据的获取与研究更加方便快捷。社会网络社区发现方法可以提高社会网络的个性化推荐质量,是目前社会网络分析领域的研究热点之一。
目前已存在一些相关的社会网络社区发现方法。例如,申请号为200810224175.5,名称为“一种复杂网络中的社区划分方法”的发明专利公开了一种以若干个不同的局部带有影响力的节点为核心,并使节点的影响力从核心逐层向外均匀扩散,最终形成以影响力最大的节点为核心,相互关联形成局部区域的方法。按照所采用的基本求解策略,可以归纳为两大类:基于优化的方法和启发式方法。前者将社会网络社区发现问题转化为优化问题,通过最优化预定义的目标函数来计算社会网络的社区结构,例如,谱方法将网络聚类问题转化为二次型优化问题,通过计算特殊矩阵的特征向量来优化预定义的“截”函数,“截”即指子网间的连接密度.具有最小“截”的划分被认为是最优的网络划分,针对不同问题,提出了不同的“截”函数,例如,针对分布式系统负载平衡提出的“平均截”、针对大规模集成电路设计提出的“比率截”以及针对图像分割提出的“规范截”等。而后者将社会网络社区问题转化为预定义启发式规则的设计问题,例如,由 Girvan 和 Newman 在 2002 年提出的Girvan 和 Newman (简称GN)算法也采用反复识别和删除簇间连接的策略聚类复杂网络,但 GN 算法采用了新的启发式规则:簇间连接的边介数应大于簇内连接的边介数,连接的边介数定义为网络中经过该连接的任意两点间最短路径的条数,GN 算法通过反复计算边介数、识别簇间连接、删除簇间连接,以自顶向下的方式建立一棵层次聚类树。目前存在的相关方法得到的社区发现结果正确率还不够理想。
发明内容
本发明针对现有方法步骤复杂,所得社区发现结果正确率不高的缺点,提供了一种步骤少,社区发现准确率高的新型基于拓扑分析的网络社区发现方法。
为实现上述目的,本发明可采取下述技术方案:
基于拓扑分析的网络社区发现方法,包括以下具体步骤:
步骤一:建立所述社会网络拓扑结构的邻接矩阵M,所述拓扑结构包括N个节点,所述邻接矩阵M为N×N的矩阵;
步骤二:确定所述社会网络拓扑结构中所包含的社区数目K;
步骤三:以所述邻接矩阵M的幂作为所述社会网络拓扑结构的分析矩阵M’;
步骤四:计算所述分析矩阵M’每一行所有数值的总和,根据计算得到的所述分析矩阵M’每一行的总和对所述社会网络拓扑结构的节点进行递减排序;
步骤五:根据所述步骤四的排序结果,选择所述分析矩阵M’每一行的总和最大的前K个节点作为所述社会网络的中心节点;
步骤六:确定所述中心节点与所述社会网络中每个节点的亲近度,在所述分析矩阵M’上分别找到与所述中心节点相对应的行,所述行中每一列的数值即为所述中心节点与所述社会网络中每个节点的亲近度;
步骤七:将所述社会网络划分成K个社区,将所述中心节点分别与所述社区一一对应,将所述社区网络中除了中心节点之外的其他节点归入与所述其他节点具有最大亲近度的中心节点所对应的社区。
作为优选,所述步骤二中,所述社区数目K为所述社会网络中已经发现的社区数目,或者为所述社会网络的直径,所述社会网络的直径为所述社会网络中任意两个节点之间最短距离的最大值。
作为优选,所述步骤三中,以所述邻接矩阵M的六次幂作为所述社会网络拓扑结构的分析矩阵M’。
上述技术方案中的社会网络的直径可以依照已经公开的文献所记载的方法进行计算,以下文献(Skiena, Steven. Implementing discrete mathematics - combinatorics and graph theory with Mathematica. Addison-Wesley,  1990,  p.107.)已经公开了上述计算社会网络直径的方法。
本发明由于采用了以上技术方案,具有显著的技术效果:
本发明方法不需要诸如节点标签、连接边标签等额外信息,仅仅使用最为基本的拓扑连接信息达到社区发现结果,具有较高的普适性。同时,也很容易与其他方法相结合以提高社区发现结果质量。与现有的一些社区发现方法相比,本发明方法每一步骤计算是确定的,而不是具有随机性不确定性。在社区发现结果上,本发明方法得到的社区结果正确率要比现有算法更高。
附图说明
图1为实施例1的网络社区组织关系示意图。
图2为实施例1的邻接矩阵的结果示意图。
图3为实施例1的分析矩阵的结果示意图。
具体实施方式
下面结合实施例对本发明作进一步的详细描述。
实施例1
基于拓扑分析的网络社区发现方法,以社会网络社区发现的经典例子zachary网络为例,本实施例所使用的社会网络如图1所示,zachary网络是一个空手道俱乐部网络,共有34名成员,该俱乐部主席和教练由于产生分歧矛盾,导致俱乐部成员选择自己支持的一方而分成2个社区。这是一个比较具有代表性的社会网络,大部分社区发现方法都会用这个数据集进行测试。包括以下具体步骤:
步骤一:建立所述社会网络拓扑结构的邻接矩阵M,所述拓扑结构包括N个节点,所述邻接矩阵M为N×N的矩阵。邻接矩阵是指矩阵中的元素只为0或者1,0表示行和列代表的社会网络中的节点不相连,1表示行和列代表的社会网络中的节点是相连的。由图1可知,这里的社会网络包括有34个节点,因此生成的邻接矩阵M为34×34的矩阵,所得到的邻接矩阵M如图2所示。
步骤二:确定所述社会网络拓扑结构中所包含的社区数目K。所述社区数目K为所述社会网络中已经发现的社区数目,或者为所述社会网络的直径,所述社会网络的直径为所述社会网络中任意两个节点之间最短距离的最大值。
步骤三:以所述邻接矩阵M的六次幂作为所述社会网络拓扑结构的分析矩阵M’。这里,分析矩阵M’也是一个34×34的矩阵,所得到的分析矩阵M’如图3所示。
步骤四:计算所述分析矩阵M’每一行所有数值的总和,根据计算得到的所述分析矩阵M’每一行的总和对所述社会网络拓扑结构的节点进行递减排序。
步骤五:根据所述步骤四的排序结果,选择所述分析矩阵M’每一行的总和最大的前K个节点作为所述社会网络的中心节点。
步骤六:确定所述中心节点与所述社会网络中每个节点的亲近度,上述分析矩阵M’的横坐标、纵坐标分别表示节点的编号,分析矩阵M’的值就是所述的亲近度。在所述分析矩阵M’上分别找到与所述中心节点相对应的行,所述行中每一列的数值即为所述中心节点与所述社会网络中每个节点的亲近度。
步骤七:将所述社会网络划分成K个社区,将所述中心节点分别与所述社区一一对应,将所述社区网络中除了中心节点之外的其他节点归入与所述其他节点具有最大亲近度的中心节点所对应的社区。
我们可以发现,通过上述方法所得到的社区发现的结果与zachary社会网络的真实社区情况完全一样。
总之,以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所作的均等变化与修饰,皆应属本发明专利的涵盖范围。

Claims (3)

1.一种基于拓扑分析的网络社区发现方法,其特征在于,包括以下具体步骤:
步骤一:建立所述社会网络拓扑结构的邻接矩阵M,所述拓扑结构包括N个节点,所述邻接矩阵M为N×N的矩阵;
步骤二:确定所述社会网络拓扑结构中所包含的社区数目K;
步骤三:以所述邻接矩阵M的幂作为所述社会网络拓扑结构的分析矩阵M’;
步骤四:计算所述分析矩阵M’每一行所有数值的总和,根据计算得到的所述分析矩阵M’每一行的总和对所述社会网络拓扑结构的节点进行递减排序;
步骤五:根据所述步骤四的排序结果,选择所述分析矩阵M’每一行的总和最大的前K个节点作为所述社会网络的中心节点;
步骤六:确定所述中心节点与所述社会网络中每个节点的亲近度,在所述分析矩阵M’上分别找到与所述中心节点相对应的行,所述行中每一列的数值即为所述中心节点与所述社会网络中每个节点的亲近度;
步骤七:将所述社会网络划分成K个社区,将所述中心节点分别与所述社区一一对应,将所述社区网络中除了中心节点之外的其他节点归入与所述其他节点具有最大亲近度的中心节点所对应的社区。
2.根据权利要求1所述基于拓扑分析的网络社区发现方法,其特征在于,所述步骤二中,所述社区数目K为所述社会网络中已经发现的社区数目,或者为所述社会网络的直径,所述社会网络的直径为所述社会网络中任意两个节点之间最短距离的最大值。
3.根据权利要求1所述基于拓扑分析的网络社区发现方法,其特征在于,所述步骤三中,以所述邻接矩阵M的六次幂作为所述社会网络拓扑结构的分析矩阵M’。
CN201210565139.1A 2012-12-24 2012-12-24 基于拓扑分析的网络社区发现方法 Expired - Fee Related CN103051476B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210565139.1A CN103051476B (zh) 2012-12-24 2012-12-24 基于拓扑分析的网络社区发现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210565139.1A CN103051476B (zh) 2012-12-24 2012-12-24 基于拓扑分析的网络社区发现方法

Publications (2)

Publication Number Publication Date
CN103051476A true CN103051476A (zh) 2013-04-17
CN103051476B CN103051476B (zh) 2015-04-22

Family

ID=48063981

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210565139.1A Expired - Fee Related CN103051476B (zh) 2012-12-24 2012-12-24 基于拓扑分析的网络社区发现方法

Country Status (1)

Country Link
CN (1) CN103051476B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104243234A (zh) * 2014-09-11 2014-12-24 清华大学 社会网络传播拓扑中用户关系构建方法及系统
CN104408149A (zh) * 2014-12-04 2015-03-11 威海北洋电气集团股份有限公司 基于社交网络分析的犯罪嫌疑人挖掘关联方法及系统
CN112529715A (zh) * 2019-09-18 2021-03-19 杭州联保致新科技有限公司 一种基于复杂拓扑网络分析的车辆理赔群体欺诈识别方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101916256A (zh) * 2010-07-13 2010-12-15 北京大学 综合行动者兴趣与网络拓扑的社区发现方法
CN102073700A (zh) * 2010-12-30 2011-05-25 浙江大学 一种复杂网络社团的发现方法
CN102594909A (zh) * 2012-03-14 2012-07-18 西安电子科技大学 基于共邻矩阵谱信息的多目标社区检测方法
US20120284384A1 (en) * 2011-03-29 2012-11-08 International Business Machines Corporation Computer processing method and system for network data

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101916256A (zh) * 2010-07-13 2010-12-15 北京大学 综合行动者兴趣与网络拓扑的社区发现方法
CN102073700A (zh) * 2010-12-30 2011-05-25 浙江大学 一种复杂网络社团的发现方法
US20120284384A1 (en) * 2011-03-29 2012-11-08 International Business Machines Corporation Computer processing method and system for network data
CN102594909A (zh) * 2012-03-14 2012-07-18 西安电子科技大学 基于共邻矩阵谱信息的多目标社区检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WANG YIWEN等: "A novel method for community detection in complex network using new representation for communities", 《PROCEEDINGS OF PAKDD 2011 WORKSHOPS》 *
朱大勇等: "利用局部拓扑信息发现模糊社团结构", 《电子科技大学学报》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104243234A (zh) * 2014-09-11 2014-12-24 清华大学 社会网络传播拓扑中用户关系构建方法及系统
CN104243234B (zh) * 2014-09-11 2017-07-07 清华大学 社会网络传播拓扑中用户关系构建方法及系统
CN104408149A (zh) * 2014-12-04 2015-03-11 威海北洋电气集团股份有限公司 基于社交网络分析的犯罪嫌疑人挖掘关联方法及系统
CN104408149B (zh) * 2014-12-04 2017-12-12 威海北洋电气集团股份有限公司 基于社交网络分析的犯罪嫌疑人挖掘关联方法及系统
CN112529715A (zh) * 2019-09-18 2021-03-19 杭州联保致新科技有限公司 一种基于复杂拓扑网络分析的车辆理赔群体欺诈识别方法

Also Published As

Publication number Publication date
CN103051476B (zh) 2015-04-22

Similar Documents

Publication Publication Date Title
Yang et al. Community mining from signed social networks
CN103325061B (zh) 一种社区发现方法和系统
Mincer et al. Application of social network analysis to the investigation of interpersonal connections
Shahrivar et al. The strategic formation of multi-layer networks
CN104077723A (zh) 一种社交网络推荐系统及方法
CN107392782A (zh) 基于word2Vec的社团构建方法、装置及计算机处理设备
CN107346333B (zh) 一种基于链路预测的在线社交网络好友推荐方法与系统
Zhao et al. Bilateral filtering graph convolutional network for multi-relational social recommendation in the power-law networks
CN103051476B (zh) 基于拓扑分析的网络社区发现方法
Meena et al. A survey on community detection algorithm and its applications
Sun et al. Graph Based Long-Term And Short-Term Interest Model for Click-Through Rate Prediction
Moosavi et al. Community detection in online social networks using actions of users
CN115130044B (zh) 一种基于二阶h指数的影响力节点识别方法和系统
Bagheri et al. An efficient and fast influence maximization algorithm based on community detection
CN110263106A (zh) 协同舆论欺诈检测方法和装置
Sharma et al. Comparative analysis of different algorithms in link prediction on social networks
Song et al. Inferring explicit and implicit social ties simultaneously in mobile social networks
CN112579831B (zh) 基于SimRank全局矩阵平滑收敛的网络社区发现方法、装置及存储介质
KR102409160B1 (ko) 복수개의 커뮤니티를 포함하는 네트워크에서 커뮤니티 재구성 방법 및 이를 위한 전자 장치
Nesmachnow et al. Evolutionary algorithms applied to reliable communication network design
Muhuri et al. An edge contribution-based approach to identify influential nodes from online social networks
Rozario et al. Community detection in social network using temporal data
Suryateja et al. Survey on efficient community detection in social networks
Jahanbakhsh et al. Human contact prediction using contact graph inference
Li et al. Understanding service integration of online social networks: A data-driven study

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150422

Termination date: 20191224

CF01 Termination of patent right due to non-payment of annual fee