CN103051476B - 基于拓扑分析的网络社区发现方法 - Google Patents
基于拓扑分析的网络社区发现方法 Download PDFInfo
- Publication number
- CN103051476B CN103051476B CN201210565139.1A CN201210565139A CN103051476B CN 103051476 B CN103051476 B CN 103051476B CN 201210565139 A CN201210565139 A CN 201210565139A CN 103051476 B CN103051476 B CN 103051476B
- Authority
- CN
- China
- Prior art keywords
- community
- network
- community network
- matrix
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000004458 analytical method Methods 0.000 title claims abstract description 26
- 239000011159 matrix material Substances 0.000 claims description 44
- 238000010937 topological data analysis Methods 0.000 claims description 7
- 230000000694 effects Effects 0.000 abstract description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 235000005156 Brassica carinata Nutrition 0.000 description 1
- 244000257790 Brassica carinata Species 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 239000003637 basic solution Substances 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明涉及用于分析节点之间相互关系的方法,公开了一种基于拓扑分析的网络社区发现方法,通过拓扑分析处理社会网络,达到社区发现的结果。本发明的优点在于,采用确定的计算步骤获得社区发现的效果,无需诸如节点标签、连接边标签等额外信息,仅仅使用最为基本的拓扑连接信息和确定的步骤即可达到社区发现的结果,普适性较高,社区发现结果的正确率较高,具有较高的应用价值。
Description
技术领域
本发明涉及用于分析节点之间相互关系的方法,特别涉及一种基于拓扑分析的网络社区发现方法。
背景技术
社会网络是由一些个人或组织以及它们之间的联系所构成的集合,这种关系可能是同事、朋友、亲属等各种关系。现实世界中的社会网络,不仅包括狭义的社会网络,还包括技术、生物和经济等网络实例,如电力网格、电话交换网、万维网、科学家合著关系网和引用关系网。随着网络技术的发展,特别是像Facebook、Twitter,以及国内的人人网,开心网等在线社会网络网站的涌现,越来多的个人用户加入到由这些虚拟关系所构筑的网络中,我们称这样的网络为社会网络。
社会网络的研究特别是社区发现的研究对我们研究人类社会有特别重要的意义。可以帮助我们更好理解发现社会网络的成长历程与未来发展发现。特别是在线社会网络的迅猛发展,使得社会网络数据的获取与研究更加方便快捷。社会网络社区发现方法可以提高社会网络的个性化推荐质量,是目前社会网络分析领域的研究热点之一。
目前已存在一些相关的社会网络社区发现方法。例如,申请号为200810224175.5,名称为“一种复杂网络中的社区划分方法”的发明专利公开了一种以若干个不同的局部带有影响力的节点为核心,并使节点的影响力从核心逐层向外均匀扩散,最终形成以影响力最大的节点为核心,相互关联形成局部区域的方法。按照所采用的基本求解策略,可以归纳为两大类:基于优化的方法和启发式方法。前者将社会网络社区发现问题转化为优化问题,通过最优化预定义的目标函数来计算社会网络的社区结构,例如,谱方法将网络聚类问题转化为二次型优化问题,通过计算特殊矩阵的特征向量来优化预定义的“截”函数,“截”即指子网间的连接密度.具有最小“截”的划分被认为是最优的网络划分,针对不同问题,提出了不同的“截”函数,例如,针对分布式系统负载平衡提出的“平均截”、针对大规模集成电路设计提出的“比率截”以及针对图像分割提出的“规范截”等。而后者将社会网络社区问题转化为预定义启发式规则的设计问题,例如,由 Girvan 和 Newman 在 2002 年提出的Girvan 和 Newman (简称GN)算法也采用反复识别和删除簇间连接的策略聚类复杂网络,但 GN 算法采用了新的启发式规则:簇间连接的边介数应大于簇内连接的边介数,连接的边介数定义为网络中经过该连接的任意两点间最短路径的条数,GN 算法通过反复计算边介数、识别簇间连接、删除簇间连接,以自顶向下的方式建立一棵层次聚类树。目前存在的相关方法得到的社区发现结果正确率还不够理想。
发明内容
本发明针对现有方法步骤复杂,所得社区发现结果正确率不高的缺点,提供了一种步骤少,社区发现准确率高的新型基于拓扑分析的网络社区发现方法。
为实现上述目的,本发明可采取下述技术方案:
基于拓扑分析的网络社区发现方法,包括以下具体步骤:
步骤一:建立所述社会网络拓扑结构的邻接矩阵M,所述拓扑结构包括N个节点,所述邻接矩阵M为N×N的矩阵;
步骤二:确定所述社会网络拓扑结构中所包含的社区数目K;
步骤三:以所述邻接矩阵M的幂作为所述社会网络拓扑结构的分析矩阵M’;
步骤四:计算所述分析矩阵M’每一行所有数值的总和,根据计算得到的所述分析矩阵M’每一行的总和对所述社会网络拓扑结构的节点进行递减排序;
步骤五:根据所述步骤四的排序结果,选择所述分析矩阵M’每一行的总和最大的前K个节点作为所述社会网络的中心节点;
步骤六:确定所述中心节点与所述社会网络中每个节点的亲近度,在所述分析矩阵M’上分别找到与所述中心节点相对应的行,所述行中每一列的数值即为所述中心节点与所述社会网络中每个节点的亲近度;
步骤七:将所述社会网络划分成K个社区,将所述中心节点分别与所述社区一一对应,将所述社区网络中除了中心节点之外的其他节点归入与所述其他节点具有最大亲近度的中心节点所对应的社区。
作为优选,所述步骤二中,所述社区数目K为所述社会网络中已经发现的社区数目,或者为所述社会网络的直径,所述社会网络的直径为所述社会网络中任意两个节点之间最短距离的最大值。
作为优选,所述步骤三中,以所述邻接矩阵M的六次幂作为所述社会网络拓扑结构的分析矩阵M’。
上述技术方案中的社会网络的直径可以依照已经公开的文献所记载的方法进行计算,以下文献(Skiena, Steven. Implementing discrete mathematics - combinatorics and graph theory with Mathematica. Addison-Wesley, 1990, p.107.)已经公开了上述计算社会网络直径的方法。
本发明由于采用了以上技术方案,具有显著的技术效果:
本发明方法不需要诸如节点标签、连接边标签等额外信息,仅仅使用最为基本的拓扑连接信息达到社区发现结果,具有较高的普适性。同时,也很容易与其他方法相结合以提高社区发现结果质量。与现有的一些社区发现方法相比,本发明方法每一步骤计算是确定的,而不是具有随机性不确定性。在社区发现结果上,本发明方法得到的社区结果正确率要比现有算法更高。
附图说明
图1为实施例1的网络社区组织关系示意图。
图2为实施例1的邻接矩阵的结果示意图。
图3为实施例1的分析矩阵的结果示意图。
具体实施方式
下面结合实施例对本发明作进一步的详细描述。
实施例1
基于拓扑分析的网络社区发现方法,以社会网络社区发现的经典例子zachary网络为例,本实施例所使用的社会网络如图1所示,zachary网络是一个空手道俱乐部网络,共有34名成员,该俱乐部主席和教练由于产生分歧矛盾,导致俱乐部成员选择自己支持的一方而分成2个社区。这是一个比较具有代表性的社会网络,大部分社区发现方法都会用这个数据集进行测试。包括以下具体步骤:
步骤一:建立所述社会网络拓扑结构的邻接矩阵M,所述拓扑结构包括N个节点,所述邻接矩阵M为N×N的矩阵。邻接矩阵是指矩阵中的元素只为0或者1,0表示行和列代表的社会网络中的节点不相连,1表示行和列代表的社会网络中的节点是相连的。由图1可知,这里的社会网络包括有34个节点,因此生成的邻接矩阵M为34×34的矩阵,所得到的邻接矩阵M如图2所示。
步骤二:确定所述社会网络拓扑结构中所包含的社区数目K。所述社区数目K为所述社会网络中已经发现的社区数目,或者为所述社会网络的直径,所述社会网络的直径为所述社会网络中任意两个节点之间最短距离的最大值。
步骤三:以所述邻接矩阵M的六次幂作为所述社会网络拓扑结构的分析矩阵M’。这里,分析矩阵M’也是一个34×34的矩阵,所得到的分析矩阵M’如图3所示。
步骤四:计算所述分析矩阵M’每一行所有数值的总和,根据计算得到的所述分析矩阵M’每一行的总和对所述社会网络拓扑结构的节点进行递减排序。
步骤五:根据所述步骤四的排序结果,选择所述分析矩阵M’每一行的总和最大的前K个节点作为所述社会网络的中心节点。
步骤六:确定所述中心节点与所述社会网络中每个节点的亲近度,上述分析矩阵M’的横坐标、纵坐标分别表示节点的编号,分析矩阵M’的值就是所述的亲近度。在所述分析矩阵M’上分别找到与所述中心节点相对应的行,所述行中每一列的数值即为所述中心节点与所述社会网络中每个节点的亲近度。
步骤七:将所述社会网络划分成K个社区,将所述中心节点分别与所述社区一一对应,将所述社区网络中除了中心节点之外的其他节点归入与所述其他节点具有最大亲近度的中心节点所对应的社区。
我们可以发现,通过上述方法所得到的社区发现的结果与zachary社会网络的真实社区情况完全一样。
总之,以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所作的均等变化与修饰,皆应属本发明专利的涵盖范围。
Claims (1)
1.一种基于拓扑分析的网络社区发现方法,其特征在于,包括以下具体步骤:
步骤一:建立社会网络拓扑结构的邻接矩阵M,所述拓扑结构包括N个节点,所述邻接矩阵M为N×N的矩阵;
步骤二:确定所述社会网络拓扑结构中所包含的社区数目K,所述社区数目K为所述社会网络中已经发现的社区数目,或者为所述社会网络的直径,所述社会网络的直径为所述社会网络中任意两个节点之间最短距离的最大值;
步骤三:以所述邻接矩阵M的幂作为所述社会网络拓扑结构的分析矩阵M’;
步骤四:计算所述分析矩阵M’每一行所有数值的总和,根据计算得到的所述分析矩阵M’每一行的总和对所述社会网络拓扑结构的节点进行递减排序;
步骤五:根据所述步骤四的排序结果,选择所述分析矩阵M’每一行的总和最大的前K个节点作为所述社会网络的中心节点;
步骤六:确定所述中心节点与所述社会网络中每个节点的亲近度,在所述分析矩阵M’上分别找到与所述中心节点相对应的行,所述行中每一列的数值即为所述中心节点与所述社会网络中每个节点的亲近度;
步骤七:将所述社会网络划分成K个社区,将所述中心节点分别与所述社区一一对应,将所述社区网络中除了中心节点之外的其他节点归入与所述其他节点具有最大亲近度的中心节点所对应的社区。
2. 根据权利要求1所述基于拓扑分析的网络社区发现方法,其特征在于,所述步骤三中,以所述邻接矩阵M的六次幂作为所述社会网络拓扑结构的分析矩阵M’。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210565139.1A CN103051476B (zh) | 2012-12-24 | 2012-12-24 | 基于拓扑分析的网络社区发现方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210565139.1A CN103051476B (zh) | 2012-12-24 | 2012-12-24 | 基于拓扑分析的网络社区发现方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103051476A CN103051476A (zh) | 2013-04-17 |
CN103051476B true CN103051476B (zh) | 2015-04-22 |
Family
ID=48063981
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210565139.1A Expired - Fee Related CN103051476B (zh) | 2012-12-24 | 2012-12-24 | 基于拓扑分析的网络社区发现方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103051476B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104243234B (zh) * | 2014-09-11 | 2017-07-07 | 清华大学 | 社会网络传播拓扑中用户关系构建方法及系统 |
CN104408149B (zh) * | 2014-12-04 | 2017-12-12 | 威海北洋电气集团股份有限公司 | 基于社交网络分析的犯罪嫌疑人挖掘关联方法及系统 |
CN112529715A (zh) * | 2019-09-18 | 2021-03-19 | 杭州联保致新科技有限公司 | 一种基于复杂拓扑网络分析的车辆理赔群体欺诈识别方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101916256A (zh) * | 2010-07-13 | 2010-12-15 | 北京大学 | 综合行动者兴趣与网络拓扑的社区发现方法 |
CN102073700A (zh) * | 2010-12-30 | 2011-05-25 | 浙江大学 | 一种复杂网络社团的发现方法 |
CN102594909A (zh) * | 2012-03-14 | 2012-07-18 | 西安电子科技大学 | 基于共邻矩阵谱信息的多目标社区检测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102724219B (zh) * | 2011-03-29 | 2015-06-03 | 国际商业机器公司 | 网络数据的计算机处理方法及系统 |
-
2012
- 2012-12-24 CN CN201210565139.1A patent/CN103051476B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101916256A (zh) * | 2010-07-13 | 2010-12-15 | 北京大学 | 综合行动者兴趣与网络拓扑的社区发现方法 |
CN102073700A (zh) * | 2010-12-30 | 2011-05-25 | 浙江大学 | 一种复杂网络社团的发现方法 |
CN102594909A (zh) * | 2012-03-14 | 2012-07-18 | 西安电子科技大学 | 基于共邻矩阵谱信息的多目标社区检测方法 |
Non-Patent Citations (2)
Title |
---|
A novel method for community detection in complex network using new representation for communities;Wang Yiwen等;《Proceedings of PAKDD 2011 Workshops》;20110527;全文 * |
利用局部拓扑信息发现模糊社团结构;朱大勇等;《电子科技大学学报》;20110131;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN103051476A (zh) | 2013-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jiacheng et al. | A hybrid genetic algorithm based on information entropy and game theory | |
Yang et al. | Community mining from signed social networks | |
CN107633260B (zh) | 一种基于聚类的社交网络意见领袖挖掘方法 | |
Amin et al. | Hotspots analysis using cyber-physical-social system for a smart city | |
CN105721279B (zh) | 一种电信网络用户的交往圈挖掘方法及系统 | |
Hébert-Dufresne et al. | Percolation on random networks with arbitrary k-core structure | |
Zhao et al. | Bilateral filtering graph convolutional network for multi-relational social recommendation in the power-law networks | |
CN109753797A (zh) | 针对流式图的密集子图检测方法及系统 | |
Xin et al. | A location-context awareness mobile services collaborative recommendation algorithm based on user behavior prediction | |
Chen et al. | Understanding the user behavior of foursquare: A data-driven study on a global scale | |
CN114928548A (zh) | 一种社交网络信息传播规模预测方法及装置 | |
CN103051476B (zh) | 基于拓扑分析的网络社区发现方法 | |
Liu et al. | Influence nodes identifying method via community-based backward generating network framework | |
Meena et al. | A survey on community detection algorithm and its applications | |
Sun et al. | Graph Based Long-Term And Short-Term Interest Model for Click-Through Rate Prediction | |
Zheng et al. | Analysis of criminal social networks with typed and directed edges | |
CN115130044B (zh) | 一种基于二阶h指数的影响力节点识别方法和系统 | |
Moosavi et al. | Community detection in online social networks using actions of users | |
Nia et al. | Leveraging social interactions to suggest friends | |
Song et al. | Inferring explicit and implicit social ties simultaneously in mobile social networks | |
Chen et al. | An approximate algorithm for the robust design in a stochastic-flow network | |
CN110263106A (zh) | 协同舆论欺诈检测方法和装置 | |
CN112579831B (zh) | 基于SimRank全局矩阵平滑收敛的网络社区发现方法、装置及存储介质 | |
Noghabi et al. | Optimized query forwarding for resource discovery in unstructured peer-to-peer grids | |
KR102409160B1 (ko) | 복수개의 커뮤니티를 포함하는 네트워크에서 커뮤니티 재구성 방법 및 이를 위한 전자 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20150422 Termination date: 20191224 |