CN102073700B - 一种复杂网络社团的发现方法 - Google Patents

一种复杂网络社团的发现方法 Download PDF

Info

Publication number
CN102073700B
CN102073700B CN 201010613184 CN201010613184A CN102073700B CN 102073700 B CN102073700 B CN 102073700B CN 201010613184 CN201010613184 CN 201010613184 CN 201010613184 A CN201010613184 A CN 201010613184A CN 102073700 B CN102073700 B CN 102073700B
Authority
CN
China
Prior art keywords
node
network
corporations
complex network
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 201010613184
Other languages
English (en)
Other versions
CN102073700A (zh
Inventor
王益文
姚敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN 201010613184 priority Critical patent/CN102073700B/zh
Publication of CN102073700A publication Critical patent/CN102073700A/zh
Application granted granted Critical
Publication of CN102073700B publication Critical patent/CN102073700B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种复杂网络社团的发现方法,包括以下步骤:步骤一:建立所需分析网络的邻接矩阵表示;步骤二:确定初始划分点的值;步骤三:计算网络中每个节点的度;步骤四:选出节点的度数最高的K个点作为初始划分点;步骤五:选取具体需要的划分点;步骤六:根据步骤五得到的最后的划分点,由计算机给出最后的社团发现结果。本发明提出了计算机的基于划分点的处理复杂网络社团的发现方法,解决了现有技术不能够利用计算机处理大规模复杂网络的技术问题,并能够在计算过程中节省大量的计算机存储空间,减少计算所占用的系统资源,提高计算机的运算速度和效率;同时,还实现了向下分解和向上聚合方法的统一。

Description

一种复杂网络社团的发现方法
技术领域
本发明涉及复杂网络技术,同时也涉及web数据挖掘技术,具体地说是一种复杂网络社团的发现方法。 
背景技术
网络科学是目前一个交叉学科中很重要的研究方向,而在网络科学中有一个突出并且富有前景的研究问题就是社团发现。而以前网络科学主要关注于度的指数分布以及小世界效应。复杂网络的结构描述一直是近几年来物理学家关心的重要问题。从个体微观层次的度、聚集系数到宏观整体统计特性的度分布、整体聚集系数等。而在这两个比较极端的中间有一个处于中间层次的描述就是社团描述。因此社团发现现已成为复杂网络研究的一个研究热点。 
现实世界中的诸多系统都以网络形式存在,如生态系统中的神经元网、基因调控网和蛋白质交互网、科技系统中的电话网、因特网和万维网等。由于这些网络具有很高的复杂性,因此被称为“复杂网络(complex network)”。复杂网络已成为当前最重要的多学科交叉研究领域之一。与小世界性、无标度性等基本统计特性相并列,网络社团结构是复杂网络最普遍和最重要的拓扑结构属性之一,具有相同社团节点相互连接密集、不同社团节点相互连接稀疏的特点。复杂网络社团的发现方法旨在揭示出复杂网络中真实存在的网络簇结构。研究复杂网络社团发现对分析复杂网络的拓扑结构、理解复杂网络的功能、发现复杂网络中的隐藏规律以及预测复杂网络的行为不仅具有十分重要的理论意义,而且具有广泛的应用前景,目前已被应用于新陈代谢网络分析、蛋白质交互网络分析和未知蛋白质功能预测、基因调控网络分析和主控基因识别等各种生物网络分析以及 Web社区挖掘和基于主题词的Web 文档聚类和搜索引擎等众多领域。 
近几年研究发现,尽管客观世界中的复杂系统功能各样,但它们对应的复杂网络在结构上却具有十分惊人的相似性。根据网络结构的特点,科学家把绝大多数的复杂网络归纳为3类:随机网络、小世界网络和无标度网络。复杂网络的核心研究内容是揭示复杂网络功能和结构之间的内在联系。目前,用于刻画复杂网络结构的重要属性是平均路长、聚类系数、度分布、网络 Motif和网络社团结构。借助复杂网络社团结构分析方法,科学家取得了一些有关网络功能和结构的初步研究结果。 
目前已存在多种复杂网络社团发现方法,按照所采用的基本求解策略,可以归纳为两大类:基于优化的方法和启发式方法。前者将复杂网络社团发现问题转化为优化问题,通过最优化预定义的目标函数来计算复杂网络的社团结构,例如,谱方法将网络聚类问题转化为二次型优化问题,通过计算特殊矩阵的特征向量来优化预定义的“截”函数,“截”即指子网间的连接密度.具有最小“截”的划分被认为是最优的网络划分,针对不同问题,提出了不同的“截”函数,例如,针对分布式系统负载平衡提出的“平均截”、针对大规模集成电路设计提出的“比率截”以及针对图像分割提出的“规范截”等。而后者将复杂网络聚类问题转化为预定义启发式规则的设计问题,例如,由 Girvan 和 Newman 在 2002 年提出的Girvan 和 Newman (简称GN)算法也采用反复识别和删除簇间连接的策略聚类复杂网络,但 GN 算法采用了新的启发式规则:簇间连接的边介数应大于簇内连接的边介数,连接的边介数定义为网络中经过该连接的任意两点间最短路径的条数,GN 算法通过反复计算边介数、识别簇间连接、删除簇间连接,以自顶向下的方式建立一棵层次聚类树。然而,计算机利用GN算法进行计算的最大缺点是计算速度慢,需要占用大量的计算机存储空间和计算机系统资源,且只能处理中小规模的网络问题,无法处理大规模的复杂网络问题。 
发明内容
本发明的目的在于:提供一种复杂网络社团的发现方法,该方法能够使计算机用来处理大规模的复杂网络问题,并能够在计算过程中节省大量的计算机存储空间,减少计算所占用的系统资源,提高计算机的运算速度和效率。 
为实现上述目的,本发明可采取下述技术方案: 
本发明一种复杂网络社团的发现方法,包括以下步骤:
步骤一:建立所需分析网络的邻接矩阵表示,所述网络的邻接矩阵表示是指矩阵中的元素只为0或者1,0表示行和列代表的节点不相连,1表示行和列代表的节点是相连的;
步骤二:确定初始划分点的值,在没有确定的需要划分的社团数目M的情况下,取初始划分点的值K=2;在需要划分的社团的数目最多为M的情况下,初始划分点的值K,应满足关系式2K>M ;
步骤三:编制计算步骤一每个节点的度的计算机程序,输入计算机,计算网络中每个节点的度,所述节点的度是指该节点与其它节点相连的边的个数;
步骤四:选出节点的度数最高的K个点作为初始划分点;
步骤五:设定满足特定需求的度量函数,通过度量函数所确定的条件,由计算机从初始划分点中选择最终的划分点;
步骤六:根据上述步骤五得到的最后的划分点,由计算机给出最后的社团发现结果,所述最后的社团发现结果是指,将网络中的每个节点,依据其是否与所述划分点相连而被划分成不同的社团。
与现有技术相比本发明的有益效果是: 
1.本发明一种复杂网络社团的发现方法,提出了计算机的基于划分点的处理复杂网络社团的发现方法,通过计算每个节点的度,然后选出度数最高的前K个点作为划分点,计算量很小,无论拥有多少节点的复杂网络,社团发现结果只需要存储在几个划分点上,而不是把每个复杂网络中的节点属于哪个社团都记录下来,并且如果原来的的网络原本就带有度的信息,那就几乎不需要什么计算了,解决了现有技术不能够利用计算机处理大规模复杂网络的技术问题,并能够在计算过程中节省大量的计算机存储空间,减少计算所占用的系统资源,提高计算机的运算速度和效率;
2.与现有的计算机的社团发现方法不同,当网络中增删一部分点和边时,本发明方法几乎不需要重新计算,这是因为社团划分结果是根据划分点给出的,而划分点是复杂网络中度数最高的点,增删一部分点和边几乎不会影响节点中度数最高的几个点,也就不会改变划分点,因而具有鲁棒性;
3.无论需要社团发现的网络是有向的还是无向的,边是否有权重,本发明方法关心的是节点的度,因此都能适用,同时,还能根据不同的实际需求,在步骤五中采用自行设计的度量函数对划分点进行优化选取;
4.传统的计算机的社团发现算法主要分为自顶向下的递归分解和自底向上的递归聚合方法,本发明方法的步骤四就是自顶向下的“分”,将整个网络分为2K个小的基本社团,实现了向下分解和向上聚合方法的统一。
具体实施方式
本发明一种复杂网络社团的发现方法,包括以下步骤: 
步骤一:建立所需分析网络的邻接矩阵表示,所述网络的邻接矩阵表示是指矩阵中的元素只为0或者1,0表示行和列代表的节点不相连,1表示行和列代表的节点是相连的;
步骤二:确定初始划分点的值,在没有确定的需要划分的社团数目M的情况下,取初始划分点的值K=2;在需要划分的社团的数目最多为M的情况下,初始划分点的值K,应满足关系式2K>M ;
步骤三:编制计算步骤一每个节点的度的计算机程序,输入计算机,计算网络中每个节点的度,所述节点的度是指该节点与其它节点相连的边的个数;
步骤四:选出节点的度数最高的K个点作为初始划分点;
步骤五:根据具体需要,从上述步骤四中得出的K个划分点中,选取具体需要的划分点;或设定满足特定需求的度量函数,通过度量函数所确定的条件,由计算机从初始划分点中选择最终的划分点;
步骤六:根据上述步骤五得到的最后的划分点,由计算机给出最后的社团发现结果,所述最后的社团发现结果是指,将网络中的每个节点,依据其是否与所述划分点相连而被划分成不同的社团。

Claims (1)

1.一种复杂网络社团的发现方法,其特征在于包括以下步骤:
步骤一:建立所需分析网络的邻接矩阵表示,所述网络的邻接矩阵表示是指矩阵中的元素只为0或者1,0表示行和列代表的节点不相连,1表示行和列代表的节点是相连的;
步骤二:确定初始划分点的值,在没有确定的需要划分的社团数目M的情况下,取初始划分点的值K=2;在需要划分的社团的数目最多为M的情况下,初始划分点的值K,应满足关系式2K>M ;
步骤三:编制计算步骤一每个节点的度的计算机程序,输入计算机,计算网络中每个节点的度,所述节点的度是指该节点与其它节点相连的边的个数;
步骤四:选出节点的度数最高的K个点作为初始划分点;
步骤五:设定满足特定需求的度量函数,通过度量函数所确定的条件,由计算机从初始划分点中选择最终的划分点;
步骤六:根据上述步骤五得到的最后的划分点,由计算机给出最后的社团发现结果,所述最后的社团发现结果是指,将网络中的每个节点,依据其是否与所述划分点相连而被划分成不同的社团。
CN 201010613184 2010-12-30 2010-12-30 一种复杂网络社团的发现方法 Expired - Fee Related CN102073700B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010613184 CN102073700B (zh) 2010-12-30 2010-12-30 一种复杂网络社团的发现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010613184 CN102073700B (zh) 2010-12-30 2010-12-30 一种复杂网络社团的发现方法

Publications (2)

Publication Number Publication Date
CN102073700A CN102073700A (zh) 2011-05-25
CN102073700B true CN102073700B (zh) 2012-12-19

Family

ID=44032239

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010613184 Expired - Fee Related CN102073700B (zh) 2010-12-30 2010-12-30 一种复杂网络社团的发现方法

Country Status (1)

Country Link
CN (1) CN102073700B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102722530B (zh) * 2012-05-17 2014-04-16 北京理工大学 一种复杂网络中的社团探测方法
CN103327092A (zh) * 2012-11-02 2013-09-25 中国人民解放军国防科学技术大学 一种信息网络上的社区发现方法和系统
CN103049496B (zh) * 2012-12-07 2016-08-17 北京百度网讯科技有限公司 一种对多个用户进行用户群划分的方法、装置与设备
CN103051476B (zh) * 2012-12-24 2015-04-22 浙江大学 基于拓扑分析的网络社区发现方法
CN103164533B (zh) * 2013-04-09 2016-07-06 哈尔滨工业大学 基于信息理论的复杂网络社团检测方法
CN103345531B (zh) * 2013-07-26 2017-05-24 苏州大学 一种复杂网络中网络社团的确定方法及装置
CN103729467B (zh) * 2014-01-16 2017-01-18 重庆邮电大学 一种社交网络中的社区结构发现方法
CN103729475B (zh) * 2014-01-24 2016-10-26 福州大学 一种社交网络中的多标签传播重叠社区发现方法
CN104021199B (zh) * 2014-06-16 2017-04-19 西安电子科技大学 基于节点支配能力相似性的功能模块检测方法
CN105335438A (zh) * 2014-08-11 2016-02-17 天津科技大学 一种基于局部最短回路的社会网络群体划分方法
CN104598927A (zh) * 2015-01-29 2015-05-06 中国科学院深圳先进技术研究院 一种大规模图分割方法及系统
CN107688629B (zh) * 2017-08-21 2021-02-26 北京工业大学 一种多类型网络间交互架构的可视化压缩方法
CN110084816B (zh) * 2019-03-21 2021-04-06 深圳大学 物体分割方法、装置、计算机可读存储介质和计算机设备
CN111008338B (zh) * 2019-11-11 2022-08-23 重庆邮电大学 一种基于层次聚类的社交网络多尺度结构挖掘方法及介质
CN111784206B (zh) * 2020-07-29 2021-03-19 南昌航空大学 采用LeaderRank算法评估社交网络关键节点的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101344940A (zh) * 2008-08-21 2009-01-14 魏芳 一种基于全局划分和局部扩展的网络重叠社团检测方法
CN101383748A (zh) * 2008-10-24 2009-03-11 北京航空航天大学 一种复杂网络中的社区划分方法
JP2010141442A (ja) * 2008-12-09 2010-06-24 Kddi Corp ネットワークにおけるコミュニティ構造検出方法、ノード、管理装置及びプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100185935A1 (en) * 2009-01-21 2010-07-22 Nec Laboratories America, Inc. Systems and methods for community detection

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101344940A (zh) * 2008-08-21 2009-01-14 魏芳 一种基于全局划分和局部扩展的网络重叠社团检测方法
CN101383748A (zh) * 2008-10-24 2009-03-11 北京航空航天大学 一种复杂网络中的社区划分方法
JP2010141442A (ja) * 2008-12-09 2010-06-24 Kddi Corp ネットワークにおけるコミュニティ構造検出方法、ノード、管理装置及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
解X 等.复杂网络中的社团结构分析算法研究综述.《复杂系统与复杂性科学》.2005,第2卷(第3期),1-12. *

Also Published As

Publication number Publication date
CN102073700A (zh) 2011-05-25

Similar Documents

Publication Publication Date Title
CN102073700B (zh) 一种复杂网络社团的发现方法
Fischetti et al. Thinning out Steiner trees: a node-based model for uniform edge costs
Ban et al. Query optimization of distributed database based on parallel genetic algorithm and max-min ant system
CN103116625A (zh) 一种基于Hadoop的海量RDF数据分布式查询处理方法
CN107609694B (zh) 海上风电集群输电系统结构优化方法及存储介质
Yang et al. Computational intelligence and metaheuristic algorithms with applications
CN104504018A (zh) 基于浓密树和自顶向下的大数据实时查询优化方法
Denis et al. A distributed approach for graph-oriented multidimensional analysis
US20190087445A1 (en) Method of facilitating distributed data search in a federated cloud and system thereof
TWI740895B (zh) 應用歸屬服務集群的分配方法和裝置
de Oliveira et al. Low-cost heuristics for matrix bandwidth reduction combined with a Hill-Climbing strategy
Yin et al. Streamnet: A dag system with streaming graph computing
CN116383247A (zh) 一种大规模图数据高效查询方法
Hajeer et al. Distributed genetic algorithm to big data clustering
Le-Khac et al. A new approach for distributed density based clustering on grid platform
Abdolazimi et al. Connected components of big graphs in fixed mapreduce rounds
CN104702690A (zh) 基于虚拟树型网络技术的分布式高性能计算的方法
Bai et al. An efficient skyline query algorithm in the distributed environment
Raj et al. PartEclat: an improved Eclat-based frequent itemset mining algorithm on spark clusters using partition technique
Bahrami et al. A demand-based structure for the architecture of wireless networks on chip
CN113487871B (zh) 基于网络集计策略的快速交通分配方法、装置及存储介质
CN102902809B (zh) 一种新型语义关联挖掘方法
Yang et al. Computing service skyeube for web service selection
Zeng A clustering method of combining grid and genetic algorithm in wireless sensor networks
Singhar et al. Optimizing Mixed Size & Large Scale Block Placement Using Greedy Approach

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20121219

Termination date: 20191230