CN102073700A - 一种复杂网络社团的发现方法 - Google Patents
一种复杂网络社团的发现方法 Download PDFInfo
- Publication number
- CN102073700A CN102073700A CN 201010613184 CN201010613184A CN102073700A CN 102073700 A CN102073700 A CN 102073700A CN 201010613184 CN201010613184 CN 201010613184 CN 201010613184 A CN201010613184 A CN 201010613184A CN 102073700 A CN102073700 A CN 102073700A
- Authority
- CN
- China
- Prior art keywords
- node
- corporations
- network
- complex network
- point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 239000011159 matrix material Substances 0.000 claims abstract description 11
- 238000004364 calculation method Methods 0.000 claims abstract description 7
- 238000004590 computer program Methods 0.000 claims description 3
- 238000006116 polymerization reaction Methods 0.000 abstract description 3
- 238000012545 processing Methods 0.000 abstract description 3
- 238000000354 decomposition reaction Methods 0.000 abstract description 2
- 238000005192 partition Methods 0.000 abstract 4
- 238000011160 research Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 5
- 108090000623 proteins and genes Proteins 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000007792 addition Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000003012 network analysis Methods 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 101710134784 Agnoprotein Proteins 0.000 description 1
- 101710124584 Probable DNA-binding protein Proteins 0.000 description 1
- 239000003637 basic solution Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000003696 structure analysis method Methods 0.000 description 1
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种复杂网络社团的发现方法,包括以下步骤:步骤一:建立所需分析网络的邻接矩阵表示;步骤二:确定初始划分点的值;步骤三:计算网络中每个节点的度;步骤四:选出节点的度数最高的K个点作为初始划分点;步骤五:选取具体需要的划分点;步骤六:根据步骤五得到的最后的划分点,由计算机给出最后的社团发现结果。本发明提出了计算机的基于划分点的处理复杂网络社团的发现方法,解决了现有技术不能够利用计算机处理大规模复杂网络的技术问题,并能够在计算过程中节省大量的计算机存储空间,减少计算所占用的系统资源,提高计算机的运算速度和效率;同时,还实现了向下分解和向上聚合方法的统一。
Description
技术领域
本发明涉及复杂网络技术,同时也涉及web数据挖掘技术,具体地说是一种复杂网络社团的发现方法。
背景技术
网络科学是目前一个交叉学科中很重要的研究方向,而在网络科学中有一个突出并且富有前景的研究问题就是社团发现。而以前网络科学主要关注于度的指数分布以及小世界效应。复杂网络的结构描述一直是近几年来物理学家关心的重要问题。从个体微观层次的度、聚集系数到宏观整体统计特性的度分布、整体聚集系数等。而在这两个比较极端的中间有一个处于中间层次的描述就是社团描述。因此社团发现现已成为复杂网络研究的一个研究热点。
现实世界中的诸多系统都以网络形式存在,如生态系统中的神经元网、基因调控网和蛋白质交互网、科技系统中的电话网、因特网和万维网等。由于这些网络具有很高的复杂性,因此被称为“复杂网络(complex network)”。复杂网络已成为当前最重要的多学科交叉研究领域之一。与小世界性、无标度性等基本统计特性相并列,网络社团结构是复杂网络最普遍和最重要的拓扑结构属性之一,具有相同社团节点相互连接密集、不同社团节点相互连接稀疏的特点。复杂网络社团的发现方法旨在揭示出复杂网络中真实存在的网络簇结构。研究复杂网络社团发现对分析复杂网络的拓扑结构、理解复杂网络的功能、发现复杂网络中的隐藏规律以及预测复杂网络的行为不仅具有十分重要的理论意义,而且具有广泛的应用前景,目前已被应用于新陈代谢网络分析、蛋白质交互网络分析和未知蛋白质功能预测、基因调控网络分析和主控基因识别等各种生物网络分析以及 Web社区挖掘和基于主题词的Web 文档聚类和搜索引擎等众多领域。
近几年研究发现,尽管客观世界中的复杂系统功能各样,但它们对应的复杂网络在结构上却具有十分惊人的相似性。根据网络结构的特点,科学家把绝大多数的复杂网络归纳为3类:随机网络、小世界网络和无标度网络。复杂网络的核心研究内容是揭示复杂网络功能和结构之间的内在联系。目前,用于刻画复杂网络结构的重要属性是平均路长、聚类系数、度分布、网络 Motif和网络社团结构。借助复杂网络社团结构分析方法,科学家取得了一些有关网络功能和结构的初步研究结果。
目前已存在多种复杂网络社团发现方法,按照所采用的基本求解策略,可以归纳为两大类:基于优化的方法和启发式方法。前者将复杂网络社团发现问题转化为优化问题,通过最优化预定义的目标函数来计算复杂网络的社团结构,例如,谱方法将网络聚类问题转化为二次型优化问题,通过计算特殊矩阵的特征向量来优化预定义的“截”函数,“截”即指子网间的连接密度.具有最小“截”的划分被认为是最优的网络划分,针对不同问题,提出了不同的“截”函数,例如,针对分布式系统负载平衡提出的“平均截”、针对大规模集成电路设计提出的“比率截”以及针对图像分割提出的“规范截”等。而后者将复杂网络聚类问题转化为预定义启发式规则的设计问题,例如,由 Girvan 和 Newman 在 2002 年提出的Girvan 和 Newman (简称GN)算法也采用反复识别和删除簇间连接的策略聚类复杂网络,但 GN 算法采用了新的启发式规则:簇间连接的边介数应大于簇内连接的边介数,连接的边介数定义为网络中经过该连接的任意两点间最短路径的条数,GN 算法通过反复计算边介数、识别簇间连接、删除簇间连接,以自顶向下的方式建立一棵层次聚类树。然而,计算机利用GN算法进行计算的最大缺点是计算速度慢,需要占用大量的计算机存储空间和计算机系统资源,且只能处理中小规模的网络问题,无法处理大规模的复杂网络问题。
发明内容
本发明的目的在于:提供一种复杂网络社团的发现方法,该方法能够使计算机用来处理大规模的复杂网络问题,并能够在计算过程中节省大量的计算机存储空间,减少计算所占用的系统资源,提高计算机的运算速度和效率。
为实现上述目的,本发明可采取下述技术方案:
本发明一种复杂网络社团的发现方法,包括以下步骤:
步骤一:建立所需分析网络的邻接矩阵表示,所述网络的邻接矩阵表示是指矩阵中的元素只为0或者1,0表示行和列代表的节点不相连,1表示行和列代表的节点是相连的;
步骤二:确定初始划分点的值,在没有确定的需要划分的社团数目M的情况下,取初始划分点的值K=2;在需要划分的社团的数目最多为M的情况下,初始划分点的值K,应满足关系式2K>M ;
步骤三:编制计算步骤一每个节点的度的计算机程序,输入计算机,计算网络中每个节点的度,所述节点的度是指该节点与其它节点相连的边的个数;
步骤四:选出节点的度数最高的K个点作为初始划分点;
步骤五:根据具体需要,从上述步骤四中得出的K个划分点中,选取具体需要的划分点;或设定满足特定需求的度量函数,通过度量函数所确定的条件,由计算机从初始划分点中选择最终的划分点;
步骤六:根据上述步骤五得到的最后的划分点,由计算机给出最后的社团发现结果,所述最后的社团发现结果是指,将网络中的每个节点,依据其是否与所述划分点相连而被划分成不同的社团。
与现有技术相比本发明的有益效果是:
1.本发明一种复杂网络社团的发现方法,提出了计算机的基于划分点的处理复杂网络社团的发现方法,通过计算每个节点的度,然后选出度数最高的前K个点作为划分点,计算量很小,无论拥有多少节点的复杂网络,社团发现结果只需要存储在几个划分点上,而不是把每个复杂网络中的节点属于哪个社团都记录下来,并且如果原来的的网络原本就带有度的信息,那就几乎不需要什么计算了,解决了现有技术不能够利用计算机处理大规模复杂网络的技术问题,并能够在计算过程中节省大量的计算机存储空间,减少计算所占用的系统资源,提高计算机的运算速度和效率;
2.与现有的计算机的社团发现方法不同,当网络中增删一部分点和边时,本发明方法几乎不需要重新计算,这是因为社团划分结果是根据划分点给出的,而划分点是复杂网络中度数最高的点,增删一部分点和边几乎不会影响节点中度数最高的几个点,也就不会改变划分点,因而具有鲁棒性;
3.无论需要社团发现的网络是有向的还是无向的,边是否有权重,本发明方法关心的是节点的度,因此都能适用,同时,还能根据不同的实际需求,在步骤五中采用自行设计的度量函数对划分点进行优化选取;
4.传统的计算机的社团发现算法主要分为自顶向下的递归分解和自底向上的递归聚合方法,本发明方法的步骤四就是自顶向下的“分”,将整个网络分为2K个小的基本社团,实现了向下分解和向上聚合方法的统一。
具体实施方式
本发明一种复杂网络社团的发现方法,包括以下步骤:
步骤一:建立所需分析网络的邻接矩阵表示,所述网络的邻接矩阵表示是指矩阵中的元素只为0或者1,0表示行和列代表的节点不相连,1表示行和列代表的节点是相连的;
步骤二:确定初始划分点的值,在没有确定的需要划分的社团数目M的情况下,取初始划分点的值K=2;在需要划分的社团的数目最多为M的情况下,初始划分点的值K,应满足关系式2K>M ;
步骤三:编制计算步骤一每个节点的度的计算机程序,输入计算机,计算网络中每个节点的度,所述节点的度是指该节点与其它节点相连的边的个数;
步骤四:选出节点的度数最高的K个点作为初始划分点;
步骤五:根据具体需要,从上述步骤四中得出的K个划分点中,选取具体需要的划分点;或设定满足特定需求的度量函数,通过度量函数所确定的条件,由计算机从初始划分点中选择最终的划分点;
步骤六:根据上述步骤五得到的最后的划分点,由计算机给出最后的社团发现结果,所述最后的社团发现结果是指,将网络中的每个节点,依据其是否与所述划分点相连而被划分成不同的社团。
Claims (1)
1.一种复杂网络社团的发现方法,其特征在于包括以下步骤:
步骤一:建立所需分析网络的邻接矩阵表示,所述网络的邻接矩阵表示是指矩阵中的元素只为0或者1,0表示行和列代表的节点不相连,1表示行和列代表的节点是相连的;
步骤二:确定初始划分点的值,在没有确定的需要划分的社团数目M的情况下,取初始划分点的值K=2;在需要划分的社团的数目最多为M的情况下,初始划分点的值K,应满足关系式2K>M ;
步骤三:编制计算步骤一每个节点的度的计算机程序,输入计算机,计算网络中每个节点的度,所述节点的度是指该节点与其它节点相连的边的个数;
步骤四:选出节点的度数最高的K个点作为初始划分点;
步骤五:根据具体需要,从上述步骤四中得出的K个划分点中,选取具体需要的划分点;或设定满足特定需求的度量函数,通过度量函数所确定的条件,由计算机从初始划分点中选择最终的划分点;
步骤六:根据上述步骤五得到的最后的划分点,由计算机给出最后的社团发现结果,所述最后的社团发现结果是指,将网络中的每个节点,依据其是否与所述划分点相连而被划分成不同的社团。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010613184 CN102073700B (zh) | 2010-12-30 | 2010-12-30 | 一种复杂网络社团的发现方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010613184 CN102073700B (zh) | 2010-12-30 | 2010-12-30 | 一种复杂网络社团的发现方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102073700A true CN102073700A (zh) | 2011-05-25 |
CN102073700B CN102073700B (zh) | 2012-12-19 |
Family
ID=44032239
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201010613184 Expired - Fee Related CN102073700B (zh) | 2010-12-30 | 2010-12-30 | 一种复杂网络社团的发现方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102073700B (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102722530A (zh) * | 2012-05-17 | 2012-10-10 | 北京理工大学 | 一种复杂网络中的社团探测方法 |
CN103049496A (zh) * | 2012-12-07 | 2013-04-17 | 北京百度网讯科技有限公司 | 一种对多个用户进行用户群划分的方法、装置与设备 |
CN103051476A (zh) * | 2012-12-24 | 2013-04-17 | 浙江大学 | 基于拓扑分析的网络社区发现方法 |
CN103164533A (zh) * | 2013-04-09 | 2013-06-19 | 哈尔滨工业大学 | 基于信息理论的复杂网络社团检测方法 |
CN103327092A (zh) * | 2012-11-02 | 2013-09-25 | 中国人民解放军国防科学技术大学 | 一种信息网络上的社区发现方法和系统 |
CN103345531A (zh) * | 2013-07-26 | 2013-10-09 | 苏州大学 | 一种复杂网络中网络社团的确定方法及装置 |
CN103729475A (zh) * | 2014-01-24 | 2014-04-16 | 福州大学 | 一种社交网络中的多标签传播重叠社区发现方法 |
CN104021199A (zh) * | 2014-06-16 | 2014-09-03 | 西安电子科技大学 | 基于节点支配能力相似性的功能模块检测方法 |
CN104598927A (zh) * | 2015-01-29 | 2015-05-06 | 中国科学院深圳先进技术研究院 | 一种大规模图分割方法及系统 |
CN105335438A (zh) * | 2014-08-11 | 2016-02-17 | 天津科技大学 | 一种基于局部最短回路的社会网络群体划分方法 |
CN103729467B (zh) * | 2014-01-16 | 2017-01-18 | 重庆邮电大学 | 一种社交网络中的社区结构发现方法 |
CN107688629A (zh) * | 2017-08-21 | 2018-02-13 | 北京工业大学 | 一种多类型网络间交互架构的可视化压缩方法 |
CN110084816A (zh) * | 2019-03-21 | 2019-08-02 | 深圳大学 | 物体分割方法、装置、计算机可读存储介质和计算机设备 |
CN111008338A (zh) * | 2019-11-11 | 2020-04-14 | 重庆邮电大学 | 一种基于层次聚类的社交网络多尺度结构挖掘方法及介质 |
CN111784206A (zh) * | 2020-07-29 | 2020-10-16 | 南昌航空大学 | 采用LeaderRank算法评估社交网络关键节点的方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101344940A (zh) * | 2008-08-21 | 2009-01-14 | 魏芳 | 一种基于全局划分和局部扩展的网络重叠社团检测方法 |
CN101383748A (zh) * | 2008-10-24 | 2009-03-11 | 北京航空航天大学 | 一种复杂网络中的社区划分方法 |
JP2010141442A (ja) * | 2008-12-09 | 2010-06-24 | Kddi Corp | ネットワークにおけるコミュニティ構造検出方法、ノード、管理装置及びプログラム |
US20100185935A1 (en) * | 2009-01-21 | 2010-07-22 | Nec Laboratories America, Inc. | Systems and methods for community detection |
-
2010
- 2010-12-30 CN CN 201010613184 patent/CN102073700B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101344940A (zh) * | 2008-08-21 | 2009-01-14 | 魏芳 | 一种基于全局划分和局部扩展的网络重叠社团检测方法 |
CN101383748A (zh) * | 2008-10-24 | 2009-03-11 | 北京航空航天大学 | 一种复杂网络中的社区划分方法 |
JP2010141442A (ja) * | 2008-12-09 | 2010-06-24 | Kddi Corp | ネットワークにおけるコミュニティ構造検出方法、ノード、管理装置及びプログラム |
US20100185935A1 (en) * | 2009-01-21 | 2010-07-22 | Nec Laboratories America, Inc. | Systems and methods for community detection |
Non-Patent Citations (1)
Title |
---|
《复杂系统与复杂性科学》 20050731 解X 等 复杂网络中的社团结构分析算法研究综述 1-12 第2卷, 第3期 2 * |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102722530A (zh) * | 2012-05-17 | 2012-10-10 | 北京理工大学 | 一种复杂网络中的社团探测方法 |
CN102722530B (zh) * | 2012-05-17 | 2014-04-16 | 北京理工大学 | 一种复杂网络中的社团探测方法 |
CN103327092A (zh) * | 2012-11-02 | 2013-09-25 | 中国人民解放军国防科学技术大学 | 一种信息网络上的社区发现方法和系统 |
CN103049496A (zh) * | 2012-12-07 | 2013-04-17 | 北京百度网讯科技有限公司 | 一种对多个用户进行用户群划分的方法、装置与设备 |
CN103049496B (zh) * | 2012-12-07 | 2016-08-17 | 北京百度网讯科技有限公司 | 一种对多个用户进行用户群划分的方法、装置与设备 |
CN103051476B (zh) * | 2012-12-24 | 2015-04-22 | 浙江大学 | 基于拓扑分析的网络社区发现方法 |
CN103051476A (zh) * | 2012-12-24 | 2013-04-17 | 浙江大学 | 基于拓扑分析的网络社区发现方法 |
CN103164533B (zh) * | 2013-04-09 | 2016-07-06 | 哈尔滨工业大学 | 基于信息理论的复杂网络社团检测方法 |
CN103164533A (zh) * | 2013-04-09 | 2013-06-19 | 哈尔滨工业大学 | 基于信息理论的复杂网络社团检测方法 |
CN103345531B (zh) * | 2013-07-26 | 2017-05-24 | 苏州大学 | 一种复杂网络中网络社团的确定方法及装置 |
CN103345531A (zh) * | 2013-07-26 | 2013-10-09 | 苏州大学 | 一种复杂网络中网络社团的确定方法及装置 |
CN103729467B (zh) * | 2014-01-16 | 2017-01-18 | 重庆邮电大学 | 一种社交网络中的社区结构发现方法 |
CN103729475A (zh) * | 2014-01-24 | 2014-04-16 | 福州大学 | 一种社交网络中的多标签传播重叠社区发现方法 |
CN104021199B (zh) * | 2014-06-16 | 2017-04-19 | 西安电子科技大学 | 基于节点支配能力相似性的功能模块检测方法 |
CN104021199A (zh) * | 2014-06-16 | 2014-09-03 | 西安电子科技大学 | 基于节点支配能力相似性的功能模块检测方法 |
CN105335438A (zh) * | 2014-08-11 | 2016-02-17 | 天津科技大学 | 一种基于局部最短回路的社会网络群体划分方法 |
CN104598927A (zh) * | 2015-01-29 | 2015-05-06 | 中国科学院深圳先进技术研究院 | 一种大规模图分割方法及系统 |
CN107688629A (zh) * | 2017-08-21 | 2018-02-13 | 北京工业大学 | 一种多类型网络间交互架构的可视化压缩方法 |
CN107688629B (zh) * | 2017-08-21 | 2021-02-26 | 北京工业大学 | 一种多类型网络间交互架构的可视化压缩方法 |
CN110084816A (zh) * | 2019-03-21 | 2019-08-02 | 深圳大学 | 物体分割方法、装置、计算机可读存储介质和计算机设备 |
CN110084816B (zh) * | 2019-03-21 | 2021-04-06 | 深圳大学 | 物体分割方法、装置、计算机可读存储介质和计算机设备 |
CN111008338A (zh) * | 2019-11-11 | 2020-04-14 | 重庆邮电大学 | 一种基于层次聚类的社交网络多尺度结构挖掘方法及介质 |
CN111008338B (zh) * | 2019-11-11 | 2022-08-23 | 重庆邮电大学 | 一种基于层次聚类的社交网络多尺度结构挖掘方法及介质 |
CN111784206A (zh) * | 2020-07-29 | 2020-10-16 | 南昌航空大学 | 采用LeaderRank算法评估社交网络关键节点的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN102073700B (zh) | 2012-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102073700B (zh) | 一种复杂网络社团的发现方法 | |
Dafir et al. | A survey on parallel clustering algorithms for big data | |
Buluç et al. | Recent advances in graph partitioning | |
US8943011B2 (en) | Methods and systems for using map-reduce for large-scale analysis of graph-based data | |
CN103116625A (zh) | 一种基于Hadoop的海量RDF数据分布式查询处理方法 | |
CN105978711B (zh) | 一种基于最小生成树的最佳交换边查找方法 | |
Chen et al. | Tology-aware optimal data placement algorithm for network traffic optimization | |
CN104504018A (zh) | 基于浓密树和自顶向下的大数据实时查询优化方法 | |
Denis et al. | A distributed approach for graph-oriented multidimensional analysis | |
TWI740895B (zh) | 應用歸屬服務集群的分配方法和裝置 | |
Chen et al. | DBSCAN-PSM: an improvement method of DBSCAN algorithm on Spark | |
Duan et al. | A hybrid genetic-particle swarm optimizer using precise mutation strategy for computationally expensive problems | |
Wu et al. | Mining large‐scale high utility patterns in vehicular ad hoc network environments | |
Wang et al. | Multi-granularity decomposition for componentized multimedia applications based on graph clustering | |
CN116383247A (zh) | 一种大规模图数据高效查询方法 | |
Raj et al. | PartEclat: an improved Eclat-based frequent itemset mining algorithm on spark clusters using partition technique | |
Abdolazimi et al. | Connected components of big graphs in fixed mapreduce rounds | |
CN115081381A (zh) | 基于图神经网络的芯片布图规划方法、装置及存储介质 | |
CN108804788B (zh) | 一种基于数据细胞模型的Web服务演化方法 | |
Bai et al. | An efficient skyline query algorithm in the distributed environment | |
Yang et al. | Computing service skyeube for web service selection | |
Singhar et al. | Optimizing Mixed Size & Large Scale Block Placement Using Greedy Approach | |
Pang et al. | Partitioning large-scale property graph for efficient distributed query processing | |
CN102902809B (zh) | 一种新型语义关联挖掘方法 | |
CN113487871B (zh) | 基于网络集计策略的快速交通分配方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20121219 Termination date: 20191230 |