CN104700311A - 一种社会网络中的邻域跟随社区发现方法 - Google Patents

一种社会网络中的邻域跟随社区发现方法 Download PDF

Info

Publication number
CN104700311A
CN104700311A CN201510046397.2A CN201510046397A CN104700311A CN 104700311 A CN104700311 A CN 104700311A CN 201510046397 A CN201510046397 A CN 201510046397A CN 104700311 A CN104700311 A CN 104700311A
Authority
CN
China
Prior art keywords
node
community
leaders
follow
neighborhood
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510046397.2A
Other languages
English (en)
Other versions
CN104700311B (zh
Inventor
陈羽中
牛玉贞
郭文忠
施松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN201510046397.2A priority Critical patent/CN104700311B/zh
Publication of CN104700311A publication Critical patent/CN104700311A/zh
Application granted granted Critical
Publication of CN104700311B publication Critical patent/CN104700311B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及社会网络技术领域,特别是一种社会网络中的邻域跟随社区发现方法,包括以下步骤:步骤A:读取社会网络数据,构造以社会网络用户为节点,用户关系为边的社会网络图;步骤B:根据社会网络图,遍历社会网络图中的节点,确定节点间的跟随关系;步骤C:根据节点间的跟随关系,遍历社会网络图中的节点,将跟随同一节点的节点划分至同一社区,得到社会网络的社区结构。该方法可提高社区检测的精度和效率,且具有接近线性的时间复杂度,能够快速有效地挖掘社会网络中的社区结构,可应用于目标群体挖掘、精确营销等领域。

Description

一种社会网络中的邻域跟随社区发现方法
技术领域
本发明涉及社会网络技术领域,特别是一种社会网络中的邻域跟随社区发现方法。
背景技术
从社会网络中检测社区结构是社会网络分析中的一项重要任务,无论是理论上还是实际应用中都具有十分重要的意义。通过挖掘网络中的社区结构,能够发现网络中隐含的组织结构信息、社会功能以及社区成员之间隐含的有趣属性,如共同爱好等。通过研究社会网络中社区之间、个体之间以及个体与社区之间的关系,可以挖掘出大量有价值的信息,可应用于许多领域。
针对社区发现,已经出现了很多经典的方法。总体上,社区发现的经典方法包括基于图分割、层次聚类、模块度优化、标签传播、极大团、边图划分、种子节点扩展、模糊聚类的社区发现方法。
KL方法是较早出现的一种社区发现方法,其优化目标为极小化社区间连接数目与社区内连接数目之差,并使用贪心策略寻找最优的社区划分。KL方法的主要缺点在于需要社区数和社区的平均规模作为算法的输入参数,且对输入参数很敏感,算法的时间复杂度也较高。
GN是Girvan和Newman提出的基于边介数的分裂式层次聚类方法。由于边介数的计算代价较大,GN方法的时间复杂度达到O(m 2 n),其中m为边数,n为节点数,不适用于大规模网络。为解决大规模网络的应用问题,Newman等在GN的基础上提出了FN方法。FN方法提出了模块度作为网络划分质量的标准,设计了一种基于模块度的凝聚式层次聚类方法,其时间复杂度为O(mn)。模块度为研究人员提供了一种用于选择网络划分的目标函数,研究人员将贪心策略、模拟退火、极值优化、禁忌搜索、整数规划等多种优化策略应用于模块度优化,模块度优化是目前社区发现的主流方法,典型方法包括CNMMSG-MVGAEO以及整数规划法,但是存在分辨率问题,难以发现小规模社区,而且由于模块度优化的搜索空间非常大,当应用于大规模网络时,方法的结果也变得很不可靠。
基于信息传播的思想,Raghavan等提出了标签传播方法LPALPA考虑社会网络的结构特征和信息传播特性,通过基于局部搜索的标签更新,经迭代收敛后将具有相同标签的节点聚合到同一社区。LPA的最大优点在于无需参数,收敛速度快,具有线性时间复杂度O(m),适用于大规模社会网络;但由于标签更新规则的随机性,LPA的稳定性和精度较差。WH(Wu-Huberman)方法将复杂网络建模为电路系统,网络连接看作是具有电阻的线路,不同位置的网络节点具有不同电位势,通过启发式规则寻找最大位势差以区分不同的社区。WH方法具有近似线性的时间复杂度,但是需要社区数目和社区规模作为输入参数。Rosvall等提出了一种基于最小化随机游走平均编码长度模型的聚类方法InfoMapInfoMap的优点是社区发现速度快、准确率高、无需社区数量作为输入参数,但是当社区结构趋向不清晰时,聚类效果下降明显。
上述社区发现方法通常存在参数敏感或者时间复杂度高的问题,难以应用于大规模复杂网络的社区发现,综上,现有的社会网络社区发现方法从发现的社区结构质量以及时间效率上看都尚有很大的提升空间。面对大规模社交网络的场景,现有方法无论实在效果和效率上都难以满足要求。
发明内容
本发明的目的在于提供一种社会网络中的邻域跟随社区发现方法,该方法有利于提高社区检测的精度和效率。
为实现上述目的,本发明的技术方案是:一种社会网络中的邻域跟随社区发现方法,包括以下步骤:
步骤A:读取社会网络数据,构造以社会网络用户为节点,用户关系为边的社会网络图;
步骤B:根据社会网络图,遍历社会网络图中的节点,将所有节点的角色初始化为未确定;
步骤C:根据社会网络图,遍历社会网络图中的节点,确定节点间的跟随关系;
步骤D:根据节点间的跟随关系,遍历社会网络图中的节点,将跟随同一节点的节点划分至同一社区。
进一步地,所述步骤C中,确定节点间的跟随关系,包括以下步骤:
步骤C1:对于所遍历的节点x,按照最可信赖邻域跟随规则选择节点k
步骤C2:设置节点x的社区跟随目标为节点k,并更新节点k的社区跟随者数量,即以节点k为社区跟随目标的节点数量;
步骤C3:若节点x的角色尚未确定,则将节点x的角色设置为社区跟随者;
步骤C4:判定节点k是否满足作为社区领导者的条件,如果满足,设置节点k的角色为社区领导者;反之设置节点k的角色为社区跟随者;
步骤C5:重复步骤C1~C4,直到社会网络图中的所有节点均已遍历。
进一步地,所述步骤C1中,采用的最可信赖邻域跟随规则为:获取节点x的邻域中社区跟随节点最多的节点作为节点x的社区跟随目标,定义为:
其中following x  表示节点x所选择的社区跟随目标,Neighborhood(x)表示节点x的邻域,定义为:
其中N(x)为节点x的邻居节点集合,由与节点x有边相连的所有节点构成,定义为:
其中VE分别为社会网络图G的节点集合与边集合;
fc j 表示节点j的社区跟随节点数,即节点j的邻域中,以节点j为社区跟随目标的节点数量,定义为:
其中followers j 表示节点j的邻域中,以节点j为社区跟随目标的节点集合,即与节点j之间存在直接邻域跟随关系的节点集合,定义为:
其中表示节点p与节点j之间存在直接邻域跟随关系,定义为:
节点x的邻域包含节点本身,因此节点x的社区跟随目标可以是节点x本身;如节点x的邻域中有多个节点满足跟随节点数最多的条件,则从中选择度最大的节点作为节点x的社区跟随目标;如仍有多个节点满足度最大的条件,则从中随机选择一个节点作为节点x的跟随目标。
进一步地,定义节点在社区中的两种角色:社区领导者和社区跟随者,社区由不同角色的节点以及节点间的跟随关系构成,一个社区由一个社区领导者节点和其余的社区跟随者节点构成,社区内的每个节点都直接或间接地跟随社区领导者节点,一个由社区领导者节点l表示的社区定义为:
其中表示节点x与节点l之间存在直接邻域跟随关系,即节点x直接跟随社区领导者节点l表示节点x与节点l之间存在间接邻域跟随关系,即节点x不属于l的邻域,但两个节点间存在中间节点,构成一个从xl的跟随链:,即节点x间接跟随社区领导者节点l,记为x=l表示由社区领导者节点l表示的社区包括社区领导者节点自身。
进一步地,所述步骤B4中,判定节点k是否满足作为社区领导者的条件定义为:
即给定参数(0<r<1),当节点k的角色为社区跟随者时,若LQ k  ≥ r,则将节点k的角色设置为社区领导者;若节点k为社区领导者但LQ k  < r,则重新设置节点k的角色为社区跟随者;
其中LQ k 表示节点k的领袖质量,为节点k的社区跟随节点数与节点k的社区跟随目标的社区跟随节点数的比值,以反映节点独立于其社区跟随目标的能力,定义为:
其中fc k 为节点k的社区跟随节点数,为节点k的社区跟随目标的社区跟随节点数。
进一步地,所述步骤D中,根据节点间的跟随关系得到网络社区,具体包括以下步骤:
步骤D1:对于所遍历的节点x,寻找节点x所跟随的社区领导者节点l
步骤D2:获取由社区领导者节点l所代表的节点集合,即由社区领导者节点l所代表的社区,将节点x添加到该集合中;
步骤D3:重复步骤D1~D2,直到社会网络图中的所有节点均已遍历。
进一步地,所述步骤D1中,寻找节点x所跟随的社区领导者节点l的具体方法如下:对于所遍历的节点x,若节点x的角色为社区领导者,则社区领导者节点l即节点x本身;若节点的角色为社区跟随者,则沿着节点x到社区领导者节点的跟随链上溯,直到找到社区领导者节点,即在跟随链上找到角色为社区领导者的节点,将节点x所跟随的社区领导者节点l设置为该节点;若在上溯过程中发现某个节点的社区跟随目标为节点x本身,即出现跟随环路情况时,则停止上溯,将节点x的角色设置为社区领导者节点,即节点x的社区领导者节点l设置为节点x本身。
相较于现有技术,本发明的有益效果是: 本方法通过让每个节点采用邻域最可信赖跟随策略选择跟随目标得到网络的社区结构,具有线性的时间复杂度,运行效率优于目前典型的社区发现算法,且无需社区数目的先验知识,能够做到对网络结构自适应,可有效的挖掘社会网络中的社区结构,可应用于目标群体挖掘、精确营销等领域。综上,本发明的方法能够高效的检测社交网络的社区结构。
附图说明
图1是本发明方法的实现流程图。
图2是本发明方法中步骤C的实现流程图。
图3是本发明方法中步骤D的实现流程图。

Claims (7)

1.一种社会网络中的邻域跟随社区发现方法,其特征在于,包括以下步骤:
步骤A:读取社会网络数据,构造以社会网络用户为节点,用户关系为边的社会网络图;
步骤B:根据社会网络图,遍历社会网络图中的节点,将所有节点的角色初始化为未确定;
步骤C:根据社会网络图,遍历社会网络图中的节点,确定节点间的跟随关系;
步骤D:根据节点间的跟随关系,遍历社会网络图中的节点,将跟随同一节点的节点划分至同一社区。
2.根据权利要求1所述的一种社会网络中的邻域跟随社区发现方法,其特征在于,所述步骤C中,确定节点间的跟随关系,包括以下步骤:
步骤C1:对于所遍历的节点x,按照最可信赖邻域跟随规则选择节点k
步骤C2:设置节点x的社区跟随目标为节点k,并更新节点k的社区跟随者数量,即以节点k为社区跟随目标的节点数量;
步骤C3:若节点x的角色尚未确定,则将节点x的角色设置为社区跟随者;
步骤C4:判定节点k是否满足作为社区领导者的条件,如果满足,设置节点k的角色为社区领导者;反之设置节点k的角色为社区跟随者;
步骤C5:重复步骤C1~C4,直到社会网络图中的所有节点均已遍历。
3.根据权利要求2所述的一种社会网络中的邻域跟随社区发现方法,其特征在于,所述步骤C1中,采用的最可信赖邻域跟随规则为:获取节点x的邻域中社区跟随节点最多的节点作为节点x的社区跟随目标,定义为:
其中following x  表示节点x所选择的社区跟随目标,Neighborhood(x)表示节点x的邻域,定义为:
其中N(x)为节点x的邻居节点集合,由与节点x有边相连的所有节点构成,定义为:
其中VE分别为社会网络图G的节点集合与边集合;
fc j 表示节点j的社区跟随节点数,即节点j的邻域中,以节点j为社区跟随目标的节点数量,定义为:
其中followers j 表示节点j的邻域中,以节点j为社区跟随目标的节点集合,即与节点j之间存在直接邻域跟随关系的节点集合,定义为:
其中表示节点p与节点j之间存在直接邻域跟随关系,定义为:
节点x的邻域包含节点本身,因此节点x的社区跟随目标可以是节点x本身;如节点x的邻域中有多个节点满足跟随节点数最多的条件,则从中选择度最大的节点作为节点x的社区跟随目标;如仍有多个节点满足度最大的条件,则从中随机选择一个节点作为节点x的跟随目标。
4.根据权利要求3所述的一种社会网络中的邻域跟随社区发现方法,其特征在于,定义节点在社区中的两种角色:社区领导者和社区跟随者,社区由不同角色的节点以及节点间的跟随关系构成,一个社区由一个社区领导者节点和其余的社区跟随者节点构成,社区内的每个节点都直接或间接地跟随社区领导者节点,一个由社区领导者节点l表示的社区定义为:
其中表示节点x与节点l之间存在直接邻域跟随关系,即节点x直接跟随社区领导者节点l表示节点x与节点l之间存在间接邻域跟随关系,即节点x不属于l的邻域,但两个节点间存在中间节点,构成一个从xl的跟随链:,即节点x间接跟随社区领导者节点l,记为x=l表示由社区领导者节点l表示的社区包括社区领导者节点自身。
5.根据权利要求4所述的一种社会网络中的邻域跟随社区发现方法,其特征在于,所述步骤B4中,判定节点k是否满足作为社区领导者的条件定义为: 
即给定参数(0<r<1),当节点k的角色为社区跟随者时,若LQ k  ≥ r,则将节点k的角色设置为社区领导者;若节点k为社区领导者但LQ k  < r,则重新设置节点k的角色为社区跟随者;
其中LQ k 表示节点k的领袖质量,为节点k的社区跟随节点数与节点k的社区跟随目标的社区跟随节点数的比值,以反映节点独立于其社区跟随目标的能力,定义为:
其中fc k 为节点k的社区跟随节点数,为节点k的社区跟随目标的社区跟随节点数。
6.根据权利要求5所述的一种社会网络中的邻域跟随社区发现方法,其特征在于,所述步骤D中,根据节点间的跟随关系得到网络社区,具体包括以下步骤:
步骤D1:对于所遍历的节点x,寻找节点x所跟随的社区领导者节点l
步骤D2:获取由社区领导者节点l所代表的节点集合,即由社区领导者节点l所代表的社区,将节点x添加到该集合中;
步骤D3:重复步骤D1~D2,直到社会网络图中的所有节点均已遍历。
7.根据权利要求6所述的一种社会网络中的邻域跟随社区发现方法,其特征在于,所述步骤D1中,寻找节点x所跟随的社区领导者节点l的具体方法如下:对于所遍历的节点x,若节点x的角色为社区领导者,则社区领导者节点l即节点x本身;若节点的角色为社区跟随者,则沿着节点x到社区领导者节点的跟随链上溯,直到找到社区领导者节点,即在跟随链上找到角色为社区领导者的节点,将节点x所跟随的社区领导者节点l设置为该节点;若在上溯过程中发现某个节点的社区跟随目标为节点x本身,即出现跟随环路情况时,则停止上溯,将节点x的角色设置为社区领导者节点,即节点x的社区领导者节点l设置为节点x本身。
CN201510046397.2A 2015-01-30 2015-01-30 一种社会网络中的邻域跟随社区发现方法 Expired - Fee Related CN104700311B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510046397.2A CN104700311B (zh) 2015-01-30 2015-01-30 一种社会网络中的邻域跟随社区发现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510046397.2A CN104700311B (zh) 2015-01-30 2015-01-30 一种社会网络中的邻域跟随社区发现方法

Publications (2)

Publication Number Publication Date
CN104700311A true CN104700311A (zh) 2015-06-10
CN104700311B CN104700311B (zh) 2018-02-06

Family

ID=53347401

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510046397.2A Expired - Fee Related CN104700311B (zh) 2015-01-30 2015-01-30 一种社会网络中的邻域跟随社区发现方法

Country Status (1)

Country Link
CN (1) CN104700311B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105808696A (zh) * 2016-03-03 2016-07-27 北京邮电大学 一种基于全局和局部特征的跨在线社交网络用户匹配方法
CN107092667A (zh) * 2017-04-07 2017-08-25 平安科技(深圳)有限公司 基于社交网络的群组查找方法和装置
CN108614932A (zh) * 2018-04-23 2018-10-02 中南大学 基于边图的线性流重叠社区发现方法、系统及存储介质
CN109978705A (zh) * 2019-02-26 2019-07-05 华中科技大学 一种基于极大团枚举的社交网络中社团发现方法
CN110162400A (zh) * 2019-05-21 2019-08-23 湖南大学 复杂网络环境下实现mas系统中智能体合作的方法和系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103325061A (zh) * 2012-11-02 2013-09-25 中国人民解放军国防科学技术大学 一种社区发现方法和系统
US20130282432A1 (en) * 2010-04-09 2013-10-24 Suk Hwan Yeom Method of generating social marketing group information of each affiliate store in which credit card payment information is associated with social network information and after-marketing method intended for social marketing group

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130282432A1 (en) * 2010-04-09 2013-10-24 Suk Hwan Yeom Method of generating social marketing group information of each affiliate store in which credit card payment information is associated with social network information and after-marketing method intended for social marketing group
CN103325061A (zh) * 2012-11-02 2013-09-25 中国人民解放军国防科学技术大学 一种社区发现方法和系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
白林根: "基于复杂网络的微博用户关系网络结构研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
雷小康: "基于邻域跟随的群集系统分群控制算法", 《控制与决策》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105808696A (zh) * 2016-03-03 2016-07-27 北京邮电大学 一种基于全局和局部特征的跨在线社交网络用户匹配方法
CN105808696B (zh) * 2016-03-03 2019-07-30 北京邮电大学 一种基于全局和局部特征的跨在线社交网络用户匹配方法
US10268655B2 (en) 2016-04-07 2019-04-23 Ping An Technology (Shenzhen) Co., Ltd. Method, device, server and storage medium of searching a group based on social network
CN107092667A (zh) * 2017-04-07 2017-08-25 平安科技(深圳)有限公司 基于社交网络的群组查找方法和装置
CN107092667B (zh) * 2017-04-07 2018-02-27 平安科技(深圳)有限公司 基于社交网络的群组查找方法和装置
CN108614932A (zh) * 2018-04-23 2018-10-02 中南大学 基于边图的线性流重叠社区发现方法、系统及存储介质
CN108614932B (zh) * 2018-04-23 2021-11-30 中南大学 基于边图的线性流重叠社区发现方法、系统及存储介质
CN109978705A (zh) * 2019-02-26 2019-07-05 华中科技大学 一种基于极大团枚举的社交网络中社团发现方法
CN110162400A (zh) * 2019-05-21 2019-08-23 湖南大学 复杂网络环境下实现mas系统中智能体合作的方法和系统

Also Published As

Publication number Publication date
CN104700311B (zh) 2018-02-06

Similar Documents

Publication Publication Date Title
Cherifi et al. On community structure in complex networks: challenges and opportunities
CN103678671B (zh) 一种社交网络中的动态社区检测方法
CN104700311A (zh) 一种社会网络中的邻域跟随社区发现方法
CN104657418B (zh) 一种基于隶属度传播的复杂网络模糊社团挖掘方法
Chen et al. Detecting local community structures in complex networks based on local degree central nodes
CN111723298B (zh) 基于改进标签传播的社交网络社团发现方法、装置及介质
CN103676645A (zh) 一种时间序列数据流中的关联规则的挖掘方法
CN102194149B (zh) 社区发现方法
Selim et al. Towards shortest path identification on large networks
CN107194498B (zh) 一种水文监测网络的优化方法
CN105279187A (zh) 一种基于边聚集系数的社会网络群体划分方法
CN108229578B (zh) 基于数据、信息和知识三层图谱架构的图像数据目标识别方法
CN105335438A (zh) 一种基于局部最短回路的社会网络群体划分方法
CN102799625B (zh) 一种挖掘社交网络中话题核心圈的方法及系统
CN112422571A (zh) 一种跨越多个属性网络进行异常对齐的方法
CN112087316B (zh) 基于异常数据分析的网络异常根源定位方法
Pourkazemi et al. Community detection in social network by using a multi-objective evolutionary algorithm
Xiao et al. Convergence improvement of differential evolution for community detection in complex networks
CN109685675A (zh) 基于标签传播自然启发式的动态网络社团结构识别方法
Jabbour et al. Triangle-driven community detection in large graphs using propositional satisfiability
Wang et al. Modeling higher-order interactions in complex networks by edge product of graphs
Kim et al. An advanced approach for incremental flexible periodic pattern mining on time-series data
CN107798146A (zh) 一种基于子图近似同构的学习资源本体匹配方法
Jin et al. Ant colony optimization with markov random walk for community detection in graphs
CN108011735B (zh) 社区发现方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180206

Termination date: 20210130