CN104484344B - 一种社会网络中社团成员层次结构的探测方法 - Google Patents

一种社会网络中社团成员层次结构的探测方法 Download PDF

Info

Publication number
CN104484344B
CN104484344B CN201410698820.2A CN201410698820A CN104484344B CN 104484344 B CN104484344 B CN 104484344B CN 201410698820 A CN201410698820 A CN 201410698820A CN 104484344 B CN104484344 B CN 104484344B
Authority
CN
China
Prior art keywords
node
sigma
community
level
corporations
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201410698820.2A
Other languages
English (en)
Other versions
CN104484344A (zh
Inventor
李侃
陈凤娇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN201410698820.2A priority Critical patent/CN104484344B/zh
Publication of CN104484344A publication Critical patent/CN104484344A/zh
Application granted granted Critical
Publication of CN104484344B publication Critical patent/CN104484344B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明涉及一种社会网络中社团成员层次结构的探测方法,属于网络技术领域,该方法包括以下步骤:a,输入社会网络的节点和边,社团核心节点S,迭代步数T;b,计算每个节点i对于社团核心S的归属程度;c,计算初始层次数K为1时,前i个节点的归属程度不一致性,各层次的分界点和社团结构稳定性;d,增加层次数K,更新归属程度不一致性以及各层次的分界点,计算社团结构稳定性;e,若社团结构稳定性比前一次增加,则记录更新的层次划分结果,重复步骤d;否则,停止计算,输出当前的层次划分结果。本发明方法可以检测社团成员的层次结构,显示多分辨率下的社团结构以及成员之间的关系。

Description

一种社会网络中社团成员层次结构的探测方法
技术领域
本发明涉及一种社团成员层次结构的探测方法,特别涉及一种社会网络中的社团成员层次结构的探测方法,属于网络技术领域。
背景技术
社会网络中的节点具有层次结构,例如领导阶级。在这些网络中,联系紧密的节点构成社团,反应了网络拓扑结构的性质。社团内部节点归属于社团的程度不同,形成了社团成员的层次结构。社团成员的层次结构显示了社团在多种分辨率下的结构,并且显示了社团成员之间的关系。利用社团成员之间的关系可以提高网页搜索结果的点击率。通常网页搜索结果是每页固定显示10条到50条,而用户通常只点击第一页的内容,使得其他同样重要的网页无法被点击到。使用本发明对搜索结果划分层次,将同等重要的网页放到同一页,可以让同等重要的网页有更大的机会被点击到,从而提高网页搜索结果的点击率。利用社团成员之间的关系还可提高购物商品推荐的准确率。比如,当推荐用户购物时需要获知不同用户之间对商品喜好的相似程度。而当前的方法只关注于用户喜欢的商品,而忽视了用户不喜欢的商品。利用社团成员之间的关系就可根据用户对某类商品的喜欢程度划分层次,既包含同样喜欢该商品的用户群,又包含同样不喜欢该商品的用户群,从而加深了对用户群的了解,提高推荐购物的准确性。
当前研究者们已经提出了社团检测的方法,包括Newman提出的用于无重叠社团检测的模块度方法、Liu提出的用于模糊社团检测的随机游走方法,Steve提出的用于检测重叠社团的标号传播方法等。近年来,层次结构得到关注,包括Newman提出的用于社团层次结构的模块方法,Havemann提出的用于检测重叠社团结构的贪心方法,Ahn提出的用于检测重叠社团层次结构的边聚类方法。然而当前方法只关注社团之间的关系,而不适用于检测社团内部成员之间的关系。
发明内容
本发明的目的是为解决现有社团检测方法不能检测社团内部成员之间的关系的问题,提供一种社会网络中社团成员层次结构的探测方法。
本发明的目的是通过以下技术方案实现的:
一种社会网络中的社团成员层次结构的探测方法,包括以下步骤:
步骤一、输入社会网络的节点和边,社团核心节点s,迭代步数T;
步骤二、根据下述公式计算每个节点i对于社团核心s的归属程度并按照归属程度降序排列所有节点:
其中矩阵ANXN是网络邻接矩阵,N是网络中节点的个数,矩阵元素Aij=1表示节点i和j之间有边,1<=i,j<=N,否则,Aij=0表示节点i和j之间没有边;di是节点i的度数,即节点i连接的边数;
步骤三、初始层次数K=1,根据下述公式计算前i个节点的归属程度不一致性f1,i,令前i个节点在第1层的分界点g1,i=-1,社团结构稳定性FL1=0:
f1,i=cost(1,i);
其中对于任意参数1<=p<=q<=N,
其中Li为第i个节点的归属程度,参数w和b的值根据下述公式计算:
步骤四、使层次数K增加1,根据下述公式计算前i个节点的归属程度不一致性fK,i、前i个节点在第K层的分界点gK,i以及社团结构稳定性FLK
fK,i=min{fK-1,r+cost(r+1,i)},r=K-1,K,...,i-1;
CK是层次数为K时的层次划分,第k层的节点集合为levelk;dinK是K个层次中,处于同一层次的节点之间的边数,doutK是K个层次中,处于不同层次的节点之间的边数;
步骤五、若社团结构稳定性比前一次增加,则记录更新的层次划分结果,重复步骤四;否则,停止计算,输出当前的层次划分结果。
本发明在社会网络中进行社团探测的原理是:成员归属于社团的程度不同,形成了社团成员的层次结构。因此要检测该结构,需要衡量成员的归属程度,并根据该程度对成员划分层次。
1.归属程度的衡量
社团成员的归属程度应满足以下要求:
归属程度越高,节点离社团核心越近。
归属程度在任意阈值以上的节点及其之间边,能够形成连通块。
归属程度相差大的两个节点应该位于不同的层次。
基于以上要求,本发明采用随机游走方法来衡量归属程度。假设一个人站在一个节点上,并以等概率随机向相邻节点移动。则从节点i走一步到节点j的转移概率为
矩阵ANXN是网络邻接矩阵,节点i和j之间有边,则矩阵元素Aij=1,否而矩阵元素Aij=0;di是节点i的度数,即节点i连接的边数。
对于给定节点s,从节点s经过t步走到节点i的概率为
初始值:
则以节点s为社团核心,步数为T时,节点i的归属程度定义为
迭代步数T取值越大,计算结果越准确;因而,在应用本发明方法时可以根据数据规模以及性能指标综合确定一个合适的值。
2.层次结构的划分
将所有节点按照归属程度降序排列。从附图2可看出,相同层次的节点间,归属程度的变化趋势成线性保持一致。为了使同层次内的节点间的归属程度保持一致,要使不一致性尽量小。其中不一致性定义为
y(i)=wi+b
nk为前k层的节点数。此为最优化问题,采用动态规划方法计算不一致性的最小值。设前i个节点划分为K层时的不一致性为fK,i,记录分界点gK,i,其中
fK,i=min{fK-1,r+cost(r+1,i)},r=K-1,K,...,i-1;
对于任意参数1<=p<=q<=N,
Li为第i个节点的归属程度,参数w和b的值为
为了进一步提高计算效率,假设分界点gK,i是随着i的增加而非降的。经实验验证,实际网络中99%的情况均满足此假设。在此假设下,时间复杂度可优化到O(KN)。
为了确定层次数K,衡量社团在K层的稳定性,以使稳定性局部最优的K作为最终结果的层次数。其中稳定性定义为
CK是层次数为K时的层次划分,第k层的节点为levelk;dinK是所有K个层次中,处于同一层次的节点之间的边数,doutK是所有K个层次中,处于不同层次的节点之间的边数。
有益效果
本发明的方法可以检测社团成员的层次结构,显示多分辨率下的社团结构以及成员之间的关系。
附图说明
图1为本发明实施例包含11个节点,24条边的样例网络;
图2为本发明实施例以节点0为社团核心的节点归属程度,并按照节点归属程度降序排列的网络层次示意图。
具体实施方式
下面将结合附图和实施例对本发明方法加以详细说明。
如图1所示,为本发明实施例11个节点的网络结构图。
本发明的一种社会网络中的社团成员层次结构的探测方法,包括以下步骤:
1.输入社会网络的节点和边,社团核心节点s=0,迭代步数T=3;网络结构如图1所示;
2.根据步骤二公式计算各节点的归属程度,并按归属程度降序排序,得到如下表所示序列:
归属程度 节点
0.372 1
0.372 3
0.367 2
0.2275 4
0.1783 5
0.1783 7
0.165 6
0.0756 8
0.0756 9
0.0756 10
按照归属程度降序排列各节点,得到节点序列如附图2所示。
3.令初始层次数K=1,根据步骤三公式计算得到不一致性f和分界点g如下表所示:
节点 f g
1 0 -1
2 0 -1
3 0.000004 -1
4 0.005704 -1
5 0.006576 -1
6 0.007143 -1
7 0.008558 -1
8 0.008771 -1
9 0.009457 -1
10 0.012037 -1
社团稳定性FL为0,记录如下表所示的当前的网络层次结构划分:
节点 层次
1 1
2 1
3 1
4 1
5 1
6 1
7 1
8 1
9 1
10 1
4.增加层次数,即K=2,根据步骤四公式计算得到不一致性f和分界点g如下表所示:
节点 f g
1 0 1
2 0 1
3 0 1
4 0 2
5 0.000004 3
6 0.000408 3
7 0.000522 3
8 0.002201 3
9 0.002217 3
10 0.002824 3
5.社团稳定性FL为0.25,大于前一次的0,记录当前的划分,继续计算;
由于第2层的分界点g2,10=3,因此当前划分结果如下表所示:
节点 层次
1 1
2 1
3 1
4 2
5 2
6 2
7 2
8 2
9 2
10 2
返回步骤四,增加层次数K=3,则计算得到不一致性f和分界点g如下表所示:
节点 f g
1 0 1
2 0 1
3 0 2
4 0 2
5 0 4
6 0 4
7 0.000004 5
8 0.000408 6
9 0.000522 7
10 0.000522 7
继续步骤五,社团稳定性FL为0.67,大于前一次的0.25,记录当前的划分,继续计算;
由于第3层的分界点g3,10=7,第2层的分界点g2,7=3,因此当前划分结果如下表所示:
返回步骤四,增加层次数K=4,则计算得到不一致性f和分界点g如下表所示:
节点 f g
1 0 1
2 0 1
3 0 1
4 0 3
5 0 4
6 0 4
7 0.000004 6
8 0.000408 6
9 0.000522 7
10 0.000522 7
继续步骤五,社团稳定性FL为0.67,不大于前一次的0.67,则停止计算。
输出当前网络层次划分结果如下表所示:
节点 层次
1 1
2 1
3 1
4 2
5 2
6 2
7 2
8 3
9 3
10 3
以上所述的具体描述,对发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (1)

1.一种社会网络中社团成员层次结构的探测方法,其特征在于:包括以下步骤:
步骤一、输入社会网络的节点和边,社团核心节点S,迭代步数T;
步骤二、根据下述公式计算每个节点i对于社团核心S的归属程度并按照归属程度降序排列所有节点:
BC s T ( i ) = Σ t = 1 T q s t ( i ) ;
q s t ( i ) = Σ j = 1 N q s t - 1 ( j ) Q i j ;
Q i j = A i j d i , i ≠ s 0 , i = s ;
q s 0 ( i ) = 0 , i ≠ s 1 , i = s ;
其中矩阵ANXN是网络邻接矩阵,N是网络中节点的个数,矩阵元素Aij=1表示节点i和j之间有边,1<=i,j<=N,否则,Aij=0表示节点i和j之间没有边;di是节点i的度数,即节点i连接的边数;表示从节点s走t步到节点i的概率,Qij表示一种转移矩阵;
步骤三、初始层次数K=1,根据下述公式计算前i个节点的归属程度不一致性f1,i,令前i个节点在第1层的分界点g1,i=-1,社团结构稳定性FL1=0:
f1,i=cost(1,i);
其中对于任意参数1<=p<=q<=N,
c o s t ( p , q ) = Σ i = p q ( w i + b - L i ) 2
其中Li为第i个节点的归属程度,参数w和b的值根据下述公式计算:
w = ( q - p + 1 ) Σ i = p q iL i - Σ i = p q iΣ i = p q L i ( q - p + 1 ) Σ i = p q i 2 - Σ i = p q iΣ i = p q i
b = Σ i = p q i 2 Σ i = p q L i - Σ i = p q iΣ i = p q iL i ( q - p + 1 ) Σ i = p q i 2 - Σ i = p q iΣ i = p q i
步骤四、使层次数K增加1,根据下述公式计算前i个节点的归属程度不一致性fK,i、前i个节点在第K层的分界点gK,i以及社团结构稳定性FLK
fK,i=min{fK-1,r+cost(r+1,i)},r=K-1,K,...,i-1;
g K , i = arg min r { f K - 1 , r + cos t ( r + 1 , i ) } , r = K - 1 , K , ... , i - 1 ;
FL K = F i t n e s s ( C K ) = din K din K + dout K
C K = ∪ k = 1 K level k
CK是层次数为K时的层次划分,第k层的节点集合为levelk;dinK是K个层次中,处于同一层次的节点之间的边数,doutK是K个层次中,处于不同层次的节点之间的边数;
步骤五、若社团结构稳定性比前一次增加,则记录更新的层次划分结果,重复步骤四;否则,停止计算,输出当前的层次划分结果。
CN201410698820.2A 2014-11-27 2014-11-27 一种社会网络中社团成员层次结构的探测方法 Expired - Fee Related CN104484344B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410698820.2A CN104484344B (zh) 2014-11-27 2014-11-27 一种社会网络中社团成员层次结构的探测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410698820.2A CN104484344B (zh) 2014-11-27 2014-11-27 一种社会网络中社团成员层次结构的探测方法

Publications (2)

Publication Number Publication Date
CN104484344A CN104484344A (zh) 2015-04-01
CN104484344B true CN104484344B (zh) 2017-07-28

Family

ID=52758885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410698820.2A Expired - Fee Related CN104484344B (zh) 2014-11-27 2014-11-27 一种社会网络中社团成员层次结构的探测方法

Country Status (1)

Country Link
CN (1) CN104484344B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110213070B (zh) * 2018-04-04 2021-08-17 腾讯科技(深圳)有限公司 团网络识别方法、装置、服务器及计算机可读存储介质
CN109308262A (zh) * 2018-09-17 2019-02-05 中国人民解放军63921部队 一种软件缺陷定位方法以及装置
CN113553498A (zh) * 2021-06-18 2021-10-26 北京旷视科技有限公司 团体更新方法、装置、电子设备和计算机可读介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102148717A (zh) * 2010-02-04 2011-08-10 明仲 一种二分网络中社团检测方法及装置
CN103164533A (zh) * 2013-04-09 2013-06-19 哈尔滨工业大学 基于信息理论的复杂网络社团检测方法
CN104008165A (zh) * 2014-05-29 2014-08-27 华东师范大学 一种基于网络拓扑结构和节点属性的社团检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102148717A (zh) * 2010-02-04 2011-08-10 明仲 一种二分网络中社团检测方法及装置
CN103164533A (zh) * 2013-04-09 2013-06-19 哈尔滨工业大学 基于信息理论的复杂网络社团检测方法
CN104008165A (zh) * 2014-05-29 2014-08-27 华东师范大学 一种基于网络拓扑结构和节点属性的社团检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Fuzzy modularity and fuzzy community structure in networks;Jian liu;《The European Physical Journal B》;20101001;第77卷(第4期);第547-557页 *
基于随机游走算法的社会化标签的用户推荐;王海雷等;《计算机工程与设计》;20130716;第34卷(第7期);第2387-2391页 *

Also Published As

Publication number Publication date
CN104484344A (zh) 2015-04-01

Similar Documents

Publication Publication Date Title
CN110110094B (zh) 基于社交网络知识图谱的跨网络人物关联方法
CN103150374B (zh) 一种识别微博异常用户的方法和系统
CN103793476B (zh) 基于网络社区的协同过滤推荐方法
CN104239496B (zh) 一种结合模糊权重相似性度量和聚类协同过滤的方法
CN105373597A (zh) 基于k-medoids项目聚类和局部兴趣融合的用户协同过滤推荐方法
CN104268271A (zh) 一种兴趣和网络结构双内聚的社交网络社区发现方法
Benouaret et al. A package recommendation framework for trip planning activities
CN104424254B (zh) 获取相似对象集合、提供相似对象信息的方法及装置
CN107169873A (zh) 一种多特征融合的微博用户权威度评价方法
CN105719191A (zh) 多尺度空间下不确定行为语义的社交群体发现系统及方法
CN103116588A (zh) 一种个性化推荐方法及系统
CN105808698A (zh) 一种面向物联网用户查询请求的TOP-k位置兴趣点推荐方法
CN104484344B (zh) 一种社会网络中社团成员层次结构的探测方法
CN104268230B (zh) 一种基于异质图随机游走的中文微博客观点探测方法
CN109522475A (zh) 一种基于用户历史消费数据的商家推荐方法
CN104462592A (zh) 基于不确定语义的社交网用户行为关系推演系统及方法
CN105354260B (zh) 一种融合社会网络和项目特征的移动应用推荐方法
CN103336771B (zh) 基于滑动窗口的数据相似检测方法
CN107862617A (zh) 一种基于用户综合相似度的微博社区划分方法
CN102999506A (zh) 一种获取用户独立访问数的方法与装置
CN106294334A (zh) 一种微博舆情指标体系的计算方法及装置
CN105893637A (zh) 大规模微博异构信息网络中的链接预测方法
Yu et al. Inferring mobility relationship via graph embedding
CN104778213A (zh) 一种基于随机游走的社交网络推荐方法
CN107239512A (zh) 一种结合评论关系网络图的微博垃圾评论识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170728

Termination date: 20201127