CN107357858B - 一种基于地理位置的网络重构方法 - Google Patents

一种基于地理位置的网络重构方法 Download PDF

Info

Publication number
CN107357858B
CN107357858B CN201710520291.0A CN201710520291A CN107357858B CN 107357858 B CN107357858 B CN 107357858B CN 201710520291 A CN201710520291 A CN 201710520291A CN 107357858 B CN107357858 B CN 107357858B
Authority
CN
China
Prior art keywords
similarity
network
nodes
user
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710520291.0A
Other languages
English (en)
Other versions
CN107357858A (zh
Inventor
郑子彬
李友
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Priority to CN201710520291.0A priority Critical patent/CN107357858B/zh
Publication of CN107357858A publication Critical patent/CN107357858A/zh
Application granted granted Critical
Publication of CN107357858B publication Critical patent/CN107357858B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Remote Sensing (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于地理位置的网络重构方法,包括以下步骤:S1、计算节点网络结构相似度;S2、计算用户地理位置相似度;S3、结合节点网络结构相似度和用户地理位置相似度,建立统一的相似度;S4、采用阈值处理的方法,对步骤S3得到的统一的相似度进行过滤,根据过滤结果重新构建一个有权网络。本发明结合用户地理位置这一动态特征对社交网络进行重构,重构后的网络图更容易获得有位置特征的网络特性;基于有权值的网络结构进行社区发现的结果具有地理位置信息的社区划分;构造后进行社区发现,可以得到在地理位置上面分布比较集中的社区。

Description

一种基于地理位置的网络重构方法
技术领域
本发明涉及网络优化的技术领域,尤其涉及到一种基于地理位置的网络重构方法。
背景技术
生活中存在着各种各样的网络,如科研合作网络、演员合作网络、城市交通网络、电力网、以及像QQ、微博、微信这样的社交网络。社交网络的核心是参与其中的用户以及用户之间的关系。一般采用图模型来为其进行建模,其中的节点表示社交网络中用户,连边则表示用户与用户之间的关系,关系的紧密程度通过连边上的权重进行区分,权重越大,关系距离越小,关系强度越大,关系越亲密。
基于社交网络的建模,可以得到图结构,在图中包含着一定的结构,其中存在一个一个的节点子集合,在这些子集合的内部存在较多的边,而子集合与子集合之间存在较少的边。这种子结构就被称为社区,社区发现算法就是通过对网络结构的理解,构造算法去发现识别出社区,从而进行进一步地应用来实现好友推荐、节点属性识别等场景。
社区发现是一件很有意义的事情。在算法层面上来说,属于无监督的图聚类算法,所以具备聚类算法所能达到的效果,对一个大型网络调用社区发现算法,其实是对其按照特定标准进行了划分,在此基础上可对每个社区做进一步的发掘。而从计算的角度而言,社区分划相当于分解了任务,起到了降低计算复杂度的作用。
移动互联网时代的到来,促进社交网络的飞速发展,社交网络中的信息越来越丰富,传统社交网络的研究是单纯基于用户与用户之间的好友关系,通过好友关系建立一个网络图,在网络图中,节点代表用户,连边表示用户之间以某种方式产生连接,比如在朋友圈内互为好友,或者同在一个兴趣群内等。
然而,社交网络中的信息除了相对而言比较静态的好友关系链以外,还存在更多用户本身的属性,网络图中的节点各不相同,每个都有各自的其他属性来描述这个个体。可见,传统社交网络不利于社交网络的分析,特别是社区发现这方面。
发明内容
本发明的目的在于克服现有技术的不足,提供一种重构后的网络更容易获得有位置特征的网络特性、进行社区发现的结果具有地理位置信息的社区划分、社区发现能得到在地理位置上面分布比较集中的社区的基于地理位置的网络重构方法。
为实现上述目的,本发明所提供的技术方案如下:
关于节点网络结构相似度:
在社交网络中用户与用户之间因为某种关联而以连边的形式在网络图中表示,比如用户A和用户B在社交媒体上互为好友关系,那么就可以说在网络图中节点A和节点B有一条连边。
根据不同的规则,可以构造出有权网络图和无权网络图,在无权图中用户与用户之间的连边没有权重,也即每条连边权重一样。在有权图中,根据相应规则确定权重,比如用户A和用户B在社交媒体上的交互次数比较少,那么节点A、B之间的连边就可以赋一个较小的权重,如0.4,用户A和用户C交互比较多,那么节点A、C之间就赋一个较大的权值。在网络图中,相互之间有连边的两个节点互为邻居。
构建网络之前,需要定义网络中两个节点的相似度,从物理意义上来讲,衡量两个节点的相似度,根据他们的邻居节点来表示,也就是说,两个节点之间若有较多共同邻居,则在网络图结构上存在较大相似性。本方案采用Jaccard相似度方法计算网络中任意两个节点之间的相似度。
在无权图中,节点u,v的Jaccard相似度表示为:
Figure BDA0001337462640000031
其中N[u],N[v]分别表示节点u,v的所有邻居加上自己所组成的集合,d[u],d[v]表示对应的邻居集合中的节点个数,|.|表示对集合求元素的个数。
通常情况下,Jaccard相似度计算方法用于计算相互间有连边的节点的相似度。但本方案计算Jaccard相似度的对象不是对于在原网络中互为邻居的两个节点,而是相互间跳数小于等于2的所有节点对,即该两个节点间有共同邻居,或者该两个节点直接相连。
本方案第一步骤S1计算节点网络结构相似度的具体步骤如下:
S11、基于网络图的邻接矩阵Adj,对于每个节点进行遍历,将其最大跳数为2的邻居在矩阵的对应位置置为1(对角线位置为0),生成一个新的邻接矩阵Nei。
S12、对共有邻居矩阵Nei中的所有边进行遍历,基于邻接矩阵Adj,计算对应节点间的Jaccard相似度作为网络结构的相似度。
关于用户地理位置相似度:
网络中用户除了好友关系链外,用户本身存在着各自不同的地理位置信息这些信息在网络中体现主要有:用户会发布包含地理位置的状态、分享地理位置给好友、在兴趣点签到等。
在计算用户间基于地理位置信息的相似度时,本发明将所有的用户信息表示为各种兴趣点的记录值,也就是用户在不同地理位置在一段时间内发布状态或签到的次数,实际值一般会是一日多次,在这里可以将其视为重复数据去掉,也就是说,如果一段时间为1个月,那么单个兴趣点的记录数不会超过31次;同时兴趣点数据需要根据实际地理位置进行进一步去重。在这种预处理的情况,每个用户用1个行向量表示其地理位置的特征,行向量的每个值表示对应兴趣点的记录数,计算两个人地理位置特征上的相似度过程,任意两个用户的地理位置特征A=[a1,a2,…,an],B=[b1,b2,…,bn],相似度计算法则为:
Figure BDA0001337462640000041
其中,log(x)公式中,当x=0时,log(x)=0;当x>0时,log(x)=log2(x)。
本方案第二步骤S2计算用户地理位置相似度的具体步骤如下:
S21、对每个用户的兴趣点数据进行预处理,并生成对应的表示地理位置信息的行向量;
S22、遍历共有邻居矩阵Nei中的所有边,对应连边的两个节点根据类熵方法计算用户地理位置属性的相似度。
关于网络结构相似度和用户地理位置相似度的结合:
对于网络结构相似度和用户地理位置相似度的非线性构造,主要目的是根据现实生活中两者的非线性关系而来,本方案记任意两节点的网络结构相似度为S,地理位置相似度为P,相似度结合后的相似度为NS,其计算公式为:
NS=Sα+β*P
其中,α和β为加权参数。
本方案第三步骤S3按照上述公式结合节点网络结构相似度和用户地理位置相似度,建立统一的相似度NS。
本方案第四步骤S4将步骤S3得到的统一的相似度NS通过一个阈值处理,权重大于阈值的边保留,得到重构的矩阵,从而得到有权的网络。
与现有技术相比,本方案原理和优点如下:
结合用户地理位置这一动态特征对社交网络进行重构,重构后的网络图更容易获得有位置特征的网络特性;基于有权值的网络结构进行社区发现的结果具有地理位置信息的社区划分;构造后进行社区发现,可以得到在地理位置上面分布比较集中的社区。
附图说明
图1为本发明一种基于地理位置的网络重构方法的流程图;
图2为本发明实施例初始的网络图;
图3为本发明实施例重构后的网络图。
具体实施方式
下面结合具体实施例对本发明作进一步说明:
参见附图1所示,本实施例所述的一种基于地理位置的网络重构方法,包括以下步骤:
S1、计算节点网络结构相似度:
S11、基于网络图的邻接矩阵Adj,对于每个节点进行遍历,将其最大跳数为2的邻居在矩阵的对应位置标为1,生成共有邻居矩阵Nei(对角线位置为0):
假设网络图如图2表示,图中有七个节点,用邻接矩阵A表示这个网络图,则对应的邻接矩阵Adj表示为7X7的矩阵,对应编号的两个节点有连边则置为1,邻接矩阵为对称矩阵,如下所示:
Figure BDA0001337462640000061
在矩阵Adj中,Adj[m][n]表示第m行,第n列的值;共有邻居矩阵Nei中,两个节点有共同邻居或互为邻居则置为1。
从邻接矩阵Adj转化为共有邻居矩阵Nei的过程,从节点1开始,节点1有节点2一个邻居,节点2除了1、2以外还有3,4两个邻居,那么则将Adj矩阵中将Adj[1][3],Adj[1][4]置为1,同理对余下节点进行同样处理,最后得到Nei矩阵,如下所示:
Figure BDA0001337462640000062
S12、对共有邻居矩阵Nei中的所有边进行遍历,基于邻接矩阵Adj,计算对应节点间的Jaccard相似度作为网络结构的相似度;
在矩阵Nei中所有连边有(1,2),(1,3),(1,4),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(4,7),(5,6),(6,7);
对上述所有边进行遍历,对边上两个节点通过Jaccard相似度计算公式计算结构相似度结果;公式如下:
Figure BDA0001337462640000063
其中,N[u]、N[v]分别表示节点u,v的所有邻居加上自己所组成的集合,d[u]、d[v]表示对应的邻居集合中的节点个数,|.|表示对集合求元素的个数。
S2、计算用户地理位置相似度:
S21、对每个用户的兴趣点数据进行预处理,并生成对应的表示地理位置信息的行向量;其中,预处理具体为:用户在一天内不同地理位置发布状态或签到的次数若多于一次,均记为一次,同时兴趣点数据根据实际地理位置进行进一步去重;
S22、遍历共有邻居矩阵Nei中的所有边,对应连边的两个节点A=[a1,a2,…,an]和B=[b1,b2,…,bn]根据类熵方法计算用户地理位置属性的相似度,计算公式为:
Figure BDA0001337462640000071
其中,log(x)公式中,当x=0时,log(x)=0;当x>0时,log(x)=log2(x)。
S3、结合节点网络结构相似度和用户地理位置相似度,建立统一的相似度,计算公式为:
NS=Sα+β*P
其中,S为任意两节点的网络结构相似度;P为用户地理位置相似度;α和β为加权参数。
假设相似度NS构成的矩阵NS为:
Figure BDA0001337462640000081
S4、采用阈值处理的方法,选取阈值为0.3,对步骤S3得到的统一的相似度NS进行过滤,得到:
Figure BDA0001337462640000082
该经过阈值过滤后的统一的相似度NS即为重构后的矩阵NS,最后转化为重构后有权的网络,如图3所示。
本实施例结合用户地理位置这一动态特征对社交网络进行重构,重构后的网络图更容易获得有位置特征的网络特性;基于有权值的网络结构进行社区发现的结果具有地理位置信息的社区划分;构造后进行社区发现,可以得到在地理位置上面分布比较集中的社区。
以上所述之实施例子只为本发明之较佳实施例,并非以此限制本发明的实施范围,故凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。

Claims (5)

1.一种基于地理位置的网络重构方法,其特征在于:以下步骤:
S1、计算节点网络结构相似度;
S2、计算用户地理位置相似度;
S3、结合节点网络结构相似度和用户地理位置相似度,建立统一的相似度;
S4、采用阈值处理的方法,对步骤S3得到的统一的相似度进行过滤,根据过滤结果重新构建一个有权网络;
所述步骤S1中计算节点网络结构相似度的具体步骤如下:
S11、基于网络图的邻接矩阵Adj,对于每个节点进行遍历,将其最大跳数为2的邻居在矩阵的对应位置标为1,生成共有邻居矩阵Nei;
S12、对共有邻居矩阵Nei中的所有边进行遍历,基于邻接矩阵Adj,计算对应节点间的Jaccard相似度作为网络结构的相似度;
所述步骤S2中计算用户地理位置相似度的具体步骤如下:
S21、对每个用户的兴趣点数据进行预处理,并生成对应的表示地理位置信息的行向量;
S22、遍历共有邻居矩阵Nei中的所有边,对应连边的两个节点根据类熵方法计算用户地理位置属性的相似度;
所述步骤S4具体如下:将步骤S3得到的统一的相似度NS通过一个阈值处理,权重大于阈值的边保留,得到重构的矩阵,从而得到有权的网络。
2.根据权利要求1所述的一种基于地理位置的网络重构方法,其特征在于:所述步骤S12中对应节点间的Jaccard相似度计算公式如下:
Figure FDA0002524026490000011
其中,N[u]、N[v]分别表示节点u,v的所有邻居加上自己所组成的集合,d[u]、d[v]表示对应的邻居集合中的节点个数,|.|表示对集合求元素的个数。
3.根据权利要求1所述的一种基于地理位置的网络重构方法,其特征在于:所述步骤S21中对每个用户的兴趣点数据进行预处理,具体为:用户在一天内不同地理位置发布状态或签到的次数若多于一次,均记为一次,同时兴趣点数据根据实际地理位置进行进一步去重。
4.根据权利要求1所述的一种基于地理位置的网络重构方法,其特征在于:所述步骤S22中对应连边的两个节点根据类熵方法计算用户地理位置属性的相似度,相似度计算公式为:
Figure FDA0002524026490000021
其中,A=[a1,a2,…,an]和B=[b1,b2,…,bn]为任意两个用户的地理位置特征,log(x)公式中,当x=0时,log(x)=0;当x>0时,log(x)=log2(x)。
5.根据权利要求1所述的一种基于地理位置的网络重构方法,其特征在于:所述步骤S3建立统一的相似度NS的计算公式为:
NS=Sα+β*P
其中,S为任意两节点的网络结构相似度;P为用户地理位置相似度;α和β为加权参数。
CN201710520291.0A 2017-06-30 2017-06-30 一种基于地理位置的网络重构方法 Active CN107357858B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710520291.0A CN107357858B (zh) 2017-06-30 2017-06-30 一种基于地理位置的网络重构方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710520291.0A CN107357858B (zh) 2017-06-30 2017-06-30 一种基于地理位置的网络重构方法

Publications (2)

Publication Number Publication Date
CN107357858A CN107357858A (zh) 2017-11-17
CN107357858B true CN107357858B (zh) 2020-09-08

Family

ID=60273346

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710520291.0A Active CN107357858B (zh) 2017-06-30 2017-06-30 一种基于地理位置的网络重构方法

Country Status (1)

Country Link
CN (1) CN107357858B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109120465B (zh) * 2018-10-23 2021-07-02 中国人民解放军战略支援部队信息工程大学 基于模体的目标区域网络拓扑划分方法
CN109472115B (zh) * 2018-12-14 2023-02-10 中国人民解放军国防科技大学 基于地理信息的大规模复杂网络建模方法及装置
CN111694900B (zh) * 2019-02-28 2023-06-13 阿里巴巴集团控股有限公司 一种网络图的处理方法及装置
CN111445674B (zh) * 2020-04-08 2021-09-14 浙江浙能技术研究院有限公司 一种面向百万千瓦超超临界机组制粉系统报警管理的因果网络构建方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101877711A (zh) * 2009-04-28 2010-11-03 华为技术有限公司 社会网络建立方法及装置、以及社区发现方法及装置
CN102880644A (zh) * 2012-08-24 2013-01-16 电子科技大学 社区发现方法
CN104008165A (zh) * 2014-05-29 2014-08-27 华东师范大学 一种基于网络拓扑结构和节点属性的社团检测方法
CN104268271A (zh) * 2014-10-13 2015-01-07 北京建筑大学 一种兴趣和网络结构双内聚的社交网络社区发现方法
CN105303450A (zh) * 2015-11-09 2016-02-03 北京工业大学 基于谱聚类改进交叉的复杂网络社区发现方法
CN105868791A (zh) * 2016-04-15 2016-08-17 上海交通大学 基于模糊聚类的多分辨率社区发现方法
CN106056455A (zh) * 2016-06-02 2016-10-26 南京邮电大学 一种基于位置和社交关系的群组与地点推荐方法
CN106411572A (zh) * 2016-09-06 2017-02-15 山东大学 一种结合节点信息和网络结构的社区发现方法
CN106570082A (zh) * 2016-10-19 2017-04-19 浙江工业大学 一种结合网络拓扑特征和用户行为特征的朋友关系挖掘方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8738361B2 (en) * 2009-07-01 2014-05-27 International Business Machines Corporation Systems and methods for extracting patterns from graph and unstructered data

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101877711A (zh) * 2009-04-28 2010-11-03 华为技术有限公司 社会网络建立方法及装置、以及社区发现方法及装置
CN102880644A (zh) * 2012-08-24 2013-01-16 电子科技大学 社区发现方法
CN104008165A (zh) * 2014-05-29 2014-08-27 华东师范大学 一种基于网络拓扑结构和节点属性的社团检测方法
CN104268271A (zh) * 2014-10-13 2015-01-07 北京建筑大学 一种兴趣和网络结构双内聚的社交网络社区发现方法
CN105303450A (zh) * 2015-11-09 2016-02-03 北京工业大学 基于谱聚类改进交叉的复杂网络社区发现方法
CN105868791A (zh) * 2016-04-15 2016-08-17 上海交通大学 基于模糊聚类的多分辨率社区发现方法
CN106056455A (zh) * 2016-06-02 2016-10-26 南京邮电大学 一种基于位置和社交关系的群组与地点推荐方法
CN106411572A (zh) * 2016-09-06 2017-02-15 山东大学 一种结合节点信息和网络结构的社区发现方法
CN106570082A (zh) * 2016-10-19 2017-04-19 浙江工业大学 一种结合网络拓扑特征和用户行为特征的朋友关系挖掘方法

Also Published As

Publication number Publication date
CN107357858A (zh) 2017-11-17

Similar Documents

Publication Publication Date Title
CN107357858B (zh) 一种基于地理位置的网络重构方法
CN106682991B (zh) 一种基于在线社交网络的信息传播模型及其传播方法
CN103024017B (zh) 一种社交网络重要目标及社区群体识别方法
Fotouhi et al. Conjoining uncooperative societies facilitates evolution of cooperation
CN108022171B (zh) 一种数据处理方法及设备
Kibanov et al. Temporal evolution of contacts and communities in networks of face-to-face human interactions
CN113962358B (zh) 一种基于时序超图注意力神经网络的信息扩散预测方法
CN103198432B (zh) 在线社会网络中网络群体的检测方法及系统
CN115905978A (zh) 基于分层联邦学习的故障诊断方法及系统
CN115470994A (zh) 基于显式时间和级联注意力的信息流行度预测方法和系统
Wei et al. Evolutionary model and simulation research of collaborative innovation network: a case study of artificial intelligence industry
Flossdorf et al. Change detection in dynamic networks using network characteristics
Wei et al. Simulation of knowledge transfer process model between universities: A perspective of cluster innovation network
CN106341258B (zh) 一种基于二阶局部社团和种子节点结构信息的预测网络未知连边的方法
CN107358534A (zh) 社交网络的无偏数据采集系统及采集方法
Kibanov et al. On the evolution of contacts and communities in networks of face-to-face proximity
CN115130044B (zh) 一种基于二阶h指数的影响力节点识别方法和系统
CN103051476B (zh) 基于拓扑分析的网络社区发现方法
Das et al. Community detection in social networks using local topology and information exchange
Wang et al. Resilience of hybrid herbivore–plant–pollinator networks
CN112256756A (zh) 一种基于三元关联图和知识表示的影响力发现方法
Noveiri et al. ACFC: ant colony with fuzzy clustering algorithm for community detection in social networks
CN110610205A (zh) 社交网络中的社区识别方法
Li et al. Understanding service integration of online social networks: A data-driven study
CN109445843A (zh) 一种基于类多层网络的软件类重要性度量方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant