CN111782969B - 基于地理区域的社交网络最大影响力节点选取方法 - Google Patents

基于地理区域的社交网络最大影响力节点选取方法 Download PDF

Info

Publication number
CN111782969B
CN111782969B CN202010639752.8A CN202010639752A CN111782969B CN 111782969 B CN111782969 B CN 111782969B CN 202010639752 A CN202010639752 A CN 202010639752A CN 111782969 B CN111782969 B CN 111782969B
Authority
CN
China
Prior art keywords
node
influence
nodes
maximum
maximum influence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010639752.8A
Other languages
English (en)
Other versions
CN111782969A (zh
Inventor
谢武
高爽
强保华
崔梦银
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guilin University of Electronic Technology
Original Assignee
Guilin University of Electronic Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guilin University of Electronic Technology filed Critical Guilin University of Electronic Technology
Priority to CN202010639752.8A priority Critical patent/CN111782969B/zh
Publication of CN111782969A publication Critical patent/CN111782969A/zh
Application granted granted Critical
Publication of CN111782969B publication Critical patent/CN111782969B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于地理区域的社交网络中最大影响力节点的选取方法,所述方法将大型社交网络结构与地理信息相结合,采用四叉树索引与最大影响力树结构相结合的算法,选取查询区域内影响力最大的节点集,本发明可以高效选取出地理区域中影响力最大的种子节点集合。其中,使用四叉树索引结构来存储网络节点的位置信息,并使用深度优先搜索方法来识别给定查询区域中的候选对象;使用最大影响树状结构(MIA)计算每个候选节点的影响集并运行动态规划算法计算所有候选节点的影响力;再根据排序迭代弹出最大堆中具有最大影响值的候选节点作为最大影响力种子节点。

Description

基于地理区域的社交网络最大影响力节点选取方法
技术领域
本发明属于网络数据分析技术领域,具体涉及基于地理区域的社交网络中最大影响力节点的选取方法。
背景技术
随着科技的发展,网络应用的普及,信息可以更加快速直接的进行传播与共享,越来越多的个人和公司使用社交网络来促进他们的业务,社交网络有许多研究应用,如链接预测、谣言控制、影响最大化等。影响力最大化作为信息扩散研究的一个关键计算问题,由于其潜在的商业价值,近年来得到了广泛的研究,特别在病毒式营销等社交网络中是一个非常重要的应用,其目标是找到一组用户,使影响用户集最大化。
虽然现有的影响力最大化传播问题研究成果中,满足了许多实际情况,但它忽略了位置信息在影响传播中可以发挥重要作用这一事实,比如在销售商品时,不仅需要线上宣传,在线下也会有各式的销售活动,位置信息对于选择合适的销售员来说是一个非常重要的因素。基于地理区域在社交网络中影响力最大的节点集选取问题,目前还未见有文献公开其解决方法。
发明内容
本发明针对地理区域影响下社交网络选点问题,将大型社交网络结构与地理信息相结合,采用四叉树索引与最大影响力树结构相结合的算法,选取查询区域内影响力最大的节点集,本发明可以高效选取出地理区域中影响力最大的种子节点集合。其中,使用四叉树索引结构来存储网络节点的位置信息,并使用深度优先搜索方法来识别给定查询区域中的候选对象;使用最大影响树状结构(maximum influence arborescence,MIA)计算每个候选节点的影响集并运行动态规划算法计算所有候选节点的影响力;再根据排序迭代弹出最大堆中具有最大影响值的候选节点作为最大影响力种子节点。本发明流程如下:
1.构建社交网络图G(Nset,E),其中Nset表示社交网络中的节点的集合,节点v(x,y)有经纬度两个位置参数,E表示网络中节点边的集合。
2.对节点间的传播概率进行初始化,设定查询区域Q=(R,k),然后选用独立级联传播模型(ICM)进行传播;传播过程中节点尝试激活邻居节点时,无论是否激活,接下来的传播过程中,都不会对相同节点再次激活,设定线性系数α(v,u)。
3.根据给定社交网络中节点的位置信息构建四叉树,并利用四叉树搜索给定区域中的节点集。其中R是四叉树单元格内位置的最小边界矩形,R=[(x,y),(xlim,ylim)],更准确地说,x和y分别是R边界中心的经度和纬度,xlim和ylim分别是R的长度和宽度的一半。此外,四叉树具有一个单元容量c,该容量限制了每个单元中的最大节点数。插入后一个单元包含多于c个节点时,该单元将根据其MBR的象限分为四个单元,最终汇总四个单元的节点集为所求点集。
4.在单元格中,采用最大影响树结构MIA计算每个节点的的影响力。在MIA中,节点u只通过最大影响路径激活节点v,会有很多路径,其中一条路径定义为:
P=<u=w1,w2,w3,...,wm=v>。
其路径的传播概率定义为:
Figure BDA0002570492120000021
节点v在MIA结构中具有两个最大影响路径,分别是输入最大影响树MIIA(v,θ)和输出最大影响树MIOA(v,θ)。
(1)在最小边界矩形R中的节点,构造MIIA(v,θ),给出一组种子集S,任何节点u的激活概率在MIIA(v,θ)中定义为:
Figure BDA0002570492120000022
计算节点影响力:IncInf(u)+=α(v,u)·(1-ap(u,S,MIIA(v,θ)))。
(2)满足条件u=arg maxv∈V\S{IncInf(v)}节点构造MIOA(v,θ)并计算减去之前的增量影响:IncInf(w)-=α(v,w)·(1-ap(w,S,MIIA(v,θ)))。
(3)将满足上述条件的节点u放入S*结果集;对于满足条件v∈MIOA(u,θ)\S的节点集增加新的增量影响:
IncInf(w)+=α(v,w)·(1-ap(w,S,MIIA(v,θ)))。
5.通过遍历各单元格节点,最终得到点集max S*,表示最小边界矩形R中具有最大影响力的种子节点集。
附图说明
图1是本发明的流程图。
具体实施方式
下面记载的是本发明的一个具体实施例。
1.构建社交网络图G(Nset,E),其中Nset表示社交网络中的节点的集合,节点v(x,y)有经纬度两个位置参数,E表示网络中节点边的集合。
2.确定查询区域Q和最大影响力点集中节点数k:根据给定社交网络中节点的位置信息构建四叉树,并利用四叉树搜索给定区域中的节点集;其中最小边界矩阵为R=[(x,y),(xlim,ylim)]。四叉树方法中具有一个单元容量c,该容量限制了每个单元中的最大节点数,插入后一个单元包含多于c个节点时,该单元将根据其MBR的象限分为四个单元,最终汇总四个单元的节点集为所求点集。
3.初始化节点
Figure BDA0002570492120000031
IncInf(u)=0;其中S*表示最终获取的最大影响力的节点集,IncInf(u)表示节点u的影响力,/>
Figure BDA0002570492120000032
表示空集。
4.然后是用独立级联传播模型(ICM)进行传播,传播过程节点尝试激活邻居节点时,无论是否激活,接下来的回合中,都不会对相同节点再次激活,设定线性系数α(v,u)。
5.定义传播路径概率:在单元格中,采用最大影响树结构MIA计算每个节点的的影响力;在MIA中,节点u只通过最大影响路径激活节点v,会有很多路径,其中一条路径定义为:P=<u=w1,w2,w3,...,wm=v>;其路径的传播概率定义为:
Figure BDA0002570492120000033
其中:w1,w2,…,wm分别为路径中的节点,m为路径的节点数,i=1,2,…,m。
6.计算节点v在MIA结构中的两个最大影响路径,它们分别是输入最大影响树MIIA(v,θ)和输出最大影响树MIOA(v,θ)。
MIIA(v,θ)和MIOA(v,θ)的计算步骤如下:
(1)在最小边界矩形R中的节点,构造MIIA(v,θ),给出一组种子集S,任何节点u的激活概率在MIIA(v,θ)中定义为:
Figure BDA0002570492120000041
计算节点影响力:
IncInf(u)+=α(v,u)·(1-ap(u,S,MIIA(v,θ)))。
(2)满足条件u=arg maxv∈V\S{IncInf(v)}节点构造MIOA(v,θ)并计算减去之前的增量影响:
IncInf(w)-=α(v,w)·(1-ap(w,S,MIIA(v,θ)))。
(3)将满足上述条件的节点u放入S*结果集;对于满足条件v∈MIOA(u,θ)\S的节点集增加新的增量影响:
IncInf(w)+=α(v,w)·(1-ap(w,S,MIIA(v,θ)))。
7.在一个单元格中进行节点影响力计算,直到影响力增量不再增加,结束遍历;根据排序迭代弹出最大堆中具有最大影响值的候选节点作为最大影响力种子节点,放入S*
8.将四个单元格的最大影响力节点集进行整合。
9.通过排序,将影响力最大的k个节点放入max S*,最终得到最小边界矩形R中具有最大影响力的种子节点集合。

Claims (1)

1.基于地理区域的社交网络最大影响力节点选取方法,包括以下步骤:
(1)构建社交网络图G(Nset,E),其中Nset表示社交网络中的节点的集合,节点v(x,y)有经纬度两个位置参数,E表示网络中节点边的集合;
(2)根据给定社交网络中节点的位置信息构建四叉树,并利用四叉树搜索给定区域中的节点集;其中最小边界矩阵为R=[(x,y),(xlim,ylim)],x和y分别是边界矩阵中心的经度和纬度,xlim和ylim分别是边界矩阵的长度和宽度的一半;
(3)初始化节点v∈Nset,
Figure FDA0002570492110000011
IncInf(u)=0;其中S*表示最终获取的最大影响力的节点集,IncInf(u)表示节点u的影响力,/>
Figure FDA0002570492110000012
表示空集;
(4)用独立级联传播模型ICM进行传播,传播过程节点尝试激活邻居节点时,无论是否激活,接下来的回合中都不会对相同节点再次激活,设定线性系数α(v,u);
(5)在单元格中采用最大影响树结构MIA计算每个节点的的影响力:在最大影响树结构MIA中,节点u只通过最大影响路径激活节点v,其中一条路径定义为:P=<u=w1,w2,w3,...,wm=v>;
其路径的传播概率定义为:
Figure FDA0002570492110000013
w1,w2,…,wm分别为路径中的节点,m为路径的节点数,i=1,2,…,m;
(6)计算节点v在最大影响树结构MIA中的两个最大影响路径,也即输入最大影响树MIIA(v,θ)和输出最大影响树MIOA(v,θ),计算步骤如下:
(a)在最小边界矩阵R中的节点,构造MIIA(v,θ),给出一组种子集S,其中θ是一个影响阈值的参数;任何节点u的激活概率在MIIA(v,θ)中定义为:
Figure FDA0002570492110000014
其中ap(wi)是节点wi的激活概率,/>
Figure FDA0002570492110000015
表示节点wi到节点u的传播概率;Nin是节点u在MIIA中邻居节点的集合;然后计算节点影响力:IncInf(u)+=α(v,u)·(1-ap(u,S,MIIA(v,θ)));
(b)满足条件u=arg maxv∈V\S{IncInf(v)}节点构造MIOA(v,θ)并计算减去之前的增量影响:IncInf(w)-=α(v,w)·(1-ap(w,S,MIIA(v,θ)));
(c)将满足上述条件的节点u放入节点集S*,对于满足条件v∈MIOA(u,θ)\S的节点集S*增加新的增量影响:
IncInf(w)+=α(v,w)·(1-ap(w,S,MIIA(v,θ)));
(7)在一个单元格中进行节点影响力计算,直到影响力增量不再增加,结束遍历;根据排序迭代弹出最大堆中具有最大影响值的候选节点作为最大影响力种子节点,放入节点集S*
(8)将四个单元格的最大影响力节点集进行整合,通过排序,将影响力最大的节点放入max S*,最终得到最小边界矩阵R中具有最大影响力的节点集合。
CN202010639752.8A 2020-07-06 2020-07-06 基于地理区域的社交网络最大影响力节点选取方法 Active CN111782969B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010639752.8A CN111782969B (zh) 2020-07-06 2020-07-06 基于地理区域的社交网络最大影响力节点选取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010639752.8A CN111782969B (zh) 2020-07-06 2020-07-06 基于地理区域的社交网络最大影响力节点选取方法

Publications (2)

Publication Number Publication Date
CN111782969A CN111782969A (zh) 2020-10-16
CN111782969B true CN111782969B (zh) 2023-05-23

Family

ID=72758947

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010639752.8A Active CN111782969B (zh) 2020-07-06 2020-07-06 基于地理区域的社交网络最大影响力节点选取方法

Country Status (1)

Country Link
CN (1) CN111782969B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113094558B (zh) * 2021-04-08 2023-10-20 电子科技大学 一种基于局部结构的网络节点影响力排序方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105869053A (zh) * 2016-03-23 2016-08-17 西安电子科技大学 基于两阶段memetic的社交网络影响最大化方法
CN108492201A (zh) * 2018-03-29 2018-09-04 山东科技大学 一种基于社区结构的社交网络影响力最大化方法
CN110046224A (zh) * 2019-04-15 2019-07-23 哈尔滨工程大学 一种基于区域的社交网络谣言抑制方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8244664B2 (en) * 2008-12-01 2012-08-14 Topsy Labs, Inc. Estimating influence of subjects based on a subject graph

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105869053A (zh) * 2016-03-23 2016-08-17 西安电子科技大学 基于两阶段memetic的社交网络影响最大化方法
CN108492201A (zh) * 2018-03-29 2018-09-04 山东科技大学 一种基于社区结构的社交网络影响力最大化方法
CN110046224A (zh) * 2019-04-15 2019-07-23 哈尔滨工程大学 一种基于区域的社交网络谣言抑制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于启发式和贪心策略的社交网络影响最大化算法;曹玖新;闵绘宇;徐顺;刘波;;东南大学学报(自然科学版)(05);全文 *

Also Published As

Publication number Publication date
CN111782969A (zh) 2020-10-16

Similar Documents

Publication Publication Date Title
CN102663100B (zh) 一种两阶段混合粒子群优化聚类方法
CN104615616B (zh) 群组推荐方法和系统
CN111932026B (zh) 基于数据融合和知识图谱嵌入的城市流量模式挖掘方法
Herrera et al. Multi-agent adaptive boosting on semi-supervised water supply clusters
CN106991127B (zh) 一种基于拓扑特征扩展的知识主题短文本层次分类方法
Yu et al. A semantic overlapping community detection algorithm based on field sampling
Ding et al. A multiway p-spectral clustering algorithm
CN105303450A (zh) 基于谱聚类改进交叉的复杂网络社区发现方法
CN104504251B (zh) 一种基于PageRank算法的社区划分方法
Miele et al. Spatially constrained clustering of ecological networks
CN105718999A (zh) 一种启发式代谢共表达网络的构建方法及系统
CN113962358A (zh) 一种基于时序超图注意力神经网络的信息扩散预测方法
Ni et al. GE-STDGN: a novel spatio-temporal weather prediction model based on graph evolution
CN111782969B (zh) 基于地理区域的社交网络最大影响力节点选取方法
CN107832319B (zh) 一种基于语义关联网络的启发式查询扩展方法
CN109739984A (zh) 一种基于Hadoop平台的改进并行KNN网络舆情分类算法
Zhou et al. An overlapping community detection algorithm in complex networks based on information theory
CN108446802B (zh) 一种基于图模型构建的赤潮预警方法
Jayakumar et al. Wildfire forecast within the districts of Kerala using Fuzzy and ANFIS
Chen et al. Research on application of clustering algorithm based on PSO for the web usage pattern
Dufek et al. Application of evolutionary computation on ensemble forecast of quantitative precipitation
Wijayanto et al. Improvement of fuzzy geographically weighted clustering using particle swarm optimization
Nurmala et al. Improvement of fuzzy geographically weighted clustering-ant colony optimization using context-based clustering
CN114970684A (zh) 一种结合vae的提取网络核心结构的社区检测方法
Huang et al. A prediction scheme with genetic neural network and Isomap algorithm for tropical cyclone intensity change over western North Pacific

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant