CN111782969B - 基于地理区域的社交网络最大影响力节点选取方法 - Google Patents
基于地理区域的社交网络最大影响力节点选取方法 Download PDFInfo
- Publication number
- CN111782969B CN111782969B CN202010639752.8A CN202010639752A CN111782969B CN 111782969 B CN111782969 B CN 111782969B CN 202010639752 A CN202010639752 A CN 202010639752A CN 111782969 B CN111782969 B CN 111782969B
- Authority
- CN
- China
- Prior art keywords
- node
- influence
- nodes
- maximum
- maximum influence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010187 selection method Methods 0.000 title description 2
- 238000000034 method Methods 0.000 claims abstract description 11
- 239000011159 matrix material Substances 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 2
- 238000007405 data analysis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于地理区域的社交网络中最大影响力节点的选取方法,所述方法将大型社交网络结构与地理信息相结合,采用四叉树索引与最大影响力树结构相结合的算法,选取查询区域内影响力最大的节点集,本发明可以高效选取出地理区域中影响力最大的种子节点集合。其中,使用四叉树索引结构来存储网络节点的位置信息,并使用深度优先搜索方法来识别给定查询区域中的候选对象;使用最大影响树状结构(MIA)计算每个候选节点的影响集并运行动态规划算法计算所有候选节点的影响力;再根据排序迭代弹出最大堆中具有最大影响值的候选节点作为最大影响力种子节点。
Description
技术领域
本发明属于网络数据分析技术领域,具体涉及基于地理区域的社交网络中最大影响力节点的选取方法。
背景技术
随着科技的发展,网络应用的普及,信息可以更加快速直接的进行传播与共享,越来越多的个人和公司使用社交网络来促进他们的业务,社交网络有许多研究应用,如链接预测、谣言控制、影响最大化等。影响力最大化作为信息扩散研究的一个关键计算问题,由于其潜在的商业价值,近年来得到了广泛的研究,特别在病毒式营销等社交网络中是一个非常重要的应用,其目标是找到一组用户,使影响用户集最大化。
虽然现有的影响力最大化传播问题研究成果中,满足了许多实际情况,但它忽略了位置信息在影响传播中可以发挥重要作用这一事实,比如在销售商品时,不仅需要线上宣传,在线下也会有各式的销售活动,位置信息对于选择合适的销售员来说是一个非常重要的因素。基于地理区域在社交网络中影响力最大的节点集选取问题,目前还未见有文献公开其解决方法。
发明内容
本发明针对地理区域影响下社交网络选点问题,将大型社交网络结构与地理信息相结合,采用四叉树索引与最大影响力树结构相结合的算法,选取查询区域内影响力最大的节点集,本发明可以高效选取出地理区域中影响力最大的种子节点集合。其中,使用四叉树索引结构来存储网络节点的位置信息,并使用深度优先搜索方法来识别给定查询区域中的候选对象;使用最大影响树状结构(maximum influence arborescence,MIA)计算每个候选节点的影响集并运行动态规划算法计算所有候选节点的影响力;再根据排序迭代弹出最大堆中具有最大影响值的候选节点作为最大影响力种子节点。本发明流程如下:
1.构建社交网络图G(Nset,E),其中Nset表示社交网络中的节点的集合,节点v(x,y)有经纬度两个位置参数,E表示网络中节点边的集合。
2.对节点间的传播概率进行初始化,设定查询区域Q=(R,k),然后选用独立级联传播模型(ICM)进行传播;传播过程中节点尝试激活邻居节点时,无论是否激活,接下来的传播过程中,都不会对相同节点再次激活,设定线性系数α(v,u)。
3.根据给定社交网络中节点的位置信息构建四叉树,并利用四叉树搜索给定区域中的节点集。其中R是四叉树单元格内位置的最小边界矩形,R=[(x,y),(xlim,ylim)],更准确地说,x和y分别是R边界中心的经度和纬度,xlim和ylim分别是R的长度和宽度的一半。此外,四叉树具有一个单元容量c,该容量限制了每个单元中的最大节点数。插入后一个单元包含多于c个节点时,该单元将根据其MBR的象限分为四个单元,最终汇总四个单元的节点集为所求点集。
4.在单元格中,采用最大影响树结构MIA计算每个节点的的影响力。在MIA中,节点u只通过最大影响路径激活节点v,会有很多路径,其中一条路径定义为:
P=<u=w1,w2,w3,...,wm=v>。
其路径的传播概率定义为:
节点v在MIA结构中具有两个最大影响路径,分别是输入最大影响树MIIA(v,θ)和输出最大影响树MIOA(v,θ)。
(1)在最小边界矩形R中的节点,构造MIIA(v,θ),给出一组种子集S,任何节点u的激活概率在MIIA(v,θ)中定义为:
计算节点影响力:IncInf(u)+=α(v,u)·(1-ap(u,S,MIIA(v,θ)))。
(2)满足条件u=arg maxv∈V\S{IncInf(v)}节点构造MIOA(v,θ)并计算减去之前的增量影响:IncInf(w)-=α(v,w)·(1-ap(w,S,MIIA(v,θ)))。
(3)将满足上述条件的节点u放入S*结果集;对于满足条件v∈MIOA(u,θ)\S的节点集增加新的增量影响:
IncInf(w)+=α(v,w)·(1-ap(w,S,MIIA(v,θ)))。
5.通过遍历各单元格节点,最终得到点集max S*,表示最小边界矩形R中具有最大影响力的种子节点集。
附图说明
图1是本发明的流程图。
具体实施方式
下面记载的是本发明的一个具体实施例。
1.构建社交网络图G(Nset,E),其中Nset表示社交网络中的节点的集合,节点v(x,y)有经纬度两个位置参数,E表示网络中节点边的集合。
2.确定查询区域Q和最大影响力点集中节点数k:根据给定社交网络中节点的位置信息构建四叉树,并利用四叉树搜索给定区域中的节点集;其中最小边界矩阵为R=[(x,y),(xlim,ylim)]。四叉树方法中具有一个单元容量c,该容量限制了每个单元中的最大节点数,插入后一个单元包含多于c个节点时,该单元将根据其MBR的象限分为四个单元,最终汇总四个单元的节点集为所求点集。
4.然后是用独立级联传播模型(ICM)进行传播,传播过程节点尝试激活邻居节点时,无论是否激活,接下来的回合中,都不会对相同节点再次激活,设定线性系数α(v,u)。
5.定义传播路径概率:在单元格中,采用最大影响树结构MIA计算每个节点的的影响力;在MIA中,节点u只通过最大影响路径激活节点v,会有很多路径,其中一条路径定义为:P=<u=w1,w2,w3,...,wm=v>;其路径的传播概率定义为:其中:w1,w2,…,wm分别为路径中的节点,m为路径的节点数,i=1,2,…,m。
6.计算节点v在MIA结构中的两个最大影响路径,它们分别是输入最大影响树MIIA(v,θ)和输出最大影响树MIOA(v,θ)。
MIIA(v,θ)和MIOA(v,θ)的计算步骤如下:
(1)在最小边界矩形R中的节点,构造MIIA(v,θ),给出一组种子集S,任何节点u的激活概率在MIIA(v,θ)中定义为:
计算节点影响力:
IncInf(u)+=α(v,u)·(1-ap(u,S,MIIA(v,θ)))。
(2)满足条件u=arg maxv∈V\S{IncInf(v)}节点构造MIOA(v,θ)并计算减去之前的增量影响:
IncInf(w)-=α(v,w)·(1-ap(w,S,MIIA(v,θ)))。
(3)将满足上述条件的节点u放入S*结果集;对于满足条件v∈MIOA(u,θ)\S的节点集增加新的增量影响:
IncInf(w)+=α(v,w)·(1-ap(w,S,MIIA(v,θ)))。
7.在一个单元格中进行节点影响力计算,直到影响力增量不再增加,结束遍历;根据排序迭代弹出最大堆中具有最大影响值的候选节点作为最大影响力种子节点,放入S*。
8.将四个单元格的最大影响力节点集进行整合。
9.通过排序,将影响力最大的k个节点放入max S*,最终得到最小边界矩形R中具有最大影响力的种子节点集合。
Claims (1)
1.基于地理区域的社交网络最大影响力节点选取方法,包括以下步骤:
(1)构建社交网络图G(Nset,E),其中Nset表示社交网络中的节点的集合,节点v(x,y)有经纬度两个位置参数,E表示网络中节点边的集合;
(2)根据给定社交网络中节点的位置信息构建四叉树,并利用四叉树搜索给定区域中的节点集;其中最小边界矩阵为R=[(x,y),(xlim,ylim)],x和y分别是边界矩阵中心的经度和纬度,xlim和ylim分别是边界矩阵的长度和宽度的一半;
(4)用独立级联传播模型ICM进行传播,传播过程节点尝试激活邻居节点时,无论是否激活,接下来的回合中都不会对相同节点再次激活,设定线性系数α(v,u);
(5)在单元格中采用最大影响树结构MIA计算每个节点的的影响力:在最大影响树结构MIA中,节点u只通过最大影响路径激活节点v,其中一条路径定义为:P=<u=w1,w2,w3,...,wm=v>;
(6)计算节点v在最大影响树结构MIA中的两个最大影响路径,也即输入最大影响树MIIA(v,θ)和输出最大影响树MIOA(v,θ),计算步骤如下:
(a)在最小边界矩阵R中的节点,构造MIIA(v,θ),给出一组种子集S,其中θ是一个影响阈值的参数;任何节点u的激活概率在MIIA(v,θ)中定义为:其中ap(wi)是节点wi的激活概率,/>表示节点wi到节点u的传播概率;Nin是节点u在MIIA中邻居节点的集合;然后计算节点影响力:IncInf(u)+=α(v,u)·(1-ap(u,S,MIIA(v,θ)));
(b)满足条件u=arg maxv∈V\S{IncInf(v)}节点构造MIOA(v,θ)并计算减去之前的增量影响:IncInf(w)-=α(v,w)·(1-ap(w,S,MIIA(v,θ)));
(c)将满足上述条件的节点u放入节点集S*,对于满足条件v∈MIOA(u,θ)\S的节点集S*增加新的增量影响:
IncInf(w)+=α(v,w)·(1-ap(w,S,MIIA(v,θ)));
(7)在一个单元格中进行节点影响力计算,直到影响力增量不再增加,结束遍历;根据排序迭代弹出最大堆中具有最大影响值的候选节点作为最大影响力种子节点,放入节点集S*;
(8)将四个单元格的最大影响力节点集进行整合,通过排序,将影响力最大的节点放入max S*,最终得到最小边界矩阵R中具有最大影响力的节点集合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010639752.8A CN111782969B (zh) | 2020-07-06 | 2020-07-06 | 基于地理区域的社交网络最大影响力节点选取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010639752.8A CN111782969B (zh) | 2020-07-06 | 2020-07-06 | 基于地理区域的社交网络最大影响力节点选取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111782969A CN111782969A (zh) | 2020-10-16 |
CN111782969B true CN111782969B (zh) | 2023-05-23 |
Family
ID=72758947
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010639752.8A Active CN111782969B (zh) | 2020-07-06 | 2020-07-06 | 基于地理区域的社交网络最大影响力节点选取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111782969B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113094558B (zh) * | 2021-04-08 | 2023-10-20 | 电子科技大学 | 一种基于局部结构的网络节点影响力排序方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105869053A (zh) * | 2016-03-23 | 2016-08-17 | 西安电子科技大学 | 基于两阶段memetic的社交网络影响最大化方法 |
CN108492201A (zh) * | 2018-03-29 | 2018-09-04 | 山东科技大学 | 一种基于社区结构的社交网络影响力最大化方法 |
CN110046224A (zh) * | 2019-04-15 | 2019-07-23 | 哈尔滨工程大学 | 一种基于区域的社交网络谣言抑制方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8244664B2 (en) * | 2008-12-01 | 2012-08-14 | Topsy Labs, Inc. | Estimating influence of subjects based on a subject graph |
-
2020
- 2020-07-06 CN CN202010639752.8A patent/CN111782969B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105869053A (zh) * | 2016-03-23 | 2016-08-17 | 西安电子科技大学 | 基于两阶段memetic的社交网络影响最大化方法 |
CN108492201A (zh) * | 2018-03-29 | 2018-09-04 | 山东科技大学 | 一种基于社区结构的社交网络影响力最大化方法 |
CN110046224A (zh) * | 2019-04-15 | 2019-07-23 | 哈尔滨工程大学 | 一种基于区域的社交网络谣言抑制方法 |
Non-Patent Citations (1)
Title |
---|
基于启发式和贪心策略的社交网络影响最大化算法;曹玖新;闵绘宇;徐顺;刘波;;东南大学学报(自然科学版)(05);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111782969A (zh) | 2020-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102663100B (zh) | 一种两阶段混合粒子群优化聚类方法 | |
CN104615616B (zh) | 群组推荐方法和系统 | |
CN111932026B (zh) | 基于数据融合和知识图谱嵌入的城市流量模式挖掘方法 | |
Herrera et al. | Multi-agent adaptive boosting on semi-supervised water supply clusters | |
CN106991127B (zh) | 一种基于拓扑特征扩展的知识主题短文本层次分类方法 | |
Yu et al. | A semantic overlapping community detection algorithm based on field sampling | |
Ding et al. | A multiway p-spectral clustering algorithm | |
CN105303450A (zh) | 基于谱聚类改进交叉的复杂网络社区发现方法 | |
CN104504251B (zh) | 一种基于PageRank算法的社区划分方法 | |
Miele et al. | Spatially constrained clustering of ecological networks | |
CN105718999A (zh) | 一种启发式代谢共表达网络的构建方法及系统 | |
CN113962358A (zh) | 一种基于时序超图注意力神经网络的信息扩散预测方法 | |
Ni et al. | GE-STDGN: a novel spatio-temporal weather prediction model based on graph evolution | |
CN111782969B (zh) | 基于地理区域的社交网络最大影响力节点选取方法 | |
CN107832319B (zh) | 一种基于语义关联网络的启发式查询扩展方法 | |
CN109739984A (zh) | 一种基于Hadoop平台的改进并行KNN网络舆情分类算法 | |
Zhou et al. | An overlapping community detection algorithm in complex networks based on information theory | |
CN108446802B (zh) | 一种基于图模型构建的赤潮预警方法 | |
Jayakumar et al. | Wildfire forecast within the districts of Kerala using Fuzzy and ANFIS | |
Chen et al. | Research on application of clustering algorithm based on PSO for the web usage pattern | |
Dufek et al. | Application of evolutionary computation on ensemble forecast of quantitative precipitation | |
Wijayanto et al. | Improvement of fuzzy geographically weighted clustering using particle swarm optimization | |
Nurmala et al. | Improvement of fuzzy geographically weighted clustering-ant colony optimization using context-based clustering | |
CN114970684A (zh) | 一种结合vae的提取网络核心结构的社区检测方法 | |
Huang et al. | A prediction scheme with genetic neural network and Isomap algorithm for tropical cyclone intensity change over western North Pacific |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |