CN111695043A - 一种基于地理区域的社交网络阻塞影响最大化方法 - Google Patents

一种基于地理区域的社交网络阻塞影响最大化方法 Download PDF

Info

Publication number
CN111695043A
CN111695043A CN202010547743.6A CN202010547743A CN111695043A CN 111695043 A CN111695043 A CN 111695043A CN 202010547743 A CN202010547743 A CN 202010547743A CN 111695043 A CN111695043 A CN 111695043A
Authority
CN
China
Prior art keywords
node
miog
blocking
social network
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010547743.6A
Other languages
English (en)
Inventor
谢武
高爽
孔丽娜
强保华
崔梦银
贾清玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guilin University of Electronic Technology
Original Assignee
Guilin University of Electronic Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guilin University of Electronic Technology filed Critical Guilin University of Electronic Technology
Priority to CN202010547743.6A priority Critical patent/CN111695043A/zh
Publication of CN111695043A publication Critical patent/CN111695043A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于地理区域的社交网络阻塞影响最大化方法,该方法旨在社交网络信息传播时,防止目标区域受到不良信息的影响。研究影响阻止最大化(IBM)问题,以找到积极的种子,以尽可能多地阻止负面信息的传播。利用四叉树索引结构来存储节点的位置信息,结合社交网络的地理位置信息,提出了构造最大影响外图(MIOG)近似估计被阻止的负面影响并识别出具有更大潜力的阻止负影响的节点,选择候选节点以减少要估计的节点数量,高效地阻止负面信息在区域内的传播。

Description

一种基于地理区域的社交网络阻塞影响最大化方法
技术领域
本发明涉及数据驱动社会网络分析与挖掘领域,具体是一种基于地理区域的社交网络阻塞影响最大化方法。
背景技术
近年来,诸如Facebook,Twitter,微博之类的社交网络越来越流行,随着社交网络规模的扩大和用户数量的增长,信息可以在社交网络中更快地传播和共享。结果,病毒式营销成为社交网络中最重要的营销策略之一。病毒式营销成功的关键问题是如何找到合适的初始客户,他们可以尽可能地传播产品信息。一些研究认为它是影响最大化(IM)问题,旨在找到影响最大的节点。研究表明,CELF算法(Cost-effective Lazy-forward)使用子模属性来提高贪婪算法的效率,PMIA(prefix excluding MIA)算法利用MIA(maximum influencearborescence)结构来近似估计每个节点的影响扩散,而TIM(Two-phase InfluenceMaximization)算法将该问题转换为最大覆盖问题。
尽管社交网络为人们带来了更多的信息获取平台,但它们也为散布谣言和错误信息提供了场所。因此,有研究旨在阻止有害信息在社交网络中的传播。但是,传统的贪婪算法会影响最大化(IBM)问题之所以缓慢,是因为它需要通过大量的蒙特卡洛模拟来估计每个节点的影响范围,当负面影响从高密度区域扩散时,时间成本通常不能令人满意。
发明内容
针对现有技术中找到有效的积极种子,但效率相对较低,且难以处理大型社交网络的缺陷,本发明提供了一种基于地理区域的社交网络阻塞影响最大化方法,在社交网络信息传播时,防止目标区域受到不良信息的影响,阻止最大化(IBM)问题,以找到积极的种子,尽可能阻止负面信息的传播。
实现本发明目的的技术方案是:
一种基于地理区域的社交网络阻塞影响最大化方法,包括如下步骤:
(1)读取社交网络数据集,构建社交网络图G(V,E),其中V表示社交网络中的节点集合,E表示网络中节点的边;节点V有经纬度(x,y)两个位置参数;
(2)定义正影响点集SP,负影响点集SN,阻塞点集B(SP),其中阻塞点集表示,当节点未被激活时,将被负影响激活,当正影响传播时,不被负影响激活的种子集;阻塞负面影响σ(SP)被定义为预期的B(SP)的大小;
(3)首先对节点间的传播概率进行初始化,设定查询区域Q=(R,k),传播过程中节点尝试激活邻居节点时,无论是否激活,接下来的回合中,都不会对相同节点再次激活,设定每条边的传播概率为ppe(v,u);
(4)根据给定社交网络中节点的位置信息构建四叉树,并利用四叉树搜索给定区域中的节点集,其中M是四叉树单元格内位置的最小边界矩形(R),R=[(x,y),(xlim,ylim)];
(5)初始化全局阻塞评分BG(w),以代替传统阻塞的负面影响,同时构建并初始化一个新的图结构MIOG;选择正种子,迭代更新MIOG:
(6)统计各单元的更新节点集,并更新全局阻塞分数,最终得到点集maxS*,表示区域R中具有最大阻塞影响力的种子节点。
步骤(5)所述构建MIOG:
定义传播路径集IPS(u,v,G)表示从节点u到节点v所有路径中传播概率最大的路径。则MIOG(u,θ)可表示为G的一个子图,定义为:
MIOG(u,θ)={IPS(u,v,G′)|ppmax(u,v,G′)≥θandv∈(V\SN)}
其路径的传播概率定义为:
Figure BDA0002541343250000021
传播过程中,节点的激活概率为:ap(v,SN,G)。寻找积极种子的一个想法是找到在MIOG中阻止消极种子的激活概率最多的节点。那么,定义节点阻塞评分BL(v,MIOG(SN,θ)):
Figure BDA0002541343250000022
其中Nr(v,MIOG(SN,θ)包含节点v和可以达到MIOG的点集;Ncn(v,MIOG(SN,θ)包含节点v及常见的邻居节点。第一个求和可以看作是v的阻塞能力,第二个求和可以看作是v和SN的共同邻居的阻塞能力。
阻塞评分近似于节点激活概率的总和对阻塞的负影响,避免了耗时的模拟,并且通过独立考虑每个负种子的MIOG减少了要计算的节点数。
步骤(5)所述初始化MIOG:
对于每一个负面的种子sN,构造MIOG(sN,θ),候选节点集Ncan(MIOG(sN,θ))被选中,并计算其激活概率。然后计算局部阻塞分数,并将其加入全局阻塞分数中。
步骤(5)所述更新MIOG:
当一个新的正传播的种子sP被选择,每个MIOG(sN,θ)将被更新。sP影响的节点的激活概率将被更新。其次,正节点sP从Ncan(MIOG(sN,θ))中被移除,阻塞分数将被更新。由于在选取节点过程中考虑共同邻居节点的情况,所以任一节点o的激活概率需乘以
Figure BDA0002541343250000031
本发明的有益效果是:利用四叉树索引结构来存储节点的位置信息,结合社交网络的地理位置信息,提出构造最大影响外图(MIOG)近似估计被阻止的负面影响并识别出具有更大潜力的阻止负影响的节点,选择候选节点以减少要估计的节点数量,高效地阻止负面信息在区域内的传播。
附图说明
图1为本发明实施例的方法流程图。
具体实施方式
下面结合附图和实施例对本发明作进一步的阐述。
实施例:
如图1所示,一种基于地理区域的社交网络阻塞影响最大化方法,包括如下步骤:
1.读取数据集,构建社交网络图G(V,E),其中V表示社交网络中的节点集合,E表示网络中节点的边。节点V(x,y)有经纬度两个位置参数;
2.定义正影响点集SP,负影响点集SN,阻塞点集B(SP)。其中阻塞点集表示,当节点未被激活时,将被负影响激活,当正影响传播时,不被负影响激活的种子集。阻塞负面影响σ(SP)被定义为预期的B(SP)的大小;
3.对节点间的传播概率进行初始化,设定查询区域Q=(R,k),传播过程中节点尝试激活邻居节点时,无论是否激活,接下来的回合中,都不会对相同节点再次激活,设定每条边的传播概率为ppe(v,u);
4.根据给定社交网络中节点的位置信息构建四叉树,并利用四叉树搜索给定区域中的节点集。其中M是四叉树单元格内位置的最小边界矩形(R),R=[(x,y),(xlim,ylim)];
5.初始化点集v∈Nset,
Figure BDA0002541343250000032
影响力BG(w)=0;
6.在竞争扩散模型下,对于每个单元格区域内,分为两个阶段完成。在初始化阶段,初始化全局阻塞评分BG(w),以代替传统阻塞的负面影响,并初始化一个新的图结构MIOG。在第二阶段,选择正种子,迭代更新MIOG。具体步骤如下:
(1)构建MIOG:
定义传播路径集IPS(u,v,G)表示从节点u到节点v所有路径中传播概率最大的路径。则MIOG(u,θ)可表示为G的一个子图,定义为:
MIOG(u,θ)={IPS(u,v,G′)|ppmax(u,v,G′)≥θandv∈(V\SN)}
其路径的传播概率定义为:
Figure BDA0002541343250000041
传播过程中,节点的激活概率为:ap(v,SN,G)。寻找积极种子的一个想法是找到在MIOG中阻止消极种子的激活概率最多的节点。那么,定义节点阻塞评分BL(v,MIOG(SN,θ)):
Figure BDA0002541343250000042
其中Nr(v,MIOG(SN,θ)包含节点v和可以达到MIOG的点集;Ncn(v,MIOG(SN,θ)包含节点v及常见的邻居节点。第一个求和可以看作是v的阻塞能力,第二个求和可以看作是v和SN的共同邻居的阻塞能力。
阻塞评分近似于节点激活概率的总和对阻塞的负影响,避免了耗时的模拟,并且通过独立考虑每个负种子的MIOG减少了要计算的节点数。
(2)初始化MIOG:
对于每一个负面的种子sN,构造MIOG(sN,θ),候选节点集Ncan(MIOG(sN,θ))被选中,并计算其激活概率。然后计算局部阻塞分数,并将其加入全局阻塞分数中。
(3)更新MIOG:
当一个新的正传播的种子sP被选择,每个MIOG(sN,θ)将被更新。sP影响的节点的激活概率将被更新。其次,正节点sP从Ncan(MIOG(sN,θ))中被移除,阻塞分数将被更新。由于在选取节点过程中考虑共同邻居节点的情况,所以任意节点o的激活概率需乘以
Figure BDA0002541343250000043
7.各单元的更新节点集,并更新全局阻塞分数;
8.将各个单元格中,直到影响力增量不再增加,结束遍历,得到的最大点集S*进行整合;
9.通过遍历节点,最终得到点集maxS*,表示区域R中具有最大阻塞影响力的种子节点。

Claims (4)

1.一种基于地理区域的社交网络阻塞影响最大化方法,其特征是:包括如下步骤:
(1)读取数据集,构建社交网络图G(V,E),其中V表示社交网络中的节点集合,E表示网络中节点的边;节点V有经纬度(x,y)两个位置参数;
(2)定义正影响点集SP,负影响点集SN,阻塞点集B(SP),其中阻塞点集表示,当节点未被激活时,将被负影响激活,当正影响传播时,不被负影响激活的种子集;阻塞负面影响σ(SP)被定义为预期的B(SP)的大小;
(3)首先对节点间的传播概率进行初始化,设定查询区域Q=(R,k),传播过程中节点尝试激活邻居节点时,无论是否激活,接下来的回合中,都不会对相同节点再次激活,设定每条边的传播概率为ppe(v,u);
(4)根据给定社交网络中节点的位置信息构建四叉树,并利用四叉树搜索给定区域中的节点集,其中M是四叉树单元格内位置的最小边界矩形(R),R=[(x,y),(xlim,ylim)];
(5)初始化全局阻塞评分BG(w),同时构建并初始化一个新的图结构MIOG;选择正种子,迭代更新MIOG:
(6)统计各单元的更新节点集,并更新全局阻塞分数,最终得到点集maxS*,表示区域R中具有最大阻塞影响力的种子节点。
2.根据权利要求1所述的一种基于地理区域的社交网络阻塞影响最大化方法,其特征是:步骤(5)所述构建MIOG:
定义传播路径集IPS(u,v,G)表示从节点u到节点v所有路径中传播概率最大的路径;则MIOG(u,θ)可表示为G的一个子图,定义为:
MIOG(u,θ)={IPS(u,v,G′)|ppmax(u,v,G′)≥θandv∈(V\SN)}
其路径的传播概率定义为:
Figure FDA0002541343240000011
传播过程中,节点的激活概率为:ap(v,SN,G);寻找积极种子的一个想法是找到在MIOG中阻止消极种子的激活概率最多的节点;那么,定义节点阻塞评分BL(v,MIOG(SN,θ)):
Figure FDA0002541343240000012
其中Nr(v,MIOG(SN,θ)包含节点v和可以达到MIOG的点集;Ncn(v,MIOG(SN,θ)包含节点v及常见的邻居节点;第一个求和可以看作是v的阻塞能力,第二个求和可以看作是v和SN的共同邻居的阻塞能力;
阻塞评分近似于节点激活概率的总和对阻塞的负影响,避免了耗时的模拟,并且通过独立考虑每个负种子的MIOG减少了要计算的节点数。
3.根据权利要求1所述的一种基于地理区域的社交网络阻塞影响最大化方法,其特征是:步骤(5)所述初始化MIOG:
对于每一个负面的种子sN,构造MIOG(sN,θ),候选节点集Ncan(MIOG(sN,θ))被选中,并计算其激活概率;然后计算局部阻塞分数,并将其加入全局阻塞分数中。
4.根据权利要求1所述的一种基于地理区域的社交网络阻塞影响最大化方法,其特征是:步骤(5)所述更新MIOG:
当一个新的正传播的种子sP被选择,每个MIOG(sN,θ)将被更新;sP影响的节点的激活概率将被更新;其次,正节点sP从Ncan(MIOG(sN,θ))中被移除,阻塞分数将被更新;由于在选取节点过程中考虑共同邻居节点的情况,所以任一节点o的激活概率需乘以
Figure FDA0002541343240000021
CN202010547743.6A 2020-06-16 2020-06-16 一种基于地理区域的社交网络阻塞影响最大化方法 Withdrawn CN111695043A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010547743.6A CN111695043A (zh) 2020-06-16 2020-06-16 一种基于地理区域的社交网络阻塞影响最大化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010547743.6A CN111695043A (zh) 2020-06-16 2020-06-16 一种基于地理区域的社交网络阻塞影响最大化方法

Publications (1)

Publication Number Publication Date
CN111695043A true CN111695043A (zh) 2020-09-22

Family

ID=72481321

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010547743.6A Withdrawn CN111695043A (zh) 2020-06-16 2020-06-16 一种基于地理区域的社交网络阻塞影响最大化方法

Country Status (1)

Country Link
CN (1) CN111695043A (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104050245A (zh) * 2014-06-04 2014-09-17 江苏大学 一种基于活跃度的社交网络影响力最大化方法
CN105468681A (zh) * 2015-11-16 2016-04-06 中国科学院信息工程研究所 一种基于话题模型的网络负面信息影响最小化方法
US20160350382A1 (en) * 2014-05-29 2016-12-01 Microsoft Technology Licensing, Llc Estimating influence using sketches
US20170126822A1 (en) * 2015-11-02 2017-05-04 International Business Machines Corporation Determining Seeds for Targeted Notifications Through Online Social Networks in Conjunction with User Mobility Data
US20170124577A1 (en) * 2013-07-10 2017-05-04 Excalibur Ip, Llc Influence maximization with viral product design
CN107220486A (zh) * 2017-05-12 2017-09-29 上海交通大学 基于局部影响力计算的影响力阻断最大化方法
CN107392365A (zh) * 2017-07-11 2017-11-24 扬州大学 基于传播路径分析的独立级联模型的影响力最大化方法
CN107507020A (zh) * 2017-07-27 2017-12-22 上海交通大学 获取网络传播影响力竞争优势最大化的方法
CN109408211A (zh) * 2018-09-28 2019-03-01 桂林电子科技大学 一种多目标优化的对等网络流媒体系统数据调度算法
CN109409495A (zh) * 2018-10-16 2019-03-01 扬州大学 基于抽样的线性阈值模型下的影响力最大化方法
CN110046224A (zh) * 2019-04-15 2019-07-23 哈尔滨工程大学 一种基于区域的社交网络谣言抑制方法
CN110069718A (zh) * 2019-04-15 2019-07-30 哈尔滨工程大学 一种基于主题的社交网络谣言抑制方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170124577A1 (en) * 2013-07-10 2017-05-04 Excalibur Ip, Llc Influence maximization with viral product design
US20160350382A1 (en) * 2014-05-29 2016-12-01 Microsoft Technology Licensing, Llc Estimating influence using sketches
CN104050245A (zh) * 2014-06-04 2014-09-17 江苏大学 一种基于活跃度的社交网络影响力最大化方法
US20170126822A1 (en) * 2015-11-02 2017-05-04 International Business Machines Corporation Determining Seeds for Targeted Notifications Through Online Social Networks in Conjunction with User Mobility Data
CN105468681A (zh) * 2015-11-16 2016-04-06 中国科学院信息工程研究所 一种基于话题模型的网络负面信息影响最小化方法
CN107220486A (zh) * 2017-05-12 2017-09-29 上海交通大学 基于局部影响力计算的影响力阻断最大化方法
CN107392365A (zh) * 2017-07-11 2017-11-24 扬州大学 基于传播路径分析的独立级联模型的影响力最大化方法
CN107507020A (zh) * 2017-07-27 2017-12-22 上海交通大学 获取网络传播影响力竞争优势最大化的方法
CN109408211A (zh) * 2018-09-28 2019-03-01 桂林电子科技大学 一种多目标优化的对等网络流媒体系统数据调度算法
CN109409495A (zh) * 2018-10-16 2019-03-01 扬州大学 基于抽样的线性阈值模型下的影响力最大化方法
CN110046224A (zh) * 2019-04-15 2019-07-23 哈尔滨工程大学 一种基于区域的社交网络谣言抑制方法
CN110069718A (zh) * 2019-04-15 2019-07-30 哈尔滨工程大学 一种基于主题的社交网络谣言抑制方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
KUEI-SHENG LIN等: "BIOG: An Effective and Efficient Algorithm for Influence Blocking Maximization in Social Networks", 《DMBD 2019: DATA MINING AND BIG DATA》 *
WENLONG ZHU等: "Location-Based Seeds Selection for Influence Blocking Maximization in Social Networks", 《IEEE ACCESS》 *
陈昕: "基于传播路径分析的复杂网络影响力最大化研究", 《中国优秀硕士学位论文全文数据库基础科学辑》 *

Similar Documents

Publication Publication Date Title
US9426233B2 (en) Multi-objective server placement determination
CN108985309B (zh) 一种数据处理方法以及装置
CN109255054B (zh) 一种基于关系权重的企业图谱中的社区发现方法
JP6998964B2 (ja) ジオフェンスのインデックスグリッドを判断するための方法及び装置
US8478054B2 (en) Method and system for text classification
Alvari et al. Community detection in dynamic social networks: A game-theoretic approach
CN111787000B (zh) 网络安全评估方法及电子设备
TW201939366A (zh) 推薦系統構建方法及裝置
CN110619082B (zh) 一种基于重复搜索机制的项目推荐方法
WO2020015464A1 (zh) 关系网络图嵌入的方法及装置
Nguyen et al. Probability-based multi-hop diffusion method for influence maximization in social networks
CN107123056B (zh) 一种基于位置的社交大数据信息最大化方法
CN111723298B (zh) 基于改进标签传播的社交网络社团发现方法、装置及介质
Ouyang et al. A class of parameter estimation methods for nonlinear Muskingum model using hybrid invasive weed optimization algorithm
CN113094558B (zh) 一种基于局部结构的网络节点影响力排序方法
Wu et al. GLP: A novel framework for group-level location promotion in geo-social networks
US8553587B2 (en) System and method for finding important nodes in a network
Liu et al. Finding densest lasting subgraphs in dynamic graphs: A stochastic approach
US11468521B2 (en) Social media account filtering method and apparatus
CN111695043A (zh) 一种基于地理区域的社交网络阻塞影响最大化方法
KR101609457B1 (ko) 대용량 그래프 데이터베이스에서 하한 경계값에 기초하여 메디안 노드를 검색하는 방법
Cheriet et al. On optimal anchor placement for area‐based localisation in wireless sensor networks
Stai et al. Hyperbolic embedding for efficient computation of path centralities and adaptive routing in large-scale complex commodity networks
Du et al. Optimization of the critical diameter and average path length of social networks
CN108415774A (zh) 一种基于改进烟花算法的软硬件划分方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20200922

WW01 Invention patent application withdrawn after publication