CN111695043A - 一种基于地理区域的社交网络阻塞影响最大化方法 - Google Patents
一种基于地理区域的社交网络阻塞影响最大化方法 Download PDFInfo
- Publication number
- CN111695043A CN111695043A CN202010547743.6A CN202010547743A CN111695043A CN 111695043 A CN111695043 A CN 111695043A CN 202010547743 A CN202010547743 A CN 202010547743A CN 111695043 A CN111695043 A CN 111695043A
- Authority
- CN
- China
- Prior art keywords
- node
- miog
- blocking
- social network
- nodes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 230000000903 blocking effect Effects 0.000 title claims abstract description 32
- 238000000034 method Methods 0.000 title claims abstract description 28
- 230000004913 activation Effects 0.000 claims description 18
- 238000010276 construction Methods 0.000 claims description 3
- 238000004088 simulation Methods 0.000 claims description 3
- 238000009792 diffusion process Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 102100034799 CCAAT/enhancer-binding protein delta Human genes 0.000 description 1
- 101000945965 Homo sapiens CCAAT/enhancer-binding protein delta Proteins 0.000 description 1
- 238000000342 Monte Carlo simulation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于地理区域的社交网络阻塞影响最大化方法,该方法旨在社交网络信息传播时,防止目标区域受到不良信息的影响。研究影响阻止最大化(IBM)问题,以找到积极的种子,以尽可能多地阻止负面信息的传播。利用四叉树索引结构来存储节点的位置信息,结合社交网络的地理位置信息,提出了构造最大影响外图(MIOG)近似估计被阻止的负面影响并识别出具有更大潜力的阻止负影响的节点,选择候选节点以减少要估计的节点数量,高效地阻止负面信息在区域内的传播。
Description
技术领域
本发明涉及数据驱动社会网络分析与挖掘领域,具体是一种基于地理区域的社交网络阻塞影响最大化方法。
背景技术
近年来,诸如Facebook,Twitter,微博之类的社交网络越来越流行,随着社交网络规模的扩大和用户数量的增长,信息可以在社交网络中更快地传播和共享。结果,病毒式营销成为社交网络中最重要的营销策略之一。病毒式营销成功的关键问题是如何找到合适的初始客户,他们可以尽可能地传播产品信息。一些研究认为它是影响最大化(IM)问题,旨在找到影响最大的节点。研究表明,CELF算法(Cost-effective Lazy-forward)使用子模属性来提高贪婪算法的效率,PMIA(prefix excluding MIA)算法利用MIA(maximum influencearborescence)结构来近似估计每个节点的影响扩散,而TIM(Two-phase InfluenceMaximization)算法将该问题转换为最大覆盖问题。
尽管社交网络为人们带来了更多的信息获取平台,但它们也为散布谣言和错误信息提供了场所。因此,有研究旨在阻止有害信息在社交网络中的传播。但是,传统的贪婪算法会影响最大化(IBM)问题之所以缓慢,是因为它需要通过大量的蒙特卡洛模拟来估计每个节点的影响范围,当负面影响从高密度区域扩散时,时间成本通常不能令人满意。
发明内容
针对现有技术中找到有效的积极种子,但效率相对较低,且难以处理大型社交网络的缺陷,本发明提供了一种基于地理区域的社交网络阻塞影响最大化方法,在社交网络信息传播时,防止目标区域受到不良信息的影响,阻止最大化(IBM)问题,以找到积极的种子,尽可能阻止负面信息的传播。
实现本发明目的的技术方案是:
一种基于地理区域的社交网络阻塞影响最大化方法,包括如下步骤:
(1)读取社交网络数据集,构建社交网络图G(V,E),其中V表示社交网络中的节点集合,E表示网络中节点的边;节点V有经纬度(x,y)两个位置参数;
(2)定义正影响点集SP,负影响点集SN,阻塞点集B(SP),其中阻塞点集表示,当节点未被激活时,将被负影响激活,当正影响传播时,不被负影响激活的种子集;阻塞负面影响σ(SP)被定义为预期的B(SP)的大小;
(3)首先对节点间的传播概率进行初始化,设定查询区域Q=(R,k),传播过程中节点尝试激活邻居节点时,无论是否激活,接下来的回合中,都不会对相同节点再次激活,设定每条边的传播概率为ppe(v,u);
(4)根据给定社交网络中节点的位置信息构建四叉树,并利用四叉树搜索给定区域中的节点集,其中M是四叉树单元格内位置的最小边界矩形(R),R=[(x,y),(xlim,ylim)];
(5)初始化全局阻塞评分BG(w),以代替传统阻塞的负面影响,同时构建并初始化一个新的图结构MIOG;选择正种子,迭代更新MIOG:
(6)统计各单元的更新节点集,并更新全局阻塞分数,最终得到点集maxS*,表示区域R中具有最大阻塞影响力的种子节点。
步骤(5)所述构建MIOG:
定义传播路径集IPS(u,v,G)表示从节点u到节点v所有路径中传播概率最大的路径。则MIOG(u,θ)可表示为G的一个子图,定义为:
MIOG(u,θ)={IPS(u,v,G′)|ppmax(u,v,G′)≥θandv∈(V\SN)}
其路径的传播概率定义为:
传播过程中,节点的激活概率为:ap(v,SN,G)。寻找积极种子的一个想法是找到在MIOG中阻止消极种子的激活概率最多的节点。那么,定义节点阻塞评分BL(v,MIOG(SN,θ)):
其中Nr(v,MIOG(SN,θ)包含节点v和可以达到MIOG的点集;Ncn(v,MIOG(SN,θ)包含节点v及常见的邻居节点。第一个求和可以看作是v的阻塞能力,第二个求和可以看作是v和SN的共同邻居的阻塞能力。
阻塞评分近似于节点激活概率的总和对阻塞的负影响,避免了耗时的模拟,并且通过独立考虑每个负种子的MIOG减少了要计算的节点数。
步骤(5)所述初始化MIOG:
对于每一个负面的种子sN,构造MIOG(sN,θ),候选节点集Ncan(MIOG(sN,θ))被选中,并计算其激活概率。然后计算局部阻塞分数,并将其加入全局阻塞分数中。
步骤(5)所述更新MIOG:
当一个新的正传播的种子sP被选择,每个MIOG(sN,θ)将被更新。sP影响的节点的激活概率将被更新。其次,正节点sP从Ncan(MIOG(sN,θ))中被移除,阻塞分数将被更新。由于在选取节点过程中考虑共同邻居节点的情况,所以任一节点o的激活概率需乘以
本发明的有益效果是:利用四叉树索引结构来存储节点的位置信息,结合社交网络的地理位置信息,提出构造最大影响外图(MIOG)近似估计被阻止的负面影响并识别出具有更大潜力的阻止负影响的节点,选择候选节点以减少要估计的节点数量,高效地阻止负面信息在区域内的传播。
附图说明
图1为本发明实施例的方法流程图。
具体实施方式
下面结合附图和实施例对本发明作进一步的阐述。
实施例:
如图1所示,一种基于地理区域的社交网络阻塞影响最大化方法,包括如下步骤:
1.读取数据集,构建社交网络图G(V,E),其中V表示社交网络中的节点集合,E表示网络中节点的边。节点V(x,y)有经纬度两个位置参数;
2.定义正影响点集SP,负影响点集SN,阻塞点集B(SP)。其中阻塞点集表示,当节点未被激活时,将被负影响激活,当正影响传播时,不被负影响激活的种子集。阻塞负面影响σ(SP)被定义为预期的B(SP)的大小;
3.对节点间的传播概率进行初始化,设定查询区域Q=(R,k),传播过程中节点尝试激活邻居节点时,无论是否激活,接下来的回合中,都不会对相同节点再次激活,设定每条边的传播概率为ppe(v,u);
4.根据给定社交网络中节点的位置信息构建四叉树,并利用四叉树搜索给定区域中的节点集。其中M是四叉树单元格内位置的最小边界矩形(R),R=[(x,y),(xlim,ylim)];
6.在竞争扩散模型下,对于每个单元格区域内,分为两个阶段完成。在初始化阶段,初始化全局阻塞评分BG(w),以代替传统阻塞的负面影响,并初始化一个新的图结构MIOG。在第二阶段,选择正种子,迭代更新MIOG。具体步骤如下:
(1)构建MIOG:
定义传播路径集IPS(u,v,G)表示从节点u到节点v所有路径中传播概率最大的路径。则MIOG(u,θ)可表示为G的一个子图,定义为:
MIOG(u,θ)={IPS(u,v,G′)|ppmax(u,v,G′)≥θandv∈(V\SN)}
其路径的传播概率定义为:
传播过程中,节点的激活概率为:ap(v,SN,G)。寻找积极种子的一个想法是找到在MIOG中阻止消极种子的激活概率最多的节点。那么,定义节点阻塞评分BL(v,MIOG(SN,θ)):
其中Nr(v,MIOG(SN,θ)包含节点v和可以达到MIOG的点集;Ncn(v,MIOG(SN,θ)包含节点v及常见的邻居节点。第一个求和可以看作是v的阻塞能力,第二个求和可以看作是v和SN的共同邻居的阻塞能力。
阻塞评分近似于节点激活概率的总和对阻塞的负影响,避免了耗时的模拟,并且通过独立考虑每个负种子的MIOG减少了要计算的节点数。
(2)初始化MIOG:
对于每一个负面的种子sN,构造MIOG(sN,θ),候选节点集Ncan(MIOG(sN,θ))被选中,并计算其激活概率。然后计算局部阻塞分数,并将其加入全局阻塞分数中。
(3)更新MIOG:
当一个新的正传播的种子sP被选择,每个MIOG(sN,θ)将被更新。sP影响的节点的激活概率将被更新。其次,正节点sP从Ncan(MIOG(sN,θ))中被移除,阻塞分数将被更新。由于在选取节点过程中考虑共同邻居节点的情况,所以任意节点o的激活概率需乘以
7.各单元的更新节点集,并更新全局阻塞分数;
8.将各个单元格中,直到影响力增量不再增加,结束遍历,得到的最大点集S*进行整合;
9.通过遍历节点,最终得到点集maxS*,表示区域R中具有最大阻塞影响力的种子节点。
Claims (4)
1.一种基于地理区域的社交网络阻塞影响最大化方法,其特征是:包括如下步骤:
(1)读取数据集,构建社交网络图G(V,E),其中V表示社交网络中的节点集合,E表示网络中节点的边;节点V有经纬度(x,y)两个位置参数;
(2)定义正影响点集SP,负影响点集SN,阻塞点集B(SP),其中阻塞点集表示,当节点未被激活时,将被负影响激活,当正影响传播时,不被负影响激活的种子集;阻塞负面影响σ(SP)被定义为预期的B(SP)的大小;
(3)首先对节点间的传播概率进行初始化,设定查询区域Q=(R,k),传播过程中节点尝试激活邻居节点时,无论是否激活,接下来的回合中,都不会对相同节点再次激活,设定每条边的传播概率为ppe(v,u);
(4)根据给定社交网络中节点的位置信息构建四叉树,并利用四叉树搜索给定区域中的节点集,其中M是四叉树单元格内位置的最小边界矩形(R),R=[(x,y),(xlim,ylim)];
(5)初始化全局阻塞评分BG(w),同时构建并初始化一个新的图结构MIOG;选择正种子,迭代更新MIOG:
(6)统计各单元的更新节点集,并更新全局阻塞分数,最终得到点集maxS*,表示区域R中具有最大阻塞影响力的种子节点。
2.根据权利要求1所述的一种基于地理区域的社交网络阻塞影响最大化方法,其特征是:步骤(5)所述构建MIOG:
定义传播路径集IPS(u,v,G)表示从节点u到节点v所有路径中传播概率最大的路径;则MIOG(u,θ)可表示为G的一个子图,定义为:
MIOG(u,θ)={IPS(u,v,G′)|ppmax(u,v,G′)≥θandv∈(V\SN)}
其路径的传播概率定义为:
传播过程中,节点的激活概率为:ap(v,SN,G);寻找积极种子的一个想法是找到在MIOG中阻止消极种子的激活概率最多的节点;那么,定义节点阻塞评分BL(v,MIOG(SN,θ)):
其中Nr(v,MIOG(SN,θ)包含节点v和可以达到MIOG的点集;Ncn(v,MIOG(SN,θ)包含节点v及常见的邻居节点;第一个求和可以看作是v的阻塞能力,第二个求和可以看作是v和SN的共同邻居的阻塞能力;
阻塞评分近似于节点激活概率的总和对阻塞的负影响,避免了耗时的模拟,并且通过独立考虑每个负种子的MIOG减少了要计算的节点数。
3.根据权利要求1所述的一种基于地理区域的社交网络阻塞影响最大化方法,其特征是:步骤(5)所述初始化MIOG:
对于每一个负面的种子sN,构造MIOG(sN,θ),候选节点集Ncan(MIOG(sN,θ))被选中,并计算其激活概率;然后计算局部阻塞分数,并将其加入全局阻塞分数中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010547743.6A CN111695043A (zh) | 2020-06-16 | 2020-06-16 | 一种基于地理区域的社交网络阻塞影响最大化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010547743.6A CN111695043A (zh) | 2020-06-16 | 2020-06-16 | 一种基于地理区域的社交网络阻塞影响最大化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111695043A true CN111695043A (zh) | 2020-09-22 |
Family
ID=72481321
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010547743.6A Withdrawn CN111695043A (zh) | 2020-06-16 | 2020-06-16 | 一种基于地理区域的社交网络阻塞影响最大化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111695043A (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104050245A (zh) * | 2014-06-04 | 2014-09-17 | 江苏大学 | 一种基于活跃度的社交网络影响力最大化方法 |
CN105468681A (zh) * | 2015-11-16 | 2016-04-06 | 中国科学院信息工程研究所 | 一种基于话题模型的网络负面信息影响最小化方法 |
US20160350382A1 (en) * | 2014-05-29 | 2016-12-01 | Microsoft Technology Licensing, Llc | Estimating influence using sketches |
US20170126822A1 (en) * | 2015-11-02 | 2017-05-04 | International Business Machines Corporation | Determining Seeds for Targeted Notifications Through Online Social Networks in Conjunction with User Mobility Data |
US20170124577A1 (en) * | 2013-07-10 | 2017-05-04 | Excalibur Ip, Llc | Influence maximization with viral product design |
CN107220486A (zh) * | 2017-05-12 | 2017-09-29 | 上海交通大学 | 基于局部影响力计算的影响力阻断最大化方法 |
CN107392365A (zh) * | 2017-07-11 | 2017-11-24 | 扬州大学 | 基于传播路径分析的独立级联模型的影响力最大化方法 |
CN107507020A (zh) * | 2017-07-27 | 2017-12-22 | 上海交通大学 | 获取网络传播影响力竞争优势最大化的方法 |
CN109408211A (zh) * | 2018-09-28 | 2019-03-01 | 桂林电子科技大学 | 一种多目标优化的对等网络流媒体系统数据调度算法 |
CN109409495A (zh) * | 2018-10-16 | 2019-03-01 | 扬州大学 | 基于抽样的线性阈值模型下的影响力最大化方法 |
CN110046224A (zh) * | 2019-04-15 | 2019-07-23 | 哈尔滨工程大学 | 一种基于区域的社交网络谣言抑制方法 |
CN110069718A (zh) * | 2019-04-15 | 2019-07-30 | 哈尔滨工程大学 | 一种基于主题的社交网络谣言抑制方法 |
-
2020
- 2020-06-16 CN CN202010547743.6A patent/CN111695043A/zh not_active Withdrawn
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170124577A1 (en) * | 2013-07-10 | 2017-05-04 | Excalibur Ip, Llc | Influence maximization with viral product design |
US20160350382A1 (en) * | 2014-05-29 | 2016-12-01 | Microsoft Technology Licensing, Llc | Estimating influence using sketches |
CN104050245A (zh) * | 2014-06-04 | 2014-09-17 | 江苏大学 | 一种基于活跃度的社交网络影响力最大化方法 |
US20170126822A1 (en) * | 2015-11-02 | 2017-05-04 | International Business Machines Corporation | Determining Seeds for Targeted Notifications Through Online Social Networks in Conjunction with User Mobility Data |
CN105468681A (zh) * | 2015-11-16 | 2016-04-06 | 中国科学院信息工程研究所 | 一种基于话题模型的网络负面信息影响最小化方法 |
CN107220486A (zh) * | 2017-05-12 | 2017-09-29 | 上海交通大学 | 基于局部影响力计算的影响力阻断最大化方法 |
CN107392365A (zh) * | 2017-07-11 | 2017-11-24 | 扬州大学 | 基于传播路径分析的独立级联模型的影响力最大化方法 |
CN107507020A (zh) * | 2017-07-27 | 2017-12-22 | 上海交通大学 | 获取网络传播影响力竞争优势最大化的方法 |
CN109408211A (zh) * | 2018-09-28 | 2019-03-01 | 桂林电子科技大学 | 一种多目标优化的对等网络流媒体系统数据调度算法 |
CN109409495A (zh) * | 2018-10-16 | 2019-03-01 | 扬州大学 | 基于抽样的线性阈值模型下的影响力最大化方法 |
CN110046224A (zh) * | 2019-04-15 | 2019-07-23 | 哈尔滨工程大学 | 一种基于区域的社交网络谣言抑制方法 |
CN110069718A (zh) * | 2019-04-15 | 2019-07-30 | 哈尔滨工程大学 | 一种基于主题的社交网络谣言抑制方法 |
Non-Patent Citations (3)
Title |
---|
KUEI-SHENG LIN等: "BIOG: An Effective and Efficient Algorithm for Influence Blocking Maximization in Social Networks", 《DMBD 2019: DATA MINING AND BIG DATA》 * |
WENLONG ZHU等: "Location-Based Seeds Selection for Influence Blocking Maximization in Social Networks", 《IEEE ACCESS》 * |
陈昕: "基于传播路径分析的复杂网络影响力最大化研究", 《中国优秀硕士学位论文全文数据库基础科学辑》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9426233B2 (en) | Multi-objective server placement determination | |
CN108985309B (zh) | 一种数据处理方法以及装置 | |
CN109255054B (zh) | 一种基于关系权重的企业图谱中的社区发现方法 | |
JP6998964B2 (ja) | ジオフェンスのインデックスグリッドを判断するための方法及び装置 | |
US8478054B2 (en) | Method and system for text classification | |
Alvari et al. | Community detection in dynamic social networks: A game-theoretic approach | |
CN111787000B (zh) | 网络安全评估方法及电子设备 | |
TW201939366A (zh) | 推薦系統構建方法及裝置 | |
CN110619082B (zh) | 一种基于重复搜索机制的项目推荐方法 | |
WO2020015464A1 (zh) | 关系网络图嵌入的方法及装置 | |
Nguyen et al. | Probability-based multi-hop diffusion method for influence maximization in social networks | |
CN107123056B (zh) | 一种基于位置的社交大数据信息最大化方法 | |
CN111723298B (zh) | 基于改进标签传播的社交网络社团发现方法、装置及介质 | |
Ouyang et al. | A class of parameter estimation methods for nonlinear Muskingum model using hybrid invasive weed optimization algorithm | |
CN113094558B (zh) | 一种基于局部结构的网络节点影响力排序方法 | |
Wu et al. | GLP: A novel framework for group-level location promotion in geo-social networks | |
US8553587B2 (en) | System and method for finding important nodes in a network | |
Liu et al. | Finding densest lasting subgraphs in dynamic graphs: A stochastic approach | |
US11468521B2 (en) | Social media account filtering method and apparatus | |
CN111695043A (zh) | 一种基于地理区域的社交网络阻塞影响最大化方法 | |
KR101609457B1 (ko) | 대용량 그래프 데이터베이스에서 하한 경계값에 기초하여 메디안 노드를 검색하는 방법 | |
Cheriet et al. | On optimal anchor placement for area‐based localisation in wireless sensor networks | |
Stai et al. | Hyperbolic embedding for efficient computation of path centralities and adaptive routing in large-scale complex commodity networks | |
Du et al. | Optimization of the critical diameter and average path length of social networks | |
CN108415774A (zh) | 一种基于改进烟花算法的软硬件划分方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20200922 |
|
WW01 | Invention patent application withdrawn after publication |