CN110069718A - 一种基于主题的社交网络谣言抑制方法 - Google Patents
一种基于主题的社交网络谣言抑制方法 Download PDFInfo
- Publication number
- CN110069718A CN110069718A CN201910300107.0A CN201910300107A CN110069718A CN 110069718 A CN110069718 A CN 110069718A CN 201910300107 A CN201910300107 A CN 201910300107A CN 110069718 A CN110069718 A CN 110069718A
- Authority
- CN
- China
- Prior art keywords
- node
- theme
- rumour
- decinf
- active cell
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000000694 effects Effects 0.000 claims abstract description 33
- 230000001186 cumulative effect Effects 0.000 claims abstract description 7
- 230000000903 blocking effect Effects 0.000 claims abstract description 4
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 238000001514 detection method Methods 0.000 claims description 3
- 230000000644 propagated effect Effects 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 9
- 230000001629 suppression Effects 0.000 description 9
- 230000007480 spreading Effects 0.000 description 6
- 230000002401 inhibitory effect Effects 0.000 description 4
- 230000005764 inhibitory process Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 208000016890 dentin dysplasia type I Diseases 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供的是一种基于主题的社交网络谣言抑制方法。(1)根据已知信息构建社交网络G中任意节点的最大影响树;(2)根据已知信息构建QT‑tree存储节点主题偏好及位置信息;(3)对于给定的查询请求Q=(T,R,k),得到阻断节点集N(T,R);(4)对于G中每个节点u,计算其区域主题阻断影响力decInf(u,T,R),所述decInf(u,T,R)是u对N(T,R)中每个节点v的主题阻断影响力decInf(u,v,T)的累加和;(5)以贪婪的方式循环从G中选择区域主题阻断影响力最大的k个节点作为肯定种子集传播真实消息,抑制谣言的传播。本发明能够根据不同主题类型的谣言选择最优种子集进行正面消息的传播,从而在给定的区域中最大限度的抑制谣言的传播,简单有效,实用性强。
Description
技术领域
本发明涉及的是一种网络信息抑制方法,尤其是一种在网络中最大限度的抑制谣言传播的方法。
背景技术
社交网络从其产生以来,就给人们的交流和沟通带来了极大的方便,然而随之而来的社交网络谣言问题也越来越严重。由于社交网络谣言传播具有低成本、难追踪、易扩散等特性、网络谣言可以在短时间内大量传播,造成严重的不良影响,因此,设计一种有效的方法来抑制谣言信息的传播是非常重要的。
目前国内外相关文献及技术资料中对于谣言抑制的研究主要有两种方法。第一种方法是通过在社交网络中寻找一些关键节点或者关键边,将其封锁使得谣言无法通过这些关键节点或关键边进行传播,进而达到抑制谣言传播的目的。这种方法的主要缺点在于对节点和边的封锁会导致正常的信息也无法传播,严重影响网络的连通性。第二种方法通过在网络中寻找影响力较大的节点,通过这些节点传播正面消息来抑制谣言的传播。这种方法假定用户一旦提前被正面消息所影响,就不会再受到谣言的影响,也就不会再传播谣言。相比于第一种方法,第二种方法的优势在于实现简单,抑制效果好,不会影响网络的连通性。He等人首次考虑了如何在网络中寻找这些影响力较大的节点,他们将谣言抑制问题定义为影响力阻断最大化问题,该问题的目标是寻找k个用户(也称为肯定种子集),通过朋友关系进行正面信息的传播,使得由该种子集产生的正面信息的传播能够最大限度地阻断谣言源(也成为否定种子集)产生的负面信息的传播。虽然研究者们不同的角度对谣言抑制问题进行了研究,但现有的研究并没有考虑用户的兴趣(也成为主题)属性。实际上,每个用户都有自己的兴趣偏好,对于不同主题的谣言其接受程度不同,而现有的方法选择出的肯定种子集对于特定主题的谣言并不能够最大限度地抑制该主题谣言的传播,因此,对于不同主题的谣言,如何选择最优种子集是本发明要解决的关键问题。
发明内容
本发明的目的在于提供一种针对特定主题的谣言,能够选择最优种子集进行正面消息的传播,进而在给定的区域内最大限度的抑制谣言传播的基于主题的社交网络谣言抑制方法。
本发明的目的是这样实现的:
(1)根据已知信息构建社交网络G中任意节点的最大影响树;
(2)根据已知信息构建QT-tree存储节点主题偏好及位置信息;
(3)对于给定的查询请求Q=(T,R,k),得到阻断节点集N(T,R),其中:T是要抑制的谣言的主题类型、R是要抑制谣言传播的区域、k是要选择的肯定种子集中种子的数量、N(T,R)是在区域R中对主题集T有偏好的节点的集合;
(4)对于G中每个节点u,计算其区域主题阻断影响力decInf(u,T,R),所述decInf(u,T,R)是u对N(T,R)中每个节点v的主题阻断影响力decInf(u,v,T)的累加和;
(5)以贪婪的方式循环从G中选择区域主题阻断影响力最大的k个节点作为肯定种子集传播真实消息,抑制谣言的传播。
本发明还可以包括:
1.步骤(1)中所述的已知信息包括:
已知社交网络G=(V,E),V为网络中节点的集合,E为网络中边的集合;已知谣言的起源节点集或称为否定种子集SN;已知谣言的传播模型为最大影响树传播模型。
2.步骤(1)中,对于G中任意节点v,其最大影响树包括最大影响入树MIIA(v,θ)和最大影响出树MIOA(v,θ)两部分,θ用来控制传播的范围,对G中任意节点v,MIIA(v,θ)和MIOA(v,θ)通过Djkstra算法得到。
3.所述的步骤(2)具体包括:
(2.1)创建QT-tree根单元qt,设置其M=[(0,0),(180,90)],设置当前单元为qt;
(2.2)检测当前单元容量是否超过c,c为表示QT-tree单元容量的一个全局变量,若未超过c,对G中所有未访问节点v,如果v坐标位于当前单元的最小边界矩形M内,则将v及其主题和位置信息保存在当前单元的List列表中,设置v为访问状态;若G中所有节点都为访问状态,则完成QT-tree的创建;
(2.3)若当前容量超过c且SE为空,则创建4个孩子单元SE、SW、NE、NW,每个孩子单元的最小边界矩形分别为当前单元最小边界矩形面积的四分之一;
(2.4)若当前容量超过c且SE不为空,则按广度优先方式在SE、SW、NE、NW中执行步骤(2.2)。
4.所述的步骤(3)具体包括:
(3.1)将QT-tree根单元设置为当前单元,将N(T,R)设置为空;
(3.2)如果R与当前单元没有交集,则结束本次递归调用;
(3.3)否则,查询当前单元中存储的每个节点,如果该节点是对主题T有偏好的节点,将该节点加入到N(T,R)中;
(3.4)如果当前单元的SE指针为空,则结束本次递归调用;
(3.5)将当前单元设置为SE,并返回步骤(3.2);
(3.6)将当前单元设置为SW,并返回步骤(3.2);
(3.7)将当前单元设置为NE,并返回步骤(3.2);
(3.8)将当前单元设置为NW,并返回步骤(3.2);
(3.9)若当前单元为QT-tree根单元,返回N(T,R),结束。
5.所述的步骤(4)具体包括:
(4.1)根据N(T,R),计算得到Ca(T,R),Ca(T,R)表示对N(T,R)中的节点有影响的节点的集合;
(4.2)对于G中每个节点u;
(4.3)如果u不属于Ca(T,R),则decInf(u,T,R)=0,decInf(u,T,R)是节点u的区域主题阻断影响力;
(4.4)如果u属于Ca(T,R),则decInf(u,T,R)=∑v∈N(T,R)decInf(u,v,T),decInf(u,v,T)是u对N(T,R)中每个节点v的主题阻断影响力的累加和。
6.所述的步骤(5)具体包括:
(5.1)在社交网络G中,选择区域主题阻断影响力最大的节点u作为当前种子节点,即u=argmaxv∈V decInf(v,T,R);
(5.2)若当前种子集SP中节点数等于k,则返回SP作为肯定种子集,结束;否则执行步骤(5.3);
(5.3)更新MIOA(u,θ);
(5.4)对于MIOA(u,θ)中的每个节点v,如果v∈N(T,R),则对于MIIA(v,θ)中的每个节点w,按如下公式更新其区域主题阻断影响力:
(5.5)decInf(w,T,R)-=(an(v,SP,SN)-an(v,SP∪{w},SN))*β(v,T);
(5.6)将节点u加入到SP中;
(5.7)对于MI0A(u,θ)中的每个节点v,更新MIIA(v,θ),如果v∈N(T,R),则对于MIIA(v,θ)中的每个节点w,按如下公式更新其区域主题阻断影响力:
(5.8)decInf(w,T,R)+=(an(v,SP,SN)-an(v,SP∪{w},SN))*β(v,T);
(5.9)返回步骤(5.1)。
本发明提供了一种在网络中针对特定主题谣言选择最优种子集传播真实消息,进而在给定的区域范围内最大限度的抑制谣言传播的方法。
与现有的技术相比,本发明具有以下优点:
本发明能够根据不同主题类型的谣言选择最优种子集进行正面消息的传播,从而在给定的区域中最大限度的抑制谣言的传播。
简单有效:本发明的方法由离线处理阶段和在线处理阶段两部分组成,离线处理阶段减少了在线处理阶段的运行时间,在线处理阶段通过贪婪算法针对不同主题类型的谣言和查询区域选择最优种子集,谣言抑制效果明显。
实用性强:用户对于不同的主题偏好不同,本发明能够针对特定主题类型的谣言和查询区域选择特定的种子集传播正面消息,抑制谣言在查询区域中的传播,具有很强的实用性。
附图说明
图1是本发明基于主题的社交网络谣言抑制方法的流程示意图。
图2(a)-图2(b)是本发明的一个典型的社交网络应用样例,图2(a)是一个含有27个节点的网络;图2(b)是网络中的节点偏好。
图3是在给定的T和R下,本发明方法与其他四个典型方法在Brightkite网络上选择不同数量的肯定种子产生的谣言抑制结果对比图。
图4是在给定的T和R下,本发明方法与其他四个典型方法在Gowalla网络上选择不同数量的肯定种子产生的谣言抑制结果对比图。
图5是在不同的T下,本发明方法与其他四个典型方法在Brightkite网络上选择400肯定种子产生的谣言抑制结果对比图。
图6是在不同的T下,本发明方法与其他四个典型方法在Gowalla网络上的选择400肯定种子产生的谣言抑制结果对比图。
图7是在不同的R下,本发明方法与其他四个典型方法在Brightkite网络上选择400肯定种子产生的谣言抑制结果对比图。
图8是在不同的R下,本发明方法与其他四个典型方法在Gowalla网络上选择400肯定种子产生的谣言抑制结果对比图。
具体实施方式
下面举例对本发明做更详细的描述。
结合图1,本发明的基于主题的社交网络谣言抑制方法,包括如下步骤:
1)根据已知信息构建社交网络G中任意节点的最大影响树;
2)根据已知信息构建QT-tree存储节点主题偏好及位置信息;
3)对于给定的查询请求Q=(T,R,k),得到阻断节点集N(T,R),所述T是要抑制的谣言的主题类型、R是要抑制谣言传播的区域,k是要选择的肯定种子集中种子的数量,N(T,R)是在区域R中对T有偏好的节点的集合;
4)对于G中每个节点u,计算其区域主题阻断影响力decInf(u,T,R),所述decInf(u,T,R)是u对N(T,R)中每个节点v的主题阻断影响力decInf(u,v,T)的累加和。
5)以贪婪的方式循环从G中选择区域主题阻断影响力最大的k个节点作为肯定种子集传播真实消息,抑制谣言的传播。
上述步骤中1)、2)属于离线处理阶段,其目的是减少在线查询阶段的运行时间,其他步骤属于在线查询阶段,对于不同的查询请求Q,得到相应的最优种子集传播真实消息,抑制谣言传播。
所述的步骤1)中,已知信息为:
已知社交网络G=(V,E),V为网络中节点的集合,E为网络中边的集合,已知谣言的起源节点集(或称为否定种子集)SN,已知谣言的传播模型为最大影响树传播模型。
所述的步骤1)中,对于G中任意节点v,其最大影响树包括两部分:最大影响入树MIIA(v,θ)和最大影响出树MIOA(v,θ)。
对于G中的任意节点对<u,v>,存在多条从u到v的传播路径,对于其中的任意一条路径P=<u=w1,w2,…,wm=v>,其影响传播概率可定义为其中是边上的影响传播概率,则u到v的最大传播路径MIPu,v是u到v的影响传播概率最大的路径,即MIPu,v=argmax pp(P)。
进一步的,对G中任意节点v,上述所述最大影响入树是所有信息能传播到v的节点及其最大传播路径的集合,θ用来控制传播的范围,即:
进一步的,对G中任意节点v,上述所述最大影响出树是v发送的信息能传播到的节点及其传播路径的集合,θ用来控制传播的范围,即:
如果将E中每条边的传播概率转换为则对G中任意节点v,MIIA(v,θ)和MIOA(v,θ)可通过Djkstra算法得到。
由此,所述的步骤1)具体包括以下步骤:
11)对于G中的任意节点对v,利用Djkstra算法计算其最大影响入树MIIA(v,θ)。
12)对于G中的任意节点对v,利用Djkstra算法计算其最大影响出树MIOA(v,θ)。
所述的步骤2)中,已知信息为:
已知社交网络G=(V,E),当前网络的主题集为{t1,t2,…,tz},且当前社交网络中的主题数为z。对V中任意节点u,已知其主题偏好向量θu={θu1,θu2,...,θuz},其中,θui表明了节点u对于主题ti的偏好程度,对于任意的i∈[1,z],满足0≤θui≤1且已知u的位置信息u(x,y),其中x表示节点u的经度坐标,y表示节点u的维度坐标。
所述的步骤2)中,QT-tree单元的结构可表示为<QTid,M,List={<u,u(x,y),θu>},SE,SW,NE,NW>,其中QTid是QT-tree的单元序号,M是该单元所覆盖的最小边界矩形(minimumbounding rectangle),例如,M=[(x,y),(xlim,ylim)],其中,(x,y)是矩形的中心位置坐标,(xlim,ylim)是矩形长度和宽度的一半,List是一个三元列表,列表元素为<u,u(x,y),θu>,该列表用来保存位于当前QT-tree中的节点及节点的位置和主题信息,SE、SW、NE、NW是QT-tree的孩子指针。对于QT-tree,存在一个全局变量c来表示QT-tree单元的容量,若某个QT-tree单元的容量超过c,则以当前单元最小边界矩形面积的四分之一进行分裂。
由此,所述的步骤2)具体包括以下步骤:
21)创建QT-tree根单元qt,设置其M=[(0,0),(180,90)],设置当前单元为qt;
22)检测当前单元容量是否超过c,若未超过c,对G中所有未访问节点v,如果v坐标位于当前单元的最小边界矩形M内,则将v及其主题和位置信息保存在当前单元的List列表中,设置v为访问状态。若G中所有节点都为访问状态,则完成QT-tree的创建;
23)若当前容量超过c且SE为空,则创建4个孩子单元SE,SW,NE,NW,每个单元的最小边界矩形分别为当前单元最小边界矩形面积的四分之一;
24)若当前容量超过c且SE不为空,则按广度优先方式在SE,SW,NE,NW中执行步骤22。
所述的步骤3)中,对于给定的查询请求Q=(T,R,k),T是要抑制的谣言的主题类型,可表示为T={t1,t2,…,tz},且满足对任意的i∈[1,z],ti=0或ti=1,其中,ti=1表示要抑制主题为ti的谣言,ti=0表示不抑制主题为ti的谣言。R是要抑制谣言传播的区域,可表示为R=[(x,y),(xlim,ylim)],其中,(x,y)是区域的中心位置坐标,(xlim,ylim)是区域长度和宽度的一半。
所述的步骤3)中,N(T,R)是在区域R中对主题T有偏好的节点的集合,即对N(T,R)中任意的节点u,应满足以下条件:存在i∈[1,z],满足ti=1且θui>0。
所述的步骤3)中,对于给定的查询请求Q=(T,R,k),N(T,R)可采用递归算法进行计算,具体过程如下:
31)将QT-tree根单元设置为当前单元,将N(T,R)设置为空;
32)如果R与当前单元没有交集,则结束本次递归调用;
33)否则,查询当前单元中存储的每个节点,如果该节点是对主题T有偏好的节点,将这该节点加入到N(T,R)中;
34)如果当前单元的SE指针为空,则结束本次递归调用;
35)将当前单元设置为SE,并返回步骤32);
36)将当前单元设置为SW,并返回步骤32);
37)将当前单元设置为NE,并返回步骤32);
38)将当前单元设置为NW,并返回步骤32);
39)若当前单元为QT-tree根单元,返回N(T,R),结束。
所述的步骤4)中,节点u对v的主题阻断影响力decInf(u,v,T)是将u加入到肯定种子集时导致的节点v被主题类型为T的谣言影响的概率的减少,其计算公式为:
decInf(u,v,T)=(an(v,SP,SN)-an(v,SP∪{u},SN))*β(v,T)
其中,β(v,T)是节点v对主题T的偏好,即SP是当前已经被选择为肯定种子的节点的集合,an(v,SP,SN)表示在当前的肯定种子集SP和否定种子集SN作用下,节点v被谣言影响的概率,其值可通过如下的动态规划算法得到:
其中Nin(v)是v的入邻居节点的集合,pw,v是节点w到节点v的消息传播概率,pn(v,t)是节点v在t时刻被谣言影响的概率,an(v,t)是节点v从谣言开始传播到当前为止的t时间段内被谣言影响的概率,pn(v,t)是节点v在t时刻被正面消息影响的概率,an(v,t)是节点v从谣言开始传播到当前为止的t时间段内被正面消息影响的概率。
所述的步骤4)中,节点u的区域主题阻断影响力decInf(u,T,R)是u对N(T,R)中每个节点v的主题阻断影响力decInf(u,v,T)的累加和,即:
decInf(u,T,R)=∑v∈N(T,R)decInf(u,v,T)
进一步的,考虑到节点的影响通过最大影响树传播,因此,令Ca(T,R)表示对N(T,R)中的节点有影响的节点的集合,即Ca(T,R)=∪v∈N(T,R)MIIA(v,θ),最终可得到decInf(u,T,R)的计算公式如下:
由此,所述的步骤4)具体包括以下步骤:
41)根据N(T,R),计算得到Ca(T,R);
42)对于G中每个节点u;
43)如果u不属于Ca(T,R),则decInf(u,T,R)=0;
44)如果u属于Ca(T,R),则decInf(u,T,R)=∑v∈N(T,R)decInf(u,v,T)。
所述的步骤5)中,通过贪婪算法选择区域主题阻断影响力最大的k个节点作为肯定种子集,具体包括以下步骤:
51)在社交网络G中,选择区域主题阻断影响力最大的节点u作为当前种子节点,即u=argmaxv∈V decInf(v,T,R);
52)若当前种子集SP中节点数等于k,则返回SP作为肯定种子集,结束;否则执行步骤53);
53)更新MIOA(u,θ);
54)对于MIOA(u,θ)中的每个节点v,如果v∈N(T,R),则对于MIIA(v,θ)中的每个节点w,按如下公式更新其区域主题阻断影响力:
55)decInf(w,T,R)-=(an(v,SP,SN)-an(v,SP∪{w},SN))*β(v,T);
56)将节点u加入到SP中;
57)对于MI0A(u,θ)中的每个节点v,更新MIIA(v,θ),如果v∈N(T,R),则对于MIIA(v,θ)中的每个节点w,按如下公式更新其区域主题阻断影响力:
58)decInf(w,T,R)+=(an(v,SP,SN)-an(v,SP∪{w},SN))*β(v,T);
59)返回步骤51)。
下面以图2为例,说明本发明的应用场景。
图2(a)是一个含有27个节点的网络,假设否定节点集SN={15,18},网络中的节点偏好如图2(b)所示,给定图中所示的查询区域R1和要抑制的谣言主题类型T={1,1,0,0,0},本发明的目标是在网络中选择k个种子进行正面消息的传播,从而在R1中最大限度的抑制SN产生的有关主题t1和t2的谣言的传播。
为了验证本发明的有效性,下面以仿真实验来进一步说明、需要说明的是,实验中应用的参数并不影响本发明的一般性。
1)实验环境:
实验采用了Linux曙光服务器,CPU:1400MHz AMD Opteron(TM)Processor 6320,内存16G,所有算法采用C++实现。
2)实验数据集:
实验采用了二个真实的社交网络数据集:Brightkite和Gowalla。这二个数据集都可以在http://snap.stanford.edu/data上下载。Brightkite和Gowalla是两个基于位置的社交网络数据集,我们将节点的位置设置为其在网络中出现次数最多的位置。表1显示了两个数据集的一些基本信息。
表1数据集基本信息表
数据集名称 | 节点数 | 边数 | 节点平均度数 | 节点最大度数 |
Brightkite | 58228 | 214078 | 3.68 | 1134 |
Gowalla | 196591 | 950327 | 9.67 | 14730 |
3)对比算法:
本发明提出的方法为LTIBM-H,本发明对比的算法包括Random、Degree-I、DD-I、Proximity-I。对于给定的查询请求Q=(T,R,k),Random随机选择k个节点作为种子集;Degree-I选择对T有偏好的度最大的k个节点作为种子集;DD-I选择对T有偏好的度减少最大的k个节点作为种子集;Proximity-I在谣言节点的出邻居节点中选择对T有偏好的传播概率最大的k个节点作为种子集。
4)实验设置:
在社交网络G中,对E中的每条边Eu,v,设置其传播概率为1/d(v),d(v)是节点v的度数。设置否定节点集SN为G中度数最大的200个节点。设置目标种子集SP中种子的个数k为400。对于查询区域R设置区域中所含的节点数为1000-5000,并设置3000为默认区域大小。Brightkite的区域中心设置为(13.0,37.0),Gowalla的区域中心设置为(7.0,76.0)。
图3、4分别显示了对于给定的主题类型T={1,1,1,1,1}和默认的R下,本发明方法与其他四个典型方法在Brightkite、Gowalla网络上的选择不同数量的肯定种子产生的谣言抑制结果对比图。图5、6分别显示了在默认的R下,本发明方法与其他四个典型方法在Brightkite、Gowalla网络上对于不同的主题ti选择400个肯定种子产生的谣言抑制结果对比图。图7、8分别显示了对于给定的主题类型T={1,0,0,0,0}下,本发明方法与其他四个典型方法在Brightkite、Gowalla网络上选择400个肯定种子产生的谣言抑制结果对比图。
从仿真结果看出,本发明的方法可以根据不同的主题类型和查询区域选择不同的最优种子集,同时,该种子集产生的谣言阻断效果明显优于其他对比方法。
综上,本发明基于主题的社交网络谣言抑制方法,能够根据不同主题类型的谣言选择最优种子进行正面消息的传播,从而在给定的区域中最大限度的抑制谣言的传播,具有简单有效,实用性强等优点,可广泛应用于社交网络谣言传播抑制等应用领域。
虽然对本发明的实施方式进行了描述,但是本发明并不局限于上述的实施方式,本领域的技术人员可在本发明权利要求的范围内做出各种改变和变形,这并不影响本发明的实质内容。
Claims (7)
1.一种基于主题的社交网络谣言抑制方法,其特征是:
(1)根据已知信息构建社交网络G中任意节点的最大影响树;
(2)根据已知信息构建QT-tree存储节点主题偏好及位置信息;
(3)对于给定的查询请求Q=(T,R,k),得到阻断节点集N(T,R),其中:T是要抑制的谣言的主题类型、R是要抑制谣言传播的区域、k是要选择的肯定种子集中种子的数量、N(T,R)是在区域R中对主题集T有偏好的节点的集合;
(4)对于G中每个节点u,计算其区域主题阻断影响力decInf(u,T,R),所述decInf(u,T,R)是u对N(T,R)中每个节点v的主题阻断影响力decInf(u,v,T)的累加和;
(5)以贪婪的方式循环从G中选择区域主题阻断影响力最大的k个节点作为肯定种子集传播真实消息,抑制谣言的传播。
2.根据权利要求1所述的基于主题的社交网络谣言抑制方法,其特征是步骤(1)中所述的已知信息包括:
已知社交网络G=(V,E),V为网络中节点的集合,E为网络中边的集合;已知谣言的起源节点集或称为否定种子集SN;已知谣言的传播模型为最大影响树传播模型。
3.根据权利要求2所述的基于主题的社交网络谣言抑制方法,其特征是步骤(1)中:对于G中任意节点v,其最大影响树包括最大影响入树MIIA(v,θ)和最大影响出树MIOA(v,θ)两部分,θ用来控制传播的范围,对G中任意节点v,MIIA(v,θ)和MIOA(v,θ)通过Djkstra算法得到。
4.根据权利要求3所述的基于主题的社交网络谣言抑制方法,其特征是所述的步骤(2)具体包括:
(2.1)创建QT-tree根单元qt,设置其M=[(0,0),(180,90)],设置当前单元为qt;
(2.2)检测当前单元容量是否超过c,c为表示QT-tree单元容量的一个全局变量,若未超过c,对G中所有未访问节点v,如果v坐标位于当前单元的最小边界矩形M内,则将v及其主题和位置信息保存在当前单元的List列表中,设置v为访问状态;若G中所有节点都为访问状态,则完成QT-tree的创建;
(2.3)若当前容量超过c且SE为空,则创建4个孩子单元SE、SW、NE、NW,每个孩子单元的最小边界矩形分别为当前单元最小边界矩形面积的四分之一;
(2.4)若当前容量超过c且SE不为空,则按广度优先方式在SE、SW、NE、NW中执行步骤(2.2)。
5.根据权利要求4所述的基于主题的社交网络谣言抑制方法,其特征是所述的步骤(3)具体包括:
(3.1)将QT-tree根单元设置为当前单元,将N(T,R)设置为空;
(3.2)如果R与当前单元没有交集,则结束本次递归调用;
(3.3)否则,查询当前单元中存储的每个节点,如果该节点是对主题T有偏好的节点,将该节点加入到N(T,R)中;
(3.4)如果当前单元的SE指针为空,则结束本次递归调用;
(3.5)将当前单元设置为SE,并返回步骤(3.2);
(3.6)将当前单元设置为SW,并返回步骤(3.2);
(3.7)将当前单元设置为NE,并返回步骤(3.2);
(3.8)将当前单元设置为NW,并返回步骤(3.2);
(3.9)若当前单元为QT-tree根单元,返回N(T,R),结束。
6.根据权利要求5所述的基于主题的社交网络谣言抑制方法,其特征是所述的步骤(4)具体包括:
(4.1)根据N(T,R),计算得到Ca(T,R),Ca(T,R)表示对N(T,R)中的节点有影响的节点的集合;
(4.2)对于G中每个节点u;
(4.3)如果u不属于Ca(T,R),则decInf(u,T,R)=0,decInf(u,T,R)是节点u的区域主题阻断影响力;
(4.4)如果u属于Ca(T,R),则decInf(u,T,R)=∑v∈N(T,R)decInf(u,v,T),decInf(u,v,T)是u对N(T,R)中每个节点v的主题阻断影响力的累加和。
7.根据权利要求6所述的基于主题的社交网络谣言抑制方法,其特征是所述的步骤(5)具体包括:
(5.1)在社交网络G中,选择区域主题阻断影响力最大的节点u作为当前种子节点,即u=argmaxv∈VdecInf(v,T,R);
(5.2)若当前种子集SP中节点数等于k,则返回SP作为肯定种子集,结束;否则执行步骤(5.3);
(5.3)更新MIOA(u,θ);
(5.4)对于MIOA(u,θ)中的每个节点v,如果v∈N(T,R),则对于MIIA(v,θ)中的每个节点w,按如下公式更新其区域主题阻断影响力:
(5.5)decInf(w,T,R)-=(an(v,SP,SN)-an(v,SP∪{w},SN))*β(v,T);
(5.6)将节点u加入到SP中;
(5.7)对于MI0A(u,θ)中的每个节点v,更新MIIA(v,θ),如果v∈N(T,R),则对于MIIA(v,θ)中的每个节点w,按如下公式更新其区域主题阻断影响力:
(5.8)decInf(w,T,R)+=(an(v,SP,SN)-an(v,SP∪{w},SN))*β(v,T);
(5.9)返回步骤(5.1)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910300107.0A CN110069718B (zh) | 2019-04-15 | 2019-04-15 | 一种基于主题的社交网络谣言抑制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910300107.0A CN110069718B (zh) | 2019-04-15 | 2019-04-15 | 一种基于主题的社交网络谣言抑制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110069718A true CN110069718A (zh) | 2019-07-30 |
CN110069718B CN110069718B (zh) | 2022-11-18 |
Family
ID=67367666
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910300107.0A Active CN110069718B (zh) | 2019-04-15 | 2019-04-15 | 一种基于主题的社交网络谣言抑制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110069718B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110851736A (zh) * | 2019-11-11 | 2020-02-28 | 重庆邮电大学 | 一种基于三方动态博弈的谣言传播控制方法 |
CN111581534A (zh) * | 2020-05-22 | 2020-08-25 | 哈尔滨工程大学 | 一种基于立场一致的谣言传播树结构优化方法 |
CN111695043A (zh) * | 2020-06-16 | 2020-09-22 | 桂林电子科技大学 | 一种基于地理区域的社交网络阻塞影响最大化方法 |
CN112001072A (zh) * | 2020-08-17 | 2020-11-27 | 东北财经大学 | 基于爆发阈值及用户体验的谣言抑制方法 |
CN112100241A (zh) * | 2020-09-14 | 2020-12-18 | 哈尔滨工程大学 | 一种基于主题的社交网络动态影响力最大化方法 |
CN112508725A (zh) * | 2020-12-04 | 2021-03-16 | 首都师范大学 | 一种基于社区结构的位置感知影响力最大化方法 |
CN112667784A (zh) * | 2021-01-14 | 2021-04-16 | 浙江工商大学 | 一种基于加权反向采样的谣言遏制方法 |
CN113326437A (zh) * | 2021-06-22 | 2021-08-31 | 哈尔滨工程大学 | 一种基于双引擎网络和drqn的微博早期谣言检测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130173485A1 (en) * | 2011-12-29 | 2013-07-04 | Telefonica, S.A. | Computer-implemented method to characterise social influence and predict behaviour of a user |
CN109064348A (zh) * | 2018-09-06 | 2018-12-21 | 上海交通大学 | 一种在社交网络中封锁谣言社区并抑制谣言传播的方法 |
CN109582791A (zh) * | 2018-11-13 | 2019-04-05 | 阿里巴巴集团控股有限公司 | 文本的风险识别方法及装置 |
-
2019
- 2019-04-15 CN CN201910300107.0A patent/CN110069718B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130173485A1 (en) * | 2011-12-29 | 2013-07-04 | Telefonica, S.A. | Computer-implemented method to characterise social influence and predict behaviour of a user |
CN109064348A (zh) * | 2018-09-06 | 2018-12-21 | 上海交通大学 | 一种在社交网络中封锁谣言社区并抑制谣言传播的方法 |
CN109582791A (zh) * | 2018-11-13 | 2019-04-05 | 阿里巴巴集团控股有限公司 | 文本的风险识别方法及装置 |
Non-Patent Citations (2)
Title |
---|
刘雅辉等: "社交媒体中的谣言识别研究综述", 《计算机学报》 * |
向卓元等: "微博谣言传播模型与影响力评估研究", 《科研管理》 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110851736A (zh) * | 2019-11-11 | 2020-02-28 | 重庆邮电大学 | 一种基于三方动态博弈的谣言传播控制方法 |
CN111581534B (zh) * | 2020-05-22 | 2022-12-13 | 哈尔滨工程大学 | 一种基于立场一致的谣言传播树结构优化方法 |
CN111581534A (zh) * | 2020-05-22 | 2020-08-25 | 哈尔滨工程大学 | 一种基于立场一致的谣言传播树结构优化方法 |
CN111695043A (zh) * | 2020-06-16 | 2020-09-22 | 桂林电子科技大学 | 一种基于地理区域的社交网络阻塞影响最大化方法 |
CN112001072A (zh) * | 2020-08-17 | 2020-11-27 | 东北财经大学 | 基于爆发阈值及用户体验的谣言抑制方法 |
CN112001072B (zh) * | 2020-08-17 | 2023-06-16 | 东北财经大学 | 基于爆发阈值及用户体验的谣言抑制方法 |
CN112100241A (zh) * | 2020-09-14 | 2020-12-18 | 哈尔滨工程大学 | 一种基于主题的社交网络动态影响力最大化方法 |
CN112100241B (zh) * | 2020-09-14 | 2023-07-25 | 哈尔滨工程大学 | 一种基于主题的社交网络动态影响力最大化方法 |
CN112508725A (zh) * | 2020-12-04 | 2021-03-16 | 首都师范大学 | 一种基于社区结构的位置感知影响力最大化方法 |
CN112508725B (zh) * | 2020-12-04 | 2023-02-17 | 首都师范大学 | 一种基于社区结构的位置感知影响力最大化方法 |
CN112667784A (zh) * | 2021-01-14 | 2021-04-16 | 浙江工商大学 | 一种基于加权反向采样的谣言遏制方法 |
CN112667784B (zh) * | 2021-01-14 | 2022-04-05 | 浙江工商大学 | 一种基于加权反向采样的谣言遏制方法 |
CN113326437B (zh) * | 2021-06-22 | 2022-06-21 | 哈尔滨工程大学 | 一种基于双引擎网络和drqn的微博早期谣言检测方法 |
CN113326437A (zh) * | 2021-06-22 | 2021-08-31 | 哈尔滨工程大学 | 一种基于双引擎网络和drqn的微博早期谣言检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110069718B (zh) | 2022-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110069718A (zh) | 一种基于主题的社交网络谣言抑制方法 | |
CN110046224A (zh) | 一种基于区域的社交网络谣言抑制方法 | |
CN107204988B (zh) | 一种基于p2p结构下的位置隐私保护方法 | |
Guan et al. | Effective data communication based on social community in social opportunistic networks | |
Zhang et al. | Gossip-based information spreading in mobile networks | |
Hu et al. | 2PASS: Bandwidth-optimized location cloaking for anonymous location-based services | |
Ye et al. | A novel location privacy-preserving scheme based on l-queries for continuous LBS | |
CN109284449B (zh) | 兴趣点的推荐方法和装置 | |
Arkian et al. | FcVcA: A fuzzy clustering-based vehicular cloud architecture | |
Dua et al. | RoVAN: A rough set-based scheme for cluster head selection in vehicular ad-hoc networks | |
Lai et al. | Efficient data request answering in vehicular ad-hoc networks based on fog nodes and filters | |
Winter et al. | KPT: a dynamic KNN query processing algorithm for location-aware sensor networks | |
Wei et al. | A neighbor discovery method based on probabilistic neighborship model for IoT | |
Mahin et al. | A crowd enabled approach for processing nearest neighbor and range queries in incomplete databases with accuracy guarantee | |
Cunha et al. | Understanding interactions in vehicular networks through taxi mobility | |
Mahmood et al. | Social-driven information dissemination for mobile wireless sensor networks | |
Lee et al. | IDR: positive influence maximization and negative influence minimization under competitive linear threshold model | |
CN108596778B (zh) | 一种基于兴趣空间的社区划分方法 | |
Huang et al. | On physical-social-aware localness inference by exploring big data from location-based services | |
Pop et al. | Data dissemination in vehicular networks using context spaces | |
Artail et al. | MDPF: Minimum Distance Packet Forwarding for search applications in mobile ad hoc networks | |
Zhang et al. | A reinforcement learning based distributed search algorithm for hierarchical peer-to-peer information retrieval systems | |
Loong et al. | Self-organized population segmentation for geosocial network neighborhood | |
Li et al. | Cellular traffic offloading through opportunistic communications based on human mobility | |
Huang et al. | DMP: Content delivery with dynamic movement pattern in vehicular networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |