CN112269945B

CN112269945B - 基于谣言辟谣促谣和三方认知博弈的信息传播预测方法

Info

Publication number: CN112269945B
Application number: CN202011207375.7A
Authority: CN
Inventors: 肖云鹏; 戴天骥; 李暾; 李茜; 刘红; 桑春艳; 刘宴兵
Original assignee: Chongqing University of Post and Telecommunications
Current assignee: Chongqing University of Post and Telecommunications
Priority date: 2020-11-03
Filing date: 2020-11-03
Publication date: 2022-10-18
Anticipated expiration: 2040-11-03
Also published as: CN112269945A

Abstract

本发明属于网络舆情分析领域，涉及一种基于谣言辟谣促谣和三方认知博弈的信息传播预测方法，包括获取在线数据；根据爬取的数据，获取消息热度、消息传播强度、用户认知指数以及用户相互强度；构建谣言传播驱动力模型，在该模型中基于三方认知博弈根据获取的信息获取谣言、辟谣以及促谣消息的收益函数；根据收益函数计算谣言、辟谣以及促谣消息的驱动力，并根据驱动力来预测用户行为；将在线爬取的数据输入建立的模型，预测得到网络节点的采取辟谣行为和促谣行为的概率；本发明可应用于社交网络中谣言传播预测和控制，舆情部门可以更及时和精确的对网络谣言进行监控和控制，并在合理的时间进行引导和抑制。

Description

基于谣言辟谣促谣和三方认知博弈的信息传播预测方法

技术领域

本发明属于网络舆情分析领域，特别涉及一种基于谣言辟谣促谣和三方认知博弈的信息传播预测方法。

背景技术

谣言是一种常见的社会现象。从狭义上讲，谣言是指未经官方核实而流传于社会的虚假信息。通常是一些人在没有确切的信息和知识或为达到特定目的情况下而四处传播。俗话说，谣言重复一千遍就会成为真理。在现实生活中，如果人们无法辨别信息的真假，总会抱着宁可信其有,不可信其无的心理传播谣言，经过大量的传播，很多谣言都被认为是真实的。当谣言在社会群体中飞速传播时，会造成社会不稳定性增加，同时，由于谣言的误导性也会使人们的认知受到影响。这一系列的影响对于和谐社会的建设而言是极具危害性的。

谣言具有悠久的历史。传统上，谣言是通过人与人之间口耳相传，传播速度慢、范围小。当今互联网发展迅速，微信、微博、博客等社交媒体已经渗入到人们日常生活的方方面面。社交网络的出现给人们带来了极大的便利，却也为谣言提供了传播渠道。它可以通过社交网络在不同地区，相距很远的陌生人之间传播，这意味着谣言的传播速度和范围比以往任何时候都更远、更快。在传统谣言的研究中，并未考虑促谣消息对于整个话题演化过程的影响。因此，开展谣言、辟谣和促谣话题传播预测模型研究，能够更好地发掘消息传播趋势和掌握群体转发特性分布，对网络舆情的引导和管控都具有重要意义。

近年来，许多学者对谣言传播模型进行了大量的研究，主要是基SIR传染病模型、机器学习算法模型和深度学习算法模型。基于SIR传染病的预测模型主要是将用户划分为三种状态：易感者(S)，感染者(I)，免疫者(R)。状态S的用户不知道谣言，因此很容易受到谣言的感染，状态I的用户知道谣言，并积极传播谣言，而状态R的用户知道谣言，但不传播谣言。基于机器学习算法模型主要是提取影响用户传播的用户特征、文本特征特征因素，将问题转化为分类或回归问题，机器学习中的算法具有处理海量数据的优势，适用于处理社交网络中复杂的问题。

虽然众多学者对话题传播预测模型进行了大量的研究，并取得了相当不错的成果，但仍存在一些不足：

1.由于多类型消息在社交网络中的传播所造成的用户认知过程多态性，给整个谣言的传播分析造成干扰；

2.多类型消息在传播过程中产生的共生性与对抗性，如何将用户认知过程中出现的矛盾性与包容性转化为多类型消息间存在的竞争与合作关系成为难点；

3.不同层级的多类型消息传播态势所具有的特征各有差异，如何解决多类型消息传播态势的多层次性带来的传播态势感知困难成为挑战。

发明内容

针对以上不足，本发明提出一种基于谣言辟谣促谣和三方认知博弈的信息传播预测方法，具体包括以下步骤：

S1、从公开的数据网站或者利用社交网络公共API爬取在线数据；

S2、根据爬取的数据，获取消息热度、消息传播强度、用户认知指数以及用户相互强度；

S3、构建谣言传播驱动力模型，在该模型中基于三方认知博弈根据获取的信息获取谣言、辟谣以及促谣消息的收益函数；

S4、根据收益函数计算谣言、辟谣以及促谣消息的驱动力，并根据驱动力来预测用户行为；

S5、将在线爬取的数据输入建立的模型，预测得到网络节点的采取辟谣行为和促谣行为的概率。

本发明方法可应用于社交网络中谣言传播预测和控制，舆情部门可以更及时和精确的对网络谣言进行监控和控制，并在合理的时间进行引导和抑制；也可用于企业产品和服务的推广，有助于广告在目标群体的快速推广和扩散，提升广告的曝光度以及品牌知晓度，以此获得良好的经济社会效益。

附图说明

图1为本发明基于三方认知博弈和谣言-辟谣-促谣的信息传播预测模型；

图2为本发明用户转发预测示例；

图3为本发明中量化消息影响力的机制；

图4为本发明中谣言-辟谣-促谣驱动机制。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供一种基于谣言辟谣促谣和三方认知博弈的信息传播预测方法，包括以下步骤：

实施例1

如图1，在本实施例中，主要包括三个步骤，一个是根据获取用户数据，包括用户基本属性、用户历史行为数据以及话题消息数据；二是根据获取的信息构建谣言消息影响机制、促谣信息影响机制以及辟谣消息影响机制，并从中提取消息自带属性、用户认知行为特征以及谣言信息影响机制；三是根据提取的数据建立三方认知博弈模型，计算谣言驱动力和辟谣驱动力，并最终获取预测的用户转发结果、信息传递趋势以及多类型消息博弈系数；上述三个步骤具体包括：

(一)在线数据获取

获取数据的方式可以是从公开的数据网站，或者是利用成熟的社交网络公共API进行获取。这里需要获取的是谣言-辟谣-促谣话题在其生命周期内的所有参与者的行为记录以及话题参与记录以及消息的转发情况。话题参与记录需要得到的是话题被转发和评论的时间、参与用户的基本信息和参与用户的好友关系信息(包括关注和被关注信息)；话题参与者的行为记录包括该用户历史上所转发和评论的信息。

作为一种可选实施方式，本实施例中对获取的数据做以下预处理：

S11：通过社交网络公共API或公开的数据网站都可以得到原始数据；

S12：通常获取的原始数据都是非结构化的，不能直接用于数据分析。通过简单的数据清洗可以使大部分非结构化数据结构化，使得异常值或空值不再出现，减少对于后续计算带来的不便。

S13：通过简单数据清晰后的数据需要使用数据库进行存储，通过表结构对数据进行进一步的规范化，并且通过数据库也能够极大的提高数据的检索效率以及表间关系的映射。

(二)提取相关属性

本实施例需要提取的信息包括消息在每个时刻的转发量、用户基本信息、用户关注列表、用户历史行为，并使用多项式方程从用户、话题两个角度融合特征量化消息影响力。

以谣言-辟谣-促谣为主的多类型谣言消息传播过程，实质上是从消息与用户两个层面提取相关特征并对这些特征进行建模分析。针对谣言信息传播网络中用户转发信息的动力学成因，从消息自带属性、用户认知行为特征、用户关系、用户心理这几个方面，挖掘用户进行消息转发的重要特征。

1)消息自带属性

谣言传播的一大特点是由于消息影响用户造成瞬时的消息扩散度上升，可见消息的热度对于谣言传播具有较大的影响。瞬时消息转发量越高，证明当前消息在整个网络中的关注度越高，消息的传播概率越高。与COVID-19的传播机理类似，当感染者接触到的人越多，则病毒传播的风险也就越大。因此本实施例将消息热度表示为：

其中，Topic(t)表示t时刻的消息热度，forward_info(t)表示t时刻消息的瞬时转发量，k代表当前话题传播的总时长。

在社交网络消息转发传播的过程中，消息热度能够衡量单一时刻消息的传播热度，但随时间变化的趋势则无法衡量。因此本实施例将话题升温-恒温-降温三个主要过程类比为模拟退火的过程，从而达到准确计算消息热度变化加速度的目的，消息传播强度表示为：

其中，Prop(t)表示在t时刻的消息传播强度，forward_info(t)表示t时刻的消息转发量，k为约束因子可自由调整，Topic(t)表示t时刻的消息热度。

2)用户认知行为特征

用户认知指数是指在某一时间段内用户产生的行为与总时间内用户总行为数的比值。用户在接触到不同的消息后，都会经过消息处理、理解、接收等必经的心理阶段，这一系列的内容即为认知过程，而最终，用户采取的行动与认知过程有着直接关系。因此从用户行为角度出发，逆向量化用户认知过程是极为重要的。本实施例将用户认知指数表示为：

其中，Cog(u_i)表示用户认知指数，Num[retweet(u_i)]表示用户在一段时间内的消息转发行为数，Num[behavior(u_i)]表示用户在一段时间内产生的行为总数，用户行为包括转发次数和原创博文个数。θ表示为约束因子，属于超参数，θ∈(0，1)。

3)用户关系

在社交网络中，用户间的交互情况能够有效的对用户关系进行挖掘，用户关系可以折射出用户认知水平，从而影响用户接触多类型消息后，选择转发每种消息的概率。用户的交互率越高，则用户对于彼此的信任程度越高会更明确，则相互转发消息的概率也就越高。本实施例的用户互动强度表示为：

Int(u_i)＝α*Num[follow(u_i)]+β*Num[followed(u_i)]

其中，Int(u_i)表示用户互动强度，Num[follow(u_i)]表示用户u_i关注的用户总数，Num[followed(u_i)]表示关注u_i用户的用户总数。α和β为衰减系数，α，β∈(0，1)。

4)用户心理

一条消息的影响力与消息所处的话题热度、消息在每个时刻传播的强弱程度是分不开的，同时其影响力也与其接触到消息的用户相关属性息息相关，用户的活跃程度、对消息的认知过程也对消息影响力有着不可忽视的影响。因此本文从消息自身属性以及用户属性两个维度出发，构建谣言消息影响机制：

Eff(rumor)

＝k₀+k₁*T₁(t)+k₂*Prop₁(t)²+k₃*(Cog₁(u_i)*Int₁(u_i))³+δ*||(Cog₁(u_i)*Int₁(u_i)，T₁(t)，Prop₁(t))||₂

其中，k₀，k₁，k₂，k₃为预设系数可以真实反映不同的特征对于消息影响力的重要度，在现实情况中，消息传播受到多重因素的影响，本文通过多元线性方程来对影响谣言传播的特征进行融合以此达到更好的拟合现实情况的效果。δ*||(Cog₁(u_i)*Int₁(u_i)，Topic₁(t)，Prop₁(t))||₂为正则化项，用于约束函数，||(Cog₁(u_i)*Int₁(u_i)，Topic₁(t)，Prop₁(t))||₂表示将t时刻用户行为、谣言话题热度、谣言传播强度值组合为向量并对其取欧几里德范数，其作用是将三种特征进行融合并在同一维度进行比较，从而更为客观的量化消息影响力也能对函数的融合结果进行修正。

同理可得辟谣消息影响力机制：

Eff(anti-rumor)

＝k₀+k₁*T₂(t)+k₂*Prop₂(t)²+k₃*(Act₂(u_i)*Int₂(u_i))³+δ*||(Act₂(u_i)*Int₂(u_i)，T₂(t)，Prop₂(t))||₂

以及促谣消息影响力机制：

Eff(sti-rumor)＝k₀+k₁*T₃(t)+k₂*Prop₃(t)²+k₃*(Act₃(u_i)*Int₃(u_i))³+δ*||(Act₃(u_i)*Int₁(u_i)，T₃(t)，Prop₃(t))||₂

用户在接触到谣言-辟谣-促谣多类型消息后，基于传统的意义上的认知过程中，则会产生矛盾心理进而影响其对于消息的判断。在用户对多类型消息进行认知后，无论用户基于何种消息认知，都会在宏观上对多类型消息的传播造成影响。这也从侧面说明谣言-辟谣-促谣多类型消息在传播过程中由于彼此内容的相悖，造成在传播过程中的竞争状态，尽管如此，多类型消息间仍然存在相似的信息并且任意一方消息扩散范围的扩大，也会使另外两方的影响力有所增加，所以，多类型消息间既存在共生关系亦存在对抗关系，这一关系实质上是用户认知过程的矛盾性和包容性所导致的，所以此处将认知过程类比于认知博弈。基于以上观点，本实施例使用三方认知博弈量化多类型消息对用户心理认知过程的影响。

依照博弈理论原理，本实施例制定如下三种博弈策略：策略1——“转发谣言消息”、策略2——“转发辟谣消息”、策略3——“转发促谣消息”，且对于分别采取以上三种的网络节点数量，w₁为网络节点中采取策略1进行转发操作的结点比例，w₂为网络节点中采取策略2进行转发操作的结点比例，w₃为网络节点中采取策略3进行转发操作的结点比例。除采取这三种策略的网络节点外，其余未参与转发等相关操作的结点对于整个话题转发网络以及其相邻结点未造成实质性影响，故本文将其忽略，则可得w₁+w₂+w₃＝1。

上述三种博弈策略的收益函表示为：

Payoff₁(u_i)＝w₁*Eff(rumor)

Payoff₂(u_i)＝w₂*Eff(anti_rumor)

Payoff₃(u_i)＝w₃*Eff(sti_rumor)

其中，Payoff₁、Payoff₂、Payoff₃分别代表用户u_i采取转发谣言消息、转发辟谣消息、转发促谣消息的收益函数；Eff(rumor)、Eff(anti_rumor)、Eff(sti_rumor)分别表示上文定义的谣言、辟谣、促谣消息影响力。

(三)建立谣言传播驱动力模型

构建谣言传播驱动力模型主要包括三个阶段，即：

根据三方认知博弈制定博弈策略，对用户在认知过程中的心理博弈状态进行量化；在该阶段使用三方认知博弈所得的收益函数，构建谣言-辟谣-促谣驱动机制，量化在三方认知博弈中的用户状态转化驱动力

根据收益函数度量用户状态转化驱动力，并使用信息熵对量化谣言、辟谣转发驱动力，从而消除信息量间的差异所带来的误差；如图3，在该阶段综合考虑谣言、辟谣和促谣消息在认知博弈过程所存在的信息量差异；如图4，利用信息熵理论计算最终的谣言、辟谣转发驱动力；

1)量化用户状态转化驱动力

对于社交网络中的用户节点而言，其在短时间内可能同时对谣言消息、辟谣消息、促谣消息进行接触，在接触到这些消息后，用户如何选择消息转发便是本节主要讨论的内容。步骤(二)为消息定义了其影响力，消息影响力作用于用户认知过程会使得用户认知出现矛盾冲突和同化，导致不一样的用户行为，这也反映出消息间既存在共生性又具有对抗性。消息面的博弈本质上也是用户认知与心理预期收益间的博弈，所以通过三方认知博弈可得消息间两两博弈所形成的谣言用户状态转化驱动力：

其中，Payoff₁、Payoff₂、Payoff₃分别为选择谣言、辟谣和促谣进行转发的收益函数，drf₁为谣言用户状态转化驱动力。同理可得辟谣用户状态转化驱动力：

以及促谣用户状态转化驱动力：

2)量化最终的谣言、辟谣信息驱动力

从独立的状态转化驱动力无法客观全面的对用户的复杂认知过程进行量化。同时，由于多类型消息所传递给用户的信息量各不相同，所以造成用户在认知过程中出现矛盾冲突的情况，这样造成用户认知过程的多变。因此，用户状态的转化可以理为信息量的差异所引起的。因此，引入信息熵理论将用户认知过程的多变性这一不确定的因素进行量化，以此得到用户在t_i时刻参与谣言消息转发的驱动力：

其中，Drf₁为谣言转发驱动力，drf₁、drf₃分别为用户谣言状态驱动力和用户促谣状态驱动力，t表示时刻的下标，t∈[0，now]，now为当前计算驱动的时刻。同理可得，用户在t_i时刻参与辟谣消息转发的驱动力：

3)设计模型算法

本发明考虑到用户接触多类型消息后所产生的认知过程多态性，将其量化为用户亢奋状态引入经典SIR模型中，从而定义一种新型的SHIR模型。SHIR模型中的用户有四种状态：易感状态(Suspicious：指在时刻t未接触到话题中消息的用户状态)、亢奋状态(Hyper：指在时刻t接触到话题中多类型消息并进入认知博弈过程的用户状态)、传谣状态(Infected：指在时刻t选择相信谣言消息并转发谣言的用户状态)、免疫状态(Resisted：指在时刻t选择不相信辟谣消息并转发其他类型消息的用户状态)，如图2所示的一例预测实例，本模型的其中一个目的即为得出预测用户的转发行为。

A：定义谣言转发规则

本实施例在构建模型过程中进行了以下假设：

由于谣言传播所具有的爆发性和短暂性特点，假定在研究谣言话题传播的时间段内，在谣言传播网络中用户的流失和增长速度保持一致，即整个网络中的用户节点总量在研究阶段的任意时刻均为N，故本发明模型中每种用户状态比率之和为S+H+I+R＝1；

由于消息传播方式类似于传染病传播，所以新用户与谣言传播用户接触后必然会存在一定的传染率；

谣言传播具有生命周期，由于用户自身记忆的局限性，谣言传播网络中的用户会随着时间的推移从已知节点转转换为免疫节点。

根据以上假设，本文定义谣言消息在社交网络中的传播规则：

怀疑节点若与亢奋状态节点和感染节点接触，将会分别以ζ、η的概率转化为亢奋节点或感染节点。其中，由于在谣言传播的整个生命周期中，均有一些节点从始至终未接触和参与谣言传播，因此，ζ+η＜1；

由于用户自身记忆的局限性，所以感染节点和亢奋节点均会随着时间推移逐渐转化为免疫节点，因此，本文定义感染节点和辟谣节点的免疫率为μ和λ，状态转移概率ζ，η，μ，λ∈[0，1)。

基于以上传播规则，本文得到如下动力学方程：

由于谣言传播的单向性，造成用户状态转移同样具有单向性——从怀疑状态到亢奋状态&感染状态最终到免疫状态。假设用户u_i关注m个用户，其中有n个用户转发谣言消息的概率服从二项分布。

因此，可得任意用户u_i在t时刻参与谣言转发的概率为：

同理，任意用户u_i在t时刻参与辟谣转发的概率为

结合平均场方程可得：

S34：模型预测结果

通过本发明中基于动力学模型的输出结果，系统能够对当前话题的消息传播趋势进行预测，并得到模型的输出：每个时刻的用户状态比率以及整个消息传播趋势图。舆情部门可以通过对每个时刻的用户状态比率以及传播趋势图动态的针对谣言的传播态势进行了解，并根据比率的变化状况进行相应的辟谣信息发布，从而达到使用最低的成本最快速的进行谣言消息的抑制。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.基于谣言辟谣促谣和三方认知博弈的信息传播预测方法，其特征在于，包括以下步骤：

S4、根据收益函数计算谣言、辟谣以及促谣消息的驱动力，并根据驱动力来预测用户行为；具体包括：

根据谣言传播驱动力模型，可以得出任意用户u_i在t时刻参与谣言转发的概率为：

任意用户u_i在t时刻参与辟谣转发的概率为：

其中，m为

表示用户u_i所关注的m个用户，转发过程中有n个用户转发了辟谣消息的行为；Drf₁(u_i)为用户在t_i时刻参与谣言消息转发的驱动力，表示为：

Drf₂(u_i)为用户在t_i时刻参与辟谣消息转发的驱动力，表示为：

其中，drf₁(t_i)为t_i时刻的用户谣言状态驱动力，表示为：

drf₂(t_i)为t_i时刻的用户辟谣状态驱动力，表示为：

drf₃(t_i)为t_i时刻的用户促谣状态驱动力，表示为：

其中，t表示时刻的下标，t∈[0,now]，now为当前计算驱动的时刻；Payof f₁、Payof f₂、Payof f₃分别为选择谣言、辟谣和促谣进行转发的收益函数，分别表示为：

Payof f₁(u_i)＝w₁*Eff(rumor)

Payof f₂(u_i)＝w₂*Eff(anti_rumor)

Payof f₃(u_i)＝w₃*Eff(sti_rumor)

其中，w₁为网络节点中转发谣言消息的节点比例，w₂为网络节点中转发辟谣消息的节点比例，w₃为网络节点中转发促谣消息的节点比例；Eff(rumor)、Eff(anti_rumor)、Eff(sti_rumor)分别表示谣言、辟谣、促谣消息影响力，分别表示为：

Eff(rumor)

＝k₀+k₁*T₁(t)+k₂*Prop₁(t)²+k₃*(Cog(u_i)*Int₁(u_i))³+δ*||(Cog(u_i)*Int₁(u_i),T₁(t),Prop₁(t))||₂

Eff(anti-rumor)

＝k₀+k₁*T₂(t)+k₂*Prop₂(t)²+k₃*(Cog(u_i)*Int₂(u_i))³+δ*||(Cog(u_i)*Int₂(u_i),T₂(t),Prop₂(t))||₂

Eff(sti-rumor)

＝k₀+k₁*T₃(t)+k₂*Prop₃(t)²+k₃*(Cog(u_i)*Int₃(u_i))³+δ*||(Cog(u_i)*Int₃(u_i),T₃(t),Prop₃(t))||₂

其中，k₀,k₁,k₂,k₃,δ为预设系数；|| ||₂表示欧几里德范数运算；T(t)为t时刻下话题传播热度值；Prop₁(t)为t时刻下谣言消息传播强度值；Cog(u_i)为t时刻下用户认知指数；Int(u_i)为t时刻下用户互动率；

消息热度表示为：

消息传播强度表示为：

用户认知指数表示为：

用户相互强度表示为：

Int(u_i)＝α*Num[follow(u_i)]+β*Num[followed(u_i)]

其中，k代表当前话题传播的总时长；forward_info(t)表示t时刻的消息转发量，k1为约束因子，Topic(t)表示t时刻的消息热度；Num[retweet(u_i)]表示用户在一段时间内的消息转发行为数，Num[behavior(u_i)]表示用户在一段时间内产生的行为总数，用户行为包括转发次数和原创博文个数；θ为约束因子，属于超参数，θ∈(0,1)；Num[follow(u_i)]表示用户u_i关注的用户总数，Num[followed(u_i)]表示关注u_i用户的用户总数，α和β为衰减系数，α,β∈(0,1)；

2.根据权利要求1所述的基于谣言辟谣促谣和三方认知博弈的信息传播预测方法，其特征在于，用户在谣言传播驱动力模型中包括四种状态，即：在时刻t未接触到话题中消息的用户为易感状态、在时刻t接触到话题中多类型消息并进入认知博弈过程的用户为亢奋状态、在时刻t选择相信谣言消息并转发谣言的用户为传谣状态、在时刻t选择不相信辟谣消息并转发其他类型消息的用户为免疫状态，易感状态节点若与亢奋状态节点和传谣状态节点接触，将会分别以ζ、η的概率转化为亢奋节点或感染节点，感染节点和亢奋节点均会随着时间推移逐渐转化为免疫节点，感染节点和免疫节点的免疫率为μ和λ，状态转移概率ζ,η,μ,λ∈[0,1)。