CN116304028B

CN116304028B - 基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法

Info

Publication number: CN116304028B
Application number: CN202310139875.9A
Authority: CN
Inventors: 陈逢章; 尚家兴; 管梦雅; 陈逢文; 郑林江
Original assignee: Chongqing University
Current assignee: Chongqing University
Priority date: 2023-02-20
Filing date: 2023-02-20
Publication date: 2023-10-03
Anticipated expiration: 2043-02-20
Also published as: CN116304028A

Abstract

本发明提出一种基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法，包括，通过预训练Bert模型对历史新闻文本数据以及历史新闻文本数据对应的历史评论文本数据进行编码，获取文本表示；通过情感评分模型计算历史评论文本信息的情感分值；根据文本表示和情感分值构建多关系情感感知图；基于多关系情感感知图，使用关系图卷积网络学习所述多关系情感感知图的情感图表示；获取待预测的新闻文本以及评论文本，基于情感图表示，生成待预测的新闻文本以及评论文本最终预测结果。通过本发明提出的方法，显著提升虚假新闻的检测效率。

Description

基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法

技术领域

本发明属于数据处理领域。

背景技术

互联网的快速发展使得社交平台逐渐兴起，极大地改变了人们参与信息传播的方式。人们可以不受空间距离的限制，在社交平台上创造、分享、获取信息。由于其方便性和实时性，社交平台吸引了大量的用户。然而，各大社交平台在方便用户交流的同时也成为虚假新闻快速传播的渠道。

虚假新闻的广泛传播产生了诸多不良社会影响。首先，其容易造成社会恐慌，扰乱社会稳定。其次，虚假新闻的广泛传播削弱了政府的公信力。第三，虚假新闻会干扰人们对事情的判断并引发人们对社会的信任危机。一项研究表明，长时间接收虚假社会性新闻的人非常容易对社会产生厌烦态度，个人的精神健康也深受影响。因此，遏制虚假新闻传播，控制其对社会的负面影响至关重要。

目前，虚假新闻检测面临诸多挑战。首先，它往往是经过特意编辑后发布出来的，旨在迷惑大众，因此，仅仅依靠新闻内容很难准确判断新闻的真实性。其次，社交媒体上的新闻数量庞大、内容形式丰富多样、大多由用户生成，数据噪声大。因此，依赖人工检测不仅非常耗时，且效率低下。

发明内容

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本发明的目的在于提出一种基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法，用于提高虚假新闻检测准确性。

为达上述目的，本发明第一方面实施例提出了一种基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法，包括：

通过预训练Bert模型对历史新闻文本数据以及所述历史新闻文本数据对应的历史评论文本数据进行编码，获取文本表示；

通过情感评分模型计算所述历史评论文本信息的情感分值；

根据所述文本表示和所述情感分值构建多关系情感感知图；

基于所述多关系情感感知图，使用关系图卷积网络学习所述多关系情感感知图的情感图表示；

获取待预测的新闻文本以及评论文本，基于所述情感图表示，生成所述待预测的新闻文本以及评论文本最终预测结果。

另外，根据本发明上述实施例的一种基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法还可以具有以下附加的技术特征：

进一步地，在本发明的一个实施例中，所述通过预训练Bert模型对历史新闻文本数据以及所述历史新闻文本数据对应的历史评论文本数据进行编码，获取文本表示，包括：

使用Bert模型对新闻进行编码，以所述Bert模型中cls位置对应的嵌入向量作为新闻表示，用T₀∈R^d表示，计算方法如下：

T₀＝PreBert(P)，

其中，P表示新闻文本内容，由一连串词语{w₁，w₂，w₃...w_k}组成，d是T₀的维度，PreBert(·)代表预训练模型；

使用Bert模型对评论进行编码，以所述Bert模型中cls位置对应的表示作为评论c_i的文本嵌入，用T_i来表示，计算方法如下：

T_i＝PreBert(c_i)，

其中，c_i∈C是一条评论，由一组词语组成。

进一步地，在本发明的一个实施例中，所述通过情感评分模型计算所述历史评论文本信息的情感分值，包括：

通过下式计算评论c_i的情感类型：

s_i＝scorer(c_i)，i∈{1，2...|C|}，

其中，scorer(·)表示情感评分模型，评论c_i的情感类型按照如下计算方式推导：

式中，min表示情感评分模型的区间下限，对于Vader模型来说为-1，max描述区间上限，对于Vader模型来说为1，L是评分区间的长度，由max-min计算得出。

进一步地，在本发明的一个实施例中，根据所述文本表示和所述情感分值构建多关系情感感知图，包括：

定义情感感知图为其中v_i∈V是新闻节点及评论节点，(v_i，r，v_j)∈E表示节点之间的边，/>是关系类型；将关系r下的邻接矩阵表示为A_r，它的初始值为：

对邻接矩阵进行拉普拉斯平滑操作，得到矩阵计算方式为：

其中，D_r表示A_r的对角矩阵，I为单位矩阵。

进一步地，在本发明的一个实施例中，所述基于所述多关系情感感知图，使用关系图卷积网络学习所述多关系情感感知图的情感图表示，包括：

定义X＝[T₀，T₁，T₂，T₃...T_|C|]∈R^(|C|+1)×d表示节点特征矩阵，给定矩阵集和特征矩阵X，/>表示第i个节点在第l+1层的表示，计算公式如下所示：

其中，l表示卷积层的序列号，是第i个节点之间周围关系为r的邻居节点集合，W_r代表网络参数，/>表示第i个节点在第l层的表示，相应地，/>表示第j个节点在第l层的表示，激活函数为ReLU；

设置模型输入为h⁰，其值为X，c_i，r是归一化常数，计算方法如下：

其中，i∈[1，|C|+1]，通过堆叠两个卷积层学习情感感知图潜在的特征交互，用h^G∈R^(|C|+1)×g表示节点嵌入，其中g为网络的输出维度；

将节点嵌入经过平均池化，得到图表示，计算方法为：

进一步地，在本发明的一个实施例中，所述基于所述情感图表示，生成所述待预测的新闻文本以及评论文本最终预测结果，包括：

将情感感知的图表示作为输入，通过softmax层预测标签/> 为0表示新闻为假，相反则为真，其中/>可以按照如下方式推导：

其中，b为偏置项，W_f为网络需要学习的参数矩阵，通过最小化交叉熵损失函数来训练模型：

式中，θ表示整个模型中需要学习的参数，y代表新闻的真实标签。

为达上述目的，本发明第二方面实施例提出了一种基于社会情感共鸣与关系图卷积网络的虚假新闻检测装置，包括以下模块：

获取模块，用于通过预训练Bert模型对历史新闻文本数据以及所述历史新闻文本数据对应的历史评论文本数据进行编码，获取文本表示；

计算模块，用于通过情感评分模型计算所述历史评论文本信息的情感分值；

构建模块，用于根据所述文本表示和所述情感分值构建多关系情感感知图；

学习模块，用于基于所述多关系情感感知图，使用关系图卷积网络学习所述多关系情感感知图的情感图表示；

生成模块，用于获取待预测的新闻文本以及评论文本，基于所述情感图表示，生成所述待预测的新闻文本以及评论文本最终预测结果。

为达上述目的，本发明第三方面实施例提出了一种计算机设备，其特征在于，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时，实现如上所述的一种基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法。

为达上述目的，本发明第四方面实施例提出了一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如上所述的一种基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法。

本发明实施例提出的基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法，首先通过预训练Bert模型编码新闻及评论以获取文本表示。其次，选用较为流行的情感评分模型计算评论的情感分值，以获取用户的情感倾向。与已有的将新闻与评论建模成序列的方法不同，本发明从情感的层面将之建模为图用以捕捉评论和新闻之间以及同种情感的评论之间的潜在交互。然后，基于构建的多关系图，使用关系图卷积网络学习情感图的表示。最后，基于融合了拓扑信息及语义信息的情感图表示，生成最终预测结果。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1为本发明实施例所提供的一种基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法的流程示意图。

图2为本发明实施例所提供的一种基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法组件示意图。

图3为本发明实施例所提供的一种基于社会情感共鸣与关系图卷积网络的虚假新闻检测装置的流程示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

下面参考附图描述本发明实施例的基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法。

如图1所示，该基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法包括以下步骤：

S101：通过预训练Bert模型对历史新闻文本数据以及所述历史新闻文本数据对应的历史评论文本数据进行编码，获取文本表示；

S102：通过情感评分模型计算所述历史评论文本信息的情感分值；

S103：根据所述文本表示和所述情感分值构建多关系情感感知图；

S104：基于所述多关系情感感知图，使用关系图卷积网络学习所述多关系情感感知图的情感图表示；

S105：获取待预测的新闻文本以及评论文本，基于所述情感图表示，生成所述待预测的新闻文本以及评论文本最终预测结果。

本方法选用预训练Bert模型作为新闻文本编码器。对于英文数据集，选用在无标签英文语料库上训练得到的模型bert-base-uncase。对于中文数据集，则选择chinese-roberta-wwm-ext模型来对文本进行编码。所有预训练模型的输入均为词语，输出为处理后得到的向量。

T₀＝PreBert(P)，

T_i＝PreBert(c_i)，

其中，c_i∈C是一条评论，由一组词语组成。

由于每条新闻长短不一，因而对输入进行零填充，设置最大长度为预训练模型的默认长度。为了保证获得的文本嵌入具有实际意义，设置评论的最小长度不少于2。

评论是人们参与话题讨论的主要表达方式，除了语义之外通常还包含丰富的情感信号。本发明将情感分为三种类型以便清楚地描述用户的情感倾向。具体划分如下：a)积极的：文本所传达的情绪是快乐的、感激的或兴奋的；b)消极的：文本所反映的情绪是愤怒的、悲观的或怨恨的；c)中性的：表示那些只是陈述事件或表达意见的评论，没有明显的情感倾向。

对于英文数据集，采用广泛用于英文文本情感检测的预训练模型Vader[36]，情感得分区间为[-1，+1]。分数接近0意味着句子的情感倾向于中性，而-1表示该评论有强烈的负面情感倾向，相反，评分接近1意味着积极的情感倾向。

通过下式计算评论c_i的情感类型：

s_i＝scorer(c_i)，i∈{1，2...|C|}，

由于中文语法结构和英文存在差异，对于中文数据集，选用较为流行的中文情感分析工具snownlp，它的情感输出区间为[0，1]。由于snownlp模型的原始语料是来自电子商务平台的评论，因此，本方法选择领域内应用较为广泛的微博情感语料对模型进行预训练，以便更加准确地对微博数据进行情感评分。

本发明通过构建一个多关系情感感知的新闻-评论图来建模新闻和评论之间的信息交互以及评论之间的情感共鸣。具有相同情感的评论之间存在信息交流，侧面反映了它们在情感层面上是相通的。因此，本方法中构建的图是基于情感连接而不是回复结构。由于用户的情感是由新闻引起的，因而新闻节点与所有评论节点相连，其关系由评论的情感决定。例如，如果评论的情绪是“积极的”，评论和新闻之间的关系就是“赞同”，这意味着新闻引起了积极的情绪或评论对新闻持赞同态度。如果评论的情绪是“负面”的，那么关系就是“消极”。最后，“中性”的情绪对应“中性”关系。评论之间的连接取决于情感共鸣，具有相同情感类型的评论互相连接，因为它们在情感层面上是相互支持的，定义连接关系为“赞同”。多关系情感感知图属于无向图，边两端的节点可以互相交换信息，便于信息传播。

对邻接矩阵进行拉普拉斯平滑操作，得到矩阵计算方式为：

其中，D_r表示A_r的对角矩阵，I为单位矩阵。

为了挖掘情感感知图上潜在的特征交互，本发明通过关系图卷积网络对图进行编码。相较于图卷积网络(GCN)，RGCN在捕捉多关系图特征方面有更好的表现。与GCN类似，RGCN通过堆叠多层卷积网络聚合邻居节点特征。

将节点嵌入经过平均池化，得到图表示，计算方法为：

以上为完整的基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法流程，图2为本发明的方法组件示意图。

为了实现上述实施例，本发明还提出基于社会情感共鸣与关系图卷积网络的虚假新闻检测装置。

图3为本发明实施例提供的一种基于社会情感共鸣与关系图卷积网络的虚假新闻检测装置的结构示意图。

如图3所示，该基于社会情感共鸣与关系图卷积网络的虚假新闻检测装置包括：获取模块100，计算模块200，构建模块300，学习模块400，生成模块500，其中，

为达上述目的，本发明第三方面实施例提出了一种计算机设备，其特征在于，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时，实现如上所述的基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法。

为达上述目的，本发明第四方面实施例提出了一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如上所述的基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

尽管上面已经示出和描述了本发明的实施例，可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法，其特征在于，包括以下步骤：

通过情感评分模型计算所述历史评论文本信息的情感分值；

根据所述文本表示和所述情感分值构建多关系情感感知图；

获取待预测的新闻文本以及评论文本，基于所述情感图表示，生成所述待预测的新闻文本以及评论文本最终预测结果；

其中，所述通过情感评分模型计算所述历史评论文本信息的情感分值，包括：

通过下式计算评论的情感类型：

，

其中，scorer (·)表示情感评分模型，评论的情感类型按照如下计算方式推导：

，

式中，min表示情感评分模型的区间下限，对于Vader模型来说为−1，max描述区间上限，对于Vader模型来说为1，L是评分区间的长度，由计算得出；

其中，根据所述文本表示和所述情感分值构建多关系情感感知图，包括：

定义情感感知图为，其中/>是新闻节点及评论节点，表示节点之间的边，/> 是关系类型；将关系/>下的邻接矩阵表示为/>，它的初始值为：

，

对邻接矩阵进行拉普拉斯平滑操作，得到矩阵，计算方式为：

，

其中，表示/>的对角矩阵，I为单位矩阵；

所述基于所述多关系情感感知图，使用关系图卷积网络学习所述多关系情感感知图的情感图表示，包括：

定义表示节点特征矩阵，给定矩阵集和特征矩阵/>，/>表示第i个节点在第/>层的表示，计算公式如下所示：

，

其中，表示卷积层的序列号，/> 是第i个节点之间周围关系为r的邻居节点集合，/>表示第i个节点在第/>层的表示，相应地，/>表示第j个节点在第l层的表示，激活函数为ReLU；

设置模型输入为，其值为/>，/>是归一化常数，计算方法如下：

，

其中，，通过堆叠两个卷积层学习情感感知图潜在的特征交互，用表示节点嵌入，其中/>为网络的输出维度；

将节点嵌入经过平均池化，得到图表示，计算方法为：

。

2.根据权利要求1所述的方法，其特征在于，所述通过预训练Bert模型对历史新闻文本数据以及所述历史新闻文本数据对应的历史评论文本数据进行编码，获取文本表示，包括：

使用Bert模型对新闻进行编码，以所述Bert模型中cls位置对应的嵌入向量作为新闻表示，用表示，计算方法如下：

，

其中，表示新闻文本内容，由一连串词语/>组成，/>是/>的维度，代表预训练模型；

使用Bert模型对评论进行编码，以所述Bert模型中cls位置对应的表示作为评论的文本嵌入，用/>来表示，计算方法如下：

，

其中，是一条评论，由一组词语/>}组成。

3.根据权利要求1所述的方法，其特征在于，所述基于所述情感图表示，生成所述待预测的新闻文本以及评论文本最终预测结果，包括：

将情感感知的图表示作为输入，通过softmax层预测标签/>，/>为0表示新闻为假，相反则为真，其中/>可以按照如下方式推导：

，

其中，为偏置项，/>为网络需要学习的参数矩阵，通过最小化交叉熵损失函数来训练模型：

，

式中，表示整个模型中需要学习的参数，/>代表新闻的真实标签。

4.一种基于社会情感共鸣与关系图卷积网络的虚假新闻检测装置，其特征在于，包括以下模块：

生成模块，用于获取待预测的新闻文本以及评论文本，基于所述情感图表示，生成所述待预测的新闻文本以及评论文本最终预测结果；

通过下式计算评论的情感类型：

，

其中，表示/>的对角矩阵，I为单位矩阵；

，

将节点嵌入经过平均池化，得到图表示，计算方法为：

。

5.一种计算机设备，其特征在于，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时，实现如权利要求1-3中任一所述的基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法。

6.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-3任意一项所述的基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法。