CN115423050A

CN115423050A - 一种虚假新闻检测方法、装置、电子设备及存储介质

Info

Publication number: CN115423050A
Application number: CN202211372839.9A
Authority: CN
Inventors: 林舒源; 陈晓; 郭榆; 黄斐然; 支庭荣
Original assignee: Jinan University
Current assignee: Jinan University
Priority date: 2022-11-04
Filing date: 2022-11-04
Publication date: 2022-12-02

Abstract

本发明实施例涉及信息检测技术领域，公开了一种虚假新闻检测方法、装置、电子设备及存储介质，一种虚假新闻检测方法，其特征在于，包括：提取新闻中的图像和文本的特征，形成图像特征序列

和文本特征序列

；对图像特征序列

进行判别，得到图像预测值

；对文本特征序列

进行判别，得到文本预测值

；融合图像特征序列

和文本特征序列

，得到多模态特征序列

；对多模态特征序列

进行判别，得到多模态预测值

；融合图像特征预测值

、文本特征预测值

和多模态特征预测值

，得到最终的预测值

；通过对图像特征序列

与文本特征序列

进行计算，得到相似度

；优化特征提取参数。本发明能检测同时含有图像与文本的虚假新闻。

Description

一种虚假新闻检测方法、装置、电子设备及存储介质

技术领域

本发明涉及信息检测技术领域，具体涉及一种虚假新闻检测方法、装置、电子设备及存储介质。

背景技术

近年来，随着网络的普及，新闻在整个社会发展进程中起着至关重要的作用。人们通过新闻媒体了解世界各地发生的事情，新闻媒体在某种程度上也在影响着人们对各种事物的看法。正是因为新闻具有引导人们对某些事物的看法，所以有很多个人或组织通过发布虚假新闻来误导人们对某些事物的看法从而谋取自身的利益。

虚假新闻是指相关人员或组织为达到自身目的发表的错误新闻，会误导群众导致错误的舆论传播，对于政治、经济发展有很大的危害。虚假新闻检测的定义是给定新闻文章的新闻内容，社交上下文内容、以及外部知识，去判断新闻文章的真假。虚假新闻检测在及时遏制谣言的传播，维护国家秩序、社会稳定方面有着举足轻重的作用。

虚假新闻的内容由多种模态的新闻信息组成，大致可以分为图像信息和文本信息。对于多模态的新闻，虚假新闻检测过程中不仅要关注单个模态信息内容的真实性，还应该关注各个模态信息的相似性。

现有的人工检测方法效率低下，而且会消耗大量的人力物力。在面对高超的伪造技巧和海量的虚假信息，人工检测方法还难以取得快速高效的判识效果。因此需要自动对虚假新闻进行检测。

发明内容

针对所述缺陷，本发明实施例公开了一种虚假新闻检测方法、装置、电子设备及存储介质，不仅可以检测仅含有图像或仅含有文本的虚假新闻，还可以检测同时含有图像与文本的虚假新闻，提高虚假新闻检测的效率与准确性。

本发明实施例第一方面公开了一种虚假新闻检测方法，包括：

步骤S1：提取新闻中的图像和文本的特征，使用自注意力机制提取全局信息，形成图像特征序列

和文本特征序列

；

步骤S2：对图像特征序列

进行判别，得到图像预测值

；对文本特征序列

进行判别，得到文本预测值

；

步骤S3：采用交叉注意力机制融合图像特征序列

和文本特征序列

，得到多模态特征序列

；对多模态特征序列

进行判别，得到多模态预测值

；

步骤S4：融合图像特征预测值

、文本特征预测值

和多模态特征预测值

，得到最终的预测值

，通过最终的预测值

判断得到真实新闻与虚假新闻；

步骤S5：通过对图像特征序列

与文本特征序列

进行计算，得到相似度

；对比真实新闻与虚假新闻的相似度

结果，优化特征提取参数。

作为一种可选的实施方式，在本发明实施例第一方面中，所述步骤S1包括：

步骤S1.1：通过预训练的ResNet50深度神经网络提取新闻中图像的局部信息；

步骤S1.2：通过多头注意力机制提取新闻中图像的全局信息，得到图像的特征序列

；

步骤S1.3：对新闻中的文本进行词嵌入；

步骤S1.4：通过LSTM长短期记忆网络提取新闻文本的信息；

步骤S1.5：利用自注意力机制提取新闻文本的信息，得到文本的特征序列

。

作为一种可选的实施方式，在本发明实施例第一方面中，所述步骤S2包括：

步骤S2.1：将图像的特征序列

通过全连接层得到图像预测值

；

步骤S2.2：将文本的特征序列

通过全连接层得到文本的预测值

。

作为一种可选的实施方式，在本发明实施例第一方面中，所述步骤S3包括：

步骤S3.1：将图像特征序列

和文本特征序列

通过交叉自注意力机制进行融合，得到包含文本信息的图像特征序列

和包含图像信息的文本特征序列

；

步骤S3.2：拼接包含文本信息的图像特征序列

和包含图像信息的文本特征序列

，得到多模态特征序列

；

步骤S3.3：将多模态特征序列

通过全连接层得到多模态特征预测值

。

作为一种可选的实施方式，在本发明实施例第一方面中，所述步骤S4包括：

步骤S4.1：计算总预测值；

设置图像预测值

的权重参数为

，设置文本预测值

的权重参数为

；计算总预测值

；当新闻中只有图像时，所述总预测值

；当新闻中只有文本时，所述总预测值

；当输入数据同时含有图像和文本时，所述总预测值

。

作为一种可选的实施方式，在本发明实施例第一方面中，所述步骤S4还包括：

S4.2：计算分类；

根据S4.1得到的总预测值

以0.5为分类阈值得到最终的分类

；当

大于等于 0.5时，新闻分类结果

为虚假新闻，当

小于0.5时，新闻分类结果

为真实新闻。

作为一种可选的实施方式，在本发明实施例第一方面中，步骤S5.1：将图像特征序列

通过两个共享参数的全连接层，得到图像特征

；将文本特征序列

，通过两个共享参数的全连接层，得到文本特征

；

步骤S5.2：计算图像特征

与文本特征

之间的余弦相似度

。

本发明实施例第二方面公开一种虚假新闻检测预测的装置，包括：

图像特征提取与检测模块：用于提取图像特征及对图像特征序列进行判别；

文本特征提取与检测模块：用于提取文本特征及对文本特征序列进行判别；

多模态对比学习模块：用于将图像特征序列和文本特征序列进行对比学习；

多模态特征融合与检测模块：用于融合图像特征序列和文本特征序列与对多模态特征序列进行判别；

后期融合模块：用于融合图像特征预测值、文本特征预测值和多模态特征预测值，输出检测结果。

本发明实施例第三方面公开一种电子设备，包括：存储有可执行程序代码的存储器；与所述存储器耦合的处理器；所述处理器调用所述存储器中存储的所述可执行程序代码，用于执行本发明实施例第一方面公开的虚假新闻检测方法。

本发明实施例第四方面公开一种计算机可读存储介质，其存储计算机程序，其中，所述计算机程序使得计算机执行本发明实施例第一方面公开的虚假新闻检测方法。

与现有技术相比，本发明实施例具有以下有益效果：

本发明通过图像特征提取模块和文本特征提取模块分别提取图像和文本中的特征，将得到的特征序列分别通过图像检测模块和文本检测模块得到图像和文本的预测值，这一部分对于新闻中只有单模态信息尤为重要。接下来进行多模态对比学习，将图像特征和文字特征序列通过多模态对比学习模块，对于真实新闻的图像和文本之间的相似度尽可能大，而虚假新闻的相似度尽可能小，这个过程可以指导图像和文本特征的学习，优化特征提取效果。再将两个特征信息通过多模态特征融合模块，通过特征融合得到多模态特征序列，使其作为多模态特征检测模块的输入，得到多模态信息的预测值。最后将图像预测值、文本预测值与多模态预测值通过后期融合模块进行加权平均，得到最终的预测值和预测标签。本发明既解决了包含图像文本的虚假新闻的预测，也能满足仅有图像或仅有文本的情况，得到较为完备的虚假新闻检测模型，进一步提高虚假新闻检测的效率与准确性。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明的虚假新闻检测方法的流程示意图；

图2为本发明的虚假新闻检测方法的总体框架示意图；

图3是本发明的虚假新闻检测方法的步骤S1的流程示意图；

图4是本发明的虚假新闻检测方法的步骤S2的流程示意图；

图5是本发明的图像特征提取与检测模块的流程示意图；

图6是本发明的文本特征提取与检测模块的流程示意图；

图7是本发明的虚假新闻检测方法的步骤S3的流程示意图；

图8是本发明的虚假新闻检测方法的步骤S4的流程示意图；

图9是本发明的多模态特征融合与检测模块的流程示意图；

图10是本发明的虚假新闻检测方法的步骤S5的流程示意图；

图11是本发明的多模态对比学习模块的流程示意图；

图12是本发明的一种虚假新闻检测装置的结构示意图；

图13是本发明提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书中的术语“第一”、“第二”、“第三”、“第四”等是用于区别不同的对象，而不是用于描述特定顺序。本发明实施例的术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，示例性地，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例一

请参阅图1-11，图1是本发明实施例公开的一种虚假新闻检测方法的流程示意图，该方法包括，

和文本特征序列

；

步骤S2：对图像特征序列

进行判别，得到图像预测值

；对文本特征序列

进行判别，得到文本预测值

。

步骤S3：采用交叉注意力机制融合图像特征序列

和文本特征序列

，得到多模态特征序列；对多模态特征序列进行判别，得到多模态预测值

。

步骤S3：融合图像特征预测值

、文本特征预测值

和多模态特征预测值

，得到最终的预测值

，通过最终的预测值

判断得到真实新闻与虚假新闻。

步骤S5：通过对图像特征序列

与文本特征序列

进行计算，得到相似度

；对比真实新闻与虚假新闻的相似度

结果，优化特征提取参数。

本实施例的虚假新闻检测方法，通过分别提取图像和文本中的特征，将得到的图像特征序列和文本特征序列分别通过图像检测模块和文本检测模块得到图像和文本的预测值，这一部分对于新闻中只有单模态信息（即仅有图像或仅有文字的信息）的真实性的预测起到重要作用，可以提高单模态信息检测的效率与准确度。再将图像特征序列和文本特征序列通过多模态特征融合模块，通过特征融合得到多模态特征序列，得到多模态信息的预测值。最后将图像预测值、文本预测值与多模态预测值通过后期融合模块进行加权平均，得到最终的预测值和与检测结果，实现提高多模态信息（即同时包括图像与文字的信息）检测的准确度与效率的目的。在此基础上继续进行多模态对比学习，将图像特征和文字特征序列进行对比得到相似度，对于真实新闻的图像和文本之间的相似度尽可能大，而虚假新闻的相似度尽可能小，这个过程可以指导图像和文本特征的学习对特征提取进行优化。

具体的，步骤S1包括：

将新闻中的图像作为ResNet50深度神经网络的数据输入，通过ResNet50网络提取输入图像的特征得到下采样后的特征图。

步骤S1.2：通过多头注意力机制(Multi-Head Attention)提取新闻中图像的全局信息；

如图5所示，在特征图上引入多头注意力机制(Multi-Head Attention)，使其能够提取全局信息，对特征图进行序列化，得到图像的特征序列

。

其中，

代表序列化后的图像特征，

分别代表序列化后的L个特征图块经过多头注意力模块之后得到的L个特征。

步骤S1.3：对新闻中的文本进行词嵌入（Embedding Layer）；

如图6所示，将新闻中的文本单词通过预训练的Word2Vec算法进行向量化得到词向量，从而得到整个文本的向量序列。

步骤S1.4：通过LSTM(Long Short-Term Memory)长短期记忆网络提取文本信息；

如图6所示，将S1.3得到的文本向量序列输入到LSTM中提取文本信息。在LSTM模型内部中，通过门控状态来控制传输状态，记住需要长时间记忆的，忘记不重要的信息。本步骤起到初步提取文本信息的作用。

步骤S1.5：利用自注意力机制(Self-attention)提取信息。

如图6所示，当文本较长时，仅仅使用LSTM，对文本特征提取效果受限，使用自注意力能更好地提取文本的上下文信息，得到文本的特征序列

。

其中，

代表文本的特征序列，

分别代表L个词向量通过LSTM以及多头注意力模块之后得到的L个文本特征。

具体的，步骤S2包括：

步骤S2.1：通过全连接层（FC Layer）得到图像预测值；

如图5所示，将步骤S1.2得到的图像特征序列

通过两个全连接层（FC Layer）得到图像特征序列

，然后通过最后一层全连接层（FC Layer）检测头得到预测值

并将其通过Sigmoid函数归一化到[0,1]之间，得到图像预测值

。

其中

是图像全连接层（FC Layer）的权重，

是步骤S1.2得到图像特征序列

通过两个全连接层（FC Layer）之后的特征序列，

是偏置项。

步骤S2.2：通过全连接层（FC Layer）得到文本的预测值；

如图6所示，将步骤S1.5得到的文本特征序列

通过两个全连接层（FC Layer）得到文本特征序列

，然后通过最后一层全连接层（FC Layer）检测头得到预测值

并将其通过Sigmoid函数归一化到[0,1]之间，得到文本预测值

。

其中

是文本全连接层（FC Layer）的权重，

是步骤S1.5得到的文本特征序列

通过两个全连接层（FC Layer）之后的特征序列，

是偏置项。

具体的，步骤S3包括：

步骤S3.1：通过交叉自注意力机制(cross attention)融合多模态特征；

如图9所示，将步骤S1.2和步骤S1.5得到的图像特征序列

和文本特征序列

，通过交叉自注意力机制(cross attention)融合图像特征序列

和文本特征序列

，得到包含文本信息的图像特征序列

和包含图像信息的文本特征序列

。

步骤S3.2：拼接包含文本信息的图像特征序列

和包含图像信息的文本特征序列

，得到多模态特征序列

。

步骤S3.3：通过全连接层（FC Layer）得到多模态特征预测值；

将多模态特征序列

通过两层全连接层（FC Layer）得到多模态特征序列

，然后通过最后一层全连接层（FC Layer）检测头得到预测值

并将其通过Sigmoid函数归一化到[0,1]之间，得到多模态特征预测值

。

其中

是最后一层全连接层（FC Layer）的权重；

是将多模态特征序列

通过两层全连接层（FC Layer）得到多模态特征序列，

是偏置项。

具体的，步骤S4包括：

步骤S4.1：计算总预测值；

设置图像预测值

的权重参数为

，设置文本预测值

的权重参数为

。计算总预测值

。

当新闻中只有图像时，预测值为上式中的(2)，即

；当新闻中只有文本时，预测值为上式中的(3)，即

；当输入数据同时含有图像和文本时，预测值为上式中的(1)，即

。

本实施例对于新闻的真实性的总预测值

的计算充分考虑了不同输入数据的情况，即可应对多种形式的新闻，分别是只有文本的新闻，只有图像的新闻以及既包含图像又包含文本的新闻。

S4.2：计算分类

根据S4.1得到的总预测值

以0.5为分类阈值得到最终的分类

。当

大于等于 0.5时，将该新闻归类为虚假新闻，当

小于0.5时，将该新闻归类为真实新闻。

具体的，步骤S5包括：

步骤S5.1：通过共享连接层得到图像特征

与文本特征

；

如图11所示，将步骤S1.2得到的图像特征序列

通过两个共享参数的全连接层（FC Layer），得到图像特征

；

将步骤S1.5得到的文本特征序列

，通过两个共享参数的全连接层（FC Layer），得到文本特征

。

其中，

代表两个全连接层（FC Layer）之后得到的图像特征，

代表通过两个全连接层（FC Layer）之后得到的文本特征。

是步骤S1.2得到的图像特征序列，

是步骤 S1.5得到的文本特征序列，

是全连接层（FC Layer）的权重，b是偏置项。

步骤S5.2：计算图像特征

与文本特征

之间的余弦相似度

；

通过余弦相似度

计算图像特征

和文本特征

之间的相似度，正样本对之间相似度应尽可能大，负样本对之间相似度应尽可能小，从而提高特征提取模块的提取效果，计算公式如下：

其中

和

分别代表图像特征和文本特征。通过这种对比学习的方法进一步对特征提取参数进行优化，不断提高特征提取的准确性与效率。

实施例二

请参阅图12，图12是本发明实施例公开的虚假新闻检测的装置的结构示意图。如图12所示，该虚假新闻检测装置包括：图像特征提取与检测模块、文本特征提取与检测模块、多模态对比学习模块、多模态特征融合与检测模块、后期融合模块。

后期融合模块：用于融合图像特征预测值、文本特征预测值和多模态特征预测值，输出最终的预测值结果。

本发明实施例的虚假新闻检测装置，通过图像特征提取模块和文本特征提取模块分别提取图像和文本中的特征，将得到的特征序列分别通过图像检测模块和文本检测模块得到图像和文本的预测值，这一部分对于新闻中只有单模态信息尤为重要。接下来进行多模态对比学习，将图像特征和文字特征序列通过多模态对比学习模块，对于真实新闻的图像和文本之间的相似度尽可能大，而虚假新闻的相似度尽可能小，这个过程可以指导图像和文本特征的学习。再将图像特征和文字特征信息通过多模态特征融合模块，通过特征融合得到多模态特征序列，使其作为多模态特征检测模块的输入，得到多模态信息的预测值。最后将图像预测值、文本预测值与多模态预测值通过后期融合模块进行加权平均，得到最终的预测值和预测标签。本实施例既解决了包含图像文本的虚假新闻的预测，也能满足仅有图像或仅有文本的情况，得到较为完备的虚假新闻检测装置。

实施例三

请参阅图13，图13是本发明实施例公开的一种电子设备的结构示意图。电子设备可以是计算机以及服务器等，当然，在一定情况下，还可以是手机、平板电脑以及监控终端等智能设备，以及具有处理功能的图像采集装置。如图13所示，该电子设备可以包括：

存储有可执行程序代码的存储器；

与存储器耦合的处理器；

其中，处理器调用存储器中存储的可执行程序代码，执行实施例一中的虚假新闻检测方法中的部分或全部步骤。

本发明实施例公开一种计算机可读存储介质，其存储计算机程序，其中，该计算机程序使得计算机执行实施例一中的虚假新闻检测方法中的部分或全部步骤。

本发明实施例还公开一种计算机程序产品，其中，当计算机程序产品在计算机上运行时，使得计算机执行实施例一中的虚假新闻检测方法中的部分或全部步骤。

本发明实施例还公开一种应用发布平台，其中，应用发布平台用于发布计算机程序产品，其中，当计算机程序产品在计算机上运行时，使得计算机执行实施例一中的虚假新闻检测方法中的部分或全部步骤。

在本发明的各种实施例中，应理解，所述各过程的序号的大小并不意味着执行顺序的必然先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物单元，即可位于一个地方，或者也可以分布到多个网络单元上。可根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本发明各实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。所述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可获取的存储器中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分，可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储器中，包括若干请求用以使得一台计算机设备（可以为个人计算机、服务器或者网络设备等，具体可以是计算机设备中的处理器）执行本发明的各个实施例所述方法的部分或全部步骤。

在本发明所提供的实施例中，应理解，“与A对应的B”表示B与A相关联，根据A可以确定B。但还应理解，根据A确定B并不意味着仅仅根据A确定B，还可以根据A和/或其他信息确定B。

本领域普通技术人员可以理解所述实施例的各种方法中的部分或全部步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质包括只读存储器（Read-Only Memory，ROM）、随机存储器（Random Access Memory，RAM）、可编程只读存储器（Programmable Read-only Memory，PROM）、可擦除可编程只读存储器（Erasable Programmable Read-Only Memory，EPROM）、一次可编程只读存储器（One-time Programmable Read-Only Memory，OTPROM）、电子抹除式可复写只读存储器（Electrically-Erasable Programmable Read-Only Memory，EEPROM）、只读光盘（CompactDisc Read-Only Memory，CD-ROM）或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

以上对本发明实施例公开的虚假新闻检测方法、装置、电子设备及存储介质进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。