CN117763147A

CN117763147A - 基于实体-名词图和图卷积网络的虚假新闻检测方法及系统

Info

Publication number: CN117763147A
Application number: CN202311786968.7A
Authority: CN
Inventors: 朱琳琳; 孙鹤立; 黄小勇; 伊庭洲; 何亮
Original assignee: Xian Jiaotong University
Current assignee: Xian Jiaotong University
Priority date: 2023-12-22
Filing date: 2023-12-22
Publication date: 2024-03-26

Abstract

基于实体‑名词图和图卷积网络的虚假新闻检测方法及系统，包括：利用预训练语言模型BERT和GRU获取新闻文本的全局表征；利用命名实体识别从新闻文本中提取出实体、名词，构造为实体‑名词图；利用图卷积网络聚合实体‑名词图中实体和名词的特征，获取新闻文本的细粒度表征；将全局表征和细粒度表征拼接在一起送入检测器进行检测，输出新闻的检测结果。本发明深入理解新闻文本的语义关系，通过构造实体‑名词图，有效提高了虚假新闻检测的准确度、精度、F1值及召回率。

Description

基于实体-名词图和图卷积网络的虚假新闻检测方法及系统

技术领域

本发明涉及自然语言处理和深度学习领域，特别是涉及基于实体-名词图和图卷积网络的虚假新闻检测方法及系统。

背景技术

现有传统的基于机器学习的虚假新闻检测方法需要特征工程。根据模型所使用的特征，这些方法可大致分为三类：语言特征、时间结构特征和混合特征。虽然这些传统的机器学习方法取得了很好的结果，但它们严重依赖于费力的特征工程。随着深度学习在各个领域的发展，基于深度学习的虚假新闻检测方法被提出并引起了人们的广泛关注。虽然现有的基于新闻内容和外部知识的高级特征表示的深度学习方法在检测假新闻方面取得了巨大的成功，但它们忽略了新闻内容本身实体与名词之间的联系，影响虚假新闻检测的效果。

发明内容

本发明的目的在于提供基于实体-名词图和图卷积网络的虚假新闻检测方法及系统，以解决忽略了新闻内容本身实体与名词之间的联系，影响虚假新闻检测的效果的问题。

为实现上述目的，本发明采用以下技术方案：

第一方面，本发明提供基于实体-名词图和图卷积网络的虚假新闻检测方法，包括：

利用预训练语言模型BERT和GRU获取新闻文本的全局表征；

利用命名实体识别从新闻文本中提取出实体、名词，构造为实体-名词图；

利用图卷积网络来聚合实体-名词图中实体和名词的特征，获取新闻文本的细粒度表征；

将全局表征和细粒度表征拼接在一起送入检测器进行检测，输出新闻的检测结果。

可选的，利用预训练语言模型BERT和GRU获取新闻文本的全局表征：

选择适用于任务的预训练BERT模型，对每篇新闻文本进行预处理，获取新闻文本的隐藏层表示，利用GRU获取上下文编码信息作为新闻文本的全局表征。

可选的，利用命名实体识别从新闻文本中提取出实体、名词：

对于中文文本使用Hanlp工具，英文文本使用NLTK工具，利用词法标注获取单词的词性，获取名词列表和实体列表；从名词列表中去除实体和重复性的名词，得到不包含实体的名词列表。

可选的，构造为实体-名词图：同一句话中的实体存在关联，图结构中用一条边表示他们之间的关系，同样的，同一句话中的实体和名词之间也用边来连接，认为同一句话中的不同的名词之间没有必然的联系，如果他们有共同的实体，再通过共同的实体进行连接，实现实体-名词图的构建。

可选的，利用图卷积网络来聚合实体-名词图中实体和名词的特征，获取新闻文本的细粒度表征：

将实体-名词图表示为邻接矩阵，确保节点表示实体和名词，边表示他们之间的关系，使用多层图卷积，通过节点的邻居信息逐步聚合实体和名词的特征，在每个卷积层中，利用节点的邻居信息更新节点的特征表示，逐渐融合实体和名词的语义信息。

可选的，具体的：

使用BERT对节点进行编码，并对其进行平均池化作为节点语义表征，即图卷积网络的初始特征；然后利用多层卷积网络捕获实体-名词图的结构信息并聚合特征；令所有的节点表示为H∈R^n×d，n为G的节点数量；H中每一行为h_i，为节点V_i的特征表示；将图G的邻接矩阵表示为A∈R^(n×n)，度矩阵表示为D∈R^(n×n)，则多层GCN的公式如下：

表示节点由j层GCN计算得到的节点V_i的特征表示，W_j是第j层的权重矩阵，σ是Sigmoid激活函数；/>是节点的初始特征表示；

通过m层GCN，得到基于实体-名词图的节点特征表示H^(m)；图G的表示R计算公式为：

W是权重矩阵，b是偏置向量，将R作为新闻文本细粒度表征。

可选的，将全局表征和细粒度表征拼接在一起送入检测器进行检测，输出新闻的检测结果：

将全局表征和细粒度表征拼接形成新的特征表示，将拼接后的特征送入多层感知机进行分类，并输出该新闻的检测结果，指示新闻是否为虚假新闻：

F＝σ(W₃[W₁R，W₂B]+b)

W₁，W₂，W₃是权重矩阵，b是偏置向量，σ是Sigmoid激活函数；将F送入分类器中，利用交叉熵来衡量分类损失。

第二方面，本发明提供基于实体-名词图和图卷积网络的虚假新闻检测系统，包括：

全局表征获取模块，用于利用预训练语言模型BERT和GRU获取新闻文本的全局表征；

图构造模块，用于利用命名实体识别从新闻文本中提取出实体、名词，构造为实体-名词图；

细粒度表征获取模块，用于利用图卷积网络来聚合实体-名词图中实体和名词的特征，获取新闻文本的细粒度表征；

检测输出模块，用于将全局表征和细粒度表征拼接在一起送入检测器进行检测，输出新闻的检测结果。

第三方面，本发明提供一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现基于实体-名词图和图卷积网络的虚假新闻检测方法的步骤。

第四方面，本发明提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现基于实体-名词图和图卷积网络的虚假新闻检测方法的步骤。

与现有技术相比，本发明有以下技术效果：

本发明基于新闻文本，深入探究语义之间的关系，通过文本语义理解新闻内容，并帮助检测新闻的真实性。该方法取得了不错的效果，与现有的虚假新闻检测方法相比，表现最优。(1)BERT是一个强大的语言模型，它利用预训练来学习丰富的语义表示，使其能够理解和编码新闻文本中的上下文关系。(2)GAT是一个用于捕获长篇新闻文章中信息的模型。它利用注意力机制来关注图的重要部分，以进行细粒度的假新闻分类。(3)GCN用于对图的信息进行聚合，得到的图向量通过全连通层进行假新闻预测。本发明深入理解新闻文本的语义关系，通过构造实体-名词图，有效提高了虚假新闻检测的准确度、精度、F1值及召回率。

附图说明

图1为基于实体-名词图和图卷积网络的虚假新闻检测方法的流程图。

图2为基于实体-名词图和图卷积网络的虚假新闻检测方法的总体框架图。

图3为实体-名词图的构造过程。

具体实施方式

以下结合附图对本发明进一步说明：

请参阅图1至图3，基于实体-名词图和图卷积网络的虚假新闻检测方法，包括：

利用预训练语言模型BERT和GRU获取新闻文本的全局表征；

具体的：

利用预训练语言模型BERT和GRU获取新闻文本的全局表征；

首先选择适用于任务的预训练BERT模型，对每篇新闻文本进行预处理，获取新闻文本的隐藏层表示，利用GRU获取上下文编码信息作为新闻文本的全局表征。

利用命名实体识别从新闻文中提取实体和名词，并将其构造为实体-名词图；

对于中文文本使用Hanlp工具，英文文本使用NLTK工具，利用词法标注获取单词的词性，找出名词列表。实体一般是名词，从名词列表中去除实体和重复性的名词，得到不包含实体的名词列表。

实体-名词图构建规则：认为同一句话中的实体存在关联，图结构中用一条边表示他们之间的关系。同样的，同一句话中的实体和名词之间也用边来连接。认为同一句话中的不同的名词之间没有必然的联系，如果他们有共同的实体，再通过共同的实体进行连接。从而实现实体-名词图的构建。

利用图卷积网络聚合图中实体-名词的特征，获取新闻文本细粒度表征；

将实体-名词图表示为邻接矩阵，确保节点表示实体和名词，边表示他们之间的关系。使用多层图卷积层，通过节点的邻居信息逐步聚合实体和名词的特征，以获取更丰富的表示。在每个图卷积层中，利用节点的邻居信息更新节点的特征表示，逐渐融合实体和名词的语义信息。

拼接新闻文本全局表征和细粒度表征，送入检测器进行检测。

将全局表征和细粒度表征进行拼接，形成新的特征表示。将拼接后的特征送入多层感知机进行分类，并输出该新闻的检测结果，指示新闻是否为虚假新闻。

如图1，为本发明实施例提供的基于实体-名词图和图卷积网络的虚假新闻检测方法，本发明的核心思想在于，提出一个有效检测虚假新闻的方法。该方法从新闻文本角度进行研究，深入分析新闻文本语义信息，理解其语义之间的相互关系，帮助判断新闻是否真实。

步骤S1使用预训练模型BERT和GRU提取新闻文本的全局表征；步骤S2从新闻文本中识别实体、名词，并按照一定的规则构造为实体-名词图；步骤S3利用图卷积网络聚合实体-名词图细粒度特征；最后步骤S4将步骤S1和S3得到的特征拼接到一起，并送入检测器进行虚假新闻检测，输出检测结果，整体框架如图2。

具体包括以下步骤：

S1使用预训练模型BERT和GRU提取新闻文本的全局表征。

全局表征模块是为了获取新闻内容的完整的语义信息，得到相对较为全面的新闻文本的上下文表征。采用BERT获取新闻文本进行编码，并对编码进行平均池化得到全局特征B。

B＝GRU(w₁，w₂，...w_n)

w₁，w₂，...w_n是新闻文本的单词序列，n为序列的长度。

S2从新闻文本中识别实体、名词，并按照一定的规则构造为实体-名词图。

首先，中文数据集使用Hanlp，英文数据集使用NLTK工具，从新闻文本中提取实体和名词，得到与之对应的实体列表和名词列表。由于实体一般是名词，所以从名词列表中去除实体和重复性的名词，得到不包含实体的名词列表。

然后设置实体-名词图的构建规则，认为同一句话中的实体存在关联，图结构中用一条边表示他们之间的关系。同样的，同一句话中的实体和名词之间也用边来连接。同一句话中的不同的名词，被认为他们之间没有必然的联系，如果他们有共同的实体，再通过共同的实体进行连接。

最后根据实体-名词图构建规则，将实体和名词组成为实体-名词图。

S3利用图卷积网络聚合实体-名词图特征，获取新闻文本的细粒度表征。

细粒度表征模块目的是获取新闻内容语义级和知识级信息。首先，使用BERT对节点进行编码，并对其进行平均池化作为节点语义表征，即图卷积网络的初始特征。然后利用多层卷积网络捕获实体-名词图的结构信息并聚合特征。令所有的节点表示为H∈R^n×d，n为G的节点数量。H中每一行为h_i，为节点V_i的特征表示。将图G的邻接矩阵表示为A∈R^(n×n)，度矩阵表示为D∈R^(n×n)，则多层GCN的公式如下：

表示节点由j层GCN计算得到的节点V_i的特征表示，W_j是第j层的权重矩阵，σ是激活函数。/>是节点的初始特征表示。

通过m层GCN，得到基于实体-名词图的节点特征表示H^(m)。我们认为图G的表示应该来源于其每一个节点的表示。因此，图G的表示R计算公式为：

W是权重矩阵，b是偏置向量，将R作为新闻文本细粒度表征。

S4将步骤S1和步骤S3得到的特征拼接到一起，并送入检测器进行虚假新闻检测，输出检测结果。

预测模块目的是检测新闻是否是真实的。通过步骤1获得新闻内容的全局表征，步骤3得到新闻内容的细粒度表征，将两者拼接起来通过一个全连接层判断新闻的真实性。

F＝σ(W₃[W₁R，W₂B]+b)

W₁，W₂，W₃是权重矩阵，b是偏置向量，σ是Sigmoid激活函数。我们将F送入分类器中，利用交叉熵来衡量分类损失。

实验环境及参数设置：训练在Linux系统、CUDA 10.2版、Pytorch 1.12.0版、Python 3.8版和NVIDIA GeForce RTX 3090下运行、Python版本3.8和NVIDIA GeForce RTX3090。我们使用早期停止机制来训练模型，并学习率设置为le-4，Dropout为0.1，batchsize16。此外，使用准确率(Acc)、F1分数(F1)、精度(Pre)和召回率(Rec)作为评价指标。

表1给出了四种对比方法在相同数据集下的实验结果，实验表明了基于实体-名词图和图卷积网络方法的有效性。

表1：与现有方法结果比较。

从整体上看，本发明方法在英文数据集上和中文数据集上均表现最优，取得了不同程度的提升，达到目前最优效果。

本发明再一实施例中，提供基于实体-名词图和图网络的虚假新闻检测系统，能够用于实现上述的基于实体-名词图和图卷积网络的虚假新闻检测方法，具体的，该系统包括：

特征获取模块，用于利用预训练语言模型BERT和GRU获取新闻文本的全局表征；

拼接输出模块，用于将全局表征和细粒度表征拼接在一起送入检测器进行检测，输出新闻的检测结果。

本发明实施例中对模块的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，另外，在本发明各个实施例中的各功能模块可以集成在一个处理器中，也可以是单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。

本发明再一个实施例中，提供了一种计算机设备，该计算机设备包括处理器以及存储器，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器用于执行所述计算机存储介质存储的程序指令。处理器可能是中央处理单元(CentralProcessing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital SignalProcessor、DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable GateArray，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等，其是终端的计算核心以及控制核心，其适于实现一条或一条以上指令，具体适于加载并执行计算机存储介质内一条或一条以上指令从而实现相应方法流程或相应功能；本发明实施例所述的处理器可以用于基于实体-名词图和图卷积网络的虚假新闻检测方法的操作。

本发明再一个实施例中，本发明还提供了一种存储介质，具体为计算机可读存储介质(Memory)，所述计算机可读存储介质是计算机设备中的记忆设备，用于存放程序和数据。可以理解的是，此处的计算机可读存储介质既可以包括计算机设备中的内置存储介质，当然也可以包括计算机设备所支持的扩展存储介质。计算机可读存储介质提供存储空间，该存储空间存储了终端的操作系统。并且，在该存储空间中还存放了适于被处理器加载并执行的一条或一条以上的指令，这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是，此处的计算机可读存储介质可以是高速RAM存储器，也可以是非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器。可由处理器加载并执行计算机可读存储介质中存放的一条或一条以上指令，以实现上述实施例中有关基于实体-名词图和图卷积网络的虚假新闻检测方法的相应步骤。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

最后应当说明的是：以上实施例仅用以说明本发明的技术方案而非对其限制，尽管参照上述实施例对本发明进行了详细的说明，所属领域的普通技术人员应当理解：依然可以对本发明的具体实施方式进行修改或者等同替换，而未脱离本发明精神和范围的任何修改或者等同替换，其均应涵盖在本发明的权利要求保护范围之内。

Claims

1.基于实体-名词图和图卷积网络的虚假新闻检测方法，其特征在于，包括：

利用预训练语言模型BERT和GRU获取新闻文本的全局表征；

2.根据权利要求1所述的基于实体-名词图和图卷积网络的虚假新闻检测方法，其特征在于，利用预训练语言模型BERT和GRU获取新闻文本的全局表征：

3.根据权利要求1所述的基于实体-名词图和图卷积网络的虚假新闻检测方法，其特征在于，利用命名实体识别从新闻文本中提取出实体、名词：

4.根据权利要求3所述的基于实体-名词图和图卷积网络的虚假新闻检测方法，其特征在于，构造为实体-名词图：同一句话中的实体存在关联，图结构中用一条边表示他们之间的关系，同样的，同一句话中的实体和名词之间也用边来连接，认为同一句话中的不同的名词之间没有必然的联系，如果他们有共同的实体，再通过共同的实体进行连接，实现实体-名词图的构建。

5.根据权利要求1所述的基于实体-名词图和图卷积网络的虚假新闻检测方法，其特征在于，利用图卷积网络来聚合实体-名词图中实体和名词的特征，获取新闻文本的细粒度表征：

6.根据权利要求5所述的基于实体-名词图和图卷积网络的虚假新闻检测方法，其特征在于，具体的：

使用BERT对节点进行编码，并对其进行平均池化作为节点语义表征，即图卷积网络的初始特征；然后利用多层卷积网络捕获实体-名词图的结构信息并聚合特征；令所有的节点表示为H∈R^n×d,n为G的节点数量；H中每一行为h_i，为节点V_i的特征表示；将图G的邻接矩阵表示为A∈R^(n×n)，度矩阵表示为D∈R^(n×n)，则多层GCN的公式如下：

表示节点由j层GCN计算得到的节点V_i的特征表示，W_j是第j层的权重矩阵，σ是激活函数；/>是节点的初始特征表示；

W是权重矩阵，b是偏置向量，将R作为新闻文本细粒度表征。

7.根据权利要求1所述的基于实体-名词图和图卷积网络的虚假新闻检测方法，其特征在于，将全局表征和细粒度表征拼接在一起送入检测器进行检测，输出新闻的检测结果：

F＝σ(W₃[W₁R,W₂B]+b)

W₁,W₂,W₃是权重矩阵，b是偏置向量，σ是Sigmoid激活函数；将F送入分类器中，利用交叉熵来衡量分类损失。

8.基于实体-名词图和图网络的虚假新闻检测系统，其特征在于，包括：

9.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述基于实体-名词图和图卷积网络的虚假新闻检测方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于实体-名词图和图卷积网络的虚假新闻检测方法的步骤。