CN113032525A

CN113032525A - 虚假新闻检测方法、装置、电子设备以及存储介质

Info

Publication number: CN113032525A
Application number: CN202110311653.1A
Authority: CN
Inventors: 廖好; 彭佳豪; 刘启鑫; 周明洋; 王毅; 陆克中; 毛睿
Original assignee: Shenzhen University
Current assignee: Shenzhen University
Priority date: 2021-03-23
Filing date: 2021-03-23
Publication date: 2021-06-25

Abstract

本申请涉及一种虚假新闻检测方法、装置、电子设备以及存储介质，该虚假新闻检测方法包括：获取待检测新闻的文本内容以及所述待检测新闻对应的评论信息和用户信息；利用文本内容编码模块对所述文本内容的第一句子进行编码，得到句子特征向量；所述第一句子是所述文本内容包含的至少两个句子中的任一个；利用用户评论联合编码模块对所述评论信息和用户信息进行编码，得到用户评论联合特征矩阵；将所述句子特征向量和所述用户评论联合特征矩阵输入联合注意力模块，得到所述待检测新闻的检测结果。本申请实施例结合新闻的文本内容、用户信息以及评论信息检测虚假新闻，提高虚假新闻检测的准确率。

Description

虚假新闻检测方法、装置、电子设备以及存储介质

技术领域

本申请涉及自然语言处理技术领域，尤其涉及一种虚假新闻检测方法、装置、电子设备以及存储介质。

背景技术

长期以来，虚假信息一直被认为是一个严重的社会问题，其中虚假新闻是最具代表性的问题之一。更糟糕的是，高度发达的社交媒体使得虚假新闻广泛传播，给人类生活的各个方面带来了实质性的伤害。假新闻往往是指借新闻报道传播的虚假的、煽动性的信息。在这个自媒体快速发展的时代，虚假新闻在社交网络上很常见。

目前，一般的虚假新闻检测方法是通过深度学习算法结合新闻的文本内容检测新闻的真实性。然而，在社交媒体上的新闻的文本内容比较短，而且碎片化，从而导致新闻携带的信息不全面、内在逻辑不完整。因此通过新闻的文本内容检测虚假新闻的方法存在局限性，使得虚假新闻检测的准确率不高。

发明内容

鉴于上述现有技术的不足，本申请的目的在于提供一种虚假新闻检测方法、装置、电子设备以及存储介质，旨在解决虚假新闻检测的准确率不高的问题。

第一方面，本申请实施例提供一种虚假新闻检测方法，包括：

获取待检测新闻的文本内容以及所述待检测新闻对应的评论信息和用户信息；

利用文本内容编码模块对所述文本内容的第一句子进行编码，得到句子特征向量；所述第一句子是所述文本内容包含的至少两个句子中的任一个；

利用用户评论联合编码模块对所述评论信息和用户信息进行编码，得到用户评论联合特征矩阵；

将所述句子特征向量和所述用户评论联合特征矩阵输入联合注意力模块，得到所述待检测新闻的检测结果。

在本申请实施例中，利用文本内容编码模块获取待检测新闻的文本内容中的有效信息，利用用户评论联合编码模块获取评论信息和用户信息中的有效信息，利用联合注意力模块结合文本内容、评论信息以及用户信息检测待检测新闻是否为虚假新闻，提高虚假新闻检测的准确率。

在第一方面的一种实施方式中，所述文本内容编码模块包括单词编码模块和句子编码模块，所述利用文本内容编码模块对所述文本内容的第一句子进行编码，得到句子特征向量，包括：

利用所述单词编码模块学习的单词上下文信息对所述第一句子的第一单词进行编码，得到单词特征向量；所述第一单词是所述第一句子包含的至少两个单词中的任一个；

利用所述句子编码模块学习的句子上下文信息和所述单词特征向量对所述第一句子进行编码，得到所述句子特征向量。

在本申请实施例中，结合单词上下文信息对第一单词进行编码，使得单词特征向量能够更好的表示第一单词的特征，结合句子上下文信息对第一句子进行编码，使句子特征向量能够更好的表示第一句子的语音特征，提高虚假新闻检测的准确率。

在第一方面的一种实施方式中，所述单词编码模块包括统一预训练语言模型，所述句子编码模块包括门控循环单元神经网络模型。

在第一方面的一种实施方式中，所述用户评论联合编码模块包括异构图模块和图神经网络模块；所述利用用户评论联合编码模块对所述评论信息和用户信息进行编码，得到用户评论联合特征矩阵，包括：

利用所述异构图模块构建与所述评论信息和用户信息对应的异构图，所述异构图包括多个用户节点、多个评论节点以及所述多个用户节点和所述多个评论节点之间的联系；

利用所述图神经网络模块对所述多个用户节点和所述多个评论节点进行编码，得到用户特征矩阵和评论特征矩阵；

拼接所述用户特征矩阵和所述评论特征矩阵，得到所述用户评论联合特征矩阵。

在本申请实施例中，通过构建与用户信息和评论信息的异构图，获取用户节点与评论节点的联系，挖掘待检测新闻对应的评论信息和用户信息中的有效信息。

在第一方面的一种实施方式中，所述图神经网络模块包括节点特征编码模块、节点聚合模块以及邻接节点混合模块，所述利用所述图神经网络模块对所述多个用户节点和所述多个评论节点进行编码，得到用户特征矩阵和评论特征矩阵，包括：

利用所述节点特征编码模块对第一节点进行编码，得到所述第一节点对应的节点向量；所述第一节点是所述多个用户节点中的任一个或者所述多个评论节点中的任一个；

获取所述第一节点的邻接节点；

确定所述邻接节点中所述第一节点的同类邻接节点和非同类邻接节点；

利用所述节点聚合模块对所述同类邻接节点进行聚合，得到所述第一节点对应的聚合特征向量，以及所述同类邻接节点对应的聚合特征向量；

利用所述节点聚合模块对所述非同类邻接节点进行聚合，得到所述非同类邻接节点对应的聚合特征向量；

利用所述邻接节点混合模块结合所述第一节点对应的聚合特征向量、所述同类邻接节点对应的聚合特征向量以及所述非同类邻接节点对应的聚合特征向量，得到所述第一节点对应的节点特征向量；

在所述第一节点是所述多个用户节点中的任一个的情况下，所述用户特征矩阵包含所述第一节点对应的特征向量，在所述第一节点是所述多个评论节点中的任一个的情况下，所述评论特征矩阵包含所述第一节点对应的特征向量。

在本申请实施例中，利用节点聚合模块获取同一类型邻接节点之间的相似特征，得到第一节点的聚合特征向量，通过邻接节点混合模块结合第一节点的两种不同类型邻接节点的特征信息，得到第一节点对应的节点特征向量，使得第一节点对应的节点特征向量更好的表示第一节点的特征。

在第一方面的一种实施方式中，所述第一节点包括属性信息与文本信息；所述节点特征编码模块包括属性编码模块和文本编码模块；所述利用所述节点特征聚合模块对第一节点进行编码，得到所述第一节点对应的节点向量，包括：

利用所述属性编码模块对所述属性信息进行编码，得到所述第一节点对应的属性向量；

利用所述文本编码模块对所述文本信息进行编码，得到所述第一节点对应的文本向量；

对所述属性向量与所述文本向量进行处理，得到所述节点向量。

在本申请实施例中，结合第一节点的文本信息和属性信息对第一节点进行编码，使得到的节点向量更好的表示第一节点的特征。

在第一方面的一种实施方式中，在所述第一节点是所述多个用户节点中的任一个的情况下，所述属性信息包括关注数、好友数以及发布的推文数；在所述第一节点是所述多个评论节点中的任一个的情况下，所述属性信息包括点赞数量、转发数量以及回复数量。

在本申请实施例中，通过用户节点的关注数、好友数以及发布的推文数等信息确定该用户节点在虚假新闻检测过程中对检测结果的影响。通过评论节点的点赞数量、转发数量以及回复数量可以确定该评论节点对应的评论的质量。

第二方面，本申请实施例提供一种虚假新闻检测装置，包括：获取单元、编码单元以及检测单元；

所述获取单元用于获取待检测新闻的文本内容以及所述待检测新闻对应的评论信息和用户信息；

所述编码单元用于利用文本内容编码模块对所述文本内容的第一句子进行编码，得到句子特征向量；所述第一句子是所述文本内容包含的至少两个句子中的任一个；

所述编码单元还用于利用用户评论联合编码模块对所述评论信息和用户信息进行编码，得到用户评论联合特征矩阵；

所述检测单元用于将所述句子特征向量和所述用户评论联合特征矩阵输入联合注意力模块，得到所述待检测新闻的检测结果。

第三方面，本申请实施例提供一种电子设备，包括处理器以及存储器，所述存储器用于存储一个或多个程序，所述一个或多个程序被配置成由所述处理器执行，所述程序包括用于执行如第一方面或者第一方面的任意一种可能的实施方式中的方法。

第四方面，本申请实施例提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行如第一方面或者第一方面的任意一种可能的实施方式中的方法。

附图说明

图1为本申请实施例提供的一种虚假新闻检测方法的流程示意图；

图2为本申请实施例提供的又一种虚假新闻检测方法的流程示意图；

图3为本申请实施例提供的一种虚假新闻检测架构图；

图4为本申请实施例提供的一种统一预训练语言模型的架构图；

图5为本申请实施例提供的一种用户-评论异构图；

图6为本申请实施例提供的一种图神经网络模块的架构图；

图7为本申请实施例提供的一种节点编码方法的流程示意图；

图8为本申请实施例提供的一种实验结果图；

图9为本申请实施例提供的一种虚假新闻检测装置的结构示意图；

图10为本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

为了便于理解本申请，下面将参照相关附图对本申请进行更全面的描述。附图中给出了本申请的较佳实施方式。但是，本申请可以以许多不同的形式来实现，并不限于本文所描述的实施方式。相反地，提供这些实施方式的目的是使对本申请的公开内容理解的更加透彻全面。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施方式的目的，不是旨在于限制本申请。

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。

请参阅图1，图1为本申请实施例提供的一种虚假新闻检测方法的流程示意图。如图 1所示，该虚假新闻检测方法包括如下步骤。

101，获取待检测新闻的文本内容以及所述待检测新闻对应的评论信息和用户信息。

具体的，新闻，也叫消息，是指通过报纸、电台、广播、电视台等媒体途径所传播信息的一种称谓。新闻是记录社会、传播信息、反映时代的一种文体，除了发表于报刊、广播、互联网、电视上的评论与专文外的常用文本都属于新闻之列，包括消息、通讯、特写、速写(有的将速写纳入特写之列)等等。在本申请实施例中，可以从个新闻媒体中获取待检测新闻的文本内容以及待检测新闻对应的评论信息和用户信息。待检测新闻对应的用户信息是指对待检测新闻进行评论的用户的信息。用户信息可以包括多个对待检测新闻进行评论的用户的信息，每个用户的信息可以包括用户所发布的评论文本信息、用好友信息、关注信息以及状态信息等。待检测新闻对应的评论信息是指与待检测新闻相关的评论的信息。评论信息可以包括多条与待检测新闻相关的评论的信息，每条评论的信息可以包括评论文本信息、回复数、转发数以及点赞数等。获取待检测新闻的文本内容以及待检测新闻对应的评论信息和用户信息，以结合待检测新闻的文本内容及其对应的评论信息和用户信息来检测待检测新闻的真实性。

102，利用文本内容编码模块对所述文本内容的第一句子进行编码，得到句子特征向量。

具体的，新闻文本内容是检测真假新闻的关键。假新闻往往带有夸张的语言风格，以引起人们的注意，从而传播不准确的信息。文本内容编码模块可以是训练好的神经网络模型，可以将文本数据转化为向量数据，即对文本进行科学的抽象，建立它的数学模型，用以描述和代替文本。在本申请实施例中，文本内容编码模块用于对待检测新闻的文本内容中的第一句子进行编码，将待检测新闻的文本内容中的第一句子的文本数据转化为向量数据，得到文本内容中的句子对应的句子特征向量。上述第一句子是上述文本内容包含的至少两个句子中的任一个。将第一句子输入到文本内容编码模块中，利用文本内容编码模块对第一句子进行编码，可以得到第一句子对应的句子特征向量。该句子特征向量是第一句子到向量空间的映射，可以表示第一句子的语言特性。文本内容编码模块可以用过独热编码的方式对第一句子进行编码，也可以通过其他句子编码的方式对第一句子进行编码。

进一步的，待检测新闻的文本内容可以被分为多个句子，将文本内容的多个句子输入到文本内容编码模块中，利用文本内容编码模块对该多个句子进行编码，得到该多个句子对应的多个句子特征向量。将多个句子特征向量拼接可以得到文本内容对应的文本特征矩阵，该文本特征矩阵包括句子特征向量。

进一步的，待检测新闻的文本内容可以由多个句子组成，一个句子可以由多个单词组成，因此待检测新闻的文本内容的重要信息可以从单词层面和句子层面获得，上述文本内容编码模块可以包括单词编码模块和句子编码模块。单词编码模块用于对第一句子中的单词进行编码，得到单词特征向量。句子编码模块结合单词特征向量对第一句子进行编码，得到第一句子对应的句子特征向量。

103，利用用户评论联合编码模块对评论信息和用户信息进行编码，得到用户评论联合特征矩阵。

具体的，上述用户评论联合编码模块可以是训练好的神经网络模型，用于挖掘待检测新闻对应的评论信息和用户信息中的有效信息。用户评论联合特征矩阵是由用户特征矩阵和评论特征矩阵横向拼接而成，用户特征矩阵和评论特征矩阵分别是用户信息和评论信息在数学空间上的特征表示。例如，用户特征矩阵是一个20*100的矩阵，评论特征矩阵也是一个20*100的矩阵，则由用户特征矩阵和评论特征矩阵拼接得到的用户评论联合特征矩阵是一个20*200的矩阵。用户评论联合特征矩阵包括第一用户评论联合特征向量，第一用户评论联合特征向量是由第一用户特征向量和第一评论特征向量拼接而成，第一评论特征向量对应的第一评论是由第一用户特征向量对应的第一用户发布的评论。其中，第一用户评论联合特征向量是用户评论联合特征矩阵中的任意一个用户评论联合特征向量，第一评论特征向量是评论特征矩阵中的任意一个评论特征向量，第一用户特征向量是用户特征矩阵中与第一评论特征向量对应的用户特征向量。用户评论联合特征矩阵是待检测新闻的多条用户评论的特征向量的集合，第一用户评论联合特征向量可以是待检测新闻的任一条用户评论的特征向量。

进一步的，用户评论联合编码模块可以包括异构图模块和图神经网络模块。异构图模块用于构建与用户信息和评论信息对应的异构图，该异构图包括多个用户节点、多个评论节点以及多个用户节点和多个评论节点之间的联系。图神经网络模块用于对上述异构图中的多个用户节点和多个评论节点进行编码，得到用户特征矩阵和评论特征矩阵。拼接用户特征矩阵和评论特征矩阵，得到用户评论联合特征矩阵。

104，将所述句子特征向量和所述用户评论联合特征矩阵输入联合注意力模块，得到所述待检测新闻的检测结果。

具体的，一条假新闻中不是所有句子都是假的，一些真实的句子是为了掩盖虚假信息。如果我们仅仅依靠新闻内容中的真假句子来判断新闻是真还是假，那是不准确的，因为每一句在识别假新闻方面的重要性不同。新闻评论往往反映了新闻内容的真实性，用户可能会根据自己的观点给出一些虚假新闻检测的重要线索。然而，一些用户可能是水军，他们的评论对于虚假新闻检测来说应该不那么重要，因此选择与新闻内容相关的评论对于虚假新闻检测至关重要。

将包含上述句子特征向量的文本特征矩阵和用户评论联合特征矩阵输入联合注意力模块，利用联合注意力模块学习待检测新闻的文本内容中的句子和评论信息之间语义一致性。

首先，计算一致性矩阵以改变文本特征矩阵和用户评论联合特征矩阵的维度，便于计算待检测新闻文本的文本内容中的句子和待检测新闻用户评论的注意力权重。用户评论联合特征矩阵表示为C'＝{C₁',...,C'_k}，文本特征矩阵表示为S＝{S₁,...,S_N}，一致性矩阵的计算公式如下：

F＝tanh(C'^TW_IS)

其中W_I是权重矩阵。通过一致性矩阵变换待检测新闻文本的文本内容中的句子和待检测新闻用户评论的注意力映射：

H^S＝tanh(W_SS+(W_C'C')F)

H^C’＝tanh(W_C'S+(W_SC')F^T)

其中W_C'和W_S是权重参数。得到待检测新闻文本的文本内容中的句子和待检测新闻用户评论的注意力映射后，计算待检测新闻文本的文本内容中的句子和待检测新闻用户评论的注意力权重为：

其中W_hc'和W_hs是注意力权重。基于以上的注意力权重，待检测新闻的文本内容中的句子特征向量和待检测新闻用户评论的特征向量的转换为：

其中

和

从联合注意力模块得到。待检测新闻的文本特征矩阵转换为

待检测新闻的用户评论联合特征矩阵转换为

聚合

和

得到待检测新闻的检测结果为：

其中W_f是权重参数，b_f是偏置值。

用作待检测新闻检测的检测结果，检测结果包括真实新闻和虚假新闻。在

的情况下，表示待检测新闻为虚假新闻，在

的情况下，表示待检测新闻为真实新闻。

在检测虚假新闻的二进制分类问题中，利用联合注意力模块检测待检测新闻的损失函数为：

其中y∈[0,1]是新闻的真实标签，代表虚假新闻和真实新闻。

请参阅图2，图2为本申请实施例提供的又一种虚假新闻检测方法的流程示意图。如图2所示，该虚假新闻检测方法包括如下步骤。

201，获取待检测新闻的文本内容以及所述待检测新闻对应的评论信息和用户信息。

其中，步骤201的具体实施可以参见图1所示的步骤101的具体描述，此处不再赘述。

202，利用单词编码模块学习的单词上下文信息对第一句子的第一单词进行编码，得到单词特征向量。

具体的，上述单词编码模块用于学习第一句子中单词上下文信息，并利用学习的单词上下文信息对第一单词进行编码。上述第一单词是上述第一句子包含的至少两个单词中的任一个。单词特征向量是第一单词在向量空间上的映射，可以表示第一单词的语言特征。

如图3所示，待检测新闻的文本内容可以分为多个句子，对文本内容中的句子进行分词处理，可以得到每个句子对应的单词序列。因为待检测新闻的文本内容中包含了多个句子，且需要计算待检测新闻的文本内容中的每一个句子对应的句子特征向量，为了使说明更为方便简洁，在本实施例将从文本内容中随机抽取一个句子作为第一句子，后续将以计算第一句子的句子特征向量为例进行说明，其中，该第一句子表示的是上述文本内容中的任意一个句子。对第一句子进行分词处理后得到第一句子对应的单词序列为(W_i1，W_i2，...， W_im)，即第一句子由单词W_i1、W_i2到单词W_im组成。将第一句子中的单词序列输入到单词编码模块中，单词编码模块读取第一句子的单词序列，单词W_i1、单词W_i2到单词W_im，并获取单词W_i1到单词W_im之间的单词上下文信息，利用获取到的单词上下文信息分别对单词W_i1到单词W_im进行编码，得到单词W_i1到单词W_im对应的单词特征向量h_i1、h_i2到 h_iM。对应的，h_i1为单词W_i1的单词特征向量，h_i2为单词W_i2的单词特征向量，h_iM为单词 W_im的单词特征向量。

可以理解的是，在对单词序列中多个单词进行编码时，分别学习每个单词的上下文信息对单词进行编码。在第一句子中的不同位置上包括多个相同的单词的情况下，该单词在第一句子中不同位置上的单词特征向量是不同的。

203，利用句子编码模块学习的句子上下文信息和单词特征向量对第一句子进行编码，得到句子特征向量。

如图3所示，获取到单词W_i1到单词W_im对应的单词特征向量h_i1、h_i2到h_iM，第一句子由单词W_i1到单词W_im组成，因此可以通过单词特征向量加权求和的方式计算第一句子的句向量v_i。由于在步骤201中，利用单词编码模块学习的单词上下文信息对第一句子中的单词进行编码，因此通过将单词特征向量加权求和的方式得到的句向量v_i可以表示第一句子的语言特征。

为了更准确的表示第一句子的特征，利用句子编码模块学习的句子上下文信息对第一句子句向量进行重编码，得到句子特征向量S_i，得到的句子特征向量S_i携带第一句子的上下文信息。

在一种实施方式中，上述单词编码模块可以包括统一预训练语言模型(UnifiedLanguage Model，UnliLM)，上述句子编码模块可以包括门控循环单元(Gated RecurrentUnit，GRU)神经网络模型。

UniLM模型的结构如图4所示，UniLM模型能够很好地处理新闻内容中自然语言的理解问题。第一句子可以被分成多个单词，并输入到UniLM中。UniLM模型可以通过学习单词的上下文语境内容来捕捉单词之间的关系，最终得到第一句子中每个单词的词向量。该模型经过预训练，可用于三种语言建模目标：单向(从左到右或从右到左读取文本内容)，双向(从左到右和从右到左读取文本内容)和逐句预测。UniLM模型包括分段嵌入 (segmentembedding)、位置嵌入(position embedding)、符号嵌入(token embedding) 和L层Tranformer模块。在一个句子的不同位置可能有多个相同的单词，但是这个单词的词向量应该是不同的。位置嵌入用于区分句子中单词的位置。符号嵌入将单词从符号转换为向量，Transformer是一种使用注意力机制来学习文本中单词间上下文语境的模型。 UniLM模型读取一个句子s_i从单词w_i到单词w_iM如下：

h_it＝UniLM(w_it),t∈{1,...,M}

其中h_it是一个词向量表示。得到第一句子中M个单词的词向量后，第一句子的句向量v_i可以由M个单词组成，表示为：

其中α_it表示在第一句子i中第t个单词的重要性，计算如下：

h'_it＝tanh(h_it)

其中h'_W是权重参数。

经过上述步骤，得到第一句子的句向量，使用带有GRU单元的递归神经网络对第一句子进行重新编码。单向GRU算法只能捕获当前句子和下一个句子之间的特征。使用双向GRU可以捕获上句和下句之间的特征。双向GRU模型包含前向

和后向

利用双向GRU对第一句子进行编码：

获得的第一句子的句子特征向量S_i是由前置隐藏层和后置隐藏层组成，表示为：

在本申请实施例中，利用UniLM模型对第一句子中的各个单词进行编码，得到第一句子中各个单词的词向量。再将第一句子中各个单词的词向量加权求和，得到第一句子的句向量。为了更好的表示第一句子的特征，利用双向GRU模型捕获句子间的上下文信息对第一句子进行重新编码，得到第一句子的句子特征向量。

204，利用异构图模块构建与评论信息和用户信息对应的异构图。

具体的，上述异构图模块用于构造待检测新闻对应的评论和用户的异构图。上述评论信息可以包括多条评论的信息，上述用户信息可以包括多个用户的信息。待检测新闻可以对应多条评论，每条评论对应每个用户。当用户浏览新闻会同时浏览新闻对应的评论，这会影响用户将要发布的评论，因此同一条新闻的评论与评论之间是相关的。因此构造的异构图可以包括多个用户节点、多个评论节点、多个用户节点和多个评论节点之间的联系以及多个评论节点之间的联系。

如图5所示，图5为本申请实施例提供的一种用户-评论异构图，对于用户节点来说，用户节点对应的用户发表过的评论节点、回复该用户的用户节点以及与该用户评论同一新闻的用户节点之间都是有联系的，都可以直接或间接的构成该用户节点的邻接节点。在本申请实施例中，主要研究待检测新闻的评论信息对待检测新闻的影响，因此可以不考虑用户节点之间的关系。

对于评论节点来说，发布该评论的用户节点、回复该评论的评论节点以及与对同一新闻进行评论的评论节点之间都是有联系的，可以构成该评论节点的邻接节点。

205，利用图神经网络模块对异构图包括的多个用户节点和多个评论节点进行编码，得到用户特征矩阵和评论特征矩阵。

具体的，神经网络模块用于将异构图中的各个节点向量化，得到各个节点对应的节点特征向量，拼接用户节点的节点特征向量构成用户特征向量，拼接评论节点的节点特征向量构成评论特征矩阵。

可选的，请参阅图6，图6是本申请实施例提供的一种图神经网络模块的架构图。如图6所示，上述图神经网络模块可以包括节点特征编码模块、节点聚合模块以及邻接节点混合模块。请参阅图7，图7为本申请实施例提供的一种节点编码方法的流程示意图，如图7所示，该节点编码方法包括如下步骤。

701，利用节点特征编码模块对第一节点进行编码，得到第一节点对应的节点向量。

具体的，第一节点是上述多个用户节点中的任一个或者上述多个评论节点中的任一个。因为异构图中包含了多个用户节点和多个评论节点，且需要计算多个用户节点和多个评论节点中的每一个节点对应的节点特征向量，为了使说明更为方便简洁，在本实施例将从多个用户节点和多个评论节点中随机抽取一个节点作为第一节点，后续将以计算第一节点的节点特征向量为例进行说明，其中，该第一节点表示的是上述多个用户节点和多个评论节点中的任意一个节点。

在本申请实施例中，节点特征编码模块用于获取节点的特征信息，对节点进行编码。利用节点特征编码模块对第一节点进行编码，得到第一节点对应的节点向量N_j，节点向量 N_j可以在向量空间上表示第一节点的特征。

进一步的，第一节点包括节点的属性信息和文本信息。上述节点特征编码模块包括属性编码模块和文本编码模块，步骤401中，利用节点特征聚合模块对第一节点进行编码，得到所述第一节点对应的节点向量，可以包括如下步骤：

(11)利用所述属性编码模块对所述属性信息进行编码，得到所述第一节点对应的属性向量；

(12)利用所述文本编码模块对所述文本信息进行编码，得到所述第一节点对应的文本向量；

(13)对所述属性向量与所述文本向量进行处理，得到所述节点向量。

在本申请实施例中，第一节点包括属性信息和文本信息，节点特征编码模块可以包括属性编码模块和文本编码模块，属性编码模块用于对节点的属性信息进行编码，文本编码模块用于对节点的文本信息进行编码。利用属性编码模块和文本编码模块分别对第一节点的属性信息和文本信息进行编码，得到第一节点对应的属性向量和文本向量，对属性向量和文本向量进行处理可以得到第一节点对应的节点向量N_j。

具体的，在第一节点包括多个属性信息的情况下，利用属性编码模块分别对第一节点的各个属性信息进行编码，可以得到第一节点的属性向量。上述文本编码模块可以为上述文本内容编码模块，即利用上述文本内容编码模块对第一节点的文本信息中的句子进行编码，得到对应的句子特征向量，构成第一节点的文本向量。获得第一节点的属性向量和文本向量后，可以对第一节点的属性向量和文本向量进行均值池化处理，也可以对第一节点的属性向量和文本向量进行最大池化处理，或者直接将第一节点的属性向量和文本向量相加，得到第一节点的节点向量N_j。其中，通过均值池化层得到的节点向量N_j可以更好的保留属性向量和文本向量的特征，使得节点向量更好的表示第一节点的特征。

可选的，在第一节点是多个用户节点中的任一个的情况下，第一节点的属性信息包括关注数、好友数以及发布的推文数；在第一节点是多个评论节点中的任一个的情况下，第一节点的属性信息包括点赞数量、转发数量以及回复数量。

在第一节点是多个用户节点中的任一个的情况下，第一节点的属性信息包括关注数、好友数以及发布的推文数。属性编码模块可以通过独热编码的方式对第一节点的属性进行编码，即属性编码模块分别对第一节点的关注数、好友数以及发布的推文数进行独热编码，将第一节点的属性信息转换为属性向量。属性编码模块对第一节点的关注数进行独热编码时，先对关注数按照数值的大小进行区间划分，分别对每个区间进行独热编码，即可得到每个区间对应的标签。然后按照第一节点的关注数的数值确定第一节点所属区间，并获取该区间的标签，以该区间的标签作为第一节点关注数这个属性对应的属性向量。同样的，对第一节点的好友数和发布的推文数的编码方式与对第一节点的关注数编码方式相同。分别对第一节点的关注数、好友数以及发布的推文数进行编码，得到第一节点每个属性对应的属性向量。

在第一节点是多个用户节点中的任一个的情况下，第一节点的文本信息包括第一节点对应的用户所发布的评论文本。在第一节点对应的用户发布多条评论的情况下，分别利用文本编码模块对多条评论中的每条评论的文本信息进行编码，得到多条评论对应的多个文本向量，拼接多个文本向量得到第一节点的文本向量。

在第一节点是多个评论节点中的任一个的情况下，第一节点的属性信息包括点赞数量、转发数量以及回复数量。属性编码模块可以通过独热编码的方式对第一节点的属性进行编码，即属性编码模块分别对第一节点的点赞数量、转发数量以及回复数量进行独热编码，将第一节点的属性信息转换为属性向量。属性编码模块对第一节点的点赞数量进行独热编码时，先对点赞数量按照数值的大小进行区间划分，分别对每个区间进行独热编码，即可得到每个区间对应的标签。然后按照第一节点的点赞数量的数值确定第一节点所属区间，并获取该区间的标签，以该区间的标签作为第一节点点赞数量这个属性对应的属性向量。同样的，对第一节点的转发数和回复数量的编码方式与对第一节点的点赞数量编码方式相同。分别对第一节点的点赞数量、转发数量以及回复数量进行编码，得到第一节点每个属性对应的属性向量。在第一节点是多个评论节点中的任一个的情况下，第一节点的文本信息即为第一节点对应的评论的文本内容，利用文本编码模块对第一节点的文本信息进行编码得到第一节点的文本向量。

在本申请实施例中，通过用户节点的关注数、好友数以及发布的推文数确定该用户节点对应的用户是否为水军用户，水军用户一般会有更少的粉丝、更少的朋友以及更多低质量的同类评论。水军用户的评论对于虚假新闻检测来说影响力极小，通过用户节点的关注数、好友数以及发布的推文数可以确定该用户节点在虚假新闻检测的检测结果的影响。通过评论节点的点赞数量、转发数量以及回复数量可以确定该评论节点对应的评论质量，从而确定该评论节点对虚假新闻检测的检测结果的影响。

702，获取第一节点的邻接节点。

如图5所示，异构图中包括多个用户节点、多个评论节点、多个用户节点与多个评论节点之间的联系以及多个评论节点之间的联系，因此可以通过异构图获取第一节点的邻接节点，第一节点的邻接节点指的是与第一节点有联系的节点。可以通过采样的方式获得第一节点的所有邻接节点。

703，确定所述邻接节点中所述第一节点的同类邻接节点和非同类邻接节点。

具体的，在第一节点为多个用户节点中的任一个的情况下，第一节点的同类节点为用户节点，非同类节点为评论节点。在异构图中包括多个用户节点和多个评论节点之间的联系，因此第一节点的邻接节点包含评论节点。在本申请实施例中，主要考虑待检测新闻评论对于新闻真实性的影响，因此可以不考虑用户节点与用户节点之间的联系。在不考虑用户节点之间的联系的情况下，第一节点的邻接节点中不包括用户节点，即第一节点没有同类邻接节点，第一节点的邻接节点都是非同类邻接节点。

在第一节点为多个评论节点中的任一个的情况下，第一节点的邻接节点包括评论节点和用户节点。第一节点的同类节点包括评论节点，非同类节点包括用户节点。

704，利用节点聚合模块对同类邻接节点进行聚合，得到第一节点对应的聚合特征向量，以及同类邻接节点对应的聚合特征向量。

具体的，同一类型的邻接节点具有相似的特征，节点聚合模块用于获取同类邻接节点之间的相似特征，对同类邻接节点进行聚合，以获取同类邻接节点的聚合特征向量。将第一节点及其同类邻接节点的集合输入到节点聚合模块中，得到第一节点对应的聚合特征向量v′_ii，以及同类邻接节点对应的聚合特征向量(v′_iC或v′_iU)。

进一步的，节点聚合模块可以包括双向长短期记忆(Long short-term memory，LSTM) 模块。利用双向LSTM模块对同类邻接节点进行聚合时，需要先将同类邻接节点进行随机排序，得到同类邻接节点序列，将该同类邻接节点序列输入到双向LSTM模块中，得到该同类邻接节点序列中各个同类邻接节点对应的聚合特征向量。利用LSTM模块对同类邻接节点进行聚合，使得到的聚合特征向量具有更高的表达能力。

705，利用节点聚合模块对非同类邻接节点进行聚合，得到非同类邻接节点对应的聚合特征向量。

具体的，将第一节点的非同类邻接节点输入到节点聚合模块，利用节点聚合模块对第一节点的非同类邻接节点进行聚合，得到非同类邻接节点对应的聚合特征向量(v′_iC或v′_iU)。

706，利用邻接节点混合模块结合第一节点对应的聚合特征向量、同类邻接节点对应的聚合特征向量以及非同类邻接节点对应的聚合特征向量，得到第一节点对应的特征向量。

具体的，不同类型的邻接节点对第一节点有不同的影响。在第一节点为评论节点的情况下，第一节点有两种不同类型的邻接节点，因为第一节点的两种不同类型的邻接节点信息是必需的，可以利用注意力机制结合两种不同类型邻接节点的特征信息，得到第一节点对应的节点特征向量。

第一节点的节点特征向量表示为：

v_i＝α_iiv′_ii+α_iCv′_iC+α_iUv′_iU

其中，v′_ii为第一节点的聚合特征向量，v′_iC为第一节点邻接的评论节点的聚合特征向量， v′_iU为与第一节点邻接的用户节点的聚合特征向量，α_iv,v∈{i,C,U}，α_iv表示不同向量内嵌的重要性，计算公式如下：

其中LeakyReLU是线性整流函数(Rectified Linear Unit，ReLU)的变式。与ReLU相比，它不会造成激活函数进入负区间时神经元不学习的问题，u是注意力模块的参数。

在第一节点是多个用户节点中的任一个的情况下，上述用户特征矩阵包含第一节点对应的节点特征向量，在第一节点是多个评论节点中的任一个的情况下，上述评论特征矩阵包含第一节点对应的节点特征向量。

206，拼接用户特征矩阵和评论特征矩阵，得到用户评论联合特征矩阵。

具体的，横向拼接用户特征矩阵和评论特征矩阵，使得评论特征矩阵中的第一评论特征向量和用户特征矩阵中的第一用户特征向量横向拼接形成第一用户评论联合特征向量，第一评论特征向量对应的第一评论是由第一用户特征向量对应的第一用户发布的评论。其中，第一评论特征向量是评论特征矩阵中的任意一个评论特征向量。用户评论联合特征矩阵包括第一用户评论联合特征矩阵。

207，将句子特征向量和用户评论联合特征矩阵输入联合注意力模块，得到待检测新闻的检测结果。

其中，步骤207的具体实施可以参见图1所示的步骤104的具体描述，此处不再赘述。

在本申请实施例中，结合第一句子中单词上下文信息以及第一句子的句子上下文信息对第一句子进行编码，使得到的句子特征向量对第一句子具有更好的表达效果。通过异构图模块构建与用户信息和评论信息对应的异构图，获取用户信息和评论信息中的用户和评论以及评论和评论之间的关系，通过图神经网络模块对异构图中的用户节点和评论节点进行编码，以获取异构图中各个节点的节点特征向量，使得到的节点特征向量能够更好的表示节点的特征。通过联合注意力模块学习待检测新闻的文本内容中的句子和评论信息之间语义一致性，以对待检测新闻的真实性进行检测，从而提高虚假新闻检测的准确率。

下文将介绍本申请实施例相关的实验数据，以佐证本申请上述方法实施例提供的虚假新闻检测方法能提虚假新闻检测的准确率。

在本申请实施例中，数据集可以从FakeNewsNet中收集，数据集可以分为Politifact 和Gossipcop两个数据集。在Politifact数据集中，综合考虑记者和网站上政治新闻的专家评论，Politifact数据集中的新闻被分为真实新闻和虚假新闻。在Gossipcop数据集中，包括从各个媒体收集的具有评分的娱乐新闻，Gossipcop数据集中的新闻也分为真实新闻和虚假新闻。数据集中的数据如表1所示。

表1

Platform	Politifact	Gossipcop
			Users	36,060	95,139
Comments-Users	73,373	129,710
			True News	152	1,112
Fake News	237	862

数据集包含带有标签的新闻的文本内容及其对应的用户信息和评论信息。每条新闻对应的评论都是由FakeNewsNet工具获取的。每条评论的信息包括评论文本信息和评论属性信息，评论属性信息包括回复数、转发数和点赞数等。每个用户的信息包括该用户发布的所有评论文本信息和用户属性信息，用户属性信息包括好友数、关注数、验证标志和状态数等。

在本实验中，我们对比了本申请实施例提供的虚假新闻检测方法(为便于描述，将本申请实施例提供的虚假新闻检测方法记为GCAL)和其它八种方法进行比较。其中，该八种方法主要分为图神经网络方法和文本分类方法两大类。图神经网络方法包括异构图神经网络(Heterogeneous Graph Neural Network，HetGNN)、图注意力网络(Graph AttentionNetworks，GAT)和图采样聚合算法(Graph SAmple and aggreGatE，GSAGE)。HetGNN 是一种异构图神经网络，通过聚集不同类型的节点来完成各种图挖掘任务。GAT使用自注意力神经网络来聚合邻接结点的特征来完成各种任务。GSAGE通过采样和收集来自邻接结点的特征来生成用于节点嵌入的聚合器。文本分类方法可以包括分级注意网络 (HierarchicalAttention Network，HAN)、文本卷积神经网络(Text Convolutional Neural Network，text-CNN)、文本循环神经网络(Text Recursive Neural Network，text-RNN)、基于用户评论生成器的文本卷积神经网络(Text Convolutional Neural Network-User ResponseGenerator，TCNN-URG)和可解释的虚假新闻检测(Explainable FakE News Detection，dEFEND)。HAN结合节点层注意力机制和语义层注意力机制来学习新闻内容的信息。text-CNN结合了卷积神经网络和新闻内容，通过利用多个卷积隐藏层，它可以自动提取文本特征。text-RNN使用LSTM对递归神经网络的最后一个输出中的文本信息进行编码。TCNN-URG利用两个卷积神经网络和条件式变分自编码机进行分类。dEFEND是一个研究句子-评论共同注意力机制的子网络模型，利用新闻内容和用户评论来共同捕获可解释的前k个最值得检查的句子和用户评论，以此来完成虚假新闻检测。

在本实验中，通过最常用的准确度、精确度、召回率、F1和AUC来评估二分类任务中的结果。准确率(Accuracy)是所有预测正确的样本与总的样本的比值，指对于给定的测试数据集，分类器正确分类的样本数与总样本数之比。精确率(Precision)是将正类样本中预测为正类的数目和总样本中预测为正类的数目的比值，它是针对我们预测结果而言的，Precision又称为查准率。召回率(Recall)是将正类样本中预测为正类的数目和总样本中正类的数目的比值，表示正类样本中的预测准确正例有多少被预测正确了，它是针对我们原来的样本而言的，Recall又称为查全率。精确率和召回率是互相影响的，理想情况下肯定是做到两者都高，但是一般情况下精确率高、召回率就低，召回率低、精确率高。所以，在两者都要求高的情况下，可以用F1来衡量。F1是精确率和召回率的调和平均值。F1的计算公式如下：

其中，Pre表示精确率，Rec表示召回率。

AUC为接受者操作特性曲线(Receiver Operating Characteristic，ROC)下方的面积大小，该ROC曲线反映敏感性和特异性连续变量的综合指标，ROC曲线上每个点反映着对同一信号刺激的感受性，ROC曲线的横坐标为预测为正但实际为负的样本占所有负例样本的比例，纵坐标为预测为正且实际为正的样本占所有正例样本的比例。

在本实验中，将数据集随机分为训练集和验证集，获得了一组新闻作为待检测新闻集来进行虚假新闻检测。其中，训练集占数据集的75％，验证集占数据集的25％。对每种虚假新闻检测方法使用相同的嵌入维度(d＝200)。在本申请实施例提供的虚假新闻检测方法中，由于考虑时间性能，对数据集中的新闻文本内容中的句子设置最大长度为50，最大评论长度为20。不同的是，在Politifact数据集中，学习率为0.0002，而在Gossipcop数据集中，学习率为0.0015。以准确率、精确率、召回率以及F1作为指标，分别使用上述八种虚假新闻检测方法对待检测新闻集进行检测，得到的结果如表2所示。

表2

所有方法的检测结果如表2所示，其中包括详细的评价指标。从检测结果中可以看出，本申请实施例提供的GCAL可以在两个数据集上获得最佳性能，我们注意到以下分析。首先，大多数具有注意力机制的方法趋于预测更多正确的新闻(HetGNN、GAT、GSAGE、HAN、dEFEND和本申请实施例提供的GCAL)。这意味着注意力机制可以更好地捕获新闻内容中的信息。其次，基于句子-评论联合注意力机制的方法(dEFEBD和GCAL)比其他方法表现更好，因为新闻句子语境和评论语境促进了对新闻内容的额外信息的学习。这表明复杂的深度机器学习模型可以通过提取高阶特征获得良好的性能，也就是说，新闻内容的附加信息有助于提高虚假新闻检测的准确性。根据与图神经网络方法的比较，通过构建异构图神经网络我们观察到网络的异质性。

就Politifact数据集的准确率、召回率和F1而言，目前的结果表明，本申请实施例提供的GCAL与其他方法相比具有更高的检测能力。就精确率而言，我们发现TCNN-URG 的表现优于GCAL。经过详细的分析，我们观察到TCNN-URG倾向于正确地预测更多真实的新闻。然而，我们的研究致力于检测假新闻，因此更高的精确率和更低的召回率并不是不准确的。在考虑Gossipcop数据集的准确率、精确率和F1时，结果表明，与其他方法相比，尽管在召回率方面略低于TCNN-URG，但是GCAL依然具有最佳性能。尽管dEFEND 是这一领域最有用的方法之一，并利用直接的注意力学习机制来获得强大的虚假新闻检测能力。但本申请实施例提供的方法从所有评估指标来看，都优于HetGNN和dEFEND，这意味着异构图神经网络学习模块的有效性。例如，与dEFEND相比，GCAL在Politifact 数据集上的准确率提高了4％，召回率提高了7％，F1提高了5％，在Gossipcop数据集上也稍好一些。本申请实施例提供的方法基于预训练语言模型的用户评论异构图学习，挖掘更多新闻内容的潜在信息。

在本实验中，为了详细验证本方案的有效性，对本申请实施例提供的虚假新闻检测框架(GCAL)进行消融分析。首先构建一个用户-评论异构图网络，然后消除用户节点，得到对比的虚假新闻检测框架(GCAL_NU)或消除评论节点得到对比的虚假新闻检测框架(GCAL_NC)。分别利用GCAL、GCAL_NU和GCAL_NC检测待检测新闻，得到的结果如图8所示。图8中，Acc、Pre和Rec分别表示准确率、精确率和召回率，从图8中，可以发现GCAL比GCAL_NC和GCAL_NU具有更好的性能。表明用户注意力机制和上下文语境特征的结合使GCAL能够提取更多特征信息，并结果更好更稳定。用户评论异构图网络构建后，用户节点或评论节点聚合计算两种节点上下文语境特征，结果不会出现明显的波动。更重要的是，用户-评论关系和单词-句子注意力学习确实可以更好地帮助新闻验证。

在虚假新闻检测时，目标是从所有句子中学习到一个排名列表RS。在每条新闻中，排名列表由k个可解释性最高的句子组成，它们在识别假新闻的任务中起着至关重要的作用。为了分析本申请实施例提供的虚假新闻检测方法评估的前k个可解释句子是否更接近那些最需要在新闻中检查的句子，利用ClaimBuster获得一个排名列表

作为评价基准。ClaimBuster是一个工具，它收集了大约20000句话，用于识别有价值的声明，并且可以计算0到1之间的可靠的分数。因此，一条声明获得的分数越高，其阐述地内容与事实越一致。特别是，以排名列表

为基准，通过比较GCAL和dEFEND确定的新闻内容中的前 k条排名列表来观察新闻句子可解释性表现。同时，利用平均精确率来评估结果，其中k设置为5和10。在评估过程中，引入另一个参数n来控制与n条相邻的句子进行比较，其中n 设置为0到4。在本实验中可以得到两个观察结果，一方面，在两个数据集上结果表明，在GCAL中找到与事实更一致的前k条可解释句子的总体性能明显优于dEFEND。因此，本申请实施例提供的虚假新闻检测方法可以促进分析找出最需要检查的句子。另一方面，由于n的增加，我们注意到平均准确率显示出上升趋势，因为与评价基准相比，匹配条件放缓了。

请参阅图9，图9为本申请实施例提供的一种虚假新闻检测装置。如图所示，该虚假新闻检测装置90包括包括：获取单元901、编码单元902以及检测单元903。

上述获取单元901用于获取待检测新闻的文本内容以及上述待检测新闻对应的评论信息和用户信息。

上述编码单元902用于利用文本内容编码模块对文本内容的第一句子进行编码，得到句子特征向量。上述第一句子是上述文本内容包含的至少两个句子中的任一个。

上述编码单元902还用于利用用户评论联合编码模块对上述评论信息和用户信息进行编码，得到用户评论联合特征矩阵。

上述检测单元903用于将上述句子特征向量和上述用户评论联合特征矩阵输入联合注意力模块，得到上述待检测新闻的检测结果。

关于上述实施例中的虚假新闻检测装置90，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

请参阅图10，图10为本申请实施例提供的一种电子设备的结构示意图，如图10所示，该电子设备100包括处理器1001和存储器1002。处理器1001、存储器1002可以通过通信总线1003相互连接。通信总线1003可以是外设部件互连标准(Peripheral ComponentInterconnect，简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，简称EISA)总线等。通信总线1003可以分为地址总线、数据总线、控制总线等。为便于表示，图10中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。存储器 1002用于存储计算机程序，计算机程序包括程序指令，处理器1001被配置用于调用程序指令，上述程序包括用于执行图1～图7所示虚假新闻检测方法中的部分或全部步骤。

处理器1001可以是通用中央处理器(CPU)，微处理器，特定应用集成电路(application-specific integrated circuit，ASIC)，或一个或多个用于控制以上方案程序执行的集成电路。

存储器1002可以是只读存储器(read-only memory，ROM)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(random access memory，RAM)或者可存储信息和指令的其他类型的动态存储设备，也可以是电可擦可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(CompactDisc Read-Only Memory，CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。存储器可以是独立存在，通过总线与处理器相连接。存储器也可以和处理器集成在一起。

本申请实施例还提供一种计算机可读存储介质，其中，该计算机可读存储介质存储用于电子数据交换的计算机程序，该计算机程序使得计算机执行如上述图1～图7所示的方法实施例中记载的任何一种虚假新闻检测方法的部分或全部步骤。

应当理解的是，本申请的应用不限于上述的举例，对本领域普通技术人员来说，可以根据上述说明加以改进或变换，所有这些改进和变换都应属于本申请所附权利要求的保护范围。

Claims

1.一种虚假新闻检测方法，其特征在于，包括：

利用用户评论联合编码模块对所述评论信息和所述用户信息进行编码，得到用户评论联合特征矩阵；

2.根据权利要求1所述的方法，其特征在于，所述文本内容编码模块包括单词编码模块和句子编码模块，所述利用文本内容编码模块对所述文本内容的第一句子进行编码，得到句子特征向量，包括：

3.根据权利要求2所述的方法，其特征在于，所述单词编码模块包括统一预训练语言模型，所述句子编码模块包括门控循环单元神经网络模型。

4.根据权利要求1所述的方法，其特征在于，所述用户评论联合编码模块包括异构图模块和图神经网络模块；所述利用用户评论联合编码模块对所述评论信息和用户信息进行编码，得到用户评论联合特征矩阵，包括：

5.根据权利要求4所述的方法，其特征在于，所述图神经网络模块包括节点特征编码模块、节点聚合模块以及邻接节点混合模块，所述利用所述图神经网络模块对所述多个用户节点和所述多个评论节点进行编码，得到用户特征矩阵和评论特征矩阵，包括：

获取所述第一节点的邻接节点；

在所述第一节点是所述多个用户节点中的任一个的情况下，所述用户特征矩阵包含所述第一节点对应的节点特征向量，在所述第一节点是所述多个评论节点中的任一个的情况下，所述评论特征矩阵包含所述第一节点对应的节点特征向量。

6.根据权利要求5所述的方法，其特征在于，所述第一节点包括属性信息与文本信息；所述节点特征编码模块包括属性编码模块和文本编码模块；所述利用所述节点特征聚合模块对第一节点进行编码，得到所述第一节点对应的节点向量，包括：

7.根据权利要求6所述的方法，其特征在于，在所述第一节点是所述多个用户节点中的任一个的情况下，所述属性信息包括关注数、好友数以及发布的推文数；在所述第一节点是所述多个评论节点中的任一个的情况下，所述属性信息包括点赞数量、转发数量以及回复数量。

8.一种虚假新闻检测装置，其特征在于，包括：获取单元、编码单元以及检测单元；

9.一种电子设备，其特征在于，包括处理器以及存储器，所述存储器用于存储一个或多个程序，所述一个或多个程序被配置成由所述处理器执行，所述程序包括用于执行如权利要求1～7任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行如权利要求1～7任一项所述的方法。