CN115659966A

CN115659966A - 基于动态异构图和多级注意力的谣言检测方法及系统

Info

Publication number: CN115659966A
Application number: CN202211340799.XA
Authority: CN
Inventors: 陈羽中; 朱文龙
Original assignee: Fuzhou University
Current assignee: Fuzhou University
Priority date: 2022-10-29
Filing date: 2022-10-29
Publication date: 2023-01-31

Abstract

本发明涉及一种基于动态异构图和多级注意力的谣言检测方法及系统，该方法包括以下步骤：步骤A：在社交平台中采集帖子，提取帖子中的文本内容、评论内容和相关用户信息，并标注帖子的真实性标签，以此构建训练数据集DE；步骤B：使用训练数据集DE训练基于动态异构图和多级注意力的深度学习网络模型，通过此模型来分析帖子的真实性，并预测帖子的真实性标签；步骤C：将待检测帖子的文本内容、评论内容和相关用户信息输入到训练好的深度学习网络模型中，得到帖子的真实性标签。该方法及系统有利于提高谣言检测的准确性。

Description

基于动态异构图和多级注意力的谣言检测方法及系统

技术领域

本发明属于自然语言处理领域，具体涉及一种基于动态异构图和多级注意力的谣言检测方法及系统。

背景技术

谣言检测(Rumor Detection)，也称为虚假新闻检测，是自然语言处理(NLP)领域的一项重要任务。随着互联网的迅速发展，微博、Twitter等社交软件逐渐成为人们生活中不可缺少的交流工具。同时，由于社交软件传播速度快、范围广，谣言也逐渐成为人们关注的一大焦点。在社交媒体中，谣言是一种以某些途径广泛传播且未经证实的信息表述，并通常使用虚假的或者伪造的图像以及煽动性的语言，误导读者并迅速传播。谣言的出现往往会给社会造成严重的危害和巨大的经济损失。尽管各社交媒体机构陆续开通了辟谣平台来加强对谣言的管控，但这些辟谣平台仍然需要依靠人工收集的信息来识别谣言真实性，非常耗时耗力。因此，迫切需要一种能够有效检测谣言的自动化方法。

随着深度学习方法研究的不断深入，许多研究人员也将深度学习模型应用到谣言检测领域中。其中最常用的神经网络是卷积神经网络(CNN)和循环神经网络(RNN)。CNN可以从文本中捕获局部语义信息，因此一些研究人员将它们应用于基于文本内容的谣言检测中。然而，该网络并不能充分学习句子中的上下文信息，而这对于建模文本的整体语义关系至关重要。因此，基于CNN的谣言检测模型的性能在谣言检测任务中受到了限制。针对这个问题，许多研究人员采用了RNN，例如长短期记忆(LSTM)和门控循环单元(GRU)，来提取文本的上下文语义信息。与CNN不同，RNN将一个句子视为一个词序列，按时间顺序取每个词，将隐藏层的输出作为下一个隐藏层的输入，不断学习序列数据中的上下文信息。但是，上述方法仅利用文本内容信息进行检测谣言，忽略了谣言传播的拓扑关系。

因此，一些研究人员研究了基于文本语义信息及其传播结构的谣言检测方法。通过对帖子的传播结构建模，构建传播图，并采用图神经网络聚合邻居节点的特征，从而捕获谣言的传播结构特征。Ma等人利用自顶向下和自低向上的树形递归神经网络来捕获谣言的语义信息和传播特征。Khoo等人使用Transformer网络中的多头注意力机制对帖子之间的长距离交互进行建模，提出一种帖子级注意力模型。Bian等人利用双向图卷积网络学习谣言的传播模式，捕捉谣言扩散的结构。Wu等人为每个谣言构建传播图，并使用门控图神经网络对关系路径上的相邻节点交换信息，更新节点的表示，从而增强传播图的节点表示。

此外，部分研究人员则尝试构建异构图为模拟谣言传播过程提供新的视角，并取得了出色的性能表现。Yuan等人将推文、转推和用户的全局关系建模成异构图，然后从帖子的内容和用户的传播关系中捕获局部语义信息和全局结构信息。Huang等人构建了推文-词-用户异构图，利用基于元路径的异构图注意力网络捕获文本内容的全局语义关系和推文传播的全局结构信息。Ran等人提出一种多通道图注意力网络，该网络分别对源推文与其评论的关系、源推文与其词的关系、源推文与其相关用户的关系进行建模构建三个子图，并设计一个事件共享模块学习不同事件谣言中的共性特征。但现有基于异构图的谣言检测方法通常使用常规的同构图神经网络，不能充分学习传播图中的结构信息，忽略了异构传播图中节点特定于自身类型的信息。其次，忽略了谣言传播的动态过程，无法捕获谣言动态传播的演化模式。因此使得模型性能提升不明显。

发明内容

本发明的目的在于提供一种基于动态异构图和多级注意力的谣言检测方法及系统，该方法及系统有利于提高谣言检测的准确性。

为实现上述目的，本发明采用的技术方案是：一种基于动态异构图和多级注意力的谣言检测方法，包括以下步骤：

步骤A：在社交平台中采集帖子，提取帖子中的文本内容、评论内容和相关用户信息，并标注帖子的真实性标签，以此构建训练数据集DE；

步骤B：使用训练数据集DE训练基于动态异构图和多级注意力的深度学习网络模型，通过此模型来分析帖子的真实性，并预测帖子的真实性标签；

步骤C：将待检测帖子的文本内容、评论内容和相关用户信息输入到训练好的深度学习网络模型中，得到帖子的真实性标签。

进一步地，所述步骤B具体包括以下步骤：

步骤B1：对训练数据集DE中的所有训练样本进行初始编码，得到文本内容的初始表征向量E^s、评论内容的初始表征向量E^r和用户初始表征向量E^u；

步骤B2：将步骤B1得到的文本内容初始表征向量E^s和评论内容初始表征向量E^r同时输入到一个多头交叉注意力机制中，得到评论内容的词级表征向量C^r，随后将文本内容初始表征向量E^s输入到多头自注意力机制中，得到文本内容的词级表征向量C^s；然后通过把评论内容的词级表征向量C^r和文本内容的词级表征向量C^s分别输入到池化层中进行平均池化操作，得到评论内容的句子级表征向量

和文本内容的句子级表征向量

步骤B3：将帖子对应的所有评论内容的句子级表征向量

拼接起来，得到评论内容的句子级表征矩阵T^r，同时将文本内容的句子级表征向量

复制m次，得到文本内容的句子级表征矩阵T^s；随后将评论内容的句子级表征矩阵T^r和文本内容的句子级表征矩阵T^s一起输入到多头交叉注意力机制中，并通过平均池化得到评论内容的综合语义表征向量

然后将文本内容的句子级表征向量

和评论内容的综合语义表征向量

输入到融合门控机制中，得到帖子基于评论的文本细粒度语义表征向量X^sr；

步骤B4：根据用户转发或评论的时间，构建T个异构传播图快照G₁，...，G_t，...，G_T；将任意一个异构传播图快照输入到多层图神经网络HGN中，先得到帖子节点与邻接用户节点的注意力分布向量A^HGN和邻接用户节点的信息表征向量I^HGN；然后再将注意力分布作为权重聚合邻接用户节点的信息，得到第t个异构传播图快照中帖子节点的信息表征向量

并经过L层HGN后得到帖子节点s_i传播结构信息表征向量

步骤B5：将所有异构传播图快照G₁，...，G_t，...，G_T分别通过步骤B4，得到每个异构传播图快照的节点表征向量集

然后将各快照的节点表征向量集

分别输入到旋转记忆单元RUM中，得到快照记忆表征向量集h_t；然后将帖子节点s_i在各快照中的记忆表征向量拼接，得到帖子节点s_i的记忆表征向量矩阵H_i；再将H_i输入到时序注意力中，并通过池化操作得到帖子节点s_i的动态信息表征向量B^s；

步骤B6：将步骤B3得到的帖子基于评论的文本细粒度语义表征向量X^sr与步骤B5得到的帖子的动态信息表征向量B^s相拼接，得到帖子最终表征向量V^f；随后将V^f输入全连接层和softmax函数，得到预测结果；然后根据目标损失函数loss，通过反向传播方法计算深度学习网络模型中各参数的梯度，并利用随机梯度下降方法更新各参数；

步骤B7：当深度学习网络模型每次迭代产生的损失值变化小于所给定阈值或者达到最大迭代次数，则终止深度学习网络模型的训练过程。

进一步地，所述步骤B1具体包括以下步骤：

步骤B11：对训练数据集DE进行遍历，同时对帖子的文本内容和评论内容进行分词处理并去除特殊符号和停用词，DE中的每个训练样本表示为de＝(s_i，R_i，U_i，c)；其中，s_i为帖子的文本内容，R_i为帖子s_i相应的评论集合，R_i＝{r₁，…，r_m}，U_i为参与转发或评论帖子s_i的用户信息集合，

p为帖子对应的真实性标签，c∈{非谣言，假谣言，真谣言，未经证实的谣言}；

帖子的文本内容s_i表示为：

其中，

为帖子文本内容s_i中的第t个词，t＝1，2，…，n，n为帖子文本内容s_i的词语数量；

帖子的评论内容r_j表示为：

其中，

为评论内容r_j中的第t个词，i＝1，2，…，m，m为评论内容r_j的词语数量；

步骤B12：对步骤B11得到文本内容

进行编码，得到文本内容s_i的初始表征向量E^s；E^s表示为：

其中，

表示从预训练的词向量矩阵

中查找得到的词嵌入表征向量，

为第t个词

所对应的词嵌入表征向量，d表示词嵌入表征向量的维度，|V|表示词典V中的词语数；

步骤B13：对步骤B11得到评论内容

进行编码，得到评论内容r_j的初始表征向量E^r；E^r表示为：

其中，

表示从预训练的词向量矩阵

中查找得到的词嵌入表征向量，

表示第j个词

所对应的词嵌入表征向量，d表示词嵌入表征向量的维度，|V|是词典V中的词语数；

步骤B14：通过将粉丝数量、关注数量、是否经过官方认证作为用户特征，对步骤B11得到用户信息u_k进行编码，得到用户初始表征向量

其中d为特征向量的维度。

进一步地，所述步骤B2具体包括以下步骤：

步骤B21：将文本内容s_i的初始表征向量E^s作为矩阵Q′，帖子相应评论内容集合R_i＝{r₁，…，r_m}的初始表征向量E^r作为K′和V′，分别对帖子的每一条评论r_j进行多头交叉注意力，得到评论内容的词级表征向量C^r，其计算过程如下：

C^r＝MultiHead(E^s，E^r，E^r)

MultiHead(Q′，K′，V′)＝Concat(head₁，…，head_h)W_o

其中，MultiHead表示多头注意力机制，h是并行头数，

是线性投影的权重矩阵，

是比例因子，head_i表示第i个注意力函数的输出，i∈[1，h]；

步骤B22：将文本内容初始表征向量E^s作为矩阵Q′、K′和V′输入到多头自注意力机制中，得到文本内容的词级表征向量C^s，其计算过程如下：

C^s＝MultiHead(E^s，E^s，E^s)

MultiHead(Q′，K′，V′)＝Concat(head₁，…，head_h)W_o

其中，MultiHead表示多头注意力机制，h是并行头数，

是线性投影的权重矩阵，

是比例因子，head_i表示第i个注意力函数的输出，i∈[1，h]；

步骤B23：将评论内容的词级表征向量Cr和文本内容的词级表征向量C^s分别输入到池化层中进行平均池化操作，得到评论内容的句子级表征向量

和文本内容的句子级表征向量

其计算过程如下：

其中，

MeanPool(·)表示平均池化函数。

进一步地，所述步骤B3具体包括以下步骤：

步骤B31：将帖子相应所有评论内容的句子级表征向量

进行拼接，得到评论内容的句子级表征矩阵T^r，同时将文本内容的句子级表征向量

复制m次，得到文本内容的句子级表征矩阵T^s，其计算过程如下：

其中，矩阵

表示第t个评论的句子级表征向量；

步骤B32：将文本内容的句子级表征矩阵T^s作为Q′，评论内容的句子级表征矩阵T^r作为矩阵K′和V′，一起输入到多头交叉注意力机制中，并通过平均池化得到评论内容的综合语义表征向量

其计算过程如下：

T′＝MultiHead(T^s，T^r，T^r)

MultiHead(Q′，K′，V′)＝Concat(head₁，…，head_h)W_o

其中，MeanPool(·)表示平均池化函数，MultiHead表示多头注意力机制，h是并行头数，

是线性投影的权重矩阵，

是比例因子，head_i表示第i个注意力函数的输出，i∈[1，h]；

步骤B33：将文本内容的句子级表征向量

和评论内容的综合语义表征向量

共同输入到融合门控机制中，得到帖子s_i基于评论的文本细粒度语义表征向量X^sr，其计算过程如下：

其中，σ(·)是sigmoid激活函数，

和

是融合门控机制中可学习参数。

进一步地，所述步骤B4具体包括以下步骤：

步骤B41：根据用户转发或评论的时间，设置T个快照时间点，构建T个异构传播图G₁，...，G_t，...，G_T；其中，G_t＝(V_t，E_t)表示为第t个异构传播图快照，节点集V_t包含数据集DE在第t个时间点中的所有帖子节点、发布帖子的用户节点和转发或评论帖子的用户节点，边集合V_t包含发布、转发和评论关系；并将步骤B1得到的文本内容的初始表征向量E^s和用户初始表征向量E^u作为各节点的初始表征向量；

步骤B42：将第t个异构传播图快照G_t＝(V_t，E_t)输入到多层图神经网络HGN中，HGN为不同类型的节点和边提供相应的线性映射函数，最大程度建模不同类型节点的分布差异性，捕获不同节点对之间的语义关联，得到帖子节点s_i与邻接用户节点的注意力分布向量A^HGN和邻接用户节点的信息表征向量I^HGN，其计算过程如下：

A^HGN＝Softmax(Concat(head¹，…，head^k))

I^HGN＝Concat(Info_head¹(u，e，s_i)，…，Info_head^H(u，e，s_i))

其中，k∈[1，H]，τ(s_i)表示节点s_i的类型，φ(e)表示边e的类型，

分别表示为τ(s_i)和τ(u)类型节点的线性映射函数，

表示τ(u)类型节点的线性映射函数，

表示φ(e)类型边的权重矩阵，Concat(·)为拼接函数，H为并行头数；

步骤B43：将帖子s_i邻接的所有用户节点的注意力分布向量A^HGN作为权重聚合所有邻接用户节点的信息表征向量I^HGN，得到第t个异构传播图快照中帖子节点s_i的信息表征向量

并通过根节点增强得到节点s_i的增强信息表征向量

最后，经过L层HGN后得到帖子节点s_i传播结构信息表征向量

其计算过程如下：

P_u＝A^HGN·I^HGN

其中，

表示将帖子节点映射回对应类别的特征分布空间，σ(·)为非线性激活函数。

进一步地，所述步骤B5具体包括以下步骤：

步骤B51：将所有异构传播图快照G₁，...，Gt，_...，G_T分别通过步骤B4，得到每个异构传播图快照的节点表征向量集

其中t表示第t个快照，i表示第i个帖子节点，d是每个节点嵌入的维度；在每个时间步长t，将节点表征向量集

作为z_t输入到旋转记忆单元RUM中，得到快照记忆表征向量集

其计算过程如下：

u_t＝sigmoid(u′_t)

其中，σ(·)是非线性激活函数，⊙是逐元素矩阵乘法运算，

是可训练的参数，λ和η是可设置的系数，d是输入向量的维度，l是隐藏层神经元数，||·||是L₂正则化操作；

步骤B52：将帖子节点s_i在各快照中的记忆表征向量拼接，得到帖子节点s_i的记忆表征向量矩阵H_i，

然后将H_i输入到时序注意力中，并通过池化操作得到帖子节点s_i的动态信息表征向量B^s，其计算过程如下：

B^s＝MeanPool(Zⁱ)

其中，MeanPool(·)表示平均池化函数，

是可训练参数，

表示掩码矩阵；如果M_u，v＝-∞，则意味着时间u到v不记录注意力系数；当时间u≤v时，设置M_u，v＝0；否则M_u，v＝--∞。

进一步地，所述步骤B6具体包括以下步骤：

步骤B61：将步骤B33得到的文本细粒度语义表征向量X^sr和步骤B52得到的动态信息表征向量B^s进行连接，得到最终表征向量V^f，计算公式如下：

V^f＝Concat(X^sr，B^s)

步骤B62：将最终表征向量V^f输入到全连接层，并使用softmax归一化，计算帖子文本内容属于各类别的概率，计算公式如下：

y＝W_oV^f+b

p^c(y)＝softmax(y)

其中，y是全连接层的输出向量，

为全连接层权重矩阵，b为全连接层的偏置项，p^c(y)是预测该文本内容对应类别为c的概率，0≤p^c(y)≤1，c∈{非谣言，假谣言，真谣言，未经证实的谣言}；

步骤B63：用交叉熵作为损失函数计算损失值，通过梯度优化算法Adam对学习率进行更新，利用反向传播迭代更新模型参数，以最小化损失函数来训练模型；最小化损失函数loss的计算公式如下：

其中，

是L2正则化项，λ是学习率，θ为模型包含的所有参数。

本发明还提供了采用上述方法的基于动态异构图和多级注意力的谣言检测系统，包括：

数据收集模块，用于提取社交平台中帖子的文本内容、评论内容和相关用户信息，并对帖子的真实性进行标注，构建训练数据集；

文本处理模块，用于对训练数据集中的训练样本进行预处理；

文本编码模块，用于在预训练的词向量矩阵中查找经过预处理的文本内容和评论内容中词的词向量，得到文本内容的初始表征向量和评论内容的初始表征向量；

用户编码模块，用于根据多种用户特征对用户信息进行编码，得到用户初始表征向量；

传播图构造模块，用于根据用户转发或评论的时间，构建多个异构传播图快照，并将文本内容的初始表征向量和用户初始表征向量作为各节点的初始表征向量；

网络模型训练模块，用于将文本内容的初始表征向量、评论内容的初始表征向量和异构传播图快照输入到深度学习网络中，得到帖子的最终表征向量，利用该表征向量预测属于某一类别的概率，并通过与训练数据集中的真实类别标注作对比计算损失，以最小化损失为目标来对整个深度学习网络进行训练，得到基于动态异构图和多级注意力的深度学习网络模型；

谣言检测模块，用于检测帖子的真实性，利用训练好的基于动态异构图和多级注意力的深度学习网络模型对输入的待检测帖子进行分析处理，提取帖子基于评论的文本语义信息和异构传播图中的结构信息和动态信息，输出预测的帖子真实性标签。

与现有技术相比，本发明具有以下有益效果：提供了一种基于动态异构图和多级注意力的谣言检测方法及系统，该方法及系统通过构建基于动态异构图和多级注意力的深度学习网络模型来分析帖子的真实性并预测帖子的真实性标签，可以有效提高谣言检测的准确性，具有很强的实用性和广阔的应用前景。

附图说明

图1是本发明实施例的方法实现流程图；

图2是本发明实施例中模型架构图；

图3是本发明实施例的系统结构示意图。

具体实施方式

下面结合附图及实施例对本发明做进一步说明。

应该指出，以下详细说明都是示例性的，旨在对本申请提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本申请的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

如图1所示，本实施例提供了一种基于动态异构图和多级注意力的谣言检测方法，包括以下步骤：

步骤A：在社交平台中采集帖子，提取帖子中的文本内容、评论内容和相关用户信息，并标注帖子的真实性标签，以此构建训练数据集DE。

步骤B：使用训练数据集DE训练基于动态异构图和多级注意力的深度学习网络模型，得到如图2所示的深度学习网络模型，通过此模型来分析帖子的真实性，并预测帖子的真实性标签。

在本实施例中，所述步骤B具体包括以下步骤：

步骤B1：对训练数据集DE中的所有训练样本进行初始编码，得到文本内容的初始表征向量E^s、评论内容的初始表征向量E^r和用户初始表征向量E^u。所述步骤B1具体包括以下步骤：

帖子的文本内容s_i表示为：

其中，

为帖子文本内容s_i中的第t个词，t＝1，2，…，n，n为帖子文本内容s_i的词语数量。

帖子的评论内容r_j表示为：

其中，

为评论内容r_j中的第t个词，i＝1，2，…，m，m为评论内容r_j的词语数量。

步骤B12：对步骤B11得到文本内容

进行编码，得到文本内容s_i的初始表征向量E^s；E^s表示为：

其中，

表示从预训练的词向量矩阵

中查找得到的词嵌入表征向量，

为第t个词

所对应的词嵌入表征向量，d表示词嵌入表征向量的维度，|V|表示词典V中的词语数。

步骤B13：对步骤B11得到评论内容

进行编码，得到评论内容r_j的初始表征向量E^r；E^r表示为：

其中，

表示从预训练的词向量矩阵

中查找得到的词嵌入表征向量，

表示第j个词

所对应的词嵌入表征向量，d表示词嵌入表征向量的维度，|V|是词典V中的词语数。

步骤B14：通过将粉丝数量、关注数量、是否经过官方认证等作为用户特征，对步骤B11得到用户信息u_k进行编码，得到用户初始表征向量

其中d为特征向量的维度。

和文本内容的句子级表征向量

所述步骤B2具体包括以下步骤：

C^r＝MultiHead(E^s，E^r，E^r)

MultiHead(Q′，K′，V′)＝Concat(head₁，…，head_h)W_o

其中，MultiHead表示多头注意力机制，h是并行头数，

是线性投影的权重矩阵，

是比例因子，headi表示第i个注意力函数的输出，i∈[1，h]。

C^s＝MultiHead(E^s，E^s，E^s)

MultiHead(Q′，K′，V′)＝Concat(head₁，…，head_h)W_o

其中，MultiHead表示多头注意力机制，h是并行头数，

是线性投影的权重矩阵，

是比例因子，headi表示第i个注意力函数的输出，i∈[1，h]。

步骤B23：将评论内容的词级表征向量C^r和文本内容的词级表征向量C^s分别输入到池化层中进行平均池化操作，得到评论内容的句子级表征向量

和文本内容的句子级表征向量

其计算过程如下：

其中，

MeanPool(·)表示平均池化函数。

步骤B3：将帖子对应的所有评论内容的句子级表征向量

然后将文本内容的句子级表征向量

和评论内容的综合语义表征向量

输入到融合门控机制中，得到帖子基于评论的文本细粒度语义表征向量X^sr。所述步骤B3具体包括以下步骤：

步骤B31：将帖子相应所有评论内容的句子级表征向量

其中，矩阵

表示第t个评论的句子级表征向量。

其计算过程如下：

T′＝MultiHead(T^s，T^r，T^r)

MultiHead(Q′，K′，V′)＝Concat(head₁，…，head_h)W_o

是线性投影的权重矩阵，

是比例因子，head_i表示第i个注意力函数的输出，i∈[1，h]。

步骤B33：将文本内容的句子级表征向量

和评论内容的综合语义表征向量

其中，σ(·)是sigmoid激活函数，

和

是融合门控机制中可学习参数。

并经过L层HGN后得到帖子节点s_i传播结构信息表征向量

所述步骤B4具体包括以下步骤：

步骤B41：根据用户转发或评论的时间，设置T个快照时间点，构建T个异构传播图G₁，...，G_t，...，G_T；其中，G_t＝(V_t，E_t)表示为第t个异构传播图快照，节点集V_t包含数据集DE在第t个时间点中的所有帖子节点、发布帖子的用户节点和转发或评论帖子的用户节点，边集合V_t包含发布、转发和评论关系；并将步骤B1得到的文本内容的初始表征向量E^s和用户初始表征向量E^u作为各节点的初始表征向量。

A^HGN＝softmax(Concat(head¹，…，head^k))

I^HGN＝Concat(Info_head¹(u，e，s_i)，…，Info_head^H(u，e，s_i))

分别表示为τ(s_i)和τ(u)类型节点的线性映射函数，

表示τ(u)类型节点的线性映射函数，

表示φ(e)类型边的权重矩阵，Concat(·)为拼接函数，H为并行头数。

并通过根节点增强得到节点s_i的增强信息表征向量

最后，经过L层HGN后得到帖子节点s_i传播结构信息表征向量

其计算过程如下：

P_u＝A^HGN·I^HGN

其中，

然后将各快照的节点表征向量集

分别输入到旋转记忆单元RUM中，得到快照记忆表征向量集h_t；然后将帖子节点s_i在各快照中的记忆表征向量拼接，得到帖子节点s_i的记忆表征向量矩阵H_i；再将H_i输入到时序注意力中，并通过池化操作得到帖子节点s_i的动态信息表征向量B^s。所述步骤B5具体包括以下步骤：

步骤B51：将所有异构传播图快照G₁，...，G_t，...，G_T分别通过步骤B4，得到每个异构传播图快照的节点表征向量集

作为z_t输入到旋转记忆单元RUM中，得到快照记忆表征向量集

其计算过程如下：

u_t＝sigmoid(u′_t)

其中，σ(·)是非线性激活函数，⊙是逐元素矩阵乘法运算，

是可训练的参数，λ和η是可设置的系数，d是输入向量的维度，l是隐藏层神经元数，||·||是L₂正则化操作。

B^s＝MeanPool(Zⁱ)

其中，MeanPool(·)表示平均池化函数，

是可训练参数，

表示掩码矩阵；如果M_u，v＝-∞，则意味着时间u到v不记录注意力系数；当时间u≤v时，设置M_u，v＝0；否则M_u，v＝-∞。

步骤B6：将步骤B3得到的帖子基于评论的文本细粒度语义表征向量X^sr与步骤B5得到的帖子的动态信息表征向量B^s相拼接，得到帖子最终表征向量V^f；随后将V^f输入全连接层和softmax函数，得到预测结果；然后根据目标损失函数loss，通过反向传播方法计算深度学习网络模型中各参数的梯度，并利用随机梯度下降方法更新各参数。所述步骤B6具体包括以下步骤：

V^f＝Concat(X^sr，B^s)

y＝W_oV^f+b

p^c(y)＝softmax(y)

其中，y是全连接层的输出向量，

为全连接层权重矩阵，b为全连接层的偏置项，p^c(y)是预测该文本内容对应类别为c的概率，0≤p^c(y)≤1，c∈{非谣言，假谣言，真谣言，未经证实的谣言}。

其中，

是L2正则化项，λ是学习率，θ为模型包含的所有参数。

如图3所示，本实施例还提供了采用上述方法的基于动态异构图和多级注意力的谣言检测系统，包括数据收集模块、文本处理模块、文本编码模块、用户编码模块、传播图构造模块、网络模型训练模块和谣言检测模块。

所述数据收集模块用于提取社交平台中帖子的文本内容、评论内容和相关用户信息，并对帖子的真实性进行标注，构建训练数据集。

所述文本处理模块用于对训练数据集中的训练样本进行预处理，包括分词处理、去除停用词等。

所述文本编码模块用于在预训练的词向量矩阵中查找经过预处理的文本内容和评论内容中词的词向量，得到文本内容的初始表征向量和评论内容的初始表征向量。

所述用户编码模块用于根据多种用户特征对用户信息进行编码，得到用户初始表征向量。

所述传播图构造模块用于根据用户转发(或评论)的时间，构建多个异构传播图快照，并将文本内容的初始表征向量和用户初始表征向量作为各节点的初始表征向量。

所述网络模型训练模块用于将文本内容的初始表征向量、评论内容的初始表征向量和异构传播图快照输入到深度学习网络中，得到帖子的最终表征向量，利用该表征向量预测属于某一类别的概率，并通过与训练数据集中的真实类别标注作对比计算损失，以最小化损失为目标来对整个深度学习网络进行训练，得到基于动态异构图和多级注意力的深度学习网络模型。

所述谣言检测模块用于检测帖子的真实性，利用训练好的基于动态异构图和多级注意力的深度学习网络模型对输入的待检测帖子进行分析处理，提取帖子基于评论的文本语义信息和异构传播图中的结构信息和动态信息，输出预测的帖子真实性标签。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述，仅是本发明的较佳实施例而已，并非是对本发明作其它形式的限制，任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例。但是凡是未脱离本发明技术方案内容，依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型，仍属于本发明技术方案的保护范围。

Claims

1.一种基于动态异构图和多级注意力的谣言检测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于动态异构图和多级注意力的谣言检测方法，其特征在于，所述步骤B具体包括以下步骤：

和文本内容的句子级表征向量

步骤B3：将帖子对应的所有评论内容的句子级表征向量

然后将文本内容的句子级表征向量

和评论内容的综合语义表征向量

步骤B4：根据用户转发或评论的时间，构建T个异构传播图快照G₁,…,G_t,…,G_T；将任意一个异构传播图快照输入到多层图神经网络HGN中，先得到帖子节点与邻接用户节点的注意力分布向量A^HGN和邻接用户节点的信息表征向量I^HGN；然后再将注意力分布作为权重聚合邻接用户节点的信息，得到第t个异构传播图快照中帖子节点的信息表征向量

并经过L层HGN后得到帖子节点s_i传播结构信息表征向量

步骤B5：将所有异构传播图快照G₁,…,G_t,…,G_T分别通过步骤B4，得到每个异构传播图快照的节点表征向量集

然后将各快照的节点表征向量集

3.根据权利要求2所述的基于动态异构图和多级注意力的谣言检测方法，其特征在于，所述步骤B1具体包括以下步骤：

步骤B11：对训练数据集DE进行遍历，同时对帖子的文本内容和评论内容进行分词处理并去除特殊符号和停用词，DE中的每个训练样本表示为de＝(s_i,R_i,U_i,c)；其中，s_i为帖子的文本内容，R_i为帖子s_i相应的评论集合，R_i＝{r₁,…,r_m}，U_i为参与转发或评论帖子s_i的用户信息集合，

帖子的文本内容s_i表示为：

其中，

为帖子文本内容s_i中的第t个词，t＝1,2,…,n，n为帖子文本内容s_i的词语数量；

帖子的评论内容r_j表示为：

其中，

为评论内容r_j中的第t个词，i＝1,2,…,m，m为评论内容r_j的词语数量；

步骤B12：对步骤B11得到文本内容

进行编码，得到文本内容s_i的初始表征向量E^s；E^s表示为：

其中，

表示从预训练的词向量矩阵

中查找得到的词嵌入表征向量，

为第t个词

步骤B13：对步骤B11得到评论内容

进行编码，得到评论内容r_j的初始表征向量E^r；E^r表示为：

其中，

表示从预训练的词向量矩阵

中查找得到的词嵌入表征向量，

表示第j个词

其中d为特征向量的维度。

4.根据权利要求3所述的基于动态异构图和多级注意力的谣言检测方法，其特征在于，所述步骤B2具体包括以下步骤：

步骤B21：将文本内容s_i的初始表征向量E^s作为矩阵Q'，帖子相应评论内容集合R_i＝{r₁,…,r_m}的初始表征向量E^r作为K'和V'，分别对帖子的每一条评论r_j进行多头交叉注意力，得到评论内容的词级表征向量C^r，其计算过程如下：

C^r＝MultiHead(E^s,E^r,E^r)

MultiHead(Q′,K′,V′)＝Concat(head₁,…,head_h)W_o

其中，MultiHead表示多头注意力机制，h是并行头数，

是线性投影的权重矩阵，

是比例因子，head_i表示第i个注意力函数的输出，i∈[1,h]；

步骤B22：将文本内容初始表征向量E^s作为矩阵Q'、K'和V'输入到多头自注意力机制中，得到文本内容的词级表征向量C^s，其计算过程如下：

C^s＝MultiHead(E^s,E^s,E^s)

MultiHead(Q′,K′,V′)＝Concat(head₁,…,head_h)W_o

其中，MultiHead表示多头注意力机制，h是并行头数，

是线性投影的权重矩阵，

是比例因子，head_i表示第i个注意力函数的输出，i∈[1,h]；

和文本内容的句子级表征向量

其计算过程如下：

其中，

MeanPool(·)表示平均池化函数。

5.根据权利要4所述的基于动态异构图和多级注意力的谣言检测方法，其特征在于，所述步骤B3具体包括以下步骤：

步骤B31：将帖子相应所有评论内容的句子级表征向量

其中，矩阵

表示第t个评论的句子级表征向量；

步骤B32：将文本内容的句子级表征矩阵T^s作为Q'，评论内容的句子级表征矩阵T^r作为矩阵K'和V'，一起输入到多头交叉注意力机制中，并通过平均池化得到评论内容的综合语义表征向量

其计算过程如下：

T′＝MultiHead(T^s,T^r,T^r)

MultiHead(Q′,K′,V′)＝Concat(head₁,…,head_h)W_o

是线性投影的权重矩阵，

是比例因子，head_i表示第i个注意力函数的输出，i∈[1,h]；

步骤B33：将文本内容的句子级表征向量

和评论内容的综合语义表征向量

其中，σ(·)是sigmoid激活函数，

和

是融合门控机制中可学习参数。

6.根据权利要求5所述的基于动态异构图和多级注意力的谣言检测方法，其特征在于，所述步骤B4具体包括以下步骤：

步骤B41：根据用户转发或评论的时间，设置T个快照时间点，构建T个异构传播图G₁,…,G_t,…,G_T；其中，G_t＝(V_t,E_t)表示为第t个异构传播图快照，节点集V_t包含数据集DE在第t个时间点中的所有帖子节点、发布帖子的用户节点和转发或评论帖子的用户节点，边集合V_t包含发布、转发和评论关系；并将步骤B1得到的文本内容的初始表征向量E^s和用户初始表征向量E^u作为各节点的初始表征向量；

步骤B42：将第t个异构传播图快照G_t＝(V_t,E_t)输入到多层图神经网络HGN中，HGN为不同类型的节点和边提供相应的线性映射函数，最大程度建模不同类型节点的分布差异性，捕获不同节点对之间的语义关联，得到帖子节点s_i与邻接用户节点的注意力分布向量A^HGN和邻接用户节点的信息表征向量I^HGN，其计算过程如下：