CN116542257A

CN116542257A - 一种基于会话语境感知的谣言检测方法

Info

Publication number: CN116542257A
Application number: CN202310828763.4A
Authority: CN
Inventors: 黄惟; 康占英; 刘优; 徐伯辰; 肖峰; 王青; 袁泽丰; 李芳芳
Original assignee: Changsha Zhiwei Information Technology Co ltd
Current assignee: Changsha Zhiwei Information Technology Co ltd
Priority date: 2023-07-07
Filing date: 2023-07-07
Publication date: 2023-08-04
Anticipated expiration: 2043-07-07
Also published as: CN116542257B

Abstract

本申请涉及一种基于会话语境感知的谣言检测方法，该方法包括：获取原帖、原贴对应的评论以及评论的语义信息；并将原帖与原贴对应的评论进行拼接，得到拼接文本；对拼接文本进行编码，得到词嵌入；并将词嵌入输入至多评论注意力机制粒度掩码BERT模型，得到模型输出；根据模型输出得到最终会话编码；最终会话编码为以各所述原贴对应的评论为节点的传播图；基于传播图，并根据评论的语义信息，计算出各节点对应的融合评论立场的语义特征；将融合评论立场的语义特征输入至图卷积网络，输出谣言分类结果。该方法能够提高谣言检测的精度，并在谣言传播的早期阶段仍能具有良好的检测能力。

Description

一种基于会话语境感知的谣言检测方法

技术领域

本申请涉及谣言检测技术领域，特别是涉及一种基于会话语境感知的谣言检测方法。

背景技术

文本分类是自然语言处理中最为重要的子任务之一，而谣言检测则是文本分类任务中的一种特殊任务。基于深度学习的方法在谣言检测方面取得了不错的效果，但在谣言传播早期等特征内容较少的时候，仍然难以准确识别，其主要面临着以下问题：

1、传统的基于文本的谣言检测方法在提取特征的时候，只利用原帖的文本来进行特征提取。而在谣言检测任务中，对于原帖的评论同样包含了很多信息，可以从评论对于原帖的情感倾向等信息中获取到关于原帖是否真实的信息。在面对一条来自未知领域的帖子时，能够根据了解该领域的其他用户的评论来度量原帖的真实性。此外，在进行特征提取的时候，使用普通的注意力机制会在不同帖子特征提取的过程中产生相互干扰，影响最终判断精度。

2、传统的谣言检测方法直接使用评论文本进行特征提取只能捕获到基础的语义信息，而没有注意到评论的立场会对父节点的语义产生影响。例如：评论中表达支持立场的，会让父节点的可信度增加；表达反对立场的，会让父节点的可信度降低。而众多评论立场不一，需要对这些评论立场的影响进行综合计量，以重新调整父节点的语义特征。

3、传统的基于文本的谣言检测方法在利用谣言语义特征的时候，没有使用到谣言局部传播过程中的结构特征，这些传播结构在面对谣言传播早期出现的评论少、传播结构简单、关注度低等特点时，能够起到至关重要的信息增强作用。而只利用文本语义特征来进行谣言检测是远远不够的，浪费了结构特征会导致最终检测精度不高。

发明内容

基于此，有必要针对上述技术问题提供一种基于会话语境感知的谣言检测方法。

本发明提供了一种基于会话语境感知的谣言检测方法，该方法包括：

S1：获取原帖、原贴对应的评论以及评论的语义信息；并将所述原帖与所述原贴对应的评论进行拼接，得到拼接文本；

S2：对所述拼接文本进行编码，得到词嵌入；并将所述词嵌入输入至多评论注意力机制粒度掩码BERT模型，得到模型输出；根据所述模型输出得到最终会话编码；所述最终会话编码为以各所述原贴对应的评论为节点的传播图；

S3：基于所述传播图，并根据所述评论的语义信息，计算出各节点对应的融合评论立场的语义特征；

S4：将所述融合评论立场的语义特征输入至图卷积网络，输出谣言分类结果。

优选的，S1中，得到拼接文本的过程包括：

所述原帖和所述原帖对应的评论组成帖子文本集合；采用分割字符、结尾符号以及拼接运算符对帖子文本集合中的所有文本进行拼接，得到所述拼接文本，计算公式为：

；

其中，表示第i个原帖的拼接文本；cls表示分割字符；||表示拼接运算符；sep表示结尾符号；/>表示第i个原帖的文本内容；/>表示第i个原帖对应的第1条评论的文本内容。

优选的，S2中，对所述拼接文本进行编码，得到词嵌入包括：

对所有所述拼接文本进行词编码，并融入分割编码和位置编码，得到词嵌入；计算公式为：

；

其中，E(V ^c)表示词嵌入；E _tok(·)表示词编码；E _seg(·)表示分割编码；E _pos(·)表示位置编码；V ^c表示所有拼接文本。

优选的，S2中，所述词嵌入输入至多评论注意力机制粒度掩码BERT模型包括编码器，所述编码器包括n层，在前k层设置有注意力掩码机制，在n-k层设置有标准注意力机制；

所述词嵌入作为编码器的输入，得到模型输出；计算公式为：

；

其中，表示第a层的模型输出；AtM()表示注意力掩码机制计算公式；At()表示标准注意力机制计算公式；/>表示第a-1层的模型输出；/>表示训练得到的查询权重矩阵；/>表示训练得到的键权重矩阵；/>表示值权重矩阵。

优选的，所述注意力掩码机制计算公式表示为：

；

其中，Q表示词嵌入与查询权重矩阵相乘得到的查询矩阵；K表示词嵌入与键权重矩阵相乘得到的键矩阵；V表示词嵌入与值权重矩阵相乘得到的值矩阵；T表示转置；d表示维度；M表示设置的掩码屏蔽矩阵；

所述标准注意力机制计算公式表示为：

。

优选的，S2中，对于多评论注意力机制粒度掩码BERT模型最后一层得到的所述模型输出，剔除其中分割字符对应的特征，得到所述最终会话编码；第i个原帖的所述最终会话编码表示为：；/>表示第i个原帖的传播图中的第1个节点；/>表示第i个原帖的传播图中的第n _i个节点；n _i表示第i个原帖对应的评论的数量。

优选的，S3中，得到各节点对应的融合评论立场的语义特征的过程包括：

S3.1：将原帖的所述传播图作为树，其中的每条评论形成的节点均为上一级文本的子节点；则所述树表示为：；其中，X为评论的语义信息，E为所有边的集合；将第i个原帖的传播图中的所有节点与其对应的评论的语义信息融合，得到立场信息；计算公式为：

；

其中，表示第i个原帖的所述传播图中第g个节点的立场信息；x _g表示第g个节点对应的评论的语义信息；x _h表示第h个节点对应的评论的语义信息；N(g)表示第g个节点的所有子节点的集合；

S3.2：将第g个节点的立场信息融入其父节点中，得到第一融合特征；计算公式为：

；

其中，表示第g个节点的父节点的第一融合特征；||表示拼接运算符；/>表示第g个节点与第h个节点之间的边；

S3.3：采用线性层对所述第g个节点的父节点的第一融合特征进行降维，得到第个节点对应的融合评论立场的语义特征；计算公式为：

；

其中，表示第/>个节点对应的融合评论立场的语义特征；/>表示激活函数；W ₁和b ₁为不同的可训练参数；

S3.4：重复执行S3.1-S3.3直至计算完原帖的传播图中所有的节点对应的融合评论立场的语义特征，结束循环；第i个原帖的传播图中所有的节点对应的融合评论立场的语义特征表示为：；/>表示第i个原帖的传播图中的第1个节点对应的融合评论立场的语义特征；/>表示第i个原帖的传播图中的第N个节点对应的融合评论立场的语义特征。

优选的，S4中，将所述融合评论立场的语义特征输入至图卷积网络，输出谣言分类结果包括：

S4.1：将计算出的所述融合评论立场的语义特征与原贴的传播图的邻接矩阵一同输入至图卷积网络中，进行快速卷积操作；图卷积网络中每层的快速卷积操作公式为：

；

其中，表示第/>+1层的输出；/>表示激活函数；/>，/>表示相加矩阵；A表示原帖的传播图的邻接矩阵，I _Z表示融合评论立场的语义特征的自传递矩阵；/>表示相加矩阵中各个元素的度；/>表示第/>层的输出；/>表示第/>层的权重矩阵；

S4.2：经过图卷积网络的层快速卷积操作后，得到融合增强特征表示；计算公式为：

；

其中，S ⁱ表示第i个原帖的融合增强特征表示；GCN()表示图卷积网络；表示第i个原帖的传播图中所有的节点对应的融合评论立场的语义特征；

S4.3：对所述融合增强特征表示使用均值运算，并通过全连接层以及Softmax函数输出分类结果；计算公式为：

；

其中，表示第i个原帖的分类结果；/>和/>为全连接层中不同的训练参数矩阵；表示均值运算。

优选的，S4中，还包括优化分类过程：

步骤1：获取真实标注的标签；

步骤2：根据所述分类结果与所述真实标注的标签计算两者之间的交叉熵损失函数，并最小化所述交叉熵损失函数，以优化分类过程；计算公式为：

；

其中，表示交叉熵损失函数；/>表示第i个原帖的真实标注的标签；/>表示第i个原帖的分类结果。

优选的，所述掩码屏蔽矩阵中元素的计算公式为：

；

其中，M _uv表示掩码屏蔽矩阵中第u行第v列的取值，Q _u表示第u条评论的查询矩阵；K _v表示第v条评论的键矩阵；表示Q _u与K _v来自同一原帖；/>表示Q _u与K _v来自不同原帖。

有益效果：为了解决传统谣言检测方法存在的问题，本发明提供的这种方法在局部会话特征提取时，将会话中的所有帖子和评论文本拼接起来作为输入，充分利用评论中的信息；同时在编码器的前几层将不同会话间的注意力屏蔽，避免不同会话间注意力的干扰；而且还将来自评论中的支持或反对的立场信息融入到编码中；最后捕获推文间的传播特征。该方法能够提高谣言检测的精度，并在谣言传播的早期阶段仍能具有良好的检测能力。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例的基于会话语境感知的谣言检测方法的流程图。

具体实施方式

为使本申请的上述目的、特征和优点能够更加明显易懂，下面结合附图对本申请的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本申请内涵的情况下做类似改进，因此本申请不受下面公开的具体实施例的限制。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

如图1所示，本实施例提供了一种基于会话语境感知的谣言检测方法，该方法包括：

S1：获取原帖、原贴对应的评论以及评论的语义信息；并将所述原帖与所述原贴对应的评论进行拼接，得到拼接文本。

具体的，得到拼接文本的过程包括：

；

S2：对所述拼接文本进行编码，得到词嵌入；并将所述词嵌入输入至多评论注意力机制粒度掩码BERT模型，得到模型输出；根据所述模型输出得到最终会话编码；所述最终会话编码为以各所述原贴对应的评论为节点的传播图。

具体的，对所述拼接文本进行编码，得到词嵌入包括：

；

所述词嵌入输入至多评论注意力机制粒度掩码BERT模型包括编码器，所述编码器包括n层，在前k层设置有注意力掩码机制，在n-k层设置有标准注意力机制；

；

所述注意力掩码机制计算公式表示为：

；

所述掩码屏蔽矩阵中元素的计算公式为：

；

所述标准注意力机制计算公式表示为：

。

对于多评论注意力机制粒度掩码BERT模型最后一层得到的所述模型输出，剔除其中分割字符对应的特征，得到所述最终会话编码；第i个原帖的所述最终会话编码表示为：；/>表示第i个原帖的传播图中的第1个节点；/>表示第i个原帖的传播图中的第n _i个节点；n _i表示第i个原帖对应的评论的数量。

S3：基于所述传播图，并根据所述评论的语义信息，计算出各节点对应的融合评论立场的语义特征。

具体的，每条评论根据其赞成或反对的立场，会对其父节点产生正面或负面的可信度影响，故此只获取原帖及其评论的编码还不够，本实施例设置了评论感知机制以得到各节点对应的融合评论立场的语义特征，其过程包括：

；

具体的，包括：

；

其中，表示第/>+1层的输出；/>表示激活函数；/>，/>表示相加矩阵；A表示原贴的传播图的邻接矩阵，I _Z表示融合评论立场的语义特征的自传递矩阵；/>表示相加矩阵中各个元素的度；/>表示第/>层的输出；/>表示第/>层的权重矩阵；

；

在本实施例中，还包括优化分类过程：

步骤1：获取真实标注的标签；

；

本实施例提供的这种基于会话语境感知的谣言检测方法具有以下有益效果：

1、为了解决传统谣言检测方法存在的问题，本发明提供的这种方法在局部会话特征提取时，将会话中的所有帖子和评论文本拼接起来作为输入，充分利用评论中的信息；同时在编码器的前几层将不同会话间的注意力屏蔽，避免不同会话间注意力的干扰；而且还将来自评论中的支持或反对的立场信息融入到编码中；最后捕获推文间的传播特征。该方法能够提高谣言检测的精度，并在谣言传播的早期阶段仍能具有良好的检测能力。

2、在该方法中，对每个节点都使用评论感知机制将来自评论的语义信息进行融合，有效利用了评论中的语义信息和连接关系，增强了会话结构中推文的语义表示，能够适应任何动态变化的评论立场。此外，本方法还将评论立场与原始特征信息进行拼合，以保留原始特征信息。

3、该方法采用了图卷积网络GCN来捕获推文间的传播特征，利用了更多的信息，能够有效应对谣言传播早期信息少的问题，提高了最终谣言检测的精度。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种基于会话语境感知的谣言检测方法，其特征在于，包括：

2.根据权利要求1所述的基于会话语境感知的谣言检测方法，其特征在于，S1中，得到拼接文本的过程包括：

；

3.根据权利要求2所述的基于会话语境感知的谣言检测方法，其特征在于，S2中，对所述拼接文本进行编码，得到词嵌入包括：

；

4.根据权利要求3所述的基于会话语境感知的谣言检测方法，其特征在于，S2中，所述词嵌入输入至多评论注意力机制粒度掩码BERT模型包括编码器，所述编码器包括n层，在前k层设置有注意力掩码机制，在n-k层设置有标准注意力机制；

；

其中，表示第a层的模型输出；AtM()表示注意力掩码机制计算公式；At()表示标准注意力机制计算公式；/>表示第a-1层的模型输出；/>表示训练得到的查询权重矩阵；表示训练得到的键权重矩阵；/>表示值权重矩阵。

5.根据权利要求4所述的基于会话语境感知的谣言检测方法，其特征在于，所述注意力掩码机制计算公式表示为：

；

所述标准注意力机制计算公式表示为：

。

6.根据权利要求4所述的基于会话语境感知的谣言检测方法，其特征在于，S2中，对于多评论注意力机制粒度掩码BERT模型最后一层得到的所述模型输出，剔除其中分割字符对应的特征，得到所述最终会话编码；第i个原帖的所述最终会话编码表示为：；/>表示第i个原帖的传播图中的第1个节点；/>表示第i个原帖的传播图中的第n _i个节点；n _i表示第i个原帖对应的评论的数量。

7.根据权利要求6所述的基于会话语境感知的谣言检测方法，其特征在于，S3中，得到各节点对应的融合评论立场的语义特征的过程包括：

；

8.根据权利要求7所述的基于会话语境感知的谣言检测方法，其特征在于，S4中，将所述融合评论立场的语义特征输入至图卷积网络，输出谣言分类结果包括：

；

其中，表示第/>+1层的输出；/>表示激活函数；/>，/>表示相加矩阵；A表示原帖的传播图的邻接矩阵，I _Z表示融合评论立场的语义特征的自传递矩阵；/>表示相加矩阵的中各个元素的度；/>表示第/>层的输出；/>表示第/>层的权重矩阵；

；

9.根据权利要求8所述的基于会话语境感知的谣言检测方法，其特征在于，S4中，还包括优化分类过程：

步骤1：获取真实标注的标签；

；

10.根据权利要求5所述的基于会话语境感知的谣言检测方法，其特征在于，所述掩码屏蔽矩阵中元素的计算公式为：

；