CN116542257B - 一种基于会话语境感知的谣言检测方法 - Google Patents

一种基于会话语境感知的谣言检测方法 Download PDF

Info

Publication number
CN116542257B
CN116542257B CN202310828763.4A CN202310828763A CN116542257B CN 116542257 B CN116542257 B CN 116542257B CN 202310828763 A CN202310828763 A CN 202310828763A CN 116542257 B CN116542257 B CN 116542257B
Authority
CN
China
Prior art keywords
comment
original
represent
representing
standpoint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310828763.4A
Other languages
English (en)
Other versions
CN116542257A (zh
Inventor
黄惟
康占英
刘优
徐伯辰
肖峰
王青
袁泽丰
李芳芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changsha Zhiwei Information Technology Co ltd
Original Assignee
Changsha Zhiwei Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changsha Zhiwei Information Technology Co ltd filed Critical Changsha Zhiwei Information Technology Co ltd
Priority to CN202310828763.4A priority Critical patent/CN116542257B/zh
Publication of CN116542257A publication Critical patent/CN116542257A/zh
Application granted granted Critical
Publication of CN116542257B publication Critical patent/CN116542257B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/042Knowledge-based neural networks; Logical representations of neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Liquid Crystal (AREA)
  • Digital Computer Display Output (AREA)

Abstract

本申请涉及一种基于会话语境感知的谣言检测方法,该方法包括:获取原帖、原贴对应的评论以及评论的语义信息;并将原帖与原贴对应的评论进行拼接,得到拼接文本;对拼接文本进行编码,得到词嵌入;并将词嵌入输入至多评论注意力机制粒度掩码BERT模型,得到模型输出;根据模型输出得到最终会话编码;最终会话编码为以各所述原贴对应的评论为节点的传播图;基于传播图,并根据评论的语义信息,计算出各节点对应的融合评论立场的语义特征;将融合评论立场的语义特征输入至图卷积网络,输出谣言分类结果。该方法能够提高谣言检测的精度,并在谣言传播的早期阶段仍能具有良好的检测能力。

Description

一种基于会话语境感知的谣言检测方法
技术领域
本申请涉及谣言检测技术领域,特别是涉及一种基于会话语境感知的谣言检测方法。
背景技术
文本分类是自然语言处理中最为重要的子任务之一,而谣言检测则是文本分类任务中的一种特殊任务。基于深度学习的方法在谣言检测方面取得了不错的效果,但在谣言传播早期等特征内容较少的时候,仍然难以准确识别,其主要面临着以下问题:
1、传统的基于文本的谣言检测方法在提取特征的时候,只利用原帖的文本来进行特征提取。而在谣言检测任务中,对于原帖的评论同样包含了很多信息,可以从评论对于原帖的情感倾向等信息中获取到关于原帖是否真实的信息。在面对一条来自未知领域的帖子时,能够根据了解该领域的其他用户的评论来度量原帖的真实性。此外,在进行特征提取的时候,使用普通的注意力机制会在不同帖子特征提取的过程中产生相互干扰,影响最终判断精度。
2、传统的谣言检测方法直接使用评论文本进行特征提取只能捕获到基础的语义信息,而没有注意到评论的立场会对父节点的语义产生影响。例如:评论中表达支持立场的,会让父节点的可信度增加;表达反对立场的,会让父节点的可信度降低。而众多评论立场不一,需要对这些评论立场的影响进行综合计量,以重新调整父节点的语义特征。
3、传统的基于文本的谣言检测方法在利用谣言语义特征的时候,没有使用到谣言局部传播过程中的结构特征,这些传播结构在面对谣言传播早期出现的评论少、传播结构简单、关注度低等特点时,能够起到至关重要的信息增强作用。而只利用文本语义特征来进行谣言检测是远远不够的,浪费了结构特征会导致最终检测精度不高。
发明内容
基于此,有必要针对上述技术问题提供一种基于会话语境感知的谣言检测方法。
本发明提供了一种基于会话语境感知的谣言检测方法,该方法包括:
S1:获取原帖、原贴对应的评论以及评论的语义信息;并将所述原帖与所述原贴对应的评论进行拼接,得到拼接文本;
S2:对所述拼接文本进行编码,得到词嵌入;并将所述词嵌入输入至多评论注意力机制粒度掩码BERT模型,得到模型输出;根据所述模型输出得到最终会话编码;所述最终会话编码为以各所述原贴对应的评论为节点的传播图;
S3:基于所述传播图,并根据所述评论的语义信息,计算出各节点对应的融合评论立场的语义特征;
S4:将所述融合评论立场的语义特征输入至图卷积网络,输出谣言分类结果。
优选的,S1中,得到拼接文本的过程包括:
所述原帖和所述原帖对应的评论组成帖子文本集合;采用分割字符、结尾符号以及拼接运算符对帖子文本集合中的所有文本进行拼接,得到所述拼接文本,计算公式为:
其中,表示第i个原帖的拼接文本;cls表示分割字符;||表示拼接运算符;sep表示结尾符号;/>表示第i个原帖的文本内容;/>表示第i个原帖对应的第1条评论的文本内容。
优选的,S2中,对所述拼接文本进行编码,得到词嵌入包括:
对所有所述拼接文本进行词编码,并融入分割编码和位置编码,得到词嵌入;计算公式为:
其中,E(V c )表示词嵌入;E tok (·)表示词编码;E seg (·)表示分割编码;E pos (·)表示位置编码;V c 表示所有拼接文本。
优选的,S2中,所述词嵌入输入至多评论注意力机制粒度掩码BERT模型包括编码器,所述编码器包括n层,在前k层设置有注意力掩码机制,在n-k层设置有标准注意力机制;
所述词嵌入作为编码器的输入,得到模型输出;计算公式为:
其中,表示第a层的模型输出;AtM()表示注意力掩码机制计算公式;At()表示标准注意力机制计算公式;/>表示第a-1层的模型输出;/>表示训练得到的查询权重矩阵;/>表示训练得到的键权重矩阵;/>表示值权重矩阵。
优选的, 所述注意力掩码机制计算公式表示为:
其中,Q表示词嵌入与查询权重矩阵相乘得到的查询矩阵;K表示词嵌入与键权重矩阵相乘得到的键矩阵;V表示词嵌入与值权重矩阵相乘得到的值矩阵;T表示转置;d表示维度;M表示设置的掩码屏蔽矩阵;
所述标准注意力机制计算公式表示为:
优选的,S2中,对于多评论注意力机制粒度掩码BERT模型最后一层得到的所述模型输出,剔除其中分割字符对应的特征,得到所述最终会话编码;第i个原帖的所述最终会话编码表示为:;/>表示第i个原帖的传播图中的第1个节点;/>表示第i个原帖的传播图中的第n i 个节点;n i 表示第i个原帖对应的评论的数量。
优选的,S3中,得到各节点对应的融合评论立场的语义特征的过程包括:
S3.1:将原帖的所述传播图作为树,其中的每条评论形成的节点均为上一级文本的子节点;则所述树表示为:;其中,X为评论的语义信息,E为所有边的集合;将第i个原帖的传播图中的所有节点与其对应的评论的语义信息融合,得到立场信息;计算公式为:
其中,表示第i个原帖的所述传播图中第g个节点的立场信息;x g 表示第g个节点对应的评论的语义信息;x h 表示第h个节点对应的评论的语义信息;N(g)表示第g个节点的所有子节点的集合;
S3.2:将第g个节点的立场信息融入其父节点中,得到第一融合特征;计算公式为:
其中,表示第g个节点的父节点的第一融合特征;||表示拼接运算符;/>表示第g个节点与第h个节点之间的边;
S3.3:采用线性层对所述第g个节点的父节点的第一融合特征进行降维,得到第个节点对应的融合评论立场的语义特征;计算公式为:
其中,表示第/>个节点对应的融合评论立场的语义特征;/>表示激活函数;W 1b 1为不同的可训练参数;
S3.4:重复执行S3.1-S3.3直至计算完原帖的传播图中所有的节点对应的融合评论立场的语义特征,结束循环;第i个原帖的传播图中所有的节点对应的融合评论立场的语义特征表示为:;/>表示第i个原帖的传播图中的第1个节点对应的融合评论立场的语义特征;/>表示第i个原帖的传播图中的第N个节点对应的融合评论立场的语义特征。
优选的,S4中,将所述融合评论立场的语义特征输入至图卷积网络,输出谣言分类结果包括:
S4.1:将计算出的所述融合评论立场的语义特征与原贴的传播图的邻接矩阵一同输入至图卷积网络中,进行快速卷积操作;图卷积网络中每层的快速卷积操作公式为:
其中,表示第/>+1层的输出;/>表示激活函数;/>,/>表示相加矩阵;A表示原帖的传播图的邻接矩阵,I Z 表示融合评论立场的语义特征的自传递矩阵;/>表示相加矩阵中各个元素的度;/>表示第/>层的输出;/>表示第/>层的权重矩阵;
S4.2:经过图卷积网络的层快速卷积操作后,得到融合增强特征表示;计算公式为:
其中,S i 表示第i个原帖的融合增强特征表示;GCN()表示图卷积网络;表示第i个原帖的传播图中所有的节点对应的融合评论立场的语义特征;
S4.3:对所述融合增强特征表示使用均值运算,并通过全连接层以及Softmax函数输出分类结果;计算公式为:
其中,表示第i个原帖的分类结果;/>和/>为全连接层中不同的训练参数矩阵;表示均值运算。
优选的,S4中,还包括优化分类过程:
步骤1:获取真实标注的标签;
步骤2:根据所述分类结果与所述真实标注的标签计算两者之间的交叉熵损失函数,并最小化所述交叉熵损失函数,以优化分类过程;计算公式为:
其中,表示交叉熵损失函数;/>表示第i个原帖的真实标注的标签;/>表示第i个原帖的分类结果。
优选的,所述掩码屏蔽矩阵中元素的计算公式为:
其中,M uv 表示掩码屏蔽矩阵中第u行第v列的取值,Q u 表示第u条评论的查询矩阵;K v 表示第v条评论的键矩阵;表示Q u K v 来自同一原帖;/>表示Q u K v 来自不同原帖。
有益效果:为了解决传统谣言检测方法存在的问题,本发明提供的这种方法在局部会话特征提取时,将会话中的所有帖子和评论文本拼接起来作为输入,充分利用评论中的信息;同时在编码器的前几层将不同会话间的注意力屏蔽,避免不同会话间注意力的干扰;而且还将来自评论中的支持或反对的立场信息融入到编码中;最后捕获推文间的传播特征。该方法能够提高谣言检测的精度,并在谣言传播的早期阶段仍能具有良好的检测能力。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例的基于会话语境感知的谣言检测方法的流程图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图对本申请的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似改进,因此本申请不受下面公开的具体实施例的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
如图1所示,本实施例提供了一种基于会话语境感知的谣言检测方法,该方法包括:
S1:获取原帖、原贴对应的评论以及评论的语义信息;并将所述原帖与所述原贴对应的评论进行拼接,得到拼接文本。
具体的,得到拼接文本的过程包括:
所述原帖和所述原帖对应的评论组成帖子文本集合;采用分割字符、结尾符号以及拼接运算符对帖子文本集合中的所有文本进行拼接,得到所述拼接文本,计算公式为:
其中,表示第i个原帖的拼接文本;cls表示分割字符;||表示拼接运算符;sep表示结尾符号;/>表示第i个原帖的文本内容;/>表示第i个原帖对应的第1条评论的文本内容。
S2:对所述拼接文本进行编码,得到词嵌入;并将所述词嵌入输入至多评论注意力机制粒度掩码BERT模型,得到模型输出;根据所述模型输出得到最终会话编码;所述最终会话编码为以各所述原贴对应的评论为节点的传播图。
具体的,对所述拼接文本进行编码,得到词嵌入包括:
对所有所述拼接文本进行词编码,并融入分割编码和位置编码,得到词嵌入;计算公式为:
其中,E(V c )表示词嵌入;E tok (·)表示词编码;E seg (·)表示分割编码;E pos (·)表示位置编码;V c 表示所有拼接文本。
所述词嵌入输入至多评论注意力机制粒度掩码BERT模型包括编码器,所述编码器包括n层,在前k层设置有注意力掩码机制,在n-k层设置有标准注意力机制;
所述词嵌入作为编码器的输入,得到模型输出;计算公式为:
其中,表示第a层的模型输出;AtM()表示注意力掩码机制计算公式;At()表示标准注意力机制计算公式;/>表示第a-1层的模型输出;/>表示训练得到的查询权重矩阵;/>表示训练得到的键权重矩阵;/>表示值权重矩阵。
所述注意力掩码机制计算公式表示为:
其中,Q表示词嵌入与查询权重矩阵相乘得到的查询矩阵;K表示词嵌入与键权重矩阵相乘得到的键矩阵;V表示词嵌入与值权重矩阵相乘得到的值矩阵;T表示转置;d表示维度;M表示设置的掩码屏蔽矩阵;
所述掩码屏蔽矩阵中元素的计算公式为:
其中,M uv 表示掩码屏蔽矩阵中第u行第v列的取值,Q u 表示第u条评论的查询矩阵;K v 表示第v条评论的键矩阵;表示Q u K v 来自同一原帖;/>表示Q u K v 来自不同原帖。
所述标准注意力机制计算公式表示为:
对于多评论注意力机制粒度掩码BERT模型最后一层得到的所述模型输出,剔除其中分割字符对应的特征,得到所述最终会话编码;第i个原帖的所述最终会话编码表示为:;/>表示第i个原帖的传播图中的第1个节点;/>表示第i个原帖的传播图中的第n i 个节点;n i 表示第i个原帖对应的评论的数量。
S3:基于所述传播图,并根据所述评论的语义信息,计算出各节点对应的融合评论立场的语义特征。
具体的,每条评论根据其赞成或反对的立场,会对其父节点产生正面或负面的可信度影响,故此只获取原帖及其评论的编码还不够,本实施例设置了评论感知机制以得到各节点对应的融合评论立场的语义特征,其过程包括:
S3.1:将原帖的所述传播图作为树,其中的每条评论形成的节点均为上一级文本的子节点;则所述树表示为:;其中,X为评论的语义信息,E为所有边的集合;将第i个原帖的传播图中的所有节点与其对应的评论的语义信息融合,得到立场信息;计算公式为:
其中,表示第i个原帖的所述传播图中第g个节点的立场信息;x g 表示第g个节点对应的评论的语义信息;x h 表示第h个节点对应的评论的语义信息;N(g)表示第g个节点的所有子节点的集合;
S3.2:将第g个节点的立场信息融入其父节点中,得到第一融合特征;计算公式为:
其中,表示第g个节点的父节点的第一融合特征;||表示拼接运算符;/>表示第g个节点与第h个节点之间的边;
S3.3:采用线性层对所述第g个节点的父节点的第一融合特征进行降维,得到第个节点对应的融合评论立场的语义特征;计算公式为:
其中,表示第/>个节点对应的融合评论立场的语义特征;/>表示激活函数;W 1b 1为不同的可训练参数;
S3.4:重复执行S3.1-S3.3直至计算完原帖的传播图中所有的节点对应的融合评论立场的语义特征,结束循环;第i个原帖的传播图中所有的节点对应的融合评论立场的语义特征表示为:;/>表示第i个原帖的传播图中的第1个节点对应的融合评论立场的语义特征;/>表示第i个原帖的传播图中的第N个节点对应的融合评论立场的语义特征。
S4:将所述融合评论立场的语义特征输入至图卷积网络,输出谣言分类结果。
具体的,包括:
S4.1:将计算出的所述融合评论立场的语义特征与原贴的传播图的邻接矩阵一同输入至图卷积网络中,进行快速卷积操作;图卷积网络中每层的快速卷积操作公式为:
其中,表示第/>+1层的输出;/>表示激活函数;/>,/>表示相加矩阵;A表示原贴的传播图的邻接矩阵,I Z 表示融合评论立场的语义特征的自传递矩阵;/>表示相加矩阵中各个元素的度;/>表示第/>层的输出;/>表示第/>层的权重矩阵;
S4.2:经过图卷积网络的层快速卷积操作后,得到融合增强特征表示;计算公式为:
其中,S i 表示第i个原帖的融合增强特征表示;GCN()表示图卷积网络;表示第i个原帖的传播图中所有的节点对应的融合评论立场的语义特征;
S4.3:对所述融合增强特征表示使用均值运算,并通过全连接层以及Softmax函数输出分类结果;计算公式为:
其中,表示第i个原帖的分类结果;/>和/>为全连接层中不同的训练参数矩阵;表示均值运算。
在本实施例中,还包括优化分类过程:
步骤1:获取真实标注的标签;
步骤2:根据所述分类结果与所述真实标注的标签计算两者之间的交叉熵损失函数,并最小化所述交叉熵损失函数,以优化分类过程;计算公式为:
其中,表示交叉熵损失函数;/>表示第i个原帖的真实标注的标签;/>表示第i个原帖的分类结果。
本实施例提供的这种基于会话语境感知的谣言检测方法具有以下有益效果:
1、为了解决传统谣言检测方法存在的问题,本发明提供的这种方法在局部会话特征提取时,将会话中的所有帖子和评论文本拼接起来作为输入,充分利用评论中的信息;同时在编码器的前几层将不同会话间的注意力屏蔽,避免不同会话间注意力的干扰;而且还将来自评论中的支持或反对的立场信息融入到编码中;最后捕获推文间的传播特征。该方法能够提高谣言检测的精度,并在谣言传播的早期阶段仍能具有良好的检测能力。
2、在该方法中,对每个节点都使用评论感知机制将来自评论的语义信息进行融合,有效利用了评论中的语义信息和连接关系,增强了会话结构中推文的语义表示,能够适应任何动态变化的评论立场。此外,本方法还将评论立场与原始特征信息进行拼合,以保留原始特征信息。
3、该方法采用了图卷积网络GCN来捕获推文间的传播特征,利用了更多的信息,能够有效应对谣言传播早期信息少的问题,提高了最终谣言检测的精度。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (5)

1.一种基于会话语境感知的谣言检测方法,其特征在于,包括:
S1:获取原帖、原贴对应的评论以及评论的语义信息;并将所述原帖与所述原贴对应的评论进行拼接,得到拼接文本;
得到拼接文本的过程包括:
所述原帖和所述原帖对应的评论组成帖子文本集合;采用分割字符、结尾符号以及拼接运算符对帖子文本集合中的所有文本进行拼接,得到所述拼接文本,计算公式为:
其中,表示第i个原帖的拼接文本;cls表示分割字符;||表示拼接运算符;sep表示结尾符号;/>表示第i个原帖的文本内容;/>表示第i个原帖对应的第1条评论的文本内容;
S2:对所述拼接文本进行编码,得到词嵌入;并将所述词嵌入输入至多评论注意力机制粒度掩码BERT模型,得到模型输出;根据所述模型输出得到最终会话编码;所述最终会话编码为以各所述原贴对应的评论为节点的传播图;
对所述拼接文本进行编码,得到词嵌入包括:
对所有所述拼接文本进行词编码,并融入分割编码和位置编码,得到词嵌入;计算公式为:
其中,E(V c )表示词嵌入;E tok (·)表示词编码;E seg (·)表示分割编码;E pos (·)表示位置编码;V c 表示所有拼接文本;
所述词嵌入输入至多评论注意力机制粒度掩码BERT模型包括编码器,所述编码器包括n层,在前k层设置有注意力掩码机制,在n-k层设置有标准注意力机制;
所述词嵌入作为编码器的输入,得到模型输出;计算公式为:
其中,表示第a层的模型输出;AtM()表示注意力掩码机制计算公式;At()表示标准注意力机制计算公式;/>表示第a-1层的模型输出;/>表示训练得到的查询权重矩阵;表示训练得到的键权重矩阵;/>表示值权重矩阵;
对于多评论注意力机制粒度掩码BERT模型最后一层得到的所述模型输出,剔除其中分割字符对应的特征,得到所述最终会话编码;第i个原帖的所述最终会话编码表示为:;/>表示第i个原帖的传播图中的第1个节点;/>表示第i个原帖的传播图中的第n i 个节点;n i 表示第i个原帖对应的评论的数量;
S3:基于所述传播图,并根据所述评论的语义信息,计算出各节点对应的融合评论立场的语义特征;
得到各节点对应的融合评论立场的语义特征的过程包括:
S3.1:将原帖的所述传播图作为树,其中的每条评论形成的节点均为上一级文本的子节点;则所述树表示为:;其中,X为评论的语义信息,E为所有边的集合;将第i个原帖的传播图中的所有节点与其对应的评论的语义信息融合,得到立场信息;计算公式为:
其中,表示第i个原帖的所述传播图中第g个节点的立场信息;x g 表示第g个节点对应的评论的语义信息;x h 表示第h个节点对应的评论的语义信息;N(g)表示第g个节点的所有子节点的集合;
S3.2:将第g个节点的立场信息融入其父节点中,得到第一融合特征;计算公式为:
其中,表示第g个节点的父节点的第一融合特征;||表示拼接运算符;/>表示第g个节点与第h个节点之间的边;
S3.3:采用线性层对所述第g个节点的父节点的第一融合特征进行降维,得到第个节点对应的融合评论立场的语义特征;计算公式为:
其中,表示第/>个节点对应的融合评论立场的语义特征;/>表示激活函数;W 1b 1为不同的可训练参数;
S3.4:重复执行S3.1-S3.3直至计算完原帖的传播图中所有的节点对应的融合评论立场的语义特征,结束循环;第i个原帖的传播图中所有的节点对应的融合评论立场的语义特征表示为:;/>表示第i个原帖的传播图中的第1个节点对应的融合评论立场的语义特征;/>表示第i个原帖的传播图中的第N个节点对应的融合评论立场的语义特征;
S4:将所述融合评论立场的语义特征输入至图卷积网络,输出谣言分类结果。
2.根据权利要求1所述的基于会话语境感知的谣言检测方法,其特征在于,所述注意力掩码机制计算公式表示为:
其中,Q表示词嵌入与查询权重矩阵相乘得到的查询矩阵;K表示词嵌入与键权重矩阵相乘得到的键矩阵;V表示词嵌入与值权重矩阵相乘得到的值矩阵;T表示转置;d表示维度;M表示设置的掩码屏蔽矩阵;
所述标准注意力机制计算公式表示为:
3.根据权利要求1所述的基于会话语境感知的谣言检测方法,其特征在于,S4中,将所述融合评论立场的语义特征输入至图卷积网络,输出谣言分类结果包括:
S4.1:将计算出的所述融合评论立场的语义特征与原贴的传播图的邻接矩阵一同输入至图卷积网络中,进行快速卷积操作;图卷积网络中每层的快速卷积操作公式为:
其中,表示第/>+1层的输出;/>表示激活函数;/>,/>表示相加矩阵;A表示原帖的传播图的邻接矩阵,I Z 表示融合评论立场的语义特征的自传递矩阵;/>表示相加矩阵的中各个元素的度;/>表示第/>层的输出;/>表示第/>层的权重矩阵;
S4.2:经过图卷积网络的层快速卷积操作后,得到融合增强特征表示;计算公式为:
其中,S i 表示第i个原帖的融合增强特征表示;GCN()表示图卷积网络;表示第i个原帖的传播图中所有的节点对应的融合评论立场的语义特征;
S4.3:对所述融合增强特征表示使用均值运算,并通过全连接层以及Softmax函数输出分类结果;计算公式为:
其中,表示第i个原帖的分类结果;/>和/>为全连接层中不同的训练参数矩阵;表示均值运算。
4.根据权利要求3所述的基于会话语境感知的谣言检测方法,其特征在于,S4中,还包括优化分类过程:
步骤1:获取真实标注的标签;
步骤2:根据所述分类结果与所述真实标注的标签计算两者之间的交叉熵损失函数,并最小化所述交叉熵损失函数,以优化分类过程;计算公式为:
其中,表示交叉熵损失函数;/>表示第i个原帖的真实标注的标签;/>表示第i个原帖的分类结果。
5.根据权利要求2所述的基于会话语境感知的谣言检测方法,其特征在于,所述掩码屏蔽矩阵中元素的计算公式为:
其中,M uv 表示掩码屏蔽矩阵中第u行第v列的取值,Q u 表示第u条评论的查询矩阵;K v 表示第v条评论的键矩阵;表示Q u K v 来自同一原帖;/>表示Q u K v 来自不同原帖。
CN202310828763.4A 2023-07-07 2023-07-07 一种基于会话语境感知的谣言检测方法 Active CN116542257B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310828763.4A CN116542257B (zh) 2023-07-07 2023-07-07 一种基于会话语境感知的谣言检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310828763.4A CN116542257B (zh) 2023-07-07 2023-07-07 一种基于会话语境感知的谣言检测方法

Publications (2)

Publication Number Publication Date
CN116542257A CN116542257A (zh) 2023-08-04
CN116542257B true CN116542257B (zh) 2023-09-22

Family

ID=87452876

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310828763.4A Active CN116542257B (zh) 2023-07-07 2023-07-07 一种基于会话语境感知的谣言检测方法

Country Status (1)

Country Link
CN (1) CN116542257B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109359190A (zh) * 2018-08-17 2019-02-19 中国电子科技集团公司第三十研究所 一种基于评价对象阵营的立场分析模型构建方法
CN111159395A (zh) * 2019-11-22 2020-05-15 国家计算机网络与信息安全管理中心 基于图神经网络的谣言立场检测方法、装置和电子设备
CN113094596A (zh) * 2021-04-26 2021-07-09 东南大学 一种基于双向传播图的多任务谣言检测方法
CN113158075A (zh) * 2021-03-30 2021-07-23 昆明理工大学 融合评论的多任务联合谣言检测方法
CN114896519A (zh) * 2022-05-27 2022-08-12 南京优慧信安科技有限公司 一种基于立场特征的早期谣言检测方法与装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9959365B2 (en) * 2015-01-16 2018-05-01 The Trustees Of The Stevens Institute Of Technology Method and apparatus to identify the source of information or misinformation in large-scale social media networks
US20190213284A1 (en) * 2018-01-11 2019-07-11 International Business Machines Corporation Semantic representation and realization for conversational systems
US20230143777A1 (en) * 2021-11-10 2023-05-11 Adobe Inc. Semantics-aware hybrid encoder for improved related conversations

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109359190A (zh) * 2018-08-17 2019-02-19 中国电子科技集团公司第三十研究所 一种基于评价对象阵营的立场分析模型构建方法
CN111159395A (zh) * 2019-11-22 2020-05-15 国家计算机网络与信息安全管理中心 基于图神经网络的谣言立场检测方法、装置和电子设备
CN113158075A (zh) * 2021-03-30 2021-07-23 昆明理工大学 融合评论的多任务联合谣言检测方法
CN113094596A (zh) * 2021-04-26 2021-07-09 东南大学 一种基于双向传播图的多任务谣言检测方法
CN114896519A (zh) * 2022-05-27 2022-08-12 南京优慧信安科技有限公司 一种基于立场特征的早期谣言检测方法与装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
STANKER: Stacking Network based on Level-grained Attention-masked BERT for Rumor Detection on Social Media;Dongning Rao;《In Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing》;第3347–3363页 *
融合评论的多任务联合谣言检测方法;王繁;《计算机工程与科学》;第44卷(第09期);第 1702-1710页 *

Also Published As

Publication number Publication date
CN116542257A (zh) 2023-08-04

Similar Documents

Publication Publication Date Title
US11687728B2 (en) Text sentiment analysis method based on multi-level graph pooling
CN110019812B (zh) 一种用户自生产内容检测方法和系统
CN111914185B (zh) 一种基于图注意力网络的社交网络中文本情感分析方法
CN114297394B (zh) 对文本中的事件论元进行抽取的方法和电子设备
CN110287329A (zh) 一种基于商品文本分类的电商类目属性挖掘方法
CN111309910A (zh) 文本信息挖掘方法及装置
CN112199606B (zh) 一种基于层次用户表示的面向社交媒体的谣言检测系统
CN113254652B (zh) 一种基于超图注意力网络的社交媒体贴文真实性检测方法
CN113076720B (zh) 长文本的分段方法及装置、存储介质、电子装置
CN112214984A (zh) 内容抄袭识别方法、装置、设备及存储介质
CN113806548A (zh) 基于深度学习模型的信访要素抽取方法及抽取系统
CN114490953A (zh) 训练事件抽取模型、事件抽取的方法和目标事件抽取模型
CN115600605A (zh) 一种中文实体关系联合抽取方法、系统、设备及存储介质
CN116737922A (zh) 一种游客在线评论细粒度情感分析方法和系统
CN113553847A (zh) 用于对地址文本进行解析的方法、装置、系统和存储介质
CN111079433A (zh) 一种事件抽取方法、装置及电子设备
CN111178080A (zh) 一种基于结构化信息的命名实体识别方法及系统
CN114548274A (zh) 一种基于多模态交互的谣言检测方法及系统
CN116542257B (zh) 一种基于会话语境感知的谣言检测方法
CN115859121A (zh) 文本处理模型训练方法及装置
CN113536798B (zh) 一种多实例文档关键信息抽取方法和系统
Munot et al. Conceptual framework for abstractive text summarization
CN112835810B (zh) 一种基于日志分析的接口测试方法及装置
CN112926318A (zh) 一种基于句法分析的网购评论新情感词提取方法
CN113868417A (zh) 一种敏感评论识别方法、装置、终端设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant