CN116431760A

CN116431760A - 基于情感感知和图卷积网络的社交网络谣言检测方法

Info

Publication number: CN116431760A
Application number: CN202310037032.8A
Authority: CN
Inventors: 刘小洋; 李慧
Original assignee: Chongqing University of Technology
Current assignee: Chongqing University of Technology
Priority date: 2023-01-10
Filing date: 2023-01-10
Publication date: 2023-07-14

Abstract

本发明提出了一种基于情感感知和图卷积网络的社交网络谣言检测方法，包括以下步骤：S1，提取融合情感信息的语义特征：将帖子和评论共同构建为一个文本序列，接着从文本序列中提取文本的情感特征，然后将得到的情感特征和文本序列相融合后提取具有情感信息的语义特征；S2，提取传播结构特征：利用源帖和评论转发作为节点，构建帖子的传播结构图，接着利用GCN提取传播结构中的隐藏特征，得到传播结构特征；S3，将情感信息的语义特征和传播结构特征进行了特征融合得到谣言的融合特征；S4，将所述融合特征输入谣言检测分类器，进行谣言预测分类。本发明在谣言检测中考虑了帖子所传达的情感信息和传播结构，本发明方法谣言检测的准确率有很大的提升。

Description

基于情感感知和图卷积网络的社交网络谣言检测方法

技术领域

本发明涉及自然语言处理技术领域，特别是涉及一种基于情感感知和图卷积网络的社交网络谣言检测方法。

背景技术

随着互联网的发展，各种在线社交平台逐渐取代早期的报纸期刊成为人们获取新闻资讯的主要途径。随着越来越多的人在互联网上参与讨论热门话题，许多谣言出现了。中国互联网络信息中心(CNNIC)发布的第48次《中国互联网络发展状况统计报告》显示，截至2021年6月，我国网民规模达10.11亿，他们活跃在各种社交网络平台，在上面发布自己的想法。由于社交媒体用户数量众多，且在线社交平台为网民的参与讨论提供了广阔的平台，谣言在社交媒体上的传播速度更加迅速，传播范围也更加广泛，为个人、社会和国家带来严重的危害，造成巨大的经济损失。从广义上讲，虚假信息是故意传播以误导或欺骗为目的的虚假或者不准确的消息。它对无论是社会还是个人都有极大的影响。Soroush等在《Science》上发表的最新成果将虚假信息与真实信息的传播结构进行了对比，发现虚假信息的传播范围更远、更快、更深、更广。此外，新媒体技术的发展也加速了信息在社会面上大规模的传播，降低了社交网络信息产生的成本，为虚假信息的传播提供了极大的便利。

目前的谣言检测主要是从发布的帖子文本的语义特征或者传播结构特征方面对帖子是谣言还是真实信息进行检测。然而，许多基于文本的谣言检测方法完全没有考虑文本的情感特征。以往的研究中有学者提出并验证了虚假信息或谣言与网络文本的情感之间存在一定关系(否定词与肯定词数量之比),并提取了帖子中的情感特征以进行谣言检测，但是没有考虑评论中的情感因素。除了帖子本身的情感特征之外，帖子的评论中也包含了大量公众的情感特征，公众的情感特征对于帖子的真假辨别往往也具有重要作用。因此，除了帖子本身的情感特征之外，公众的情感特征也需要被关注以用于谣言检测。此外，根据相关研究，谣言和真实信息在网络上的传播结构有很大的不同，且许多学者的研究证明，谣言的传播结构特征对谣言的识别有重要意义。

发明内容

本发明旨在至少解决现有技术中存在的技术问题，特别创新地提出了一种基于情感感知和图卷积网络的社交网络谣言检测方法。

为了实现本发明的上述目的，本发明提供了一种基于情感感知和图卷积网络的社交网络谣言检测方法，包括以下步骤：

S1，提取融合情感信息的语义特征：使用word2vec将帖子和评论共同构建为一个文本序列，接着从文本序列中提取文本的情感特征，然后利用多头注意力机制或多头自注意力机制将得到的情感特征和文本序列相融合后提取具有情感信息的语义特征；

S2，提取传播结构特征：利用源帖和评论转发作为节点，构建帖子的传播结构图，接着利用GCN提取传播结构中的隐藏特征，得到传播结构特征；

S3，将情感信息的语义特征和传播结构特征进行了特征融合得到谣言的融合特征；

S4，将所述融合特征输入谣言检测分类器，进行谣言预测分类。

GCN能够更好地从图中或者树中捕获全局结构特征，Attention机制能更好的聚合文本内容以从中获得更加关键的隐藏特征。

进一步地，所述从文本序列中提取文本的情感特征是从情感分类和情感词典两方面进行文本内容特征提取的；

基于情感词典的情感特征提取，是使用情感分类器去获得帖子文本的情感分类特征；

基于情感词典的情感特征提取包括以下步骤：

对于情感词典，将情感词典记为D＝{d₁,d₂,...,d_m}，其中情感词典D包含m种情感，对于情感d∈D，情感字典提供了一个包含L个情感单词的单词表

f为情感词；

对于情感d，首先计算单词级别的得分score(c_i,d),其中c_i是文本序列C中的第i个单词，如果单词c_i在

中，则需考虑出现频率以及其上下文中的程度副词和否定词；

接着对文本分词，找出文档中的情感词f、否定词以及程度副词，然后判断每个情感词之前是否有否定词及程度副词，将它之前的否定词和程度副词划分为一个组，如果有否定词，则将情感词的情感权值乘以否定词的值，如果有程度副词就乘以程度副词的程度值，然后将所有组的得分加起来，大于0的归于正向，小于0的归于负向，此外得分的绝对值大小反映了文本的消极或积极的程度，通过这种方式获得每个单词的情感得分，其计算方式如下：

其中score(c_i,d)表示单词c_i的情感得分；

c_i表示第i个单词；

表示c_i是否存在于单词表/>

中；

neg(c_i,s)表示左侧上下文的窗口大小为s的情况下，单词c_i的负值；

deg(c_i,s)表示左侧上下文的窗口大小为s的情况下，单词c_i的程度值；

L表示单词的总数量；

表示单词表；

s是单词左侧上下文的窗口大小，neg(c_j)和deg(c_j)分别是单词c_j的负值和程度值，这些可以通过情感词典查找到；

然后将所有获得的单词的得分score(c_i,d)进行相加，得到基于文本的情感得分score(C,d)，文本情感得分的计算如下：

其中score(C,d)表示文本C的情感得分；

d表示一种情感；

D表示情感词典；

L表示单词的总数量；

最后将这些所有的文本级的情感得分进行拼接得到基于情感词典的情感特征：

其中d_m表示第m种情感；

在得到基于情感词典的情感特征和基于情感词典的情感特征后，将所有获得的不同种类的情感特征进行拼接进而得到文本的情感特征emo_C，如式所示：

其中emo_C表示文本的情感特征，

表示不同种类的情感特征；

表示基于情感词典的情感特征；

⊕为拼接符号。

进一步地，所述利用多头注意力机制或多头自注意力机制将得到的情感特征和文本序列相融合后提取具有情感信息的语义特征包括：

多头注意力机制通过计算Query和Key之间的相似性来获得权重系数a_i,

其中a_i表示权重系数；

Sim_i表示第i个Query和第i个Key之间的相似性；

Sim_j表示第j个Query和第j个Key之间的相似性；

Query和Key分别表示查询值和键值，为注意力机制的输入向量；在本文中这两个输入向量分别包含了情感特征信息和文本语义信息。

L_x是帖子的长度；

其中Sim_i、Sim_j由下列公式计算得来：

其中Key^T表示Key的矩阵转置；

d代表词嵌入的维度；

式(9)计算出的a_i就是Value_i对应的权重系数，然后进行加权求和即可得到Attention数值即注意值：

通过拼接多个注意力头值得到最终的多头注意值：

MultiHead(Query,Key,Value)＝concat(head₁,head₂,...,head_h)W (12)

其中MultiHead(Query,Key,Value)表示多头注意值；

concat表示拼接；

head_h表示第h个注意力头值；

表示可训练的权重变量；

head_i＝Attention(X·W_i ^Q,X·W_i ^K,X·W_i ^V) (13)

其中W_i ^Q，W_i ^K和

都是可训练的变量；

X是输入向量；

Query、Key和Value是X分别与可训练变量W_i ^Q，W_i ^K和W_i ^V相乘得到的；

由于是多头注意力机制，不同的头的Query、Key、Value由输入向量X与每个头的三个可训练变量相乘得到，公式11是通用得表示形式。

若使用多头注意力机制，由多头自注意力机制融合得来的新的情感表示为：

Emo'＝MultiHead(Query,Key,Value)

其中Emo'是由多头注意力机制融合得来的新的情感表示；

若使用多头自注意力机制，由多头注意力机制融合得来的新的情感表示为：

Emo'＝MultiHead(emo,emo,emo) (14)

其中Emo'是由多头自注意力机制融合得来的新的情感表示；

MultiHead(emo,emo,emo)表示使用多头自注意力机制对获得的情感emo进行融合；

emo表示获得的情感特征；

多头自注意力机制和多头注意力机制的区别就在于：多头注意力机制的输入是Query、Key、Value，而多头自注意力机制的输入向量都相同。

接着谣言文本C和得到的情感特征之间的隐藏特征将被进一步被挖掘，C和Emo'相应的相似度分数a可以通过式(9)～式(11)计算得出，其表示如下：

其中a表示C和Emo'的相似度分数；

Emo'表示多头自注意力机制融合得来的新的情感表示；

S^T为S的转置，S表示源帖；

由这个值可以获得情感信息和文本之间的高级关系：

h＝a^TEmo' (16)

最后文章融合了h与文本C来获得具有情感信息的高级语义表示：

其中

为具有情感信息的高级语义表示即语义特征；

ω₁、ω₂和b都是可训练的参数；

h表示情感信息和文本之间的高级关系；

S'是微博或推特的交互式文本的最终表示。

进一步地，在利用GCN提取传播结构中的隐藏特征时，使用DropEdge方法随机去除冗余的边和节点，以减少干扰，同时采用根节点增强的方法提取有效的结构特征，进而提高谣言检测的准确度。

利用根节点信息增强的方法和DropEdge方法，增强根节点的影响力并对虚假、无关的交互信息进行抑制，从而得到更有效的传播结构特征。

进一步地，所述采用根节点增强的方法提取有效的结构特征包括：

对于第k个图卷积层处的GCN，将每个节点的隐式特征和第k-1个图卷积层的根节点的隐式特征拼接起来，构造一个新的特征矩阵：

其中

表示根节点增强后的特征；

H_k表示由第k层的卷积层计算得来的隐藏向量矩阵；

H_k-1 ^root表示H_k-1的根节点；

H_k-1表示由第k-1层的卷积层计算得来的隐藏向量矩阵；

令H₀＝X，那么前面公式中的H_k-1替换为

H_k的计算如下：

表示根节点增强后的第一层特征；

H₁ ^root是H₁的根节点；

H₁是GCN中第一层特征；

H₂是GCN中第二层特征；

concat表示拼接。

进一步地，所述谣言检测分类器包括：一个多层感知机MLP和Softmax层。

综上所述，由于采用了上述技术方案，本发明在谣言检测中考虑了帖子所传达的情感信息和传播结构，于是基于社交网络中发帖与评论，以帖子和其评论转发为节点构建了传播结构图，结合根节点增强GCN来提取了构建传播图的结构特征。并且利用注意力机制将情感特征融合在文本序列中以提取具有情感信息的语义特征，结合传播结构特征进行了特征融合得到谣言特征的更有效表示。本发明提出的基于情感感知和图卷积网络的社交网络谣言检测方法，将较于常见的DTC等9种机器学习和深度学习模型，本发明方法谣言检测的准确率有很大的提升。

本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1是本发明EaA-GCN模型框架示意图。

图2是本发明方法在不同类别数据上的实验结果。

图3是本发明EaA-GCN模型与其它三种模型在Weibo、Twitter 15、Twitter 16数据集上的性能和合理性的对比示意图，图3(a)是在Weibo数据集的结果示意图，图3(b)是在Twitter 15数据集的结果示意图，图3(c)是在Twitter 16数据集的结果示意图。

图4是本发明方法在Weibo、Twitter 15、Twitter 16数据集上的早期检测结果示意图，图4(a)是在Weibo数据集的结果示意图，图4(b)是在Twitter 15数据集的结果示意图，图4(c)是在Twitter 16数据集的结果示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

近年来，社交媒体的兴起加剧了谣言的产生与传播，谣言对社会稳定性的影响使得谣言检测吸引了大量研究者的注意力。早期的谣言检测主要依赖于从文本内容、用户信息、传播结构等方面提取谣言的特征以对带有标签的帖子进行分类。这些特征主要是通过人工提取的，属于劳动密集型。如Castillo et al.探索并提取基于文本、用户信息以及传播结构的特征，来验证Tweet上新闻的可信度。Yang et al.提出了基于文本特征的时间序列并融合了各种社会语境信息的谣言检测方法。Zhao et al.利用正则表达式表达的方式来发现推特上的谣言。为了从传播结构和文本语义中提取有用的特征，Ma et al.用传播树模型模拟了微博帖子的传播方式，使用了基于内核传播树Kernel通过区分传播树结构之间的相似性以达到区分不同类型谣言的高阶模式。然而这些方法太依赖于特征工程，需要大量的人力的投入，是一个费时费力的工作。

随着数据量的攀升以及数据种类的多样性，人工提取特征的难度也逐渐加大，为了解决这个局限性并学习谣言的高级特征，越来越多的深度学习的方法被用于挖掘谣言的各种隐藏特征以用于自动谣言检测。谣言的传播结构的高级表示和时间特征也被考虑以提高谣言检测的准确性。Ma et al.提出基于递归神经网络(RNN)的模型比依赖手工特征的学习算法取得了显著改进，它从文本中学习隐藏表示，捕捉相关帖子上下文信息随时间的变化。Yu et al.提出了基于CNN的自动谣言检测模型，它可以灵活地提取分散在输入序列中的关键特征，形成显著特征之间的高层交互，有助于有效识别错误信息，实现谣言的早期检测。Chen et al.等人使用了基于RNN的深度注意力模型用以选择性学习序列帖子的时间表示。Ma et al.针对帖子的传播结构使用RNN从传播结构自底向上和自上向下两个方向以提取帖子的隐藏特征。为了解决早期谣言检测信息不足的问题Yang et al.将推文的传播路径建模为多元时间序列，并使用RNN和CNN分别提取全局和局部用户特征沿传播路径的变化。Bian et al.使用了双向图卷积神经网络从谣言传播的深度和广度两个维度去探索谣言传播结构和扩散结构中的高级表示。Liu et al.使用了双重注意力机制提取新闻传播结构中的交互式表征和新闻文本、评论中的高级语义特征来实现谣言检测。Bi et al.等人从微博信息传播网络的语义信息出发，构建其异构图，使用节点级注意力结合微博节点的邻居节点以生成具有特定语义的节点嵌入，再使用语义级注意力融合提取到的不同语义，进而得到更高级的语义表示。Tu et al^.提出了一种具有联合文本和传播结构表示学习的Rumor2vec的谣言检测框架。

与上面提到的深度学习模型相比，GCN能够更好地从图中或者树中捕获全局结构特征，Attention机制能更好的聚合文本内容以从中获得更加关键的隐藏特征。随着对谣言检测这一领域的不断深入研究，也有一些研究者将注意力放在帖子文本的情感特征上，他们认为谣言的文本和评论传递出的情感与非谣言的文本和评论传递出的情感不同，因此在谣言检测模型中使用了情感特征，如Castillo等人依据情感词典提取了Twitter谣言文本和非谣言文本中的情感词，通过分析发现谣言文本中包含更多消极情感词，非谣言文本中包含更多积极情感词，基于此构建了包含消息的平均情感分数等15个特征进行分类。Ajaoet al.提出了虚假信息或者谣言与网上发布的文本之间存在关联并设计实验对这一想法进行了验证，证明了网上发布的帖子的情感特征的确对谣言检测准确率的提升有帮助。Giachanou et al.研究了情感信号在谣言检测中的作用。然而这些方法中有的只关注了发布者的情感特征，忽略了公众情感在谣言检测中的作用，有的只考虑的情感特征而没有考虑文本中的其他特征，基于此提出了结合具有帖子原文和评论情感信息的语义特征和传播结构特征的谣言检测方法。

为了从用户转发评论中挖掘更深层的信息、从传播结构中挖掘更有效的特征我们提出了EaA-GCN模型，构建的自动谣言检测系统框架如图1所示。

图1中，模型包含三个模块，交互式文本语义特征模块、传播结构特征模块以及谣言预测分类模块。可以从原始传播结构中发现信息，充分利用用户评论和转发中的关键信息，从而获得抗干扰传播结构特征和交互式文本具有情感信息的语义特征，通过整合这两个个特征，新的特征在谣言表示方面会有更好的表现。利用注意力机制计算并融合源推文或微博的文本内容与源帖的评论和转发内容，每个源贴S_i或事件E_i都用融合产生的新特征表示。传播结构的特征提取依赖于基于节点之间存在评论-转发关系，将源帖或者源微博(推文)、转发微博、评论的用户，作为传播结构图中的节点，用以构造传播图。使用GCN提取传播结构图中的结构信息，由于原始的传播结构中包含大量无用或者冗余的节点或边，进而会干扰提取出的结构特征，此外，具有较大影响力的根节点的特征应该被充分利用。因此在这里使用DropEdge方法随机去除冗余的边和节点，以减少干扰，同时采用根增强的方法，提取更有效的结构特征进而提高谣言检测的准确度。

对于每一个事件E_i有相应的标签Y_i与之对应，来表示事件的性质，y_i∈{TR,FR}，TR代表是谣言，FR代表不是谣言，在一些数据集中y_i还有其他取值，例如UF代表未经核实的谣言，NR代表非谣言。谣言检测的目的就是通过学习谣言数据中的特征，并构造分类器，根据学习到的特征使用分类器来区分真实性未知的微博或推文。

f:E_i→Y_i (1)

其中f表示函数；

:表示冒号；

→表示映射关系；

E_i就是将要确定的事件；

Y_i是由分类器给出的事件真实性的标签。

1.融合情感信息的语义特征提取

对于帖子和评论先对其使用Word2vec将其转化为向量，并将其长度控制为L，对于文本长度大于L的，将其裁剪为L，长度小于L的将其用0向量进行填充，使其长度为L。接着对于长度为L的文本序列C＝[c₁,c₂,c₃,...,c_i,...,c_L]，其中c_i是文本的第i个单词。将这些向量表示输入到提出的模型中，首先提取其中的情感特征，再使用多头注意力机制对情感特征与文本和评论内容进行融合并学习其隐含的特征。

为了使获得的情感特征更具有解释性，使用了情感分类和情感词典从文本内容中提取特征。

给定的融合文本输入序列为L，其中c_i是文本中的第i个单词，目标是从文本C中提取情感特征。

1.1情感分类

对于情感分类，使用公开的情感分类器去获得帖子文本的情感分类特征。对于中文的数据集使用了百度AI平台提供的情感分析算法,对于英文数据集使用了NVIDIA发布的开源情感分类器。给定情感分类器F_emo，和帖子文本C，假设输出的维度是d_f，因此对文本C的预测是F_emo(C)。从而能够获得文本的情感分类特征

其中/>

1.2情感词典

为了更好的获得句子的情感表示以及充分利用情感词典信息，本发明专利将情感词典加入到情感特征提取任务中，为模型提供额外的情感特征信息。将情感词典记为D＝{d₁,d₂,...,d_m}，其中情感词典D包含m种情感，对于情感d∈D，情感字典提供了一个包含L个情感单词的单词表

f为情感词。

在给定文本C的情况下，将每个单词在左右情绪中的得分进行汇总以丰富表示。

对于情感d，首先计算单词级别的得分score(c_i,d),其中c_i是文本序列C中的第i个单词，如果单词c_i在词典

中，不仅考虑它的出现频率，还要考虑其上下文中的程度副词和否定词。

接着对文本分词，找出文档中的情感词、否定词以及程度副词，然后判断每个情感词之前是否有否定词及程度副词，将它之前的否定词和程度副词划分为一个组，如果有否定词，则将情感词的情感权值乘以否定词的值，如果有程度副词就乘以程度副词的程度值，然后将所有组的得分加起来，大于0的归于正向，小于0的归于负向，此外得分的绝对值大小反映了文本的消极或积极的程度，通过这种方式获得每个单词的情感得分，其计算方式如下：

其中score(c_i,d)表示单词c_i的情感得分；

c_i表示第i个单词；

表示c_i是否存在于单词表/>

中；

L表示单词的总数量；

表示单词表。

s是单词左侧上下文的窗口大小，neg(c_j)和deg(c_j)分别是单词c_j的负值和程度值，这些可以通过情感词典查找到。

然后将所有获得的单词的得分score(ci,d)进行相加，得到基于文本的情感得分score(C,d)，文本情感得分的计算如下：

其中score(C,d)表示文本C的情感得分；

d表示一种情感；

D表示情感词典；

L表示单词的总数量；

其中d_m表示第m种情感；

在得到这两种特征后，将所有获得的不同种类的情感特征进行拼接进而得到文本的情感特征emo_C，如式所示：

其中emo_C表示文本的情感特征，

表示不同种类的情感特征；

表示基于情感词典的情感特征；

⊕为拼接符号。

在获取了情感信息后，将文本和情感特征一起输入到注意力机制中从而获得融合了情感信息的语义特征。注意力机制有

三个输入向量，其中Query表示查询，缩写为Q；Key表示键，缩写为K；Value表示值，缩写为V，这三个向量分别指代多头注意力机制的三个输入向量，n_q、n_k、n_v分别代表三个向量的长度，d代表词嵌入的维度。多头注意力机制通过计算Query和Key之间的相似性来获得权重系数a_i,

其中a_i表示权重系数；

Sim_i表示第i个Query和第i个Key之间的相似性；

Sim_j表示第j个Query和第j个Key之间的相似性；

L_x是帖子的长度，Sim是相似的缩写，Sim_i、Sim_j由下列公式计算得来：

其中Key^T表示Key的矩阵转置；

d代表词嵌入的维度。

式(9)计算出的a_i就是Value_i对应的权重系数，然后进行加权求和即可得到Attention数值：

注意力机制通过计算Query和各个Key之间的相似性，得到每个Key对应Value的权重系数，然后对Value进行加权求和，得到最终的Attention数值，这样可以得到一个新的Query向量。为了捕捉数据中更丰富的特征和信息，平衡不同权重参数带来的影响，模型使用了多头注意力。每个注意力头从不同的方面捕捉Query、Key、Value之间的隐式关系，通过拼接多个注意力头值得到最终的多头注意值：

MultiHead(Query,Key,Value)＝concat(head₁,head₂,...,head_h)W (12)

其中MultiHead(Query,Key,Value)表示多头注意值；

concat表示拼接；

head_h表示第h个注意力头；

表示可训练的变量。

head_i＝Attention(X·W_i ^Q,X·W_i ^K,X·W_i ^V) (13)

其中W_i ^Q，W_i ^K和

都是可训练的变量；

X是输入向量；

Query、Key和Value是X分别与可训练变量W_i ^Q，W_i ^K和W_i ^V相乘得到的。

本发明专利使用了多头自注意力机制来挖掘帖子文本和用户评论中的可用信息，并将情感信息与构建的文本相融合，生成融合了情感特征的语义特征，根据上式可得：

Emo'＝MultiHead(emo,emo,emo) (14)

其中Emo'是由多头自注意力机制融合得来的新的情感表示；

emo表示获得的情感特征；

其中a表示C和Emo'的相似度分数；

Emo'表示多头自注意力机制融合得来的新的情感表示；

S^T为S的转置，S表示源帖；

由这个值可以获得情感信息和文本之间的高级关系：

h＝a^TEmo' (16)

/>

其中

为具有情感信息的高级语义表示；

ω₁、ω₂和b都是可训练的参数；

h表示情感信息和文本之间的高级关系；

S'是微博或推特的交互式文本的最终表示。

2传播结构特征提取

基于帖子及其转发和评论关系为其构造了帖子的传播结构图G<V,E>，其中V做为传播结构图的节点集包含了帖子发布者和用户节点，E是传播结构图的边集表示节点之间有评论或者转发行为。由于近年来，卷积模型在图域中的应用越来越广泛，在现有的卷积模型中GCN的表现是最有效的模型之一，因此，在模型中采用GCN，其计算“消息传递”架构的方式如下：

H_k＝M(A,H_k-1；W_k-1) (19)

其中H_k和H_k-1分别是由第k层和第k-1层的卷积层计算得来的隐藏向量矩阵即传播结构特征，M是信息传播函数，A是传播结构图的邻接矩阵，W_k-1表示可训练的参数。由ChebNet et al.的对消息传播函数的定义，基本的频域卷积网络要计算拉普拉斯矩阵所有的特征值和特征向量，计算量巨大，因此使用切比雪夫多项式来加速矩阵的求解，可知上式可写成如下形式：

其中

是归一化后的邻接矩阵，/>

I是一个单位矩阵，邻接矩阵与其单位矩阵相加表示添加自连接(self connection)，/>

表示第i个节点的度，/>

表示添加了自连接的图的邻接矩阵，σ(·)是激活函数。

由于传播图G的节点较多，较为复杂，为了防止在GCN训练过程中出现过拟合现象同时为了减少由于过平滑引起的信息缺失，采用了DropEdge机制在模型训练时随机删减掉原始图中的边。假设传播结构图的总共边数为N_e，弃边率为p,那么DropEdge后的邻接矩阵A'由以下方式计算得到：

A'＝A-A_drop (21)

其中，A是传播结构图的邻接矩阵，A_drop是对G中的边集E进行随机采样后形成的邻接矩阵，邻接矩阵中的边的数目为N_e×p.

GCN被用于提取谣言的传播结构特征，传播图G的隐藏特征矩阵H₁可以由以下公式获得：

其中

是归一化后的邻接矩阵，/>

是GCN中第一层特征，/>

表示参数矩阵，X是基于传播树构建的特征矩阵，σ为激活函数，在模型中使用ReLU函数作为激活函数。为了防止在GCN训练过程中出现过拟合现象同时为了减少由于过平滑引起的信息缺失，采用了DropEdge机制在模型训练时随机删减掉原始图中的边。

对于一条帖子的传播结构来说，根节点的影响力往往是最大的，由于在GCN的训练过程中根节点的影响力会被削弱，因此，这里本发明专利提出的模型采用了根节点增强的方式来扩大其在传播结构中的作用。具体来说就是对于第k个图卷积层处的GCN，将每个节点的隐式特征和第k-1个图卷积层的根节点的隐式特征拼接起来，构造一个新的特征矩阵：

其中

表示根节点增强后的特征；

H_k表示由第k层的卷积层计算得来的隐藏向量矩阵；

H_k-1 ^root表示H_k-1的根节点；

H_k-1表示由第k-1层的卷积层计算得来的隐藏向量矩阵；

H₀＝X，那么前面公式中的H₁就应该替换为

H₂计算如下：

表示根节点增强后的第一层特征；

H₁ ^root是H₁的根节点；

H₁是GCN中第一层特征；

H₂是GCN中第二层特征；

concat表示拼接。

3.分类预测

在获得了具有情感信息的语义特征和根节点增强的传播结构特征之后，将这些特征进行拼接从而获得融合特征F

F＝concat(S',H) (26)

其中S'表示具有情感信息的语义特征；

H表示根节点增强的传播结构特征；

最后的预测值由拼接后的向量输入一个多层感知机MLP和Softmax层从而获得对帖子准确性的概率

的预测，如下式：

其中

是判断谣言类别的概率值，通过映射该值可以得到最终的标签；

MLP是Multilayer Perception的简称，即多层感知机；

c表示输出节点个数；

C表示输出节点总个数；

Softmax函数将神经元得输出映射到(0,1)区间内；

为了验证模型的有效性并使实验结果具有普遍性，在中文的Weibo数据集和两个英文的数据集Twitter 15和Twitter 16上进行实验。其中传播结构图中的节点表示了用户的源帖子，边表示了转发或者评论关系。在Weibo数据集中有两种标签，分别是True Rumor(TR)和False Rumor(FR),在Twitter数据集中有四种标签，分别为True Rumor(TR)、FalseRumor(FR)、Unverified Rumor(UF)和None Rumor(NR)。数据集的详细信息如表1所示。

表1数据集的统计

在实验环节，实验配置为Windows10、CPU Xeon Gold 6226R*2、128GB内存、NVIDIAQuadro RTX A6000*2。在实验中用下面的模型作为谣言检测模型的基准，与本发明专利提出的EaA-GCN方法进行了比较分析。

1)DTC基于手工特征的决策树分类器检测谣言的方法。

2)DTR，是一种基于决策数的排名模型，统计并排序有争议的事实声明，从而识别出谣言。

3)RFC，是一种基于随机森林的谣言分类器，探索了不同时间窗口的谣言分类表现水平，使用三个参数来拟合时间推文体积曲线，提供了对谣言随时间积累传播模式的深入洞察，以及跟踪不同谣言特征的预测能力的精确变化，

4)SVM-RBF，一种基于SVM并结合了RBF内核的检测模型，它是使用了新浪微博的具体特征构建的分类器。

5)SVM-TS是一种线性SVM分类器模型，该模型从时间序列结构，从内容、用户、和扩散模式对社会背景特征的变化进行建模。

6)GRU是一种基于RNN深度学习模型，该模型考虑了谣言帖子的时间序列和文本语义特征。

7)RvNN是一种基于树状结构RNN的模型，该模型考虑了谣言传播结构的自上而下和自底向上两个方向的特征。

8)PPC是一种结合了循环神经网络和卷积神经网络的谣言检测模型，该模型从考虑了用户特征在传播路径上的全局和局部变化。

9)VAE-GCN提出了基于GCN的图卷积编码解码的谣言检测模型，学习谣言的文本和传播结构特征以进行谣言检测

采用Accuracy(Acc.)，Precision(Prec.)，Recall(Rec.)和F1-score(F1)对提出的EaA-GCN方法进行性能评估。在Weibo数据集上采用Accuracy、Precision、Recall和F1；在Twitter 15和Twitter 16数据集采用Accuracy和F1进行评价。

/>

其中TP(True Positive)表示被判定为正样本，事实上也是正样本；FP(FalsePositive)表示被判定为正样本，但是事实上是负样本；TN(True Negative)表示被判定为负样本，事实上也是负样本；FN(False Negative)表示被判定为负样本，但是事实上是正样本。

在Weibo数据集上，将提出的EaA-GCN方法与经典的DTC等9种基线模型进行了对比分析，其实验结果如表2所示。

表2Weibo数据集的实验结果

表2中，提出的EaA-GCN方法以94.5％的准确率(Accuracy)成为对比的9种模型中表现最好的模型，与最佳基准相比有0.1％的提升，其中F1值达到了94.5％，与最佳基准相比有0.5％的提升，精确率(Precision)更是达到了96.9％。因此EaA-GCN方法整体来说优于其他模型。

在Twitter 15和Twitter 16数据集上将提出的EaA-GCN方法与传统的DTC等9种基线模型进行了对比分析，实验结果如表3和表4所示。

表3Twitter 15数据集的实验结果

表4Twitter 16数据集的实验结果

表3～表4中，EaA-GCN方法在Twitter 15和Twitter 16两个数据集上以89.9％和90.5％的准确率(Accuracy)成为表现最好的模型，与基线中表现最好的VAE-GCN模型的准确率(Accuracy)相比分别有4.3％和3.7％的提升。此外，表III和表IV，EaA-GCN能在两个数据集上的TR指标分别达到了92.1％和93.2％，在NR、FR和UR上的精确率(Precision)也都能达到87％以上。

从图2可以看出，EaA-GCN在Twitter 15和Twitter 16数据集上不仅取得了最高的准确率(Accuracy)，还在NR、FR、TR、UR四个评价指标上均取得了80％以上的成绩。其中EaA-GCN在Twitter 15数据集中TR和FR的精确率(Precision)分别达到了92.1％和89.9％；对于Twitter 16数据集，EaA-GCN在NR和FR的召回率(Recall)分别达到了93.4％和92.3％。

通过表2～表3和图2可以看出，与DTC、DTR和基于SVM的一系列传统模型相比，本发明专利提出的EaA-GCN及GRU、PPC等模型在一系列评价指标上均有较大的提升，且都达到了0.9以上的准确率(Accuracy)，表明了基于神经网络的深度学习检测方法在原理上大幅优于基于传统机器学习的检测方法，证明了神经网络模型在不依赖于特征工程的同时，有着更好的谣言特征提取能力。在五个深度学习检测模型中，EaA-GCN和VAE-GCN由于结合了GCN来提取谣言的传播结构特征，因此在检测精度上优于其他三个模型，表明了以图结构来对传播过程进行建模并以图卷积神经网络来提取谣言在传播过程中的结构特征是有效的。本发明专利提出的EaA-GCN是唯一采用了情绪感知模块来分析文本情感特征的检测模型，在各项指标上优于其他模型，表明了通过情绪感知模块来分析文本的情感特征对于提升谣言检测的精度是合理有效的。总体上，提出的EaA-GCN方法在不同程度上均优于其他的传统的DTC、DTR等9种模型。

(1)消融实验

为了验证EaA-GCN方法中各个模块的有效性，设计了相应的消融实验。消融实验的模型如下：

1)EaA-GCN/ER:去掉模型中的情感信息提取模块和根节点增强模块，即将语义特征和传播结构特征相结合并进行谣言检测。

2)EaA-GCN/R：在传播结构特征提取中去掉根节点增强模块，即仅仅使用DropEdge和GCN提取传播结构特征，然后将其与具有情感信息的语义特征相融合进行谣言检测；

3)EaA-GCN/E：在模型中去掉提取情感信息的模块，即语义特征和根节点增强的传播结构特征相结合进行谣言检测。

在Weibo、Twitter 15、Twitter 16数据集上对以上三种模型进行验证，以衡量不同模块的性能和合理性，并与本发明专利提出的EaA-GCN模型进行对比，实验结果如图所示。图3中，图3(a)表示在四种模型在Weibo数据集上的表现，3(b)、3(c)分别是四种模型在Twitter 15、16数据集上的结果。从图3中可以看出与其他三种模型相比，本发明专利提出的模型EaA-GCN在三个数据集上都有良好的表现。

(2)早期检测

由于随着时间的增加，谣言扩散的范围会越来越广，产生的负面影响也会越来越大，所以尽早地检测出谣言的存在并抑制其传播非常重要，对谣言的早期发现能力也成为一个衡量谣言检测效果的重要指标。为了验证该模型对谣言早期检测的有效性，在三个数据集上的实验过程中设置了一系列的检测截止日期，并对从释放时间到截止日期时间的数据进行了实验。早期检测结果如图4所示。

图4中，图4(a)、图4(b)和图4(c)分别显示了EaA-GCN方法与SVM-TS、DTC、RvNN、Bi-GCN和PPC模型在Weibo、Twitter 15和Twitter 16数据集当设置不同截至时间的情况下性能对比。图4显示，本发明专利提出EaA-GCN方法在源帖早期就达到了较高的准确率(Accuracy)，此外，在每个截止时间本发明专利提出的模型都明显优于其他模型。表明提出的EaA-GCN方法不仅有利于长期的谣言检测，而且有助于谣言的早期检测。

综上所述，结合情感感知提出了一种自动谣言检测方法EaA-GCN。考虑了帖子发布者和用户的情感信息，结合注意力机制将从文本中提取出的情感信息融合在文本中并获得具有情感信息的语义特征；此外，考虑帖子传播结构特征，利用根节点信息增强的方式处理结构特征；最终将结构特征与具有情感信息的语义特征相融合的到融合特征并进行谣言检测。为了评估EaA-GCN模型的合理性、有效性，在不同Weibo、Twitter 15和Twitter 16数据集上，对比DTC等9种不同的模型；为了验证各个模块的有效性在三个数据集上进行了消融实验，实验结果表明，EaA-GCN方法综合来说优于传统的DTC等9种基线模型；全面论证了提出的EaA-GCN方法的合理性与有效性。

尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。