CN113919440A - 一种融合双重注意力机制和图卷积社交网络谣言检测系统 - Google Patents
一种融合双重注意力机制和图卷积社交网络谣言检测系统 Download PDFInfo
- Publication number
- CN113919440A CN113919440A CN202111233669.1A CN202111233669A CN113919440A CN 113919440 A CN113919440 A CN 113919440A CN 202111233669 A CN202111233669 A CN 202111233669A CN 113919440 A CN113919440 A CN 113919440A
- Authority
- CN
- China
- Prior art keywords
- text
- rumor
- propagation
- data
- feature extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 76
- 230000007246 mechanism Effects 0.000 title claims abstract description 45
- 230000009977 dual effect Effects 0.000 title claims description 6
- 238000000605 extraction Methods 0.000 claims abstract description 43
- 239000013598 vector Substances 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 4
- 230000006855 networking Effects 0.000 claims 1
- 238000000034 method Methods 0.000 abstract description 35
- 239000011159 matrix material Substances 0.000 description 20
- 230000000694 effects Effects 0.000 description 15
- 230000006870 function Effects 0.000 description 14
- 238000002474 experimental method Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 13
- 239000000284 extract Substances 0.000 description 11
- 238000013528 artificial neural network Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000010801 machine learning Methods 0.000 description 7
- 238000002679 ablation Methods 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 230000002411 adverse Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000000306 recurrent effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Abstract
本发明提出了一种融合双重注意力机制和图卷积社交网络谣言检测系统,包括文本获取模块、文本语义特征提取模块、传播结构特征提取模块和谣言预测分类模块;文本获取模块的数据输出端与文本语义特征提取模块的数据输入端相连,文本语义特征提取模块的数据输出端与传播结构特征提取模块的数据输入端相连,传播结构特征提取模块的数据输出端与谣言预测分类模块的数据输入端相连。本发明能够对社交网络上获取的文本进行谣言检测。
Description
技术领域
本发明涉及一种社交网络技术领域,特别是涉及一种融合双重注意力机制和图卷积社交网络谣言检测系统。
背景技术
随着移动互联网技术的蓬勃发展,在线社交网络如微博、微信、Twitter等信息平台逐渐走进人们的生活并渐渐成为日常生活中重要的信息生成及传播平台。在这些社交媒体平台上,用户不仅仅是信息的消费者也是信息的生产者和传播者。社交网络中的用户可以在这些网络平台上发布,转发或分享文本、图片、音频和视频等各种信息。然而正因为如此,与传统纸媒时代相比,信息的生产和传播的门槛大大降低,大量信息未经核实或判断就被发布在社交网络平台,同时社交网络平台对信息也缺乏有效的监管。这些因素导致了网络谣言的产生和泛滥。社交网络平台在为人与人之间信息交流提供了便利的同时,也降低了不实信息的传播成本,进而逐渐发展成为网络谣言肆意滋生的温床。根据微博辟谣官方账号在2021年2月发布的月度工作报告,当月共有效处理不实信息5332条,发布微博辟谣信息83条。社交网络中谣言的传播会对社会产生不良的影响,严重时会危害社会稳定,造成社会动荡。因此,对社交网络中的谣言进行及早检测并抑制其传播对维护社会稳定具有重要意义。
发明内容
本发明旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种融合双重注意力机制和图卷积社交网络谣言检测系统。
为了实现本发明的上述目的,本发明提供了一种融合双重注意力机制和图卷积社交网络谣言检测系统,包括文本获取模块、文本语义特征提取模块、传播结构特征提取模块和谣言预测分类模块;
文本获取模块的数据输出端与文本语义特征提取模块的数据输入端相连,文本语义特征提取模块的数据输出端与传播结构特征提取模块的数据输入端相连,传播结构特征提取模块的数据输出端与谣言预测分类模块的数据输入端相连;
所述文本获取模块用于获取网络节点上的文本数据;
文本语义特征提取模块用于对获取的文本数据进行语义特征提取;
传播结构特征提取模块用于对文本数据传播的提取;
谣言预测分类模块用于对获取的文本数据进行预测分类。
在本发明的一种优选实施方式中,在文本语义特征提取模块中包括:
为了便于对数据的处理,采用Skip-gram模型将文本数据转换为向量形式,由于不同文本数据的长度不一致,因此需要统一文本数据长度。
在本发明的一种优选实施方式中,将文本长度设定为L,若获取的文本长度Li<L,则在该文本末尾处进行补0填充;若该文本长度Li>L,则在该文本长度为L处进行分割。
在本发明的一种优选实施方式中,在谣言预测分类模块中包括:
其中,yk是某个类别的预测值,
K是类别的数量。
在本发明的一种优选实施方式中,还包括展示模块,此时文本获取模块的数据输出端与文本语义特征提取模块的数据输入端相连,文本语义特征提取模块的数据输出端与传播结构特征提取模块的数据输入端相连,传播结构特征提取模块的数据输出端与谣言预测分类模块的数据输入端相连,谣言预测分类模块的数据输出端与展示模块的数据输入端相连;在展示模块上展示谣言文本以及非谣言文本。
在本发明的一种优选实施方式中,还包括无线传输模块,此时文本获取模块的数据输出端与文本语义特征提取模块的数据输入端相连,文本语义特征提取模块的数据输出端与传播结构特征提取模块的数据输入端相连,传播结构特征提取模块的数据输出端与谣言预测分类模块的数据输入端相连,谣言预测分类模块的数据输出端与无线传输模块的数据输入端相连,将谣言文本通过电话号码发送至指定用户人群,防止事态扩大。
综上所述,由于采用了上述技术方案,本发明能够对社交网络上获取的文本进行谣言检测。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是现有技术中微博传播过程示意图。
图2是本发明谣言监测模型结构示意图。
图3是本发明多头注意力示意图
图4是本发明不同类别数据上的实验结果示意图
图5是本发明消融实验对比示意图。
图6是本发明早期检测结果示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
1.1背景
针对社交网络中谣言泛滥的问题,相关专家和学者提出了一系列的检测办法。目前对于社交网络平台上的谣言检测方法主要分为三类:人工检测方法,基于传统机器学习的检测方法和基于深度学习的检测方法。随着近年来图卷积技术在文本处理上的广泛应用,利用图卷积来实现谣言检测已取得了不错的效果,如Bian等人提出使用双向图卷积(Bi-Directional Graph Convolutional Network)来抽取谣言传播过程中的相关特征来进行谣言检测。另一方面,Google提出的Transformer模型使注意力机制(Attentionmechanism)得到广泛应用。
现有的谣言检测方法大多是基于事件本身的语义特征来实现,但事件在传播过程所产生的传播结构特征对于实现谣言检测也具有重要意义。图1为微博在传播过程中所产生的关系结构的简化模型。
其中Weibo1与Weibo2为社交网络中的源博文,User为相应微博下进行评论或转发的用户,Weibo3和Weibo4则为分别以Weibo1与Weibo2为源头的转发微博。从该传播结构可以看出,原本互不相关的Weibo1与Weibo2可能会因为同一用户User3的转发或评论而产生关联,因此社交网络中的微博传播关系错综复杂,充分挖掘微博在传播过程中所产生的种种关系结构,对实现谣言检测具有重要意义。因此本发明专利提出融合双重注意力机制和图卷积网络的谣言检测方法(BA-GCN)。利用图卷积网络和注意力机制来提取谣言传播网络中的关键传播结构特征,并应用了注意力机制来融合文本数据并从中捕获谣言的文本语义特征。实验表明,将事件在语义和传播两个方面的特征相融合有利于实现高质量的谣言检测。
1.2本发明专利主要贡献
1)将谣言的文本语义特征和传播结构特征进行融合产生了新的特征信息,提取的新特征信息对微博谣言具有更好的表示。
2)提出了一种新的基于注意力机制的谣言文本语义特征及关键传播特征提取方法,其中文本语义特征融合了源微博和原博下的评论转发内容。
3)提出了一种新的结合了注意力机制和图卷积神经网络的传播结构特征提取方法,该方法构建了微博的传播结构图并从中提取微博在社交网络中的关键传播结构特征。
4)为了有效检测社交网络谣言,提出了一种融合双重注意力机制和图卷积神经网络的社交网络谣言检测方法(Bi-Attention Graph Convolutional Network,BA-GCN),并在三个不同数据集上对提出的方法进行了验证。
2相关工作
谣言可以定义为在社交网络中传播并被官方证实为虚假的信息,鉴于谣言在社交网络中传播所带来的不良影响,相关学者和机构对谣言检测技术进行了一系列的研究。
早期对谣言的自动检测主要是利用机器学习的方法来进行,对于基于机器学习的谣言检测方法而言,如何选择与提取出显著的特征来表征数据对谣言检测的效果至关重要。因此基于机器学习的谣言检测方法在某种程度上可以说是一种基于特征工程的方法。Castillo等通过检测微博文本中的特殊字符或链接来检测谣言;Qazvinian等通过提取微博中的内容特征、用户行为特征和微博标签等特征来判别微博是否为谣言;Yang等在Castillo及Qazvinian等人的基础上提出基于客户的特征(Client-Based Features)和基于位置的特征(Location-Based Features)来检测微博谣言。
由于基于传统机器学习的谣言检测方法对特征工程的依赖性较高,深度学习逐渐取代了传统机器学习成为目前主流的谣言检测方法。2016年Ma等首次使用循环神经网络(Recurrent Neural Network,RNN)来对时间序列和句子等变长序列信息进行建模分析得到谣言的隐藏特征;Bian等首次将图卷积神经网络(Graph Convolutional Network,GCN)应用到谣言检测领域,并使用双向图卷积神经网络来捕获谣言在传播过程中自上而下和自下而上的特征;Huang等使用图卷积网络来建模用户网络,并结合用户特征和传播树特征来进行谣言检测;Ma等采用对抗学习的方式来提升谣言分类的表现;此外,Ma等通过构建树形递归神经网络结构(tree-structured Recursive Neural Networks,RvNN)来捕获谣言的传播特征;Yu等将注意力机制应用到卷积神经网络上,利用注意力机制学习事件的表示,再使用卷积神经网络(Convolutional Neural Networks,CNN)来提取序列中的关键特征来实现虚假信息的检测;Liu等提出结合边内核和点内核的注意力网络来进行谣言检测;Sujana等提出一种具有衰减因子的分层BiLSTM模型,从有限的谣言文本信息中提取深层信息并利用衰减因子来提高准确性;Zhong等构建了语义级别的事实核查方法,并通过预训练模型来提取事实结构信息;
Li等将Twitter中的评论和对话信息建模为图结构,并利用评论信息来提高谣言检测效果;Li等将用户可信度信息和注意力机制结合起来,同时提取用户特征和谣言特征来进行谣言检测;Yang等为用户信息和评论信息建模,并提出图对抗学习来增强模型的鲁棒性和检测效果;He等通过修改回复信息和事件结构实现数据增强,同时引入自监督学习来进行谣言检测;Malhotra等将图卷积网络和Transformer结构结合起来并从谣言传播路径中提取谣言传播特征来对谣言进行分类;Ma等提出使用实体识别方法来增强谣言语义信息,并结合语句重构方法来提高谣言检测的表现;Chen等提出一种基于细粒度(fine-grained)用户表示学习的谣言检测模型,该模型将参与者的用户影响力等特征进行建模来改进模型的效果;Toan等将传播图视为数据流,并通过计算潜在谣言的异常分数来捕捉谣言传播特征;Lu等提出一种图形感知协同注意网络,通过加入用户特征来对谣言检测的效果进行改进。Li等通过提取用户之间的关注信息,构建基于关注关系的好友网络来进行谣言检测。
3提出的方法
3.1谣言检测模型构建
本发明专利所提出方法中使用到的公式及变量符号的定义如表1所示。本发明专利所提出的融合双重注意力机制和图卷积的谣言检测方法(BA-GCN)包含三个模块:文本语义特征提取模块;传播结构特征提取模块和谣言预测分类模块。BA-GCN的结构图如图2,该方法关注谣言的文本语义特征和在传播过程中产生的关键传播结构特征,BA-GCN从谣言文本和谣言传播图中分别提取出文本语义特征和传播结构特征后,将二者进行融合,产生的新特征对微博谣言有着更好的表示。
表1变量定义表
其中每个事件都有相应的标签yi表示该事件的真实性即yi∈{T,F}(T表示真实的,F表示虚假的)。在某些数据集中,标签yi含四种取值即yi∈{N,T,F,U}(N表示非谣言,T表示真实的事件,F表示虚假的事件,U表示真实性未确定的事件)。在给定数据集下,谣言检测的目的是学习谣言数据中的隐藏特征并根据这些特征利用分类器对真实性未知的微博数据进行判别:
f:Ci→Yi
其中Ci是待判别的事件,Yi是由分类器给出的真实性标签,f:表示分类器函数,→表示获得。
图2中的模型包含两个部分:文本语义特征提取和传播结构特征提取。语义特征提取是利用注意力机制将源微博的文本内容与源博下的评论及转发内容ri进行融合,使用融合后产生的新特征来表示每条源博文si或事件Ci。传播结构特征提取是使用传播图的结构来表示微博数据,将源微博、转发微博、评论和用户作为传播图中的节点,根据评论—转发关系构建节点之间的边,不同的源微博通过相同的参与用户连接起来,利用图卷积网络来提取传播图中的结构信息,同时结合注意力机制为结构中不同的关系赋予相应的权重,实现更好的传播结构特征表示。
3.2传播结构图构建
Ma等早期通过构建传播树的结构来提取谣言在传播过程中所产生的结构信息,但传播树的结构只考虑了源微博下的转发关系,忽略了不同源微博因共同用户的转发及评论而产生的联系,因此本发明专利构建传播图来提取传播特征。本发明专利基于评论—转发关系为每个事件Ci构建传播结构G<V,E>,其中V是图中的节点集合,包含微博节点和用户节点。G中表示不同事件的节点vi之间因共同用户ui的参与形成边ei。使用矩阵和X分别表示G的邻接矩阵和事件Ci的特征矩阵,并在这两个矩阵的基础上构建图卷积网络。由于传播图G的结构复杂,为防止在图卷积训练过程中发生过拟合的现象,本发明专利在每个训练epoch中采用DropEdge的方式来随机丢弃G中一些边,通过该方法能够增强原始数据的多样性和随机性。假设在传播图G中边ei的总数量为Ne,此时Ne=υ;对边进行丢弃的概率为p,则经过DropEdge后的邻接矩阵A′为:
A′=A-Adrop (1)
其中Adrop是对G中的边集合E进行随机采样后形成邻接矩阵,该邻接矩阵中边的数量为Ne×p。
3.3文本语义特征提取
为了便于模型对数据的处理,本发明专利采用Skip-gram模型将微博文本内容转换为向量形式,由于不同微博文本的长度不一致,因此需要统一文本长度。本发明专利将每条微博文本长度设定为L,若某条博文长度Li<L,则在该条博文的末尾处进行补0填充;若某条博文长度Li>L,则在该博文长度为L处进行分割。一条长度为Li的博文向量表示s由该博文中单词向量wi拼接而成。
其中⊙表示单词向量的拼接操作,当博文长度不足L时,⊙0表示拼接0向量。将文本的向量表示输入到BA-GCN中,模型利用多头注意力机制来学习文本中的隐含语义特征,多头注意力机制结构如图2。
其中Q、K、V分别表示是多头注意力机制的三个输入,表示实数矩阵;Query表示注意力机制中三个输入之一,即查询向量,Key表示注意力机制中三个输入之一,即键值对中的键,Value表示注意力机制中三个输入之一,即键值对中的值;nq、nk、nv分别代表这三个向量的长度,d则是词嵌入的维度。多头注意力机制通过计算Q和K之间的相关性或相似度来得到权重系数w:
其中Lx为博文长度,Sim代表相似度,Softmax()表示Softmax函数,Simi表示某两个向量之间的相似度i,Simj表示另外个向量之间的相似度j,其计算方式如下:
T表示矩阵转置;
d表示词嵌入的维度;
再根据w对V进行加权求和得到注意力的数值:
wi表示权重值;
通过注意力机制的计算,模型能够感知Q与K之间的隐含关系,同时V与表示隐含关系的权重系数进行加权求和能够得到新的Q向量。考虑到微博文本数据量较大,为捕捉到数据中更丰富的特征和信息,平衡不同权重参数带来的影响,模型使用多头注意力,每个注意力头headi从不同的方面来捕捉Q、K和V之间的隐含关系,最终的多头注意力数值由多个headi值进行拼接得到:
MultiHead(Q,K,V)=Concat(head1,head2,head3,…,headh)W (7)
W表示用来维度转换的矩阵;
headi表示第i个head计算出来的值;
Concat()表示连接。
本发明专利使用多头注意力机制来挖掘评论和转发的语义特征,并从文本内容的角度构建它们之间的联系,然后基于文本的语义关系将评论和转发数据进行融合以产生新的表示,根据式(7)则有:
R′=MultiHead(R,R,R) (8)
MultiHead()表示多头注意力机制函数;
其中R={r1,r2,r3,…rn}表示评论和转发的集合,是经过多头注意力机制融合产生的新表示。然后进一步挖掘源微博s与R′的隐含特征,通过计算转发与原博之间的相关性得到相应的注意力数值a,根据式(3)和式(5)则有:
Softmax()表示Softmax函数;
根据该数值能够生成与原博相关性最高的评论和转发r:
r=aTR′ (10)
最后,本发明专利将r与源博s进行融合来生成新的源博表示s′:
3.4传播结构特征提取
在处理图结构信息方面,图卷积网络(GCN)是最有效神经网络之一,其卷积原理可以看作是“消息传递(message-passing)”的过程:
Hk=M(A,Hk-1,Wk-1) (12)
其中Hk和Hk-1分别是图卷积层(Graph Conventional Layer,GCL)在第k和第k-1层得到的隐含特征矩阵,A是对应图结构的邻接矩阵,Wk-1是网络中的可学习参数,M()则是消息传递函数(Message Propagation Function),根据Kipf等提出的ChebNet,式(12)可以写成:
本发明专利使用GCN来提取微博的传播结构特征,根据式(13)能够得到传播结构图G的隐含特征矩阵:
其中X表示图的特征矩阵,是GCN中第一层的特征矩阵,是参数矩阵,使用ReLU函数作为激活函数同时加入Dropout来降低过拟合的风险。经过GCN对节点的聚合,节点的表示已经包含了全局的结构信息,为了从中获得最关键的结构特征,本发明专利应用多头注意力机制来更新节点的分布式特征,图中某个节点的特征向量为hi,其邻居节点的特征向量为hj,根据多头注意力机制则有:
其中a是可学习参数,w是线性变换矩阵,⊙表示拼接操作,LeakyRelu()表示LeakyRelu激活函数,hi表示节点i的特征向量,hj表示节点j的特征向量,hk表示节点k的特征向量,Ni表示总的节点数。最后将多个注意力头生成的向量进行拼接:
计算传播结构特征的算法如下:
在GCN和注意力机制的共同作用下,每个节点都包含了图中的全局结构信息,同时对于每个节点,其不同的邻居节点和邻边具有不同的权重。通过关注重要的节点信息,模型最终得到的节点表示能够更高效地表征微博的传播特征。
3.5预测及分类
在得到微博数据的文本语义特征和传播结构特征后,本发明专利将二者结合起来作为融合特征F:
F=concat(s′,H′) (17)
其中H′=[h1′,h2′,h3′,…,hi′],concat()表示连接,s'为最终得到的微博文本表示,在经过全连接神经网络(Fully Connected Neural Network,FC)的计算后得到最终预测值:
y=Soft max(FC(F)) (18)
其中y是用于判断谣言类别的概率值,FC()表示全连接神经网络,通过该值的映射能够得到最终的标签。若概率值大于或者等于预设谣言概率阈值,则认为该条文本为谣言,否则为非谣言;在训练中通过最小化预测值y与真实值之间的交叉熵损失函数来最小化误差:
4.实验结果分析
本发明专利通过最小化交叉熵损失函数来训练BA-GCN,得到最佳的参数集合,并在三个数据集上验证模型的有效性。
4.1数据集
本发明专利分别在三个真实数据集上验证提出的模型:Weibo,Twitter15和Twitter16,这三个数据集是中国和美国目前主流社交网络平台的真实数据集。数据集中的节点代表用户,边则表示转发-评论关系。Weibo数据集中关于真实性的标签为True Rumor(TR)或False Rumor(FR),而Twitter数据集中关于真实性的标签有四个,分别为TrueRumor(TR)、False Rumor(FR)、Unverified Rumor(UR)和None Rumor(NR)。数据集的详细信息如表2所示。
表2数据集信息
Statistic | Twitter15 | Twitter16 | |
#of users | 2,746,818 | 276,663 | 173,487 |
#of posts | 3,805,656 | 331,612 | 204,820 |
#of events | 4664 | 1490 | 818 |
#of True rumors | 2351 | 374 | 205 |
#of False rumors | 2313 | 370 | 205 |
#of Unverified rumors | 0 | 374 | 203 |
#of Non-rumors | 0 | 372 | 205 |
Avg.time length/event | 2,460.7 Hours | 1,337 Hours | 848 Hours |
Avg.#of posts/event | 816 | 223 | 251 |
Max#of posts/event | 59,318 | 1,768 | 2,765 |
Min#of posts/event | 10 | 55 | 81 |
4.2实验设置
本发明专利基于PyTorch 1.8框架构建提出的模型并进行实验,对于不同的数据集,实验所采用的超参数初始化值略有不同。实验中部分超参数初始化值设置如表3。
表3超参数设置
Parameters | Values for Weibo | Values for Twitter |
Optimizer | Adam | Adam |
Batch size | 64 | 16 |
Learning rate | 0.002 | 0.002 |
Regression | 0.00001 | 0 |
Epochs | 30 | 30 |
Dropout rate | 0.5 | 0.5 |
以下几个模型将作为谣言检测模型的基准与本发明专利提出的模型进行比较:
DTC:一种依赖于手工提取特征的决策树分类器谣言检测模型。
DTR:该方法通过正则表达式从Twitter信息流提取关键词并进行排序,再使用基于决策树的模型来对排序结果进行谣言检测。
RFC:一种利用用户特征,内容特征和结构特征进行判别的随机森林分类模型。
SVM-RBF:一种结合博文特征和RBF内核的SVM检测模型。
SVM-TS:一种利用手工提取的特征来构建时间序列模型的SVM检测模型。
PTK:该方法从传播树中学习时间序列结构并使用基于传播树内核的SVM分类器来进行谣言检测。
GRU:一种利用RNN来提取推文序列信息的谣言检测模型。
RvNN:一种使用树形结构循环神经网络来从传播结构中学习谣言特征的谣言检测模型。
PPC:该方法将CNN与RNN相结合,并以此从谣言传播路径及用户特征中提取谣言特征。
GLAN:该方法通过构建异质图,并通过联合异质图的本地和全局关系来进行谣言检测。
VAE-GCN:该方法使用图卷积作为编码器和解码器来学习谣言的文本和传播信息,并利用这些信息进行谣言检测。
4.3结果分析
为方便比较,本发明专利使用准确率(Accuracy)、精确率(Precision)、召回率(Recall)和F1-值(F1-score)作为模型的评价指标。表4、表5和表6分别展示了BA-GCN和各基准模型在三个数据集上的实验结果。
表4 Weibo数据集实验结果
表4显示了上述模型在Weibo数据集上的实验结果,其中本发明专利提出的模型以94.4%的准确率(Accuracy)成为表现最好的模型之一,并且F1-值(F1-score)达到了94.4%,与最佳基准相比提升了0.8%。因此BA-GCN在一定程度上优于其他模型。
表5 Twitter15数据集实验结果
表6 Twitter16数据集实验结果
表5和表6显示了上述模型在Twitter15和Twitter16数据集上的实验结果,其中本发明专利提出的模型分别以90.5%和90.2%的准确率(Accuracy)成为表现最好的模型,与之前表现最佳的GLAN相比分别提升了1.6%和2.5%,此外在F1-值(F1-score)上的表现也超过其他基准模型,最高达到94.7%,相比于最佳基准提高了1.0%。
BA-GCN在Twitter15和Twitter16数据集上不仅取得了最高的准确率(Accuracy)和F1值(F1-score),在精确率(Precision)和召回率(Recall)两个指标上的表现也十分优秀。图4展示了BA-GCN在Twitter15和Twitter16中不同类别数据上的实验结果。
从图4可以看出,BA-GCN在Twitter15和Twitter16两个数据集的四个评价指标上均取得了80%以上的成绩。其中BA-GCN在Twitter15数据集中NR和TR上的精确率(Precision)分别达到了95.3%和94.9%,在NR和FR上的召回率(Recall)分别达到了96.4%和91.7%;对于Twitter16数据集,BA-GCN在NR和TR上的精确率(Precision)分别达到了97.4%和90.0%,在UR和TR上的召回率(Recall)分别达到了93.3%和95.7%。
通过表4~表6和图4可以看出,本发明专利提出的BA-GCN在不同的数据集上都有着杰出的表现,这意味着图卷积网络结合双重注意力机制能够有效的捕捉谣言在传播过程中的语义特征和传播结构特征,将这两种特征融合能够有效地提升谣言检测的效果。从实验数据能够看出,在众多基准模型中,依赖于手工提取特征的传统机器学习方法如RFC、SVM-RBF等表现较差,而基于深度学习的方法利用神经网络捕获数据中的隐含特征,能够有效提升谣言检测的效果,因此深度学习是实现高质量谣言检测的关键手段。此外BA-GCN在实验结果上优于GRU、RvNN和PPC,表明谣言的文本语义特征和传播结构特征对谣言检测而言都具有重要影响,综合考虑二者才能取得更好的检测效果。最后以图结构为基础的GLAN、VAE-GCN及BA-GCN的表现优于RvNN等模型也证明了图结构相对于树形结构能够更有效地处理传播结构信息;而本发明专利提出的BA-GCN将注意力机制与图卷积相结合,不仅能够很好的从图中提取信息,更能在错综复杂的边关系中关注重点,从而高效地获取关键特征,实现更好的检测效果。
4.4消融实验
为分析BA-GCN中每个模块的有效性,本发明专利在BA-GCN的基础上进行修改,设计了一部分新的模型来进行消融实验。进行消融实验的模型分别有:
SA-GCN:去除传播结构信息模块中的注意力机制,仅仅使用GCN来提取图中的传播结构特征,保留单个注意力机制来提取微博文本语义特征。
SAN:去除传播结构信息模块,仅仅使用注意力机制融合原博、评论和转发,并从中提取文本语义特征来进行谣言检测。
GCN:去除文本语义信息模块,仅仅使用GCN来提取传播图中的传播结构信息用于谣言检测。
分别在Weibo、Twitter15和Twitter16三个数据集上进行实验,衡量上述三个模型的准确率(Accuracy),并与BA-GCN进行比较,实验结果如表7,图5显示了四个模型的对比结果。
表7消融实验结果
表7和图5表明,BA-GCN中的模块和方法都是必要的,在一定程度上提升了谣言检测的准确率。首先BA-GCN与SA-GCN相比,在三个数据集上的准确率分别提高了3.1%、5.8%和3.0%,这表明在提取谣言传播结构特征方面,注意力机制和图卷积的结合能够有效降低传播过程中噪音带来的影响,为关键的微博节点和评论-转发关系赋予更大的权重,从而学习到关键的传播结构特征;其次去除了传播结构特征的SAN相比于BA-GCN在三个数据集上的准确率分别降低了6.1%、7.7%和3.7%,这表明只关注谣言的文本语义信息而忽略其传播结构特征会对谣言检测的准确率带来较大的影响;而只关注传播结构信息的GCN在四个模型中表现最差,相比于BA-GCN在三个数据集上的准确率分别降低了8.3%、9.6%和4.8%,表明文本语义特征是谣言最重要的特征之一;最后BA-GCN与SA-GCN的表现总体上优于SAN和GCN,说明文本语义特征和传播结构特征对于谣言检测都具有重要意义,只有二者结合才能实现更好的检测效果。
4.5早期检测
在谣言传播过程中,随着传播时间的增加,谣言的传播范围逐渐增大,对社会造成的负面影响也越来越大,因此在谣言传播初期对其进行检测和抑制至关重要,对谣言的早期检测能力也成为衡量谣言检测效果的一个重要指标。实现谣言的早期检测,就是要在某条微博发布后一段较短的时间内,判断出该微博是否为谣言。为了衡量BA-GCN对谣言的早期检测能力,本发明专利设定一系列检测截止时间(deadlines),利用从发布时间到检测截至时间内的数据进行实验,根据模型在截止时间所取得的准确率(Accuracy)来衡量BA-GCN的早期检测能力,并与部分基准模型进行比较,实验结果如图6所示。
从图6显示的实验结果能够看出,BA-GCN在微博发布后的两个小时内就能够达到90%左右的准确率,表现优于其他基准模型。从传播开始到截止时间内,BA-GCN、VAE-GAN、GLAN及PPC的准确率波动较小,均能够在初始阶段达到较高的准确率,而RvNN和SVM-RBF则在初始阶段的准确率较低,经过一段时间后,准确率逐渐提高并在截止时间达到最高,本发明专利提出的模型在整体表现和最终的准确率上也优于VAE-GAN、GLAN及PPC。这表明本发明专利提出的BA-GCN不仅能够实现更高的准确率,而且能够在更短的时间内实现谣言的早期检测。
5总结
为了及早地检测并抑制谣言传播,降低谣言给社会带来的不良影响,本发明专利提出融合图卷积和双重注意力机制的社交网络谣言检测方法,从谣言的文本语义特征和传播结构特征两个方面充分地挖掘谣言的隐含特征,为谣言构建了全新的表示,实现了更高效率和更好效果的谣言检测任务。模型通过注意力机制将源微博与评论-转发进行融合并从中提取文本语义特征;此外为谣言构建传播图,利用图卷积来提取图中的传播结构信息并结合注意力机制使模型关注更重要的微博节点和评论-转发关系,降低不必要信息的干扰;最后模型将文本语义特征和传播结构特征融合产生新的表示。三个真实数据集上的实验结果表明本发明专利提出的BA-GCN在谣言检测和早期检测任务上均取得了非常好的效果并且优于其他基准模型。此外,本发明专利在BA-GCN的基础上构建了SA-GCN及SAN等模型来进行消融实验,实验结果也进一步验证了BA-GCN中每个模块的有效性和和合理性。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
Claims (4)
1.一种融合双重注意力机制和图卷积社交网络谣言检测系统,其特征在于,包括文本获取模块、文本语义特征提取模块、传播结构特征提取模块和谣言预测分类模块;
文本获取模块的数据输出端与文本语义特征提取模块的数据输入端相连,文本语义特征提取模块的数据输出端与传播结构特征提取模块的数据输入端相连,传播结构特征提取模块的数据输出端与谣言预测分类模块的数据输入端相连;
所述文本获取模块用于获取网络节点上的文本数据;
文本语义特征提取模块用于对获取的文本数据进行语义特征提取;
传播结构特征提取模块用于对文本数据传播的提取;
谣言预测分类模块用于对获取的文本数据进行预测分类。
2.根据权利要求1所述的融合双重注意力机制和图卷积社交网络谣言检测系统,其特征在于,在文本语义特征提取模块中包括:
为了便于对数据的处理,采用Skip-gram模型将文本数据转换为向量形式,由于不同文本数据的长度不一致,因此需要统一文本数据长度。
3.根据权利要求2所述的融合双重注意力机制和图卷积社交网络谣言检测系统,其特征在于,将文本长度设定为L,若获取的文本长度Li<L,则在该文本末尾处进行补0填充;若该文本长度Li>L,则在该文本长度为L处进行分割。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111233669.1A CN113919440A (zh) | 2021-10-22 | 2021-10-22 | 一种融合双重注意力机制和图卷积社交网络谣言检测系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111233669.1A CN113919440A (zh) | 2021-10-22 | 2021-10-22 | 一种融合双重注意力机制和图卷积社交网络谣言检测系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113919440A true CN113919440A (zh) | 2022-01-11 |
Family
ID=79242389
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111233669.1A Pending CN113919440A (zh) | 2021-10-22 | 2021-10-22 | 一种融合双重注意力机制和图卷积社交网络谣言检测系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113919440A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114444516A (zh) * | 2022-04-08 | 2022-05-06 | 四川大学 | 一种基于深度语义感知图卷积网络的粤语谣言检测方法 |
CN116431760A (zh) * | 2023-01-10 | 2023-07-14 | 重庆理工大学 | 基于情感感知和图卷积网络的社交网络谣言检测方法 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019183191A1 (en) * | 2018-03-22 | 2019-09-26 | Michael Bronstein | Method of news evaluation in social media networks |
CN111274491A (zh) * | 2020-01-15 | 2020-06-12 | 杭州电子科技大学 | 一种基于图注意力网络的社交机器人识别方法 |
CN112231562A (zh) * | 2020-10-15 | 2021-01-15 | 北京工商大学 | 一种网络谣言识别方法及系统 |
CN112256945A (zh) * | 2020-11-06 | 2021-01-22 | 四川大学 | 一种基于深度神经网络的社交网络粤语谣言检测方法 |
CN112256981A (zh) * | 2020-11-13 | 2021-01-22 | 北京理工大学 | 一种基于线性和非线性传播的谣言检测方法 |
CN112329444A (zh) * | 2020-11-10 | 2021-02-05 | 南开大学 | 融合文本和传播结构的早期谣言检测方法 |
US20210117619A1 (en) * | 2019-10-18 | 2021-04-22 | Nanjing University Of Aeronautics And Astronautics | Cyberbullying detection method and system |
CN112925908A (zh) * | 2021-02-19 | 2021-06-08 | 东北林业大学 | 一种基于Attention的图注意力网络的文本分类方法及系统 |
CN113191144A (zh) * | 2021-03-19 | 2021-07-30 | 北京工商大学 | 一种基于传播影响力的网络谣言识别系统及方法 |
CN113268675A (zh) * | 2021-05-19 | 2021-08-17 | 湖南大学 | 一种基于图注意力网络的社交媒体谣言检测方法和系统 |
CN113515634A (zh) * | 2021-07-09 | 2021-10-19 | 福州大学 | 基于分层异质图神经网络的社交媒体谣言检测方法及系统 |
-
2021
- 2021-10-22 CN CN202111233669.1A patent/CN113919440A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019183191A1 (en) * | 2018-03-22 | 2019-09-26 | Michael Bronstein | Method of news evaluation in social media networks |
US20210117619A1 (en) * | 2019-10-18 | 2021-04-22 | Nanjing University Of Aeronautics And Astronautics | Cyberbullying detection method and system |
CN111274491A (zh) * | 2020-01-15 | 2020-06-12 | 杭州电子科技大学 | 一种基于图注意力网络的社交机器人识别方法 |
CN112231562A (zh) * | 2020-10-15 | 2021-01-15 | 北京工商大学 | 一种网络谣言识别方法及系统 |
CN112256945A (zh) * | 2020-11-06 | 2021-01-22 | 四川大学 | 一种基于深度神经网络的社交网络粤语谣言检测方法 |
CN112329444A (zh) * | 2020-11-10 | 2021-02-05 | 南开大学 | 融合文本和传播结构的早期谣言检测方法 |
CN112256981A (zh) * | 2020-11-13 | 2021-01-22 | 北京理工大学 | 一种基于线性和非线性传播的谣言检测方法 |
CN112925908A (zh) * | 2021-02-19 | 2021-06-08 | 东北林业大学 | 一种基于Attention的图注意力网络的文本分类方法及系统 |
CN113191144A (zh) * | 2021-03-19 | 2021-07-30 | 北京工商大学 | 一种基于传播影响力的网络谣言识别系统及方法 |
CN113268675A (zh) * | 2021-05-19 | 2021-08-17 | 湖南大学 | 一种基于图注意力网络的社交媒体谣言检测方法和系统 |
CN113515634A (zh) * | 2021-07-09 | 2021-10-19 | 福州大学 | 基于分层异质图神经网络的社交媒体谣言检测方法及系统 |
Non-Patent Citations (3)
Title |
---|
ZUNWANG KE等: "Rumor Detection on Social Media via Fused Semantic Information and a Propagation Heterogeneous Graph", 《 COMPUTER SCIENCE AND SYMMETRY/ASYMMETRY》 * |
杨延杰等: "融合源信息和门控图神经网络的谣言检测研究", 《计算机研究与发展》 * |
梁兆君等: "基于社交网络的谣言检测综述", 《电脑编程技巧与维护》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114444516A (zh) * | 2022-04-08 | 2022-05-06 | 四川大学 | 一种基于深度语义感知图卷积网络的粤语谣言检测方法 |
CN114444516B (zh) * | 2022-04-08 | 2022-07-05 | 四川大学 | 一种基于深度语义感知图卷积网络的粤语谣言检测方法 |
CN116431760A (zh) * | 2023-01-10 | 2023-07-14 | 重庆理工大学 | 基于情感感知和图卷积网络的社交网络谣言检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Shi et al. | mvn2vec: Preservation and collaboration in multi-view network embedding | |
CN113919440A (zh) | 一种融合双重注意力机制和图卷积社交网络谣言检测系统 | |
CN113705099B (zh) | 基于对比学习的社交平台谣言检测模型构建方法及检测方法 | |
CN113268675B (zh) | 一种基于图注意力网络的社交媒体谣言检测方法和系统 | |
CN113434628B (zh) | 一种基于特征级与传播关系网络的评论文本置信检测方法 | |
Liu et al. | Social network rumor detection method combining dual-attention mechanism with graph convolutional network | |
CN116431760A (zh) | 基于情感感知和图卷积网络的社交网络谣言检测方法 | |
Li et al. | Graph contrastive learning with feature augmentation for rumor detection | |
Yu et al. | Graph learning for fake review detection | |
Zhang et al. | Rumor detection with hierarchical representation on bipartite ad hoc event trees | |
Chen et al. | A supervised link prediction method for dynamic networks | |
CN113191144B (zh) | 一种基于传播影响力的网络谣言识别系统及方法 | |
Hajare et al. | A machine learning pipeline to examine political bias with congressional speeches | |
Lan et al. | Mining semantic variation in time series for rumor detection via recurrent neural networks | |
Wei et al. | Twitter Bot Detection Using Neural Networks and Linguistic Embeddings | |
Ran et al. | A metric-learning method for few-shot cross-event rumor detection | |
Patel et al. | Rumour detection using graph neural network and oversampling in benchmark Twitter dataset | |
Zhang et al. | A social commerce information propagation prediction model based on transformer | |
Soga et al. | Propagation-based fake news detection using a combination of different content features | |
Dong et al. | Rumor Detection with Adversarial Training and Supervised Contrastive Learning | |
Peng et al. | Detecting Political Opinions in Tweets through Bipartite Graph Analysis: A Skip Aggregation Graph Convolution Approach | |
CN110674257B (zh) | 评估网络空间中文本信息真实性的方法 | |
Banu S | Graph-Based Rumor Detection on social media Using Posts and Reactions | |
AlGarni et al. | A Dynamic Deep-Learning Approach for Predicting Information Diffusion. | |
CN117556830B (zh) | 基于潜在热点话题与传播过程的谣言检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220111 |
|
RJ01 | Rejection of invention patent application after publication |