CN113343126A - 基于事件与传播结构的谣言检测方法 - Google Patents

基于事件与传播结构的谣言检测方法 Download PDF

Info

Publication number
CN113343126A
CN113343126A CN202110903231.3A CN202110903231A CN113343126A CN 113343126 A CN113343126 A CN 113343126A CN 202110903231 A CN202110903231 A CN 202110903231A CN 113343126 A CN113343126 A CN 113343126A
Authority
CN
China
Prior art keywords
propagation
event
tree
propagation structure
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110903231.3A
Other languages
English (en)
Other versions
CN113343126B (zh
Inventor
梁刚
杨进
高玉君
许春
蒋方婷
奚金霞
李劭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
Original Assignee
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University filed Critical Sichuan University
Priority to CN202110903231.3A priority Critical patent/CN113343126B/zh
Publication of CN113343126A publication Critical patent/CN113343126A/zh
Application granted granted Critical
Publication of CN113343126B publication Critical patent/CN113343126B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了基于事件与传播结构的谣言检测方法,提取每个事件中的源帖信息,并通过基于情感极性的双向编码器表示技术对源帖信息进行文本数据增强;然后构建传播关系,同时,将增强后的文本向量特征加入到传播关系的根节点中,与传播关系结合,形成树型传播结构,再从根节点开始,通过转发及响应关系而形成的自前向后的正向树型传播结构和将由社区内各个分散节点聚集到上层根节点表示形成自后向前的反向树型传播结构分别输入到FRBi‑GCN中;最后,对传播树中包含根节点以及转发节点在内的所有节点进行节点增强操作,并通过softmax分类器鉴别出该事件是否是谣言。

Description

基于事件与传播结构的谣言检测方法
技术领域
本发明涉及谣言识别技术领域,具体的说,是基于事件与传播结构的谣言检测方法。
背景技术
社会网络爆炸式的发展使得以微博、Twitter、微信等为代表的社会网络已逐渐取代传统媒体成为人们发布和获取信息的一个重要平台。社会网络中的信息具有传播速度快,范围广,即时性强等优点。然而,由于发布信息时缺乏有效的监管手段,导致社会网络平台同时也成为谣言传播的温床。根据新浪微博2021年发布的《微博辟谣2020年度报告》显示,三分之一的谣言始发于社会网络。这些信息在未经处理的情况下可能被迅速地歪曲和放大,从而误导公众。谣言无节制地在网络上传播不仅影响社会和谐与稳定。因此,快速有效地检测出社会网络谣言,对净化网络环境,维护公共安全至关重要。
现有的谣言检测方法可以归纳为三类:
1)人工检测方法
人工谣言检测方法就是平台将社会网络中的可疑信息交给经验丰富的编辑或是行业专家,利用编辑和专家的领域知识和经验对信息的真实性进行甄别。当前的主流社会网络平台,如Twitter、Facebook与新浪微博,在其平台上都是采用人工的谣言检测方法。该方法的优点是简单、准确率高。缺点是需要检测者对用户或平台举报的信息进行逐条判断,单靠人力对每天产生的数以亿计的数据进行检测,具有明显的滞后性,且检测的质量依赖于检测者的知识背景与经验,对个人的知识与经验要求极高,也有可能因为个人因素而造成误判。
2)基于机器学习的检测方法
基于机器学习的检测方法。早期对谣言的自动检测主要集中在利用机器学习技术来检测谣言,该类方法主要包含三个流程:首先,从训练数据集中选择并提取能够有效表征数据的特征;其次,利用选择与提取的特征在训练数据集上训练分类模型;最后,使用训练好的模型对训练数据集外的数据进行预测,经过不断的评估与优化,判断数据是否是谣言。对于基于机器学习的谣言检测方法而言,如何选择与提取出显著的特征来表征数据对谣言检测效果至关重要,其优点是相对简单且具有一定的可解释性。缺点是依赖人工进行特征的选择,耗费人力物力的同时,得到特征向量的鲁棒性较差。且试图用一套通用的特征集合表征社会网络不同平台不同语言中的全部信息,训练出来的谣言分类器容易陷入过拟合状态,导致检测准确度不高。
3)基于深度学习的检测方法
深度学习具有很强的特征学习能力,其模型学习的特征比传统机器学习算法中通过特征工程得到的特征数据对原数据具有更好的,更本质的代表性,从而能实现更好的分类效果。一般来说,这类方法的在性能上优于上述两类方法。但该方法对数据的需求量大,当样本数据较少时,训练出来的分类器仍存在分类偏倚问题,且模型训练周期更长,训练出的模型可解释性差,同时,对GPU的要求较高。
上述几类方法在一定程度上成功抑制了谣言泛滥的问题,但是现有方法仍然存在以下几点不足:
1、传统的文本表示是高维度高稀疏的,且未考虑上下文关联等特征,特征表达能力十分有限。而人工进行特征选择的方式耗费大量人力物力与时间,且十分依赖研究者个人对谣言检测领域的经验。无法灵活准确地表征社会网络中各种不同类型的谣言以及非谣言数据。因此,训练出来的谣言分类器往往泛化能力不强,即使训练出来的分类器在训练数据集合中具有较好的表现,在实际应用中的实用性也较低,且存在检测率低,误报率较高的问题。现有的谣言检测方法在识别谣言的过程中往往只关注文本内容,模因信息以及传播结构等特征,缺乏对文本情感极性等重要特征的研究,而情感极性的改变可能完全改变文本的语义甚至影响到最终训练出来的谣言分类器对信息的鉴别结果。
2、社会网络中的信息错综复杂,且相互关联,其中,文本信息包含的线索有限,有些谣言单纯靠文本信息无法进行甄别。因此,从社会网络信息传播的各种关系中抽取出有用的信息是社会网络谣言检测中亟待解决的问题之一。传统的RNN、LSTM、GRU等只关注谣言信息的时间序列和句子等变长序列信息建模等方面,只能解决在长序列训练过程中,随着神经网络层数的加深而造成的梯度消失以及梯度爆炸的问题,无法抑制谣言传播与扩散结构对谣言检测的影响。现有的CNN无法处理谣言传播过程中的全局结构关系,而使用单向的GCN容易忽略谣言的传播方向这一重要线索。从而导致谣言检测的准确率难以大幅度提升。
3、谣言之间关联性普遍,但在现有的谣言检测方法中,基于事件形成的传播树结构中的节点通常都是孤立存在的。单纯地通过源贴与转发帖形成的网络结构容易忽略谣言传播之间的关联,导致谣言检测过程中,无法通过谣言之间的关系而判断该谣言的共同主体或相同主题所关联的谣言,从而造成谣言检测的准确率受到影响。因此,如何提高谣言传播过程中的关联性,同时,考虑社会网络之中的各个相邻节点之间的合作与共享是谣言检测领域需要解决的问题。
发明内容
本发明的目的在于提供基于事件与传播结构的谣言检测方法,针对现有方法因为特征表示方法单一,对节点间关系缺乏关联与分析,采用的神经网络结构不适用社交网络的问题导致的检测准率不高的问题,提出了一种事件与传播结构相结合的社交网络谣言检测方法,通过事件检测克服现有方法的特性稀疏与检测冷启动问题,在检测过程中引入BERT模型引增强检测数据的文本特征,在检测方法中引入适合社交网络的图神经网络,能够针对灵活适应社交网络的节点数目的变换关系的变化进行数据分析。
本发明通过下述技术方案实现:基于事件与传播结构的谣言检测方法,包括下述步骤:
步骤1、从获取的公开数据集E所包含的事件
Figure 454226DEST_PATH_IMAGE001
中提取源帖信息、转发关系以及其他特征,其中,其他特征包括用户信息、粉丝数、点赞数等,k表示的是事件的序数,e k 表示第k个事件,n k 为第k个事件e k 中的单个帖子,r k 为源帖,每个
Figure 845281DEST_PATH_IMAGE002
代表第j个相关的转发帖或响应帖,且j=1…k
本发明采用基于事件级数据对谣言进行检测,其中,公开数据集E的表示如下所示:
Figure 951078DEST_PATH_IMAGE003
其中,k表示的是事件的序数,e k 表示第k个事件,且
Figure 358051DEST_PATH_IMAGE001
n k 为第k个事件e k 中的单个帖子,r k 为源帖,每个
Figure 408571DEST_PATH_IMAGE004
代表第j个相关的转发帖或响应帖,且j =1…k
步骤2、使用基于情感极性的BERT(Emotional Polarity Bidirectional EncoderRepresentations from Transformers, EPBERT)对源帖信息进行文本数据增强,进而获得源帖的增强文本特征向量D
步骤3、将源贴的增强文本特征向量D加入到传播关系的根节点中,与传播关系T结合,形成树型传播结构G k
步骤4、将树型传播结构G k 解析成正向树型传播结构
Figure 233894DEST_PATH_IMAGE005
和反向树型传播结构
Figure 697760DEST_PATH_IMAGE006
,并将正向和反向两种树型传播结构分别输入到FGCN(正向的图卷积神经网络)模型以及RGCN(反向的图卷积神经网络)模型中,获得传播特性H F 和扩散特性H R ,FGCN模型和RGCN模型共同构成基于事件与传播结构的双向图卷积神经网络(FRBi-GCN)模型;
步骤5、对正向树型传播结构
Figure 696373DEST_PATH_IMAGE005
以及反向树型传播结构
Figure 99935DEST_PATH_IMAGE006
中包含根节点以及转发节点在内的所有节点进行节点增强操作;
步骤6、使用全连接将基于事件与传播结构的双向图卷积神经网络层与softmax分类函数进行连接,根据softmax分类函数的输出结果用于判断待检测的事件是否为谣言,所述softmax分类函数为:
Figure 549238DEST_PATH_IMAGE007
,其中 V i 表示分类的类别,i表示类别索引,C表示分类的种类,S i 表示输出最大对应的类别,e为自然对数,e优选取值为2.718,softmax分类函数最终选择S i 值最大的V i 作为分类的类别。
进一步的为更好地实现本发明,特别采用下述设置方式:所述步骤2包括以下具体步骤:
步骤2.1、将源帖信息中的文本数据进行情感极性标注,获得标记数据集S,且
Figure 202198DEST_PATH_IMAGE008
,其中,N为被标记的数据个数,
Figure 186859DEST_PATH_IMAGE009
为第N个被标记的数据,
Figure 59307DEST_PATH_IMAGE010
为第N个被标记数据的情感极性标签;
步骤2.2、在标记数据集S上对预训练的BERT进行微调,直至收敛;即将BERT中能对文本的语义相似性进行分类的段表征(Segment Embeddings, SE)
Figure 540229DEST_PATH_IMAGE011
改为与标注好的情感极性有关联的情感极性表征(Emotional Polarity Embedding, EPE)E emotion ,从而根据标记数据集上的情感极性标签进行学习;其中,E A 表示改词属于句向量AE B 表示词属于句向量B;AB分别为句向量,且当输入文本为非单一的情感极性时,需调整向量的大小以兼容标签大小;
步骤2.3、对于每次迭代
Figure 368902DEST_PATH_IMAGE012
,从标记数据集S中抽取句子p i ,随机屏蔽k个词,通过EPBERT模型根据语境和情感极性预测被屏蔽词的原始词汇索引I,且
Figure 11715DEST_PATH_IMAGE013
,从而获得与句子情感极性标签相匹配的各种词
Figure 107978DEST_PATH_IMAGE014
,并获得文本特征向量
Figure 589163DEST_PATH_IMAGE015
;其中,word i 为文本中第i个特征词,
Figure 997141DEST_PATH_IMAGE016
y分别表示除去被屏蔽词之外的上下文及其标签,trem k 表示是第k 个情感极性词;
所述EPBERT模型的模型层数为12,隐藏层神经元数为768,头自注意力数为12,总参数为110M(1M=1000000);
EPBERT模型的训练轮次范围在1-50之间,屏蔽词的范围在1-2之间。
步骤2.4、形成源帖的增强文本特征向量D,且D={word 1 word 2 ,…,word n tag 1 tag 2 ,…,tag n emotion 1 emotion 2 ,…,emotion n },其中,tag i ,为文本中第i个特殊符号标记,如@、#等,emotion i 为标注的情感极性。
进一步的为更好地实现本发明,特别采用下述设置方式:所述BERT采用双向语言模型从正反两个方向对生成新语句的概率进行建模,再由独立训练的正向语言模型的浅层和反向语言模型的浅层连接而成,形成BERT模型;其中,正向语言模型预测序列的概率表示为:
Figure 515149DEST_PATH_IMAGE017
p i 表示选择的句子,反向语言模型预测序列的概率表示为:
Figure 669181DEST_PATH_IMAGE018
p i 表示选择的句子。
进一步的,所述步骤3具体为:将源贴的增强后文本数据的文本特征向量D,且D={word 1 word 2 ,…,word n tag 1 tag 2 ,…,tag n emotion 1 emotion 2 ,…,emotion n }加入到传播关系的根节点中,与传播关系T结合,即
Figure 819801DEST_PATH_IMAGE019
,形成树型传播结构G k ,且
Figure 526462DEST_PATH_IMAGE020
;其中,tag i为文本中第i个特殊符号标记,如@、#等,emotion i 为标注的情感极性,
Figure 469666DEST_PATH_IMAGE021
Figure 515421DEST_PATH_IMAGE022
V k B k 分别表示回复帖到转发帖和回复帖到响应帖所形成的边集合;若
Figure 758314DEST_PATH_IMAGE023
Figure 766984DEST_PATH_IMAGE024
为一个反馈,即
Figure 763146DEST_PATH_IMAGE023
Figure 185380DEST_PATH_IMAGE024
的转发帖或响应帖,则
Figure 444848DEST_PATH_IMAGE025
为一条边,即
Figure 65447DEST_PATH_IMAGE026
;若
Figure 384740DEST_PATH_IMAGE024
Figure 180920DEST_PATH_IMAGE027
为一个反馈,则
Figure 955497DEST_PATH_IMAGE028
为一条边,即
Figure 107734DEST_PATH_IMAGE029
,以此类推。
进一步的为更好地实现本发明,特别采用下述设置方式:所述步骤4包括下述具体步骤:
步骤4.1、将谣言从根结点开始,自源贴开始通过转发及响应关系形成自前向后的正向树型传播结构
Figure 711278DEST_PATH_IMAGE005
,且
Figure 361965DEST_PATH_IMAGE030
和将由社区内各个分散节点聚集到上层根节点表示形成自后向前的反向树型传播结构
Figure 938134DEST_PATH_IMAGE006
,且
Figure 923539DEST_PATH_IMAGE031
步骤4.2、在每个训练轮次epoch采用随机删边技术避免过拟合问题,获得邻接矩阵
Figure 986566DEST_PATH_IMAGE032
,且
Figure 690429DEST_PATH_IMAGE033
,其中,A drop 是使用
Figure 134704DEST_PATH_IMAGE034
从原始边集合中随机采样的矩阵结构,N e 为边的总数,p为删除率;在正向树型传播结构
Figure 686033DEST_PATH_IMAGE005
中,邻接矩阵表示为
Figure 196825DEST_PATH_IMAGE035
,在反向树型传播结构
Figure 510519DEST_PATH_IMAGE036
中,邻接矩阵表示为
Figure 171701DEST_PATH_IMAGE037
步骤4.3、将构造好的正向树型传播结构
Figure 459594DEST_PATH_IMAGE005
和反向树型传播结构
Figure 17088DEST_PATH_IMAGE006
分别输入到FGCN模型和RGCN模型中,获得传播特性H F 和扩散特性H R ,且
Figure 762453DEST_PATH_IMAGE038
Figure 109383DEST_PATH_IMAGE039
;其中,
Figure 808873DEST_PATH_IMAGE040
为隐藏层特性,W F 为FGCN的滤波参数矩阵,
Figure 769789DEST_PATH_IMAGE041
为隐藏层特性,W R 为RGCN的滤波参数矩阵,
Figure 448289DEST_PATH_IMAGE042
为ReLU激活函数。
进一步的为更好地实现本发明,特别采用下述设置方式:所述步骤5包括下述具体步骤:
步骤5.1、将原始特征矩阵
Figure 841486DEST_PATH_IMAGE043
输入到FRBi-GCN模型中,通过k层GCL后形成的隐藏特征向量H k
步骤5.2、再将第k层节点的隐藏特征向量H k k-1层节点的隐藏特征向量H k-1 进行拼接,得到新的隐藏特征向量
Figure 261228DEST_PATH_IMAGE044
,且
Figure 444079DEST_PATH_IMAGE045
步骤5.3、将传播表示
Figure 660358DEST_PATH_IMAGE046
和扩散表示
Figure 365403DEST_PATH_IMAGE047
的节点表示信息分别使用均值池化进行聚合操作,得到
Figure 865916DEST_PATH_IMAGE048
Figure 744136DEST_PATH_IMAGE049
,将二者进行拼接得到
Figure 41301DEST_PATH_IMAGE050
进一步的为更好地实现本发明,特别采用下述设置方式:所述传播关系由源帖和转发贴之间的转发关系及包括用户信息,粉丝数,点赞数等在内的其他特征构成。
进一步的为更好地实现本发明,特别采用下述设置方式:将数据集E随机地划分为5个部分,并进行5倍交叉验证;采用随机梯度下降法更新基于事件与传播结构的双向图卷积神经网络(Forward Reverse Bi-Directional Graph Convolutional Networks, FRBi-GCN)的参数,其中,单个节点的隐藏特征向量维度为64,随机删边技术的中断率为0.2,删边率为0.5,迭代次数为100,而整体基于事件生成的树型传播结构将以80%,10%,10%的比例划分为训练集、测试集和验证集。
本发明与现有技术相比,具有以下优点及有益效果:
(1)针对谣言检测过程中提取的表层特征难以灵活准确地表征社会网络中全部信息,从而造成训练出来的分类器泛化能力不强,以及忽略情感极性特征造成语义变化等问题,本发明提出了基于情感极性BERT的文本数据增强方法来提高模型提取特征的能力,从而增强训练出来分类器的泛化能力。该方法考虑情感极性特征对谣言检测的影响,将BERT的词表征、情感极性表征与位置表征三部分相结合;使用该方法不仅能挖掘表示文本的深层特征,从而避免特征构建的问题,且能生成人工难以发现的隐藏特征,同时考虑上下文语义与标签对屏蔽位置单词的影响,以此根据语境在屏蔽词位置生成相同情感极性的不同表达形式。
(2)针对当前谣言检测忽略传播结构的多样性导致检测准确率无法大幅度提升的问题,本发明提出了基于事件与传播结构的双向图卷积神经网络,结合事件与信息传播深度和散布广度三方面,形成自前向后的基于关系链的深度传播结构以及自后向前的基于社会群体之间的广度扩散结构;在检测时,通过正向的图卷积神经网络来支持自源帖开始通过转发关系链而形成的自前向后深度传播结构,通过反向的图卷积神经网络来支持由社区内各个分散节点聚集到上层节点表示的广度扩散结构,充分利用事件中蕴含的谣言之间潜在的关联以及社会网络中信息来进行谣言检测,从而提高谣言检测的准确率。
(3)针对当前谣言检测方法忽略谣言传播结构节点之间关联性与共享性,导致无法获得相邻节点中的关联信息,从而影响谣言检测效果的问题,本发明提出了基于事件型传播结构的传播树节点增强方法,将每个通过GCL后形成隐藏层特征向量的节点与其上一层节点的隐藏层特征向量进行拼接,得到新的特征矩阵,在更好地利用源帖以及各个转发节点中蕴含的丰富信息的同时从各节点之间的关系中获得更准确的节点表示,从而提高谣言检测的准确率。
附图说明
图1为谣言检测流程图。
图2为基于情感极性BERT的文本数据增强模型图。
图3为基于事件与传播结构的双向图卷积神经网络模型图。
图4为传播树节点增强图。
具体实施方式
下面结合实施例对本发明作进一步地详细说明,但本发明的实施方式不限于此。
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。因此,以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
名词解释:
BERT:Bidirectional Encoder Representation from Transformers的简称,即双向编码器表示技术;
FRBi-GCN:Forward Reverse Bi-Directional Graph Convolutional Networks的简称,即基于事件与传播结构的双向图卷积神经网络;
epoch:轮次,一次epoch是指将所有数据训练一遍的次数,epoch所代表的数字则是指所有数据被训练的总轮数;epoch为深度学习专业术语,一个epoch指代所有的数据送入神经网络中完成一次前向计算及反向传播的过程;
FGCN:Forward Graph Convolutional Networks的简称,即正向的图卷积神经网络;
RGCN:Reverse Graph Convolutional Networks的简称,即反向的图神经网络;
GCN:Graph Convolutional Networks的简称,即图卷积神经网络;
GCL:Graph Convolutional Layer的简称,即图卷积层;
EPBERT:Emotional Polarity Bidirectional Encoder Representation fromTransformers的简称,即基于情感极性的双向编码器表示技术(基于情感极性的BERT);
EPE:Emotional Polarity Embedding的简称,即情感极性表征。
实施例1:
本发明设计出基于事件与传播结构的谣言检测方法,包括下述步骤:
1)从获取的公开数据集E所包含的事件
Figure 776301DEST_PATH_IMAGE001
中提取源帖信息、转发关系以及其他特征,其中,其他特征包括用户信息、粉丝数、点赞数等,k表示的是事件的序数,e k 表示第k个事件,n k 为第k个事件e k 中的单个帖子,r k 为源帖,每个
Figure 249264DEST_PATH_IMAGE004
代表第j个相关的转发帖或响应帖,且j=1…k
本发明采用基于事件级数据对谣言进行检测,其中,公开数据集E的表示如下所示:
Figure 836234DEST_PATH_IMAGE003
其中,k表示的是事件的序数,e k 表示第k个事件,且
Figure 886710DEST_PATH_IMAGE001
n k 为第k个事件e k 中的单个帖子,r k 为源帖,每个
Figure 933556DEST_PATH_IMAGE004
代表第j个相关的转发帖或响应帖,且j= 1…k
其中,第k个事件提取的特征表示如下所示:
Figure 923509DEST_PATH_IMAGE051
其中,
Figure 425422DEST_PATH_IMAGE052
表示r k 的特征向量,每行特征
Figure 182333DEST_PATH_IMAGE053
表示
Figure 164195DEST_PATH_IMAGE004
的特征向量,里面每个变量都是表示特征的向量。
对每个事件e k 都进行人工标记为谣言或非谣言y k :每个事件e k 都与其标签相关联,将第k个事件进行人工标记,得到谣言或非谣言的标签y k
Figure 1963DEST_PATH_IMAGE054
其中,F表示错误的谣言,T表示正确的谣言。
谣言检测的最终目标都是对谣言进行分类,其公式如下所示:
Figure 432201DEST_PATH_IMAGE055
其中,EY分别为事件集和标签集。
2)使用基于情感极性的BERT(Emotional Polarity Bidirectional EncoderRepresentations from Transformers, EPBERT)对源帖信息进行文本数据增强,进而获得源帖的增强文本特征向量D,且D={word 1 word 2 ,…,word n tag 1 tag 2 ,…,tag n emotion 1 emotion 2 ,…,emotion n };其中,word i 为文本中得到的第i个特征词以及BERT模型提取的隐藏特征词,tag i 为文本中第i个特殊符号标记,如@、#等,emotion i ,为标注的情感极性;
3)将源贴的增强文本特征向量D加入到传播关系的根节点中,与传播关系T结合,即concat(D,T),形成树型传播结构G k ,且
Figure 881768DEST_PATH_IMAGE056
;其中,tag i为文本中第i个特殊符号标记,emotion i 为标注的情感极性,
Figure 937929DEST_PATH_IMAGE057
Figure 279305DEST_PATH_IMAGE058
V k B k 分别表示回复帖到转发帖和回复帖到响应帖所形成的边集合;若
Figure 637867DEST_PATH_IMAGE023
Figure 473099DEST_PATH_IMAGE024
为一个反馈,即
Figure 360546DEST_PATH_IMAGE023
Figure 9790DEST_PATH_IMAGE024
的转发帖或响应帖,则
Figure 183762DEST_PATH_IMAGE025
为一条边,即
Figure 30757DEST_PATH_IMAGE026
;若
Figure 728586DEST_PATH_IMAGE024
Figure 247817DEST_PATH_IMAGE027
为一个反馈,则
Figure 93720DEST_PATH_IMAGE059
为一条边,即
Figure 575648DEST_PATH_IMAGE029
,以此类推;
4)将树型传播结构G k 解析成正向树型传播结构
Figure 24471DEST_PATH_IMAGE005
和反向树型传播结构
Figure 388588DEST_PATH_IMAGE006
,并将正向和反向两种树型传播结构分别输入到FGCN(正向的图卷积神经网络)模型以及RGCN(反向的图卷积神经网络)模型中,获得传播特性H F 和扩散特性H R ,FGCN模型和RGCN模型共同构成基于事件与传播结构的双向图卷积神经网络(FRBi-GCN)模型;
5)对正向树型传播结构
Figure 514149DEST_PATH_IMAGE060
以及反向树型传播结构
Figure 178480DEST_PATH_IMAGE061
中包含根节点以及转发节点在内的所有节点进行节点增强操作;
6)使用全连接将基于事件与传播结构的双向图卷积神经网络层与softmax分类函数进行连接,根据softmax分类函数的输出结果用于判断待检测的事件是否为谣言,所述softmax分类函数为:
Figure 765581DEST_PATH_IMAGE007
,其中 V i 表示分类的类别,i表示类别索引,C表示分类的种类,S i 表示输出最大对应的类别,e为自然对数,e优选取值为2.718,softmax分类函数最终选择S i 值最大的V i 作为分类的类别。
实施例2:
本实施例是在上述实施例的基础上进一步优化,与前述技术方案相同部分在此将不再赘述,所述步骤2)包括以下具体步骤:
2.1)将源帖信息中的文本数据进行情感极性标注,获得标记数据集S;被标记了情感极性的数据所组成的标记数据集S表示为如下:
Figure 649617DEST_PATH_IMAGE008
其中,N为被标记的数据个数,
Figure 596845DEST_PATH_IMAGE009
为第N个被标记的数据,
Figure 261220DEST_PATH_IMAGE010
为第N个被标记数据的情感极性标签;
2.2)在标记数据集S上对预训练的BERT进行微调,直至收敛;即将BERT中能对文本的语义相似性进行分类的段表征(Segment Embeddings, SE)
Figure 832272DEST_PATH_IMAGE011
改为与标注好的情感极性有关联的情感极性表征(Emotional Polarity Embedding, EPE)E emotion ,从而根据标记数据集上的情感极性标签进行学习;其中,E A 表示改词属于句向量AE B 表示词属于句向量B;AB分别为句向量,且当输入文本为非单一的情感极性时,需调整向量的大小以兼容标签大小;基于情感的掩码语言模型(EPBERT模型)允许表示层融合上下文以及情感标签等信息,即允许进一步训练基于情感极性标签条件的深度双向表示;
2.3)对于每次迭代
Figure 141287DEST_PATH_IMAGE012
,从标记数据集S中抽取句子p i ,随机屏蔽k个词,通过EPBERT模型根据语境和情感极性预测被屏蔽词的原始词汇索引I,且
Figure 829889DEST_PATH_IMAGE013
,从而获得与句子情感极性标签相匹配的各种词
Figure 732727DEST_PATH_IMAGE014
,并获得文本特征向量
Figure 317424DEST_PATH_IMAGE015
;其中,word i 为文本中第i个特征词,
Figure 894161DEST_PATH_IMAGE016
y分别表示除去被屏蔽词之外的上下文及其标签,trem k 表示是第k 个情感极性词;
即使用加入情感极性的掩码语言模型(即EPBERT模型)随机屏蔽被标记句子中的一些词,目的是根据语境和情感预测被屏蔽词的原始词汇索引I,其公式如下所示:
Figure 950235DEST_PATH_IMAGE013
其中,p i 为给定的被屏蔽的数据,
Figure 638138DEST_PATH_IMAGE016
y分别表示除去被屏蔽词之外的上下文及其标签;
所述EPBERT模型的模型层数为12,隐藏层神经元数为768,头自注意力数为12,总参数为110M(1M=1000000);
EPBERT模型的训练轮次范围在1-50之间,屏蔽词的范围在1-2之间。
2.4)形成源帖的增强文本特征向量D,且D={word 1 word 2 ,…,word n tag 1 tag 2 ,…,tag n emotion 1 emotion 2 ,…,emotion n },其中,tag i ,为文本中第i个特殊符号标记,如@、#等,emotion i 为标注的情感极性。
实施例3:
本实施例是在上述任一实施例的基础上进一步优化,与前述技术方案相同部分在此将不再赘述,所述BERT采用双向语言模型从正反两个方向对生成新语句的概率进行建模,再由独立训练的正向语言模型的浅层和反向语言模型的浅层连接而成,形成BERT模型;其中,正向语言模型预测序列的概率表示为:
Figure 206784DEST_PATH_IMAGE017
p i 表示选择的句子,反向语言模型预测序列的概率表示为:
Figure 631337DEST_PATH_IMAGE062
p i 表示选择的句子。
实施例4:
本实施例是在上述任一实施例的基础上进一步优化,与前述技术方案相同部分在此将不再赘述,所述步骤3)具体为:将源贴的增强后文本数据的文本特征向量D,且D={word 1 word 2 ,…,word n tag 1 tag 2 ,…,tag n emotion 1 emotion 2 ,…,emotion n }加入到传播关系的根节点中,与传播关系T结合,即
Figure 299558DEST_PATH_IMAGE019
,形成树型传播结构G k ,且
Figure 647494DEST_PATH_IMAGE020
;其中,tag i为文本中第i个特殊符号标记,如@、#等,emotion i 为标注的情感极性,
Figure 652622DEST_PATH_IMAGE021
Figure 485842DEST_PATH_IMAGE022
V k B k 分别表示回复帖到转发帖和回复帖到响应帖所形成的边集合;若
Figure 116674DEST_PATH_IMAGE023
Figure 289423DEST_PATH_IMAGE024
为一个反馈,即
Figure 345411DEST_PATH_IMAGE023
Figure 633304DEST_PATH_IMAGE024
的转发帖或响应帖,则
Figure 54446DEST_PATH_IMAGE025
为一条边,即
Figure 658864DEST_PATH_IMAGE026
;若
Figure 266781DEST_PATH_IMAGE024
Figure 730385DEST_PATH_IMAGE027
为一个反馈,则
Figure 548693DEST_PATH_IMAGE028
为一条边,即
Figure 7619DEST_PATH_IMAGE029
,以此类推。
实施例5:
本实施例是在上述任一实施例的基础上进一步优化,与前述技术方案相同部分在此将不再赘述,所述步骤4)包括下述具体步骤:
4.1)将谣言从根结点开始,自源贴开始通过转发及响应关系形成自前向后的正向树型传播结构
Figure 733305DEST_PATH_IMAGE063
,且
Figure 746523DEST_PATH_IMAGE030
和将由社区内各个分散节点聚集到上层根节点表示形成自后向前的反向树型传播结构
Figure 758734DEST_PATH_IMAGE036
,且
Figure 947533DEST_PATH_IMAGE031
;通过本发明提出的基于事件与传播结构的双向图卷积神经网络(FRBi-GCN),结合事件与信息传播深度和散布广度三方面进行谣言检测,以提高谣言检测准确率。
本发明提出的基于事件级传播结构的传播树节点增强技术,能更好地利用源帖以及各个转发节点中蕴含的丰富信息的同时从各节点之间的关系中获得更准确的节点表示。
4.2)在每个训练轮次epoch,采用随机删边技术避免过拟合问题,获得邻接矩阵
Figure 352162DEST_PATH_IMAGE032
,且
Figure 305205DEST_PATH_IMAGE064
,其中,
Figure 917846DEST_PATH_IMAGE065
是使用
Figure 570937DEST_PATH_IMAGE034
从原始边集合中随机采样的矩阵结构,N e 为边的总数,p为删除率;在正向树型传播结构
Figure 576110DEST_PATH_IMAGE005
中,邻接矩阵表示为
Figure 16449DEST_PATH_IMAGE035
,在反向树型传播结构
Figure 650691DEST_PATH_IMAGE066
中,邻接矩阵表示为
Figure 391245DEST_PATH_IMAGE037
模型的本质还是根据事件的文本内容,用户信息和转发的文章所构造的传播结构来预测事件的标签类别,本发明基于事件与传播结构的双向图卷积神经网络模型,在每个训练epoch,为避免过拟合问题,采用随机删边技术(DropEdge),在每个训练阶段,随机地从输入的传播树中删除边,以产生一定速率的不同变形副本。该方法能增加输入的随机性以及多样性。
假设树型传播结构图G k 中边的总数为N e ,删除率为p,则使用DropEdge后的邻接矩阵
Figure 438092DEST_PATH_IMAGE032
的计算公式如下所示:
Figure 178777DEST_PATH_IMAGE033
其中,
Figure 835018DEST_PATH_IMAGE065
是使用
Figure 155710DEST_PATH_IMAGE034
从原始边集合中随机采样的矩阵结构。在FGCN中,邻接矩阵表示为
Figure 763671DEST_PATH_IMAGE035
,在RGCN中,邻接矩阵表示为
Figure 975341DEST_PATH_IMAGE037
4.3)将构造好的正向树型传播结构
Figure 467895DEST_PATH_IMAGE060
和反向树型传播结构
Figure 617597DEST_PATH_IMAGE061
分别输入到FGCN模型和RGCN模型中,获得传播特性H F 和扩散特性H R ,且
Figure 6246DEST_PATH_IMAGE038
Figure 377316DEST_PATH_IMAGE039
;其中,
Figure 1457DEST_PATH_IMAGE040
为隐藏层特性,W F 为FGCN的滤波参数矩阵,
Figure 400471DEST_PATH_IMAGE041
为隐藏层特性,W R 为RGCN的滤波参数矩阵,
Figure 699035DEST_PATH_IMAGE042
为ReLU激活函数。
FGCN模型和RGCN模型分别获得传播特性H F 和扩散特性H R ,FGCN和RGCN分别通过下式计算获得:
Figure 308133DEST_PATH_IMAGE038
Figure 408070DEST_PATH_IMAGE039
其中,
Figure 610992DEST_PATH_IMAGE040
Figure 934919DEST_PATH_IMAGE041
分别为FGCN隐藏层特性和RGCN隐藏层特性,W F W R 分别为FGCN和RGCN的滤波参数矩阵,
Figure 844363DEST_PATH_IMAGE067
为ReLU激活函数。
实施例6:
本实施例是在上述任一实施例的基础上进一步优化,与前述技术方案相同部分在此将不再赘述,所述步骤5)包括下述具体步骤:
5.1)将原始特征矩阵
Figure 449788DEST_PATH_IMAGE068
输入到FRBi-GCN模型中,通过k个GCL后形成的隐藏特征向量H k ,其中,
Figure 10344DEST_PATH_IMAGE068
为FRBi-GCN模型输入的原始特征矩阵,H k 为第k个GCL生成的隐藏特征向量;
5.2)除了提取FGCN和RGCN的隐藏特征外,还将每层节点(除根节点外)与上一层节点的特征向量进行拼接,构造一个新的特征矩阵,增强节点之间关联性。即将第k层节点的隐藏特征向量H k k-1层层节点的隐藏特征向量H k-1 进行拼接,得到新的隐藏特征向量
Figure 165558DEST_PATH_IMAGE044
,且
Figure 14828DEST_PATH_IMAGE045
Figure 597512DEST_PATH_IMAGE044
为第k层节点隐藏层特征向量与k-1层节点隐藏层特征向量拼接后所得隐藏特征向量。
在通过根节点的源帖开始通过转发及响应关系形成自前向后的正向树型传播结构
Figure 74892DEST_PATH_IMAGE005
中,节点与相邻节点进行拼接通过下式计算得到:
Figure 129172DEST_PATH_IMAGE069
其中,
Figure 449426DEST_PATH_IMAGE070
表示根节点,即
Figure 366960DEST_PATH_IMAGE071
第一层与第二层的转发节点增强公式分别如下所示:
Figure 421548DEST_PATH_IMAGE072
Figure 602387DEST_PATH_IMAGE073
同理可得,由社区内各个分散节点聚集到上层根节点表示形成自后向前的反向树型传播结构
Figure 472254DEST_PATH_IMAGE066
节点增强所得的
Figure 927900DEST_PATH_IMAGE074
Figure 97981DEST_PATH_IMAGE075
Figure 336806DEST_PATH_IMAGE076
的计算方式与上式相同。
5.3)将传播表示
Figure 274063DEST_PATH_IMAGE046
和扩散表示
Figure 985929DEST_PATH_IMAGE077
的节点表示信息分别使用均值池化进行聚合操作,得到
Figure 495670DEST_PATH_IMAGE078
Figure 537751DEST_PATH_IMAGE049
,进而将二者进行拼接得到
Figure 382211DEST_PATH_IMAGE079
将通过正向树型传播结构获得的传播表示
Figure 897768DEST_PATH_IMAGE046
和通过反向树型传播结构获得的扩散表示
Figure 560218DEST_PATH_IMAGE080
的节点表示信息分别使用均值池化(Mean-Pooling)进行聚合操作,其公式分别如下所示:
Figure 858955DEST_PATH_IMAGE048
Figure 20071DEST_PATH_IMAGE049
将FGCN的特征向量S F 和RGCN的特征向量S R 进行拼接:
Figure 791849DEST_PATH_IMAGE079
本发明提出了基于事件级传播树节点增强技术,增强了源帖与转发贴之间的关联性,从而达到提高谣言检测准确率的目的。
实施例7:
本实施例是在上述任一实施例的基础上进一步优化,与前述技术方案相同部分在此将不再赘述,所述传播关系由源帖和转发贴之间的转发关系及包括用户信息,粉丝数,点赞数等在内的其他特征构成。
实施例8:
本实施例是在上述任一实施例的基础上进一步优化,与前述技术方案相同部分在此将不再赘述,将数据集E随机地划分为5个部分,并进行5倍交叉验证;采用随机梯度下降法更新基于事件与传播结构的双向图卷积神经网络(Forward Reverse Bi-DirectionalGraph Convolutional Networks, FRBi-GCN)的参数,其中,单个节点的隐藏特征向量维度为64,随机删边技术的中断率为0.2,删边率为0.5,迭代次数为100,而整体基于事件生成的树型传播结构将以80%,10%,10%的比例划分为训练集、测试集和验证集。
实施例9:
基于情感极性BERT的文本数据增强(基于情感极性的双向编码器表示技术(EPBERT)的文本数据增强技术)的大致过程为:首先,将BERT中的段表征改为情感极性(Emotional Polarity Embedding, EPE)表征;然后,在被标记数据集上对预训练的BERT进行微调,直到收敛;最后,对于被标记数据集中的每个句子,随机地屏蔽其中的几个词,再通过EPBERT预测与句子情感极性标签相匹配的各种词。EPBERT模型的整体架构如图2所示。其模型层数为12,隐藏层神经元数为768,头自注意力数为12,总参数为110M。EPBERT的训练轮次范围在1-50之间,屏蔽词的范围在1-2之间。
基于事件与传播结构的双向图卷积神经网络(FRBi-GCN)可分为正向的图卷积神经网络(FGCN)以及反向的图卷积神经网络(RGCN),其中,FGCN包含谣言从根结点开始,沿着关系链传播的因果特征。RGCN则是聚集了谣言在社区内扩散的结构特征。将FGCN的传播表示特征向量和RGCN的扩散表示特征向量通过全连接层进行融合,从而得到最终结果。FRBi-GCN谣言检测模型如图3所示。本发明将数据集随机地划分为5个部分,并进行5倍交叉验证。采用随机梯度下降法更新FRBi-GCN的参数,其中,单个节点的隐藏特征向量维度为64,随机删边技术的中断率为0.2,删边率为0.5,迭代次数为100,而整体基于事件生成的树型传播结构将以80%,10%,10%的比例划分为训练集、测试集和验证集。
基于事件级传播结构的传播树节点增强技术,能更好地利用源帖以及各个转发节点中蕴含的丰富信息的同时从各节点之间的关系中获得更准确的节点表示。本发明除了提取FGCN和RGCN的隐藏特征外,还将每层节点(除根节点外)与上一层节点的特征向量进行拼接,构造一个新的特征矩阵,增强节点之间关联性。传播树节点增强如图4所示。其中,
Figure 26915DEST_PATH_IMAGE068
为FRBi-GCN模型输入的原始特征矩阵,H k 为第k个GCL生成的隐藏特征向量。
Figure 717790DEST_PATH_IMAGE044
为第k层节点隐藏层特征向量与k-1层节点隐藏层特征向量拼接后所得隐藏特征向量。
基于事件与传播结构的谣言检测方法,该方法综合应用了基于情感极性的双向编码器表示技术(EPBERT)的文本数据增强技术,基于事件与传播结构的双向图卷积神经网络(FRBi-GCN)以及基于事件级数据的传播树节点增强技术。其中,基于情感极性的双向编码器表示技术的文本数据增强技术用于提高谣言检测模型的提取特征的能力;基于事件与传播结构的双向图卷积神经网络(FRBi-GCN)用于结合事件与信息传播深度和散布广度三方面进行谣言检测,以提高模型检测准确率。基于事件级数据的传播树节点增强技术用于增强源帖与转发贴之间的关联性,从而提高谣言检测的准确率。
本发明的基于事件与传播结构的谣言检测模型流程如图1所示。首先,提取原始数据中每个事件(事件1~事件N)中的源帖信息(源贴1~源贴N),并通过基于情感极性的双向编码器表示技术(EPBERT)对源帖信息进行文本数据增强(基于情感极性BERT的文本数据增强)。然后,将源帖和转发贴之间的转发关系(转发关系1~转发关系M)及包括用户信息,粉丝数,点赞数等在内的其他特征(其他特征1~其他特征K)构成传播关系,同时,将增强后的文本向量特征加入到传播关系的根节点中,与传播关系结合,形成树型传播结构,再从根节点开始,通过转发及响应关系而形成的自前向后的正向树型传播结构
Figure 620063DEST_PATH_IMAGE005
和将由社区内各个分散节点聚集到上层根节点表示形成自后向前的反向树型传播结构
Figure 415106DEST_PATH_IMAGE006
,分别输入到FGCN模型和RGCN模型中。最后,对传播树中包含根节点以及转发节点在内的所有节点进行节点增强操作,并通过softmax分类器鉴别出该事件是否是谣言。
该基于事件与传播结构的谣言检测方法包括下述具体步骤:
(1)从获取的公开数据集E所包含的事件
Figure 753946DEST_PATH_IMAGE082
中提取源帖信息、转发关系以及包括用户信息,粉丝数,点赞数等在内的其他特征;
本发明采用基于事件级数据对谣言进行检测,其中,公开数据集E的表示如下所示:
Figure 117187DEST_PATH_IMAGE084
其中,k表示的是事件的序数,e k 表示第k个事件,且
Figure 423535DEST_PATH_IMAGE082
n k 为第k个事件e k 中的单个帖子,r k 为源帖,每个
Figure 909354DEST_PATH_IMAGE086
代表第j个相关的转发帖或响应帖,且j= 1…k
其中,第k个事件提取的特征表示如下所示:
Figure 571541DEST_PATH_IMAGE088
其中,
Figure 200625DEST_PATH_IMAGE090
表示r k 的特征向量,每行特征
Figure 359381DEST_PATH_IMAGE092
表示
Figure 870127DEST_PATH_IMAGE086
的特征向量,里面每个变量都是表示特征的向量。
对每个事件e k 都进行人工标记为谣言或非谣言y k :每个事件e k 都与其标签相关联,将第k个事件进行人工标记,得到谣言或非谣言的标签y k
Figure 137554DEST_PATH_IMAGE094
其中,F表示错误的谣言,T表示正确的谣言。
谣言检测的最终目标都是对谣言进行分类,其公式如下所示:
Figure DEST_PATH_IMAGE096
其中,EY分别为事件集和标签集。
(2)将源帖信息中的文本数据进行情感极性标注,获得标记数据集S;被标记了情感极性的数据所组成的标记数据集S表示为如下:
Figure DEST_PATH_IMAGE098
其中,N为被标记的数据个数,
Figure DEST_PATH_IMAGE100
为第N个被标记的数据,
Figure DEST_PATH_IMAGE102
为第N个被标记数据的情感极性标签;
(3)所述BERT采用双向语言模型从正反两个方向对生成新语句的概率进行建模,再由独立训练的正向语言模型的浅层和反向语言模型的浅层连接而成,形成BERT模型;其中,正向语言模型预测序列的概率表示为:
Figure 656365DEST_PATH_IMAGE104
p i 表示选择的句子,反向语言模型预测序列的概率表示为:
Figure 161471DEST_PATH_IMAGE106
p i 表示选择的句子
(4)在标记数据集S上对预训练的BERT进行微调,直至收敛;即将BERT中能对文本的语义相似性进行分类的段表征(Segment Embeddings, SE)
Figure DEST_PATH_IMAGE108
改为与标注好的情感极性有关联的情感极性表征(Emotional Polarity Embedding, EPE)E emotion ,从而根据标记数据集上的情感极性标签进行学习;其中,E A 表示改词属于句向量AE B 表示词属于句向量B;AB分别为句向量,且当输入文本为非单一的情感极性时,需调整向量的大小以兼容标签大小;基于情感的掩码语言模型(EPBERT模型)允许表示层融合上下文以及情感标签等信息,即允许进一步训练基于情感极性标签条件的深度双向表示;
(5)对于每次迭代
Figure 321582DEST_PATH_IMAGE110
,从标记数据集S中抽取句子p i ,随机屏蔽k个词,通过EPBERT模型根据语境和情感极性预测被屏蔽词的原始词汇索引I,从而获得与句子情感极性标签相匹配的各种词
Figure 942050DEST_PATH_IMAGE112
,并获得文本特征向量
Figure 83575DEST_PATH_IMAGE114
;其中,word i 为文本中第i个特征词,trem k 表示是第k 个情感极性词;
即使用加入情感极性的掩码语言模型(即EPBERT模型)随机屏蔽被标记句子中的一些词,目的是根据语境和情感预测被屏蔽词的原始词汇索引I,其公式如下所示:
Figure 336964DEST_PATH_IMAGE116
其中,
Figure 466811DEST_PATH_IMAGE118
y分别表示除去被屏蔽词之外的上下文及其标签。
所述EPBERT模型的模型层数为12,隐藏层神经元数为768,头自注意力数为12,总参数为110M(1M=1000000);
EPBERT模型的训练轮次范围在1-50之间,屏蔽词的范围在1-2之间。
其中,步骤(2)~步骤(5),为通过基于情感极性BERT对源帖信息进行文本数据增强。
(6)形成源帖的增强文本特征向量D,且D={word 1 word 2 ,…,word n tag 1 tag 2 ,…,tag n emotion 1 emotion 2 ,…,emotion n },将源贴的增强文本向量特征D加入到传播关系的根节点中,与传播关系T结合,即
Figure 177672DEST_PATH_IMAGE120
,形成树型传播结构G k ,且
Figure 677049DEST_PATH_IMAGE122
,其中,word i 为文本中得到的第i个特征词以及BERT模型提取的隐藏特征词,tag i为文本中第i个特殊符号标记,如@、#等,emotion i 为标注的情感极性,
Figure DEST_PATH_IMAGE124
Figure DEST_PATH_IMAGE126
V k B k 分别表示回复帖到转发帖和回复帖到响应帖所形成的边集合,则
Figure DEST_PATH_IMAGE128
,由于
Figure DEST_PATH_IMAGE130
代表第j个相关的转发帖或响应帖,因此,若
Figure DEST_PATH_IMAGE132
Figure DEST_PATH_IMAGE134
为一个反馈,即
Figure 488840DEST_PATH_IMAGE132
Figure 256332DEST_PATH_IMAGE134
的转发帖或响应帖,则
Figure DEST_PATH_IMAGE136
为一条边,即
Figure DEST_PATH_IMAGE138
;若
Figure 642271DEST_PATH_IMAGE134
Figure DEST_PATH_IMAGE140
为一个反馈,则
Figure DEST_PATH_IMAGE142
为一条边,即
Figure DEST_PATH_IMAGE144
,以此类推。
(7)将谣言从根结点开始,自源贴开始通过转发及响应关系形成自前向后的正向树型传播结构
Figure DEST_PATH_IMAGE146
,且
Figure DEST_PATH_IMAGE148
和将由社区内各个分散节点聚集到上层根节点表示形成自后向前的反向树型传播结构
Figure DEST_PATH_IMAGE150
,且
Figure DEST_PATH_IMAGE152
;通过本发明提出的基于事件与传播结构的双向图卷积神经网络(FRBi-GCN),结合事件与信息传播深度和散布广度三方面进行谣言检测,以提高谣言检测准确率。
本发明提出的基于事件级传播结构的传播树节点增强技术,能更好地利用源帖以及各个转发节点中蕴含的丰富信息的同时从各节点之间的关系中获得更准确的节点表示。
(8)在每个训练轮次epoch,采用随机删边技术避免过拟合问题,获得邻接矩阵
Figure DEST_PATH_IMAGE154
模型的本质还是根据事件的文本内容,用户信息和转发的文章所构造的传播结构来预测事件的标签类别,本发明基于事件与传播结构的双向图卷积神经网络模型,在每个训练轮次epoch,为避免过拟合问题,采用随机删边技术(DropEdge),在每个训练阶段,随机地从输入的传播树中删除边,以产生一定速率的不同变形副本。该方法能增加输入的随机性以及多样性。
假设树型传播结构图G k 中边的总数为N e ,删除率为p,则使用DropEdge后的邻接矩阵
Figure 916080DEST_PATH_IMAGE154
的计算公式如下所示:
Figure DEST_PATH_IMAGE156
其中,
Figure DEST_PATH_IMAGE158
是使用
Figure DEST_PATH_IMAGE160
从原始边集合中随机采样的矩阵结构。在FGCN中,邻接矩阵表示为
Figure DEST_PATH_IMAGE162
,在RGCN中,邻接矩阵表示为
Figure DEST_PATH_IMAGE164
(9)将构造好的正向树型传播结构
Figure DEST_PATH_IMAGE165
和反向树型传播结构
Figure DEST_PATH_IMAGE166
分别输入到FGCN模型和RGCN模型中,获得传播特性H F 和扩散特性H R
FGCN模型和RGCN模型分别获得传播特性H F 和扩散特性H R ,FGCN和RGCN分别通过下式计算获得:
Figure DEST_PATH_IMAGE168
Figure DEST_PATH_IMAGE170
其中,
Figure DEST_PATH_IMAGE172
Figure DEST_PATH_IMAGE174
分别为FGCN隐藏层特性和RGCN隐藏层特性,W F W R 分别为FGCN和RGCN的滤波参数矩阵,
Figure DEST_PATH_IMAGE176
为ReLU激活函数。
其中步骤(7)~步骤(9)是为了将树型传播结构G k 解析成自源帖开始通过转发及响应关系形成自前向后的正向树型传播结构
Figure 789401DEST_PATH_IMAGE165
,且
Figure 531223DEST_PATH_IMAGE148
和将由社区内各个分散节点聚集到上层根节点表示形成自后向前的反向树型传播结构
Figure 419938DEST_PATH_IMAGE166
,且
Figure 605325DEST_PATH_IMAGE152
。在每个训练epoch,采用随机删边技术避免过拟合问题,获得邻接矩阵
Figure 83054DEST_PATH_IMAGE156
,其中,
Figure 549938DEST_PATH_IMAGE158
是使用
Figure 932640DEST_PATH_IMAGE160
从原始边集合中随机采样的矩阵结构,N e 为边的总数,p为删除率;在正向树型传播结构
Figure 85666DEST_PATH_IMAGE165
中,邻接矩阵表示为
Figure 101289DEST_PATH_IMAGE162
,在反向树型传播结构
Figure 861611DEST_PATH_IMAGE166
中,邻接矩阵表示为
Figure 708606DEST_PATH_IMAGE164
。将正向和反向两种树型传播结构分别输入到正向的图卷积神经网络(FGCN)以及反向的图卷积神经网络(RGCN)中,获得传播特性
Figure 563692DEST_PATH_IMAGE168
和扩散特性
Figure 643775DEST_PATH_IMAGE170
;其中,
Figure 27962DEST_PATH_IMAGE172
为隐藏层特性,W F 为FGCN的滤波参数矩阵,
Figure 41049DEST_PATH_IMAGE174
为隐藏层特性,W R 为RGCN的滤波参数矩阵,
Figure 145664DEST_PATH_IMAGE176
为ReLU激活函数;
(10)将原始特征矩阵
Figure DEST_PATH_IMAGE178
输入到FRBi-GCN模型中,通过k个GCL后形成的隐藏特征向量H k ,其中,
Figure 480087DEST_PATH_IMAGE178
为FRBi-GCN模型输入的原始特征矩阵,H k 为第k个GCL生成的隐藏特征向量;
(11)除了提取FGCN和RGCN的隐藏特征外,还将每层节点(除根节点外)与上一层节点的特征向量进行拼接,构造一个新的特征矩阵,增强节点之间关联性。即将第k层节点的隐藏特征向量H k k-1层层节点的隐藏特征向量H k-1 进行拼接,得到新的隐藏特征向量
Figure DEST_PATH_IMAGE180
,且
Figure DEST_PATH_IMAGE182
Figure 162305DEST_PATH_IMAGE180
为第k层节点隐藏层特征向量与k-1层节点隐藏层特征向量拼接后所得隐藏特征向量。
在步骤(11)中,在通过根节点的源贴开始通过转发及响应关系形成自前向后的正向树型传播结构
Figure 92215DEST_PATH_IMAGE146
中,节点与相邻节点进行拼接通过下式计算得到:
Figure DEST_PATH_IMAGE184
其中,
Figure DEST_PATH_IMAGE186
表示根节点,即
Figure DEST_PATH_IMAGE188
第一层与第二层的转发节点增强公式分别如下所示:
Figure DEST_PATH_IMAGE190
Figure DEST_PATH_IMAGE192
同理可得,由社区内各个分散节点聚集到上层根节点表示形成自后向前的反向树型传播结构
Figure DEST_PATH_IMAGE193
节点增强所得的
Figure DEST_PATH_IMAGE195
Figure DEST_PATH_IMAGE197
Figure DEST_PATH_IMAGE199
的计算方式与上式相同。
(12)将传播表示
Figure DEST_PATH_IMAGE201
和扩散表示
Figure DEST_PATH_IMAGE203
的节点表示信息分别使用均值池化进行聚合操作,得到S F S R ,进而将二者进行拼接得到
Figure DEST_PATH_IMAGE205
将通过正向树型传播结构获得的传播表示
Figure 972178DEST_PATH_IMAGE201
和通过反向树型传播结构获得的扩散表示
Figure DEST_PATH_IMAGE206
的节点表示信息分别使用均值池化(Mean-Pooling)进行聚合操作,其公式分别如下所示:
Figure DEST_PATH_IMAGE208
Figure DEST_PATH_IMAGE210
将FGCN的特征向量S F 和RGCN的特征向量S R 进行拼接:
Figure DEST_PATH_IMAGE212
其中,步骤(10)步骤(12)为对正向树型传播结构
Figure 129315DEST_PATH_IMAGE165
以及反向树型传播结构
Figure 46849DEST_PATH_IMAGE166
中包含根节点以及转发节点在内的所有节点进行节点增强操作,即基于事件级传播树节点增强技术,增强了源帖与转发贴之间的关联性,从而达到提高谣言检测准确率的目的。
(13)通过全连接层以及softmax层获得用于预测事件的标签y,进而区分是谣言还是非谣言,同时,与人工标记的标签
Figure DEST_PATH_IMAGE214
进行对比,进而评估模型的谣言检测效果。
以上所述,仅是本发明的较佳实施例,并非对本发明做任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化,均落入本发明的保护范围之内。

Claims (7)

1.基于事件与传播结构的谣言检测方法,其特征在于:包括下述步骤:
步骤1、从获取的公开数据集E所包含的事件
Figure DEST_PATH_IMAGE002
中提取源帖信息、转发关系以及其他特征,其中,其他特征包括用户信息、粉丝数、点赞数,k表示的是事件的序数,e k 表示第k个事件,n k 为第k个事件e k 中的单个帖子,r k 为源帖,每个
Figure DEST_PATH_IMAGE004
代表第j个相关的转发帖或响应帖,且j=1…k
步骤2、使用基于情感极性的BERT对源帖信息进行文本数据增强,进而获得源帖的增强文本特征向量D
步骤3、将源贴的增强文本特征向量D加入到传播关系的根节点中,与传播关系T结合,形成树型传播结构G k
步骤4、将树型传播结构G k 解析成正向树型传播结构
Figure DEST_PATH_IMAGE006
和反向树型传播结构
Figure DEST_PATH_IMAGE008
,并将正向和反向两种树型传播结构分别输入到FGCN模型以及RGCN模型中,获得传播特性H F 和扩散特性H R ,FGCN模型和RGCN模型共同构成基于事件与传播结构的双向图卷积神经网络模型;
步骤5、对正向树型传播结构
Figure DEST_PATH_IMAGE009
以及反向树型传播结构
Figure DEST_PATH_IMAGE010
中包含根节点以及转发节点在内的所有节点进行节点增强操作;
步骤6、使用全连接将基于事件与传播结构的双向图卷积神经网络层与softmax分类函数进行连接,根据softmax分类函数的输出结果用于判断待检测的事件是否为谣言,所述softmax分类函数为:
Figure DEST_PATH_IMAGE012
,其中 V i 表示分类的类别,i表示类别索引,C表示分类的种类,S i 表示输出最大定的类别。
2.根据权利要求1所述的基于事件与传播结构的谣言检测方法,其特征在于:所述步骤2包括以下具体步骤:
步骤2.1、将源帖信息中的文本数据进行情感极性标注,获得标记数据集S,且
Figure DEST_PATH_IMAGE014
,其中,N为被标记的数据个数,
Figure DEST_PATH_IMAGE016
为第N个被标记的数据,
Figure DEST_PATH_IMAGE018
为第N个被标记数据的情感极性标签;
步骤2.2、在标记数据集S上对预训练的BERT进行微调,直至收敛;即将BERT中能对文本的语义相似性进行分类的段表征
Figure DEST_PATH_IMAGE020
改为与标注好的情感极性有关联的情感极性表征E emotion ,从而根据标记数据集上的情感极性标签进行学习;其中,E A 表示改词属于句向量AE B 表示词属于句向量B;AB分别为句向量,且当输入文本为非单一的情感极性时,需调整向量的大小以兼容标签大小;
步骤2.3、对于每次迭代
Figure DEST_PATH_IMAGE022
,从标记数据集S中抽取句子p i ,随机屏蔽k个词,通过EPBERT模型根据语境和情感极性预测被屏蔽词的原始词汇索引I,且
Figure DEST_PATH_IMAGE024
,从而获得与句子情感极性标签相匹配的各种词
Figure DEST_PATH_IMAGE026
,并获得文本特征向量
Figure DEST_PATH_IMAGE028
;其中,word i 为文本中第i个特征词,
Figure DEST_PATH_IMAGE030
y分别表示除去被屏蔽词之外的上下文及其标签,trem k 表示是第k 个情感极性词;
步骤2.4、形成源帖的增强文本特征向量D
3.根据权利要求1所述的基于事件与传播结构的谣言检测方法,其特征在于:所述BERT采用双向语言模型从正反两个方向对生成新语句的概率进行建模,再由独立训练的正向语言模型的浅层和反向语言模型的浅层连接而成,形成BERT模型;其中,正向语言模型预测序列的概率表示为:
Figure DEST_PATH_IMAGE032
p i 表示选择的句子,反向语言模型预测序列的概率表示为:
Figure DEST_PATH_IMAGE034
p i 表示选择的句子。
4.根据权利要求2所述的基于事件与传播结构的谣言检测方法,其特征在于:所述步骤3具体为:
将源贴的增强后文本数据的文本特征向量D,且D={word 1 word 2 ,…,word n tag 1 tag 2 ,…,tag n emotion 1 emotion 2 ,…,emotion n }加入到传播关系的根节点中,与传播关系T结合,即
Figure DEST_PATH_IMAGE036
,形成树型传播结构G k ,且
Figure DEST_PATH_IMAGE038
;其中,tag i为文本中第i个特殊符号标记,emotion i 为标注的情感极性,
Figure DEST_PATH_IMAGE040
Figure DEST_PATH_IMAGE042
V k B k 分别表示回复帖到转发帖和回复帖到响应帖所形成的边集合;若
Figure DEST_PATH_IMAGE044
Figure DEST_PATH_IMAGE046
为一个反馈,即
Figure 587658DEST_PATH_IMAGE044
Figure 616050DEST_PATH_IMAGE046
的转发帖或响应帖,则
Figure DEST_PATH_IMAGE048
为一条边,即
Figure DEST_PATH_IMAGE050
;若
Figure 724950DEST_PATH_IMAGE046
Figure DEST_PATH_IMAGE052
为一个反馈,则
Figure DEST_PATH_IMAGE054
为一条边,即
Figure DEST_PATH_IMAGE056
,以此类推。
5.根据权利要求1所述的基于事件与传播结构的谣言检测方法,其特征在于:所述步骤4包括下述具体步骤:
步骤4.1、将谣言从根结点开始,自源贴开始通过转发及响应关系形成自前向后的正向树型传播结构
Figure 534207DEST_PATH_IMAGE009
,且
Figure DEST_PATH_IMAGE058
和将由社区内各个分散节点聚集到上层根节点表示形成自后向前的反向树型传播结构
Figure 430137DEST_PATH_IMAGE010
,且
Figure DEST_PATH_IMAGE060
步骤4.2、在每个训练轮次epoch,采用随机删边技术避免过拟合问题,获得邻接矩阵
Figure DEST_PATH_IMAGE062
,且
Figure DEST_PATH_IMAGE064
,其中,A drop 是使用
Figure DEST_PATH_IMAGE066
从原始边集合中随机采样的矩阵结构,N e 为边的总数,p为删除率;在正向树型传播结构
Figure 331945DEST_PATH_IMAGE009
中,邻接矩阵表示为
Figure DEST_PATH_IMAGE068
,在反向树型传播结构
Figure DEST_PATH_IMAGE069
中,邻接矩阵表示为
Figure DEST_PATH_IMAGE071
步骤4.3、将构造好的正向树型传播结构
Figure 78272DEST_PATH_IMAGE009
和反向树型传播结构
Figure 774045DEST_PATH_IMAGE010
分别输入到FGCN模型和RGCN模型中,获得传播特性H F 和扩散特性H R ,且
Figure DEST_PATH_IMAGE073
Figure DEST_PATH_IMAGE075
;其中,
Figure DEST_PATH_IMAGE077
为隐藏层特性,W F 为FGCN的滤波参数矩阵,
Figure DEST_PATH_IMAGE079
为隐藏层特性,W R 为RGCN的滤波参数矩阵,
Figure DEST_PATH_IMAGE081
为ReLU激活函数。
6.根据权利要求1所述的基于事件与传播结构的谣言检测方法,其特征在于:所述步骤5包括下述具体步骤:
步骤5.1、将原始特征矩阵
Figure DEST_PATH_IMAGE083
输入到FRBi-GCN模型中,通过k层GCL后形成的隐藏特征向量H k
步骤5.2、再将第k层节点的隐藏特征向量H k k-1层节点的隐藏特征向量H k-1 进行拼接,得到新的隐藏特征向量
Figure DEST_PATH_IMAGE085
,且
Figure DEST_PATH_IMAGE087
步骤5.3、将传播表示
Figure DEST_PATH_IMAGE089
和扩散表示
Figure DEST_PATH_IMAGE091
的节点表示信息分别使用均值池化进行聚合操作,得到
Figure DEST_PATH_IMAGE093
Figure DEST_PATH_IMAGE095
,将二者进行拼接得到
Figure DEST_PATH_IMAGE097
7.根据权利要求1所述的基于事件与传播结构的谣言检测方法,其特征在于:所述传播关系由源帖和转发贴之间的转发关系及包括用户信息,粉丝数,点赞数在内的其他特征构成。
CN202110903231.3A 2021-08-06 2021-08-06 基于事件与传播结构的谣言检测方法 Active CN113343126B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110903231.3A CN113343126B (zh) 2021-08-06 2021-08-06 基于事件与传播结构的谣言检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110903231.3A CN113343126B (zh) 2021-08-06 2021-08-06 基于事件与传播结构的谣言检测方法

Publications (2)

Publication Number Publication Date
CN113343126A true CN113343126A (zh) 2021-09-03
CN113343126B CN113343126B (zh) 2021-12-21

Family

ID=77480936

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110903231.3A Active CN113343126B (zh) 2021-08-06 2021-08-06 基于事件与传播结构的谣言检测方法

Country Status (1)

Country Link
CN (1) CN113343126B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113821723A (zh) * 2021-09-22 2021-12-21 广州博冠信息科技有限公司 搜索方法、装置及电子设备
CN114444516A (zh) * 2022-04-08 2022-05-06 四川大学 一种基于深度语义感知图卷积网络的粤语谣言检测方法
CN116758567A (zh) * 2023-08-11 2023-09-15 浪潮电子信息产业股份有限公司 不实信息检测方法、装置、电子设备及计算机可读存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160212163A1 (en) * 2015-01-16 2016-07-21 The Trustees Of The Stevens Institute Of Technology Method and Apparatus to Identify the Source of Information or Misinformation in Large-Scale Social Media Networks
CN110362818A (zh) * 2019-06-06 2019-10-22 中国科学院信息工程研究所 基于用户关系结构特征的微博谣言检测方法和系统
CN111400452A (zh) * 2020-03-16 2020-07-10 腾讯科技(深圳)有限公司 文本信息分类处理方法、电子设备及计算机可读存储介质
US20200334416A1 (en) * 2019-04-16 2020-10-22 Covera Health Computer-implemented natural language understanding of medical reports
CN112256945A (zh) * 2020-11-06 2021-01-22 四川大学 一种基于深度神经网络的社交网络粤语谣言检测方法
CN112612970A (zh) * 2020-12-25 2021-04-06 南京邮电大学 一种基于微博事件关系的谣言检测方法及其系统
CN113094596A (zh) * 2021-04-26 2021-07-09 东南大学 一种基于双向传播图的多任务谣言检测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160212163A1 (en) * 2015-01-16 2016-07-21 The Trustees Of The Stevens Institute Of Technology Method and Apparatus to Identify the Source of Information or Misinformation in Large-Scale Social Media Networks
US20200334416A1 (en) * 2019-04-16 2020-10-22 Covera Health Computer-implemented natural language understanding of medical reports
CN110362818A (zh) * 2019-06-06 2019-10-22 中国科学院信息工程研究所 基于用户关系结构特征的微博谣言检测方法和系统
CN111400452A (zh) * 2020-03-16 2020-07-10 腾讯科技(深圳)有限公司 文本信息分类处理方法、电子设备及计算机可读存储介质
CN112256945A (zh) * 2020-11-06 2021-01-22 四川大学 一种基于深度神经网络的社交网络粤语谣言检测方法
CN112612970A (zh) * 2020-12-25 2021-04-06 南京邮电大学 一种基于微博事件关系的谣言检测方法及其系统
CN113094596A (zh) * 2021-04-26 2021-07-09 东南大学 一种基于双向传播图的多任务谣言检测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
XINYU CHEN 等: "A Novel Hybrid Model for Cantonese Rumor Detection on Twitter", 《APPLIED SCIENCES》 *
梁兆君 等: "基于BERT模型的增强混合神经网络的谣言检测", 《计算机应用与软件》 *
高玉君: "社会网络谣言检测综述", 《电子学报》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113821723A (zh) * 2021-09-22 2021-12-21 广州博冠信息科技有限公司 搜索方法、装置及电子设备
CN113821723B (zh) * 2021-09-22 2024-04-12 广州博冠信息科技有限公司 搜索方法、装置及电子设备
CN114444516A (zh) * 2022-04-08 2022-05-06 四川大学 一种基于深度语义感知图卷积网络的粤语谣言检测方法
CN114444516B (zh) * 2022-04-08 2022-07-05 四川大学 一种基于深度语义感知图卷积网络的粤语谣言检测方法
CN116758567A (zh) * 2023-08-11 2023-09-15 浪潮电子信息产业股份有限公司 不实信息检测方法、装置、电子设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN113343126B (zh) 2021-12-21

Similar Documents

Publication Publication Date Title
Chen et al. Call attention to rumors: Deep attention based recurrent neural networks for early rumor detection
CN113343126B (zh) 基于事件与传播结构的谣言检测方法
Tu et al. Rumor2vec: a rumor detection framework with joint text and propagation structure representation learning
CN112199608B (zh) 基于网络信息传播图建模的社交媒体谣言检测方法
CN112084335B (zh) 一种基于信息融合的社交媒体用户账号分类方法
CN110851176B (zh) 一种自动构造并利用伪克隆语料的克隆代码检测方法
CN112749274B (zh) 基于注意力机制和干扰词删除的中文文本分类方法
CN114844840B (zh) 一种基于计算似然比的分布外网络流量数据检测方法
Lin et al. A graph convolutional encoder and decoder model for rumor detection
CN114218457B (zh) 一种基于转发社交媒体用户表征的假新闻检测方法
Ma et al. Beyond statistical relations: Integrating knowledge relations into style correlations for multi-label music style classification
Zhang et al. Causalrd: A causal view of rumor detection via eliminating popularity and conformity biases
Tarnpradab et al. Attention based neural architecture for rumor detection with author context awareness
Singh et al. Fighting for Information Credibility: AnEnd-to-End Framework to Identify FakeNews during Natural Disasters.
CN114238738A (zh) 一种基于注意力机制与双向gru的谣言检测方法
CN113157993A (zh) 一种基于时序图极化分析的网络水军行为预警模型
Lan et al. Mining semantic variation in time series for rumor detection via recurrent neural networks
Cumalat Puig Sentiment analysis on short Spanish and Catalan texts using contextual word embeddings
Labhsetwar Sentiment analysis of customer satisfaction using deep learning
Sharma et al. A review of text mining techniques and applications
Si et al. Consistent multi-granular rationale extraction for explainable multi-hop fact verification
CN117743581B (zh) 一种农产品质量安全网络谣言的干预方法
Sultana et al. Fake News Detection Using Machine Learning Techniques
Alkulaib et al. HyperTwitter: A Hypergraph-based Approach to Identify Influential Twitter Users and Tweets
Muthulakshmi et al. Generative adversarial networks classifier optimized with water strider algorithm for fake tweets detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant