CN112732906A - 一种基于传播图神经网络的互联网谣言检测方法 - Google Patents

一种基于传播图神经网络的互联网谣言检测方法 Download PDF

Info

Publication number
CN112732906A
CN112732906A CN202011520193.5A CN202011520193A CN112732906A CN 112732906 A CN112732906 A CN 112732906A CN 202011520193 A CN202011520193 A CN 202011520193A CN 112732906 A CN112732906 A CN 112732906A
Authority
CN
China
Prior art keywords
node
propagation
vector
nodes
vector representation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011520193.5A
Other languages
English (en)
Inventor
曹建军
皮德常
翁年凤
吴致远
江春
陈俊夫
丁鲲
瞿雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN202011520193.5A priority Critical patent/CN112732906A/zh
Publication of CN112732906A publication Critical patent/CN112732906A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于传播图神经网络的互联网谣言检测方法,属于深度学习技术领域。包括获取待检测网页中用户的评论或回复结构,构建传播图;获取待检测网页中的文本数据,构建文本的向量表示;将文本的向量表示作为传播图中节点的初始状态,并利用基于门控循环单元的图神经网络更新传播图中节点的向量表示,根据传播图中节点的向量表示对待检测谣言进行分类,同时,本发明还引入注意力机制,动态地调整传播图中各个节点的权重。利用本发明的方法,能够高效准确地对谣言进行检测。

Description

一种基于传播图神经网络的互联网谣言检测方法
技术领域
本发明属于深度学习技术领域,具体涉及一种基于传播图神经网络的互联网谣言检测方法。
背景技术
在现实中,谣言检测存在诸多挑战:1)信息量大。社交网络上每时每刻都在产生新的新闻和资讯,并且内容涉及各个领域。为了检测谣言,需要处理大量的信息;2)实效性高。社交网络上的用户活跃度高,新闻资讯短时间内传播范围广,对于虚假的谣言必须能够尽早发现,以防止恶劣影响的传播;3)识别困难。有些谣言是精心设计的,有意图和导向性的,不仅普通用户甚至专业人士也难以分辨其真假。
为了能够检测互联网谣言,提出了很多互联网谣言的检测方法,例如申请号为201911158422.0的中国专利公开了一种基于图神经网络的谣言立场检测方法、装置和电子设备。该专利包括:获取谣言数据;根据所述谣言数据的特征构建异构图,其中,所述异构图包括多个节点,所述节点用于表示所述谣言数据;将所述异构图输入图神经网络模型,得到对所述节点的立场分类结果,其中,所述立场分类结果是由所述图神经网络模型确定所述节点的目标特征,并根据每个所述节点的目标特征经过分类得到的。
但是现有方法对于谣言的检测时,面对大量的网络数据时,检测效率不高,准确性相对较差,从而很难有效应对上述的挑战,因此,还需对谣言检测的方法进行深入研究。
发明内容
技术问题:本发明针对现有技术在进行谣言检测时,检测效率地以及准确性不足的问题,提供一种基于传播图神经网络的互联网谣言检测方法,该方法具有较高的检测效率和准确率,实现快速准确地检测谣言的目的。
技术方案:本发明的基于传播图神经网络的互联网谣言检测方法,包括:
步骤S1:获取待检测网页中用户的评论或回复结构,构建传播图;
步骤S2:获取待检测网页中的文本数据,构建文本的向量表示;
步骤S3:将文本的向量表示作为传播图中节点的初始状态,并利用基于门控循环单元的图神经网络更新传播图中节点的向量表示,根据传播图中节点的向量表示对待检测谣言进行分类。
进一步地,步骤S1包括:
获取网页中消息的评论、回复和转发关系,构建传播树结构;
对于传播树中存在的路径,添加方向相反的路径,构成传播图。
进一步地,步骤S2包括:
获取待检测网页中的文本数据,并将文本中的每个单词表示为词向量;
对每个文本中的词向量取均值,作为文本的向量表示。
进一步地,采用word2vec算法将文本中的每个单词表示为词向量。
进一步地,利用基于门控循环单元的图神经网络对传播图中节点的向量表示进行更新,节点v的向量表示从时间步t-1到t的更新过程为:
Figure BDA0002849232990000021
Figure BDA0002849232990000022
Figure BDA0002849232990000023
Figure BDA0002849232990000024
Figure BDA0002849232990000025
其中,v表示节点,IN(v)表示传播图中的节点集合,t表示时间步,
Figure BDA0002849232990000026
作为门控循环单元在第t个时间步的输入,I(·)为指示函数,eu,v表示从节点u指向节点v的边,Ψ:E→R是边集的类型映射函数,E表示传播图中的边集,R表示关系路径的集合,|R|表示关系路径的类型总数,ri表示第i种类型的关系路径,αi表示不同类型的关系路径的权重,
Figure BDA0002849232990000027
为节点v在第t个更新步的向量表示,r为重置门,
Figure BDA0002849232990000028
是当前时间步节点状态的一个候选状态,z为更新门。
进一步地,步骤S3中,在更新传播图中节点的向量表示时,通过注意力机制,动态地调整传播图中各个节点的权重,具体方法为:
将公式
Figure BDA0002849232990000029
修改为如下公式:
Figure BDA00028492329900000210
其中,
Figure BDA00028492329900000211
为注意力分数,计算方式为:
Figure BDA0002849232990000031
其中,u′表示与节点u不同的任意节点,节点v沿着某一条关系路径汇聚邻域信息时,会根据该路径两端节点的向量表示动态地调整该路径的权重。
进一步地,步骤S3中,根据传播图中节点的向量表示对待检测谣言进行分类的过程为:
将传播图中所有节点的向量表示取均值得到均值向量c,按如下公式计算:
Figure BDA0002849232990000032
其中Wc和bc分别为计算均值向量所需的权重矩阵和偏置,Hv为传播图中节点v的向量表示,T为转置符号,N为节点的总数;
对于任意节点v,根据该节点的向量表示Hv和均值向量c,共同确定该节点在全局中所占的权重αv,节点v权重αv按如下公式计算:
αv=σ([Hv T,cT]Wg1)
其中,Wg1为权重矩阵,σ(·)为sigmoid激活函数;
得到传播图中所有节点的权重后,计算整个传播图的向量表示,按如下公式计算
Figure BDA0002849232990000033
其中,g为整个传播图的向量表示,Wg2为权重矩阵;
将得到的整个传播图的向量表示g作为全连接层的输入,输出最终的分类结果:
Figure BDA0002849232990000034
其中,F为全连接神经网络,
Figure BDA0002849232990000035
为模型的分类结果。
进一步地,步骤S3中,根据传播图的向量表示对待检测谣言进行分类的过程为:
将传播图中所有节点的向量表示取均值得到均值向量c,按如下公式计算:
Figure BDA0002849232990000036
其中Wc和bc分别为计算均值向量所需的权重矩阵和偏置,Hv为传播图中节点v的向量表示,T为转置符号,N为节点的个数;
根据每个节点的向量表示得到各自的分类结果,并将所有的分类结果通过线性加和的方式得到最终的分类结果,分类公式如下:
Figure BDA0002849232990000041
其中,We1、We2为权重矩阵,⊙为哈达马积,σ(·)为sigmoid激活函数。
进一步地,所述基于门控循环单元的图神经网络至少为两层,其中,第m层经过迭代更新后得到的节点表示
Figure BDA0002849232990000042
将作为第m+1层迭代更新的起始状态;相邻层之间按如下公式进行更新:
Figure BDA0002849232990000043
其中,Tm表示第m层节点迭代更新的次数,
Figure BDA0002849232990000044
表示第m层的节点v经过Tm次更新后得到的向量表示。
有益效果:本发明与现有技术相比,具有以下优点:
本发明根据网页中评论/回复结构构建了传播图,并构建文本的向量表示,利用基于门控循环单元的图神经网络更新传播图中节点的向量表示,并根据传播图中节点的向量表示对待检测谣言进行分类,从而对谣言在互联网上的传播结构进行捕捉和动态更新,有效地提高了谣言的检测效率和准确率,实现了快速准确地检测谣言的目的。
并且,在更新传播图中节点的向量表示时,引入注意力机制,动态地调整传播图中各个节点的权重,从而有效地提升了谣言检测的准确度。
附图说明
图1为本发明的实施例中的方法流程图;
图2为本发明的实施例中传播图的构建方式图;
图3为本发明的实施例中传播图中节点的更新方式图;
图4为本发明的实施例中利用GLO-PGNN方法时迭代更新次数的仿真图;
图5为本发明的实施例中利用ENS-PGNN方法时迭代更新次数的仿真图;
图6为本发明的实施例中利用GLO-PGNN方法时更新的层数M的仿真图;
图7为本发明的实施例中利用ENS-PGNN方法时更新的层数M的仿真图。
具体实施方式
下面结合实施例和说明书附图对本发明作进一步的说明。首先对对相关概念进行定义。
源推文:一个用户原创的推文,它不是对任何其他推文的回复、评论或是转发,本发明的实施例中,使用si表示第i个源推文s。
响应推文:是在源推文发布后,对其进行回复、评论或是转发的推文。本发明的实施例中,使用xi,t表示源推文si在t时刻的响应推文。将原推文和相应推文按时间排列,构成集合Ci={si,xi,1,xi,2,…,xi,T},其中si表示源推文,xi,t,t∈1,2,…,T为按时间排列的响应推文,为了统一符号,将源推文si记做xi,0
结合图1所示,本发明的方法包括以下步骤:
步骤S1:获取待检测网页中用户的评论或回复结构,构建传播图。
图2(a)展示了ACM官方推特账号发布2019年图领奖获得者的消息后,其他用户对该推文的评论、回复和转发关系。获取推文之间的回复、评论和转发关系构建一个传播树结构,如图2(b)所示。其中,节点0表示源推文,节点1、2、3表示响应推文。
显式关系路径:对于一条推文xi,t,如果某一个用户通过发布一条推文xi,t′(t<t′)对推文xi,t进行回复或者评论,则推文xi,t和推文xi,t′之间存在一条从xi,t指向xi,t′的显示关系路径。
隐式关系路径:对于推文节点xi,t和推文xi,t′,如果存在一条从xi,t指向xi,t′的显示关系路径,则添加一条从xi,t′指向xi,t的隐式关系路径。
通过引入关系路径,本发明定义从源推文开始经过多名用户回复、评论和转发形成的图结构为传播图,如图2(c)所示。
传播图的结构定义为:G=(V,E;f,Ψ,Φ),其中V为传播图中所有推文节点的集合,对于
Figure BDA0002849232990000051
都存在唯一的推文xi与之对应;f:X→H
Figure BDA0002849232990000052
为特征映射函数,用于将推文节点vi对应的推文内容xi表示成为高维向量
Figure BDA0002849232990000053
N为传播图中的节点个数,d为每个推文节点的特征维度;
Figure BDA0002849232990000054
为关系图中所有边e的集合。Φ:V→A是节点集的类型映射函数,其中A={a1,a2}是节点类型的集合,a1表示节点类型为源推文节点,a2表示节点类型为响应推文节点;Ψ:E→R是边集的类型映射函数,其中R={r1,r2}是关系路径的集合,r1表示边类型为显示关系路径,r2表示边类型为隐式关系路径。
步骤S2:获取待检测网页中的文本数据,构建文本的表示。
在本发明的实施例中,使用Word2vec算法将文本中的每个单词表示为词向量,并对每个文本中的词向量取均值,作为文本的向量表示。
步骤S3:将文本的向量表示作为传播图中节点的初始状态,并利用基于门控循环单元的图神经网络更新传播图中节点的向量表示,根据传播图中节点的向量表示对待检测谣言进行分类。
具体地,将文本的向量表示作为传播图中节点的初始状态,该节点的原始向量表示记作
Figure BDA0002849232990000061
引入基于门控循环单元的图神经网络,对传播图中的节点进行更新,节点v的向量表示从时间步t-1到t的更新过程如公式(1)~(5)所示:
Figure BDA0002849232990000062
Figure BDA0002849232990000063
Figure BDA0002849232990000064
Figure BDA0002849232990000065
Figure BDA0002849232990000066
其中,t表示时间步,
Figure BDA0002849232990000067
作为门控循环单元在第t个时间步的输入,它是由节点v的邻域信息汇聚得到的;I(·)为指示函数,eu,v表示从节点u指向节点v的边,Ψ:E→R是边集的类型映射函数,E表示传播图中的边集,R表示关系路径的集合,|R|表示关系路径的类型总数,ri表示第i种类型的关系路径,αi表示不同类型的关系路径的权重,所有类型的关系路径的权重之和为1,Wi和bi分别为第i种关系路径对应的权重矩阵和偏置,
Figure BDA0002849232990000068
为节点u在第t-1个时间步的向量表示。
Figure BDA0002849232990000069
为节点v在第t个时间步的更新门,σ(·)为sigmoid激活函数,用于将输出限制在0~1之间,Wz和Uz为更新门的权重矩阵,
Figure BDA00028492329900000610
为节点v在第t-1个时间步的向量表示;
Figure BDA00028492329900000611
为节点v在第t个时间步的重置门,Wr和Ur为重置门的权重矩阵;
Figure BDA00028492329900000612
为节点v在第t个时间步的候选状态,
Figure BDA00028492329900000613
Figure BDA00028492329900000614
为候选状态的权重矩阵,
Figure BDA00028492329900000615
为节点v在第t个更新步的向量表示,对于
Figure BDA00028492329900000616
需满足在传播图中存在从u指向v的边;⊙为哈达马积,表示对于两个维度相同的向量、矩阵、张量进行对应位置的逐元素乘积运算。重置门
Figure BDA0002849232990000071
控制t-1时间步的节点状态
Figure BDA0002849232990000072
有多少信息能被写入到当前时间步的候选状态
Figure BDA0002849232990000073
上,重置门数值越小,前一时间步的状态信息被写入的越少。从公式(4)可以看出,
Figure BDA0002849232990000074
与重置门
Figure BDA0002849232990000075
节点v在t-1时间步的状态
Figure BDA0002849232990000076
以及当前时间步的输入
Figure BDA0002849232990000077
有关。更新门
Figure BDA0002849232990000078
可以看作是一个平衡参数。使用更新门,可以有选择地遗忘节点v在t-1时刻的信息
Figure BDA0002849232990000079
同时有选择地增加候选状态
Figure BDA00028492329900000710
中的信息,从而得到在当前时间步节点v的状态表示
Figure BDA00028492329900000711
传播图中节点更新过程如图3所示。
通过引入门控循环单元来控制信息的累积速度。有选择的加入新的邻域汇聚信息,并有选择的遗忘之前时刻的历史信息,从而达到在有限的时间步内不断更新节点的向量表示的目的。
在本发明的实施例中,更新传播图的节点的向量表示过程中,在每次汇集邻域信息时,通过注意力机制,动态地调整传播图中各个节点的权重,具体地,将公式(1)修改为:
Figure BDA00028492329900000712
其中,
Figure BDA00028492329900000713
为注意力分数,它的计算方式如公式(7)所示:
Figure BDA00028492329900000714
用u′表示与节点u不同的任意节点,节点v沿着某一条关系路径汇聚邻域信息时,会根据该路径两端节点的向量表示动态地调整该路径的权重。
按上述过程更新T个时间步后,即可得到节点的向量表示,但是使用单层图神经网络得到的节点表示,其表达能力相对较弱。在对图像进行特征提取时,通常使用多层卷积神经网络来提取图像中更为抽象的信息。因此在本发明的实施例中,采用的基于门控循环单元的图神经网络至少包括两层门控循环单元,每一层的更新方式均如公式(1)~(5)所示,但是每一层的参数W、U和b等的取值是不一样的,这使得每一层在更新节点的向量表示时能够关注不同的信息。
假设基于门控循环单元的图神经网络共有M层门控循环单元,则第m层经过Tm次迭代更新后得到的节点表示
Figure BDA00028492329900000715
将作为第m+1层迭代更新的起始状态。相邻层之间用公式(8)进行更新:
Figure BDA0002849232990000081
其中,Tm表示第m层节点迭代更新的次数,
Figure BDA0002849232990000082
表示第m的第t次更新后节点v的向量表示。
本发明的实施例中,将上述方法成为传播图神经网络算法(PNGG),则使用PNGG算法生成节点的向量表示的具体方法如下:
Figure BDA0002849232990000083
进一步地,在得到传播图中各节点的向量表示H后,根据节点的向量表示对谣言数据进行分类,在本发明的一个实施例中,从全局的角度,整合各个局部节点的信息,得到整个传播图的向量表示,然后用于分类,并与上述的PNGG算法集成为GLO-PNGG。
具体地,将传播图中所有节点的向量表示取均值得到均值向量c,按如下公式计算
Figure BDA0002849232990000091
其中,
Figure BDA0002849232990000092
Figure BDA0002849232990000093
分别为计算均值向量所需的权重矩阵和偏置,Hv为传播图中节点v的向量表示,T为转置符号,N为节点的总数。
对于任意节点v,根据该节点的向量表示Hv和均值向量c,共同确定该节点在全局中所占的权重αv,节点v权重αv按如下公式计算:
αv=σ([Hv T,cT]Wg1) (10)
其中,
Figure BDA0002849232990000094
为权重矩阵,σ(·)为sigmoid激活函数;
得到传播图中所有节点的权重后,计算整个传播图的向量表示,按如下公式计算:
Figure BDA0002849232990000095
其中,g为整个传播图的向量表示,
Figure BDA0002849232990000096
为权重矩阵。
将得到的整个传播图的向量表示g作为全连接层的输入,输出最终的分类结果:
Figure BDA0002849232990000097
其中,F为全连接神经网络,
Figure BDA0002849232990000098
为模型的分类结果。
在本发明的另一种实施例中,先根据每个节点的向量表示得到各自的分类结果,再通过线性加和的方式得到最终的分类结果,并与PNGG算法集成为ENS-PNGG算法。具体地分类计算公式如(13)所示:
Figure BDA0002849232990000099
其中,c表示均值向量,利用公式(9)计算;σ(·)为sigmoid函数,用于将输出限制在0~1之间,⊙为哈达马积,表示对于两个维度相同的向量、矩阵、张量进行对应位置的逐元素乘积运算,
Figure BDA00028492329900000910
Figure BDA00028492329900000911
均为权重矩阵。
为了对本发明的效果进行说明,通过仿真试验进行验证,在使用PGNN计算传播图中的节点表示时,更新的层数M和每一层的迭代次数T是需要手动设置。
首先讨论模型的分类效果与迭代次数T的关系。固定更新的层数M=1,即神经网络模型中只包括一层门控循环单元,图4和图5分别展示了利用GLO-PGNN方法和ENS-PGNN方法分类结果的F1值与迭代次数T的关系,对于这两种方法,最优的迭代次数都是2。
固定迭代次数T=2不变,图6和图7分别展示了利用GLO-PGNN方法和ENS-RGNN方法分类结果的F1值与更新层数M的关系,可以看出,最佳的更新层数M均为2。并且可以看出本发明的方法的F1值都相对较高,也说明了本发明的方法具有较高的准确率,能够更好地对谣言数据进行分类,从而更准确地检测谣言。
上述实施例仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和等同替换,这些对本发明权利要求进行改进和等同替换后的技术方案,均落入本发明的保护范围。

Claims (9)

1.一种基于传播图神经网络的互联网谣言检测方法,其特征在于,包括:
步骤S1:获取待检测网页中用户的评论或回复结构,构建传播图;
步骤S2:获取待检测网页中的文本数据,构建文本的向量表示;
步骤S3:将文本的向量表示作为传播图中节点的初始状态,并利用基于门控循环单元的图神经网络更新传播图中节点的向量表示,根据传播图中节点的向量表示对待检测谣言进行分类。
2.根据权利要求1所述的基于传播图神经网络的互联网谣言检测方法,其特征在于,步骤S1包括:
获取网页中消息的评论、回复和转发关系,构建传播树结构;
对于传播树中存在的路径,添加方向相反的路径,构成传播图。
3.根据权利要求1所述的基于传播图神经网络的互联网谣言检测方法,其特征在于,步骤S2包括:
获取待检测网页中的文本数据,并将文本中的每个单词表示为词向量;
对每个文本中的词向量取均值,作为文本的向量表示。
4.根据权利要求3所述的基于传播图神经网络的互联网谣言检测方法,其特征在于,采用word2vec算法将文本中的每个单词表示为词向量。
5.根据权利要求1所述的基于传播图神经网络的互联网谣言检测方法,其特征在于,利用基于门控循环单元的图神经网络对传播图中节点的向量表示进行更新,节点v的向量表示从时间步t-1到t的更新过程为:
Figure FDA0002849232980000011
Figure FDA0002849232980000012
Figure FDA0002849232980000013
Figure FDA0002849232980000014
Figure FDA0002849232980000015
其中,v表示节点,IN(v)表示传播图中的节点集合,t表示时间步,
Figure FDA0002849232980000016
作为门控循环单元在第t个时间步的输入,I(·)为指示函数,eu,v表示从节点u指向节点v的边,Ψ:E→R是边集的类型映射函数,E表示传播图中的边集,R表示关系路径的集合,|R|表示关系路径的类型总数,ri表示第i种类型的关系路径,αi表示不同类型的关系路径的权重,Wi和bi分别为第i种关系路径对应的权重矩阵和偏置,
Figure FDA0002849232980000021
为节点u在第t-1个时间步的向量表示;
Figure FDA0002849232980000022
为节点v在第t个时间步的更新门,σ(·)为sigmoid激活函数,Wz和Uz为更新门的权重矩阵,
Figure FDA0002849232980000023
为节点v在第t-1个时间步的向量表示;
Figure FDA0002849232980000024
为节点v在第t个时间步的重置门,Wr和Ur为重置门的权重矩阵;
Figure FDA0002849232980000025
为节点v在第t个时间步的候选状态,
Figure FDA0002849232980000026
Figure FDA0002849232980000027
为候选状态的权重矩阵,
Figure FDA0002849232980000028
为节点v在第t个更新步的向量表示,⊙为哈达马积。
6.根据权利要求5所述的基于传播图神经网络的互联网谣言检测方法,其特征在于,步骤S3中,在更新传播图中节点的向量表示时,通过注意力机制,动态地调整传播图中各个节点的权重,具体方法为:
将公式
Figure FDA0002849232980000029
修改为如下公式:
Figure FDA00028492329800000210
其中,
Figure FDA00028492329800000211
为注意力分数,计算方式为:
Figure FDA00028492329800000212
其中,u′表示与节点u不同的任意节点,节点v沿着某一条关系路径汇聚邻域信息时,会根据该路径两端节点的向量表示动态地调整该路径的权重。
7.根据权利要求1所述的基于传播图神经网络的互联网谣言检测方法,其特征在于,步骤S3中,根据传播图中节点的向量表示对待检测谣言进行分类的过程为:
将传播图中所有节点的向量表示取均值得到均值向量c,按如下公式计算:
Figure FDA00028492329800000213
其中Wc和bc分别为计算均值向量所需的权重矩阵和偏置,Hv为传播图中节点v的向量表示,T为转置符号,N为节点的总数;
对于任意节点v,根据该节点的向量表示Hv和均值向量c,共同确定该节点在全局中所占的权重αv,节点v权重αv按如下公式计算:
αv=σ([Hv T,cT]Wg1)
其中,Wg1为权重矩阵,σ(·)为sigmoid激活函数;
得到传播图中所有节点的权重后,计算整个传播图的向量表示,按如下公式计算
Figure FDA0002849232980000031
其中,g为整个传播图的向量表示,Wg2为权重矩阵;
将得到的整个传播图的向量表示g作为全连接层的输入,输出最终的分类结果:
Figure FDA0002849232980000032
其中,F为全连接神经网络,
Figure FDA0002849232980000033
为模型的分类结果。
8.根据权利要求1所述的基于传播图神经网络的互联网谣言检测方法,其特征在于,步骤S3中,根据传播图的向量表示对待检测谣言进行分类的过程为:
将传播图中所有节点的向量表示取均值得到均值向量c,按如下公式计算:
Figure FDA0002849232980000034
其中Wc和bc分别为计算均值向量所需的权重矩阵和偏置,Hv为传播图中节点v的向量表示,T为转置符号,N为节点的个数;
根据每个节点的向量表示得到各自的分类结果,并将所有的分类结果通过线性加和的方式得到最终的分类结果,分类公式如下:
Figure FDA0002849232980000035
其中,We1、We2为权重矩阵,⊙为哈达马积,σ(·)为sigmoid激活函数。
9.根据权利要求1-8任一项所述的基于传播图神经网络的互联网谣言检测方法,其特征在于,所述基于门控循环单元的图神经网络至少为两层,其中,第m层经过迭代更新后得到的节点表示
Figure FDA0002849232980000036
将作为第m+1层迭代更新的起始状态;相邻层之间按如下公式进行更新:
Figure FDA0002849232980000037
其中,Tm表示第m层节点迭代更新的次数,
Figure FDA0002849232980000038
表示第m层的节点v经过Tm次更新后得到的向量表示。
CN202011520193.5A 2020-12-21 2020-12-21 一种基于传播图神经网络的互联网谣言检测方法 Pending CN112732906A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011520193.5A CN112732906A (zh) 2020-12-21 2020-12-21 一种基于传播图神经网络的互联网谣言检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011520193.5A CN112732906A (zh) 2020-12-21 2020-12-21 一种基于传播图神经网络的互联网谣言检测方法

Publications (1)

Publication Number Publication Date
CN112732906A true CN112732906A (zh) 2021-04-30

Family

ID=75604107

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011520193.5A Pending CN112732906A (zh) 2020-12-21 2020-12-21 一种基于传播图神经网络的互联网谣言检测方法

Country Status (1)

Country Link
CN (1) CN112732906A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113343041A (zh) * 2021-06-21 2021-09-03 北京邮电大学 基于图模型表示学习的消息回复关系判断系统
CN113377422A (zh) * 2021-06-09 2021-09-10 大连海事大学 一种基于深度学习识别自我承认技术债务方法
CN113434684A (zh) * 2021-07-01 2021-09-24 北京中科研究院 自监督学习的谣言检测方法、系统、设备及存储介质
CN113515634A (zh) * 2021-07-09 2021-10-19 福州大学 基于分层异质图神经网络的社交媒体谣言检测方法及系统
CN113626685A (zh) * 2021-07-08 2021-11-09 中国科学院信息工程研究所 一种面向传播不确定性的谣言检测方法及装置
CN113849599A (zh) * 2021-09-03 2021-12-28 北京中科睿鉴科技有限公司 基于模式信息和事实信息的联合虚假新闻检测方法
CN114330337A (zh) * 2021-12-29 2022-04-12 电子科技大学 一种用于社交媒体上的谣言检测方法
CN114706977A (zh) * 2022-02-25 2022-07-05 福州大学 基于动态多跳图注意力网络的谣言检测方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ZHIYUAN WU等: "Rumor detection based on propagation graph neural network with", 《EXPERT SYSTEMS WITH APPLICATIONS》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113377422A (zh) * 2021-06-09 2021-09-10 大连海事大学 一种基于深度学习识别自我承认技术债务方法
CN113377422B (zh) * 2021-06-09 2024-04-05 大连海事大学 一种基于深度学习识别自我承认技术债务方法
CN113343041A (zh) * 2021-06-21 2021-09-03 北京邮电大学 基于图模型表示学习的消息回复关系判断系统
CN113343041B (zh) * 2021-06-21 2022-05-20 北京邮电大学 基于图模型表示学习的消息回复关系判断系统
CN113434684A (zh) * 2021-07-01 2021-09-24 北京中科研究院 自监督学习的谣言检测方法、系统、设备及存储介质
CN113626685A (zh) * 2021-07-08 2021-11-09 中国科学院信息工程研究所 一种面向传播不确定性的谣言检测方法及装置
CN113626685B (zh) * 2021-07-08 2024-05-03 中国科学院信息工程研究所 一种面向传播不确定性的谣言检测方法及装置
CN113515634B (zh) * 2021-07-09 2023-08-01 福州大学 基于分层异质图神经网络的社交媒体谣言检测方法及系统
CN113515634A (zh) * 2021-07-09 2021-10-19 福州大学 基于分层异质图神经网络的社交媒体谣言检测方法及系统
CN113849599A (zh) * 2021-09-03 2021-12-28 北京中科睿鉴科技有限公司 基于模式信息和事实信息的联合虚假新闻检测方法
CN114330337A (zh) * 2021-12-29 2022-04-12 电子科技大学 一种用于社交媒体上的谣言检测方法
CN114330337B (zh) * 2021-12-29 2023-04-07 电子科技大学 一种用于社交媒体上的谣言检测方法
CN114706977A (zh) * 2022-02-25 2022-07-05 福州大学 基于动态多跳图注意力网络的谣言检测方法及系统

Similar Documents

Publication Publication Date Title
CN112732906A (zh) 一种基于传播图神经网络的互联网谣言检测方法
Alarifi et al. A big data approach to sentiment analysis using greedy feature selection with cat swarm optimization-based long short-term memory neural networks
US9846840B1 (en) Semantic class localization in images
Choi et al. Dynamic graph convolutional networks with attention mechanism for rumor detection on social media
Li et al. Image sentiment prediction based on textual descriptions with adjective noun pairs
CN112861967A (zh) 基于异构图神经网络的社交网络异常用户检测方法及设备
Khodadadi et al. BAOA: binary arithmetic optimization algorithm with K-nearest neighbor classifier for feature selection
Qiu et al. An adaptive social spammer detection model with semi-supervised broad learning
Jabbari et al. Discovery of causal models that contain latent variables through Bayesian scoring of independence constraints
Song et al. Learning node and edge embeddings for signed networks
Winkler et al. Data-based prediction of sentiments using heterogeneous model ensembles
Pham et al. Bio-inspired feature selection algorithms with their applications: a systematic literature review
Pham et al. Unsupervised training of Bayesian networks for data clustering
Awad et al. An improved long short term memory network for intrusion detection
Kim et al. Active anomaly detection based on deep one-class classification
Akinyelu et al. Ant colony optimization edge selection for support vector machine speed optimization
Ameur et al. Merits of Bayesian networks in overcoming small data challenges: A meta-model for handling missing data
Du et al. Structure tuning method on deep convolutional generative adversarial network with nondominated sorting genetic algorithm II
Latona et al. The AI Review Lottery: Widespread AI-Assisted Peer Reviews Boost Paper Scores and Acceptance Rates
Liu et al. Neural belief propagation for scene graph generation
Hosseini et al. Pool and accuracy based stream classification: a new ensemble algorithm on data stream classification using recurring concepts detection
CN116956081A (zh) 面向异构社交网络分布外泛化的社交标签预测方法及系统
Sarkar et al. Building, tuning, and deploying models
Zhang et al. Differential evolution-based weighted majority voting for crowdsourcing
İş et al. A Profile Analysis of User Interaction in Social Media Using Deep Learning.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210430