CN113139052B - 基于图神经网络特征聚合的谣言检测方法及装置 - Google Patents
基于图神经网络特征聚合的谣言检测方法及装置 Download PDFInfo
- Publication number
- CN113139052B CN113139052B CN202110402464.5A CN202110402464A CN113139052B CN 113139052 B CN113139052 B CN 113139052B CN 202110402464 A CN202110402464 A CN 202110402464A CN 113139052 B CN113139052 B CN 113139052B
- Authority
- CN
- China
- Prior art keywords
- event source
- graph
- source text
- neural network
- tweet
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 84
- 238000001514 detection method Methods 0.000 title claims abstract description 62
- 230000002776 aggregation Effects 0.000 title claims abstract description 51
- 238000004220 aggregation Methods 0.000 title claims abstract description 51
- 238000012549 training Methods 0.000 claims abstract description 69
- 230000004044 response Effects 0.000 claims abstract description 66
- 238000003062 neural network model Methods 0.000 claims abstract description 45
- 238000000034 method Methods 0.000 claims abstract description 16
- 239000013598 vector Substances 0.000 claims description 79
- 230000006870 function Effects 0.000 claims description 39
- 230000011218 segmentation Effects 0.000 claims description 17
- 238000007781 pre-processing Methods 0.000 claims description 14
- 230000004913 activation Effects 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 10
- 238000002372 labelling Methods 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 10
- 238000013507 mapping Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 8
- 235000019580 granularity Nutrition 0.000 description 16
- 238000010586 diagram Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 4
- 239000000126 substance Substances 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 230000009849 deactivation Effects 0.000 description 2
- 238000013213 extrapolation Methods 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 239000009853 xinfeng Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本发明提供一种基于图神经网络特征聚合的谣言检测方法及装置,方法包括:获取第一事件源文本图;将第一事件源文本图和训练标签输入至预设第一图神经网络模型进行训练,以确定图神经网络预测模型;将待检测的第一事件源文本图输入至图神经网络预测模型,以对互联网中的事件源文本及响应推文进行谣言检测。所述装置用于执行上述方法。本发明提供的基于图神经网络特征聚合的谣言检测方法,使用得到的图神经网络预测模型对互联网的事件源文本及响应推文进行检测,能够保留社交媒体中的信息传播结构,更好地将事件的响应推文特征与事件源推文特征相融合,从文本级粒度和词语级粒度进行谣言判别。
Description
技术领域
本发明涉及大数据挖掘技术领域,尤其涉及一种基于图神经网络特征聚合的谣言检测方法及装置。
背景技术
谣言指没有相应事实基础,却被捏造出来并通过一定手段推动传播的言论。社交媒体上的谣言具有碎片化、网络化、范围广、速度快的特点。谣言检测技术和方法通过对现有计算机相关知识和技能的运用,在网络社交平台上对谣言进行识别。
现有谣言检测技术存在如下问题:1)现有的谣言检测研究无法较好地捕捉到文本中上下文及前后词的关系;2)谣言检测研究使用频率较高的文本向量化方法word2vec和GloVe无法将一词多义现象和上下文语境在词向量中体现出来;3)现有的基于图的研究倾向于从单一粒度入手对谣言文本或谣言传播结构进行谣言检测。
发明内容
本发明提供的基于图神经网络特征聚合的谣言检测方法,用于克服现有技术中存在的至少一个问题,使用得到的图神经网络预测模型对互联网的事件源文本及响应推文进行检测,能够保留社交媒体中的信息传播结构,更好地将事件的响应推文特征与事件源推文特征相融合,从文本级粒度和词语级粒度进行谣言判别。本发明提供一种基于图神经网络特征聚合的谣言检测方法,包括:
获取第一事件源文本图;
将所述第一事件源文本图和训练标签输入至预设第一图神经网络模型进行训练,以确定图神经网络预测模型;
将待检测的第一事件源文本图输入至所述图神经网络预测模型,以对互联网中的事件源文本及响应推文进行谣言检测;
其中,事件源文本图是通过将所述事件源文本进行图结构建模得到的;
所述训练标签是通过采用预设编码方式对所述事件源文本和所述响应推文进行标注后得到的。
根据本发明提供的一种基于图神经网络特征聚合的谣言检测方法,所述获取第一事件源文本图,包括
对事件源推文预处理,并对预处理后的事件源推文进行图结构建模,以获取第二事件源推文图;
将所述第二事件源推文图输入至训练好的第二图神经网络模型,以获取事件源推文的文本级特征向量;
根据事件源文本的词向量和所述文本级特征向量,获取所述第一事件源文本图;
其中,所述事件源推文包括所述事件源文本和所述响应推文。
根据本发明提供的一种基于图神经网络特征聚合的谣言检测方法,所述对事件源推文预处理,包括:
去除所述事件源文本中的乱码数据和空行数据;以及
去除所述事件源的响应推文的冗余项;
其中,所述冗余项包括转发但未评论的事件源的响应推文、乱码数据和空行数据。
根据本发明提供的一种基于图神经网络特征聚合的谣言检测方法,所述事件源文本的词向量通过如下方式获取:
去除所述事件源文本中的乱码数据和空行数据,获取满足预设条件的事件源文本;
对满足所述预设条件的事件源文本分词预处理,并将分词预处理后的满足所述预设条件的事件源文本输入至训练好的BERT模型,以获取所述事件源文本的词向量;
其中,所述分词预处理包括分词处理和去停用词处理。
根据本发明提供的一种基于图神经网络特征聚合的谣言检测方法,所述根据事件源文本的词向量和所述文本级特征向量,获取所述第一事件源文本图,包括:
获取所述文本级特征向量中表示所述事件源推文的向量;
获取所述事件源文本的词向量表示的词语;
将所述词语与预处理后的的事件源文本进行对应,确定所述词语所属事件;
根据所述词语所属事件,确定所述词语与所述事件源推文的向量之间的映射字典;
根据所述事件源文本的词向量和所述映射字典,确定所述事件源推文的聚合特征向量;
通过将所述聚合特征向量作为所述第一事件源文本图的节点集以及将所述词语之间的共现关系作为所述第一事件源文本图的边集,以获取所述第一事件源文本图。
根据本发明提供的一种基于图神经网络特征聚合的谣言检测方法,所述训练好的第二图神经网络模型通过如下方式获取:
将所述第二事件源推文图和所述训练标签输入至预设第二图神经网络模型进行训练,根据预设第一更新规则和预设第一激活函数对所述第二事件源推文图中的每个节点进行第一次更新;
根据第一次更新后的节点、预设分层传播规则和预设嵌入矩阵向量,确定所述事件源推文的文本级特征向量;
根据所述文本级特征向量,获取所述预设第二图神经网络模型的第一交叉熵函数,并在所述第一交叉熵函数小于第一预设阈值时,停止训练,以获取所述训练好的第二图神经网络模型。
根据本发明提供的一种基于图神经网络特征聚合的谣言检测方法,所述将所述第一事件源文本图和训练标签输入至预设第一图神经网络模型进行训练,以确定图神经网络预测模型,包括:
将所述第一事件源文本图和所述训练标签输入至预设第一图神经网络模型进行训练,根据预设第二更新规则和所述预设第一激活函数对所述第一事件源文本图中的每个节点进行第二次更新;
根据第二次更新后的节点和预设第二激活函数,获取记忆当前时刻状态,并根据所述记忆当前时刻状态获取总的当前状态信息;
根据所述总的当前状态信息和预设多个多层感知器,对所述第二次更新后的节点进行第三次更新;
根据第三次更新后的节点和预设softmax函数,获取对所述事件源文本及所述响应推文的预测标签;
根据所述预测标签和所述训练标签,获取所述预设第一图神经网络模型的第二交叉熵函数,并在所述第二交叉熵函数小于第二预设阈值时,停止训练,以确定所述图神经网络预测模型。
本发明还提供一种基于图神经网络特征聚合的谣言检测装置,包括:图获取模块、模型确定模块以及谣言检测模块;
所述图获取模块,用于获取第一事件源文本图;
所述模型确定模块,用于将所述第一事件源文本图和训练标签输入至预设第一图神经网络模型进行训练,以确定图神经网络预测模型;
所述谣言检测模块,用于将待检测的第一事件源文本图输入至所述图神经网络预测模型,以对互联网中的事件源文本及响应推文进行谣言检测;
其中,事件源文本图是通过将所述事件源文本进行图结构建模得到的;
所述训练标签是通过采用预设编码方式对所述事件源文本和所述响应推文进行标注后得到的。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述基于图神经网络特征聚合的谣言检测方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述基于图神经网络特征聚合的谣言检测方法的步骤。
本发明提供的基于图神经网络特征聚合的谣言检测方法及装置,使用得到的图神经网络预测模型对互联网的事件源文本及响应推文进行检测,能够保留社交媒体中的信息传播结构,更好地将事件的响应推文特征与事件源推文特征相融合,从文本级粒度和词语级粒度进行谣言判别。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的基于图神经网络特征聚合的谣言检测方法的流程示意图;
图2是本发明提供的训练好的第二图神经网络模型结构示意图;
图3是本发明提供的图神经网络预测模型结构示意图;
图4是本发明提供的基于图神经网络特征聚合的谣言检测装置的结构示意图;
图5是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提出基于图神经网络特征聚合的谣言检测方法。首先,使用图卷积神经网络对事件源文本-响应推文图进行文本粒度上的特征构造;其次,将含有事件推文结构信息的文本级特征与使用训练好的BERT模型生成的事件源推文的词语级特征相结合;最后,使用图神经网络预测模型对事件源文本词图进行词语粒度上的谣言检测,具体实现如下:
图1是本发明提供的基于图神经网络特征聚合的谣言检测方法的流程示意图,如图1所示,方法包括:
S1、获取第一事件源文本图;
S2、将第一事件源文本图和训练标签输入至预设第一图神经网络模型进行训练,以确定图神经网络预测模型;
S3、将待检测的第一事件源文本图输入至图神经网络预测模型,以对互联网中的事件源文本及响应推文进行谣言检测;
其中,事件源文本图是通过将事件源文本进行图结构建模得到的;
训练标签是通过采用预设编码方式对事件源文本和响应推文进行标注后得到的。
需要说明的是,上述方法的执行主体可以是电子设备、电子设备中的部件、集成电路、或芯片。该电子设备可以是移动电子设备,也可以为非移动电子设备。示例性的,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personal digital assistant,PDA)等,非移动电子设备可以为服务器、网络附属存储器(Network Attached Storage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本发明不作具体限定。
具体地,对第一事件源文本进行图结构建模可以得到第一事件源文本图,然后将得到的第一事件源文本图和训练标签作为训练样本,对预设的第一图神经网络模型进行训练以得到图神经网络预测模型,其中,第一图神经网络模型可以采用两层带门控循环单元(GRU)的图神经网络,训练标签是通过采用预设编码方式对互联网中的如腾讯微博、新浪微博和MSN等社交媒体的事件源文本及对应事件源文本的响应推文进行标注后得到。其中,事件源文本及响应推文可以采用爬虫工具进行爬取。
事件源文本是通过将源文本按事件进行分类后得到的,源文本的响应推文是由对源文本进行分享、转发或者评论的文本信息构成,通过对事件源文本和响应推文进行提取,采用ONEHOT编码方式得到事件源文本及响应推文对应的训练标签,例如用数字“0”表示事件对应的源文本和响应推文为非谣言,用数字“1”表示事件对应的源文本和响应推文为谣言,或用数字“1”表示事件对应的源文本和响应推文为非谣言,用数字“0”表示事件对应的源文本和响应推文为谣言。
得到图神经网络预测模型之后,利用爬虫工具爬取互联网中如社交媒体的源文本及其对应的响应推文,并按照事件类型进行划分,可以为每个事件类型进行编码,作为事件ID。然后对事件源文本进行图结构建模得到待检测的第一事件源文本图,并将其输入至得到的图神经网络预测模型,以对互联网中的事件源文本及响应推文进行谣言判别。
例如,若训练第一图神经网络模型时,采用的训练标签为:数字“1”表示为谣言,或数字“0”表示为非谣言,在将待检测的第一事件源文本图输入到图神经网络预测模型时,如果输出结果为“0”,则表示事件的源文本及对应的响应推文为非谣言,若输出结果为“1”,则表示事件的源文本及对应的响应推文为谣言,以此实现对互联网中的事件进行谣言甄别。
本发明提供的基于图神经网络特征聚合的谣言检测方法,使用得到的图神经网络预测模型对互联网的事件源文本及响应推文进行检测,能够保留社交媒体中的信息传播结构,更好地将事件的响应推文特征与事件源推文特征相融合,从文本级粒度和词语级粒度进行谣言判别。
进一步地,在一个实施例中,步骤S1可以具体包括:
S11、对事件源推文预处理,并对预处理后的事件源推文进行图结构建模,以获取第二事件源推文图;
S12、将第二事件源推文图输入至训练好的第二图神经网络模型,以获取事件源推文的文本级特征向量;
S13、根据事件源文本的词向量和文本级特征向量,获取第一事件源文本图;
其中,事件源推文包括事件源文本和响应推文。
进一步地,在一个实施例中,步骤S11可以具体包括:
S111、去除事件源文本中的乱码数据和空行数据;以及
S112、去除事件源的响应推文的冗余项;
其中,冗余项包括转发但未评论的事件源的响应推文、乱码数据和空行数据。
每个事件含有事件源文本及其响应推文(转发并评论推文)的文本信息。对获得的事件源推文预处理,具体包括对事件源文本及其响应推文分别进行预处理,具体地,去除事件源文本中的不规范数据如乱码数据和空行数据,同时去除对应标签数据,再以各事件为基础,将事件源的响应推文中存在的冗余项去除,其中,冗余项具体包括只转发而未评论的响应推文、乱码数据以及空行数据。
对经预处理后的事件源推文的事件源文本和响应推文分别进行图结构建模,得到第二事件源推文图,具体地,为事件源推文构造图G2=(V2,E2),其中V2为节点集,E2为边集。每个节点表示一条推文(包括源文本和响应推文),每条边表示推文节点之间的响应关系(转发和评论),其中,第二事件源推文图包括事件源文本图和响应推文图。然后将第二事件源推文图输入至训练好的第二图神经网络模型,以获取事件源推文的文本级特征向量。
根据事件源文本的词向量以及事件源推文的文本级特征向量,获得第一事件源文本图。
本发明提供的基于图神经网络特征聚合的谣言检测方法,基于图结构的模型能够捕捉到文本中上下词之间的关系,能够将文本和词语两个粒度的特征相结合来判别谣言。
进一步地,在一个实施例中,步骤S13中的事件源文本的词向量通过如下方式获取:
步骤1、去除事件源文本中的乱码数据和空行数据,获取满足预设条件的事件源文本;
步骤2、对满足预设条件的事件源文本分词预处理,并将分词预处理后的满足预设条件的事件源文本输入至训练好的BERT模型,以获取事件源文本的词向量;
其中,分词预处理包括分词处理和去停用词处理。
具体地,首先去除事件源文本中的乱码数据和空行数据,以得到满足预设条件的事件源文本,然后将满足预设条件的事件源文本进行分词以及去停用词处理,具体可以调用结巴包对事件源文本进行分词预处理,其中,预设条件为事件源文本中不包括乱码数据和空行数据。最后将经分词预处理(分词及去停用词处理)后的满足预设条件的事件源文本输入至训练好的BERT模型,以得到的该事件源文本的词向量。
本发明提供的基于图神经网络特征聚合的谣言检测方法,使用预训练模型BERT对分词后的事件源文本进行向量化操作,能够生成体现上下文语境和一词多义现象的词向量,同时为后续构建第一事件源文本图并基于第一事件源文本图对互联网中的事件源推文进行文本级和词语级粒度的谣言甄别奠定了基础。
进一步地,在一个实施例中,步骤S13可以具体包括:
S131、获取文本级特征向量中表示事件源推文的向量;
S132、获取事件源文本的词向量表示的词语;
S133、将词语与预处理后的事件源文本进行对应,确定词语所属事件;
S134、根据词语所属事件,确定词语与事件源推文的向量之间的映射字典;
S135、根据事件源文本的词向量和映射字典,确定事件源推文的聚合特征向量;
S136通过将聚合特征向量作为第一事件源文本图的节点集以及将词语之间的共现关系作为第一事件源文本图的边集,以获取第一事件源文本图。
具体地,提取事件源推文的文本级特征向量里表示事件源推文的向量,提取经预处理后的事件源推文,提取经BERT模型得到的事件源文本的词向量所表示的词语,将事件源文本的词向量所表示的词语与经预处理后的事件源推文进行对应,以确定词语所属事件,以此为依据构造词语-源推文向量映射字典。
将事件源文本的词向量所表示的词语与词语-源推文向量映射字典中的词语相对应,由此进行BERT词级向量与源推文向量的聚合操作,生成事件源推文的聚合特征向量。
通过将聚合特征向量作为第一事件源文本图的节点集以及将词语之间的共现关系作为第一事件源文本图的边集,以获取第一事件源文本图G1=(V1,E1),图节点集V1为上述获得的聚合特征向量,边集E1为词语之间的共现关系。其中,词语之间的共现关系是通过将各种词语之间的共现信息定量化分析之后,揭示的词语的内容关联和特征项所隐含的共现关系。
本发明提供的基于图神经网络特征聚合的谣言检测方法,基于事件源推文的文本级特征向量和事件源文本的词语级向量构造第一事件源文本图,并以此训练得到图神经网络预测模型,使得使用图神经网络预测模型可以实现对事件源文本图及响应推文图进行文本粒度及词语级粒度上的特征构造,最终实现对事件源图文图进行词语粒度上的谣言检测。
进一步地,在一个实施例中,步骤S12中训练好的第二图神经网络模型通过如下方式获取:
步骤A、将第二事件源推文图和训练标签输入至预设第二图神经网络模型进行训练,根据预设第一更新规则和预设第一激活函数对第二事件源推文图中的每个节点进行第一次更新;
步骤B、根据第一次更新后的节点、预设分层传播规则和预设嵌入矩阵向量,确定事件源推文的文本级特征向量;
步骤C、根据文本级特征向量,获取预设第二图神经网络模型的第一交叉熵函数,并在第一交叉熵函数小于第一预设阈值时,停止训练,以获取训练好的第二图神经网络模型。
具体地,如图2所示,将第二事件源推文图和训练标签输入至预设第二图神经网络模型进行训练,其中,预设第二图神经网络模型可以采用两层图卷积神经网络(GCN),在GCN中,每个事件源对应的节点根据其邻居节点(响应推文对应的节点)和自身的聚合信息,根据预设第一更新规则和预设第一激活函数进行节点更新,对于任一节点vi∈V2,采用公式(1)进行节点更新:
其中,为GCN第l层中节点vi的隐藏状态,Ni为包含节点vi的邻居集,σ为第一激活函数,b(l)为偏置项。来自Ni的消息通过函数g进行更新,再通过第一激活函数σ输出每个节点的新表示。线性变换函数W(l)为一个可学习的权重矩阵。
根据第一次更新后的节点、预设分层传播规则和预设嵌入矩阵向量,确定事件源推文的文本级特征向量,其中,预设分层传播规则如公式(2)所示:
其中,H(l)包含第1层所有节点向量,为预设嵌入矩阵,具体为嵌入自循环的归一化邻接矩阵,W(l)为权重矩阵,B(l)为广播偏置项。将N个d维嵌入向量H(0)=X∈RN×d组成矩阵输入到两层GCN中,得到通过H(2)后的文本级特征向量表示。
根据事件源推文的文本级特征向量,基于公式(3)得到GCN的第一交叉熵函数:
其中,γL为带标签的节点索引集合(事件ID),F为输出的维度(2维),Y为标签,Z为softmax函数得到的预测值。softmax函数如下:
当第一交叉熵函数小于第一预设阈值时,停止训练,以得到训练好的第二图神经网络模型。
本发明提供的基于图神经网络特征聚合的谣言检测方法,使用图卷积神经网络生成文本级特征能够保留社交媒体中的信息传播结构,并且能够更好地将事件的响应推文特征与事件源推文特征相融合,能够在整合语义信息(词语级)的同时保留结构信息(文本级)。
进一步地,在一个实施例中,步骤S2可以具体包括:
S21、将第一事件源文本图和训练标签输入至预设第一图神经网络模型进行训练,根据预设第二更新规则和预设第一激活函数对第一事件源文本图中的每个节点进行第二次更新;
S22、根据第二次更新后的节点和预设第二激活函数,获取记忆当前时刻状态,并根据记忆当前时刻状态获取总的当前状态信息;
S23、根据总的当前状态信息和预设多个多层感知器,对第二次更新后的节点进行第三次更新;
S24、根据第三次更新后的节点和预设softmax函数,获取对事件源文本及响应推文的预测标签;
S25、根据预测标签和训练标签,获取预设第一图神经网络模型的第二交叉熵函数,并在第二交叉熵函数小于第二预设阈值时,停止训练,以确定图神经网络预测模型。
具体地,如图3所示,将第一事件源文本图和训练标签输入至预设第一图神经网络模型进行训练,其中,第一图神经网络模型可以具体为带GRU的图神经网络,通过与事件源文本词节点的相邻节点(事件源文本词节点)的表示合并的方式进行词节点交互更新,更新操作按照下式计算:
at=Aht-1Wa (5)
其中,at为节点从其临近节点接收到的信息,A为邻接矩阵,ht-1为上一状态所传递信息,Wa为权重。上一状态信息经过重置后,通过权重和偏置项与当前输入进行聚合更新以形成当前时刻状态:
其中,包含了当前的输入数据,为记忆的当前时刻状态,Wh、Uh和bh为权重和偏置项,at为式(5)中的节点更新表示,rt为复位门,可由公式(7)获得,ht-1为上一状态的信息。Tanh第二激活函数将数据放缩至-1到1的范围内,即记忆当前时刻状态。
rt=σ(Wrat+Urht-1+br) (7)
其中,Wr、Ur和br为权重和偏置项。
根据记忆当前时刻状态获取总的当前状态信息,具体如公式(8)所示:
zt=σ(Wzat+Uzht-1+bz) (9)
其中,Wz、Uz和bz为权重和偏置项,更新门和复位门确定临近节点信息对当前节点嵌入的贡献程度。
根据总的当前状态信息和预设多个多层感知器,对第二次更新后的词节点进一步更新,如公式(10):
hv=σ(f1(ht))⊙tanh (f2(ht)) (10)
其中,f1和f2为两个多层感知器(MLP),f1是软注意权重(sigmoid函数),f2是非线性特征变换(tanh函数)。ht为GRU的输出。对词特征去均值并使用最大池化来聚合图G1的节点,如公式(11)所示:
其中,hG为图级表示,h1至hv为式(10)中更新后产生的节点表示,v是节点集里的节点。
将聚合图表示hG作为softmax函数的输入来进行标签预测,具体实现如公式(12)所示:
根据预测标签和训练标签,基于公式(13)获取预设第一图神经网络模型的第二交叉熵函数,并在第二交叉熵函数小于第二预设阈值时,停止训练,以确定图神经网络预测模型。
本发明提供的基于图神经网络特征聚合的谣言检测方法,基于获得的图神经网络预测模型可以从文本级和词语级多粒度特征聚合的谣言检测。
下面对本发明提供的基于图神经网络特征聚合的谣言检测装置进行描述,下文描述的基于图神经网络特征聚合的谣言检测装置与上文描述的基于图神经网络特征聚合的谣言检测方法可相互对应参照。
图4是本发明提供的基于图神经网络特征聚合的谣言检测装置的结构示意图,如图4所示,图获取模块410、模型确定模块411以及谣言检测模块412;
图获取模块410,用于获取第一事件源文本图;
模型确定模块411,用于将第一事件源文本图和训练标签输入至预设第一图神经网络模型进行训练,以确定图神经网络预测模型;
谣言检测模块412,用于将待检测的第一事件源文本图输入至图神经网络预测模型,以对互联网中的事件源文本及响应推文进行谣言检测;
其中,事件源文本图是通过将事件源文本进行图结构建模得到的;
训练标签是通过采用预设编码方式对所述事件源文本和响应推文进行标注后得到的。
本发明提供的基于图神经网络特征聚合的谣言检测装置,使用得到的图神经网络预测模型对互联网的事件源文本及响应推文进行检测,能够保留社交媒体中的信息传播结构,更好地将事件的响应推文特征与事件源推文特征相融合,从文本级粒度和词语级粒度进行谣言判别。
图5是本发明提供的一种电子设备的实体结构示意图,如图5所示,该电子设备可以包括:处理器(processor)510、通信接口(communication interface)511、存储器(memory)512和总线(bus)513,其中,处理器510,通信接口511,存储器512通过总线513完成相互间的通信。处理器510可以调用存储器512中的逻辑指令,以执行如下方法:
获取第一事件源文本图;
将第一事件源文本图和训练标签输入至预设第一图神经网络模型进行训练,以确定图神经网络预测模型;
将待检测的第一事件源文本图输入至图神经网络预测模型,以对互联网中的事件源文本及响应推文进行谣言检测;
其中,事件源文本图是通过将事件源文本进行图结构建模得到的;
训练标签是通过采用预设编码方式对事件源文本和响应推文进行标注后得到的。
此外,上述的存储器中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
进一步地,本发明公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的基于图神经网络特征聚合的谣言检测方法,例如包括:
获取第一事件源文本图;
将第一事件源文本图和训练标签输入至预设第一图神经网络模型进行训练,以确定图神经网络预测模型;
将待检测的第一事件源文本图输入至图神经网络预测模型,以对互联网中的事件源文本及响应推文进行谣言检测;
其中,事件源文本图是通过将事件源文本进行图结构建模得到的;
训练标签是通过采用预设编码方式对事件源文本和响应推文进行标注后得到的。
另一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的基于图神经网络特征聚合的谣言检测方法,例如包括:
获取第一事件源文本图;
将第一事件源文本图和训练标签输入至预设第一图神经网络模型进行训练,以确定图神经网络预测模型;
将待检测的第一事件源文本图输入至图神经网络预测模型,以对互联网中的事件源文本及响应推文进行谣言检测;
其中,事件源文本图是通过将事件源文本进行图结构建模得到的;
训练标签是通过采用预设编码方式对事件源文本和响应推文进行标注后得到的。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (9)
1.一种基于图神经网络特征聚合的谣言检测方法,其特征在于,包括:
获取第一事件源文本图;
将所述第一事件源文本图和训练标签输入至预设第一图神经网络模型进行训练,以确定图神经网络预测模型;
将待检测的第一事件源文本图输入至所述图神经网络预测模型,以对互联网中的事件源文本及响应推文进行谣言检测;
其中,事件源文本图是通过将所述事件源文本进行图结构建模得到的;
所述训练标签是通过采用预设编码方式对所述事件源文本和所述响应推文进行标注后得到的;
所述获取第一事件源文本图,包括
对事件源推文预处理,并对预处理后的事件源推文进行图结构建模,以获取第二事件源推文图;
将所述第二事件源推文图输入至训练好的第二图神经网络模型,以获取事件源推文的文本级特征向量;
根据事件源文本的词向量和所述文本级特征向量,获取所述第一事件源文本图;
其中,所述事件源推文包括所述事件源文本和所述响应推文。
2.根据权利要求1所述的基于图神经网络特征聚合的谣言检测方法,其特征在于,所述对事件源推文预处理,包括:
去除所述事件源文本中的乱码数据和空行数据;以及
去除所述事件源的响应推文的冗余项;
其中,所述冗余项包括转发但未评论的事件源的响应推文、乱码数据和空行数据。
3.根据权利要求1所述的基于图神经网络特征聚合的谣言检测方法,其特征在于,所述事件源文本的词向量通过如下方式获取:
去除所述事件源文本中的乱码数据和空行数据,获取满足预设条件的事件源文本;
对满足所述预设条件的事件源文本分词预处理,并将分词预处理后的满足所述预设条件的事件源文本输入至训练好的BERT模型,以获取所述事件源文本的词向量;
其中,所述分词预处理包括分词处理和去停用词处理。
4.根据权利要求3所述的基于图神经网络特征聚合的谣言检测方法,其特征在于,所述根据事件源文本的词向量和所述文本级特征向量,获取所述第一事件源文本图,包括:
获取所述文本级特征向量中表示所述事件源推文的向量;
获取所述事件源文本的词向量表示的词语;
将所述词语与预处理后的事件源文本进行对应,确定所述词语所属事件;
根据所述词语所属事件,确定所述词语与所述事件源推文的向量之间的映射字典;
根据所述事件源文本的词向量和所述映射字典,确定所述事件源推文的聚合特征向量;
通过将所述聚合特征向量作为所述第一事件源文本图的节点集以及将所述词语之间的共现关系作为所述第一事件源文本图的边集,以获取所述第一事件源文本图。
5.根据权利要求1所述的基于图神经网络特征聚合的谣言检测方法,其特征在于,所述训练好的第二图神经网络模型通过如下方式获取:
将所述第二事件源推文图和所述训练标签输入至预设第二图神经网络模型进行训练,根据预设第一更新规则和预设第一激活函数对所述第二事件源推文图中的每个节点进行第一次更新;
根据第一次更新后的节点、预设分层传播规则和预设嵌入矩阵向量,确定所述事件源推文的文本级特征向量;
根据所述文本级特征向量,获取所述预设第二图神经网络模型的第一交叉熵函数,并在所述第一交叉熵函数小于第一预设阈值时,停止训练,以获取所述训练好的第二图神经网络模型。
6.根据权利要求5所述的基于图神经网络特征聚合的谣言检测方法,其特征在于,所述将所述第一事件源文本图和训练标签输入至预设第一图神经网络模型进行训练,以确定图神经网络预测模型,包括:
将所述第一事件源文本图和所述训练标签输入至预设第一图神经网络模型进行训练,根据预设第二更新规则和所述预设第一激活函数对所述第一事件源文本图中的每个节点进行第二次更新;
根据第二次更新后的节点和预设第二激活函数,获取记忆当前时刻状态,并根据所述记忆当前时刻状态获取总的当前状态信息;
根据所述总的当前状态信息和预设多个多层感知器,对所述第二次更新后的节点进行第三次更新;
根据第三次更新后的节点和预设softmax函数,获取对所述事件源文本及所述响应推文的预测标签;
根据所述预测标签和所述训练标签,获取所述预设第一图神经网络模型的第二交叉熵函数,并在所述第二交叉熵函数小于第二预设阈值时,停止训练,以确定所述图神经网络预测模型。
7.一种基于图神经网络特征聚合的谣言检测装置,其特征在于,包括:图获取模块、模型确定模块以及谣言检测模块;
所述图获取模块,用于获取第一事件源文本图;
所述模型确定模块,用于将所述第一事件源文本图和训练标签输入至预设第一图神经网络模型进行训练,以确定图神经网络预测模型;
所述谣言检测模块,用于将待检测的第一事件源文本图输入至所述图神经网络预测模型,以对互联网中的事件源文本及响应推文进行谣言检测;
其中,事件源文本图是通过将所述事件源文本进行图结构建模得到的;
所述训练标签是通过采用预设编码方式对所述事件源文本和所述响应推文进行标注后得到的;
所述获取第一事件源文本图,包括
对事件源推文预处理,并对预处理后的事件源推文进行图结构建模,以获取第二事件源推文图;
将所述第二事件源推文图输入至训练好的第二图神经网络模型,以获取事件源推文的文本级特征向量;
根据事件源文本的词向量和所述文本级特征向量,获取所述第一事件源文本图;
其中,所述事件源推文包括所述事件源文本和所述响应推文。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述基于图神经网络特征聚合的谣言检测方法的步骤。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述基于图神经网络特征聚合的谣言检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110402464.5A CN113139052B (zh) | 2021-04-14 | 2021-04-14 | 基于图神经网络特征聚合的谣言检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110402464.5A CN113139052B (zh) | 2021-04-14 | 2021-04-14 | 基于图神经网络特征聚合的谣言检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113139052A CN113139052A (zh) | 2021-07-20 |
CN113139052B true CN113139052B (zh) | 2022-04-19 |
Family
ID=76812523
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110402464.5A Active CN113139052B (zh) | 2021-04-14 | 2021-04-14 | 基于图神经网络特征聚合的谣言检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113139052B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230095352A1 (en) * | 2022-05-16 | 2023-03-30 | Beijing Baidu Netcom Science Technology Co., Ltd. | Translation Method, Apparatus and Storage Medium |
CN116245139B (zh) * | 2023-04-23 | 2023-07-07 | 中国人民解放军国防科技大学 | 图神经网络模型训练方法和装置、事件检测方法和装置 |
CN117633635B (zh) * | 2024-01-23 | 2024-04-16 | 南京信息工程大学 | 一种基于时空传播图的动态谣言检测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111400452A (zh) * | 2020-03-16 | 2020-07-10 | 腾讯科技(深圳)有限公司 | 文本信息分类处理方法、电子设备及计算机可读存储介质 |
CN112199608A (zh) * | 2020-11-03 | 2021-01-08 | 北京中科研究院 | 基于网络信息传播图建模的社交媒体谣言检测方法 |
CN112231562A (zh) * | 2020-10-15 | 2021-01-15 | 北京工商大学 | 一种网络谣言识别方法及系统 |
CN112487143A (zh) * | 2020-11-30 | 2021-03-12 | 重庆邮电大学 | 一种基于舆情大数据分析的多标签文本分类方法 |
KR20210029005A (ko) * | 2019-09-05 | 2021-03-15 | 군산대학교산학협력단 | 딥러닝 기반의 가짜 뉴스를 탐지하는 방법 및 이를 수행하는 장치 |
-
2021
- 2021-04-14 CN CN202110402464.5A patent/CN113139052B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210029005A (ko) * | 2019-09-05 | 2021-03-15 | 군산대학교산학협력단 | 딥러닝 기반의 가짜 뉴스를 탐지하는 방법 및 이를 수행하는 장치 |
CN111400452A (zh) * | 2020-03-16 | 2020-07-10 | 腾讯科技(深圳)有限公司 | 文本信息分类处理方法、电子设备及计算机可读存储介质 |
CN112231562A (zh) * | 2020-10-15 | 2021-01-15 | 北京工商大学 | 一种网络谣言识别方法及系统 |
CN112199608A (zh) * | 2020-11-03 | 2021-01-08 | 北京中科研究院 | 基于网络信息传播图建模的社交媒体谣言检测方法 |
CN112487143A (zh) * | 2020-11-30 | 2021-03-12 | 重庆邮电大学 | 一种基于舆情大数据分析的多标签文本分类方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113139052A (zh) | 2021-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113139052B (zh) | 基于图神经网络特征聚合的谣言检测方法及装置 | |
CN113822494B (zh) | 风险预测方法、装置、设备及存储介质 | |
CN111666502A (zh) | 一种基于深度学习的异常用户识别方法、装置及存储介质 | |
US20230102337A1 (en) | Method and apparatus for training recommendation model, computer device, and storage medium | |
CN105426356B (zh) | 一种目标信息识别方法和装置 | |
CN110032632A (zh) | 基于文本相似度的智能客服问答方法、装置及存储介质 | |
Lubis et al. | The effect of the TF-IDF algorithm in times series in forecasting word on social media | |
CN110825969B (zh) | 数据处理方法、装置、终端和存储介质 | |
Egger | Machine Learning in Tourism: A Brief Overview: Generation of Knowledge from Experience | |
CN111400452A (zh) | 文本信息分类处理方法、电子设备及计算机可读存储介质 | |
CN110597965B (zh) | 文章的情感极性分析方法、装置、电子设备及存储介质 | |
CN113761359B (zh) | 数据包推荐方法、装置、电子设备和存储介质 | |
CN112487794A (zh) | 行业分类方法、装置、终端设备及存储介质 | |
CN111159481B (zh) | 图数据的边预测方法、装置及终端设备 | |
CN113591077A (zh) | 一种网络攻击行为预测方法、装置、电子设备及存储介质 | |
CN114223012A (zh) | 推送对象确定方法、装置、终端设备及存储介质 | |
CN116521899B (zh) | 一种基于改进的图神经网络的文档级关系抽取方法及系统 | |
CN111079084B (zh) | 一种基于长短时记忆网络的信息转发概率预测方法及系统 | |
CN112989182A (zh) | 信息处理方法、装置、信息处理设备及存储介质 | |
CN113409096B (zh) | 目标对象识别方法、装置、计算机设备及存储介质 | |
CN116029760A (zh) | 消息推送方法、装置、计算机设备和存储介质 | |
CN114579876A (zh) | 虚假信息检测方法、装置、设备及介质 | |
CN111027318B (zh) | 基于大数据的行业分类方法、装置、设备及存储介质 | |
CN114004235A (zh) | 基于句向量和多特征融合的情感原因对抽取方法、系统及装置 | |
US11068793B2 (en) | Causality analysis device, method, and non-transitory computer readable storage medium with determination of causal advantages and disadvantages to a user |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
EE01 | Entry into force of recordation of patent licensing contract | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20210720 Assignee: Hubei Zhigan Space Information Technology Co.,Ltd. Assignor: CHINA THREE GORGES University Contract record no.: X2023980051109 Denomination of invention: A Rumor Detection Method and Device Based on Graph Neural Network Feature Aggregation Granted publication date: 20220419 License type: Common License Record date: 20231213 |