CN113722484A - 基于深度学习的谣言检测方法、装置、设备及存储介质 - Google Patents
基于深度学习的谣言检测方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113722484A CN113722484A CN202111010971.0A CN202111010971A CN113722484A CN 113722484 A CN113722484 A CN 113722484A CN 202111010971 A CN202111010971 A CN 202111010971A CN 113722484 A CN113722484 A CN 113722484A
- Authority
- CN
- China
- Prior art keywords
- event
- detected
- events
- graph
- rumor detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 119
- 238000013135 deep learning Methods 0.000 title claims abstract description 41
- 230000007246 mechanism Effects 0.000 claims abstract description 51
- 238000012545 processing Methods 0.000 claims abstract description 46
- 238000013528 artificial neural network Methods 0.000 claims abstract description 43
- 239000013604 expression vector Substances 0.000 claims abstract description 30
- 238000000034 method Methods 0.000 claims abstract description 25
- 230000006403 short-term memory Effects 0.000 claims abstract description 15
- 230000007787 long-term memory Effects 0.000 claims abstract description 14
- 230000015654 memory Effects 0.000 claims description 45
- 238000012549 training Methods 0.000 claims description 37
- 239000013598 vector Substances 0.000 claims description 25
- 238000013527 convolutional neural network Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 16
- 238000007621 cluster analysis Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 5
- 230000000875 corresponding effect Effects 0.000 description 88
- 230000008569 process Effects 0.000 description 10
- 238000013145 classification model Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000002996 emotional effect Effects 0.000 description 4
- 238000012512 characterization method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 101150064138 MAP1 gene Proteins 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000019771 cognition Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 238000004880 explosion Methods 0.000 description 2
- 230000008450 motivation Effects 0.000 description 2
- 230000008448 thought Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 101100400452 Caenorhabditis elegans map-2 gene Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Mathematical Physics (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Probability & Statistics with Applications (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Animal Behavior & Ethology (AREA)
- Molecular Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请适用于人工智能技术领域,提供了基于深度学习的谣言检测方法、装置、设备及存储介质。包括:基于待检测事件构建图数据库;通过图卷积神经网络,提取图数据库对应的第一数据特征;将第一数据特征输入长短期记忆网络中进行处理,得到第二数据特征;通过自注意力机制对第二数据特征进行处理,得到事件特征表示向量;对事件特征表示向量进行判别,得到待检测事件对应的谣言检测结果。上述方案中,构建图数据库降低了事件之间的干扰,减少了图卷积神经网络的计算量,提升谣言检测的速度。通过图卷积神经网络、长短期记忆网络以及自注意力机制使提取到的事件特征表示向量更准确,进而使最终得到的谣言检测结果更准确,提升了谣言检测的准确率。
Description
技术领域
本申请属于人工智能技术领域,尤其涉及基于深度学习的谣言检测方法、谣言检测装置、谣言检测设备及存储介质。
背景技术
随着互联网与自媒体行业的迅速发展,我们已经进入了信息爆炸的时代,人们每天都要接收与发出不计其数的信息,这些信息无时无刻不在影响着人们的生活。然而正如人们在传统的口头交流中那样,互联网所传递的信息并不是完全真实与可信的。在铺天盖地的信息中总会包含一些虚假的、对人的认知、思想与行为产生误导的信息,这便是网络谣言。
不同网络谣言的发布动机或发布意图不同,发布后在社会上产生的影响不同。现有的网络谣言检测方法主要包括人工谣言检测方法和基于图神经网络的谣言检测方法。
无论是人工谣言检测方法,还是基于图神经网络的谣言检测方法,提取的谣言特征都太过浅显、片面,导致谣言检测的准确率低,无法检测出真正的谣言事件。
发明内容
有鉴于此,本申请实施例提供了基于深度学习的谣言检测方法、谣言检测装置、谣言检测设备及存储介质,以解决现有技术中无论是人工谣言检测方法,还是基于图神经网络的谣言检测方法,提取的谣言特征都太过浅显、片面,导致谣言检测的准确率低,无法检测出真正的谣言事件的问题。
本申请实施例的第一方面提供了一种基于深度学习的谣言检测方法,该谣言检测方法包括:
基于待检测事件构建图数据库;
通过图卷积神经网络,提取所述图数据库对应的第一数据特征,所述第一数据特征包括事件特征;
将所述第一数据特征输入长短期记忆网络中进行处理,得到第二数据特征,所述第二数据特征包括时间特征;
通过自注意力机制对所述第二数据特征进行处理,得到事件特征表示向量;
对所述事件特征表示向量进行判别,得到所述待检测事件对应的谣言检测结果。
可选地,所述图数据库中存储有多个事件图谱;当所述待检测事件为多个时,所述基于待检测事件构建图数据库,包括:
对多个所述待检测事件进行聚类分析,得到多个聚类集合,每个所述聚类集合包括同类型的待检测事件各自对应的特征词以及同类型的待检测事件之间的关系信息;
基于每个所述聚类集合,生成与每个所述聚类集合对应的事件图谱;
根据每个所述聚类集合对应的事件图谱,构成所述图数据库。
可选地,所述基于待检测事件构建图数据库,包括:
获取初始图数据库;
确定所述待检测事件对应的特征词和事件类型;
根据所述特征词和所述事件类型,将所述特征词和所述待检测事件添加至所述初始图数据库中,得到所述图数据库。
可选地,所述图卷积神经网络包括图卷积公式,所述通过图卷积神经网络,提取所述图数据库对应的第一数据特征,包括:
利用所述图卷积公式,对所述图数据库中的数据进行卷积处理,得到所述第一数据特征。
可选地,所述谣言检测结果包括所述待检测事件属于谣言事件,或所述待检测事件属于真实事件,所述对所述事件特征表示向量进行判别,得到所述待检测事件对应的谣言检测结果,包括:
将所述事件特征表示向量输入已训练的判别器中进行处理,得到所述谣言检测结果。
可选地,所述基于待检测事件构建图数据库之前,所述谣言检测方法还包括:
获取样本训练集,所述样本训练集包括多个样本事件以及每个所述样本事件对应的标签,所述标签用于表示所述样本事件属于谣言事件或真实事件;
采用深度学习算法,基于所述样本训练集训练所述图卷积神经网络、所述长短期记忆网络、所述自注意力机制以及所述判别器。
可选地,所述采用深度学习算法,基于所述样本训练集训练所述图卷积神经网络、所述长短期记忆网络、所述自注意力机制以及所述判别器,包括:
基于所述多个样本事件构建样本图数据库;
基于所述样本图数据库、初始图卷积神经网络、初始长短期记忆网络、初始自注意力机制以及初始判别器,确定每个所述样本事件对应的谣言检测结果;
基于每个所述样本事件对应的谣言检测结果、每个所述样本事件对应的标签以及预设损失函数,确定损失值;
当检测到所述损失值不满足预设条件时,调整所述初始图卷积神经网络、所述初始长短期记忆网络、所述初始自注意力机制以及所述初始判别器各自对应的参数,并继续训练所述初始图卷积神经网络、所述初始长短期记忆网络、所述初始自注意力机制以及所述初始判别器;
当检测到所述损失值满足所述预设条件时,得到训练好的所述图卷积神经网络、所述长短期记忆网络、所述自注意力机制以及所述判别器。
本申请实施例的第二方面提供了一种基于深度学习的谣言检测装置,包括:
构建单元,用于基于待检测事件构建图数据库;
提取单元,用于通过图卷积神经网络,提取所述图数据库对应的第一数据特征,所述第一数据特征包括事件特征;
第一处理单元,用于将所述第一数据特征输入长短期记忆网络中进行处理,得到第二数据特征,所述第二数据特征包括时间特征;
第二处理单元,用于通过自注意力机制对所述第二数据特征进行处理,得到事件特征表示向量;
判别单元,用于对所述事件特征表示向量进行判别,得到所述待检测事件对应的谣言检测结果。
本申请实施例的第三方面提供了一种基于深度学习的谣言检测设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上述第一方面所述的基于深度学习的谣言检测方法的步骤。
本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的基于深度学习的谣言检测方法的步骤。
本申请实施例的第五方面提供了一种计算机程序产品,当计算机程序产品在谣言检测设备上运行时,使得该设备执行上述第一方面所述的基于深度学习的谣言检测方法的步骤。
本申请实施例提供的基于深度学习的谣言检测方法、谣言检测装置、谣言检测设备及存储介质,具有以下有益效果:
基于待检测事件构建图数据库;通过图卷积神经网络,提取图数据库对应的第一数据特征;将第一数据特征输入长短期记忆网络中进行处理,得到第二数据特征;通过自注意力机制对第二数据特征进行处理,得到事件特征表示向量;对事件特征表示向量进行判别,得到待检测事件对应的谣言检测结果。上述方案中,基于待检测事件构建图数据库,降低了不同类型事件之间的干扰,减少了后续图卷积神经网络的计算量,提升了谣言检测的速度。通过图卷积神经网络、长短期记忆网络不仅提取了事件本身的特征,还提取了事件之间的时间特征,由于考虑到了事件之间的时间特性,再借助自注意力机制使提取到的事件特征表示向量更准确、丰富,进而对该事件特征表示向量进行判别,可使最终得到的谣言检测结果更准确,提升了谣言检测的准确率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一示例性实施例提供的基于深度学习的谣言检测方法的示意性流程图;
图2是本申请一示例性实施例示出的一种基于深度学习的谣言检测方法的步骤S101的具体流程图;
图3是本申请另一示例性实施例示出的一种基于深度学习的谣言检测方法的步骤S101的具体流程图;
图4是本申请又一示例性实施例示出的训练网络的具体流程图;
图5是本申请一实施例提供的一种基于深度学习的谣言检测装置的示意图;
图6是本申请另一实施例提供的谣言检测设备的示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在本申请实施例的描述中,除非另有说明,“/”表示或的意思,例如,A/B可以表示A或B;本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,在本申请实施例的描述中,“多个”是指两个或多于两个。
以下,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
随着互联网与自媒体行业的迅速发展,我们已经进入了信息爆炸的时代,人们每天都要接收与发出不计其数的信息,这些信息无时无刻不在影响着人们的生活。然而正如人们在传统的口头交流中那样,互联网所传递的信息并不是完全真实与可信的。在铺天盖地的信息中总会包含那么一些虚假的、对人的认知、思想与行为产生误导的信息,这便是网络谣言。
不同网络谣言的发布动机或发布意图不同,发布后在社会上产生的影响不同。现有的网络谣言检测方法主要包括人工谣言检测方法、基于深度学习的谣言检测方法和基于图神经网络的谣言检测方法。
其中,人工谣言检测方法提取的谣言特征太过浅显,导致谣言检测的准确率低。传统的基于深度学习的谣言检测方法,虽然可以提取深度的谣言特征,但是需要海量的标注数据进行训练,且需要较长时间等待官方辟谣信息发布后,才实现人工标注数据,影响了模型训练的及时性。基于图神经网络的谣言检测方法,对谣言的检测过于片面,无法准确地检测出真正的谣言。
有鉴于此,本申请实施例提供了一种基于深度学习的谣言检测方法,基于待检测事件构建图数据库;通过图卷积神经网络,提取图数据库对应的第一数据特征;将第一数据特征输入长短期记忆网络中进行处理,得到第二数据特征;通过自注意力机制对第二数据特征进行处理,得到事件特征表示向量;对事件特征表示向量进行判别,得到待检测事件对应的谣言检测结果。上述方案中,基于待检测事件构建图数据库,降低了不同类型事件之间的干扰,减少了后续图卷积神经网络的计算量,提升了谣言检测的速度。通过图卷积神经网络、长短期记忆网络不仅提取了事件本身的特征,还提取了事件之间的时间特征,由于考虑到了事件之间的时间特性,再借助自注意力机制使提取到的事件特征表示向量更准确、丰富,进而对该事件特征表示向量进行判别,可使最终得到的谣言检测结果更准确,提升了谣言检测的准确率。
请参见图1,图1是本申请一示例性实施例提供的基于深度学习的谣言检测方法的示意性流程图。本申请提供的基于深度学习的谣言检测方法的执行主体为谣言检测设备,其中,该设备包括但不限于智能手机、平板电脑、计算机、个人数字助理(Personal DigitalAssistant,PDA)、台式电脑等移动终端,还可以包括各种类型的服务器。例如,服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network, CDN)、以及大数据和人工智能平台等基础云计算服务的云服务。
本申请实施例中以执行主体为计算机终端为例进行说明。
如图1所示的基于深度学习的谣言检测方法可包括:S101~S105,具体如下:
S101:基于待检测事件构建图数据库。
图数据库中的“图”,并不是计算机视觉、图像处理领域的图,而是图论中的图,它由节点和节点间的线组成,通常用来描述某些实体与它们之间的特定关系。
图数据库用于图数据的存储和关联查询,具备实时性。
示例性地,图数据库中存储有多个特征词、多个事件(例如,可以是多个待检测事件,也可以是多个待检测事件和多个其他无需检测的事件)、特征词--特征词(特征词与特征词之间的联系)、特征词--事件(特征词与事件之间的联系)以及事件--事件(事件与事件之间的联系)。
其中,特征词、事件表示实体,也称为节点,“--”表示边。可以通过查询图数据库中的实体以及实体的边,快速地获取与其相联系的另一实体,省去了复杂的各种表格的关联操作,关系查询更加便捷,效率显著提高。
获取待检测事件,根据获取的待检测事件构建图数据库。待检测事件即为需要判断是属于真实事件还是谣言事件的事件。待检测事件可以是微博事件、新闻事件、自媒体发表的文章、网络上发表的文章等,对此不做限定。
当有多个待检测事件时,对多个待检测事件进行聚类分析,得到多个聚类集合,基于每个聚类集合,生成与每个聚类集合对应的事件图谱;根据每个聚类集合对应的事件图谱,构成图数据库。
可选地,在一种可能的实现方式中,当有一个或多个待检测事件时,获取初始图数据库。其中,初始图数据库基于其他无需检测的事件构建而成。当待检测事件只有一件时,确定该待检测事件对应的特征词和事件类型;根据该特征词和该事件类型,将该特征词和该待检测事件添加至初始图数据库中,得到图数据库。
当有多个待检测事件时,确定每个待检测事件对应的特征词和事件类型;根据每个待检测事件对应的特征词和事件类型,将每个待检测事件对应的特征词和每个待检测事件分别添加至初始图数据库中,得到图数据库。此处仅为示例性说明,对此不做限定。
S102:通过图卷积神经网络,提取图数据库对应的第一数据特征,第一数据特征包括事件特征。
图卷积神经网络(Graph Convolutional Network,GCN)顾名思义就是在图(图数据库)上使用卷积运算。可将图卷积神经网络看作一个图数据特征提取器。
第一数据特征可以包括待检测事件对应的事件特征、情感特征等。其中,事件特征用于表征待检测事件中的人物、事务、地点、主题、各事件之间的联系等、传播途径等信息。情感特征用于表征待检测事件的情感倾向。
示例性地,图卷积神经网络可利用图数据库中边的信息(例如实体之间的联系)对节点信息(例如各个实体)进行聚合,并与邻居节点的特征向量加和后求平均,从而生成新的节点表示,即得到第一数据特征。
可选地,图卷积神经网络可包括图卷积公式,利用图卷积公式,对图数据库中的数据进行卷积处理,得到第一数据特征。图卷积公式如下:
S103:将第一数据特征输入长短期记忆网络中进行处理,得到第二数据特征,第二数据特征包括时间特征。
长短期记忆网络(Long Short-Term Memory,LSTM)是一种时间循环神经网络,适合于处理和预测时间序列中间隔和延迟非常长的重要事件。
LSTM网络基于待检测事件传播的时间顺序,捕捉谣言信息随时间顺序传播的规律特征。单个事件可能不足以判断为谣言,但是结合事件传播的时间顺序,在一段时间内突发性爆发大量相似的事件,那么谣言的可能性就更大,LSTM网络能很好的捕捉这种传播特性。因此,通过LSTM网络对第一数据特征进行处理,可以提取到的包含时间特征的第二数据特征。
值得说明的是,第二数据特征包含了时间特征,同时也保留了第一数据特征中包含的待检测事件对应的事件特征、情感特征等特征,只是将时间特征显现出来,并不是仅提取了时间特征。
示例性地,LSTM网络包含输入层、隐含层以及输出层。输入层对输入的第一数据特征进行选择性忘记,通俗理解为“忘记不重要的,记住重要的”,并将结果输入隐含层。隐含层对输入有选择性地进行“记忆”,即对输入进行选择记忆,哪些重要则着重记录下来,哪些不重要,则少记一些。输出层决定哪些将会被当成当前状态的输出,并通过输出层输出,即得到第二数据特征。此处仅为示例性说明,对此不做限定。
S104:通过自注意力机制对第二数据特征进行处理,得到事件特征表示向量。
将LSTM网络的输出作为自注意力机制的输入,通过自注意力机制对第二数据特征进行处理,得到事件特征表示向量。
自注意力机制在训练的过程中,会捕获各个节点之间的影响,给予相关性高得邻居节点较高的权重。因此,在通过自注意力机制对第二数据特征进行处理时,自注意力机制会对倾向于真实事件的待检测事件的第二数据特征赋予较高的权重值(例如赋予大于预设阈值的权重值),进而得到事件特征表示向量。
事件特征表示向量可以包括谣言故事特征表示向量,或真实故事特征表示向量。
本实施方式中,图卷积神经网络对图数据库进行处理时,能够考虑到事件之间的关系信息,让每个节点较好地聚合到邻居节点信息,但是仅仅通过一次图卷积处理,无法较好地利用非邻居节点的信息。例如真实网络中谣言事件与真实事件混杂在一起。自注意力机制可以显式的将影响较大的信息赋予较大的权重值,这样可以极大地丰富节点的表示,通过引入自注意力机制来捕获任意节点之间的影响,并给予相关性高的邻节点较高的权重值,从而让谣言事件与真实事件更好的区分开。
S105:对事件特征表示向量进行判别,得到待检测事件对应的谣言检测结果。
谣言检测结果包括待检测事件属于谣言事件,或待检测事件属于真实事件。
由于自注意力机制对倾向于真实事件的待检测事件的第二数据特征赋予了较高的权重值,进而事件特征表示向量中也包含了该权重值信息。因此,可对事件特征表示向量进行判别,得到待检测事件对应的谣言检测结果。
示例性地,将基于赋予大于预设阈值的权重值得到的事件特征表示向量对应的待检测事件,判别为真实事件。将基于赋予小于或等于预设阈值的权重值得到的事件特征表示向量对应的待检测事件,判别为谣言事件。此处仅为示例性说明,对此不做限定。
可选地,在本申请一些可能的实现方式中,将事件特征表示向量输入已训练的判别器中进行处理,得到谣言检测结果。
示例性地,判别器用于区分事件特征表示向量是真实事件对应的事件特征表示向量,还是谣言事件对应的事件特征表示向量。判别器包括全连接层,通过全连接层可对事件特征表示向量进行分类,输出事件特征表示向量对应的标签。例如,标签0表示真实事件,标签1 表示谣言事件。
例如,将事件特征表示向量输入已训练的判别器中进行处理,输出标签0,则表示该事件特征表示向量对应的待检测事件属于真实事件。若输出标签1,则表示该事件特征表示向量对应的待检测事件属于谣言事件。此处仅为示例性说明,对此不做限定。
上述方案中,基于待检测事件构建图数据库,降低了不同类型事件之间的干扰,减少了后续图卷积神经网络的计算量,提升了谣言检测的速度。通过图卷积神经网络、长短期记忆网络不仅提取了事件本身的特征,还提取了事件之间的时间特征,由于考虑到了事件之间的时间特性,再借助自注意力机制使提取到的事件特征表示向量更准确、丰富,进而对该事件特征表示向量进行判别,可使最终得到的谣言检测结果更准确,提升了谣言检测的准确率。
请参见图2,图2是本申请一示例性实施例示出的一种基于深度学习的谣言检测方法的步骤S101的具体流程图;可选地,在本申请一些可能的实现方式中,图数据库中存储有多个事件图谱,当待检测事件为多个时,上述S101可包括S1011~S1013,具体如下:
S1011:对多个待检测事件进行聚类分析,得到多个聚类集合,每个聚类集合包括同类型的待检测事件各自对应的特征词以及同类型的待检测事件之间的关系信息。
示例性地,图数据库中存储有多个事件图谱,当待检测事件为多个时,对多个待检测事件进行聚类分析,得到多个聚类集合。
事件图谱中存储有多个同类型的待检测事件各自对应的特征词、以及同类型的待检测事件之间的关系信息。其中,特征词、事件表示实体,也称为节点,同类型的待检测事件之间的关系信息称为边。
示例性地,获取若干个待检测事件,按照预设时间段对若干个待检测事件进行聚类分析,得到多个聚类集合。例如,获取若干个新闻事件,按照预设时间段对若干个新闻事件按照主题进行分类,将若干个新闻事件归类为N(N为大于或等于1的整数)个集合。
可以理解为,对若干个新闻事件进行分类,根据每个新闻事件对应的主题,将若干个新闻事件划分为N个集合。每个集合中包括一个或多个属于同一主题的案件。
例如,与娱乐明星相关的新闻事件构成一个集合,与科学研究相关的新闻事件构成一个集合等。其中,聚类算法可以包括K均值聚类算法(kmeans)、基于密度的聚类算法(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)等,对其不做限定。
本实施方式中,通过分时、分层(例如不同主题)聚类减少了不同事件之间跨主题、跨时间段的干扰,同时也大幅减轻了后续图神经网络处理的复杂度,进而提升了谣言检测的速度和准确性。
S1012:基于每个聚类集合,生成与每个聚类集合对应的事件图谱。
每个聚类集合包括同类型的待检测事件各自对应的特征词以及同类型的待检测事件之间的关系信息。每个聚类集合还可包括与该聚类集合对应的主题高度相关的核心事件。
根据每个聚类集合,可构建一个与其对应的事件图谱。
例如,对若干个新闻事件进行聚类分析,得到两个聚类集合,分别为聚类集合1和聚类集合2。针对聚类集合1构建事件图谱1,针对聚类集合2构建事件图谱2。
示例性地,用公式G=(V,E)表示事件图谱。在一种实现方式中,事件图谱中有大小不一的多个椭圆,以及连接各个椭圆的线。用小的椭圆表示特征词节点v,用大的椭圆表示事件节点V。其中,v∈V。
例如,新闻事件对应的文本中的名词、动词、形容词以及量词等可作为事件特征词。各个事件节点间是一种局部性的全连接关系,而特征词节点间的关系,以及特征词节点和事件节点之间的关系是一种词共现关系。
连接各个椭圆的线称为事件图谱的边,用于表示着两个节点之间的关联关系,每条边e=(v,V)∈E。
示例性地,以事件图谱1为例进行说明。事件图谱1中包括三种类型的边:表示特征词--特征词(特征词与特征词之间的联系)的边、表示特征词--事件(特征词与事件之间的联系)的边以及表示事件--事件(事件与事件之间的联系)的边。
三种类型的边的权重采用不同的方法计算。例如,特征词--特征词间的权重关系采用点互信息计算。点互信息(Pointwise Mutual Information,PMI)这个指标来衡量两个事物之间的相关性。可通过下述公式计算两个特征词之间的相关性,公式具体如下:
上述(2)式中,PMI(x;y)表示两个特征词之间的相关性,p(x)、 p(y)分别表示不同的特征词。
特征词--事件间的权重关系可采用用于信息检索与数据挖掘的常用加权(TermFrequency–Inverse Document Frequency,TF-IDF) 算法计算。
示例性地,TF表示词频,即一个词在事件文本中出现的次数; IDF表示逆文档频率,用于在词频的基础上给每个词分配一个重要性权重,它的大小与一个词的常见程度成反比。将词频与逆文档频率的值相乘,得到一个词的TF-IDF值,该词的TF-IDF值表示该词对事件文本的重要性,TF-IDF值越大表示该词对事件文本越重要。将TF-IDF 值排在最前面的一个或多个词作为事件文本的特征词。
“词频(TF)=某个词在事件文本的出现次数/事件文本的总词数”或“词频(TF)=某个词在事件文本中的出现次数/该事件文本出现次数最多的词的出现次数”。
通过“逆文档频率(IDF)=log(事件文本总数/包含该词的文本数+1)”计算逆文档频率(IDF);其中,分母加1是为了避免所有文本都不包含该词导致分母为0的情况出现,log表示对得到的值取对数;若一个词越常见,则分母越大,逆文档频率就越小越接近0。通过“TF-IDF=词频(TF)*逆文档频率(IDF)”计算该词的TF-IDF值,即该词对事件文本的重要性。计算得到每个词对应的TF-IDF值后,对TF-IDF值进行降序排列,取排在最前面的一个或多个词作为该事件文本的特征词。
事件--事件间的权重关系可采用事件相关性算法计算。例如,通过下述公式计算,具体如下:
两个事件的时间间隔越久,相关度也会指数性衰减。意味着时间间隔越久,事件失真的可能性越大。p为-1时,代表两个事件的内容完全负相关。
可选地,事件内容的相关性可以利用已标注的谣言事件与真实事件(从每个聚类集合中抽取一部分)训练事件分类模型。
其中,事件分类模型可以结合自编码语言模型(Bidirectional EncoderRepresentations from Transformers,BERT)进行微调。即以现有的BERT模型为基础,以已标注的谣言事件与真实事件为训练数据对现有的BERT模型进行训练,得到训练好的事件分类模型。通过该事件分类模型可计算不同事件的隐含的表示向量。通过计算向量之间的余弦相似度即可判断两个事件的相关性。
该事件分类模型不仅仅可以计算每个聚类集合内部事件之间的相关性,还可以计算不同聚类集合的事件之间的相关性。
S1013:根据每个聚类集合对应的事件图谱,构成图数据库。
每个聚类集合还可包括与该聚类集合对应的主题高度相关的核心事件。该核心事件用于将该核心事件所属的事件图谱与其他事件图谱关联起来,进而构成图数据库。
示例性地,利用距离算法提取出同一个聚类集合中的核心事件。例如,计算同一个聚类集合中每个事件与该聚类集合对应的主题的距离,距离越短则相关度最高,选取距离最短的节点所对应的事件作为核心事件。然后通过核心事件将不同的事件图谱联系在一起,构成图数据库。此处仅为示例性说明,对此不做限定。
上述实施方式中,根据待检测事件直接构建图数据库,这种批处理的方式,可提升谣言检测的速率。
请参见图3,图3是本申请另一示例性实施例示出的一种基于深度学习的谣言检测方法的步骤S101的具体流程图;上述S101可包括 S1014~S1016,值得说明的是,S1014~S1016与上述S1011~S1013并列,并非在S1011~S1013之后执行S1014~S1016,可根据实际情况选择执行S1011~S1013或S1014~S1016,对此不做限定。S1014~S1016,具体如下:
S1014:获取初始图数据库。
当有一个或多个待检测事件时,获取初始图数据库。其中,初始图数据库基于其他无需检测的事件构建而成。或者,初始图数据库也可以基于若干个发生在待检测事件之前的事件构建而成。构建初始图数据库的方式与构建图数据库的方式相同,只是采用的数据不同,可参考上述S101中的描述,此处不再赘述。
S1015:确定待检测事件对应的特征词和事件类型。
示例性地,提取待检测事件的特征词,对待检测事件进行分类,确定待检测事件对应的事件类型,即确定待检测事件对应的主题。例如,可采用TF-IDF算法计算待检测事件的特征词。具体可参考上述 S1012中的描述,此处不再赘述。值得说明的是,对待检测事件进行分类的方式不做限定。例如,可采用现有技术中的分类模型对其进行分类,得到待检测事件对应的事件类型。
S1016:根据特征词和所述事件类型,将特征词和待检测事件添加至初始图数据库中,得到图数据库。
示例性地,初始图数据库包括若干个事件图谱。每个事件图谱对应一种主题类型,选取与待检测事件对应的事件类型所匹配的事件图谱,将该待检测事件以及该待检测事件对应的特征词存储至与其最相关的事件图谱中,得到图数据库。
可选地,在一种可能的实现方式中,可通过事件相关性算法计算待检测事件与初始图数据库中各个事件的相关性,将该待检测事件以及该待检测事件对应的特征词存储至与其最相关的事件图谱中,得到图数据库。此处仅为示例性说明,对此不做限定。
值得说明的是,当有一个待检测事件时,对其进行上述处理,得到图数据库。当有多个待检测事件时,对每个待检测事件都进行上述处理,直至多个待检测事件都处理完成,得到图数据库。
本实施方式中,在初始图数据库的基础上添加待检测事件,构建图数据库,这种增量处理的方式,可实时对事件的真实性进行检测,且提升了谣言检测的准确性。
请参见图4,图4是本申请又一示例性实施例示出的训练网络的具体流程图;可选地,在本申请一些可能的实现方式中,在执行如图 1所示的基于深度学习的谣言检测方法之前,还可包括训练图卷积神经网络、长短期记忆网络、自注意力机制以及判别器的方法,包括:S201~S202,具体如下:
S201:获取样本训练集,样本训练集包括多个样本事件以及每个样本事件对应的标签,标签用于表示样本事件属于谣言事件或真实事件。
示例性的,样本训练集可以来自网络中公开的数据,也可以通过多个用户自行标注多个事件得到。例如,在网络中采集多个样本事件,每个样本事件对应的标签。或者,采集到多个样本事件后,用户自行为每个样本事件标注标签。即标注该样本事件属于谣言事件或真实事件。例如,标签0表示真实事件,标签1表示谣言事件。
可选地,还可将样本训练集中的一部分数据作为样本测试集,便于后续对训练中的各个网络进行测试。例如,在样本训练集中选取若干个样本事件,以及这些样本事件各自对应的标签作为样本测试集。
S202:采用深度学习算法,基于样本训练集训练图卷积神经网络、长短期记忆网络、自注意力机制以及判别器。
示例性地,基于多个样本事件构建样本图数据库;通过初始图卷积神经网络,提取样本图数据库对应的第一样本数据特征;将第一样本数据特征输入初始长短期记忆网络中进行处理,得到第二样本数据特征;通过初始自注意力机制对第二样本数据特征进行处理,得到样本事件特征表示向量;对事件特征样本表示向量进行判别,得到每个样本事件对应的谣言检测结果;基于每个样本事件对应的谣言检测结果、每个样本事件对应的标签以及预设损失函数,确定损失值。其中,预设损失函数可以为交叉熵损失函数。
当损失值不满足预设条件时,调整初始图卷积神经网络、初始长短期记忆网络、初始自注意力机制以及初始判别器各自对应的参数,并继续训练初始图卷积神经网络、初始长短期记忆网络、初始自注意力机制以及初始判别器;当损失值满足预设条件时,得到训练好的图卷积神经网络、长短期记忆网络、自注意力机制以及判别器。
可选地,在本申请一些可能的实现方式中,上述S202可包括 S2021~S2025,具体如下:
S2021:基于多个样本事件构建样本图数据库。
构建样本图数据库的方式与构建图数据库的方式相同,只是采用的数据不同,可参考上述S101中的描述,此处不再赘述。
S2022:基于样本图数据库、初始图卷积神经网络、初始长短期记忆网络、初始自注意力机制以及初始判别器,确定每个样本事件对应的谣言检测结果。
可参考图1对应的实施例中S102~S105中的描述,此处不再赘述。
S2023:基于每个样本事件对应的谣言检测结果、每个样本事件对应的标签以及预设损失函数,确定损失值。
示例性地,通过预设损失函数计算样本事件对应的谣言检测结果,与该样本事件对应的标签之间的损失值。预设损失函数也可为均方差公式。
判断损失值是否满足预设条件。当损失值不满足预设条件时,执行S2024;当损失值满足预设条件时,执行S2025。预设条件可以是损失值小于或等于预设的损失值阈值,也可以是损失值属于预设的误差范围,但并不限于此,还可以根据实际情况进行设置,此处不做限制。
S2024:当检测到损失值不满足预设条件时,调整初始图卷积神经网络、初始长短期记忆网络、初始自注意力机制以及初始判别器各自对应的参数,并继续训练初始图卷积神经网络、初始长短期记忆网络、初始自注意力机制以及初始判别器。
例如,假设预设条件为损失值小于或等于预设的损失值阈值。那么,当执行训练过程的终端在确认当前的损失值大于预设的损失值阈值时,判定当前的各个网络还未训练好。
此时,调整初始图卷积神经网络、初始长短期记忆网络、初始自注意力机制以及初始判别器各自对应的参数,之后返回S2022,继续执行S2022和S2023,直到在S2023中确定的损失值小于或等于预设的损失值阈值时,执行S2025。
S2025:当检测到损失值满足预设条件时,得到训练好的图卷积神经网络、长短期记忆网络、自注意力机制以及判别器。
例如,假设预设条件为损失值小于或等于预设的损失值阈值。那么,当执行训练过程的终端在确认当前的损失值小于或者等于预设的损失值阈值时,判定当前的各个网络已训练好,停止训练各个网络。固定初始图卷积神经网络、初始长短期记忆网络、初始自注意力机制以及初始判别器各自对应的参数,得到训练好的图卷积神经网络、长短期记忆网络、自注意力机制以及判别器。
上述实施方式中,训练的图卷积神经网络、长短期记忆网络能对不同类型的事件的故事线进行有效检测,最后通过训练的判别判别器进行迭代优化,整体提升了谣言检测准确性。
可选地,在本申请一些可能的实现方式中,本申请提供的基于深度学习的谣言检测方法,可应用在医疗领域,例如利用基于深度学习的谣言检测方法对与医疗相关事件进行检测,判断这些事件是否属于谣言事件等。
请参见图5,图5是本申请一实施例提供的一种基于深度学习的谣言检测装置的示意图。该谣言检测装置包括的各单元用于执行图 1~图4对应的实施例中的各步骤。具体请参阅图1~图4各自对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图5,包括:
构建单元310,用于基于待检测事件构建图数据库;
提取单元320,用于通过图卷积神经网络,提取所述图数据库对应的第一数据特征,所述第一数据特征包括事件特征;
第一处理单元330,用于将所述第一数据特征输入长短期记忆网络中进行处理,得到第二数据特征,所述第二数据特征包括时间特征;
第二处理单元340,用于通过自注意力机制对所述第二数据特征进行处理,得到事件特征表示向量;
判别单元350,用于对所述事件特征表示向量进行判别,得到所述待检测事件对应的谣言检测结果。
可选地,所述图数据库中存储有多个事件图谱,所述构建单元 310包括:
分析单元,用于当所述待检测事件为多个时,对多个所述待检测事件进行聚类分析,得到多个聚类集合,每个所述聚类集合包括同类型的待检测事件各自对应的特征词以及同类型的待检测事件之间的关系信息;
生成单元,用于基于每个所述聚类集合,生成与每个所述聚类集合对应的事件图谱;
构成单元,用于根据每个所述聚类集合对应的事件图谱,构成所述图数据库。
可选地,所述构建单元310还包括:
获取单元,用于获取初始图数据库;
确定单元,用于确定所述待检测事件对应的特征词和事件类型;
添加单元,用于根据所述特征词和所述事件类型,将所述特征词和所述待检测事件添加至所述初始图数据库中,得到所述图数据库。
可选地,所述图卷积神经网络包括图卷积公式,所述提取单元 320具体用于:
利用所述图卷积公式,对所述图数据库中的数据进行卷积处理,得到所述第一数据特征。
可选地,所述谣言检测结果包括所述待检测事件属于谣言事件,或所述待检测事件属于真实事件,所述判别单元350具体用于:
将所述事件特征表示向量输入已训练的判别器中进行处理,得到所述谣言检测结果。
可选地,所述谣言检测装置还包括:
训练集获取单元,用于获取样本训练集,所述样本训练集包括多个样本事件以及每个所述样本事件对应的标签,所述标签用于表示所述样本事件属于谣言事件或真实事件;
训练单元,用于采用深度学习算法,基于所述样本训练集训练所述图卷积神经网络、所述长短期记忆网络、所述自注意力机制以及所述判别器。
可选地,所述训练单元具体用于:
基于所述多个样本事件构建样本图数据库;
基于所述样本图数据库、初始图卷积神经网络、初始长短期记忆网络、初始自注意力机制以及初始判别器,确定每个所述样本事件对应的谣言检测结果;
基于每个所述样本事件对应的谣言检测结果、每个所述样本事件对应的标签以及预设损失函数,确定损失值;
当检测到所述损失值不满足预设条件时,调整所述初始图卷积神经网络、所述初始长短期记忆网络、所述初始自注意力机制以及所述初始判别器各自对应的参数,并继续训练所述初始图卷积神经网络、所述初始长短期记忆网络、所述初始自注意力机制以及所述初始判别器;
当检测到所述损失值满足所述预设条件时,得到训练好的所述图卷积神经网络、所述长短期记忆网络、所述自注意力机制以及所述判别器。
请参见图6,图6是本申请另一实施例提供的谣言检测设备的示意图。如图6所示,该实施例的谣言检测设备4包括:处理器40、存储器41以及存储在所述存储器41中并可在所述处理器40上运行的计算机程序42。所述处理器40执行所述计算机程序42时实现上述各个基于深度学习的谣言检测方法实施例中的步骤,例如图1所示的S101至S1045。或者,所述处理器40执行所述计算机程序42时实现上述各实施例中各单元的功能,例如图5所示单元310至350功能。
示例性地,所述计算机程序42可以被分割成一个或多个单元,所述一个或者多个单元被存储在所述存储器41中,并由所述处理器 40执行,以完成本申请。所述一个或多个单元可以是能够完成特定功能的一系列计算机指令段,该指令段用于描述所述计算机程序42 在所述设备4中的执行过程。例如,所述计算机程序42可以被分割为构建单元、提取单元、第一处理单元、第二处理单元以及判别单元,各单元具体功能如上所述。
所述设备可包括,但不仅限于,处理器40、存储器41。本领域技术人员可以理解,图6仅仅是设备4的示例,并不构成对设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器40可以是中央处理单元(Central Processing Unit, CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array, FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器41可以是所述设备的内部存储单元,例如设备的硬盘或内存。所述存储器41也可以是所述设备的外部存储终端,例如所述设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器41还可以既包括所述设备的内部存储单元也包括外部存储终端。所述存储器41用于存储所述计算机指令以及所述终端所需的其他程序和数据。所述存储器41还可以用于暂时地存储已经输出或者将要输出的数据。
本申请实施例还提供了一种计算机存储介质,计算机存储介质可以是非易失性,也可以是易失性,该计算机存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述各个基于深度学习的谣言检测方法实施例中的步骤。
本申请还提供了一种计算机程序产品,当计算机程序产品在设备上运行时,使得该设备执行上述各个基于深度学习的谣言检测方法实施例中的步骤。
本申请实施例还提供了一种芯片或者集成电路,该芯片或者集成电路包括:处理器,用于从存储器中调用并运行计算机程序,使得安装有该芯片或者集成电路的设备执行上述各个基于深度学习的谣言检测方法实施例中的步骤。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种基于深度学习的谣言检测方法,其特征在于,包括:
基于待检测事件构建图数据库;
通过图卷积神经网络,提取所述图数据库对应的第一数据特征,所述第一数据特征包括事件特征;
将所述第一数据特征输入长短期记忆网络中进行处理,得到第二数据特征,所述第二数据特征包括时间特征;
通过自注意力机制对所述第二数据特征进行处理,得到事件特征表示向量;
对所述事件特征表示向量进行判别,得到所述待检测事件对应的谣言检测结果。
2.如权利要求1所述的谣言检测方法,其特征在于,所述图数据库中存储有多个事件图谱;当所述待检测事件为多个时,所述基于待检测事件构建图数据库,包括:
对多个所述待检测事件进行聚类分析,得到多个聚类集合,每个所述聚类集合包括同类型的待检测事件各自对应的特征词以及同类型的待检测事件之间的关系信息;
基于每个所述聚类集合,生成与每个所述聚类集合对应的事件图谱;
根据每个所述聚类集合对应的事件图谱,构成所述图数据库。
3.如权利要求1所述的谣言检测方法,其特征在于,所述基于待检测事件构建图数据库,包括:
获取初始图数据库;
确定所述待检测事件对应的特征词和事件类型;
根据所述特征词和所述事件类型,将所述特征词和所述待检测事件添加至所述初始图数据库中,得到所述图数据库。
4.如权利要求1所述的谣言检测方法,其特征在于,所述图卷积神经网络包括图卷积公式,所述通过图卷积神经网络,提取所述图数据库对应的第一数据特征,包括:
利用所述图卷积公式,对所述图数据库中的数据进行卷积处理,得到所述第一数据特征。
5.如权利要求1所述的谣言检测方法,其特征在于,所述谣言检测结果包括所述待检测事件属于谣言事件,或所述待检测事件属于真实事件,所述对所述事件特征表示向量进行判别,得到所述待检测事件对应的谣言检测结果,包括:
将所述事件特征表示向量输入已训练的判别器中进行处理,得到所述谣言检测结果。
6.如权利要求5所述的谣言检测方法,其特征在于,所述基于待检测事件构建图数据库之前,所述谣言检测方法还包括:
获取样本训练集,所述样本训练集包括多个样本事件以及每个所述样本事件对应的标签,所述标签用于表示所述样本事件属于谣言事件或真实事件;
采用深度学习算法,基于所述样本训练集训练所述图卷积神经网络、所述长短期记忆网络、所述自注意力机制以及所述判别器。
7.如权利要求6所述的谣言检测方法,其特征在于,所述采用深度学习算法,基于所述样本训练集训练所述图卷积神经网络、所述长短期记忆网络、所述自注意力机制以及所述判别器,包括:
基于所述多个样本事件构建样本图数据库;
基于所述样本图数据库、初始图卷积神经网络、初始长短期记忆网络、初始自注意力机制以及初始判别器,确定每个所述样本事件对应的谣言检测结果;
基于每个所述样本事件对应的谣言检测结果、每个所述样本事件对应的标签以及预设损失函数,确定损失值;
当检测到所述损失值不满足预设条件时,调整所述初始图卷积神经网络、所述初始长短期记忆网络、所述初始自注意力机制以及所述初始判别器各自对应的参数,并继续训练所述初始图卷积神经网络、所述初始长短期记忆网络、所述初始自注意力机制以及所述初始判别器;
当检测到所述损失值满足所述预设条件时,得到训练好的所述图卷积神经网络、所述长短期记忆网络、所述自注意力机制以及所述判别器。
8.一种基于深度学习的谣言检测装置,其特征在于,包括:
构建单元,用于基于待检测事件构建图数据库;
提取单元,用于通过图卷积神经网络,提取所述图数据库对应的第一数据特征,所述第一数据特征包括事件特征;
第一处理单元,用于将所述第一数据特征输入长短期记忆网络中进行处理,得到第二数据特征,所述第二数据特征包括时间特征;
第二处理单元,用于通过自注意力机制对所述第二数据特征进行处理,得到事件特征表示向量;
判别单元,用于对所述事件特征表示向量进行判别,得到所述待检测事件对应的谣言检测结果。
9.一种基于深度学习的谣言检测设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111010971.0A CN113722484A (zh) | 2021-08-31 | 2021-08-31 | 基于深度学习的谣言检测方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111010971.0A CN113722484A (zh) | 2021-08-31 | 2021-08-31 | 基于深度学习的谣言检测方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113722484A true CN113722484A (zh) | 2021-11-30 |
Family
ID=78679678
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111010971.0A Pending CN113722484A (zh) | 2021-08-31 | 2021-08-31 | 基于深度学习的谣言检测方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113722484A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114781553A (zh) * | 2022-06-20 | 2022-07-22 | 浙江大学滨江研究院 | 一种基于并行多图卷积神经网络的无监督专利聚类方法 |
-
2021
- 2021-08-31 CN CN202111010971.0A patent/CN113722484A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114781553A (zh) * | 2022-06-20 | 2022-07-22 | 浙江大学滨江研究院 | 一种基于并行多图卷积神经网络的无监督专利聚类方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ahmad et al. | Fake news detection using machine learning ensemble methods | |
Boididou et al. | Verifying information with multimedia content on twitter: a comparative study of automated approaches | |
Li et al. | Mining opinion summarizations using convolutional neural networks in Chinese microblogging systems | |
WO2023029506A1 (zh) | 病情分析方法、装置、电子设备及存储介质 | |
CN111797214A (zh) | 基于faq数据库的问题筛选方法、装置、计算机设备及介质 | |
CN108647322B (zh) | 基于词网识别大量Web文本信息相似度的方法 | |
CN107844533A (zh) | 一种智能问答系统及分析方法 | |
Lim et al. | Clustop: A clustering-based topic modelling algorithm for twitter using word networks | |
CN109471944A (zh) | 文本分类模型的训练方法、装置及可读存储介质 | |
Hossny et al. | Feature selection methods for event detection in Twitter: a text mining approach | |
Sleeman et al. | Entity type recognition for heterogeneous semantic graphs | |
Budhiraja et al. | A supervised learning approach for heading detection | |
CN114416998A (zh) | 文本标签的识别方法、装置、电子设备及存储介质 | |
Lazaridou et al. | Discovering biased news articles leveraging multiple human annotations | |
Chernyaev et al. | A rumor detection in Russian tweets | |
Wang et al. | A meta-learning based stress category detection framework on social media | |
Xu et al. | Topic-sentiment evolution over time: A manifold learning-based model for online news | |
US20220058464A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
CN113722484A (zh) | 基于深度学习的谣言检测方法、装置、设备及存储介质 | |
Subramani et al. | Text mining and real-time analytics of twitter data: A case study of australian hay fever prediction | |
CN112434126B (zh) | 一种信息处理方法、装置、设备和存储介质 | |
Mohemad et al. | Performance analysis in text clustering using k-means and k-medoids algorithms for Malay crime documents | |
CN116737947A (zh) | 实体关系图构建方法、装置、设备及存储介质 | |
CN115878761A (zh) | 事件脉络生成方法、设备及介质 | |
Wang | Textual information classification of campus network public opinion based on BILSTM and ARIMA |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220916 Address after: Room 2601 (Unit 07), Qianhai Free Trade Building, No. 3048, Xinghai Avenue, Nanshan Street, Qianhai Shenzhen-Hong Kong Cooperation Zone, Shenzhen, Guangdong 518000 Applicant after: Shenzhen Ping An Smart Healthcare Technology Co.,Ltd. Address before: 1-34 / F, Qianhai free trade building, 3048 Xinghai Avenue, Mawan, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong 518000 Applicant before: Ping An International Smart City Technology Co.,Ltd. |
|
TA01 | Transfer of patent application right |