CN113742604B - 一种谣言检测方法、装置、电子设备和存储介质 - Google Patents
一种谣言检测方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN113742604B CN113742604B CN202110972848.0A CN202110972848A CN113742604B CN 113742604 B CN113742604 B CN 113742604B CN 202110972848 A CN202110972848 A CN 202110972848A CN 113742604 B CN113742604 B CN 113742604B
- Authority
- CN
- China
- Prior art keywords
- event
- rumor
- detected
- relation
- feature vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 148
- 238000000034 method Methods 0.000 claims abstract description 18
- 239000013598 vector Substances 0.000 claims description 163
- 239000011159 matrix material Substances 0.000 claims description 97
- 238000011176 pooling Methods 0.000 claims description 46
- 238000012545 processing Methods 0.000 claims description 39
- 238000010586 diagram Methods 0.000 claims description 14
- 238000003062 neural network model Methods 0.000 claims description 14
- 238000010276 construction Methods 0.000 claims description 12
- 238000013527 convolutional neural network Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 8
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 abstract description 7
- 238000004458 analytical method Methods 0.000 abstract description 2
- 230000007547 defect Effects 0.000 abstract description 2
- 230000004927 fusion Effects 0.000 abstract 1
- 230000006870 function Effects 0.000 description 13
- 238000004891 communication Methods 0.000 description 6
- 238000010606 normalization Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 3
- 230000007480 spreading Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种谣言检测方法、装置、电子设备和存储介质,包括:获取待检测事件;将所述待检测事件输入至谣言检测模型中,得到所述谣言检测模型输出的谣言检测结果;其中,所述谣言检测模型是基于谣言事件、所述谣言事件的传播特征以及谣言事件间的关系特征训练得到的。该方法用以解决现有技术中在谣言的检测方面,对谣言的分析角度不够全面的缺陷,实现将事件的传播特征与事件间关系融合用于谣言的检测,有效提高了谣言检测的准确性。
Description
技术领域
本发明涉及网络谣言检测技术领域,尤其涉及一种谣言检测方法、装置、电子设备和存储介质。
背景技术
近年来,随着微博、推特等社交媒体的深度普及,用户可以自由的发布信息,用户之间能够直接建立联系和交流,加速了信息的流动和传播,同时也使得谣言事件的产生和传播更加的容易和迅速。
谣言指捏造的没有相应事实依据的,并通过社交媒体网络传播的可能造成严重后果的言论。谣言检测技术通过对现有计算机相关知识和技能的运用,能够检测出在网络社交平台上的哪些信息是谣言。
然而,现有技术仍存在一些不完善的地方,例如:现有的关注谣言传播过程的研究只倾向于研究谣言的传播结构特征,忽略了谣言传播的时间特征和不同转发帖子的重要程度;现有的谣言检测研究倾向于只从单一传播结构角度或只从单一的文本角度来进行谣言检测,忽略了事件参与用户在谣言传播中的作用,即忽略了事件之间的联系。
发明内容
本发明提供一种谣言检测方法、装置、电子设备和存储介质,用以解决现有技术中在谣言的检测方面,对谣言的分析角度不够全面的缺陷,实现将事件的传播特征与事件间关系融合用于谣言的检测,有效提高了谣言检测的准确性。
本发明提供一种谣言检测方法,包括:
获取待检测事件;
将所述待检测事件输入至谣言检测模型中,得到所述谣言检测模型输出的谣言检测结果;
其中,所述谣言检测模型是基于谣言事件、所述谣言事件的传播特征以及谣言事件间的关系特征训练得到的。
根据本发明提供的一种谣言检测方法,将待检测事件输入至谣言检测模型中,得到所述谣言检测模型输出的谣言检测结果,包括:
将所述待检测事件分别输入至所述谣言检测模型中的特征处理层和关系处理层;由所述特征处理层输出由所述待检测事件中提取的事件文本特征向量和事件传播特征向量融合得到的事件的混合特征向量构建的混合特征向量的向量矩阵;由所述关系处理层输出根据所述待检测事件与其他谣言事件间的联系关系构建的表示事件间联系紧密程度的第一邻接矩阵;
将所述混合特征向量的向量矩阵和第一邻接矩阵输入至所述谣言检测模型中的特征构造层,输出所述待检测事件与其他谣言事件间的事件关系特征;
将所述事件关系特征输入至所述谣言检测模型的输出层,输出对所述待检测事件是否为谣言的检测结果。
根据本发明提供的一种谣言检测方法,将所述待检测事件输入至所述谣言检测模型中的特征处理层,所述特征处理层由所述待检测事件中提取事件传播特征向量,包括:
根据所述待检测事件的帖文的转发关系构建所述待检测事件的传播图;
通过所述传播图得到表示转发帖文对被转发帖文的影响力度的第二邻接矩阵;
将由所述事件文本特征向量得到的文本特征向量矩阵和所述第二邻接矩阵输入根增强图卷积神经网络模型中,得到所述事件传播特征向量。
根据本发明提供的一种谣言检测方法,通过所述根增强图卷积神经网络模型得到所述事件传播特征向量,包括:
将所述文本特征向量矩阵和第二邻接矩阵输入所述根增强图卷积神经网络模型中,经过所述根增强图卷积神经网络模型的预定层数后,得到更新事件传播特征向量矩阵;
对所述更新事件传播特征向量矩阵中与事件相关的所有帖文对应的事件传播特征向量做池化操作,并将池化操作的结果作为最终的事件传播特征向量;
其中,所述池化操作为最大池化和平均池化后,将最大池化的结果和平均池化的结果相加。
根据本发明提供的一种谣言检测方法,所述混合特征向量由所述事件的源帖文的事件文本特征向量和事件传播特征向量融合得到。
根据本发明提供的一种谣言检测方法,由所述关系处理层根据所述待检测事件与其他谣言事件间的联系关系构建表示事件间联系紧密程度的第一邻接矩阵,包括:
由所述关系处理层根据所述待检测事件与其他谣言事件间的联系关系构建事件关系图,根据所述事件关系图得到表示事件间联系紧密程度的第一邻接矩阵。
根据本发明提供的一种谣言检测方法,将所述混合特征向量的向量矩阵和第一邻接矩阵输入至所述谣言检测模型中的特征构造层,输出所述待检测事件与其他谣言事件间的事件关系特征,包括:
将所述混合特征向量的向量矩阵和第一邻接矩阵输入图卷积神经网络模型中构造针对于各个事件的事件关系特征;
其中,将图卷积神经网络中每一层输出的事件关系特征向量进行缝合后,得到更新事件关系特征向量;
将得到的各层所述更新事件关系特征向量的最大池化操作的结果和平均池化操作的结果之和作为相应事件的最终的事件关系特征向量。
本发明还提供一种谣言检测装置,包括:
事件获取单元,用于获取待检测事件;
谣言检测单元,用于将所述待检测事件输入至谣言检测模型中,得到所述谣言检测模型输出的谣言检测结果;
其中,所述谣言检测模型是基于谣言事件、所述谣言事件的传播特征以及谣言事件间的关系特征训练得到的。
本发明还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述谣言检测方法的步骤。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述谣言检测方法的步骤。
本发明提供的谣言检测方法、装置、电子设备和存储介质,通过基于谣言事件、所述谣言事件的传播特征以及谣言事件间的关系特征训练得到的谣言检测模型对待检测事件是否为谣言进行检测,实现了在谣言的检测过程中,对待检测事件的综合判断,使得谣言检测准确度大大提高。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的谣言检测方法的流程示意图;
图2是本发明提供的谣言检测模型的运行流程示意图;
图3是本发明提供的特征构造层构造事件关系特征向量的流程示意图;
图4是本发明提供的特征处理层由待检测事件中提取事件传播特征向量的流程示意图;
图5是本发明提供的提取事件传播特征的根增强的图卷积神经网络模型的结构流程图;
图6是本发明提供的生成事件关系特征的图卷积神经网络模型的结构流程图;
图7是本发明提供的谣言检测方法的网格示意图;
图8是本发明提供的谣言检测装置的结构示意图;
图9是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1-图7描述本发明的谣言检测方法,该方法具体包括:
步骤110、获取待检测事件;
步骤120、将所述待检测事件输入至谣言检测模型中,得到所述谣言检测模型输出的谣言检测结果;
其中,所述谣言检测模型是基于谣言事件、所述谣言事件的传播特征以及谣言事件间的关系特征训练得到的。
具体地,现有的谣言检测方法中,倾向于仅从单一传播结构角度或单一文本角度来进行谣言的检测,忽略了事件参与用户在谣言传播中的作用,即忽略了事件与事件间的联系,本发明实施例提供的方法,通过将事件传播特征和事件关系特征结合用于待检测事件是否为谣言的检测,实现了在谣言的检测过程中,对待检测事件的综合判断,使得谣言检测准确度大大提高。
基于上述实施例,图2为本发明提供的谣言检测模型的运行流程示意图,如图2所示,步骤120具体包括:
步骤121、将所述待检测事件分别输入至所述谣言检测模型中的特征处理层和关系处理层;由所述特征处理层输出由所述待检测事件中提取的事件文本特征向量和事件传播特征向量融合得到的事件的混合特征向量构建的混合特征向量的向量矩阵;由所述关系处理层输出根据所述待检测事件与其他谣言事件间的联系关系构建的表示事件间联系紧密程度的第一邻接矩阵。
具体地,对于待检测事件ci,其可以表示为其中/>代表源帖文,/>代表第j个响应帖文(j=1,2,3,…,mi),则mi+1代表事件ci包含的帖文总数,mi代表响应帖文总数。
特征处理层在将待检测事件的事件文本特征向量和事件传播特征向量融合得到待检测事件的混合特征向量前,先要由待检测事件中分别提取事件文本特征向量和事件传播特征向量。
其中,首先需要依次对待检测事件的所有帖文的文本信息进行预处理,然后输入预训练模型得到每个帖文的文本特征向量,而后将帖文的文本特征向量组合成文本特征矩阵。进一步地,对于待检测事件得到其对应的文本特征向量矩阵/> 其中,/>代表源帖文的d维文本特征向量,/>代表响应帖文的d维文本特征向量。
可以理解的是,事件参与用户对谣言传播具有一定的影响,而现阶段的谣言检测研究中,通常仅从单一的谣言传播结构或文本角度进行谣言检测,因而在该步骤中,当获得了待检测事件的文本特征向量和传播特征向量后,在谣言检测中考虑了融合文本特征向量与传播特征向量,得到待检测事件ci的混合特征向量fi,进而得到待检测事件的混合特征向量矩阵F。
其中,所述混合特征向量由所述待检测事件的源帖文的事件文本特征向量和事件传播特征向量融合得到,即依据下述公式1进行融合:
公式1中,代表待检测事件ci的源帖文/>的文本特征向量,/>代表待检测事件ci的传播特征向量。
同时,在该步骤中,谣言检测模型的关系处理层还需根据待检测事件与其他谣言事件间的联系关系构建事件关系图G=(Node,Edge),其中,事件节点集Node表示事件集C中的所有事件节点,节点集数目|Node|=n,边集Edge表示事件之间的联系,通常将是否有相同用户参与作为事件之间的联系的判断依据。
然后通过事件关系图G得到第一邻接矩阵A′∈Rn×n,具体地,参照下述公式2:
公式2中,unp,q表示同时参与事件cp和cq的用户数目,a′p,q表示事件节点间边的权重,即代表了事件节点间的关系强度,即事件联系的紧密程度。
步骤122、将所述混合特征向量的向量矩阵和第一邻接矩阵输入至所述谣言检测模型中的特征构造层,输出所述待检测事件与其他谣言事件间的事件关系特征。
具体地,在该步骤中,将混合特征向量矩阵F与第一邻接矩阵A′输入特征构造层,更新图节点信息,将特征构造层中每一层输出的节点向量缝合起来,拼接图浅层特征与深层特征,然后进行池化操作,得到每个事件节点的事件关系特征向量hi。
进一步地,基于上述任一实施例,图3为本发明实施例提供的特征构造层构造事件关系特征向量的流程示意图,如图3所示,步骤122具体包括:
步骤1221、将所述混合特征向量的向量矩阵和第一邻接矩阵输入图卷积神经网络模型中构造针对于各个事件的事件关系特征;
其中,将图卷积神经网络中每一层输出的事件关系特征向量进行缝合后,得到更新事件关系特征向量;
步骤1222、将得到的各层所述更新事件关系特征向量的最大池化操作的结果和平均池化操作的结果之和作为相应事件的最终的事件关系特征向量。
具体地,GCN模型中的第l+1层的特征矩阵H(l+1)的表达式为公
式3:
公式3中,H(l+1)代表第l+1层所有事件节点向量构成的特征向量矩阵,H(l)代表第l层所有事件节点向量构成的特征向量矩阵,代表标准化对称邻接矩阵,用/>进行表示,其中D代表度矩阵,W(l)代表权重矩阵,B(l)代表广播偏置项,通过激活函数σ输出新的表示。
然后,将图卷积神经网络中每一层输出的事件节点向量缝合起来,拼接图浅层特征与深层特征,然后进行池化操作,第kn层输出的事件节点向量矩阵如下述公式4所示:
公式4中,Hkn代表经过kn层GCN模型后得到的更新后的节点特征向量矩阵,代表经过kn层GCN模型更新后的节点ci的特征向量。
最后,进行池化操作,得到每个事件节点的事件关系特征向量,具体参照公式5:
公式5中,函数MeanPooling代表对向量做平均池化操作,函数MaxPooling代表对向量做最大池化操作,将平均向量与最大池化向量相加得到最终图节点表示,即事件关系特征[h1,h2,h3,…,hi,…,hn]T。
步骤123、将所述事件关系特征输入至所述谣言检测模型的输出层,输出对所述待检测事件是否为谣言的检测结果。
具体地,通过融合了待检测事件的文本特征、传播特征以及与其他谣言事件的关系构建的事件关系特征在输出层中的输入,能够由所述谣言检测模型中得到该待检测事件是否为谣言的准确的结果。
基于上述任一实施例,图4为本发明提供的特征处理层由所述待检测事件中提取事件传播特征向量的流程示意图,如图4所示,步骤121具体包括:
步骤1211、根据所述待检测事件的帖文的转发关系构建所述待检测事件的传播图;
步骤1212、通过所述传播图得到表示转发帖文对被转发帖文的影响力度的第二邻接矩阵;
步骤1213、将由所述事件文本特征向量得到的文本特征向量矩阵和所述第二邻接矩阵输入根增强图卷积神经网络模型中,得到所述事件传播特征向量。
具体地,首先根据待检测事件ci的转发主体ID构造事件传播图gi=(Vi,Ei),得到传播图的第二邻接矩阵Ai,而后应用根增强图卷积神经网络(GCN)模型构造事件ci的传播特征
其中,传播图具体参照下述公式6:
gi=(Vi,Ei) 公式6;
公式6中,事件的节点集表示事件ci的所有帖文(源帖文+响应帖文)节点,节点集数目|Vi|=mi+1,边集Ei表示帖文之间的转发关系。
通过事件ci的传播图gi得到邻接矩阵具体参见下述公式7:
公式7中,times,t表示被转发帖文/>与转发帖文/>发布时间的时间差,as,t表示事件节点间边的权重,代表了节点间关系强度,即转帖对被转帖的影响力度。
之后,应用根增强图卷积神经网络(GCN)模型,将事件ci的文本特征向量矩阵Xi与邻接矩阵Ai输入GCN模型,获取事件ci的传播特征向量
基于上述任一实施例,在另一个实施例中,通过所述根增强图卷积神经网络模型得到所述事件传播特征向量,还包括:
将所述文本特征向量矩阵和第二邻接矩阵输入所述根增强图卷积神经网络模型中,经过所述根增强图卷积神经网络模型的预定层数后,得到更新事件传播特征向量矩阵;
对所述更新事件传播特征向量矩阵中与事件相关的所有帖文对应的事件传播特征向量做池化操作,并将池化操作的结果作为最终的事件传播特征向量;
其中,所述池化操作为最大池化和平均池化后,将最大池化的结果和平均池化的结果相加。
具体地,在根增强GCN模型中的第l+1隐藏层的特征矩阵H(l+1)的表达式为公式8和9:
第l+1隐藏层由第l+1层的图卷积层与第l+1层的根增强层构成。公式8为第l+1层的根增强GCN模型的图卷积层公式,代表第l+1层的图卷积层中的所有事件节点向量构成的特征向量矩阵,/>代表根增强GCN模型的第l层根增强层的所有事件节点组成的特征向量矩阵,/>代表标准化对称邻接矩阵,用/>进行表示,其中Di代表度矩阵,Wl代表权重矩阵,B(l)代表广播偏置项;公式9为第l+1层的根增强GCN模型的根增强层公式,式中/>代表第l+1层的根增强层的所有事件节点向量构成的特征向量矩阵,concat代表根增强层的连接函数,/>代表第l层的根增强层的所有事件节点向量构成的特征向量矩阵,且/>通过激活函数σ输出新表示。而后得到如公式10所示的更新事件节点特征矩阵:
公式10中,代表经过k层根增强GCN模型后得到的更新节点特征矩阵,/>代表经过k层根增强GCN模型更新后的节点/>的特征向量。
最后,将一个事件的所有帖文特征通过池化算法聚合为一个特征向量,得到事件ci的传播特征向量具体参照公式11:
公式11中,函数MeanPooling代表对向量做平均池化操作,函数MaxPooling代表对向量做最大池化操作,将平均向量与最大池化向量相加作为待检测事件ci的传播特征向量hgi。
同时,将所述事件关系特征输入归一化函数,获得预测的真实性标签分布。
本发明使用改进的根增强图卷积神经网络构造事件的传播特征,并融合事件文本特征与传播特征,最后使用图卷积神经网络对事件关系图进行谣言检测。其中,使用根增强图卷积神经网络模型获取事件传播特征能够很好的提取信息的传播结构特征,根增强层可以更好的获取帖子的原始信息,得到更准确的节点表示,并且传播图的邻接矩阵以帖文时间差为权重,能更好的捕捉信息传播中重要的节点信息,更好的将帖文的文本特征与传播结构特征相融合;另外,使用图卷积神经网络模型能够很好的获取事件之间的关系特征,能够将事件的传播特征与关系特征结合起来,进行谣言检测。即使用图卷积神经网络模型分别对事件传播图和事件关系图进行训练,能够融合事件的传播特征与事件关系特征,提高谣言检测准确性。
另外,所述输出层可以应用归一化函数进行待检测事件是否为谣言的判断,具体地,将图节点表示hi作为归一化函数softmax的输入来预测标签分布,如公式12所示:
在公式12中,W表示权重,b表示偏置项,hi表示更新后的事件节点表示。
同时,在应用所述谣言检测模型进行谣言检测的过程中,还可以应用谣言事件的检测结果使用交叉熵函数最小化损失,以便于对谣言检测模型不断的训练,以在应用本发明的谣言检测模型对待检测事件进行检测时,得到更准确的检测结果,具体参见公式13:
在公式13中,yi表示真实标签,表示预测的标签,L表示交叉熵损失函数。
下面结合图8对本发明提供的一种谣言检测装置进行描述,下文描述的谣言检测装置与上文描述的谣言检测方法可相互对应参照。
该装置包括事件获取单元810和谣言检测单元820;其中,
事件获取单元810用于获取待检测事件;
谣言检测单元820用于将所述待检测事件输入至谣言检测模型中,得到所述谣言检测模型输出的谣言检测结果;
其中,所述谣言检测模型是基于谣言事件、所述谣言事件的传播特征以及谣言事件间的关系特征训练得到的。
具体地,本发明提供的装置,通过将事件传播特征和事件关系特征结合用于待检测事件是否为谣言的检测,实现了在谣言的检测过程中,对待检测事件的综合判断,使得谣言检测准确度大大提高。
基于上述任一实施例,谣言检测单元820包括:
特征处理单元,用于将所述待检测事件输入至所述谣言检测模型中的特征处理层中,得到由所述待检测事件中提取的事件文本特征向量和事件传播特征向量融合得到的事件的混合特征向量构建的混合特征向量的向量矩阵;
关系处理单元,用于将所述待检测事件输入至所述谣言检测模型中的关系处理层中,得到根据所述待检测事件与其他谣言事件间的联系关系构建的表示事件间联系紧密程度的第一邻接矩阵;
特征构造单元,用于将所述混合特征向量的向量矩阵和第一邻接矩阵输入至所述谣言检测模型中的特征构造层中,得到所述待检测事件与其他谣言事件间的事件关系特征;
输出单元,用于将所述事件关系特征输入至所述谣言检测模型的输出层中,输出对所述待检测事件是否为谣言的检测结果。
基于上述任一实施例,特征处理单元具体用于:
根据所述待检测事件的帖文的转发关系构建所述待检测事件的传播图;
通过所述传播图得到表示转发帖文对被转发帖文的影响力度的第二邻接矩阵;
将由所述事件文本特征向量得到的文本特征向量矩阵和所述第二邻接矩阵输入根增强图卷积神经网络模型中,得到所述事件传播特征向量。
基于上述任一实施例,特征处理单元更具体的用于:
将所述文本特征向量矩阵和第二邻接矩阵输入所述根增强图卷积神经网络模型中,经过所述根增强图卷积神经网络模型的预定层数后,得到更新事件传播特征向量矩阵;
对所述更新事件传播特征向量矩阵中与事件相关的所有帖文对应的事件传播特征向量做池化操作,并将池化操作的结果作为最终的事件传播特征向量;
其中,所述池化操作为最大池化和平均池化后,将最大池化的结果和平均池化的结果相加。
基于上述任一实施例,所述混合特征向量由所述事件的源帖文的事件文本特征向量和事件传播特征向量融合得到。
基于上述任一实施例,关系处理单元具体用于:
根据所述待检测事件与其他谣言事件间的联系关系构建事件关系图,根据所述事件关系图得到表示事件间联系紧密程度的第一邻接矩阵。
基于上述任一实施例,特征构造单元具体用于:
将所述混合特征向量的向量矩阵和第一邻接矩阵输入图卷积神经网络模型中构造针对于各个事件的事件关系特征;
其中,将图卷积神经网络中每一层输出的事件关系特征向量进行缝合后,得到更新事件关系特征向量;
将得到的各层所述更新事件关系特征向量的最大池化操作的结果和平均池化操作的结果之和作为相应事件的最终的事件关系特征向量。
基于上述任一实施例,输出单元具体用于:
将所述事件关系特征输入归一化函数,获得预测的真实性标签分布。
图9示例了一种电子设备的实体结构示意图,如图9所示,该电子设备可以包括:处理器(processor)910、通信接口(Communications Interface)920、存储器(memory)930和通信总线940,其中,处理器910,通信接口920,存储器930通过通信总线940完成相互间的通信。处理器910可以调用存储器930中的逻辑指令,以执行谣言检测方法,该方法包括:
步骤110、获取待检测事件;
步骤120、将所述待检测事件输入至谣言检测模型中,得到所述谣言检测模型输出的谣言检测结果;
其中,所述谣言检测模型是基于谣言事件、所述谣言事件的传播特征以及谣言事件间的关系特征训练得到的。
此外,上述的存储器930中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的谣言检测方法,该方法包括:
步骤110、获取待检测事件;
步骤120、将所述待检测事件输入至谣言检测模型中,得到所述谣言检测模型输出的谣言检测结果;
其中,所述谣言检测模型是基于谣言事件、所述谣言事件的传播特征以及谣言事件间的关系特征训练得到的。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法所提供的谣言检测方法,该方法包括:
步骤110、获取待检测事件;
步骤120、将所述待检测事件输入至谣言检测模型中,得到所述谣言检测模型输出的谣言检测结果;
其中,所述谣言检测模型是基于谣言事件、所述谣言事件的传播特征以及谣言事件间的关系特征训练得到的。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (8)
1.一种谣言检测方法,其特征在于,包括:
获取待检测事件;
将所述待检测事件输入至谣言检测模型中,得到所述谣言检测模型输出的谣言检测结果;
其中,所述谣言检测模型是基于谣言事件、所述谣言事件的传播特征以及谣言事件间的关系特征训练得到的;将待检测事件输入至谣言检测模型中,得到所述谣言检测模型输出的谣言检测结果,包括:
将所述待检测事件分别输入至所述谣言检测模型中的特征处理层和关系处理层;由所述特征处理层输出由所述待检测事件中提取的事件文本特征向量和事件传播特征向量融合得到的事件的混合特征向量构建的混合特征向量的向量矩阵;由所述关系处理层输出根据所述待检测事件与其他谣言事件间的联系关系构建的表示事件间联系紧密程度的第一邻接矩阵;
将所述混合特征向量的向量矩阵和第一邻接矩阵输入至所述谣言检测模型中的特征构造层,输出所述待检测事件与其他谣言事件间的事件关系特征;
将所述事件关系特征输入至所述谣言检测模型的输出层,输出对所述待检测事件是否为谣言的检测结果;
其中,将所述待检测事件输入至所述谣言检测模型中的特征处理层,所述特征处理层由所述待检测事件中提取事件传播特征向量,包括:
根据所述待检测事件的帖文的转发关系构建所述待检测事件的传播图gi:
gi=(Vi,Ei),
其中,事件的节点集表示待检测事件ci的所有帖文节点,/>代表源帖文,/>代表第mi个响应帖文,mi代表响应帖文总数,边集Ei表示帖文之间的转发关系;
通过所述传播图得到表示转发帖文对被转发帖文的影响力度的第二邻接矩阵
则:
其中,times,t表示被转发帖文/>与转发帖文/>发布时间的时间差,as,t表示事件节点间边的权重,代表了节点间关系强度,即转帖对被转帖的影响力度;
将由所述事件文本特征向量得到的文本特征向量矩阵和所述第二邻接矩阵输入根增强图卷积神经网络模型中,得到所述事件传播特征向量。
2.根据权利要求1所述的谣言检测方法,其特征在于,通过所述根增强图卷积神经网络模型得到所述事件传播特征向量,包括:
将所述文本特征向量矩阵和第二邻接矩阵输入所述根增强图卷积神经网络模型中,经过所述根增强图卷积神经网络模型的预定层数后,得到更新事件传播特征向量矩阵;
对所述更新事件传播特征向量矩阵中与事件相关的所有帖文对应的事件传播特征向量做池化操作,并将池化操作的结果作为最终的事件传播特征向量;
其中,所述池化操作为最大池化和平均池化后,将最大池化的结果和平均池化的结果相加。
3.根据权利要求1所述的谣言检测方法,其特征在于,所述混合特征向量由所述事件的源帖文的事件文本特征向量和事件传播特征向量融合得到。
4.根据权利要求1所述的谣言检测方法,其特征在于,由所述关系处理层根据所述待检测事件与其他谣言事件间的联系关系构建表示事件间联系紧密程度的第一邻接矩阵,包括:
由所述关系处理层根据所述待检测事件与其他谣言事件间的联系关系构建事件关系图,根据所述事件关系图得到表示事件间联系紧密程度的第一邻接矩阵。
5.根据权利要求1所述的谣言检测方法,其特征在于,将所述混合特征向量的向量矩阵和第一邻接矩阵输入至所述谣言检测模型中的特征构造层,输出所述待检测事件与其他谣言事件间的事件关系特征,包括:
将所述混合特征向量的向量矩阵和第一邻接矩阵输入图卷积神经网络模型中构造针对于各个事件的事件关系特征;
其中,将图卷积神经网络中每一层输出的事件关系特征向量进行缝合后,得到更新事件关系特征向量;
将得到的各层所述更新事件关系特征向量的最大池化操作的结果和平均池化操作的结果之和作为相应事件的最终的事件关系特征向量。
6.一种谣言检测装置,其特征在于,包括:
事件获取单元,用于获取待检测事件;
谣言检测单元,用于将所述待检测事件输入至谣言检测模型中,得到所述谣言检测模型输出的谣言检测结果;
其中,所述谣言检测模型是基于谣言事件、所述谣言事件的传播特征以及谣言事件间的关系特征训练得到的;
所述谣言检测单元具体用于:
将所述待检测事件分别输入至所述谣言检测模型中的特征处理层和关系处理层;由所述特征处理层输出由所述待检测事件中提取的事件文本特征向量和事件传播特征向量融合得到的事件的混合特征向量构建的混合特征向量的向量矩阵;由所述关系处理层输出根据所述待检测事件与其他谣言事件间的联系关系构建的表示事件间联系紧密程度的第一邻接矩阵;
将所述混合特征向量的向量矩阵和第一邻接矩阵输入至所述谣言检测模型中的特征构造层,输出所述待检测事件与其他谣言事件间的事件关系特征;
将所述事件关系特征输入至所述谣言检测模型的输出层,输出对所述待检测事件是否为谣言的检测结果;
其中,将所述待检测事件输入至所述谣言检测模型中的特征处理层,所述特征处理层由所述待检测事件中提取事件传播特征向量,包括:
根据所述待检测事件的帖文的转发关系构建所述待检测事件的传播图gi:
gi=(Vi,Ei),
其中,事件的节点集表示待检测事件ci的所有帖文节点,/>代表源帖文,/>代表第mi个响应帖文,mi代表响应帖文总数,边集Ei表示帖文之间的转发关系;
通过所述传播图得到表示转发帖文对被转发帖文的影响力度的第二邻接矩阵
则:
其中,times,t表示被转发帖文/>与转发帖文/>发布时间的时间差,as,t表示事件节点间边的权重,代表了节点间关系强度,即转帖对被转帖的影响力度;
将由所述事件文本特征向量得到的文本特征向量矩阵和所述第二邻接矩阵输入根增强图卷积神经网络模型中,得到所述事件传播特征向量。
7.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5任一项所述谣言检测方法的步骤。
8.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述谣言检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110972848.0A CN113742604B (zh) | 2021-08-24 | 2021-08-24 | 一种谣言检测方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110972848.0A CN113742604B (zh) | 2021-08-24 | 2021-08-24 | 一种谣言检测方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113742604A CN113742604A (zh) | 2021-12-03 |
CN113742604B true CN113742604B (zh) | 2024-04-16 |
Family
ID=78732479
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110972848.0A Active CN113742604B (zh) | 2021-08-24 | 2021-08-24 | 一种谣言检测方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113742604B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106354845A (zh) * | 2016-08-31 | 2017-01-25 | 上海交通大学 | 基于传播结构的微博谣言识别方法和系统 |
CN107797998A (zh) * | 2016-08-29 | 2018-03-13 | 腾讯科技(深圳)有限公司 | 含谣言用户生成内容识别方法和装置 |
CN112231562A (zh) * | 2020-10-15 | 2021-01-15 | 北京工商大学 | 一种网络谣言识别方法及系统 |
CN112256981A (zh) * | 2020-11-13 | 2021-01-22 | 北京理工大学 | 一种基于线性和非线性传播的谣言检测方法 |
CN112612970A (zh) * | 2020-12-25 | 2021-04-06 | 南京邮电大学 | 一种基于微博事件关系的谣言检测方法及其系统 |
CN112966191A (zh) * | 2020-12-02 | 2021-06-15 | 东北大学 | 一种新媒体平台网络信息传播弱连接节点的获取方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190354832A1 (en) * | 2018-05-17 | 2019-11-21 | Università della Svizzera italiana | Method and system for learning on geometric domains using local operators |
-
2021
- 2021-08-24 CN CN202110972848.0A patent/CN113742604B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107797998A (zh) * | 2016-08-29 | 2018-03-13 | 腾讯科技(深圳)有限公司 | 含谣言用户生成内容识别方法和装置 |
CN106354845A (zh) * | 2016-08-31 | 2017-01-25 | 上海交通大学 | 基于传播结构的微博谣言识别方法和系统 |
CN112231562A (zh) * | 2020-10-15 | 2021-01-15 | 北京工商大学 | 一种网络谣言识别方法及系统 |
CN112256981A (zh) * | 2020-11-13 | 2021-01-22 | 北京理工大学 | 一种基于线性和非线性传播的谣言检测方法 |
CN112966191A (zh) * | 2020-12-02 | 2021-06-15 | 东北大学 | 一种新媒体平台网络信息传播弱连接节点的获取方法 |
CN112612970A (zh) * | 2020-12-25 | 2021-04-06 | 南京邮电大学 | 一种基于微博事件关系的谣言检测方法及其系统 |
Non-Patent Citations (1)
Title |
---|
更主动的大众VS被设置的大众――新媒体时代谣言传播的参与者分析;雷霞;科技传播;第99-102页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113742604A (zh) | 2021-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110516085A (zh) | 基于双向注意力的图像文本互检索方法 | |
CN107728780A (zh) | 一种基于虚拟机器人的人机交互方法及装置 | |
CN108269110A (zh) | 基于社区问答的物品推荐方法、系统及用户设备 | |
CN108074016B (zh) | 基于位置社交网络的用户关系强度预测方法、装置及设备 | |
CN103530428B (zh) | 一种基于开发者实践技能相似性的同行推荐方法 | |
WO2018068648A1 (zh) | 一种信息匹配方法及相关装置 | |
Gao et al. | Gnes: Learning to explain graph neural networks | |
CN110659573A (zh) | 一种人脸识别方法、装置、电子设备及存储介质 | |
CN106202031A (zh) | 一种基于在线社交平台群聊数据对群成员进行关联的系统及方法 | |
CN109741198A (zh) | 网络信息传播影响力度量方法、系统及影响力最大化方法 | |
CN113628059A (zh) | 一种基于多层图注意力网络的关联用户识别方法及装置 | |
CN112417112A (zh) | 一种基于图表征增强的开放域对话系统评估方法 | |
CN114020928A (zh) | 一种基于异质图对比学习的虚假新闻识别方法 | |
Zhu et al. | A novel simple visual tracking algorithm based on hashing and deep learning | |
CN114548274A (zh) | 一种基于多模态交互的谣言检测方法及系统 | |
CN113742604B (zh) | 一种谣言检测方法、装置、电子设备和存储介质 | |
CN113806564A (zh) | 多模态信息性推文检测方法及系统 | |
CN113361928A (zh) | 一种基于异构图注意力网络的众包任务推荐方法 | |
CN106844743B (zh) | 维吾尔语文本的情感分类方法及装置 | |
CN111401854A (zh) | 信息处理方法以及装置 | |
US20230351153A1 (en) | Knowledge graph reasoning model, system, and reasoning method based on bayesian few-shot learning | |
CN110059457B (zh) | 一种核身方法及装置 | |
Yang et al. | Dishonest behaviors in online rating systems: cyber competition, attack models, and attack generator | |
CN113705247B (zh) | 主题模型效果评估方法、装置、设备、存储介质和产品 | |
CN113010772B (zh) | 一种数据处理方法、相关设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |