CN111428151B - 一种基于网络增速的虚假消息识别方法及其装置 - Google Patents
一种基于网络增速的虚假消息识别方法及其装置 Download PDFInfo
- Publication number
- CN111428151B CN111428151B CN202010315344.7A CN202010315344A CN111428151B CN 111428151 B CN111428151 B CN 111428151B CN 202010315344 A CN202010315344 A CN 202010315344A CN 111428151 B CN111428151 B CN 111428151B
- Authority
- CN
- China
- Prior art keywords
- user
- matrix
- network
- time interval
- target message
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 230000001133 acceleration Effects 0.000 title claims abstract description 18
- 239000011159 matrix material Substances 0.000 claims abstract description 55
- 230000005540 biological transmission Effects 0.000 claims abstract description 4
- 239000013598 vector Substances 0.000 claims description 26
- 238000013528 artificial neural network Methods 0.000 claims description 14
- 238000012549 training Methods 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 11
- 230000006403 short-term memory Effects 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 230000007787 long-term memory Effects 0.000 claims description 6
- 230000015654 memory Effects 0.000 claims description 5
- 238000013527 convolutional neural network Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 3
- 210000002569 neuron Anatomy 0.000 claims description 3
- 230000007480 spreading Effects 0.000 claims description 2
- 230000007246 mechanism Effects 0.000 abstract description 5
- 230000000644 propagated effect Effects 0.000 description 8
- 238000012360 testing method Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000005295 random walk Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000000192 social effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Information Transfer Between Computers (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于网络增速的虚假消息识别方法及装置,方法包括以下步骤:(1)记录n个等时间间隔的时刻t0,t1,...,tn下目标消息在社交网络中的用户传播情况,获得各个时间间隔内的用户增量矩阵ΔG1,...,ΔGn;(2)将ΔG1,...,ΔGn输入至训练好的预测模型中,获得下一个时间间隔内的用户增量矩阵ΔGn+1;(3)将ΔGn+1输入至训练好的分类器中进行二分类,识别目标消息的真伪;n为大于或等于4的自然数。该方法通过真假消息的传播机制和传播速度上的差异来实现对消息真伪的辨别。
Description
技术领域
本发明涉及信息处理技术领域,尤其涉及一种基于网络增速的虚假消息识别方法及其装置。
背景技术
随着计算机技术的高速发展,社交媒体在我们的生活中扮演着越来越重要的角色。各种各样的便捷的社交媒体在让我们能获得实时新闻的同时,也让虚假信息的传播变得极其容易。在微博、Facebook(脸书)和Twitter(推特)等社交网站上,到处都充斥着被放大的虚假故事,有时这些故事所造成的后果十分严重。
客观真实性是新闻最基本最重要的传播原则,这也是新闻工作领域的基本道德底线。但近年来,随着新闻传播渠道、传播载体的日趋多元化,以及各种网络自媒体的迅速发展蔓延,虚假新闻问题也逐步发展迅猛。虚假新闻不仅损害了新闻媒体的权威性和公信力,同时也会严重影响社会舆论,带来严重的负面社会效应。因此,在当前新闻传媒行业领域融合发展的新时期,更应该深入研究分析虚假新闻的传播机制,加强虚假新闻治理,促进提升新闻的真实性和社会正能量。首先我们要明确的是什么样的新闻会被称为“假新闻”?假新闻指的是被捏造的信息,它在形式上模仿新闻内容,但在组织过程和意图上却和新闻不同。假新闻缺乏的是新闻媒体的编辑规范,以及确保信息准确性与可靠性的流程。它大致可被分为两种,一种是含有不正确或误导性的错误信息,另一种是故意散播的以欺骗为目的虚假信息。《Science》杂志上发表的一项研究表明,虚假新闻的传播速度比真实新闻来得更快。实验结果表明,对于所有形式的新闻,虚假消息都能让它们传播得更快。在Twitter上将有虚假内容的推文传送到1500人的速度,比传播真实推文给1500人的速度快6倍。而且虚假信息获得首次转发的可能性比真实信息高出70%。因此,各种不法分子利用各种社交网络平台散布不实消息进行违法犯罪活动,给国家安全和社会稳定带来了严重的影响。由此可见,及时发现社交网络中的虚假消息并制定相应措施防止其进一步传播所带来的恶劣影响就显得十分重要。
自2012年以来,深度学习在计算机视觉以及自然语言处理两个领域取得了巨大的成功。和传统方法相比,深度学习的方法避免了手工提取特征或者人工规则,从原始数据中自动化地去提取特征,是一种端到端(end-to-end)的学习方法,能够学习到更高效的特征与模式。图卷积神经网络(Graph Convolutional Network)是一种能对图数据进行深度学习的方法。
长短期记忆网络(LSTM,Long Short-Term Memory)是一种时间循环神经网络,是为了解决一般的RNN(循环神经网络)存在的长期依赖问题而专门设计出来的,所有的RNN都具有一种重复神经网络模块的链式形式。在标准RNN中,这个重复的结构模块只有一个非常简单的结构,例如一个tanh层。LSTM的表现通常比时间递归神经网络及隐马尔科夫模型(HMM)更好,比如用在不分段连续手写识别上。2009年,用LSTM构建的人工神经网络模型赢得过ICDAR手写识别比赛冠军。LSTM还普遍用于自主语音识别,2013年运用TIMIT自然演讲数据库达成17.7%错误率的纪录。作为非线性模型,LSTM可作为复杂的非线性单元用于构造更大型深度神经网络。
公开号为CN107403007A的中国专利文献公开了一种基于网络的微博消息可信度判别模型的方法,该方法通过将微博评论网络建模为异构信息网络,并结合计算得到的先验知识在异构信息网络上做分类以实现虚假消息识别的目的。该方法需要结合先验知识,而且异构网络的处理也相对比较麻烦。
公开号为CN108830630A的中国专利文献公开了一种虚假消息的识别方法及其设备,该方法通过获取包含目标消息的多个载体文本,以及各个所述载体文本的传播路径,并基于所述载体文本和传播路径得到各个载体文本的文本矩阵,然后将得到的文本矩阵导入到特征向量计算模型里得到目标消息对应的文本特征向量。同样的再对传播路径进行类似的操作得到目标消息对应的用户传播特征向量,最后基于目标消息的文本特征向量和用户传播特征向量来计算目标消息的真伪指数,以识别消息的真伪与否。该方法需要两个不同的模型分别计算目标消息的文本特征向量和用户传播特征向量,实现起来较为繁琐。
发明内容
本发明提供了一种基于网络增速的虚假消息识别方法及其装置,该方法通过真假消息的传播机制和传播速度上的差异来实现对消息真伪的辨别。
具体技术方案如下:
一种基于网络增速的虚假消息识别方法,包括以下步骤:
(1)记录n个等时间间隔的时刻t0,t1,...,tn下目标消息在社交网络中的用户传播情况,获得各个时间间隔内的用户增量矩阵ΔG1,...,ΔGn;
(2)将ΔG1,...,ΔGn输入至训练好的预测模型中,获得下一个时间间隔内的用户增量矩阵ΔGn+1;
(3)将ΔGn+1输入至训练好的分类器中进行二分类,识别目标消息的真伪;
n为大于或等于4的自然数。
相邻时刻之间的时间间隔可根据具体数据集的不同灵活设定。
本发明通过真假消息的传播机制和传播速度上的差异来实现对目标消息真伪的辨别,通过神经网络模型直接端到端地获得虚假消息的识别结果,简单高效。
目标消息可以是文本消息,也可以是视频消息;社交网络可以是任意社交平台,例如微博、Facebook、Twitter等。
用户传播情况是指在各个时刻内,目标消息具体传播到了哪些用户。
在前一时刻未被传播到,而在当前时刻被传播到的用户,被视为该时间间隔内的增量用户,一个时刻内的增量用户用矩阵形式表示,该矩阵即为用户增量矩阵。
通过以下步骤获得各个时间间隔内的用户增量矩阵:
(a)构建一个m×m的矩阵;m为该社交网络中用户的数量;
(b)确定t时刻下目标消息传播到的用户,在矩阵中目标消息传播到的用户的对应位置置1,目标消息未传播到的用户的对应位置置0,获得t时刻的传播矩阵;
(c)确定t+1时刻下目标消息传播到的用户,在矩阵中目标消息传播到的用户的对应位置置1,目标消息未传播到的用户的对应位置置0,获得t+1时刻的传播矩阵;
(d)将t+1时刻的传播矩阵与t时刻的传播矩阵相减,得到当前时间间隔内的用户增量矩阵。
步骤(a)中,若m大于设定阈值,则采用随机游走算法获取社交网络的子网络,以所述子网络替代原社交网络构建用户增量矩阵。设定阈值可根据具体情况人为设定。
传播矩阵可表示为Amm=[aij],其中i、j为大于等于1且小于等于m的自然数;当i=j时,当前时刻第i(j)个用户被传播到时,则当前时刻的传播矩阵中aij置1,否则置0;当i≠j时,第i个用户与第j个用户存在边的关系时(即第i个用户与第j个用户为朋友关系时),aij置1,否则置0。
所述的预测模型包括:
图卷积神经网络,对输入的各个时间间隔的用户增量矩阵提取特征向量;
长短期记忆网络,根据各个时间间隔的用户增量矩阵的特征向量其及时间先后顺序,预测得到下一时间间隔的用户增量矩阵。
预测模型由图卷积神经网络(GCN)和长短期记忆网络(LSTM)组成。将ΔG1,...,ΔGn输入至预测模型中,预测模型先利用图卷积神经网络对增量矩阵ΔG1,...,ΔGn进行特征提取,然后将提取到的特征按照时序先后放入长短期记忆网络,利用长短期记忆网络善于处理序列信息的能力来获得下一时刻的增量矩阵ΔGn+1。
优选的,所述的预测模型中的图卷积神经网络有三层。
所述的分类器包括全连接层和Softmax层;所述全连接层将网络的神经元个数减少至2,所述的Softmax层输出目标消息被分到每个类别的置信度。
通过以下步骤对所述的预测模型及分类器进行训练:
(i)将包含时间、结构和语言三个维度的谣言数据集作为训练集,将所述的谣言数据集中的数据处理成用户增量矩阵的形式;
所述的谣言数据集为论文《Prominent features of rumor propagation inonline social media》中采用的谣言数据集,将谣言数据集划分为训练集、验证集和测试集,三者的比例为75%、12.5%、12.5%。
(ii)将处理成用户增量矩阵形式的谣言数据集分批次输入至图卷积神经网络中,得到每个批次对应的特征向量;
将获得的特征向量按照时间顺序输入到长短期记忆网络中,得到下一时刻间隔的特征向量;
将获得的下一时刻间隔的特征向量通过分类器,输出其预测类标,并将预测类标与真实类标对比,通过损失函数对预测类标和真实类标之间的差距进行刻画,并通过反向传播更新模型中的参数来拟合模型。
优选的,在对分类器进行训练时,以二分类结果的交叉熵作为损失函数。
基于同样的发明构思,本发明还提供了一种基于网络增速的虚假消息识别装置,包括计算机存储器、计算机处理器以及存储在所述计算机存储器中并可在所述计算机处理器上执行的计算机程序;
所述计算机存储器中存储有预测模型和分类器,所述计算机处理器执行所述计算机程序时实现所述的基于网络增速的虚假消息识别方法。
与现有技术相比,本发明的有益效果为:
本发明通过真假消息的传播机制和传播速度上的差异来实现对目标消息真伪的辨别,通过神经网络模型直接端到端地获得虚假消息的识别结果,简单高效。
附图说明
图1为基于网络增速的虚假消息识别方法的流程示意图;
图2为在单个时间间隔下的预测模型结构原理示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步详细描述,需要指出的是,以下所述实施例旨在便于对本发明的理解,而对其不起任何限定作用。
本实施例提供了一种基于网络增速的虚假消息识别方法,如图1和图2所示,具体包括如下步骤:
(1)记录目标消息在社交网络中的传播情况
首先,记录下t0,t1,...,tn各个时刻下目标消息在社交网络中具体影响到哪些用户的情况,用1来表示被目标消息传播到的用户,否则为0。
其中各相邻时刻之间的时间间隔是相等的,n需要大于等于4。相邻时刻之间的时间间隔可根据具体数据集的不同灵活设定。
目标消息的形式可以是文本消息,也可以是视频消息,社交网络可以是任意社交平台,比如微博、Facebook、Twitter等。
(2)根据所记录的目标消息的传播情况,确定每段时间间隔下目标消息在社交网络中传播到用户的增量,通过矩阵形式表示,在该增量矩阵中,在前一时刻下未被传播到的而在当前时刻被传播到的用户,视为“增量用户”,在该矩阵中用1表示,否则为0,得到n个增量矩阵ΔG1,...,ΔGn。
通过以下步骤获得各个时间间隔内的用户增量矩阵:
(a)首先构建一个m×m的矩阵,m为该社交网络中用户的数量。当m值过大时,可由随机游走算法获取其子网络以替代较难处理的原网络。
(b)确定当前t时刻活跃用户,在矩阵中的对应位置置1。例如5号用户在当前时刻为活跃用户,则在矩阵中的第5行第5列位置置为1。矩阵中的其他位置表示对应用户之间是否存在边的关系,如第5行第4列对应的是5号节点与4号节点之间是否存在边的关系,对应社交网络中5号用户与4号用户是否为朋友关系,1表示是,0表示不是。
(c)确定t+1时刻活跃用户,操作同步骤(2);
(d)将步骤(3)和步骤(2)中得到的矩阵相减,得到当前时间间隔下的增量矩阵。
(3)然后根据每个时间间隔下目标消息在社交网络中的传播到用户的增量矩阵ΔG1,...,ΔGn,通过预测模型获得下一时刻的网络增量ΔGn+1。
预测模型由三层图卷积神经网络(GCN)和长短期记忆网络(LSTM)组成。将ΔG1,...,ΔGn输入至预测模型中,预测模型先利用图卷积神经网络对增量矩阵ΔG1,...,ΔGn进行特征提取,然后将提取到的特征按照时序先后放入长短期记忆网络,利用长短期记忆网络善于处理序列信息的能力来获得下一时刻的增量矩阵ΔGn+1。
(4)最后根据预测得到的下一时刻的网络增量矩阵ΔGn+1,通过神经网络的分类层实现二分类,达到识别消息真伪的目的。
具体的,在预测模型之后添加分类层实现对ΔGn+1进行二分类。分类层包括全连接层和Softmax层,通过全连接层将神经元个数减少至2个,通过Softmax层的Softmax函数进行归一化,输出目标消息被分到每个类别的置信度,实现对ΔGn+1进行二分类,其中0表示真消息,1表示假消息。
Softmax层中,Softmax函数公式为:
其中K表示向量y的维度,yi表示该向量中第i个元素。它的实质就是将一个K维的任意实数向量映射成另一个K维的实数向量,其中向量中的每个元素取值都介于0和1之间,并且和为1。
整个识别模型由预测模型和连接在预测模型之后的分类层组成。识别模型中各个需要训练的参数通过求得损失函数关于每个参数的偏导数,然后使用梯度下降更新参数的方法迭代训练获得。
识别模型的训练包括以下步骤:
(i)获取训练集:数据集采用论文《Prominent features of rumor propagationin online social media》中采用的谣言数据集,该数据集包含三个维度:时间、结构和语言,数据集划分为训练集75%、验证集12.5%、测试集12.5%。
(ii)采用上述谣言数据集对识别模型(包括三层GCN、LSTM和分类层)进行训练:
首先将谣言数据集中的原始数据处理成增量矩阵形式,分批次输入到GCN模型中进行特征提取,得到每个批次对应的特征向量后按照时间顺序输入到LSTM网络中,得到下一时刻的特征向量,然后通过分类层输出预测类标,并将预测类标与原数据集中标注的真实类标对比,通过损失函数对预测类标和真实类标之间的差距进行刻画,并通过反向传播更新模型中的参数来拟合模型;验证集在每次训练后对当前模型进行准确率测试,验证集跟训练集没有交集,因此这个准确率是可靠的。但是,验证集参与了调参的过程;最后在模型训练完成后,用没有参与任何调参过程的测试集对模型的性能进行测试。
识别模型中的损失函数采用交叉熵损失函数。对于二分类问题,交叉熵损失函数公式为:
L=-[ylog(p)+(1-y)log(1-p)]
其中y表示样本的真实类标,正类为1,负类为0;p表示样本预测为正类的概率。
我们事先用带有标注的数据放入上述识别模型训练好各个参数后,该识别模型便可用于识别没有标注信息的消息,识别消息的真伪。
本实施例还提供了一种基于网络增速的虚假消息识别装置,包括计算机存储器、计算机处理器以及存储在计算机存储器中并可在计算机处理器上执行的计算机程序;
计算机存储器中存储有预测模型和分类器,计算机处理器执行计算机程序时实现上述基于网络增速的虚假消息识别方法。
实际应用中,计算机存储器可以为易失性存储器,如RAM,还可以是失性存储器,如ROM、FLASH、软盘、机械硬盘灯,还可以是存储云。计算机处理器可以为中央处理器(CPU)、微处理器(MPU)、数字信号处理器(DSP)或现场可编程门阵列(FPGA),即可以通过这些处理器实现对目标消息的识别步骤。
以上所述的实施例对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的具体实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种基于网络增速的虚假消息识别方法,其特征在于,包括以下步骤:
(1)记录n个等时间间隔的时刻t0,t1,...,tn下目标消息在社交网络中的用户传播情况,获得各个时间间隔内的用户增量矩阵ΔG1,...,ΔGn;通过以下步骤获得各个时间间隔内的用户增量矩阵:
(a)构建一个m×m的矩阵;m为该社交网络中用户的数量;
(b)确定t时刻下目标消息传播到的用户,在矩阵中目标消息传播到的用户的对应位置置1,目标消息未传播到的用户的对应位置置0,获得t时刻的传播矩阵;
(c)确定t+1时刻下目标消息传播到的用户,在矩阵中目标消息传播到的用户的对应位置置1,目标消息未传播到的用户的对应位置置0,获得t+1时刻的传播矩阵;
(d)将t+1时刻的传播矩阵与t时刻的传播矩阵相减,得到当前时间间隔内的用户增量矩阵;
(2)将ΔG1,...,ΔGn输入至训练好的预测模型中,获得下一个时间间隔内的用户增量矩阵ΔGn+1;所述的预测模型包括:
图卷积神经网络,对输入的各个时间间隔的用户增量矩阵提取特征向量;
长短期记忆网络,根据各个时间间隔的用户增量矩阵的特征向量其及时间先后顺序,预测得到下一时间间隔的用户增量矩阵;
(3)将ΔGn+1输入至训练好的分类器中进行二分类,识别目标消息的真伪;
n为大于或等于4的自然数。
2.根据权利要求1所述的基于网络增速的虚假消息识别方法,其特征在于,所述的预测模型中的图卷积神经网络有三层。
3.根据权利要求1所述的基于网络增速的虚假消息识别方法,其特征在于,所述的分类器包括全连接层和Softmax层;所述全连接层将网络的神经元个数减少至2,所述的Softmax层输出目标消息被分到每个类别的置信度。
4.根据权利要求1~3任一项所述的基于网络增速的虚假消息识别方法,其特征在于,通过以下步骤对所述的预测模型及分类器进行训练:
(ⅰ)将包含时间、结构和语言三个维度的谣言数据集作为训练集,将所述的谣言数据集中的数据处理成用户增量矩阵的形式;
(ⅱ)将处理成用户增量矩阵形式的谣言数据集分批次输入至图卷积神经网络中,得到每个批次对应的特征向量;
将获得的特征向量按照时间顺序输入到长短期记忆网络中,得到下一时刻间隔的特征向量;
将获得的下一时刻间隔的特征向量通过分类器,输出其预测类标,并将预测类标与真实类标对比,通过损失函数对预测类标和真实类标之间的差距进行刻画,并通过反向传播更新模型中的参数来拟合模型。
5.根据权利要求4所述的基于网络增速的虚假消息识别方法,其特征在于,所述的谣言数据集为论文《Prominent features of rumor propagation in online social media》中采用的谣言数据集。
6.根据权利要求4所述的基于网络增速的虚假消息识别方法,其特征在于,在对分类器进行训练时,以二分类结果的交叉熵作为损失函数。
7.一种基于网络增速的虚假消息识别装置,包括计算机存储器、计算机处理器以及存储在所述计算机存储器中并可在所述计算机处理器上执行的计算机程序,其特征在于,
所述计算机存储器中存储有预测模型和分类器,所述计算机处理器执行所述计算机程序时实现如权利要求1~6任一项所述的基于网络增速的虚假消息识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010315344.7A CN111428151B (zh) | 2020-04-20 | 2020-04-20 | 一种基于网络增速的虚假消息识别方法及其装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010315344.7A CN111428151B (zh) | 2020-04-20 | 2020-04-20 | 一种基于网络增速的虚假消息识别方法及其装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111428151A CN111428151A (zh) | 2020-07-17 |
CN111428151B true CN111428151B (zh) | 2022-05-17 |
Family
ID=71558217
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010315344.7A Active CN111428151B (zh) | 2020-04-20 | 2020-04-20 | 一种基于网络增速的虚假消息识别方法及其装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111428151B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112100515B (zh) * | 2020-09-04 | 2023-07-07 | 西北工业大学 | 一种用于社交媒体中假消息的检测方法 |
CN112819645B (zh) * | 2021-03-23 | 2024-03-29 | 大连民族大学 | 基于模体度的社交网络虚假信息传播检测方法 |
CN113283535B (zh) * | 2021-06-11 | 2024-03-29 | 浙江工业大学 | 一种融合多模态特征的虚假消息检测方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103258039A (zh) * | 2013-05-20 | 2013-08-21 | 中国地质大学(武汉) | 一种微博伪造信息的检测方法 |
CN107832353A (zh) * | 2017-10-23 | 2018-03-23 | 同济大学 | 一种社交媒体平台虚假信息识别方法 |
CN108830630A (zh) * | 2018-04-09 | 2018-11-16 | 平安科技(深圳)有限公司 | 一种虚假消息的识别方法及其设备 |
CN110362818A (zh) * | 2019-06-06 | 2019-10-22 | 中国科学院信息工程研究所 | 基于用户关系结构特征的微博谣言检测方法和系统 |
-
2020
- 2020-04-20 CN CN202010315344.7A patent/CN111428151B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103258039A (zh) * | 2013-05-20 | 2013-08-21 | 中国地质大学(武汉) | 一种微博伪造信息的检测方法 |
CN107832353A (zh) * | 2017-10-23 | 2018-03-23 | 同济大学 | 一种社交媒体平台虚假信息识别方法 |
CN108830630A (zh) * | 2018-04-09 | 2018-11-16 | 平安科技(深圳)有限公司 | 一种虚假消息的识别方法及其设备 |
CN110362818A (zh) * | 2019-06-06 | 2019-10-22 | 中国科学院信息工程研究所 | 基于用户关系结构特征的微博谣言检测方法和系统 |
Non-Patent Citations (1)
Title |
---|
一种改进的SEIR网络谣言传播模型研究;范纯龙等;《情报杂志》;20170318(第03期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111428151A (zh) | 2020-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11494648B2 (en) | Method and system for detecting fake news based on multi-task learning model | |
CN111428151B (zh) | 一种基于网络增速的虚假消息识别方法及其装置 | |
Hu et al. | Social spammer detection with sentiment information | |
CN112199608B (zh) | 基于网络信息传播图建模的社交媒体谣言检测方法 | |
CN104462592B (zh) | 基于不确定语义的社交网用户行为关系推演系统及方法 | |
CN105975504A (zh) | 一种基于循环神经网络的社交网络消息爆发检测方法及系统 | |
CN111460294A (zh) | 消息推送方法、装置、计算机设备及存储介质 | |
CN113422761B (zh) | 基于对抗学习的恶意社交用户检测方法 | |
Ramalingaiah et al. | Twitter bot detection using supervised machine learning | |
CN111641608A (zh) | 异常用户识别方法、装置、电子设备及存储介质 | |
CN113343126B (zh) | 基于事件与传播结构的谣言检测方法 | |
CN113191144B (zh) | 一种基于传播影响力的网络谣言识别系统及方法 | |
Bhattacharya et al. | Application of machine learning techniques in detecting fake profiles on social media | |
CN107392392A (zh) | 基于深度学习的微博转发预测方法 | |
Abinaya et al. | Spam detection on social media platforms | |
CN114896977A (zh) | 一种物联网实体服务信任值的动态评估方法 | |
CN115905572A (zh) | 一种对于推特用户的社交机器人检测方法及存储介质 | |
CN116244429A (zh) | 社交关系引导的多级特征交互融合的微博情感分析方法 | |
CN113157993A (zh) | 一种基于时序图极化分析的网络水军行为预警模型 | |
CN115495671A (zh) | 一种基于图结构迁移的跨领域谣言传播控制方法 | |
CN116091133A (zh) | 一种目标对象属性的识别方法、装置及存储介质 | |
Arumugam et al. | Machine Learning For Detecting Twitter Bot | |
Wen et al. | Fusion-based spammer detection method by embedding review texts and weak social relations | |
Foysal et al. | Classification of AI powered social bots on Twitter by sentiment analysis and data mining through SVM | |
Nicholas et al. | An Efficient Mechanism of Modified Sand Cat Swarm Optimization and DCNN For Detection of Spam In Online Social Media Network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |