CN113849598A - 基于深度学习的社交媒体虚假信息检测方法及检测系统 - Google Patents
基于深度学习的社交媒体虚假信息检测方法及检测系统 Download PDFInfo
- Publication number
- CN113849598A CN113849598A CN202111016642.7A CN202111016642A CN113849598A CN 113849598 A CN113849598 A CN 113849598A CN 202111016642 A CN202111016642 A CN 202111016642A CN 113849598 A CN113849598 A CN 113849598A
- Authority
- CN
- China
- Prior art keywords
- model
- network
- information detection
- text
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 106
- 238000013135 deep learning Methods 0.000 title claims abstract description 24
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 47
- 238000000034 method Methods 0.000 claims abstract description 43
- 230000003044 adaptive effect Effects 0.000 claims abstract description 34
- 239000000284 extract Substances 0.000 claims abstract description 5
- 239000013598 vector Substances 0.000 claims description 67
- 239000011159 matrix material Substances 0.000 claims description 55
- 238000012549 training Methods 0.000 claims description 55
- 230000004927 fusion Effects 0.000 claims description 52
- 230000008569 process Effects 0.000 claims description 34
- 230000006870 function Effects 0.000 claims description 23
- 238000012360 testing method Methods 0.000 claims description 13
- 230000007246 mechanism Effects 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 230000006855 networking Effects 0.000 claims description 4
- 238000011176 pooling Methods 0.000 claims description 4
- 230000000007 visual effect Effects 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000002996 emotional effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Business, Economics & Management (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Molecular Biology (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Image Analysis (AREA)
Abstract
本发明提供基于深度学习的社交媒体虚假信息检测方法及检测系统,通过采集社交媒体信息中的图像和文本数据,使用深度学习模型提取图像和文本的特征,利用分类模型检测信息的真实性。与现有的社交媒体虚假信息检测方法相比,本发明能充分提取社交媒体虚假信息中图像和文本的深层语义特征,通过卷积神经网络融合不同模态的特征,并使用域自适应网络移除不同事件特有的特征,增强虚假信息检测的鲁棒性。本发明能有效地提高社交媒体虚假信息检测的准确性。
Description
技术领域
本发明属于信息技术领域,具体涉及基于深度学习的社交媒体虚假信息检测方法及检测系统。
背景技术
随着我国经济发展和人民生活水平提升,互联网迅速普及到千家万户。截至2020年12月,我国网民规模达9.89亿,手机网民规模达9.86亿,互联网普及率达70.4%。微博、博客、论坛、播客等社交媒体已经成为大众获取实时信息、分享意见、发表观点的主要工具和平台。然而,随着越来越多的人热衷于在社交媒体上参与讨论热点话题,各种虚假信息也随之出现。群众的大量参与和网络社交媒体的实时更新,在带来高速信息流的同时也加速了虚假信息的传播。由于网络社交媒体使用门槛低,虚假信息普遍传播迅速,容易给公众带来困惑和不安,虚假信息甚至造成巨大的社会和经济损失。
现有的社交媒体虚假信息检测方法大多采用统计学或浅层的机器学习方法来实现。例如使用随机森林、支持向量机、回归模型等。随着虚假信息内容的复杂性越来越高,现有方法的检测准确率很难满足需求。其次,虚假信息检测的主要难点之一是训练数据集不涵盖新出现的事件,现有方法在新出现事件上的识别效果较差。此外,现有的方法大多只能检测单一语言的社交媒体平台。
发明内容
针对现有技术中的问题,本发明提供基于深度学习的社交媒体虚假信息检测方法及检测系统,通过提取社交媒体信息中图片和文本数据的语义特征,使用神经网络融合多模态的特征,利用虚假信息检测模型检测社交媒体信息的真实性,并通过域自适应网络模型提升检测的准确性。
为实现上述目的,本发明是通过以下技术方案实现的:
本发明提供基于深度学习的社交媒体虚假信息检测方法,其特殊之处在于:通过提取网络社交媒体信息中图片和文本数据的语义特征,使用多模态融合网络的特征,利用虚假信息检测模型检测社交媒体信息的真实性,并通过域自适应网络模型提升检测的准确性,具体按照以下步骤进行检测;
步骤1)信息收集:分别采集网络社交媒体中真实信息和虚假信息的原始图像和文本数据;
步骤2)在多模态融合网络中对步骤1中的原始图像和文本数据分别形成图像特征、文本统计特征、整句语义特征,并将图像特征、文本统计特征、整句语义特征形成三维特征向量,构建多模态融合特征;
步骤2.5)使用轻量化的深度卷积神经网络MoibleNet模型融合步骤2.4中的三维特征向量,得到每条信息的多模态融合特征,为多模态融合特征,为深度卷积神经网络MoibleNet模型的网络结构,为步骤2.4中获得的三维特征向量,为深度卷积神经网络MoibleNet模型的网络参数;
步骤6)利用步骤5中训练好的虚假信息检测模型对测试数据进行真实性检测。
进一步的,在步骤2.2中,在词嵌入模型中,使用在相同语种数据集上预先训练的单词嵌入提取器来生成每个单词的特征向量,每个单词的特征向量可以表示为,为单词的特征向量,为实数矩阵,k为矩阵的维度;一个具有n个单词的句子可以表示为: ,代表一个句子的特征向量,n代表句子中单词的数量,为实数矩阵, 为矩阵的维度;
进一步的,在步骤2.3中使用文本标识化器将文本信息分割为单词列表,然后使用多语言预训练的BERT模型来提取该文本信息的语义特征,选择BERT模型中最后一个维度为768×1的隐藏层参数作为文本的语义特征,为提取出的语义特征,为实数矩阵,为实数矩阵的维度。
进一步的,在步骤3中,构建虚假信息检测模型时,虚假信息检测模型在训练过程中按照深度学习自身的计算机制更新网络参数;
模型的计算机制公式如下:
其中:代表虚假信息检测模型的网络结构,代表虚假信息检测模型的网络参数,为深度卷积神经网络MoibleNet模型的网络结构,为步骤2.4中获得第i个信息对应的三维特征向量,为深度卷积神经网络MoibleNet模型的网络参数;输出代表信息的真实性概率,该概率取值的范围为0%—100%;
虚假信息检测模型识别一条信息的真实性,使用y来表示信息的真实度,并使用交叉熵函数来计算检测损失:
其中表示域自适应网络模型训练过程中的损失值,表示交叉熵函数,表示步骤2.4中获得的所有三维特征向量,K为所有事件分类的数量,为域自适应网络模型的网络结构,为深度卷积神经网络MoibleNet模型的网络结构,为步骤2.4中获得第i个信息对应的的三维特征向量,为深度卷积神经网络MoibleNet模型的网络参数,为域自适应网络模型的网络参数;
进一步的,将步骤2.5的所有多模态融合特征样本随机划分为训练样本集和测试样本集,利用训练样本集训练虚假信息检测模型和域自适应网络模型的训练过程中,虚假信息检测模型需要最小化损失来提升模型的准确率,而域自适应网络模型需要最大化损失来获取通用的事件特征;总体损失的公式如下:
在模型训练过程中,参数的更新方式如下:
其中,为总体损失,表示虚假信息检测模型训练过程中的损失值,表示域自适应网络模型训练过程中的损失值,为深度卷积神经网络MoibleNet模型的网络参数,代表虚假信息检测模型的网络参数,为域自适应网络模型的网络参数,为常量参数。
本发明还提供基于深度学习的社交媒体虚假信息检测系统,其特殊之处在于:
包括多模态融合网络、域自适应网络模型、虚假信息检测模型,其中多模态融合网络包括卷积神经网络VGG19模型、词嵌入模型、BERT模型、深度卷积神经网络MoibleNet模型,卷积神经网络VGG19模型用于提取图像特征,词嵌入模型提取词组序列中的文本统计特征,BERT模型提取文本的整句语义特征,深度卷积神经网络MoibleNet模型用于融合图像特征、文本统计特征、整句语义特征堆叠成三维特征向量,形成多模态融合特征;
进一步的,在该系统的词嵌入模型中,使用在相同语种数据集上预先训练的单词嵌入提取器来生成每个单词的特征向量,每个单词的特征向量可以表示为,为单词的特征向量,为实数矩阵,k为矩阵的维度;一个具有n个单词的句子可以表示为:,代表一个句子的特征向量,n代表句子中单词的数量,为实数矩阵, 为矩阵的维度;
进一步的,在该系统的BERT模型中,使用文本标识化器将文本信息分割为单词列表,然后使用多语言预训练的BERT模型来提取该文本信息的语义特征,选择BERT模型中最后一个维度为768×1的隐藏层参数作为文本的语义特征,为提取出的语义特征,为实数矩阵,为实数矩阵的维度。
进一步的,该系统的虚假信息检测模型由一层隐藏层组成,输入为社交媒体信息的多模态融合特征,输出为该信息的真实度,虚假信息检测模型在训练过程中按照深度学习自身的计算机制更新网络参数;模型的公式如下:
其中:代表虚假信息检测模型的网络结构,代表虚假信息检测模型的网络参数,为深度卷积神经网络MoibleNet模型的网络结构,为获得第i个信息对应的三维特征向量,为深度卷积神经网络MoibleNet模型的网络参数;输出代表信息的真实性概率,该概率取值的范围为0%—100%。
虚假信息检测模型旨在用于识别一条信息的真实性。使用y来表示信息的真实度,并使用交叉熵函数来计算检测损失:
进一步的,该系统的域自适应网络模型由一个梯度翻转层和两层隐藏层组成,输入为社交媒体信息的多模态融合特征,输出为该信息所属的事件分类。使用来表示信息的事件分类,并使用交叉熵函数来计算分类损失,域自适应网络模型在训练过程中按照深度学习自身的计算机制更新网络参数:
其中表示域自适应网络模型训练过程中的损失值,表示交叉熵函数,表示获得的所有三维特征向量,K为所有事件分类的数量,为域自适应网络模型的网络结构,为深度卷积神经网络MoibleNet模型的网络结构,为获得第i个信息对应的的三维特征向量,为深度卷积神经网络MoibleNet模型的网络参数,为域自适应网络模型的网络参数。
进一步的,所有多模态融合特征样本按照9:1的比例随机划分为训练样本集和测试样本集,利用训练样本集训练虚假信息检测模型和域自适应网络模型;在模型的训练过程中,虚假信息检测模型需要最小化损失来提升模型的准确率,而域自适应网络模型需要最大化损失来获取通用的事件特征。总体损失的公式如下:
在模型训练过程中,参数的更新方式如下:
其中,为总体损失,表示虚假信息检测模型训练过程中的损失值,表示域自适应网络模型训练过程中的损失值,为深度卷积神经网络MoibleNet模型的网络参数,代表虚假信息检测模型的网络参数,为域自适应网络模型的网络参数,为常量参数。
本发明与现有技术相比,其有益之处在于:
1、使用BERT模型提取文本信息的整句语义能获得更丰富的文本特征:
当某些热点事件发生时,公众会在社交媒体平台上大量转发同一张图片并配以自己的评论。这就意味着在判断信息的真实性时,文本中的信息比图片中的信息更重要。现有的社交媒体虚假信息检测方法,通常只采用Word2vec词嵌入模型等方法提取文本数据的数学统计特征,无法获取到用户的语义和情感信息。本发明使用多语言预训练的BERT模型处理文本信息,可以有效地提取文本中的语义信息。
2、使用卷积神经网络融合不同模态的特征,更好的利用图片和文本的语义联系:
现有的社交媒体虚假信息检测方法,在连接不同模态的特征向量时,大多采用直接连接的方法。由于图片和文本存在语义差异的问题,直接连接文本和图片的特征向量无法有效地将文本和图像中的特征结合起来。为此,本发明将提取的图像特征、文本统计特征、整句语义特征堆叠成三维向量,使用卷积神经网络从三维向量中提取融合特征,能有效地利用图片和文本之间的语义联系。
3、使用域自适应网络模型,移除不同事件信息的独有特征,有助于提高虚假信息检测的准确性:
社交媒体虚假信息检测的主要难点之一是训练数据集不涵盖新出现的事件,虚假信息检测模型只能帮助检测训练集上的虚假信息。因此,在不同事件的信息中提取更多的共享特征可以帮助模型学习到所有事件中的共同特征。为了实现这一目标,应计算不同事件之间的特征差异,并消除每个事件的独有特征。
附图说明
图1为本发明的原理示意图。
图2为卷积神经网络VGG19模型的结构图。
图3为BERT模型的结构图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
实施例1
本发明采用以下技术方案实现,参考图1-图3,以社交媒体信息中的马航M370事件为例对本发明技术方案进行详细介绍,本申请通过提取社交媒体信息中图片和文本数据的语义特征,采集有关马航M370事件信息的文本和图像数据后,使用神经网络融合多模态的特征,利用虚假信息检测模型检测社交媒体信息的真实性,并通过域自适应网络模型提升检测的准确性,本申请提供的基于深度学习的社交媒体虚假信息检测系统包括多模态融合网络、域自适应网络模型、虚假信息检测模型,其中多模态融合网络包括卷积神经网络VGG19模型、词嵌入模型、BERT模型、深度卷积神经网络MoibleNet模型,卷积神经网络VGG19模型用于提取图像特征,词嵌入模型提取词组序列中的文本统计特征,BERT模型提取文本的整句语义特征,MoibleNet模型用于融合图像特征、文本统计特征、整句语义特征堆叠成三维特征向量,形成多模态融合特征;
本申请的基于深度学习的社交媒体虚假信息检测系统具体按照以下步骤对马航M370事件信息进行检测:
步骤1)分别采集网络社交媒体中真实信息和虚假信息的原始图像和文本数据,本实施例的原始图像为马航事件相关的图片信息,文本数据,比如“M370终于被找到了”,带有马航飞机相关的图片。
步骤2)在多模态融合网络中对步骤1中的原始图像和文本数据分别形成图像特征、文本统计特征、整句语义特征,并将图像特征、文本统计特征、整句语义特征形成三维特征向量,构建多模态融合特征。
在构建多模态融合特征时按照如下过程进行:
步骤2.1)使用在ImageNet图像数据集上预训练的卷积神经网络VGG19模型提取图像特征,为提取出的图像特征,为实数矩阵,为实数矩阵的维度;为了防止VGG19模型过拟合,在特征提取过程冻结了VGG19模型的所有网络层权重参数,m、n均为自然数,本实施例的图像特征大小为4096×1。
步骤2.2)使用结巴分词模块分割文本语句,将语句按照词性分割成一组单词,此处的词性为名词、动词、形容词等,然后使用在相同语种上预训练的词嵌入模型提取单词序列中的文本统计特征,为提取出的文本统计特征,为实数矩阵,为实数矩阵的维度,m、n均为自然数,本实施例的文本统计特征大小为768×1。
在词嵌入模型中,使用在相同语种数据集上预先训练的单词嵌入提取器来生成每个单词的特征向量,每个单词的特征向量可以表示为,为单词的特征向量,为实数矩阵,k为矩阵的维度。一个具有n个单词的句子可以表示为: ,代表一个句子的特征向量,n代表句子中单词的数量,n为自然数,为实数矩阵,为矩阵的维度。
步骤2.3)使用文本标识化器将文本信息分割为单词列表,然后使用多语言预训练的BERT模型来提取该文本信息的语义特征,选择BERT模型中最后一个维度为768×1的隐藏层参数作为文本的语义特征,为提取出的语义特征,为实数矩阵,为实数矩阵的维度,本实施例的文本语义特征大小为768×1。
步骤2.5)使用轻量化的深度卷积神经网络MoibleNet模型融合步骤2.4中的三维特征向量,得到每条信息的多模态融合特征,为多模态融合特征,为深度卷积神经网络MoibleNet模型的网络结构,为步骤2.4中获得的三维特征向量,为深度卷积神经网络MoibleNet模型的网络参数。
步骤3)构建虚假信息检测模型,模型由一层隐藏层组成,输入为社交媒体信息的多模态融合特征,输出为该信息的真实度,虚假信息检测模型在训练过程中按照深度学习自身的计算机制更新网络参数。
模型的公式如下:
其中:代表虚假信息检测模型的网络结构,代表虚假信息检测模型的网络参数,为深度卷积神经网络MoibleNet模型的网络结构,为步骤2.4中获得第i个信息对应的三维特征向量,为深度卷积神经网络MoibleNet模型的网络参数。输出代表信息的真实性概率,该概率取值的范围为0%—100%。
虚假信息检测模型旨在识别一条信息的真实性。使用y来表示信息的真或假,并使用交叉熵函数来计算检测损失:
步骤4)构建域自适应网络模型,模型由一个梯度翻转层和两层隐藏层组成,输入为社交媒体信息的多模态融合特征,输出为该信息所属的事件分类。使用来表示信息的事件分类,并使用交叉熵函数来计算分类损失,域自适应网络模型在训练过程中按照深度学习自身的计算机制更新网络参数:
其中表示域自适应网络模型训练过程中的损失值,表示交叉熵函数,表示步骤2.4中获得的所有三维特征向量,K为所有事件分类的数量,为域自适应网络模型的网络结构,为深度卷积神经网络MoibleNet模型的网络结构,为步骤2.4中获得第i个信息对应的的三维特征向量,为深度卷积神经网络MoibleNet模型的网络参数,为域自适应网络模型的网络参数。
步骤5)将步骤2.5的所有多模态融合特征样本按照9:1的比例随机划分为训练样本集和测试样本集,利用训练样本集训练虚假信息检测模型和域自适应网络模型,比例还可以选择如8:2、7:3等,比例的选取随机。
总体损失的公式如下:
在模型训练过程中,参数的更新方式如下:
其中,为总体损失,表示虚假信息检测模型训练过程中的损失值,表示域自适应网络模型训练过程中的损失值,为深度卷积神经网络MoibleNet模型的网络参数,代表虚假信息检测模型的网络参数,为域自适应网络模型的网络参数,为一个常量参数。
步骤6)利用步骤5中训练好的虚假信息检测模型对测试数据进行真实性检测,以此来检测关于马航事件的图像信息及文本信息真实性,通过在两个公开社交媒体数据集微博和推特上验证效果,虚假信息的检测精度分别为0.907和0.828。验证了本发明具有较高的精度,能够应用于社交媒体虚假信息检测。
在本实施例中选用的关于马航MH370航班失事事件社交媒体信息进行说明,在事件发生后,推特、微博等网络社交媒体上涌现出大量关于马航MH370航班的帖子。这些帖子大多是人公众对此次事件的疑问、猜想以及别有用心的人发布的谣言。谣言以及虚假的新闻不仅包含被故意修改的图片,也包含与此次事件无关的真实图片,如过去真实发生的空难图片。所以图片的真实性无法直接作为判断帖子真实性的依据,图片与事件的关联性也是重要的因素。而帖子中的文本信息中包含了用户的看法、猜想和情感色彩,如对事件原因的猜测,对失事地点的猜测,以及疑惑,悲伤,愤怒等语气词。通过提取文本统计特征可以获取到文本信息中出现的时间、地点、人名等关键词出现的频次,通过提取文本语义特征可以获取到用户的感情色彩。
本发明在采集有关马航事件信息的文本和图像数据后,使用卷积神经网络VGG19模型提取图像的特征,使用词嵌入模型提取文本的统计特征,使用BERT模型提取文本的语义特征,进一步地使用深度卷积神经网络MoibleNet模型融合图像特征、文本统计特征、整句语义特征,得到该信息的三维融合特征向量。域自适应网络模型首先会通过三维融合特征综合计算图像特征、文本统计特征、整句语义特征与马航事件的关联性,之后虚假信息检测模型将利用三维融合特征和事件的关联性计算出该信息的真实性。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
Claims (7)
1.基于深度学习的社交媒体虚假信息检测方法,其特征在于:通过提取网络社交媒体信息中图片和文本数据的语义特征,使用多模态融合网络的特征,利用虚假信息检测模型检测社交媒体信息的真实性,并通过域自适应网络模型提升检测的准确性,具体按照以下步骤进行检测;
步骤1)信息收集:分别采集网络社交媒体中真实信息和虚假信息的原始图像和文本数据;
步骤2)在多模态融合网络中对步骤1中的原始图像和文本数据分别形成图像特征、文本统计特征、整句语义特征,并将图像特征、文本统计特征、整句语义特征形成三维特征向量,构建多模态融合特征;
步骤2.5)使用轻量化的深度卷积神经网络MoibleNet模型融合步骤2.4中的三维特征向量,得到每条信息的多模态融合特征,为多模态融合特征,为深度卷积神经网络MoibleNet模型的网络结构,为步骤2.4中获得的三维特征向量,为深度卷积神经网络MoibleNet模型的网络参数;
步骤6)利用步骤5中训练好的虚假信息检测模型对测试数据进行真实性检测。
2.如权利要求1所述的基于深度学习的社交媒体虚假信息检测方法,其特征在于:在步骤2.2中,在词嵌入模型中,使用在相同语种数据集上预先训练的单词嵌入提取器来生成每个单词的特征向量,每个单词的特征向量可以表示为,为单词的特征向量,为实数矩阵,k为矩阵的维度;一个具有n个单词的句子可以表示为: ,代表一个句子的特征向量,n代表句子中单词的数量,为实数矩阵, 为矩阵的维度;
4.如权利要求1所述的基于深度学习的社交媒体虚假信息检测方法,其特征在于:
在步骤3中,构建虚假信息检测模型时,虚假信息检测模型在训练过程中按照深度学习自身的计算机制更新网络参数;
模型的计算机制公式如下:
其中:代表虚假信息检测模型的网络结构,代表虚假信息检测模型的网络参数,为深度卷积神经网络MoibleNet模型的网络结构,为步骤2.4中获得第i个信息对应的三维特征向量,为深度卷积神经网络MoibleNet模型的网络参数;输出代表信息的真实性概率,该概率取值的范围为0%—100%;
虚假信息检测模型识别一条信息的真实性,使用y来表示信息的真实度,并使用交叉熵函数来计算检测损失:
5.如权利要求1所述的基于深度学习的社交媒体虚假信息检测方法,其特征在于:构建域自适应网络模型时使用来表示信息的事件分类,并使用交叉熵函数来计算分类损失,域自适应网络模型在训练过程中按照深度学习自身的计算机制更新网络参数:
其中表示域自适应网络模型训练过程中的损失值,表示交叉熵函数,表示步骤2.4中获得的所有三维特征向量,K为所有事件分类的数量,为域自适应网络模型的网络结构,为深度卷积神经网络MoibleNet模型的网络结构,为步骤2.4中获得第i个信息对应的的三维特征向量,为深度卷积神经网络MoibleNet模型的网络参数,为域自适应网络模型的网络参数;
6.如权利要求1所述的基于深度学习的社交媒体虚假信息检测方法,其特征在于:将步骤2.5的所有多模态融合特征样本随机划分为训练样本集和测试样本集,利用训练样本集训练虚假信息检测模型和域自适应网络模型的训练过程中,虚假信息检测模型需要最小化损失来提升模型的准确率,而域自适应网络模型需要最大化损失来获取通用的事件特征;总体损失的公式如下:
在模型训练过程中,参数的更新方式如下:
7.基于深度学习的社交媒体虚假信息检测系统,其特征在于:
包括多模态融合网络、域自适应网络模型、虚假信息检测模型,其中多模态融合网络包括卷积神经网络VGG19模型、词嵌入模型、BERT模型、深度卷积神经网络MoibleNet模型,卷积神经网络VGG19模型用于提取图像特征,词嵌入模型提取词组序列中的文本统计特征,BERT模型提取文本的整句语义特征,MoibleNet模型用于融合图像特征、文本统计特征、整句语义特征堆叠成三维特征向量,形成多模态融合特征;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111016642.7A CN113849598B (zh) | 2021-08-31 | 2021-08-31 | 基于深度学习的社交媒体虚假信息检测方法及检测系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111016642.7A CN113849598B (zh) | 2021-08-31 | 2021-08-31 | 基于深度学习的社交媒体虚假信息检测方法及检测系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113849598A true CN113849598A (zh) | 2021-12-28 |
CN113849598B CN113849598B (zh) | 2024-08-02 |
Family
ID=78976798
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111016642.7A Active CN113849598B (zh) | 2021-08-31 | 2021-08-31 | 基于深度学习的社交媒体虚假信息检测方法及检测系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113849598B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114579876A (zh) * | 2022-03-10 | 2022-06-03 | 中国科学院空天信息创新研究院 | 虚假信息检测方法、装置、设备及介质 |
CN114662586A (zh) * | 2022-03-18 | 2022-06-24 | 南京邮电大学 | 一种基于共注意的多模态融合机制检测虚假信息的方法 |
CN114722298A (zh) * | 2022-04-28 | 2022-07-08 | 兰州大学 | 一种基于多特征融合和标签关联的轻生检测方法及装置 |
CN116452939A (zh) * | 2023-05-11 | 2023-07-18 | 河海大学 | 基于多模态实体融合与对齐的社交媒体虚假信息检测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111414968A (zh) * | 2020-03-26 | 2020-07-14 | 西南交通大学 | 一种基于卷积神经网络特征图的多模态遥感影像匹配方法 |
CN112035669A (zh) * | 2020-09-09 | 2020-12-04 | 中国科学技术大学 | 基于传播异质图建模的社交媒体多模态谣言检测方法 |
US20210012199A1 (en) * | 2019-07-04 | 2021-01-14 | Zhejiang University | Address information feature extraction method based on deep neural network model |
CN112256945A (zh) * | 2020-11-06 | 2021-01-22 | 四川大学 | 一种基于深度神经网络的社交网络粤语谣言检测方法 |
CN113239926A (zh) * | 2021-06-17 | 2021-08-10 | 北京邮电大学 | 基于对抗的多模态虚假信息检测模型 |
-
2021
- 2021-08-31 CN CN202111016642.7A patent/CN113849598B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210012199A1 (en) * | 2019-07-04 | 2021-01-14 | Zhejiang University | Address information feature extraction method based on deep neural network model |
CN111414968A (zh) * | 2020-03-26 | 2020-07-14 | 西南交通大学 | 一种基于卷积神经网络特征图的多模态遥感影像匹配方法 |
CN112035669A (zh) * | 2020-09-09 | 2020-12-04 | 中国科学技术大学 | 基于传播异质图建模的社交媒体多模态谣言检测方法 |
CN112256945A (zh) * | 2020-11-06 | 2021-01-22 | 四川大学 | 一种基于深度神经网络的社交网络粤语谣言检测方法 |
CN113239926A (zh) * | 2021-06-17 | 2021-08-10 | 北京邮电大学 | 基于对抗的多模态虚假信息检测模型 |
Non-Patent Citations (1)
Title |
---|
金志威;曹娟;王博;王蕊;张勇东;: "融合多模态特征的社会多媒体谣言检测技术研究", 南京信息工程大学学报(自然科学版), no. 06, 28 November 2017 (2017-11-28) * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114579876A (zh) * | 2022-03-10 | 2022-06-03 | 中国科学院空天信息创新研究院 | 虚假信息检测方法、装置、设备及介质 |
CN114662586A (zh) * | 2022-03-18 | 2022-06-24 | 南京邮电大学 | 一种基于共注意的多模态融合机制检测虚假信息的方法 |
CN114722298A (zh) * | 2022-04-28 | 2022-07-08 | 兰州大学 | 一种基于多特征融合和标签关联的轻生检测方法及装置 |
CN114722298B (zh) * | 2022-04-28 | 2024-09-13 | 兰州大学 | 一种基于多特征融合和标签关联的轻生检测方法及装置 |
CN116452939A (zh) * | 2023-05-11 | 2023-07-18 | 河海大学 | 基于多模态实体融合与对齐的社交媒体虚假信息检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113849598B (zh) | 2024-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111079444B (zh) | 一种基于多模态关系的网络谣言检测方法 | |
CN113849598B (zh) | 基于深度学习的社交媒体虚假信息检测方法及检测系统 | |
CN110222163B (zh) | 一种融合cnn与双向lstm的智能问答方法及系统 | |
CN109543178B (zh) | 一种司法文本标签体系构建方法及系统 | |
CN110209897B (zh) | 智能对话方法、装置、存储介质及设备 | |
CN111414461B (zh) | 一种融合知识库与用户建模的智能问答方法及系统 | |
CN110569920B (zh) | 一种多任务机器学习的预测方法 | |
CN105975478A (zh) | 一种基于词向量分析的网络文章所属事件的检测方法和装置 | |
CN102929873A (zh) | 一种基于情境搜索提取搜索价值词的方法及装置 | |
CN105354216B (zh) | 一种中文微博话题信息处理方法 | |
CN106649258A (zh) | 一种智能的问答系统 | |
CN110728144B (zh) | 一种基于上下文语义感知的抽取式文档自动摘要方法 | |
CN106599824B (zh) | 一种基于情感对的gif动画情感识别方法 | |
CN113593661A (zh) | 临床术语标准化方法、装置、电子设备及存储介质 | |
CN108268470A (zh) | 一种基于演化聚类的评论文本分类提取方法 | |
CN108763355B (zh) | 一种基于用户的智能机器人交互数据处理系统及方法 | |
CN118035945B (zh) | 一种标签识别模型的处理方法和相关装置 | |
CN115221864A (zh) | 一种多模态假新闻检测方法及系统 | |
Polignano et al. | Identification Of Bot Accounts In Twitter Using 2D CNNs On User-generated Contents. | |
CN110347812A (zh) | 一种面向司法文本的搜索排序方法及系统 | |
Dwivedi et al. | Examining the emotional tone in politically polarized Speeches in India: An In-Depth analysis of two contrasting perspectives | |
CN113158673A (zh) | 单篇文档分析方法和装置 | |
Drishya et al. | Cyberbully image and text detection using convolutional neural networks | |
CN116049527A (zh) | 一种面向军事领域的社交网络特定目标账号挖掘方法 | |
Hajare et al. | A machine learning pipeline to examine political bias with congressional speeches |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |