CN110852368A - 全局与局部特征嵌入及图文融合的情感分析方法与系统 - Google Patents
全局与局部特征嵌入及图文融合的情感分析方法与系统 Download PDFInfo
- Publication number
- CN110852368A CN110852368A CN201911068737.6A CN201911068737A CN110852368A CN 110852368 A CN110852368 A CN 110852368A CN 201911068737 A CN201911068737 A CN 201911068737A CN 110852368 A CN110852368 A CN 110852368A
- Authority
- CN
- China
- Prior art keywords
- emotion
- image
- text
- global
- inputting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
Abstract
本发明公开了一种全局与局部特征嵌入及图文融合的情感分析方法与系统,该方法首先利用卷积神经网络提取图像的全局特征,同时利用迁移学习训练目标检测模型,对图像中携带情感的局部区域进行检测定位,提取局部区域特征并嵌入到全局特征共同训练图像情感分类模型,得到图像的情感极性概率。接着将文本表示为包含丰富语义信息的词向量,输入到可提取文本语义上下文特征的双向LSTM进行情感分类,得到文本的情感的极性概率。最后根据后期融合公式,得到图像及文本融合后的情感极性概率,进行图文情感分析。本发明能有效的关注图文的情感信息,并通过图像的全局与局部情感特征的提取以及文本信息的融合,提高图文情感分类的准确性和鲁棒性。
Description
技术领域
本发明涉及一种全局与局部特征嵌入及图文融合的情感分析方法与系统,尤其涉及社交媒体图文的情感分析,属于计算机视觉图像以及自然语言处理交叉的情感识别技术领域。
背景技术
图像与文字的情感分析是一项涉及计算机视觉、模式识别以及自然语言处理等多领域交叉的研究课题。随着互联网的不断发展,以及社交媒体的日益成熟,越来越多的互联网用户喜欢在微博,微信等社交平台分享自己的经历以及参与各种事件话题的讨论,社交网站已经成为互联网用户发表观点抒发感情的重要平台。通过分析用户在社交媒体上发布分享的观点及图片等挖掘用户的情感倾向,可以更好的理解用户的行为及预测市场的趋势。因此社交媒体用户的情感分析引起了学术界和工业界的广泛关注。
传统的情感分析工作主要的关注点是文本,随着社交媒体大量共享图片的社交方式的兴起,也出现了一些针对图片的情感分析的研究,因为图片中也同样包含着大量的情感信息,有时一张图片更能表达出用户的一些情感,然而由于社交媒体信息的多元化,有时候单一的文本或者图片很难表达出用户明显的情感倾向。因此需要综合图片和文本进行情感的分析。但是,就目前的情感分析方法而言,也面临着诸多问题,由于社交媒体的多元性,用户分享的图片内容存在多样性,单单提取图像的全局情感特征而忽略情感突出的局部情感对象,将很难把握图片所传达的用户的情感倾向,这都给社交媒体情感分析的研究带来了严峻的挑战。
发明内容
发明目的:针对以上问题,本发明提出一种全局与局部特征嵌入及图文融合的情感分析方法与系统。该方法结合图像全局与局部特征共同挖掘图片情感,进一步提高图片情感识别的准确率,并将文本的情感信息融合,解决了图像全局情感特征不够丰富且单一图片文本情感特征无法准确判断用户情感的问题,提高了社交媒体情感分析的准确性。
技术方案:本发明的目的通过以下技术方案实现:
全局与局部特征嵌入及图文融合的情感分析方法,包括如下步骤:
(1)将整张图像输入到卷积神经网络模型中,进行图像全局特征的提取,得到表示图像全局信息的特征向量;
(2)利用目标检测数据集预训练目标检测模型,通过迁移学习,利用情感图像数据集再次训练目标检测模型,从而获得能检测出图像中携带情感的局部区域的情感对象检测模型,将整张图像输入情感对象检测模型,提取检测定位到情感对象的局部区域特征向量;
(3)将步骤(1)和步骤(2)得到的全局特征向量与局部特征向量进行拼接,最终每张图像可表示为一组更为丰富的情感特征,然后将拼接后的联合情感特征输入到全连接层,并通过softmax分类器进行分类,得到图像的情感极性概率;
(4)利用词嵌入技术,将文本输入到词向量模型中,得到文本的词向量表示,并输入到双向长短期记忆网络(Long Short-Term Memory,LSTM)中训练得到文本情感分类模型,得到文本的情感极性概率;
(5)将步骤(3)得到的图像的情感极性概率与步骤(4)得到的文本的情感极性概率根据模型融合公式赋予不同的权重后相加,最终得到图文融合的整体情感极性。
作为优选,所述的步骤(1)采用VGGNet-16框架提取全局图像特征。通过该模型框架提取的全局特征向量记为G。
作为优选,所述的步骤(2)中包括:
(2.1)利用目标检测数据集预训练目标检测模型Faster-RCNN,获得训练后的模型参数;
(2.2)通过迁移学习的策略来克服目标检测数据集与图像情感数据集之间的差异,利用情感图像数据集再次训练目标检测模型,对其进行微调训练,从而获得能够检测图像中携带情感的目标对象的情感对象检测模型;
(2.3)将图像输入到情感对象检测模型中,经过一系列卷积池化后得到特征图,将特征图输入到RPN(Region Proposal Networks)网络中,该网络用来提取情感局部区域的候选框,将RPN输出的候选框信息与之前卷积输出的特征图进行映射,得到定位的局部区域的情感特征,并将其输入到ROI(Region Of Interest)层,得到固定大小的特征图,再经过两层全连接层,得到局部情感特征向量;假定检测到的某一局部区域特征向量为Li,则检测到的前N个局部区域可表示为特征向量集{L1 L2 L3····LN},其中N表示检测到局部区域的个数,LN表示第N个局部区域表示的特征向量。
作为优选,将图像的全局特征G和包含情感对象的局部特征{L1 L2 L3····LN}两组特征进行拼接,得到一组更为丰富的情感特征向量U={G,L1,L2,L3…LN};将拼接后的联合情感特征U输入到全连接层,并通过softmax分类器进行分类,得到图片情感极性概率P1。
作为优选,所述的步骤(4)包括:
(4.1)利用词嵌入技术Word2Vec工具将社交媒体的文本信息表示为包含丰富语义信息的词向量特征,其模型结构首先通过神经网络训练出指定维度的词向量,再计算单词与单词之间的欧式距离从而表示出不同单词之间的相似性,最后将意思相近的词汇映射到向量空间中相似的位置;
(4.2)将步骤(4.1)中的词向量特征输入到双向LSTM网络中,两个反向的LSTM单元对文本序列进行从前往后以及从后往前的特征提取,连接两个方向最后一个LSTM单元的隐含层输出作为最终的文本特征表示,将其输入到全连接层,进行降维处理,全连接层采用Dropout技术防止过拟合;
(4.3)将全连接层输出的特征输入到sigmoid函数中进行情感分类,sigmoid函数定义如下
其中x是输入特征,sigmoid函数将输入的特征映射到0到1之间。
作为优选,所述的步骤(5)中由于文本特征与图像特征在维度上有着较大的差异,根据后期融合的模型思想,设计模型融合公式,将步骤(3)中得到的图像的情感极性概率与步骤(4)得到的文本的情感极性概率输入到模型融合公式,其融合公式如下:
P=wP1+(1-w)P2 w∈(0,1)
其中P1为图像的情感极性概率,P2为文本的情感极性概率,w为融合权重,其中w根据样本数据的预测情感类别与真实情感类别的损失函数,采用梯度下降法自学习得到;P为图像与文本融合后的情感极性概率;若P≥0.5,则图文情感为积极的情感,若P<0.5,则表达为消极的情感。
本发明另一方面提供一种全局与局部特征嵌入及图文融合的情感分析系统,包括:
全局特征提取模块,用于将整张图像输入到VGGNet-16卷积神经网络模型中,进行图像全局特征的提取,得到表示图像全局信息的特征向量;
局部特征提取模块,用于利用目标检测数据集预训练目标检测模型,通过迁移学习,利用情感图像数据集再次训练目标检测模型,从而获得能检测出图像中携带情感的局部区域的情感对象检测模型,将整张图像输入情感对象检测模型,提取检测定位到情感对象的局部区域特征向量;
图像情感分类模块,用于将得到的全局特征向量与局部特征向量进行拼接,然后将拼接后的联合情感特征输入到全连接层,并通过softmax分类器进行分类,得到图像的情感极性概率;
文本情感分类模块,用于利用词嵌入技术,将文本输入到词向量模型中,得到文本的词向量表示,并输入到双向长短期记忆网络中训练得到文本情感分类模型,将图像对应的描述文本输入到文本情感分类模型得到文本的情感极性概率;
以及,情感识别模块,用于将图像的情感极性概率和文本的情感极性概率根据模型融合公式赋予不同的权重后相加,最终得到图文融合的整体情感极性。
本发明另一方面提供一种全局与局部特征嵌入及图文融合的情感分析系统,包括至少一台计算机设备,所述计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的全局与局部特征嵌入及图文融合的情感分析方法。
有益效果:与现有技术相比,本发明全局与局部特征嵌入及图文融合的情感分析方法,在图像情感分类模型中将情感突出的局部对象特征嵌入到全局的情感特征中,增强了图像情感特征的表示,相比于单一的全局情感特征更能准确的挖掘图片的情感倾向。同时通过学习情感权重将文本的情感信息与图片的情感信息进行后期融合。相较于之前的工作,在一定程度上提高了图文情感分析的准确度。
附图说明
图1是本发明全局与局部特征嵌入及图文融合的情感分析方法的流程示意图。
具体实施方式
下面结合附图对本发明的技术方案进行详细说明:
如图1所示,本发明实施例公开一种全局与局部特征嵌入及图文融合的情感分析方法,利用卷积神经网络提取图像的全局特征,同时利用目标检测数据集预训练目标检测模型,通过迁移学习利用情感图像数据集再次训练目标检测模型,对图像中携带情感的有效目标区域进行检测定位,提取检测定位到的局部区域特征,再将提取到的局部区域特征嵌入到从图像全局抽取的深层特征来共同训练图像情感分类模型,得到图像的情感极性概率。接着通过训练词向量模型将文本表示为包含丰富语义信息的词向量,将其输入到可提取文本语义上下文特征的双向长短期记忆网络;训练文本情感分类模型,得到文本的情感的极性概率。最后根据后期融合的模型思想,设计模型融合公式融合图像和文本两个模型,得到图像及文本融合后的情感极性概率。下面详细介绍本实施例的全局与局部特征嵌入及图文融合的情感分析方法的过程,具体包括如下步骤:
步骤A,将待提取全局特征的整张图像输入深度卷积神经网络VGGNet-16[K.Simonyan,A.Zisseman,"Very Deep Convolutional Networks for Large-ScaleImage Recognition."CVPR,2014],图片输入尺寸为224*224,该网络由13个卷积层和3个全连接组成,采用大小为3*3的卷积核,步幅和填充均为1*1,经过最后一个全连接层得到一个表示图像全局信息的特征向量G。
步骤B,利用目标检测数据集预训练目标检测模型,通过迁移学习,利用情感图像数据集再次训练目标检测模型,从而获得更好的能检测出图像中携带情感的局部区域的情感对象检测模型,将整张图像输入情感对象检测模型提取检测定位到情感对象的局部区域特征向量。具体包括:
步骤B1,利用目标检测模型Faster-RCNN[S.Ren,K.He,R.Girshick,andJ.Sun.Faster r-cnn:Towards real-time object detection with region proposalnetworks.arXiv preprint arXiv:1506.01497,2015]在目标检测数据集PASCAL VOC2007上进行预训练,获得训练后的模型参数。
步骤B2,利用步骤B1训练得到的参数,通过迁移学习策略,利用情感图像数据集Twitter再次训练目标检测模型。来克服目标检测数据集与图像情感数据集之间的差异,从而能够获得更好的图像中携带情感的目标对象的局部区域。该情感数据集Twitter中的一条数据包含有图片及其文字描述,其中积极情感数据769条,消极情感数据500条。利用ImageLab标注工具对情感图像数据集中的对象进行目标检测标注,此时数据集既包含情感标签也包含目标检测标签。
步骤B3,将图像输入到情感对象检测模型中,该模型的提取特征模块的网络架构与VGGNet-16的网络架构相同,保证后续拼接的一致性,经过一系列卷积池化后得到特征图,将特征图输入到RPN(Region Proposal Networks)网络中,该网络用来提取情感局部区域的候选框,将RPN输出的候选框信息与之前卷积输出的特征图进行映射,得到定位的局部区域的情感特征,并将其输入到ROI(Region Of Interest)层,得到固定大小的特征图,再经过两层全连接层,得到与步骤A全局特征相同维度的局部情感特征。假定检测到的某一局部区域特征向量为Li,则检测到的前N个局部区域可表示为特征向量集{L1 L2 L3····LN},其中N表示检测到局部区域的个数,LN表示第N个局部区域表示的特征向量。
步骤C,将步骤A与步骤B得到的全局特征向量与局部特征向量进行拼接,最终每张图像可表示为一组更为丰富的情感特征向量U={G,L1,L2,L3····LN},然后将拼接后的联合情感特征输入到全连接层,并通过softmax分类器进行分类,得到图像的情感极性概率P1。
步骤D,利用词嵌入技术,将文本输入到词向量模型中,得到文本的词向量表示,并输入到Bi-LSTM中训练得到文本情感分类模型;将图像对应的描述文本输入到文本情感分类模型得到文本的情感极性概率。具体包括:
步骤D1,利用词嵌入技术Word2Vec工具将社交媒体的文本信息表示为包含丰富语义信息的词向量特征,其模型结构首先通过神经网络训练出指定维度的词向量,再计算单词与单词之间的欧式距离从而表示出不同单词之间的相似性,最后将意思相近的词汇映射到向量空间中相似的位置。
步骤D2,将步骤D1中的词向量特征输入到双向LSTM网络中,两个反向的LSTM单元对文本序列进行从前往后以及从后往前的特征提取,连接两个方向最后一个LSTM单元的隐含层输出作为最终的文本特征表示,将其输入到全连接层,进行降维处理,全连接层采用Dropout技术防止过拟合。
步骤D3,将全连接层的输出的特征输入到sigmoid函数中进行情感分类,得到文本情感极性概率P2。其中sigmoid函数定义如下
其中x是输入特征,sigmoid函数将输入的特征映射到0到1之间。
步骤E,根据后期融合的模型思想,设计模型融合公式,将步骤C中得到的图像情感极性概率P1与步骤D得到的文本情感极性概率P2输入到模型融合公式,其融合公式如下:
P=wP1+(1-w)P2 w∈(0,1)
其中,w为融合权重,P为图像与文本融合后的情感极性概率。若P≥0.5,则图文情感为积极的情感,若P<0.5,则表达为消极的情感。由此得到最终的图像与文本融合的情感分析方法。
其中w根据样本数据的预测情感类别与真实情感类别的损失函数,采用梯度下降法自学习得到。模型学习的目的为找出最优的模型参数w,使得预测情感类别和实际情感类别yi的差异最小。本发明给出的全局损失函数为:
本发明另一实施例公开的一种全局与局部特征嵌入及图文融合的情感分析系统,包括全局特征提取模块,用于将整张图像输入到VGGNet-16卷积神经网络模型中,进行图像全局特征的提取,得到表示图像全局信息的特征向量;局部特征提取模块,用于利用目标检测数据集预训练目标检测模型,通过迁移学习,利用情感图像数据集再次训练目标检测模型,从而获得能检测出图像中携带情感的局部区域的情感对象检测模型,将整张图像输入情感对象检测模型,提取检测定位到情感对象的局部区域特征向量;图像情感分类模块,用于将得到的全局特征向量与局部特征向量进行拼接,然后将拼接后的联合情感特征输入到全连接层,并通过softmax分类器进行分类,得到图像的情感极性概率;文本情感分类模块,用于利用词嵌入技术,将文本输入到词向量模型中,得到文本的词向量表示,并输入到双向长短期记忆网络中训练得到文本情感分类模型,将图像对应的描述文本输入到文本情感分类模型得到文本的情感极性概率;以及,情感识别模块,用于将图像的情感极性概率和文本的情感极性概率根据模型融合公式赋予不同的权重后相加,最终得到图文融合的整体情感极性。
上述全局与局部特征嵌入及图文融合的情感分析系统实施例可以用于执行上述全局与局部特征嵌入及图文融合的情感分析方法实施例,其技术原理、所解决的技术问题及产生的技术效果相似,上述描述的全局与局部特征嵌入及图文融合的情感分析的具体工作过程及有关说明,可以参考前述全局与局部特征嵌入及图文融合的情感分析方法实施例中的对应过程,在此不再赘述。
本领域技术人员可以理解,可以对实施例中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个系统中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。
基于相同的发明构思,本发明实施例还提供一种全局与局部特征嵌入及图文融合的情感分析系统,包括至少一台计算机设备,所述计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的全局与局部特征嵌入及图文融合的情感分析方法。
以上实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。
Claims (8)
1.全局与局部特征嵌入及图文融合的情感分析方法,其特征在于,包括如下步骤:
(1)将整张图像输入到卷积神经网络模型中,进行图像全局特征的提取,得到表示图像全局信息的特征向量;
(2)利用目标检测数据集预训练目标检测模型,通过迁移学习,利用情感图像数据集再次训练目标检测模型,从而获得能检测出图像中携带情感的局部区域的情感对象检测模型,将整张图像输入情感对象检测模型,提取检测定位到情感对象的局部区域特征向量;
(3)将步骤(1)和步骤(2)得到的全局特征向量与局部特征向量进行拼接,然后将拼接后的联合情感特征输入到全连接层,并通过softmax分类器进行分类,得到图像的情感极性概率;
(4)利用词嵌入技术,将文本输入到词向量模型中,得到文本的词向量表示,并输入到双向长短期记忆网络中训练得到文本情感分类模型,将图像对应的描述文本输入到文本情感分类模型得到文本的情感极性概率;
(5)将步骤(3)得到的图像的情感极性概率与步骤(4)得到的文本的情感极性概率根据模型融合公式赋予不同的权重后相加,最终得到图文融合的整体情感极性。
2.根据权利要求1所述的全局与局部特征嵌入及图文融合的情感分析方法,其特征在于,所述的步骤(1)采用VGGNet-16框架提取全局图像特征。
3.根据权利要求1所述的全局与局部特征嵌入及图文融合的情感分析方法,其特征在于,所述的步骤(2)包括:
(2.1)利用目标检测数据集预训练目标检测模型Faster-RCNN,获得训练后的模型参数;
(2.2)通过迁移学习的策略来克服目标检测数据集与图像情感数据集之间的差异,利用情感图像数据集再次训练目标检测模型,对其进行微调训练,从而获得能够检测图像中携带情感的目标对象的情感对象检测模型;
(2.3)将图像输入到情感对象检测模型,首先经过一系列卷积池化后得到特征图,再将特征图输入到RPN网络中,该网络用来提取情感局部区域的候选框,将RPN输出的候选框信息与之前卷积输出的特征图进行映射,得到定位的局部区域的情感特征,并将其输入到ROI层,得到固定大小的特征图,最后再经过两层全连接层,得到局部情感特征向量;假定检测到的某一局部区域特征向量为Li,则检测到的前N个局部区域可表示为特征向量集{L1 L2L3····LN},其中N表示检测到局部区域的个数,LN表示第N个局部区域表示的特征向量。
4.根据权利要求1所述的全局与局部特征嵌入及图文融合的情感分析方法,其特征在于,所述的步骤(3)中将图像的全局特征G和包含情感对象的局部特征{L1 L2 L3····LN}两组特征进行拼接,得到一组更为丰富的情感特征向量U={G,L1,L2,L3…LN};将拼接后的联合情感特征U输入到全连接层,并通过softmax分类器进行分类,得到图像的情感极性概率。
5.根据权利要求1所述的全局与局部特征嵌入及图文融合的情感分析方法,其特征在于,所述的步骤(4)包括:
(4.1)利用词嵌入技术Word2Vec工具将社交媒体的文本信息表示为包含语义信息的词向量特征,其模型结构首先通过神经网络训练出指定维度的词向量,再计算单词与单词之间的欧式距离从而表示出不同单词之间的相似性,最后将意思相近的词汇映射到向量空间中相似的位置;
(4.2)将步骤(4.1)中的词向量特征输入到双向LSTM网络中,两个反向的LSTM单元对文本序列进行从前往后以及从后往前的特征提取,连接两个方向最后一个LSTM单元的隐含层输出作为最终的文本特征表示,将其输入到全连接层,进行降维处理,全连接层采用Dropout技术防止过拟合。
(4.3)将全连接层输出的特征输入到sigmoid函数中进行情感分类,得到文本情感极性概率,sigmoid函数定义如下
其中x是输入特征,sigmoid函数将输入的特征映射到0到1之间。
6.根据权利要求1所述的全局与局部特征嵌入及图文融合的情感分析方法,其特征在于,所述的步骤(5)中将步骤(3)中得到的图像情感极性概率与步骤(4)得到的文本的情感极性概率输入到模型融合公式,其融合公式如下:
P=wP1+(1-w)P2 w∈(0,1)
其中P1为图像的情感极性概率,P2为文本的情感极性概率,w为融合权重,其中w根据样本数据的预测情感类别与真实情感类别的损失函数,采用梯度下降法自学习得到;P为图像与文本融合后的情感极性概率;若P≥0.5,则图文情感为积极的情感,若P<0.5,则表达为消极的情感。
7.全局与局部特征嵌入及图文融合的情感分析系统,其特征在于,包括:
全局特征提取模块,用于将整张图像输入到VGGNet-16卷积神经网络模型中,进行图像全局特征的提取,得到表示图像全局信息的特征向量;
局部特征提取模块,用于利用目标检测数据集预训练目标检测模型,通过迁移学习,利用情感图像数据集再次训练目标检测模型,从而获得能检测出图像中携带情感的局部区域的情感对象检测模型,将整张图像输入情感对象检测模型,提取检测定位到情感对象的局部区域特征向量;
图像情感分类模块,用于将得到的全局特征向量与局部特征向量进行拼接,然后将拼接后的联合情感特征输入到全连接层,并通过softmax分类器进行分类,得到图像的情感极性概率;
文本情感分类模块,用于利用词嵌入技术,将文本输入到词向量模型中,得到文本的词向量表示,并输入到双向长短期记忆网络中训练得到文本情感分类模型,将图像对应的描述文本输入到文本情感分类模型得到文本的情感极性概率;
以及,情感识别模块,用于将图像的情感极性概率和文本的情感极性概率根据模型融合公式赋予不同的权重后相加,最终得到图文融合的整体情感极性。
8.全局与局部特征嵌入及图文融合的情感分析系统,其特征在于,包括至少一台计算机设备,所述计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1-6任一项所述的全局与局部特征嵌入及图文融合的情感分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911068737.6A CN110852368B (zh) | 2019-11-05 | 2019-11-05 | 全局与局部特征嵌入及图文融合的情感分析方法与系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911068737.6A CN110852368B (zh) | 2019-11-05 | 2019-11-05 | 全局与局部特征嵌入及图文融合的情感分析方法与系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110852368A true CN110852368A (zh) | 2020-02-28 |
CN110852368B CN110852368B (zh) | 2022-08-26 |
Family
ID=69598360
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911068737.6A Active CN110852368B (zh) | 2019-11-05 | 2019-11-05 | 全局与局部特征嵌入及图文融合的情感分析方法与系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110852368B (zh) |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111563190A (zh) * | 2020-04-07 | 2020-08-21 | 中国电子科技集团公司第二十九研究所 | 一种区域网络用户行为的多维度分析与监管方法及系统 |
CN111581966A (zh) * | 2020-04-30 | 2020-08-25 | 华南师范大学 | 一种融合上下文特征方面级情感分类方法和装置 |
CN111612090A (zh) * | 2020-05-29 | 2020-09-01 | 中国科学技术大学 | 基于内容颜色交叉相关的图像情感分类方法 |
CN111626889A (zh) * | 2020-06-02 | 2020-09-04 | 小红书科技有限公司 | 社交内容对应的类目预测方法及装置 |
CN111832573A (zh) * | 2020-06-12 | 2020-10-27 | 桂林电子科技大学 | 一种基于类激活映射和视觉显著性的图像情感分类方法 |
CN111860670A (zh) * | 2020-07-28 | 2020-10-30 | 平安科技(深圳)有限公司 | 域自适应模型训练、图像检测方法、装置、设备及介质 |
CN112101380A (zh) * | 2020-08-28 | 2020-12-18 | 合肥工业大学 | 基于图文匹配的产品点击率预测方法和系统、存储介质 |
CN112651448A (zh) * | 2020-12-29 | 2021-04-13 | 中山大学 | 一种面向社交平台表情包的多模态情感分析方法 |
CN112801219A (zh) * | 2021-03-22 | 2021-05-14 | 华南师范大学 | 一种多模态情感分类方法、装置及设备 |
CN113157998A (zh) * | 2021-02-28 | 2021-07-23 | 江苏匠算天诚信息科技有限公司 | 通过ip巡检网站、并判断网站类别的方法、系统、设备及介质 |
CN113177111A (zh) * | 2021-05-28 | 2021-07-27 | 中国人民解放军国防科技大学 | 中文文本情感分析方法、装置、计算机设备和存储介质 |
CN113239981A (zh) * | 2021-04-23 | 2021-08-10 | 中国科学院大学 | 局部特征耦合全局表征的图像分类方法 |
CN113362227A (zh) * | 2021-06-22 | 2021-09-07 | 北京百度网讯科技有限公司 | 图像处理方法、装置、电子设备及存储介质 |
CN113449085A (zh) * | 2021-09-02 | 2021-09-28 | 华南师范大学 | 多模态情感分类方法、装置以及电子设备 |
CN113590918A (zh) * | 2021-07-12 | 2021-11-02 | 电子科技大学 | 基于课程式学习的社交媒体舆情热度监测的框架构建方法 |
CN113627550A (zh) * | 2021-08-17 | 2021-11-09 | 北京计算机技术及应用研究所 | 一种基于多模态融合的图文情感分析方法 |
CN113672731A (zh) * | 2021-08-02 | 2021-11-19 | 北京中科闻歌科技股份有限公司 | 基于领域信息的情感分析方法、装置、设备及存储介质 |
WO2022156084A1 (zh) * | 2021-01-22 | 2022-07-28 | 平安科技(深圳)有限公司 | 基于人脸和交互文本的目标对象行为预测方法及相关设备 |
CN115100390A (zh) * | 2022-08-24 | 2022-09-23 | 华东交通大学 | 一种联合对比学习与自监督区域定位的图像情感预测方法 |
CN115187996A (zh) * | 2022-09-09 | 2022-10-14 | 中电科新型智慧城市研究院有限公司 | 语义识别方法、装置、终端设备和存储介质 |
CN115187579A (zh) * | 2022-08-11 | 2022-10-14 | 北京医准智能科技有限公司 | 一种图像类别判定方法、装置及电子设备 |
CN115761569A (zh) * | 2022-10-20 | 2023-03-07 | 之江实验室 | 一种基于情感分类的视频情感定位方法 |
CN116383770A (zh) * | 2023-06-05 | 2023-07-04 | 中国科学院空天信息创新研究院 | 环境质量检测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107092596A (zh) * | 2017-04-24 | 2017-08-25 | 重庆邮电大学 | 基于attention CNNs和CCR的文本情感分析方法 |
CN107679580A (zh) * | 2017-10-21 | 2018-02-09 | 桂林电子科技大学 | 一种基于多模态深度潜在关联的异构迁移图像情感极性分析方法 |
CN108388544A (zh) * | 2018-02-10 | 2018-08-10 | 桂林电子科技大学 | 一种基于深度学习的图文融合微博情感分析方法 |
CN110059188A (zh) * | 2019-04-11 | 2019-07-26 | 四川黑马数码科技有限公司 | 一种基于双向时间卷积网络的中文情感分析方法 |
-
2019
- 2019-11-05 CN CN201911068737.6A patent/CN110852368B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107092596A (zh) * | 2017-04-24 | 2017-08-25 | 重庆邮电大学 | 基于attention CNNs和CCR的文本情感分析方法 |
CN107679580A (zh) * | 2017-10-21 | 2018-02-09 | 桂林电子科技大学 | 一种基于多模态深度潜在关联的异构迁移图像情感极性分析方法 |
CN108388544A (zh) * | 2018-02-10 | 2018-08-10 | 桂林电子科技大学 | 一种基于深度学习的图文融合微博情感分析方法 |
CN110059188A (zh) * | 2019-04-11 | 2019-07-26 | 四川黑马数码科技有限公司 | 一种基于双向时间卷积网络的中文情感分析方法 |
Cited By (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111563190A (zh) * | 2020-04-07 | 2020-08-21 | 中国电子科技集团公司第二十九研究所 | 一种区域网络用户行为的多维度分析与监管方法及系统 |
CN111581966A (zh) * | 2020-04-30 | 2020-08-25 | 华南师范大学 | 一种融合上下文特征方面级情感分类方法和装置 |
CN111581966B (zh) * | 2020-04-30 | 2023-04-21 | 华南师范大学 | 一种融合上下文特征方面级情感分类方法和装置 |
CN111612090A (zh) * | 2020-05-29 | 2020-09-01 | 中国科学技术大学 | 基于内容颜色交叉相关的图像情感分类方法 |
CN111612090B (zh) * | 2020-05-29 | 2022-09-06 | 中国科学技术大学 | 基于内容颜色交叉相关的图像情感分类方法 |
CN111626889A (zh) * | 2020-06-02 | 2020-09-04 | 小红书科技有限公司 | 社交内容对应的类目预测方法及装置 |
CN111832573A (zh) * | 2020-06-12 | 2020-10-27 | 桂林电子科技大学 | 一种基于类激活映射和视觉显著性的图像情感分类方法 |
CN111832573B (zh) * | 2020-06-12 | 2022-04-15 | 桂林电子科技大学 | 一种基于类激活映射和视觉显著性的图像情感分类方法 |
CN111860670A (zh) * | 2020-07-28 | 2020-10-30 | 平安科技(深圳)有限公司 | 域自适应模型训练、图像检测方法、装置、设备及介质 |
CN112101380A (zh) * | 2020-08-28 | 2020-12-18 | 合肥工业大学 | 基于图文匹配的产品点击率预测方法和系统、存储介质 |
CN112101380B (zh) * | 2020-08-28 | 2022-09-02 | 合肥工业大学 | 基于图文匹配的产品点击率预测方法和系统、存储介质 |
CN112651448B (zh) * | 2020-12-29 | 2023-09-15 | 中山大学 | 一种面向社交平台表情包的多模态情感分析方法 |
CN112651448A (zh) * | 2020-12-29 | 2021-04-13 | 中山大学 | 一种面向社交平台表情包的多模态情感分析方法 |
WO2022156084A1 (zh) * | 2021-01-22 | 2022-07-28 | 平安科技(深圳)有限公司 | 基于人脸和交互文本的目标对象行为预测方法及相关设备 |
CN113157998A (zh) * | 2021-02-28 | 2021-07-23 | 江苏匠算天诚信息科技有限公司 | 通过ip巡检网站、并判断网站类别的方法、系统、设备及介质 |
CN112801219B (zh) * | 2021-03-22 | 2021-06-18 | 华南师范大学 | 一种多模态情感分类方法、装置及设备 |
CN112801219A (zh) * | 2021-03-22 | 2021-05-14 | 华南师范大学 | 一种多模态情感分类方法、装置及设备 |
CN113239981B (zh) * | 2021-04-23 | 2022-04-12 | 中国科学院大学 | 局部特征耦合全局表征的图像分类方法 |
CN113239981A (zh) * | 2021-04-23 | 2021-08-10 | 中国科学院大学 | 局部特征耦合全局表征的图像分类方法 |
CN113177111A (zh) * | 2021-05-28 | 2021-07-27 | 中国人民解放军国防科技大学 | 中文文本情感分析方法、装置、计算机设备和存储介质 |
CN113362227A (zh) * | 2021-06-22 | 2021-09-07 | 北京百度网讯科技有限公司 | 图像处理方法、装置、电子设备及存储介质 |
CN113362227B (zh) * | 2021-06-22 | 2023-07-21 | 北京百度网讯科技有限公司 | 图像处理方法、装置、电子设备及存储介质 |
CN113590918A (zh) * | 2021-07-12 | 2021-11-02 | 电子科技大学 | 基于课程式学习的社交媒体舆情热度监测的框架构建方法 |
CN113672731A (zh) * | 2021-08-02 | 2021-11-19 | 北京中科闻歌科技股份有限公司 | 基于领域信息的情感分析方法、装置、设备及存储介质 |
CN113672731B (zh) * | 2021-08-02 | 2024-02-23 | 北京中科闻歌科技股份有限公司 | 基于领域信息的情感分析方法、装置、设备及存储介质 |
CN113627550A (zh) * | 2021-08-17 | 2021-11-09 | 北京计算机技术及应用研究所 | 一种基于多模态融合的图文情感分析方法 |
CN113449085B (zh) * | 2021-09-02 | 2021-11-26 | 华南师范大学 | 多模态情感分类方法、装置以及电子设备 |
CN113449085A (zh) * | 2021-09-02 | 2021-09-28 | 华南师范大学 | 多模态情感分类方法、装置以及电子设备 |
CN115187579A (zh) * | 2022-08-11 | 2022-10-14 | 北京医准智能科技有限公司 | 一种图像类别判定方法、装置及电子设备 |
CN115187579B (zh) * | 2022-08-11 | 2023-05-02 | 北京医准智能科技有限公司 | 一种图像类别判定方法、装置及电子设备 |
CN115100390A (zh) * | 2022-08-24 | 2022-09-23 | 华东交通大学 | 一种联合对比学习与自监督区域定位的图像情感预测方法 |
CN115187996B (zh) * | 2022-09-09 | 2023-01-06 | 中电科新型智慧城市研究院有限公司 | 语义识别方法、装置、终端设备和存储介质 |
CN115187996A (zh) * | 2022-09-09 | 2022-10-14 | 中电科新型智慧城市研究院有限公司 | 语义识别方法、装置、终端设备和存储介质 |
CN115761569A (zh) * | 2022-10-20 | 2023-03-07 | 之江实验室 | 一种基于情感分类的视频情感定位方法 |
CN116383770A (zh) * | 2023-06-05 | 2023-07-04 | 中国科学院空天信息创新研究院 | 环境质量检测方法 |
CN116383770B (zh) * | 2023-06-05 | 2023-09-15 | 中国科学院空天信息创新研究院 | 环境质量检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110852368B (zh) | 2022-08-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110852368B (zh) | 全局与局部特征嵌入及图文融合的情感分析方法与系统 | |
CN110334705B (zh) | 一种结合全局和局部信息的场景文本图像的语种识别方法 | |
CN110119786B (zh) | 文本话题分类方法及装置 | |
WO2022022163A1 (zh) | 文本分类模型的训练方法、装置、设备及存储介质 | |
CN106650725B (zh) | 基于全卷积神经网络的候选文本框生成和文本检测方法 | |
AU2016259337B2 (en) | Modeling semantic concepts in an embedding space as distributions | |
CN109145712B (zh) | 一种融合文本信息的gif短视频情感识别方法及系统 | |
CN112860888B (zh) | 一种基于注意力机制的双模态情感分析方法 | |
CN111461174B (zh) | 多层次注意力机制的多模态标签推荐模型构建方法及装置 | |
CN111598183A (zh) | 一种多特征融合图像描述方法 | |
CN112800225B (zh) | 一种微博评论情绪分类方法和系统 | |
Hao | Multimedia English teaching analysis based on deep learning speech enhancement algorithm and robust expression positioning | |
CN110297986A (zh) | 一种微博热点话题的情感倾向分析方法 | |
CN106227836B (zh) | 基于图像与文字的无监督联合视觉概念学习系统及方法 | |
Islam et al. | A simple and mighty arrowhead detection technique of Bangla sign language characters with CNN | |
CN109740536A (zh) | 一种基于特征融合神经网络的亲属识别方法 | |
Jishan et al. | Bangla language textual image description by hybrid neural network model | |
Yu et al. | Hand gesture recognition based on attentive feature fusion | |
Mahmud et al. | Deep learning based sentiment analysis from Bangla text using glove word embedding along with convolutional neural network | |
Chen et al. | Dual-bottleneck feature pyramid network for multiscale object detection | |
Zhu et al. | NAGNet: A novel framework for real‐time students' sentiment analysis in the wisdom classroom | |
CN110472655A (zh) | 一种用于跨境旅游的标志物机器学习识别系统及方法 | |
CN110765956A (zh) | 基于部件特征的双人交互行为识别方法 | |
CN116662924A (zh) | 基于双通道与注意力机制的方面级多模态情感分析方法 | |
Atif et al. | Emojis pictogram classification for semantic recognition of emotional context |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |