CN112101241A - 一种基于深度学习的轻量级表情识别方法 - Google Patents
一种基于深度学习的轻量级表情识别方法 Download PDFInfo
- Publication number
- CN112101241A CN112101241A CN202010982821.5A CN202010982821A CN112101241A CN 112101241 A CN112101241 A CN 112101241A CN 202010982821 A CN202010982821 A CN 202010982821A CN 112101241 A CN112101241 A CN 112101241A
- Authority
- CN
- China
- Prior art keywords
- network
- expression
- expression recognition
- lightweight
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000014509 gene expression Effects 0.000 title claims abstract description 59
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000013135 deep learning Methods 0.000 title claims abstract description 21
- 230000008921 facial expression Effects 0.000 claims abstract description 38
- 230000006870 function Effects 0.000 claims abstract description 31
- 238000000605 extraction Methods 0.000 claims abstract description 16
- 238000001514 detection method Methods 0.000 claims abstract description 14
- 230000000694 effects Effects 0.000 claims abstract description 10
- 238000012549 training Methods 0.000 claims description 17
- 230000004913 activation Effects 0.000 claims description 9
- 238000013527 convolutional neural network Methods 0.000 claims description 9
- 238000012360 testing method Methods 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 8
- 238000005286 illumination Methods 0.000 claims description 4
- 238000000926 separation method Methods 0.000 claims description 4
- 238000005728 strengthening Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims 1
- 108091006146 Channels Proteins 0.000 description 28
- 238000010586 diagram Methods 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 210000002569 neuron Anatomy 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 210000001097 facial muscle Anatomy 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/174—Facial expression recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明涉及轻量级表情识别方法相关技术领域,尤其为一种基于深度学习的轻量级表情识别方法,包括以下步骤,首先,通过MTCNN轻量级人脸检测网络实现快速高效的人脸检测;然后,改进MobileNetV3网络的基础结构,基于深度可分离卷积改进线性瓶减少网络复杂性和防止过拟合;最后,通过设计高效注意力模块将特征图的深度与空间信息结合,更着重于重要特征提取,并采用Centerloss损失函数减少相同表情的类内特征差异,Softmaxloss扩大不同表情类间特征间距,使网络具有更好的特征判别效果,最终完成实时的人脸表情识别。
Description
技术领域
本发明涉及轻量级表情识别方法相关技术领域,尤其涉及一种基于深度学习的轻量级表情识别方法。
背景技术
面部表情是一种常见的非语言交流形式,它能够有效的传达个人情感和意图;人类可以通过视觉获取他人的面部表情并通过大脑的分析了解他人的内心状态来达到交流的目的,随着科学繁荣和人工智能的发展,人们希望机器能够相对准确的识别面部表情达到人与机器间的交流,人脸表情自动识别在在改善人机交互、远程教育、辅助医疗、驾驶疲劳监测、营销辅助等方面都有着重要的研究价值和广泛的应用空间;
19世纪初,一些学者开始致力于人脸表情识别领域研究;1971年,心理学家EKman和他的伙伴深入研究了面部肌肉和不同表情之间的关系,将人脸表情化分为愤怒、厌恶、恐惧、高兴、悲伤和惊讶六类基本表情,并提出可以通过面部信号识别人脸表情;人脸表情识别过程可分为三个步骤:图像预处理,特征提取及人脸表情分类,如何有效的提取人脸表情特征是表情识别的关键步骤,此后研究的重点在就于人脸表情特征的提取,现如今主要分为两类特征提取方法;
一种是基于传统人工设计的表情特征提取方法,如局部二值模式(LocalBinaryPattern,LBP)、定向梯度直方图(HistogramofOrientedGradients,HOG)、尺度不变特征变换(ScaleInvariantFeatureTransform,SIFT)等,但这些方法可能会丢失一些原始图像的特征信息,还易受噪声干扰,对图像尺度和光照条件等不具有鲁棒性;
另一种是基于深度学习的表情特征提取方法,其能够自动的学习脸表情的特征,在人脸表情识别中达到较高的识别率;随着深度学习在图像识别领域的发展,卷积神经网络在计算机视觉领域展现出了优越的表现,同时涌现了越来越的卷积网络模型,例如AlexNet、VGG、GoogleNet和ResNet,这些网络模型被广泛应用于各个领域,其良好的识别性能和鲁棒性在人脸识别领域获得了巨大的进展;其在人脸表情识别方向也得到了大量的研究,并证实了卷积神经网络对于人脸表情识别任务的优越性能,相比传统识别方法具有更高的识别准确率和更好的稳定性;
但随着卷积神经网络模型在各个领域的迅速发展,在各个领域都取得非凡成果的同时,它的一些缺点也逐渐显露出来;其具有网络模型冗余复杂、模型参数数量庞大,训练时间漫长等缺点,因此其模型对配置要求较高且难以到达实时的要求,使得其只能在某些特定场所才能具有良好的应用,虽然采用卷积神经网络进行人脸表情识别能够提高识别的准确率且具有良好的稳定性,但其复杂的网络模型与难以实时性都影响其进一步的应用。
发明内容
本发明的目的在于提供一种基于深度学习的轻量级表情识别方法,以解决上述背景技术中提出的现有的基于深度学习的表情识别模型大,实时性差等问题。
为了实现以上目的,本发明采用的技术方案为:一种基于深度学习的轻量级表情识别方法,包括以下步骤,
S10、MTCNN人脸检测与定位,当得到摄像头采集的图像或输入一张图片后,先使用小模型生成有一定可能性的人脸候选框,然后再使用稍微复杂一些的网络对候选框筛选分类和更高精度的区域框回归,并且让这一步递归执行,以此思想构成三层网络,得到最终的人脸检测结果;
S20、通过S10得到人脸区域,然后进行图像的预处理操作,将人脸区域进行裁剪,去除部分与表情识别无关的背景以及头发等信息,只保留与表情相关的主要部分,然后判断图像是否为灰度图,不是则将其转化为灰度图,使得光照对人脸表情识别的影响降到最低,然后将其尺寸变换为96x96x1大小,便于后续卷积神经网络网络的训练与测试;
S30、设计与训练高效通道注意力网络,将S20预处理后的人脸表情图片输入到训练好的高效通道注意力网络进行表情特征提取;
S40、在得到S30高效通道注意力网络的输出后,本发明采用中心损失函数(Centerloss)完成表情的分类,Centerloss用于加强类内距,Softmaxloss用于改进类间的分离度,结合两种损失函数特点,提高人脸表情的识别效果。
进一步的,所述利用S10的轻量级人脸检测网络MTCNN网络从图像中检测出人脸,获得人脸区域。
进一步的,所述S20中将人脸区域进行裁剪与尺度变换,灰度化等图像预处理操作,得到96x96大小的人脸灰度图像。
进一步的,所述利用S30中高效通道注意力网络,其改进MobileNetV3网络的基础结构,基于深度可分离卷积改进线性瓶颈层,使用PReLU激活函数代替了ReLU激活函数,提高了表情识别的准确率,提升了算法的性能;引入高效通道注意力网络(ECA-Net)代替SE-Net模块,将特征图的深度与空间信息结合,更着重于重要特征提取,使网络具有更好的特征判别效果,并且加快了网络的收敛速度。
进一步的,所述S40中使用中心损失函数(Centerloss)完成表情的分类,设计的中心损失函数如下:
其中α是中心向量更新的参数,λ用于loss中占比的参数,公式参数选取为α=0.5,λ=0.1。
本发明的有益效果为:
本发明提出一种高效通道注意力的轻量级表情识别方法;该方法基于深度可分离卷积改进线性瓶颈结构减少网络复杂性和防止过拟合,通过设计高效注意力模块将特征图的深度与空间信息结合,更着重于重要特征提取,并采用Centerloss损失函数减少相同表情的类内特征差异,Softmaxloss扩大不同表情类间特征间距,使网络具有更好的特征判别效果,最终完成实时的人脸表情识别;稳定的识别出七种基本的表情,且能够更好的达到实时性要求,识别速度达到每秒90帧以上,处理效果较好,运行效率高,具有较好的鲁棒性。
附图说明
图1为一种基于深度学习的轻量级表情识别方法的具体实施整体框架结构示意图。
图2为一种基于深度学习的轻量级表情识别方法的改进线性瓶颈层结构示意图。
图3为一种基于深度学习的轻量级表情识别方法的高效通道注意力网络(ECA-Net)模型结构示意图。
图4为一种基于深度学习的轻量级表情识别方法的高效通道注意力网络结构示意图。
图5为一种基于深度学习的轻量级表情识别方法的网络的输入尺寸图。
具体实施方式
为了使本领域技术人员更好地理解本发明的技术方案,下面结合附图对本发明进行详细描述,本部分的描述仅是示范性和解释性,不应对本发明的保护范围有任何的限制作用。
如图1-图5所示,本发明的具体结构为:一种基于深度学习的轻量级表情识别方法,包括以下步骤,
S10、MTCNN人脸检测与定位,当得到摄像头采集的图像或输入一张图片后,先使用小模型生成有一定可能性的人脸候选框,然后再使用稍微复杂一些的网络对候选框筛选分类和更高精度的区域框回归,并且让这一步递归执行,以此思想构成三层网络,得到最终的人脸检测结果;
S20、通过S10得到人脸区域,然后进行图像的预处理操作,将人脸区域进行裁剪,去除部分与表情识别无关的背景以及头发等信息,只保留与表情相关的主要部分,然后判断图像是否为灰度图,不是则将其转化为灰度图,使得光照对人脸表情识别的影响降到最低,然后将其尺寸变换为96x96x1大小,便于后续卷积神经网络网络的训练与测试;
S30、设计与训练高效通道注意力网络,将S20预处理后的人脸表情图片输入到训练好的高效通道注意力网络进行表情特征提取;
S40、在得到S30高效通道注意力网络的输出后,本发明采用中心损失函数(Centerloss)完成表情的分类,Centerloss用于加强类内距,Softmaxloss用于改进类间的分离度,结合两种损失函数特点,提高人脸表情的识别效果。
优选的,所述利用S10的轻量级人脸检测网络MTCNN网络从图像中检测出人脸,获得人脸区域。
优选的,所述S20中将人脸区域进行裁剪与尺度变换,灰度化等图像预处理操作,得到96x96大小的人脸灰度图像。
优选的,所述利用S30中高效通道注意力网络,其改进MobileNetV3网络的基础结构,基于深度可分离卷积改进线性瓶颈层,使用PReLU激活函数代替了ReLU激活函数,提高了表情识别的准确率,提升了算法的性能;引入高效通道注意力网络(ECA-Net)代替SE-Net模块,将特征图的深度与空间信息结合,更着重于重要特征提取,使网络具有更好的特征判别效果,并且加快了网络的收敛速度。
优选的,所述S40中使用中心损失函数(Centerloss)完成表情的分类,设计的中心损失函数如下:
其中α是中心向量更新的参数,λ用于loss中占比的参数,公式参数选取为α=0.5,λ=0.1。
图1是本发明的一种具体实施方式的总体框图,具体包括如下4个步骤,按照以下步骤进行:
S10,MTCNN人脸检测;
MTCNN网络兼顾了性能和准确率,实现快速高效的人脸检测;MTCNN由三个轻量级卷积神经网络结构级联组成,分别是ProposalNetwork(P-Net)、RefineNetwork(R-Net)、OutputNetwork(O-Net);
P-Net:基本结构是一个全卷积网络,负责获得人脸区域的候选窗口和人脸框的回归向量,根据人脸框回归向量对人脸候选窗口完成校正,并采用非极大值抑制(NMS)合并重叠过高的候选窗口。
R-Net:基本结构是一个卷积神经网络,增添了全连接层,对输入数据进行更严格的筛选,通过否决大量的非人脸窗口来精简人脸窗口。
O-Net:基本结构相较于R-Net增添了一层卷积层,是一个更为复杂的卷积神经网络;通过更多的监督来识别人脸区域,得到最终的人脸框,并且得到5个人脸特征点。
S20,人脸表情图片预处理;
收集人脸表情数据集,对高效通道注意力网络进行模型训练;FER-2013是Kaggle人脸表情识别挑战赛提供的一个人脸表情数据集;此数据集总共具有35887张表情图像,包括7类基本表情:愤怒、厌恶、高兴、悲伤、恐惧、惊讶和中性;FER2013数据集总共由三部分组成:其中训练集有28709张图片、公共测试集有3589张图片、私有测试集也为3589张图片;在训练时将公共测试集作为验证集,私有测试集作为最终指标判断的测试集,该数据集不仅包含了不同比例、不同姿势角度的人脸表情,很多图片有外界环境影响,包括手,头发,眼镜的遮挡,甚至有一些动漫卡通图片,挑战性非常大。
训练部分,由于人脸表情原始数据集数据量较小,难以满足深度学习对数据量的需求,为了避免人脸表情模型训练出现过拟合与模型泛化能力差的问题使用一系列随机变换对数据集图像进行扩增处理,扩充数据集的大小以更好的训练神经网络模型,使得训练的网络鲁棒性更强;在网络训练阶段为了防止网络出现过拟合,我们首先做一些列的随机变换,包括翻转,旋转,切割等,我们将数据图片尺寸变换为104x104大小,然后采用随机切割96*96的图像,然后将图片在0~15°之间进行随机旋转,并将图像随机进行水平镜像操作,然后送入高效通道注意力网络训练,得到高效通道注意力网络模型。
测试部分,我们分别在图像的左上,左下,右上,右下,中心进行切割为96x96的图像,然后再分别对其进行水平镜像操作,这样之后就相当于将数据扩增了10倍,之后我们将扩增后的图片输入得到的网络模型对其识别,将得到结果进行平均,最后得分最高的输出分类即为对应表情,这种方法能进一步提高识别的准确率。
S30,高效通道注意力网络表情特征提取;
改进的线性瓶颈层以深度可分离卷积为基础,分支中采用MobileNetV3的线性瓶颈层结构并对其进行了改进,将其中的非线性激活函数ReLU部分改为PReLU,使用h-swish新激活函数保持不变。
图2为本发明的改进线性瓶颈层图;在MobileNetV3的线性瓶颈网络结构中,在每一个卷积层之后都使用了BN层避免梯度消失和爆炸,防止网络过拟合,保证网络的稳定性;并且在网络的前几层为了增加网络非线性建模能力,防止梯度消失,使网络具有稀疏性,在瓶颈层与深度卷积层都采用了ReLU激活函数;但是RELU函数的使用也可能导致部分神经网络失活,在训练中如果一个非常大的梯度流经ReLU神经元,导致更新参数后此神经元的梯度输出永久的变为零,这时从此该神经元就会变为失活状态,这部分的权重就无法继续更新,网络得不到学习,就会导致信息丢失;所以我们采用了了PReLU函数替代ReLU函数,在负数区域有一个很小的斜率,该区域内会进行线性预算,避免了神经网络失活状态的发生,减少了可能的信息丢失,使得后续表情特征提取更加准确,提高了表情识别的准确率。
为了能够从人脸表情图像深层信息中筛选出有效的特征,我们引入超轻量级注意模块ECA-Net模块对改进的线性瓶颈结构的网络特征通道进行重新校准,它只涉及k(k<=9)参数,但带来了明显的性能增益。
图3为本发明的高效通道注意力网络(ECA-Net)模型图;该模块主要的作用是为每个通道生成权重并学习其相关性,就像加入注意力一样优先关注有用的信息,提升网络对主要特征的敏感度,同时降低模型的复杂度;对比原MobileNetV3中加入的SENet模块,ECA在不降低维度的情况下进行逐通道全局平均池化,再通过考虑每个通道及其k近邻来实现局部跨通道交互,并通过自适应选择一维卷积核大小确定局部通道交互的覆盖范围;
自适应确定内核大小k:
此处|t|odd表示最近的奇数t。并且我们将γ和b分别设为2和1。显然,映射函数ψ使大的通道维度有更大的覆盖范围,反之亦然。
基于改进的线性瓶颈结构与高效注意力网络模型如图4所示,在线性瓶颈结构的深度卷积层后嵌入高效注意力机制,深度可分离卷积的深度卷积为表情特征提取部分,而在之后嵌入了高效通道注意力机制能够将深度卷积提取的特征权重重新加权,更着重提取重要的表情特征,接着在通过点卷积完成通道的缩放,并加入快捷连接层构成倒置残差结构,在减少网络结构的同时防止网络过拟合,最终基于线性瓶颈与倒置残差构成高效通道注意力网络。
本发明受到MobileNetV3网络结构启发,基于改进线性瓶颈层的高效通道注意力网络结构如图5所示,将网络的输入尺寸改为96x96x1,并将benck模型替换为改进的线性瓶颈与高效注意力网路模型,并减少两层卷积层以适应表情特征的提取,该网络结构在减少网络计算量的同时提升网络识别率。
S40,中心损失函数的表情分类;
采用Centerloss损失函数,Centerloss用于加强类内距,Softmaxloss用于改进类间的分离度,结合两种损失函数特点,提高人脸表情的识别效果。
我们通过Centerloss得到的类中心位置,Centerloss根据下式更新类中心:
γ是学习率,t是迭代次数,δ是一个条件函数,如果条件满足则δ=1,如果条件不满足则δ=0。
整个损失为Softmax损失加上Center损失,其公式如下:
在神经网络中,通过Centerloss损失函数学习步骤如下:输入数据为输入训练样本{fi},初始化的卷积层参数θC,最后的全连接层参数W,初始化的n类中心{cj|j=1,2,3...,n-1,n},学习率μt,超参数α,类中心学习率λ和迭代次数t←1。输出为参数θC,对所有样本训练时会循环以下步骤:
(1)计算总损失:L=LS+αLC
(6)t←t+1。
针对自然环境下的人脸表情识别;本发明给出了一种高效通道注意力的轻量级表情识别方法,首先;通过MTCNN轻量级人脸检测网络检测人脸与特征点,然后;以mobilenetv3网络为基础网络;基于深度可分离卷积与倒置残差与线性瓶颈结构采用注意力模块将特征图的深度与空间信息结合;联合Softmaxloss、Centerloss提高了网络对于人脸表情的识别准确率;实验结果表明;本文模型不仅能够更稳定的识别出七种基本的表情;且能够更好的达到实时性要求,识别速度达到每秒90帧以上,本发明算法简单;可操作性强;具有广泛的适用性。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实例的说明只是用于帮助理解本发明的方法及其核心思想。以上所述仅是本发明的优选实施方式,应当指出,由于文字表达的有限性,而客观上存在无限的具体结构,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进、润饰或变化,也可以将上述技术特征以适当的方式进行组合;这些改进润饰、变化或组合,或未经改进将发明的构思和技术方案直接应用于其它场合的,均应视为本发明的保护范围。
Claims (5)
1.一种基于深度学习的轻量级表情识别方法,其特征在于:包括以下步骤,
S10、MTCNN人脸检测与定位,当得到摄像头采集的图像或输入一张图片后,先使用小模型生成有一定可能性的人脸候选框,然后再使用稍微复杂一些的网络对候选框筛选分类和更高精度的区域框回归,并且让这一步递归执行,以此思想构成三层网络,得到最终的人脸检测结果;
S20、通过S10得到人脸区域,然后进行图像的预处理操作,将人脸区域进行裁剪,去除部分与表情识别无关的背景以及头发等信息,只保留与表情相关的主要部分,然后判断图像是否为灰度图,不是则将其转化为灰度图,使得光照对人脸表情识别的影响降到最低,然后将其尺寸变换为96x96x1大小,便于后续卷积神经网络网络的训练与测试;
S30、设计与训练高效通道注意力网络,将S20预处理后的人脸表情图片输入到训练好的高效通道注意力网络进行表情特征提取;
S40、在得到S30高效通道注意力网络的输出后,本发明采用中心损失函数(Centerloss)完成表情的分类,Centerloss用于加强类内距,Softmaxloss用于改进类间的分离度,结合两种损失函数特点,提高人脸表情的识别效果。
2.根据权利要求1所述的一种基于深度学习的轻量级表情识别方法,其特征在于:所述利用S10的轻量级人脸检测网络MTCNN网络从图像中检测出人脸,获得人脸区域。
3.根据权利要求1所述的一种基于深度学习的轻量级表情识别方法,其特征在于:所述S20中将人脸区域进行裁剪与尺度变换,灰度化等图像预处理操作,得到96x96大小的人脸灰度图像。
4.根据权利要求1所述的一种基于深度学习的轻量级表情识别方法,其特征在于:所述利用S30中高效通道注意力网络,其改进MobileNetV3网络的基础结构,基于深度可分离卷积改进线性瓶颈层,使用PReLU激活函数代替了ReLU激活函数,提高了表情识别的准确率,提升了算法的性能;引入高效通道注意力网络(ECA-Net)代替SE-Net模块,将特征图的深度与空间信息结合,更着重于重要特征提取,使网络具有更好的特征判别效果,并且加快了网络的收敛速度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010982821.5A CN112101241A (zh) | 2020-09-17 | 2020-09-17 | 一种基于深度学习的轻量级表情识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010982821.5A CN112101241A (zh) | 2020-09-17 | 2020-09-17 | 一种基于深度学习的轻量级表情识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112101241A true CN112101241A (zh) | 2020-12-18 |
Family
ID=73759574
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010982821.5A Pending CN112101241A (zh) | 2020-09-17 | 2020-09-17 | 一种基于深度学习的轻量级表情识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112101241A (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112613479A (zh) * | 2021-01-04 | 2021-04-06 | 福州大学 | 基于轻量流式网络和注意力机制的表情识别方法 |
CN112668631A (zh) * | 2020-12-24 | 2021-04-16 | 哈尔滨理工大学 | 基于卷积神经网络的移动端社区宠物识别方法 |
CN112699797A (zh) * | 2020-12-30 | 2021-04-23 | 常州码库数据科技有限公司 | 基于联合特征对关系网络的静态人脸表情识别方法及系统 |
CN112733806A (zh) * | 2021-02-18 | 2021-04-30 | 北京工商大学 | 基于表情识别的课堂中学生实时分类与遴选方法 |
CN112801040A (zh) * | 2021-03-08 | 2021-05-14 | 重庆邮电大学 | 嵌入高阶信息的轻量级无约束人脸表情识别方法及系统 |
CN113065432A (zh) * | 2021-03-23 | 2021-07-02 | 内蒙古工业大学 | 一种基于数据增强和ECA-Net的手写体蒙古文识别方法 |
CN113065460A (zh) * | 2021-03-31 | 2021-07-02 | 吉林农业大学 | 基于多任务级联的猪脸面部表情识别框架的建立方法 |
CN113128369A (zh) * | 2021-04-01 | 2021-07-16 | 重庆邮电大学 | 一种融合均衡损失的轻量级网络人脸表情识别方法 |
CN113158872A (zh) * | 2021-04-16 | 2021-07-23 | 中国海洋大学 | 一种在线学习者情绪识别方法 |
CN113252790A (zh) * | 2021-06-21 | 2021-08-13 | 四川轻化工大学 | 基于宽卷积与循环神经网络的磁瓦内部缺陷检测方法 |
CN113343773A (zh) * | 2021-05-12 | 2021-09-03 | 上海大学 | 基于浅层卷积神经网络的人脸表情识别系统 |
CN113505651A (zh) * | 2021-06-15 | 2021-10-15 | 杭州电子科技大学 | 一种基于卷积神经网络的蚊虫识别方法 |
CN113642467A (zh) * | 2021-08-16 | 2021-11-12 | 江苏师范大学 | 一种基于改进vgg网络模型的人脸表情识别方法 |
CN114063150A (zh) * | 2021-11-16 | 2022-02-18 | 西南科技大学 | 一种基于ml-knn算法的“震源-台站”速度模型选取方法 |
CN114648803A (zh) * | 2022-05-20 | 2022-06-21 | 中国科学技术大学 | 自然场景下人脸表情识别方法、系统、设备及存储介质 |
CN114973362A (zh) * | 2022-05-20 | 2022-08-30 | 厦门大学 | 一种应用于社交机器人的动态延长编码微表情识别方法 |
CN116012930A (zh) * | 2023-03-28 | 2023-04-25 | 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) | 一种基于深度学习卷积神经网络的维度表情识别方法 |
CN117115895A (zh) * | 2023-10-25 | 2023-11-24 | 成都大学 | 一种课堂微表情识别方法、系统、设备及介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110414371A (zh) * | 2019-07-08 | 2019-11-05 | 西南科技大学 | 一种基于多尺度核卷积神经网络的实时人脸表情识别方法 |
CN110427867A (zh) * | 2019-07-30 | 2019-11-08 | 华中科技大学 | 基于残差注意力机制的面部表情识别方法及系统 |
CN111027382A (zh) * | 2019-11-06 | 2020-04-17 | 华中师范大学 | 一种基于注意力机制的轻量级人脸检测的方法及模型 |
CN111382684A (zh) * | 2020-03-02 | 2020-07-07 | 中国科学技术大学 | 基于对抗学习的角度鲁棒的个性化人脸表情识别方法 |
-
2020
- 2020-09-17 CN CN202010982821.5A patent/CN112101241A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110414371A (zh) * | 2019-07-08 | 2019-11-05 | 西南科技大学 | 一种基于多尺度核卷积神经网络的实时人脸表情识别方法 |
CN110427867A (zh) * | 2019-07-30 | 2019-11-08 | 华中科技大学 | 基于残差注意力机制的面部表情识别方法及系统 |
CN111027382A (zh) * | 2019-11-06 | 2020-04-17 | 华中师范大学 | 一种基于注意力机制的轻量级人脸检测的方法及模型 |
CN111382684A (zh) * | 2020-03-02 | 2020-07-07 | 中国科学技术大学 | 基于对抗学习的角度鲁棒的个性化人脸表情识别方法 |
Non-Patent Citations (4)
Title |
---|
KAIPENG ZHANG等: "Joint Face Detection and Alignment Using Multitask Cascaded Convolutional Networks", 《IEEE SIGNAL PROCESSING LETTERS》 * |
QILONG WANG等: "ECA-Net: Efficient Channel Attention for Deep Convolutional Neural Networks", 《ARXIV》 * |
ZUHENG MING等: "Dynamic Multi-Task Learning for Face Recognition with Facial Expression", 《ARXIV》 * |
王灵珍等: "基于多任务级联 CNN 与中心损失的人脸识别", 《计算机仿真》 * |
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112668631A (zh) * | 2020-12-24 | 2021-04-16 | 哈尔滨理工大学 | 基于卷积神经网络的移动端社区宠物识别方法 |
CN112699797A (zh) * | 2020-12-30 | 2021-04-23 | 常州码库数据科技有限公司 | 基于联合特征对关系网络的静态人脸表情识别方法及系统 |
CN112699797B (zh) * | 2020-12-30 | 2024-03-26 | 常州码库数据科技有限公司 | 基于联合特征对关系网络的静态人脸表情识别方法及系统 |
CN112613479A (zh) * | 2021-01-04 | 2021-04-06 | 福州大学 | 基于轻量流式网络和注意力机制的表情识别方法 |
CN112613479B (zh) * | 2021-01-04 | 2022-07-08 | 福州大学 | 基于轻量流式网络和注意力机制的表情识别方法 |
CN112733806A (zh) * | 2021-02-18 | 2021-04-30 | 北京工商大学 | 基于表情识别的课堂中学生实时分类与遴选方法 |
CN112733806B (zh) * | 2021-02-18 | 2023-07-28 | 北京工商大学 | 基于表情识别的课堂中学生实时分类与遴选方法 |
CN112801040A (zh) * | 2021-03-08 | 2021-05-14 | 重庆邮电大学 | 嵌入高阶信息的轻量级无约束人脸表情识别方法及系统 |
CN112801040B (zh) * | 2021-03-08 | 2022-09-23 | 重庆邮电大学 | 嵌入高阶信息的轻量级无约束人脸表情识别方法及系统 |
CN113065432A (zh) * | 2021-03-23 | 2021-07-02 | 内蒙古工业大学 | 一种基于数据增强和ECA-Net的手写体蒙古文识别方法 |
CN113065460A (zh) * | 2021-03-31 | 2021-07-02 | 吉林农业大学 | 基于多任务级联的猪脸面部表情识别框架的建立方法 |
CN113128369B (zh) * | 2021-04-01 | 2022-07-01 | 重庆邮电大学 | 一种融合均衡损失的轻量级网络人脸表情识别方法 |
CN113128369A (zh) * | 2021-04-01 | 2021-07-16 | 重庆邮电大学 | 一种融合均衡损失的轻量级网络人脸表情识别方法 |
CN113158872A (zh) * | 2021-04-16 | 2021-07-23 | 中国海洋大学 | 一种在线学习者情绪识别方法 |
CN113343773A (zh) * | 2021-05-12 | 2021-09-03 | 上海大学 | 基于浅层卷积神经网络的人脸表情识别系统 |
CN113343773B (zh) * | 2021-05-12 | 2022-11-08 | 上海大学 | 基于浅层卷积神经网络的人脸表情识别系统 |
CN113505651A (zh) * | 2021-06-15 | 2021-10-15 | 杭州电子科技大学 | 一种基于卷积神经网络的蚊虫识别方法 |
CN113252790A (zh) * | 2021-06-21 | 2021-08-13 | 四川轻化工大学 | 基于宽卷积与循环神经网络的磁瓦内部缺陷检测方法 |
CN113642467A (zh) * | 2021-08-16 | 2021-11-12 | 江苏师范大学 | 一种基于改进vgg网络模型的人脸表情识别方法 |
CN113642467B (zh) * | 2021-08-16 | 2023-12-01 | 江苏师范大学 | 一种基于改进vgg网络模型的人脸表情识别方法 |
CN114063150A (zh) * | 2021-11-16 | 2022-02-18 | 西南科技大学 | 一种基于ml-knn算法的“震源-台站”速度模型选取方法 |
CN114063150B (zh) * | 2021-11-16 | 2023-05-23 | 西南科技大学 | 一种基于ml-knn算法的“震源-台站”速度模型选取方法 |
CN114648803A (zh) * | 2022-05-20 | 2022-06-21 | 中国科学技术大学 | 自然场景下人脸表情识别方法、系统、设备及存储介质 |
CN114648803B (zh) * | 2022-05-20 | 2022-09-06 | 中国科学技术大学 | 自然场景下人脸表情识别方法、系统、设备及存储介质 |
CN114973362A (zh) * | 2022-05-20 | 2022-08-30 | 厦门大学 | 一种应用于社交机器人的动态延长编码微表情识别方法 |
CN116012930B (zh) * | 2023-03-28 | 2023-07-18 | 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) | 一种基于深度学习卷积神经网络的维度表情识别方法 |
CN116012930A (zh) * | 2023-03-28 | 2023-04-25 | 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) | 一种基于深度学习卷积神经网络的维度表情识别方法 |
CN117115895A (zh) * | 2023-10-25 | 2023-11-24 | 成都大学 | 一种课堂微表情识别方法、系统、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112101241A (zh) | 一种基于深度学习的轻量级表情识别方法 | |
CN110427867B (zh) | 基于残差注意力机制的面部表情识别方法及系统 | |
CN107273800B (zh) | 一种基于注意机制的卷积递归神经网络的动作识别方法 | |
Garcia et al. | Real-time American sign language recognition with convolutional neural networks | |
CN111414862B (zh) | 基于神经网络融合关键点角度变化的表情识别方法 | |
CN109815826B (zh) | 人脸属性模型的生成方法及装置 | |
Admasu et al. | Ethiopian sign language recognition using Artificial Neural Network | |
Das et al. | SSERBC 2017: Sclera segmentation and eye recognition benchmarking competition | |
CN106909938B (zh) | 基于深度学习网络的视角无关性行为识别方法 | |
Liu et al. | Fingerprint pore matching using deep features | |
CN112883931A (zh) | 基于长短期记忆网络的实时真假运动判断方法 | |
CN117351550A (zh) | 基于有监督对比学习的网格自注意力人脸表情识别方法 | |
Ahammad et al. | Recognizing Bengali sign language gestures for digits in real time using convolutional neural network | |
CN117150320B (zh) | 对话数字人情感风格相似度评价方法及系统 | |
CN114626461A (zh) | 基于领域自适应的跨域目标检测方法 | |
CN114495163A (zh) | 基于类别激活映射的行人重识别生成学习方法 | |
CN116758621B (zh) | 基于自注意力机制的遮挡人脸面部表情深度卷积识别方法 | |
CN114663910A (zh) | 基于多模态学习状态分析系统 | |
Santosh et al. | Recent Trends in Image Processing and Pattern Recognition: Third International Conference, RTIP2R 2020, Aurangabad, India, January 3–4, 2020, Revised Selected Papers, Part I | |
Fang et al. | (Retracted) Face recognition technology in classroom environment based on ResNet neural network | |
Hallyal et al. | Optimized recognition of CAPTCHA through attention models | |
CN111898473A (zh) | 一种基于深度学习的司机状态实时监测方法 | |
Khan et al. | The Art of Seeing: A Computer Vision Journey into Object Detection | |
Gedaragoda et al. | “Hand Model”–A Static Sinhala Sign Language Translation Using Media-Pipe and SVM Compared with Hybrid Model of KNN, SVM and Random Forest Algorithms | |
Orpilla et al. | Raspberry Pi-Based Dual Iris Recognition System Using Coiflet Wavelet |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20201218 |
|
WD01 | Invention patent application deemed withdrawn after publication |