CN106503654A - 一种基于深度稀疏自编码网络的人脸情感识别方法 - Google Patents
一种基于深度稀疏自编码网络的人脸情感识别方法 Download PDFInfo
- Publication number
- CN106503654A CN106503654A CN201610924367.1A CN201610924367A CN106503654A CN 106503654 A CN106503654 A CN 106503654A CN 201610924367 A CN201610924367 A CN 201610924367A CN 106503654 A CN106503654 A CN 106503654A
- Authority
- CN
- China
- Prior art keywords
- network
- depth
- layer
- sparse autoencoder
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/174—Facial expression recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Molecular Biology (AREA)
- Evolutionary Biology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种基于深度稀疏自编码网络的人脸情感识别方法,包括以下步骤:步骤1:数据获取及预处理;步骤2:建立深度稀疏自编码网络;步骤3:深度稀疏网络自动编解码;步骤4:训练Softmax分类器;步骤5:整体网络权值微调。本发明的方法引入稀疏性参数,即减少神经元节点个数情况下,可以学习到数据的压缩表示,有效提高训练和识别速度,并通过反向传播算法与梯度下降法对网络权值进行微调从而达到全局最优,能够克服训练过程中局部极值与梯度弥散问题,从而提高识别性能。
Description
技术领域
本发明涉及一种基于深度稀疏自编码网络的人脸情感识别方法,属于模式识别技术领域。
背景技术
随着人机交互、情感计算等理论与技术的高速发展,人们普遍希望机器人具有识别、理解和生成人类情感的能力,从而实现和谐、友好、顺畅的人机交流。由于人类情感的多样性与相应行为之间的复杂性,当前的人机交互仍面临着关于情感计算(包括识别、理解和表达情感的情感计算能力)领域的一些难题。研究基于人脸表情、语音、手势、生理信号等信息的情感识别等已成为人机交互中的重点。人脸表情识别是情感计算领域的关键技术,将人脸表情识别嵌入人机交互系统,可使机器更好地理解人类情感,建立人性化的交互模式,将会在客户体验、智能驾驶、远程教育等领域获得广泛应用。
人脸表情识别由人脸检测与分割、表情特征提取、人脸表情分类三部分组成。其中,人脸表情特征分析与人脸表情分类算法是人脸表情算法的关键。然而己有的一些机器学习算法对人脸表情特征进行训练与识别的过程中往往容易产生局部最优与梯度弥散等问题,因此更具鉴别力的人脸特征选择以及具有良好分类能力的分类器设计是提高人脸情感识别率的关键。
深度学习的概念源于人工神经网络的研究,通过组合低层特征形成更加抽象的高层表示类别或特征,以发现数据的分布式特征表示。深度稀疏自编码网络是一个含有多层隐藏层的神经网络,外加限制隐藏层神经元数量的稀疏性因子,是深度学习的基础模型之一。此网络较以往的识别算法具有以下优点:通过采用分层处理的方式训练数据,每一层都能提取到数据不同层次的特征,从而逐层建立从底层到高层信号的特征映射,大大提高训练和识别的速度;层叠非线性神经元,能够模仿高度复杂的非线性函数;能够克服训练过程中局部极值与梯度弥散问题,从而提高识别性能。
发明内容
为了解决现有技术的不足,本发明提供了一种基于深度稀疏自编码网络的人脸情感识别方法,用受限玻尔兹曼机进行逐层贪婪预训练得到网络的初始权重矩阵,展开模型产生“编码”网络与“解码”网络,之后在模型顶端搭建Softmax分类器并对其进行训练,最后将整个网络视为一个模型,使用反向传播算法与梯度下降法对网络权值进行微调从而达到全局最优,以此提高人脸情感识别性能。
本发明为解决其技术问题所采用的技术方案是:提供了一种基于深度稀疏自编码网络的人脸情感识别方法,包括以下步骤:
步骤1:数据获取与预处理:对训练样本中的人脸图像进行感兴趣区域剪裁,采用灰度均衡方法对剪裁后的人脸图像预处理,然后将表情图像中的像素信息进行归一化;所述训练样本中的人脸图像的人脸表情信息已知;
步骤2:建立深度稀疏自编码网络:根据归一化后的人脸图像的像素信息以及人脸表情信息,建立一个1+n+1层的深度稀疏自编码网络,其中第1层为输入层,最后一层为分类器输出层,中间n层为隐藏层,通过进行RBM预训练,对深度稀疏自编码网络中的1+n层的权重进行初始化;所述n为设置值;
步骤3:深度稀疏自编码网络解码:将经过步骤2中RBM预训练得到的初始权重矩阵定义为wi,i∈[1,n],展开深度稀疏自编码网络,产生编码网络与解码网络并实现稀疏性表示;
步骤4:训练Softmax分类器:在深度稀疏自编码网络顶层搭建Softmax分类器,并对深度稀疏自编码网络学习到的特征进行分类,采用梯度下降法对Softmax分类器进行训练;
步骤5:整体网络权值微调:将包括Softmax分类器在内的整个深度稀疏自编码网络视为一个模型,利用反向传播算法计算整体代价函数的偏导数,并采用梯度下降法对整体深度稀疏自编码网络权值进行微调从而达到全局最优,从而提高人脸情感识别性能。
步骤1所述数据获取与预处理具体包括以下过程:
(1-1)数据获取:对于训练样本中的人脸图像,将眉毛、眼睛和嘴巴这三部分ROI区域从人脸图像中分割出来,获取该ROI区域的四角坐标,并将ROI区域的像素信息存储在矩阵中;
(1-2)样本预处理:对人脸图像进行直方图均衡化处理,调整人脸图像的灰度值,使不同灰度区域范围内的图像像素个数均衡。
步骤2所述建立深度稀疏自编码网络具体包括以下过程:
(2-1)从输入层开始,将输入层及上一层隐藏层组成一个RBM,并训练这个RBM;
(2-2)定义输入层为v,隐藏层为h,用训练好的参数以及输入层数据计算v与h的联合概率分布函数p(hj=1|v),并将此函数值作为hj的值;
(2-3)如果上述隐藏层的上一层是输出层,则预训练结束,否则进行下一步;
(2-4)把上述隐藏层看成输入层,hj作为输入数据,以输入层及上一层隐藏层组成一个RBM,并训练这个RBM;
(2-5)用训练好的参数以及输入数据计算p(hj=1|v),作为hj的值;
(2-6)返回步骤(2-3)判断预训练是否结束。
步骤3所述深度稀疏自编码网络解码具体包括以下过程:
(3-1)定义归一化的人脸图像的像素信息为网络输入数据x,网络输出为hw,b(x);在编码阶段,输入x通过激活函数g(·)的映射,得到u;
(3-2)在解码阶段,通过激活函数g(·)对输入信号u进行重建,得到hw,b(x);
(3-3)用表示在给定输入x下隐藏层第j个神经元的激活度,定义ρ为稀疏性参数,若某些隐藏神经元平均激活度与ρ不一致,则引入惩罚因子惩罚,使隐藏神经元的平均激活度保持在[0,0.2]范围内。
步骤4所述训练Softmax分类器具体包括以下过程:
(4-1)对于训练集{(x(1),y(1)),...,(x(m),y(m))},有y(i)∈{1,2,…,k},在人脸情感识别中定义k种不同类别以表示不同表情,定义θ表示模型参数矩阵;
(4-2)在代价函数中添加权重衰减项以此惩罚数值过大的参数,并对代价函数J(θ)求导;使用梯度下降法来最小化J(θ),每一次迭代需要进行参数更新,利用此迭代步骤重复进行来优化Soft分类器模型参数,实现一个优化的回归模型。
步骤5所述整体网络权值微调具体包括以下过程:
(5-1)利用前向传导计算公式,计算网络中各层的激活值;
(5-2)计算第ni层中每一个输出单元i的残差,之后利用递推原理得到第l层第i个节点残差的计算公式;
(5-3)计算i=1,2...,m的偏导数以及整体代价的偏导函数;
(5-4)对于J(w,b;x,y),每一次迭代进行权重更新,通过重复迭代优化权重参数求出代价函数的最小值,即求解出了最优的网络模型。
本发明基于其技术方案所具有的有益效果在于:本发明通过采用分层处理的方式训练数据,每一层都能提取到数据不同层次的特征,从而逐层建立从底层到高层信号的特征映射,引入稀疏性参数,即减少神经元节点个数情况下,可以学习到数据的压缩表示,大大提高训练和识别的速度;反向传播算法与梯度下降法对网络权值进行微调从而达到全局最优,使整个深度神经网络更具有鲁棒性,能够克服训练过程中局部极值与梯度弥散问题,从而提高识别性能。
附图说明
图1是本发明总体结构框图。
图2是日本JAFFE人脸表情数据库图像。
图3是人脸表情图像ROI区域分割。
图4是引入稀疏性参数前整体代价函数收敛曲线。
图5是引入稀疏性参数后整体代价函数收敛曲线。
图6是稀疏性参数ρ=0.05,微调前隐藏层权值特征可视化图像。
图7是稀疏性参数ρ=0.05,微调后隐藏层权值特征可视化图像。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
本发明提供了一种基于深度稀疏自编码网络的人脸情感识别方法,参照图1,通过构建深度稀疏自编码网络使其学习人脸表情特征并使用Softmax分类器对表情进行情感识别。首先用受限玻尔兹曼机进行逐层贪婪预训练得到网络的初始权重矩阵,展开模型产生“编码”网络与“解码”网络,之后在模型顶端搭建Softmax分类器并对其进行训练,通过梯度下降法寻找最优模型参数,最后将包括Softmax分类器在内的整个网络视为一个模型,使用反向传播算法与梯度下降法对网络权值进行微调从而达到全局最优,使整个深度神经网络更具有鲁棒性,从而提高人脸情感识别性能。
具体实现方法包括以下步骤:
步骤1:数据获取与预处理:对训练样本中的人脸图像进行感兴趣区域剪裁,采用灰度均衡方法对剪裁后的人脸图像预处理,然后将表情图像中的像素信息进行归一化;所述训练样本中的人脸图像的人脸表情信息已知。
(1-1)数据获取:使用日本JAFFE人脸表情数据库作为训练样本,此数据库共有213张人脸表情图像,包括10个对象,7类基本表情。其中7类表情为自然、高兴、愤怒、悲伤、吃惊、厌恶、恐惧。每幅灰度图像的分辨率为256×256,各个对象都有3~4幅无遮挡光照良好的正面表情灰度图像,部分样本如图2所示。对于训练样本中的人脸图像,将眉毛、眼睛和嘴巴这三部分ROI区域(Region of Interest,感兴趣区域)从人脸图像张分割出来,获取该ROI区域的四角坐标,并将ROY区域的像素信息存储在矩阵中;
(1-2)样本预处理:对每幅ROI区域分割后的人脸图像进行直方图均衡化处理,调整人脸图像的灰度值,将表情图像像素信息归一化为[0,1],如图3所示,使不同灰度区域范围内的图像像素个数均衡。
步骤2:建立深度稀疏自编码网络:根据归一化后的人脸图像的像素信息以及人脸表情信息,建立一个1+n+1(输入+隐藏+Softmax分类器输出)层的深度稀疏自编码网络,其中第1层为输入层,最后一层为分类器输出层,中间n层为隐藏层,用wij (l)表示第l层中第j个神经元与第l+1层中第i个神经元之间的连接权重,用bi (l)表示第l+1层中第i个神经元的偏置项,通过进行逐层RBM预训练,对深度稀疏自编码网络中的1+n层(输入层+隐藏层)的权重进行初始化;所述n为设置值。为减少噪声一般并不对每个输入数据都进行更新,而是将一定数量数据合并为一组,称为一个minibatch,把一个minibatch的更新值平均后才进行一次更新。当所有数据都被使用一次后,称为进行了一个epoch,每进行一个epoch,minibatch应该重新组合。之后重新划分minibatch,重复上述步骤进行若干个epoch从而达到训练的目的,具体包括以下过程:
(2-1)从输入层开始,将输入层及上一层隐藏层组成一个RBM(RestrictedBoltzmannMachine,逐层受限玻尔兹曼机),并训练这个RBM;
(2-2)定义输入层为v,隐藏层为h,用训练好的参数以及输入层数据计算v与h的联合概率分布函数p(hj=1|v),并将此函数值作为hj的值;概率分布函数如公式(1)所示:
其中是logistic sigmoid函数,cj为隐藏层偏移量;
(2-3)如果上述隐藏层的上一层是输出层,则预训练结束,否则进行下一步;
(2-4)把上述隐藏层看成输入层,hj作为输入数据,以输入层及上一层隐藏层组成一个RBM,并训练这个RBM,进行若干个epoch;
(2-5)用训练好的参数以及输入数据计算p(hj=1|v),作为hj的值;
(2-6)返回步骤(2-3)判断预训练是否结束。
上述方法是将深度稀疏自编码网络中除输出层外的连续两层均两两看成一个RBM,之后自下而上地一层一层采用RBM进行预训练,因此训练的RBM数目与隐藏层数目一致。
步骤3:深度稀疏自编码网络解码:将经过步骤2中RBM预训练得到的初始权重矩阵定义为wi(i=1,2...n),展开深度稀疏自编码网络,产生编码网络与解码网络并实现稀疏性表示,定义网络输入数据为x,网络输出为hw,b(x),具体包括以下过程:
(3-1)在编码阶段,输入x通过激活函数g(·)的映射,得到u如公式(2)所示;
u=g(wix+bi) (2)
其中激活函数选取Sigmoid函数,
(3-2)在解码阶段,通过激活函数g(·)对输入信号u进行重建,得到hw,b(x)如公式(3)所示:
hw,b(x)=g(wi Tu+bi+1) (3)
(3-3)用表示在给定输入x下隐藏层第j个神经元的激活度,定义ρ为稀疏性参数,若某些隐藏神经元平均激活度与ρ不一致(其中,与ρ的取值范围均为[0,1],不一致指它们的比值不等于1),则引入惩罚因子惩罚,使隐藏神经元的平均激活度保持在较小范围[0,0.2]。
定义ρ为稀疏性参数,使若某些隐藏神经元平均激活度与ρ有显著不同,则引入惩罚因子惩罚,使隐藏神经元的平均激活度保持在较小范围,惩罚因子的具体形式有很多选择,本文选取其中的一种如公式(5)所示:
其中si+1表示隐藏层中神经元的数量,将公式(5)写成相对熵(KL divergence)的形式如公式(6)所示:
为了减小与ρ之间的差距需将惩罚因子最小化,因此总体代价函数如公式(7)所示:
其中是用于控制稀疏性惩罚因子的权重,代价函数在步骤4中继续具体说明;
步骤4:训练Softmax分类器:在网络顶层搭建Softmax分类器,并对深度自编码网络学习到的特征进行分类,采用梯度下降法对分类器进行训练;
(4-1)对于训练集{(x(1),y(1)),...,(x(m),y(m))},有y(i)∈{1,2,…,k},在人脸情感识别中定义k种不同类别以表示不同表情,例如定义k=7种不同类别,分别为自然、高兴、愤怒、悲伤、吃惊、厌恶、恐惧。
定义一个假设函数针对每一个类别估算概率分布,假设函数hθ(x)形式如公式(8)所示:
其中θ1,θ2,...,θk为模型参数;
定义θ表示模型参数矩阵如公式(9)所示:
则Softmax分类器的代价函数表达式如公式(10)所示:
(4-2)在代价函数中添加权重衰减项以此惩罚数值过大的参数,权重衰减项可定义为既可保留全部参数θ1,θ2,...,θk也能够解决参数冗余问题,代价函数改写为如公式(11)所示:
并对代价函数J(θ)求导,得到结果如公式(12)所示:
使用梯度下降法来最小化J(θ),每一次迭代需要进行参数更新,计算如公式(13)所示:
利用此迭代步骤重复进行来优化Soft分类器模型参数,实现一个优化的回归模型。
步骤5:整体网络权值微调:将包括Softmax分类器在内的整个网络视为一个模型,使用反向传播算法计算整体代价函数的偏导数,并采用梯度下降法对整体网络权值进行微调从而达到全局最优,具体包括以下步骤:
(5-1)包含m个样例的样本集整体代价函数可表示如公式(14)所示:
公式中第一项是一个均方差项(average sum-of-squares error),第二项为权重衰减项(weight decay);
利用前向传导计算公式,计算网络中各层的激活值(不包括输出层),前向传导如公式(15)所示:
a(l+1)=f(w(l)a(l)+b(l))A (15)
(5-2)计算第ni层中每一个输出单元i的残差,如公式(16)所示:
对于其它各层,即l=n1-1,n2-2,nl-3,...,2层,利用l+1层节点的残差来计算l层节点的残差,其具体计算方式如公式(17)所示:
之后利用递推原理得到第l层第i个节点残差的计算公式如公式(18)所示:
(5-3)计算J(w,b;x,y)的偏导数,计算公式如公式(19)所示:
则整体代价的偏导函数如公式(20)所示:
(5-4)对于i=1,2...,m,每一次迭代需要进行权重更新,计算如公式(21)所示:
利用上述迭代步骤,不断重复从而优化权重参数,可求出代价函数的最小值,也便求解出了最优的网络模型。
在求解出最优化的网络模型过程中,引入稀疏性参数,得到引入前后算法收敛情况如图4和图5所示,可以看出,引入稀疏性参数后,在训练次数为182时停止训练,使得整体代价函数更快地收敛,因此大幅度减少训练时间,提高训练效率。
进一步的,对网络权值进行全局微调来观察特征图像的变化,将学习得到的网络隐藏层权值特征进行可视化设计,如图6和图7所示,可以看出,微调后网络自学习到的表情特征更为精细与全面,保证了较高的识别精度。
同时,将所提出的深度稀疏自编码网络模型与Softmax回归模型进行人脸表情识别对比实验。通过表1中的实验结果可以得出,单独使用Softmax回归模型训练输入样本,总体表情平均识别率为73.333%,而首先使用深度稀疏自编码网络进行样本学习之后训练Softmax回归模型得到的总体表情平均识别率提高到94.761%,而且每个单项表情的识别率均比Softmax回归模型高,表明此深度稀疏自编码网络学习到的表情特征到比原始图像的特性更具有代表性,这也是传统的训练方法和深度学习训练方法的典型差别。
表1不同方法的表情识别结果对比。
Claims (6)
1.一种基于深度稀疏自编码网络的人脸情感识别方法,其特征在于,包括以下步骤:
步骤1:数据获取与预处理:对训练样本中的人脸图像进行感兴趣区域剪裁,采用灰度均衡方法对剪裁后的人脸图像预处理,然后将表情图像中的像素信息进行归一化;所述训练样本中的人脸图像的人脸表情信息已知;
步骤2:建立深度稀疏自编码网络:根据归一化后的人脸图像的像素信息以及人脸表情信息,建立一个1+n+1层的深度稀疏自编码网络,其中第1层为输入层,最后一层为分类器输出层,中间n层为隐藏层,通过进行RBM预训练,对深度稀疏自编码网络中的1+n层的权重进行初始化;所述n为设置值;
步骤3:深度稀疏自编码网络解码:将经过步骤2中RBM预训练得到的初始权重矩阵定义为wi,i∈[1,n],展开深度稀疏自编码网络,产生编码网络与解码网络并实现稀疏性表示;
步骤4:训练Softmax分类器:在深度稀疏自编码网络顶层搭建Softmax分类器,并对深度稀疏自编码网络学习到的特征进行分类,采用梯度下降法对Softmax分类器进行训练;
步骤5:整体网络权值微调:将包括Softmax分类器在内的整个深度稀疏自编码网络视为一个模型,利用反向传播算法计算整体代价函数的偏导数,并采用梯度下降法对整体深度稀疏自编码网络权值进行微调从而达到全局最优,从而提高人脸情感识别性能。
2.根据权利要求1所述的基于深度稀疏自编码网络的人脸情感识别方法,其特征在于:步骤1所述数据获取与预处理具体包括以下过程:
(1-1)数据获取:对于训练样本中的人脸图像,将眉毛、眼睛和嘴巴这三部分ROI区域从人脸图像中分割出来,获取该ROI区域的四角坐标,并将ROI区域的像素信息存储在矩阵中;
(1-2)样本预处理:对人脸图像进行直方图均衡化处理,调整人脸图像的灰度值,使不同灰度区域范围内的图像像素个数均衡。
3.根据权利要求1所述的基于深度稀疏自编码网络的人脸情感识别方法,其特征在于:步骤2所述建立深度稀疏自编码网络具体包括以下过程:
(2-1)从输入层开始,将输入层及上一层隐藏层组成一个RBM,并训练这个RBM;
(2-2)定义输入层为v,隐藏层为h,用训练好的参数以及输入层数据计算v与h的联合概率分布函数p(hj=1|v),并将此函数值作为hj的值;
(2-3)如果上述隐藏层的上一层是输出层,则预训练结束,否则进行下一步;
(2-4)把上述隐藏层看成输入层,hj作为输入数据,以输入层及上一层隐藏层组成一个RBM,并训练这个RBM;
(2-5)用训练好的参数以及输入数据计算p(hj=1|v),作为hj的值;
(2-6)返回步骤(2-3)判断预训练是否结束。
4.根据权利要求1所述的基于深度稀疏自编码网络的人脸情感识别方法,其特征在于:步骤3所述深度稀疏自编码网络解码具体包括以下过程:
(3-1)定义归一化的人脸图像的像素信息为网络输入数据x,网络输出为hw,b(x);在编码阶段,输入x通过激活函数g(·)的映射,得到u;
(3-2)在解码阶段,通过激活函数g(·)对输入信号u进行重建,得到hw,b(x);
(3-3)用表示在给定输入x下隐藏层第j个神经元的激活度,定义ρ为稀疏性参数,若某些隐藏神经元平均激活度与ρ不一致,则引入惩罚因子惩罚,使隐藏神经元的平均激活度保持在[0,0.2]范围内。
5.根据权利要求1所述的基于深度稀疏自编码网络的人脸情感识别方法,其特征在于:步骤4所述训练Softmax分类器具体包括以下过程:
(4-1)对于训练集{(x(1),y(1)),...,(x(m),y(m))},有y(i)∈{1,2,…,k},在人脸情感识别中定义k种不同类别以表示不同表情,定义θ表示模型参数矩阵;
(4-2)在代价函数中添加权重衰减项以此惩罚数值过大的参数,并对代价函数J(θ)求导;使用梯度下降法来最小化J(θ),每一次迭代需要进行参数更新,利用此迭代步骤重复进行来优化Soft分类器模型参数,实现一个优化的回归模型。
6.根据权利要求1所述的基于深度稀疏自编码网络的人脸情感识别方法,其特征在于:步骤5所述整体网络权值微调具体包括以下过程:
(5-1)利用前向传导计算公式,计算网络中各层的激活值;
(5-2)计算第ni层中每一个输出单元i的残差,之后利用递推原理得到第l层第i个节点残差的计算公式;
(5-3)计算i=1,2...,m的偏导数以及整体代价的偏导函数;
(5-4)对于J(w,b;x,y),每一次迭代进行权重更新,通过重复迭代优化权重参数求出代价函数的最小值,即求解出了最优的网络模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610924367.1A CN106503654A (zh) | 2016-10-24 | 2016-10-24 | 一种基于深度稀疏自编码网络的人脸情感识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610924367.1A CN106503654A (zh) | 2016-10-24 | 2016-10-24 | 一种基于深度稀疏自编码网络的人脸情感识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106503654A true CN106503654A (zh) | 2017-03-15 |
Family
ID=58318543
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610924367.1A Pending CN106503654A (zh) | 2016-10-24 | 2016-10-24 | 一种基于深度稀疏自编码网络的人脸情感识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106503654A (zh) |
Cited By (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107025629A (zh) * | 2017-04-27 | 2017-08-08 | 维沃移动通信有限公司 | 一种图像处理方法及移动终端 |
CN107103308A (zh) * | 2017-05-24 | 2017-08-29 | 武汉大学 | 一种基于由粗到细深度尺度学习的行人重识别方法 |
CN107122809A (zh) * | 2017-04-24 | 2017-09-01 | 北京工业大学 | 基于图像自编码的神经网络特征学习方法 |
CN107256393A (zh) * | 2017-06-05 | 2017-10-17 | 四川大学 | 基于深度学习的一维生理信号的特征提取与状态识别 |
CN107506722A (zh) * | 2017-08-18 | 2017-12-22 | 中国地质大学(武汉) | 一种基于深度稀疏卷积神经网络人脸情感识别方法 |
CN107528824A (zh) * | 2017-07-03 | 2017-12-29 | 中山大学 | 一种基于二维度稀疏化的深度信念网络入侵检测方法 |
CN107634937A (zh) * | 2017-08-29 | 2018-01-26 | 中国地质大学(武汉) | 一种无线传感网数据压缩方法、设备及其存储设备 |
CN107625521A (zh) * | 2017-09-14 | 2018-01-26 | 华东师范大学 | 基于脑电数据的用于评估记忆动态变化的多层建模方法 |
CN107634943A (zh) * | 2017-09-08 | 2018-01-26 | 中国地质大学(武汉) | 一种权值简约无线传感网数据压缩方法、设备及存储设备 |
CN107832718A (zh) * | 2017-11-13 | 2018-03-23 | 重庆工商大学 | 基于自编码器的手指静脉防伪鉴别方法及系统 |
CN107947156A (zh) * | 2017-11-24 | 2018-04-20 | 国网辽宁省电力有限公司 | 基于改进Softmax回归的电网故障临界切除时间判别方法 |
CN108021908A (zh) * | 2017-12-27 | 2018-05-11 | 深圳云天励飞技术有限公司 | 人脸年龄段识别方法及装置、计算机装置及可读存储介质 |
CN108537100A (zh) * | 2017-11-17 | 2018-09-14 | 吉林大学 | 一种基于pca和lda分析的心电信号身份识别方法及系统 |
CN108549692A (zh) * | 2018-04-13 | 2018-09-18 | 重庆邮电大学 | Spark框架下的稀疏多元逻辑回归模型对文本情感分类的方法 |
CN108694408A (zh) * | 2017-04-11 | 2018-10-23 | 西安邮电大学 | 一种基于深度稀疏滤波卷积神经网络的驾驶行为识别方法 |
CN108734116A (zh) * | 2018-05-04 | 2018-11-02 | 江南大学 | 一种基于变速学习深度自编码网络的人脸识别方法 |
CN108805802A (zh) * | 2018-06-05 | 2018-11-13 | 东北大学 | 一种基于约束条件的堆叠步进自编码器的正面人脸重建系统及方法 |
CN108921233A (zh) * | 2018-07-31 | 2018-11-30 | 武汉大学 | 一种基于自编码网络的拉曼光谱数据分类方法 |
CN108961366A (zh) * | 2018-06-06 | 2018-12-07 | 大连大学 | 基于卷积自编码器和流形学习人体运动编辑方法 |
CN109151727A (zh) * | 2018-07-28 | 2019-01-04 | 天津大学 | 基于改进的dbn的wlan指纹定位数据库构建方法 |
CN109188211A (zh) * | 2018-07-30 | 2019-01-11 | 上海交通大学 | 一种高压设备绝缘故障诊断方法和系统 |
CN109215678A (zh) * | 2018-08-01 | 2019-01-15 | 太原理工大学 | 一种基于情感维度下的深度情感交互模型的构建方法 |
CN109460471A (zh) * | 2018-11-01 | 2019-03-12 | 信融源大数据科技(北京)有限公司 | 一种基于自学习的方式建立纤维种类图谱库的方法 |
CN109635945A (zh) * | 2018-11-21 | 2019-04-16 | 华中科技大学 | 一种用于图像分类的深度神经网络的训练方法 |
CN109919864A (zh) * | 2019-02-20 | 2019-06-21 | 重庆邮电大学 | 一种基于稀疏去噪自编码网络的图像压缩感知方法 |
CN109919020A (zh) * | 2019-01-29 | 2019-06-21 | 青岛科技大学 | 一种实验性质的适应不同情感模式的驾驶意图辨识方法 |
CN109977792A (zh) * | 2019-03-04 | 2019-07-05 | 上海商汤智能科技有限公司 | 人脸特征压缩方法及装置 |
CN110082283A (zh) * | 2019-05-23 | 2019-08-02 | 山东科技大学 | 一种大气颗粒物sem图像识别方法及系统 |
CN110222623A (zh) * | 2019-05-31 | 2019-09-10 | 深圳市恩钛控股有限公司 | 微表情研判方法和系统 |
CN110321777A (zh) * | 2019-04-25 | 2019-10-11 | 重庆理工大学 | 一种基于栈式卷积稀疏去噪自编码器的人脸识别方法 |
CN110533065A (zh) * | 2019-07-18 | 2019-12-03 | 西安电子科技大学 | 基于自编码特征和深度学习回归模型的盾构姿态预测方法 |
CN110852432A (zh) * | 2018-07-24 | 2020-02-28 | 三星电子株式会社 | 对象识别装置、电子装置和识别对象的方法 |
CN110892417A (zh) * | 2017-06-05 | 2020-03-17 | D5Ai有限责任公司 | 具有学习教练的异步代理以及在不降低性能的情况下在结构上修改深度神经网络 |
CN111178520A (zh) * | 2017-06-15 | 2020-05-19 | 北京图森智途科技有限公司 | 一种低计算能力处理设备的数据处理方法及装置 |
CN111797683A (zh) * | 2020-05-21 | 2020-10-20 | 台州学院 | 一种基于深度残差注意力网络的视频表情识别方法 |
CN112270650A (zh) * | 2020-10-12 | 2021-01-26 | 西南大学 | 基于稀疏自编码器的图像处理方法、系统、介质、设备 |
CN113366509A (zh) * | 2019-01-31 | 2021-09-07 | 日立安斯泰莫株式会社 | 运算装置 |
CN113780249A (zh) * | 2021-11-10 | 2021-12-10 | 腾讯科技(深圳)有限公司 | 表情识别模型的处理方法、装置、设备、介质和程序产品 |
CN114398949A (zh) * | 2021-12-13 | 2022-04-26 | 鹏城实验室 | 一种脉冲神经网络模型的训练方法、存储介质及计算设备 |
CN114724009A (zh) * | 2022-04-26 | 2022-07-08 | 北京拙河科技有限公司 | 一种基于改进的深度学习网络的图像识别方法及装置 |
CN118036669A (zh) * | 2024-04-15 | 2024-05-14 | 深圳精智达技术股份有限公司 | 一种稀疏自编码模型的训练方法、装置、设备和介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104156728A (zh) * | 2014-07-14 | 2014-11-19 | 西安电子科技大学 | 一种基于栈式编码和softmax的极化SAR图像分类方法 |
CN104346617A (zh) * | 2014-04-18 | 2015-02-11 | 南京信息工程大学 | 一种基于滑动窗口和深度结构提取特征的细胞检测方法 |
CN104850836A (zh) * | 2015-05-15 | 2015-08-19 | 浙江大学 | 基于深度卷积神经网络的害虫图像自动识别方法 |
CN105741267A (zh) * | 2016-01-22 | 2016-07-06 | 西安电子科技大学 | 聚类引导深度神经网络分类的多源图像变化检测方法 |
CN105913025A (zh) * | 2016-04-12 | 2016-08-31 | 湖北工业大学 | 一种基于多特征融合的深度学习人脸识别方法 |
-
2016
- 2016-10-24 CN CN201610924367.1A patent/CN106503654A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104346617A (zh) * | 2014-04-18 | 2015-02-11 | 南京信息工程大学 | 一种基于滑动窗口和深度结构提取特征的细胞检测方法 |
CN104156728A (zh) * | 2014-07-14 | 2014-11-19 | 西安电子科技大学 | 一种基于栈式编码和softmax的极化SAR图像分类方法 |
CN104850836A (zh) * | 2015-05-15 | 2015-08-19 | 浙江大学 | 基于深度卷积神经网络的害虫图像自动识别方法 |
CN105741267A (zh) * | 2016-01-22 | 2016-07-06 | 西安电子科技大学 | 聚类引导深度神经网络分类的多源图像变化检测方法 |
CN105913025A (zh) * | 2016-04-12 | 2016-08-31 | 湖北工业大学 | 一种基于多特征融合的深度学习人脸识别方法 |
Non-Patent Citations (6)
Title |
---|
L.MA 等: "Facial Expression Recognition Using Constructive Feedforward Neural Networks", 《IEEE TRANSACTIONS ON SYSTEMS,MAN,AND CYBERNETICS-PARTB:CYBERNETICS》 * |
卢官明 等: "一种用于人脸表情识别的卷积神经网络", 《南京邮电大学学报(自然科学版)》 * |
施徐敢 等: "融合深度信念网络和多层感知器的人脸表情识别", 《小型微型计算机系统》 * |
池燕玲: "基于深度学习的人脸识别方法的研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
闫新宝: "深度学习机器在人脸识别中应用进展", 《无线互联科技》 * |
陈耀丹 等: "基于卷积神经网络的人脸识别方法", 《东北师大学报(自然科学版)》 * |
Cited By (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108694408A (zh) * | 2017-04-11 | 2018-10-23 | 西安邮电大学 | 一种基于深度稀疏滤波卷积神经网络的驾驶行为识别方法 |
CN107122809A (zh) * | 2017-04-24 | 2017-09-01 | 北京工业大学 | 基于图像自编码的神经网络特征学习方法 |
CN107122809B (zh) * | 2017-04-24 | 2020-04-28 | 北京工业大学 | 基于图像自编码的神经网络特征学习方法 |
CN107025629B (zh) * | 2017-04-27 | 2021-03-26 | 维沃移动通信有限公司 | 一种图像处理方法及移动终端 |
CN107025629A (zh) * | 2017-04-27 | 2017-08-08 | 维沃移动通信有限公司 | 一种图像处理方法及移动终端 |
CN107103308A (zh) * | 2017-05-24 | 2017-08-29 | 武汉大学 | 一种基于由粗到细深度尺度学习的行人重识别方法 |
CN107256393A (zh) * | 2017-06-05 | 2017-10-17 | 四川大学 | 基于深度学习的一维生理信号的特征提取与状态识别 |
CN110892417A (zh) * | 2017-06-05 | 2020-03-17 | D5Ai有限责任公司 | 具有学习教练的异步代理以及在不降低性能的情况下在结构上修改深度神经网络 |
CN110892417B (zh) * | 2017-06-05 | 2024-02-20 | D5Ai有限责任公司 | 具有学习教练的异步代理以及在不降低性能的情况下在结构上修改深度神经网络 |
CN111178520B (zh) * | 2017-06-15 | 2024-06-07 | 北京图森智途科技有限公司 | 一种构建神经网络的方法及装置 |
CN111178520A (zh) * | 2017-06-15 | 2020-05-19 | 北京图森智途科技有限公司 | 一种低计算能力处理设备的数据处理方法及装置 |
CN107528824A (zh) * | 2017-07-03 | 2017-12-29 | 中山大学 | 一种基于二维度稀疏化的深度信念网络入侵检测方法 |
CN107528824B (zh) * | 2017-07-03 | 2020-08-04 | 中山大学 | 一种基于二维度稀疏化的深度信念网络入侵检测方法 |
CN107506722A (zh) * | 2017-08-18 | 2017-12-22 | 中国地质大学(武汉) | 一种基于深度稀疏卷积神经网络人脸情感识别方法 |
CN107634937A (zh) * | 2017-08-29 | 2018-01-26 | 中国地质大学(武汉) | 一种无线传感网数据压缩方法、设备及其存储设备 |
CN107634943A (zh) * | 2017-09-08 | 2018-01-26 | 中国地质大学(武汉) | 一种权值简约无线传感网数据压缩方法、设备及存储设备 |
CN107625521A (zh) * | 2017-09-14 | 2018-01-26 | 华东师范大学 | 基于脑电数据的用于评估记忆动态变化的多层建模方法 |
CN107832718A (zh) * | 2017-11-13 | 2018-03-23 | 重庆工商大学 | 基于自编码器的手指静脉防伪鉴别方法及系统 |
CN107832718B (zh) * | 2017-11-13 | 2020-06-05 | 重庆工商大学 | 基于自编码器的手指静脉防伪鉴别方法及系统 |
CN108537100A (zh) * | 2017-11-17 | 2018-09-14 | 吉林大学 | 一种基于pca和lda分析的心电信号身份识别方法及系统 |
CN107947156A (zh) * | 2017-11-24 | 2018-04-20 | 国网辽宁省电力有限公司 | 基于改进Softmax回归的电网故障临界切除时间判别方法 |
CN107947156B (zh) * | 2017-11-24 | 2021-02-05 | 国网辽宁省电力有限公司 | 基于改进Softmax回归的电网故障临界切除时间判别方法 |
CN108021908A (zh) * | 2017-12-27 | 2018-05-11 | 深圳云天励飞技术有限公司 | 人脸年龄段识别方法及装置、计算机装置及可读存储介质 |
CN108549692B (zh) * | 2018-04-13 | 2021-05-11 | 重庆邮电大学 | Spark框架下的稀疏多元逻辑回归模型对文本情感分类的方法 |
CN108549692A (zh) * | 2018-04-13 | 2018-09-18 | 重庆邮电大学 | Spark框架下的稀疏多元逻辑回归模型对文本情感分类的方法 |
CN108734116A (zh) * | 2018-05-04 | 2018-11-02 | 江南大学 | 一种基于变速学习深度自编码网络的人脸识别方法 |
CN108734116B (zh) * | 2018-05-04 | 2021-12-03 | 江南大学 | 一种基于变速学习深度自编码网络的人脸识别方法 |
CN108805802A (zh) * | 2018-06-05 | 2018-11-13 | 东北大学 | 一种基于约束条件的堆叠步进自编码器的正面人脸重建系统及方法 |
CN108961366A (zh) * | 2018-06-06 | 2018-12-07 | 大连大学 | 基于卷积自编码器和流形学习人体运动编辑方法 |
CN110852432A (zh) * | 2018-07-24 | 2020-02-28 | 三星电子株式会社 | 对象识别装置、电子装置和识别对象的方法 |
CN109151727B (zh) * | 2018-07-28 | 2020-11-10 | 天津大学 | 基于改进的dbn的wlan指纹定位数据库构建方法 |
CN109151727A (zh) * | 2018-07-28 | 2019-01-04 | 天津大学 | 基于改进的dbn的wlan指纹定位数据库构建方法 |
CN109188211A (zh) * | 2018-07-30 | 2019-01-11 | 上海交通大学 | 一种高压设备绝缘故障诊断方法和系统 |
CN108921233B (zh) * | 2018-07-31 | 2021-06-04 | 武汉大学 | 一种基于自编码网络的拉曼光谱数据分类方法 |
CN108921233A (zh) * | 2018-07-31 | 2018-11-30 | 武汉大学 | 一种基于自编码网络的拉曼光谱数据分类方法 |
CN109215678B (zh) * | 2018-08-01 | 2022-10-11 | 太原理工大学 | 一种基于情感维度下的深度情感交互模型的构建方法 |
CN109215678A (zh) * | 2018-08-01 | 2019-01-15 | 太原理工大学 | 一种基于情感维度下的深度情感交互模型的构建方法 |
CN109460471A (zh) * | 2018-11-01 | 2019-03-12 | 信融源大数据科技(北京)有限公司 | 一种基于自学习的方式建立纤维种类图谱库的方法 |
CN109460471B (zh) * | 2018-11-01 | 2021-09-24 | 信融源大数据科技(北京)有限公司 | 一种基于自学习的方式建立纤维种类图谱库的方法 |
CN109635945A (zh) * | 2018-11-21 | 2019-04-16 | 华中科技大学 | 一种用于图像分类的深度神经网络的训练方法 |
CN109635945B (zh) * | 2018-11-21 | 2022-12-02 | 华中科技大学 | 一种用于图像分类的深度神经网络的训练方法 |
CN109919020A (zh) * | 2019-01-29 | 2019-06-21 | 青岛科技大学 | 一种实验性质的适应不同情感模式的驾驶意图辨识方法 |
CN113366509A (zh) * | 2019-01-31 | 2021-09-07 | 日立安斯泰莫株式会社 | 运算装置 |
CN109919864A (zh) * | 2019-02-20 | 2019-06-21 | 重庆邮电大学 | 一种基于稀疏去噪自编码网络的图像压缩感知方法 |
CN109977792A (zh) * | 2019-03-04 | 2019-07-05 | 上海商汤智能科技有限公司 | 人脸特征压缩方法及装置 |
CN109977792B (zh) * | 2019-03-04 | 2021-11-05 | 上海商汤智能科技有限公司 | 人脸特征压缩方法及装置 |
CN110321777A (zh) * | 2019-04-25 | 2019-10-11 | 重庆理工大学 | 一种基于栈式卷积稀疏去噪自编码器的人脸识别方法 |
CN110321777B (zh) * | 2019-04-25 | 2023-03-28 | 重庆理工大学 | 一种基于栈式卷积稀疏去噪自编码器的人脸识别方法 |
CN110082283A (zh) * | 2019-05-23 | 2019-08-02 | 山东科技大学 | 一种大气颗粒物sem图像识别方法及系统 |
CN110222623A (zh) * | 2019-05-31 | 2019-09-10 | 深圳市恩钛控股有限公司 | 微表情研判方法和系统 |
CN110533065A (zh) * | 2019-07-18 | 2019-12-03 | 西安电子科技大学 | 基于自编码特征和深度学习回归模型的盾构姿态预测方法 |
CN111797683A (zh) * | 2020-05-21 | 2020-10-20 | 台州学院 | 一种基于深度残差注意力网络的视频表情识别方法 |
CN112270650A (zh) * | 2020-10-12 | 2021-01-26 | 西南大学 | 基于稀疏自编码器的图像处理方法、系统、介质、设备 |
CN113780249A (zh) * | 2021-11-10 | 2021-12-10 | 腾讯科技(深圳)有限公司 | 表情识别模型的处理方法、装置、设备、介质和程序产品 |
CN114398949A (zh) * | 2021-12-13 | 2022-04-26 | 鹏城实验室 | 一种脉冲神经网络模型的训练方法、存储介质及计算设备 |
CN114724009A (zh) * | 2022-04-26 | 2022-07-08 | 北京拙河科技有限公司 | 一种基于改进的深度学习网络的图像识别方法及装置 |
CN114724009B (zh) * | 2022-04-26 | 2022-09-27 | 北京拙河科技有限公司 | 一种基于改进的深度学习网络的图像识别方法及装置 |
CN118036669A (zh) * | 2024-04-15 | 2024-05-14 | 深圳精智达技术股份有限公司 | 一种稀疏自编码模型的训练方法、装置、设备和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106503654A (zh) | 一种基于深度稀疏自编码网络的人脸情感识别方法 | |
CN111858989B (zh) | 一种基于注意力机制的脉冲卷积神经网络的图像分类方法 | |
CN109829541A (zh) | 基于学习自动机的深度神经网络增量式训练方法及系统 | |
CN110399821B (zh) | 基于人脸表情识别的顾客满意度获取方法 | |
CN107220506A (zh) | 基于深度卷积神经网络的乳腺癌风险评估分析系统 | |
CN110083700A (zh) | 一种基于卷积神经网络的企业舆情情感分类方法及系统 | |
CN107423442A (zh) | 基于用户画像行为分析的应用推荐方法及系统,储存介质及计算机设备 | |
CN108304826A (zh) | 基于卷积神经网络的人脸表情识别方法 | |
Chen et al. | Adaptive feature selection-based AdaBoost-KNN with direct optimization for dynamic emotion recognition in human–robot interaction | |
CN113469356A (zh) | 一种基于迁移学习的改进vgg16网络猪的身份识别方法 | |
CN106709482A (zh) | 基于自编码器的人物亲缘关系识别方法 | |
CN106920243A (zh) | 改进的全卷积神经网络的陶瓷材质件序列图像分割方法 | |
CN108805167A (zh) | 一种基于Laplace函数约束的稀疏深度置信网络图像分类方法 | |
CN103324954B (zh) | 一种基于树结构的图像分类方法及其系统 | |
CN106951858A (zh) | 一种基于深度卷积网络的人物亲缘关系识别方法与装置 | |
CN108182259A (zh) | 一种基于深度长短期记忆神经网络对多变量时间序列分类的方法 | |
CN106980830A (zh) | 一种基于深度卷积网络自亲缘关系识别方法与装置 | |
CN107194438A (zh) | 一种基于多重栈式自编码的深度特征表示方法 | |
CN110598552A (zh) | 基于改进粒子群算法优化卷积神经网络的表情识别方法 | |
CN108021908A (zh) | 人脸年龄段识别方法及装置、计算机装置及可读存储介质 | |
CN106886798A (zh) | 基于矩阵变量的高斯分布受限玻尔兹曼机的图像识别方法 | |
CN108256630A (zh) | 一种基于低维流形正则化神经网络的过拟合解决方法 | |
Xu et al. | Face expression recognition based on convolutional neural network | |
CN111104975A (zh) | 一种基于广度学习的信用评估模型 | |
Li et al. | Adaptive dropout method based on biological principles |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170315 |
|
RJ01 | Rejection of invention patent application after publication |