CN106778444A - 一种基于多视图卷积神经网络的表情识别方法 - Google Patents

一种基于多视图卷积神经网络的表情识别方法 Download PDF

Info

Publication number
CN106778444A
CN106778444A CN201510807938.9A CN201510807938A CN106778444A CN 106778444 A CN106778444 A CN 106778444A CN 201510807938 A CN201510807938 A CN 201510807938A CN 106778444 A CN106778444 A CN 106778444A
Authority
CN
China
Prior art keywords
view
feature
convolutional neural
neural networks
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510807938.9A
Other languages
English (en)
Other versions
CN106778444B (zh
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Huajian Intelligent Technology Co ltd
Original Assignee
GUANGZHOU HUAJIU INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GUANGZHOU HUAJIU INFORMATION TECHNOLOGY Co Ltd filed Critical GUANGZHOU HUAJIU INFORMATION TECHNOLOGY Co Ltd
Priority to CN201510807938.9A priority Critical patent/CN106778444B/zh
Publication of CN106778444A publication Critical patent/CN106778444A/zh
Application granted granted Critical
Publication of CN106778444B publication Critical patent/CN106778444B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/174Facial expression recognition
    • G06V40/175Static expression

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于多视图卷积神经网络的表情识别方法,包括步骤:根据表情类别构造多个视图;采用每个视图的训练样本集训练卷积神经网络,获得视图特征抽取模型。根据视图抽取模型抽取测试样本的特征向量,将测试样本在所有视图下的特征向量串接成一个高维稀疏特征向量,然后进行特征选择,获得低维特征向量;采用表情分类模型对低维特征向量分类,获得表情类别。本发明的效果是提高了表情识别的准确率,每个视图特征抽取模型可并行计算,能提高识别速度。

Description

一种基于多视图卷积神经网络的表情识别方法
技术领域
本发明涉及一种基于多视图卷积神经网络的表情识别方法,属于医疗健康和模式识别技术领域。
背景技术
情感状态体现了心理的健康状态,目前很多人都面临心理压力,或多或少会出现一些心理情感问题,表现为烦躁,焦虑,抑郁等,需要及时引导,但是这些表现出来的信号,对于心理学知识缺乏的人一般很难觉察,因此借助信息技术,自动监测并提醒是很重要的。人脸表情包含了丰富的情感信息,是我们理解情感的重要途径,因此通过人脸表情分析就可以实现人类的情感状态判别,进而判断人类的情感健康情况。
发明内容
本发明要解决的技术问题是:目前表情识别的准确率不高。
本发明涉及一种基于多视图卷积神经网络的表情识别方法,其特征在于该方法包括以下步骤:
[1]根据每个视图特征抽取模型抽取测试样本(输入人脸图像)在该视图下的特征向量;
[2]将测试样本在所有视图下的特征向量串接成一个高维稀疏特征向量;
[3]根据特征选择模型对高维稀疏特征向量进行特征选择,获得低维特征向量;
[4]采用表情分类模型对低维特征向量分类,获得测试样本的表情类别。
步骤[1] 根据每个视图特征抽取模型抽取测试样本在该视图下的特征向量,其包括视图定义和视图特征抽取模型的实现。
视图定义为表情类别的任意组合,每个组合就是一个视图。
视图特征抽取模型的实现是在训练阶段完成的,包括以下步骤:
(a)构造每个视图的训练样本集,其由该视图所包含的所有类的训练样本构成
(b)利用每个视图的训练样本集训练卷积神经网络,获得该视图的视图特征抽取模型,它由训练好的卷积神经网络中的特征提取部分组成。
然后用训练好的视图特征抽取模型抽取测试样本在该视图下的特征向量。
步骤[2] 将测试样本在所有视图下的特征向量串接成一个高维稀疏特征向量。
步骤[3] 根据特征选择模型对高维稀疏特征向量进行特征选择,获得低维特征向量,其中特征选择模型是在训练阶段完成的,包括以下步骤:
(a)构造每个视图的训练样本集
(b)利用每个视图抽取模型抽取每个训练样本的特征向量
(c)将每个训练样本在所有视图下的特征向量串接成一个高维稀疏特征向量
(d)采用特征选择方法对所有训练样本的高维特征向量进行特征选择,获得低维特征向量和特征选择模型。
采用特征选择方法对所有训练样本的稀疏特征向量进行特征选择时,需要预先训练,获得特征选择模型。
步骤[4] 采用表情分类模型对低维特征向量分类,获得测试样本的表情类别。
分类模型是通过大量的训练样本训练机器学习算法获得,而每个训练样本则由人脸图像和其对应的表情类别构成。训练样本的特征向量是经过步骤[3]特征选择后的特征向量。
有益效果
与现有技术相比,本发明的一种基于多视图卷积神经网络的表情识别方法具有以下优点:
[1]提高了表情识别的准确率
[2]视图特征抽取模型、特征选择模型和表情分类模型都是在训练阶段完成的,不影响测试过程
[3]多个视图特征抽取模型可以并行运行,具有提高识别速度的潜在能力。
附图说明
图1 基于多视图卷积神经网络的表情识别方法的流程图;
图2 视图的示意图。
具体实施方式
本发明提出的一种基于多视图卷积神经网络的表情识别方法,结合附图和实施例说明如下。如图1 所示,为一种基于多视图卷积神经网络的表情识别方法的流程图,该方法包括以下步骤:
[1]根据每个视图特征抽取模型抽取测试样本(输入人脸图像)在该视图下的特征向量;
[2]将测试样本在所有视图下的特征向量串接成一个高维稀疏特征向量;
[3]根据特征选择模型对高维稀疏特征向量进行特征选择,获得低维特征向量;
[4]采用表情分类模型对低维特征向量分类,获得测试样本的表情类别。
步骤[1] 根据每个视图特征抽取模型抽取测试样本的在该视图下的特征向量,其包括视图的定义和视图特征抽取模型的实现。
视图定义为表情类别的任意组合,每个组合就是一个视图。如图2所示,情感类别为高兴C1,悲伤C2,和平静C3, 则视图有:
视图V1={C1}={高兴}
视图V2={C2}={悲伤}
视图V3={C3}={平静}
视图V4={C1,C2}={高兴,悲伤}
视图V5={C1,C3}={高兴,平静}
视图V6={C2,C3}={悲伤,平静}
视图特征抽取模型的实现包括以下步骤:(a)构造每个视图的训练样本集,其由该视图所包含的所有类的训练样本组成。如图2中的视图V6={C2,C3}={悲伤,平静},其训练样本集则由类别C2的训练样本和类别C3的训练样本构成。(b)采用每个视图的训练样本集训练卷积神经网络,获得该视图的视图特征抽取模型,它由训练好的卷积神经网络中的特征提取部分组成。
然后用训练好的视图特征抽取模型抽取测试样本在该视图下的特征向量。
视图特征抽取模型采用卷积神经网络(Convolutional Neural Networks-简称CNN)实现。CNN是近年发展起来,并引起广泛重视的一种高效识别方法。由于CNN的特征检测层通过训练样本进行自动学习,避免了显示特征抽取,因而得到了更为广泛的应用。
本实施案例采用2010年Alex Krizhevsky发表的CNN结构, 其为2-GPU并行结构,基本参数如下:
输入:224×224大小的图片,3通道。
第一层卷积:5×5大小的卷积核96个,每个GPU上48个。
第一层max-pooling:2×2的核。
第二层卷积:3×3卷积核256个,每个GPU上128个。
第二层max-pooling:2×2的核。
第三层卷积:与上一层是全连接,3*3的卷积核384个。分到两个GPU上个192个。
第四层卷积:3×3的卷积核384个,两个GPU各192个。该层与上一层连接没有经过pooling层。
第五层卷积:3×3的卷积核256个,两个GPU上个128个。
第五层max-pooling:2×2的核。
第一层全连接:4096维,将第五层max-pooling的输出连接成为一个一维向量,作为该层的输入。
第二层全连接:4096维
Softmax层:输出为1000,输出的每一维都是图片属于该类别的概率
因此此CNN网络的特征提取4096维,分类器采用Softmax。
即每个视图特征抽取模型最终提取的特征维是4096维。
步骤[2] 将测试样本在所有视图下的特征向量串接成一个高维稀疏特征向量。如图2所示,共有6个视图,因此串接的高维稀疏特征向量为4096*6=24576维,这是一个典型的高维稀疏向量,需要通过特征选择方法来降维。
步骤[3] 根据特征选择模型对测试样本的高维稀疏特征向量进行特征选择,获得低维特征向量,其中特征选择模型是在训练阶段完成的,包括以下步骤:
(a)构造每个视图的训练样本集
(b)利用每个视图抽取模型抽取每个训练样本的特征向量
(c)将每个训练样本在所有视图下的特征向量串接成一个高维稀疏特征向量
(d)采用特征选择方法对所有训练样本的高维特征向量进行特征选择,获得低维特征向量和特征选择模型
采用特征选择方法对所有训练样本的稀疏特征向量进行特征选择时,需要预先训练,获得特征选择模型。
如图2所示,共有6个视图,那么根据以上步骤(a)~(c)就能将每个训练样本转为24576维的高维稀疏特征向量,然后本实施案例采用一种非常有效的多聚类特征选择(Multi-cluster Feature Selection, MCFS)方法(Deng Cai, et al. UnsupervisedFeature Selection for Multi-cluster Data, KDD 2010)在这些高维训练样本集上实现特征选择模型。
MCFS训练后的特征选择模型就是选择的d个特征的索引,其中MFCS中涉及的参数如d都是预先指定的参数,可以通过实验获取较好的值。假定选择比较好的d=5000,即每个训练样本转化为5000维的特征向量。
同样用第5步获得的特征选择模型将测试样本转为5000维的特征向量。
步骤[4] 采用表情分类模型对测试样本的低维特征向量分类,获得测试样本的表情类别。
分类模型是通过大量的训练样本训练机器学习算法获得,而每个训练数据则由人脸图像和其对应的表情类别构成。训练样本的特征向量是经过步骤[3]特征选择后的低维特征向量。
目前有很多分类器,包括支持向量机(Support Vector Machine, SVM),SOFTMAX。本实施案例采用SVM作为分类器。SVM基于结构风险最小化原则,具有良好的泛化能力。SVM算法实现直接采用LibSVM库函数
(http://www.csie.ntu.edu.tw/~cjlin/libsvm/),其由多种编程语言实现。SVM选择径向基函数作为核函数,以预测性能为准则,以10倍交叉验证方式选择SVM的合适参数,进而获得对应的支持向量机分类模型。
实验结果表明所提方法是有效的,优于现有的方法。
本领域的普通技术人员应当理解,本发明的技术方案可以进行修改,变形或等同变换,而不脱离本发明技术方案的本质和范围,均覆盖在本发明的权利要求范围之中。

Claims (5)

1.一种基于多视图卷积神经网络的表情识别方法,其特征在于该方法包括以下步骤:
[1]根据每个视图特征抽取模型抽取测试样本(输入人脸图像)在该视图下的特征向量;
[2]将测试样本在所有视图下的特征向量串接成一个高维稀疏特征向量;
[3]根据特征选择模型对高维稀疏特征向量进行特征选择,获得低维特征向量;
[4]采用表情分类模型对低维特征向量分类,获得测试样本的表情类别。
2.根据权利要求1 所述的一种基于多视图卷积神经网络的表情识别方法,其特征在于所述的步骤[1] 视图定义为表情类别的任意组合,每个组合就是一个视图。
3.根据权利要求1 所述的一种基于多视图卷积神经网络的表情识别方法,其特征在于所述的步骤[1] 中视图特征抽取模型的获得是在训练阶段完成的,包括以下步骤:
[1]构造每个视图的训练样本集,其由该视图所包含的所有类的训练样本构成;
[2]利用每个视图的训练样本集训练卷积神经网络,获得该视图特征抽取模型。
4.根据权利要求1 所述的一种基于多视图卷积神经网络的表情识别方法,其特征在于所述的步骤[3] 中特征选择模型的获得是在训练阶段完成的,包括以下步骤:
[1]构造每个视图的训练样本集;
[2]利用每个视图抽取模型抽取每个训练样本的特征向量;
[3]将每个训练样本在所有视图下的特征向量串接成一个高维稀疏特征向量;
[4]采用特征选择方法对所有训练样本的高维特征向量进行特征选择,获得低维特征向量和特征选择模型。
5.根据权利要求1 和权利要求3所述的一种基于多视图卷积神经网络的表情识别方法,其特征在于采用卷积神经网络实现每个视图的特征抽取模型。
CN201510807938.9A 2015-11-23 2015-11-23 一种基于多视图卷积神经网络的表情识别方法 Active CN106778444B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510807938.9A CN106778444B (zh) 2015-11-23 2015-11-23 一种基于多视图卷积神经网络的表情识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510807938.9A CN106778444B (zh) 2015-11-23 2015-11-23 一种基于多视图卷积神经网络的表情识别方法

Publications (2)

Publication Number Publication Date
CN106778444A true CN106778444A (zh) 2017-05-31
CN106778444B CN106778444B (zh) 2022-02-15

Family

ID=58885687

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510807938.9A Active CN106778444B (zh) 2015-11-23 2015-11-23 一种基于多视图卷积神经网络的表情识别方法

Country Status (1)

Country Link
CN (1) CN106778444B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107506722A (zh) * 2017-08-18 2017-12-22 中国地质大学(武汉) 一种基于深度稀疏卷积神经网络人脸情感识别方法
CN107609587A (zh) * 2017-09-11 2018-01-19 浙江工业大学 一种基于深度卷积生成对抗网络的多类别多视图数据生成方法
CN107958230A (zh) * 2017-12-22 2018-04-24 中国科学院深圳先进技术研究院 人脸表情识别方法及装置
CN107977634A (zh) * 2017-12-06 2018-05-01 北京飞搜科技有限公司 一种针对视频的表情识别方法、装置及设备
CN108921061A (zh) * 2018-06-20 2018-11-30 腾讯科技(深圳)有限公司 一种表情识别方法、装置和设备
CN110110672A (zh) * 2019-05-10 2019-08-09 广东工业大学 一种人脸表情识别方法、装置及设备
CN110287773A (zh) * 2019-05-14 2019-09-27 杭州电子科技大学 基于自主学习的交通枢纽安检图像识别方法
CN111310670A (zh) * 2020-02-19 2020-06-19 江苏理工学院 一种基于预定义和随机视点的多视图三维形状识别方法
CN112036288A (zh) * 2020-08-27 2020-12-04 华中师范大学 基于跨连接多特征融合卷积神经网络的面部表情识别方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130142426A1 (en) * 2011-12-01 2013-06-06 Canon Kabushiki Kaisha Image recognition apparatus, control method for image recognition apparatus, and storage medium
CN104636711A (zh) * 2013-11-15 2015-05-20 广州华久信息科技有限公司 一种基于局部稀疏表示分类器的人脸情感识别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130142426A1 (en) * 2011-12-01 2013-06-06 Canon Kabushiki Kaisha Image recognition apparatus, control method for image recognition apparatus, and storage medium
CN104636711A (zh) * 2013-11-15 2015-05-20 广州华久信息科技有限公司 一种基于局部稀疏表示分类器的人脸情感识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
唐浩 等: "《基于改进的卷积神经网络的负面表情识别方法》", 《华中科技大学学报(自然科学版)》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107506722A (zh) * 2017-08-18 2017-12-22 中国地质大学(武汉) 一种基于深度稀疏卷积神经网络人脸情感识别方法
CN107609587A (zh) * 2017-09-11 2018-01-19 浙江工业大学 一种基于深度卷积生成对抗网络的多类别多视图数据生成方法
CN107609587B (zh) * 2017-09-11 2020-08-18 浙江工业大学 一种基于深度卷积生成对抗网络的多类别多视图数据生成方法
CN107977634A (zh) * 2017-12-06 2018-05-01 北京飞搜科技有限公司 一种针对视频的表情识别方法、装置及设备
CN107958230A (zh) * 2017-12-22 2018-04-24 中国科学院深圳先进技术研究院 人脸表情识别方法及装置
CN107958230B (zh) * 2017-12-22 2020-06-23 中国科学院深圳先进技术研究院 人脸表情识别方法及装置
CN108921061A (zh) * 2018-06-20 2018-11-30 腾讯科技(深圳)有限公司 一种表情识别方法、装置和设备
CN110110672A (zh) * 2019-05-10 2019-08-09 广东工业大学 一种人脸表情识别方法、装置及设备
CN110287773A (zh) * 2019-05-14 2019-09-27 杭州电子科技大学 基于自主学习的交通枢纽安检图像识别方法
CN111310670A (zh) * 2020-02-19 2020-06-19 江苏理工学院 一种基于预定义和随机视点的多视图三维形状识别方法
CN111310670B (zh) * 2020-02-19 2024-02-06 江苏理工学院 一种基于预定义和随机视点的多视图三维形状识别方法
CN112036288A (zh) * 2020-08-27 2020-12-04 华中师范大学 基于跨连接多特征融合卷积神经网络的面部表情识别方法

Also Published As

Publication number Publication date
CN106778444B (zh) 2022-02-15

Similar Documents

Publication Publication Date Title
CN106778444A (zh) 一种基于多视图卷积神经网络的表情识别方法
Khor et al. Dual-stream shallow networks for facial micro-expression recognition
CN110353675B (zh) 基于图片生成的脑电信号情感识别方法及装置
CN108388348A (zh) 一种基于深度学习和注意力机制的肌电信号手势识别方法
CN107610123A (zh) 一种基于深度卷积神经网络的图像美学质量评价方法
CN106845329A (zh) 一种基于深度卷积特征多通道金字塔池化的动作识别方法
CN103971095B (zh) 基于多尺度lbp和稀疏编码的大规模人脸表情识别方法
CN105139004A (zh) 基于视频序列的人脸表情识别方法
CN110390275A (zh) 一种基于迁移学习的手势分类方法
CN113011386B (zh) 一种基于等分特征图的表情识别方法及系统
CN105244042A (zh) 一种基于有限状态自动机的语音情感交互装置与方法
CN106959946A (zh) 一种基于深度学习的文本语义特征生成优化方法
Wang et al. Maximum weight multi-modal information fusion algorithm of electroencephalographs and face images for emotion recognition
CN113343860A (zh) 一种基于视频图像和语音的双模态融合情感识别方法
CN110135244A (zh) 一种基于脑-机协同智能的表情识别方法
CN106909573A (zh) 一种评价问答对质量的方法和装置
CN113069117A (zh) 一种基于时间卷积神经网络的脑电情绪识别方法及系统
CN104679967A (zh) 一种判断心理测试可靠性的方法
Yao et al. Parkinson’s disease and cleft lip and palate of pathological speech diagnosis using deep convolutional neural networks evolved by IPWOA
CN106874363A (zh) 智能机器人的多模态输出方法及装置
Cai et al. Cross-subject emotion recognition using visibility graph and genetic algorithm-based convolution neural network
CN107045624A (zh) 一种基于最大加权团的脑电信号预处理与分类方法
CN117195099A (zh) 一种融合多尺度特征的脑电信号情感识别算法
CN115801152B (zh) 基于层次化transformer模型的WiFi动作识别方法
Tan et al. An emotion index estimation based on facial action unit prediction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230410

Address after: 511458 room 901, No. 2, Chenghui street, Nansha street, Nansha District, Guangzhou City, Guangdong Province

Patentee after: GUANGZHOU HUAJIAN INTELLIGENT TECHNOLOGY Co.,Ltd.

Address before: 510000 Room 820, Engineering Building, Guangzhou University of Traditional Chinese Medicine, 232 East Ring Road, Xiaoguwei Street, Panyu District, Guangzhou, Guangdong Province

Patentee before: GUANGZHOU HUAJIU INFORMATION TECHNOLOGY Co.,Ltd.