CN110309791A - 一种峰值时空表情识别的方法 - Google Patents
一种峰值时空表情识别的方法 Download PDFInfo
- Publication number
- CN110309791A CN110309791A CN201910599506.1A CN201910599506A CN110309791A CN 110309791 A CN110309791 A CN 110309791A CN 201910599506 A CN201910599506 A CN 201910599506A CN 110309791 A CN110309791 A CN 110309791A
- Authority
- CN
- China
- Prior art keywords
- sequence
- light stream
- image
- peak value
- peak
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000014509 gene expression Effects 0.000 title claims abstract description 31
- 238000000034 method Methods 0.000 title claims abstract description 31
- 230000008921 facial expression Effects 0.000 claims description 7
- 238000009795 derivation Methods 0.000 claims description 4
- 239000013598 vector Substances 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims 1
- 238000006467 substitution reaction Methods 0.000 claims 1
- 230000007423 decrease Effects 0.000 abstract 1
- 230000036651 mood Effects 0.000 description 2
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/174—Facial expression recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开一种峰值时空表情识别的方法,属于图像识别技术领域。该方法将视频序列固定为长度为n的序列,得到视频图像序列的灰度原始图像序列G、光流图像序列Ft和光流应变图像序列St;堆叠G、Ft、St这3个图像序列输入训练好的VGG16网络;使用峰值帧和非峰值帧对网络进行微调,得出视频序列的表情预测结果。该方法输入光流图像携带了物体的运动信息,光流应变图像能够准确地表示两个连续帧之间存在物体的微小移动量,帮助简化网络学习高级特征,有更好的易用性和鲁棒性。该方法还提出了一种新型的梯度下降的方法,使非峰值图像特征向峰值图像的特征靠近。
Description
技术领域
本发明涉及图像识别技术领域,尤其涉及一种峰值时空表情识别的方法。
背景技术
表情是情绪的主观体验的外部表现模式,人的表情主要有三种方式:面部表情、语言声调表情和身体姿态表情。从面部图像中识别情绪是计算机视觉领域的一个经典问题,到目前为止已经进行了许多研究。1971年,专家研究了人类的6种基本表情(即高兴、悲伤、惊讶、恐惧、愤怒、厌恶),并系统地建立了人脸表情图象库。
面部表情的识别对于研究人员在运动和有限数据库中的处理造成巨大挑战。
第一、大多数方法在学习过程中独立地考虑每个样本,忽略了每对样本之间的内在相关性,这限制了学习模型的识别能力;
第二、专注于识别清晰可分性的峰值表达样本,而忽略最常见的非峰值表达样本,这些非峰值表达样本的识别具有极大的挑战性;
第三、许多表情识别的方法取得了优异的性能,但是以复杂的网络模型和繁琐的调节参数为代价。
发明内容
针对上述现有技术的不足,本发明提供一种峰值时空表情识别的方法。
本发明所采取的技术方案是:
一种峰值时空表情识别的方法,其流程如图1所示,包括如下步骤:
步骤1:将已经公开带有7类基本表情标签的CK+表情数据库代入VGG16网络模型进行训练;
步骤2:采集一个固定长度为a帧的视频图像序列,检测到每一帧输入图像中的人脸,将图片含人脸部分进行剪裁,固定到224*224像素大小,将新的图片序列记为X;
步骤3:将图片序列X进行灰度处理,得到灰度原始图像序列G;
步骤4:使用方法opencv将图片序列X进行光流预处理得到光流图像序列Ft;
步骤5:对光流向量进行求导,得到光流应变图像序列St;
步骤6:将光流图像序列Ft,光流应变图像序列St,灰度原始图像序列G分别沿输入通道代入步骤1所述训练好的VGG16网络模型进行学习;
步骤6-1:将VGG16网络模型的输入维度调整为224*224*5,其中5代表有5个通道数;
步骤6-2:将光流图像序列Ft,光流应变图像序列St,灰度原始图像序列G,分别沿各自的通道输入模型进行堆叠,形成堆叠光流图像序列记为Ft’,其中Ft占3个通道,St、G分别占一个通道;
步骤6-3:将Ft’中VGG16网络模型预测得分最好的堆叠光流图像作为峰值表达图像,其余堆叠光流图像作为非峰值图像;
步骤7:将一个具有相同类型和主题的峰值和非峰值表达式的图像对作为输入,对VGG16网络进行微调;
步骤8:输出网络预测的表情标签。
本发明提供的一种峰值时空表情识别的方法融合了时间特征(视频序列中峰值表情和非峰值表情)和空间特征(视频运动的光流信息),以光流数据作为输入可以帮助简化网络学习高级特征,从而提升注入的准确率和效率,并具有更好的易用性和鲁棒性。
附图说明
图1为本发明一种峰值时空表情识别的方法的流程图;
图2为本发明具体实施例中对图像序列进行灰度处理后得到的灰度原始图像序列G;
图3为本发明具体实施例中对图像序列进行光流预处理得到的光流图像序列Ft;
图4为本发明具体实施例中对光流向量进行求导,得到光流应变图像序列St;
图5为本发明具体实施例中输出的预测表情标签。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
如图1所示,本实施例的方法如下所述。
步骤1:将已经公开带有7类基本表情标签的CK+表情数据库代入VGG16网络模型进行训练;
步骤2:采集一个固定长度为9帧的视频图像序列,检测到每一帧输入图像中的人脸,将图片含人脸部分进行剪裁,固定到224*224像素大小,将新的图片序列记为X;
步骤3:将图片序列X进行灰度处理,得到灰度原始图像序列G,如图2所示;
步骤4:使用方法opencv将图片序列X进行光流预处理得到光流图像序列Ft,如图3所示;
步骤5:对光流向量进行求导,得到光流应变图像序列St,如图4所示;
步骤6:将光流图像序列Ft,光流应变图像序列St,灰度原始图像序列G分别沿输入通道代入步骤1所述训练好的VGG16网络模型进行学习;
步骤6-1:将VGG16网络模型的输入维度调整为224*224*5,其中5代表有5个通道数;
步骤6-2:将光流图像序列Ft,光流应变图像序列St,灰度原始图像序列G,分别沿各自的通道输入模型进行堆叠,形成堆叠光流图像序列记为Ft’,其中Ft占3个通道,St、G分别占一个通道;
步骤6-3:将Ft’中VGG16网络模型预测得分最好的堆叠光流图像作为峰值表达图像,其余堆叠光流图像作为非峰值图像;
步骤7:将一个具有相同类型和主题的峰值和非峰值表达式的图像对作为输入,对VGG16网络进行微调;
步骤8:输出网络预测的表情标签,如图5所示,该图片系列的表情为“正常”。
本发明提供的方法替代传统的SGD来实现反向传播过程。本方法只允许非峰值表情的特征像峰值靠近,不允许峰值表情特征像峰值特征靠近,提高了学习模型的识别能力。
Claims (3)
1.一种峰值时空表情识别的方法,其特征在于,包括如下步骤:
步骤1:将已经公开带有7类基本表情标签的CK+表情数据库代入VGG16网络模型进行训练;
步骤2:采集一个固定长度为a帧的视频图像序列,检测到每一帧输入图像中的人脸,将图片含人脸部分进行剪裁,固定到224*224像素大小,将新的图片序列记为X;
步骤3:将图片序列X进行灰度处理,得到灰度原始图像序列G;
步骤4:将图片序列X进行光流预处理得到光流图像序列Ft;
步骤5:对光流向量进行求导,得到光流应变图像序列St;
步骤6:将光流图像序列Ft,光流应变图像序列St,灰度原始图像序列G分别沿输入通道代入步骤1所述训练好的VGG16网络模型进行学习;
步骤7:将一个具有相同类型和主题的峰值和非峰值表达式的图像对作为输入,对VGG16网络进行微调;
步骤8:输出网络预测的表情标签。
2.根据权利要求1所述的一种峰值时空表情识别的方法,其特征在于,所述步骤4中使用方法opencv进行光流预处理。
3.根据权利要求1所述的一种峰值时空表情识别的方法,其特征在于,所述步骤6中沿输入通道代入步骤1所述训练好的VGG16网络模型进行学习的过程如下:
步骤6-1:将VGG16网络模型的输入维度调整为224*224*5,其中5代表有5个通道数;
步骤6-2:将光流图像序列Ft,光流应变图像序列St,灰度原始图像序列G,分别沿各自的通道输入模型进行堆叠,形成堆叠光流图像序列记为Ft’,其中Ft占3个通道,St、G分别占一个通道;
步骤6-3:将Ft’中VGG16网络模型预测得分最好的堆叠光流图像作为峰值表达图像,其余堆叠光流图像作为非峰值图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910599506.1A CN110309791A (zh) | 2019-07-04 | 2019-07-04 | 一种峰值时空表情识别的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910599506.1A CN110309791A (zh) | 2019-07-04 | 2019-07-04 | 一种峰值时空表情识别的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110309791A true CN110309791A (zh) | 2019-10-08 |
Family
ID=68078195
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910599506.1A Pending CN110309791A (zh) | 2019-07-04 | 2019-07-04 | 一种峰值时空表情识别的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110309791A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111709266A (zh) * | 2020-03-26 | 2020-09-25 | 杭州尚课网络科技有限公司 | 基于时空融合网络的面部表情识别方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107220591A (zh) * | 2017-04-28 | 2017-09-29 | 哈尔滨工业大学深圳研究生院 | 多模态智能情绪感知系统 |
CN108647628A (zh) * | 2018-05-07 | 2018-10-12 | 山东大学 | 一种基于多特征多任务字典稀疏迁移学习的微表情识别方法 |
CN109190479A (zh) * | 2018-08-04 | 2019-01-11 | 台州学院 | 一种基于混合深度学习的视频序列表情识别方法 |
-
2019
- 2019-07-04 CN CN201910599506.1A patent/CN110309791A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107220591A (zh) * | 2017-04-28 | 2017-09-29 | 哈尔滨工业大学深圳研究生院 | 多模态智能情绪感知系统 |
CN108647628A (zh) * | 2018-05-07 | 2018-10-12 | 山东大学 | 一种基于多特征多任务字典稀疏迁移学习的微表情识别方法 |
CN109190479A (zh) * | 2018-08-04 | 2019-01-11 | 台州学院 | 一种基于混合深度学习的视频序列表情识别方法 |
Non-Patent Citations (1)
Title |
---|
HUAI-QIAN KHOR ET AL.: "Enriched Long-term Recurrent Convolutional Network for Facial Micro-Expression Recognition", 《2018 13TH IEEE INTERNATIONAL CONFERENCE ON AUTOMATIC FACE & GESTURE RECOGNITION (FG 2018)》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111709266A (zh) * | 2020-03-26 | 2020-09-25 | 杭州尚课网络科技有限公司 | 基于时空融合网络的面部表情识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Khor et al. | Enriched long-term recurrent convolutional network for facial micro-expression recognition | |
Tenenbaum et al. | Separating style and content | |
Chen et al. | Facial expression recognition: a clustering-based approach | |
Saha et al. | Hierarchical deep feature learning for decoding imagined speech from EEG | |
Fanelli et al. | Hough forest-based facial expression recognition from video sequences | |
Zhou et al. | Color facial expression recognition by quaternion convolutional neural network with Gabor attention | |
CN116386104A (zh) | 对比学习结合掩码图像建模的自监督人脸表情识别方法 | |
CN116311483B (zh) | 基于局部面部区域重构和记忆对比学习的微表情识别方法 | |
Lee et al. | Timeconvnets: A deep time windowed convolution neural network design for real-time video facial expression recognition | |
Hussein et al. | Emotional stability detection using convolutional neural networks | |
CN116701996A (zh) | 基于多元损失函数的多模态情感分析方法、系统、设备及介质 | |
CN114973383A (zh) | 一种微表情识别方法、装置、电子设备及存储介质 | |
CN113033452A (zh) | 融合通道注意力和选择性特征融合机制的唇语识别方法 | |
CN110175578B (zh) | 应用于刑侦的基于深度森林的微表情识别方法 | |
CN110309791A (zh) | 一种峰值时空表情识别的方法 | |
Baffour et al. | A survey on deep learning algorithms in facial Emotion Detection and Recognition | |
CN112686117B (zh) | 一种基于隐变量分析的人脸表情强度识别方法及系统 | |
CN113076916A (zh) | 基于几何特征加权融合的动态人脸表情识别方法及系统 | |
Guo et al. | A hybrid facial expression recognition system based on recurrent neural network | |
Zhang et al. | Position-squeeze and excitation module for facial attribute analysis | |
CN113221884B (zh) | 一种基于低频字存储记忆的文本识别方法及系统 | |
CN112766101B (zh) | 一种中文唇语识别建模单元集的构建方法 | |
Wang | Facial affect detection using convolutional neural networks | |
Yan et al. | Cross-age face synthesis based on conditional adversarial autoencoder | |
CN117558050B (zh) | 面向边缘计算端的实时人脸表情识别方法及人机交互系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191008 |