CN110309791A - 一种峰值时空表情识别的方法 - Google Patents
一种峰值时空表情识别的方法 Download PDFInfo
- Publication number
- CN110309791A CN110309791A CN201910599506.1A CN201910599506A CN110309791A CN 110309791 A CN110309791 A CN 110309791A CN 201910599506 A CN201910599506 A CN 201910599506A CN 110309791 A CN110309791 A CN 110309791A
- Authority
- CN
- China
- Prior art keywords
- sequence
- image
- peak
- light stream
- optical flow
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000014509 gene expression Effects 0.000 title claims abstract description 38
- 238000000034 method Methods 0.000 title claims abstract description 27
- 230000008921 facial expression Effects 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 239000013598 vector Substances 0.000 claims description 4
- 238000009795 derivation Methods 0.000 claims description 2
- 238000013528 artificial neural network Methods 0.000 claims 1
- 238000006467 substitution reaction Methods 0.000 claims 1
- 230000003287 optical effect Effects 0.000 abstract description 32
- 238000011478 gradient descent method Methods 0.000 abstract 1
- 230000008451 emotion Effects 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/174—Facial expression recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开一种峰值时空表情识别的方法,属于图像识别技术领域。该方法将视频序列固定为长度为n的序列,得到视频图像序列的灰度原始图像序列G、光流图像序列Ft和光流应变图像序列St;堆叠G、Ft、St这3个图像序列输入训练好的VGG16网络;使用峰值帧和非峰值帧对网络进行微调,得出视频序列的表情预测结果。该方法输入光流图像携带了物体的运动信息,光流应变图像能够准确地表示两个连续帧之间存在物体的微小移动量,帮助简化网络学习高级特征,有更好的易用性和鲁棒性。该方法还提出了一种新型的梯度下降的方法,使非峰值图像特征向峰值图像的特征靠近。
Description
技术领域
本发明涉及图像识别技术领域,尤其涉及一种峰值时空表情识别的方法。
背景技术
表情是情绪的主观体验的外部表现模式,人的表情主要有三种方式:面部表情、语言声调表情和身体姿态表情。从面部图像中识别情绪是计算机视觉领域的一个经典问题,到目前为止已经进行了许多研究。1971年,专家研究了人类的6种基本表情(即高兴、悲伤、惊讶、恐惧、愤怒、厌恶),并系统地建立了人脸表情图象库。
面部表情的识别对于研究人员在运动和有限数据库中的处理造成巨大挑战。
第一、大多数方法在学习过程中独立地考虑每个样本,忽略了每对样本之间的内在相关性,这限制了学习模型的识别能力;
第二、专注于识别清晰可分性的峰值表达样本,而忽略最常见的非峰值表达样本,这些非峰值表达样本的识别具有极大的挑战性;
第三、许多表情识别的方法取得了优异的性能,但是以复杂的网络模型和繁琐的调节参数为代价。
发明内容
针对上述现有技术的不足,本发明提供一种峰值时空表情识别的方法。
本发明所采取的技术方案是:
一种峰值时空表情识别的方法,其流程如图1所示,包括如下步骤:
步骤1:将已经公开带有7类基本表情标签的CK+表情数据库代入VGG16网络模型进行训练;
步骤2:采集一个固定长度为a帧的视频图像序列,检测到每一帧输入图像中的人脸,将图片含人脸部分进行剪裁,固定到224*224像素大小,将新的图片序列记为X;
步骤3:将图片序列X进行灰度处理,得到灰度原始图像序列G;
步骤4:使用方法opencv将图片序列X进行光流预处理得到光流图像序列Ft;
步骤5:对光流向量进行求导,得到光流应变图像序列St;
步骤6:将光流图像序列Ft,光流应变图像序列St,灰度原始图像序列G分别沿输入通道代入步骤1所述训练好的VGG16网络模型进行学习;
步骤6-1:将VGG16网络模型的输入维度调整为224*224*5,其中5代表有5个通道数;
步骤6-2:将光流图像序列Ft,光流应变图像序列St,灰度原始图像序列G,分别沿各自的通道输入模型进行堆叠,形成堆叠光流图像序列记为Ft’,其中Ft占3个通道,St、G分别占一个通道;
步骤6-3:将Ft’中VGG16网络模型预测得分最好的堆叠光流图像作为峰值表达图像,其余堆叠光流图像作为非峰值图像;
步骤7:将一个具有相同类型和主题的峰值和非峰值表达式的图像对作为输入,对VGG16网络进行微调;
步骤8:输出网络预测的表情标签。
本发明提供的一种峰值时空表情识别的方法融合了时间特征(视频序列中峰值表情和非峰值表情)和空间特征(视频运动的光流信息),以光流数据作为输入可以帮助简化网络学习高级特征,从而提升注入的准确率和效率,并具有更好的易用性和鲁棒性。
附图说明
图1为本发明一种峰值时空表情识别的方法的流程图;
图2为本发明具体实施例中对图像序列进行灰度处理后得到的灰度原始图像序列G;
图3为本发明具体实施例中对图像序列进行光流预处理得到的光流图像序列Ft;
图4为本发明具体实施例中对光流向量进行求导,得到光流应变图像序列St;
图5为本发明具体实施例中输出的预测表情标签。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
如图1所示,本实施例的方法如下所述。
步骤1:将已经公开带有7类基本表情标签的CK+表情数据库代入VGG16网络模型进行训练;
步骤2:采集一个固定长度为9帧的视频图像序列,检测到每一帧输入图像中的人脸,将图片含人脸部分进行剪裁,固定到224*224像素大小,将新的图片序列记为X;
步骤3:将图片序列X进行灰度处理,得到灰度原始图像序列G,如图2所示;
步骤4:使用方法opencv将图片序列X进行光流预处理得到光流图像序列Ft,如图3所示;
步骤5:对光流向量进行求导,得到光流应变图像序列St,如图4所示;
步骤6:将光流图像序列Ft,光流应变图像序列St,灰度原始图像序列G分别沿输入通道代入步骤1所述训练好的VGG16网络模型进行学习;
步骤6-1:将VGG16网络模型的输入维度调整为224*224*5,其中5代表有5个通道数;
步骤6-2:将光流图像序列Ft,光流应变图像序列St,灰度原始图像序列G,分别沿各自的通道输入模型进行堆叠,形成堆叠光流图像序列记为Ft’,其中Ft占3个通道,St、G分别占一个通道;
步骤6-3:将Ft’中VGG16网络模型预测得分最好的堆叠光流图像作为峰值表达图像,其余堆叠光流图像作为非峰值图像;
步骤7:将一个具有相同类型和主题的峰值和非峰值表达式的图像对作为输入,对VGG16网络进行微调;
步骤8:输出网络预测的表情标签,如图5所示,该图片系列的表情为“正常”。
本发明提供的方法替代传统的SGD来实现反向传播过程。本方法只允许非峰值表情的特征像峰值靠近,不允许峰值表情特征像峰值特征靠近,提高了学习模型的识别能力。
Claims (3)
1.一种峰值时空表情识别的方法,其特征在于,包括如下步骤:
步骤1:将已经公开带有7类基本表情标签的CK+表情数据库代入VGG16网络模型进行训练;
步骤2:采集一个固定长度为a帧的视频图像序列,检测到每一帧输入图像中的人脸,将图片含人脸部分进行剪裁,固定到224*224像素大小,将新的图片序列记为X;
步骤3:将图片序列X进行灰度处理,得到灰度原始图像序列G;
步骤4:将图片序列X进行光流预处理得到光流图像序列Ft;
步骤5:对光流向量进行求导,得到光流应变图像序列St;
步骤6:将光流图像序列Ft,光流应变图像序列St,灰度原始图像序列G分别沿输入通道代入步骤1所述训练好的VGG16网络模型进行学习;
步骤7:将一个具有相同类型和主题的峰值和非峰值表达式的图像对作为输入,对VGG16网络进行微调;
步骤8:输出网络预测的表情标签。
2.根据权利要求1所述的一种峰值时空表情识别的方法,其特征在于,所述步骤4中使用方法opencv进行光流预处理。
3.根据权利要求1所述的一种峰值时空表情识别的方法,其特征在于,所述步骤6中沿输入通道代入步骤1所述训练好的VGG16网络模型进行学习的过程如下:
步骤6-1:将VGG16网络模型的输入维度调整为224*224*5,其中5代表有5个通道数;
步骤6-2:将光流图像序列Ft,光流应变图像序列St,灰度原始图像序列G,分别沿各自的通道输入模型进行堆叠,形成堆叠光流图像序列记为Ft’,其中Ft占3个通道,St、G分别占一个通道;
步骤6-3:将Ft’中VGG16网络模型预测得分最好的堆叠光流图像作为峰值表达图像,其余堆叠光流图像作为非峰值图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910599506.1A CN110309791A (zh) | 2019-07-04 | 2019-07-04 | 一种峰值时空表情识别的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910599506.1A CN110309791A (zh) | 2019-07-04 | 2019-07-04 | 一种峰值时空表情识别的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110309791A true CN110309791A (zh) | 2019-10-08 |
Family
ID=68078195
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910599506.1A Pending CN110309791A (zh) | 2019-07-04 | 2019-07-04 | 一种峰值时空表情识别的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110309791A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111709266A (zh) * | 2020-03-26 | 2020-09-25 | 杭州尚课网络科技有限公司 | 基于时空融合网络的面部表情识别方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107220591A (zh) * | 2017-04-28 | 2017-09-29 | 哈尔滨工业大学深圳研究生院 | 多模态智能情绪感知系统 |
CN108647628A (zh) * | 2018-05-07 | 2018-10-12 | 山东大学 | 一种基于多特征多任务字典稀疏迁移学习的微表情识别方法 |
CN109190479A (zh) * | 2018-08-04 | 2019-01-11 | 台州学院 | 一种基于混合深度学习的视频序列表情识别方法 |
-
2019
- 2019-07-04 CN CN201910599506.1A patent/CN110309791A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107220591A (zh) * | 2017-04-28 | 2017-09-29 | 哈尔滨工业大学深圳研究生院 | 多模态智能情绪感知系统 |
CN108647628A (zh) * | 2018-05-07 | 2018-10-12 | 山东大学 | 一种基于多特征多任务字典稀疏迁移学习的微表情识别方法 |
CN109190479A (zh) * | 2018-08-04 | 2019-01-11 | 台州学院 | 一种基于混合深度学习的视频序列表情识别方法 |
Non-Patent Citations (1)
Title |
---|
HUAI-QIAN KHOR ET AL.: "Enriched Long-term Recurrent Convolutional Network for Facial Micro-Expression Recognition", 《2018 13TH IEEE INTERNATIONAL CONFERENCE ON AUTOMATIC FACE & GESTURE RECOGNITION (FG 2018)》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111709266A (zh) * | 2020-03-26 | 2020-09-25 | 杭州尚课网络科技有限公司 | 基于时空融合网络的面部表情识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kuhnke et al. | Two-stream aural-visual affect analysis in the wild | |
CN109858392B (zh) | 一种用于化妆前后人脸图像自动识别方法 | |
CN116311483B (zh) | 基于局部面部区域重构和记忆对比学习的微表情识别方法 | |
CN113537008A (zh) | 基于自适应运动放大和卷积神经网络的微表情识别方法 | |
CN112329604B (zh) | 一种基于多维度低秩分解的多模态情感分析方法 | |
CN109919055B (zh) | 一种基于AdaBoost-KNN的动态人脸情感识别方法 | |
CN110110648A (zh) | 基于视觉感知与人工智能的动作提名方法 | |
CN118097490A (zh) | 任务处理方法、商品分类方法及电商直播的商品分类方法 | |
Guarin et al. | The effect of improving facial alignment accuracy on the video-based detection of neurological diseases | |
Wang et al. | Emotional talking head generation based on memory-sharing and attention-augmented networks | |
Zhua et al. | Audio-driven talking head video generation with diffusion model | |
EP4479968A1 (en) | Video synthesis via multimodal conditioning | |
CN115331289A (zh) | 基于视频运动放大和光流特征的微表情识别方法 | |
CN110309791A (zh) | 一种峰值时空表情识别的方法 | |
Chen et al. | Talking head generation driven by speech-related facial action units and audio-based on multimodal representation fusion | |
CN115050075B (zh) | 一种跨粒度交互学习的微表情图像标注方法及装置 | |
Wang et al. | An attention self-supervised contrastive learning based three-stage model for hand shape feature representation in cued speech | |
CN114998973B (zh) | 一种基于域自适应的微表情识别方法 | |
CN116453178A (zh) | 基于YOLOv4的课堂人脸表情识别方法及装置 | |
CN115719497A (zh) | 一种学生专注度识别方法及系统 | |
Kondo et al. | Evaluating the Accuracy of Real-Time Japanese Sign Language Word Recognition with Vision Transformer Models Trained on Angular Features | |
CN114943746A (zh) | 一种利用深度信息辅助和轮廓增强损失的运动迁移方法 | |
CN114842551A (zh) | 一种基于人体关键点热力图的实时肢体动作识别方法 | |
Wang et al. | A Survey on Facial Expression Recognition of Static and Dynamic Emotions | |
Huang | Decoding Emotions: Intelligent visual perception for movie image classification using sustainable AI in entertainment computing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191008 |
|
RJ01 | Rejection of invention patent application after publication |