CN111539376A

CN111539376A - 一种基于视频图像的多模态情感识别系统及方法

Info

Publication number: CN111539376A
Application number: CN202010389939.7A
Authority: CN
Inventors: 范习健; 杨绪兵; 张严; 蒋安纳; 张礼
Original assignee: Nanjing Forestry University
Current assignee: Nanjing Forestry University
Priority date: 2020-05-11
Filing date: 2020-05-11
Publication date: 2020-08-14
Also published as: WO2021227585A1

Abstract

本发明公开了一种基于视频图像的多模态情感识别系统及方法，该系统包括人脸提取模块、生理信号感应模块、姿态信号采集模块、着装信号扫描模块、场景分析模块、情感时序编码模块，情感信息建模模块，情感空间映射模块。本发明还提供了一种基于视频图像的多模态情感识别方法。本发明的基于视频图像的多模态情感识别系统通过功能模块的设计，采用多模态情感特征提取，具有识别结构更加准确可靠的特点，适合推广应用。

Description

一种基于视频图像的多模态情感识别系统及方法

技术领域

本发明属于情感计算技术领域，涉及一种基于视频图像的多模态情感识别系统及方法。

背景技术

在较长一段时期内，情感一直位于认知科学研究者的视线以外。直到20世纪末期，情感作为认知过程重要组成部分的身份才得到了学术界的普遍认同。当代的认知科学家们把情感与知觉、学习、记忆、言语等经典认知过程相提并论，关于情感本身及情感与其他认知过程间相互作用的研究成为当代认知科学的研究热点，情感计算（ affectivecomputing ）也成为一个新兴研究领域。

众所周知，人随时随地都会有喜怒哀乐等情感的起伏变化。那么在人与计算机交互过程中，计算机是否能够体会人的喜怒哀乐，并见机行事呢。情感计算研究就是试图创建一种能感知、识别和理解人的情感，并能针对人的情感做出智能、灵敏、友好反应的计算系统，即赋予计算机像人一样的观察、理解和生成各种情感特征的能力。

目前情感计算研究面临的挑战还很多，例如，情感信息的获取与建模问题，情感识别与理解问题，情感表达问题，以及自然和谐的人性化和智能化的人机交互的实现问题。显然，为解决上述问题，我们需要知道人是如何感知环境的，人会产生什么样的情感和意图，人如何作出恰当的反应。而人类的情感交流是个非常复杂的过程，不仅受时间、地点、环境、人物对象和经历的影响，而且有表情、语言、动作或身体的接触。因此，在人和计算机的交互过程中，计算机需要捕捉关键信息，识别使用者的情感状态，觉察人的情感变化，利用有效的线索选择合适的使用者模型（依据使用者的操作方式、表情特点、态度喜好、认知风格、知识背景等构建的模型），并对使用者情感变化背后的意图形成预期，进而激活相应的数据库，及时主动地提供使用者需要的新信息。

现有技术中，有关于视频图像的情感识别技术有：发明名称：用于视频图像的情感识别系统及方法，申请号：201810026649.9 申请日：2018-01-11，该发明涉及情感计算领域，提出用于视频图像的情感识别系统，旨在解决由于图片之间信息的损失，造成情感识别的准确率低下的问题，系统包括：人脸提取模块，情感时序编码模块，情感信息建模模块，情感空间映射模块，人脸提取模块对视频图像进行分帧，从分帧后的图片中提取人脸图片，组成图片序列；情感时序编码模块利用3D卷积算法对图片序列的各人脸图片前后帧信息进行情感信息计算，生成情感的时序信息编码；情感信息建模模块接收时序信息编码，基于情感信息的长时动态特性，利用卷积长短时记忆模型确定时序信息的情感特征矩阵；情感空间映射模块接收情感特征矩阵，通过全连接映射到情感空间，输出情感识别结果。实现了对视频图像的情感识别。但是，该系统为单模态情感特征提取，其结果的精确性较低。

发明内容

本发明的目的在于提供一种基于视频图像的多模态情感识别系统及方法。

其具体技术方案为：

一种基于视频图像的多模态情感识别系统，包括人脸提取模块、生理信号感应模块、姿态信号采集模块、着装信号扫描模块、场景分析模块、情感时序编码模块，情感信息建模模块，情感空间映射模块；

所述生理信号感应模块用于感应人的生理信号；

所述姿态信号采集模块用于采集人的身体动作信号；

所述着装信号扫描模块用于扫描人身上的着装和配饰信号；

所述场景分析模块用于分析人所处的环境信号。

进一步，生理信号感应器感应的人的生理信号包括呼吸、体温、脉搏。

进一步，还包括语音信号采集模块用于采集人的声音信号。

一种基于视频图像的多模态情感识别方法，包括以下步骤：

步骤1、生理信号感应模块感应人的呼吸、体温、脉搏生理信号；

步骤2、所述姿态信号采集模块采集人的身体动作信号；

步骤3、所述着装信号扫描模块扫描人身上的着装和配饰信号；

步骤4、所述场景分析模块分析人所处的环境信号。

有益效果：

本发明的基于视频图像的多模态情感识别系统通过功能模块的设计，采用多模态情感特征提取，采用生理信号辅助视频进行判断，具有识别结果更加准确可靠的特点，适合推广应用。

附图说明

图1为本发明基于视频图像的多模态情感识别系统的原理图。

具体实施方式

下面结合附图和具体实施例对本发明的技术方案作进一步详细地说明。

参照图1，一种基于视频图像的多模态情感识别系统，包括人脸提取模块、生理信号感应模块、姿态信号采集模块、着装信号扫描模块、场景分析模块、情感时序编码模块，情感信息建模模块，情感空间映射模块；

所述生理信号感应模块用于感应人的生理信号；

所述姿态信号采集模块用于采集人的身体动作信号；

所述着装信号扫描模块用于扫描人身上的着装和配饰信号；

所述场景分析模块用于分析人所处的环境信号。

生理信号感应器感应的人的生理信号包括呼吸、体温、脉搏。

还包括语音信号采集模块用于采集人的声音信号。

本发明的基于视频图像的多模态情感识别系统在具体应用过程中，包括以下步骤：

步骤2、所述姿态信号采集模块采集人的身体动作信号；

步骤4、所述场景分析模块分析人所处的环境信号。

以上所述，仅为本发明较佳的具体实施方式，本发明的保护范围不限于此，任何熟悉本技术领域的技术人员在本发明披露的技术范围内，可显而易见地得到的技术方案的简单变化或等效替换均落入本发明的保护范围内。

Claims

1.一种基于视频图像的多模态情感识别系统，其特征在于，包括人脸提取模块、生理信号感应模块、姿态信号采集模块、着装信号扫描模块、场景分析模块、情感时序编码模块，情感信息建模模块，情感空间映射模块；

所述生理信号感应模块用于感应人的生理信号；

所述姿态信号采集模块用于采集人的身体动作信号；

所述着装信号扫描模块用于扫描人身上的着装和配饰信号；

所述场景分析模块用于分析人所处的环境信号。

2.根据权利要求1所述的基于视频图像的多模态情感识别系统，其特征在于，生理信号感应器感应的人的生理信号包括呼吸、体温、脉搏。

3.根据权利要求1所述的基于视频图像的多模态情感识别系统，其特征在于，还包括语音信号采集模块用于采集人的声音信号。