CN110298325A

CN110298325A - 基于视频表情识别的表达障碍患者辅助护理系统

Info

Publication number: CN110298325A
Application number: CN201910593597.8A
Authority: CN
Inventors: 何娟; 刘蛟
Original assignee: Sichuan Changhong Electric Co Ltd
Current assignee: Sichuan Changhong Electric Co Ltd
Priority date: 2019-07-02
Filing date: 2019-07-02
Publication date: 2019-10-01

Abstract

本发明公开了基于视频表情识别的表达障碍患者辅助护理系统，包括采集视频模块、人脸检测模块、基于深度神经网络的表情识别模块、护理建议生成模块；利用深度卷积神经网络的良好非线性拟合的优点，构建出高性能的视频表情识别系统，通过构建高性能的视频表情识别深度神经网络模型，用于表情的自动识别，可以应用于表达障碍患者辅助护理系统，以极大地提高患者护理的质量。

Description

基于视频表情识别的表达障碍患者辅助护理系统

技术领域

本发明涉及视频处理技术领域，尤其涉及基于视频表情识别的表达障碍患者辅助护理系统。

背景技术

情绪是一种综合了人的感觉、思想和行为的状态，它包括人对外界或自身刺激的心理反应，包括伴随这种心理反应的生理反应。对人类情绪的感知与描述是当前神经科学、心理学、认知科学、计算机科学和人工智能等领域中的热点交叉研究课题。在人们的日常工作和生活中，情绪的作用无处不在。特别是在医疗护理中，如果能够知道患者、特别是有表达障碍的患者的情绪状态，就可以迅速将患者的情绪状况传送给护理人员，并及时根据患者的情绪做出不同的护理措施，提高护理质量。因此，表达障碍患者的情绪分析对提高护理质量来说非常重要。本发明提出一种基于视频表情识别的表达障碍患者辅助护理系统，以极大地提高患者护理的质量。

发明内容

针对上述问题，本发明提出了基于视频表情识别的表达障碍患者辅助护理系统，利用深度卷积神经网络的良好非线性拟合的优点，构建一种高性能的视频表情识别系统，用于医疗护理中。

本发明通过以下技术方案来实现上述目的：

基于视频表情识别的表达障碍患者辅助护理系统，包括采集视频模块、人脸检测模块、基于深度神经网络的表情识别模块、护理建议生成模块；

采集视频模块用于收集患者表情数据集，并手动标注训练样本；收集的患者表情包括如下4种表情：厌恶、恐惧、快乐、悲伤；

人脸检测模块在得到表情数据集后根据目前比较成熟的人脸区域检测算法将人脸区域的视频裁剪出来，为后续使用；

基于深度神经网络的表情识别模块包括动态检测与静态检测两部分，静态检测部分将视频最后一帧图像作为网络输入，其前五个卷积层为特征提取层，每个卷积层后均接最大池化层与ReLU层，第六、七、八层为全连接层，对前述提取的视频特征进行人物表情种类的映射，输出对应表情的权重大小；动态检测部分与静态检测部分类似，只是输入为视频中的5帧图像，这5帧图像分别输入与静态检测部分类似的网络中，区别仅在于第三个卷积层的输出经过级联层后，再经过1x1的卷积层进行降维，以实现特征融合，之后输入第四个卷积层；动态检测部分能够获取视频的时序特征，静态部分获取静态表情特征，最后经过融合得到最终表情识别的结果，该融合过程可用如下公式表示：

O＝αA+(1-α)B，0≤α≤1；

其中，A表示动态检测部分的输出，B表示静态检测部分的输出，α为融合权重，0为网络的最终预测结果；

护理建议生成模块根据识别到的表情信息，判断患者的精神状态，若长时间处于快乐状态，说明护理情况良好；若处于恐惧，则需要对患者进行安慰，避免对治疗过程过于畏惧；若检测为厌恶，则需要思考护理方式是否符合患者的心意；若检测为悲伤，则需要对患者进行心理疏导，并可邀其家人也多与患者进行沟通，避免消极情绪，提高护理质量，并将识别结果以及推荐的护理方案及时反馈给护理人员。

本申请另一方面提供了上述基于视频表情识别的表达障碍患者辅助护理系统的护理方法，包括以下步骤：

(1)构建视频表情识别深度神经网络模型，用于表情的自动识别；

(2)采集患者表情数据集，并构建标注的训练样本；

(3)利用(1)中模型以及(2)中的训练集，对网络模型进行优化训练；

(4)将(3)中得到的神经网络模型网络导入计算机视觉系统中，作为事先已知的模型数据；

(5)采集到实际患者视频后，采用人脸区域检测算法将人脸区域的视频裁剪出来，并利用训练得到的深度卷积神经网络对输入人脸视频序列进行表情识别；

(6)将识别到的表情信息以及推荐的护理方案及时反馈给护理人员。

本发明的有益效果在于：

本发明利用深度卷积神经网络的良好非线性拟合的优点，构建出高性能的视频表情识别系统，通过构建高性能的视频表情识别深度神经网络模型，用于表情的自动识别，可以应用于表达障碍患者辅助护理系统，以极大地提高患者护理的质量。

本发明方法能够较好地提升护理效果，且提出的视频表情识别模块，能够很容易地扩展到别的领域，诸如用户满意度判别、员工工作状态感知、学生课堂状态判别等。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述中所需要实用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本实施例的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明系统的工作流程示意图；

图2为本发明基于深度卷积神经网络的视频表情识别网络结构图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将对本发明的技术方案进行详细的描述。显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式，都属于本发明所保护的范围。

在任一实施例中，如图1所示，本发明的基于视频表情识别的表达障碍患者辅助护理系统，包括采集视频模块、人脸检测模块、基于深度神经网络的表情识别模块、护理建议生成模块；

O＝αA+(1-α)B，0≤α≤1；

在一个具体实施例中，如图2所示，本申请提供了上述的本申请另一方面提供了上述基于视频表情识别的表达障碍患者辅助护理系统的护理方法，包括以下步骤：

(2)采集患者表情数据集，并构建标注的训练样本；

所述(1)中，我们构建如图2所示的基于深度卷积神经网络的视频表情识别网络模型。该网络包含动态检测与静态检测两部分，最终将两部分的估计结果进行融合。先就静态检测部分进行介绍。静态检测部分将视频最后一帧图像作为网络输入，其前五个卷积层为特征提取层，每个卷积层后均接最大池化层与ReLU(激活函数)层。第六、七、八层为全连接层，对前述提取的视频特征进行人物表情种类的映射，输出对应表情的权重大小。动态检测部分与静态检测部分类似，只是输入为视频中的5帧图像，这5帧图像分别输入与静态检测部分类似的网络中。区别仅在于第三个卷积层的输出经过级联层后，再经过1x1的卷积层进行降维，以实现特征融合，之后输入第四个卷积层。动态检测部分能够获取视频的时序特征，静态部分获取静态表情特征，最后经过融合得到最终表情识别的结果。该融合过程可用如下公式表示：

O＝αA+(1-α)B，0≤α≤1；

其中，A表示动态检测部分的输出，B表示静态检测部分的输出，α为融合权重，0为网络的最终预测结果。

所述(2)中，我们采集大量的患者表情数据集，并手动标注训练样本。我们采用的患者表情包含如下4种：厌恶、恐惧、快乐、悲伤。

所述(3)中，我们首先利用(2)中得到的训练样本来训练(1)中构建的基于深度卷积神经网络的深度视频表情识别模型。

所述(4)中，将(3)得到的神经网络模型网络导入计算机视觉系统中，作为事先已知的模型数据，用于后期视频表情识别。

所述(5)中，在采集到实际患者视频后，采用人脸区域检测算法将人脸区域的视频裁剪出来，并利用训练得到的深度卷积神经网络对输入人脸视频序列进行表情识别，得到表情估计结果。

所述(6)中，根据识别到的表情信息，判断患者的精神状态。如果长时间处于快乐状态，说明护理情况良好；若处于恐惧，则需要对患者进行安慰，避免对治疗过程过于畏惧；若检测为厌恶，则需要思考护理方式是否符合患者的心意；若检测为悲伤，则需要对患者进行心理疏导，并可邀其家人也多与患者进行沟通，避免消极情绪，提高护理质量。最后，将识别结果以及推荐的护理方案及时反馈给护理人员。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。在上述具体实施方式中所描述的各个具体技术特征，在不矛盾的情况下，可以通过任何合适的方式进行组合，为了避免不必要的重复，本发明对各种可能的组合方式不再另行说明。本发明的各种不同的实施方式之间也可以进行任意组合，只要其不违背本发明的思想，其同样应当视为本发明所公开的内容。

Claims

1.基于视频表情识别的表达障碍患者辅助护理系统，其特征在于，包括采集视频模块、人脸检测模块、基于深度神经网络的表情识别模块、护理建议生成模块；

O＝αA+(1-α)B，0≤α≤1；

2.如权利要求1所述基于视频表情识别的表达障碍患者辅助护理系统的护理方法，其特征在于，包括以下步骤：

(2)采集患者表情数据集，并构建标注的训练样本；