CN111507224B

CN111507224B - 一种基于网络剪枝的cnn人脸表情识别显著性分析方法

Info

Publication number: CN111507224B
Application number: CN202010273344.5A
Authority: CN
Inventors: 龚聿枫; 姚潇; 刘小峰; 徐宁; 霍冠英; 夏岭
Original assignee: Changzhou Campus of Hohai University
Current assignee: Changzhou Campus of Hohai University
Priority date: 2020-04-09
Filing date: 2020-04-09
Publication date: 2022-08-30
Anticipated expiration: 2040-04-09
Also published as: CN111507224A

Abstract

本发明公开了一种基于网络剪枝的CNN人脸表情识别显著性分析方法，包括：S1将人脸数据按表情归类并分别训练识别网络；S2利用剪枝算法分别处理每个训练好的识别网络，得到选定卷积层各滤波器的重要性分数；S3根据选定卷积层剪枝之后计算出的各滤波器的重要性分数，计算该层的特征图权重。本发明在特定表情训练网络的基础上，利用剪枝算法找到对表情识别贡献大的特征并赋上对应权重，解决基于注意力机制的表情识别中重要特征的显著性分析问题，提高识别准确率、完成表情识别的相关操作。

Description

一种基于网络剪枝的CNN人脸表情识别显著性分析方法

技术领域

本发明涉及一种基于网络剪枝的CNN人脸表情识别显著性分析方法，属于计算机视觉技术领域。

背景技术

表情识别是计算机视觉以及人机交互的一个重要方面，在实现智能化生活中有着举足轻重的地位。近年来深度学习和卷积神经网络快速发展，基于CNN的分类方法也因其较高的准确率在人脸表情识别领域中代替了传统的特征提取，赢得更多的青睐。但是随着应用场景的扩大，识别过程中的各种问题开始出现：大型网络模型难以搭载到移动设备上，而相似表情(如惊讶和害怕)的识别准确率也不尽如人意。

发明内容

为了克服现有技术的缺陷，本发明提出一种基于网络剪枝的CNN人脸表情识别显著性分析方法，在特定表情训练网络的基础上，利用剪枝算法找到对表情识别贡献大的特征并赋上对应权重，解决基于注意力机制的表情识别中重要特征的显著性分析问题，提高识别准确率、完成表情识别的相关操作。

为达到上述目的，本发明的技术方案是这样实现的：

一种基于网络剪枝的CNN人脸表情识别显著性分析方法，其特征在于，具体包括以下步骤：

S1将人脸数据按表情归类并分别训练识别网络；

S2利用剪枝算法分别处理每个训练好的识别网络，得到选定卷积层各滤波器的重要性分数；

S3根据选定卷积层剪枝之后计算出的各滤波器的重要性分数，计算该层的特征图权重。

优选地，所述步骤S1的具体步骤如下：

S11构建人脸的图像数据集并按表情分类；

S12使用同一种类的表情数据分别训练一个表情识别卷积神经网络，从而得到训练好的不同参数的识别网络。

优选地，所述步骤S12中所述的表情识别卷积神经网络基于VGG19网络结构，每一个小块包括一个卷积层，一个BatchNorm层，一个relu层和一个平均池化层。

优选地，所述步骤S12中，所述的表情识别卷积神经网络在VGG19网络结构基础上，仅采用一个全连接层，且在全连接层之前加入dropout策略，并直接在一个全连接层后分为7类输出表情识别结果，同时采用交叉熵作为损失函数对输出的表情识别结果进行训练得到更高的识别准确率。

优选地，所述步骤S2的具体步骤如下：

分别将步骤S12每个训练好的识别网络作为输入，运行剪枝算法，在基本维持识别准确率的条件下，完成网络的滤波器修剪，得到选定卷积层各滤波器的重要性分数。

优选地，所述步骤S3的具体步骤如下：

S31对于选定卷积层，在剪枝之后保留的各滤波器的重要性分数中找到最大值与最小值；

S32对各滤波器的重要性分数进行归一化处理，将各滤波器重要性分数转化为特征图权重。

优选地，所述步骤S32中，对各滤波器的重要性分数进行归一化处理的步骤如下：首先假设某卷积层i+1的特征图矩阵大小为H×B×C，其中H、B分别代表特征图的高、宽，C为卷积层i经过剪枝之后的滤波器个数，则卷积层i的滤波器重要性分数向量集合为：

I＝{I₁,I₂,…,I_C}；

将I中元素按下式分别进行归一化，得到各自的权重：

最终得到该层的特征图权重矩阵W＝{W₁,W₂,…,W_C}，大小为1×1×C，其中，一个元素W_j对应着卷积层i+1特征图的一个通道。

有益效果：本发明提供一种基于网络剪枝的CNN人脸表情识别显著性分析方法，具有如下优点：

1、本发明所使用的表情识别卷积神经网络基于VGG19卷积神经网络，并在此基础上增加了dropout，用以降低网络的过拟合，同时使用softmax分类提高了识别准确率。

2、本发明所使用的滤波器剪枝算法将一个特定滤波器的Importance定义为从网络中移除它时引起的损失的差值平方，并使用泰勒展开式来估计重要性、生成由参数梯度计算得来的判断依据，简单高效地实现滤波器的贡献值估算。

3、本发明分别使用不同表情的人脸数据训练网络，再通过后续的计算处理得到各种表情识别中对应的特征图权重；可以在初步分类后在特征图上乘上此权重进行进一步分析，结合两次分类结果做出决策，提高一些易混淆的表情识别准确率。

附图说明

图1为本发明的流程图；

图2为剪枝后选定卷积层的特征图通道维度权重计算过程。

具体实施方式

为了使本技术领域的人员更好地理解本申请中的技术方案，下面对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

如图1所示，一种基于网络剪枝的CNN人脸表情识别显著性分析方法，具体包括以下步骤：

S1从现有的人脸表情数据库中获取人脸表情图像数据集，并完成识别网络的训练，具体操作步骤如下：

S11构建人脸表情图像数据集，按表情分类：

获取kaggle网站提供的FER2013人脸表情图像数据集，并按表情标签分为7类；

S12使用同一种类的人脸表情图像数据分别训练一个表情识别卷积神经网络，从而得到训练好的不同参数的识别网络；

本发明中选择的卷积神经网络基于VGG19网络结构：每一个小块包括一个卷积层，一个BatchNorm层，一个relu层和一个平均池化层，且卷积神经网络去掉了其中的多个全连接层，直接在一个全连接层后分为7类输出表情识别结果，并在该全连接层之前加入dropout策略，增加模型鲁棒性，同时采用交叉熵作为损失函数对输出的表情识别结果进行训练得到更高的识别准确率。

其中交叉熵损失函数具体为：模型在全连接层之后，得到了每一类表情的输出概率，而通过一个softmax层将概率归一化到1，更加易于数据处理，单种表情的损失函数计算公式如下：

其中，m代表训练样本的总数；yⁱ为其中一个训练样本，xⁱ是对应的目标输出；h_θ(xⁱ)为目标输出的概率。

S2利用剪枝算法分别处理每个识别网络，使用一种剪枝算法处理网络，实现滤波器的修剪、网络轻量化，具体包括以下步骤：

分别将每个训练好的识别网络作为输入，运行剪枝算法，得到选定卷积层(选定层由操作者根据经验确定)各滤波器的重要性分数；

选择的剪枝算法定义个别参数E的贡献值为：

I_m(E)＝(g_mw_m)²， (1)；

其中，m为神经网络参数的个数，w_m是识别网络中的权重参数，

是梯度g的元素，可从后向传播中得到；

滤波器，即一组结构参数_c的联合重要性分数定义为个别结构参数贡献值的总和，其中，C为结构参数个数：

在基本维持识别准确率的条件下，完成识别网络的滤波器修剪。

剪枝算法以一个训练好的网络作为输入，并在一个小学习率的迭代调试过程中对其修剪。在每一次迭代中，下面的步骤不断重复：

1、对每一个minibatch计算参数梯度并通过梯度下降更新网络权重，使用minibatch里的平均梯度计算了每一个滤波器的重要性，如公式(2)所示，minibatch数量和规模依据数据集大小而定；

2、在提前定义一定数量的minibatch之后，平均每个滤波器的重要性分数，并且将分数最小的N个滤波器移除。(其中每次迭代N的大小不同，通常为初始数量的2％；调试和剪枝将持续到最大可容忍损失无法再实现，即识别准确率开始下降。

上述迭代过程属于现有技术，故而未加详述。

S3根据选定卷积层剪枝之后计算出的各滤波器的重要性分数，计算该层的特征图权重，具体步骤如下：

S32归一化处理保留滤波器的重要性分数，将各滤波器重要性分数转化为特征图权重。

首先假设某卷积层i+1的特征图矩阵大小为H×B×C，其中H、B分别代表特征图的高、宽，C为卷积层i经过剪枝之后的滤波器个数，则卷积层i的滤波器重要性分数向量集合为：

I＝{I₁,I₂,…,I_C}，即S2中得到的I(E_c)；

将I归一化，得到:

W＝{W₁,W₂,…,W_C}；

其中，最终得到该层的特征图权重矩阵W＝{W₁,W₂,…,W_C}，大小为1×1×C，其中，一个元素W_j对应着卷积层i+1特征图的一个通道。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的两种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种基于网络剪枝的CNN人脸表情识别显著性分析方法，其特征在于，具体包括以下步骤：

S1将人脸数据按表情归类并分别训练识别网络，具体步骤如下：

S11构建人脸的图像数据集并按表情分类；

S12使用同一种类的表情数据分别训练一个表情识别卷积神经网络，从而得到训练好的不同参数的识别网络，其中，所述的表情识别卷积神经网络基于VGG19网络结构，每一个小块包括一个卷积层，一个BatchNorm层，一个relu层和一个平均池化层，所述的表情识别卷积神经网络在VGG19网络结构基础上，仅采用一个全连接层，且在全连接层之前加入dropout策略，并直接在一个全连接层后分为7类输出表情识别结果，同时采用交叉熵作为损失函数对输出的表情识别结果进行训练得到更高的识别准确率；

2.根据权利要求1所述的一种基于网络剪枝的CNN人脸表情识别显著性分析方法，其特征在于，所述步骤S2的具体步骤如下：

分别将步骤S12每个训练好的识别网络作为输入，运行剪枝算法，在维持识别准确率的条件下，完成网络的滤波器修剪，得到选定卷积层各滤波器的重要性分数。

3.根据权利要求1所述的一种基于网络剪枝的CNN人脸表情识别显著性分析方法，其特征在于，所述步骤S3的具体步骤如下：

4.根据权利要求3所述的一种基于网络剪枝的CNN人脸表情识别显著性分析方法，其特征在于，所述步骤S32中，对各滤波器的重要性分数进行归一化处理的步骤如下：首先假设某卷积层i+1的特征图矩阵大小为H×B×C，其中H、B分别代表特征图的高、宽，C为卷积层i经过剪枝之后的滤波器个数，则卷积层i的滤波器重要性分数向量集合为：

I＝{I₁,I₂,…,I_C}；

将I中元素按下式分别进行归一化，得到各自的权重: