CN111444787B

CN111444787B - 一种性别约束的全智能化人脸表情识别方法及系统

Info

Publication number: CN111444787B
Application number: CN202010172458.0A
Authority: CN
Inventors: 廖海斌; 李淑琴; 邱吉刚; 晏丽娟
Original assignee: Jiangxi Ganpoyun New Smart City Technology Research Co ltd
Current assignee: Jiangxi Ganpoyun New Smart City Technology Research Co ltd
Priority date: 2020-03-12
Filing date: 2020-03-12
Publication date: 2023-04-07
Anticipated expiration: 2040-03-12
Also published as: CN111444787A

Abstract

本发明公开了一种性别约束的全智能化人脸表情识别方法及系统，包括人脸特征提取、人脸性别估计、条件随机森训练和基于性别条件随机森林的人脸表情识别四个步骤，对输入的人脸图像进行人脸检测和图像质量评判以后，将其送入预训练好的深度神经网络中进行学习提取深度学习特征，然基于提取的人脸特征，利用随机森林分类方法进行人脸性别估计，基于提取的人脸特征及其性别属性，利用条件随机森林进行人脸表情识别。本发明提出的基于深度学习和条件随机森林的鲁棒性人脸表情识别方法，解决了非可控环境和小样本下的人脸表情识别问题，解决了深度学习方法需要大量训练样本支持的问题，同时提高了非可控环境下的人脸表情识别准确性和有效性。

Description

一种性别约束的全智能化人脸表情识别方法及系统

技术领域

本发明属于图像处理与模式识别技术领域，具体涉及一种性别约束的全智能化人脸表情识别方法及系统。

背景技术

人脸表情是人类一种最直接、自然和有效的情感表达方式，它是人工智能和计算机领域的一个重要研究方向。人脸表情识别可以广泛应用于安全驾驶、智能教室、视频监控、虚拟现实和人工机交互等场景。由于人脸表情识别是一种特殊的模式识别问题，因此一般的模式分类方法可以自然而然的应用于人脸表情识别问题。受到人脸识别和ImageNet图像识别巨大突破的启示，深度学习技术被广泛应用于人脸表情识别。如，Kim等人通过多样化CNNs设计出一种层次化的网络结构应用于人脸表情识别，在国际人脸表情竞赛(EmotiW2015)上获得第一名成绩。目前，在可控环境下，已经出现了大量的人脸表情识别方法并获得很大的成功。但是，只有少数工作去研究非可控环境下的人脸表情识别问题，非可控环境和小样本下的人脸表情识别问题仍然是一个具有挑战的问题。本发明提出基于深度学习和条件随机森林的鲁棒性人脸表情识别方法，解决深度学习方法需要大量训练样本支持的问题，同时提高非可控环境下的人脸表情识别准确性和有效性。

发明内容

本发明提出了一种性别约束的全智能化人脸表情识别方法及系统，以解决上述背景技术中提出的问题。本发明的技术方案是这样实现的：

一种性别约束的全智能化人脸表情识别方法，包括人脸特征提取、人脸性别估计、条件随机森林训练和基于性别条件随机森林的人脸表情识别四个步骤，首先，对输入的人脸图像进行人脸检测和图像质量评判以后，将其送入预训练好的深度神经网络中进行学习提取深度学习特征，然后，基于提取的人脸特征，利用随机森林分类方法进行人脸性别估计，最后，基于提取的人脸特征及其性别属性，利用条件随机森林进行人脸表情识别，

步骤一：人脸特征提取

将采集的人脸图像送入卷积神经网络CNN进行表示学习，提取人脸高层语义特征，并使用迁移学习策略将选择的网络模型在LFW和YTF人脸库进行预训练，使其更具高层语义信息表示能力，人脸特征表示为y；

步骤二：人脸性别估计

使用整个训练集S去训练生成一个基于人脸性别分类的人脸性别随机森林T^G，然后，训练集S根据人脸性别类别被分成N＝2个子集，每一个子集被用于训练生成一组条件随机森林

用于人脸表情分类，将人脸性别划分成两类{Ω₁：female,Ω₂：male}；

步骤三：条件随机森林训练

条件随机森林

中的每棵决策树T_t ^S(Ω_n)采用相同的方法独立训练，为构建每棵决策树，从相应的数据子集

中随机选取图像构成训练数据集，然后，从人脸特征y中随机提取一组子特征{y_i＝(e_i,I_i)}，其中e_i为人脸表情类别，

为提取的子特征集合，最后，提取的子特征集合被用于决策树节点的分裂以便生成最终的决策树；

步骤四：基于性别条件随机森林的人脸表情识别

首先，利用人脸性别随机森林T^G对测试人脸图像进行性别估计，然后，根据性别估计结果，随机的从条件随机森林

中选择相应数量的决策树动态构建人脸表情识别随机森林T^E，最后，根据构建的人脸表情识别随机森林T^E进行人脸表情分类识别。

在本发明的性别约束的全智能化人脸表情识别方法中，步骤一中，为了提高特征的鲁棒性，CNN采用目前效果较好的GoogleNet、VGG21或RestNet50。

在本发明的性别约束的全智能化人脸表情识别方法中，步骤一中，将检测到的人脸图像进行归一化处理后送入GoogleNet网络模型进行表示学习，GoogleNet通过LFW和YTF人脸库进行预训练，使其更具高层语义信息表示能力，基于GoogleNet的人脸特征提取可以表示为：

y＝x_cw+b (1)

式(1)中，其中，人脸特征y表示最后的高层特征输出，x_c表示人脸图像在“Depthconcat”层中的特征图，w是权值项，b为偏置项，其中，深度学习框架采用Caffe开源平台，学习率λ＝0.005，epochs为5000，优化函数采用“Adam”算法，最终得到人脸特征y的维度为256。

在本发明的性别约束的全智能化人脸表情识别方法中，步骤二中，根据步骤一中得到的人脸特征y，采用人脸性别随机森林T^G进行人脸性别分类，在训练生成人脸性别随机森林T^G模型时，采用如下不确定性测度：

式(2)中，g表示人脸性别类别，不确定性测度引导各节点从二值测试候选库中选择最优的二值测试，以保证能不断将当前节点分裂为不确定性降低的两个子节点，人脸性别以高斯模型的方式储于人脸性别随机森林T^G的每个叶子节点l上：

式(3)中，

和σ_l表示叶子节点l上性别均值和方差，生成叶子节点后，人脸特征y在人脸性别随机森林T^G上的性别类别概率可以通过投票方式获得：

式(4)中，l_m为决策树对应的叶子节点，M为决策树的数量。

在本发明的性别约束的全智能化人脸表情识别方法中，步骤三中，采用NCSF分裂模型，结合决策树的度量函数信息增益(IG)和深度学习模型中的损失函数进行深度网络增强树的节点生长，基于CNN隐藏层的联接函数f_n强化人脸特征y的表示，用增强后特征表示作为网络增强森林的节点特征选择：

d_n(y,K|Ω_g)＝σ(f_n(y,K|Ω_g)) (5)

式(5)中，σ(x)＝(1+e^-x)^-1是sigmoid函数，Ω_g为不同性别下的表情子森林，为增强森林中的一个分裂节点，K是CNN网络模型参数，通过随机梯度下降法(SGD)或Adam(Adaptive Moment Estimation)方法进行更新，当信息增益IG最大时，分裂生成树的左、右子节点：

式(10)中

左、右子节点为特征样本数量概率，H(d_n)为节点d_n的熵。

在本发明的性别约束的全智能化人脸表情识别方法中，步骤四中，在人脸性别g∈Ω_n已知的条件下，人脸特征y属于表情e的概率p(e|Ω_n,y)由随机森林T^E中所有树投票得到：

式(11)中，M为树的数量，l_m为第m棵树上人脸特征y达到的叶子节点，在人脸性别g未知的条件下，人脸特征y属于表情e的概率p(e|y)可以表示为：

式(12)中，∑_nk_n＝M，

一种性别约束的全智能化人脸表情识别系统，包括人脸特征提取、人脸性别估计和人脸表情识别三大模块，

人脸特征提取：此模块输入是人脸图像，输出是人脸特征向量，采用卷积神经网络模型进行人脸特征提取，如GoogleNet和RestNet50等；

人脸性别估计：此模块输入是人脸特征向量，输出是人脸性别类别，采用随机森林分类方法进行人脸性别分类估计；

人脸表情识别：此模块输入是人脸特征向量和人脸性别类别，输出是人脸表情类别，采用性别条件随机森林方法进行人脸表情分类识别。

实施本发明的这种性别约束的全智能化人脸表情识别方法及系统，具有以下有益效果：

本发明提出的基于深度学习和条件随机森林的鲁棒性人脸表情识别方法，解决了非可控环境和小样本下的人脸表情识别问题，解决了深度学习方法需要大量训练样本支持的问题，同时提高了非可控环境下的人脸表情识别准确性和有效性。

附图说明

图1为本发明性别约束的全智能化人脸表情识别的技术框架图；

图2为本发明性别约束的全智能化人脸表情识别的系统图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。

实施例1：

一种性别约束的全智能化人脸表情识别方法，其技术架构及流程如图1所示，包括人脸特征提取、人脸性别估计、条件随机森林训练和基于性别条件随机森林的人脸表情识别四个步骤，首先，对输入的人脸图像进行人脸检测和图像质量评判以后，将其送入预训练好的深度神经网络中进行学习提取深度学习特征，然后，基于提取的人脸特征，利用随机森林分类方法进行人脸性别估计，最后，基于提取的人脸特征及其性别属性，利用条件随机森林进行人脸表情识别。

步骤一：人脸特征提取

将采集的人脸图像送入卷积神经网络(CNN)进行表示学习，提取人脸高层语义特征，为了提高特征的鲁棒性，CNN采用目前效果较好的GoogleNet、VGG21或RestNet50，并使用迁移学习策略将选择的网络模型在LFW和YTF人脸库进行预训练，使其更具高层语义信息表示能力，人脸特征提取表示为y。

步骤二：人脸性别估计

用于人脸表情分类，将人脸性别划分成两类{Ω₁：female,Ω₂：male}。

优选的，根据步骤一中得到的人脸特征y，采用人脸性别随机森林T^G进行人脸性别分类，在训练生成人脸性别随机森林T^G模型时，采用如下不确定性测度：

式(3)中，

式(4)中，l_m为决策树对应的叶子节点，M为决策树的数量。

步骤三：条件随机森林训练

条件随机森林

中随机选取图像构成训练数据集，然后，从人脸特征表示为y的每张训练样本特征{y_i＝(e_i,I_i)}，其中e_i为人脸表情类别，

为提取的子特征集合，最后，提取的子特征集合被用于决策树节点的分裂以便生成最终的决策树。

优选的，采用NCSF分裂模型，结合决策树的度量函数信息增益(IG)和深度学习模型中的损失函数进行深度网络增强树的节点生长，基于CNN隐藏层的联接函数f_n强化人脸样本的条件特征表示y，用增强后特征表示作为网络增强森林的节点特征选择：

d_n(y,K|Ω_g)＝σ(f_n(y,K|Ω_g)) (5)

式(10)中

左、右子节点为特征样本数量概率，H(d_n)为节点d_n的熵。

步骤四：基于性别条件随机森林的人脸表情识别

优选的，在人脸性别g∈Ω_n已知的条件下，人脸样本y属于表情e的概率p(e|Ω_n,y)由随机森林T^E中所有树投票得到：

式(11)中，M为树的数量，l_m为第m棵树上人脸特征y特征达到的叶子节点，在人脸性别g未知的条件下，人脸特征y属于表情e的概率p(e|y)可以表示为：

式(12)中，∑_nk_n＝M，

一种性别约束的全智能化人脸表情识别系统，如图2所示，包括人脸特征提取、人脸性别估计和人脸表情识别三大模块，

人脸特征提取：此模块输入是人脸图像，输出是人脸特征向量，为了提高人脸特征提取的鲁棒性，采用卷积神经网络模型进行人脸特征提取，如GoogleNet和RestNet50等；

人脸性别估计：此模块输入是人脸特征向量，输出是人脸性别类别，为了提高人脸性别估计的准确性，采用随机森林分类方法进行人脸性别分类估计；

人脸表情识别：此模块输入是人脸特征向量和人脸性别类别，输出是人脸表情类别，为了提高人脸表情识别的准确性，采用性别条件随机森林方法进行人脸表情分类识别。

实施例2：

一种性别约束的全智能化人脸表情识别方法，主要包括人脸特征提取、人脸性别估计、条件随机森林训练和基于性别条件随机森林的人脸表情识别四大部分：

①人脸特征提取

对输入的人脸图像利用人脸检测算法剪切出无背景的人脸图像。然后利用图像质量评判算法挑选出具有正面姿态和高分辨率的高质量人脸图像。最后，将挑选出的高质量人脸图像进行归一化处理后送入GoogleNet网络模型进行表示学习。GoogleNet通过LFW和YTF人脸库进行预训练，使其更具高层语义信息表示能力。基于GoogleNet的人脸特征提取可以表示为：

y＝x_cw+b (1)

其中，人脸特征y表示最后的高层特征输出，x_c表示人脸图像在“Depthconcat”层中的特征图，w是权值项，b为偏置项。其中，深度学习框架采用Caffe开源平台，学习率λ＝0.005，epochs为5000，优化函数采用“Adam”算法。最终得到人脸特征表示为y中人脸高层特征表示向量的维度为256。

②人脸性别估计

使用整个训练集S去训练生成一个基于人脸性别分类的人脸性别随机森林T^G。然后，训练集S根据人脸性别类别被分成N＝2个子集，每一个子集被用于训练生成一组条件随机森林

用于人脸表情分类。本文将人脸性别划分成两类{Ω₁：female,Ω₂：male}。

根据得到的人脸特征y，采用人脸性别随机森林T^G进行人脸性别分类。在训练生成人脸性别随机森林T^G模型时，采用如下不确定性测度：

其中，g表示人脸性别类别。不确定性测度引导各节点从二值测试候选库中选择最优的二值测试，以保证能不断将当前节点分裂为不确定性降低的两个子节点。人脸性别以高斯模型的方式储于人脸性别随机森林T^G的每个叶子节点l上：

其中，

和σ_l表示叶子节点l上性别均值和方差。生成叶子节点后，人脸特征y在人脸性别随机森林T^G上的性别类别概率可以通过投票方式获得：

其中，l_m为决策树对应的叶子节点，M为决策树的数量。

③条件随机森林训练

条件随机森林

中的每棵决策树T_t ^S(Ω_n)采用相同的方法独立训练。为构建每棵决策树，从相应的数据子集

中随机选取图像构成训练数据集；然后，从人脸特征表示为y的每张训练样本特征随机提取一组子特征{y_i＝(e_i,I_i)}，其中e_i为人脸表情类别，

为提取的子特征集合；最后，提取的子特征集合被用于决策树节点的分裂以便生成最终的决策树。

为了更好的学习和生长分裂节点，本发明采用NCSF分裂模型，结合决策树的度量函数信息增益(IG)和深度学习模型中的损失函数进行深度网络增强树的节点生长。基于CNN隐藏层的联接函数f_n强化人脸样本的条件特征表示y，用增强后特征表示作为网络增强森林的节点特征选择：

d_n(y,K|Ω_g)＝σ(f_n(y,K|Ω_g)) (5)

其中，σ(x)＝(1+e^-x)^-1是sigmoid函数，Ω_g为不同性别下的表情子森林，为增强森林中的一个分裂节点，K是CNN网络模型参数，本实施例通过随机梯度下降法(SGD)更新：

其中，η为学习率，e为表情类别，B为随机抽取的特征子集(即mini-batch)，L(K,e；y)为训练样本y的损失函数，定义如下：

其中，p(e|d_n,K,y)为人脸表情概率。根据链式求导法对K求导：

其中，g为性别类别，第2项求导可由CNN网络参数优化得到；第1项求导根据生成树的左、右子节点特征选择得到：

其中，

和

分别表示生成树的右、左节点。当信息增益IG最大时，分裂生成树的左、右子节点：

其中，

为左、右子节点特征样本数量概率，H(d_n)为节点d_n的熵。当树的深度达到最大或者损失函数迭代收敛后，生成叶子节点；否则，继续迭代节点学习。

④基于性别条件随机森林的人脸表情识别

在人脸性别g∈Ω_n已知的条件下，人脸特征y属于表情e的概率p(e|Ω_n,y)由随机森林T^E中所有树投票得到：

其中，M为树的数量，l_m为第m棵树上人脸特征y特征达到的叶子节点。在人脸性别g未知的条件下，人脸特征y属于表情e的概率p(e|y)可以表示为：

其中，∑_nk_n＝M，

从上面式子可以看出，在进行人脸表情识别时：首先，根据性别估计的结果从条件随机森林T^S(Ω_n)中随机选取k_n棵决策树动态构建随机森林T^E；然后，由T^E中决策树投票得出测试样本y的表情类别概率p(e|y)。

一种性别约束的全智能化人脸表情识别系统，如图2所示，主要包括人脸特征提取、人脸性别估计和人脸表情识别三大模块：

人脸特征提取：此模块输入是人脸图像，输出是人脸特征向量。本发明将所有输入图像归一化到256*256大小，通过卷积神经网络后提取的人脸特征向量维数为256。为了提高人脸特征提取的鲁棒性，本发明采用目前效果较好的RestNet50残差神经网络模型进行人脸特征提取。

人脸性别估计：此模块输入是人脸特征向量，输出是人脸性别类别。其中，输入是256维的人脸特征向量，输出为1(代表女性)或-1(代表男性)。为了提高人脸性别估计的准确性，本发明采用随机森林分类方法进行人脸性别分类估计。

人脸表情识别：此模块输入是人脸特征向量和人脸性别类别，输出是人脸表情类别。其中，人脸特征向量为256维，人脸性别类别为1或-1；人脸表情类别为1(高兴)、2(悲伤)、3(惊讶)、4(愤怒)、5(厌恶)和6(害怕)中的一种。为了提高人脸表情识别的准确性，本发明采用性别条件随机森林方法进行人脸表情分类识别。

实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种性别约束的全智能化人脸表情识别方法，其特征在于，包括人脸特征提取、人脸性别估计、条件随机森林训练和基于性别条件随机森林的人脸表情识别四个步骤，首先，对输入的人脸图像进行人脸检测和图像质量评判以后，将其送入预训练好的深度神经网络中进行学习提取深度学习特征，然后，基于提取的人脸特征，利用随机森林分类方法进行人脸性别估计，最后，基于提取的人脸特征及其性别属性，利用条件随机森林进行人脸表情识别，

步骤一：人脸特征提取

步骤二：人脸性别估计

步骤三：条件随机森林训练

条件随机森林

步骤四：基于性别条件随机森林的人脸表情识别

2.根据权利要求1所述的性别约束的全智能化人脸表情识别方法，其特征在于，步骤一中，为了提高特征的鲁棒性，CNN采用目前效果较好的GoogleNet、VGG21或RestNet50。

3.根据权利要求2所述的性别约束的全智能化人脸表情识别方法，其特征在于，步骤一中，将检测到的人脸图像进行归一化处理后送入GoogleNet网络模型进行表示学习，GoogleNet通过LFW和YTF人脸库进行预训练，使其更具高层语义信息表示能力，基于GoogleNet的人脸特征提取表示为：

y＝x_cw+b (1)

4.根据权利要求1所述的性别约束的全智能化人脸表情识别方法，其特征在于，步骤二中，根据步骤一中得到的人脸特征y，采用人脸性别随机森林T^G进行人脸性别分类，在训练生成人脸性别随机森林T^G模型时，采用如下不确定性测度：

式(3)中，

式(4)中，l_m为决策树对应的叶子节点，M为决策树的数量。

5.根据权利要求1所述的性别约束的全智能化人脸表情识别方法，其特征在于，步骤三中，采用NCSF分裂模型，结合决策树的度量函数信息增益IG和深度学习模型中的损失函数进行深度网络增强树的节点生长，基于CNN隐藏层的联接函数f_n强化人脸特征y的表示，用增强后特征表示作为网络增强森林的节点特征选择：

d_n(y,K|Ω_g)＝σ(f_n(y,K|Ω_g)) (5)

式(5)中，σ(x)＝(1+e^-x)^-1是sigmoid函数，Ω_g为不同性别下的表情子森林，为增强森林中的一个分裂节点，K是CNN网络模型参数，通过随机梯度下降法SGD或Adam方法进行更新，当度量函数信息增益IG最大时，分裂生成树的左、右子节点：

式(10)中

为左、右子节点特征样本数量概率，H(d_n)为节点d_n的熵。

6.根据权利要求1所述的性别约束的全智能化人脸表情识别方法，其特征在于，步骤四中，在人脸性别g∈Ω_n已知的条件下，人脸特征y属于表情e的概率p(e|Ω_n,y)由随机森林T^E中所有树投票得到：

式(11)中，M为树的数量，l_m为第m棵树上人脸特征y达到的叶子节点，在人脸性别g∈Ω_n未知的条件下，人脸特征y属于表情e的概率p(e|y)表示为：

式(12)中，∑_nk_n＝M，

7.一种基于权利要求1-6任意一项所述的性别约束的全智能化人脸表情识别方法的识别系统，其特征在于，包括人脸特征提取、人脸性别估计和人脸表情识别三大模块，

人脸特征提取：此模块输入是人脸图像，输出是人脸特征向量，采用卷积神经网络模型进行人脸特征提取，为GoogleNet和RestNet50；