CN109145749B

CN109145749B - 一种跨数据集的面部表情识别模型构建及识别方法

Info

Publication number: CN109145749B
Application number: CN201810810769.8A
Authority: CN
Inventors: 马祥; 付俊妮
Original assignee: Changan University
Current assignee: Changan University
Priority date: 2018-07-23
Filing date: 2018-07-23
Publication date: 2021-07-30
Anticipated expiration: 2038-07-23
Also published as: CN109145749A

Abstract

本发明公开了一种跨数据集面部表情识别模型构建方法以及识别方法，通过自适应非负加权矩阵约束训练表情图像的重建误差，加强了图像数据表示中重要特征的作用并减少了具有重大重建误差的无用特征。另外通过映射矩阵将训练集投影到适当的子空间中，可以更好地揭示跨数据集图像样本之间的内在相似关系，从而使基于低秩与稀疏表示的子空间能够学习鲁棒的重建图像以便于实现最终的跨数据集面部表情识别。

Description

一种跨数据集的面部表情识别模型构建及识别方法

技术领域

本发明涉及面部表情识别领域，具体涉及一种跨数据集的面部表情识别模型构建及识别方法。

背景技术

现有的面部表情识别方法主要是基于所捕获的测试图像与训练图像均来自相同条件和相同个体的这一假设，且这些方法受限于大量的标记样本。然而当这些方法的训练与测试过程分别来自不同条件和不同个体的表情数据库上时，它们的识别性能将会显著下降。同时当已标记的训练样本严重不足时，现有的面部表情识别方法在学习过程中往往会出现过拟合现象，使得学习得到的模型在测试过程中无法获得应有的效果。

目前国内仅有个别针对跨域有限标记的人脸识别算法被提出，例如一种基于稀疏子空间聚类的跨域人脸迁移学习算法。然而该方法对待所有特征甚至包括一些冗余特征和噪声没有区别，这些冗余特征和噪声不仅无用，而且可能对图像数据表示不利。特别是当这些冗余特征的百分比大于有效特征时，冗余特征可能在图像数据表示中起主导作用。在这种情况下，基于子空间学习的图像是不精准的，进而导致不理想的聚类效果。

发明内容

本发明的目的在于提供一种跨数据集的面部表情识别模型构建及识别方法，用以解决现有技术中跨数据集的表情识别方法聚类效果不理想的问题。

为了实现上述任务，本发明采用以下技术方案：

一种跨数据集面部表情识别模型构建方法，所述的方法包括：

步骤1、获得面部表情图像训练集，所述的训练集包括第一数据集中的多幅已标记的面部表情图像以及第二数据集中的多幅未标记的面部表情图像，在所述的训练集中每幅已标记的面部表情图像对应一个标记标签，每幅未标记的面部表情图像对应一个随机标签；

步骤2、对所述训练集中的每幅面部表情图像进行人脸位置固定的预处理后再进行图像尺寸的归一化，获得每幅预处理后的面部表情图像；

步骤3、根据式I获得每幅预处理后的面部表情图像的相似图像：

其中，X_s为预处理后的面部表情图像，P为预处理后的面部表情图像的相似图像，M为投影矩阵，W为非负加权矩阵，E为重建误差，P₁为相似图像P的低秩表示、P₂为相似图像P的稀疏表示，λ₁为非负加权矩阵W的参数，λ₂为相似图像P的低秩表示P₁的参数，λ₃为相似图像P的稀疏表示P₂的参数，λ₁>0，λ₂>0，λ₃>0；

步骤4、对所有预处理后的面部表情图像的相似图像进行聚类，获得每幅预处理后的面部表情图像的相似图像的聚类结果，所述的聚类结果为每幅面部表情图像的确定标签，收集面部表情图像训练集中所有面部表情图像的确定标签，获得面部表情确定标签集；

步骤5、利用所述的面部表情图像训练集作为输入，利用所述的面部表情确定标签集作为输出，训练识别模型，获得面部表情识别模型。

进一步地，所述的步骤2、对所述训练集中的每幅面部表情图像进行人脸位置固定的预处理后再进行图像格式的归一化，获得预处理后的训练集，包括：

步骤21、将所述训练集中的每幅面部表情图像中的每个眼睛的中心点固定至相同位置，将所述眼睛中心点固定后的每幅面部表情图像中的嘴巴中心点固定至相同位置；

步骤22、将进行位置固定后的每幅面部表情图像进行直方图均衡化；

步骤23、将进行直方图均衡化后的每幅面部表情图像裁剪切割成尺寸相同的图像，获得预处理后的训练集。

进一步地，所述的步骤4、对所有预处理后的面部表情图像的相似图像进行聚类时，采用归一化切割的谱聚类算法。

进一步地，所述步骤5中识别模型为SVM分类模型。

一种跨数据集面部表情识别方法，采用上述的面部表情识别模型对将待识别的面部表情图像进行识别，获得待识别的面部表情图像的标签。

本发明与现有技术相比具有以下技术特点:

1、本发明提供的方法通过自适应非负加权矩阵约束训练表情图像的重建误差，加强了跨数据集样本图像数据表示中重要特征的作用并减少了具有重大重建误差的冗余特征。

2、本发明提供的方法通过映射矩阵将训练集投影到适当的子空间中，可以更好地揭示跨数据集图像样本之间的内在相似关系，使基于低秩与稀疏表示的子空间能够学习鲁棒的重建图像。

3、本发明提供的方法有效解决了当训练样本标签严重不足时的跨数据集面部表情识别问题。

附图说明

图1为本发明提供的识别模型构建方法的流程图；

图2为本发明的一个实施例中提供的CK+数据集中部分面部表情图像；

图3为本发明的一个实施例中提供的JAFFE数据集中部分面部表情图像；

图4为本发明的一个实施例中提供的待识别面部表情图像。

具体实施方式

以下是发明人提供的具体实施例，以对本发明的技术方案作进一步解释说明。

实施例一

本发明公开了一种跨数据集面部表情识别模型构建方法，所述的方法包括：

在本实施例中，分别选取CK+数据集中327张标记表情的面部表情图像和JAFFE数据集中142张未标记表情的面部表情图像构成一组面部表情图像训练集，其中CK+数据集中面部表情图像如图2所示，JAFFE数据集中面部表情图像如图3所示。其中已标记的面部表情图像的标签有：(1-中性，2-惊讶，3-悲伤，4-恐惧,5-生气,6-厌恶,7-高兴)，未标记的面部表情图像的随机标签设定为0。

在本步骤中，对每幅面部表情图像进行人脸位置固定可以是通过固定图像尺寸进行固定，也可以是在人脸中标记特征点进行固定。

作为一种优选的实施方式，将人脸图像中双眼与唇部中心的位置进行固定。

可选地，步骤2包括：

步骤22的目的在于将所有图像转化为灰度图。

步骤23、将进行直方图均衡化后的每幅面部表情图像裁剪切割成尺寸相同的图像，获得每幅预处理后的面部表情图像。

在本实施例中，将进行直方图均衡化后的每幅面部表情图像裁剪切割成大小为46×40的图像，获得预处理后的训练集。

作为一种优选的实施方式，λ₁＝10，λ₂＝0.001，λ₃＝0.02。

在本步骤中，通过非负加权矩阵来规范数据的重建误差，加强了图像数据表示中重要特征的作用并减少了具有重大重建误差的无用特征，通过依次迭代更新式I中的投影矩阵M，非负加权矩阵W，重建误差E，相似图像P的低秩表示P₁、相似图像P的稀疏表示P₂以及相似图像P，获得最终的相似图像P，也就是说，将一次更新后的投影矩阵M代入非负加权矩阵W的更新公式中，获得一次更新后的非负加权矩阵W，再将更新后的投影矩阵M、更新后的非负加权矩阵W代入重建误差E的更新公式中，获得一次更新后的重建误差E，同样地方法，更新相似图像P的低秩表示P₁、相似图像P的稀疏表示P₂，将所有一次更新后的投影矩阵M、更新后的非负加权矩阵W、更新后的重建误差E、更新后的相似图像P的低秩表示P₁以及更新后的相似图像P的稀疏表示P₂代入相似图像P的更新公式中，获得一次更新后的相似图像P。

具体地，重复多次步骤31-36迭代更新投影矩阵M，非负加权矩阵W，重建误差E，相似图像P的低秩表示P₁、相似图像P的稀疏表示P₂以及相似图像P，获得更新后的相似图像P，其中每次迭代更新包括：

步骤31、采用式II更新投影矩阵M，获得本次更新后的投影矩阵M：

求解出的投影矩阵M作为本次更新后的投影矩阵M；

其中，μ为惩罚因子，μ>0，Y₁与Y₄均为拉格朗日乘数因子，Y₁>0，Y₄>0，I为单位矩阵，在首次更新投影矩阵M时，E＝0，W＝1，P₁＝0，P₂＝0，P＝0；

步骤32、采用式III更新非负加权矩阵W，获得本次更新后的非负加权矩阵W：

求解出的非负加权矩阵W作为本次更新后的非负加权矩阵W；

在首次更新非负加权矩阵W时，E＝0；

步骤33、采用式IV更新重建误差E，获得本次更新后的重建误差E：

其中，在首次更新重建误差E时，P＝0；

步骤34、采用式V更新相似图像P的低秩表示P₁，获得本次更新后的相似图像P的低阶表示P₁：

其中，Y₂为拉格朗日乘数因子，Y₂>0，在首次更新相似图像P的低秩表示P₁时，P＝0；

步骤35、采用式VI更新相似图像P的稀疏表示P₂，获得本次更新后的相似图像P的稀疏表示P₂：

其中，Y₃为拉格朗日乘数因子，Y₃>0，在首次更新相似图像P的稀疏表示P₂时，P＝0；

步骤36、采用式VII更新相似图像P，获得本次更新后的相似图像P：

P＝(2I+X_s ^TWW^TX_s)^-1(G₂+G₃+X_s ^TWG₁) 式VII

其中，

作为一种优选的实施方式，对所有预处理后的面部表情图像的相似图像进行聚类时，采用归一化切割的谱聚类算法。

具体地，利用归一化切割的谱聚类算法对所有相似图像进行聚类包括：

步骤A、对每幅相似图像采用式VIII进行处理，获得近似图像G：

G＝(|P|+|P|^T)/2 式VIII

步骤B、通过对近似图像G的拉普拉斯矩阵进行特征分解来产生低维表示；

步骤C、利用K–means聚类的方法将产生的低维表示划分类别。

在本步骤中，识别模型可以是神经网络模型、SVM分类模型等，作为一种优选的实施方式，该识别模型为SVM分类模型。

通过在训练表情图像的重建误差处施加自适应非负加权矩阵，以加强图像数据表示中重要特征的作用并减少具有重大重建误差的无用特征，另外通过映射矩阵将训练集投影到适当的子空间中，可以更好地揭示跨数据集图像样本之间的内在相似关系，从而使基于低秩与稀疏表示的子空间能够学习鲁棒的重建图像以便于实现最终的表情识别。

实施例二

一种跨数据集面部表情识别方法，实施例一中所述的面部表情识别模型对将待识别的面部表情图像进行识别，获得待识别的面部表情图像的标签。

在本实施例中，对如图4所示的面部表情图像进行识别，识别结果为：7-高兴。