CN109711378A

CN109711378A - 人脸表情自动识别方法

Info

Publication number: CN109711378A
Application number: CN201910000813.3A
Authority: CN
Inventors: 于明; 高磊; 王岩; 刘依; 于洋; 师硕; 郭迎春; 郝小可; 朱叶; 阎刚
Original assignee: Hebei University of Technology; Tianjin University of Commerce
Current assignee: Hebei University of Technology; Tianjin University of Commerce
Priority date: 2019-01-02
Filing date: 2019-01-02
Publication date: 2019-05-03
Anticipated expiration: 2039-01-02
Also published as: CN109711378B

Abstract

本发明人脸表情自动识别方法，涉及用于识别图形的图像特征或特性的抽取的图像预处理，步骤是：人脸表情图像预处理→对人脸表情图像的关键特征点进行自动定位标记→将人脸表情图像的关键特征点形成特征块→获得各个不规则的多边形特征块的PD‑LDN特征直方图；获得各个不规则的多边形特征块的七阶矩特征→将PD‑LDN特征直方图和七阶矩特征融合起来，得到融合的人脸表情特征数据→采用SVM分类器进行人脸表情的训练和预测，实现人脸表情自动识别。本发明方法克服了现有的人脸表情识别方法存在对光照噪声的干扰鲁棒性差，对局部信息的提取不充分，计算复杂，导致人脸表情识别率低并且计算时间过长的缺陷。

Description

人脸表情自动识别方法

技术领域

本发明的技术方案涉及用于识别图形的图像特征或特性的抽取的图像预处理，具体地说是人脸表情自动识别方法。

背景技术

人脸表情识别属于情感识别的一类，是指对给定的人脸图像指定一个所属的情感类别，包括开心、悲伤、恐惧、惊讶、愤怒或厌恶的情感类别。人脸表情自动识别是计算机视觉领域研究的重点。

人脸表情自动识别方法涉及到的技术包括人脸表情图像获取、人脸图像预处理、人脸图像特征提取和人脸表情分类，其中人脸图像特征提取是人脸表情自动识别过程中的一个重要的环节，其有效性决定了人脸表情自动识别的准确率。现有的人脸图像特征提取方法包括基于纹理特征提取和基于几何特征提取两类方法。纹理特征表示人脸脸部皮肤纹理的信息，如皱眉和皱纹，纹理特征提取是针对整个人脸脸部图像，或者是针对脸部图像中的某一个特定区域进行的，其方法有Gabor滤波器、局部二值模式(以下简称LBP)算法和方向梯度直方图(以下简称HOG)算法。几何特征表示人脸脸部五官的形状和位置，几何特征提取方法有活动外观模型(以下简称AAM)算法和七阶矩算法。以上人脸表情特征提取方法中，由于LBP算法能够很好地提取局部特征而得到了广泛的应用，但LBP算法本身也存在着过于依赖中心像素和对光照敏感的缺点，针对这些缺点，He等在“Multi-structure localbinary patterns for texture classification”一文中提出了多结构局部二值模式(简称MS-LBP)方法，通过多种结构的邻域选择，提取出人脸图像的多种局部信息，该方法存在特征维度大，计算复杂度高的问题。CN107045621A公开了一种结合LBP和LDA的人脸表情识别方法，该方法通过LDA算法对提取出的LBP特征进行降维，存在对光照和遮挡的鲁棒性低而导致的识别率低下的缺陷。CN106599854A公开了一种基于多特征融合的人脸表情自动识别方法，该方法对人脸表情图像进行分割并提取ACILBP和Gabor特征，存在对图像进行多尺度特征提取造成的计算复杂度高因而计算耗时过长的缺陷。CN103971095A公开了一种基于多尺度LBP和稀疏编码的人脸表情识别方法，该方法需要大量的样本进行训练，因而存在方法操作复杂可实施性差的缺陷。CN105005765A公开了一种基于Gabor小波和灰度共生矩阵的人脸表情识别方法，该方法提取的两种特征都属于纹理特征，存在着特征冗余导致计算复杂度高并且对光照的影响敏感的缺陷。CN105844221A公开了一种加入特征点检测的人脸表情识别方法，该方法采用规则的矩形分块不能很好地将不规则的人脸五官划分出来，因而存在对局部信息利用不充分而导致识别率低下的缺陷。CN105913053A公开了一种基于稀疏融合的单演多特征的人脸表情识别方法，该方法存在仅使用单演特征而使得方法对光照环境变化敏感的缺陷。

总之，现有的人脸表情识别方法存在对光照噪声的干扰鲁棒性差，对局部信息的提取不充分，计算复杂，导致人脸表情识别率低并且计算时间过长的缺陷。因此有必要提出一种新的人脸表情自动识别方法技术方案，克服上述现有技术存在的缺陷。

发明内容

本发明所要解决的技术问题是：提供人脸表情自动识别方法，是一种基于人脸特征部位不规则分块和多特征融合的人脸表情自动识别方法，本发明方法克服了现有的人脸表情识别方法存在对光照噪声的干扰鲁棒性差，对局部信息的提取不充分，计算复杂，导致人脸表情识别率低并且计算时间过长的缺陷。

本发明解决该技术问题所采用的技术方案是：人脸表情自动识别方法，是一种基于人脸特征部位不规则分块和多特征融合的人脸表情自动识别方法，具体步骤如下：

第一步，人脸表情图像预处理：

采用如下的公式(1)，将从计算机USB接口采集的人脸表情图像由RGB空间转化到灰度空间，然后对图像进行尺寸归一化，得到人脸表情灰度图像I_gray，

I_gray＝0.299R+0.587G+0.114B (1)，

公式(1)中，R、G和B分别为红色、绿色和蓝色通道的分量，

由此完成人脸表情图像预处理；

第二步，对人脸表情图像的关键特征点进行自动定位标记：

用AAM算法对上述第一步得到的人脸表情灰度图像I_gray的特征点进行自动定位标记，根据人脸不同部位的特征，依次得到六十八个人脸关键特征点的标记坐标，形成坐标集如下公式(2)所示：

L＝{s_l|l＝1,2,...,k；s_l＝(x_l,y_l)} (2)，

公式(2)中，L为所有标记点的集合，s_l为每个标记的人脸关键特征点，k为标记的人脸关键特征点的个数，k＝68，x_l为标记的人脸关键特征点的横坐标，y_l为标记的人脸关键特征点的纵坐标，各个标记的人脸关键特征点的含义及定位标记如下：

对人脸面部轮廓定位标记，得到编号为0～16的十七个标记的人脸关键特征点标记坐标；对人脸眉毛的位置以及弧度进行定位标记，得到编号为17～26的十个标记的人脸关键特征点标记坐标，其中编号17～21的五个标记的人脸关键特征点标记坐标定位左眼眉毛，编号22～26的五个标记的人脸关键特征点标记坐标定位右眼眉毛；对人脸鼻子的位置和轮廓进行定位标记，得到编号为27～35的九个标记的人脸关键特征点标记坐标；对人脸眼睛的位置和轮廓进行定位标记，得到编号为36～47的十二个标记的人脸关键特征点标记坐标，其中编号36～41的六个标记的人脸关键特征点标记坐标是对左眼进行定位，编号42～47的六个标记的人脸关键特征点标记坐标是对右眼进行定位；最后对人脸嘴部的位置和轮廓进行定位标记，得到编号为48～67的二十个标记的人脸关键特征点标记坐标，

由此完成对人脸表情图像的关键特征点进行自动定位标记；

第三步，将人脸表情图像的关键特征点形成特征块：

根据上述第二步得到的68个人脸表情图像的关键特征点的标记坐标，将人脸表情图像的人脸各部位的关键特征点按照人脸各部位的形状进行连线，形成十五个封闭的不规则的多边形特征块如下公式(3)所示：

Q＝{c_t|t＝1,2,...,n} (3)，

公式(3)中，Q为十五个封闭的不规则的多边形特征块的集合，c_t为各单个不规则的多边形特征块，n为不规则的多边形特征块的个数，n＝15，

由此完成将人脸表情图像的关键特征点形成特征块；

第四步，获得各个不规则的多边形特征块的PD-LDN特征直方图：

利用PD-LDN算子提取上述第三步中的各个不规则的多边形特征块的PD-LDN特征直方图，具体步骤如下：

第4.1步，计算边缘响应值：

将上述第三步中的单个不规则的多边形特征块中的每一个像素点置于3×3的邻域G的中心处，邻域G如下公式(4)所示：

公式(4)中，g₀、g₁、g₂、g₃、g₄、g₅、g₆、g₇分别为邻域G内8个位置上的像素值，g₈为邻域G的中心像素值；

然后将邻域G和四个方向的Robinson算子计算卷积{M₀,M₁,M₂,M₃}，其计算公式(5)如下：

公式(5)中，M₀、M₁、M₂、M₃分别为Robinson算子在东、东北、北和西北四个方向上的模板矩阵，

由如下公式(6)得出上述四个方向的边缘响应值{R₀,R₁,R₂,R₃}，

R_i＝M_i*G,0≤i≤3 (6)，

公式(6)中，M_i为Robinson算子的模板矩阵，G为3×3的邻域，R_i为边缘响应值，i为方向编号，R_i是由M_i和G经过卷积计算得到；

第4.2步，计算两个方向编码值：

根据上述第4.1步计算出的边缘响应值，取其绝对值最大的两个方向作为编码方向，得到两个方向编码值d₁和d₂，如下公式(7)所示：

公式(7)中，R_i为上述第4.1步中得到的边缘响应值，i为方向编号，j为对边缘响应绝对值进行降序排序得到的顺序编号，取边缘响应绝对值最大的两个方向，故此处j的值取1和2；

由算子对上述第4.1步计算出的边缘响应绝对值进行降序排序，得到d₁和d₂两个方向编码值；

第4.3步，计算阈值：

通过阈值自适应的方式计算出上述第4.1步中的3×3的邻域G内的阈值δ，计算步骤如下公式(8)-(11)所示：

先计算上述第4.1步中的3×3的邻域G内的像素均值

公式(8)中，g_v为邻域G内各像素点的像素值，T为邻域G内的像素点个数，此处T的值为9，v为邻域G内像素点的下标；

再将该邻域内的各个像素值分别和均值相减，得到对比度值Δg_v：

公式(9)中，g_v为邻域G内各像素点的像素值，T为邻域G内的像素点个数，此处T的值为9，为由公式(8)计算得到的邻域G内的像素均值，v为邻域G内像素点的下标；

然后统计该邻域对比度值，求其均值

公式(10)中，为邻域G对比度的均值，Δg_v为由公式(9)计算得到的对比度值，T为邻域G内的像素点个数，此处T的值为9，v为邻域G内像素点的下标；

最后根据对比度值及其均值，计算阈值δ：

公式(11)中，Δg_v为由公式(9)计算得到的对比度值，为由公式(10)计算得出的邻域G对比度的均值，T为邻域G内像素点的总个数，此处T的值为9，v为邻域G内像素点的下标；

第4.4步，计算二值模式：

通过上述第4.3步计算得到的阈值，将上述第4.2步中的d₁和d₂两个编码方向上的像素值进行二值化计算，得出两个二值模式b₁和b₂，计算公式如下公式(12)所示：

公式(12)中，d₁和d₂为上述第4.2步中的两个方向编码值，g_d1为邻域G内d₁位置上的像素值，g_d2为邻域G内d₂位置上的像素值，b₁和b₂分别为g_d1和g_d2的二值模式，g₈是邻域G的中心像素值，δ为上述第4.3步计算得到的阈值；

第4.5步，计算PD-LDN编码值进而获得PD-LDN特征直方图：

把上述第4.2步计算得到的两个方向编码值d₁和d₂和上述第4.4步中的两个二值模式b₁和b₂进行组合，采用公式(13)转换为十进制数得到该窗口中心像素点的PD-LDN编码值，计算公式(13)如下：

CV＝16d₁+8b₁+2d₂+b₂ (13)，

公式(13)中，CV为PD-LDN编码值，d₁和d₂为上述第4.2步计算得到的两个方向编码值，b₁和b₂为上述第4.4步中的两个二值模式，

最后通过对PD-LDN编码值进行统计获得PD-LDN特征直方图；

第五步，获得各个不规则的多边形特征块的七阶矩特征：

提取上述第三步中的十五个不规则的多边形特征块的七阶矩特征，具体步骤如下：

第5.1步，计算几何矩

计算上述第三步中的十五个不规则的多边形特征块中每个特征块的0阶几何矩和1阶几何矩，m₀₀，m₀₁和m₁₀，其中，m₀₀为0阶几何矩，m₀₁和m₁₀为1阶几何矩，计算公式如下公式(14)所示，

公式(14)中，m_pq为每个特征块的几何矩，x和y分别为每个不规则特征块内像素点的横坐标和纵坐标，p和q分别为每个不规则特征块内像素点横坐标和纵坐标的阶次，Z和N分别表示每个不规则特征块形成的像素矩阵的行数和列数，f(x,y)为不规则特征块内(x,y)点的像素值；

第5.2步，计算质心坐标

根据上述第5.1步计算出来的0阶和1阶几何矩，计算上述第三步中的十五个不规则的多边形特征块中每个不规则特征块的质心坐标，计算公式如下公式(15)所示，

公式(15)中，和分别为质心的横坐标和纵坐标，m₀₀为上述第5.1步中的0阶几何矩，m₀₁和m₁₀为上述第5.1步中的1阶几何矩；

第5.3步，计算中心矩：

计算上述第三步中的十五个不规则的多边形特征块中每个不规则特征块的0～3阶中心矩，即μ₀₀，μ₀₁，μ₁₀，μ₁₁，μ₀₂，μ₂₀，μ₀₃和μ₃₀，计算公式如下公式(16)所示，

公式(16)中，μ_ab表示每个不规则特征块的中心矩，x和y分别为每个不规则特征块内像素点的横坐标和纵坐标，a和b分别为每个不规则特征块内像素点横坐标和纵坐标的阶次，R和W分别表示每个不规则特征块形成的像素矩阵的行数和列数，f(x,y)为不规则特征块内(x,y)点的像素值；

第5.4步，计算规格化中心矩

将上述第5.3步中得到的中心矩μ_ab进行规格化，计算出上述第三步中的十五个不规则的多边形特征块中每个不规则特征块的2阶和3阶规格化中心矩，计算公式如下公式(17)所示：

公式(17)中，η_αβ为上述第三步中的十五个不规则的多边形特征块中每个不规则特征块的规格化中心矩，α和β分别为每个不规则特征块内像素点横坐标和纵坐标的阶次，μ_αβ为上述第5.3步中的中心矩，γ为中心矩的阶次；

第5.5步，计算七阶矩

根据上述第5.4步中得到的上述第三步中的十五个不规则的多边形特征块中每个不规则特征块的2阶和3阶规格化中心矩，计算出七个不变矩，即七阶矩，计算公式如下(18)-(24)所示，

Φ₁＝η₂₀+η₀₂ (18)，

Φ₃＝(η₂₀-3η₁₂)²+3(η₂₁-η₀₃)² (20)，

Φ₄＝(η₃₀+η₁₂)²+(η₂₁+η₀₃)² (21)，

Φ₆＝(η₂₀-η₀₂)[(η₃₀+η₁₂)²-(η₂₁+η₀₃)²]+4η₁₁(η₃₀+η₁₂)(η₂₁+η₀₃) (23)，

公式(18)-(24)中，Φ₁，Φ₂，Φ₃，Φ₄，Φ₅，Φ₆，Φ₇为上述第三步中的十五个不规则的多边形特征块中每个特征块的七个不变矩，η₂₀、η₀₂、η₁₁为上述第5.4步中计算得到的2阶规格化中心矩，η₁₂、η₂₁、η₃₀、η₀₃为上述第5.4步中计算得到的3阶规格化中心矩；

由此最终得到上述第三步中的十五个不规则的多边形特征块的七阶矩特征，完成获得各个不规则的多边形特征块的七阶矩特征；

第六步，将PD-LDN特征直方图和七阶矩特征融合起来，得到融合的人脸表情特征数据：

将上述第四步中各个不规则的多边形特征块的PD-LDN特征直方图和上述第五步中的各个不规则的多边形特征块的七阶矩特征融合起来，得到融合的人脸表情特征数据，具体地说是将上述第四步中通过对PD-LDN编码值进行统计获得的所有PD-LDN特征直方图串联，形成整张人脸表情图像的PD-LDN直方图；将上述第五步获得的所有各个不规则的多边形特征块的七阶矩特征串联起来，形成整张人脸表情图像的七阶矩特征，最后将整张人脸表情图像的PD-LDN直方图和整张人脸表情图像的七阶矩特征融合起来，得到融合的人脸表情特征数据；

第七步，采用SVM分类器进行人脸表情的训练和预测，实现人脸表情自动识别：

将上述第一步中的全部人脸表情图像分为训练集和测试集两个部分，将这两部分分别按照上述第一步到第六步的顺序处理后，得到训练集和测试集的人脸表情特征值，将训练集的人脸表情特征输入到分类器中进行训练得到SVM分类器的支持向量，再将测试集人脸表情图像的特征和训练好的SVM分类器的支持向量送入到SVM分类器中进行预测，SVM分类器采用自定义核函数，利用交叉验证选择最佳参数，拉格朗日因子c＝600，g＝1.7，实现人脸表情自动识别。

上述人脸表情自动识别方法，其中所述PD-LDN算子的英文为pixel difference-local directional number pattern，中文意为像素差局部方向数值模式。

上述人脸表情自动识别方法，其中所述AAM算法，LBP算法，七阶矩算法，SVM分类器都是本领域公知的。

本发明的有益效果是：与现有技术相比，本发明的突出的实质性特点和显著进步如下：

(1)本发明方法将人脸表情图像的关键特征点形成特征块，利用所提出的PD-LDN算子提取上述第三步中的各个不规则的多边形特征块的PD-LDN特征直方图，然后提取各个不规则的多边形特征块的七阶矩特征，进而将PD-LDN直方图和七阶矩特征融合起来，得到融合的人脸表情特征数据。基于人脸表情图像特征部位的不规则特征块，能够针对人脸五官的形状进行局部信息提取，纹理特征和几何特征融合的方法提高了特征的鲁棒性，方法的低维度特征降低了整个计算的复杂度。与现有的局部方向数值模式(以下简称LDN)算子相比，本发明的PD-LDN算子采用对称的Robinson算子进行卷积计算，只需进行四个方向的计算即可求出边缘响应值，比传统LDN算法计算8个方向的边缘响应值降低了计算复杂度，节省了计算时间。

(2)本发明采用基于人脸特征部位的不规则分块，不仅能够将人脸五官图像区域更好的提取出来，还能够把人脸五官的形状变化反映出来，所以较传统的网格分块更能充分提取人脸表情的局部信息，因此能更好的对不同的面部表情加以区分，提高了人脸表情的自动识别率。

(3)本发明提出的PD-LDN算子还将中心像素点的灰度值和最大响应方向的灰度值差异信息作为特征，并且采用了阈值自适应的方式进行二值化计算，充分利用局部信息，比现有的LDN算子更具鲁棒性。

(4)本发明方法融合了人脸表情图像的纹理特征和几何特征，使得表情特征的辨识度更高，并且受其它因素的干扰更小。本方法克服了现有的人脸表情识别方法存在对光照噪声的干扰鲁棒性差，对局部信息的提取不充分，计算复杂，导致人脸表情识别率低并且计算时间长的缺陷。

(5)本发明与CN105844221A相比：CN105844221A中通过对面部关键点定位，然后使用规则的矩形对人脸表情图像进行子块提取，而本发明使用的是能够更好贴合人脸五官形状的不规则分块，能将人脸五官的特征提取的更加完整，对局部信息利用更加充分；在特征提取方面，CN105844221A使用的是LBP特征，LBP特征抗噪能力差，而本发明提出的PD-LDN特征能够对局部的信息进行细致的提取，并且对光照噪声不敏感，所以对人脸表情的识别效果好。本发明的显著进步是采用符合五官外形的不规则分块充分利用了局部信息，提取的特征抗噪能力强，所以识别率高。

(6)本发明与CN107045621A相比：CN107045621A中提取特征使用的是LBP算子，所以提取的特征辨识度低，抗噪能力差，本发明提出的PD-LDN算子，使用Robinson算子对局部邻域像素块进行卷积计算，得到边缘响应值，选取边缘响应值中绝对值最大的方向进行像素值的二值化计算，在二值化的过程中采用了阈值自适应的方式，因此本方法不仅提取到局部邻域的方向信息，还获得了邻域内像素的灰度值与中心像素的灰度值差异信息，使得对局部特征的提取更加完整，对局部信息的利用更加全面，提取的特征有更强的抗噪能力，所以识别率更高。本发明的显著进步是使用PD-LDN算子对局部信息进行更好地提取，对光照噪声的鲁棒性更强，所以识别率更高。

(7)本发明与CN103971095A相比：CN103971095A中首先需要建立大规模的人脸表情数据库，然后对这些表情图像提取多尺度LBP特征，数量庞大的数据库不仅给方法实施带来了难度，还给方法的训练和识别过程增加了时间消耗，并且多尺度LBP特征维度高，而且对光照噪声敏感，所以此方法识别率低，计算复杂度高，耗时太长。本发明提出的PD-LDN算子比CN103971095A中使用的LBP算子有更好的鲁棒性和抗干扰性，不仅提高了识别率，而且由于特征维度低，所以计算时间短，并且CN103971095A需要建立大规模的人脸表情数据库，增加了方法实施的难度，而本发明仅需少量样本即可，实施方法简便，所以在表情识别准确率和实施难度方面，本发明有一定的优势。本发明的显著进步是不需要大量的人脸表情图像样本所以方法操作简便，可实施性好，训练和识别速度快。

(8)本发明与CN105005765A相比：CN105005765A中使用的特征是Gabor特征和灰度共生矩阵，这两种特征都对光照敏感，所以这种方法抗干扰能力差，而本发明方法提出的PD-LDN特征，对光照噪声具有鲁棒性，并且七阶矩几何特征能将人脸五官的外形和大小变化更好的表现出来，最后将纹理和几何特征进行融合，所以本发明方法能取得更高的识别率并且有抗干扰能力。CN105005765A提取的两种特征属于纹理特征，造成了特征冗余，本发明的显著进步是提取了纹理和几何两种不同的种类的特征，使得特征对光照影响有鲁棒性。

(9)本发明与CN106599854A相比：CN106599854A中人脸图像特征提取的区域为规则的矩形，造成了局部信息的损失，并且在多尺度空间进行特征提取，使得特征维度变高，而本发明采用的是符合人脸五官形状的不规则分块，完整地提取局部信息，本发明提出的PD-LDN算子提取的纹理特征辨识度高，并且结合低维度的七阶矩几何特征，使得本发明的方法在保持高识别率的同时，特征维度小，耗时少。CN106599854A提取了多尺度的特征，而本发明仅需在单尺度空间中进行特征提取，所以特征维度小，操作简便。

(10)本发明与CN105913053A相比：CN105913053A中采用均匀分块对人脸表情图像进行分割，对人脸表情图像的信息造成了损失，CN105913053A提取的多尺度特征，使得特征维度变高，所以计算时间长。本发明的PD-LDN算法提取的特征辨识度高，并且特征维度小，加上基于五官形状的不规则分块和低维度七阶矩几何特征，使得本发明提取的特征鲁棒性强，所以识别率高。CN105913053A仅提取了单演特征，因而对光照噪声的干扰敏感，本发明将纹理和几何特征进行了融合，所以抗干扰性强，对环境的变化敏感度小。

附图说明

下面结合附图和实施例对本发明进一步说明。

图1是本发明方法的流程示意图。

图2是本发明方法中人脸表情图像特征点标记的示意图。

图3是本发明方法中人脸表情图像特征部位分块的示意图。

图4为本发明方法中人脸表情图像纹理特征和几何特征提取并融合的过程示意图。

具体实施方式

图1所示实施例表明，本发明方法的流程为：人脸表情图像预处理→对人脸表情图像的关键特征点进行自动定位标记→将人脸表情图像的关键特征点形成特征块→获得各个不规则的多边形特征块的PD-LDN特征直方图；获得各个不规则的多边形特征块的七阶矩特征→将PD-LDN特征直方图和七阶矩特征融合起来，得到融合的人脸表情特征数据→采用SVM分类器进行人脸表情的训练和预测，实现人脸表情自动识别。

图2所示实施例表明，用AAM算法对人脸进行特征点标定，共标记了68个特征点，具体分布为：脸部轮廓用七个标记点进行标记，眼眉用10个标记点进行标记，眼睛用12个标记点进行标记，鼻子用9个标记点进行标记，嘴部用20个标记点进行标记。标记点详细位置如图2所示。

图3所示实施例表明，本发明采用人脸表情图像特征部位分块的方式，将人脸表情图像分割为十五个不规则的多边形特征块。

图4所示实施例表明，本发明方法采用特征融合方法，在将人脸表情图像进行特征部位分块之后，对每个小块分别提取PD-LDN特征直方图和七阶矩特征，最后将PD-LDN特征直方图和七阶矩特征串联起来，组成融合的人脸表情特征。

实施例1

本实施例是一种基于人脸特征部位不规则分块和多特征融合的人脸表情自动识别方法，具体步骤如下：

第一步，人脸表情图像预处理：

I_gray＝0.299R+0.587G+0.114B (1)，

公式(1)中，R、G和B分别为红色、绿色和蓝色通道的分量，

由此完成人脸表情图像预处理；

第二步，对人脸表情图像的关键特征点进行自动定位标记：

L＝{s_l|l＝1,2,...,k；s_l＝(x_l,y_l)} (2)，

由此完成对人脸表情图像的关键特征点进行自动定位标记；

第三步，将人脸表情图像的关键特征点形成特征块：

Q＝{c_t|t＝1,2,...,n} (3)，

由此完成将人脸表情图像的关键特征点形成特征块；

第4.1步，计算边缘响应值：

R_i＝M_i*G,0≤i≤3 (6)，

第4.2步，计算两个方向编码值：

第4.3步，计算阈值：

先计算上述第4.1步中的3×3的邻域G内的像素均值

然后统计该邻域对比度值，求其均值

最后根据对比度值及其均值，计算阈值δ：

第4.4步，计算二值模式：

第4.5步，计算PD-LDN编码值进而获得PD-LDN特征直方图：

CV＝16d₁+8b₁+2d₂+b₂ (13)，

最后通过对PD-LDN编码值进行统计获得PD-LDN特征直方图；

第五步，获得各个不规则的多边形特征块的七阶矩特征：

第5.1步，计算几何矩

第5.2步，计算质心坐标

第5.3步，计算中心矩：

第5.4步，计算规格化中心矩

第5.5步，计算七阶矩

Φ₁＝η₂₀+η₀₂ (18)，

Φ₃＝(η₂₀-3η₁₂)²+3(η₂₁-η₀₃)² (20)，

Φ₄＝(η₃₀+η₁₂)²+(η₂₁+η₀₃)² (21)，

实施例2

本实施例是对本发明所采用的一种基于人脸特征部位不规则分块和多特征融合的人脸表情自动识别方法所进行的实验验证。

本实施例在JAFFE人脸表情数据库和CK+人脸表情数据库上进行了实验。其中，JAFFE数据库共有213张人脸表情图像，由十个女性的七种人脸表情包括中性、高兴、悲伤、愤怒、惊奇、恐惧和厌恶所组成。选取JAFFE数据库中的137张人脸表情图像作为训练数据，其余的76张人脸表情图像用于测试。CK+人脸表情数据库包含了不同国家不同地区参与者123人，共593个人脸表情序列，每个人脸表情序列都是从中性人脸表情开始，以人脸表情的峰值帧结束。选取CK+数据库中每个人脸表情序列的峰值帧共1716张人脸表情图像作为实验数据，选取862张人脸表情图像作为训练数据，854张人脸表情图像作为测试数据。本实验在Windows7环境下的MATLAB R2016a平台上进行。本实施例在JAFFE数据库和CK+数据库上实验的准确率分别为98.68％和97.16％。表1和表2分别列出了本实施例中的不同人脸表情自动识别方法在两个数据库中的识别率。

表1 JAFFE和CK+数据库中不同分块方式的测试结果

从表1可以看出，相比于现有的网格分块方法，本发明方法一种基于人脸特征部位不规则分块和多特征融合的人脸表情自动识别方法在识别率上有明显的优势。

表2不同的特征提取方法在JAFFE和CK+数据库上的测试结果

表2列出了本发明方法即该表中的人脸表情自动识别的“PD-LDN”特征提取方法与现有技术中的人脸表情自动识别的特征提取方法在人脸表情图像上的识别率，结果表明，本发明方法在JAFFE和CK+数据库中人脸表情识别率都高于其他几种方法，可见本发明方法在人脸表情自动识别上的效果显著。

上述实施例中所述PD-LDN算子的英文为pixel difference-local directionalnumber pattern，中文意为像素差局部方向数值模式；其中所述AAM算法，LBP算法，七阶矩算法，SVM分类器都是本领域公知的。

Claims

1.人脸表情自动识别方法，其特征在于：是一种基于人脸特征部位不规则分块和多特征融合的人脸表情自动识别方法，具体步骤如下：

第一步，人脸表情图像预处理：

I_gray＝0.299R+0.587G+0.114B (1)，

公式(1)中，R、G和B分别为红色、绿色和蓝色通道的分量，

由此完成人脸表情图像预处理；

第二步，对人脸表情图像的关键特征点进行自动定位标记：

L＝{s_l|l＝1,2,...,k；s_l＝(x_l,y_l)} (2)，

由此完成对人脸表情图像的关键特征点进行自动定位标记；

第三步，将人脸表情图像的关键特征点形成特征块：

Q＝{c_t|t＝1,2,...,n} (3)，

由此完成将人脸表情图像的关键特征点形成特征块；

第4.1步，计算边缘响应值：

R_i＝M_i*G,0≤i≤3 (6)，

第4.2步，计算两个方向编码值：

由算子对上述第4.1步计算出的边缘响应绝对值值进行排序，得到d₁和d₂两个方向编码值；

第4.3步，计算阈值：

先计算上述第4.1步中的3×3的邻域G内的像素均值

然后统计该邻域对比度值，求其均值

最后根据对比度值及其均值，计算阈值δ：

第4.4步，计算二值模式：

公式(12)中，d₁和d₂为上述第4.2步中的两个方向编码值，为邻域G内d₁位置上的像素值，为邻域G内d₂位置上的像素值，b₁和b₂分别为和的二值模式，g₈是邻域G的中心像素值，δ为上述第4.3步计算得到的阈值；

第4.5步，计算PD-LDN编码值进而获得PD-LDN特征直方图：

CV＝16d₁+8b₁+2d₂+b₂ (13)，

最后通过对PD-LDN编码值进行统计获得PD-LDN特征直方图；

第五步，获得各个不规则的多边形特征块的七阶矩特征：

第5.1步，计算几何矩

第5.2步，计算质心坐标

第5.3步，计算中心矩：

第5.4步，计算规格化中心矩

第5.5步，计算七阶矩

Φ₁＝η₂₀+η₀₂ (18)，

Φ₃＝(η₂₀-3η₁₂)²+3(η₂₁-η₀₃)² (20)，

Φ₄＝(η₃₀+η₁₂)²+(η₂₁+η₀₃)² (21)，

Φ₆＝(η₂₀-η₀₂)[(η₃₀+η₁₂)²-(η₂₁+η₀₃)²]+4η₁₁(η₃₀+η₁₂)(η₂₁+η₀₃)(23)，