CN1710595A

CN1710595A - 嘴角定位方法

Info

Publication number: CN1710595A
Application number: CN 200510026811
Authority: CN
Inventors: 杜春华; 杨杰
Original assignee: Shanghai Jiaotong University
Current assignee: Shanghai Jiaotong University
Priority date: 2005-06-16
Filing date: 2005-06-16
Publication date: 2005-12-21

Abstract

一种属于数字图像处理和模式识别技术领域的嘴角定位方法，本发明根据嘴唇的颜色分布，首先获得嘴巴区域的大概位置，然后分析该区域的直方图并对该区域进行阈值化处理得到二值图像，接着对该二值图像进行两次腐蚀运算，并对腐蚀后的图像进行连通区域分析并找到最大的连通区域，然后对这个最大的连通区域进行两次膨胀运算，最后分析膨胀后得图像即可精确地定位出嘴角的位置。本发明精确地给出嘴角的位置，大大提高人脸识别、表情识别的精度。

Description

嘴角定位方法

技术领域

本发明涉及的是一种属于数字图像处理和模式识别技术领域的方法，具体地说，是一种嘴角定位方法。

背景技术

人脸特征点检测是人脸识别、表情识别、性别识别，年龄估计等应用中的关键技术，其特征点位置定位的准确性直接影响到识别的精度，而在人脸特征中嘴角特征很重要。因此，准确地定位嘴角的位置可以大大地提高识别的精度。当前嘴角的定位主要依据对不同颜色空间嘴唇颜色的分布，图像灰度、图像边缘的分析。但在大多数情况下，由于复杂背景和光照的影响，仅仪依赖某个颜色空间，灰度和边缘来定位嘴角是一件非常困难的工作。

经对现有技术文献的检索发现，Rein-Lien Hsu等(Rein-Lien Hsu，MohamedAbdel-Mottaleb，Anil K.Jain彩色图像中的人脸检测电气与电子工程师协会学报模式分析与机器学习VOL 24，NO.5.MAY 2002)曾通过大量样本的统计给出了嘴巴区域在YCbCr颜色空间的各个分量的分布，并根据这些分量的分布粗略地定位嘴的位置，但却不能给出嘴角的精确定位。

发明内容

本发明的目的在于克服现有技术中存在的不足，提供一种嘴角定位方法，使其精确地给出嘴角的位置，大大提高人脸识别、表情识别的精度。

本发明是通过以下技术方案实现的，本发明根据嘴唇的颜色分布，首先获得嘴巴区域的大概位置，然后分析该区域的直方图并对该区域进行阈值化处理得到二值图像，接着对该二值图像进行两次腐蚀运算，并对腐蚀后的图像进行连通区域分析并找到最大的连通区域，然后对这个最大的连通区域进行两次膨胀运算，最后分析膨胀后的图像即可精确地定位出嘴角的位置。

本发明具体步骤如下：

(1)把原始人脸图像从RGB空间转换到YCbCr空间并进行相应的处理，对图像中的每个像素计算Cr分量除以Cb分量的结果，记为Cr_div_Cb，同时计算Cr分量的平方，记为Cr_mul_Cr，对每个像素都进行这样的操作后得到了两个矩阵：Cr_div_Cb，Cr_mul_Cr，然后对该这两个矩阵进行归一化处理，得到矩阵：Cr_div_Cb，Cr_mul_Cr；计算一个常数K，K＝0.95*mean(Cr_mul_Cr)/mean(Cr-_div_Cb)，其中mean表示求矩阵的平均值，然后初始化一个和人脸图像一样大小的矩阵，矩阵中每个元素都赋值后，对这个矩阵进行归一化处理得到一个新的矩阵，在这个新的矩阵上利用模板匹配的方法找到使模板内平均灰度最大的位置即为嘴巴区域的位置，而且该嘴巴是在该模板内，且记嘴巴区域为MouthMap。

(2)分析嘴巴区域的直方图找到对应的像素点最多的灰度级并以该灰度级为阈值对嘴巴区域图像进行二值化处理得到一个二值图像。

(3)对上一步得到的二值图像进行两次腐蚀运算。进行腐蚀运算是为了去除一些零星分布的小的区域，同时尽可能地把嘴巴区域和非嘴巴区域分开。

(4)对上一步腐蚀运算后的结果进行连通区域分析，并找到最大的连通区域。对腐蚀后的图像进行连通区域分析，因为嘴巴区域里最主要的是嘴唇区域，且其在嘴巴区域中占很大比例，因此最大的连通区域即为嘴唇对应的区域。

(5)对上一步找到的最大的连通区域进行两次膨胀运算，以恢复在第3步中腐蚀掉的边界像素点。

(6)搜索经过膨胀运算后的二值图像中最左边的灰度值为1的像素点，该像素即为左嘴角点，同理找到二值图像中最右边的灰度值为1的像素点，该像素即为右嘴角点。

所述的归一化处理，是指：计算矩阵的最大值，然后矩阵中的每个元素都除以这个最大值。

所述的赋值，是指：每个像素的灰度值赋值为Cr_mul_Cr*(Cr_mul_Cr-k*Cr_div_Cb)^2。

本发明的工作原理是：首先根据嘴唇的颜色分布找到嘴巴区域的大概位置，该区域用一矩形表示，在该区域中嘴唇所占的面积比例较大，把该区域内的彩色图像转换为灰度图像并分析灰度图像对应的直方图，由于嘴唇在嘴巴区域中占很大比例，分析该直方图，用对应像素点最多的灰度级对灰度图像进行二值化处理得到一二值图像，该二值图像中嘴唇对应的像素为白色，非嘴唇对应的位置为黑色，由于在该二值图像中也有一些非常小的区域被判定为嘴唇的区域，因此用两次腐蚀运算可以去除一些非嘴唇区域并得到少数几个备选嘴唇区域，因为嘴唇在嘴巴区域中占很大比例，所以在剩下的备选嘴唇区域中面积最大的区域即为真正的嘴唇区域，由于前面的腐蚀运算已经腐蚀掉真正的嘴唇区域的一些边界像素，为了提高定位精度还要进行两次与腐蚀运算对应的膨胀运算以恢复被腐蚀掉的像素，最后找到嘴唇区域最左边的像素点即为左嘴角点，嘴唇区域最右边的像素点极为右嘴角点。

由于现有技术只能给出嘴巴的大概位置，这就严重影响了后续工作，如人脸检测，人脸识别，表情识别的精度，而本发明所描述的技术能精确地给出嘴角的位置，这可以大大提高人脸识别，表情识别的精度。

附图说明

图1：找到的嘴巴的大概位置。

图2：嘴巴区域的直方图和嘴巴区域图像经过二值化处理后的二值图像。

图3：二值化后的图像和对二值图像进行两次腐蚀运算后得到的图像。

图4：对腐蚀后的图像进行连通区域分析并找到最大的连通区域。

图5：对最大的连通区域进行两次膨胀运算后的图像。

图6：左嘴角和右嘴角的定位。

具体实施方式

实施例

本实施例采用的人脸图像来自上海交通大学和复旦大学医学院共同拍摄的人脸图像库，实现过程如下：

(1)把原始图像转换到YCbCr空间并进行相应的处理，对图像中的每个像素计算Cr分量除以Cb分量的结果，记为Cr_div_Cb，同时计算Cr分量的平方，记为Cr_mul_Cr，对每个像素都进行这样的操作后得到了两个矩阵：Cr_div_Cb，Cr_mul_Cr，然后对该这两个矩阵进行归一化处理，即计算矩阵的最大值，然后矩阵中的每个元素都除以这个最大值，这样得到了两个归一化的矩阵，Cr-_div_Cb，Cr_mul_Cr。然后计算一个常数K，K＝0.95*mean(Cr_mul_Cr)/mean(Cr-_div_Cb)，其中mean表示求矩阵的平均值，然后初始化一个和人脸图像一样大小的矩阵，其中每个像素的灰度值赋值为为Cr_mul_Cr*(Cr_mul_Cr-k*Cr_div_Cb)^2，矩阵中每个元素都赋值后对这个矩阵进行归一化处理得到一个新的矩阵。在这个新的矩阵上利用模板匹配的方法找到使模板内平均灰度最大的位置即为嘴巴区域的大概位置，而且该嘴巴是在该模板内，且记嘴巴区域为MouthMap。如图1所示。

(2)分析由上一步得到的嘴巴区域的直方图并设定像素点最多的灰度级为阈值，用该阈值对嘴巴区域做二值化处理得到一个二致图像，直方图和二值图像如图2所示。

(3)对上一步得到的二值图像进行两次腐蚀运算。进行腐蚀运算是为了去除一些零星分布的小的区域，同时尽可能地把嘴巴区域和非嘴巴区域分开，腐蚀前和腐蚀后的图像如图3所示。

(4)对腐蚀后的图像进行连通区域分析并找到最大的连通区域使其灰度值为1而图像上其他区域里的像素的灰度值为0，因为嘴巴区域里最主要的是嘴唇区域，且其在嘴巴区域中占很大比例，因此最大的连通区域即为嘴唇对应的区域，嘴唇连通区域如图4所示。

(5)对最大的连通区域进行两次膨胀运算。进行膨胀运算是为了恢复在第3步中腐蚀掉的边缘像素。膨胀后图像如图5所示。

(6)对膨胀后的图像进行分析并找到左嘴角和右嘴角。找到经过膨胀运算后的二值图像中最左边的灰度值为1的像素点，该像素即为左嘴角点，同理找到二值图像中最右边的灰度值为1的像素点，该像素即为右嘴角点。如图6所示。

Claims

1.一种嘴角定位方法，其特征在于，根据嘴唇的颜色分布，首先获得嘴巴区域的大概位置，然后分析该区域的直方图并对该区域进行阈值化处理得到二值图像，接着对该二值图像进行两次腐蚀运算，并对腐蚀后的图像进行连通区域分析并找到最大的连通区域，然后对这个最大的连通区域进行两次膨胀运算，最后分析膨胀后得图像即可精确地定位出嘴角的位置。

2.根据权利要求1所述的嘴角定位方法，其特征是，具体步骤如下：

(1)把原始人脸图像从RGB空间转换到YCbCr空间并进行相应的处理，得到矩阵：Cr_div_Cb，Cr_mul_Cr，然后再对这两个矩阵进行归一化处理，再计算常数K，K＝0.95*mean(Cr_mul_Cr)/mean(Cr_div_Cb)，其中mean表示求矩阵的平均值，然后初始化一个和人脸图像一样大小的矩阵，矩阵中每个元素都赋值后，对这个矩阵进行归一化处理得到一个新的矩阵，在这个新的矩阵上利用模板匹配的方法，找到使模板内平均灰度最大的位置即为嘴巴区域的位置，而且该嘴巴是在该模板内，且记嘴巴区域为MouthMap；

(2)分析嘴巴区域的直方图找到对应的像素点最多的灰度级，并以该灰度级为阈值对嘴巴区域图像进行二值化处理得到一个二值图像；

(3)对上一步得到的二值图像进行两次腐蚀运算；

(4)对上一步腐蚀运算后的结果进行连通区域分析，并找到最大的连通区域；

(5)对上一步找到的最大的连通区域进行两次膨胀运算，以恢复在第3步中腐蚀掉的边界像素点；

3.根据权利要求2所述的嘴角定位方法，其特征是，所述的把原始人脸图像从RGB空间转换到YCbCr空间并进行相应的处理，其方法是：对图像中的每个像素计算Cr分量除以Cb分量的结果，记为Cr_div_Cb，同时计算Cr分量的平方，记为Cr_mul_Cr，对每个像素都进行这样的操作后得到了两个矩阵：Cr-_div_Cb，Cr_mul_Cr，然后对该这两个矩阵进行归一化处理，得到矩阵：Cr-_div_Cb，Cr_mul_Cr。

4.根据权利要求2所述的嘴角定位方法，其特征是，所述的归一化处理，是指：计算矩阵的最大值，然后矩阵中的每个元素都除以这个最大值。

5.根据权利要求2所述的嘴角定位方法，其特征是，所述的赋值，是指：每个像素的灰度值赋值为Cr_mul_Cr*(Cr_mul_Cr-k*Cr_div_Cb)^2。