CN103793720A

CN103793720A - 一种眼睛定位方法和系统

Info

Publication number: CN103793720A
Application number: CN201410049139.5A
Authority: CN
Inventors: 刘晓春; 赵元兴; 王贤良
Original assignee: Haixinkejin High Sci & Tech Co Ltd Beijing
Current assignee: Haixinkejin High Sci & Tech Co Ltd Beijing
Priority date: 2014-02-12
Filing date: 2014-02-12
Publication date: 2014-05-14
Anticipated expiration: 2034-02-12
Also published as: CN103793720B

Abstract

本发明提供了一种眼睛定位方法，该方法包括：对若干图像进行预处理后作为输入样本，对若干对眼睛位置坐标进行预处理后作为目标样本；利用所述输入样本和目标样本训练组合分类器；将待定位图像进行预处理后输入所述组合分类器得到与所述待定位图像对应的眼睛位置坐标。本发明能够实现眼睛的快速准确定位。

Description

一种眼睛定位方法和系统

技术领域

本发明涉及计算机技术领域，具体涉及一种眼睛定位方法和系统。

背景技术

眼睛定位技术主要应用于人脸识别、表情识别等相关领域，其主要目标为精确定位复杂背景中的眼睛位置，是衔接二维图像数据与更高层认知的核心环节。

目前，眼睛定位问题基本上都是基于学习的方法进行解决的，基于学习的方法主要通过提取特征，训练分类器模型的方式来进行眼睛定位，基于学习的方法可以很好地适应外界环境的复杂变化，是眼睛定位领域的主流方法。在基于学习的眼睛定位方法中，有很多相关的研究，其中效果比较好的一种眼睛定位方法是通过以下方式实现的：

该方法训练阶段分别训练左眼分类器、右眼分类器以及眼对分类器。定位阶段主要包括三步，首先通过输入图像的垂直投影确定眼睛可能出现的大概位置区域，然后在该区域中分别检测左眼和右眼，最后将左眼候选点和右眼候选点进行两两组合，输出置信度，选置信度最大的一对眼睛最为最终结果。

但是该方法在定位过程中多次涉及穷举搜索，包括穷举搜索候选区域查找眼睛位置和穷举搜索所有候选眼对，这大幅度提高了算法的定位时间，对于实时性要求比较高的应用场景，该算法存在一定的局限性。

发明内容

针对现有技术的不足，本发明提供一种眼睛定位方法和系统，能够实现眼睛的快速准确定位。

为实现上述目的，本发明通过以下技术方案予以实现：

一种眼睛定位方法，该方法包括：

对若干图像进行预处理后作为输入样本，对若干对眼睛位置坐标进行预处理后作为目标样本；

利用所述输入样本和目标样本训练组合分类器；

将待定位图像进行预处理后输入所述组合分类器得到与所述待定位图像对应的眼睛位置坐标。

较佳地，所述对若干图像进行预处理后作为输入样本包括：

对若干图像进行人脸检测，得到若干人脸检测图像；

对若干人脸检测图像进行归一化处理，使每幅图像的大小一致；

对归一化处理后的某幅人脸检测图像，将其图像灰度值逐行首尾拼接后转化为0均值单位方差的向量，得到特征向量x_i，对其它幅人脸检测图像按照相同的方式进行处理，得到输入样本的特征向量集合X＝(...x_i...)。

较佳地，所述对若干对眼睛位置坐标进行预处理后作为目标样本包括：

对若干对眼睛位置坐标进行与所述人脸检测图像相同比例的归一化处理；

将原相对于整幅图像左上角的眼睛位置坐标转化为相对于归一化处理后的人脸检测图像左上角的眼睛位置坐标；

将某个转化后的眼睛位置坐标按照左眼横坐标、左眼纵坐标、右眼横坐标、右眼纵坐标的顺序存储为目标样本向量y_i，将其它转化后的眼睛位置坐标按照相同的方式进行处理，得到目标样本的向量集合Y＝(...y_i...)。

较佳地，所述利用所述输入样本和目标样本训练组合分类器包括：

设置向量V_f[i]，i＝1,2,...,n，用来存放n个分类器的特征组；

其中，所述特征组由L_f个点对特征组成，每一个点对特征为{x[i₁],x[i₂],T_b}，x为输入样本的特征向量，i₁、i₂分别为特征向量x中两维特征的下标，T_b为两维特征之差的阈值，每一个点对特征的特征值f按以下公式计算：

L_f个点对特征的特征值组成一个长度为L_f的二进制串，将长度为L_f的二进制串转化成十进制数后即可得到特征组的特征值，其取值范围为

共

个取值；

设置向量V_c[i]，i＝1,2,...,n，用来存放n个分类器的查找表；

其中，所述每个查找表为一矩阵，共

行5列，

行与所述特征组的特征值一一对应，5列依次存放左眼横坐标残差改变量、左眼纵坐标残差改变量、右眼横坐标残差改变量、左眼纵坐标残差改变量、置信度；

设置残差向量R₀，用目标样本的向量集合Y＝(...y_i...)初始化残差向量R₀＝{...r_i...}；

利用输入样本的特征向量x_i与当前残差向量R_i训练组合分类器，直到残差向量R_i各元素绝对值之和低于预先设定的阈值T_e，存储此时的向量V_f和V_c。

较佳地，所述将待定位图像进行预处理后输入所述组合分类器得到与所述待定位图像对应的眼睛位置坐标包括：

将待定位图像进行人脸检测，得到人脸检测图像；

将得到的人脸检测图像归一化到设定的大小；

对归一化处理后的人脸检测图像，将其图像灰度值逐行首尾拼接后转化为0均值单位方差的向量，输入到训练好的组合分类器，组合分类器输出相对于归一化人脸检测图像的眼睛位置坐标以及对应输出结果的置信度；

将所述相对于归一化人脸检测图像的眼睛位置坐标变换为相对于待定位图像的眼睛位置坐标。

一种眼睛定位系统，该系统包括：

预处理模块，用于对若干图像进行预处理后作为输入样本，对若干对眼睛位置坐标进行预处理后作为目标样本；

组合分类器训练模块，用于利用所述输入样本和目标样本训练组合分类器；

定位模块，用于将待定位图像进行预处理后输入所述组合分类器得到与所述待定位图像对应的眼睛位置坐标。

较佳地，所述预处理模块包括输入样本预处理子单元和目标样本预处理子单元，其中，

输入样本预处理子单元，用于对若干图像进行人脸检测，得到若干人脸检测图像；

对归一化处理后的某幅人脸检测图像，将其图像灰度值逐行首尾拼接后转化为0均值单位方差的向量，得到特征向量x_i，对其它幅人脸检测图像按照相同的方式进行处理，得到输入样本的特征向量集合X＝(...x_i...)；

目标样本预处理子单元，用于对若干对眼睛位置坐标进行与所述人脸检测图像相同比例的归一化处理；

较佳地，所述组合分类器训练模块包括组合分类器特征组设置子单元、组合分类器查找表设置子单元、残差向量设置子单元和组合分类器训练子单元，其中，

组合分类器特征组设置子单元，用于设置向量V_f[i]，i＝1,2,...,n，用来存放n个分类器的特征组；

共

个取值；

组合分类器查找表设置子单元，用于设置向量V_c[i]，i＝1,2,...,n，用来存放n个分类器的查找表；

其中，所述每个查找表为一矩阵，共行5列，行与所述特征组的特征值一一对应，5列依次存放左眼横坐标残差改变量、左眼纵坐标残差改变量、右眼横坐标残差改变量、左眼纵坐标残差改变量、置信度；

残差向量设置子单元，用于设置残差向量R₀，用目标样本的向量集合Y＝(...y_i...)初始化残差向量R₀＝{...r_i...}；

组合分类器训练子单元，用于利用输入样本的特征向量x_i与当前残差向量R_i训练组合分类器，直到残差向量R_i各元素绝对值之和低于预先设定的阈值T_e，存储此时的向量V_f和V_c。

较佳地，所述定位模块包括预处理子单元和眼睛定位子单元，其中，

预处理子单元，用于将待定位图像进行人脸检测，得到人脸检测图像；

将得到的人脸检测图像归一化到设定的大小；

对归一化处理后的人脸检测图像，将其图像灰度值逐行首尾拼接后转化为0均值单位方差的向量；

眼睛定位子单元，用于将预处理子单元输出的0均值单位方差的向量输入到训练好的组合分类器，组合分类器输出相对于归一化人脸检测图像的眼睛位置坐标以及对应输出结果的置信度；

本发明至少具有如下的有益效果：

1、本发明直接利用原始图像和眼睛对位置坐标的关系进行眼睛定位，通过将若干图像作为输入样本，将若干对眼睛位置坐标作为目标样本，来训练组合分类器，最后将待定位的原始图像输入训练好的组合分类器中，从而可以直接得到该图像眼睛对的位置坐标，相对于现有技术，本发明不用先搜索眼睛的候选位置，再穷举搜索所有的候选点对，因此，本发明所述的方法定位时间较短，可以满足实时性的要求。

2、本发明直接利用人脸图像的灰度信息，只需要经过简单的向量规范化处理，不需要进行复杂的特征提取过程，从而可以降低整体的定位时间。

3、本发明通过查找表建立人脸灰度信息与眼睛位置坐标的关系，该方法的主要优势是整个定位过程完全通过减法操作，比较操作，平移操作和下标操作，因此计算复杂度大幅度降低。

4、在眼睛坐标空间进行聚类，为每一类分配唯一的标号，从而将无监督学习问题转化为有监督的学习问题，提高了纹理建模的针对性。

当然，实施本发明的任一方法或产品不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例1眼睛定位方法的流程图；

图2是本发明实施例2眼睛定位方法的流程图；

图3是本发明实施例2中输入样本和目标样本初始化流程图；

图4是本发明实施例2中分类器训练阶段的算法流程图；

图5是本发明实施例2中眼睛定位阶段的算法流程图；

图6是本发明实施例3眼睛定位系统的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整的描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1

本发明实施例1提出了一种眼睛定位方法，参见图1，包括如下步骤：

步骤101：对若干图像进行预处理后作为输入样本，对若干对眼睛位置坐标进行预处理后作为目标样本。

步骤102：利用所述输入样本和目标样本训练组合分类器。

步骤103：将待定位图像进行预处理后输入所述组合分类器得到与所述待定位图像对应的眼睛位置坐标。

可见，在本发明实施例中，直接利用原始图像和眼睛对位置坐标的关系进行眼睛定位，通过将若干图像作为输入样本，将若干对眼睛位置坐标作为目标样本，来训练组合分类器，最后将待定位的原始图像输入训练好的组合分类器中，从而可以直接得到该图像眼睛对的位置坐标，相对于现有技术，本发明实施例不用先搜索眼睛的候选位置，再穷举搜索所有的候选点对，因此，本发明实施例所述的方法定位时间较短，可以满足实时性的要求。

实施例2

下面通过实施例2，来更为详细的说明本发明的一个较佳实现过程。参见图2、图3、图4和图5，该过程包括如下步骤：

步骤201：对若干原始图像进行预处理后作为输入样本。

在本步骤中，在对原始图像进行人脸检测之前，需要对原始图像进行初步的处理，主要目的是增加样本的变化种类，可参见图3所示。这里可以采用常用的图像处理方式对图像进行处理，具体包括：加噪、旋转、模糊等，为了模拟鱼眼镜头成像，还加入了径向畸变处理。各种变化以一定的概率随机作用于训练样本，既增加了样本的变化情况，也增加了样本的数量。

对处理后的图像进行人脸检测，得到若干人脸检测图像；

对若干人脸检测图像进行归一化处理，使每幅图像的大小一致，例如使图像归一化为64*64。

步骤202：对若干对眼睛位置坐标进行预处理后作为目标样本。

在本步骤中，对若干对眼睛位置坐标进行与所述人脸检测图像相同比例的归一化处理；

步骤203：利用所述输入样本和目标样本训练组合分类器。

在本步骤中，设置向量V_f[i]，i＝1,2,...,n，用来存放n个分类器的特征组；

共

个取值；

设置向量V_c[i]，i＝1,2,...,n，用来存放n个分类器的查找表；

其中，所述每个查找表为一矩阵，共

行5列，行与所述特征组的特征值一一对应，例如一个由五个点对特征组成的特征组，得到的二进制串为10110，转化为十进制数为22，其对应的查找表行即为第22行。其中依前4列依次存放左眼横坐标残差改变量、左眼纵坐标残差改变量、右眼横坐标残差改变量、左眼纵坐标残差改变量，最后一列存放训练集合中特征值为该行行号的样本的数目，用来计算置信度。

利用输入样本的特征向量x_i与当前残差向量R_i训练组合分类器，直到残差向量R_i各元素绝对值之和低于预先设定的阈值T_e，存储此时的向量V_f和V_c，该过程中利用机器学习方法建立输入特征向量X与当前残差R_i之间的关系模型，从而实现根据X推断R_i，详细如下：

a）对残差向量R_i在样本空间进行k均值聚类，k=1,2…，并计算每次聚类后的准则函数值

c = Σ_{c_{i} = 1}^{k} Σ_{i = 1}^{n_{c_{i}}} | | r_{i} - r_{c_{i}} | |

其中

为第c_i类样本的个数，

为第c_i类的样本的均值。准则函数会随着k的增大而减小，其变化趋势为首先大幅度减小，之后减小的速度逐渐放缓，这里取准则函数趋势开始放缓时得到的聚类数目k_b为最优聚类数目。

b)采用ECOC方法训练组合分类器

i.给k_b中的每一类随机分配标号0或1，将k_b类问题转化为两类问题。

ii.构造原始特征x的差值特征。随机选择特征向量x的p_n个位置的值，两两做差，得到有效特征共p_n(p_n-1)/2维。（两两做差共生成p_n ²维特征，去除其中相同点之差为0的特征以及互为相反数的特征）

iii.i_p=1……p_n(p_n-1)/2

●计算每个样本第i_p个差值特征的特征值。

●计算样本在该特征值上的Gini不纯度i(N)。

i (N) = \frac{N_{0} N_{1}}{N^{2}}

其中N₀、N₁为标号为0的样本和标号为1的样本的个数，N为样本总数。

●依次以每个样本的特征值为阈值，按照样本特征值相对于该阈值的大小将样本分到左右子节点，分别计算子节点的Gini不纯度。找到使不纯度改变量

Δi (N) = i (N) - \frac{N_{L}}{N} i (N_{L}) - \frac{N_{R}}{N} i (N_{R})

最大时的值即为该特征的不纯度改变量，这时的阈值即为该特征的阈值。式中N_L是左节点样本数，N_R是右节点样本数。

●生成一个点对特征。其阈值为不纯度改变量最大的差值特征对应的阈值，d1和d2为该差值特征对应的两维原始特征在特征向量x中的下标。

iv.重复过程ii～iii L_f次，得到L_f个点对特征组成的特征组。

c)建立一个上文所述的查找表，查找表中元素初始化为0。

d)构造查找表。查找表中第b_n行前四位的输出

为

{δS}_{b_{n}} = s_{k} \times \frac{Σ_{{i &Element; Ω}_{b_{n}}} (r_{i})}{| Ω_{b_{n}} |}

其中，s_k为正则化系数，用来防止过拟合的发生（本方法取0.1），

为特征值为b_n的样本集合，为该样本集中元素的个数。第五位即为

e)更新残差。计算所有样本的特征，利用该特征值定位到查找表中对应的行。将样本残差与该行的前四位对应相减，得到样本新的残差值，最终得到新的残差矩阵R_i+1。

f)重复a～e过程，直到训练集合残差R_i各个元素绝对值之和低于预先设定的阈值T_e。存储V_c、V_f，结束处理。

步骤204：将待定位图像进行预处理后输入所述组合分类器得到与所述待定位图像对应的眼睛位置坐标。

在本步骤中，将待定位图像进行人脸检测，得到人脸检测图像；

将得到的人脸检测图像归一化到设定的大小；

本过程中对于新输入的人脸图像利用203训练得到的分类器输出眼睛位置，以及该位置的置信度，具体举例如下：

a).输入待定位图像，提取待定位图像中的人脸位置。

b).初始化5维数组y_p，数组元素为0，将输入图像中的人脸图像规一化到规定大小，例如64×64，然后逐行进行首尾拼接并转化为0均值，单位方差，作为输入分类器的特征向量。

c).遍历所有分类器i=1....n

i.读取V_f[i]中的一组点对特征，计算该人脸图像通过该特征输出的二进制串并转化为十进制数b_n。

ii.查询V_c[i]查找表中第b_n行，将该行元素与y_p元素对应相加。

d).将y_p中前四个元素由标准尺度反变换到原始图像尺度，再将相对于人脸左上角的坐标变化成相对于整幅图像左上角的坐标。

这时y_p数组的前四个元素即为预测的两眼位置的横纵坐标（依次为左眼横坐标、左眼纵坐标、右眼横坐标、右眼纵坐标），最后一个元素即为该输出结果的置信度。

可见，在本发明实施中，直接利用原始图像和眼睛对位置坐标的关系进行眼睛定位，通过将若干图像作为输入样本，将若干对眼睛位置坐标作为目标样本，来训练组合分类器，最后将待定位的原始图像输入训练好的组合分类器中，从而可以直接得到该图像眼睛对的位置坐标，相对于现有技术，本实施例不用先搜索眼睛的候选位置，再穷举搜索所有的候选点对，因此，本实施例所述的方法定位时间较短，可以满足实时性的要求。

另外，本实施例直接利用人脸图像的灰度信息，只需要经过简单的向量规范化处理，不需要进行复杂的特征提取过程，从而可以降低整体的定位时间。

本实施例中，还通过查找表建立人脸灰度信息与眼睛位置坐标的关系，该方法的主要优势是整个定位过程完全通过减法操作，比较操作，平移操作和下标操作，因此计算复杂度大幅度降低。

本实施例中，在眼睛坐标空间进行聚类，为每一类分配唯一的标号，从而将无监督学习问题转化为有监督的学习问题，提高了纹理建模的针对性。

本实施例中，利用了ECOC（Error-Correcting output code）编码方式，得到点对特征最优阈值，以此来建立输入特征与当前残差的关系。

本实施例中，在定位阶段利用训练阶段样本落入每个查找表中各行的样本数之和作为置信度，评价最后输出结果的可靠性。

实施例3

本发明的实施例3还提出了一种眼睛定位系统，参见图6，该系统包括：

预处理模块601，用于对若干图像进行预处理后作为输入样本，对若干对眼睛位置坐标进行预处理后作为目标样本；

组合分类器训练模块602，用于利用所述输入样本和目标样本训练组合分类器；

定位模块603，用于将待定位图像进行预处理后输入所述组合分类器得到与所述待定位图像对应的眼睛位置坐标。

其中，所述预处理模块601包括输入样本预处理子单元6010和目标样本预处理子单元6011，其中，

输入样本预处理子单元6010，用于对若干图像进行人脸检测，得到若干人脸检测图像；

目标样本预处理子单元6011，用于对若干对眼睛位置坐标进行与所述人脸检测图像相同比例的归一化处理；

其中，所述组合分类器训练模块602包括组合分类器特征组设置子单元6020、组合分类器查找表设置子单元6021、残差向量设置子单元6022和组合分类器训练子单元6023，其中，

组合分类器特征组设置子单元6020，用于设置向量V_f[i]，i＝1,2,...,n，用来存放n个分类器的特征组；

共

个取值；

组合分类器查找表设置子单元6021，用于设置向量V_c[i]，i＝1,2,...,n，用来存放n个分类器的查找表；

其中，所述每个查找表为一矩阵，共

行5列，

行与所述特征组的

特征值一一对应，5列依次存放左眼横坐标残差改变量、左眼纵坐标残差改变量、右眼横坐标残差改变量、左眼纵坐标残差改变量、置信度；

残差向量设置子单元6022，用于设置残差向量R₀，用目标样本的向量集合Y＝(...y_i...)初始化残差向量R₀＝{...r_i...}；

组合分类器训练子单元6023，用于利用输入样本的特征向量x_i与当前残差向量R_i训练组合分类器，直到残差向量R_i各元素绝对值之和低于预先设定的阈值T_e，存储此时的向量V_f和V_c。

其中，所述定位模块603包括预处理子单元6030和眼睛定位子单元6031，其中，

预处理子单元6030，用于将待定位图像进行人脸检测，得到人脸检测图像；

将得到的人脸检测图像归一化到设定的大小；

眼睛定位子单元6031，用于将预处理子单元输出的0均值单位方差的向量输入到训练好的组合分类器，组合分类器输出相对于归一化人脸检测图像的眼睛位置坐标以及对应输出结果的置信度；

以上实施例仅用于说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种眼睛定位方法，其特征在于，该方法包括：

利用所述输入样本和目标样本训练组合分类器；

2.根据权利要求1所述的方法，其特征在于，所述对若干图像进行预处理后作为输入样本包括：

对若干图像进行人脸检测，得到若干人脸检测图像；

3.根据权利要求2所述的方法，其特征在于，所述对若干对眼睛位置坐标进行预处理后作为目标样本包括：

4.根据权利要求3所述的方法，其特征在于，所述利用所述输入样本和目标样本训练组合分类器包括：

设置向量V_f[i]，i＝1,2,...,n，用来存放n个分类器的特征组；

共个取值；

设置向量V_c[i]，i＝1,2,...,n，用来存放n个分类器的查找表；

其中，所述每个查找表为一矩阵，共

行5列，

行与所述特征组的

5.根据权利要求4所述的方法，其特征在于，所述将待定位图像进行预处理后输入所述组合分类器得到与所述待定位图像对应的眼睛位置坐标包括：

将待定位图像进行人脸检测，得到人脸检测图像；

将得到的人脸检测图像归一化到设定的大小；

6.一种眼睛定位系统，其特征在于，该系统包括：

7.根据权利要求6所述的系统，其特征在于，所述预处理模块包括输入样本预处理子单元和目标样本预处理子单元，其中，

8.根据权利要求7所述的系统，其特征在于，所述组合分类器训练模块包括组合分类器特征组设置子单元、组合分类器查找表设置子单元、残差向量设置子单元和组合分类器训练子单元，其中，

共

个取值；

其中，所述每个查找表为一矩阵，共

行5列，

行与所述特征组的

9.根据权利要求8所述的系统，其特征在于，所述定位模块包括预处理子单元和眼睛定位子单元，其中，

将得到的人脸检测图像归一化到设定的大小；