CN103793720A - 一种眼睛定位方法和系统 - Google Patents

一种眼睛定位方法和系统 Download PDF

Info

Publication number
CN103793720A
CN103793720A CN201410049139.5A CN201410049139A CN103793720A CN 103793720 A CN103793720 A CN 103793720A CN 201410049139 A CN201410049139 A CN 201410049139A CN 103793720 A CN103793720 A CN 103793720A
Authority
CN
China
Prior art keywords
image
vector
position coordinate
face detected
eye position
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410049139.5A
Other languages
English (en)
Other versions
CN103793720B (zh
Inventor
刘晓春
赵元兴
王贤良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Haixinkejin High Sci & Tech Co Ltd Beijing
Original Assignee
Haixinkejin High Sci & Tech Co Ltd Beijing
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Haixinkejin High Sci & Tech Co Ltd Beijing filed Critical Haixinkejin High Sci & Tech Co Ltd Beijing
Priority to CN201410049139.5A priority Critical patent/CN103793720B/zh
Publication of CN103793720A publication Critical patent/CN103793720A/zh
Application granted granted Critical
Publication of CN103793720B publication Critical patent/CN103793720B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明提供了一种眼睛定位方法,该方法包括:对若干图像进行预处理后作为输入样本,对若干对眼睛位置坐标进行预处理后作为目标样本;利用所述输入样本和目标样本训练组合分类器;将待定位图像进行预处理后输入所述组合分类器得到与所述待定位图像对应的眼睛位置坐标。本发明能够实现眼睛的快速准确定位。

Description

一种眼睛定位方法和系统
技术领域
本发明涉及计算机技术领域,具体涉及一种眼睛定位方法和系统。
背景技术
眼睛定位技术主要应用于人脸识别、表情识别等相关领域,其主要目标为精确定位复杂背景中的眼睛位置,是衔接二维图像数据与更高层认知的核心环节。
目前,眼睛定位问题基本上都是基于学习的方法进行解决的,基于学习的方法主要通过提取特征,训练分类器模型的方式来进行眼睛定位,基于学习的方法可以很好地适应外界环境的复杂变化,是眼睛定位领域的主流方法。在基于学习的眼睛定位方法中,有很多相关的研究,其中效果比较好的一种眼睛定位方法是通过以下方式实现的:
该方法训练阶段分别训练左眼分类器、右眼分类器以及眼对分类器。定位阶段主要包括三步,首先通过输入图像的垂直投影确定眼睛可能出现的大概位置区域,然后在该区域中分别检测左眼和右眼,最后将左眼候选点和右眼候选点进行两两组合,输出置信度,选置信度最大的一对眼睛最为最终结果。
但是该方法在定位过程中多次涉及穷举搜索,包括穷举搜索候选区域查找眼睛位置和穷举搜索所有候选眼对,这大幅度提高了算法的定位时间,对于实时性要求比较高的应用场景,该算法存在一定的局限性。
发明内容
针对现有技术的不足,本发明提供一种眼睛定位方法和系统,能够实现眼睛的快速准确定位。
为实现上述目的,本发明通过以下技术方案予以实现:
一种眼睛定位方法,该方法包括:
对若干图像进行预处理后作为输入样本,对若干对眼睛位置坐标进行预处理后作为目标样本;
利用所述输入样本和目标样本训练组合分类器;
将待定位图像进行预处理后输入所述组合分类器得到与所述待定位图像对应的眼睛位置坐标。
较佳地,所述对若干图像进行预处理后作为输入样本包括:
对若干图像进行人脸检测,得到若干人脸检测图像;
对若干人脸检测图像进行归一化处理,使每幅图像的大小一致;
对归一化处理后的某幅人脸检测图像,将其图像灰度值逐行首尾拼接后转化为0均值单位方差的向量,得到特征向量xi,对其它幅人脸检测图像按照相同的方式进行处理,得到输入样本的特征向量集合X=(...xi...)。
较佳地,所述对若干对眼睛位置坐标进行预处理后作为目标样本包括:
对若干对眼睛位置坐标进行与所述人脸检测图像相同比例的归一化处理;
将原相对于整幅图像左上角的眼睛位置坐标转化为相对于归一化处理后的人脸检测图像左上角的眼睛位置坐标;
将某个转化后的眼睛位置坐标按照左眼横坐标、左眼纵坐标、右眼横坐标、右眼纵坐标的顺序存储为目标样本向量yi,将其它转化后的眼睛位置坐标按照相同的方式进行处理,得到目标样本的向量集合Y=(...yi...)。
较佳地,所述利用所述输入样本和目标样本训练组合分类器包括:
设置向量Vf[i],i=1,2,...,n,用来存放n个分类器的特征组;
其中,所述特征组由Lf个点对特征组成,每一个点对特征为{x[i1],x[i2],Tb},x为输入样本的特征向量,i1、i2分别为特征向量x中两维特征的下标,Tb为两维特征之差的阈值,每一个点对特征的特征值f按以下公式计算:
Figure BDA0000465476170000031
Lf个点对特征的特征值组成一个长度为Lf的二进制串,将长度为Lf的二进制串转化成十进制数后即可得到特征组的特征值,其取值范围为
Figure BDA0000465476170000032
Figure BDA0000465476170000033
个取值;
设置向量Vc[i],i=1,2,...,n,用来存放n个分类器的查找表;
其中,所述每个查找表为一矩阵,共
Figure BDA0000465476170000034
行5列,
Figure BDA0000465476170000035
行与所述特征组的特征值一一对应,5列依次存放左眼横坐标残差改变量、左眼纵坐标残差改变量、右眼横坐标残差改变量、左眼纵坐标残差改变量、置信度;
设置残差向量R0,用目标样本的向量集合Y=(...yi...)初始化残差向量R0={...ri...};
利用输入样本的特征向量xi与当前残差向量Ri训练组合分类器,直到残差向量Ri各元素绝对值之和低于预先设定的阈值Te,存储此时的向量Vf和Vc
较佳地,所述将待定位图像进行预处理后输入所述组合分类器得到与所述待定位图像对应的眼睛位置坐标包括:
将待定位图像进行人脸检测,得到人脸检测图像;
将得到的人脸检测图像归一化到设定的大小;
对归一化处理后的人脸检测图像,将其图像灰度值逐行首尾拼接后转化为0均值单位方差的向量,输入到训练好的组合分类器,组合分类器输出相对于归一化人脸检测图像的眼睛位置坐标以及对应输出结果的置信度;
将所述相对于归一化人脸检测图像的眼睛位置坐标变换为相对于待定位图像的眼睛位置坐标。
一种眼睛定位系统,该系统包括:
预处理模块,用于对若干图像进行预处理后作为输入样本,对若干对眼睛位置坐标进行预处理后作为目标样本;
组合分类器训练模块,用于利用所述输入样本和目标样本训练组合分类器;
定位模块,用于将待定位图像进行预处理后输入所述组合分类器得到与所述待定位图像对应的眼睛位置坐标。
较佳地,所述预处理模块包括输入样本预处理子单元和目标样本预处理子单元,其中,
输入样本预处理子单元,用于对若干图像进行人脸检测,得到若干人脸检测图像;
对若干人脸检测图像进行归一化处理,使每幅图像的大小一致;
对归一化处理后的某幅人脸检测图像,将其图像灰度值逐行首尾拼接后转化为0均值单位方差的向量,得到特征向量xi,对其它幅人脸检测图像按照相同的方式进行处理,得到输入样本的特征向量集合X=(...xi...);
目标样本预处理子单元,用于对若干对眼睛位置坐标进行与所述人脸检测图像相同比例的归一化处理;
将原相对于整幅图像左上角的眼睛位置坐标转化为相对于归一化处理后的人脸检测图像左上角的眼睛位置坐标;
将某个转化后的眼睛位置坐标按照左眼横坐标、左眼纵坐标、右眼横坐标、右眼纵坐标的顺序存储为目标样本向量yi,将其它转化后的眼睛位置坐标按照相同的方式进行处理,得到目标样本的向量集合Y=(...yi...)。
较佳地,所述组合分类器训练模块包括组合分类器特征组设置子单元、组合分类器查找表设置子单元、残差向量设置子单元和组合分类器训练子单元,其中,
组合分类器特征组设置子单元,用于设置向量Vf[i],i=1,2,...,n,用来存放n个分类器的特征组;
其中,所述特征组由Lf个点对特征组成,每一个点对特征为{x[i1],x[i2],Tb},x为输入样本的特征向量,i1、i2分别为特征向量x中两维特征的下标,Tb为两维特征之差的阈值,每一个点对特征的特征值f按以下公式计算:
Figure BDA0000465476170000051
Lf个点对特征的特征值组成一个长度为Lf的二进制串,将长度为Lf的二进制串转化成十进制数后即可得到特征组的特征值,其取值范围为
Figure BDA0000465476170000052
Figure BDA0000465476170000053
个取值;
组合分类器查找表设置子单元,用于设置向量Vc[i],i=1,2,...,n,用来存放n个分类器的查找表;
其中,所述每个查找表为一矩阵,共行5列,行与所述特征组的特征值一一对应,5列依次存放左眼横坐标残差改变量、左眼纵坐标残差改变量、右眼横坐标残差改变量、左眼纵坐标残差改变量、置信度;
残差向量设置子单元,用于设置残差向量R0,用目标样本的向量集合Y=(...yi...)初始化残差向量R0={...ri...};
组合分类器训练子单元,用于利用输入样本的特征向量xi与当前残差向量Ri训练组合分类器,直到残差向量Ri各元素绝对值之和低于预先设定的阈值Te,存储此时的向量Vf和Vc
较佳地,所述定位模块包括预处理子单元和眼睛定位子单元,其中,
预处理子单元,用于将待定位图像进行人脸检测,得到人脸检测图像;
将得到的人脸检测图像归一化到设定的大小;
对归一化处理后的人脸检测图像,将其图像灰度值逐行首尾拼接后转化为0均值单位方差的向量;
眼睛定位子单元,用于将预处理子单元输出的0均值单位方差的向量输入到训练好的组合分类器,组合分类器输出相对于归一化人脸检测图像的眼睛位置坐标以及对应输出结果的置信度;
将所述相对于归一化人脸检测图像的眼睛位置坐标变换为相对于待定位图像的眼睛位置坐标。
本发明至少具有如下的有益效果:
1、本发明直接利用原始图像和眼睛对位置坐标的关系进行眼睛定位,通过将若干图像作为输入样本,将若干对眼睛位置坐标作为目标样本,来训练组合分类器,最后将待定位的原始图像输入训练好的组合分类器中,从而可以直接得到该图像眼睛对的位置坐标,相对于现有技术,本发明不用先搜索眼睛的候选位置,再穷举搜索所有的候选点对,因此,本发明所述的方法定位时间较短,可以满足实时性的要求。
2、本发明直接利用人脸图像的灰度信息,只需要经过简单的向量规范化处理,不需要进行复杂的特征提取过程,从而可以降低整体的定位时间。
3、本发明通过查找表建立人脸灰度信息与眼睛位置坐标的关系,该方法的主要优势是整个定位过程完全通过减法操作,比较操作,平移操作和下标操作,因此计算复杂度大幅度降低。
4、在眼睛坐标空间进行聚类,为每一类分配唯一的标号,从而将无监督学习问题转化为有监督的学习问题,提高了纹理建模的针对性。
当然,实施本发明的任一方法或产品不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例1眼睛定位方法的流程图;
图2是本发明实施例2眼睛定位方法的流程图;
图3是本发明实施例2中输入样本和目标样本初始化流程图;
图4是本发明实施例2中分类器训练阶段的算法流程图;
图5是本发明实施例2中眼睛定位阶段的算法流程图;
图6是本发明实施例3眼睛定位系统的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
本发明实施例1提出了一种眼睛定位方法,参见图1,包括如下步骤:
步骤101:对若干图像进行预处理后作为输入样本,对若干对眼睛位置坐标进行预处理后作为目标样本。
步骤102:利用所述输入样本和目标样本训练组合分类器。
步骤103:将待定位图像进行预处理后输入所述组合分类器得到与所述待定位图像对应的眼睛位置坐标。
可见,在本发明实施例中,直接利用原始图像和眼睛对位置坐标的关系进行眼睛定位,通过将若干图像作为输入样本,将若干对眼睛位置坐标作为目标样本,来训练组合分类器,最后将待定位的原始图像输入训练好的组合分类器中,从而可以直接得到该图像眼睛对的位置坐标,相对于现有技术,本发明实施例不用先搜索眼睛的候选位置,再穷举搜索所有的候选点对,因此,本发明实施例所述的方法定位时间较短,可以满足实时性的要求。
实施例2
下面通过实施例2,来更为详细的说明本发明的一个较佳实现过程。参见图2、图3、图4和图5,该过程包括如下步骤:
步骤201:对若干原始图像进行预处理后作为输入样本。
在本步骤中,在对原始图像进行人脸检测之前,需要对原始图像进行初步的处理,主要目的是增加样本的变化种类,可参见图3所示。这里可以采用常用的图像处理方式对图像进行处理,具体包括:加噪、旋转、模糊等,为了模拟鱼眼镜头成像,还加入了径向畸变处理。各种变化以一定的概率随机作用于训练样本,既增加了样本的变化情况,也增加了样本的数量。
对处理后的图像进行人脸检测,得到若干人脸检测图像;
对若干人脸检测图像进行归一化处理,使每幅图像的大小一致,例如使图像归一化为64*64。
对归一化处理后的某幅人脸检测图像,将其图像灰度值逐行首尾拼接后转化为0均值单位方差的向量,得到特征向量xi,对其它幅人脸检测图像按照相同的方式进行处理,得到输入样本的特征向量集合X=(...xi...)。
步骤202:对若干对眼睛位置坐标进行预处理后作为目标样本。
在本步骤中,对若干对眼睛位置坐标进行与所述人脸检测图像相同比例的归一化处理;
将原相对于整幅图像左上角的眼睛位置坐标转化为相对于归一化处理后的人脸检测图像左上角的眼睛位置坐标;
将某个转化后的眼睛位置坐标按照左眼横坐标、左眼纵坐标、右眼横坐标、右眼纵坐标的顺序存储为目标样本向量yi,将其它转化后的眼睛位置坐标按照相同的方式进行处理,得到目标样本的向量集合Y=(...yi...)。
步骤203:利用所述输入样本和目标样本训练组合分类器。
在本步骤中,设置向量Vf[i],i=1,2,...,n,用来存放n个分类器的特征组;
其中,所述特征组由Lf个点对特征组成,每一个点对特征为{x[i1],x[i2],Tb},x为输入样本的特征向量,i1、i2分别为特征向量x中两维特征的下标,Tb为两维特征之差的阈值,每一个点对特征的特征值f按以下公式计算:
Figure BDA0000465476170000091
Lf个点对特征的特征值组成一个长度为Lf的二进制串,将长度为Lf的二进制串转化成十进制数后即可得到特征组的特征值,其取值范围为
Figure BDA0000465476170000092
Figure BDA0000465476170000093
个取值;
设置向量Vc[i],i=1,2,...,n,用来存放n个分类器的查找表;
其中,所述每个查找表为一矩阵,共
Figure BDA0000465476170000094
行5列,行与所述特征组的特征值一一对应,例如一个由五个点对特征组成的特征组,得到的二进制串为10110,转化为十进制数为22,其对应的查找表行即为第22行。其中依前4列依次存放左眼横坐标残差改变量、左眼纵坐标残差改变量、右眼横坐标残差改变量、左眼纵坐标残差改变量,最后一列存放训练集合中特征值为该行行号的样本的数目,用来计算置信度。
设置残差向量R0,用目标样本的向量集合Y=(...yi...)初始化残差向量R0={...ri...};
利用输入样本的特征向量xi与当前残差向量Ri训练组合分类器,直到残差向量Ri各元素绝对值之和低于预先设定的阈值Te,存储此时的向量Vf和Vc,该过程中利用机器学习方法建立输入特征向量X与当前残差Ri之间的关系模型,从而实现根据X推断Ri,详细如下:
a)对残差向量Ri在样本空间进行k均值聚类,k=1,2…,并计算每次聚类后的准则函数值
c = Σ c i = 1 k Σ i = 1 n c i | | r i - r c i | |
其中
Figure BDA0000465476170000102
为第ci类样本的个数,
Figure BDA0000465476170000103
为第ci类的样本的均值。准则函数会随着k的增大而减小,其变化趋势为首先大幅度减小,之后减小的速度逐渐放缓,这里取准则函数趋势开始放缓时得到的聚类数目kb为最优聚类数目。
b)采用ECOC方法训练组合分类器
i.给kb中的每一类随机分配标号0或1,将kb类问题转化为两类问题。
ii.构造原始特征x的差值特征。随机选择特征向量x的pn个位置的值,两两做差,得到有效特征共pn(pn-1)/2维。(两两做差共生成pn 2维特征,去除其中相同点之差为0的特征以及互为相反数的特征)
iii.ip=1……pn(pn-1)/2
●计算每个样本第ip个差值特征的特征值。
●计算样本在该特征值上的Gini不纯度i(N)。
i ( N ) = N 0 N 1 N 2
其中N0、N1为标号为0的样本和标号为1的样本的个数,N为样本总数。
●依次以每个样本的特征值为阈值,按照样本特征值相对于该阈值的大小将样本分到左右子节点,分别计算子节点的Gini不纯度。找到使不纯度改变量
Δi ( N ) = i ( N ) - N L N i ( N L ) - N R N i ( N R )
最大时的值即为该特征的不纯度改变量,这时的阈值即为该特征的阈值。式中NL是左节点样本数,NR是右节点样本数。
●生成一个点对特征。其阈值为不纯度改变量最大的差值特征对应的阈值,d1和d2为该差值特征对应的两维原始特征在特征向量x中的下标。
iv.重复过程ii~iii Lf次,得到Lf个点对特征组成的特征组。
c)建立一个上文所述的查找表,查找表中元素初始化为0。
d)构造查找表。查找表中第bn行前四位的输出
Figure BDA0000465476170000117
δS b n = s k × Σ i ∈ Ω b n ( r i ) | Ω b n |
其中,sk为正则化系数,用来防止过拟合的发生(本方法取0.1),
Figure BDA0000465476170000114
为特征值为bn的样本集合,为该样本集中元素的个数。第五位即为
e)更新残差。计算所有样本的特征,利用该特征值定位到查找表中对应的行。将样本残差与该行的前四位对应相减,得到样本新的残差值,最终得到新的残差矩阵Ri+1
f)重复a~e过程,直到训练集合残差Ri各个元素绝对值之和低于预先设定的阈值Te。存储Vc、Vf,结束处理。
步骤204:将待定位图像进行预处理后输入所述组合分类器得到与所述待定位图像对应的眼睛位置坐标。
在本步骤中,将待定位图像进行人脸检测,得到人脸检测图像;
将得到的人脸检测图像归一化到设定的大小;
对归一化处理后的人脸检测图像,将其图像灰度值逐行首尾拼接后转化为0均值单位方差的向量,输入到训练好的组合分类器,组合分类器输出相对于归一化人脸检测图像的眼睛位置坐标以及对应输出结果的置信度;
将所述相对于归一化人脸检测图像的眼睛位置坐标变换为相对于待定位图像的眼睛位置坐标。
本过程中对于新输入的人脸图像利用203训练得到的分类器输出眼睛位置,以及该位置的置信度,具体举例如下:
a).输入待定位图像,提取待定位图像中的人脸位置。
b).初始化5维数组yp,数组元素为0,将输入图像中的人脸图像规一化到规定大小,例如64×64,然后逐行进行首尾拼接并转化为0均值,单位方差,作为输入分类器的特征向量。
c).遍历所有分类器i=1....n
i.读取Vf[i]中的一组点对特征,计算该人脸图像通过该特征输出的二进制串并转化为十进制数bn
ii.查询Vc[i]查找表中第bn行,将该行元素与yp元素对应相加。
d).将yp中前四个元素由标准尺度反变换到原始图像尺度,再将相对于人脸左上角的坐标变化成相对于整幅图像左上角的坐标。
这时yp数组的前四个元素即为预测的两眼位置的横纵坐标(依次为左眼横坐标、左眼纵坐标、右眼横坐标、右眼纵坐标),最后一个元素即为该输出结果的置信度。
可见,在本发明实施中,直接利用原始图像和眼睛对位置坐标的关系进行眼睛定位,通过将若干图像作为输入样本,将若干对眼睛位置坐标作为目标样本,来训练组合分类器,最后将待定位的原始图像输入训练好的组合分类器中,从而可以直接得到该图像眼睛对的位置坐标,相对于现有技术,本实施例不用先搜索眼睛的候选位置,再穷举搜索所有的候选点对,因此,本实施例所述的方法定位时间较短,可以满足实时性的要求。
另外,本实施例直接利用人脸图像的灰度信息,只需要经过简单的向量规范化处理,不需要进行复杂的特征提取过程,从而可以降低整体的定位时间。
本实施例中,还通过查找表建立人脸灰度信息与眼睛位置坐标的关系,该方法的主要优势是整个定位过程完全通过减法操作,比较操作,平移操作和下标操作,因此计算复杂度大幅度降低。
本实施例中,在眼睛坐标空间进行聚类,为每一类分配唯一的标号,从而将无监督学习问题转化为有监督的学习问题,提高了纹理建模的针对性。
本实施例中,利用了ECOC(Error-Correcting output code)编码方式,得到点对特征最优阈值,以此来建立输入特征与当前残差的关系。
本实施例中,在定位阶段利用训练阶段样本落入每个查找表中各行的样本数之和作为置信度,评价最后输出结果的可靠性。
实施例3
本发明的实施例3还提出了一种眼睛定位系统,参见图6,该系统包括:
预处理模块601,用于对若干图像进行预处理后作为输入样本,对若干对眼睛位置坐标进行预处理后作为目标样本;
组合分类器训练模块602,用于利用所述输入样本和目标样本训练组合分类器;
定位模块603,用于将待定位图像进行预处理后输入所述组合分类器得到与所述待定位图像对应的眼睛位置坐标。
其中,所述预处理模块601包括输入样本预处理子单元6010和目标样本预处理子单元6011,其中,
输入样本预处理子单元6010,用于对若干图像进行人脸检测,得到若干人脸检测图像;
对若干人脸检测图像进行归一化处理,使每幅图像的大小一致;
对归一化处理后的某幅人脸检测图像,将其图像灰度值逐行首尾拼接后转化为0均值单位方差的向量,得到特征向量xi,对其它幅人脸检测图像按照相同的方式进行处理,得到输入样本的特征向量集合X=(...xi...);
目标样本预处理子单元6011,用于对若干对眼睛位置坐标进行与所述人脸检测图像相同比例的归一化处理;
将原相对于整幅图像左上角的眼睛位置坐标转化为相对于归一化处理后的人脸检测图像左上角的眼睛位置坐标;
将某个转化后的眼睛位置坐标按照左眼横坐标、左眼纵坐标、右眼横坐标、右眼纵坐标的顺序存储为目标样本向量yi,将其它转化后的眼睛位置坐标按照相同的方式进行处理,得到目标样本的向量集合Y=(...yi...)。
其中,所述组合分类器训练模块602包括组合分类器特征组设置子单元6020、组合分类器查找表设置子单元6021、残差向量设置子单元6022和组合分类器训练子单元6023,其中,
组合分类器特征组设置子单元6020,用于设置向量Vf[i],i=1,2,...,n,用来存放n个分类器的特征组;
其中,所述特征组由Lf个点对特征组成,每一个点对特征为{x[i1],x[i2],Tb},x为输入样本的特征向量,i1、i2分别为特征向量x中两维特征的下标,Tb为两维特征之差的阈值,每一个点对特征的特征值f按以下公式计算:
Figure BDA0000465476170000141
Lf个点对特征的特征值组成一个长度为Lf的二进制串,将长度为Lf的二进制串转化成十进制数后即可得到特征组的特征值,其取值范围为
Figure BDA0000465476170000151
Figure BDA0000465476170000152
个取值;
组合分类器查找表设置子单元6021,用于设置向量Vc[i],i=1,2,...,n,用来存放n个分类器的查找表;
其中,所述每个查找表为一矩阵,共
Figure BDA0000465476170000153
行5列,
Figure BDA0000465476170000154
行与所述特征组的
Figure BDA0000465476170000155
特征值一一对应,5列依次存放左眼横坐标残差改变量、左眼纵坐标残差改变量、右眼横坐标残差改变量、左眼纵坐标残差改变量、置信度;
残差向量设置子单元6022,用于设置残差向量R0,用目标样本的向量集合Y=(...yi...)初始化残差向量R0={...ri...};
组合分类器训练子单元6023,用于利用输入样本的特征向量xi与当前残差向量Ri训练组合分类器,直到残差向量Ri各元素绝对值之和低于预先设定的阈值Te,存储此时的向量Vf和Vc
其中,所述定位模块603包括预处理子单元6030和眼睛定位子单元6031,其中,
预处理子单元6030,用于将待定位图像进行人脸检测,得到人脸检测图像;
将得到的人脸检测图像归一化到设定的大小;
对归一化处理后的人脸检测图像,将其图像灰度值逐行首尾拼接后转化为0均值单位方差的向量;
眼睛定位子单元6031,用于将预处理子单元输出的0均值单位方差的向量输入到训练好的组合分类器,组合分类器输出相对于归一化人脸检测图像的眼睛位置坐标以及对应输出结果的置信度;
将所述相对于归一化人脸检测图像的眼睛位置坐标变换为相对于待定位图像的眼睛位置坐标。
以上实施例仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (9)

1.一种眼睛定位方法,其特征在于,该方法包括:
对若干图像进行预处理后作为输入样本,对若干对眼睛位置坐标进行预处理后作为目标样本;
利用所述输入样本和目标样本训练组合分类器;
将待定位图像进行预处理后输入所述组合分类器得到与所述待定位图像对应的眼睛位置坐标。
2.根据权利要求1所述的方法,其特征在于,所述对若干图像进行预处理后作为输入样本包括:
对若干图像进行人脸检测,得到若干人脸检测图像;
对若干人脸检测图像进行归一化处理,使每幅图像的大小一致;
对归一化处理后的某幅人脸检测图像,将其图像灰度值逐行首尾拼接后转化为0均值单位方差的向量,得到特征向量xi,对其它幅人脸检测图像按照相同的方式进行处理,得到输入样本的特征向量集合X=(...xi...)。
3.根据权利要求2所述的方法,其特征在于,所述对若干对眼睛位置坐标进行预处理后作为目标样本包括:
对若干对眼睛位置坐标进行与所述人脸检测图像相同比例的归一化处理;
将原相对于整幅图像左上角的眼睛位置坐标转化为相对于归一化处理后的人脸检测图像左上角的眼睛位置坐标;
将某个转化后的眼睛位置坐标按照左眼横坐标、左眼纵坐标、右眼横坐标、右眼纵坐标的顺序存储为目标样本向量yi,将其它转化后的眼睛位置坐标按照相同的方式进行处理,得到目标样本的向量集合Y=(...yi...)。
4.根据权利要求3所述的方法,其特征在于,所述利用所述输入样本和目标样本训练组合分类器包括:
设置向量Vf[i],i=1,2,...,n,用来存放n个分类器的特征组;
其中,所述特征组由Lf个点对特征组成,每一个点对特征为{x[i1],x[i2],Tb},x为输入样本的特征向量,i1、i2分别为特征向量x中两维特征的下标,Tb为两维特征之差的阈值,每一个点对特征的特征值f按以下公式计算:
Figure FDA0000465476160000021
Lf个点对特征的特征值组成一个长度为Lf的二进制串,将长度为Lf的二进制串转化成十进制数后即可得到特征组的特征值,其取值范围为
Figure FDA0000465476160000022
个取值;
设置向量Vc[i],i=1,2,...,n,用来存放n个分类器的查找表;
其中,所述每个查找表为一矩阵,共
Figure FDA0000465476160000024
行5列,
Figure FDA0000465476160000025
行与所述特征组的
Figure FDA0000465476160000026
特征值一一对应,5列依次存放左眼横坐标残差改变量、左眼纵坐标残差改变量、右眼横坐标残差改变量、左眼纵坐标残差改变量、置信度;
设置残差向量R0,用目标样本的向量集合Y=(...yi...)初始化残差向量R0={...ri...};
利用输入样本的特征向量xi与当前残差向量Ri训练组合分类器,直到残差向量Ri各元素绝对值之和低于预先设定的阈值Te,存储此时的向量Vf和Vc
5.根据权利要求4所述的方法,其特征在于,所述将待定位图像进行预处理后输入所述组合分类器得到与所述待定位图像对应的眼睛位置坐标包括:
将待定位图像进行人脸检测,得到人脸检测图像;
将得到的人脸检测图像归一化到设定的大小;
对归一化处理后的人脸检测图像,将其图像灰度值逐行首尾拼接后转化为0均值单位方差的向量,输入到训练好的组合分类器,组合分类器输出相对于归一化人脸检测图像的眼睛位置坐标以及对应输出结果的置信度;
将所述相对于归一化人脸检测图像的眼睛位置坐标变换为相对于待定位图像的眼睛位置坐标。
6.一种眼睛定位系统,其特征在于,该系统包括:
预处理模块,用于对若干图像进行预处理后作为输入样本,对若干对眼睛位置坐标进行预处理后作为目标样本;
组合分类器训练模块,用于利用所述输入样本和目标样本训练组合分类器;
定位模块,用于将待定位图像进行预处理后输入所述组合分类器得到与所述待定位图像对应的眼睛位置坐标。
7.根据权利要求6所述的系统,其特征在于,所述预处理模块包括输入样本预处理子单元和目标样本预处理子单元,其中,
输入样本预处理子单元,用于对若干图像进行人脸检测,得到若干人脸检测图像;
对若干人脸检测图像进行归一化处理,使每幅图像的大小一致;
对归一化处理后的某幅人脸检测图像,将其图像灰度值逐行首尾拼接后转化为0均值单位方差的向量,得到特征向量xi,对其它幅人脸检测图像按照相同的方式进行处理,得到输入样本的特征向量集合X=(...xi...);
目标样本预处理子单元,用于对若干对眼睛位置坐标进行与所述人脸检测图像相同比例的归一化处理;
将原相对于整幅图像左上角的眼睛位置坐标转化为相对于归一化处理后的人脸检测图像左上角的眼睛位置坐标;
将某个转化后的眼睛位置坐标按照左眼横坐标、左眼纵坐标、右眼横坐标、右眼纵坐标的顺序存储为目标样本向量yi,将其它转化后的眼睛位置坐标按照相同的方式进行处理,得到目标样本的向量集合Y=(...yi...)。
8.根据权利要求7所述的系统,其特征在于,所述组合分类器训练模块包括组合分类器特征组设置子单元、组合分类器查找表设置子单元、残差向量设置子单元和组合分类器训练子单元,其中,
组合分类器特征组设置子单元,用于设置向量Vf[i],i=1,2,...,n,用来存放n个分类器的特征组;
其中,所述特征组由Lf个点对特征组成,每一个点对特征为{x[i1],x[i2],Tb},x为输入样本的特征向量,i1、i2分别为特征向量x中两维特征的下标,Tb为两维特征之差的阈值,每一个点对特征的特征值f按以下公式计算:
Lf个点对特征的特征值组成一个长度为Lf的二进制串,将长度为Lf的二进制串转化成十进制数后即可得到特征组的特征值,其取值范围为
Figure FDA0000465476160000042
Figure FDA0000465476160000043
个取值;
组合分类器查找表设置子单元,用于设置向量Vc[i],i=1,2,...,n,用来存放n个分类器的查找表;
其中,所述每个查找表为一矩阵,共
Figure FDA0000465476160000044
行5列,
Figure FDA0000465476160000045
行与所述特征组的
Figure FDA0000465476160000046
特征值一一对应,5列依次存放左眼横坐标残差改变量、左眼纵坐标残差改变量、右眼横坐标残差改变量、左眼纵坐标残差改变量、置信度;
残差向量设置子单元,用于设置残差向量R0,用目标样本的向量集合Y=(...yi...)初始化残差向量R0={...ri...};
组合分类器训练子单元,用于利用输入样本的特征向量xi与当前残差向量Ri训练组合分类器,直到残差向量Ri各元素绝对值之和低于预先设定的阈值Te,存储此时的向量Vf和Vc
9.根据权利要求8所述的系统,其特征在于,所述定位模块包括预处理子单元和眼睛定位子单元,其中,
预处理子单元,用于将待定位图像进行人脸检测,得到人脸检测图像;
将得到的人脸检测图像归一化到设定的大小;
对归一化处理后的人脸检测图像,将其图像灰度值逐行首尾拼接后转化为0均值单位方差的向量;
眼睛定位子单元,用于将预处理子单元输出的0均值单位方差的向量输入到训练好的组合分类器,组合分类器输出相对于归一化人脸检测图像的眼睛位置坐标以及对应输出结果的置信度;
将所述相对于归一化人脸检测图像的眼睛位置坐标变换为相对于待定位图像的眼睛位置坐标。
CN201410049139.5A 2014-02-12 2014-02-12 一种眼睛定位方法和系统 Active CN103793720B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410049139.5A CN103793720B (zh) 2014-02-12 2014-02-12 一种眼睛定位方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410049139.5A CN103793720B (zh) 2014-02-12 2014-02-12 一种眼睛定位方法和系统

Publications (2)

Publication Number Publication Date
CN103793720A true CN103793720A (zh) 2014-05-14
CN103793720B CN103793720B (zh) 2017-05-31

Family

ID=50669362

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410049139.5A Active CN103793720B (zh) 2014-02-12 2014-02-12 一种眼睛定位方法和系统

Country Status (1)

Country Link
CN (1) CN103793720B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105844284A (zh) * 2015-01-16 2016-08-10 阿里巴巴集团控股有限公司 人脸特征点定位方法和装置
CN108615014A (zh) * 2018-04-27 2018-10-02 京东方科技集团股份有限公司 一种眼睛状态的检测方法、装置、设备和介质
CN109901716A (zh) * 2019-03-04 2019-06-18 厦门美图之家科技有限公司 视线点预测模型建立方法、装置及视线点预测方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100336071C (zh) * 2005-08-19 2007-09-05 清华大学 复杂背景图像中鲁棒的眼睛精确定位方法
CN101196985B (zh) * 2006-12-18 2011-06-01 北京海鑫科金高科技股份有限公司 一种用于复杂背景图像的眼睛定位方法
CN103093215B (zh) * 2013-02-01 2016-12-28 北京天诚盛业科技有限公司 人眼定位方法及装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
GANG PAN ET AL.: ""An eye detection system based on SVM filter"", 《PROC.SPIE4925,ELECTRONIC IMAGING AND MULTIMEDIA TECHNOLOGYⅢ》 *
孟萍: ""基于支持向量机的人眼定位方法研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑 》 *
胡涛等: ""基于支持向量机的人眼检测"", 《计算机工程与应用》 *
陈瑞等: ""基于 Ada Boost 算法的快速虹膜检测与定位"", 《清华大学学报(自然科学版)》 *
黄增喜等: ""一种快速的自动人眼定位方法"", 《计算机工程与应用》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105844284A (zh) * 2015-01-16 2016-08-10 阿里巴巴集团控股有限公司 人脸特征点定位方法和装置
CN105844284B (zh) * 2015-01-16 2019-07-09 阿里巴巴集团控股有限公司 人脸特征点定位方法和装置
CN108615014A (zh) * 2018-04-27 2018-10-02 京东方科技集团股份有限公司 一种眼睛状态的检测方法、装置、设备和介质
CN108615014B (zh) * 2018-04-27 2022-06-21 京东方科技集团股份有限公司 一种眼睛状态的检测方法、装置、设备和介质
CN109901716A (zh) * 2019-03-04 2019-06-18 厦门美图之家科技有限公司 视线点预测模型建立方法、装置及视线点预测方法
CN109901716B (zh) * 2019-03-04 2022-08-26 厦门美图之家科技有限公司 视线点预测模型建立方法、装置及视线点预测方法

Also Published As

Publication number Publication date
CN103793720B (zh) 2017-05-31

Similar Documents

Publication Publication Date Title
Chen et al. Progressively complementarity-aware fusion network for RGB-D salient object detection
CN111160440B (zh) 一种基于深度学习的安全帽佩戴检测方法及装置
CN109783666B (zh) 一种基于迭代精细化的图像场景图谱生成方法
CN106022363B (zh) 一种适用于自然场景下的中文文字识别方法
CN106570464A (zh) 一种快速处理人脸遮挡的人脸识别方法及装置
CN104463101A (zh) 用于文字性试题的答案识别方法及系统
CN105893968A (zh) 基于深度学习的文本无关的端到端的笔迹识别方法
Zhang et al. Efficient inductive vision transformer for oriented object detection in remote sensing imagery
CN110175248B (zh) 一种基于深度学习和哈希编码的人脸图像检索方法和装置
CN106991355A (zh) 基于拓扑保持的解析型字典学习模型的人脸识别方法
CN113449801B (zh) 一种基于多级图像上下文编解码的图像人物行为描述生成方法
CN112651940B (zh) 基于双编码器生成式对抗网络的协同视觉显著性检测方法
CN111401156A (zh) 基于Gabor卷积神经网络的图像识别方法
CN109670559A (zh) 手写汉字的识别方法、装置、设备和存储介质
CN105631469A (zh) 一种多层稀疏编码特征的鸟类图像识别方法
CN113762269A (zh) 基于神经网络的中文字符ocr识别方法、系统、介质及应用
CN114283285A (zh) 交叉一致性自训练遥感图像语义分割网络训练方法及装置
CN115690549A (zh) 一种基于并联交互架构模型实现多维度特征融合的目标检测方法
CN114550212A (zh) 一种基于轻量级模型的羊脸检测与识别方法
CN110111365B (zh) 基于深度学习的训练方法和装置以及目标跟踪方法和装置
Daihong et al. Facial expression recognition based on attention mechanism
CN117079098A (zh) 一种基于位置编码的空间小目标检测方法
Qin et al. PointSkelCNN: Deep Learning‐Based 3D Human Skeleton Extraction from Point Clouds
CN103793720A (zh) 一种眼睛定位方法和系统
Zheng Visual memory neural network for artistic graphic design

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant