CN102194110B - 基于k-l变换和核相关系数的人脸图像中眼睛定位方法 - Google Patents
基于k-l变换和核相关系数的人脸图像中眼睛定位方法 Download PDFInfo
- Publication number
- CN102194110B CN102194110B CN 201110155309 CN201110155309A CN102194110B CN 102194110 B CN102194110 B CN 102194110B CN 201110155309 CN201110155309 CN 201110155309 CN 201110155309 A CN201110155309 A CN 201110155309A CN 102194110 B CN102194110 B CN 102194110B
- Authority
- CN
- China
- Prior art keywords
- eye
- vector
- template
- eyes
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明涉及一种人脸图像中眼睛定位的方法,它包括以下步骤:首先构建眼睛模板库,生成训练矩阵;对训练矩阵进行K-L变换,获取基向量和特征值,并选取主要基向量,将每个眼睛训练样本投影到主要基向量上,得到投影系数向量;以投影系数向量作为模板,以核相关系数进行匹配程度的度量,在人脸图像中进行左眼和右眼的模板匹配;最后,最大核相关系数的位置,确定为眼睛位置。本发明通过K-L变换,将眼睛训练样本在基向量上的投影系数作为匹配模板,具有更好的泛化能力。本发明通过核相关系数来度量被测对象和模板的匹配程度,其匹配的精度更高,且目标的显著度更高。
Description
技术领域
本发明涉及图像处理和模式识别技术,特别是一种能够对人脸图像中眼睛进行定位的基于K-L变换和核相关系数的人脸图像中眼睛定位方法。
背景技术
眼睛定位技术可以应用到疲劳驾驶检测、医学检查、视频会议和视觉制导等军民两用领域中。且该技术的应用所体现出的经济价值和社会价值越来显著,比如疲劳驾驶检测,可以大大降低恶性交通事故的发生率;视觉制导系统,可以提高武器系统的效能。目前,定位人眼的方法大致可以分为三种:基于图像分割技术、基于模式识别技术和基于模板匹配技术的人眼定位方法。基于图像分割的定位方法有Ostu法(最大类间方差法)和最大熵分割法等;基于模式识别技术的方法有人工神经网络定位法、特征眼法和SVM(支持向量机)定位法等;基于模板匹配技术的方法最常用的是相关系数法。模板匹配法是较为简单有效的一种定位方法,它需要解决两个问题,首先需要确定一个较为可靠的模板,其次要有一种度量匹配程度的方法。利用传统的模板匹配法定位人眼,直接使用人眼图像作为模板(灰度模板),将相关系数用作匹配程度的度量。这种检测方法会面临两个问题,模板的选择比较困难,一个人的眼睛模板(图像)只能与同一个人的眼睛进行匹配,检测其他人眼睛的效果差,泛化能力较弱,且对光照、噪声等影响因素较为敏感;此外,传统的相关系数是两个向量的线性相关,而图像具有较强的非线性和非高斯性,用线性相关系数度量匹配程度,效果不能令人满意。
发明内容
本发明所要解决的技术问题是针对现有技术中模板匹配在人眼定位中存在的不足,提供一种具有更高的准确性的基于K-L变换和核相关系数的眼睛定位方法。
为实现上述目的,本发明提出一种新的相关方法——核相关系数法,来度量匹配程度。核相关系数来自于核方法(Kernel method)的启发,在核方法中(K.-R. Muller, S. Mika, G. Ratsch, K. Tsuda, and B. Scholkopf, “An Introduction to Kernel-Based Learning Algorithms,” IEEE Transaction on Neural Networks, vol. 12, no. 2, pp. 181-201, 2001.),向量X、Y通过函数 被映射到高维特征空间,成为高维特征向量和,而在高维特征空间中的内积可以用核函数来计算,其中最常用的核函数是高斯核函数, 为可调参数。传统的相关系数法,计算向量、Y的线性相关系数的公式为:,将、Y通过映射函数映射到高维特征空间后,在高维特征空间中的向量和的相关系数为:
本发明所要解决的技术问题是通过以下的技术方案为实现的。本发明是一种基于K-L变换和核相关系数的人脸图像中眼睛定位方法,其特点是:首先采集人脸正面图像,建立人脸图像库,从人脸图像中截取眼睛图像,建立人眼模板库,并将人眼模板转化为向量;然后,构建人眼训练矩阵,并进行K-L变换,获得主要基向量,将各人眼模板向量投影到主要基向量,得到每个人眼模板相应的投影系数向量;接着,在视场中获取人脸正面图像,并将人脸图像以中轴线为界分为左脸图像和右脸图像两部分,在右脸图像中进行右眼定位,在左脸图像中进行左眼定位;最后,给出右眼和左眼在图像中的位置坐标。
本发明所述的K-L变换可参见:边肇祺,张学工等. “模式识别(第二版)”清华大学出版社, 224-227, 2001。
所述建立人眼模板库,即从人脸图像库中的图像,截取眼睛图像,为了便于更多的保留眼睛的特征,截取的眼睛图像中应包括眉毛、上眼睑、下眼睑和眼角,按左、右眼归类,并归一化为相同的分辨率(设分辨率为),构建含有n个左眼图像和n个右眼图像的眼睛模板库。
所述构建人脸训练矩阵,即将左、右眼训练模板的向量作为行,分别构造左、右眼训练矩阵。
所述获得主要基向量,是指对生成的眼睛训练矩阵进行K-L变换,得到左、右眼训练矩阵的基向量和相应的特征值(按文献:边肇祺,张学工等. “模式识别(第二版)”清华大学出版社, 224-227, 2001),并将基向量按相应的特征值从大到小排列;从基向量中,取前、个基向量分别作为左眼和右眼的主要基向量,其对应的特征值之和大于所有特征值之和的98%,这些主要基向量包含了描述人眼的大部分信息。
所述在右脸图像中进行右眼定位,是以高为h、宽为w的滑动窗口,在每一个像素位置上剪切子图像,为像素坐标;将子图像转换为维向量,并将其投影到右眼个主要基向量,得到维投影系数向量;由核相关系数法得到子图像与右眼模板的匹配程度,向量和的核相关系数为:,取为像素处的匹配值;右眼的中心位置用下式确定:。
所述在左脸图像中进行左眼定位。首先确定左眼的搜索区域,为减小计算量,利用左、右眼的对称性缩小搜索范围,只在左脸图像的右眼对称位置的邻域内搜索左眼,该邻域确定为以(,)和(,W)为顶点的矩形区域(符号,表示向上取整);然后,在该区域内用与右眼定位相同的方法进行左眼定位:先求各左眼模板的核相关系数:,取为像素处的匹配值;左眼的中心位置用下式确定:。
本发明与已有技术相比具有如下优点:
1、 本发明通过K-L变换,将眼睛训练样本在基向量上的投影系数作为匹配模板,与直接将眼睛图像作为模板相比,具有更好的泛化能力。
2、 本发明通过核相关系数来度量被测对象和模板的匹配程度,与传统的相关系数相比,匹配的精度更高,目标的显著度更高。
附图说明
图1为本发明图像中的坐标约定。
图2为本发明训练阶段的流程框图。
图3为本发明定位阶段的流程框图。
图4-11为本发明的实际效果图。其中:图4、图8为实验人脸图像;图5、图9分别为图4、图8以核相关系数值为像素灰度值的图像;图6、图10为图5、图9的三维图像;图7、图11分别为图4、图8中人眼定位结果。
具体实施方式
下面结合附图和具体实施例对本发明进行详细描述,以便于本领域的技术人员进一步地理解本发明。需要强调的是,以下实施例仅是本发明的一种优选实施方式而已,对于本技术领域的技术人员来说,在不脱离本发明的核心思想和基本原理的前提下,可以进行改进和修改,或者利用本发明的主要方法、核心思想和基本原理解决其它领域的技术问题,都应视为本发明的保护范围。
实施例1,一种基于K-L变换和核相关系数的人脸图像中眼睛定位方法,首先构建眼睛模板库,生成训练矩阵;对训练矩阵进行K-L变换,获取基向量和特征值,并选取主要基向量,将每个眼睛训练样本投影到主要基向量上,获得眼睛样本的投影系数向量;以投影系数向量作为模板,以核相关系数作为匹配程度的度量,在人脸图像中进行左眼和右眼的模板匹配;最后,最大核相关系数的位置,确定为眼睛位置。
实施例2,参照图2-3,实施例1所述的人脸图像中眼睛定位的方法中:
构建眼睛模板库的具体步骤如下:
(2)建立眼睛模板库;从人脸样本图像中,截取眼睛图像,为了便于更多的保留眼睛的特征,截取的眼睛图像中应包括眉毛、上眼睑、下眼睑和眼角,按左、右眼归类,并统一为相同的分辨率,构建含有n个左眼图像和n个右眼图像的眼睛模板库。
生成训练矩阵的具体步骤如下:
对训练矩阵进行K-L变换,获取基向量和特征值,其具体步骤是:对生成的左眼、右眼训练矩阵,分别进行K-L变换,得到左、右眼训练矩阵的基向量和特征值,并将基向量按相应的特征值从大到小排列。
在人脸图像中进行左眼和右眼的模板匹配,具体步骤为:
(1)获取人脸正面图像,将图像以中轴线为界,分为左脸图像和右脸图像两部分,左脸图像包含左眼,右脸图像包含右眼;
(5)右眼的位置用下式确定:;
(6)确定左眼的搜索区域。为减小计算量,在确定右眼中心位置后,利用左、右眼的对称性缩小搜索范围,只在左脸图像的右眼对称位置的邻域内搜索目标,该邻域为以(,)和(,W)为顶点的矩形区域,该区域为左眼的搜索区域;
(7)以高为h、宽为w的滑动窗口,在左眼的搜索区域每一个像素位置上剪切子图像;
实施例3,参照图1-11,基于K-L变换和核相关系数的人脸图像中眼睛定位方法实验及其结果。
主要包括三个阶段:
第一阶段为训练阶段,通过眼睛训练样本,得到K-L变换的主要基向量和各训练样本的投影系数向量;
第二阶段为右眼定位阶段,利用眼睛模板投影系数向量和被测图像投影系数向量的核相关系数,对右眼进行定位;
第三阶段为左眼定位阶段,利用双眼的对称性缩小搜索区、减小计算量,然后用与右眼定位相同的方法进行左眼定位。
眼睛定位方法包括以下步骤:
训练阶段:
步骤S101,建立人脸图像库。创建人脸样本库,对不同的人,在不同光照条件、不同表情条件下获取n=150幅人脸图像,作为提取人眼的样本图像,并统一取人脸图像的分辨率为,并分别取H=100和W=100。
步骤S102,建立眼睛模板库。从步骤S101中建立的人脸样本库中,截取眼睛图像,为了便于更多的保留眼睛的特征,截取的眼睛图像中应包括眉毛、上眼睑、下眼睑和眼角,按左、右眼归类,并归一化为相同的分辨率(,本实施例中,取和),构建含有n个左眼图像和n个右眼图像的眼睛模板库。
步骤S105,获取训练矩阵的基向量和特征值。对步骤S104中生成的眼睛训练矩阵,分别进行K-L变换,得到左、右眼训练矩阵的基向量和特征值,并将基向量按相应的特征值从大到小排列。
右眼定位阶段:
步骤S201,获取人脸正面图像,将图像以中轴线为界,分为左脸图像和右脸图像两部分,左脸图像包含左眼,右脸图像包含右眼。
步骤S205,得到所有像素位置上的匹配值后,右眼的中心位置用下式确定:。
左眼定位阶段:
本实施例的人眼定位效果显示在图4-11中。
Claims (8)
1.一种基于K-L变换和核相关系数的人脸图像中眼睛定位方法,其特征在于:首先构建眼睛模板库,生成训练矩阵;对训练矩阵进行K-L变换,获取基向量和特征值,并选取主要基向量,将每个眼睛训练样本投影到主要基向量上,获得眼睛样本的投影系数向量;以投影系数向量作为模板,以核相关系数作为匹配程度的度量,在人脸图像中进行左眼和右眼的模板匹配;最后,最大核相关系数的位置,确定为眼睛位置;在人脸图像中进行左眼和右眼的模板匹配,具体步骤为:
(1)获取人脸正面图像,将图像以中轴线为界,分为左脸图像和右脸图像两部分,左脸图像包含左眼,右脸图像包含右眼;
(6)确定左眼的搜索区域;
4.根据权利要求1所述的人脸图像中眼睛定位的方法,其特征在于,对训练矩阵进行K-L变换,获取基向量和特征值,其具体步骤是:对生成的左眼、右眼训练矩阵,分别进行K-L变换,得到左、右眼训练矩阵的基向量和特征值,并将基向量按相应的特征值从大到小排列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110155309 CN102194110B (zh) | 2011-06-10 | 2011-06-10 | 基于k-l变换和核相关系数的人脸图像中眼睛定位方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110155309 CN102194110B (zh) | 2011-06-10 | 2011-06-10 | 基于k-l变换和核相关系数的人脸图像中眼睛定位方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102194110A CN102194110A (zh) | 2011-09-21 |
CN102194110B true CN102194110B (zh) | 2013-03-13 |
Family
ID=44602154
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201110155309 Expired - Fee Related CN102194110B (zh) | 2011-06-10 | 2011-06-10 | 基于k-l变换和核相关系数的人脸图像中眼睛定位方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102194110B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109034051A (zh) * | 2018-07-24 | 2018-12-18 | 哈尔滨理工大学 | 人眼定位方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7336830B2 (en) * | 2002-11-29 | 2008-02-26 | Sony United Kingdom Limited | Face detection |
CN101916370A (zh) * | 2010-08-31 | 2010-12-15 | 上海交通大学 | 人脸检测中非特征区域图像处理的方法 |
-
2011
- 2011-06-10 CN CN 201110155309 patent/CN102194110B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7336830B2 (en) * | 2002-11-29 | 2008-02-26 | Sony United Kingdom Limited | Face detection |
CN101916370A (zh) * | 2010-08-31 | 2010-12-15 | 上海交通大学 | 人脸检测中非特征区域图像处理的方法 |
Non-Patent Citations (1)
Title |
---|
David Zhang,etc..A Novel Face Recognition System Using Hybrid Neuraland Dual Eigenspaces Methods.《IEEE TRANSACTIONS ON SYSTEMS, MAN, AND CYBERNETICS—PART A: SYSTEMS AND HUMANS》.2002,第32卷(第6期),第787-793页. * |
Also Published As
Publication number | Publication date |
---|---|
CN102194110A (zh) | 2011-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3091479B1 (en) | Method and apparatus for fingerprint identification | |
CN108549873A (zh) | 三维人脸识别方法和三维人脸识别系统 | |
US10019624B2 (en) | Face recognition system and face recognition method | |
CN103902992B (zh) | 人脸识别方法 | |
Chiang et al. | A stereo vision-based self-localization system | |
CN105022999A (zh) | 一种人码伴随实时采集系统 | |
CN104700412A (zh) | 一种视觉显著图的计算方法 | |
CN103093226B (zh) | 一种用于图像特征处理的ratmic描述子的构造方法 | |
CN107563292B (zh) | 一种基于lddmm曲线匹配的人脸情感识别方法 | |
Zhang et al. | Linearly augmented real-time 4D expressional face capture | |
CN102194110B (zh) | 基于k-l变换和核相关系数的人脸图像中眼睛定位方法 | |
Guo et al. | Palmprint Recognition Based on Local Fisher Discriminant Analysis. | |
CN103136513B (zh) | 一种改进的asm人脸特征点定位方法 | |
KR20160042646A (ko) | 얼굴 인식 방법 | |
Wang et al. | Handling occlusion and large displacement through improved RGB-D scene flow estimation | |
KR101001184B1 (ko) | 얼굴 정규화 벡터를 이용한 반복적 3차원 얼굴 포즈 추정 방법 | |
WO2006061365A1 (en) | Face recognition using features along iso-radius contours | |
Tang et al. | Parametric distortion-adaptive neighborhood for omnidirectional camera | |
Xu et al. | Improving the interest operator for face recognition | |
CN108241868B (zh) | 图像客观相似度到主观相似度的映射方法及装置 | |
Zhang et al. | A single training sample face recognition algorithm based on sample extension | |
Li et al. | Analysis of AdaBoost-based face detection algorithm | |
Hashim et al. | Local and semi-global feature-correlative techniques for face recognition | |
Rama et al. | Aligned texture map creation for pose invariant face recognition | |
Shoman et al. | Illumination invariant camera localization using synthetic images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130313 Termination date: 20160610 |
|
CF01 | Termination of patent right due to non-payment of annual fee |