CN111291701B

CN111291701B - 一种基于图像梯度和椭圆拟合算法的视线追踪方法

Info

Publication number: CN111291701B
Application number: CN202010104977.3A
Authority: CN
Inventors: 王鹏; 梁金伟; 董鑫; 才思文; 温宏韬; 沈翔; 尚子渠
Original assignee: Harbin University of Science and Technology
Current assignee: Harbin University of Science and Technology
Priority date: 2020-02-20
Filing date: 2020-02-20
Publication date: 2022-12-13
Anticipated expiration: 2040-02-20
Also published as: CN111291701A

Abstract

本发明是一种基于图像梯度和椭圆拟合算法的视线追踪方法。本发明通过摄像机采集人的原始图像信息，所述原始图像信息为视频流数据；对采集到的视频流数据进行图像预处理，得到处理好的视频流数据；根据处理好的视频流数据，进行人脸检测与定位；根据人脸检测与定位得到的图像，进行人眼检测与定位；根据人眼检测与定位得到的图像，进行瞳孔中心定位；根据人脸和人眼检测与定位的结果，以及瞳孔中心定位的结果，采用九点标定，对视线方向进行判定。本算法对被试者头部运动和实验环境有很好的鲁棒性，与传统的视线追踪方法相比，具有检测速度快和检测精度高的优点，满足大部分人的需求。

Description

一种基于图像梯度和椭圆拟合算法的视线追踪方法

技术领域

本发明涉及视线追踪技术领域，是一种基于图像梯度和椭圆拟合算法的视线追踪方法。

背景技术

人类从外界获得的信息大部分是通过眼睛来完成。视线追踪技术是一种利用人类眼部的运动情况来估计视线方向或者视线落点位置的技术。随着计算机的广泛普及，视线追踪技术越来越被人们所重视，并广泛应用于人机交互、医疗诊断、心理学和军事等领域。

视线追踪技术主要分为两类：穿戴式和非穿戴式。其中穿戴式系统需要用户佩戴头盔等设备，对使用者影响较大；而非穿戴式视线追踪技术对使用者干扰少，操作简单，逐渐成为视线追踪技术中的研究热点，并且近年来，人们将这一技术引入到信息领域，与机器视觉、图像处理及生物特征检测与识别等技术相结合。

在非穿戴式的视线追踪技术中包括多摄像机多光源系统、单摄像机多光源系统、单摄像机单光源系统以及单摄像机无光源系统。相比于其他三种系统，单摄像机无光源系统硬件要求较低、无需其他辅助设备去配合，并且也对人体没有副作用，具有很好的发展前景。目前国内外在视线追踪技术领域取得了较多的研究成果，但是存在视线追踪的系统硬件要求较高，单摄像机情况下视线追踪的检测精度和检测速度不高等问题。

发明内容

本发明为实现人类视线的追踪，本发明提供了一种基于图像梯度和椭圆拟合算法的视线追踪方法，本发明提供了以下技术方案：

一种基于图像梯度和椭圆拟合算法的视线追踪方法，包括以下步骤：

步骤1：通过摄像机采集人的原始图像信息，所述原始图像信息为视频流数据；

步骤2：对采集到的视频流数据进行图像预处理，得到处理好的视频流数据；

步骤3：根据处理好的视频流数据，进行人脸检测与定位，得到人脸检测与定位后的图像数据；

步骤4：根据人脸检测与定位后的图像数据，进行人眼检测与定位，得到人眼检测与定位后的图像数据；

步骤5：根据人眼检测与定位后的图像数据，进行瞳孔中心定位；

步骤6：根据人脸和人眼检测与定位的结果，以及瞳孔中心定位的结果，采用九点标定的方法对视线方向进行判定。

优选地，所述步骤2具体为：

步骤2.1：将采集到的视频流数据进行图像灰度化处理，减少原始数据量，减少后续图像处理的计算量；

步骤2.2:对灰度化处理后的图像信息中的图片进行直方图均衡化处理，来增强图像的对比度；

步骤2.3：选用双线性插值算法对直方图均衡化后图像进行缩放，克服了最近邻插值法灰度不连续的缺点，并对原始图像信息进行高斯滤波进行除噪，最终得到预处理好的视频流数据。

优选地，所述步骤3具体为：

步骤3.1：选用基于Haar-like特征的AdaBoost的人脸检测算法，进行人脸检测与定位，采用Haar-like特征进行表征人脸特征；

步骤3.2：采用AdaBoost的人脸检测算法进行人脸检测，寻找T个弱分类器h_t(t＝1,2,…,T)，对于训练集合(x₁,y₁)…(x_n,y_n)，其中x_i为人脸样本；y_i为样本类型，y_i取值为0或1，取1时为人脸，取0时为非人脸，样本总数为n；g_j(x_i)代表第i个信息图像中的第j个Haar-like特征，人脸样本的初始权重为ω_1,i＝1/2m，非人脸样本初始权重为ω_1,i＝1/2l，人脸样本个数m和非人脸样本个数l，其中，n＝m+l；

步骤3.3：将所有样本的权重进行归一化，通过下式表示所述归一化过程：

其中，ω_t,i为所有样本的权重进行归一化结果；

对于每个样本中第j个Haar-like特征，根据双阈值搜索方法，得到弱分类器h_j，进一步确定双阈值

和

确定分类器对应的加权偏差，通过下式表示分类器对应的加权偏差ε_j：

其中，从所有分类器中挑选分类错误率ε_j和最小的弱分类器h_t；

步骤3.4：每一次训练完一个弱分类器，对样本权重重新进行调整，通过下式对样本权重重新进行调整:

其中，ω_t+1，i为更新权重，样本为目标，则e_i＝0，否则为1，迭代t次，β_t＝ε_t/(1-ε_t)，ε_t为t个样本的挑选分类错误率；

根据样本权重重新进行调整的结果，确定强分类器，通过下式表示强分类器：

α_t＝ln(1/β_t)

优选地，所述步骤4具体为：

设置眼眶的大小以及眼眶在人脸的具体位置，眼眶的宽为脸框宽度的0.35倍，眼眶的高为脸框高度的0.3倍，左眼眼眶的左边距离为脸框宽度的0.13倍，左眼眼眶的上边距离为脸框高度的0.25倍，左右眼之间距离为脸框的0.13倍，根据处理好的视频流数据，进行人眼检测与定位。

优选地，所述步骤5具体为：

步骤5.1:采用图像梯度瞳孔定位方法，估计出瞳孔中心点，确定瞳孔中心点和图像中所有梯度方向之间的关系，确定目标函数，通过下式表示目标函数：

其中，N为整个人眼图像中像素点的个数，c是图像中任意一点，x_i表示图像中边缘轮廓的任意一点，d_i表示从c到x_i的向量，g_i表示位置x_i处的图像梯度；

将d_i缩放到单位长度，以获得所有像素位置的相同位置，为了提高该算法对照明和对比度等线性变化的健壮性，将g_i缩放到单位长度，根据公式(1)得出通过图像梯度获取的瞳孔中心点(x₀,y₀)；

步骤5.2：根据图像梯度算法得出的瞳孔中心点(x₀,y₀)，向瞳孔中心点四周取尺寸大小的图像，将瞳孔图像切割出来，从瞳孔中心点进行边界跟踪，通过改进的星射线法获得虹膜边缘点，将射线的角度区域限制在[-70°,60°]和[120°,250°]内；

步骤5.3：基于最小二乘法的椭圆拟合对虹膜边界上的边缘点进行计算，随机在虹膜边缘上选取6个点，至少选取6个点，进行椭圆拟合，得到多个拟合的椭圆边缘，利用非线性最小二乘法找到与实际边缘的欧式距离最小的拟合椭圆边缘；

步骤5.4：利用瞳孔和虹膜同心圆的原理，使用图像梯度瞳孔定位算法估计的瞳孔中心坐标和改进的基于最小二乘法的椭圆算法的瞳孔中心坐标进行评判，当两者的x，y坐标相差在三个像素点之内，则选取椭圆拟合出的瞳孔中心作为瞳孔中心，当两者的x，y坐标相差值大于三个像素点，则椭圆拟合程度较低，重新进行瞳孔中心判定。

优选地，所述步骤6具体为：

步骤6.1:进行九点标定，使用者头部保持不动且依次看电脑屏幕上均匀分布的九个点，记录标定时右眼的九个坐标(a₁,b₁)…(a₉,b₉),同时记录脸框左上角坐标(m,n)，和脸框长度l和宽度h；

步骤6.2:记录相邻标定点的横纵坐标差值，通过脸框左上角坐标和脸框长度对视线判定进行补偿，把判定过程中的脸框左上角坐标记为(m₁,n₁)，脸框的长度为l₁，宽度为h₁,标定完成后，利用当前瞳孔中心坐标为(a,b)，首先对瞳孔中心坐标做补偿，通过下式进行补偿：

以注视5区域，采用补偿后的瞳孔中心坐标与5区域做比较，建立判定原则，通过下式表示判定原则：

当瞳孔坐标(a₅,b₅)满足判定原则时，则视线方向判断为5部分的感兴趣区域。

本发明具有以下有益效果：

本发明充分考虑视线追踪算法的实时性、复杂度、检测精度、遮挡等因素，在目前单摄像机的人眼追踪的基础上，提出了一种结合图像梯度算法和改进的椭圆拟合算法确定出瞳孔中心和基于坐标标定判定视线方向的视线追踪方法。该视线追踪方法具有非接触、鲁棒性较强、检测精度高和检测速度快等优点。

本发明结合图像梯度和改进的椭圆拟合算法确定瞳孔中心。首先采用采用改进的AdaBoost算法进行人脸检测，利用双阈值弱分类器构造强分类器的方法，较传统的AdaBoost算法不仅提高了检测速度，并且有更高的准确性；在人眼标定过程中，采用三庭五眼的标定方法，大大提高了检测速度，使整个方法拥有更好的实时性；在瞳孔中心定位过程中，鉴于单摄像机像素不足等问题，采用基于图像梯度和改进椭圆拟合算法进行瞳孔中心定位，不仅弥补了设备上不足的问题，还具有很好的准确性。在视线判定过程中，采用基于坐标的方法，能够较准确地判定视线的方向，且补偿了头动对视线追踪的影响，有较高的准确性。本算法对被试者头部运动和实验环境有很好的鲁棒性，与传统的视线追踪方法相比，具有检测速度快和检测精度高的优点，满足大部分人的需求。

附图说明

图1为一种基于图像梯度和椭圆拟合算法的视线追踪方法流程图；

图2为图像预处理流程图；

图3为Haar-like特征的三种形式图；

图4为眼眶在人脸的位置示意图；

图5为梯度向量和位移向量示意图；

图6为改进星射线法示意；

图7为瞳孔中心判定流程图；

图8位视线标定定位图。

具体实施方式

以下结合具体实施例，对本发明进行了详细说明。

具体实施例一：

本发明的算法流程主要包括图像预处理、人脸检测与定位、人眼检测与定位、瞳孔中心定位、视线方向判定等五个步骤，如图1所示。

首先，用摄像机采集人的原始图像信息，将采集到的视频流数据首先进行图像灰度化处理，减少原始数据量，减少后续图像处理的计算量；然后将图片进行直方图均衡化处理，来增强图像的对比度；选用双线性插值算法对图像进行缩放，在图像处理过程中，双线性插值算法生成的图像克服了最近邻插值法灰度不连续的缺点，且运算量比三次多项式插值法少的多；能够满足本文需求；最后将图像进行高斯滤波进行除噪，具体图像预处理流程如图2所示。

步骤3：根据处理好的视频流数据，进行人脸检测与定位；

在人脸的检测与定位中，选用基于Haar-like特征的改进型AdaBoost的人脸检测算法。Haar-like是一种基于图像的特征值进行图像分类的特征提取算法，Harr-like特征主要有三种如图3所示，(a)为边缘特征，(b)为线性特征，(c)为特定方向特征，定义为模板矩形中的白色矩阵像素和减去黑色矩阵的像素和来计算矩阵像素，能够反映检测对象特征局部灰度变化。人脸和非人脸区域的特征有很大的差值，利用Haar-like特征能够表征人脸特征。

AdaBoost算法步骤包括初始化训练数据的权值分布，训练每一个弱分类器，并且将所有经过训练后的弱分类器组合成一个强分类器；在每一轮的训练迭代过程中，不断地对样本权重值进行调整，分类出正确的样本，每次进行样本权重修改后，会将修改值引入到下一个分类器进行分类，将所有弱分类器串联起来就成为了一个强分类器；传统的AdaBoost算法进行特征选择时弱分类器采用了单个阈值，本文采用双阈值的弱分类器，进行每一次的训练迭代，不仅提高了分类能力，也减少了训练时间。

Step1.首先寻找T个弱分类器h_t(t＝1,2,…,T)，对于训练集合(x₁,y₁)…(x_n,y_n)，其中x_i为人脸样本；y_i为样本类型，y_i取值为0或1，取1时为人脸，取0时为非人脸，样本总数为n；g_j(x_i)代表第i个信息图像中的第j个Haar-like特征，人脸样本的初始权重为ω_1,i＝1/2m，非人脸样本初始权重为ω_1,i＝1/2l，人脸样本个数m和非人脸样本个数l，其中，n＝m+l。

Step2.然后将所有样本的权重进行归一化:

对于每个样本中第j个Haar-like特征，根据双阈值搜索方法，可以得到一个简单分类器h_j，

也就是确定双阈值

求出分类器对应的加权偏差:

其中

从所有弱分类器中挑选分类错误率ε_j和较小的弱分类器h_t。

Step3.每一次训练完一个弱分类器，对样本权重重新进行调整，公式如下:

其中β_t＝ε_t/(1-ε_t)，当人脸样本被分类正确时，则e_i＝0，反之e_i＝1。

Step4.最后得到强分类器为:

其中，α_t＝ln(1/β_t)。

步骤4：根据处理好的人脸检测与定位后的图像数据，进行人眼检测与定位；其中人眼检测与定位采用三庭五眼，三庭五眼是人的脸长与脸宽的一般标准比例，从前额发际线至眉骨，从眉骨至鼻底，从鼻底至下颌，各占脸长的1/3；五眼是指脸的宽度比例，以眼型长度为单位，把脸的宽度分成五等份，从左侧发际至右侧发际进行划分。本文中设置眼眶的大小以及眼眶在人脸的具体位置，眼眶的宽为脸框宽度的0.35倍，眼眶的高为脸框高度的0.3倍，左眼眼眶的左边距离为脸框宽度的0.13倍，左眼眼眶的上边距离为脸框高度的0.25倍，左右眼之间距离为脸框的0.13倍，如图4所示。

步骤5：根据处理好的人眼检测与定位后的图像数据，进行瞳孔中心定位；

在进行瞳孔中心定位时，首先从人脸图像中裁剪出包含眼睛的子图，减少后续处理中的计算负荷。本发明采用结合图像梯度和基于改进的最小二乘法椭圆拟合的算法进行瞳孔中心定位，首先通过图像梯度瞳孔定位方法，估计出瞳孔中心点，通过估计出的瞳孔中心点作为中心利用改进的星射线方法实现虹膜边缘点的提取，再利用改进的最小二乘椭圆拟合的方法进行虹膜中心定位，最后使用图像梯度瞳孔定位算法估计的瞳孔中心坐标和最小二乘法椭圆拟合出的虹膜中心坐标进行评判。

1)图像梯度瞳孔定位

图像梯度可以把图像看成二维离散函数，其数学原理就是二维离散函数的求导，在图像中即求两个相邻像素点之间灰度的差值。原理是利用梯度向量方向结合位移向量，如图5所示，c是图像中任意一点，表示可能是瞳孔中心的点，x_i表示图像中边缘轮廓的任意一点，d_i表示从c到x_i的向量，g_i表示位置x_i处的图像梯度。

根据定义数学公式来计算瞳孔中心，该数学公式表示了一个可能的瞳孔中心点和图像中所有梯度方向之间的关系，目标函数公式如公式5所示。

其中N为整个人眼图像中像素点的个数。把位移矢量d_i缩放到单位长度，以获得所有像素位置的相同位置，为了提高该算法对照明和对比度等线性变化的健壮性，把径向向量g_i缩放到单位长度。从公式可以得出通过图像梯度获取的瞳孔中心点。

2)虹膜边缘点提取

根据图像梯度算法得出的瞳孔中心(x₀,y₀)，首先向四周取尺寸20×20大小的图像，将瞳孔图像切割出来。随后从瞳孔中心点进行边界跟踪，通过改进的星射线法获得虹膜边缘点。传统的星射线法是以瞳孔中心为起始点，每隔0.5度向图像四周发射射线，对每条射线经过的像素，将具有最大梯度值的像素作为瞳孔的边缘点。改进的星射线法主要考虑到上眼睑和下眼睑的影响，将射线的角度区域限制在[-70°,60°]和[120°,250°]内，如图6所示。

3)改进的基于最小二乘法的椭圆拟合

基于最小二乘法的椭圆拟合[18]是对虹膜边界上的边缘点进行计算，首先可以随机在虹膜边缘上选取6个点(至少6个点可以确定一个椭圆)，然后进行椭圆拟合，得到多个拟合的椭圆边缘，利用非线性最小二乘法找到与实际边缘的欧式距离最小的拟合椭圆边缘。如下:

实际边缘点到估计的瞳孔中心的欧式距离:

拟合椭圆边缘点到估计的瞳孔中心的欧式距离:

拟合椭圆边缘点到实际边缘点的欧式距离:

取所有实际边缘点到拟合椭圆边缘点距离平方和小的椭圆作为最小二乘意义下的最优拟合。

椭圆拟合的算法公式:

F(x,y)＝Ax²+Bxy+Cy²+Dx+Ey+F＝0,B²-4AC＜0 (10)

其中，A,B,C,D,E,F是椭圆参数表达式的系数，(x,y)为椭圆上的点。

瞳孔中心坐标:

长短轴坐标:

长短轴比:

为了提高检测速度，本发明提出了一种改进的基于最小二乘法的椭圆拟合算法，具体方法如下:检测虹膜边缘信息处采用改进的星射线法，将检测射线的角度区域限制在[-70°,60°]和[120°,250°]内。若在该区域内随机选取6个样本点椭圆拟合，共有

种选择，而分别从[-70°,60°]和[120°,250°]区域内各选取三个样本点比在区域点中随机选取6个样本点更容易找到最优的拟合椭圆，且共有

种选择，减少了计算量，缩短了时间。

4)瞳孔中心判定流程

利用瞳孔和虹膜同心圆的原理，使用图像梯度瞳孔定位算法估计的瞳孔中心坐标和改进的基于最小二乘法的椭圆算法的瞳孔中心坐标进行评判，若两者的x，y坐标相差在三个像素点之内，则选取椭圆拟合出的瞳孔中心作为瞳孔中心，若两者的x，y坐标相差值大于三个像素点，则椭圆拟合程度较低，重新进行瞳孔中心判定，具体流程如图7所示。将该方法作为选取瞳孔中心的一个评价方法可以大大降低拟合的误差。

本发明采用基于坐标的视线判定方法,首先对使用者进行九点标定，如图8所示，使用者头部保持不动且依次看电脑屏幕上均匀分布的九个点，记录标定时右眼的九个坐标(a₁,b₁)…(a₉,b₉),同时记录脸框左上角坐标(m,n)，和脸框长度l和宽度h。首先记录相邻标定点的横纵坐标差值x，例如x₁₂＝b₂-b₁，x₁₄＝a₄-a₁，为了解决头动、距离摄像机远近对于视线判定的影响，本文通过脸框左上角坐标和脸框长度对视线判定进行补偿，把判定过程中的脸框左上角坐标记为(m₁,n₁)，脸框的长度为l₁，宽度为h₁。标定完成后，视线判定过程中首先用当前瞳孔中心坐标为(a,b)，首先对瞳孔中心坐标做补偿，补偿公式如下:

以注视5区域为例，用补偿后的瞳孔中心坐标与5区域做比较，若瞳孔坐标(a₅,b₅)满足公式16:

则视线方向判断为5部分的感兴趣区域。若不满足再同理分布判断属于哪个区域。

以上所述仅是一种基于图像梯度和椭圆拟合算法的视线追踪方法的优选实施方式，一种基于图像梯度和椭圆拟合算法的视线追踪方法的保护范围并不仅局限于上述实施例，凡属于该思路下的技术方案均属于本发明的保护范围。应当指出，对于本领域的技术人员来说，在不脱离本发明原理前提下的若干改进和变化，这些改进和变化也应视为本发明的保护范围。

Claims

1.一种基于图像梯度和椭圆拟合算法的视线追踪方法，其特征是：包括以下步骤：

所述步骤3具体为：

步骤3.2：采用AdaBoost的人脸检测算法进行人脸检测，寻找T个弱分类器h_t(t＝1,2,···,T)，对于训练集合(x₁,y₁)···(x_n,y_n)，其中x_i为人脸样本；y_i为样本类型，y_i取值为0或1，取1时为人脸，取0时为非人脸，样本总数为n；g_j(x_i)代表第i个信息图像中的第j个Haar-like特征，人脸样本的初始权重为ω_1,i＝1/2m，非人脸样本初始权重为ω_1,i＝1/2l，人脸样本个数m和非人脸样本个数l，其中，n＝m+l；

其中，ω_t,i为所有样本的权重进行归一化结果；

和

从所有分类器中挑选分类错误率ε_j和最小的弱分类器h_t；

2.根据权利要求1所述的一种基于图像梯度和椭圆拟合算法的视线追踪方法，其特征是：所述步骤2具体为：

步骤2.3：选用双线性插值算法对直方图均衡化中的图像进行缩放，克服了最近邻插值法灰度不连续的缺点，并对原始图像信息进行高斯滤波进行除噪，得到预处理好的视频流数据。

3.根据权利要求1所述的一种基于图像梯度和椭圆拟合算法的视线追踪方法，其特征是：所述步骤4具体为：

设置眼眶的大小以及眼眶在人脸的具体位置，眼眶的宽为脸框宽度的0.35倍，眼眶的高为脸框高度的0.3倍，左眼眼眶的左边距离为脸框宽度的0.13倍，左眼眼眶的上边距离为脸框高度的0.25倍，左右眼之间距离为脸框的0.13倍，根据人脸检测与定位后的图像数据，进行人眼检测与定位。

4.根据权利要求1所述的一种基于图像梯度和椭圆拟合算法的视线追踪方法，其特征是：所述步骤5具体为：

将d_i缩放到单位长度，以获得所有像素位置的相同位置，为了提高该算法对照明和对比度线性变化的健壮性，将g_i缩放到单位长度，通过图像梯度算法获取的瞳孔中心点(x₀,y₀)；

步骤5.2：根据图像梯度算法得出的瞳孔中心点(x₀,y₀)，向瞳孔中心点四周取尺寸20×20大小的图像，将瞳孔图像切割出来，从瞳孔中心点进行边界跟踪，通过改进的星射线法获得虹膜边缘点，将射线的角度区域限制在[-70°,60°]和[120°,250°]内；

步骤5.4：利用瞳孔和虹膜同心圆的原理，使用图像梯度瞳孔定位算法估计的瞳孔中心坐标和改进的基于最小二乘法的椭圆算法的瞳孔中心坐标进行评判，当两者的x，y坐标相差在三个像素点之内，则选取椭圆拟合出的瞳孔中心作为瞳孔中心，当两者的x，y坐标相差值大于三个像素点，则椭圆拟合程度低，重新进行瞳孔中心判定。

5.根据权利要求1所述的一种基于图像梯度和椭圆拟合算法的视线追踪方法，其特征是：所述步骤6具体为：