WO2017211066A1

WO2017211066A1 - 基于虹膜与瞳孔的用于头戴式设备的视线估计方法

Info

Publication number: WO2017211066A1
Application number: PCT/CN2016/111600
Authority: WO
Inventors: 秦华标; 费舒
Original assignee: 华南理工大学
Priority date: 2016-06-08
Filing date: 2016-12-23
Publication date: 2017-12-14
Also published as: US10353465B2; CN106056092B; US20190121427A1; CN106056092A

Abstract

基于虹膜与瞳孔的用于头戴式设备的视线估计方法，只利用单摄像头和单红外光源以及屏幕四个平均区域内均具有的中心标定点，通过提取的眼动二维中心特征对瞳孔和虹膜进行三维空间建模，建立三维视线方向向量并结合视线方向角度信息，从而估计人眼注视点的位置。这充分考虑了头戴式设备应用的特点，在保证头戴式设备下注视点估计精度的同时，极大地减小了系统整体结构和标定过程的复杂度，为头戴式设备下的视线跟踪提供了一种精度高、复杂度低的解决方法。

Description

基于虹膜与瞳孔的用于头戴式设备的视线估计方法

技术领域

本发明涉及人机交互方式中的视线跟踪技术领域，具体涉及基于虹膜与瞳孔的用于头戴式设备的视线估计方法。

背景技术

视线跟踪技术作为最新颖的人机交互方式，具有精度高、简单易用、稳定性好以及对用户干扰性小等优点。因此，视线跟踪技术在医学辅助诊断、残疾人辅助设备、广告与市场分析以及日常人机交互等多个领域具有广阔的应用前景。此外，增强现实越来越深入到人们的生活，如何将视线跟踪技术与增强现实相结合，构建实时交互的视觉化增强现实成为人们越来越关注的焦点。

增强现实AR(Augmented Reality)是对用户周围真实世界中的现实信息通过三维注册技术进行增强，从而达到真实世界信息与虚拟世界信息的“无缝”集成，带给用户超现实的感官体验。为了给增强现实系统提供一种简单、高效且双向的交互方式，将视线跟踪技术与增强现实相结合，不仅能够跟踪用户的视线方向，获取用户在场景中的感兴趣区域，还可以体现增强现实系统虚实结合的特点，其中，具有视线跟踪功能的基于头戴式显示器的增强现实系统通过红外摄像头捕获的人眼图像以跟踪视线方向，视线转移视角、播放音乐以及打开视频等操作，拥有很强的增强现实的效果，具有重要的研究意义，近年来引起了广泛的关注。

头戴式视线跟踪系统的结构具有特殊性，当人眼注视空间某一物体且头部自由转动时，人眼与注视屏幕以及摄像头之间的相对位置和距离始终保持不变，无需考虑头部转动对注视点估计的影响，因此，头戴式视线跟踪系统的设计为视线跟踪技术领域的研究提供了一种新的思路，从研究估计注视点位置的过程中如何避免头部大范围转动的影响转换为研究如何在头戴式系统狭小的空间内更加简单精确地跟踪人眼运动信息以获取人眼视线方向。综上所述，精确地提取近红外光下表征视线方向的眼动特征以及建立简单高效的视线映射模型成为头戴式视线跟踪系统研究中两大关键的任务。

对于眼动特征的提取，其提取效果应该满足精度高和实时性强的要求。在头戴式视线跟踪系统中，摄像头距离人眼较近，所捕获的人眼图像清晰，但光照不均会造成人眼图像在清晰度上的差异；此外，由于系统中反射镜的影响，摄像头所捕获的人眼图像会产生形变，且当眼球转动角度较大时，部分眼动特征会受到眼睑或睫毛的遮挡以致轮廓不完整或产生虚假轮廓。目前的眼动特征提取算法大多提取瞳孔特征并结合角膜反射光斑或眼睛内外角点，为提取准确表征视线方向的眼动特征，这些算法往往计算复杂，无法保证眼动特征提取的实时性。因此，如何在近红外光下快速、准确地提取眼动特征是头戴式视线跟踪系统的技术难点之一。

对于视线映射模型的建立，其目的是利用提取的眼动特征获取注视点位置。在头戴式视线跟踪系统中，摄像头与人眼位置相对固定，头部运动并不会对注视点的计算造成影响，但用户在使用系统时往往希望佩戴简单且使用方便。在目前的视线映射模型中，二维映射模型算法简单，无需预先知道系统设备和用户的位置信息，但为建立二维映射方程，往往需要利用多个红外光源或较多的屏幕标定点；而三维映射模型算法复杂，为了获得眼睛三维中心与屏幕注视点的映射关系，需要复杂的立体摄像机或多个摄像机采集人眼图像，整个视线跟踪系统硬件复杂。因此，如何在保证注视点估计高精度的同时，只利用单摄像头和单红外光源建立标定过程简单的视线映射模型时头戴式视线跟踪系统中存在的主要技术难点。

发明内容

本发明公开了基于虹膜与瞳孔的用于头戴式设备的视线估计方法，该方法只利用单摄像头和单红外光源以及屏幕四个平均区域内均具有的中心标定点，通过提取的眼动二维中心特征对瞳孔和虹膜进行三维空间建模，建立三维视线方向向量并结合视线方向角度信息，从而估计人眼注视点的位置。本发明充分考虑了头戴式设备应用的特点，在保证头戴式设备下注视点估计精度的同时，极大地减小了系统整体结构和标定过程的复杂度。

本发明的目的至少通过以下技术方案之一实现。

基于虹膜与瞳孔的用于头戴式设备的视线估计方法，该方法只需要单摄像头和单红外光源以及屏幕四个平均区域内均具有的中心标定点，具体包括如下步骤:

(1)眼动特征提取：头戴式设备中人眼距离屏幕以及摄像头较近，对摄像头捕获的近红外光下的人眼图像，采用先获取眼动特征轮廓再定位眼动特征中心的思路，对于分割的瞳孔和虹膜特征区域，利用边缘检测、椭圆拟合算法获取瞳孔和虹膜的二维中心参数；

(2)眼动特征三维空间建模：人眼与屏幕以及摄像机的相对位置和距离始终保持不变，同时瞳孔和虹膜并不位于同一平面且虹膜位于瞳孔前方；根据图像像素坐标系到摄像机坐标系的转换公式，将人眼观察屏幕四个区域内中心标定点时摄像机捕获的人眼二维图像信息与标定点位置信息相结合，对眼动特征向量进行三维空间建模得到三维视线映射模型，即获得人眼注视四个区域中心标定点时的瞳孔和虹膜三维中心坐标参数；

(3)注视点位置估计：当人眼注视屏幕上任意一点时，将二维人眼图像中提取的瞳孔以及虹膜中心参数与四个标定点的二维中心相比较以定位人眼注视区域，利用已经建立的三维视线映射模型计算此注视区域内瞳孔中心和虹膜中心的三维坐标，获取瞳孔－虹膜三维视线方向向量，结合视线估计角度信息以获得最终人眼注视点的位置。

进一步地，所述步骤(1)包括：

a.对于输入的人眼图像，采用模板匹配算法对右眼区域进行初定位；

b.对于瞳孔中心特征提取部分，首先采用OTSU算法结合直方图峰值搜索阈值补偿算法实现对瞳孔区域的自动分割，并采用最大连通区域搜索算法消除瞳孔二值图像上的噪声团块，利用Sobel边缘检测获得瞳孔边缘，最后通过RANSAC椭圆拟合算法获取瞳孔中心参数信息；

c.对于虹膜中心特征提取部分，以瞳孔特征提取中心作为ROI区域的中心确定虹膜感兴趣区域，利用数字形态学结合直方图迭代算法获取虹膜二值图像，由于虹膜的上下边缘较易受到眼睑和睫毛的遮挡，因此利用Sobel垂直边缘检测获取虹膜垂直边缘信息后，通过椭圆拟合获得虹膜中心参数信息。

进一步地，所述步骤(2)包括：

a.摄像机内参数标定，采用张正友平面标定法，利用固定位置的摄像头拍摄的不同角度和距离下的棋盘图像对摄像机的内参数进行标定，以获取物体二维图像坐标系到摄像机坐标系转换公式中的缩放因子参数信息；

b.将注视屏幕分成大小相等的四个区域并在每个区域的中心设置一个标定点，将瞳孔二维中心坐标和已知的瞳孔深度信息值即瞳孔三维中心到摄像机光心的距离代入到步骤a所述的公式中，获得瞳孔三维坐标参数；

c.根据人眼视线方向下虹膜平面以及视线在屏幕投影后的几何相似性，利用屏幕标定点坐标和步骤b获取的瞳孔三维坐标计算虹膜深度信息值，再将虹膜二维中心坐标和虹膜深度信息值代入到步骤a所述的公式中，获得虹膜三维坐标参数。

进一步地，所述步骤(3)包括：

a.当人眼注视屏幕上任意一点时，将提取的瞳孔二维中心坐标与四个标定点对应的瞳孔二维中心相比较以定位人眼注视区域；

b.根据瞳孔中心和虹膜中心在三维空间中不共点，引起瞳孔中心和虹膜中心在二维平面不共线的特点，利用瞳孔和虹膜二维中心坐标获取人眼视线估计角度信息；

c.利用步骤(2)已经建立的三维视线映射模型计算此注视区域内瞳孔中心和虹膜中心的三维坐标，获取瞳孔－虹膜三维视线方向向量，结合视线估计角度信息以获得最终人眼注视点位置。

进一步优化实施地，所述步骤(1)中包括：

从摄像机中获取人眼图像，利用模版匹配算法对右眼区域进行定位；对于定位好的右眼区域，为了获得精确的瞳孔中心参数信息，采用OTSU结合直方图峰值搜索阈值补偿算法确定瞳孔分割阈值，采用图像连通区域搜索算法消除瞳孔二值图像中的噪声团块，利用Sobel边缘检测获得瞳孔边缘，再通过RANSAC椭圆拟合获取瞳孔中心参数信息；当准确提取瞳孔特征参数后，以瞳孔中心作为ROI区域的中心确定虹膜感兴趣区域，利用数字形态学结合直方图迭代算法获取虹膜二值图像，采用Sobel垂直边缘检测获取虹膜垂直边缘信息后，通过椭圆拟合获得虹膜中心参数信息。

进一步优化实施地，所述步骤(2)中包括：

将注视屏幕分成大小相等的四个区域并在每个区域的中心设置一个标定点，利用步骤(1)提取人眼分别注视四个标定点时的瞳孔和虹膜二维中心坐标；利用张正友平面标定法对摄像机的内参数进行标定，获取图像像素坐标系到摄像机坐标系转换公式中的缩放因子参数；将瞳孔二维中心坐标和已知的瞳孔深度信息值代入公式中获取瞳孔三维坐标参数；根据视线方向在虹膜平面和屏幕上投影的几何相似性，利用已经获取的瞳孔三维中心和屏幕标定点坐标计算虹膜深度信息值，并将其和虹膜二维中心坐标代入公式中获取虹膜三维中心坐标信息。

进一步优化实施地，所述步骤(3)中包括：

当人眼注视屏幕任意一点时，将利用步骤(1)提取的瞳孔二维中心坐标与四个标定点对应的瞳孔二维中心相比较以定位人眼注视区域；根据瞳孔中心和虹膜中心在三维空间中不共点，引起瞳孔中心和虹膜中心在二维平面不共线的原理，利用瞳孔和虹膜二维中心坐标获取人眼视线估计角度信息；将视线估计角度信息与瞳孔－虹膜三维视线方向向量结合以获得最终人眼注视点位置。

与现有技术相比，本发明的优点与积极效果在于：

1、精确、快速的眼动特征提取。精确的眼动特征提取是视线跟踪系统各方面性能得以保证的基础。目前的特征提取算法大多是提取瞳孔中心结合普尔钦斑点或眼睛内外角点作为眼动特征，在头戴式视线跟踪系统下，红外光源以及反射镜会使人眼图像对比度不均匀并使人眼图像发生形变，导致提取的眼动特征不能反映真实的人眼运动变化。本发明选取瞳孔和虹膜稳定的特征作为头戴式设备视线跟踪的眼动特征，采用先获取眼动特征轮廓再定位眼动特征中心的思路，在传统OTSU算法的基础上结合直方图峰值搜索阈值补偿算法实现对瞳孔区域的精确分割，利用直方图迭代算法获取虹膜区域分割阈值，采用Sobel边缘检测以及RANSAC椭圆拟合算法分别提取瞳孔和虹膜中心特征参数，满足头戴式视线跟踪系统对于眼动特征提取精度和实时性的要求。

2、精确、高效的视线映射模型建立。视线跟踪系统的最终目的是利用建立的视线映射模型估计人眼注视点位置。在目前的视线映射模型中，二维视线映射模型方法简单，在头部静止不动时拥有较高的注视点估计精度，但此映射模型的建立需要多个红外光源或较多的标定点的辅助；三维视线映射模型方法复杂，为直接利用眼睛三维信息获取精确的注视点估计位置，往往需要多个摄像头和多个红外光源的相互配合使用，以上两种视线映射模型均在一定程度上增加了系统的复杂度，在头戴式视线跟踪系统的应用上存在限制。本发明充分考虑头戴式视线跟踪系统下人眼与注视屏幕以及摄像头的相对位置和距离始终保持不变这一特点，只利用单摄像头和单红外光源以及屏幕上指定区域的四个标定点，提出新颖的基于瞳孔和虹膜的三维视线映射模型，利用提取的眼动二维中心特征对瞳孔和虹膜进行三维空间建模，建立三维视线方向向量并结合视线角度信息，从而估计人眼注视点位置。此映射模型对于不同的用户具有普适性，在保证头戴式视线跟踪系统注视点估计精度的同时，极大地减小了系统整体结构和标定过程的复杂度。

附图说明

图1是本发明实施方式中视线映射模型建立的整体框架图。

图2是本发明实施方式中屏幕观测点(4个标定点和16个注视点)的分布图。

具体实施方式

下面结合附图和实例对本发明的具体实施方式作进一步说明，但本发明的实施和保护不限于此。

本发明利用头戴式设备将摄像头以及红外光源固定在头部附近，其中，获取人眼图像的摄像头分辨率为640*480，红外摄像头的功率为3W，波长为850mm。

如图1，基于虹膜与瞳孔的用于头戴式设备的视线映射模型建立的具体实施步骤如下：

步骤一：眼睛注视屏幕四个标定点，提取眼动特征信息；

步骤二：对瞳孔和虹膜眼动特征进行三维空间建模；

步骤三：眼睛注视屏幕16个注视点，利用已经建立的三维视线映射模型估计注视点位置。

其中，步骤一的具体实施步骤为：

1、观测者佩戴头戴式设备后，眼睛依次注视前方屏幕上的四个标定点，其标定点分布图如图2所示，分别为屏幕四个相等区域内的中心点。

2、在眼睛注视标定点时提取眼动特征信息：对于每个标定点，分别提取瞳孔中心和虹膜中心作为眼动特征信息，其具体实施步骤为：

2.1单眼区域定位

头戴式视线跟踪系统中，红外光源距离人眼较近，摄像头捕获的只是人眼图像，而非整张人脸，但本发明的视线跟踪算法的基于单眼数据信息，因此，本发明在提取眼动特征前首先利用模版匹配算法对右眼区域进行定位。

2.2瞳孔中心特征提取

a.近红外光下的人眼图像中暗瞳效应明显，瞳孔区域呈现出明显的黑色团块的特点，为了消除图像噪声对瞳孔特征提取的影响，本发明首先利用中值滤波技术对人眼图像进行预处理，消除眼睛周围部分噪声，获取瞳孔区域细节更加明显的人眼图像。

b.头戴式视线跟踪系统下的人眼图像中，瞳孔区域特征明显但与其它区域对比度不均匀，因此，本发明利用最大类间方差算法(OTSU算法)获取瞳孔区域分割初步阈值后，根据人眼图像直方图的特点，通过直方图峰值搜索阈值补偿算法对初步分割阈值做一个补偿以获取最终的瞳孔分割阈值，将瞳孔区域与背景区域自动分割，获取瞳孔区域分割二值图像。

c.红外光照会在角膜上产生反射光斑，当眼球转动时，反射光斑会出现在瞳孔外部、瞳孔内部以及瞳孔边界三个位置上，尤其是当反射光斑出现在瞳孔边界上时会对瞳孔分割造成影响，导致瞳孔分割二值图像在反射光斑处产生凹陷，而非一个完整的椭圆。为了获取有效瞳孔边缘信息，本发明采用Sobel边缘检测算法分别提取瞳孔的竖直和水平边缘，并在两个方向上分别选取最长的边缘作为瞳孔边缘提取的结果，作为后续瞳孔椭圆拟合的有效边缘点集。

d.采用RANSAC椭圆拟合算法，通过不断的迭代获取最终瞳孔二维中心特征参数。

2.3虹膜中心特征提取

a.在近红外人眼图像中，瞳孔区域位于虹膜区域内，因此，当准确地提取瞳孔中心之后，为了消除面部其他区域对虹膜特征提取的影响，本发明首先以瞳孔中心作为虹膜感兴趣区域的中心，以适当的长度作为感兴趣区域矩形的边长对虹膜区域进行初定位。

b.为使虹膜区域中的像素值占据较大的灰度范围且分布均匀，使虹膜区域具有较高的对比度，本发明采用直方图均衡化算法对图像进行非线性拉伸，以增大虹膜区域与背景灰度之间的差别。

c.由于虹膜分割阈值位于瞳孔分割阈值与像素灰度最大值之间，因此，以已经确定的瞳孔分割阈值为起点，采用直方图迭代的方法获取虹膜分割二值图像。

d.与瞳孔区域在人眼图像中所占比例相比，虹膜区域所占比例较大且其上下眼睑易受眼睑和睫毛的遮挡，因此，本发明利用Sobel垂直边缘检测算子提取虹膜垂直边缘，并利用RANSAC椭圆拟合算法对虹膜进行椭圆拟合，获取虹膜二维中心特征参数。

其中，步骤二的具体实施步骤为：

1、摄像机内参数标定

摄像机捕获人眼图像后，其人眼图像像素坐标系到摄像机坐标系的转换公式为：

其中，坐标(u,v)表示人眼图像像素点在图像数组中所在的列数和行数，(dx,dy)分别表示每个像素在横轴和纵轴的物理尺寸，(u₀,v₀)表示图像主点，f为摄像机焦距，而(X_c,Y_c,Z_c)表示在摄像机坐标系下眼动特征三维位置坐标，Z_c为深度信息，表示人眼三维中心沿摄像机光轴到摄像机光心的距离。头戴式设备下，摄像头始终位于屏幕的正前方，人脸始终正对摄像机，无法通过瞳孔在平面内的不断移动来对摄像机的内参数进行标定。根据这一特点，本发明采用张正友平面标定法，利用摄像头拍摄的不同角度和距离下的20幅黑白相间的平面棋盘图像来计算摄像机的内参数，获取视线映射模型建立过程中的所有已知的参数信息。

2、眼动特征三维空间建模

眼动特征三维空间建模是三维视线映射模型建立的关键，通过眼动特征二维中心坐标来获取瞳孔和虹膜的三维中心坐标，构建三维视线方向向量以估计注视点位置。由步骤1中的公式可知，此时要获取瞳孔和虹膜眼动特征的三维坐标还需要知道瞳孔和虹膜三维位置相对于摄像机坐标系的深度信息Z_c1和Z_c2。由于头戴式视线跟踪系统中，头部相对于屏幕和摄像头的距离和位置始终保持不变，因此，当人眼注视屏幕上任意一点时，瞳孔和虹膜中心位置的变化可近似表示为在两个小矩形平面内的移动，两者的深度信息Z_c1和Z_c2始终保持不变。因此，本发明经过摄像机标定获取摄像机内参数后，为减小注视点估计的误差，将注视屏幕分成大小相等的四个小区域后对眼动特征进行三维空间建模，分别获取人眼注视每个小区域内中心点的瞳孔和虹膜三维坐标。

2.1瞳孔三维坐标获取

将步骤1中的公式进行变形可以得到如下公式：

(u₁-u₀)×Z_c1＝f_x×X_c1

(v₁-v₀)×Z_c1＝f_y×Y_c1

其中，(f_x,f_y)以及(u₀,v₀)为摄像机内参数，(u₁,v₁)为瞳孔二维中心在人眼图像中的像素点位置，而(X_c1,Y_c1,Z_c1)表示所要求取的瞳孔三维坐标。根据头戴式设备的特点，当人眼注视屏幕不同位置导致瞳孔中心变化时，假设瞳孔深度信息的值等于人脸平面到摄像头光心的距离，其数值已知且始终保持不变。其瞳孔眼动特征三维空间坐标获取过程如下：

1)将注视屏幕分成大小相等的的四个区域并在每一个区域内的中心位置设立一个标定点；

2)摄像机捕获人眼分别注视四个标定点的人眼图像，利用近红外光下眼动特征提取算法获取四个瞳孔二维中心像素点位置坐标；

3)将瞳孔二维中心坐标和瞳孔深度信息以及摄像机内参数分别代入上述两个公式中，即可获得瞳孔三维坐标。

2.2虹膜三维坐标获取

人眼视线方向可近似表示为经过三维瞳孔中心与虹膜中心的连线方向，因此，当获得瞳孔三维中心坐标后，为了获得视线方向还需要计算虹膜三维中心坐标。由于虹膜平面位于瞳孔平面的前方，虹膜深度信息并不等于瞳孔深度信息。根据瞳孔中心在虹膜平面以及屏幕平面投影的几何相似性原理可以得到如下公式：

其中，d表示瞳孔平面距屏幕的距离，(x,y)为屏幕上注视点的坐标，(u₂,v₂)为虹膜二维中心在人眼图像中的像素点位置，(X_c1,Y_c1,Z_c1)表示2.1中已经获取的瞳孔三维坐标，而(X_c2,Y_c2,Z_c2)为所要求取的虹膜三维中心坐标。因此，通过上述公式，即可通过已知的屏幕注视点坐标、对应的瞳孔三维中心坐标以及瞳孔深度信息值首先计算出虹膜深度信息值，将其值代入上述下面的两个公式中即可获得虹膜三维坐标。

其中，步骤三的具体实施步骤为：

1、人眼注视区域定位：

人眼分别注视屏幕上的16个注视点，将提取的瞳孔二维中心坐标与四个标定点对应的瞳孔二维中心坐标相比较以定位人眼注视区域。以缩小注视区域范围，提高注视点位置估计的精度。完成注视点区域定位后，根据步骤二2.1中的公式，由于人眼转动时瞳孔深度信息与虹膜深度信息保持不变，当人眼转动导致瞳孔和虹膜三维中心位置移动时，其相应的瞳孔和虹膜二维中心也在图像平面中发生变化，因此，此时的瞳孔和虹膜三维中心坐标可通过如下公式获得：

其中，(u,v)为定位注视区域内标定点对应的瞳孔(虹膜)二维中心坐标，(u',v')为注视点对应的瞳孔(虹膜)二维中心坐标；(X_c,Y_c)为定位注视区域内标定点对应的瞳孔(虹膜)三维中心坐标分量，而(X'_c,Y'_c)为所要求取的注视点对应的瞳孔(虹膜)三维中心坐标。

2、视线估计角度信息获取：

根据三维空间到二维空间的映射原理，三维空间内一个旋转的圆形映射到二维空间表现为一个椭圆轮廓。因此，当人眼注视空间某一物体以致眼球转动时，其三维视线方向、瞳孔三维中心以及瞳孔二维中心三者之间存在着相互表示的关系，因此，可以通过瞳孔二维中心坐标(u,v)获取视线偏离x-y平面的角度值，公式如下所示；

由于人眼在观察位于前方空间区域内的物体时，其眼球转动的角度变化在一定的范围内，当偏离z轴的角度相同而偏离x-y平面的角度相差180度时，其瞳孔二维映射椭圆的大小和形状相同，此时，需要利用第二个眼动特征(虹膜二维中心坐标)来构建瞳孔－虹膜补偿向量以剔除其中与真实视线方向相反的干扰角度，其计算公式如下所示：

其中，(u,v)表示瞳孔二维中心坐标，

表示虹膜二维中心坐标。将补偿角度与获取的两个角度信息做比较，选取与视线补偿角度最为接近的角度作为最终获取的视线估计角度信息值。

3、注视点位置计算：

当人眼注视屏幕上任意一点时，其视线方向经瞳孔三维中心和和虹膜三维中心的连线后与屏幕交叉获得注视点位置，此时首先计算出视线方向向量在x-y平面上的投影向量，再结合视线方向的角度信息即可获得最终屏幕注视点的位置，其计算公式如下所示：

(Y_c1-y)＝(X_c1-x)·tan(φ)

其中，(X_c1,Y_c1,Z_c1)为瞳孔三维中心坐标，(X_c2,Y_c2,Z_c2)为虹膜三维中心坐标，d为瞳孔平面到屏幕平面的距离，φ为视线方向角度信息。因此，通过步骤三中第一步获得的瞳孔三维中心和虹膜三维中心，结合视线方向角度信息以及瞳孔到屏幕的距离，即可准确地求取屏幕注视带你位置坐标，在保证注视点估计精度的同时，极大地减小了系统结构和标定过程的复杂度。

Claims

基于虹膜与瞳孔的用于头戴式设备的视线估计方法，该方法只需要单摄像头和单红外光源以及屏幕四个平均区域内均具有的中心标定点，其特征在于包括如下步骤:

(1)眼动特征提取：头戴式设备中人眼距离屏幕以及摄像头较近，对摄像头捕获的近红外光下的人眼图像，采用先获取眼动特征轮廓再定位眼动特征中心的思路，对于分割的瞳孔和虹膜特征区域，利用边缘检测、椭圆拟合算法获取瞳孔和虹膜的二维中心参数；

(2)眼动特征三维空间建模：人眼与屏幕以及摄像机的相对位置和距离始终保持不变，同时瞳孔和虹膜并不位于同一平面且虹膜位于瞳孔前方；根据图像像素坐标系到摄像机坐标系的转换公式，将人眼观察屏幕四个区域内中心标定点时摄像机捕获的人眼二维图像信息与标定点位置信息相结合，对眼动特征向量进行三维空间建模得到三维视线映射模型，即获得人眼注视四个区域中心标定点时的瞳孔和虹膜三维中心坐标参数；

(3)注视点位置估计：当人眼注视屏幕上任意一点时，将二维人眼图像中提取的瞳孔以及虹膜中心参数与四个标定点的二维中心相比较以定位人眼注视区域，利用已经建立的三维视线映射模型计算此注视区域内瞳孔中心和虹膜中心的三维坐标，获取瞳孔－虹膜三维视线方向向量，结合视线估计角度信息以获得最终人眼注视点的位置。
根据权利要求1所述的基于虹膜与瞳孔的用于头戴式设备的视线估计方法，其特征在于所述步骤(1)包括：

a.对于输入的人眼图像，采用模板匹配算法对右眼区域进行初定位；

b.对于瞳孔中心特征提取部分，首先采用OTSU算法结合直方图峰值搜索阈值补偿算法实现对瞳孔区域的自动分割，并采用最大连通区域搜索算法消除瞳孔二值图像上的噪声团块，利用Sobel边缘检测获得瞳孔边缘，最后通过RANSAC椭圆拟合算法获取瞳孔中心参数信息；

c.对于虹膜中心特征提取部分，以瞳孔特征提取中心作为ROI区域的中心确定虹膜感兴趣区域，利用数字形态学结合直方图迭代算法获取虹膜二值图像，由于虹膜的上下边缘较易受到眼睑和睫毛的遮挡，因此利用Sobel垂直边缘检测获取虹膜垂直边缘信息后，通过椭圆拟合获得虹膜中心参数信息。
根据权利要求1所述的基于虹膜与瞳孔的用于头戴式设备的视线估计方法，其特征在于所述步骤(2)包括：

a.摄像机内参数标定，采用张正友平面标定法，利用固定位置的摄像头拍摄的不同角度和距离下的棋盘图像对摄像机的内参数进行标定，以获取物体二维图像坐标系到摄像机坐标系转换公式中的缩放因子参数信息；

b.将注视屏幕分成大小相等的四个区域并在每个区域的中心设置一个标定点，将瞳孔二维中心坐标和已知的瞳孔深度信息值即瞳孔三维中心到摄像机光心的距离代入到步骤a所述的公式中，获得瞳孔三维坐标参数；

c.根据人眼视线方向下虹膜平面以及视线在屏幕投影后的几何相似性，利用屏幕标定点坐标和步骤b获取的瞳孔三维坐标计算虹膜深度信息值，再将虹膜二维中心坐标和虹膜深度信息值代入到步骤a所述的公式中，获得虹膜三维坐标参数。
根据权利要求1所述的基于虹膜与瞳孔的用于头戴式设备的视线估计方法，其特征在于所述步骤(3)包括：

a.当人眼注视屏幕上任意一点时，将提取的瞳孔二维中心坐标与四个标定点对应的瞳孔二维中心相比较以定位人眼注视区域；

b.根据瞳孔中心和虹膜中心在三维空间中不共点，引起瞳孔中心和虹膜中心在二维平面不共线的特点，利用瞳孔和虹膜二维中心坐标获取人眼视线估计角度信息；

c.利用步骤(2)已经建立的三维视线映射模型计算此注视区域内瞳孔中心和虹膜中心的三维坐标，获取瞳孔－虹膜三维视线方向向量，结合视线估计角度信息以获得最终人眼注视点位置。