CN113158879A

CN113158879A - 基于匹配特征的三维注视点估计及三维眼动模型建立方法

Info

Publication number: CN113158879A
Application number: CN202110417364.XA
Authority: CN
Inventors: 刘昱; 孙景林
Original assignee: Tianjin University
Current assignee: Tianjin University
Priority date: 2021-04-19
Filing date: 2021-04-19
Publication date: 2021-07-23
Anticipated expiration: 2041-04-19
Also published as: CN113158879B

Abstract

本发明公开了一种基于匹配特征的三维注视点估计及三维眼动模型建立方法，以眼动数据和立体视频刺激数据作为输入，首先同步提取眼动特征集；训练一个高斯过程回归模型来估计观察者的注视视线向量；将视线与刺激显示面相交来获得二维屏幕注视点位置；用观察者眼动特征数据、视线向量数据和立体视图的视差数据的匹配特征集来训练梯度提升回归模型，进一步获取注视深度；最终通过组合二维屏幕注视点及其相应的注视深度来获得观察者三维注视点的坐标，构建被测者观看立体视频刺激时的三维眼动感知模型。本发明具有高采样精度，深度学习和智能数据处理强大的数据处理能力对眼动数据和三维立体视频数据进行同步处理，因而算法精度也得到了提高。

Description

基于匹配特征的三维注视点估计及三维眼动模型建立方法

技术领域

本发明涉及深度学习和智能数据分析等技术领域，特别是涉及一种基于匹配特征的三维注视点估计及三维眼动模型建立方法。

背景技术

传统的基于特征和基于模型的视线估计方法，由于其局部特征(例如轮廓，眼角和眼睛图像的反射)易于提取并且与视线相关，已经被证明在通用环境下表现良好，成为视线估计的主流算法。然而，在不受约束的真实环境中，由于光照变化和其他视觉工件等建模因素的困难，这些方法的应用受到了限制。

发明内容

本发明旨在提出了一种基于匹配特征的三维注视点估计及三维眼动模型建立方法，基于深度学习的方法进行眼部地标定位及基于眼部特征的算法进行视线向量的估计，并结合基于视线匹配视差的注视深度估计方法，完成三维眼动感知模型的特征提取及表达。

本发明的一种基于匹配特征的三维注视点估计及三维眼动模型建立方法，该方法体包括以下步骤：

步骤1、播放三维立体视频，在观察者观看立体视频的同时收到视频刺激产生眼动，采集眼动数据；

步骤2、在所收集的观察者观看三维立体视频过程中利用霍夫变换算法来实现对应红外补光灯的虹膜反射点定位；

步骤3、进行(m,n,p,q)四个虹膜反射点的最小外接圆圆心o₁的位置估计；

步骤4、利用GAZEML深度学习算法进行眼睛区域特征点定位，所述特征点至少包括上下眼睑、虹膜、瞳孔和眼球中心区域；具体包括以下处理：

利用瞳孔中心特征点o相较于眼睛部区域特征点至少包括上、下眼睑，眼球中心的相对位置，进行眼睛区域特征点定位及特征提取；

步骤5、构建眼动数据特征集O₁，该特征集由9个坐标向量v_o→a，v_o→b，...，v_o→g,v_o→h，

以及瞳孔中心特征点o的坐标值组成；

步骤6、基于眼动数据特征集O₁，采用高斯回归算法GPR完成左、右眼注视向量(v_xl,v_yl)与(v_xr,v_yr)的回归估计；

步骤7、利用空间平面与直线交点的几何知识，求解左、右眼注视向量(v_xl,v_yl)、(v_xr,v_yr)与左、右刺激平面P_L、P_R的各自交叉点(x_l,y_l),(x_r,y_r)，即为左右眼注视点坐标；

步骤8、以左、右两屏幕注视点的位置(x_l,y_l),(x_r,y_r)为输入，采用人工网络参数化的自组织映射PSOM，求解出三维注视点的位置(X,Y)；

步骤9、基于眼动特征与立体视频特征构建匹配特征集O₂，以用于注视深度的回归估计；此匹配特征集O₂至少包括左右眼注视向量(v_xl,v_yl)与(v_xr,v_yr)、Δx＝x_l-x_r左右眼瞳孔半径R_l和R_r、左右眼瞳孔中心坐标C_l和C_r、左右眼瞳距a在内的眼部的视线特征以及三维立体刺激视频刺激左右视图的视差值v_dis；

步骤10、基于匹配数据集O₂，采用高斯回归算法(GPR)完成注视深度Z的回归估计；

步骤11、通过组合(X,Y)及相应的注视深度Z来获得观察者三维注视点的坐标X,Y,Z，构建三维眼动感知模型。

与现有技术相比，本发明具有以下积极效果：

1)用深度学习和智能数据处理强大的数据处理能力对眼动数据和三维立体视频数据进行同步处理；

2)为单只眼睛配备了4个红外补光灯，因此可以充分利用多个反射点特征来提高算法精度；

3)采集到的单眼图像的分辨率可以达到1920×1080，可以为算法提供更精确的特征数据。

附图说明

图1为本发明的一种基于匹配特征的三维注视点估计及三维眼动模型建立方法整体流程图；

图2为眼睛区域特征点定位及特征提取示例图；

图3为利用PSOM映射3D注视点的位置(X,Y)求解示例图；

图4为被测者观看立体视频刺激时的三维眼动感知模型示例图。

具体实施方式

本发明提出的一种基于匹配特征的三维注视点估计及三维眼动模型建立方法，以眼动数据和立体视频刺激数据作为输入，首先同步提取眼动特征集；训练一个高斯过程回归模型(Gaussian Processes Regression，GPR)来估计观察者的注视视线向量；通过将视线与刺激显示面相交来获得二维屏幕注视点位置；使用包括观察者眼动特征数据，视线向量数据和立体视图的视差数据的匹配特征集来训练梯度提升回归模型(Gradientboosting regression，GBR)，进一步获取注视深度；最终，通过组合二维屏幕注视点及其相应的注视深度来获得观察者三维注视点的坐标，构建被测者观看立体视频刺激时的三维眼动感知模型。

下面结合附图和具体实施例对本发明技术方案作进一步详细描述。

如图1所示，为本发明的一种基于匹配特征的三维注视点估计及三维眼动模型建立方法整体流程，该方法具体包括以下步骤：

步骤1、通过眼动仪设备播放三维立体视频，在观察者观看立体视频的同时收到视频刺激产生眼动，采集眼动数据；

步骤2、眼动仪设备为单只眼睛配备了四个红外补光灯，在所收集的观察者观看三维立体视频过程中利用霍夫变换算法来实现对应红外补光灯的虹膜反射点定位；

步骤3、如图2所示，为眼睛区域特征点定位及特征提取示例图；进行(m,n,p,q)四个虹膜反射点的最小外接圆圆心o₁的位置估计；

步骤4、利用现有的GAZEML深度学习算法进行眼睛区域特征点定位，包括上下眼睑、虹膜、瞳孔和眼球中心等区域特征；具体包括以下处理：

利用瞳孔中心特征点o相较于眼睛部区域特征点(上、下眼睑，眼球中心等)的相对位置，进行眼睛区域特征点定位及特征提取；

步骤5、构建眼动数据特征集O₁，该特征集由9个坐标向量(v_o→a，v_o→b，...，v_o→g，v_o→h，

)以及瞳孔中心特征点o的坐标值组成；

步骤6、基于眼动数据特征集O₁，采用高斯回归算法GPR完成左、右眼注视向量(v_xl,v_yl)与(v_xr,v_yr)的回归估计；使用包括观察者眼动特征、注视视线向量和立体视图的视差的匹配特征集在内的数据来训练梯度提升回归模型(Gradientboostingregression，GBR)，进一步获取注视深度；

步骤8、以左、右两屏幕注视点的位置(x_l,y_l)，(x_r,y_r)为输入，采用人工网络参数化的自组织映射(parametrized self-organizingmap，PSOM)，求解出三维注视点的位置(X,Y)，如图3所示，为利用PSOM映射三维注视点的位置(X,Y)求解示例图；

步骤9、基于眼动特征与立体视频特征构建匹配特征集O₂，以用于注视深度的回归估计；此匹配特征集O₂包括左右眼注视向量(v_xl,v_yl)与(v_xr,v_yr)、Δx＝x_l-x_r左右眼瞳孔半径R_l和R_r、左右眼瞳孔中心坐标C_l和C_r、左右眼瞳距a等眼部的视线特征以及三维立体刺激视频刺激左右视图的视差值v_dis，如图3所示；

步骤10、基于匹配数据集O₂，采用高斯回归算法(GaussianProcessesRegression，GPR)完成注视深度Z的回归估计；

步骤11、通过组合(X,Y)及相应的注视深度Z来获得观察者三维注视点的坐标(X,Y,Z)，构建被测者观看立体视频刺激时的三维眼动感知模型，如图4所示，为被测者观看立体视频刺激时的三维眼动感知模型示例图。

Claims

1.一种基于匹配特征的三维注视点估计及三维眼动模型建立方法，其特征在于，该方法具体包括以下步骤：

以及瞳孔中心特征点o的坐标值组成；

步骤10、基于匹配数据集O₂，采用高斯回归算法GPR完成注视深度Z的回归估计；

步骤11、通过组合X,Y及相应的注视深度Z来获得观察者三维注视点的坐标X,Y,Z，构建三维眼动感知模型。