CN109033957A

CN109033957A - 一种基于二次多项式的视线估计方法

Info

Publication number: CN109033957A
Application number: CN201810638681.2A
Authority: CN
Inventors: 董延超; 林敏静; 何士波; 岳继光
Original assignee: Tongji University
Current assignee: Tongji University
Priority date: 2018-06-20
Filing date: 2018-06-20
Publication date: 2018-12-18
Anticipated expiration: 2038-06-20
Also published as: CN109033957B

Abstract

本发明涉及一种基于二次多项式的视线估计方法，包括：步骤S1：建立眼部二维模型和三维模型，并建立视线估计模型；步骤S2：载入多张图片，并导入各图片中视线特征量和视线真实结果；步骤S3：将所有已知视线特征量的图片划分为训练集和测试集；步骤S4：采用训练集图片对视线估计模型进行训练；步骤S5：采用测试集图片对训练后的视线估计模型进行测试，若测试误差小于阈值，则执行步骤S6，若为否，则返回步骤S2；步骤S6：采用视线估计模型对待估计图片进行视线估计。与现有技术相比，本发明利用二次多项式拟合法，来回归视线，只需要利用头部姿态三个角度，以及瞳孔偏离距离EX和EY，就可以进行视线方向的回归，计算效率高。

Description

一种基于二次多项式的视线估计方法

技术领域

本发明涉及一种视线估计方法，尤其是涉及一种基于二次多项式的视线估计方法。

背景技术

“视线跟踪”并不是什么新概念，比如说“眼动鼠标”，我们不用实际的鼠标来控制我们的计算机，而是用我们的眼睛，我们通过眼睛的注视来控制电脑屏幕上的鼠标点的运动，并且通过眼睛注视来打开或者关闭一个窗口程序，而且实验显示，用视线跟踪来完成的操作要比鼠标操作来的要快。

在民用方面的例子如美国弗吉尼亚大学研制成功的Erica系统(Eye-gazeResponse Interface Computer Aid)。它用眼睛注视作输入，配上一定的硬件设备，可帮助残疾人较方便的表达自己的思想及控制周围环境。

用在军事上，就是我们常常提到的“眼睛瞄准系统”或“视觉跟踪系统”。例如配备有用眼睛瞄准的头盔式武器系统等。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于二次多项式的视线估计方法。

本发明的目的可以通过以下技术方案来实现：

一种基于二次多项式的视线估计方法，包括：

步骤S1：建立眼部二维模型和三维模型，并建立视线估计模型；

步骤S2：载入多张图片，并导入各图片中视线特征量和视线真实结果；

步骤S3：将所有已知视线特征量的图片划分为训练集和测试集；

步骤S4：采用训练集图片对视线估计模型进行训练；

步骤S5：采用测试集图片对训练后的视线估计模型进行测试，若测试误差小于阈值，则执行步骤S6，若为否，则返回步骤S2；

步骤S6：采用视线估计模型对待估计图片进行视线估计。

二维X轴偏移量EX，用于表征瞳孔偏离眼部二维模型中Y轴的偏移，

二维Y轴偏移量EY，用于表征瞳孔偏离眼部二维模型中X轴的偏移，

头部姿态，由头部俯仰角、方位角和翻滚角组成；

视线结果包括：

第一视线夹角，用于表征瞳孔向量与眼部三维模型中X轴的夹角，

第二视线夹角，用于表征瞳孔向量与眼部三维模型中Y轴的夹角；

其中，所述瞳孔向量为眼部三维模型中坐标系原点至瞳孔位置的向量。

所述视线估计模型为：

其中：w_j为第j次项的系数，x为视线特征量，M为最高次幂，y为估计结果。

所述步骤S4具体包括：

步骤S41：载入训练集图片的视线特征量和视线真实结果；

步骤S42：利用训练集图片的视线特征量和视线真实结果对视线估计模型进行拟合；

步骤S43：根据损失函数确定使损失函数值最小的各次项的系数。

所述损失函数为：

其中：E为损失函数，y(x_n,W)为系数为W时第n张测试集图片视线估计结果，t_n为第n张测试集图片视线真实结果，

所述步骤S2具体为：通过三维建模软件生成多张已知视线特征量和视线真实结果的图片。

所述M为2。

与现有技术相比，本发明具有以下有益效果：

1)利用二次多项式拟合法，来回归视线，只需要利用头部姿态三个角度，以及瞳孔偏离距离EX和EY，就可以进行视线方向的回归，计算效率高。

2)通过三维建模软件生成多张已知视线特征量和视线真实结果的图片，可以提供可靠的测试集和训练集数据来源。

附图说明

图1为眼部二维模型图；

图2为眼球三维模型图；

图3为头部姿态中三个欧拉角的定义示意图；

图4为本发明方法的主要步骤流程示意图；

图5(a)和(b)为头部姿态为第一种状态下实施例中视线夹角与偏移量的关系示意图；

图6(a)和(b)为头部姿态为第二种状态下实施例中视线夹角与偏移量的关系示意图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的实施例。

在介绍视线回归方法之前，我们简单介绍几个定义的符号，分别是EX和EY。如图1所示，是一个眼部的二维模型图，以眼部中心为坐标系原点，自左向右为X轴正向，自下向上为Y轴正向。其中P点为瞳孔，P点到Y轴的距离为ex，到X轴的距离为ey。眼睛宽度为d，则和即：二维X轴偏移量EX，用于表征瞳孔偏离眼部二维模型中Y轴的偏移，二维Y轴偏移量EY，用于表征瞳孔偏离眼部二维模型中X轴的偏移。EX和EY为视线特征量，可以在二维图片中测量得到。

如图2所示，为眼球三维模型图，阴影部分为眼部区域。O点为眼球中心，P点为瞳孔，线段OP为眼球的半径。并且，向量与X轴正向的夹角为α，与Y轴正向的夹角为β。其中α大小的变化与EX有关，β的大小变化与EY有关。α和β为视线结果，即：第一视线夹角α，用于表征瞳孔向量与眼部三维模型中X轴的夹角，第二视线夹角β，用于表征瞳孔向量与眼部三维模型中Y轴的夹角；其中，瞳孔向量为眼部三维模型中坐标系原点至瞳孔位置的向量。

如图3所示，头部姿态由头部俯仰角、方位角和翻滚角组成；具体为三个欧拉角(Eular Angle)，其中，pitch是围绕X轴旋转，也叫做俯仰角。yaw是围绕Y轴旋转，也叫方位角。roll是围绕Z轴旋转，也叫翻滚角。这三个角度可以有现有技术测量得到(例如根据特征点之间的距离、角度等)，本申请不再赘述。

图5和图6给出了EX与α，EY与β的关系图。图5(a)为头部姿态角度都为0°时，EX-α的关系示意图，图5(b)为头部姿态角度都为0°时，EY-β的关系示意图，图6(a)为yaw角度从[-40°,40°]变化时，EX-α的关系示意图，图6(b)为yaw角度从[-40°,40°]变化时，EY-β的关系示意图，从图5中可以看出，当头部姿态角度都为0°时，EX-α，EY-β呈一定的线性关系。当头部发生转动时，如yaw角度从[-40°,40°]变化时，EX-α，EY-β的线性度降低，但仍存在一定的函数关系。

一种基于二次多项式的视线估计方法，具体为根据采集到的二维图片识别出人像在三维坐标系下的视线，如图4所示，包括：

步骤S1：建立眼部二维模型和三维模型，并建立视线估计模型，其中，视线估计模型为：

优选的，M为2。

步骤S2：载入多张图片，并导入各图片中视线特征量和视线真实结果，具体的：通过三维建模软件生成多张已知视线特征量和视线真实结果的图片。即CG方式，采用blender和Daz3D自动批量渲染出图片以及真值(即上文提到的EX，EY和α，β)。

步骤S3：将所有已知视线特征量的图片划分为训练集和测试集，一般采用8:2比例分割成训练数据和测试数据；

步骤S4：采用训练集图片对视线估计模型进行训练，具体包括：

步骤S41：载入训练集图片的视线特征量和视线真实结果；

损失函数为：

步骤S5：采用测试集图片对训练后的视线估计模型进行测试，若测试误差小于阈值，则执行步骤S6，若为否，则返回步骤S2；其中，测试误差阈值可以为经验值；

步骤S6：采用视线估计模型对待估计图片进行视线估计。

Claims

1.一种基于二次多项式的视线估计方法，其特征在于，包括：

步骤S4：采用训练集图片对视线估计模型进行训练；

步骤S6：采用视线估计模型对待估计图片进行视线估计。

2.根据权利要求1所述的一种基于二次多项式的视线估计方法，其特征在于，所述视线特征量包括：

头部姿态，由头部俯仰角、方位角和翻滚角组成；

视线结果包括：

3.根据权利要求2所述的一种基于二次多项式的视线估计方法，其特征在于，所述视线估计模型为：

4.根据权利要求3所述的一种基于二次多项式的视线估计方法，其特征在于，所述步骤S4具体包括：

步骤S41：载入训练集图片的视线特征量和视线真实结果；

5.根据权利要求4所述的一种基于二次多项式的视线估计方法，其特征在于，所述损失函数为：

其中：E为损失函数，y(x_n,W)为系数为W时第n张测试集图片视线估计结果，t_n为第n张测试集图片视线真实结果。

6.根据权利要求1所述的一种基于二次多项式的视线估计方法，其特征在于，所述步骤S2具体为：通过三维建模软件生成多张已知视线特征量和视线真实结果的图片。

7.根据权利要求3所述的一种基于二次多项式的视线估计方法，其特征在于，所述M为2。