CN111325736B

CN111325736B - 一种基于人眼差分图像的视线角度估计方法

Info

Publication number: CN111325736B
Application number: CN202010124652.1A
Authority: CN
Inventors: 顾菘; 何龙
Original assignee: Chengdu Aeronautic Polytechnic
Current assignee: Chengdu Aeronautic Polytechnic
Priority date: 2020-02-27
Filing date: 2020-02-27
Publication date: 2024-02-27
Anticipated expiration: 2040-02-27
Also published as: CN111325736A

Abstract

本发明公开了一种基于人眼差分图像的视线角度估计方法，将被测试人眼图像和参考人眼图像这两个不同的人眼图像输入到孪生神经网络中，通过网络回归得到相应的视线角度的差分值。当参考人眼图像的视线角度已知时，就可以得到被测试人眼图像的视线角度。所述方法解决了现有视线角度估计方法中从图像直接估计视线角度，由于个人的表观差异会带来较大的估计误差的问题；同时解决了针对某一个体进行数据标定的工作量相当大的问题。本发明利用孪生神经网络技术估计两个图像中视线角度的差分值，从而得到被测试人眼图像的视线角度，其角度估计精度高，鲁棒性好。

Description

一种基于人眼差分图像的视线角度估计方法

技术领域

本发明属于计算机视觉技术领域，具体涉及一种基于人眼差分图像的视线角度估计方法的设计。

背景技术

视线角度估计是通过图像处理技术将人眼部的视线角度计算出来，一般分为基于几何模型和基于表观模型两种估计方法。基于几何模型的估计方法是通过计算眼部的几何参数从而得到视线角度；基于表观模型的估计方法是将此问题看作回归问题，利用机器学习技术直接从输入图像中学习回归子，从而得到视线角度。由于前者较多的依赖于眼部图像的分辨率，因此后者成为主流的研究方向。但在目前基于表观模型的研究中，大多算法都是利用深度神经网络技术训练人眼图像，直接得到视线角度。一方面，由于网络训练与测试时所用到的人眼图像往往是不同的主体，所以个人表观特征的差异往往使得这种利用图像直接得到视线角度的方法存在较大的误差。虽然这种方法的平均误差可能较小，但针对某一个体时，通常存在较为固定的估计误差，影响了整个系统的估计精度。另一方面，如果针对某一个体进行网络学习时需要大量的数据标定工作，使得系统的应用范围受到极大的限制。

孪生网络技术的特征是其输入为两路，利用此两路输入，可以得到所对应输入的差分特征值。虽然网络训练集与测试集的数据来源不同，但在对训练好的网络进行测试时，网络输入可以选择相同主体的人眼图像分别作为参考图像和被测试图像。由于参考图像的视线角度可以提前标定，那么系统最终得到的被测试图像的视线角度即为参考图像视线角度与孪生网络输出的和。这样避免了由于个体原因带来的误差，提高了估计精度；并且，由于只需要选择几个有限的参考图像进行标定，这样大大减少了针对某一个体进行标定的工作量。

发明内容

本发明的目的是针对现有技术中的上述不足，提出了一种基于人眼差分图像的视线角度估计方法，解决现有人眼视线角度估计结果不精确，标定工作量大的问题。

本发明的技术方案为：一种基于人眼差分图像的视线角度估计方法，包括以下步骤：

S1、向孪生神经网络的两个输入端分别输入被测试人眼图像和参考人眼图像。

S2、在孪生神经网络中将被测试人眼图像和参考人眼图像分别依次经过VGG16网络、第一全连接层以及ReLU激活函数，得到第一特征向量和第二特征向量。

S3、将第一特征向量和第二特征向量拼接为第三特征向量。

S4、将第三特征向量依次经过第二全连接层和ReLU激活函数，得到第四特征向量。

S5、将第四特征向量经过第三全连接层，在孪生神经网络的输出端得到被测试人眼图像和参考人眼图像对应的视线角度差分值G_d。

S6、对参考人眼图像进行标定，得到参考人眼图像的视线角度向量G_f。

S7、根据参考人眼图像的视线角度向量G_f以及视线角度差分值G_d，得到被测试人眼图像的视线角度向量G_t。

本发明的有益效果是：本发明通过两个不同的人眼图像得到所对应视线角度的差分值，并通过标定的参考人眼图像所对应的视线角度得到被测试图像的视线角度，这种方法避免了网络训练集与测试集中由于主体个体差异带来的估计误差，并且大大减少了针对某一个体进行数据标定的工作量，提高了系统的可操作性，其角度估计精度高，鲁棒性好。

进一步地，步骤S1中被测试人眼图像和参考人眼图像均为左眼图像或均为右眼图像。

上述进一步方案的有益效果是：本发明将被测试人眼图像和参考人眼图像统一为左眼图像或右眼图像，能够有效提高方法的通用性。

进一步地，步骤S1中被测试人眼图像和参考人眼图像均为图像大小为36行，60列的彩色图像。

上述进一步方案的有益效果是：本发明统一了被测试人眼图像和参考人眼图像的格式和大小，规范了对输入数据的要求。

进一步地，步骤S2中第一全连接层的输入参数长度为512，输出参数长度为512。

上述进一步方案的有益效果是：通过对第一全连接层输入输出参数的具体设置，能够提取人眼图像的特征信息，有效进行后续计算。

进一步地，步骤S4中第二全连接层的输入参数长度为1024，输出参数长度为256。

上述进一步方案的有益效果是：通过对第二全连接层输入输出参数的具体设置，能够提高网络训练速度，增加网络的非线性性能。

进一步地，步骤S5中第三全连接层的输入参数长度为256，输出参数长度为3。

上述进一步方案的有益效果是：通过对第三全连接层输入输出参数的具体设置，使孪生神经网络的输出与整个视线角度估计方法的输出形式一致。

进一步地，步骤S7中被测试人眼图像的视线角度向量G_t的计算公式为：G_t＝G_f+G_d。

上述进一步方案的有益效果是：有效避免了网络训练集与测试集中由于主体个体差异带来的估计误差。

进一步地，视线角度差分值G_d、参考人眼图像的视线角度向量G_f和被测试人眼图像的视线角度向量G_t均为采用欧拉角表示的长度为3的向量。

上述进一步方案的有益效果是：方便标识视线在三维空间中的方向。

进一步地，对孪生神经网络进行网络参数学习时，损失函数采用视线角度差分值G_d与标注的视线角度差值的L2范数。

上述进一步方案的有益效果是：有效优化了神经网络中的各层参数。

进一步地，对孪生神经网络进行网络参数学习时，采用标注好的MPIIFaceGaze数据集对孪生神经网络进行网络参数学习。

上述进一步方案的有益效果是：减小了数据标定的工作量。

附图说明

图1所示为本发明实施例提供的一种基于人眼差分图像的视线角度估计方法流程图。

具体实施方式

现在将参考附图来详细描述本发明的示例性实施方式。应当理解，附图中示出和描述的实施方式仅仅是示例性的，意在阐释本发明的原理和精神，而并非限制本发明的范围。

本发明实施例提供了一种基于人眼差分图像的视线角度估计方法，如图1所示，包括以下步骤S1～S7：

本发明实施例中，被测试人眼图像和参考人眼图像均为左眼图像或均为右眼图像。被测试人眼图像和参考人眼图像均为图像大小为36行，60列的彩色图像。

本发明实施例中，第一全连接层的输入参数长度为512，输出参数长度为512。

S3、将第一特征向量和第二特征向量拼接为第三特征向量。

本发明实施例中，第二全连接层的输入参数长度为1024，输出参数长度为256。

本发明实施例中，第三全连接层的输入参数长度为256，输出参数长度为3。

S7、根据参考人眼图像的视线角度向量G_f以及视线角度差分值G_d，得到被测试人眼图像的视线角度向量G_t，计算公式为：G_t＝G_f+G_d。

本发明实施例中，视线角度差分值G_d、参考人眼图像的视线角度向量G_f和被测试人眼图像的视线角度向量G_t均为采用欧拉角(Yaw、Pitch和Roll)表示的长度为3的向量。

本发明实施例中，对孪生神经网络进行网络参数学习时，损失函数采用视线角度差分值G_d与标注的视线角度差值的L2范数。

本发明实施例中，对孪生神经网络进行网络参数学习时，采用标注好的MPIIFaceGaze数据集对孪生神经网络进行网络参数学习。

本领域的普通技术人员将会意识到，这里所述的实施例是为了帮助读者理解本发明的原理，应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合，这些变形和组合仍然在本发明的保护范围内。

Claims

1.一种基于人眼差分图像的视线角度估计方法，其特征在于，包括以下步骤：

S1、向孪生神经网络的两个输入端分别输入被测试人眼图像和参考人眼图像；

S2、在孪生神经网络中将被测试人眼图像和参考人眼图像分别依次经过VGG16网络、第一全连接层以及ReLU激活函数，得到第一特征向量和第二特征向量；

S3、将第一特征向量和第二特征向量拼接为第三特征向量；

S4、将第三特征向量依次经过第二全连接层和ReLU激活函数，得到第四特征向量；

S5、将第四特征向量经过第三全连接层，在孪生神经网络的输出端得到被测试人眼图像和参考人眼图像对应的视线角度差分值G_d；

S6、对参考人眼图像进行标定，得到参考人眼图像的视线角度向量G_f；

S7、根据参考人眼图像的视线角度向量G_f以及视线角度差分值G_d，得到被测试人眼图像的视线角度向量G_t；

所述步骤S2中第一全连接层的输入参数长度为512，输出参数长度为512；

所述步骤S7中被测试人眼图像的视线角度向量G_t的计算公式为：G_t＝G_f+G_d。

2.根据权利要求1所述的视线角度估计方法，其特征在于，所述步骤S1中被测试人眼图像和参考人眼图像均为左眼图像或均为右眼图像。

3.根据权利要求1所述的视线角度估计方法，其特征在于，所述步骤S1中被测试人眼图像和参考人眼图像均为图像大小为36行，60列的彩色图像。

4.根据权利要求1所述的视线角度估计方法，其特征在于，所述步骤S4中第二全连接层的输入参数长度为1024，输出参数长度为256。

5.根据权利要求1所述的视线角度估计方法，其特征在于，所述步骤S5中第三全连接层的输入参数长度为256，输出参数长度为3。

6.根据权利要求1所述的视线角度估计方法，其特征在于，所述视线角度差分值G_d、参考人眼图像的视线角度向量G_f和被测试人眼图像的视线角度向量G_t均为采用欧拉角表示的长度为3的向量。

7.根据权利要求1所述的视线角度估计方法，其特征在于，对所述孪生神经网络进行网络参数学习时，损失函数采用视线角度差分值G_d与标注的视线角度差值的L2范数。

8.根据权利要求7所述的视线角度估计方法，其特征在于，对所述孪生神经网络进行网络参数学习时，采用标注好的MPIIFaceGaze数据集对孪生神经网络进行网络参数学习。