CN115147462A - 一种基于三维眼球模型和卡尔曼滤波的注视特征跟踪方法 - Google Patents

一种基于三维眼球模型和卡尔曼滤波的注视特征跟踪方法 Download PDF

Info

Publication number
CN115147462A
CN115147462A CN202210806512.1A CN202210806512A CN115147462A CN 115147462 A CN115147462 A CN 115147462A CN 202210806512 A CN202210806512 A CN 202210806512A CN 115147462 A CN115147462 A CN 115147462A
Authority
CN
China
Prior art keywords
eyeball
point
dimensional
pupil
center
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210806512.1A
Other languages
English (en)
Other versions
CN115147462B (zh
Inventor
孙立
贝史涛
张昊泽
宋明黎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202210806512.1A priority Critical patent/CN115147462B/zh
Publication of CN115147462A publication Critical patent/CN115147462A/zh
Application granted granted Critical
Publication of CN115147462B publication Critical patent/CN115147462B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/277Analysis of motion involving stochastic approaches, e.g. using Kalman filters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10012Stereo images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30041Eye; Retina; Ophthalmic

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Eye Examination Apparatus (AREA)

Abstract

本发明提供一种基于三维眼球模型和卡尔曼滤波的注视特征跟踪方法,能够提升视线追踪过程中特征提取的速度。所述方法包括下列步骤:1)检测部分输入图像序列的瞳孔特征和普尔钦斑特征的信息;2)根据特征构建三维眼球模型;3)基于卡尔曼滤波预测当前帧的眼球姿态;4)基于三维眼球模型计算当前预测的瞳孔和普尔钦斑的投影区域;5)适当扩大选区边缘并在其中检测当前帧的特征;6)重复上述步骤3)至5),直至人眼视频帧序列输入结束。

Description

一种基于三维眼球模型和卡尔曼滤波的注视特征跟踪方法
技术领域
本发明属于视线追踪领域,具体涉及人眼特征的跟踪以加速特征检测的方法。
背景技术
眼睛是人类获取外部信息的主要方式,也是最直接的方式。眼睛能表达人类丰富的情感,视线追踪技术在各领域有极高的科研与应用价值,诸如人机交互、医疗保健、行为认知分析、元宇宙等领域。
现代视线追踪技术的实现方法主要基于二维、三维和表观的方法,且这些方法大多基于人眼图像中的一些特征,例如瞳孔特征、普尔钦斑特征、虹膜特征等。当瞳孔受光照、眼睑遮挡等外界干扰时,现有的特征检测方案的精度和置信度都会降低,甚至失效。当红外光源落在眼球的非角膜区域反射时,若在特征检测中将其视为普尔钦斑,会导致后续基于普尔钦斑的研究工作都出现错误。因此,特征检测的高精度和高置信度对于视线追踪研究工作有重要意义。此外,眼动追踪在嵌入式设备中应用愈发广泛,这就要求特征检测在保持高精度的前提下能做到尽量减少算力,提升实时性以符合人眼高速转动的事实。
发明内容
本发明的目的就在于为了解决上述问题而提供的一个从特征跟踪角度来加速人眼特征检测并提升可信度的方法。
本发明的技术方案是:
一种基于三维眼球模型和卡尔曼滤波的注视特征跟踪方法,包括下列步骤:
1)将眼动视频转换为序列帧,检测前一部分图像帧的眼动特征,包括瞳孔特征和普尔钦斑特征。
2)得到步骤1)中的特征信息后,将二维信息作为输入计算构建得到可靠的三维眼球模型。
3)计算上一图像帧在三维眼球模型中的眼球姿态,并作为卡尔曼滤波的初值,预测当前帧的眼球姿态。
4)基于三维眼球模型计算瞳孔和普尔钦斑在成像平面上的位置。
5)得到步骤4)的投影位置后,适当扩大选区边缘,在选区内检测当前帧的特征,并使用检测到的特征信息更新卡尔曼滤波参数。
6)重复上述步骤3)至5),直至人眼视频帧序列输入结束。
上述一种基于三维眼球模型和卡尔曼滤波的注视特征跟踪方法的步骤2)中,采用的是简化眼球模型,主体由两个半径不同的共轴球体组成,半径较小的是角膜,较大的是眼球,且角膜有固有的折射率。
步骤3)中采用的卡尔曼滤波是一种高效的自回归滤波器,能够从一系列不完全及包含噪声的测量中估计动态系统的状态,利用前一时刻的状态来计算得到当前时刻下的状态的最优估计。
具体的,卡尔曼滤波的系统过程模型和观测模型可以表示为:
xk=F·xk+B·uk+Wk (1)
zk=H·xk+vk (2)
其中xk是k时刻的系统状态,uk是k时刻对系统的控制量。zk取k时刻的观测值,H是观测系统的参数。wk和vk分别表示过程和观测的噪声,它们的协方差分别是Q和R。
xk这里设定为
Figure BDA0003737922690000021
共6个状态量,分别为仰角、方向角、仰角速度、方向角速度,仰角加速度和方向角加速度。zk取状态量中的2个,设定为
Figure BDA0003737922690000022
卡尔曼滤波算法的操作包括两个阶段:预测与更新。
预测过程:假设k时刻为当前时刻,滤波器使用上一时刻即k-1时刻的状态的估计,做出对k时刻系统状态的估计。
更新过程:滤波器利用对k时刻状态的观测值,优化在预测阶段获得的预测值,并计算下一时刻即k+1时刻的估计值。
卡尔曼滤波预测估计方程:
x(k|k-1)=F·x(k-1|k-1)+B·uk (3)
P(k|k-1)=F·P(k-1|k-1)·FT+Qk (4)
卡尔曼滤波更新修正过程:
Kk=P(k|k-1)·HT·(H·P(k|k-1)·HT+Rk)-1 (5)
x(k∣∣k)=x(k∣∣k-1)+Kk·(zk-H·x(k∣∣k-1)) (6)
P(k|k)=(I-Kk·H)·P(k|k-1) (7)
其中,xk|k-1是根据k-1时刻预测的k时刻结果,xk-1|k-1是k-1时刻的最优结果,xk|k是k时刻的最优结果,Pk|k-1是xk|k-1对应的协方差,Pk-1|k-1是xk-1|k-1对应的协方差,Kk是卡尔曼增益,I是单位矩阵。
仰角θ和方向角
Figure BDA0003737922690000031
是球坐标系中的构成要素,需要从笛卡尔坐标系转换过来,具体过程:
在三维眼球模型已构建的前提下,眼球中心在笛卡尔坐标系中的位置基本不变,设该点为S(xs,ys,zs),上一帧的瞳孔中心为点P(xp,yp,zp),以眼球中心为球坐标中心,得到瞳孔中心点P相对于眼球中心的坐标为Ps(x,y,z)=(xp-xs,yp-ys,zp-zs),点Ps在球坐标系下的坐标
Figure BDA0003737922690000032
这里在坐标系转换过程中进行了适当修改,转换方程表示为:
Figure BDA0003737922690000033
Figure BDA0003737922690000034
Figure BDA0003737922690000041
由于人类生理构造的原因,瞳孔转动只会发生在眼球中心的一侧,即瞳孔中心相对于眼球中心所处笛卡尔坐标系的z轴值均为同一个方向,这里将笛卡尔坐标系的z轴和y轴分别作为球坐标系的y轴和z轴,这样保证了
Figure BDA0003737922690000042
步骤4)中的计算瞳孔和普尔钦斑在成像平面上的位置包括坐标系转换和计算投影两个阶段,具体为:
通过卡尔曼滤波得到当前k时刻的状态估计,需要将球坐标系下的
Figure BDA0003737922690000043
再转换到笛卡尔坐标下的Ps(x,y,z),转换方程表示为:
Figure BDA0003737922690000044
y=rcosθ (12)
Figure BDA0003737922690000045
通过Ps(x,y,z)和S(xs,ys,zs)还原P(xp,yp,zp),进而计算瞳孔和普尔钦斑在成像平面上的位置。
瞳孔中心坐标和普尔钦斑从三维空间到二维平面上的投影关系应符合眼球成像规律。这里以小孔成像为例,投影关系具体如下:
Figure BDA0003737922690000046
其中,(x,y,z)是三维空间中的点坐标,rw和rh分别为相机在x和y方向上的分辨率,f是相机焦距。
瞳孔投影到二维平面上的椭圆的长轴、短轴和倾角可通过三维眼球模型计算得到。
普尔钦斑是红外光源在人眼角膜上反射的亮斑。本发明使用一种迭代优化的方法去近似计算该点,具体方法为:
已知相机光心O、眼球中心S、已标定的LED光源位置L,通过卡尔曼滤波跟踪得到的光轴方向
Figure BDA0003737922690000047
角膜半径r,通过光轴方向可以计算出角膜中心C。根据这些已知条件要计算光源在角膜上的反射点X。根据反射原理,L、O、C和X四个点共面于P,
Figure BDA0003737922690000051
表示向量XL与向量n的夹角,
Figure BDA0003737922690000052
表示向量XO与向量n的夹角,这两个夹角相等,记作α。
设CL与角膜球面的交点为A,CO与角膜球面的交点为B,得到向量CL与向量CO在平面P上的角平分线与角膜球面的交点为X′,具体为:
Figure BDA0003737922690000053
计算向量点积
Figure BDA0003737922690000054
Figure BDA0003737922690000055
若前者大,则X′点作为新的B点,反之X′点作为新的A点,根据上一步骤计算得到新的X′点,并与原来的X′点计算欧氏距离,当欧氏距离小于某一个设定阈值后(这个阈值应当近似于0),则将该点作为反射点X,计算结束。若大于这个阈值,重复上述操作直至计算结束,以达到迭代优化的目的。
步骤5)中,在得到瞳孔特征和普尔钦斑的预测投影位置后,适当扩大若干个像素点的选区边缘,在选区内检测k时刻的对应特征,并更新卡尔曼滤波参数。
本发明的有益效果是:
本发明创建了一种基于三维眼球模型和卡尔曼滤波的注视特征跟踪方法,具有如下有益效果:(1)特征跟踪可以避免特征检测过程中受外界干扰等因素引起的特征精度和置信度低甚至检测失败的情况;(2)对三维眼球姿态的跟踪更加符合空间中眼球连续运动的真实状态,对特征的跟踪能够加速特征检测工作,提高整个过程的实时性,为后续眼动追踪的研究提供了重要基础。效果具体表现为:
在特征检测过程中,若瞳孔受睫毛、眼睑遮挡,那么此时检测到的瞳孔特征的精度和置信度都会降低。当红外光源在眼球非角膜区域发生反射时,若在特征检测中将该点视作普尔钦斑,会导致后续的研究工作出错。通过基于三维眼球模型和卡尔曼滤波的特征跟踪方法能够很好地预测眼球连续运动的运动轨迹,避免因上述因素而导致特征不可靠的情况出现。
在计算红外光源在角膜上的反射落点的方法上,本发明从数学角度进行了优化,计算速度快,误差可控且很小。
通过特征跟踪的方法可以缩小特征检测的范围,对特征检测的性能起到了正优化作用。
附图说明
图1是本发明方法的总体流程图。
图2是本发明方法采用的简化眼球模型。
图3是本发明方法计算普尔钦斑反射点的迭代优化示意图。
具体实施方式
下面结合附图进一步说明本发明的技术方案。需要指出的是,下面描述中的附图仅仅是本说明书的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本说明书应用于其它类似情景。
如图1所示,本发明的具体实施步骤如下:
1)将眼动视频转换为序列帧。如果当前帧为闭眼状态,则跳过该帧。检测前一部分图像帧的眼动特征,包括瞳孔特征和普尔钦斑特征。
2)得到步骤1)中的特征信息后,将二维信息作为输入计算构建得到可靠的三维眼球模型。
3)计算上一图像帧在三维眼球模型中的眼球姿态,并作为卡尔曼滤波的初值,预测当前帧的眼球姿态。
4)基于三维眼球模型计算瞳孔和普尔钦斑在成像平面上的位置。
5)得到步骤4)的投影位置后,适当扩大选区边缘,在选区内检测当前帧的特征,并使用检测到的特征信息更新卡尔曼滤波参数。
6)重复上述步骤3)至5),直至人眼视频帧序列输入结束。
如图2所示,步骤2)采用的是简化眼球模型,主体由两个半径不同的共轴球体组成,半径较小的是角膜,较大的是眼球,且角膜有固有的折射率。
其中步骤3)的具体实施步骤为:
采用的卡尔曼滤波是一种高效的自回归滤波器,能够从一系列不完全及包含噪声的测量中估计动态系统的状态,利用前一时刻的状态来计算得到当前时刻下的状态的最优估计。
具体的,卡尔曼滤波的系统过程模型和观测模型可以表示为:
xk=F·xk+B·uk+wk (1)
zk=H·xk+vk (2)
其中xk是k时刻的系统状态,uk是k时刻对系统的控制量。zk取k时刻的观测值,H是观测系统的参数。wk和vk分别表示过程和观测的噪声,它们的协方差分别是Q和R。
xk这里设定为
Figure BDA0003737922690000071
共6个状态量,分别为仰角、方向角、仰角速度、方向角速度、仰角加速度和方向角加速度。zk取状态量中的2个,设定为
Figure BDA0003737922690000072
卡尔曼滤波算法的操作包括两个阶段:预测与更新。
预测过程:假设k时刻为当前时刻,滤波器使用上一时刻即k-1时刻的状态的估计,做出对k时刻系统状态的估计。
更新过程:滤波器利用对k时刻状态的观测值,优化在预测阶段获得的预测值,并计算下一时刻即k+1时刻的估计值。
卡尔曼滤波预测估计方程:
x(k|k-1)=F·x(k-1|k-1)+B·uk (3)
P(k|k-1)=F·P(k-1|k-1)·FT+Qk (4)
卡尔曼滤波更新修正过程:
Kk=P(k|k-1)·HT·(H·P(k|k-1)·HT+Rk)-1 (5)
x(k∣k)=x(k∣k-1)+Kk·(zk-H·x(k∣k-1)) (6)
P(k|k)=(I-Kk·H)·P(k|k-1) (7)
其中,xk|k-1是根据k-1时刻预测的k时刻结果,xk-1|k-1是k-1时刻的最优结果,xk|k是k时刻的最优结果,Pk|k-1是xk|k-1对应的协方差,Pk-1|k-1是xk-1|k-1对应的协方差,Kk是卡尔曼增益,I是单位矩阵。
仰角θ和方向角
Figure BDA0003737922690000081
是球坐标系中的构成要素,需要从笛卡尔坐标系转换过来,具体过程:
在三维眼球模型已构建的前提下,眼球中心在笛卡尔坐标系中的位置基本不变,设该点为S(xs,ys,zs),上一帧的瞳孔中心为点P(xp,yp,zp),以眼球中心为球坐标中心,得到瞳孔中心点P相对于眼球中心的坐标为Ps(x,y,z)=(xp-xs,yp-ys,zp-zs),点Ps在球坐标系下的坐标
Figure BDA0003737922690000082
这里在坐标系转换过程中进行了适当修改,转换方程表示为:
Figure BDA0003737922690000083
Figure BDA0003737922690000084
Figure BDA0003737922690000085
由于人类生理构造的原因,瞳孔转动只会发生在眼球中心的一侧,即瞳孔中心相对于眼球中心所处笛卡尔坐标系的z轴值均为同一个方向,这里将笛卡尔坐标系的z轴和y轴分别作为球坐标系的y轴和z轴,这样保证了
Figure BDA0003737922690000086
步骤4)中的计算瞳孔和普尔钦斑在成像平面上的位置包括坐标系转换和计算投影两个阶段,具体为:
通过卡尔曼滤波得到当前k时刻的状态估计,需要将球坐标系下的
Figure BDA0003737922690000091
再转换到笛卡尔坐标下的Ps(x,y,z),转换方程表示为:
Figure BDA0003737922690000092
y=r cosθ (12)
Figure BDA0003737922690000093
通过Ps(x,y,z)和S(xs,ys,zs)还原P(xp,yp,zp),进而计算瞳孔和普尔钦斑在成像平面上的位置。
瞳孔中心坐标和普尔钦斑从三维空间到二维平面上的投影关系应符合眼球成像规律。这里以小孔成像为例,投影关系具体如下:
Figure BDA0003737922690000094
其中,(x,y,z)是三维空间中的点坐标,rw和rh分别为相机在x和y方向上的分辨率,f是相机焦距。
瞳孔投影到二维平面上的椭圆的长轴、短轴和倾角可通过三维眼球模型计算得到。
普尔钦斑是红外光源在人眼角膜上反射的亮斑。如图3,本发明使用一种迭代优化的方法去近似计算该点,具体方法为:
已知相机光心O、眼球中心S、已标定的LED光源位置L,通过卡尔曼滤波跟踪得到的光轴方向
Figure BDA0003737922690000095
角膜半径r,通过光轴方向可以计算出角膜中心C。根据这些已知条件要计算光源在角膜上的反射点X。根据反射原理,L、O、C和X四个点共面于P,
Figure BDA0003737922690000096
表示向量XL与向量n的夹角,
Figure BDA0003737922690000097
表示向量XO与向量n的夹角,这两个夹角相等,记作α。
设CL与角膜球面的交点为A,CO与角膜球面的交点为B,得到向量CL与向量CO在平面P上的角平分线与角膜球面的交点为X′,具体为:
Figure BDA0003737922690000101
计算向量点积
Figure BDA0003737922690000102
Figure BDA0003737922690000103
若前者大,则X′点作为新的B点,反之X′点作为新的A点,根据上一步骤计算得到新的X′点,并与原来的X′点计算欧氏距离,当欧氏距离小于某一个设定阈值后(这个阈值应当近似于0),则将该点作为反射点X,计算结束。若大于这个阈值,重复上述操作直至计算结束,以达到迭代优化的目的。
步骤5)中,在得到瞳孔特征和普尔钦斑的预测投影位置后,适当扩大若干个像素点的选区边缘,在选区内检测k时刻的对应特征,并更新卡尔曼滤波参数。
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。

Claims (6)

1.一种基于三维眼球模型和卡尔曼滤波的注视特征跟踪方法,包括下列步骤:
1)将眼动视频转换为序列帧,检测前一部分图像帧的眼动特征,包括瞳孔特征和普尔钦斑特征。
2)得到步骤1)中的特征信息后,将二维信息作为输入计算构建得到可靠的三维眼球模型。
3)计算上一图像帧在三维眼球模型中的眼球姿态,并作为卡尔曼滤波的初值,预测当前帧的眼球姿态。
4)基于三维眼球模型计算瞳孔和普尔钦斑在成像平面上的位置。
5)得到步骤4)的投影位置后,适当扩大选区边缘,在选区内检测当前帧的特征,并使用检测到的特征信息更新卡尔曼滤波参数。
6)重复上述步骤3)至5),直至人眼视频帧序列输入结束。
2.如权利要求1所述的一种基于三维眼球模型和卡尔曼滤波的注视特征跟踪方法,其特征是,步骤2)中采用的是简化眼球模型,主体由两个半径不同的共轴球体组成,半径较小的是角膜,较大的是眼球,且角膜有固有的折射率。
3.如权利要求1所述的一种基于三维眼球模型和卡尔曼滤波的注视特征跟踪方法,其特征是,步骤3)中采用的卡尔曼滤波是一种高效的自回归滤波器,能够从一系列不完全及包含噪声的测量中估计动态系统的状态,利用前一时刻的状态来计算得到当前时刻下的状态的最优估计。
4.如权利要求3所述的一种基于三维眼球模型和卡尔曼滤波的注视特征跟踪方法,其特征是,卡尔曼滤波的系统过程模型和观测模型可以表示为:
xk=F·xk+B·uk+wk (1)
zk=H·xk+vk (2)
其中xk是k时刻的系统状态,uk是k时刻对系统的控制量。zk取k时刻的观测值,H是观测系统的参数。wk和vk分别表示过程和观测的噪声,它们的协方差分别是Q和R。
xk这里设定为
Figure FDA0003737922680000021
共6个状态量,分别为仰角、方向角、仰角速度、方向角速度、仰角加速度和方向角加速度。zk取状态量中的2个,设定为
Figure FDA0003737922680000022
卡尔曼滤波算法的操作包括两个阶段:预测与更新。
预测过程:假设k时刻为当前时刻,滤波器使用上一时刻即k-1时刻的状态的估计,做出对k时刻系统状态的估计。
更新过程:滤波器利用对k时刻状态的观测值,优化在预测阶段获得的预测值,并计算下一时刻即k+1时刻的估计值。
卡尔曼滤波预测估计方程:
x(k|k-1)=F·x(k-1|k-1)+B·uk (3)
P(k|k-1)=F·P(k-1|k-1)·FT+Qk (4)
卡尔曼滤波更新修正过程:
Kk=P(k|k-1)·HT·(H·P(k|k-1)·HT+Rk)-1 (5)
x(k|k)=x(k|k-1)+Kk·(zk-H·x(k|k-1)) (6)
P(k|k)=(I-Kk·H)·P(k|k-1) (7)
其中,xk|k-1是根据k-1时刻预测的k时刻结果,xk-1|k-1是k-1时刻的最优结果,xk|k是k时刻的最优结果,Pk|k-1是xk|k-1对应的协方差,Pk-1|k-1是xk-1|k-1对应的协方差,Kk是卡尔曼增益,I是单位矩阵。
5.如权利要求4所述的一种基于三维眼球模型和卡尔曼滤波的注视特征跟踪方法,其特征是,卡尔曼滤波的状态值为,其中仰角θ和方向角
Figure FDA0003737922680000023
是球坐标系中的构成要素,需要从笛卡尔坐标系转换过来,具体过程:
在三维眼球模型已构建的前提下,眼球中心在笛卡尔坐标系中的位置基本不变,设该点为v(xs,ys,zs),上一帧的瞳孔中心为点P(xp,yp,zp),以眼球中心为球坐标中心,得到瞳孔中心点P相对于眼球中心的坐标为Ps(x,y,z)=(xp-xs,yp-ys,zp-zs),点Ps在球坐标系下的坐标
Figure FDA0003737922680000031
这里在坐标系转换过程中进行了适当修改,转换方程表示为:
Figure FDA0003737922680000032
Figure FDA0003737922680000033
Figure FDA0003737922680000034
由于人类生理构造的原因,瞳孔转动只会发生在眼球中心的一侧,即瞳孔中心相对于眼球中心所处笛卡尔坐标系的z轴值均为同一个方向,这里将笛卡尔坐标系的z轴和y轴分别作为球坐标系的y轴和z轴,这样保证了
Figure FDA0003737922680000035
6.如权利要求1所述的一种基于三维眼球模型和卡尔曼滤波的注视特征跟踪方法,其特征是,步骤4)中的计算瞳孔和普尔钦斑在成像平面上的位置包括坐标系转换和计算投影两个阶段,具体为:
通过卡尔曼滤波得到当前k时刻的状态估计,需要将球坐标系下的
Figure FDA0003737922680000036
再转换到笛卡尔坐标下的Ps(x,y,z),转换方程表示为:
Figure FDA0003737922680000037
y=r cosθ (12)
Figure FDA0003737922680000038
通过Ps(x,y,z)和S(xs,ys,zs)还原P(xp,yp,zp),进而计算瞳孔和普尔钦斑在成像平面上的位置。
瞳孔中心坐标和普尔钦斑从三维空间到二维平面上的投影关系应符合眼球成像规律。这里以小孔成像为例,则投影关系具体如下:
Figure FDA0003737922680000039
其中,(x,y,z)是三维空间中的点坐标,rw和rh分别为相机在x和y方向上的分辨率,f是相机焦距。
瞳孔投影到二维平面上的椭圆的长轴、短轴和倾角可通过三维眼球模型计算得到。
普尔钦斑是红外光源在人眼角膜上反射的亮斑。本发明使用一种迭代优化的方法去近似计算该点,具体方法为:
已知相机光心O、眼球中心S、已标定的LED光源位置L,通过卡尔曼滤波跟踪得到的光轴方向
Figure FDA0003737922680000046
角膜半径r,通过光轴方向可以计算出角膜中心C。根据这些已知条件要计算光源在角膜上的反射点X。根据反射原理,L、O、C和X四个点共面于P,
Figure FDA0003737922680000041
表示向量XL与向量n的夹角,
Figure FDA0003737922680000042
表示向量XO与向量n的夹角,这两个夹角相等,记作α。
设CL与角膜球面的交点为A,CO与角膜球面的交点为B,得到向量CL与向量CO在平面P上的角平分线与角膜球面的交点为X′,具体为:
Figure FDA0003737922680000043
计算向量点积
Figure FDA0003737922680000044
Figure FDA0003737922680000045
若前者大,则X′点作为新的B点,反之X′点作为新的A点,根据上一步骤计算得到新的X′点,并与原来的X′点计算欧氏距离,当欧氏距离小于某一个设定阈值后(这个阈值应当近似于0),则将该点作为反射点X,计算结束。若大于这个阈值,重复上述操作直至计算结束,以达到迭代优化的目的。
CN202210806512.1A 2022-07-08 2022-07-08 一种基于三维眼球模型和卡尔曼滤波的注视特征跟踪方法 Active CN115147462B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210806512.1A CN115147462B (zh) 2022-07-08 2022-07-08 一种基于三维眼球模型和卡尔曼滤波的注视特征跟踪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210806512.1A CN115147462B (zh) 2022-07-08 2022-07-08 一种基于三维眼球模型和卡尔曼滤波的注视特征跟踪方法

Publications (2)

Publication Number Publication Date
CN115147462A true CN115147462A (zh) 2022-10-04
CN115147462B CN115147462B (zh) 2023-07-21

Family

ID=83411503

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210806512.1A Active CN115147462B (zh) 2022-07-08 2022-07-08 一种基于三维眼球模型和卡尔曼滤波的注视特征跟踪方法

Country Status (1)

Country Link
CN (1) CN115147462B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101699510A (zh) * 2009-09-02 2010-04-28 北京科技大学 视线追踪系统中的基于粒子滤波的瞳孔跟踪方法
CN102125422A (zh) * 2010-01-12 2011-07-20 北京科技大学 视线追踪系统中基于瞳孔-角膜反射的视线估计方法
CN104951084A (zh) * 2015-07-30 2015-09-30 京东方科技集团股份有限公司 视线追踪方法及装置
CN107506705A (zh) * 2017-08-11 2017-12-22 西安工业大学 一种瞳孔‑普尔钦斑视线跟踪与注视提取方法
CN107784280A (zh) * 2017-10-18 2018-03-09 张家港全智电子科技有限公司 一种动态瞳孔跟踪方法
US20180350070A1 (en) * 2017-05-31 2018-12-06 Fujitsu Limited Recording medium storing computer program for pupil detection, information processing apparatus, and pupil detecting method
US20180357790A1 (en) * 2017-06-09 2018-12-13 Aisin Seiki Kabushiki Kaisha Gaze-tracking device, computable readable medium, and method
CN110913751A (zh) * 2017-06-30 2020-03-24 聂小春 具有滑动检测和校正功能的可穿戴眼睛跟踪系统
CN113348487A (zh) * 2019-01-29 2021-09-03 埃韦视觉有限公司 眼睛跟踪设备及其方法
WO2021204449A1 (en) * 2020-04-09 2021-10-14 Irisbond Crowdbonding, S.L. Method for eye gaze tracking

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101699510A (zh) * 2009-09-02 2010-04-28 北京科技大学 视线追踪系统中的基于粒子滤波的瞳孔跟踪方法
CN102125422A (zh) * 2010-01-12 2011-07-20 北京科技大学 视线追踪系统中基于瞳孔-角膜反射的视线估计方法
CN104951084A (zh) * 2015-07-30 2015-09-30 京东方科技集团股份有限公司 视线追踪方法及装置
US20180350070A1 (en) * 2017-05-31 2018-12-06 Fujitsu Limited Recording medium storing computer program for pupil detection, information processing apparatus, and pupil detecting method
US20180357790A1 (en) * 2017-06-09 2018-12-13 Aisin Seiki Kabushiki Kaisha Gaze-tracking device, computable readable medium, and method
CN110913751A (zh) * 2017-06-30 2020-03-24 聂小春 具有滑动检测和校正功能的可穿戴眼睛跟踪系统
CN107506705A (zh) * 2017-08-11 2017-12-22 西安工业大学 一种瞳孔‑普尔钦斑视线跟踪与注视提取方法
CN107784280A (zh) * 2017-10-18 2018-03-09 张家港全智电子科技有限公司 一种动态瞳孔跟踪方法
CN113348487A (zh) * 2019-01-29 2021-09-03 埃韦视觉有限公司 眼睛跟踪设备及其方法
WO2021204449A1 (en) * 2020-04-09 2021-10-14 Irisbond Crowdbonding, S.L. Method for eye gaze tracking

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
AMER AL-RAHAYFEH AND MIAD FAEZIPOUR: "Eye Tracking and Head Movement Detection: A State-of-Art Survey", 《REHABILITATION DEVICES AND SYSTEMS》, pages 1 - 12 *
JIAN-NAN CHI 等: "Hybrid Particle and Kalman Filtering for Pupil Tracking in Active IR Illumination Gaze Tracking System", 《MATHEMATICAL PROBLEMS IN ENGINEERING》, pages 1 - 18 *
QIANG JI 等: "Real Time Visual Cues Extraction for Monitoring Driver Vigilance", 《SPRINGER-VERLAG BERLIN HEIDELBERG 2001》, pages 107 - 124 *
王亚飞: "复杂光环境下人眼视线追踪技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, pages 138 - 36 *
苟超 等: "眼动跟踪研究进展与展望", 《自动化学报》, vol. 48, no. 5, pages 1173 - 1192 *

Also Published As

Publication number Publication date
CN115147462B (zh) 2023-07-21

Similar Documents

Publication Publication Date Title
JP6586523B2 (ja) 構造化光を用いた視線追跡
EP3413234B1 (en) Gaze-tracking device, gaze-tracking method, program, and computer-readable medium
US7043056B2 (en) Facial image processing system
US11715231B2 (en) Head pose estimation from local eye region
JP2019519859A (ja) 視線追跡を実行するシステム及び方法
JP5578603B2 (ja) 視線制御装置、視線制御方法、及びそのプログラム
CN108170279A (zh) 头显设备的眼动和头动交互方法
US20220100268A1 (en) Eye tracking device and a method thereof
US11287882B2 (en) Translating combinations of user gaze direction and predetermined facial gestures into user input instructions for near-eye-display (NED) devices
US11321965B2 (en) Scalable gesture and eye-gaze tracking in virtual, augmented, and mixed reality (xR) applications
US20230116638A1 (en) Method for eye gaze tracking
US10855979B2 (en) Interpreting eye gaze direction as user input to near-eye-display (NED) devices for enabling hands free positioning of virtual items
US20210041943A1 (en) Eye tracking architecture
CN113160260B (zh) 一种头眼双通道智能人机交互系统及运行方法
CN114973389A (zh) 一种基于耦合级联回归的眼动追踪方法
CN111526286B (zh) 控制电机运动的方法、系统及终端设备
CN115147462B (zh) 一种基于三维眼球模型和卡尔曼滤波的注视特征跟踪方法
CN114022514A (zh) 一种融合头部姿态和眼球跟踪的实时视线推断方法
CN113963416A (zh) 一种基于激光视觉反馈的眼动交互方法及系统
Villanueva et al. A geometric approach to remote eye tracking
CN115937432A (zh) 基于多模态输入的人体动作重建系统及方法
Han et al. User-independent gaze estimation by extracting pupil parameter and its mapping to the gaze angle
Zhu et al. A novel target tracking method of unmanned drones by gaze prediction combined with YOLO algorithm
Karakaya et al. Gaze estimation for off-angle iris recognition based on the biometric eye model
Du et al. A Swift Gaze Estimate Method Based On The Corneal Image System

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant