CN111582120A - 用于捕捉眼球活动特征的方法、终端设备 - Google Patents

用于捕捉眼球活动特征的方法、终端设备 Download PDF

Info

Publication number
CN111582120A
CN111582120A CN202010358128.0A CN202010358128A CN111582120A CN 111582120 A CN111582120 A CN 111582120A CN 202010358128 A CN202010358128 A CN 202010358128A CN 111582120 A CN111582120 A CN 111582120A
Authority
CN
China
Prior art keywords
depth image
feature point
face
key
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010358128.0A
Other languages
English (en)
Inventor
生金龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Youle Technology Co ltd
Original Assignee
Beijing Youle Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Youle Technology Co ltd filed Critical Beijing Youle Technology Co ltd
Priority to CN202010358128.0A priority Critical patent/CN111582120A/zh
Publication of CN111582120A publication Critical patent/CN111582120A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/165Detection; Localisation; Normalisation using facial parts and geometric relationships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • G06V40/171Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/18Eye characteristics, e.g. of the iris
    • G06V40/193Preprocessing; Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/18Eye characteristics, e.g. of the iris
    • G06V40/197Matching; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Ophthalmology & Optometry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Geometry (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本公开的实施例公开了用于捕捉眼球活动特征的方法、终端设备。该方法的一具体实施方式包括:获取表演者的面部数据;生成深度图像对应于预先确定的人脸检测模型的面部关键区域的各个特征点的特征点坐标集合;生成深度图像的关键参数;生成深度图像的眼球活动特征。这种方法利用深度图像,能够直接获取表演者面部的三维特征,同时,利用预先确定的人脸检测模型确定表演者的面部数据中每个深度图像的面部关键区域的各个特征点的特征点坐标集合,基于特征点坐标集合,确定深度图像的关键参数,基于深度图像的关键参数,方便用户捕捉有效的眼球活动特征。

Description

用于捕捉眼球活动特征的方法、终端设备
技术领域
本公开实施例涉及运动捕捉和数据表示领域,具体涉及一种眼球活动特征捕获和预处理作用的组合方法、电子设备。
背景技术
随着运动捕捉技术的快速发展,运动捕捉系统在影视、动画制作上被广泛应用。目前,大多数运动捕捉系统通过跟踪粘帖在表演者面部标识点的方式对面部表情进行捕捉,这种捕捉方式对表情具有较大的束缚性,标识点极易脱落,降低了表演者对模型表情的精细化控制,此外,这种捕捉方式依赖于专业的设备来完成,技术复杂度高、成本高。因此,在无任何辅助标识点的条件下,利用运动捕捉技术实现对面部表情的定位以及捕获面部表情特征,已经成为运动捕捉技术中的热点问题。眼睛是用于表征面部表情的重要器官,闭眼后捕捉眼睛特征的技术复杂度高、准确度差。
发明内容
本公开实施例提出了一种用于捕捉眼球活动特征的方法。
第一方面,本公开实施例提供了一种用于捕捉眼球活动特征的方法,该方法包括:获取表演者的面部数据,其中,面部数据包括深度图像;生成深度图像对应于预先确定的人脸检测模型的面部关键区域的各个特征点的特征点坐标集合;基于深度图像的面部关键区域的特征点坐标集合,生成深度图像的关键参数;基于深度图像的关键参数,生成深度图像的眼球活动特征。
在一些实施例中,获取表演者的面部数据,包括:启动深度摄像机;接收深度摄像机返回的视频数据,其中,视频数据包括第一数目帧图像;将视频数据转化为深度图像序列,其中,深度图像序列包括第一数目个深度图像;将深度图像序列保存为面部数据。
在一些实施例中,该方法还包括:基于人脸检测模型,生成面部关键区域的各个特征点的特征点初始坐标集合,其中,面部关键区域包括左眼部区域、右眼部区域、左眉部区域、右眉部区域、口部区域、鼻部区域。
在一些实施例中,生成深度图像对应于预先确定的人脸检测模型的面部关键区域的各个特征点的特征点坐标集合,包括:基于人脸检测模型,生成深度图像的面部关键区域的各个特征点的特征点集合;生成深度图像的脸部及五官轮廓;对脸部及五官轮廓进行对齐归一化处理;对于特征点集合中的每个特征点,沿脸部及五官轮廓的法线方向扩展以及完成灰度匹配,更新特征点集合;确定特征点集合中每个特征点的坐标。
在一些实施例中,基于深度图像的面部关键区域的特征点坐标集合,生成深度图像的关键参数,包括:基于深度图像的面部关键区域的特征点坐标集合,确定每个特征点的主关键点和次关键点,得到主关键点集合和次关键点集合;将所得到的主关键点集合和所述次关键点集合,确定为深度图像的关键参数。
在一些实施例中,该用于捕捉眼球活动特征的方法还包括:生成每个特征点与每个特征点的主关键点和次关键点的对应关系表。
在一些实施例中,基于深度图像的关键参数,生成深度图像的眼球活动特征,包括:将面部关键区域的特征点初始坐标集合与深度图像的关键参数进行匹配,生成面部关键区域的特征点集合的坐标差值集合,其中,利用深度图像的关键参数中对应于第n个特征点的关键参数的坐标P(n)和面部关键区域的特征点初始坐标集合中的第n个特征点的初始坐标P_ori(n),得到第n个特征点的坐标差值为D(n)=P(n)-P_ori(n);将深度图像的面部关键区域的所有特征点的坐标差值与对应的权重系数相乘后,对加权结果求和,得到深度图像的眼球活动特征。
第二方面,本公开实施例提供了一种终端设备,该终端设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如第一方面中任一实现方式描述的方法。
第三方面,本公开实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如第一方面中任一实现方式描述的方法。
本公开实施例提供一种用于捕捉眼球活动特征的方法,获取表演者的面部数据,其中,面部数据包括深度图像;生成深度图像对应于预先确定的人脸检测模型的面部关键区域的各个特征点的特征点坐标集合;基于深度图像的面部关键区域的特征点坐标集合,生成深度图像的关键参数;基于深度图像的关键参数,生成深度图像的眼球活动特征。
本公开的上述各个实施例中的一个实施例具有如下有益效果:使用深度摄像机获取面部数据,无需对面部数据进行三维重建可以直接得到包含表演者面部区域三维特征的深度信息。利用预先确定的人脸检测模型,直接提取面部数据中的每个深度图像的关键参数,利用关键参数可以直接生成深度图像的眼球活动特征。本公开的实施例利用深度图像,能够直接获取表演者面部的三维特征。同时,利用预先确定的人脸检测模型确定表演者的面部数据中每个深度图像的面部关键区域的各个特征点的特征点坐标集合。基于特征点坐标集合,确定深度图像的关键参数,基于深度图像的关键参数,方便用户捕捉有效的眼球活动特征。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:
图1是本公开的一些实施例可以应用于其中的示例性系统的架构图;
图2是根据本公开的用于捕捉眼球活动特征的方法的一些实施例的流程图;
图3是根据本公开的一些实施例的利用主动形状模型提取面部关键区域的特征点的示意图;
图4是适于用来实现本公开的一些实施例的终端设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
下面将参考附图并结合实施例来详细说明本公开。
图1示出了可以应用本公开的用于捕捉眼球活动特征的方法的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如数字签名应用、特征提取应用、运动捕捉应用等。
终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏的各种终端设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的终端设备中。其可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103输入的目标数据进行眼球活动特征捕捉的服务器等。服务器可以基于接收到的目标数据进行眼球活动特征捕捉等处理,并将处理结果(例如眼球活动特征)反馈给终端设备。
需要说明的是,本公开实施例所提供的用于捕捉眼球活动特征的方法可以由服务器105,也可以由终端设备101、102、103执行。
还需要指出的是,终端设备101、102、103中也可以安装有眼球活动特征捕捉类应用,此时,处理方法也可以由终端设备101、102、103执行。此时,示例性系统架构100也可以不包括服务器105和网络104。
需要说明的是,服务器105可以是硬件,也可以是软件。当服务器105为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器为软件时,可以实现成多个软件或软件模块(例如用来提供眼球活动特征捕捉处理),也可以实现成单个软件或软件模块。在此不做具体限定。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本公开的用于捕捉眼球活动特征的方法的一些实施例的流程200。该用于捕捉眼球活动特征的方法,包括以下步骤:
步骤201,获取表演者的面部数据。
在一些实施例中,用于捕捉眼球活动特征的方法的执行主体(例如图1所示的终端设备)获取表演者的面部数据。可选的,该执行主体启动深度摄像机,接收所述深度摄像机返回的视频数据,其中,所述视频数据包括第一数目帧图像。与传统的通过立体视觉分析重构三维特征的摄像机不同,深度摄像机可以获取平面图像,也可以获取所拍摄对象的深度信息,也就是三维的位置和尺寸信息。深度摄像机的摄像头可以是深度摄像头。可选的,深度摄像机使用的技术可以是结构光技术、飞行时间法技术和双目多角立体成像技术。可选的,使用飞行时间法技术的摄像头通过连续发射光脉冲到被观测物体上,然后接收从物体反射回去的光脉冲,通过探测光脉冲的往返飞行时间来计算被测物体离相机的距离。
可选的,深度图像包含了表征所拍摄对象的深度信息,其中,深度信息是指所拍摄对象的三维特征。深度图像可以是指将从深度摄像机到所拍摄对象中各点的距离(深度)作为像素值的图像,它直接反映了所拍摄对象可见表面的几何形状。深度图像经过坐标转换可以计算为点云数据,有规则及必要信息的点云数据也可以反算为深度图像数据。深度图像中每一个像素点代表的是在深度摄像机的深度感应器的视野中,该像素点(x,y)坐标处所拍摄对象到离摄像头平面最近的所拍摄对象到该平面的距离(以毫米为单位),其中x表示水平方向的横坐标、y表示竖直方向的纵坐标。可选的,点云数据是指扫描所拍摄的对象并以点的形式记录,每一个点包含有三维坐标,也可以包含颜色信息或反射强度信息。
可选的,将深度摄像机得到的视频数据转化为深度图像序列,其中,该深度图像序列包括第一数目个深度图像。将第一数目个深度图像序列保存为面部数据,其中,面部数据包括第一数目个深度图像。
步骤202,生成深度图像对应于预先确定的人脸检测模型的面部关键区域的各个特征点的特征点坐标集合。
在一些实施例中,上述执行主体对于面部数据中的第二个至第一数目个深度图像,生成该深度图像对应于预先确定的人脸检测模型的面部关键区域的各个特征点的特征点坐标集合。其中,面部关键区域包括左眼部区域、右眼部区域、左眉部区域、右眉部区域、口部区域、鼻部区域。
在一些实施例的一些可选的实现方式中,上述执行主体基于预先确定的人脸检测模型,对于面部数据中的第一个深度图像,生成面部关键区域的各个特征点的特征点初始坐标集合。可选的,预先确定的人脸检测模型可以是主动形状模型。将第一张深度图像输入到人脸检测模型中,输出第一张深度图像中的面部关键区域的各个特征点的特征点初始坐标集合。
主动形状模型是一种基于统计学的主动外观模型,将第一张深度图像输入主动形状模型后,得到该第一张深度图像的主动形状模型特征点集合。其中,在人脸轮廓区域内部,主动形状模型特征点的数量的取值范围是[20,68],具体的,主动形状模型特征点的数量可以是68个。
利用所述人脸检测模型得到第一张深度图像的初始主动形状模型特征点集合,生成第一张深度图像的脸部及五官轮廓。具体的,使用第一张深度图像的初始主动形状模型特征点的横坐标和纵坐标组成形状向量X1表征第一张深度图像的脸部及五官轮廓:
X1=(x11,y11,x12,y12,...,x1k,y1k)T
其中,x表示横坐标,y表示纵坐标,右下角标的第一个数字“1”表示第一张深度图像,右下角标的第二个数字表示特征点记数,x11表示初始主动形状模型第一个特征点的横坐标,y11表示初始主动形状模型第一个特征点的纵坐标,x12表示初始主动形状模型第二个特征点的横坐标,y12表示初始主动形状模型第二个特征点的纵坐标,x1k表示初始主动形状模型第k个特征点的横坐标,yk表示初始主动形状模型第k个特征点的纵坐标,具体的,k可以是68。响应于k为68,X1=(x11,y11,x12,y12,...,x168,y168)T。响应于k为20,X1=(x11,y11,x12,y12,...,x120,y120)T。对该脸部及五官轮廓进行对齐归一化处理,包括但不限于旋转、缩放、平移等等。
对于第一张深度图像的初始主动形状模型特征点集合中的每个特征点,执行下述步骤一,得到每个特征点的灰度值。
步骤一:根据形状向量X1中特征点的排序,对于第k个特征点,找到其前后两个特征点:特征点k-1和特征点k+1。确定特征点k-1和特征点k+1连线方向的法线方向。在第一张深度图像中,沿着该法线方向,在特征点k的横坐标方向的左侧和右侧分别找m个像素点。这m个像素点的灰度值构成一个2m+1长度的向量gk。gk为特征点k的灰度值,其中,k表示第k个特征点,g表示灰度值。
对于第一张深度图像的初始主动形状模型特征点集合中的每个特征点,计算其3x3大小的邻域内的每个像素的灰度值与该特征点灰度值的差值,将该3x3大小的邻域内与该特征点灰度值的差值最小的像素确定为第一张深度图像的初始主动形状模型特征点。利用更新得到的每个第一张深度图像的初始主动形状模型特征点,更新第一张深度图像的初始主动形状模型特征点集合X1中对应的元素,得到最终的第一张深度图像的初始主动形状模型特征点集合。
利用所述人脸检测模型得到第一张深度图像的主动形状模型特征点集合,输出第一张深度图像的主动形状模型特征点集合中每个特征点的坐标,生成第一张深度图像中的面部关键区域的各个特征点的特征点初始坐标集合。
可选的,闭眼后眼球的活动情况,可以通过嘴角运动态势,提唇肌、眉弓运动态势,头部运动态势等,得到眼球活动范围。可选的,表演者撇嘴时眼睛向下看,眉弓上扬时眼睛向上看。在动态捕捉过程中,侦测到人物闭眼且在撇嘴,则判定其眼睛是向下看的,从而可以估计得到闭眼时眼球在眼睑内运动引起的眼睑鼓起位置的变化。可选的,使用嘴角、眉弓、头部、提唇肌的坐标,可以计算得出当前眼睛的朝向,从而估计闭眼后眼睛的运动轨迹。
继续参考图3,示出了根据本公开的利用主动形状模型提取面部关键区域的特征点的一个示意图。
在图3的应用场景中,服务器301利用用于捕捉眼球活动特征的方法,生成第一张深度图像中的面部关键区域的各个特征点的特征点初始坐标集合302,可选的,主动形状模型关键点的数量可以是68个。其中,编号17、18、19、20、21对应的特征点为左眉部区域的特征点,编号22、23、24、25、26对应的特征点为右眉部区域的特征点,编号36、37、38、39、40、41对应的特征点为左眼部区域的特征点,编号42、43、44、45、46、47对应的特征点为右眼部区域的特征点,编号48-67对应的特征点为口部区域的特征点,编号31、32、33、34、35对应的特征点为鼻部区域的特征点。
在一些实施例的一些可选的实现方式中,对于面部数据中的第二张至第一数目张深度图像,循环执行下述步骤二,生成该深度图像对应于预先确定的人脸检测模型的面部关键区域的各个特征点的特征点坐标集合。
步骤二:将该深度图像输入人脸检测模型,可选的,人脸检测模型可以是主动形状模型,得到该深度图像的主动形状模型特征点。其中,主动形状模型特征点的数量可以是68个。
使用该深度图像的主动形状模型特征点的横坐标和纵坐标组成形状向量X2表征该深度图像的脸部及五官轮廓:
X2=(x21,y21,x22,y22,...,x1K,y1K)T
其中,x表示横坐标,y表示纵坐标,右下角标的第一个数字“2”表示该深度图像的主动形状模型特征点。对于面部数据中的第二张至第一数目张深度图像,执行步骤二时都标记为数字“2”。右下角标的第二个数字表示特征点记数,x21表示该深度图像的主动形状模型第一个特征点的横坐标,y21表示该深度图像的主动形状模型第一个特征点的纵坐标,x22表示该深度图像的主动形状模型第二个特征点的横坐标,y22表示该深度图像的主动形状模型第二个特征点的纵坐标,x2K表示该深度图像的主动形状模型第K个特征点的横坐标,y2K表示该深度图像的主动形状模型第K个特征点的纵坐标,具体的,K可以是68。响应于K是68,X2=(x21,y21,x22,y22,...,x168,y168)T。对该脸部及五官轮廓进行对齐归一化处理,包括但不限于旋转、缩放、平移等等。
对于该深度图像的主动形状模型特征点集合中的每个特征点,计算得到每个特征点的灰度值。对于该深度图像的主动形状模型特征点集合中的每个特征点,计算其3x3大小的邻域内的每个像素的灰度值与该特征点灰度值的差值,将该3x3大小的邻域内与该特征点灰度值的差值最小的像素确定为该深度图像的主动形状模型特征点。利用更新得到的每个该深度图像的主动形状模型特征点,更新该深度图像的主动形状模型特征点集合X1中对应的元素,得到最终的该深度图像的主动形状模型特征点集合。确定该深度图像的主动形状模型特征点集合中每个特征点的坐标。
输出该深度图像的主动形状模型特征点集合中每个特征点的坐标,生成该深度图像中的面部关键区域的各个特征点的特征点坐标集合,其中,面部关键区域包括左眼部区域、右眼部区域、左眉部区域、右眉部区域、口部区域、鼻部区域。
步骤203,基于所述深度图像的面部关键区域的特征点坐标集合,生成所述深度图像的关键参数。
在一些实施例中,上述执行主体对于面部数据中的第二张至第一数目张深度图像,基于该深度图像的面部关键区域的各个特征点的特征点坐标集合,循环执行下述步骤三,生成该深度图像的关键参数。
步骤三:计算面部关键区域的各个特征点对应的关键参数。将面部分割成面部关键区域,面部关键区域相互独立,一个区域的动作与另一个区域的动作没有关系,不受另一个区域影响,其中,面部关键区域包括左眼部区域、右眼部区域、左眉部区域、右眉部区域、口部区域、鼻部区域。对于每个面部关键区域,分辨出影响该面部关键区域的主要参数和次要参数,主要参数决定了最大变化程度,次要参数则需要在主要参数基础上叠加,增加描述变化程度。
可选的,上述执行主体根据该深度图像的面部关键区域的特征点坐标集合确定全部特征点,生成该深度图像的面部区域的每个特征点与每个特征点的主关键点和次关键点的对应关系表。将所得到的主关键点集合和所述次关键点集合,确定为所述深度图像的关键参数。具体的,该深度图像的面部区域的每个特征点与每个特征点的主关键点和次关键点的对应关系表见表格1。
表格1
Figure BDA0002474180550000111
步骤204,基于深度图像的关键参数,生成深度图像的眼球活动特征。
在一些实施例中,上述执行主体利用深度图像的关键参数表征眼球的动作情况。具体的,表征的对应情况见表格2。
表格2
Figure BDA0002474180550000112
Figure BDA0002474180550000121
可选的,上述执行主体对于面部数据中的第二张至第一数目张深度图像,基于该深度图像的关键参数和面部关键区域的各个特征点的特征点初始坐标集合,循环执行下述步骤四,生成该深度图像的眼球活动特征。
步骤四:将面部关键区域的特征点初始坐标集合与该深度图像的关键参数进行匹配,生成该深度图像的面部关键区域的特征点集合的坐标差值集合。利用该深度图像的面部关键区域的特征点集合的坐标差值集合确定所述深度图像的眼球活动特征。可选的,令P_ori(n)表示面部关键区域的特征点初始坐标集合中的第n个特征点的初始坐标,n可以是取值范围为1到68的整数,P(n)表示该深度图像的关键参数中对应于第n个特征点的关键参数的坐标,得到第n个特征点的坐标差值为:
D(n)=P(n)-P_ori(n)
计算该深度图像的面部关键区域的所有特征点的坐标差值,得到坐标差值集合。该深度图像包含所拍摄对象的三维特征,可以直接利用坐标差值集合确定该深度图像的眼球活动特征,无需额外的对准或坐标转换、缩放处理。
将该深度图像的坐标差值集合中的各个坐标差值与对应的权重系数相乘后,对加权结果求和,得到该深度图像的眼球活动特征。具体的,权重系数可以是人工设定的。可选的,在闭眼的情况下可以使用左眼部区域、右眼部区域、左眉部区域、右眉部区域、口部区域、鼻部区域的关键点运动情况计算眼球活动特征。
图2给出的一个实施例具有如下有益效果:使用深度摄像机获取面部数据,无需对面部数据进行三维重建可以直接得到包含表演者面部区域三维特征的深度信息。利用预先确定的人脸检测模型,直接提取面部数据中的每个深度图像的关键参数,利用关键参数可以直接生成深度图像的眼球活动特征。本公开的实施例利用深度图像,能够直接获取表演者面部的三维特征,同时,利用预先确定的人脸检测模型确定表演者的面部数据中每个深度图像的面部关键区域的各个特征点的特征点坐标集合,基于特征点坐标集合,确定深度图像的关键参数,基于深度图像的关键参数,方便用户捕捉有效的眼球活动特征。
下面参考图4,其示出了适于用来实现本公开实施例的终端设备的计算机系统400的结构示意图。图4示出的终端设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图4所示,计算机系统400包括中央处理单元(CPU,Central Processing Unit)401,其可以根据存储在只读存储器(ROM,Read Only Memory)402中的程序或者从存储部分408加载到随机访问存储器(RAM,Random Access Memory)403中的程序而执行各种适当的动作和处理。在RAM 403中,还存储有系统400操作所需的各种程序和数据。CPU 401、ROM402以及RAM 403通过总线404彼此相连。输入/输出(I/O,Input/Output)接口405也连接至总线404。
以下部件连接至I/O接口405:包括硬盘等的存储部分406;以及包括诸如LAN(局域网,Local Area Network)卡、调制解调器等的网络接口卡的通信部分407。通信部分407经由诸如因特网的网络执行通信处理。驱动器408也根据需要连接至I/O接口405。可拆卸介质409,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器408上,以便于从其上读出的计算机程序根据需要被安装入存储部分406。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分407从网络上被下载和安装,和/或从可拆卸介质409被安装。在该计算机程序被中央处理单元(CPU)401执行时,执行本公开的方法中限定的上述功能。需要说明的是,本公开所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如C语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (9)

1.一种用于捕捉眼球活动特征的方法,包括:
获取表演者的面部数据,其中,所述面部数据包括深度图像;
生成所述深度图像对应于预先确定的人脸检测模型的面部关键区域的各个特征点的特征点坐标集合;
基于所述深度图像的面部关键区域的特征点坐标集合,生成所述深度图像的关键参数;
基于所述深度图像的关键参数,生成所述深度图像的眼球活动特征。
2.根据权利要求1所述的方法,其中,所述获取表演者的面部数据,包括:
启动深度摄像机;
接收所述深度摄像机返回的视频数据,其中,所述视频数据包括第一数目帧图像;
将所述视频数据转化为深度图像序列,其中,所述深度图像序列包括第一数目个深度图像;
将所述深度图像序列保存为所述面部数据。
3.根据权利要求2所述的方法,其中,所述方法还包括:
基于所述人脸检测模型,生成面部关键区域的各个特征点的特征点初始坐标集合,其中,所述面部关键区域包括左眼部区域、右眼部区域、左眉部区域、右眉部区域、口部区域、鼻部区域。
4.根据权利要求3所述的方法,其中,所述生成所述深度图像对应于预先确定的人脸检测模型的面部关键区域的各个特征点的特征点坐标集合,包括:
基于所述人脸检测模型,生成所述深度图像的面部关键区域的各个特征点的特征点集合;
使用所述深度图像的面部关键区域的特征点的横坐标和纵坐标组成形状向量X2表征所述深度图像的脸部及五官轮廓X2=(x21,y21,x22,y22,...,x2K,y2K)T,其中,x表示横坐标,y表示纵坐标,右下角标的第一个数字“2”表示该深度图像,右下角标的第二个数字或字母表示该深度图像中的特征点的记数,x21表示该深度图像的面部关键区域的第一个特征点的横坐标,y21表示该深度图像的面部关键区域的第一个特征点的纵坐标,x22表示该深度图像的面部关键区域的第二个特征点的横坐标,y22表示该深度图像的面部关键区域的第二个特征点的纵坐标,x2K表示该深度图像的面部关键区域的第K个特征点的横坐标,y2K表示该深度图像的面部关键区域的第K个特征点的纵坐标,K的取值范围是[20,68];
对所述深度图像的脸部及五官轮廓进行对齐归一化处理;
对于所述特征点集合中的每个特征点,沿所述脸部及五官轮廓的法线方向扩展以及完成灰度匹配,更新所述特征点集合;
确定所述特征点集合中每个特征点的坐标。
5.根据权利要求4所述的方法,其中,所述基于所述深度图像的面部关键区域的特征点坐标集合,生成所述深度图像的关键参数,包括:
基于所述深度图像的面部关键区域的特征点坐标集合,确定每个特征点的主关键点和次关键点,得到主关键点集合和次关键点集合;
将所得到的主关键点集合和所述次关键点集合,确定为所述深度图像的关键参数。
6.根据权利要求5所述的方法,其中,所述方法还包括:
生成每个特征点与每个特征点的主关键点和次关键点的对应关系表。
7.根据权利要求6所述的方法,其中,所述基于所述深度图像的关键参数,生成所述深度图像的眼球活动特征,包括:
将所述面部关键区域的特征点初始坐标集合与所述深度图像的关键参数进行匹配,生成所述面部关键区域的特征点集合的坐标差值集合,其中,利用所述深度图像的关键参数中对应于第n个特征点的关键参数的坐标P(n)和面部关键区域的特征点初始坐标集合中的第n个特征点的初始坐标P_ori(n),得到第n个特征点的坐标差值为D(n)=P(n)-P_ori(n);
将所述深度图像的面部关键区域的所有特征点的坐标差值与对应的权重系数相乘后,对加权结果求和,得到所述深度图像的眼球活动特征。
8.一种第一终端设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
CN202010358128.0A 2020-04-29 2020-04-29 用于捕捉眼球活动特征的方法、终端设备 Pending CN111582120A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010358128.0A CN111582120A (zh) 2020-04-29 2020-04-29 用于捕捉眼球活动特征的方法、终端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010358128.0A CN111582120A (zh) 2020-04-29 2020-04-29 用于捕捉眼球活动特征的方法、终端设备

Publications (1)

Publication Number Publication Date
CN111582120A true CN111582120A (zh) 2020-08-25

Family

ID=72120260

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010358128.0A Pending CN111582120A (zh) 2020-04-29 2020-04-29 用于捕捉眼球活动特征的方法、终端设备

Country Status (1)

Country Link
CN (1) CN111582120A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115100380A (zh) * 2022-06-17 2022-09-23 上海新眼光医疗器械股份有限公司 基于眼部体表特征点的医学影像自动识别方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115100380A (zh) * 2022-06-17 2022-09-23 上海新眼光医疗器械股份有限公司 基于眼部体表特征点的医学影像自动识别方法
CN115100380B (zh) * 2022-06-17 2024-03-26 上海新眼光医疗器械股份有限公司 基于眼部体表特征点的医学影像自动识别方法

Similar Documents

Publication Publication Date Title
CN109285215B (zh) 一种人体三维模型重建方法、装置和存储介质
KR102319177B1 (ko) 이미지 내의 객체 자세를 결정하는 방법 및 장치, 장비, 및 저장 매체
CN107358648B (zh) 基于单张人脸图像的实时全自动高质量三维人脸重建方法
CN111598998A (zh) 三维虚拟模型重建方法、装置、计算机设备和存储介质
JP4950787B2 (ja) 画像処理装置及びその方法
JP6685827B2 (ja) 画像処理装置、画像処理方法及びプログラム
US9679192B2 (en) 3-dimensional portrait reconstruction from a single photo
CN109684969B (zh) 凝视位置估计方法、计算机设备及存储介质
CN113269862B (zh) 场景自适应的精细三维人脸重建方法、系统、电子设备
WO2022095721A1 (zh) 参数估算模型的训练方法、装置、设备和存储介质
EP3992919B1 (en) Three-dimensional facial model generation method and apparatus, device, and medium
CN113822977A (zh) 图像渲染方法、装置、设备以及存储介质
KR20170008638A (ko) 3차원 컨텐츠 생성 장치 및 그 3차원 컨텐츠 생성 방법
WO2014117446A1 (zh) 基于单个视频摄像机的实时人脸动画方法
CN108388889B (zh) 用于分析人脸图像的方法和装置
CN111369428A (zh) 虚拟头像生成方法和装置
CN108509994B (zh) 人物图像聚类方法和装置
CN108062544A (zh) 用于人脸活体检测的方法和装置
CN109977764A (zh) 基于平面检测的活体识别方法、装置、终端及存储介质
CN111680573B (zh) 人脸识别方法、装置、电子设备和存储介质
CN106909904B (zh) 一种基于可学习形变场的人脸正面化方法
CN111862278A (zh) 一种动画获得方法、装置、电子设备及存储介质
CN114049290A (zh) 图像处理方法、装置、设备及存储介质
WO2024051593A1 (en) Systems and methods for image processing
CN111784660B (zh) 一种用于人脸图像的正脸程度的分析方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination