CN106897659A - 眨眼运动的识别方法和装置 - Google Patents

眨眼运动的识别方法和装置 Download PDF

Info

Publication number
CN106897659A
CN106897659A CN201510964968.0A CN201510964968A CN106897659A CN 106897659 A CN106897659 A CN 106897659A CN 201510964968 A CN201510964968 A CN 201510964968A CN 106897659 A CN106897659 A CN 106897659A
Authority
CN
China
Prior art keywords
image
eyes
textural characteristics
eye
facial image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510964968.0A
Other languages
English (en)
Other versions
CN106897659B (zh
Inventor
汪铖杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Tencent Cloud Computing Beijing Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201510964968.0A priority Critical patent/CN106897659B/zh
Publication of CN106897659A publication Critical patent/CN106897659A/zh
Application granted granted Critical
Publication of CN106897659B publication Critical patent/CN106897659B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/18Eye characteristics, e.g. of the iris

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Ophthalmology & Optometry (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种眨眼运动的识别方法和装置。其中,该方法包括:获取人脸图像帧序列的预定图像帧中眼部图像的纹理特征,其中,纹理特征用于表征眼部图像对应的眼部的生物特征;根据纹理特征确定预定图像帧中眼部图像为睁眼图像还是闭眼图像;判断人脸图像帧序列的眼部图像是否包括睁眼图像和闭眼图像;若人脸图像帧序列的眼部图像包括睁眼图像和闭眼图像,则确定人脸图像帧序列对应的人脸存在眨眼运动。本发明解决了检测人眼的运动状态不准确的技术问题。

Description

眨眼运动的识别方法和装置
技术领域
本发明涉及人脸识别领域,具体而言,涉及一种眨眼运动的识别方法和装置。
背景技术
人脸识别技术可以识别视频中的人脸是否有眨眼的动作,通常采用人脸五官关键点定位技术,使用多个关键点定位视频序列中每一帧的人脸图像的眼部,然后利用这些关键点的坐标计算出眼部面积,最后通过计算面积的变化来判定视频中人脸是否存在眨眼运动。
当视频中人脸存在晃动时,依据人脸关键点进行的定位会出现定位失败或定位偏差较大的情况,使得定位的位置偏离人眼,因而造成所计算的眼部面积错误,并最终导致人眼运动状态检测不准确。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种眨眼运动的识别方法和装置,以至少解决检测人眼的运动状态不准确的技术问题。
根据本发明实施例的一个方面,提供了一种眨眼运动的识别方法,包括:获取人脸图像帧序列的预定图像帧中眼部图像的纹理特征,其中,所述纹理特征用于表征所述眼部图像对应的眼部的生物特征;根据所述纹理特征确定所述预定图像帧中眼部图像为睁眼图像还是闭眼图像;判断所述人脸图像帧序列的眼部图像是否包括所述睁眼图像和所述闭眼图像;若所述人脸图像帧序列的眼部图像包括所述睁眼图像和所述闭眼图像,则确定所述人脸图像帧序列对应的人脸存在眨眼运动。
根据本发明实施例的另一方面,还提供了一种眨眼运动的识别装置,包括:获取单元,用于获取人脸图像帧序列的预定图像帧中眼部图像的纹理特征,其中,所述纹理特征用于表征所述眼部图像对应的眼部的生物特征;第一确定单元,用于根据所述纹理特征确定所述预定图像帧中眼部图像为睁眼图像还是闭眼图像;判断单元,用于判断所述人脸图像帧序列的眼部图像是否包括所述睁眼图像和所述闭眼图像;第二确定单元,用于在所述人脸图像帧序列的眼部图像包括所述睁眼图像和所述闭眼图像时,确定所述人脸图像帧序列对应的人脸存在眨眼运动。
在本发明实施例中,利用纹理特征能够反映眼部的生物特征的特性,以及利用纹理特征进行眼部识别时,即使局部有偏差也不会导致眼部图像的识别错误的特性,对眼部关键点的定位结果精确性的依赖较低,避免了采用计算眼部的面积来区分睁眼和闭眼时对定位结果精确性的依赖较高所导致识别不准确的问题,从而解决了检测人眼的运动状态不准确的技术问题,达到了准确检测人眼的运动状态的技术效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的硬件环境的示意图;
图2是根据本发明实施例的眨眼运动的识别方法的流程图;
图3是根据本发明实施例的定位人脸五官的示意图;
图4是根据本发明实施例的眨眼运动的识别装置的示意图;
图5是根据本发明实施例的终端的硬件结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本发明实施例,提供了一种可以通过本申请装置实施例执行的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本发明实施例,提供了一种眨眼运动的识别方法。
可选地,在本实施例中,上述眨眼运动的识别方法可以应用于如图1所示的终端102和服务器104所构成的硬件环境中。如图1所示,终端102通过网络与服务器104进行连接,上述网络包括但不限于:移动通信网络、广域网、城域网或局域网,终端102可以是手机终端,也可以是PC终端、笔记本终端或平板电脑终端。
图1中示出的硬件环境系统的主要工作原理是:终端102采集人脸图像帧序列,并识别人脸图像帧序列中是否有眨眼运动,若识别出眨眼运动,将识别结果发送给服务器104,由服务器104向终端102发出相应的指令信息,指示终端102执行预设动作。
需要说明的是,终端102也可以在识别出眨眼运动后,根据自身的逻辑执行预设的动作,而无需等待服务器104的指令信息。并且,终端102可以一边采集人脸图像帧序列,一边识别眨眼运动,并实时输出识别结果。
图2是根据本发明实施例的眨眼运动的识别方法的流程图,以下结合图2对本发明实施例所提供的眨眼运动的识别方法做具体介绍,如图2所示,该眨眼运动的识别方法主要包括如下步骤:
步骤S202,获取人脸图像帧序列的预定图像帧中眼部图像的纹理特征,其中,纹理特征用于表征眼部图像对应的眼部的生物特征。
人脸图像帧序列可以是视频、动图等具有至少两个图像帧的序列。预定图像帧可以是人脸图像帧序列中具有一定间隔的多个人脸图像帧,也可以是人脸图像帧序列中的每一帧。对于具有一定间隔的多个人脸图像帧,可以采用均匀时间间隔或者均匀图像帧数量间隔从人脸图像帧序列中抽取多个人脸图像帧。为了兼顾准确性和计算效率,例如,可以从时长为1秒的人脸图像帧序列中抽取30帧作为预定图像帧,即每间隔33毫秒抽出一个图像帧,或者每间隔4个图像帧抽取一个图像帧。
纹理用来表示图像的均匀、细致、粗糙等现象,纹理特征是图像灰度等级的变化,这种变化是与空间统计相关的,即物体表面的属性反映在图像中所造成的图像灰度等级的变化。也就是说,纹理特征能够反映物体本身的属性特征。对于人脸图像来说,人脸图像中的纹理特征可以反映人脸的生物特征,如人脸图像中纹理特征的变化体现人脸上的凹陷、突起等生物特征,由于纹理特征不是图像中基于像素点的特征,而是包含多个像素点的区域中进行统计得到的纹理特征,因此,不会由于局部的偏差而无法体现人脸上五官的空间变化。
本实施例采用的纹理特征可以是梯度方向直方图(Histogram ofOriented Gradient,简称HOG)特征、局部二值模式特征(Local BinaryPattern,简称为LBP)特征和Gabor特征等。
步骤S204,根据纹理特征确定预定图像帧中眼部图像为睁眼图像还是闭眼图像。由于图像的纹理特征可以反映人脸的生物特征,因此,可以根据纹理特征确定出眼部图像为睁眼图像还是闭眼图像。有些人脸图像帧模糊导致无法确认该人脸图像中的眼部图像为睁眼图像还是闭眼图像,则确定该眼部图形既不是睁眼图像也不是闭眼图像,确定为模糊状态。
步骤S206,判断人脸图像帧序列的眼部图像是否包括睁眼图像和闭眼图像。人脸图像帧序列的眼部图像可能全部为睁眼图像、全部为闭眼图像,或者既有睁眼图像还有闭眼图像。若人脸图像帧序列所对应的视频或者动图中的人脸在进行眨眼运动,则就会包含有睁眼图像的人脸图像帧和包含有闭眼图像的人脸图像帧。为了确定眨眼运动需要判断整个人脸图像帧序列是否包括睁眼图像和闭眼图像。
在判断人脸图像帧序列的眼部图像是否包括睁眼图像和闭眼图像时,可以在对整个人脸图像帧序列的每一帧都确定完成之后,判断整个人脸图像帧序列是否包括睁眼图像和闭眼图像;还可以对人脸图像帧序列中每一帧人脸图像中眼部图像确定出是睁眼图像还是闭眼图像后,实时输出该人脸图像帧序列是否包括睁眼图像和闭眼图像。例如,第一帧人脸图像的眼部图像为睁眼图像,第二帧人脸图像的眼部图像为闭眼图像,则在第二帧人脸图像的眼部图像确定出结果后,输出人脸图像帧序列的眼部图像包括睁眼图像和闭眼图像的结果。在确定完一张人脸图像后,可以设置相应的标识位,比如睁眼设置为1,闭眼设置为0,根据0和1来判断是否包括睁眼图像和闭眼图像。
步骤S208,若人脸图像帧序列的眼部图像包括睁眼图像和闭眼图像,则确定人脸图像帧序列对应的人脸存在眨眼运动。
通过上述实施例,利用纹理特征能够反映眼部的生物特征的特性,以及利用纹理特征进行眼部识别时,即使局部有偏差也不会导致眼部图像的识别错误的特性,对眼部关键点的定位结果精确性的依赖较低,避免了采用计算眼部的面积来区分睁眼和闭眼时对定位结果精确性的依赖较高所导致识别不准确的问题,从而解决了检测人眼的运动状态不准确的技术问题,达到了准确检测人眼的运动状态的技术效果。
可选地,根据纹理特征判断预定图像帧中眼部图像为睁眼图像还是闭眼图像包括:获取用于区分眼部图像为睁眼图像还是闭眼图像的模型,模型包括第一规则和第二规则;通过模型判断第一纹理特征满足第一规则还是第二规则,其中,第一纹理特征为人脸图像帧序列中的任意一张图像中眼部图像的纹理特征;若通过模型判断出第一纹理特征满足第一规则,则通过模型输出用于指示第一纹理特征所属的眼部图像为睁眼图像的结果;若通过模型判断出第一纹理特征满足第二规则,则通过模型输出用于指示第一纹理特征所属的眼部图像为闭眼图像的结果。
采集眼部图像的训练样本训练出上述模型,训练样本包括两类,一类是睁眼图像的纹理特征的训练样本,一类是闭眼图像的纹理特征的训练样本,从睁眼图像的纹理特征的训练样本学习确定睁眼图像的判断规则(即第一规则),从闭眼图像的纹理特征的训练样本学习确定闭眼图像的判断规则(即第二规则)。
训练得到的上述模型能够根据学习到的判断规则对测试样本(待识别的眼部图像)进行判断。若测试样本的纹理特征满足模型从睁眼图像的纹理特征的训练的纹理特征样本中学习的第一规则,则确定测试样本为睁眼图像;若测试样本的纹理特征满足模型从闭眼图像的纹理特征的训练样本中学习的第二规则,则确定测试样本为闭眼图像。上述模型完成对某一张眼部图像的识别后,输出识别结果。
在利用训练出的模型进行眼部图像的识别时,可以直接将眼部图像输入给模型,由模型提取输入的眼部图像的纹理特征,并判断纹理特征符合第一规则还是第二规则;或者,先提取眼部图像的纹理特征,将纹理特征输入到模型中,由模型判断纹理特征符合第一规则还是第二规则。
由于纹理特征能够表征眼部的生物特征,用于区分眼部图像为睁眼图像还是闭眼图像的模型又是根据大量的睁眼图像和闭眼图像的训练样本训练得到的,因此,利用模型对纹理特征进行识别,可以准确的确定出眼部图像为睁眼图像还是闭眼图像,从而提高了识别的准确率。另外,由于对眼部定位的依赖性较低,因此,也减少了眼部定位不准确对眼部识别的准确率的影响,进而提高了识别的准确性。
该实施例仅以第一纹理特征进行说明,预定图像帧中眼部图像都按照该方式来确定为睁眼图像或者闭眼图像,以下区分睁眼图像和闭眼图像的方式均以第一纹理特征来说明。
进一步可选地,通过模型判断第一纹理特征满足第一规则还是第二规则包括:将第一纹理特征映射到N维空间中,其中,N维空间被分类边界划分为第一空间和第二空间;判断第一纹理特征映射到第一空间还是第二空间;若第一纹理特征映射到第一空间,则确定第一纹理特征满足第一规则;若第一纹理特征映射到第二空间,则确定第一纹理特征满足第二规则。
通过训练样本训练出两种类别的眼部图像的分类边界,该分类边界就是N维空间中的超面,超面比N维空间少一维,若N维空间为2维空间,则超面为一条直线或者曲线。利用分类边界区分两类眼部图像时,先将第一纹理特征映射到N维空间中,若映射到N维空间中的第一空间,则确定第一纹理特征满足第一规则,即第一纹理特征对应的眼部图像为睁眼图像;若映射到N维空间中的第二空间,则确定第一纹理特征满足第二规则,即第一纹理特征对应的眼部图像为闭眼图像。
对于区分睁眼图像和闭眼图像这两类图像,可以采用2维空间对两类图像进行划分,分类边界为曲线或者直线。
若两类纹理特征的分类边界为曲线,而训练出的模型需要线性的分类边界,则可以将第一纹理特征从低维空间映射到高维空间,使得处于低维空间中的非线性划分的数据映射为线性可分的,以便于区分两类眼部图像。具体可采用核函数将低维空间的第一纹理特征映射到高维空间。
若两类纹理特征的分类边界为线性的分类边界,则直接将第一纹理特征映射到2维空间中,根据第一纹理特征在2维空间中的位置来确定第一纹理特征所满足的规则。
如果除了区分睁眼图像和闭眼图像这两类图像,还区分半闭半睁的图像,可以采用3维空间对三类图像进行划分,超面可以是2维的平面,其他判断的方式与2维空间相似,不再赘述。
进一步可选地,通过模型判断第一纹理特征满足第一规则还是第二规则包括:将第一纹理特征输入到多个决策树中,其中,多个决策树采用不相关的分类规则将第一纹理特征分为第一结果或第二结果,第一结果用于指示第一纹理特征属于睁眼图像,第二结果用于指示第一纹理特征属于闭眼图像;比较多个决策树输出的第一结果的数量和输出第二结果的数量;若第一结果的数量大于等于第二结果的数量,则确定第一纹理特征满足第一规则;若第一结果的数量小于第二结果的数量,则确定第一纹理特征满足第二规则。
模型包括多个决策树,每个决策树都有自己的分类规则,这些规则是从训练样本中学习得到的。每个决策树都能获取第一纹理特征,并按照自己的分类规则将第一纹理特征分为第一结果或者第二结果。由于第一结果和第二结果可以体现第一纹理特征所对应的眼部图像的类别,在多个决策树都完成分类后,多个决策树输出的最多的一类判断结果就是模型的最终归判断结果,即确定眼部图像为睁眼图像还是闭眼图像。
上述的模型可以采用分类器,包括支持向量机(Support Vector Machine,简称SVM)、决策树分类器等,还可以采用回归器,包括线性回归器、随机森林和神经网络等,此处不再一一举例说明。
可选地,获取人脸图像帧序列的预定图像帧中眼部图像的纹理特征包括:定位第一帧人脸图像中人脸五官的关键特征点,并根据关键特征点确定第一帧人脸图像中眼部图像的位置,其中,第一帧人脸图像为人脸图像序列帧中的任意一帧;按照位置从第一帧人脸图像中扣取眼部图像;从扣取的眼部图像中提取纹理特征作为第一帧人脸图像中眼部图像的纹理特征。
在获取眼部图像的纹理特征之前,先利用人脸五官关键点定位技术定位人脸五官的关键特征点,如图3所示,根据关键特征点确定眼部图像在人脸图像中的位置,其中,虚线表示五官的关键特征点。扣取眼部图像,并采用HOG、Gabor和LBP等算法来提取眼部图像的纹理特征。先定位眼部的位置再扣取眼部图像,使得提取的纹理特征远小于提取整个人脸图像的眼部特征,减少模型在根据纹理特征确定预定图像帧中眼部图像为睁眼图像还是闭眼图像时的计算量,提高了区分睁眼图像和闭眼图像的效率。
可选地,若人脸图像帧序列的眼部图像包括睁眼图像和闭眼图像,则确定人脸图像帧序列对应的人脸存在眨眼运动包括:判断第一睁眼图像和与第一睁眼图像最近的闭眼图像之间的帧间隔是否满足预设帧间隔,第一睁眼图像为人脸图像帧序列中的任意一个睁眼图像;若满足,则确定人脸图像帧序列对应的人脸存在眨眼运动;若不满足,则确定人脸图像帧序列对应的人脸存在由睁眼到闭眼的动作,或者存在由闭眼到睁眼的动作。
由于眨眼运动是眼部的瞬间动作,或者眨眼运动的时间较短,在眨眼运动以外的睁眼状态和闭眼状态持续的时间比眨眼运动的时间长。同时,通常眨眼运动是在人眼较长时间为睁眼时出现的,因此,若检测到第一睁眼图像和与第一睁眼图像最近的闭眼图像之间的帧间隔是否满足预设帧间隔,即睁眼和闭眼的时间较短时,确定为眨眼运动,否则,认为人脸存在由睁眼到闭眼的动作,或者存在由闭眼到睁眼的动作。
如果与第一睁眼图像最近的闭眼图像在人脸图像帧序列中出现在第一睁眼图像之前,则确定人脸存储由闭眼到睁眼的动作,例如,由睡眠到清醒的过程;如果与第一睁眼图像最近的闭眼图像在人脸图像帧序列中出现在第一睁眼图像之后,则确定人脸存储由睁眼到闭眼的动作,例如由清醒到睡眠的过程。
通过上述的实施例,根据相邻的睁眼图像和闭眼图像之间的时间间隔判断是否为眨眼运动,对于时间间隔较长的睁眼图像和闭眼图像并不会被判断为眨眼运动,可以提高判断眨眼运动的准确性。
在确定人脸图像帧序列的眼部图像包括睁眼图像和闭眼图像判断出人脸图像帧序列对应的人脸存在眨眼运动的同时,还能确定出人脸图像帧序列对应的人脸存在睁眼状态和闭眼状态。
进一步可选地,人脸图像帧序列中眼部图像若有连续较多的人脸图像帧中眼部图像为睁眼图像,则确定眼部处于睁眼状态;人脸图像帧序列中眼部图像若有连续较多的人脸图像帧中眼部图像为闭眼图像,则确定眼部处于闭眼状态。
可选地,在可以确定出眼部的眨眼运动、闭眼到睁眼的动作、睁眼到闭眼的动作、睁眼状态和闭眼状态基础上,可以根据眼部的不同动作或者状态执行相应的动作,即该方法还包括:在确定人脸图像帧序列对应的人脸存在眨眼运动之后,发出用于指示目标对象执行第一预设动作指令信息;在确定人脸图像帧序列对应的人脸存在由睁眼到闭眼的动作,或者存在由闭眼到睁眼的动作之后,发出用于指示目标对象执行第二预设动作指令信息。目标对象可以是终端和服务器,也可以是终端或服务器中的某个程序,第一预设动作和第二预设动作可以相同或者不同。
检测眨眼运动的应用场景如下:
例如,在利用终端进行人脸识别之前,先根据人脸图像帧序列判断人脸是否存在眨眼运动,若存在眨眼运动,则确定进行人脸识别的人脸为活体,向服务器或者终端(即目标对象)发出继续进行人脸识别(即第一预设动作)的指令信息。其中,人脸图像帧序列中的一帧人脸图像也可以作为进行人脸识别的图像。
例如,在用户通过终端使用办公应用程序或者娱乐应用程序(如即时通讯、游戏)时,采集人脸的视频(即人脸图像帧序列),并实时判断是否有眨眼运动,在检测出眨眼运动后,指示终端或者相应的应用程序发出声音、灯光、静态或动态图像、文字等提示信息(即第一预设动作)。
例如,眨眼运动的检测还可以应用在车载应用上,采集驾驶员的驾驶过程中的视频,并判断是否有眨眼运动,或者判断是否有闭眼状态,若检测到频繁的眨眼运动或者闭眼状态时,发出声音提示,以避免驾驶员疲劳驾驶而威胁驾驶员的安全。
例如,眨眼运动的检测还可以应用在闹钟上,采集睡眠状态的人的视频,判断是否有眨眼运动,或者是否有睁眼状态,若检测到眨眼运动或者睁眼状态,则发出音乐提示,或者根据眨眼运动或者睁眼状态调整音乐的声音逐渐变大等。
上述例子也不用于限制本实施例的眨眼运动的判断结果所应用的场景,其他应用眨眼运动的判断结果的场景不再一一举例。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
实施例2
根据本发明实施例,还提供了一种用于实施上述眨眼运动的识别方法的眨眼运动的识别装置,如图4所示,该装置包括:获取单元40、第一确定单元42、判断单元44和第二确定单元46。
获取单元40用于获取人脸图像帧序列的预定图像帧中眼部图像的纹理特征,其中,纹理特征用于表征眼部图像对应的眼部的生物特征。
人脸图像帧序列可以是视频、动图等具有至少两个图像帧的序列,预定图像帧可以是人脸图像帧序列中具有一定间隔的多个人脸图像帧,也可以是人脸图像帧序列中的每一帧。对于具有一定间隔的多个人脸图像帧,可以采用均匀时间间隔或者均匀图像帧数量间隔从人脸图像帧序列中抽取多个人脸图像帧。为了兼顾准确性和计算效率,例如,可以从时长为1秒的人脸图像帧序列中抽取30帧作为预定图像帧,即每间隔33毫秒抽出一个图像帧,或者每间隔4个图像帧抽取一个图像帧。
纹理用来表示图像的均匀、细致、粗糙等现象,纹理特征是图像灰度等级的变化,这种变化是与空间统计相关的,即物体表面的属性反映在图像中所造成的图像灰度等级的变化。也就是说,纹理特征能够反映物体本身的属性特征。对于人脸图像来说,人脸图像中的纹理特征可以反映人脸的生物特征,如人脸图像中纹理特征的变化体现人脸上的凹陷、突起等生物特征,由于纹理特征不是图像中基于像素点的特征,而是包含多个像素点的区域中进行统计得到的纹理特征,因此,不会由于局部的偏差而无法体现人脸上五官的空间变化。
本实施例采用的纹理特征可以是梯度方向直方图(Histogram ofOriented Gradient,简称HOG)特征、局部二值模式特征(Local BinaryPattern,简称为LBP)特征和Gabor特征等。
第一确定单元42用于根据纹理特征确定预定图像帧中眼部图像为睁眼图像还是闭眼图像。由于图像的纹理特征可以反映人脸的生物特征,因此,可以根据纹理特征确定出眼部图像为睁眼图像还是闭眼图像。有些人脸图像帧模糊导致无法确认该人脸图像中的眼部图像为睁眼图像还是闭眼图像,则确定该眼部图形既不是睁眼图像也不是闭眼图像,确定为模糊状态。
判断单元44用于判断人脸图像帧序列的眼部图像是否包括睁眼图像和闭眼图像。人脸图像帧序列的眼部图像可能全部为睁眼图像、全部为闭眼图像,或者既有睁眼图像还有闭眼图像。若人脸图像帧序列所对应的视频或者动图中的人脸在进行眨眼运动,则就会包含有睁眼图像的人脸图像帧和包含有闭眼图像的人脸图像帧。为了确定眨眼运动需要判断整个人脸图像帧序列是否包括睁眼图像和闭眼图像。
在判断人脸图像帧序列的眼部图像是否包括睁眼图像和闭眼图像时,可以在对整个人脸图像帧序列的每一帧都确定完成之后,判断整个人脸图像帧序列是否包括睁眼图像和闭眼图像;还可以对人脸图像帧序列中每一帧人脸图像中眼部图像确定出是睁眼图像还是闭眼图像后,实时输出该人脸图像帧序列是否包括睁眼图像和闭眼图像。例如,第一帧人脸图像的眼部图像为睁眼图像,第二帧人脸图像的眼部图像为闭眼图像,则在第二帧人脸图像的眼部图像确定出结果后,输出人脸图像帧序列的眼部图像包括睁眼图像和闭眼图像的结果。
第二确定单元46用于在人脸图像帧序列的眼部图像包括睁眼图像和闭眼图像时,确定人脸图像帧序列对应的人脸存在眨眼运动。
通过上述实施例,利用纹理特征能够反映眼部的生物特征的特性,以及利用纹理特征进行眼部识别时,即使局部有偏差也不会导致眼部图像的识别错误的特性,对眼部关键点的定位结果精确性的依赖较低,避免了采用计算眼部的面积来区分睁眼和闭眼时对定位结果精确性的依赖较高所导致识别不准确的问题,从而解决了检测人眼的运动状态不准确的技术问题,达到了准确检测人眼的运动状态的技术效果。
可选地,第一确定单元包括:获取模块,用于获取用于区分眼部图像为睁眼图像还是闭眼图像的模型,模型包括第一规则和第二规则;第一判断模块,用于通过模型判断第一纹理特征满足第一规则还是第二规则,其中,第一纹理特征为人脸图像帧序列中的任意一张图像中眼部图像的纹理特征;第一输出模块,用于通过模型判断出第一纹理特征满足第一规则时,通过模型输出用于指示第一纹理特征所属的眼部图像为睁眼图像的结果;第二输出模块,用于通过模型判断出第一纹理特征满足第二规则时,通过模型输出用于指示第一纹理特征所属的眼部图像为闭眼图像的结果。
采集眼部图像的训练样本训练出上述模型,训练样本包括两类,一类是睁眼图像的纹理特征的训练样本,一类是闭眼图像的纹理特征的训练样本,从睁眼图像的纹理特征的训练样本学习确定睁眼图像的判断规则(即第一规则),从闭眼图像的纹理特征的训练样本学习确定闭眼图像的判断规则(即第二规则)。
训练得到的上述模型能够根据学习到的判断规则对测试样本(待识别的眼部图像)进行判断。若测试样本的纹理特征满足模型从睁眼图像的纹理特征的训练的纹理特征样本中学习的第一规则,则确定测试样本为睁眼图像;若测试样本的纹理特征满足模型从闭眼图像的纹理特征的训练样本中学习的第二规则,则确定测试样本为闭眼图像。上述模型完成对某一张眼部图像的识别后,输出识别结果。
在利用训练出的模型进行眼部图像的识别时,可以直接将眼部图像输入给模型,由模型提取输入的眼部图像的纹理特征,并判断纹理特征符合第一规则还是第二规则;或者,先提取眼部图像的纹理特征,将纹理特征输入到模型中,由模型判断纹理特征符合第一规则还是第二规则。
由于纹理特征能够表征眼部的生物特征,用于区分眼部图像为睁眼图像还是闭眼图像的模型又是根据大量的睁眼图像和闭眼图像的训练样本训练得到的,因此,利用模型对纹理特征进行识别,可以准确的确定出眼部图像为睁眼图像还是闭眼图像,从而提高了识别的准确率。另外,由于对眼部定位的依赖性较低,因此,也减少了眼部定位不准确对眼部识别的准确率的影响,进而提高了识别的准确性。
该实施例仅以第一纹理特征进行说明,预定图像帧中眼部图像都按照该方式来确定为睁眼图像或者闭眼图像,以下区分睁眼图像和闭眼图像的方式均以第一纹理特征来说明。
进一步可选地,第一判断模块包括:映射子模块,用于将第一纹理特征映射到N维空间中,其中,N维空间被分类边界划分为第一空间和第二空间;判断子模块,用于判断第一纹理特征映射到第一空间还是第二空间;第一确定子模块,用于在第一纹理特征映射到第一空间时,确定第一纹理特征满足第一规则;第二确定子模块,用于在第一纹理特征映射到第二空间时,确定第一纹理特征满足第二规则。
通过训练样本训练出两种类别的眼部图像的分类边界,该分类边界就是N维空间中的超面,超面比N维空间少一维,若N维空间为2维空间,则超面为一条直线或者曲线。利用分类边界区分两类眼部图像时,先将第一纹理特征映射到N维空间中,若映射到N维空间中的第一空间,则确定第一纹理特征满足第一规则,即第一纹理特征对应的眼部图像为睁眼图像;若映射到N维空间中的第二空间,则确定第一纹理特征满足第二规则,即第一纹理特征对应的眼部图像为闭眼图像。
对于区分睁眼图像和闭眼图像这两类图像,可以采用2维空间对两类图像进行划分,分类边界为曲线或者直线。
若两类纹理特征的分类边界为曲线,而训练出的模型需要线性的分类边界,则可以将第一纹理特征从低维空间映射到高维空间,使得处于低维空间中的非线性划分的数据映射为线性可分的,以便于区分两类眼部图像。具体可采用核函数将低维空间的第一纹理特征映射到高维空间。
若两类纹理特征的分类边界为线性的分类边界,则直接将第一纹理特征映射到2维空间中,根据第一纹理特征在2维空间中的位置来确定第一纹理特征所满足的规则。
如果除了区分睁眼图像和闭眼图像这两类图像,还区分半闭半睁的图像,可以采用3维空间对三类图像进行划分,超面可以是2维的平面,其他判断的方式与2维空间相似,不再赘述。
进一步可选地,第一判断模块包括:输入子模块,用于将第一纹理特征输入到多个决策树中,其中,多个决策树采用不同的分类规则将第一纹理特征分为第一结果或第二结果,第一结果用于指示第一纹理特征属于睁眼图像,第二结果用于指示第一纹理特征属于闭眼图像;比较子模块,用于比较多个决策树输出的第一结果的数量和输出第二结果的数量;第三确定子模块,用于在第一结果的数量大于等于第二结果的数量时,确定第一纹理特征满足第一规则;第四确定子模块,用于在第一结果的数量小于第二结果的数量时,确定第一纹理特征满足第二规则。
模型包括多个决策树,每个决策树都有自己的分类规则,这些分类规则是从训练样本中学习得到的。每个决策树都能获取第一纹理特征,并按照自己的分类规则将第一纹理特征分为第一结果或者第二结果。由于第一结果和第二结果可以体现第一纹理特征所对应的眼部图像的类别,在多个决策树都完成分类后,多个决策树输出的最多的一类判断结果就是模型的最终归判断结果,即确定眼部图像为睁眼图像还是闭眼图像。
上述的模型可以采用分类器,包括支持向量机(Support Vector Machine,简称SVM)、决策树分类器等,还可以采用回归器,包括线性回归器、随机森林和神经网络等,此处不再一一举例说明。
可选地,获取单元包括:定位模块,用于定位第一帧人脸图像中人脸五官的关键特征点,并根据关键特征点确定第一帧人脸图像中眼部图像的位置,其中,第一帧人脸图像为人脸图像序列帧中的任意一帧;扣取模块,用于按照位置从第一帧人脸图像中扣取眼部图像;提取模块,用于从扣取的眼部图像中提取纹理特征作为第一帧人脸图像中眼部图像的纹理特征。
在获取眼部图像的纹理特征之前,先利用人脸五官关键点定位技术定位人脸五官的关键特征点,如图3所示,根据关键特征点确定眼部图像在人脸图像中的位置。扣取眼部图像,并采用HOG、Gabor和LBP等算法来提取眼部图像的纹理特征。先定位眼部的位置再扣取眼部图像,使得提取的纹理特征远小于提取整个人脸图像的眼部特征,减少模型在根据纹理特征确定预定图像帧中眼部图像为睁眼图像还是闭眼图像时的计算量,提高了区分睁眼图像和闭眼图像的效率。
可选地,第二确定单元包括:第二判断模块,用于判断第一睁眼图像和与第一睁眼图像最近的闭眼图像之间的帧间隔是否满足预设帧间隔,第一睁眼图像为人脸图像帧序列中的任意一个睁眼图像;第一确定模块,用于在满足的情况下,确定人脸图像帧序列对应的人脸存在眨眼运动;第二确定模块,用于在不满足的情况下,确定人脸图像帧序列对应的人脸存在由睁眼到闭眼的动作,或者存在由闭眼到睁眼的动作。
由于眨眼运动是眼部的瞬间动作,或者眨眼运动的时间较短,在眨眼运动以外的睁眼状态和闭眼状态持续的时间比眨眼运动的时间长。同时,通常眨眼运动是在人眼较长时间为睁眼时出现的,因此,若检测到第一睁眼图像和与第一睁眼图像最近的闭眼图像之间的帧间隔是否满足预设帧间隔,即睁眼和闭眼的时间较短时,确定为眨眼运动,否则,认为人脸存在由睁眼到闭眼的动作,或者存在由闭眼到睁眼的动作。
如果与第一睁眼图像最近的闭眼图像在人脸图像帧序列中出现在第一睁眼图像之前,则确定人脸存储由闭眼到睁眼的动作,例如,由睡眠到清醒的过程;如果与第一睁眼图像最近的闭眼图像在人脸图像帧序列中出现在第一睁眼图像之后,则确定人脸存储由睁眼到闭眼的动作,例如由清醒到睡眠的过程。
通过上述的实施例,根据相邻的睁眼图像和闭眼图像之间的时间间隔判断是否为眨眼运动,对于时间间隔较长的睁眼图像和闭眼图像并不会被判断为眨眼运动,可以提高判断眨眼运动的准确性。
在确定人脸图像帧序列的眼部图像包括睁眼图像和闭眼图像判断出人脸图像帧序列对应的人脸存在眨眼运动的同时,还能确定出人脸图像帧序列对应的人脸存在睁眼状态和闭眼状态。
进一步可选地,人脸图像帧序列中眼部图像若有连续较多的人脸图像帧中眼部图像为睁眼图像,则确定眼部处于睁眼状态;人脸图像帧序列中眼部图像若有连续较多的人脸图像帧中眼部图像为闭眼图像,则确定眼部处于闭眼状态。
可选地,在可以确定出眼部的眨眼运动、闭眼到睁眼的动作、睁眼到闭眼的动作、睁眼状态和闭眼状态基础上,可以根据眼部的不同动作或者状态执行相应的动作,即该装置还包括:第一发送单元,用于在确定人脸图像帧序列对应的人脸存在眨眼运动之后,发出用于指示目标对象执行第一预设动作指令信息;第二发送单元,用于在确定人脸图像帧序列对应的人脸存在由睁眼到闭眼的动作,或者存在由闭眼到睁眼的动作之后,发出用于指示目标对象执行第二预设动作指令信息。
目标对象可以是终端和服务器,也可以是终端或服务器中的某个程序,第一预设动作和第二预设动作可以相同或者不同。
检测眨眼运动的应用场景如下:
例如,在利用终端进行人脸识别之前,先根据人脸图像帧序列判断人脸是否存在眨眼运动,若存在眨眼运动,则确定进行人脸识别的人脸为活体,向服务器或者终端(即目标对象)发出继续进行人脸识别(即第一预设动作)的指令信息。其中,人脸图像帧序列中的一帧人脸图像也可以作为进行人脸识别的图像。
例如,在用户通过终端使用办公应用程序或者娱乐应用程序(如即时通讯、游戏)时,采集人脸的视频(即人脸图像帧序列),并实时判断是否有眨眼运动,在检测出眨眼运动后,指示终端或者相应的应用程序发出声音、灯光、静态或动态图像、文字等提示信息(即第一预设动作)。
例如,眨眼运动的检测还可以应用在车载应用上,采集驾驶员的驾驶过程中的视频,并判断是否有眨眼运动,或者判断是否有闭眼状态,若检测到频繁的眨眼运动或者闭眼状态时,发出声音提示,以避免驾驶员疲劳驾驶而威胁驾驶员的安全。
例如,眨眼运动的检测还可以应用在闹钟上,采集睡眠状态的人的视频,判断是否有眨眼运动,或者是否有睁眼状态,若检测到眨眼运动或者睁眼状态,则发出音乐提示,或者根据眨眼运动或者睁眼状态调整音乐的声音逐渐变大等。
上述例子也不用于限制本实施例的眨眼运动的判断结果所应用的场景,其他应用眨眼运动的判断结果的场景不再一一举例。
实施例3
根据本发明实施例,还提供了一种用于实施上述眨眼运动的识别方法的终端,如图5所示,主要包括处理器501、摄像头502、显示器503、数据接口504、存储器505和网络接口506,其中:
摄像头502主要用于采集人脸图像帧序列。
数据接口504则主要通过数据传输的方式将第三方工具拍摄到的人脸图像帧序列传输给处理器501。
存储器505主要用于存储初始图像和利用初始图像进行车辆识别的中间文件。
网络接口506主要用于与服务器或者其他终端进行网络通信,以发出指令信息。
显示器503主要用于显示眨眼运动的识别结果,以及终端执行指令信息所指示的指令时所得到的执行结果。
处理器501主要用于执行如下操作:
获取人脸图像帧序列的预定图像帧中眼部图像的纹理特征,其中,纹理特征用于表征眼部图像对应的眼部的生物特征;根据纹理特征确定预定图像帧中眼部图像为睁眼图像还是闭眼图像;判断人脸图像帧序列的眼部图像是否包括睁眼图像和闭眼图像;若人脸图像帧序列的眼部图像包括睁眼图像和闭眼图像,则确定人脸图像帧序列对应的人脸存在眨眼运动。
处理器501还用于获取用于区分眼部图像为睁眼图像还是闭眼图像的模型,模型包括第一规则和第二规则;通过模型判断第一纹理特征满足第一规则还是第二规则,其中,第一纹理特征为人脸图像帧序列中的任意一张图像中眼部图像的纹理特征;若通过模型判断出第一纹理特征满足第一规则,则通过模型输出用于指示第一纹理特征所属的眼部图像为睁眼图像的结果;若通过模型判断出第一纹理特征满足第二规则,则通过模型输出用于指示第一纹理特征所属的眼部图像为闭眼图像的结果。
可选地,本实施例中的具体示例可以参考上述实施例1和实施例2中所描述的示例,本实施例在此不再赘述。
实施例4
本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以位于网络中的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:
S1,获取人脸图像帧序列的预定图像帧中眼部图像的纹理特征,其中,纹理特征用于表征眼部图像对应的眼部的生物特征;
S2,根据纹理特征确定预定图像帧中眼部图像为睁眼图像还是闭眼图像;
S3,判断人脸图像帧序列的眼部图像是否包括睁眼图像和闭眼图像;
S4,若人脸图像帧序列的眼部图像包括睁眼图像和闭眼图像,则确定人脸图像帧序列对应的人脸存在眨眼运动。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:获取用于区分眼部图像为睁眼图像还是闭眼图像的模型,模型包括第一规则和第二规则;通过模型判断第一纹理特征满足第一规则还是第二规则,其中,第一纹理特征为人脸图像帧序列中的任意一张图像中眼部图像的纹理特征;若通过模型判断出第一纹理特征满足第一规则,则通过模型输出用于指示第一纹理特征所属的眼部图像为睁眼图像的结果;若通过模型判断出第一纹理特征满足第二规则,则通过模型输出用于指示第一纹理特征所属的眼部图像为闭眼图像的结果。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:通过模型判断第一纹理特征满足第一规则还是第二规则包括:将第一纹理特征映射到N维空间中,其中,N维空间被分类边界划分为第一空间和第二空间;判断第一纹理特征映射到第一空间还是第二空间;若第一纹理特征映射到第一空间,则确定第一纹理特征满足第一规则;若第一纹理特征映射到第二空间,则确定第一纹理特征满足第二规则。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:将第一纹理特征输入到多个决策树中,其中,多个决策树采用不同的分类规则将第一纹理特征分为第一结果或第二结果,第一结果用于指示第一纹理特征属于睁眼图像,第二结果用于指示第一纹理特征属于闭眼图像;比较多个决策树输出的第一结果的数量和输出第二结果的数量;若第一结果的数量大于等于第二结果的数量,则确定第一纹理特征满足第一规则;若第一结果的数量小于第二结果的数量,则确定第一纹理特征满足第二规则。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
可选地,在本实施例中,处理器根据存储介质中已存储的程序代码执行将第一纹理特征输入到多个决策树中,其中,多个决策树采用不同的分类规则将第一纹理特征分为第一结果或第二结果,第一结果用于指示第一纹理特征属于睁眼图像,第二结果用于指示第一纹理特征属于闭眼图像;比较多个决策树输出的第一结果的数量和输出第二结果的数量;若第一结果的数量大于等于第二结果的数量,则确定第一纹理特征满足第一规则;若第一结果的数量小于第二结果的数量,则确定第一纹理特征满足第二规则。
可选地,在本实施例中,处理器根据存储介质中已存储的程序代码执行获取用于区分眼部图像为睁眼图像还是闭眼图像的模型,模型包括第一规则和第二规则;通过模型判断第一纹理特征满足第一规则还是第二规则,其中,第一纹理特征为人脸图像帧序列中的任意一张图像中眼部图像的纹理特征;若通过模型判断出第一纹理特征满足第一规则,则通过模型输出用于指示第一纹理特征所属的眼部图像为睁眼图像的结果;若通过模型判断出第一纹理特征满足第二规则,则通过模型输出用于指示第一纹理特征所属的眼部图像为闭眼图像的结果。
可选地,本实施例中的具体示例可以参考上述实施例1和实施例2中所描述的示例,本实施例在此不再赘述。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (14)

1.一种眨眼运动的识别方法,其特征在于,包括:
获取人脸图像帧序列中的预定图像帧中眼部图像的纹理特征,其中,所述纹理特征用于表征所述眼部图像对应的眼部的生物特征;
根据所述纹理特征确定所述预定图像帧中眼部图像为睁眼图像还是闭眼图像;
判断所述人脸图像帧序列的眼部图像是否包括睁眼图像和闭眼图像;
若所述人脸图像帧序列的眼部图像包括睁眼图像和闭眼图像,则确定所述人脸图像帧序列对应的人脸存在眨眼运动。
2.根据权利要求1所述的方法,其特征在于,根据所述纹理特征确定所述预定图像帧中眼部图像为睁眼图像还是闭眼图像包括:
获取用于区分眼部图像为睁眼图像还是闭眼图像的模型,所述模型包括第一规则和第二规则;
通过所述模型判断第一纹理特征满足所述第一规则还是所述第二规则,其中,所述第一纹理特征为所述人脸图像帧序列中的任意一张图像中眼部图像的纹理特征;
若通过所述模型判断出所述第一纹理特征满足所述第一规则,则通过所述模型输出用于指示所述第一纹理特征所属的眼部图像为睁眼图像的结果;
若通过所述模型判断出所述第一纹理特征满足所述第二规则,则通过所述模型输出用于指示所述第一纹理特征所属的眼部图像为闭眼图像的结果。
3.根据权利要求2所述的方法,其特征在于,通过所述模型判断第一纹理特征满足所述第一规则还是所述第二规则包括:
将所述第一纹理特征映射到N维空间中,其中,所述N维空间被分类边界划分为第一空间和第二空间;
判断所述第一纹理特征映射到所述第一空间还是所述第二空间;
若所述第一纹理特征映射到所述第一空间,则确定所述第一纹理特征满足所述第一规则;
若所述第一纹理特征映射到所述第二空间,则确定所述第一纹理特征满足所述第二规则。
4.根据权利要求2所述的方法,其特征在于,通过所述模型判断第一纹理特征满足所述第一规则还是所述第二规则包括:
将所述第一纹理特征输入到多个决策树中,其中,所述多个决策树采用不同的分类规则将所述第一纹理特征分为第一结果或第二结果,所述第一结果用于指示所述第一纹理特征属于睁眼图像,所述第二结果用于指示所述第一纹理特征属于闭眼图像;
比较所述多个决策树输出的第一结果的数量和输出所述第二结果的数量;
若所述第一结果的数量大于等于所述第二结果的数量,则确定所述第一纹理特征满足所述第一规则;
若所述第一结果的数量小于所述第二结果的数量,则确定所述第一纹理特征满足所述第二规则。
5.根据权利要求1所述的方法,其特征在于,获取人脸图像帧序列的预定图像帧中眼部图像的纹理特征包括:
定位第一帧人脸图像中人脸五官的关键特征点,并根据所述关键特征点确定所述第一帧人脸图像中眼部图像的位置,其中,所述第一帧人脸图像为所述人脸图像序列帧中的任意一帧;
按照所述位置从所述第一帧人脸图像中扣取眼部图像;
从扣取的眼部图像中提取纹理特征作为所述第一帧人脸图像中眼部图像的纹理特征。
6.根据权利要求1所述的方法,其特征在于,若所述人脸图像帧序列的眼部图像包括所述睁眼图像和所述闭眼图像,则确定所述人脸图像帧序列对应的人脸存在眨眼运动包括:
判断第一睁眼图像和与所述第一睁眼图像最近的闭眼图像之间的帧间隔是否满足预设帧间隔,所述第一睁眼图像为所述人脸图像帧序列中的任意一个睁眼图像;
若满足,则确定所述人脸图像帧序列对应的人脸存在眨眼运动;
若不满足,则确定所述人脸图像帧序列对应的人脸存在由睁眼到闭眼的动作,或者存在由闭眼到睁眼的动作。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
在确定所述人脸图像帧序列对应的人脸存在眨眼运动之后,发出用于指示目标对象执行第一预设动作指令信息;
在确定所述人脸图像帧序列对应的人脸存在由睁眼到闭眼的动作,或者存在由闭眼到睁眼的动作之后,发出用于指示目标对象执行第二预设动作指令信息。
8.一种眨眼运动的识别装置,其特征在于,包括:
获取单元,用于获取人脸图像帧序列的预定图像帧中眼部图像的纹理特征,其中,所述纹理特征用于表征所述眼部图像对应的眼部的生物特征;
第一确定单元,用于根据所述纹理特征确定所述预定图像帧中眼部图像为睁眼图像还是闭眼图像;
判断单元,用于判断所述人脸图像帧序列的眼部图像是否包括睁眼图像和闭眼图像;
第二确定单元,用于在所述人脸图像帧序列的眼部图像包括睁眼图像和闭眼图像时,确定所述人脸图像帧序列对应的人脸存在眨眼运动。
9.根据权利要求8所述的装置,其特征在于,所述第一确定单元包括:
获取模块,用于获取用于区分眼部图像为睁眼图像还是闭眼图像的模型,所述模型包括第一规则和第二规则;
第一判断模块,用于通过所述模型判断第一纹理特征满足所述第一规则还是所述第二规则,其中,所述第一纹理特征为所述人脸图像帧序列中的任意一张图像中眼部图像的纹理特征;
第一输出模块,用于通过所述模型判断出所述第一纹理特征满足所述第一规则时,通过所述模型输出用于指示所述第一纹理特征所属的眼部图像为睁眼图像的结果;
第二输出模块,用于通过所述模型判断出所述第一纹理特征满足所述第二规则时,通过所述模型输出用于指示所述第一纹理特征所属的眼部图像为闭眼图像的结果。
10.根据权利要求9所述的装置,其特征在于,所述第一判断模块包括:
映射子模块,用于将所述第一纹理特征映射到N维空间中,其中,所述N维空间被分类边界划分为第一空间和第二空间;
判断子模块,用于判断所述第一纹理特征映射到所述第一空间还是所述第二空间;
第一确定子模块,用于在所述第一纹理特征映射到所述第一空间时,确定所述第一纹理特征满足所述第一规则;
第二确定子模块,用于在所述第一纹理特征映射到所述第二空间时,确定所述第一纹理特征满足所述第二规则。
11.根据权利要求9所述的装置,其特征在于,所述第一判断模块包括:
输入子模块,用于将所述第一纹理特征输入到多个决策树中,其中,所述多个决策树采用不同的分类规则将所述第一纹理特征分为第一结果或第二结果,所述第一结果用于指示所述第一纹理特征属于睁眼图像,所述第二结果用于指示所述第一纹理特征属于闭眼图像;
比较子模块,用于比较所述多个决策树输出的第一结果的数量和输出所述第二结果的数量;
第三确定子模块,用于在所述第一结果的数量大于等于所述第二结果的数量时,确定所述第一纹理特征满足所述第一规则;
第四确定子模块,用于在所述第一结果的数量小于所述第二结果的数量时,确定所述第一纹理特征满足所述第二规则。
12.根据权利要求8所述的装置,其特征在于,所述获取单元包括:
定位模块,用于定位第一帧人脸图像中人脸五官的关键特征点,并根据所述关键特征点确定所述第一帧人脸图像中眼部图像的位置,其中,所述第一帧人脸图像为所述人脸图像序列帧中的任意一帧;
扣取模块,用于按照所述位置从所述第一帧人脸图像中扣取眼部图像;
提取模块,用于从扣取的眼部图像中提取纹理特征作为所述第一帧人脸图像中眼部图像的纹理特征。
13.根据权利要求8所述的装置,其特征在于,所述第二确定单元包括:
第二判断模块,用于判断第一睁眼图像和与所述第一睁眼图像最近的闭眼图像之间的帧间隔是否满足预设帧间隔,所述第一睁眼图像为所述人脸图像帧序列中的任意一个睁眼图像;
第一确定模块,用于在满足的情况下,确定所述人脸图像帧序列对应的人脸存在眨眼运动;
第二确定模块,用于在不满足的情况下,确定所述人脸图像帧序列对应的人脸存在由睁眼到闭眼的动作,或者存在由闭眼到睁眼的动作。
14.根据权利要求13所述的装置,其特征在于,所述装置还包括:
第一发送单元,用于在确定所述人脸图像帧序列对应的人脸存在眨眼运动之后,发出用于指示目标对象执行第一预设动作指令信息;
第二发送单元,用于在确定所述人脸图像帧序列对应的人脸存在由睁眼到闭眼的动作,或者存在由闭眼到睁眼的动作之后,发出用于指示目标对象执行第二预设动作指令信息。
CN201510964968.0A 2015-12-18 2015-12-18 眨眼运动的识别方法和装置 Active CN106897659B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510964968.0A CN106897659B (zh) 2015-12-18 2015-12-18 眨眼运动的识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510964968.0A CN106897659B (zh) 2015-12-18 2015-12-18 眨眼运动的识别方法和装置

Publications (2)

Publication Number Publication Date
CN106897659A true CN106897659A (zh) 2017-06-27
CN106897659B CN106897659B (zh) 2019-05-24

Family

ID=59190536

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510964968.0A Active CN106897659B (zh) 2015-12-18 2015-12-18 眨眼运动的识别方法和装置

Country Status (1)

Country Link
CN (1) CN106897659B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107220635A (zh) * 2017-06-21 2017-09-29 北京市威富安防科技有限公司 基于多造假方式的人脸活体检测方法
CN107766840A (zh) * 2017-11-09 2018-03-06 杭州有盾网络科技有限公司 一种眨眼检测的方法、装置、设备及计算机可读存储介质
CN107992842A (zh) * 2017-12-13 2018-05-04 深圳云天励飞技术有限公司 活体检测方法、计算机装置及计算机可读存储介质
CN108415653A (zh) * 2018-03-27 2018-08-17 百度在线网络技术(北京)有限公司 用于终端设备的锁屏方法和装置
CN108701214A (zh) * 2017-12-25 2018-10-23 深圳市大疆创新科技有限公司 图像数据处理方法、装置及设备
CN109165570A (zh) * 2018-08-03 2019-01-08 北京字节跳动网络技术有限公司 用于生成信息的方法和装置
CN109188928A (zh) * 2018-10-29 2019-01-11 百度在线网络技术(北京)有限公司 用于控制智能家居设备的方法和装置
CN109522868A (zh) * 2018-11-30 2019-03-26 北京七鑫易维信息技术有限公司 一种检测眨眼的方法和装置
CN112183215A (zh) * 2020-09-02 2021-01-05 重庆利龙科技产业(集团)有限公司 一种结合多特征级联svm与人眼模板的人眼定位方法及系统
US10936867B2 (en) 2018-04-25 2021-03-02 Beijing Didi Infinity Technology And Development Co.. Ltd. Systems and methods for blink action recognition based on facial feature points
CN112738364A (zh) * 2020-12-07 2021-04-30 浙江合众新能源汽车有限公司 一种基于面部表情及语音识别的用户监控装置及其监控方法
CN113008231A (zh) * 2021-04-30 2021-06-22 东莞市小精灵教育软件有限公司 一种运动状态识别方法、系统、可穿戴设备和存储介质
CN116311539A (zh) * 2023-05-19 2023-06-23 亿慧云智能科技(深圳)股份有限公司 基于毫米波的睡眠动作捕捉方法、装置、设备及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101425136A (zh) * 2008-10-24 2009-05-06 北京工业大学 视频图像局部二进制模式特征的获取方法和装置
CN101599207A (zh) * 2009-05-06 2009-12-09 深圳市汉华安道科技有限责任公司 一种疲劳驾驶检测装置及汽车
CN103150870A (zh) * 2013-02-04 2013-06-12 浙江捷尚视觉科技有限公司 一种基于视频的火车驾驶员疲劳检测方法
CN103268479A (zh) * 2013-05-29 2013-08-28 电子科技大学 全天候疲劳驾驶检测方法
CN103336973A (zh) * 2013-06-19 2013-10-02 华南理工大学 多特征决策融合的眼状态识别方法
CN103971093A (zh) * 2014-04-22 2014-08-06 大连理工大学 基于多尺度lbp算法的疲劳检测方法
CN104091147A (zh) * 2014-06-11 2014-10-08 华南理工大学 一种近红外眼睛定位及眼睛状态识别方法
CN104166831A (zh) * 2013-05-15 2014-11-26 五邑大学 一种基于albp与src算法的疲劳检测方法与系统
CN105095879A (zh) * 2015-08-19 2015-11-25 华南理工大学 基于特征融合的眼睛状态识别方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101425136A (zh) * 2008-10-24 2009-05-06 北京工业大学 视频图像局部二进制模式特征的获取方法和装置
CN101599207A (zh) * 2009-05-06 2009-12-09 深圳市汉华安道科技有限责任公司 一种疲劳驾驶检测装置及汽车
CN103150870A (zh) * 2013-02-04 2013-06-12 浙江捷尚视觉科技有限公司 一种基于视频的火车驾驶员疲劳检测方法
CN104166831A (zh) * 2013-05-15 2014-11-26 五邑大学 一种基于albp与src算法的疲劳检测方法与系统
CN103268479A (zh) * 2013-05-29 2013-08-28 电子科技大学 全天候疲劳驾驶检测方法
CN103336973A (zh) * 2013-06-19 2013-10-02 华南理工大学 多特征决策融合的眼状态识别方法
CN103971093A (zh) * 2014-04-22 2014-08-06 大连理工大学 基于多尺度lbp算法的疲劳检测方法
CN104091147A (zh) * 2014-06-11 2014-10-08 华南理工大学 一种近红外眼睛定位及眼睛状态识别方法
CN105095879A (zh) * 2015-08-19 2015-11-25 华南理工大学 基于特征融合的眼睛状态识别方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
姚胜等: ""基于LBP的眼睛开闭检测方法"", 《计算机应用研究》 *
孙睿: ""基于人脸定位技术的疲劳驾驶检测方法"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
宋凯等: ""基于Gabor 变换的人眼开闭状态识别技术研究"", 《吉林大学学报( 信息科学版)》 *
李雪梅: ""复杂及红外环境下人眼状态检测算法研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
林建文: ""复杂光照条件下的驾驶员眼状态识别算法研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107220635A (zh) * 2017-06-21 2017-09-29 北京市威富安防科技有限公司 基于多造假方式的人脸活体检测方法
CN107766840A (zh) * 2017-11-09 2018-03-06 杭州有盾网络科技有限公司 一种眨眼检测的方法、装置、设备及计算机可读存储介质
CN107992842B (zh) * 2017-12-13 2020-08-11 深圳励飞科技有限公司 活体检测方法、计算机装置及计算机可读存储介质
CN107992842A (zh) * 2017-12-13 2018-05-04 深圳云天励飞技术有限公司 活体检测方法、计算机装置及计算机可读存储介质
CN108701214A (zh) * 2017-12-25 2018-10-23 深圳市大疆创新科技有限公司 图像数据处理方法、装置及设备
CN108415653A (zh) * 2018-03-27 2018-08-17 百度在线网络技术(北京)有限公司 用于终端设备的锁屏方法和装置
US10936867B2 (en) 2018-04-25 2021-03-02 Beijing Didi Infinity Technology And Development Co.. Ltd. Systems and methods for blink action recognition based on facial feature points
CN109165570A (zh) * 2018-08-03 2019-01-08 北京字节跳动网络技术有限公司 用于生成信息的方法和装置
CN109188928A (zh) * 2018-10-29 2019-01-11 百度在线网络技术(北京)有限公司 用于控制智能家居设备的方法和装置
CN109522868A (zh) * 2018-11-30 2019-03-26 北京七鑫易维信息技术有限公司 一种检测眨眼的方法和装置
CN112183215A (zh) * 2020-09-02 2021-01-05 重庆利龙科技产业(集团)有限公司 一种结合多特征级联svm与人眼模板的人眼定位方法及系统
CN112738364A (zh) * 2020-12-07 2021-04-30 浙江合众新能源汽车有限公司 一种基于面部表情及语音识别的用户监控装置及其监控方法
CN113008231A (zh) * 2021-04-30 2021-06-22 东莞市小精灵教育软件有限公司 一种运动状态识别方法、系统、可穿戴设备和存储介质
CN116311539A (zh) * 2023-05-19 2023-06-23 亿慧云智能科技(深圳)股份有限公司 基于毫米波的睡眠动作捕捉方法、装置、设备及存储介质
CN116311539B (zh) * 2023-05-19 2023-07-28 亿慧云智能科技(深圳)股份有限公司 基于毫米波的睡眠动作捕捉方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN106897659B (zh) 2019-05-24

Similar Documents

Publication Publication Date Title
CN106897659A (zh) 眨眼运动的识别方法和装置
CN108319953B (zh) 目标对象的遮挡检测方法及装置、电子设备及存储介质
KR102339915B1 (ko) 셀피를 촬영하도록 사용자를 안내하기 위한 시스템 및 방법
CN110569795B (zh) 一种图像识别方法、装置以及相关设备
US9111375B2 (en) Evaluation of three-dimensional scenes using two-dimensional representations
CN111178183B (zh) 人脸检测方法及相关装置
CN108229268A (zh) 表情识别及卷积神经网络模型训练方法、装置和电子设备
CN110956060A (zh) 动作识别、驾驶动作分析方法和装置及电子设备
CN109271884A (zh) 人脸属性识别方法、装置、终端设备和存储介质
CN110414428A (zh) 一种生成人脸属性信息识别模型的方法
CN107341435A (zh) 视频图像的处理方法、装置和终端设备
CN108875452A (zh) 人脸识别方法、装置、系统和计算机可读介质
CN107169797A (zh) 智能导购方法、系统、共享服务器和智能导购机器人
CN112732071B (zh) 一种免校准眼动追踪系统及应用
CN112016527B (zh) 基于深度学习的大熊猫行为识别方法、系统、终端及介质
CN109271930A (zh) 微表情识别方法、装置与存储介质
CN112052746A (zh) 目标检测方法、装置、电子设备和可读存储介质
WO2019142127A1 (en) Method and system of creating multiple expression emoticons
CN109670517A (zh) 目标检测方法、装置、电子设备和目标检测模型
CN110728242A (zh) 基于人像识别的图像匹配方法、装置、存储介质及应用
CN110363111A (zh) 基于镜头失真原理的人脸活体检测方法、装置及存储介质
CN109159129A (zh) 一种基于人脸表情识别的智能陪伴机器人
CN112818899A (zh) 人脸图像处理方法、装置、计算机设备和存储介质
CN112861743A (zh) 一种掌静脉图像防伪方法、装置和设备
CN110148234A (zh) 校园刷脸接送交互方法、存储介质及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20210924

Address after: 518000 Tencent Building, No. 1 High-tech Zone, Nanshan District, Shenzhen City, Guangdong Province, 35 Floors

Patentee after: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.

Patentee after: TENCENT CLOUD COMPUTING (BEIJING) Co.,Ltd.

Address before: 2, 518000, East 403 room, SEG science and Technology Park, Zhenxing Road, Shenzhen, Guangdong, Futian District

Patentee before: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.

TR01 Transfer of patent right