CN104091150B - 一种基于回归的人眼状态判断方法 - Google Patents

一种基于回归的人眼状态判断方法 Download PDF

Info

Publication number
CN104091150B
CN104091150B CN201410300198.5A CN201410300198A CN104091150B CN 104091150 B CN104091150 B CN 104091150B CN 201410300198 A CN201410300198 A CN 201410300198A CN 104091150 B CN104091150 B CN 104091150B
Authority
CN
China
Prior art keywords
human eye
sample
eye
eyes
opening degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201410300198.5A
Other languages
English (en)
Other versions
CN104091150A (zh
Inventor
尚凌辉
蒋宗杰
高勇
于晓静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZHEJIANG ICARE VISION TECHNOLOGY Co Ltd
Original Assignee
ZHEJIANG ICARE VISION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZHEJIANG ICARE VISION TECHNOLOGY Co Ltd filed Critical ZHEJIANG ICARE VISION TECHNOLOGY Co Ltd
Priority to CN201410300198.5A priority Critical patent/CN104091150B/zh
Publication of CN104091150A publication Critical patent/CN104091150A/zh
Application granted granted Critical
Publication of CN104091150B publication Critical patent/CN104091150B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本发明涉及一种基于回归的人眼状态判断方法。本发明首先对样本中人眼的眼睑位置进行标注;并生成归一化的人眼样本x。其次将人眼样本x,及由上下眼睑距离l计算得到的开合度d作为训练数据(x,d),输入给统计回归算法进行训练,得到回归模型Μ。然后对于新的人眼图像,归一化为标准输入xi给回归模型Μ,得到输出开合度di。最后根据不同的应用需要,场景和不同的使用者,选择阈值Τ。检测闭眼,如果di≤Τc,则表示闭眼,Τc为闭眼阈值。如果di≥Τo,则表示开眼,Τo为开眼阈值。本发明在不需要精确检测眼睑的情况下,利用统计学习技术自动得到连续的人眼睁闭开合度。该方法易于实现,鲁棒性好,应用灵活。

Description

一种基于回归的人眼状态判断方法
技术领域
本发明属于视频分析技术领域,涉及一种基于回归的人眼状态判断方法。
背景技术
在疲劳检测等人脸图像分析应用中,需要自动检测人眼闭合状态。已有方法可分为两类。一类是通过边缘分析、主动形状模型(ASM)、纹理模型(AAM)等图像分析手段,精确检测出眼睑轮廓线,通过两个眼睑之间的距离,直接判断出眼睛是否闭合;另一类是通过统计学习的方法,利用大量的开眼和闭眼样本,训练出分类器,对人眼状态进行开、合分类。第一类方法直接,而且可以给出眼睛的开合度。但是要准确的检测出眼睑轮廓线,技术要求非常高,且实际应用准确度不高。第二类方法通过特征描述和分类技术对眼睛图像进行分类,技术实现相对成熟。但是应该认识到,人眼的睁闭状态并非是离散的,只有开、合两种状态,而是连续的。特别是驾驶过程中,眼睑的距离是变化的。再加上,即便都是在开眼状态下,不同人眼睛的开合度也有差异。因此,简单用分类器对眼睛状态进行分类并不合理。
发明内容
本发明采用统计学习中的回归技术,对人眼的状态判断输出连续值。在疲劳检测等实际应用中,可以设定不同的阈值,来获得不同灵敏度和对不同人的适用性。
本发明方法具体是:
步骤一:对样本中人眼的眼睑位置进行标注;所述样本至少包含10000张以上的人脸图像,且应该包含不同睁闭状态。
步骤二:生成归一化的人眼样本x。
步骤三:将人眼样本x,及由上下眼睑距离l计算得到的开合度d作为训练数据(x,d),输入给统计回归算法进行训练,得到回归模型Μ。
步骤四:对于新的人眼图像,采用与步骤二相同方法归一化为标准输入xi给回归模型Μ,得到输出开合度di
步骤五:根据不同的应用需要,场景和不同的使用者,选择阈值Τ。检测闭眼,如果di≤Τc,则表示闭眼,Τc为闭眼阈值。如果di≥Τo,则表示开眼,Τo为开眼阈值。
进一步说,在步骤一中至少标注上眼睑的最低点和下眼睑的最高点。
进一步说,步骤二具体是:
首先以双眼中心为基准,将所有的人脸进行相似变换,使它们的双眼中心位置对齐。这样所有人脸图像的双眼中心距离一样,用Deye_cent表示,眼睛中心点为两个眼角中线和上下眼睑中线的交点。
然后,以眼睛中心点为中心,切取固定大小区域作为归一化人眼样本,这里区域宽度W = 0.6 Deye_cent,高度H = 0.3Deye_cent
进一步说,步骤三中的训练过程中将开合度作为训练标签,标签按照开合度范围划分为0~26个等级,训练至样本图像对应预测值为样本标签,则训练结束。
进一步说,步骤三中的统计回归算法采用基于回归算法原理的梯度提升树。
本发明的有益效果:在不需要精确检测眼睑的情况下,利用统计学习技术自动得到连续的人眼睁闭开合度。该方法易于实现,鲁棒性好,应用灵活。
附图说明
图1为人眼样本的选取方式;
图2为根据人眼样本闭合度标签,迭代训练过程。
具体实施方式
下面结合附图对本发明作进一步描述。
步骤一:对样本中人眼的眼睑位置进行标注。所述样本至少包含10000张以上的人脸图像,且应该包含不同睁闭状态;人眼标注上眼睑的最低点和下眼睑的最高点,人眼左右两个眼角。
步骤二:生成归一化的人眼样本x。如图1,首先以双眼中心为基准,将所有的人脸进行相似变换,使它们的双眼中心位置对齐。这样所有人脸图像的双眼中心距离一样,用Deye_cent表示,眼睛中心点为两个眼角中线和上下眼睑中线的交点;
然后,以眼睛中心点为中心,切取固定大小区域作为归一化人眼样本,这里区域宽度W = 0.6 Deye_cent,高度H = 0.3Deye_cent
步骤三:将人眼样本x,及由上下眼睑距离l计算得到的开合度d作为训练数据(x,d),训练过程中将开合度作为训练标签,标签按照开合度范围划分为0~26个等级,其中0表示完全眼睛完全闭合,26表示人眼上下眼睑距离为左右眼角距离的0.5倍。假设实际过程中,上下眼睑大于左右眼角的0.5倍,则该人眼样本的类别属于第26个等级。使用这27个等级作为回归算法训练的收敛目标,如图2,举例10000个人眼样本中,闭合度为14、16、24、26的样本训练过程,在流程图第一阶段,闭合度为14、16的样本预测值为15,闭合度24、26的样本预测值为25。可见闭合度为14、16、24和26的样本离目标结果差1,称之为目标残差。将目标残差作为第二轮训练的收敛目标,直至训练残差为0,则训练结束。最终得到回归模型M。
步骤四:对于新的人眼图像,采用与步骤二相同方法归一化为标准输入xi给回归模型Μ,得到输出开合度di
步骤五:根据不同的应用需要,场景和不同的使用者,选择阈值Τ。检测闭眼,如果di≤Τc,则表示闭眼,Τc为闭眼阈值。如果di≥Τo, 则表示开眼,Τo为开眼阈值。

Claims (5)

1.一种基于回归的人眼状态判断方法,其特征在于该方法的具体步骤如下:
步骤一:对样本中人眼的眼睑位置进行标注;所述样本至少包含10000张以上的人脸图像,且应该包含不同睁闭状态;
步骤二:生成归一化的人眼样本x;
步骤三:将人眼样本x,及由上下眼睑距离l计算得到的开合度d作为训练数据(x,d),输入给统计回归算法进行训练,得到回归模型Μ;
步骤四:对于新的人眼图像,采用与步骤二相同方法归一化为标准输入xi给回归模型Μ,得到输出开合度di;该输出开合度为连续值;
步骤五:根据不同的应用需要,场景和不同的使用者,选择阈值Τ;检测闭眼,如果di≤Τc,则表示闭眼,Τc为闭眼阈值;如果di≥Τo,则表示开眼,Τo为开眼阈值。
2.根据权利要求1所述的一种基于回归的人眼状态判断方法,其特征在于:在步骤一中至少标注上眼睑的最低点和下眼睑的最高点。
3.根据权利要求1所述的一种基于回归的人眼状态判断方法,其特征在于:步骤二具体是:
首先以双眼中心为基准,将所有的人脸进行相似变换,使它们的双眼中心位置对齐;这样所有人脸图像的双眼中心距离一样,用Deye_cent表示,眼睛中心点为两个眼角中线和上下眼睑中线的交点;
然后,以眼睛中心点为中心,切取固定大小区域作为归一化人眼样本,这里区域宽度W=0.6Deye_cent,高度H=0.3Deye_cent
4.根据权利要求1所述的一种基于回归的人眼状态判断方法,其特征在于:步骤三中的训练过程中将开合度作为训练标签,标签按照开合度范围划分为0~26个等级,训练至样本图像对应预测值为样本标签,则训练结束。
5.根据权利要求1所述的一种基于回归的人眼状态判断方法,其特征在于:步骤三中的统计回归算法采用基于回归算法原理的梯度提升树。
CN201410300198.5A 2014-06-26 2014-06-26 一种基于回归的人眼状态判断方法 Expired - Fee Related CN104091150B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410300198.5A CN104091150B (zh) 2014-06-26 2014-06-26 一种基于回归的人眼状态判断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410300198.5A CN104091150B (zh) 2014-06-26 2014-06-26 一种基于回归的人眼状态判断方法

Publications (2)

Publication Number Publication Date
CN104091150A CN104091150A (zh) 2014-10-08
CN104091150B true CN104091150B (zh) 2019-02-26

Family

ID=51638865

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410300198.5A Expired - Fee Related CN104091150B (zh) 2014-06-26 2014-06-26 一种基于回归的人眼状态判断方法

Country Status (1)

Country Link
CN (1) CN104091150B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109460704B (zh) * 2018-09-18 2020-09-15 厦门瑞为信息技术有限公司 一种基于深度学习的疲劳检测方法、系统和计算机设备
CN111382648A (zh) * 2018-12-30 2020-07-07 广州市百果园信息技术有限公司 人脸动态表情的检测方法、装置、设备及存储介质
CN110956067B (zh) * 2019-05-26 2022-05-17 魔门塔(苏州)科技有限公司 一种人眼眼睑曲线的构建方法及装置
CN112016347B (zh) * 2019-05-29 2022-06-24 魔门塔(苏州)科技有限公司 一种基于眼睑特征信息的人员状态检测方法及装置
CN110956071B (zh) * 2019-06-21 2022-06-03 魔门塔(苏州)科技有限公司 眼部关键点的标注及其检测模型的训练方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101059836A (zh) * 2007-06-01 2007-10-24 华南理工大学 一种人眼定位及人眼状态识别方法
CN101299234A (zh) * 2008-06-06 2008-11-05 华南理工大学 一种基于嵌入式隐马尔可夫模型的人眼状态识别方法
CN102324166A (zh) * 2011-09-19 2012-01-18 深圳市汉华安道科技有限责任公司 一种疲劳驾驶检测方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101059836A (zh) * 2007-06-01 2007-10-24 华南理工大学 一种人眼定位及人眼状态识别方法
CN101299234A (zh) * 2008-06-06 2008-11-05 华南理工大学 一种基于嵌入式隐马尔可夫模型的人眼状态识别方法
CN102324166A (zh) * 2011-09-19 2012-01-18 深圳市汉华安道科技有限责任公司 一种疲劳驾驶检测方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
复杂光照条件下的驾驶员眼状态识别算法研究;林建文;《中国优秀硕士学位论文全文数据库工程科技Ⅱ辑》;20130115;正文第3.2.2节、第3.3.2节

Also Published As

Publication number Publication date
CN104091150A (zh) 2014-10-08

Similar Documents

Publication Publication Date Title
CN110348319B (zh) 一种基于人脸深度信息和边缘图像融合的人脸防伪方法
Rao et al. Selfie video based continuous Indian sign language recognition system
Khan et al. Hand gesture recognition: a literature review
CN104463100B (zh) 基于面部表情识别模式的智能轮椅人机交互系统及方法
CN104091150B (zh) 一种基于回归的人眼状态判断方法
CN105160317B (zh) 一种基于区域分块行人性别识别方法
Mohandes et al. A signer-independent Arabic Sign Language recognition system using face detection, geometric features, and a Hidden Markov Model
CN100452081C (zh) 一种人眼定位及人眼状态识别方法
CN103971106B (zh) 多视角人脸图像性别识别方法及装置
Ragab et al. A visual-based driver distraction recognition and detection using random forest
CN107301376B (zh) 一种基于深度学习多层刺激的行人检测方法
CN109460704A (zh) 一种基于深度学习的疲劳检测方法、系统和计算机设备
CN102270308A (zh) 一种基于五官相关aam模型的面部特征定位方法
CN104281839A (zh) 一种人体姿势识别方法和装置
CN105701466A (zh) 快速的全角度人脸跟踪方法
CN105809713A (zh) 基于在线Fisher判别机制增强特征选择的目标跟踪方法
CN102831408A (zh) 人脸识别方法
CN108108651B (zh) 基于视频人脸分析的驾驶员非专心驾驶检测方法及系统
CN105426882A (zh) 一种人脸图像中快速定位人眼的方法
CN105678735A (zh) 一种用于雾天图像的目标显著性检测方法
CN105354549A (zh) 基于似物性估计的快速行人检测方法
CN107330363A (zh) 一种快速的互联网广告牌检测方法
Agrawal et al. A Tutor for the hearing impaired (developed using Automatic Gesture Recognition)
Singh et al. Implementation and evaluation of DWT and MFCC based ISL gesture recognition
CN108133202A (zh) 一种基于分层混合密度网络的自遮挡手部姿态估计方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Human eye state judgment method based on regression

Effective date of registration: 20190821

Granted publication date: 20190226

Pledgee: Hangzhou Yuhang Small and Medium-sized Enterprise Transfer Service Co., Ltd.

Pledgor: ZHEJIANG ICARE VISION TECHNOLOGY CO., LTD.

Registration number: Y2019330000020

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190226

Termination date: 20210626