CN104091150B - 一种基于回归的人眼状态判断方法 - Google Patents
一种基于回归的人眼状态判断方法 Download PDFInfo
- Publication number
- CN104091150B CN104091150B CN201410300198.5A CN201410300198A CN104091150B CN 104091150 B CN104091150 B CN 104091150B CN 201410300198 A CN201410300198 A CN 201410300198A CN 104091150 B CN104091150 B CN 104091150B
- Authority
- CN
- China
- Prior art keywords
- human eye
- sample
- eye
- eyes
- opening degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Image Analysis (AREA)
- Image Processing (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Abstract
本发明涉及一种基于回归的人眼状态判断方法。本发明首先对样本中人眼的眼睑位置进行标注;并生成归一化的人眼样本x。其次将人眼样本x,及由上下眼睑距离l计算得到的开合度d作为训练数据(x,d),输入给统计回归算法进行训练,得到回归模型Μ。然后对于新的人眼图像,归一化为标准输入xi给回归模型Μ,得到输出开合度di。最后根据不同的应用需要,场景和不同的使用者,选择阈值Τ。检测闭眼,如果di≤Τc,则表示闭眼,Τc为闭眼阈值。如果di≥Τo,则表示开眼,Τo为开眼阈值。本发明在不需要精确检测眼睑的情况下,利用统计学习技术自动得到连续的人眼睁闭开合度。该方法易于实现,鲁棒性好,应用灵活。
Description
技术领域
本发明属于视频分析技术领域,涉及一种基于回归的人眼状态判断方法。
背景技术
在疲劳检测等人脸图像分析应用中,需要自动检测人眼闭合状态。已有方法可分为两类。一类是通过边缘分析、主动形状模型(ASM)、纹理模型(AAM)等图像分析手段,精确检测出眼睑轮廓线,通过两个眼睑之间的距离,直接判断出眼睛是否闭合;另一类是通过统计学习的方法,利用大量的开眼和闭眼样本,训练出分类器,对人眼状态进行开、合分类。第一类方法直接,而且可以给出眼睛的开合度。但是要准确的检测出眼睑轮廓线,技术要求非常高,且实际应用准确度不高。第二类方法通过特征描述和分类技术对眼睛图像进行分类,技术实现相对成熟。但是应该认识到,人眼的睁闭状态并非是离散的,只有开、合两种状态,而是连续的。特别是驾驶过程中,眼睑的距离是变化的。再加上,即便都是在开眼状态下,不同人眼睛的开合度也有差异。因此,简单用分类器对眼睛状态进行分类并不合理。
发明内容
本发明采用统计学习中的回归技术,对人眼的状态判断输出连续值。在疲劳检测等实际应用中,可以设定不同的阈值,来获得不同灵敏度和对不同人的适用性。
本发明方法具体是:
步骤一:对样本中人眼的眼睑位置进行标注;所述样本至少包含10000张以上的人脸图像,且应该包含不同睁闭状态。
步骤二:生成归一化的人眼样本x。
步骤三:将人眼样本x,及由上下眼睑距离l计算得到的开合度d作为训练数据(x,d),输入给统计回归算法进行训练,得到回归模型Μ。
步骤四:对于新的人眼图像,采用与步骤二相同方法归一化为标准输入xi给回归模型Μ,得到输出开合度di。
步骤五:根据不同的应用需要,场景和不同的使用者,选择阈值Τ。检测闭眼,如果di≤Τc,则表示闭眼,Τc为闭眼阈值。如果di≥Τo,则表示开眼,Τo为开眼阈值。
进一步说,在步骤一中至少标注上眼睑的最低点和下眼睑的最高点。
进一步说,步骤二具体是:
首先以双眼中心为基准,将所有的人脸进行相似变换,使它们的双眼中心位置对齐。这样所有人脸图像的双眼中心距离一样,用Deye_cent表示,眼睛中心点为两个眼角中线和上下眼睑中线的交点。
然后,以眼睛中心点为中心,切取固定大小区域作为归一化人眼样本,这里区域宽度W = 0.6 Deye_cent,高度H = 0.3Deye_cent。
进一步说,步骤三中的训练过程中将开合度作为训练标签,标签按照开合度范围划分为0~26个等级,训练至样本图像对应预测值为样本标签,则训练结束。
进一步说,步骤三中的统计回归算法采用基于回归算法原理的梯度提升树。
本发明的有益效果:在不需要精确检测眼睑的情况下,利用统计学习技术自动得到连续的人眼睁闭开合度。该方法易于实现,鲁棒性好,应用灵活。
附图说明
图1为人眼样本的选取方式;
图2为根据人眼样本闭合度标签,迭代训练过程。
具体实施方式
下面结合附图对本发明作进一步描述。
步骤一:对样本中人眼的眼睑位置进行标注。所述样本至少包含10000张以上的人脸图像,且应该包含不同睁闭状态;人眼标注上眼睑的最低点和下眼睑的最高点,人眼左右两个眼角。
步骤二:生成归一化的人眼样本x。如图1,首先以双眼中心为基准,将所有的人脸进行相似变换,使它们的双眼中心位置对齐。这样所有人脸图像的双眼中心距离一样,用Deye_cent表示,眼睛中心点为两个眼角中线和上下眼睑中线的交点;
然后,以眼睛中心点为中心,切取固定大小区域作为归一化人眼样本,这里区域宽度W = 0.6 Deye_cent,高度H = 0.3Deye_cent。
步骤三:将人眼样本x,及由上下眼睑距离l计算得到的开合度d作为训练数据(x,d),训练过程中将开合度作为训练标签,标签按照开合度范围划分为0~26个等级,其中0表示完全眼睛完全闭合,26表示人眼上下眼睑距离为左右眼角距离的0.5倍。假设实际过程中,上下眼睑大于左右眼角的0.5倍,则该人眼样本的类别属于第26个等级。使用这27个等级作为回归算法训练的收敛目标,如图2,举例10000个人眼样本中,闭合度为14、16、24、26的样本训练过程,在流程图第一阶段,闭合度为14、16的样本预测值为15,闭合度24、26的样本预测值为25。可见闭合度为14、16、24和26的样本离目标结果差1,称之为目标残差。将目标残差作为第二轮训练的收敛目标,直至训练残差为0,则训练结束。最终得到回归模型M。
步骤四:对于新的人眼图像,采用与步骤二相同方法归一化为标准输入xi给回归模型Μ,得到输出开合度di。
步骤五:根据不同的应用需要,场景和不同的使用者,选择阈值Τ。检测闭眼,如果di≤Τc,则表示闭眼,Τc为闭眼阈值。如果di≥Τo, 则表示开眼,Τo为开眼阈值。
Claims (5)
1.一种基于回归的人眼状态判断方法,其特征在于该方法的具体步骤如下:
步骤一:对样本中人眼的眼睑位置进行标注;所述样本至少包含10000张以上的人脸图像,且应该包含不同睁闭状态;
步骤二:生成归一化的人眼样本x;
步骤三:将人眼样本x,及由上下眼睑距离l计算得到的开合度d作为训练数据(x,d),输入给统计回归算法进行训练,得到回归模型Μ;
步骤四:对于新的人眼图像,采用与步骤二相同方法归一化为标准输入xi给回归模型Μ,得到输出开合度di;该输出开合度为连续值;
步骤五:根据不同的应用需要,场景和不同的使用者,选择阈值Τ;检测闭眼,如果di≤Τc,则表示闭眼,Τc为闭眼阈值;如果di≥Τo,则表示开眼,Τo为开眼阈值。
2.根据权利要求1所述的一种基于回归的人眼状态判断方法,其特征在于:在步骤一中至少标注上眼睑的最低点和下眼睑的最高点。
3.根据权利要求1所述的一种基于回归的人眼状态判断方法,其特征在于:步骤二具体是:
首先以双眼中心为基准,将所有的人脸进行相似变换,使它们的双眼中心位置对齐;这样所有人脸图像的双眼中心距离一样,用Deye_cent表示,眼睛中心点为两个眼角中线和上下眼睑中线的交点;
然后,以眼睛中心点为中心,切取固定大小区域作为归一化人眼样本,这里区域宽度W=0.6Deye_cent,高度H=0.3Deye_cent。
4.根据权利要求1所述的一种基于回归的人眼状态判断方法,其特征在于:步骤三中的训练过程中将开合度作为训练标签,标签按照开合度范围划分为0~26个等级,训练至样本图像对应预测值为样本标签,则训练结束。
5.根据权利要求1所述的一种基于回归的人眼状态判断方法,其特征在于:步骤三中的统计回归算法采用基于回归算法原理的梯度提升树。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410300198.5A CN104091150B (zh) | 2014-06-26 | 2014-06-26 | 一种基于回归的人眼状态判断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410300198.5A CN104091150B (zh) | 2014-06-26 | 2014-06-26 | 一种基于回归的人眼状态判断方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104091150A CN104091150A (zh) | 2014-10-08 |
CN104091150B true CN104091150B (zh) | 2019-02-26 |
Family
ID=51638865
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410300198.5A Expired - Fee Related CN104091150B (zh) | 2014-06-26 | 2014-06-26 | 一种基于回归的人眼状态判断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104091150B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109460704B (zh) * | 2018-09-18 | 2020-09-15 | 厦门瑞为信息技术有限公司 | 一种基于深度学习的疲劳检测方法、系统和计算机设备 |
CN111382648A (zh) * | 2018-12-30 | 2020-07-07 | 广州市百果园信息技术有限公司 | 人脸动态表情的检测方法、装置、设备及存储介质 |
CN110956067B (zh) * | 2019-05-26 | 2022-05-17 | 魔门塔(苏州)科技有限公司 | 一种人眼眼睑曲线的构建方法及装置 |
CN112016347B (zh) * | 2019-05-29 | 2022-06-24 | 魔门塔(苏州)科技有限公司 | 一种基于眼睑特征信息的人员状态检测方法及装置 |
CN110956071B (zh) * | 2019-06-21 | 2022-06-03 | 魔门塔(苏州)科技有限公司 | 眼部关键点的标注及其检测模型的训练方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101059836A (zh) * | 2007-06-01 | 2007-10-24 | 华南理工大学 | 一种人眼定位及人眼状态识别方法 |
CN101299234A (zh) * | 2008-06-06 | 2008-11-05 | 华南理工大学 | 一种基于嵌入式隐马尔可夫模型的人眼状态识别方法 |
CN102324166A (zh) * | 2011-09-19 | 2012-01-18 | 深圳市汉华安道科技有限责任公司 | 一种疲劳驾驶检测方法及装置 |
-
2014
- 2014-06-26 CN CN201410300198.5A patent/CN104091150B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101059836A (zh) * | 2007-06-01 | 2007-10-24 | 华南理工大学 | 一种人眼定位及人眼状态识别方法 |
CN101299234A (zh) * | 2008-06-06 | 2008-11-05 | 华南理工大学 | 一种基于嵌入式隐马尔可夫模型的人眼状态识别方法 |
CN102324166A (zh) * | 2011-09-19 | 2012-01-18 | 深圳市汉华安道科技有限责任公司 | 一种疲劳驾驶检测方法及装置 |
Non-Patent Citations (1)
Title |
---|
复杂光照条件下的驾驶员眼状态识别算法研究;林建文;《中国优秀硕士学位论文全文数据库工程科技Ⅱ辑》;20130115;正文第3.2.2节、第3.3.2节 |
Also Published As
Publication number | Publication date |
---|---|
CN104091150A (zh) | 2014-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110348319B (zh) | 一种基于人脸深度信息和边缘图像融合的人脸防伪方法 | |
Rao et al. | Selfie video based continuous Indian sign language recognition system | |
Khan et al. | Hand gesture recognition: a literature review | |
CN104463100B (zh) | 基于面部表情识别模式的智能轮椅人机交互系统及方法 | |
CN104091150B (zh) | 一种基于回归的人眼状态判断方法 | |
CN105160317B (zh) | 一种基于区域分块行人性别识别方法 | |
Mohandes et al. | A signer-independent Arabic Sign Language recognition system using face detection, geometric features, and a Hidden Markov Model | |
CN100452081C (zh) | 一种人眼定位及人眼状态识别方法 | |
CN103971106B (zh) | 多视角人脸图像性别识别方法及装置 | |
Ragab et al. | A visual-based driver distraction recognition and detection using random forest | |
CN107301376B (zh) | 一种基于深度学习多层刺激的行人检测方法 | |
CN109460704A (zh) | 一种基于深度学习的疲劳检测方法、系统和计算机设备 | |
CN102270308A (zh) | 一种基于五官相关aam模型的面部特征定位方法 | |
CN104281839A (zh) | 一种人体姿势识别方法和装置 | |
CN105701466A (zh) | 快速的全角度人脸跟踪方法 | |
CN105809713A (zh) | 基于在线Fisher判别机制增强特征选择的目标跟踪方法 | |
CN102831408A (zh) | 人脸识别方法 | |
CN108108651B (zh) | 基于视频人脸分析的驾驶员非专心驾驶检测方法及系统 | |
CN105426882A (zh) | 一种人脸图像中快速定位人眼的方法 | |
CN105678735A (zh) | 一种用于雾天图像的目标显著性检测方法 | |
CN105354549A (zh) | 基于似物性估计的快速行人检测方法 | |
CN107330363A (zh) | 一种快速的互联网广告牌检测方法 | |
Agrawal et al. | A Tutor for the hearing impaired (developed using Automatic Gesture Recognition) | |
Singh et al. | Implementation and evaluation of DWT and MFCC based ISL gesture recognition | |
CN108133202A (zh) | 一种基于分层混合密度网络的自遮挡手部姿态估计方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: Human eye state judgment method based on regression Effective date of registration: 20190821 Granted publication date: 20190226 Pledgee: Hangzhou Yuhang Small and Medium-sized Enterprise Transfer Service Co., Ltd. Pledgor: ZHEJIANG ICARE VISION TECHNOLOGY CO., LTD. Registration number: Y2019330000020 |
|
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190226 Termination date: 20210626 |