CN106485273A - 一种基于hog特征与dnn分类器的人脸检测方法 - Google Patents
一种基于hog特征与dnn分类器的人脸检测方法 Download PDFInfo
- Publication number
- CN106485273A CN106485273A CN201610880082.2A CN201610880082A CN106485273A CN 106485273 A CN106485273 A CN 106485273A CN 201610880082 A CN201610880082 A CN 201610880082A CN 106485273 A CN106485273 A CN 106485273A
- Authority
- CN
- China
- Prior art keywords
- dnn
- face
- grader
- hog feature
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于HOG特征与DNN分类器的人脸检测方法。基于二值化人脸图像提取HOG特征,结合DNN分类器进行人脸检测。在训练阶段,该方法首先对人脸正负样本进行二值化,然后针对二值人脸图像提取HOG特征,并基于该特征训练DNN分类器;在检测阶段,首先对待处理图像进行二值化,然后循环亚采样,在不同尺度下滑动提取块HOG特征,基于训练好的DNN分类器进行人脸检测。该方法的优势在于去除了人脸局部区域灰度变化对检测造成的影响,同时DNN分类器有利于从大量数据中提取抽象特征,提高分类器性能。
Description
技术领域
本发明属于面向公共安全预警的视频图像处理领域,具体涉及一种人脸检测方法。
背景技术
随着视频监控系统的大规模应用,在车站、机场、街道等重要场所安装有大量监控摄像机,可获得充足的含有人员面部区域的视频图像,从而使得进一步基于人脸特征进行目标搜索、人员管控成为可能,在公共安全管理等领域有重要应用前景。人脸检测是其中一个重要的处理环节,相关算法的优劣直接决定人脸识别、人脸搜索等处理的效果和速度。
在人脸检测领域,基于Haar-like(哈尔)或HOG(Histogram of OrientedGradient,方向梯度直方图)特征构建人脸检测分类器是一类比较便于实现的技术手段,但其检测准确性目前并不能满足实际应用的需求。专利201210042789.8结合基于Haar-like特征的人脸分类器和基于HOG特征的人体分类器检测目标,利用头肩区域检测来降低人脸检测的错误率,该方法的缺陷是实际应用中人体经常存在遮挡,对此种情况不能准确地检测目标;专利201410553184.4采用多角度人脸分类器进行人脸检测,理论上可以适应人脸角度变化,但并未从实质上改进基于Haar-like特征的人脸检测方法,反而可能在每个角度都引起错误检测;专利201310377532.2基于HOG特征与SVM分类器进行人脸检测,对表情具有较好适应性,但基于灰度空间计算HOG特征的过程比较复杂,时间开销较大,不利于实时处理。同时上述方法都是在灰度空间进行处理,事实上实现与肤色无关的人脸检测并不需要获得人脸区域的具体灰度值,而是基于人脸区域五官结构、人脸区域与背景的差异进行检测,并且灰度图像存在一定的数据冗余,既增加额外计算量,同时又可能对人脸目标检测造成不利影响。
发明内容
本发明设计了一种基于HOG特征与DNN(Deep Neural Network,深度神经网络)分类器的人脸检测方法,该方法基于二值化人脸图像提取HOG特征,结合DNN分类器进行人脸检测。在训练阶段,该方法首先对人脸正负样本进行二值化,然后针对二值人脸图像提取HOG特征,并基于该特征训练DNN分类器;在检测阶段,首先对待处理图像进行二值化,然后循环亚采样,在不同尺度下滑动提取块HOG特征,基于训练好的DNN分类器进行人脸检测。该方法的优势在于去除了人脸局部区域灰度变化对检测造成的影响,同时DNN分类器有利于从大量数据中提取抽象特征,提高分类器性能。
下面对本发明中的技术方案阐述如下:
1、基于二值化图像提取HOG特征
Step1:原始图像为I(x,y),二值化后为H(x,y),亮区为1,暗区为0。
Step2:对二值图像,计算像素点(x,y)的水平和垂直梯度分别为
Gx(x,y)=H(x+1,y)-H(x-1,y)
Gy(x,y)=H(x,y+1)-H(x,y-1)
进一步计算该点的梯度幅值和方向分别为:
Step3:将原图按照常用的8×8像素划分为若干细胞元Ck,k表示其序号,计算每一个细胞元的加权梯度方向直方图。
(1)按照多次实验得到的60度的合理间距,将0度到360度划分为6等分,对每一个细胞元构造对应的直方图累加器sk[i],i=0,1,2,3,4,5,并初始化为0;
(2)对Ck中的每一个像素点,令i=α(x,y)%6,其中%为整除运算,则对累加器进行加权累加,计算该细胞元加权梯度方向直方图为
sk[i]=sk[i]+G(x,y)
Step4:将相邻10×10个细胞元(多次实验得到)组合成一个块,则该块的大小为80×80像素,在该块内按从左到右、从上到下的顺序将各细胞元的加权梯度直方图串联起来,得到具有600个元素的一维向量,即为该块的HOG特征。
2、基于训练好的DNN分类器进行人脸检测
在训练阶段,对海量人脸图像进行训练,生成人脸分类器,用于人脸检测,可分为:
Step1:从各种视频采集设备,以及互联网等渠道,获取海量具有人脸的图像,且含有光照、角度、表情等各种常见外界变化因素;
Step2:人工裁剪人脸区域,并缩放至归一化尺寸为80×80像素;
Step3:对尺寸归一化图像进行二值化;
Step4:提取二值化图像的HOG特征,作为正样本;
Step5:采集同样数量的不含人脸图像,归一化至相同尺寸,二值化,提取其HOG特征,作为负样本;
Step6:将正负样本图像作为输入,输出为对应的人脸或非人脸标志,通过训练建立DNN网络;
Step7:将上述训练好的DNN网络参数保存到文件,后续人脸检测时使用。
在检测阶段,利用训练好的DNN网络,将待处理图像按不同尺度计算其二值化后的HOG特征,循环亚采样,在不同尺度下滑动提取块HOG特征向量,输入到DNN网络,检测是否有人脸。
Step1:载入保存的DNN网络参数,建立DNN人脸检测网络;
Step2:将待处理图像二值化,设其宽度为width,高度为height;
Step3:提取二值化图像的细胞元加权梯度方向直方图;
Step4:按从左到右,从上到下的顺序,每次偏移2个像素(多次实验得到),从原图中将10×10个细胞元组合成块,提取该块的HOG特征向量,作为输入数据传递给分类器,如果分类器判断为人脸,则输出该块的矩形区域顶点坐标,并将该块内所有原二值图像素值设为1;
Step5:将原二值图按步长1.1向下亚采样,重复step3~step5,直到width或height有一项小于等于最小人脸尺度80时停止。
本发明的优点在于:
1、基于二值图像计算HOG特征,减少数据冗余,降低局部无关灰度变化对检测结果的影响;
2、人脸目标的训练和检测基于二值图像的HOG特征进行,可强化突出训练样本和待检测目标的边缘分布规律,获得比单纯灰度图像更好的效果;
3、人脸目标的训练和检测基于DNN网络进行,相对于传统的浅层网络,DNN更有利于提取抽象信息,实现更好的分类效果。
附图说明
图1是本发明实施例的整体示意图;
图2-图4是二值化人脸区域示意图;
图5是像素点、细胞元、块的结构图。
具体实施方式
下面结合图示,对本发明的优选实施例作详细介绍。
本发明的人脸检测工作流程如图1所示,在训练阶段,准备人脸正负样本并手动裁剪、尺寸归一化,在二值化之后提取其HOG特征用于训练DNN分类器;在检测阶段,对原始图像进行二值化,按一定步长循环亚采样和最小窗口提取HOG特征,输入到DNN分类器进行检测,输出是否有人脸及人脸区域坐标。该方法利用人脸区域的梯度差异信息,结合DNN网络提取抽象特征的能力,能可靠地检测视频图像中的人脸区域,并降低人脸区域具体灰度值对检测的影响。
应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,比如更改应用领域等,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。
本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
Claims (3)
1.一种基于HOG特征与DNN分类器的人脸检测方法,基于二值化人脸图像提取HOG特征,Histogram of Oriented Gradient方向梯度直方图,结合DNN分类器进行人脸检测,DeepNeural Network深度神经网络,其特征在于,在训练阶段,首先对人脸正负样本进行二值化,然后针对二值人脸图像提取HOG特征,并基于该特征训练DNN分类器;在检测阶段,首先对待处理图像进行二值化,然后循环亚采样,在不同尺度下滑动提取块HOG特征,基于训练好的DNN分类器进行人脸检测。
2.根据权利要求1所述的一种基于HOG特征与DNN分类器的人脸检测方法,其特征在于,所述基于二值化图像提取HOG特征,具体步骤如下:
Step1.1:原始图像为I(x,y),二值化后为H(x,y),亮区为1,暗区为0;
Step1.2:对二值图像,计算像素点(x,y)的水平和垂直梯度分别为
Gx(x,y)=H(x+1,y)-H(x-1,y)
Gy(x,y)=H(x,y+1)-H(x,y-1)
进一步计算该点的梯度幅值和方向分别为:
Step1.3:将原图按照常用的8×8像素划分为若干细胞元Ck,k表示其序号,计算每一个细胞元的加权梯度方向直方图;
(1)按照多次实验得到的60度的合理间距,将0度到360度划分为6等分,对每一个细胞元构造对应的直方图累加器sk[i],i=0,1,2,3,4,5,并初始化为0;
(2)对Ck中的每一个像素点,令i=α(x,y)%6,其中%为整除运算,则对累加器进行加权累加,计算该细胞元加权梯度方向直方图为
sk[i]=sk[i]+G(x,y)
Step1.4:将相邻10×10个细胞元组合成一个块,则该块的大小为80×80像素,在该块内按从左到右、从上到下的顺序将各细胞元的加权梯度直方图串联起来,得到具有600个元素的一维向量,即为该块的HOG特征。
3.根据权利要求1所述的一种基于HOG特征与DNN分类器的人脸检测方法,其特征在于,所述基于训练好的DNN分类器进行人脸检测,具体步骤如下:
在训练阶段,对海量人脸图像进行训练,生成人脸分类器,用于人脸检测,可分为:
Step2.1:从各种视频采集设备,以及互联网等渠道,获取海量具有人脸的图像,且含有光照、角度、表情等各种常见外界变化因素;
Step2.2:人工裁剪人脸区域,并缩放至归一化尺寸为80×80像素;
Step2.3:对尺寸归一化图像进行二值化;
Step2.4:提取二值化图像的HOG特征,作为正样本;
Step2.5:采集同样数量的不含人脸图像,归一化至相同尺寸,二值化,提取其HOG特征,作为负样本;
Step2.6:将正负样本图像作为输入,输出为对应的人脸或非人脸标志,通过训练建立DNN网络;
Step2.7:将上述训练好的DNN网络参数保存到文件,后续人脸检测时使用;
在检测阶段,利用训练好的DNN网络,将待处理图像按不同尺度计算其二值化后的HOG特征,循环亚采样,在不同尺度下滑动提取块HOG特征向量,输入到DNN网络,检测是否有人脸;
Step3.1:载入保存的DNN网络参数,建立DNN人脸检测网络;
Step3.2:将待处理图像二值化,设其宽度为width,高度为height;
Step3.3:提取二值化图像的细胞元加权梯度方向直方图;
Step3.4:按从左到右,从上到下的顺序,每次偏移2个像素,从原图中将10×10个细胞元组合成块,提取该块的HOG特征向量,作为输入数据传递给分类器,如果分类器判断为人脸,则输出该块的矩形区域顶点坐标,并将该块内所有原二值图像素值设为1;
Step3.5:将原二值图按步长1.1向下亚采样,重复step3.3~step3.5,直到width或height有一项小于等于最小人脸尺度80时停止。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610880082.2A CN106485273A (zh) | 2016-10-09 | 2016-10-09 | 一种基于hog特征与dnn分类器的人脸检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610880082.2A CN106485273A (zh) | 2016-10-09 | 2016-10-09 | 一种基于hog特征与dnn分类器的人脸检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106485273A true CN106485273A (zh) | 2017-03-08 |
Family
ID=58269175
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610880082.2A Pending CN106485273A (zh) | 2016-10-09 | 2016-10-09 | 一种基于hog特征与dnn分类器的人脸检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106485273A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109063581A (zh) * | 2017-10-20 | 2018-12-21 | 奥瞳系统科技有限公司 | 用于有限资源嵌入式视觉系统的增强型人脸检测和人脸跟踪方法和系统 |
CN109614962A (zh) * | 2019-01-24 | 2019-04-12 | 深圳市梦网百科信息技术有限公司 | 一种偏光光源人脸图像检测方法和系统 |
CN109726769A (zh) * | 2019-01-24 | 2019-05-07 | 电子科技大学 | 一种基于卷积核权重参数的目标分类和角度估计方法 |
CN109753981A (zh) * | 2017-11-06 | 2019-05-14 | 彼乐智慧科技(北京)有限公司 | 一种图像识别的方法及装置 |
CN110309709A (zh) * | 2019-05-20 | 2019-10-08 | 平安科技(深圳)有限公司 | 人脸识别方法、装置及计算机可读存储介质 |
CN111144220A (zh) * | 2019-11-29 | 2020-05-12 | 福建省星云大数据应用服务有限公司 | 适于大数据的人员检测方法、装置、设备和介质 |
CN111274886A (zh) * | 2020-01-13 | 2020-06-12 | 天地伟业技术有限公司 | 一种基于深度学习的行人闯红灯违法行为分析方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102682287A (zh) * | 2012-04-17 | 2012-09-19 | 电子科技大学 | 基于显著度信息的行人检测方法 |
CN103679205A (zh) * | 2013-12-23 | 2014-03-26 | 湖南大学 | 基于阴影假设和分层hog对称特征验证的前车检测方法 |
CN103699888A (zh) * | 2013-12-29 | 2014-04-02 | 深圳市捷顺科技实业股份有限公司 | 人脸检测方法和装置 |
CN103745240A (zh) * | 2013-12-20 | 2014-04-23 | 许雪梅 | 一种基于Haar分类器和ORB特征的人脸检索方法及系统 |
CN104778474A (zh) * | 2015-03-23 | 2015-07-15 | 四川九洲电器集团有限责任公司 | 一种用于目标检测的分类器构建方法及目标检测方法 |
CN105956570A (zh) * | 2016-05-11 | 2016-09-21 | 电子科技大学 | 基于唇部特征和深度学习的笑脸识别方法 |
-
2016
- 2016-10-09 CN CN201610880082.2A patent/CN106485273A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102682287A (zh) * | 2012-04-17 | 2012-09-19 | 电子科技大学 | 基于显著度信息的行人检测方法 |
CN103745240A (zh) * | 2013-12-20 | 2014-04-23 | 许雪梅 | 一种基于Haar分类器和ORB特征的人脸检索方法及系统 |
CN103679205A (zh) * | 2013-12-23 | 2014-03-26 | 湖南大学 | 基于阴影假设和分层hog对称特征验证的前车检测方法 |
CN103699888A (zh) * | 2013-12-29 | 2014-04-02 | 深圳市捷顺科技实业股份有限公司 | 人脸检测方法和装置 |
CN104778474A (zh) * | 2015-03-23 | 2015-07-15 | 四川九洲电器集团有限责任公司 | 一种用于目标检测的分类器构建方法及目标检测方法 |
CN105956570A (zh) * | 2016-05-11 | 2016-09-21 | 电子科技大学 | 基于唇部特征和深度学习的笑脸识别方法 |
Non-Patent Citations (1)
Title |
---|
BISSACCO A 等: "PhotoOCR: Reading Text in Uncontrolled Conditions", 《2013 IEEE INTERNATIONAL CONFERENCE ON COMPUTER VISION》 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109063581A (zh) * | 2017-10-20 | 2018-12-21 | 奥瞳系统科技有限公司 | 用于有限资源嵌入式视觉系统的增强型人脸检测和人脸跟踪方法和系统 |
CN109753981B (zh) * | 2017-11-06 | 2020-12-22 | 彼乐智慧科技(北京)有限公司 | 一种图像识别的方法及装置 |
CN109753981A (zh) * | 2017-11-06 | 2019-05-14 | 彼乐智慧科技(北京)有限公司 | 一种图像识别的方法及装置 |
CN109726769A (zh) * | 2019-01-24 | 2019-05-07 | 电子科技大学 | 一种基于卷积核权重参数的目标分类和角度估计方法 |
CN109726769B (zh) * | 2019-01-24 | 2020-07-10 | 电子科技大学 | 一种基于卷积核权重参数的目标分类和角度估计方法 |
CN109614962A (zh) * | 2019-01-24 | 2019-04-12 | 深圳市梦网百科信息技术有限公司 | 一种偏光光源人脸图像检测方法和系统 |
CN109614962B (zh) * | 2019-01-24 | 2022-11-18 | 深圳市梦网视讯有限公司 | 一种偏光光源人脸图像检测方法和系统 |
CN110309709A (zh) * | 2019-05-20 | 2019-10-08 | 平安科技(深圳)有限公司 | 人脸识别方法、装置及计算机可读存储介质 |
WO2020233000A1 (zh) * | 2019-05-20 | 2020-11-26 | 平安科技(深圳)有限公司 | 人脸识别方法、装置及计算机可读存储介质 |
CN111144220A (zh) * | 2019-11-29 | 2020-05-12 | 福建省星云大数据应用服务有限公司 | 适于大数据的人员检测方法、装置、设备和介质 |
CN111144220B (zh) * | 2019-11-29 | 2023-03-24 | 福建省星云大数据应用服务有限公司 | 适于大数据的人员检测方法、装置、设备和介质 |
CN111274886A (zh) * | 2020-01-13 | 2020-06-12 | 天地伟业技术有限公司 | 一种基于深度学习的行人闯红灯违法行为分析方法及系统 |
CN111274886B (zh) * | 2020-01-13 | 2023-09-19 | 天地伟业技术有限公司 | 一种基于深度学习的行人闯红灯违法行为分析方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106485273A (zh) | 一种基于hog特征与dnn分类器的人脸检测方法 | |
CN103839065B (zh) | 人群动态聚集特征提取方法 | |
CN105260749B (zh) | 基于方向梯度二值模式和软级联svm的实时目标检测方法 | |
Chen et al. | An improved license plate location method based on edge detection | |
CN105023008A (zh) | 基于视觉显著性及多特征的行人再识别方法 | |
Li et al. | Robust people counting in video surveillance: Dataset and system | |
CN103839279A (zh) | 一种目标检测中基于vibe的粘连目标分割方法 | |
CN104866829A (zh) | 一种基于特征学习的跨年龄人脸验证方法 | |
CN103886325B (zh) | 一种分块的循环矩阵视频跟踪方法 | |
CN105469105A (zh) | 一种基于视频监控的香烟烟雾检测方法 | |
CN103310194A (zh) | 视频中基于头顶像素点梯度方向的行人头肩部检测方法 | |
CN104751136A (zh) | 一种基于人脸识别的多相机视频事件回溯追踪方法 | |
CN102902986A (zh) | 自动性别识别系统及方法 | |
CN103824070A (zh) | 一种基于计算机视觉的快速行人检测方法 | |
CN103886589A (zh) | 面向目标的自动化高精度边缘提取方法 | |
CN104978567A (zh) | 基于场景分类的车辆检测方法 | |
CN107038416A (zh) | 一种基于二值图像改进型hog特征的行人检测方法 | |
CN105825233B (zh) | 一种基于在线学习随机蕨分类器的行人检测方法 | |
CN103390151B (zh) | 人脸检测方法及装置 | |
CN107330027A (zh) | 一种弱监督的深度台标检测方法 | |
CN103593679A (zh) | 一种基于在线机器学习的视觉人手跟踪方法 | |
CN101470802B (zh) | 物体检测装置和方法 | |
CN103020614A (zh) | 基于时空兴趣点检测的人体运动识别方法 | |
CN104123714A (zh) | 一种人流量统计中最优目标检测尺度的生成方法 | |
CN105354547A (zh) | 一种结合纹理和彩色特征的行人检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170308 |