CN104899576A - 基于Gabor变换和HOG的人脸识别特征提取方法 - Google Patents
基于Gabor变换和HOG的人脸识别特征提取方法 Download PDFInfo
- Publication number
- CN104899576A CN104899576A CN201510350083.1A CN201510350083A CN104899576A CN 104899576 A CN104899576 A CN 104899576A CN 201510350083 A CN201510350083 A CN 201510350083A CN 104899576 A CN104899576 A CN 104899576A
- Authority
- CN
- China
- Prior art keywords
- gabor
- gradient
- hog
- face
- gmp
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
- G06V40/171—Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于Gabor变换和HOG的人脸识别特征提取方法。该方法首先对含人脸图像进行提取并归一化,通过生成40个不同方向大小的Gabor滤波器对归一化人脸进行分别滤波,得到多个方向和大小的Gabor特征,随后对得到的Gabor特征进行HOG处理,进一步得到Gabor特征的梯度直方图信息,使得Gabor滤波结果增强。
Description
技术领域
本发明属于人脸识别技术,具体是一种基于Gabor变换和HOG的人脸识别特征提取方法。
背景技术
特征提取是计算机视觉和图像处理中的一个概念。是指对某一模式的组测量值进行变换,以突出该模式具有代表性特征的一种方法。通过影像分析和变换,以提取所需特征的方法。
在Heisenberg测不准原理下,Gabor变换已被证明具有最优的联合时频分辨率。在图像处理中,Gabor小波与人类视觉系统中简单细胞的视觉刺激响应非常相似,它对图像的边缘敏感,能够提供良好的方向选择和尺度选择特性,此外,它对于光照变化不敏感,能够提供对光照变化良好的适应性。研究发现,Gabor滤波器十分适合纹理表达和分离。
HOG(Histograms of Oriented Gradients,梯度方向直方图)的核心思想是让所检测的局部物体外形能够被光强梯度或边缘方向的分布所描述。与其他描述子相比,它通过方向直方图有效的描述了图像区域的局部形状特征信息,此外通过采用区域的梯度方向量化,使得特征描述算子具有一些平移旋转不变性,其中可以通过改变直方图的bin数目以及区域的大小来控制图像局部区域特征信息的精度和保持特征具有不变性。因此HOG描述子尤其适合人的检测。
目前基于Gabor变换的特征提取方法广泛应用于人脸识别中的特征提取阶段,包括直接应用Gabor小波作用人脸图像后的Gabor Magnitude Picture(GMP)作为提取的特征(1.Chengjun Liu,Harry Wechsler.Gabor Feature BasedClassification Using the Enhanced Fisher Linear Discriminant Model for FaceRecognition,Image Processing,2002,vol.11,pp.467-476.),将GMP再经过LBP算子作用得到有效特征更为明显的LGBP(Local Gabor Binary Pattern)特征,体现了GMP的梯度信息(2.Wenchao Zhang,Shiguang Shan,Wen Gao,Xilin Chen,Hongming Zhang.Local Gabor Binary Pattern Histogram Sequence(LGBPHS):ANovel Non-Statistical Model for Face Representation and Recognition,IEEEComputer Society Press,2005.3.Wenchao Zhang,Shiguang Shan,Wen Gao,XilinChen,Hongming Zhang.Ensemble of Piecewise FDA Based on Spatial Histogramsof Local(Gabor)Binary Patterns for Face Recognition,Pattern Recognition,2006.),还有将GMP经过求梯度和二阶求偏导后经过多种多项式组合得到图像的多种特征信息(4.Ke Yan,Youbin Chen,David Zhang.Gabor Surface Feature for FaceRecognition,Asia Communications and Photonics conference and Exhibition,2011.)。但是上述方法得到的特征向量并不能对Gabor滤波结果的方向上滤波增强,使充分利用Gabor特征的梯度方向信息。并且LBP算子可能会对原有特征信息造成误解,在识别阶段直接使用会造成一定的困难。HOG特征具有计算量小和体现多方向特征的优点,可以通过三线性插值法进行描述(5.X.Wang,X.Han,and S.Yan.A HOG-LBP human detector with partial occlu-sion handling[A].In Proc.of ICCV[C],2009.)。
发明内容
本发明的目的在于提供一种将Gabor变换与HOG纹理特征提取方法融合的人脸识别特征提取方法,能够达到有效特征明显保留以及Gabor特征充分利用的效果。
实现本发明目的的技术解决方案为:
一种基于Gabor变换与HOG的人脸识别特征提取方法,步骤如下:
第一步,将含有人脸的图片通过人脸定位和光照处理,即输入图像为含有人脸的图片,通过人脸定位找到图片中人脸的位置,将其裁切成68*84的人脸图像,再经过γ校正和高斯差分滤波对裁切的人脸图像进行光照处理,使其去除一定的光照的影响,最终得到归一化的人脸图像。
第二步,对归一化人脸图像进行Gabor变换。将Gabor母小波生成5个大小和8个方向的Gabor小波组合,分别对第一步得到的归一化人脸图像进行卷积运算。这一步可以得到40个不同方向和大小的Gabor特征。
第三步,对第二步得到的Gabor特征作方向梯度直方图HOG纹理特征提取操作。得到更高Gabor滤波精度的特征。
本发明与现有技术相比,其显著优点为:(1)两种方法的结合充分利用Gabor特征的梯度方向信息;(2)与其他方法和Gabor特征融合相比较,HOG特征具有计算量小和体现多方向特征的优点。
附图说明
图1是本发明基于Gabor变换和HOG的人脸识别特征提取方法的流程图。
图2是40个不同方向大小的Gabor滤波器图。
图3是滤波器对一图像的滤波示意图。
图4是HOG特征提取中三线性插值示意图。
具体实施方式
下面结合附图对本发明作进一步详细描述。
结合图1,本发明基于Gabor变换和HOG的人脸识别特征提取方法,步骤如下:
第一步是将含有人脸的图片通过人脸定位和光照处理,即输入图像为含有人脸的图片,通过Adaboost人脸定位找到图片中人脸的位置,将其裁切成68*84的人脸图像,再经过γ校正和高斯差分滤波对裁切的人脸图像进行光照处理,使其去除一定的光照的影响,最终得到归一化的人脸图像。
第二步是提取图像的Gabor特征。在空间域中,一个二维Gabor滤波器是一个由正弦平面波调制的高斯核函数,一般公式为:
其中xr=xcosθ+ysinθ,yr=-xsinθ+ycosθ
需要传进去的4个参数:x、y、θ、f。xr和yr为二维坐标(x,y)旋转后的坐标。因有eix=cosx+isinx,则可以得到:
该Gabor函数的实数部分(偶部分、余弦部分):
虚数部分(奇部分、正弦部分):
需要得到的特征,可以看作是实部和虚部与图像分别做卷积之后结果的模:
(表示x轴上的高斯窗宽),(表示y轴上的高斯窗宽)。当γ和ρ为定值的时候,Gabor过滤器的形状就只和中心频率f有关了,相同方向下,每个过滤器看起来只是彼此的缩放版本。此时令
定义一个小波向量表示频率中的中心频率部分,并令
则公式可变换为我们取γ和ρ为令Gabor组中的f和θ满足:
其中fmax为f的最大值。
如图2,是通过小波向量的θ和f改变得到8个方向和5个大小的小波组合,共40个Gabor滤波器。将其分别与图片作卷积,组合起来得到图像的Gabor特征,即GMP(Gabor Magnitude Picture)如图3。
第三步是对第二步得到的GMP进行HOG过程。
(1)用水平梯度算子[-1,0,1]以及垂直梯度算子[-1,0,1]T来计算GMP水平方向的梯度分量I(X+1,Y)-I(X-1,Y)以及竖直方向上的梯度分量I(X,Y-1)-I(X,Y+1),使得到GMP中边缘、轮廓等纹理信息。
梯度的大小计算公式为:
梯度的方向计算公式为:
(2)对梯度图像进行取梯度方向直方图:将其分为多个区域,区域大小为8*8,每个区域计算一个加权梯度方向直方图,直方图中包含9个bin,划分的区间为0°-180°。在加权投影上可以采用三线性插值方法来实现,具体插值方法如下:
其中:(x1,y1)、(x1,y2)、(x2,y1)、(x2,y2)为像素点(x,y)所在区域相邻的四个区域的中心像素点坐标,θ1和θ2为该像素点的梯度方向大小在梯度方向直方图中最相近的bin值,dx和dy是(x,y)距离各中心点的x轴方向的距离以及y方向上的距离,dθ为该像素点梯度方向大小距离相邻bin的大小。插值操作如图4所示。
这样可以避免梯度方向直方图在区域边界和梯度方向量化的直方图边界突然变化。通过对其进行量化,可以得到局部图像区域的特征描述向量。该特征描述向量能够描述局部图像的内容,且能对其外观少量的变化具有忽视作用。
(3)将多个区域并为块,并对块进行对比度归一化。每个区域被多个块共享。采用L2范式对块的直方图进行归一化,将所有bin值中的最大值控制在0.2以内,再重新归一化一次。这样能够对阴影和边缘对比度等有更好的不变性。块取2*2区域,一个块的特征数有2*2*9个,其中块每次滑动一个区域。
(4)将所有重叠块的梯度方向直方图描述组合在一起,便形成了最终的特征向量,得到的特征维数为7*9*(2*2*9)=2268维。
综上所述,本发明通过将Gabor滤波和HOG两种方法的结合,使得能够充分利用图像的Gabor特征的梯度方向信息;并且与其他特征和Gabor特征融合相比较,HOG特征具有计算量小和体现多方向特征的优点,因此本发明在保证特征信息量的前提下仍能保证图像处理的效率。
Claims (3)
1.一种基于Gabor变换与HOG的人脸识别特征提取方法,其特征在于步骤如下:
第一步,对含有人脸的图片进行人脸定位和光照处理;输入图像为含有人脸的图片,通过人脸定位找到图片中人脸的位置,并将人脸部分裁切出来,再经过γ校正及高斯差分滤波对裁切的人脸图像进行光照处理,得到归一化的人脸图像;
第二步,对归一化人脸图像进行Gabor变换得到Gabor特征;
第三步,对第二步得到的Gabor特征作方向梯度直方图HOG纹理特征提取操作,得到更高Gabor滤波精度的特征。
2.根据权利要求1所述的基于Gabor变换和HOG的人脸识别特征提取方法,其特征在于步骤三所述的具体方法为:
2.1提取出图像的Gabor特征,得到GMP;
2.2基于Gabor特征对GMP进行HOG变换。
3.根据权利要求2所述的基于Gabor变换和HOG的人脸识别特征提取方法,其特征在于步骤2.2所述的具体方法为:
采用水平梯度算子[-1,0,1]以及垂直梯度算子[-1,0,1]T计算GMP水平方向的梯度分量I(X+1,Y)-I(X-1,Y)以及竖直方向上的梯度分量I(X,Y-1)-I(X,Y+1),得到GMP中边缘、轮廓纹理信息;
GMP中的点(X,Y)梯度的大小R(X,Y)计算公式为:
梯度的方向Ang(X,Y)计算公式为:
对梯度图像进行取梯度方向直方图:将其分为多个区域,每个区域计算一个加权梯度方向直方图,直方图中包含9个bin,划分的区间为0°-180°,在加权投影上采用三线性插值方法来实现,具体插值方法如下:
其中:(x1,y1)、(x1,y2)、(x2,y1)、(x2,y2)为像素点(x,y)所在区域相邻的四个区域的中心像素点坐标,θ1和θ2为该像素点的梯度方向大小在梯度方向直方图中最相近的bin值,dx和dy是(x,y)距离各中心点的x轴方向的距离以及y方向上的距离,dθ为该像素点梯度方向大小距离相邻bin的大小;
将多个区域并为块,并对块进行对比度归一化,每个区域被多个块共享,并对块的直方图的bin作最大值的控制,进行归一化;最后将所有重叠块的梯度方向直方图描述组合在一起,形成最终的特征向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510350083.1A CN104899576A (zh) | 2015-06-23 | 2015-06-23 | 基于Gabor变换和HOG的人脸识别特征提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510350083.1A CN104899576A (zh) | 2015-06-23 | 2015-06-23 | 基于Gabor变换和HOG的人脸识别特征提取方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104899576A true CN104899576A (zh) | 2015-09-09 |
Family
ID=54032230
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510350083.1A Pending CN104899576A (zh) | 2015-06-23 | 2015-06-23 | 基于Gabor变换和HOG的人脸识别特征提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104899576A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106022214A (zh) * | 2016-05-04 | 2016-10-12 | 南京工程学院 | 非约束环境下的有效人脸特征提取方法 |
CN106934403A (zh) * | 2017-03-09 | 2017-07-07 | 湖南第师范学院 | 一种低维方向梯度直方图特征的提取方法 |
CN107273845A (zh) * | 2017-06-12 | 2017-10-20 | 大连海事大学 | 一种基于置信区域和多特征加权融合的人脸表情识别方法 |
CN107392866A (zh) * | 2017-07-07 | 2017-11-24 | 武汉科技大学 | 一种光照鲁棒的人脸图像局部纹理增强方法 |
CN108038464A (zh) * | 2017-12-22 | 2018-05-15 | 新疆大学 | 一种新的hog特征维吾尔族人脸图像识别算法 |
CN109034066A (zh) * | 2018-07-27 | 2018-12-18 | 北方工业大学 | 基于多特征融合的建筑物识别方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102194108A (zh) * | 2011-05-13 | 2011-09-21 | 华南理工大学 | 一种聚类线性鉴别分析特征选择的笑脸表情识别方法 |
CN103268497A (zh) * | 2013-06-18 | 2013-08-28 | 厦门大学 | 一种人脸姿态检测方法与在人脸识别中的应用 |
CN103413119A (zh) * | 2013-07-24 | 2013-11-27 | 中山大学 | 基于人脸稀疏描述子的单样本人脸识别方法 |
CN103810490A (zh) * | 2014-02-14 | 2014-05-21 | 海信集团有限公司 | 一种确定人脸图像的属性的方法和设备 |
-
2015
- 2015-06-23 CN CN201510350083.1A patent/CN104899576A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102194108A (zh) * | 2011-05-13 | 2011-09-21 | 华南理工大学 | 一种聚类线性鉴别分析特征选择的笑脸表情识别方法 |
CN103268497A (zh) * | 2013-06-18 | 2013-08-28 | 厦门大学 | 一种人脸姿态检测方法与在人脸识别中的应用 |
CN103413119A (zh) * | 2013-07-24 | 2013-11-27 | 中山大学 | 基于人脸稀疏描述子的单样本人脸识别方法 |
CN103810490A (zh) * | 2014-02-14 | 2014-05-21 | 海信集团有限公司 | 一种确定人脸图像的属性的方法和设备 |
Non-Patent Citations (4)
Title |
---|
NA LIU ETAL: "A facial sparse descriptor for single image based face recognition", 《NEUROCOMPUTING》 * |
商逾众: "高清视频监视中行人检测方法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
溪海燕 等: "基于线性SVM的车辆前方行人检测方法", 《天津工业大学学报》 * |
薛茹 等: "基于Gabor小波与HOG特征的目标检测方法", 《电视技术》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106022214A (zh) * | 2016-05-04 | 2016-10-12 | 南京工程学院 | 非约束环境下的有效人脸特征提取方法 |
CN106022214B (zh) * | 2016-05-04 | 2019-10-08 | 南京工程学院 | 非约束环境下的有效人脸特征提取方法 |
CN106934403A (zh) * | 2017-03-09 | 2017-07-07 | 湖南第师范学院 | 一种低维方向梯度直方图特征的提取方法 |
CN106934403B (zh) * | 2017-03-09 | 2019-09-06 | 湖南第一师范学院 | 一种低维方向梯度直方图特征的提取方法 |
CN107273845A (zh) * | 2017-06-12 | 2017-10-20 | 大连海事大学 | 一种基于置信区域和多特征加权融合的人脸表情识别方法 |
CN107273845B (zh) * | 2017-06-12 | 2020-10-02 | 大连海事大学 | 一种基于置信区域和多特征加权融合的人脸表情识别方法 |
CN107392866A (zh) * | 2017-07-07 | 2017-11-24 | 武汉科技大学 | 一种光照鲁棒的人脸图像局部纹理增强方法 |
CN107392866B (zh) * | 2017-07-07 | 2019-09-17 | 武汉科技大学 | 一种光照鲁棒的人脸图像局部纹理增强方法 |
CN108038464A (zh) * | 2017-12-22 | 2018-05-15 | 新疆大学 | 一种新的hog特征维吾尔族人脸图像识别算法 |
CN109034066A (zh) * | 2018-07-27 | 2018-12-18 | 北方工业大学 | 基于多特征融合的建筑物识别方法 |
CN109034066B (zh) * | 2018-07-27 | 2022-05-03 | 北方工业大学 | 基于多特征融合的建筑物识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104899576A (zh) | 基于Gabor变换和HOG的人脸识别特征提取方法 | |
Yu et al. | A novel license plate location method based on wavelet transform and EMD analysis | |
Meethongjan et al. | An intelligent fused approach for face recognition | |
Teng et al. | Real-time lane detection by using multiple cues | |
Khan et al. | Fingerprint image enhancement using multi-scale DDFB based diffusion filters and modified Hong filters | |
CN115100719A (zh) | 基于Gabor二值模式与三维梯度直方图特征融合的人脸识别方法 | |
Katramados et al. | Real-time visual saliency by division of gaussians | |
Chaki et al. | Plant leaf recognition using ridge filter and curvelet transform with neuro-fuzzy classifier | |
Hiremath et al. | RGB-based color texture image classification using anisotropic diffusion and LDBP | |
Dixit et al. | Copy-move image forgery detection a review | |
Kaur et al. | Illumination invariant face recognition | |
Priyadharshini et al. | A quaternionic wavelet transform-based approach for object recognition | |
Patel et al. | Object detection and segmentation using local and global property | |
Li et al. | Visual saliency detection based on gradient contrast and color complexity | |
Mude et al. | Gabor filter for accurate iris segmentation analysis | |
Muzaffer et al. | Copy move forgery detection using gabor filter and orb | |
Babu et al. | Texture Segmentation by Using Haar Wavelets and K-means Algorithm | |
Zhang et al. | Thermal infrared face recognition based on the modified blood perfusion model and improved weber local descriptor | |
Qian et al. | Background of shape contexts for point matching | |
Jiang et al. | Edge detection using simplified Gabor wavelets | |
Zhangyuan et al. | Detection of infrared dim and small targets based on saliency and grayscale morphological reconstruction | |
Teymourzadeh et al. | Design an advance computer-aided tool for image authentication and classification | |
Chhor et al. | Illumination-invariant line detection with the Gray-scale Hough transform | |
Wallace et al. | Gradient detection in discrete log-polar images | |
Uçar | Color face recognition based on curvelet transform |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150909 |