CN108681737B - 一种复杂光照下图像特征提取方法 - Google Patents

一种复杂光照下图像特征提取方法 Download PDF

Info

Publication number
CN108681737B
CN108681737B CN201810516014.7A CN201810516014A CN108681737B CN 108681737 B CN108681737 B CN 108681737B CN 201810516014 A CN201810516014 A CN 201810516014A CN 108681737 B CN108681737 B CN 108681737B
Authority
CN
China
Prior art keywords
image
operator
value
gray
dimensional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810516014.7A
Other languages
English (en)
Other versions
CN108681737A (zh
Inventor
高涛
李思
陈婷
刘占文
梁闪
曹金沛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changan University
Original Assignee
Changan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changan University filed Critical Changan University
Priority to CN201810516014.7A priority Critical patent/CN108681737B/zh
Publication of CN108681737A publication Critical patent/CN108681737A/zh
Application granted granted Critical
Publication of CN108681737B publication Critical patent/CN108681737B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis

Abstract

本发明公开了一种复杂光照下图像特征提取方法,利用改进的集变尺度、变角度为一体的具有方向敏感性的各向异性LOG算子来计算其差分激励分量;同时,比较以中心像素对称的像素对的灰度值,并基于韦伯准则实现其阈值的自适应选取,最后融合生成二维AWASTP直方图,并进一步转化为一维直方图,从而利用KNN算法进行分类,通过比较与中心像素相邻,且关于中心像素对称的像素对的灰度值来减少特征维数,使得阈值的选取根据图像的区域特性而相应改变,有效地提取出了更具鉴别能力的特征,提高了复杂光照图像的识别率,本方法简单,能够提取出更多的纹理信息和多个方向的梯度信息,从而更好地描述复杂光照图像的特征,性能优于其他现有算法。

Description

一种复杂光照下图像特征提取方法
技术领域
本发明属于图像处理技术领域,具体涉及一种复杂光照下图像特征提取方法。
背景技术
随着模式识别、人工智能的出现和快速发展,图像特征提取技术已然成为计算机视觉领域的研究热点,已广泛应用于生物识别、目标检测、图像检索以及车牌识别等领域。然而,在现实生活中,由于受到光照不足、光照不均匀、光照变化剧烈或光照过强等复杂光照情况的影响,获取到的图像易出现局部细节丢失严重,噪声大,所能获取到的信息量少的问题,给计算机智能识别技术带来了很严重的偏差错误,本文就复杂光照下人脸图像和纹理图像的特征提取算法进行深入探究。
根据特征提取区域的大小可将特征分为全局特征和局部特征。全局特征通常从整个图像生成统计信息普遍模板,突出样本间的差异性。这一类的典型方法是主成分分析(PCA)。之后,国内外有关学者相继提出了许多改进的主成分分析算法,2D PCA,IPCA,PCA-CFEA和PCA-SC。一些代表性算法还包含ICA[,LDA,SVD,KSVD等。全局特征提取虽然能展现图像的主要特征,但由于没有考虑局部特征,对于局部细节丢失严重、噪声较为明显的复杂光照图像来说,其特征提取效果很糟。因此,局部特征提取算法逐渐引起了人们的高度重视和深入探究。
局部特征使用像素比较编码规则来表征图像局部信息,通过将图像分成若干个部分分别进行处理,然后按照一定的顺序将各个部分的特征组合起来用于图像的表述,不仅保留了图像各部分之间的拓扑关系,而且还保留了各部分本身的信息。由于局部特征对旋转、平移、光照和方向具有不变性,因此较全局特征具有更高的稳定性和识别率。局部特征提取算法主要包括局部图形结构(LGS),尺度不变特征变换(SIFT),局部相位量化(LPQ),局部导数模式(LDP),加权局部Gabor(LG),局部Gabor二值模式(LGBP),局部差分二进制(LDB),局部线性方向模式(LLDP),局部二值模式(LBP),局部三值模式(LTP)和韦伯局部描述符(WLD)等。局部特征描述符对图像局部区域的变化具有更强的稳定性和鲁棒性,如面部表情、姿势的不同以及局部遮挡、复杂光照。
近年来,LTP和WLD是局部特征描述符中最具代表性、稳定性最高的方法。Tan X等基于局部二值模式(LBP)提出了对光照变化不敏感的局部三值模式(LTP),该算子具有极强的噪声判别能力和光照、噪声鲁棒性,较LBP直方图维数显著较低。然而,LTP算子存在阈值随数据和实验环境的不同会发生相应变化,从而导致算法的执行时间增加且效率降低的问题。针对此问题,现有方法利用局部区域的像素均值和标准差自动计算阈值的算法LATP(Local Adapted Ternary Pattern),使得算法的光照和噪声鲁棒性在一定程度上得到了增强。将编码阈值设定为邻域像素均值的加权值,提出了基于LTP的局部改进描述符LTCD。将图像样本邻域对比度的标准差设为当前邻域的阈值,极大地增强了算法的抗噪性,具有良好的实时性。事实上,人类对图像的感知不仅取决于绝对刺激强度,而且依赖于相对刺激的大小。基于此,源于韦伯准则的韦伯局部描述符(WLD)被提出,该算法采用差分激励(Differential Excitation)和梯度方向(Orientation)这两个分量来描述图像的局部特征。然而,WLD不能充分利用对光照变化和噪声等影响因素敏感的像素强度。因此,提出了一种韦伯局部二值模式,即用高斯拉普拉斯算子代替WLD差分激励中的拉普拉斯算子,同时用LBP算子代替WLD算子中的梯度方向,达到了对时间、面部表情、光照、姿势、噪音鲁棒的效果;利用非线性量化方法来计算WLD算子中的差分激励和梯度信息,同时提出多尺度WLD描述符(Multi-Scale Weber Local Descriptors,WLDs)和多层次信息融合的框架,达到了更好的图像特征辨识能力;对图像进行分块处理,并用Prewitt算子替换原始WLD的梯度方向算子,该算法对表情、光照变化等具有较强的鲁棒性。一般来说,组合方法总是能表现出优越的能力。一种称为韦伯局部二进制模式(WLBP)的局部描述符,有效地结合了WLD和LBP的优点。将WLD算子的差分激励改用高斯差分算子(DoG)来计算,梯度方向部分改用OSLGS算子,提出了正交对称局部韦伯图结构(Orthogonal Symmetric Local Weber GraphStructure,OSLWGS)。
丰富的实验表明,LTP和WLD算子在图像特征提取方面的表现优于其他最先进的描述符,但仍存在一些缺陷。LTP由于其特征空间维数较高,存在样本受限的问题;同时,该算子阈值无法自适应选取,导致其执行时间增加,性能下降。另一方面,WLD仅仅考虑水平和垂直方向上的灰度变化,不能充分反映局部窗内灰度变化的空间分布结构信息,难以体现图像的内在特征。此外,WLD通过中心像素值和周围像素之间的差的和计算差分激励,导致局部窗内灰度变化的正负差值可能相互抵消,灰度变化信息无法充分体现。如图1为高频、中频和低频三种模式,三者的差分激励和梯度方向均为零,WLD算子无法区分这样的纹理差异,因此限制了WLD的性能。
因此,WLD算子在具有方向性差异的场合中局部纹理区分能力不足和LTP算子在描述图像特征时直方图维数过高、阈值不能自适应选取存在缺陷。
发明内容
本发明的目的在于提供复杂光照下图像特征提取技术研究,以克服现有技术的不足。
为达到上述目的,本发明采用如下技术方案:
一种复杂光照下图像特征提取方法,包括以下步骤:
首先对目标图像进行分块,然后对分块后的图像进行预处理,利用各向异性LOG算子计算预处理后的各图像分块的差分激励分量,同时利用自适应对称三值模式ASTP计算预处理后的各图像分块的梯度方向分量;然后将各向异性LOG算子所得到的差分激励图像分别与自适应对称三值模式ASTP计算后的梯度方向正值图像、梯度方向负值图像进行融合得到两个二维AWASTP直方图,并将得到的两个二维AWASTP直方图转化为两个一维直方图,然后将两个一维直方图连接起来得到最终的直方图向量,最后将每个子块的直方图连接起来,利用KNN算法基于卡方距离进行分类,最后得到识别结果,完成图像特征提取。
进一步的,具体的预处理包括灰度处理和分辨率处理。
进一步的,预处理包括图像尺寸的归一化为128*128以及彩色图像的灰度化。
进一步的,利用公式(2)和公式(4)计算每块图像的差分激励分量;
Figure GDA0001744733910000041
其中xc为目标像素点,xi为xc的第i个临近像素点,P为xc邻域像素点的总个数,Δx为xc与其邻接像素点xi的灰度差值;
Δxi=(xi-xc)
易知,式(2)中的Δx为一个二阶拉普拉斯算子,在图像f中可表示为:
Figure GDA0001744733910000051
各向异性二阶拉普拉斯算子ΔI的计算过程如下:
ΔI=LOG*f(x,y)(4)。
进一步的,具体的,各向异性LOG算子计算公式如下:
二维高斯函数G(x,y)定义如式(5):
Figure GDA0001744733910000052
其中δ为高斯函数的空间分布系数;
对函数G(x,y)取二阶拉普拉斯变换,得二维LOG算子的函数形式如下:
Figure GDA0001744733910000053
为了能使δ的取值对x方向与y方向产生的影响不同,在水平和垂直方向上采取不同尺度,将x方向的δ记为δx,y方向的δ记为δy,则二维高斯函数计算过程如下:
Figure GDA0001744733910000054
对式(7)进行拉氏变换可得具有变尺度特性的LOG边缘检测算子:
Figure GDA0001744733910000055
将标准椭圆以坐标原点为中心逆时针旋转α角度,则新的坐标关系为:
Figure GDA0001744733910000061
将上式(9)中的角度信息量带入公式(7)中,可以得到集变角度、变尺度为一体的二维高斯函数式:
Figure GDA0001744733910000062
对上式进行拉氏变换,可得各向异性拉普拉斯算子:
Figure GDA0001744733910000063
式中各参数取值分别为:A=xcos2α+ysinαcosα,B=xsin2α-ysinαcosα,C=xsinαcosα+ysin2α,D=-xsinαcosα+ycos2α,E=xcosα+ysinα,F=ycosα-xsinα。
进一步的,尺度参量的选取:
尺度定义为:
δ2(x,y)=1/I(x,y) (12)
其中I(x,y)代表图像中像素点(x,y)的灰度值,I(x,y)的值归一化为[0,1];
通过上述公式来确定滤波器x轴的尺度δx,即
Figure GDA0001744733910000064
由于图像区域的平滑度可以由图像的灰度方差来反映,定义式(14)来计算局部窗内的灰度均方差:
Figure GDA0001744733910000065
其中M×N为局部窗的大小,
Figure GDA0001744733910000066
代表目标像素点邻域灰度的均值,
Figure GDA0001744733910000067
和I(i,j)的取值范围均为[0,255];
定义x,y轴的尺度比例为:
Figure GDA0001744733910000071
其中K为比例因子,取固定值K=50,于是y轴的尺度定义为:
δy=R·δx(16)。
进一步的,采用Kirsch算子来计算各向异性LOG算子的角度参量α,首先选取以目标像素点为中心的5×5大小的窗口,分别以其八个方向上3×3大小窗口的均值来代替中心像素3×3邻域范围内相应位置像素的灰度值,并将该3×3邻域范围的均值作为中心像素的灰度值,从而形成一个3×3的灰度均值矩阵Xp,然后利用Kirsch算子的8个方向模板分别与灰度均值矩阵Xp相乘,最后取结果最大值所对应的模板方向作为该目标像素点的角度参量值α。
进一步的,利用韦伯比结合中心像素的灰度值来确定LTP算子的阈值,计算公式如下所示:
t=xc×k(17)
其中,xc为中心像素,k为韦伯比(常数)。
与现有技术相比,本发明具有以下有益的技术效果:
本发明一种复杂光照下图像特征提取方法,通过引入尺度参量和角度参量,利用改进的集变尺度、变角度为一体的具有方向敏感性的各向异性LOG算子来计算其差分激励分量;同时,比较以中心像素对称的像素对的灰度值,并基于韦伯准则实现其阈值的自适应选取,最后融合生成二维AWASTP直方图,并进一步转化为一维直方图,从而利用KNN算法进行分类,利用具有方向敏感性的各向异性LOG算子代替各向同性拉普拉斯算子来计算差分激励,通过比较与中心像素相邻,且关于中心像素对称的像素对的灰度值来减少特征维数,并在韦伯准则的基础上提出阈值的自适应选取算法,使得阈值的选取根据图像的区域特性而相应改变,有效地提取出了更具鉴别能力的特征,提高了复杂光照图像的识别率,本方法简单,能够提取出更多的纹理信息和多个方向的梯度信息,从而更好地描述复杂光照图像的特征,性能优于其他现有算法。
附图说明
图1为局部灰度分布示例。
图2为本发明处理方法流程图。
图3为椭圆对称的LOG算子三维图。
图4为Kirsch算子模板。
图5为角度参量值α的计算过程示意图。
图6为AWASTP算子示意图。
图7为AWASTP特征示意图。
图8为AWASTP直方图计算示意图。
图9为CMUPIE图像库中的部分图片。
图10为分块数对算法性能的影响结构示意图。
图11为CMUPIE人脸库k取不同值时各算法识别率对比。
图12为FERET人脸数据库人脸样本图像。
图13为FERET人脸库k取不同值时算法识别率对比。
图14为PhoTex数据库样本图像。
图15为PhoTex纹理库k取不同值时算法识别率对比图。
图16为RawFooT数据库样本图像。
图17为RawFooT纹理库k取不同值时算法识别率对比图。
具体实施方式
下面结合附图对本发明做进一步详细描述:
如图2所示,一种复杂光照下图像特征提取方法,包括以下步骤:
首先对目标图像进行分块,然后对分块后的图像进行预处理,利用各向异性LOG算子计算预处理后的各图像分块的差分激励分量,同时利用自适应对称三值模式ASTP计算预处理后的各图像分块的梯度方向分量;然后将各向异性LOG算子所得到的差分激励图像分别与自适应对称三值模式ASTP计算后的梯度方向正值图像、梯度方向负值图像进行融合得到两个二维AWASTP直方图,并将得到的两个二维AWASTP直方图转化为两个一维直方图,然后将两个一维直方图连接起来得到最终的直方图向量,最后将每个子块的直方图连接起来,利用KNN算法基于卡方距离进行分类,最后得到识别结果,完成图像特征提取,并结合各算法识别时间,对算法性能进行评价;具体的识别时间对比实验:与经典的LBP、LTP、LGS等算法以及融合本文部分改进思想的算法,同时包含新近国内外提出的优秀算法,以识别时间作为算法的评价标准,对算法的执行效率进行判别。识别时间越短,算法的执行效率越高,性能则更佳。结合识别率来评价算法性能,识别时间最短,识别率最高的算法,即为最优。
具体的预处理包括灰度处理和分辨率处理;
具体包括图像尺寸的归一化(128*128)以及彩色图像的灰度化;
韦伯定律是由德国心理学专家Ernst Weber提出的反映心理量与物理量之间关系的一个定律。韦伯定律表示,当刺激变化量与背景值的比值小于比值常数时,人们会将这个变化认为是背景噪音,而非一个有效信号;而大于这个常数时,人们便能察觉出来。例如,在一个喧闹的环境中,若要与人交流,则必须尽力大声说话;而在极其安静的环境中,低声说话就能达到同样的效果。由此可以看出,在这两种情况下,人耳能感知到的分贝值与环境本身分贝值的比值是相近的[35],这便是韦伯准则的本质。韦伯准则表明想要引起差别感觉,则必须满足刺激的变化与原刺激本身的比值达到一个阈值,该比值是一个常数,公式如下:
Figure GDA0001744733910000101
其中,k为韦伯定律的比值常数,ΔI为差别阈限,I为原始刺激的强度。韦伯准则表明,增量阈值与其背景强度呈线性变化。目前,韦伯准则已广泛应用于人脸识别、脉冲噪声去除以及交通监控等领域。
差分激励是某像素点与邻域像素点的差值之和与该像素点的比值,能够反映出局部窗内灰度变化的强度。目标像素点xc的差分激励分量ξ(xc)的计算过程如下:
Figure GDA0001744733910000102
其中xc为目标像素点,xi为xc的第i个临近像素点,P为xc邻域像素点的总个数,Δx为xc与其邻接像素点xi的灰度差值。定义如下:
Δxi=(xi-xc)
易知,式(2)中的Δx为一个二阶拉普拉斯算子,在图像f中可表示为:
Figure GDA0001744733910000103
由于在使用拉普拉斯算子对图像进行处理的过程中会增强图像中的噪声,高斯——拉普拉斯算子(Laplacian-of-Gaussian,LOG)被提出,该算子首先对图像进行高斯滤波,从而实现对噪声最大程度的抑制,然后再求其拉普拉斯二阶导数,有效地解决了拉普拉斯算子对噪声敏感的问题。但由于原始LOG算子是关于中心对称的,具有旋转不变性,因此属于各项同性算子,在具有方向性差异的场合中并不适用。
利用LOG算子代替二阶拉普拉斯算子来对图像f进行处理,各向异性二阶拉普拉斯算子ΔI的计算过程如下:
ΔI=LOG*f(x,y)(4)
各向异性LOG算子计算公式如下:
二维高斯函数G(x,y)定义如式(5):
Figure GDA0001744733910000111
其中δ为高斯函数的空间分布系数;
对函数G(x,y)取二阶拉普拉斯变换,得二维LOG算子的函数形式如下:
Figure GDA0001744733910000112
为了能使δ的取值对x方向与y方向产生的影响不同,本文在水平和垂直方向上采取不同尺度,将x方向的δ记为δx,y方向的δ记为δy,则新的二维高斯函数计算过程如下:
Figure GDA0001744733910000113
对式(7)进行拉氏变换可得具有变尺度特性的LOG边缘检测算子:
Figure GDA0001744733910000114
如图3中两幅图分别为δx<δy和δx>δy时LOG算子的三维图,可以看出其关于椭圆对称。但该椭圆仅仅是以x,y轴对称的特殊椭圆,若将该椭圆以坐标原点为中心旋转一定角度,便可得到在坐标中旋转任意角度的椭圆。
将标准椭圆以坐标原点为中心逆时针旋转α角度,则新的坐标关系为:
Figure GDA0001744733910000121
将上式(9)中的角度信息量带入公式(7)中,可以得到集变角度、变尺度为一体的二维高斯函数式:
Figure GDA0001744733910000122
对上式进行拉氏变换,可得新的集变角度、变尺度为一体的LOG算子:
Figure GDA0001744733910000123
式中各参数取值分别为:A=xcos2α+ysinαcosα,B=xsin2α-ysinαcosα,C=xsinαcosα+ysin2α,D=-xsinαcosα+ycos2α,E=xcosα+ysinα,F=ycosα-xsinα。
(1)尺度参量的选取
尺度定义为:
δ2(x,y)=1/I(x,y)(12)
其中I(x,y)代表图像中像素点(x,y)的灰度值,I(x,y)的值归一化为[0,1]。
本文通过上述公式来确定滤波器x轴的尺度δx,即
Figure GDA0001744733910000124
由于图像区域的平滑度可以由图像的灰度方差来反映,定义式(14)来计算局部窗内的灰度均方差:
Figure GDA0001744733910000131
其中M×N为局部窗的大小,
Figure GDA0001744733910000132
代表目标像素点邻域灰度的均值,
Figure GDA0001744733910000133
和I(i,j)的取值范围均为[0,255]。
定义x,y轴的尺度比例为:
Figure GDA0001744733910000134
其中K为比例因子,取固定值,K=50,于是y轴的尺度定义为:
δy=R·δx(16);
(2)角度参量的选取
采用Kirsch算子来计算各向异性LOG算子的角度参量α,如图4为Kirsch算子模板,在利用其进行角度参量α的计算过程中,首先选取以目标像素点为中心的5×5大小的窗口,分别以其八个方向上3×3大小窗口的均值来代替中心像素3×3邻域范围内相应位置像素的灰度值,并将该3×3邻域范围的均值作为中心像素的灰度值,从而形成一个3×3的灰度均值矩阵Xp,然后利用Kirsch算子的8个方向模板分别与灰度均值矩阵Xp相乘,最后取结果最大值所对应的模板方向作为该目标像素点的角度参量值α。如图5为一个完整的角度参量值α的确定过程。
由于Kirsch算子具有非常明确的方向性,因此通过Kirsch算子对图像进行处理,能够根据图像的区域特性来自适应选取角度参量α。
将上述计算得到的尺度参量δx、δy以及角度参量α代入式(11)中,便形成了具有变尺度、变角度特性的各向异性LOG算子。然后再通过公式(2)与公式(4)即可得到各向异性韦伯局部描述符(AWLD)的差分激励分量。
自适应对称三值模式(ASTP)
为引入本文所提出的阈值自适应选取的算法,首先列举两个示例:(1)中心像素为5,邻域像素均为8;(2)中心像素为500,邻域像素均为503。这两个示例中像素差值均为3,若将LTP算子的阈值设为3,则所有的三值编码均为1。这显然是不合理的,(1)中邻域像素与中心像素可以被认为是不同的,但(2)中邻域像素与中心像素却是极为相似的。由此便可得出,将阈值t设定为固定值是不合理的,其取值应该随着局部窗内中心像素灰度值的大小而相应改变。
另外,由韦伯准则可知,增量值与原始值的比率为恒定常数,该常数被定义为阈值,仅仅当刺激的变化相对于原始刺激的比率超过该阈值,刺激才能被显现出来;若其比率小于该阈值,则人们通常会将这些差异当作基本噪音。
本文将这两点应用到LTP算子阈值选取算法的设计中,自适应局部三值模式(Adapted Local Ternary Pattern,ALTP),利用韦伯比结合中心像素的灰度值来确定LTP算子的阈值,计算公式如下所示:
t=xc×k(17)
其中,xc为中心像素,k为韦伯比(常数)。
本文将该方法应用到CSLTP算子中,提出了自适应对称三值模式(ASTP)。由于CSLTP算子比较的是与中心像素相邻,且关于中心像素对称的像素对,因此ASTP算子的阈值取决于与像素xi中心对称的像素xi+(N/2),其阈值计算公式为:
t=xi+(N/2)×k(0≤i≤(N/2)-1)(18)
AWASTP算子
一种基于WLD和LTP算子的图像局部特征提取算法(AWASTP)。如图6为AWASTP算子示意图,图7为AWASTP特征示意图。
从图6中可以看出,AWASTP算子分为两部分:差分激励图像与梯度方向图像。与WLD算子不同的是,本文算法在进行特征提取的过程中,首先通过各向异性LOG算子来计算AWLD算子的差分激励分量,并利用改进的ASTP算子来代替其梯度方向分量,并将各向异性LOG算子所得到的差分激励图像分别与梯度方向正值图像、梯度方向负值图像进行融合得到两个二维AWASTP直方图,并将它们转化为一维直方图,然后将两个一维直方图连接起来得到最终的直方图向量。如图8所示,二维直方图{AWASTP(ξmt)}的每一行对应一个子直方图H(k)(k=0,1,…,K-1),每个子直方图H(k)对应差励区间ξ,将该二维直方图按行进行展开,按顺序将M个子直方图连接在一起从而形成一个一维直方图H(H=[H(0),H(1),…H(M-1)])。
一种复杂光照下图像特征提取方法,具体包括以下步骤:
(1)、输入样本图像;
(2)、对图像进行分块处理;
(3)、利用公式(2)和公式(4)计算每块图像的差分激励分量;
Figure GDA0001744733910000151
其中xc为目标像素点,xi为xc的第i个临近像素点,P为xc邻域像素点的总个数,Δx为xc与其邻接像素点xi的灰度差值;
Δxi=(xi-xc)
易知,式(2)中的Δx为一个二阶拉普拉斯算子,在图像f中可表示为:
Figure GDA0001744733910000152
各向异性二阶拉普拉斯算子ΔI的计算过程如下:
ΔI=LOG*f(x,y)(4)
(4)、根据公式(18)得出的阈值计算每块图像的梯度方向图像:
t=xi+(N/2)×k(0≤i≤(N/2)-1)(18)
(5)、根据每块图像的差分激励和梯度方向分量,统计其特征直方图,并将其映射为一维向量;
(6)、将各个子块的一维特征向量连接起来,完成其特征向量的计算;
(7)、利用卡方距离计算测试样本图像与训练样本之间特征向量的相似度;
(8)、利用KNN分类算法进行分类,得出识别结果;
(9)、统计每组实验中所有样本图像的识别结果,得到其识别率作为实验结果。
具体的相似度计算:
采用KNN算法相似性衡量的依据是向量间的卡方距离大小,假设测试样本与训练样本分别为xi、yi(i=1,2,3,...,N),其特征向量分别为f(xi)、f(yi),采用测试样本与训练样本特征向量之间卡方距离的大小d来作为两者相似度衡量的依据,定义如下:
Figure GDA0001744733910000161
在本部分实验中,选用在人脸识别领域应用较为广泛的人脸数据库CMUPIE、FERET与纹理数据库PHOTEX、RAWFOOT,通过在这些数据库上进行对比实验来验证本文算法AWASTP的性能,并对实验结果进行合理分析。本文实验部分首先介绍本文的实验设置,然后在四个数据库上分别将本文AWASTP算子的特征提取性能与经典的局部特征提取算法LBP、LTP、LGS、SLGS、WLD等进行对比,并列举了新近提出的国内外优秀的特征提取算法,同时将AWASTP算子与融合本文改进思想的一系列算法进行比较。实验设置
实验环境设置如表1:
表1实验环境设置
Figure GDA0001744733910000171
性能评价标准
在本文的实验结果与分析部分,算法性能的优劣主要取决于以下两个指标:
(1)识别率(%):即识别精度。指样本集中测试样本的最终特征向量与训练样本的特征向量匹配正确的概率。
(2)识别时间(s):指的是算法从开始执行到得出最终匹配结果所用的时间。
实验结果与分析
(1)、CMUPIE人脸图像库
CMUPIE人脸图像库由41368幅图像组成,包含68个人的面部图像,其中每人13种不同姿态(POSE)、43种不同光照(ILLUMINATION)以及4种不同表情(EXPRESSION)。CMUPIE图像库中的部分图片如图9所示;
在进行实验之前,首先需要考虑分块数和韦伯比k值的选取对AWASTP算子性能的影响。下面将分别就这两个因素对复杂光照图像识别率的影响进行实验,从而选取出效果最优的分块数和最佳的k值取值范围,并在CMUPIE人脸库上进行各算法识别率的对比实验。最后,针对各算法的识别时间进行实验论证,验证本文算法的执行效率。
分块数对算法识别率的影响
本次实验选取图像分块大小分别为2×2、4×4、8×8、16×16、32×32。实验选取不同光照人脸图像的前32幅图像作为训练图像,其余为测试图像,最终将十次实验的结果均值作为实验结果。实验结果如图10所示。
从上图可以看出,各算法的识别率随着分块数的增大而不断提高,当分块数为8×8时呈现出最佳结果,随后识别率便开始呈现下降或平稳的趋势。究其根本原因:随着分块数的增多,每个小块的直方图统计信息变少,描述符将会陷入局部细致分析,从而导致识别效果降低。因此,分块数是影响算法分类性能的一个重要因素。经过上述分析,本文实验部分的图像分块数均设定为8×8。
k值对算法识别率的影响
本次实验在不同光照条件下的人脸图像中,分别选择其前2,4,8,16,32幅图像作为训练样本,将其余图像作为测试样本。表2中列举了本文AWASTP算法与WALTP、AWALTP、WASTP算法在不同k值下的识别结果,可以看出,当k取0.1时,本文算法取得了高达96.7%的识别率,识别效果甚佳。为使选取的k值在各个数据库上均能得到较高的识别率,本文在CMUPIE、FERET、PHOTEX以及RAWFOOT数据库上针对k值分别取0.08、0.09、0.1、0.11、0.12时进行实验,选取识别效果最好的k值。
表2 CMUPIE人脸库关于k值选取的实验论证
Figure GDA0001744733910000191
CMUPIE人脸库算法识别率对比实验
在本部分实验中,样本的选取与k值最佳范围选取的实验相同。图11中将AWASTP算子的识别率与WALTP、AWALTP、WASTP算子进行对比,分别选取其识别效果最好的k值下的识别率与表3中局部特征提取算法以及融合本文改进思想的AWLD、WSTP、AWSTP算子进行识别率的对比。
表3 CMUPIE人脸库不同训练样本数下各算法识别率对比
Figure GDA0001744733910000201
可以看出,在不同的光照条件下,经过本文算法所提取的图像特征的识别率明显高于上面所列举的其它方法,在k=0.1时,AWASTP算子分类性能最好,识别率高达96.7%,这足以说明该算子能够较好地克服复杂光照的影响,提取出具有较强鉴别能力的特征。
CMUPIE人脸库算法识别时间对比实验
下面将本文算法的识别时间(训练样本数量为32时)与其它算法进行对比,如表4:
表4 CMUPIE人脸库各算法识别时间对比
Figure GDA0001744733910000202
Figure GDA0001744733910000211
从上表可以看出,LBP算子识别时间是最小,执行速度最快,但同时它也是上述算法中识别率最低的。值得注意的是,在经典的LBP、LTP、LGS等经典算法上进行改进的一系列算法,其识别时间随着算法识别率的提高而增加。虽然本文算法AWASTP花费较多的时间来提取图像特征,但与其它算法时间成本的差异对实时性并没有多大影响,AWASTP算子所需的额外时间相比于其识别率的提高是可以忽略的。综上所述,AWASTP算子极大程度地提高了复杂光照图像的识别率,同时具有一定的实时性,与上表中其它算法相比,AWASTP算子性能最佳。
FERET人脸图像库
FERET图像库由fa、fb、fc、dup I和dup II五个图像集合组成的,包括1199人在不同光照、姿态、表情以及不同时期的的14051幅人脸图像。图12为FERET人脸数据库的部分图像:
本文主要针对FERET人脸数据库中不同光照条件下的人脸图像进行实验,从中选取20人,每人10张照片,分别选取前1、3、5、7张作为训练样本,其余作为测试样本。
图13中列举了WALTP、AWALTP、WASTP和AWASTP算子(k分别取0.08、0.09、0.1、0.11、0.12)的识别率,分别选取其识别效果最好的k值,将该k值下算法的识别率与表6中LBP、LTP、LGS、SLGS、WLD算子等经典算子和融合本文改进思想的算法以及表5、6中所列举的新近提出的国内外优秀算法进行对比。
表5 FERET人脸库整体识别率对比
Figure GDA0001744733910000221
表6 FERET人脸库不同训练样本数下各算法识别率对比
Figure GDA0001744733910000222
Figure GDA0001744733910000231
就识别率而言,从上述对比实验可以看出,AWLD算子相比于WLD算子来说,充分地展现了本文所提出的各向异性LOG算子在复杂光照情况下进行特征提取时的优势。WASTP相比于WALTP和WSTP算子,识别率有了极大的地提升,证明了本文所提出的中心对称和自适应阈值选取思想的可行性。同时,AWASTP算子在k取0.09时取得了最高的识别效果,说明该算子对复杂光照图像特征的描述能力强,由此对本文改进算法的性能有了进一步的验证。
PhoTex纹理图像库
PhoTex数据库包含从各个方向照亮的粗糙表面的纹理图像,部分图像如图14所示。本次实验选择了20种纹理,每种类型在复杂的光照变化下选取15幅图像,分别选取其前2、4、6、8、10幅图像作为训练图像,其余作为测试图像,重复进行十次实验取其均值作为最终实验结果。
实验结果如表7和图15所示,可以看出,训练样本数量增加时,识别率总是增加。其中,图15展示了k取不同值时,AWASTP算子与WALTP、AWALTP、WASTP算子的识别率对比。表7列举了AWASTP算子与部分融合本文改进思想的算法以及LBP、LTP、LGS、SLGS、WLD等经典算法、新近提出的国内外优秀算法在FERET库上的识别率的对比。
表7PhoTex纹理库不同训练样本数下各算法识别率对比
Figure GDA0001744733910000241
从上述实验对比结果可以看出,与经典算法LBP、LTP、LGS、SLGS、WLD相比,本文提出的AWLD、WSTP以及AWSTP算子在复杂光照图像特征提取中均呈现出了极强的优越性,本文最终的算法AWASTP在k=0.1时表现甚佳,识别率高达94.8%。通过上述分析,可以看出本文算法不仅可以在人脸特征表示方面展示最佳性能,而且可以在纹理特征描述领域依然有着极其出色的结果。
RawFoot纹理图像库
RawFoot纹理数据库一共包含68种类型的纹理图像,这些图像分别在46种光照条件下获得,其光照条件的不同体现在光照方向、光源颜色、光照强度或这些因素的组合上。包含在RawFooT数据集中的一些纹理如图16所示。
在本实验中,针对每种类型的纹理在不同光照条件下共选取13张图片,分别选取其前2、4、6、8、10张图像为训练样本,其余为测试样本。本次实验的对比方法与PhoTex纹理库上的对比方法相同,如图17呈现了在不同的k值下本文算法AWASTP算法的优劣性能对比;表8展示了在训练样本不断增加的情况下,AWASTP算子与融合本文改进思想的算法以及LBP、LTP、LGS、SLGS、WLD等经典算法、新近提出的国内外优秀算法OSLWGS、WWSCP的分类性能的相应改变。
表8 RawFooT纹理库不同训练样本数下各算法识别率对比
Figure GDA0001744733910000251
从上述对比结果可以看出,随着训练样本数的等差增长,各种算法的识别率都呈现出快速增长的趋势。尤其是AWALTP、AWASTP算子与其相对应的各项同性算子相比,识别率得到了极大的提升,因此可以证明,各向异性LOG算子在复杂光照图像特征提取方面具有很大的优势,能够更好地提取出图像中鉴别能力强的特征。另外当k=0.09,训练样本数目为10时,AWASTP算子的识别率高达98.7%,说明本文算法在很大程度上能够克服复杂光照对图像特征提取造成的影响,具有极强的光照、噪声鲁棒性。
一种新的局部特征描述符—各向异性韦伯自适应对称三值模式(AWASTP)。本文的主要贡献在于提出了各向异性韦伯局部描述符(AWLD),利用改进的集变角度、变尺度为一体的具有方向敏感性的各向异性LOG算子进行WLD算子差分激励分量的计算;同时,对LTP算子进行改进,提出比较与中心像素相邻,且关于中心像素对称的像素对的灰度值,并在韦伯准则的基础上提出实现阈值自适应选取的自适应对称三值模式(ASTP)。最后,利用AWLD算子和ASTP算子分别替代原始WLD算子中的差分激励和梯度方向分量,提出了AWASTP算子。实验结果表明,该算子能够提取出更多的纹理信息和多个方向的梯度信息,从而更好地描述复杂光照图像的特征,性能优于其他现有算法。虽然AWASTP已经取得了卓越的表现,但仍然有可能进行一些改进。在接下来的研究中,本文将研究如何将本文算法应用于实时系统中,由于实时系统包含的信息量更大、对实时性、鲁棒性要求更髙,因此本文算法还需做进一步的研究。

Claims (4)

1.一种复杂光照下图像特征提取方法,其特征在于,包括以下步骤:
首先对目标图像进行分块,然后对分块后的图像进行预处理,包括图像尺寸的归一化为128*128以及彩色图像的灰度化,利用各向异性LOG算子计算预处理后的各图像分块的差分激励分量,同时利用自适应对称三值模式ASTP计算预处理后的各图像分块的梯度方向分量;然后将各向异性LOG算子所得到的差分激励图像分别与自适应对称三值模式ASTP计算后的梯度方向正值图像、梯度方向负值图像进行融合得到两个二维AWASTP直方图,并将得到的两个二维AWASTP直方图转化为两个一维直方图,然后将两个一维直方图连接起来得到最终的直方图向量,最后将每个子块的直方图连接起来,利用KNN算法基于卡方距离进行分类,最后得到识别结果,完成图像特征提取;具体的,利用公式(2)和公式(4)计算每块图像的差分激励分量;
Figure FDA0003346008430000011
其中xc为目标像素点,xi为xc的第i个临近像素点,P为xc邻域像素点的总个数,Δx为xc与其邻接像素点xi的灰度差值;
Δxi=(xi-xc)
易知,式(2)中的Δx为一个二阶拉普拉斯算子,在图像f中可表示为:
Figure FDA0003346008430000012
各向异性二阶拉普拉斯算子ΔI的计算过程如下:
ΔI=LOG*f(x,y) (4);
各向异性LOG算子计算公式如下:
二维高斯函数G(x,y)定义如式(5):
Figure FDA0003346008430000021
其中δ为高斯函数的空间分布系数;
对函数G(x,y)取二阶拉普拉斯变换,得二维LOG算子的函数形式如下:
Figure FDA0003346008430000022
为了能使δ的取值对x方向与y方向产生的影响不同,在水平和垂直方向上采取不同尺度,将x方向的δ记为δx,y方向的δ记为δy,则二维高斯函数计算过程如下:
Figure FDA0003346008430000023
对式(7)进行拉氏变换可得具有变尺度特性的LOG边缘检测算子:
Figure FDA0003346008430000024
将标准椭圆以坐标原点为中心逆时针旋转α角度,则新的坐标关系为:
Figure FDA0003346008430000025
将上式(9)中的角度信息量带入公式(7)中,可以得到集变角度、变尺度为一体的二维高斯函数式:
Figure FDA0003346008430000026
对上式进行拉氏变换,可得各向异性拉普拉斯算子:
Figure FDA0003346008430000027
式中各参数取值分别为:A=xcos2α+ysinαcosα,B=xsin2α-ysinαcosα,C=xsinαcosα+ysin2α,D=-xsinαcosα+ycos2α,E=xcosα+ysinα,F=ycosα-xsinα。
2.根据权利要求1所述的一种复杂光照下图像特征提取方法,其特征在于,尺度参量的选取:
尺度定义为:
δ2(x,y)=1/I(x,y) (12)
其中I(x,y)代表图像中像素点(x,y)的灰度值,I(x,y)的值归一化为[0,1];
通过上述公式来确定滤波器x轴的尺度δx,即
Figure FDA0003346008430000031
由于图像区域的平滑度可以由图像的灰度方差来反映,定义式(14)来计算局部窗内的灰度均方差:
Figure FDA0003346008430000032
其中M×N为局部窗的大小,
Figure FDA0003346008430000033
代表目标像素点邻域灰度的均值,
Figure FDA0003346008430000034
和I(i,j)的取值范围均为[0,255];
定义x,y轴的尺度比例为:
Figure FDA0003346008430000035
其中K为比例因子,取固定值,y轴的尺度定义为:
δy=R·δx (16)。
3.根据权利要求1所述的一种复杂光照下图像特征提取方法,其特征在于,采用Kirsch算子来计算各向异性LOG算子的角度参量α,首先选取以目标像素点为中心的5×5大小的窗口,分别以其八个方向上3×3大小窗口的均值来代替中心像素3×3邻域范围内相应位置像素的灰度值,并将该3×3邻域范围的均值作为中心像素的灰度值,从而形成一个3×3的灰度均值矩阵Xp,然后利用Kirsch算子的8个方向模板分别与灰度均值矩阵Xp相乘,最后取结果最大值所对应的模板方向作为该目标像素点的角度参量值α。
4.根据权利要求1所述的一种复杂光照下图像特征提取方法,其特征在于,利用韦伯比结合中心像素的灰度值来确定LTP算子的阈值,计算公式如下所示:
t=xc×k (17)
其中,xc为中心像素,k为韦伯比。
CN201810516014.7A 2018-05-25 2018-05-25 一种复杂光照下图像特征提取方法 Active CN108681737B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810516014.7A CN108681737B (zh) 2018-05-25 2018-05-25 一种复杂光照下图像特征提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810516014.7A CN108681737B (zh) 2018-05-25 2018-05-25 一种复杂光照下图像特征提取方法

Publications (2)

Publication Number Publication Date
CN108681737A CN108681737A (zh) 2018-10-19
CN108681737B true CN108681737B (zh) 2022-06-07

Family

ID=63808415

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810516014.7A Active CN108681737B (zh) 2018-05-25 2018-05-25 一种复杂光照下图像特征提取方法

Country Status (1)

Country Link
CN (1) CN108681737B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109993761B (zh) 2018-06-29 2021-04-09 长城汽车股份有限公司 一种三值图像获取方法、装置及车辆
CN109598295A (zh) * 2018-11-23 2019-04-09 贵州宇鹏科技有限责任公司 一种用于图像特征提取的学习方法
CN110287780B (zh) * 2019-05-17 2021-08-03 长安大学 一种光照下人脸图像特征提取方法
CN110222661B (zh) * 2019-06-12 2023-04-07 中国矿业大学 一种用于运动目标识别及跟踪的特征提取方法
CN110232390B (zh) * 2019-06-13 2022-10-14 长安大学 一种变化光照下图像特征提取方法
CN115861135B (zh) * 2023-03-01 2023-05-23 铜牛能源科技(山东)有限公司 一种应用于箱体全景探测的图像增强及识别方法
CN116993643B (zh) * 2023-09-27 2023-12-12 山东建筑大学 基于人工智能的无人机摄影测量图像校正方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103077512A (zh) * 2012-10-18 2013-05-01 北京工业大学 基于主成分析的数字图像的特征提取与匹配方法及装置
CN106228163A (zh) * 2016-07-25 2016-12-14 长安大学 一种基于特征选择的局部差三进制序列图像特征描述方法
CN106295650A (zh) * 2016-07-22 2017-01-04 长安大学 一种适用于复杂光照下的图像描述方法
CN107229949A (zh) * 2017-05-25 2017-10-03 贵州宇鹏科技有限责任公司 一种复杂光照下图像特征提取方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103077512A (zh) * 2012-10-18 2013-05-01 北京工业大学 基于主成分析的数字图像的特征提取与匹配方法及装置
CN106295650A (zh) * 2016-07-22 2017-01-04 长安大学 一种适用于复杂光照下的图像描述方法
CN106228163A (zh) * 2016-07-25 2016-12-14 长安大学 一种基于特征选择的局部差三进制序列图像特征描述方法
CN107229949A (zh) * 2017-05-25 2017-10-03 贵州宇鹏科技有限责任公司 一种复杂光照下图像特征提取方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"Local Diagonal Extrema Number Pattern:A new Feature Descriptor for Face Recognition";Arvind Pillai etc.;《Journal of LATEX Templates》;20170924;全文 *

Also Published As

Publication number Publication date
CN108681737A (zh) 2018-10-19

Similar Documents

Publication Publication Date Title
CN108681737B (zh) 一种复杂光照下图像特征提取方法
Varish et al. Image retrieval scheme using quantized bins of color image components and adaptive tetrolet transform
CN103632132B (zh) 一种基于肤色分割和模板匹配的人脸检测与识别方法
Cohen et al. Inference of human postures by classification of 3D human body shape
Khan et al. Iris recognition using image moments and k-means algorithm
CN106599854B (zh) 基于多特征融合的人脸表情自动识别方法
CN104850838B (zh) 基于表情不变区域的三维人脸识别方法
CN104778457B (zh) 基于多示例学习的视频人脸识别方法
Puhan et al. Efficient segmentation technique for noisy frontal view iris images using Fourier spectral density
CN109902590A (zh) 深度多视图特征距离学习的行人重识别方法
CN110991389B (zh) 判断目标行人在非重叠相机视角中出现的匹配方法
CN106529504B (zh) 一种复合时空特征的双模态视频情感识别方法
CN109902585A (zh) 一种基于图模型的手指三模态融合识别方法
CN110287780B (zh) 一种光照下人脸图像特征提取方法
CN105975906B (zh) 一种基于面积特征的pca静态手势识别方法
Russ et al. 3D facial recognition: a quantitative analysis
CN110555386A (zh) 一种基于动态贝叶斯的人脸识别身份认证方法
Kpalma et al. An overview of advances of pattern recognition systems in computer vision
CN106778491B (zh) 人脸3d特征信息的获取方法及设备
CN105069403B (zh) 一种基于分块统计特征与字典学习稀疏表示分类的三维人耳识别
Li et al. Performance comparison of saliency detection
CN108932468A (zh) 一种适用于心理学的面部识别方法
Ribarić et al. Personal recognition based on the Gabor features of colour palmprint images
Kar et al. An adaptive block based integrated LDP, GLCM, and Morphological features for Face Recognition
CN105955473A (zh) 一种基于计算机的静态手势图像识别交互系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant