CN110781802A - 一种基于信息论流形的人脸图像识别方法 - Google Patents

一种基于信息论流形的人脸图像识别方法 Download PDF

Info

Publication number
CN110781802A
CN110781802A CN201911011834.1A CN201911011834A CN110781802A CN 110781802 A CN110781802 A CN 110781802A CN 201911011834 A CN201911011834 A CN 201911011834A CN 110781802 A CN110781802 A CN 110781802A
Authority
CN
China
Prior art keywords
dimensional
face
image
face image
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911011834.1A
Other languages
English (en)
Other versions
CN110781802B (zh
Inventor
张宏伟
张小虎
杨夏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Priority to CN201911011834.1A priority Critical patent/CN110781802B/zh
Publication of CN110781802A publication Critical patent/CN110781802A/zh
Application granted granted Critical
Publication of CN110781802B publication Critical patent/CN110781802B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2132Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis
    • G06F18/21322Rendering the within-class scatter matrix non-singular
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2132Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis
    • G06F18/21322Rendering the within-class scatter matrix non-singular
    • G06F18/21324Rendering the within-class scatter matrix non-singular involving projections, e.g. Fisherface techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Human Computer Interaction (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本发明提供了一种基于信息论流形的人脸图像识别方法,包括如下步骤:步骤1,通过Gabor滤波器对人脸二维图像进行处理,使用多个中心尺度和多个方向组合,提取人脸二维图像的纹理结构特征;步骤2,使用不确定度计算人脸二维图像经过多尺度变换后各个尺度特征结果的权值;步骤3,对高维张量空间数据进行降维,得到低维数据并提取人脸二维图像数据的特征;步骤4,根据已提取到的人脸二维图像数据,利用线性判别分析和最近邻算法识别人脸二维图像;本发明相对于一些基础的人脸二维图像特征提取算法而言,具有较好的识别率。

Description

一种基于信息论流形的人脸图像识别方法
技术领域
本发明涉及图像识别技术领域,具体而言,涉及一种基于信息论流形的人脸图像识别方法。
背景技术
图像特征提取技术在科学研究、社会安全、软件开发和航空航天等项目中有着广阔的应用前景,如何对图像特征进行有效表示和提取一直都是图像理解和识别的热点。
经过大量检索发现一些典型的现有技术,如申请号为 201410360742.5提出了一种基于最近特征线的人脸特征提取方法,其直接利用图像矩阵数据进行计算,求取与人脸图像样本同样是矩阵的在同类人脸图像样本所生成的特征线上的投影点,使得人脸图像样本经过该线性变换之后,基于二维最近特征线的类内散度最小。该发明降低了运算量,并尽可能多的保留图像矩阵本身临近像素点之间的相关性。
又如申请号为201310320237.3提出了一种基于流形学习的人脸识别方法,该发明通过对图像进行训练,实时采集待测试图像,进行人脸识别,比采用基于欧氏距离的局部线性嵌入方法更为合理,识别准确率更高,也比直接采用高维数据进行识别的运算复杂度更低,更加简便。
由此可见,如何对人脸二维图像进行识别,其实际应用中的亟待处理的实际问题还有很多未提出具体的解决方案。
发明内容
为了克服现有技术的不足提供了一种基于信息论流形的人脸图像识别方法,本发明的具体技术方案如下:
1.一种基于信息论流形的人脸图像识别方法,包括如下步骤:
步骤1,通过Gabor滤波器对人脸二维图像进行处理,使用多个中心尺度和多个方向组合,提取人脸二维图像的纹理结构特征;
步骤2,使用不确定度计算人脸二维图像经过多尺度变换后各个尺度特征结果的权值;
步骤3,对高维张量空间数据进行降维,得到低维数据并提取人脸二维图像数据的特征;
步骤4,根据已提取到的人脸二维图像数据,利用线性判别分析和最近邻算法识别人脸二维图像;
其中,不确定度通过实验标准差计算。
可选的,在步骤1中,通过Gabor滤波器对人脸二维图像进行处理的具体方法为:
获取人脸二维图像上给定点I(z)附近区域的灰度特征;
利用公式Gu,v(z)=I(z)*ψu,v(z),对获取的灰度特征与Gabor函数进行卷积运算;
其中*表示卷积运算,z=(x,y)为具体某个点的坐标,I (z)为给定点的灰度值,ψu,v(z)中参数u和v分别表示Gabor内核的方向和中心尺度。
可选的,在步骤2中,不确定度权值的具体计算方法为:
对M张同类人脸图像样本{Yi,i=1,…,M},使用5个不同的中心尺度和8个不同的方向组合成40个Gabor滤波器,得到40张人脸图像特征
使
Figure RE-GDA0002273929570000031
为Gi的算术平均值,则第j个Gabor滤波器的不确定度其中
Figure RE-GDA0002273929570000033
表示矩阵间的欧式距离;
设40个多尺度Gabor滤波器的权值分别为A1,A2,A3,…A40,且
Figure RE-GDA0002273929570000034
通过融合得到人脸图像样本的最终特征
Figure RE-GDA0002273929570000035
且人脸图像样本Yi经过Gabor滤波响应后的方差
Figure RE-GDA0002273929570000036
结合不确定度Uj和方差σ2,得到
Figure RE-GDA0002273929570000037
使用拉格朗日乘法完成计算,其中γ为拉格朗日常数,有
Figure RE-GDA0002273929570000038
求解得到不确定度权值
Figure RE-GDA00022739295700000310
可选的,在步骤3中,对高维张量空间数据进行降维以得到低维数据的具体方法为:
使用M个张量样本{Xm,m=1,…,M}为练本,且Am∈ RI1×I2×…×IN,即构建的张量空间属于张量空间
Figure RE-GDA00022739295700000311
其中In 作为张量第n模的维数;
通过多线性主成分分析方法计算多线性变换空间{U(n)∈RIn×Pn, n=1,2,…,N},其中U(n)由Φ(n)中最大的Pn个特征值对应Pn个特征向量构成,其中,
Figure RE-GDA00022739295700000312
Figure RE-GDA0002273929570000041
Figure RE-GDA0002273929570000042
Figure RE-GDA0002273929570000043
为最大化张量总的散布值;
利用公式
Figure RE-GDA0002273929570000044
其中Ω<1,使用基于Q值的方法计算较优的Pn值。
可选的,在步骤1中,通过Gabor滤波器对人脸二维图像进行处理前,先对人脸二维图像进行预处理,预处理的具体方法为:
第一步,获取一张人脸二维背景图像并对获取的人脸二维背景图像进行数据解码,利用有限状态机方法进行人脸二维背景图像数据的提取,得到人脸二维背景图像数据;
第二步,按照一定周期连续采集人脸二维图像并对人脸二维图像进行数据解码,利用有限状态机方法进行人脸二维图像数据的提取,得到人脸二维图像数据;
第三步,提取人脸二维背景图像数据的亮度Y和色度Cb以及人脸二维图像数据的亮度YS和色度Cbs,得到前景图像为|Cb-Cbs|,对前景图像进行二值化,得到二值化处理后的人脸二维图像。
1、本发明所取得的有益效果包括:采用了多尺度Gabor变换获取图像多尺度特征,并通过使用不确定度计算各个多尺度特征的权重,优化了各个纹理特征在图像识别中的作用;
2、通过组建成张量空间,使用MPCA算法和线性判别分析算法把高维构建的张量空间降维成低维数据,提取得到较好表征人脸二维图像数据的特征,完成最终的人脸二维图像特征提取,相对于一些基础的人脸二维图像特征提取算法具有较好的识别率;
3、通过Gabor滤波器对人脸二维图像进行处理前,利用背景减除法对人脸二维图像进行预处理,可以节省人脸二维图像识别的时间,提高识别效率。
附图说明
从以下结合附图的描述可以进一步理解本发明,将重点放在示出实施例的原理上。
图1是本发明实施例之一中一种基于信息论流形人脸图像识别方法的流程示意图;
图2是本发明实施例中方向滤波响应特征的示意图;
图3是本发明实施例中中心尺度滤波响应特征的示意图;
图4是本发明实施例中多尺度Gabor特征加权构造张量空间的示意图;
图5是CAS-PEAL-R1光照的子图像库中部分人脸示意图;
图6是经过预处理后的部分人脸示意图;
图7是本实施例与一些基础人脸特征提取算法的识别率比较图。
具体实施方式
为了使得本发明的目的、技术方案及优点更加清楚明白,以下结合其实施例,对本发明进行进一步详细说明;应当理解,此处所描述的具体实施例仅用于解释本发明,并不用于限定本发明。对于本领域技术人员而言,在查阅以下详细描述之后,本实施例的其它系统、方法和/或特征将变得显而易见。旨在所有此类附加的系统、方法、特征和优点都包括在本说明书内、包括在本发明的范围内,并且受所附权利要求书的保护。在以下详细描述描述了所公开的实施例的另外的特征,并且这些特征根据以下将详细描述将是显而易见的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或组件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
本发明为一种基于信息论流形的人脸图像识别方法,根据图1-7所示讲述以下实施例:
实施例一:
一种基于信息论流形的人脸图像识别方法,包括如下步骤:
步骤1,通过Gabor滤波器对人脸二维图像进行处理,使用多个中心尺度和多个方向组合,提取人脸二维图像的纹理结构特征;
步骤2,使用不确定度计算人脸二维图像经过多尺度变换后各个尺度特征结果的权值;
步骤3,对高维张量空间数据进行降维,得到低维数据并提取人脸二维图像数据的特征;
步骤4,根据已提取到的人脸二维图像数据,利用线性判别分析和最近邻算法识别人脸二维图像;
其中,不确定度通过实验标准差计算。
其中,在步骤1中,通过Gabor滤波器对人脸二维图像进行处理的具体方法为:
获取人脸二维图像上给定点I(z)附近区域的灰度特征;
利用公式Gu,v(z)=I(z)*ψu,v(z),对获取的灰度特征与Gabor函数进行卷积运算;
其中*表示卷积运算,z=(x,y)为具体某个点的坐标,I (z)为给定点的灰度值,ψu,v(z)中参数u和v分别表示Gabor内核的方向和中心尺度。
为了尽可能完整地得到人脸二维图像的纹理特征,通常使用多个中心尺度和多个方向组合,完成人脸二维图像纹理特征的获取,其中方向的变化u∈(0,1,2,3,4,5,6,7),卷积后图像的纹理方向也会随之变化,如图2所示。
在图2中可以看到,当使用滤波器方向与人脸二维图像纹理特征的方向一致时,得到的滤波特征响应比较明显。
同理,当中心尺度变化v∈(0,1,2,3,4)时,图像与核函数卷积后图像的纹理方向也会随着变化,具体结果如图3所示。
在步骤2中,不确定度权值的具体计算方法为:
对M张同类人脸图像样本{Yi,i=1,…,M},使用5个不同的中心尺度和8个不同的方向组合成40个Gabor滤波器,得到40张人脸图像特征
Figure RE-GDA0002273929570000071
使
Figure RE-GDA0002273929570000072
为Gi的算术平均值,则第j个Gabor滤波器的不确定度
Figure RE-GDA0002273929570000073
其中表示矩阵间的欧式距离;
设40个多尺度Gabor滤波器的权值分别为A1,A2,A3,…A40,且
Figure RE-GDA0002273929570000081
通过融合得到人脸图像样本的最终特征
Figure RE-GDA0002273929570000082
且人脸图像样本Yi经过Gabor滤波响应后的方差
Figure RE-GDA0002273929570000083
结合不确定度Uj和方差σ2,得到
Figure RE-GDA0002273929570000084
使用拉格朗日乘法完成计算,其中γ为拉格朗日常数,有
Figure RE-GDA0002273929570000085
求解得到不确定度权值
Figure RE-GDA0002273929570000086
Figure RE-GDA0002273929570000087
在步骤3中,对高维张量空间数据进行降维以得到低维数据的具体方法为:
使用M个张量样本{Xm,m=1,…,M}为练本,且Am∈ RI1×I2×…×IN,即构建的张量空间属于张量空间其中In 作为张量第n模的维数;
通过多线性主成分分析方法计算多线性变换空间{U(n)∈RIn×Pn, n=1,2,…,N},其中U(n)由Φ(n)中最大的Pn个特征值对应Pn个特征向量构成,其中,
Figure RE-GDA0002273929570000089
Figure RE-GDA00022739295700000810
为最大化张量总的散布值;
利用公式
Figure RE-GDA0002273929570000092
其中Ω<1,使用基于Q值的方法计算较优的Pn值。
本实施例采用了多尺度Gabor变换获取图像多尺度特征,并通过使用不确定度计算各个多尺度特征的权重,优化了各个纹理特征在图像识别中的作用。
实施例二:
一种基于信息论流形的人脸图像识别方法,包括如下步骤:
步骤1,通过Gabor滤波器对人脸二维图像进行处理,使用多个中心尺度和多个方向组合,提取人脸二维图像的纹理结构特征;
步骤2,使用不确定度计算人脸二维图像经过多尺度变换后各个尺度特征结果的权值;
步骤3,对高维张量空间数据进行降维,得到低维数据并提取人脸二维图像数据的特征;
步骤4,根据已提取到的人脸二维图像数据,利用线性判别分析和最近邻算法识别人脸二维图像;
其中,不确定度通过实验标准差计算。
在步骤1中,通过Gabor滤波器对人脸二维图像进行处理的具体方法为:
获取人脸二维图像上给定点I(z)附近区域的灰度特征;
利用公式Gu,v(z)=I(z)*ψu,v(z),对获取的灰度特征与Gabor函数进行卷积运算;
其中*表示卷积运算,z=(x,y)为具体某个点的坐标,I (z)为给定点的灰度值,ψu,v(z)中参数u和v分别表示Gabor内核的方向和中心尺度。
在步骤2中,不确定度权值的具体计算方法为:
对M张同类人脸图像样本{Yi,i=1,…,M},使用5个不同的中心尺度和8个不同的方向组合成40个Gabor滤波器,得到40张人脸图像特征
使
Figure RE-GDA0002273929570000102
为Gi的算术平均值,则第j个Gabor滤波器的不确定度
Figure RE-GDA0002273929570000103
其中
Figure RE-GDA0002273929570000104
表示矩阵间的欧式距离;
设40个多尺度Gabor滤波器的权值分别为A1,A2,A3,…A40,且
Figure RE-GDA0002273929570000105
通过融合得到人脸图像样本的最终特征
Figure RE-GDA0002273929570000106
且人脸图像样本Yi经过Gabor滤波响应后的方差
Figure RE-GDA0002273929570000107
结合不确定度Uj和方差σ2,得到
Figure RE-GDA0002273929570000108
使用拉格朗日乘法完成计算,其中γ为拉格朗日常数,有
Figure RE-GDA0002273929570000109
求解得到不确定度权值
Figure RE-GDA00022739295700001010
Figure RE-GDA00022739295700001011
在步骤3中,对高维张量空间数据进行降维以得到低维数据的具体方法为:
使用M个张量样本{Xm,m=1,…,M}为练本,且Am∈ RI1×I2×…×IN,即构建的张量空间属于张量空间其中In 作为张量第n模的维数;
通过多线性主成分分析方法计算多线性变换空间{U(n)∈RIn×Pn, n=1,2,…,N},其中U(n)由Φ(n)中最大的Pn个特征值对应Pn个特征向量构成,其中,
Figure RE-GDA0002273929570000112
Figure RE-GDA0002273929570000113
Figure RE-GDA0002273929570000114
Figure RE-GDA0002273929570000115
为最大化张量总的散布值;
利用公式
Figure RE-GDA0002273929570000116
其中Ω<1,使用基于Q值的方法计算较优的Pn值。
本实施例中所述的一种基于信息论流形的人脸图像识别方法,其具体算法:
{Vm,m=1,2,···M};设定M个人脸二维训练样本集。
利用样本集Vm,通过卷积变换得到40个滤波响应图。
{Xm,m=1,2···M};构建样本的张量形式。
Program Sub_tensor_features Begin
构建张量(如图4所示)。
Figure RE-GDA0002273929570000122
进行张量样本中心化。
Pn←Qmethod;使用Q方法计算张量子空间维数。
for n=1 to pn
Figure RE-GDA0002273929570000123
{U(n),n=1,2,···,N}←Φ(n)*;奇异值分解得到特征向量
End for
Figure RE-GDA0002273929570000124
对样本张量进行投影映射,得到样本张量集。
Figure RE-GDA0002273929570000125
计算投影映射后总的散布值。
for k=1:K;通过使用交替最小二乘法算法,直到结果收敛。
For n=1:N;设置由Φ(n)*中最大的Pn个特征值对应的Pn个特征向量构成的U(n)
Figure RE-GDA0002273929570000126
else exit
end for
end for
Figure RE-GDA0002273929570000131
完成人脸二维图像纹理结构特征提取过程。
ym←Ym;重新排列一个特征矩阵。
Zm=Vldaym;设置投影空间Vlda,计算最后投影空间。
End Program Sub_tensor_features
实施例三:
一种基于信息论流形的人脸图像识别方法,包括如下步骤:
步骤1,通过Gabor滤波器对人脸二维图像进行处理,使用多个中心尺度和多个方向组合,提取人脸二维图像的纹理结构特征;
步骤2,使用不确定度计算人脸二维图像经过多尺度变换后各个尺度特征结果的权值;
步骤3,对高维张量空间数据进行降维,得到低维数据并提取人脸二维图像数据的特征;
步骤4,根据已提取到的人脸二维图像数据,利用线性判别分析和最近邻算法识别人脸二维图像;
其中,不确定度通过实验标准差计算。
其中,在步骤1中,通过Gabor滤波器对人脸二维图像进行处理的具体方法为:
获取人脸二维图像上给定点I(z)附近区域的灰度特征;
利用公式Gu,v(z)=I(z)*ψu,v(z),对获取的灰度特征与Gabor函数进行卷积运算;
其中*表示卷积运算,z=(x,y)为具体某个点的坐标,I (z)为给定点的灰度值,ψu,v(z)中参数u和v分别表示Gabor内核的方向和中心尺度。
为了尽可能完整地得到人脸二维图像的纹理特征,通常使用多个中心尺度和多个方向组合,完成人脸二维图像纹理特征的获取,其中方向的变化u∈(0,1,2,3,4,5,6,7),卷积后图像的纹理方向也会随之变化,如图2所示。
在图2中可以看到,当使用滤波器方向与人脸二维图像纹理特征的方向一致时,得到的滤波特征响应比较明显。
同理,当中心尺度变化v∈(0,1,2,3,4)时,图像与核函数卷积后图像的纹理方向也会随着变化,具体结果如图3所示。
在步骤2中,不确定度权值的具体计算方法为:
对M张同类人脸图像样本{Yi,i=1,…,M},使用5个不同的中心尺度和8个不同的方向组合成40个Gabor滤波器,得到40张人脸图像特征
Figure RE-GDA0002273929570000141
使
Figure RE-GDA0002273929570000142
为Gi的算术平均值,则第j个Gabor滤波器的不确定度
Figure RE-GDA0002273929570000143
其中
Figure RE-GDA0002273929570000144
表示矩阵间的欧式距离;
设40个多尺度Gabor滤波器的权值分别为A1,A2,A3,…A40,且
Figure RE-GDA0002273929570000145
通过融合得到人脸图像样本的最终特征且人脸图像样本Yi经过Gabor滤波响应后的方差
Figure RE-GDA0002273929570000147
结合不确定度Uj和方差σ2,得到
Figure RE-GDA0002273929570000151
使用拉格朗日乘法完成计算,其中γ为拉格朗日常数,有求解得到不确定度权值
Figure RE-GDA0002273929570000153
Figure RE-GDA0002273929570000154
在步骤3中,对高维张量空间数据进行降维以得到低维数据的具体方法为:
使用M个张量样本{Xm,m=1,…,M}为练本,且Am∈ RI1×I2×…×IN,即构建的张量空间属于张量空间
Figure RE-GDA0002273929570000155
其中In 作为张量第n模的维数;
通过多线性主成分分析方法计算多线性变换空间{U(n)∈RIn×Pn, n=1,2,…,N},其中U(n)由Φ(n)中最大的Pn个特征值对应Pn个特征向量构成,其中,
Figure RE-GDA0002273929570000156
Figure RE-GDA0002273929570000157
Figure RE-GDA0002273929570000158
为最大化张量总的散布值;
利用公式
Figure RE-GDA00022739295700001510
其中Ω<1,使用基于Q值的方法计算较优的Pn值。
本实施例通过使用东方人脸库CSA-PEAL-R1进行了人脸二维图像算法识别过程。东方人脸库图像都是在某种特定环境中采集获取的包括表情、饰物、姿势、光照等环境情况。而光照的变换对人脸二维图像识别影响较大,其识别率较低。本发明的一种基于信息论流形的人脸图像识别方法考虑了光照等外界环境对识别的干扰。东方人脸库CSA-PEAL-R1的光照子图库中部分人脸如图5所示
由于东方人脸库CSA-PEAL-R1中的图像包含多种背景信息,本实施例对图4进行一定的预处理。经过预处理后的人脸图像如图6所示。
为了说明本实施例对人脸二维图像特征提取的有效性,将与一些基础的人脸特征提取算法(PCA-PCA+LDA,MPCA+LDA和GPCA+LDA(Gabor+ PCA+LDA))进行识别率比较,实验过程中都使用东方人脸库中CSA- PEAL-R1光照子图像库。实验训练过程中,使用东方人脸库光照子图像库中每类人脸样本数为变化的r用于训练,其值分别为{r=1,2,…, 6},则相对应剩下部分全部用于识别率测试。在CSA-PEAL-R1光照子库上识别算法识别率比较图如图7所示。
本实施例通过组建成张量空间,使用MPCA算法和线性判别分析算法把高维构建的张量空间降维成低维数据,提取得到较好表征人脸二维图像数据的特征,完成最终的人脸二维图像特征提取,相对于一些基础的人脸二维图像特征提取算法具有较好的识别率。
实施例四:
一种基于信息论流形的人脸图像识别方法,包括如下步骤:
步骤1,通过Gabor滤波器对人脸二维图像进行处理,使用多个中心尺度和多个方向组合,提取人脸二维图像的纹理结构特征;
步骤2,使用不确定度计算人脸二维图像经过多尺度变换后各个尺度特征结果的权值;
步骤3,对高维张量空间数据进行降维,得到低维数据并提取人脸二维图像数据的特征;
步骤4,根据已提取到的人脸二维图像数据,利用线性判别分析和最近邻算法识别人脸二维图像;
其中,不确定度通过实验标准差计算。
其中,在步骤1中,通过Gabor滤波器对人脸二维图像进行处理的具体方法为:
获取人脸二维图像上给定点I(z)附近区域的灰度特征;
利用公式Gu,v(z)=I(z)*ψu,v(z),对获取的灰度特征与Gabor函数进行卷积运算;
其中*表示卷积运算,z=(x,y)为具体某个点的坐标,I (z)为给定点的灰度值,ψu,v(z)中参数u和v分别表示Gabor内核的方向和中心尺度。
为了尽可能完整地得到人脸二维图像的纹理特征,通常使用多个中心尺度和多个方向组合,完成人脸二维图像纹理特征的获取,其中方向的变化u∈(0,1,2,3,4,5,6,7),卷积后图像的纹理方向也会随之变化,如图2所示。
在图2中可以看到,当使用滤波器方向与人脸二维图像纹理特征的方向一致时,得到的滤波特征响应比较明显。
同理,当中心尺度变化v∈(0,1,2,3,4)时,图像与核函数卷积后图像的纹理方向也会随着变化,具体结果如图3所示。
在步骤2中,不确定度权值的具体计算方法为:
对M张同类人脸图像样本{Yi,i=1,…,M},使用5个不同的中心尺度和8个不同的方向组合成40个Gabor滤波器,得到40张人脸图像特征
Figure RE-GDA0002273929570000181
使
Figure RE-GDA0002273929570000182
为Gi的算术平均值,则第j个Gabor滤波器的不确定度
Figure RE-GDA0002273929570000183
其中
Figure RE-GDA0002273929570000184
表示矩阵间的欧式距离;
设40个多尺度Gabor滤波器的权值分别为A1,A2,A3,…A40,且
Figure RE-GDA0002273929570000185
通过融合得到人脸图像样本的最终特征
Figure RE-GDA0002273929570000186
且人脸图像样本Yi经过Gabor滤波响应后的方差
Figure RE-GDA0002273929570000187
结合不确定度Uj和方差σ2,得到
Figure RE-GDA0002273929570000188
使用拉格朗日乘法完成计算,其中γ为拉格朗日常数,有
Figure RE-GDA0002273929570000189
求解得到不确定度权值
Figure RE-GDA00022739295700001810
Figure RE-GDA00022739295700001811
在步骤3中,对高维张量空间数据进行降维以得到低维数据的具体方法为:
使用M个张量样本{Xm,m=1,…,M}为练本,且Am∈ RI1×I2×…×IN,即构建的张量空间属于张量空间
Figure RE-GDA00022739295700001812
其中In 作为张量第n模的维数;
通过多线性主成分分析方法计算多线性变换空间{U(n)∈RIn×Pn, n=1,2,…,N},其中U(n)由Φ(n)中最大的Pn个特征值对应Pn个特征向量构成,其中,
Figure RE-GDA0002273929570000191
Figure RE-GDA0002273929570000192
为最大化张量总的散布值;
利用公式
Figure RE-GDA0002273929570000195
其中Ω<1,使用基于Q值的方法计算较优的Pn值。
本实施例通过使用东方人脸库CSA-PEAL-R1进行了人脸二维图像算法识别过程。东方人脸库图像都是在某种特定环境中采集获取的包括表情、饰物、姿势、光照等环境情况。而光照的变换对人脸二维图像识别影响较大,其识别率较低。本发明的一种基于信息论流形的人脸图像识别方法考虑了光照等外界环境对识别的干扰。东方人脸库CSA-PEAL-R1的光照子图库中部分人脸如图5所示
由于东方人脸库CSA-PEAL-R1中的图像包含多种背景信息,本实施例对图4进行一定的预处理。经过预处理后的人脸图像如图6所示。
为了更好得对人脸二维图像处理,在通过Gabor滤波器对人脸二维图像进行处理,使用多个中心尺度和多个方向组合,提取人脸二维图像的纹理结构特征值前,可以先剔除人脸图像所包含的多种背景信息,其具体步骤如下:
第一步,获取一张人脸二维背景图像并对获取的人脸二维背景图像进行数据解码,利用有限状态机方法进行人脸二维背景图像数据的提取,得到人脸二维背景图像数据;
第二步,按照一定周期连续采集人脸二维图像并对人脸二维图像进行数据解码,利用有限状态机方法进行人脸二维图像数据的提取,得到人脸二维图像数据;
第三步,提取人脸二维背景图像数据的亮度Y和色度Cb以及人脸二维图像数据的亮度YS和色度Cbs,得到前景图像为|Cb-Cbs|,对前景图像进行二值化,得到二值化处理后的人脸二维图像。
其中,对前景图像进行二值化的阈值为10。
通常的背景减除法,一般使用RGB三个通道中的一个或多个,也有使用灰度或亮度的,虽然使用这些通道计算方便,但RGB三个通道、灰度及亮度对光照都非常敏感,而且处理后的图像除了目标,阴影也会被检测出来,而YCbCr颜色模型中的Cb和Cr两个通道对光照不敏感,同时选择适当的阈值可以去除阴影的影响,在实现这些的同时,也能将图像二值化。
对人脸二维图像的二值化处理可以在FPGA中处理,以节省数据处理时间。
通过Gabor滤波器对人脸二维图像进行处理前,利用背景减除法对人脸二维图像进行预处理,可以节省人脸二维图像识别的时间,提高识别效率。
综上所述,本发明公开的一种基于信息论流形的人脸图像识别方法,所产生的有益技术效果包括:
1、采用了多尺度Gabor变换获取图像多尺度特征,并通过使用不确定度计算各个多尺度特征的权重,优化了各个纹理特征在图像识别中的作用;
2、通过组建成张量空间,使用MPCA算法和线性判别分析算法把高维构建的张量空间降维成低维数据,提取得到较好表征人脸二维图像数据的特征,完成最终的人脸二维图像特征提取,相对于一些基础的人脸二维图像特征提取算法具有较好的识别率;
3、通过Gabor滤波器对人脸二维图像进行处理前,利用背景减除法对人脸二维图像进行预处理,可以节省人脸二维图像识别的时间,提高识别效率。
虽然上面已经参考各种实施例描述了本发明,但是应当理解,在不脱离本发明的范围的情况下,可以进行许多改变和修改。也就是说上面讨论的方法、系统和设备是示例,各种配置可以适当地省略、替换或添加各种过程或组件。例如,在替代配置中,可以以与所描述的顺序不同的顺序执行方法和/或可以添加、省略和/或组合各种部件。而且,关于某些配置描述的特征可以以各种其他配置组合,如可以以类似的方式组合配置的不同方面和元素。此外,随着技术发展其中的元素可以更新,即许多元素是示例,并不限制本发明公开或权利要求的范围。
在说明书中给出了具体细节以提供对包括实现的示例性配置的透彻理解。然而,可以在没有这些具体细节的情况下实践配置,例如已经示出了众所周知的电路、过程、算法、结构和技术而没有不必要的细节,以避免模糊配置。该描述仅提供示例配置,并且不限制权利要求的范围,适用性或配置。相反,前面对配置的描述将为本领域技术人员提供用于实现所描述的技术的使能描述。在不脱离本发明公开的精神或范围的情况下,可以对元件的功能和布置进行各种改变。
综上,其旨在上述详细描述被认为是例示性的而非限制性的,并且应当理解,以下权利要求(包括所有等同物)旨在限定本发明的精神和范围。以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。

Claims (5)

1.一种基于信息论流形的人脸图像识别方法,包括如下步骤:
步骤1,通过Gabor滤波器对人脸二维图像进行处理,使用多个中心尺度和多个方向组合,提取人脸二维图像的纹理结构特征;
步骤2,使用不确定度计算人脸二维图像经过多尺度变换后各个尺度特征结果的权值;
步骤3,对高维张量空间数据进行降维,得到低维数据并提取人脸二维图像数据的特征;
步骤4,根据已提取到的人脸二维图像数据,利用线性判别分析和最近邻算法识别人脸二维图像。
2.如权利要求1所述的一种基于信息论流形的人脸图像识别方法,在步骤1中,通过Gabor滤波器对人脸二维图像进行处理的具体方法为:
获取人脸二维图像上给定点I(z)附近区域的灰度特征;
利用公式Gu,v(z)=I(z)*ψu,v(z),对获取的灰度特征与Gabor函数进行卷积运算;
其中*表示卷积运算,z=(x,y)为具体某个点的坐标,I(z)为给定点的灰度值,ψu,v(z)中参数u和v分别表示Gabor内核的方向和中心尺度。
3.如权利要求2所述的一种基于信息论流形的人脸图像识别方法,在步骤2中,不确定度权值的具体计算方法为:
对M张同类人脸图像样本{Yi,i=1,…,M},使用5个不同的中心尺度和8个不同的方向组合成40个Gabor滤波器,得到40张人脸图像特征
Figure FDA0002244426880000011
使为Gi的算术平均值,则第j个Gabor滤波器的不确定度
Figure FDA0002244426880000022
其中
Figure FDA0002244426880000023
表示矩阵间的欧式距离;
设40个多尺度Gabor滤波器的权值分别为A1,A2,A3,…A40,且
Figure FDA0002244426880000024
通过融合得到人脸图像样本的最终特征且人脸图像样本Yi经过Gabor滤波响应后的方差
Figure FDA0002244426880000026
结合不确定度Uj和方差σ2,得到
Figure FDA0002244426880000027
使用拉格朗日乘法完成计算,其中γ为拉格朗日常数,有
Figure FDA0002244426880000028
求解得到不确定度权值
Figure FDA0002244426880000029
j=1,2,…40。
4.如权利要求3所述的一种基于信息论流形的人脸图像识别方法,在步骤3中,对高维张量空间数据进行降维以得到低维数据的具体方法为:
使用M个张量样本{Xm,m=1,…,M}为练本,且Am∈RI1×I2×…×IN,即构建的张量空间属于张量空间
Figure FDA00022444268800000210
其中In作为张量第n模的维数;
通过多线性主成分分析方法计算多线性变换空间{U(n)∈RIn×Pn,n=1,2,…,N},其中U(n)由Φ(n)中最大的Pn个特征值对应Pn个特征向量构成,其中,
Figure FDA00022444268800000211
Figure FDA0002244426880000031
Figure FDA0002244426880000032
为最大化张量总的散布值;
利用公式
Figure FDA0002244426880000034
其中Ω<1,使用基于Q值的方法计算较优的Pn值。
5.如权利要求4所述的一种基于信息论流形的人脸图像识别方法,在步骤1中,通过Gabor滤波器对人脸二维图像进行处理前,先对人脸二维图像进行预处理,预处理的具体方法为:
第一步,获取一张人脸二维背景图像并对获取的人脸二维背景图像进行数据解码,利用有限状态机方法进行人脸二维背景图像数据的提取,得到人脸二维背景图像数据;
第二步,按照一定周期连续采集人脸二维图像并对人脸二维图像进行数据解码,利用有限状态机方法进行人脸二维图像数据的提取,得到人脸二维图像数据;
第三步,提取人脸二维背景图像数据的亮度Y和色度Cb以及人脸二维图像数据的亮度YS和色度Cbs,得到前景图像为|Cb-Cbs|,对前景图像进行二值化,得到二值化处理后的人脸二维图像。
CN201911011834.1A 2019-10-23 2019-10-23 一种基于信息论流形的人脸图像识别方法 Active CN110781802B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911011834.1A CN110781802B (zh) 2019-10-23 2019-10-23 一种基于信息论流形的人脸图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911011834.1A CN110781802B (zh) 2019-10-23 2019-10-23 一种基于信息论流形的人脸图像识别方法

Publications (2)

Publication Number Publication Date
CN110781802A true CN110781802A (zh) 2020-02-11
CN110781802B CN110781802B (zh) 2023-04-18

Family

ID=69386500

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911011834.1A Active CN110781802B (zh) 2019-10-23 2019-10-23 一种基于信息论流形的人脸图像识别方法

Country Status (1)

Country Link
CN (1) CN110781802B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113837188A (zh) * 2020-06-24 2021-12-24 深圳君正时代集成电路有限公司 一种为人脸识别消除人脸图像背景的方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104700089A (zh) * 2015-03-24 2015-06-10 江南大学 一种基于Gabor小波和SB2DLPP的人脸识别方法
CN106934350A (zh) * 2017-02-21 2017-07-07 东南大学 一种基于Gabor张量的MLFDA人脸识别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104700089A (zh) * 2015-03-24 2015-06-10 江南大学 一种基于Gabor小波和SB2DLPP的人脸识别方法
CN106934350A (zh) * 2017-02-21 2017-07-07 东南大学 一种基于Gabor张量的MLFDA人脸识别方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113837188A (zh) * 2020-06-24 2021-12-24 深圳君正时代集成电路有限公司 一种为人脸识别消除人脸图像背景的方法

Also Published As

Publication number Publication date
CN110781802B (zh) 2023-04-18

Similar Documents

Publication Publication Date Title
CN108549873B (zh) 三维人脸识别方法和三维人脸识别系统
CN106815566B (zh) 一种基于多任务卷积神经网络的人脸检索方法
CN109389074B (zh) 一种基于人脸特征点提取的表情识别方法
Ramanathan et al. Face verification across age progression
Li et al. Expression-robust 3D face recognition via weighted sparse representation of multi-scale and multi-component local normal patterns
US20150177846A1 (en) Hand pointing estimation for human computer interaction
CN109543548A (zh) 一种人脸识别方法、装置及存储介质
Wang et al. Head pose estimation with combined 2D SIFT and 3D HOG features
Zhou et al. Fusion with diffusion for robust visual tracking
Kittler et al. 3D morphable face models and their applications
CN107301643B (zh) 基于鲁棒稀疏表示与拉普拉斯正则项的显著目标检测方法
CN113361495A (zh) 人脸图像相似度的计算方法、装置、设备及存储介质
Liu et al. An end-to-end deep model with discriminative facial features for facial expression recognition
CN111126240A (zh) 一种三通道特征融合人脸识别方法
Seo et al. Robust recognition of face with partial variations using local features and statistical learning
Yu et al. Sparse 3D directional vertices vs continuous 3D curves: efficient 3D surface matching and its application for single model face recognition
CN110188646B (zh) 基于梯度方向直方图与局部二值模式融合的人耳识别方法
Imani et al. Histogram of the node strength and histogram of the edge weight: two new features for RGB-D person re-identification
Deng et al. Attention-aware dual-stream network for multimodal face anti-spoofing
Linder et al. Real-time full-body human attribute classification in RGB-D using a tessellation boosting approach
CN110781802B (zh) 一种基于信息论流形的人脸图像识别方法
Reale et al. Facial action unit analysis through 3d point cloud neural networks
Tao et al. Illumination-insensitive image representation via synergistic weighted center-surround receptive field model and weber law
Singh et al. Wavelet based histogram of oriented gradients feature descriptors for classification of partially occluded objects
CN110532971A (zh) 图像处理及装置、训练方法以及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant