CN111008575B - 一种基于多尺度上下文信息融合的鲁棒人脸识别方法 - Google Patents

一种基于多尺度上下文信息融合的鲁棒人脸识别方法 Download PDF

Info

Publication number
CN111008575B
CN111008575B CN201911163739.3A CN201911163739A CN111008575B CN 111008575 B CN111008575 B CN 111008575B CN 201911163739 A CN201911163739 A CN 201911163739A CN 111008575 B CN111008575 B CN 111008575B
Authority
CN
China
Prior art keywords
sample
image block
scale
identified
key point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911163739.3A
Other languages
English (en)
Other versions
CN111008575A (zh
Inventor
张皖
高广谓
吴松松
邓松
汪焰南
岳东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN201911163739.3A priority Critical patent/CN111008575B/zh
Publication of CN111008575A publication Critical patent/CN111008575A/zh
Application granted granted Critical
Publication of CN111008575B publication Critical patent/CN111008575B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明提出了一种基于多尺度上下文信息融合的鲁棒人脸识别方法,包括以下步骤:获取人脸关键点上下文信息;在特定尺度下对关键点图像块集合进行分;对待识别样本进行多尺度集成分类。本发明充分考虑人脸图像不同部位的上下文语义信息差异,提出使用检测到的关键点周围图像块集合来描述人脸图像不同部位的上下文语义信息,并使用多尺度集成方法来降低待识别样本图像块的尺度大小对识别效果的影响,提高了识别精度,为后续人脸识别方法的发展提供帮助。

Description

一种基于多尺度上下文信息融合的鲁棒人脸识别方法
技术领域
本发明涉及一种图像识别方法,具体的说是一种基于多尺度上下文信息融合的鲁棒人脸识别方法,属于图形识别技术领域。
背景技术
人脸识别是计算机视觉领域中的一项热门的研究课题,它将计算机图像处理技术和统计学技术融入到一起,并以其非接触性、非侵扰性等优点广泛应用于各个领域,如:金融领域、公安系统、社保领域、机场安检人脸识别等。基于图像块的人脸识别方法更是取得了显著性能,通常是先对待识别样本分块,再把多个尺度的图像块识别分类结果集成起来得到最终待识别样本的分类结果。基于图像块的多尺度集成人脸识别方法具有一个明显的优势是它考虑了不同尺度图像块对识别效果的影响。然而这些方法只是把待识别样本直接进行分块识别,并没有考虑到人脸图像不同部位包含的上下文语义信息不同,对局部特征的描述也不同,从而对最终识别结果所作贡献的大小不同。
将现有的人脸检测和识别方法归类如下:
1.通过显性形状回归进行面部对齐[1]自动检测待识别人脸图像的关键点,有利于对面部局部特征进行描述,其对姿势,表情和遮挡变化具有鲁棒性。
[1]X.Cao,Y.Wei,F.Wen,J.Sun,“Face alignment by explicit shaperegression”Int.J.Computer.Vis.107(2)(2014),pp.177–190.
2.基于协同表示的分类方法(CRC)[2]待识别样本用所有类的训练样本进行线性表示,哪一类的训练样本对待识别样本的表示贡献最多,就把待识别样本归为哪一类。
[2]L.Zhang,M.Yang,and X.Feng,“Sparse representation or collaborativerepresentation:Which helps face recognition?”in Proc.Int.Conf.Comput.Vis.(ICCV),Nov.2011,pp.471–478.
3.基于多尺度图像块的协作表示人脸识别(MSPCRC)[3]对待识别人脸图像进行分块,对每一块图像利用CRC分类,再把待识别样本不同尺度的分类结果利用间隔分布优化方法集成起来得到最终的识别结果。
[3]P.Zhu,L.Zhang,Q.Hu,and Simon C.K.Shiu,“Multi-scale Patch basedCollaborative Representation for Face Recognition with Margin DistributionOptimization”in ECCV 2012.
4.基于图像块集合的协作表示人脸识别(ISCRC)[4]将待识别人脸图像和训练图像分别看作一个和若干个集合,把待识别人脸图像集在若干训练图像集上利用CRC分类,再根据最小重构误差得到最终分类识别结果。
[4]P.Zhu,W.Zuo,L.Zhang,S.Shiu,and D.Zhang,“Image Set basedCollaborative Representation for Face Recognition”IEEE Trans.on InformationForensics and Security,vol.9,No.7,pp.1120-1132,July 2014.
以上人脸识别方法中,一方面当训练样本数目较少时,待识别样本不能很好的被表示出来,另一方面MSPCRC是直接把待识别样本分块,没有考虑到人脸图像不同部位包含的上下文语义信息不同,对面部局部特征的描述不同,对最终识别效果所做的贡献不同。
发明内容
本发明所要解决的技术问题是,克服现有技术的不足而提供一种基于多尺度上下文信息融合的鲁棒人脸识别方法,能充分利用人脸图像的多尺度上下文语义信息,达到提高识别率的目的。
本发明提供一种基于多尺度上下文信息融合的鲁棒人脸识别方法,包括以下步骤:
S1、获取人脸关键点上下文信息;转至步骤S2;
S2、在特定尺度下对关键点图像块集合进行分类;转至步骤S3;
S3、对待识别样本进行多尺度集成分类,输出待识别样本的类标。
本发明的目的是对人脸图像进行关键点检测,把检测到的关键点部位及其周围一定窗口大小的区域分块,可以得到多个图像块集合,先对每个关键点处的图像块集合在特定尺度下进行分类,再把不同尺度的图像块分类结果进行融合得到最终待识别人脸图像的分类结果。
作为本发明的进一步技术方案,步骤S1的具体方法如下:
S101、设有一待识别样本集为Y,Y=[Y1,Y2,…,Yi…,YM],且Yi∈Y表示其中一个样本,利用文献[1]中提到的方法对待识别样本进行关键点检测;
S102、设自动检测出H个关键点,对关键点部位及其周围一定窗口大小的区域进行分块,可得到H个图像块集合Yi,且Yi=[y1,y2,…,yj…,yH],其中yj表示第i个待识别样本中的第j个关键点处的图像块集合,每个关键点处窗口内图像块的数目N可根据(1)式获得,
Figure BDA0002286860310000031
上式中,图像块的数目N由窗口大小w、图像块大小p以及步长s决定。
步骤S102中,待识别样本Yi可划分为H个p×N的图像块集合。
步骤S2的具体方法如下:
S201、对每个人脸关键点图像块集合分类;转至步骤S202;
S202、对所有关键点进行投票分类。
步骤S201的具体方法如下:
(1)给定c个类的训练样本集X=[X1,X2…Xk…Xc],可以看作是c个类训练样本的级联组合,且Xk表示第k个类的训练样本,将待识别样本的每个关键点图像块集合Yi和训练样本集X分别看作一个凸包,则第j个关键点图像块集合yj与训练样本集X之间的距离可定义为,
mina,b||yja-Xb||2s.t.∑as=1 (2)
上式中,yj表示第i个待识别样本的第j个关键点图像块集合,X表示对应位置的训练样本图像块集合,a、b为系数向量,as表示该图像块集合中第s个图像块的系数,∑as=1避免了a=b=0的无效解;
(2)为获得稳定解系数,对a和b施加lp范数约束,将(2)式变形为,
Figure BDA0002286860310000041
上式中,δ1与δ2均为很小的正常数;
则,(3)式的拉格朗日形式方程为,
Figure BDA0002286860310000042
上式中,λ1与λ2为平衡表示残差与正则化项的正常数;
(3)当使用l2范数时,(4)式具有闭合形式的解,其拉格朗日形式的方程变为,
Figure BDA0002286860310000043
上式中,λ3是拉格朗日乘子,e是元素均为1的行向量,aT与bT分别表示系数向量a与b的转置,I为单位矩阵;
那么,令
Figure BDA0002286860310000051
A=[yj-X],
Figure BDA0002286860310000052
d=[e 0]T,则(5)式变为,
L(z,λ3)=zTATAz+zTBz+λ3(dTz-1) (6)
为求解(6)式,可令,
Figure BDA0002286860310000053
Figure BDA0002286860310000054
由式(7)和(8),可得到式(5)闭合形式的解,
Figure BDA0002286860310000055
其中,z0=(ATA+B)-1d,
Figure BDA0002286860310000056
表示与Xk相关联的系数向量;当获得系数
Figure BDA0002286860310000057
Figure BDA0002286860310000058
后,根据
Figure BDA0002286860310000059
计算该关键点图像块集合yj与每个类的训练样本对应位置的图像块集合之间的相似度,并根据式(10)来判断该图像块集合分到哪一类,
Identity(yj)=argmink{rk} (10)
上式中,
Figure BDA00022868603100000510
其中yj表示第i个待识别样本的第j个关键点图像块集合,Xk表示对应位置的第k个类的训练样本图像块集合,
Figure BDA00022868603100000511
表示与Xk相关联的系数向量。
步骤S202的具体方法如下:
对于待识别样本Yi的H个人脸关键点图像块集合,根据步骤201可以得到H个关键点图像块集合的分类结果,再根据相对多数投票法,若H个关键点图像块集合中分到第k类的关键点图像块集合数目最多,则在该尺度下待识别样本就分到第k类。
步骤S3的具体方法如下:
S301、基于多尺度上下文信息融合的人脸识别输出可以看作是特殊的分类任务,对于二分类问题,设给定一个待识别样本集S={(Yi,zi)},其中i=1,2,…,M,zi={+1,-1},设该待识别样本每个关键点图像块集合中图像块的大小可以划分为s个不同尺度,则该s个不同尺度的识别结果构成空间Q∈RM×s,同时w=[w1,w2,…,wj…,ws]为不同尺度识别输出的权重向量,满足
Figure BDA0002286860310000061
S302、对于多分类问题,给定一个待识别样本Yi∈S,在s个不同尺度下的识别输出为{hij},其中i=1,2,…,M,j=1,2,…s,定义决策矩阵D={dij},其中i=1,2,…,M,j=1,2,…,s,则
Figure BDA0002286860310000062
其中,zi是待识别样本Yi的标签,当dij=+1时,则Yi被正确地分为第i类,否则Yi被错误分类;
S303、将待识别样本Yi∈S的集成间隔定义为
Figure BDA0002286860310000063
集成间隔反映了待识别样本被错误分类的程度,当集成间隔为正数时,待识别样本被正确分类,在学习尺度权重时,应尽可能使集成间隔大,间隔最大化问题通常可以转化成合页损失函数的最小化问题,故待识别样本Yi∈S的集成损失为:
Figure BDA0002286860310000064
其中,wj表示待识别样本在第j个尺度下识别输出的权重向量;
S304、对于待识别样本集S,其集成平方损失为,
Figure BDA0002286860310000071
其中,ε(Yi)表示待识别样本Yi的集成间隔,D是决策矩阵,w是尺度权重向量,e是元素为1且长度为s的单位向量;
S305、为学习到最优的尺度权重向量,应使(13)式的集成损失最小,为获得(13)式唯一且鲁棒性的解,基于AdaBoost原理,提出基于l1正则化约束的最小二乘优化法来最小化集成损失及求解权重,
Figure BDA0002286860310000072
其中,D是决策矩阵,w是尺度权重向量,τ表示正则化参数,wj表示待识别样本在第j个尺度下识别输出的权重向量;
S306、约束
Figure BDA0002286860310000073
等价于ew=1,e是元素均为1的列向量,则
Figure BDA0002286860310000074
Figure BDA0002286860310000075
可以得到,
Figure BDA0002286860310000076
S307、获得尺度权重后,对于待识别样本Yi,其类标识别输出为
zi=argmaxk={∑wj|hij=k} (17)
其中,hij表示待识别样本Yi在第j个尺度下的识别输出,k表示待识别样本Yi在第j个尺度下输出为第i类的标签总数。
对待识别样本进行多尺度集成分类,待识别样本的每个关键点图像块集合中图像块的尺度与每一类训练样本的数目对待识别样本的识别结果有很大影响,故把待识别样本不同尺度的识别结果融合起来以降低图像块集合中图像块的尺度对识别结果的影响。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:本发明提出一种用于人脸识别的基于多尺度上下文信息融合的方法,本发明的方法充分考虑人脸图像不同部位的上下文语义信息差异,提出使用检测到的关键点周围图像块集合来描述人脸图像不同部位的上下文语义信息,并使用多尺度集成方法来降低待识别样本图像块的尺度大小对识别效果的影响,提高了识别精度,为后续人脸识别方法的发展提供帮助。
附图说明
图1为本发明的流程图。
具体实施方式
下面结合附图对本发明的技术方案做进一步的详细说明:本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护权限不限于下述的实施例。
本实施例提出了一种基于多尺度上下文信息融合的鲁棒人脸识别方法,如图1所示,包括以下步骤:
S1、获取人脸关键点上下文信息
步骤S1的具体方法如下:
S101、设有一待识别样本集为Y,Y=[Y1,Y2,…,Yi…,YM],M表示该待识别样本集Y中样本的总数,且Yi∈Y表示其中一个样本,利用文献[1]中提到的方法对待识别样本进行关键点检测;
S102、设自动检测出H个关键点,对关键点部位及其周围一定窗口大小的区域进行分块,可得到H个图像块集合Yi,且Yi=[y1,y2,…,yj…,yH],H表示该待识别样本Yi中图像块集合的数目,其中yj表示第i个待识别样本中的第j个关键点处的图像块集合,每个关键点处窗口内图像块的数目N可根据(1)式获得,
Figure BDA0002286860310000091
上式中,图像块的数目N由窗口大小w、图像块大小p以及步长s决定。待识别样本Yi可划分为H个p×N的图像块集合。
S2、在特定尺度下对关键点图像块集合进行分类
步骤S2的具体方法如下:
S201、对每个人脸关键点图像块集合分类
步骤S201的具体方法如下:
(1)给定c个类的训练样本集X=[X1,X2…Xk…Xc],可以看作是c个类训练样本的级联组合,且Xk表示第k个类的训练样本。将待识别样本的每个关键点图像块集合Yi和训练样本集X分别看作一个凸包,则第j个关键点图像块集合yj与训练样本集X之间的距离可定义为,
mina,b||yja-Xb||2s.t.∑as=1 (2)
上式中,yj表示第i个待识别样本的第j个关键点图像块集合,X表示对应位置的训练样本图像块集合,a、b为系数向量,as表示该图像块集合中第s个图像块的系数,∑as=1避免了a=b=0的无效解。
(2)为获得稳定解系数,对a和b施加lp范数约束,将(2)式变形为,
Figure BDA0002286860310000092
上式中,δ1与δ2均为很小的正常数。
其拉格朗日形式方程为,
Figure BDA0002286860310000093
上式中,λ1与λ2为平衡表示残差与正则化项的正常数。
(3)当使用l2范数时,(4)式具有闭合形式的解,其拉格朗日形式的方程变为,
Figure BDA0002286860310000101
上式中,L表示拉格朗日方程,λ3是拉格朗日乘子,e是元素均为1的行向量,aT与bT分别表示系数向量a与b的转置,I为单位矩阵;
那么,令
Figure BDA0002286860310000102
A=[yj-X],
Figure BDA0002286860310000103
d=[e 0]T,则(5)式变为,
L(z,λ3)=zTATAz+zTBz+λ3(dTz-1) (6)
式中,zT表示z的转置,AT表示A的转置,dT表示d的转置;
为求解(6)式,可令,
Figure BDA0002286860310000104
Figure BDA0002286860310000105
由式(7)和(8),可得到式(5)闭合形式的解,
Figure BDA0002286860310000106
这里,z0=(ATA+B)-1d,
Figure BDA0002286860310000107
Figure BDA0002286860310000108
表示与yj相关联的系数向量,
Figure BDA0002286860310000109
表示与Xk相关联的系数向量。当获得系数
Figure BDA00022868603100001010
Figure BDA00022868603100001011
后,根据
Figure BDA00022868603100001012
计算该关键点图像块集合yj与每个类的训练样本对应位置的图像块集合之间的相似度,并根据式(10)来判断该图像块集合分到哪一类,
Identity(yj)=argmink{rk} (10)
上式中,rk表示该关键点图像块集合yj与第k类的训练样本对应位置的图像块集合之间的相似度,
Figure BDA0002286860310000111
其中yj表示第i个待识别样本的第j个关键点图像块集合,Xk表示对应位置的第k个类的训练样本图像块集合,
Figure BDA0002286860310000112
表示与Xk相关联的系数向量。
S202、对所有关键点进行投票分类
步骤S202的具体方法如下:
对于待识别样本Yi的H个人脸关键点图像块集合,根据步骤201可以得到H个关键点图像块集合的分类结果,再根据相对多数投票法,若H个关键点图像块集合中分到第k类的关键点图像块集合数目最多,则在该尺度下待识别样本就分到第k类。
S3、对待识别样本进行多尺度集成分类,输出待识别样本的类标
待识别样本的每个关键点图像块集合中图像块的尺度与每一类训练样本的数目对待识别样本的识别结果有很大影响,故把待识别样本不同尺度的识别结果集成起来以降低图像块集合中图像块的尺度对识别结果的影响。
步骤S3的具体方法如下:
S301、基于多尺度上下文信息融合的人脸识别输出可以看作是特殊的分类任务,对于二分类问题,设给定一个待识别样本集S={(Yi,zi)},其中i=1,2,…,M,zi={+1,-1},zi表示分类标签,设该待识别样本每个关键点图像块集合中图像块的大小可以划分s个不同尺度,则该s个不同尺度的识别结果构成空间Q∈RM×s,RM×s表示空间Q的维度,同时w=[w1,w2,…,wj…,ws]为不同尺度识别输出的权重向量,满足
Figure BDA0002286860310000113
wj表示第j个尺度下识别输出的权重向量,s表示权重向量的个数。
S302、对于多分类问题,给定一个待识别样本Yi∈S,在s个不同尺度下的识别输出为{hij},其中i=1,2,…,M,j=1,2,…s,hij表示待识别样本Yi在第j个尺度下的识别输出,定义决策矩阵D={dij},dij表示决策矩阵D内的元素,其中i=1,2,…,M,j=1,2,…,s,则
Figure BDA0002286860310000121
其中,zi是待识别样本Yi的标签,当dij=+1时,则Yi被正确地分为第i类,否则Yi被错误分类。
S303、将待识别样本Yi∈S的集成间隔定义为
Figure BDA0002286860310000122
集成间隔反映了待识别样本被错误分类的程度,当集成间隔为正数时,待识别样本被正确分类,在学习尺度权重时,应尽可能使集成间隔大,间隔最大化问题通常可以转化成合页损失函数的最小化问题。故待识别样本Yi∈S的集成损失为:
Figure BDA0002286860310000123
其中,wj表示待识别样本在第j个尺度下识别输出的权重向量。
S304、对于待识别样本集S,其集成平方损失为,
Figure BDA0002286860310000124
其中,ε(Yi)表示待识别样本Yi的集成间隔,D是决策矩阵,w是尺度权重向量,e是元素为1且长度为s的单位向量。
S305、为学习到最优的尺度权重向量,应使(13)式的集成损失最小,为获得(13)式唯一且鲁棒性的解,基于AdaBoost原理,提出基于l1正则化约束的最小二乘优化法来最小化集成损失及求解权重:
Figure BDA0002286860310000131
其中,D是决策矩阵,w是尺度权重向量,τ表示正则化参数,wj表示待识别样本在第j个尺度下识别输出的权重向量,
Figure BDA0002286860310000132
表示尺度权重向量最小值。
S306、约束
Figure BDA0002286860310000133
等价于ew=1,e是元素均为1的列向量,则
Figure BDA0002286860310000134
Figure BDA0002286860310000135
可以得到,
Figure BDA0002286860310000136
S307、获得尺度权重后,对于待识别样本Yi,其类标识别输出为
zi=argmaxk={∑wj|hij=k} (17)
其中,hij表示待识别样本Yi在第j个尺度下的识别输出,k表示待识别样本Yi在第j个尺度下输出为第i类的标签总数。
以上所述,仅为本发明中的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可理解想到的变换或替换,都应涵盖在本发明的包含范围之内,因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (5)

1.一种基于多尺度上下文信息融合的鲁棒人脸识别方法,其特征在于,包括以下步骤:
S1、获取人脸关键点上下文信息;转至步骤S2;
S2、在特定尺度下对关键点图像块集合进行分类;具体方法如下:
S201、对每个人脸关键点图像块集合分类;转至步骤S202;
S202、对所有关键点进行投票分类;具体方法如下:
(1)给定c个类的训练样本集X=[X1,X2…Xk…Xc],且
Figure FDA0003690339020000011
表示第k个类的训练样本,将待识别样本的每个关键点图像块集合和训练样本集X分别看作一个凸包,则第j个关键点图像块集合yj与训练样本集X之间的距离可定义为,
mina,b||yja-Xb||2 s.t.∑as=1 (2)
上式中,yj表示第i个待识别样本的第j个关键点图像块集合,X表示对应位置的训练样本图像块集合,a、b为系数向量,as表示该图像块集合中第s个图像块的系数,∑as=1避免了a=b=0的无效解;
(2)为获得稳定解系数,对a和b施加lp范数约束,将(2)式变形为,
Figure FDA0003690339020000012
上式中,δ1与δ2均为很小的正常数;
则,(3)式的拉格朗日形式方程为,
Figure FDA0003690339020000013
上式中,λ1与λ2为平衡表示残差与正则化项的正常数;
(3)当使用l2范数时,(4)式具有闭合形式的解,其拉格朗日形式的方程变为,
Figure FDA0003690339020000021
上式中,λ3是拉格朗日乘子,e是元素均为1的行向量,aT与bT分别表示系数向量a与b的转置,I为单位矩阵;
那么,令
Figure FDA0003690339020000022
A=[yj-X],
Figure FDA0003690339020000023
d=[e 0]T,则(5)式变为,
L(z,λ3)=zTATAz+zTBz+λ3(dTz-1) (6)
为求解(6)式,可令,
Figure FDA0003690339020000024
Figure FDA0003690339020000025
由式(7)和(8),可得到式(5)闭合形式的解,
Figure FDA0003690339020000026
其中,z0=(ATA+B)-1d,
Figure FDA0003690339020000027
Figure FDA0003690339020000028
表示与Xk相关联的系数向量;当获得系数
Figure FDA0003690339020000029
Figure FDA00036903390200000210
后,根据
Figure FDA00036903390200000211
计算该关键点图像块集合yj与每个类的训练样本对应位置的图像块集合之间的相似度,并根据式(10)来判断该图像块集合分到哪一类,
Identity(yj)=arg mink{rk} (10)
上式中,
Figure FDA0003690339020000031
其中yj表示第i个待识别样本的第j个关键点图像块集合,Xk表示对应位置的第k个类的训练样本图像块集合,
Figure FDA0003690339020000032
表示与Xk相关联的系数向量;
转至步骤S3;
S3、对待识别样本进行多尺度集成分类。
2.根据权利要求1所述一种基于多尺度上下文信息融合的鲁棒人脸识别方法,其特征在于,步骤S1的具体方法如下:
S101、设有一待识别样本集为Y,Y=[Y1,Y2,…,Yi…,YM],M表示该待识别样本集Y中样本的总数,且Yi∈Y表示其中一个样本,对待识别样本进行关键点检测;
S102、设自动检测出H个关键点,对关键点部位及其周围一定窗口大小的区域进行分块,可得到H个图像块集合Y′,且Y′=[y1,y2,…,yj…,yH],其中yj表示第i个待识别样本中的第j个关键点处的图像块集合,每个关键点处窗口内图像块的数目N可根据(1)式获得,
Figure FDA0003690339020000033
上式中,图像块的数目N由窗口大小w、图像块大小p以及步长s决定。
3.根据权利要求2所述一种基于多尺度上下文信息融合的鲁棒人脸识别方法,其特征在于,步骤S102中,待识别样本Yi可划分为H个p×N的图像块集合。
4.根据权利要求1所述一种基于多尺度上下文信息融合的鲁棒人脸识别方法,其特征在于,步骤S202的具体方法如下:
对于待识别样本Yi的H个人脸关键点图像块集合,根据步骤201可以得到H个关键点图像块集合的分类结果,再根据相对多数投票法,若H个关键点图像块集合中分到第k类的关键点图像块集合数目最多,则在该尺度下待识别样本就分到第k类。
5.根据权利要求4所述一种基于多尺度上下文信息融合的鲁棒人脸识别方法,其特征在于,步骤S3的具体方法如下:
S301、设给定一个待识别样本集S={(Yi,zi)},其中i=1,2,…,M,zi={+1,-1},设该待识别样本每个关键点图像块集合中图像块的大小可以划分为s个不同尺度,则该s个不同尺度的识别结果构成空间Q∈RM×s,同时w=[w1,w2,…,wj…,ws]为不同尺度识别输出的权重向量,满足
Figure FDA0003690339020000041
S302、对于多分类问题,给定一个待识别样本Yi∈S,在s个不同尺度下的识别输出为{hij},其中i=1,2,…,M,j=1,2,…s,定义决策矩阵D={dij},其中i=1,2,…,M,j=1,2,…,s,则
Figure FDA0003690339020000042
其中,zi是待识别样本Yi的标签,当dij=+1时,则Yi被正确地分为第i类,否则Yi被错误分类;
S303、将待识别样本Yi∈S的集成间隔定义为
Figure FDA0003690339020000043
集成间隔反映了待识别样本被错误分类的程度,当集成间隔为正数时,待识别样本被正确分类,在学习尺度权重时,应尽可能使集成间隔大,间隔最大化问题通常可以转化成合页损失函数的最小化问题,故待识别样本Yi∈S的集成损失为:
Figure FDA0003690339020000044
其中,wj表示待识别样本在第j个尺度下识别输出的权重向量;
S304、对于待识别样本集S,其集成平方损失为,
Figure FDA0003690339020000051
其中,ε(Yi)表示待识别样本Yi的集成间隔,D是决策矩阵,w是尺度权重向量,e是元素为1且长度为s的单位向量;
S305、为学习到最优的尺度权重向量,应使(13)式的集成损失最小,为获得(13)式唯一且鲁棒性的解,基于AdaBoost原理,提出基于l1正则化约束的最小二乘优化法来最小化集成损失及求解权重,
Figure FDA0003690339020000052
其中,D是决策矩阵,w是尺度权重向量,τ表示正则化参数,wj表示待识别样本在第j个尺度下识别输出的权重向量;
S306、约束
Figure FDA0003690339020000053
等价于ew=1,e是元素均为1的列向量,则
Figure FDA0003690339020000054
Figure FDA0003690339020000055
可以得到,
Figure FDA0003690339020000056
S307、获得尺度权重后,对于待识别样本Yi,其类标识别输出为
zi=arg maxk={∑wj|hij=k} (17)
其中,hij表示待识别样本Yi在第j个尺度下的识别输出,k表示待识别样本Yi在第j个尺度下输出为第i类的标签总数。
CN201911163739.3A 2019-11-25 2019-11-25 一种基于多尺度上下文信息融合的鲁棒人脸识别方法 Active CN111008575B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911163739.3A CN111008575B (zh) 2019-11-25 2019-11-25 一种基于多尺度上下文信息融合的鲁棒人脸识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911163739.3A CN111008575B (zh) 2019-11-25 2019-11-25 一种基于多尺度上下文信息融合的鲁棒人脸识别方法

Publications (2)

Publication Number Publication Date
CN111008575A CN111008575A (zh) 2020-04-14
CN111008575B true CN111008575B (zh) 2022-08-23

Family

ID=70113088

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911163739.3A Active CN111008575B (zh) 2019-11-25 2019-11-25 一种基于多尺度上下文信息融合的鲁棒人脸识别方法

Country Status (1)

Country Link
CN (1) CN111008575B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111639672B (zh) * 2020-04-23 2023-12-19 中国科学院空天信息创新研究院 一种基于多数投票的深度学习城市功能区分类方法
CN114693562B (zh) * 2022-04-15 2022-11-25 黄淮学院 一种基于人工智能的图像增强方法
CN114743247A (zh) * 2022-04-26 2022-07-12 支付宝(杭州)信息技术有限公司 一种面部识别模型的训练方法、装置以及设备
CN115761411B (zh) * 2022-11-24 2023-09-01 北京的卢铭视科技有限公司 模型训练方法、活体检测方法、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107506694A (zh) * 2017-07-27 2017-12-22 南京邮电大学 基于局部中值表示的鲁棒人脸识别方法
CN108664911A (zh) * 2018-05-04 2018-10-16 武汉科技大学 一种基于图像稀疏表示的鲁棒人脸识别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107506694A (zh) * 2017-07-27 2017-12-22 南京邮电大学 基于局部中值表示的鲁棒人脸识别方法
CN108664911A (zh) * 2018-05-04 2018-10-16 武汉科技大学 一种基于图像稀疏表示的鲁棒人脸识别方法

Also Published As

Publication number Publication date
CN111008575A (zh) 2020-04-14

Similar Documents

Publication Publication Date Title
CN111008575B (zh) 一种基于多尺度上下文信息融合的鲁棒人脸识别方法
US8842883B2 (en) Global classifier with local adaption for objection detection
Chen et al. Text detection and recognition in images and video frames
Tian et al. Do singular values contain adequate information for face recognition?
Huang et al. Face detection from cluttered images using a polynomial neural network
CN100423020C (zh) 一种基于结构主元分析的人脸识别方法
CN113657425B (zh) 基于多尺度与跨模态注意力机制的多标签图像分类方法
Gao et al. High accuracy handwritten Chinese character recognition using LDA-based compound distances
CN105138998B (zh) 基于视角自适应子空间学习算法的行人重识别方法及系统
US20050265607A1 (en) Multimodal high-dimensional data fusion for classification and identification
CN111340103B (zh) 一种基于图嵌入典型相关分析的特征层融合方法及其装置
Shrivastava et al. Learning discriminative dictionaries with partially labeled data
CN107220627B (zh) 基于协作模糊均值鉴别分析的多姿态人脸识别方法
CN112149538A (zh) 一种基于多任务学习的行人重识别方法
Lu et al. Feature fusion with covariance matrix regularization in face recognition
CN105023006A (zh) 基于增强型非参数最大边缘准则的人脸识别方法
CN108985161B (zh) 一种基于拉普拉斯正则化的低秩稀疏表征图像特征学习方法
CN112115881A (zh) 基于鲁棒鉴别特征学习的图像特征提取方法
Zuobin et al. Feature regrouping for cca-based feature fusion and extraction through normalized cut
CN111325275B (zh) 基于低秩二维局部鉴别图嵌入的鲁棒图像分类方法及装置
Huang et al. Locality-regularized linear regression discriminant analysis for feature extraction
CN114764869A (zh) 利用每个对象的单个检测的多对象检测
CN103942572A (zh) 一种基于双向压缩数据空间维度缩减的面部表情特征提取方法和装置
Sahbi et al. From coarse to fine skin and face detection
CN110287973B (zh) 一种基于低秩鲁棒线性鉴别分析的图像特征提取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant