CN103605972B - 一种基于分块深度神经网络的非限制环境人脸验证方法 - Google Patents

一种基于分块深度神经网络的非限制环境人脸验证方法 Download PDF

Info

Publication number
CN103605972B
CN103605972B CN201310664180.9A CN201310664180A CN103605972B CN 103605972 B CN103605972 B CN 103605972B CN 201310664180 A CN201310664180 A CN 201310664180A CN 103605972 B CN103605972 B CN 103605972B
Authority
CN
China
Prior art keywords
neural network
subimage
deep neural
feature
rbm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310664180.9A
Other languages
English (en)
Other versions
CN103605972A (zh
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KANJON SCIENCE & TECHNOLOGY(BEIJING)CO Ltd
Original Assignee
KANJON SCIENCE & TECHNOLOGY(BEIJING)CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KANJON SCIENCE & TECHNOLOGY(BEIJING)CO Ltd filed Critical KANJON SCIENCE & TECHNOLOGY(BEIJING)CO Ltd
Priority to CN201310664180.9A priority Critical patent/CN103605972B/zh
Publication of CN103605972A publication Critical patent/CN103605972A/zh
Application granted granted Critical
Publication of CN103605972B publication Critical patent/CN103605972B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明提供一种基于分块深度神经网络的非限制环境人脸验证方法,其包括步骤:1)检测输入人脸图像的人脸区域,并将所述人脸区域进行归一化处理;2)将所述归一化处理后的人脸区域划分为若干个不重叠的矩形子图像,提取每一个子图像的特征、并进行降维和归一化处理;3)根据所提取的子图像特征,对每个子图像构建一个深度神经网络,子图像特征输入网络后转变为新特征;4)根据成对的人脸图像数据和所述的深度神经网络群,通过约束变换后新特征的异类分离性和同类紧致性优化深度神经网络结构参数;5)将成对的人脸图像输入所述优化的深度神经网络群,计算新特征的距离,验证人脸对。

Description

一种基于分块深度神经网络的非限制环境人脸验证方法
技术领域
本发明属于人脸识别技术领域,具体涉及一种基于分块深度神经网络的非限制环境人脸验证方法。
背景技术
人脸验证的目标是验证被某个人声明的身份。通常提供一对人脸图片,需要判断这一对图片是来自同一个人还是不同人。非限制环境中的人脸图片通常包含复杂的背景变化,包括光照,遮挡,及自身的姿态,表情等变化。这些影响因素带来的差异可能比因身份变化而导致的图片差异还大。因此,在非限制环境中,姿态相同或光照条件相同的不同人图片对常常会被验证成来自同一个人;而同一人的图片对却由于环境差异很大而被验证成来自不同人。这一现象导致高精度的非限制环境人脸验证非常困难。
目前,大多数人脸识别方法主要依赖于人为设计的描述,如尺度不变特征转换(SIFT),局部二值模式(LBP)及它的变形分层局部二值模式(HLBP)。这些特征一般只能提供低级的有限的信息,导致系统不能达到很好的性能。最近,为图像描述开发监督或者非监督的特征学习方法在人脸识别领域受到很大的关注。CN101059838A公开了一种人脸识别系统与识别方法,与现有监控网络很好的兼容;CN103049736A公开了一种基于最大稳定极值区域的人脸识别方法,通过提取表征关键特征的属性,并对关键特征进行分类,从而达到人脸识别的目的。此外,有人用修改的二项式单元来构造深度神经网络,并将它用于目标识别和人脸验证;也有人提出利用深度卷积神经网络学习完备分层的图像表述。深度神经网络获得研究者的广泛关注的主要是因为它强大的学习能力。经过训练,它能深度挖掘原始输入中的有用信息。但是,当输入的特征维数较高时,网络的训练比较困难,时间复杂度也高。为了解决这一问题,有的学者通过下采样的方法来降低原始图像的大小。这种做法通常会损失很多的区分信息,对接下来的区分性学习产生不利影响。
发明内容
本发明的目的是要解决复杂环境中低级特征表述能力差及深度神经网络对高维输入训练难的问题,为此,本发明提供一种基于分块深度神经网络的非限制环境人脸验证方法。
为了实现所述目的,本发明基于深度神经网络的非限制环境人脸验证方法的技术解决方案如下:
1)检测输入人脸图像的人脸区域,并将所述人脸区域进行归一化处理;2)将所述归一化处理后的人脸区域划分为若干个不重叠的矩形子图像,提取每一个子图像的特征、并进行降维和归一化处理;3)根据所提取的子图像特征,对每个子图像构建一个深度神经网络,子图像特征输入网络后转变为新特征;4)根据成对的人脸图像数据和所述的深度神经网络群,通过约束变换后新特征的异类分离性和同类紧致性优化深度神经网络结构参数;5)将成对的人脸图像输入所述优化的深度神经网络群,计算新特征的距离,验证人脸对。其具体步骤为:
A)首先,检测原始输入图片中人脸的位置,提取人脸区域图像,将人脸区域归一化为大小为H×W的矩形图像区域,H表示矩形图像区域的高度,W表示矩形图像区域的宽度;
B)将归一化的人脸区域等分成若干大小为h×w的无重叠子图像,h表示子图像的高度,w表示子图像的宽度,在每个子图像上提取特征,并用主成分分析方法对特征降维,然后将特征归一化使其均值为0方差为1;
C)将提取的子图像特征作为严格玻尔兹曼机RBM的输入,通过最大化训练集数据在RBM上的log似然函数来优化其结构参数,原子图像特征输入优化的RBM后得到的输出作为新的RBM的输入,以相同的方式优化新RBM参数,以这种方式,在子图像上有序地训练一系列的RBM;将这些RBM按照训练的顺序分层叠加形成深度神经网络,网络的初始结构参数为优化的RBM的结构参数,这样,对每个子图像预训练一个深度神经网络,同时原始的子图像特征经过深度神经网络变换后,得到新的特征表述;
D)训练集由成对的图像对组成,包括同一人在不同环境下的人脸图像对和不同人的人脸图像对;所有原始图片输入预训练构造的深度神经网络群后得到新的特征表述;通过约束变换后同一人的图片对距离小而不同人的图片对距离大,构造使得训练集中所有图像对的log似然函数最小化的优化能量函数;利用梯度下降法求解,得到最优的深度神经网络结构参数;
E)对于成对的测试图片,将原始特征输入深度神经网络得到变换后的特征,计算新特征的距离,和分类阈值比较,如果距离大于分类阈值,则测试图片对为不同的人脸图像,如果距离小于分类阈值,则测试图片对为同一人的人脸图像。
进一步,所述步骤B)中,对训练集上的所有图片提取特征后,进行主成分分析获得降维矩阵;原始特征经降维矩阵后获得低维特征,对降维后的特征求均值和方差,并将其转化为均值为0、方差为1的特征分布。
进一步,所述步骤C)步中,严格玻尔兹曼机RBM是一种无向的图模型,包括一个可见层和一个隐含层,模型的参数包括可见层和隐含层间的权重连接矩阵W、可见层的偏差c和隐含层的偏差b,RBM的能量函数定义为:
其中,vi,ci是第i个可见层单元的输入值和偏差;hj,bj是第j个隐含层单元的输出值和偏差;wi,j是第i个可见层单元与第j个隐含层单元间的连接权重;σi是第i个可见层单元中高斯噪声的标准方差,v表示可见层单元,h表示隐含层单元;vis表示可见层,hid表示隐含层,基于能量函数的联合概率分布定义为:
其中,Z=∑v,hexp(-E(v,h))是归一化因子,同时,条件概率分布计算为:
其中,为sigmoid函数;表示变量vi属于均值为方差为的高斯分布函数。
进一步,所述步骤C)中,训练集数据在RBM上的log似然函数定义为:
其中,x(i)为训练集D中的数据,N为训练集数据个数;θ为RBM的结构参数,p表示数据的分布概率,因此,RBM结构参数的训练步骤如下:
a)利用剃度下降方法求解训练集log似然函数对参数的梯度:
其中,表示梯度在训练集数据上的期望;表示梯度在模型定义的分布上的期望。
b)参数θ的更新方式为:
其中,α表示学习速率,t表示第t次迭代更新,m是加速学习的动量因子。
进一步,所述步骤C)中,对每个子图像训练一系列RBM后,由这些RBM叠加构造的深度神经网络的结构参数表示为:W={W(1),W(2),...,W(M)},其中W(l)表示第l个RBM的结构参数矩阵,省略号“...”表示第2个至第N个RBM的结构参数;那么,子图像x输入深度神经网络后,每一层的计算表示为:
zi (1)(x)=x*Wi (1),
zi (l)(x)=a(l-1)(x)*Wi (1),
zi (M)(x)=a(M-1)(x)*Wi (M),
其中,f(l)(x)=σ(x)是第l层的激励函数;分别表示第l层第i个单元的输入加权和及对应的激励相应,第一个省略号“...”表示第1层至第l层之间每一层的计算公式可用类似的形式表示;第二个省略号“...”表示第l层至第M层之间每一层的计算公式可用类似的形式表示。这样,原始子图像特征x经过深度神经网络变换后,新的特征表示为
进一步,,所述步骤D)中,原始人脸图片x={x1,x2,...,xN}包含N个子图像,其中xc表示第c个子图像,省略号“...”表示第2个至第N个子图像;对所有的子图像训练得到的深度神经网络群表示为
w={W1,W2,...,WN},其中Wc为第c个子图像对应的深度神经网络结构参数,省略号“...”表示第2个子图像至第N个子图像对应的深度神经网络结构参数;将原始图片输入深度神经网络群,计算得到新的特征表述为:其中aM(xc)表示第c个子图像对应的新特征,省略号“...”表示第2个子图像至第N个子图像对应的新特征。
进一步,所述步骤D)中,S={x,y}表示相同人的图像对集,D={x,y}表示不同人的图像对集;图像间的距离用欧氏距离表示:d(x,y)=(x-y)T(x-y),其中T表示矩阵的转置;图像对{x,y}属于S的概率表示为:
ρS(x,y|fθ,b)=σ(b-d(fθ(x),fθ(y)));
图像对{x,y}属于D的概率表示为:
ρD(x,y|fθ,b)=1-σ(b-d(fθ(x),fθ(y))),
其中,b是构造概率模型的偏差项,函数fθ定义了一个映射空间fθ:x→fθ(x);那么,训练集中所有样本对的log似然计算为:
最小化似然函数Lg(f,b)约束同一人的图片对距离小而不同人的图片对距离大,因此Lg(f,b)也作为优化映射空间参数的能量函数。
进一步,所述步骤D)中,用深度神经网络作为映射函数,那么训练集上的能量函数即作为优化深度神经网络结构参数的学习准则;基于深度神经网络的优化目标表示为:
其中,w={W1,W2,...,WN}为原始图像中N个子图像对应的深度神经网络机构参数,省略号“...”表示第2个子图像至第N个子图像对应的深度神经网络结构参数。
进一步,所述步骤E)中,将一对测试图片{x,y}输入深度神经网络,变换后的特征计算为{fw(x),fw(y)};图片对属于相同人图像对集S的概率计算为:
ρS(fw(x),fw(y))=σ(b-d(fw(x),fw(y)))。
如果概率值ρS(fw(x),fw(y))>0.5,则图像对{x,y}属于相同人;如果ρS(fw(x),fw(y))<0.5,则图像对{x,y}属于不同人。
本发明的有益效果:本发明采用深度神经网络学习原始低级特征中的区分性信息,提高特征描述能力。采用将原始图片分块,对子图像分别构造深度神经网络来解决高维输入的问题。
附图说明
当结合附图阅读下文对示范性实施方式的详细描述时,这些以及其他目的、特征和优点将变得显而易见,在附图中:
图1是本发明的基于分块深度神经网络的非限制环境人脸验证方法的流程图;
图2是本发明的构建分块深度神经网络群的示意图;
图3是成对人脸图像训练集的示意图;
图4是本发明的基于分块深度神经网络的人脸验证方法和整体深度神经网络方法,及线性特征学习方法的识别效果比较图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
图1为本发明所述方法的实施例流程图,参照图1,本发明提出的一种基于分块深度神经网络的非限制环境人脸验证方法具体包括以下步骤:
步骤1,检测输入人脸图像的人脸区域,并将所述人脸区域进行归一化处理;
首先,检测原始输入图片中人脸的位置,提取人脸区域图像。这一步骤可采用基于Adaboost方法(Robust real-time face detection,Viola,Paul and Jones,Michael J,International journal of computer vision 2004)得到的人脸检测器来实现。通过对输入人脸图像的检测,得到一个包含人脸区域的图像区域。这样的图像区域中的脸部区域的大小通常不一样,无法直接用于识别。因此需要对人脸区域进行归一化处理,这里我们将人脸区域归一化为大小为H×W的矩形图像区域,H表示矩形图像区域的高度,W表示矩形图像区域的宽度。
步骤2,将所述归一化处理后的人脸区域划分为若干个不重叠的矩形子图像,提取每一个子图像的特征、并进行降维和归一化处理;
由于从原始图像中检测到的人脸区域一般比较大,直接将其作为深度神经网络的输入,会使网络难以训练。因此,首先将所述归一化的人脸区域等分成若干大小为h×w的无重叠子图像,h表示子图像的高度,w表示子图像的宽度,接下来对每个子图像学习一个深度神经网络。
子图像上提取的特征类型可以是纹理特征(LBP、HLBP)、变换特征(SIFT)等直方图统计特征或上述特征的组合。基于原始图像提取的特征维数一般比较高,而且含有很多的冗余信息和干扰信息,因此可以采用主成分分析方法获得降维矩阵,原始特征通过降维矩阵后获得低维特征。降维后的特征需要进行归一化处理。对训练集上的所有图片特征求均值和方差,并将其转化为均值为0,方差为1的特征分布。
步骤3,根据所提取的子图像特征,对每个子图像构建一个深度神经网络,子图像特征输入网络后转变为新特征;
深度神经网络由多个经过预训练的严格玻尔兹曼机(RBM),按照训练的顺序分层叠加构成。严格玻尔兹曼机(RBM)是一种无向的图模型,包括一个可见层和一个隐含层。模型的参数主要包括可见层和隐含层间的权重连接矩阵W,可见层的偏差c和隐含层的偏差b。RBM的能量函数定义为:
其中,vi,ci是第i个可见层单元的输入值和偏差;hj,bj是第j个隐含层单元的输出值和偏差;wi,j是第i个可见层单元与第j个隐含层单元间的连接权重,v表示可见层单元,h表示隐含层单元;σi是第i个可见层单元中高斯噪声的标准方差,vis表示可见层,hid表示隐含层。基于能量函数的的联合概率分布可定义为:
其中,Z=∑v,hexp(-E(v,h))是归一化因子。同时,条件概率分布可以计算为:
其中,为sigmoid函数;表示变量vi属于均值为方差为的高斯分布函数。
首先,对每个子图像构建一个深度神经网络,步骤如下:
1)将提取的子图像特征作为严格玻尔兹曼机(RBM)的输入,训练集数据在RBM上的log似然函数定义为:
其中,x(i)为训练集D中的数据,N为训练集数据个数;θ为RBM的结构参数,p表示数据分布概率。RBM结构参数的训练步骤如下:
a)利用剃度下降方法求解训练集log似然函数对参数的梯度:
其中,表示梯度在训练集数据上的期望;表示梯度在模型定义的分布上的期望。
b)参数θ的更新方式为:
其中,α表示学习速率,m是加速学习的动量因子,t表示第t次迭代更新。迭代更新,直到似然函数值变化很小,学习结束。
2)原子图像特征输入优化的RBM后得到输出,并将输出作为下一层RBM的输入,以相同的方式优化新RBM的参数。以这种方式,可以在子图像上有序地训练一系列的RBM。
将这些RBM按照训练的顺序分层叠加形成深度神经网络,网络初始结构参数为优化的RBM结构参数。
接下来,原始的子图像特征经过深度神经网络变换后,得到新的特征表述。对每个子图像训练一系列RBM后,由这些RBM叠加构造的深度神经网络的结构参数表示为:W={W(1),W(2),...,W(M)},其中W(l)表示第l个RBM的结构参数矩阵,省略号“...”表示第2个至第N个RBM的结构参数。那么,子图像x输入深度神经网络后,每一层的计算可表为:
zi (1)(x)=x*Wi (1),
zi (l)(x)=a(l-1)(x)*Wi (l),
zi (M)(x)=a(M-1)(x)*Wi (M),
其中,f(l)(x)=σ(x)是第l层的激励函数;分别表示第l层第i个单元的输入加权和及对应的激励相应;第一个省略号“...”表示第1层至第l层之间每一层的计算公式可用类似的形式表示;第二个省略号“...”表示第l层至第M层之间每一层的计算公式可用类似的形式表示。这样,原始子图像特征x经过深度神经网络变换后,新的特征表示为aM(x)。
步骤4,根据成对的人脸图像数据和所述的深度神经网络群,通过约束变换后新特征的异类分离性和同类紧致性优化深度神经网络结构参数;
6、原始图片分块后,输入深度神经网络群得到新的特征表述,示意图如图2所示。假设,原始人脸图片x={x1,x2,...,xN}包含N个子图像,其中xc表示第c个子图像,省略号“...”表示第2个至第N个子图像;对所有的子图像对应的深度神经网络群表示为w={W1,W2,...,WN},其中Wc为第c个子图像对应的深度神经网络结构参数,省略号“...”表示第2个子图像至第N个子图像对应的深度神经网络结构参数。原始图片输入深度神经网络,得到新的特征表述为aM(x)=[aM(x1),aM(x2),...,aM(xN)],其中aM(xc)表示第c个子图像对应的新特征,省略号“...”表示第2个子图像至第N个子图像对应的新特征。
训练集由成对的图像组成,包括同一人在不同环境下的人脸图像对和不同人的人脸图像对。图3是训练集中的一些例子,上面一行为相同的人脸对,下面一行为不同的人脸对。假设,S={x,y}表示相同人的图像对集,D={x,y}表示不同人的图像对集。图像间的距离用欧氏距离表示:
d(x,y)=(x-y)T(x-y),其中T表示矩阵的转置。那么,图像对{x,y}属于S的概率表示为:
ρS(x,y|fθ,b)=σ(b-d(fθ(x),fθ(y)));
图像对{x,y}属于D的概率表示为:
ρD(x,y|fθ,b)=1-σ(b-d(fθ(x),fθ(y))),
其中,b是构造概率模型的偏差项,函数fθ定义了一个映射空间fθ:x→fθ(x)。那么,训练集中所有样本对的log似然可以计算为:
最小化似然函数Lg(f,b)约束同一人的图片对距离小而不同人的图片对距离大,因此Lg(f,b)也作为优化映射空间参数的能量函数。
用深度神经网络作为映射函数,那么训练集上的能量函数即作为优化深度神经网络结构参数的学习准则。基于深度神经网络的优化目标可以表示为:
,其中,w={W1,W2,...,WN}为原始图像中N个子图像对应的深度神经网络机构参数,省略号“...”表示第2个子图像至第N个子图像对应的深度神经网络结构参数;fw(x)=aM(x)为原始图片x输入深度神经网络,得到的新特征表述。
利用梯度下降法求解上述优化目标函数,得到最优的深度神经网络结构参数。
步骤5,将成对的人脸图像输入所述优化的深度神经网络群,计算新特征的距离,验证人脸对。
将一对测试图像{x,y}输入深度神经网络,变换后的特征计算为{fw(x),fw(y)}。图像对属于相同人图像对集S的概率计算为:
ρS(fw(x),fw(y))=σ(b-d(fw(x),fw(y)))。
如果概率值ρS(fw(x),fw(y))>0.5,则图像对{x,y}属于相同人;如果ρS(fw(x),fw(y))<0.5,则图像对{x,y}属于不同人。
相对于目前流行的人脸识别方法,本发明所提出的基于深度神经网络的非限制环境人脸验证方法能够较好的适应复杂的环境。图4为本发明的基于分块深度神经网络的人脸验证方法和整体深度神经网络方法,及线性特征学习方法在LFW人脸数据库上的性能比较结果图。在图4中,每一组中,例如1000表示的组中,中间柱形表示本发明的基于深度神经网络的非限制环境人脸验证方法,左侧柱形表示整体深度神经网络方法,右侧柱形表示线性特征学习方法,2000及3000组中左侧、中间、右侧柱形表示同1000所在的组。实验中采用3层深度神经网络结构,选用纹理特征(LBP、HLBP)及变换特征(SIFT)三种直方图统计特征的组合。如图4所示,可以看到本发明提出的方法相较整体深度神经网络方法和线性特征学习方法性能有较大的提高。
已经出于示出和描述的目的给出了本发明的说明书,但是其并不意在是穷举的或者限制于所公开形式的发明。本领域技术人员可以想到很多修改和变体。本领域技术人员应当理解,本发明实施方式中的方法和装置可以以软件、硬件、固件或其组合实现。
因此,实施方式是为了更好地说明本发明的原理、实际应用以及使本领域技术人员中的其他人员能够理解以下内容而选择和描述的,即,在不脱离本发明精神的前提下,做出的所有修改和替换都将落入所附权利要求定义的本发明保护范围内。

Claims (9)

1.一种基于分块深度神经网络的非限制环境人脸验证方法,其特征在于,包括步骤:1)检测输入人脸图像的人脸区域,并将所述人脸区域进行归一化处理;2)将所述归一化处理后的人脸区域划分为若干个不重叠的矩形子图像,提取每一个子图像的特征、并进行降维和归一化处理;3)根据所提取的子图像特征,对每个子图像构建一个深度神经网络,所有的深度神经网络形成深度神经网络群,子图像特征输入深度神经网络后转变为新特征;4)根据成对的人脸图像数据和所述的深度神经网络群,通过约束变换后新特征的异类分离性和同类紧致性优化深度神经网络结构参数;5)将成对的人脸图像输入优化的深度神经网络群,计算新特征的距离验证人脸对;其具体步骤为:
A)首先,检测原始输入图片中人脸的位置,提取人脸区域图像,将人脸区域归一化为大小为H×W的矩形图像区域,H表示矩形图像区域的高度,W表示矩形图像区域的宽度;
B)将归一化的人脸区域等分成若干大小为h×w的无重叠子图像,h表示子图像的高度,w表示子图像的宽度,在每个子图像上提取特征,并用主成分分析方法对特征降维,然后将特征归一化使其均值为0方差为1;
C)将提取的子图像特征作为严格玻尔兹曼机RBM的输入,通过最大化训练集数据在RBM上的log似然函数来优化其结构参数,原子图像特征输入优化的RBM后得到的输出作为新的RBM的输入,以相同的方式优化新RBM参数,以这种方式,在子图像上有序地训练一系列的RBM;将这些RBM按照训练的顺序分层叠加形成深度神经网络,网络的初始结构参数为优化的RBM的结构参数,这样,对每个子图像预训练一个深度神经网络,同时原始的子图像特征经过深度神经网络变换后,得到新的特征表述;
D)训练集由成对的图像对组成,包括同一人在不同环境下的人脸图像对和不同人的人脸图像对;所有原始图片输入预训练构造的深度神经网络群后得到新的特征表述;通过约束变换后同一人的图片对距离小而不同人的图片对距离大,构造使得训练集中所有图像对的log似然函数最小化的优化能量函数;利用梯度下降法求解,得到最优的深度神经网络结构参数;
E)对于成对的测试图片,将原始特征输入深度神经网络得到变换后的特征,计算新特征的距离,和分类阈值比较,如果距离大于分类阈值,则测试图片对为不同的人脸图像,如果距离小于分类阈值,则测试图片对为同一人的人脸图像。
2.根据权利要求1所述的人脸验证方法,其特征在于,所述步骤B)中,对训练集上的所有图片提取特征后,进行主成分分析获得降维矩阵;原始特征经降维矩阵后获得低维特征,对降维后的特征求均值和方差,并将其转化为均值为0、方差为1的特征分布。
3.根据权利要求1-2中任一项所述的人脸验证方法,其特征在于,所述步 骤C)步中,严格玻尔兹曼机RBM是一种无向的图模型,包括一个可见层和一个隐含层,模型的参数包括可见层和隐含层间的权重连接矩阵W、可见层的偏差c和隐含层的偏差b,RBM的能量函数定义为:
其中,vi,ci是第i个可见层单元的输入值和偏差;hj,bj是第j个隐含层单元的输出值和偏差;wi,j是第i个可见层单元与第j个隐含层单元间的连接权重;σi是第i个可见层单元中高斯噪声的标准方差,v表示可见层单元,h表示隐含层单元;vis表示可见层,hid表示隐含层,基于能量函数的联合概率分布定义为:
其中,Z=∑v,hexp(-E(v,h))是归一化因子,同时,条件概率分布计算为:
其中,为sigmoid函数;表示变量vi属于均值为方差为的高斯分布函数。
4.根据权利要求3所述的人脸验证方法,其特征在于,所述步骤C)中,RBM在训练数据集上的log似然函数定义为:
其中,x(i)为训练集D中的数据,N为训练集数据个数;θ为RBM的结构参数,p表示数据的分布概率,因此,RBM结构参数的训练步骤如下:
a)利用剃度下降方法求解训练集log似然函数对参数的梯度:
其中,E表示RBM的能量函数;表示能量函数E对参数θ的梯度; 表示梯度在训练集数据上的期望;表示梯度在模型定义的分布上的期望,
b)参数θ的更新方式为:
其中,α表示学习速率,t表示第t次迭代更新,m是加速学习的动量因子。
5.根据权利要求3所述的人脸验证方法,其特征在于,所述步骤C)中,对每个子图像训练一系列RBM后,由这些RBM叠加构造的深度神经网络的结构参数表示为:W={W(1),W(2),...,W(M)},其中W(l)表示第l个RBM的结构参数矩阵,省略号“...”表示第2个至第N个RBM的结构参数;那么,子图像x输入深度神经网络后,每一层的计算表示为:
zi (1)(x)=x*Wi (1),
...
zi (l)(x)=a(l-1)(x)*Wi (1),
...
zi (M)(x)=a(M-1)(x)*Wi (M),
其中,f(l)(x)=σ(x)是第l层的激励函数;分别表示第l层第i个单元的输入加权和及对应的激励相应;第一个省略号“...”表示第1层至第l层之间每一层的计算公式可用类似的形式表示;第二个省略号“...”表示第l层至第M层之间每一层的计算公式可用类似的形式表示,这样,原始子图像特征x经过深度神经网络变换后,新的特征表示为aM i(x)。
6.根据权利要求1所述的人脸验证方法,其特征在于,所述步骤D)中,原始人脸图片x={x1,x2,...,xN}包含N个子图像,其中xc表示第c个子图像,省略号“...”表示第2个至第N个子图像;对所有的子图像训练得到的深度神经网络群表示为w={W1,W2,...,WN},其中Wc为第c个子图像对应的深度神经网络结构参数,省略号“...”表示第2个子图像至第N个子图像对应的深度神经网络结构参数;将原始图片输入深度神经网络群,计算得到新的特征表述为:其中aM(xc)表示第c个子图像对应的新特征;省略号“...”表示第2个子图像至第N个子图像对应的新特征。
7.根据权利要求6所述的人脸验证方法,其特征在于,所述步骤D)中, S={x,y}表示相同人的图像对集,D={x,y}表示不同人的图像对集;图像间的距离用欧氏距离表示:d(x,y)=(x-y)T(x-y),其中T表示矩阵的转置;图像对{x,y}属于S的概率表示为:
ρS(x,y|fθ,b)=σ(b-d(fθ(x),fθ(y)));
图像对{x,y}属于D的概率表示为:
ρD(x,y|fθ,b)=1-σ(b-d(fθ(x),fθ(y))),
其中,b是构造概率模型的偏差项,函数fθ定义了一个映射空间
fθ:x→fθ(x);那么,训练集中所有样本对的log似然计算为:
最小化似然函数Lg(f,b)约束同一人的图片对距离小而不同人的图片对距离大,因此Lg(f,b)也作为优化映射空间参数的能量函数。
8.根据权利要求7所述的人脸验证方法,其特征在于,所述步骤D)中,用深度神经网络作为映射函数,那么训练集上的能量函数即作为优化深度神经网络结构参数的学习准则;基于深度神经网络的优化目标表示为:
其中,w={W1,W2,...,WN}为原始图像中N个子图像对应的深度神经网络结构参数,省略号“...”表示第2个子图像至第N个子图像对应的深度神经网络结构参数。
9.根据权利要求8所述的人脸验证方法,其特征在于,所述步骤E)中,将一对测试图片{x,y}输入深度神经网络,变换后的特征计算为{fw(x),fw(y)};图片对属于相同人图像对集S的概率计算为:
ρS(fw(x),fw(y))=σ(b-d(fw(x),fw(y))),
如果概率值ρS(fw(x),fw(y))>0.5,则图像对{x,y}属于相同人;如果ρS(fw(x),fw(y))<0.5,则图像对{x,y}属于不同人。
CN201310664180.9A 2013-12-10 2013-12-10 一种基于分块深度神经网络的非限制环境人脸验证方法 Expired - Fee Related CN103605972B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310664180.9A CN103605972B (zh) 2013-12-10 2013-12-10 一种基于分块深度神经网络的非限制环境人脸验证方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310664180.9A CN103605972B (zh) 2013-12-10 2013-12-10 一种基于分块深度神经网络的非限制环境人脸验证方法

Publications (2)

Publication Number Publication Date
CN103605972A CN103605972A (zh) 2014-02-26
CN103605972B true CN103605972B (zh) 2017-02-15

Family

ID=50124192

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310664180.9A Expired - Fee Related CN103605972B (zh) 2013-12-10 2013-12-10 一种基于分块深度神经网络的非限制环境人脸验证方法

Country Status (1)

Country Link
CN (1) CN103605972B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108629193A (zh) * 2018-04-26 2018-10-09 成都大象分形智能科技有限公司 一种针对人工神经网络模型的加密保护系统及方法

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106358444B (zh) * 2014-04-11 2019-07-30 北京市商汤科技开发有限公司 用于面部验证的方法和系统
CN106462724B (zh) * 2014-04-11 2019-08-02 北京市商汤科技开发有限公司 基于规范化图像校验面部图像的方法和系统
CN104008393A (zh) * 2014-05-17 2014-08-27 北京工业大学 一种用于认知状态识别的特征分组归一化方法
CN104036242B (zh) * 2014-06-03 2017-04-05 北京工业大学 基于Centering Trick卷积限制玻尔兹曼机的物体识别方法
CN104537684A (zh) * 2014-06-17 2015-04-22 浙江立元通信技术股份有限公司 一种静态场景中的实时运动目标提取方法
WO2016008071A1 (zh) * 2014-07-14 2016-01-21 中国科学院自动化研究所 人脸验证方法和系统
CN104318215B (zh) * 2014-10-27 2017-09-19 中国科学院自动化研究所 一种基于域鲁棒卷积特征学习的交叉视角人脸识别方法
CN104504362A (zh) * 2014-11-19 2015-04-08 南京艾柯勒斯网络科技有限公司 基于卷积神经网络的人脸检测方法
CN104463324A (zh) * 2014-11-21 2015-03-25 长沙马沙电子科技有限公司 一种基于大规模高性能集群的卷积神经网络并行处理方法
CN106408037B (zh) * 2015-07-30 2020-02-18 阿里巴巴集团控股有限公司 图像识别方法及装置
US9594984B2 (en) * 2015-08-07 2017-03-14 Google Inc. Business discovery from imagery
CN105654028A (zh) * 2015-09-29 2016-06-08 厦门中控生物识别信息技术有限公司 一种真假人脸识别方法及装置
CN105787440A (zh) * 2015-11-10 2016-07-20 深圳市商汤科技有限公司 一种基于人脸特征和步态特征的安保管理方法及系统
CN105551036B (zh) * 2015-12-10 2019-10-08 中国科学院深圳先进技术研究院 一种深度学习网络的训练方法和装置
CN106203442B (zh) * 2016-06-28 2019-04-05 北京小白世纪网络科技有限公司 一种基于深度学习的拷贝图像特征提取方法
CN106355066A (zh) * 2016-08-28 2017-01-25 乐视控股(北京)有限公司 人脸验证方法及人脸验证装置
CN107871103B (zh) * 2016-09-23 2021-10-19 北京眼神科技有限公司 一种人脸认证方法和装置
CN106844524B (zh) * 2016-12-29 2019-08-09 北京工业大学 一种基于深度学习和Radon变换的医学图像检索方法
CN106934346B (zh) * 2017-01-24 2019-03-15 北京大学 一种目标检测性能优化的方法
CN106709480B (zh) * 2017-03-02 2018-07-10 太原理工大学 基于加权强度pcnn模型的分块人脸识别方法
CN108509920B (zh) * 2018-04-04 2022-04-26 南京信息工程大学 基于CNN的多patch多通道联合特征选择学习的人脸识别方法
CN111292234B (zh) * 2018-12-07 2022-12-13 大唐移动通信设备有限公司 一种全景图像生成方法及装置
CN109886891B (zh) * 2019-02-15 2022-01-11 北京市商汤科技开发有限公司 一种图像复原方法及装置、电子设备、存储介质
CN111709344B (zh) * 2020-06-09 2023-10-17 上海海事大学 一种基于高斯混合模型的epll图像去光照识别处理方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101021900A (zh) * 2007-03-15 2007-08-22 上海交通大学 利用降维方法进行人脸姿态估计的方法
CN102902966A (zh) * 2012-10-12 2013-01-30 大连理工大学 一种基于深度信赖网络的超分辨率人脸识别方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008191816A (ja) * 2007-02-02 2008-08-21 Sony Corp 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
US8229221B2 (en) * 2009-08-04 2012-07-24 Microsoft Corporation Image processing using masked restricted boltzmann machines

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101021900A (zh) * 2007-03-15 2007-08-22 上海交通大学 利用降维方法进行人脸姿态估计的方法
CN102902966A (zh) * 2012-10-12 2013-01-30 大连理工大学 一种基于深度信赖网络的超分辨率人脸识别方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108629193A (zh) * 2018-04-26 2018-10-09 成都大象分形智能科技有限公司 一种针对人工神经网络模型的加密保护系统及方法
CN108629193B (zh) * 2018-04-26 2020-06-16 成都大象分形智能科技有限公司 一种针对人工神经网络模型的加密保护系统及方法

Also Published As

Publication number Publication date
CN103605972A (zh) 2014-02-26

Similar Documents

Publication Publication Date Title
CN103605972B (zh) 一种基于分块深度神经网络的非限制环境人脸验证方法
CN107273845B (zh) 一种基于置信区域和多特征加权融合的人脸表情识别方法
CN106599797B (zh) 一种基于局部并行神经网络的红外人脸识别方法
CN107194341B (zh) Maxout多卷积神经网络融合人脸识别方法和系统
CN104598890B (zh) 一种基于rgb‑d视频的人体行为识别方法
CN105426919B (zh) 基于显著性指导非监督特征学习的图像分类方法
CN111639558B (zh) 一种基于ArcFace Loss和改进残差网络的指静脉身份验证方法
Kozerawski et al. Clear: Cumulative learning for one-shot one-class image recognition
CN106650693A (zh) 一种用于人脸比对的多特征融合识别算法
CN106096535A (zh) 一种基于双线性联合cnn的人脸验证方法
CN109344856B (zh) 一种基于多层判别式特征学习的脱机签名鉴别方法
CN111401156B (zh) 基于Gabor卷积神经网络的图像识别方法
CN111414862A (zh) 基于神经网络融合关键点角度变化的表情识别方法
CN109614866A (zh) 基于级联深度卷积神经网络的人脸检测方法
CN108664975A (zh) 一种维吾尔文手写字母识别方法、系统及电子设备
Shen et al. Learning high-level concepts by training a deep network on eye fixations
CN107220598A (zh) 基于深度学习特征和Fisher Vector编码模型的虹膜图像分类方法
CN107818299A (zh) 基于融合hog特征和深度信念网络的人脸识别算法
CN110837777A (zh) 基于改进VGG-Net的部分遮挡的人脸表情识别方法
Tao et al. DGLFV: Deep generalized label algorithm for finger-vein recognition
Huang et al. Design and Application of Face Recognition Algorithm Based on Improved Backpropagation Neural Network.
CN110188646B (zh) 基于梯度方向直方图与局部二值模式融合的人耳识别方法
Huang et al. Human emotion recognition based on face and facial expression detection using deep belief network under complicated backgrounds
CN103942545A (zh) 一种基于双向压缩数据空间维度缩减的人脸识别方法和装置
Ashoka et al. Feature extraction technique for neural network based pattern recognition

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170215

Termination date: 20171210