CN104156698A - 人脸识别方法和装置 - Google Patents
人脸识别方法和装置 Download PDFInfo
- Publication number
- CN104156698A CN104156698A CN201410361640.5A CN201410361640A CN104156698A CN 104156698 A CN104156698 A CN 104156698A CN 201410361640 A CN201410361640 A CN 201410361640A CN 104156698 A CN104156698 A CN 104156698A
- Authority
- CN
- China
- Prior art keywords
- subspace
- face
- matrix
- people
- identified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Collating Specific Patterns (AREA)
Abstract
本发明提供了一种人脸识别方法和装置。该人脸识别方法包括:将待识别人脸的图片表示成子空间的投影矩阵;基于该子空间的投影矩阵,产生该待识别人脸的基于子空间的签名;针对该待识别人脸的基于子空间的签名,查找存储的训练人脸的基于子空间的签名的集合中与该待识别人脸的基于子空间的签名距离最近的签名,从而识别该待识别人脸。本发明实施例以低计算和存储成本解决了光照对人脸识别的影响。
Description
技术领域
本发明涉及图像识别,尤其涉及一种人脸识别方法和装置。
背景技术
人脸识别问题中一个重要的因素是光照。不同的光照对人脸识别可能造成很大的影响。有的现有技术能够解决光照对人脸识别的影响问题,但计算和存储开销很大。如何以低计算和存储成本来解决光照对人脸识别的影响,成为业界难以解决的一大问题。
发明内容
本发明解决的一个问题是,以低计算和存储成本来解决光照对人脸识别的影响。
为解决上述问题,本发明的一个实施例提供了一种人脸识别方法,包括:将待识别人脸的图片表示成子空间的投影矩阵;基于该子空间的投影矩阵,产生该待识别人脸的基于子空间的签名;针对该待识别人脸的基于子空间的签名,查找存储的训练人脸的基于子空间的签名的集合中与该待识别人脸的基于子空间的签名距离最近的签名,从而识别该待识别人脸。
由于本发明的实施例将待识别人脸的图片表示成子空间的投影矩阵,基于该子空间的投影矩阵产生该待识别人脸的基于子空间的签名,通过比较计算出的签名与存储的签名集合中的各签名的距离来识别人脸,首先,由于该签名是基于子空间的签名,很好地克服了光照对人脸识别的影响,其次,由于基于子空间产生签名,而比较签名之间的距离(例如汉明距离),相对于比较子空间本身、或比较子空间变换出的哈希值结合子空间的方法,需要更少的计算和存储开销,因此本发明的实施例既克服了光照对人脸识别的影响,又降低了计算和存储开销。
根据本发明的一个实施例,训练人脸的基于子空间的签名是这样产生的:将训练人脸在不同光照下的图片表示成子空间的投影矩阵;基于该子空间的投影矩阵,产生该训练人脸的基于子空间的签名。
上述产生训练人脸的签名的方法相对于从已有的库中获得、或规定的方法,可以获得比较客观的识别结果,并可以不断随着人员的增加补充集合中的签名,以灵活扩大人脸识别范围,例如某公司采用本发明提供的人脸识别方法来给员工提供签到功能,则当该公司的新员工不断增加时,基于本实施例提供的产生训练人脸的签名的方法可以不断将新员工对应的签名补充到存储的签名集合,从而扩大人脸识别的范围。而且,训练人脸的签名与待识别人脸的签名的产生过程基于同一过程,使识别结果更精确。
根据本发明的一个实施例,将待识别人脸在不同光照下的图片表示成子空间的投影矩阵。
采用待识别人脸在不同光照下的多张图片,相对于一张图片,能够提高人脸识别的准确度。
根据本发明的一个实施例,产生该待识别人脸的基于子空间的签名的步骤包括:将所述子空间的投影矩阵转化为第一向量;以矩阵元素服从独立同分布、零均值的高斯分布的第一矩阵或非0离散矩阵元素取值概率相同的第一矩阵或自学习获取的第一矩阵对所述第一向量投影,得到反映待识别人脸特征的第二向量;对第二向量进行0-1量化,得到该待识别人脸的基于子空间的签名。其中,所述非0离散矩阵元素取值概率相同的第一矩阵主要指该矩阵中的非零且离散的矩阵元素取值概率相同,例如矩阵中包括以下元素:a、-a和0,其中a不等于0,则a和-a的取值概率相同。
以矩阵元素服从独立同分布、零均值的高斯分布的第一矩阵或非0离散矩阵元素取值概率相同的第一矩阵对所述第一向量投影,得到反映待识别人脸特征的第二向量,可以给第一向量降维。第一向量的维度是很大的,直接用其产生签名,会带来大的计算和存储开销。先将第一向量降维成维度低的第二向量,可以进一步减小计算和存储开销。而且,由于是以矩阵元素服从独立同分布、零均值的高斯分布的第一矩阵对所述第一向量投影,得到的第二向量中仍然保持了人脸在不同光照下的典型特征。
上述0-1量化带来的优点是,如果不进行0-1量化,把得到的第二向量直接当成基于子空间的签名,签名距离的比较时就不能比较汉明距离而是欧式距离了,计算欧式距离比汉明距离具有更大的计算和存储开销,因此0-1量化减小了计算和存储开销。
根据本发明的一个实施例,所述第一矩阵的矩阵元素服从独立同分布、零均值的高斯分布的第一矩阵或非0离散矩阵元素取值概率相同的第一矩阵是随机生成的。
根据本发明的一个实施例,所述第一矩阵通过自学习获取。所述自学习获得的第一矩阵具有能够根据识别人脸的结果不断调整第一矩阵,使识别人脸的结果通过不断反馈、学习达到完美的进一步的效果。
根据本发明的一个实施例,所述矩阵元素服从独立同分布、零均值的高斯分布的第一矩阵的元素服从标准正态分布。在其他实施例中,所述矩阵元素服从独立同分布、零均值的高斯分布的第一矩阵的元素也可以不服从标准正态分布。
元素服从标准正态分布的矩阵相对于其它矩阵,在概率上使得最终产生的签名更好地保持原子空间的相似度。
根据本发明的一个实施例,对第二向量进行0-1量化的步骤包括:对第二向量中的每个元素进行取符号操作,当元素为非负时,取1,否则,取0,从而得到待识别人脸的基于子空间的0-1哈希签名。
根据本发明的一个实施例,将所述子空间的投影矩阵转化为第一向量的步骤包括将所述子空间的投影矩阵通过以下算式转化为第一向量:
g(Z)=[z1,1,z1,2,z13,…,z1,d,z2,2,z2,3,…,zd,d]T
其中,Z表示d行d列的投影矩阵,g(Z)表示Z转化成的第一向量,zi,j表示Z中第i行第j列的元素,i和j为正整数。
由于投影矩阵Z的元素具有对角线对称的特点,因此zi,j和zj,i具有相同的信息,因此g(Z)中删除了重复信息,可以达到减少计算和存储开销的有益效果。
根据本发明的一个实施例,所述距离是汉明距离。
计算欧式距离比汉明距离具有更大的计算和存储开销,因此采用汉明距离减小了计算开销。
根据本发明的一个实施例,查找存储的训练人脸的基于子空间的签名的集合中与该待识别人脸的基于子空间的签名距离最近的签名的步骤包括:计算该待识别人脸的基于子空间的签名和所述集合中每一个训练人脸的基于子空间的签名的距离,并找出最小者。
根据本发明的一个实施例,查找存储的训练人脸的基于子空间的签名的集合中与该待识别人脸的基于子空间的签名距离最近的签名的步骤包括:根据所述集合中的索引,排除其下属签名与该待识别人脸的基于子空间的签名的距离大于预定阈值的索引;计算未被排除的索引下属的签名与该待识别人脸的基于子空间的签名的距离,并找出最小者。
由于采用索引的方式,首先根据索引排除了一部分签名不参与签名距离的比较,因此,大大减小了计算开销。
根据本发明的一个实施例,将待识别人脸在不同光照下的图片表示成子空间的投影矩阵的步骤包括:将待识别人脸在不同光照下的图片表示成子空间;求所述子空间的投影矩阵。
求投影矩阵的好处就是该投影矩阵的行数和列数不随取子空间有多少列而改变,便于不同光照下的图片数目不同时都能够统一进行处理。
根据本发明的一个实施例,将待识别人脸在不同光照下的图片表示成子空间的步骤包括:将待识别人脸在不同光照下的图片转化为灰度图;对所述灰度图进行规范化;对于每幅图片,以规范化后的灰度图的像素灰度值组成列向量,待识别人脸在不同光照下的全部图片组成m行n列的矩阵M;对矩阵M进行奇异值分解,得到M=USV,其中矩阵S是m×n矩阵,矩阵U是m×m阶酉矩阵,矩阵V的共轭转置是n×n阶酉矩阵;取矩阵U的h列组成矩阵P,该矩阵P的这h列组成待识别人脸的子空间的一组正交基,该矩阵P构成待识别人脸的子空间。其中,矩阵S中的Sij元素(即Sij表示第i行第j列的元素)符合下述标准:当i=j时,Sij为非负数。
由于上述子空间的产生过程融合了人脸在不同光照下的图片的典型特征,规范化的过程使得不同人脸图片具有了可比较性,而奇异值分解所分解出的矩阵U具有正交基,这样形成的子空间反映了人脸在不同光照下的典型规范化的特征,而且具有列向量正交的特点。子空间即反映了人脸在不同光照下的典型规范化的特征的空间表示。通过这样的子空间,就能够解决光照对人脸识别的影响,获得对光照的鲁棒性。
根据本发明的一个实施例,求所述子空间的投影矩阵的步骤包括:按照公式PPT求所述子空间的投影矩阵,其中矩阵P构成待识别人脸的子空间。
本发明的一个实施例还提供了一种人脸识别装置,包括:子空间预处理单元,被配置为将待识别人脸的图片表示成子空间的投影矩阵;签名产生单元,被配置为基于该子空间的投影矩阵,产生该待识别人脸的基于子空间的签名;识别单元,被配置为针对该待识别人脸的基于子空间的签名,查找存储的训练人脸的基于子空间的签名的集合中与该待识别人脸的基于子空间的签名距离最近的签名,从而识别该待识别人脸。
根据本发明的一个实施例,训练人脸的基于子空间的签名是这样产生的:将训练人脸在不同光照下的图片表示成子空间的投影矩阵;基于该子空间的投影矩阵,产生该训练人脸的基于子空间的签名。
根据本发明的一个实施例,将待识别人脸在不同光照下的图片表示成子空间的投影矩阵。
根据本发明的一个实施例,签名产生单元被配置为:转化单元,被配置为将所述子空间的投影矩阵转化为第一向量;投影单元,被配置为以矩阵元素独立同分布、零均值的、服从高斯分布的第一矩阵或非0离散矩阵元素取值概率相同的第一矩阵或自学习获取的第一矩阵对所述第一向量投影,得到反映待识别人脸特征的第二向量;量化单元,被配置为对第二向量进行0-1量化,得到该待识别人脸的基于子空间的签名。
根据本发明的一个实施例,所述矩阵元素服从独立同分布、零均值的高斯分布的第一矩阵或非0离散矩阵元素取值概率相同的第一矩阵是随机生成的。
根据本发明的一个实施例,所述矩阵元素服从独立同分布、零均值的高斯分布的第一矩阵的元素服从标准正态分布。
根据本发明的一个实施例,量化单元被配置为:对第二向量中的每个元素进行取符号操作,当元素为非负时,取1,否则,取0,从而得到待识别人脸的基于子空间的0-1哈希签名。
根据本发明的一个实施例,转化单元被配置为将所述子空间的投影矩阵通过以下算式转化为第一向量:
g(Z)=[z1,1,z1,2,z13,…,z1,d,z2,2,z2,3,…,zd,d]T
其中,Z表示d行d列的投影矩阵,g(Z)表示Z转化成的第一向量,zi,j表示Z中第i行第j列的元素,i和j为正整数。
根据本发明的一个实施例,所述距离是汉明距离。
根据本发明的一个实施例,识别单元被配置为:计算该待识别人脸的基于子空间的签名和所述集合中每一个训练人脸的基于子空间的签名的距离,并找出最小者。
根据本发明的一个实施例,识别单元被配置为:根据所述集合中的索引,排除其下属签名与该待识别人脸的基于子空间的签名的距离大于预定阈值的索引;计算未被排除的索引下属的签名与该待识别人脸的基于子空间的签名的距离,并找出最小者。
根据本发明的一个实施例,子空间预处理单元包括:表示单元,被配置为将待识别人脸在不同光照下的图片表示成子空间;求解单元,被配置为求所述子空间的投影矩阵。
根据本发明的一个实施例,表示单元被配置为:将待识别人脸在不同光照下的图片转化为灰度图;对所述灰度图进行规范化;对于每幅图片,以规范化后的灰度图的像素灰度值组成列向量,待识别人脸在不同光照下的全部图片组成m行n列的矩阵M;对矩阵M进行奇异值分解,得到M=USV,其中矩阵S是m×n矩阵,矩阵U是m×m阶酉矩阵,矩阵V的共轭转置是n×n阶酉矩阵;取矩阵U的h列组成矩阵P,该矩阵P的这h列组成待识别人脸的子空间的一组正交基,该矩阵P构成待识别人脸的子空间。其中,矩阵S中的Sij元素(即Sij表示第i行第j列的元素)符合下述标准:当i=j时,Sij为非负数。
根据本发明的一个实施例,求解单元被配置为:按照公式PPT求所述子空间的投影矩阵,其中矩阵P构成待识别人脸的子空间。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1是根据本发明的一个实施例的人脸识别方法的流程图;
图2示出了同一人脸在不同光照下的图片的例子;
图3是根据本发明的一个实施例的人脸识别装置的框图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。本领域普通技术人员将了解,虽然下面的详细说明将参考图示实施例、附图进行,但本发明并不仅限于这些实施例。而是,本发明的范围是广泛的,且意在仅通过后附的权利要求限定本发明的范围。
图1是根据本发明一个实施例的人脸识别方法1的流程图。
在步骤S1中,将待识别人脸的图片表示成子空间的投影矩阵。
这里的待识别人脸的图片可以是一张待识别人脸的图片,也可以是待识别人脸在不同光照下的多张图片,如图2所示(图2所提供的照片来源于网址http://vision.ucsd.edu/kriegman-grp/research/9pt/)。待识别人脸在不同光照下的多张图片能够相对于一张图片提高人脸识别的准确度。下面主要以待识别人脸在不同光照下的多张图片(例如15张)进行说明。
首先,将待识别人脸在不同光照下的图片表示成子空间。这一过程可以如下进行:假设待识别人脸有15张其它条件都相同情况下不同光照下的对齐的正面人脸图片,先将这些图片转化为灰度图。然后,例如采用插值和下采样方法(比如双线性插值)将灰度图规范化到相同大小,例如32×32像素,当然还有其它规范化的方法也可以适用。接着,对于每幅图片,把规范化的图像按列向0-1量化,例如对于32×32像素,每个像素的灰度值形成一个32×32的矩阵,将其变成一列,就是一个1024的元素的一列,由于有15张照片,组成1024行15列的矩阵M。对该矩阵进行奇异值分解,得到M=USV,其中矩阵S是1024×15的矩阵,矩阵U是1024×1024阶酉矩阵,矩阵V的共轭转置是15×15阶酉矩阵。一般来说,任意光照下的人脸图片可以由9种对齐的特定的不同光照下的人脸图片线性表出,因此取矩阵U的前9列组成矩阵P,该矩阵P的这9列组成待识别人脸的子空间的一组正交基,该矩阵P构成待识别人脸的子空间。当然,上述1024行15列也可以替换成其它数目的行和列,原则上只要是正整数就可以,例如256行20列。上述9列与可以替换成例如10列、12列,一般不能大于图片的数目。由于上述子空间的产生过程融合了人脸在不同光照下的图片的典型特征,规范化的过程使得不同人脸图片具有了可比较性,而奇异值分解所分解出的矩阵U具有正交基,这样形成的子空间反映了人脸在不同光照下的典型规范化的特征,而且具有列向量正交的特点。子空间即反映了人脸在不同光照下的典型规范化的特征的空间表示。通过这样的子空间,就能够解决光照对人脸识别的影响,获得对光照的鲁棒性。人脸的子空间表示方法于R.Basri and D.Jacobs,“Lambertian Reflectance and Linear Subspaces,”IEEE Trans.PatternAnalysis and Machine Intelligence,vol.25,no.2,pp.218-233,Feb.2003.中提出。
接着,求所述子空间的投影矩阵。可以按照公式PPT求所述子空间的投影矩阵,其中矩阵P构成待识别人脸的子空间。例如,对于上述1024行15列的矩阵M(32×32像素,15张图片),取矩阵U的前9列,则P为1024×9的矩阵。PPT为1024×1024的矩阵,求投影矩阵的好处就是该投影矩阵的行数和列数不随取矩阵U的多少列而改变。例如,由于任意光照下的人脸图片可以由9种对齐的特定的不同光照下的人脸图片线性表出,因此取矩阵U的前9列组成矩阵P,如果此时人脸在不同光照下的图片不足9张,例如7张,则取U的前7列作为子空间,但子空间的投影矩阵的行数和列数仍都是1024。另外,待识别人脸的图片可以是一张待识别人脸的图片,此时矩阵M为1024×1的矩阵,也只取U的前1列作为子空间,但子空间的投影矩阵的行数和列数仍都是1024,保持了不同子空间的可比性。
在步骤S2中,基于该子空间的投影矩阵,产生该待识别人脸的基于子空间的签名。
首先,将所述子空间的投影矩阵转化为第一向量。
在一个实施例中,将所述子空间的投影矩阵通过以下算式转化为第一向量:
g(Z)=[z1,1,z1,2,z13,…,z1,d,z2,2,z2,3,…,zd,d]T
其中,Z表示d行d列的投影矩阵,即PPT,g(Z)表示Z转化成的第一向量,zi,j表示Z中第i行第j列的元素,i和j为正整数。
由于投影矩阵Z的元素具有对角线对称的特点,因此zi,j和zj,i具有相同的信息,因此g(Z)中删除了重复信息,可以达到减少计算和存储开销的有益效果。它得到的第一向量是d(d+1)/2维。
在另一个实施例中,也可以通过以下算式将所述子空间的投影矩阵转化为第一向量:
g(Z)=[z1,1,z1,2,z1,3,…,z1,d,z2,1,z2,2,z2,3,…,z2,d,z3,1…,zd,d]T
其中,Z表示d行d列的投影矩阵,即PPT,g(Z)表示Z转化成的第一向量,zi,j表示Z中第i行第j列的元素,i和j为正整数。它得到的第一向量是d2维,相比于前一种方式,开销稍大,但也可以适用。
接着,以矩阵元素服从独立同分布、零均值的高斯分布的第一矩阵或非0离散矩阵元素取值概率相同的第一矩阵或自学习获取的第一矩阵对所述第一向量投影,得到反映待识别人脸特征的第二向量。
假定要生成K(K为正整数)比特的哈希签名。需要事先生成一个的第一矩阵A,其中第一矩阵A的每个元素都独立服从相同的高斯分布,且这些元素的均值为0.用第一矩阵A对g(Z)投影,得到一个K维向量,即w=ATg(Z),w是反映待识别人脸特征的第二向量。关于K的取值,可以根据实际需要进行选取。这一步对第一向量降维。由于上述第一向量是d(d+1)/2维,假设d=1024,d(d+1)/2=524,800。显然,用这么大维数的第二向量直接得到签名,其计算和存储开销是巨大的,通过这样的降维,可以进一步减小计算和存储开销。由于是以矩阵元素服从独立同分布、零均值的高斯分布的第一矩阵对所述第一向量投影,得到的第二向量中仍然保持了人脸在不同光照下的相似度。
矩阵元素服从独立同分布、零均值的高斯分布的第一矩阵A还可以替换成非0离散矩阵元素取值概率相同的第一矩阵,例如一个矩阵只包括a,-a和0元素,其中三者的取值概率分别为1/6、1/6、2/3。其也能达到降维的效果,因此可以进一步减小计算和存储开销。由于是以非0离散矩阵元素取值概率相同的第一矩阵对所述第一向量投影,得到的第二向量中仍然保持了人脸在不同光照下的相似度。
另外,所述矩阵元素独立服从同分布、零均值的高斯分布的第一矩阵或非0离散矩阵元素取值概率相同的第一矩阵是随机生成的,即A是随机投影矩阵,当然,所述第一矩阵也可以是自学习获得的第一矩阵。自学习获得的第一矩阵具有能够根据识别人脸的结果不断调整第一矩阵,使识别人脸的结果通过不断反馈、学习达到完美的进一步的效果。
另外,还可以不将子空间的投影矩阵Z(即PPT)转化为第一向量而直接用两个第一矩阵A1和A2来降维。两个矩阵A1和A2也是矩阵元素服从独立同分布、零均值的高斯分布的第一矩阵或非0离散矩阵元素取值概率相同的第一矩阵。A1是d×K1矩阵,A2是d×K2矩阵,K=K1×K2。w=ATg(Z)替换成公式w=A1 TZA2,这样得到的w是一个K1×K2的矩阵,将该矩阵转化为列向量或行向量,得到一个K1×K2行(即K行)的列向量或K1×K2列(即K列)的行向量,即第二向量。这也是另一种得到第二向量的方法。基于该子空间的投影矩阵得到第二向量,也可以通过其它方式。
接着,对第二向量进行0-1量化,得到该待识别人脸的基于子空间的签名。
一种0-1量化方法是,对第二向量中的每个元素进行取符号操作,当元素为非负时,取1,否则,取0,从而得到待识别人脸的基于子空间的0-1哈希签名。例如,K=4,假设得到的第二向量为(24,6,-4,-98),则签名为(1,1,0,0)。
也可以有其它0-1量化方法。例如当元素为非负时,取0,否则,取1。或者,将第二向量中的每个元素与预定阈值比较,当大于等于预定阈值时,取1,否则,取0,等等。
另外,也可以不进行0-1量化步骤,而把得到的第二向量直接当成基于子空间的签名。这时,在后面的签名距离的比较时就不能比较汉明距离而是欧式距离了。0-1量化的得到0-1哈希签名相对于普通签名,能使比较距离时的计算开销变得非常小,因为汉明距离的计算比欧式距离的计算占用更小的开销。
另外,上述矩阵元素独立服从同分布、零均值的高斯分布的第一矩阵优选是矩阵元素独立同分布、零均值的、服从标准正态分布的第一矩阵。元素服从标准正态分布的矩阵相对于其它矩阵,在概率上使得最终产生的签名更好地保持原子空间的相似度。
在步骤S3中,针对该待识别人脸的基于子空间的签名,查找存储的训练人脸的基于子空间的签名的集合中与该待识别人脸的基于子空间的签名距离最近的签名,从而识别该待识别人脸。
训练人脸是用于训练的人脸。例如,对于全公司员工的人脸产生基于子空间的签名,组成签名集合,这时全公司员工的每个员工的人脸就是一个训练人脸。待识别人脸的识别结果就是全公司员工中的一个,具体地说,是签名与待识别人脸的签名距离最近的一个。
在一种实施例中,训练人脸的基于子空间的签名是这样产生的:将训练人脸在不同光照下的图片表示成子空间的投影矩阵;基于该子空间的投影矩阵,产生该训练人脸的基于子空间的签名。它与图1中步骤S1和S2基本上是相同,只不过将待识别人脸的图片替换成了训练人脸的图片而已,其它的产生基于子空间的签名的过程都相同。例如,对于每个训练人脸,也采集其在不同光照下的15个图片,进行类似上述步骤S1和S2的处理。上述S1和S2最终产生的是待识别人脸的基于子空间的签名。这里产生的是每个训练人脸的基于子空间的签名。所有训练人脸的基于子空间的签名组成集合。然后,在步骤S3中,将待识别人脸的基于子空间的签名与集合中的每个训练人脸的基于子空间的签名进行距离比较,距离最近的那个训练人脸就是当前待识别人脸的识别结果。也就是说,这要求这个待识别人脸必须实现为其采集过不同光照下的图片并如上处理并事先存储在集合中,否则只能找到与该待识别人脸最像的人脸,而不是这个人本身。需要指出的是,待识别人脸在不同光照下的图片(例如15种光照下)、训练人脸在不同光照下的图片(例如15种光照下)最好是在相同的例如15中光照下采集的,以提升图片之间的可对比性。当然,尽管训练人脸最好是在同样的若干种光照下采集的,但是这一条件也不是必须的。另外,待识别人脸也不一定要在相同光照下采集。
训练人脸的基于子空间的签名也不一定要如上产生。在某些特殊情况下,也可以从已有的标准库中获得,或人为规定。利用上述方法产生训练人脸的签名的优点是可以获得比较客观的识别结果,并可以不断随着人员的增加补充集合中的签名,以灵活扩大识别范围,例如某公司采用本发明提供的人脸识别方法来给员工提供签到功能,则当该公司的新员工不断增加时,基于本实施例提供的产生训练人脸的签名的方法可以不断将新员工对应的签名补充到存储的签名集合,从而扩大人脸识别的范围。
步骤S3的一种具体实现方式可以是,计算该待识别人脸的基于子空间的签名和所述集合中每一个训练人脸的基于子空间的签名的距离,并找出最小者。这种方式需要与集合中的每个训练人脸的签名都要比较一次,计算开销较大。
通过为集合建立索引能够减小处理开销。索引是在集合或数据库中具有共同性质的一类条目建立的标签。例如,假设集合中共有5个哈希签名(0,0,1,1),(1,0,1,1),(1,0,0,1),(1,1,0,0),(1,1,0,1)。由于第一个签名的前2位是(0,0),第二、三个签名的前2位是(1,0),第四、五个签名的前2位是(1,1)。签名与索引的对应关系如下:
在利用索引的方式中,首先,根据所述集合中的索引,排除其下属签名与该待识别人脸的基于子空间的签名的距离大于预定阈值的索引。然后,计算未被排除的索引下属的签名与该待识别人脸的基于子空间的签名的距离,并找出最小者。
假设预定阈值为1,则如果签名之间的距离为2、3、4……都是不可接受的。假设待识别人脸的基于子空间的签名是(0,0,1,0),首先,其前两位与索引比较,就会发现(1,1)以及与待识别人脸的基于子空间的签名的前两位汉明距离为2了,考虑后两位,汉明距离一定会大于等于2,因此,排除索引(1,1)和其下属所有签名。在剩下的签名中,(0,0,1,1)与本签名的汉明距离为1,(1,0,1,1)与本签名的汉明距离为2,(1,0,0,1)与本签名的汉明距离为3,因此,(0,0,1,1)是距离最近的签名。可以认为待识别人脸就是这个签名为(0,0,1,1)的那个训练人脸。这种方式相对于前一种方式,只需比较3个签名与本签名的距离,而不是5个签名与本签名的距离,减小了处理开销。
另外,如果在步骤S2中采用的是不进行0-1量化步骤、把得到的第二向量直接当成基于子空间的签名的方案,由于这时的签名不是哈希签名,无法利用汉明距离,只能利用欧式距离。例如待识别人脸的基于子空间的签名是(24,-6,-96,4),集合中有两个签名(25,-5,-97,3)和(24,-5,-98,6),则(25,-5,-97,3)与本签名的距离是(24,-5,-98,6)与本签名的距离是可以认为签名(25,-5,-97,3)所对应的人脸就是当前待识别人脸的识别结果。
如图3所示,根据本发明的一个实施例,提供了一种人脸识别装置2,包括:子空间预处理单元21,被配置为将待识别人脸的图片表示成子空间的投影矩阵;签名产生单元22,被配置为基于该子空间的投影矩阵,产生该待识别人脸的基于子空间的签名S2;识别单元23,被配置为针对该待识别人脸的基于子空间的签名,查找存储的训练人脸的基于子空间的签名的集合中与该待识别人脸的基于子空间的签名距离最近的签名,从而识别该待识别人脸S3。
根据本发明的一个实施例,训练人脸的基于子空间的签名是这样产生的:将训练人脸在不同光照下的图片表示成子空间的投影矩阵;基于该子空间的投影矩阵,产生该训练人脸的基于子空间的签名。
根据本发明的一个实施例,将待识别人脸在不同光照下的图片表示成子空间的投影矩阵。
根据本发明的一个实施例,签名产生单元22被配置为:转化单元221,被配置为将所述子空间的投影矩阵转化为第一向量;投影单元222,被配置为以矩阵元素服从独立同分布、零均值的高斯分布的第一矩阵或非0离散矩阵元素取值概率相同的第一矩阵或以自学习获取的第一矩阵对所述第一向量投影,得到反映待识别人脸特征的第二向量;量化单元223,被配置为对第二向量进行0-1量化,得到该待识别人脸的基于子空间的签名。
根据本发明的一个实施例,所述矩阵元素服从独立同分布、零均值的高斯分布的第一矩阵或非0离散矩阵元素取值概率相同的第一矩阵是随机生成的。
根据本发明的一个实施例,所述矩阵元素服从独立同分布、零均值的高斯分布的第一矩阵的元素服从标准正态分布。
根据本发明的一个实施例,量化单元223被配置为:对第二向量中的每个元素进行取符号操作,当元素为非负时,取1,否则,取0,从而得到待识别人脸的基于子空间的0-1哈希签名。
根据本发明的一个实施例,转化单元221被配置为将所述子空间的投影矩阵通过以下算式转化为第一向量:
g(Z)=[z1,1,z1,2,z13,…,z1,d,z2,2,z2,3,…,zd,d]T
其中,Z表示d行d列的投影矩阵,g(Z)表示Z转化成的第一向量,zi,j表示Z中第i行第j列的元素,i和j为正整数。
根据本发明的一个实施例,所述距离是汉明距离。
根据本发明的一个实施例,识别单元23被配置为:计算该待识别人脸的基于子空间的签名和所述集合中每一个训练人脸的基于子空间的签名的距离,并找出最小者。
根据本发明的一个实施例,识别单元23被配置为:根据所述集合中的索引,排除其下属签名与该待识别人脸的基于子空间的签名的距离大于预定阈值的索引;计算未被排除的索引下属的签名与该待识别人脸的基于子空间的签名的距离,并找出最小者。
根据本发明的一个实施例,子空间预处理单元21包括:表示单元211,被配置为将待识别人脸在不同光照下的图片表示成子空间;求解单元212,被配置为求所述子空间的投影矩阵。
根据本发明的一个实施例,表示单元211被配置为:将待识别人脸在不同光照下的图片转化为灰度图;对所述灰度图进行规范化;对于每幅图片,以规范化后的灰度图的像素灰度值组成列向量,待识别人脸在不同光照下的全部图片组成m行n列的矩阵M;对矩阵M进行奇异值分解,得到M=USV,其中矩阵S是m×n矩阵,矩阵U是m×m阶酉矩阵,矩阵V的共轭转置是n×n阶酉矩阵,m、n为正整数;其中,矩阵S中的Sij元素(即Sij表示第i行第j列的元素)符合下述标准:当i=j时,Sij为非负数。取矩阵U的h列组成矩阵P,该矩阵P的这h列组成待识别人脸的子空间的一组正交基,该矩阵P构成待识别人脸的子空间,h为正整数,h不大于n。
根据本发明的一个实施例,求解单元212被配置为:按照公式PPT求所述子空间的投影矩阵,其中矩阵P构成待识别人脸的子空间。
图3所示的人脸识别装置2可以利用软件、硬件(例如集成电路、FPGA等)或软硬件结合的方式来实现。
所属技术领域的技术人员知道,本发明可以实现为设备、装置、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:可以是完全的硬件,也可以是完全的软件,还可以是硬件和软件结合的形式。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
Claims (10)
1.一种人脸识别方法(1),包括:
将待识别人脸的图片表示成子空间的投影矩阵(S1);
基于该子空间的投影矩阵,产生该待识别人脸的基于子空间的签名(S2);
针对该待识别人脸的基于子空间的签名,查找存储的训练人脸的基于子空间的签名的集合中与该待识别人脸的基于子空间的签名距离最近的签名,从而识别该待识别人脸(S3)。
2.根据权利要求1所述的人脸识别方法(1),其中训练人脸的基于子空间的签名是这样产生的:
将训练人脸在不同光照下的图片表示成子空间的投影矩阵;
基于该子空间的投影矩阵,产生该训练人脸的基于子空间的签名。
3.根据权利要求1所述的人脸识别方法(1),其中将待识别人脸在不同光照下的图片表示成子空间的投影矩阵。
4.根据权利要求1所述的人脸识别方法(1),其中产生该待识别人脸的基于子空间的签名的步骤(S2)包括:
将所述子空间的投影矩阵转化为第一向量;
以矩阵元素服从独立同分布、零均值的高斯分布的第一矩阵或非0离散矩阵元素取值概率相同的第一矩阵或以自学习获取的第一矩阵对所述第一向量投影,得到反映待识别人脸特征的第二向量;
对第二向量进行0-1量化,得到该待识别人脸的基于子空间的签名。
5.根据权利要求4所述的人脸识别方法(1),其中所述矩阵元素服从独立同分布、零均值的高斯分布的第一矩阵或非0离散矩阵元素取值概率相同的第一矩阵是随机生成的。
6.根据权利要求4所述的人脸识别方法(1),其中所述矩阵元素服从独立同分布、零均值的高斯分布的第一矩阵的元素服从标准正态分布。
7.根据权利要求4所述的人脸识别方法(1),其中对第二向量进行0-1量化的步骤包括:
对第二向量中的每个元素进行取符号操作,当元素为非负时,取1,否则,取0,从而得到待识别人脸的基于子空间的0-1哈希签名。
8.根据权利要求4所述的人脸识别方法(1),其中将所述子空间的投影矩阵转化为第一向量的步骤包括将所述子空间的投影矩阵通过以下算式转化为第一向量:
g(Z)=[z1,1,z1,2,z13,…,z1,d,z2,2,z2,3,…,zd,d]T
其中,Z表示d行d列的投影矩阵,g(Z)表示Z转化成的第一向量,zi,j表示Z中第i行第j列的元素,i和j为正整数。
9.根据权利要求1所述的人脸识别方法(1),其中所述距离是汉明距离。
10.根据权利要求1所述的人脸识别方法(1),其中查找存储的训练人脸的基于子空间的签名的集合中与该待识别人脸的基于子空间的签名距离最近的签名的步骤(S3)包括:
计算该待识别人脸的基于子空间的签名和所述集合中每一个训练人脸的基于子空间的签名的距离,并找出最小者。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410361640.5A CN104156698B (zh) | 2014-07-25 | 2014-07-25 | 人脸识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410361640.5A CN104156698B (zh) | 2014-07-25 | 2014-07-25 | 人脸识别方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104156698A true CN104156698A (zh) | 2014-11-19 |
CN104156698B CN104156698B (zh) | 2017-10-03 |
Family
ID=51882195
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410361640.5A Active CN104156698B (zh) | 2014-07-25 | 2014-07-25 | 人脸识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104156698B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108629414A (zh) * | 2018-05-09 | 2018-10-09 | 清华大学 | 深度哈希学习方法及装置 |
CN110276263A (zh) * | 2019-05-24 | 2019-09-24 | 长江大学 | 一种人脸识别系统及识别方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101038622A (zh) * | 2007-04-19 | 2007-09-19 | 上海交通大学 | 基于几何保存的人脸子空间识别方法 |
US20080205712A1 (en) * | 2007-02-28 | 2008-08-28 | Fotonation Vision Limited | Separating Directional Lighting Variability in Statistical Face Modelling Based on Texture Space Decomposition |
CN101393608A (zh) * | 2008-11-04 | 2009-03-25 | 清华大学 | 一种基于流形距离分析的视觉对象识别方法和装置 |
-
2014
- 2014-07-25 CN CN201410361640.5A patent/CN104156698B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080205712A1 (en) * | 2007-02-28 | 2008-08-28 | Fotonation Vision Limited | Separating Directional Lighting Variability in Statistical Face Modelling Based on Texture Space Decomposition |
CN101038622A (zh) * | 2007-04-19 | 2007-09-19 | 上海交通大学 | 基于几何保存的人脸子空间识别方法 |
CN101393608A (zh) * | 2008-11-04 | 2009-03-25 | 清华大学 | 一种基于流形距离分析的视觉对象识别方法和装置 |
Non-Patent Citations (5)
Title |
---|
ARISTIDES GIONIS等: "Similarit y Searc h in High Dimensions via Hashing", 《PRO CEEDINGS OF THE 25TH VLDB CONFERENCE》 * |
KAIMING HE等: "K-m eans H as hing: a n Affinity-Pres erving Quantization Method fo r L earning Binary Compact Codes", 《2013 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 * |
RONEN BASRI等: "Approximate Nearest Subspace Search", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》 * |
张成元: "基于子空间分析的人脸识别算法研究", 《中国博士学位论文全文数据库 信息科技辑》 * |
邓伟洪: "高精度人脸识别算法研究", 《中国博士学位论文全文数据库 信息科技辑》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108629414A (zh) * | 2018-05-09 | 2018-10-09 | 清华大学 | 深度哈希学习方法及装置 |
CN108629414B (zh) * | 2018-05-09 | 2020-04-14 | 清华大学 | 深度哈希学习方法及装置 |
CN110276263A (zh) * | 2019-05-24 | 2019-09-24 | 长江大学 | 一种人脸识别系统及识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN104156698B (zh) | 2017-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105893954B (zh) | 一种基于核机器学习的非负矩阵分解人脸识别方法及系统 | |
US20220076136A1 (en) | Method and system for training a neural network model using knowledge distillation | |
JP7266674B2 (ja) | 画像分類モデルの訓練方法、画像処理方法及び装置 | |
US20160321522A1 (en) | Devices, systems, and methods for pairwise multi-task feature learning | |
WO2019047672A1 (zh) | 信息推荐方法、计算机设备及存储介质 | |
Wang | Block principal component analysis with L1-norm for image analysis | |
CN113128478B (zh) | 模型训练方法、行人分析方法、装置、设备及存储介质 | |
CN112633309A (zh) | 基于贝叶斯优化的查询高效的黑盒对抗攻击 | |
KR102370910B1 (ko) | 딥러닝 기반 소수 샷 이미지 분류 장치 및 방법 | |
CN111027576A (zh) | 基于协同显著性生成式对抗网络的协同显著性检测方法 | |
CN115293919B (zh) | 面向社交网络分布外泛化的图神经网络预测方法及系统 | |
Katariya et al. | Active evaluation of classifiers on large datasets | |
CN114330514B (zh) | 一种基于深度特征与梯度信息的数据重建方法及系统 | |
CN104036021A (zh) | 混合生成式和判别式学习模型的图像语义标注方法 | |
Li et al. | Graph regularized non-negative matrix factorization by maximizing correntropy | |
CN110111365B (zh) | 基于深度学习的训练方法和装置以及目标跟踪方法和装置 | |
Teffahi et al. | A novel spectral-spatial classification technique for multispectral images using extended multi-attribute profiles and sparse autoencoder | |
CN113780365B (zh) | 样本生成方法和装置 | |
Singh et al. | Towards combined matrix and tensor factorization for universal schema relation extraction | |
US11922312B2 (en) | Image classification system, image classification method, and image classification program | |
CN104156698A (zh) | 人脸识别方法和装置 | |
CN112269875B (zh) | 文本分类方法、装置、电子设备及存储介质 | |
Yan et al. | Towards incremental and large scale face recognition | |
JPWO2012077818A1 (ja) | ハッシュ関数の変換行列を定める方法、該ハッシュ関数を利用するハッシュ型近似最近傍探索方法、その装置及びそのコンピュータプログラム | |
Wang et al. | Locality constrained joint dynamic sparse representation for local matching based face recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |