CN105930834A - 基于球哈希二值编码的人脸识别方法及装置 - Google Patents
基于球哈希二值编码的人脸识别方法及装置 Download PDFInfo
- Publication number
- CN105930834A CN105930834A CN201610513332.9A CN201610513332A CN105930834A CN 105930834 A CN105930834 A CN 105930834A CN 201610513332 A CN201610513332 A CN 201610513332A CN 105930834 A CN105930834 A CN 105930834A
- Authority
- CN
- China
- Prior art keywords
- ball
- pixel value
- value difference
- pixel
- difference vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
- G06V40/171—Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种基于球哈希二值编码的人脸识别方法。该方法包括提取训练样本中的多个训练人脸图像的各个局部块中每个像素点对应的像素差值向量;根据球哈希优化算法得到球哈希函数的参数;根据球哈希函数的参数对像素差值向量进行二值编码,得到第一二值向量;对第一二值向量进行聚类,得到多个视觉单词;提取测试人脸图像的局部块中每个像素点对应的像素差值向量;根据球哈希函数的参数对测试人脸图像对应的多个像素差值向量进行二值编码,得到第二二值向量;根据视觉单词对第二二值向量进行特征表示得到特征向量,并根据特征向量进行人脸识别。本发明存储量小,计算速度快,对局部变化的敏感度较低,而且数据适应性较高,数据描述能力较强。
Description
技术领域
本发明涉及人脸识别技术领域,尤其涉及一种基于球哈希二值编码的人脸识别方法及装置。
背景技术
人脸识别技术,是一种通过分析比较人脸视觉特征信息进行身份鉴别的计算机技术。人脸识别算法可以分为:基于全局特征的算法和基于局部特征的算法。其中,基于全局特征的人脸识别算法对于局部变化较为敏感,如:表情、遮挡等。而基于局部特征的人脸识别算法则是将图像视为多个局部块的组合,分别从每个局部块中提取局部特征,再将这些局部特征拼接成为一个长向量,从而表示一幅人脸图像。该类算法对于局部变化较为鲁棒。因此,基于局部特征的人脸识别算法的应用较为广泛。
现有的基于局部特征的人脸识别算法中包括基于特征学习的人脸识别算法,是通过从实际数据中来学习算法的组织形式或先验知识,即数据依赖型的算法。因此只需要训练数据与实际应用场景中的数据具有较高的一致性,在加入少量甚至不加入先验知识的情况下,就能够应对实际场景中出现的类内变化。而现有的基于特征学习的人脸识别算法大多是基于实值的特征表示,即首先利用设计的目标函数从输入的人脸图像中提取基于实数值的人脸特征表示,然后利用模式识别方法判断输入图像到底属于哪个人。
但该类算法存在以下缺点:首先,由于特征是基于实数值的,当外界因素发生变化时,学习得到的特征也必然会随之变化,当变化的程度超过某一阈值时,分类器就会将两个原本属于同一个人的特征识别为不同人。即该类算法对于人脸图像的局部变化较为敏感,即提取得到的人脸特征向量的数值容易随着图像的变化而随之变化。而且,基于实值的特征学习算法的时间、空间复杂度高。
发明内容
本发明提供一种基于球哈希二值编码的人脸识别方法及装置,以克服现有技术中基于实值的特征学习算法的时间、空间复杂度高的问题。
第一方面,本发明提供一种基于球哈希二值编码的人脸识别方法,包括:
分别将训练样本中的多个训练人脸图像进行局部块的划分,得到所述训练人脸图像对应的多个局部块,并提取各个所述训练人脸图像的各个所述局部块中每个像素点对应的像素差值向量;
根据所述像素差值向量和球哈希优化算法得到球哈希函数的参数;所述球哈希函数的参数包括:中心点和半径;
根据所述球哈希函数的参数对所述像素差值向量进行二值编码,得到所述像素差值向量对应的第一二值向量;
对所述第一二值向量进行聚类,获取聚类得到的多个视觉单词;
对测试人脸图像进行局部块的划分,得到所述测试人脸图像对应的多个局部块,并提取测试人脸图像中每个所述局部块中每个像素点对应的像素差值向量;
根据所述球哈希函数的参数对所述测试人脸图像对应的多个像素差值向量进行二值编码,得到所述像素差值向量对应的第二二值向量;
根据所述视觉单词对所述第二二值向量进行特征表示得到特征向量,并根据所述特征向量进行人脸识别。
第二方面,本发明提供一种基于球哈希二值编码的人脸识别装置,包括:
第一提取模块,用于分别将训练样本中的多个训练人脸图像进行局部块的划分,得到所述训练人脸图像对应的多个局部块,并提取各个所述训练人脸图像的各个所述局部块中每个像素点对应的像素差值向量;
优化模块,用于根据所述像素差值向量和球哈希优化算法得到球哈希函数的参数;所述球哈希函数的参数包括:中心点和半径;
第一编码模块,用于根据所述球哈希函数的参数对所述像素差值向量进行二值编码,得到所述像素差值向量对应的第一二值向量;
聚类模块,用于对所述第一二值向量进行聚类,获取聚类得到的多个视觉单词;
第二提取模块,用于对测试人脸图像进行局部块的划分,得到所述测试人脸图像对应的多个局部块,并提取测试人脸图像中每个所述局部块中每个像素点对应的像素差值向量;
第二编码模块,用于根据所述球哈希函数的参数对所述测试人脸图像对应的多个像素差值向量进行二值编码,得到所述像素差值向量对应的第二二值向量;
处理模块,用于根据所述视觉单词对所述第二二值向量进行特征表示得到特征向量,并根据所述特征向量进行人脸识别。
本发明基于球哈希二值编码的人脸识别方法及装置,首先提取训练样本中的多个训练人脸图像的局部块中的像素点对应的像素差值向量,然后根据球哈希优化算法得到球哈希函数的参数;进一步的,根据所述球哈希函数的参数对所述像素差值向量进行二值编码,得到所述像素差值向量对应的第一二值向量;然后,对所述第一二值向量进行聚类,获取聚类得到的多个视觉单词;进一步的,提取测试人脸图像的局部块中的像素点对应的像素差值向量;根据所述球哈希函数的参数对所述测试人脸图像对应的多个像素差值向量进行二值编码,得到所述像素差值向量对应的第二二值向量;根据所述视觉单词对所述第二二值向量进行特征表示得到特征向量,并根据所述特征向量进行人脸识别,由于采用了二值编码,因此计算存储消耗量小,计算速度快,而且对局部变化的敏感度较低,而且利用无监督的聚类算法将利用球哈希二值编码算法得到的二值向量进一步表示为词袋模型,数据适应性较高,而且由于采用的是球哈希算法,因此数据描述能力较强。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于球哈希二值编码的人脸识别方法一实施例的流程示意图;
图2为本发明方法一实施例的实现流程示意图;
图3为本发明方法一实施例的像素差值向量提取示意图;
图4为本发明基于球哈希二值编码的人脸识别装置一实施例的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例的方法,可应用于所有自然条件(即非约束条件)下的人脸识别任务。如:在人机交互系统中的用户身份识别、表情识别等;人员密集场所下的黑名单监控和VIP监控等;在社交网络中,含有人脸的上传照片中的用户标签推荐等。由于本发明利用基于球哈希二值编码的人脸识别算法,算法的运算速度极快,可完成某些非实时的人脸识别算法无法完成的识别任务。
图1为本发明基于球哈希二值编码的人脸识别方法一实施例的流程示意图。图2为本发明方法一实施例的实现流程示意图。图3为本发明方法一实施例的像素差值向量提取示意图。如图1、图2所示,本实施例的方法,包括:
步骤101、分别将训练样本中的多个训练人脸图像进行局部块的划分,得到所述训练人脸图像对应的多个局部块,并提取各个所述训练人脸图像的各个所述局部块中每个像素点对应的像素差值向量;
训练样本中包括多个训练人脸图像,即至少包括两个训练人脸图像。
可选地,提取局部块中每个像素点对应的像素差值向量具体可以通过如下方式实现:
以每个像素点为中心,以R为半径,提取位于所述像素点四周的邻域像素点,并以顺时针方向依次将所述邻域像素点的像素值与所述像素点的像素值进行差值运算,得到所述像素点对应的N维像素差值向量;R为预设值;N=(2×R+1)×(2×R+1)-1。
具体的,如图3所示,该局部块中的中心像素块中像素点g对应的像素差值向量的提取过程如下:
以像素点g为中心点,以R=1为半径,提取位于该像素点四周的邻域像素点,并以顺时针方向依次将邻域像素点的像素值与该像素点的像素值进行差值运算,得到的N=8维像素差值向量为(a-g,f-g,k-g,l-g,m-g,h-g,c-g,b-g)。
该中心像素块中的其他像素点对应的像素差值向量如图3中所示,即像素差值矩阵的每一列为一个像素点对应的像素差值向量,具体提取过程与上述过程类似,此处不再赘述。
图3中的邻域像素块分别表示了像素点g、q、s和i的邻域像素块。
R取值范围为大于0的整数。
图2中的像素差值向量只列出了一个像素点的像素差值向量(-8,7,3,0,-2,-1,9,2)。
步骤102、根据所述像素差值向量和球哈希优化算法得到球哈希函数的参数;所述球哈希函数的参数包括:中心点和半径;
利用球哈希优化算法,计算球哈希函数中每个球哈希函数的参数,即每个超球体的中心点和半径。
步骤103、根据所述球哈希函数的参数对所述像素差值向量进行二值编码,得到所述像素差值向量对应的第一二值向量;
可选地,步骤103具体可以采用如下方式实现:
将所述像素差值向量分别代入所述球哈希函数中,将所述球哈希函数的值作为所述第一二值向量对应位置的元素。
如图2所示,假设球哈希函数的个数为4个,则将像素差值向量分别代入4个球哈希函数中,将球哈希函数的值作为第一二值向量对应位置的元素,即得到向量(0,1,1,0)。
例如,假设在二维空间中,我们学习得到了三个球哈希函数(即三个圆形A,B,C),假设它们的半径均为1,中心点分别为A:(-1,1),B:(0,0)和C:(1,-1)。那么,基于实值的像素差值向量(1,-1.5)不在圆A,B的范围内,在圆C的范围内,因此,它对应的二值向量为(0,0,1);同理,(-√2/2,√2/2)位于圆A和B的范围内,不在圆C的范围内,因此,它对应的二值向量为(1,1,0);再比如:(-1,-1)不在任何一个球的范围内,故其二值向量为(0,0,0)。
步骤104、对所述第一二值向量进行聚类,获取聚类得到的多个视觉单词;
可选的,可以利用K-Means算法对第一二值向量进行聚类,分别将聚类得到的k个类别中的几何中心点作为所述视觉单词;k为预设的大于0的整数。
例如,以二维空间为例,二维空间共有4个二值向量,即(0,0),(0,1),(1,0)和(1,1)。利用K-Means方式聚类,可以将(0,0),(0,1)聚成一堆,将(1,0),(1,1)聚成一堆。当然也可以(0,0),(1,0)一堆,另两个一堆。反正就是将距离近的多个二值向量聚在一起。并取这一堆中的几何中心点作为视觉单词,在我们的例子中,可以取(0,0.5)和(1,0.5)作为单词。这样,任何二值向量均可以用这两个单词线性表示;高维空间类似。
本发明实施例中还可以利用无监督的聚类算法进行聚类。
步骤105、对测试人脸图像进行局部块的划分,得到所述测试人脸图像对应的多个局部块,并提取测试人脸图像中每个所述局部块中每个像素点对应的像素差值向量;
该步骤中提取像素差值向量的过程与步骤101中的相同,此处不再赘述。
步骤106、根据所述球哈希函数的参数对所述测试人脸图像对应的多个像素差值向量进行二值编码,得到所述像素差值向量对应的第二二值向量;
该步骤中而孩子编码的过程与步骤103中的相同,此处不再赘述。
步骤107、根据所述视觉单词对所述第二二值向量进行特征表示得到特征向量,并根据所述特征向量进行人脸识别。
具体的,可以根据所述视觉单词对所述第二二值向量进行线性表示,即将多个视觉单词(多个二值向量)的加权和作为第二二值向量的特征向量,并利用多个像素点对应的特征向量进行人脸识别。
权重的取值可以采用如下的方式:
将每一个视觉单词(即二值向量)与其他所有的视觉单词计算欧氏距离,得到欧氏距离最小值的个数,进行归一化,得到各个视觉单词对应的权重。
综上所述,本发明实施例的人脸识别方法,具体可分为训练阶段和测试阶段。如图2所示,其中,在训练阶段中,我们首先从训练样本中的每个训练人脸图像的局部块中提取每个像素点对应的像素差值向量;然后利用球哈希优化算法,计算球哈希函数中每个球哈希函数的参数(即每个超球体的中心点和半径);最后,利用计算得到的球哈希参数,分别将训练样本中提取的各个像素差值向量编码为二值向量的形式,即得到多个第一二值向量,并利用聚类算法(如K-Means算法)对多个第一二值向量进行聚类,得到聚类的多个类别分别对应的视觉单词,形成词袋模型。
在测试阶段中,我们同样从测试人脸图像的局部块中提取每个像素点对应的像素差值向量;然后利用训练阶段计算得到的球哈希参数,将测试人脸图像中提取的像素差值向量编码为二值向量的形式,即得到多个第二二值向量;最后,利用训练阶段学习得到的词袋模型,对第二二值向量进行特征表示。
本发明实施例的方法在以下方面均得到了优化:
1、存储量方面。由于存储一个二值数据只需要1个字节,是存储一个double类型的实值数据所需空间的1/8。且在使用稀疏存储的情况下,存储大规模数据所需的空间会进一步减少。在使用本发明的基础上,利用64个比特存储一副图像,对于一个拥有64G内存的工作站,可以存储近10亿张人脸图像,几乎能够满足现有的所有人脸识别应用。
2、计算速度方面。二值运算只需要对0和1进行数值计算,而计算机底层的逻辑电路可以极快地完成这项运算。因此,使用二值编码能够加快人脸识别算法的训练过程和测试过程。本发明比现有水平的基于实值的人脸识别算法快近10倍。
3、人脸图像中的局部变化是否敏感方面。本发明是基于二值编码的人脸识别算法,当人脸图像中像素点的值发生变化时,基于二值编码的人脸特征向量有很大可能保持不变。从而保证了类内差异减小,类间差异增加。实验结果表明,本发明在面对各种应用场景下的人脸识别问题时,均获得了比基于实值编码的人脸识别算法更为优秀的识别性能。
4、先验知识的依赖性方面。由于本发明实施例的算法是通过从训练样本中学习得到特征向量,从而避免了依赖于先验知识的准确性,只要训练样本中存在的类内变化与实际应用场景中的具有较高的一致性,即使不加入先验先验知识,依然可以得到能够准确描述人脸图像的特征。
5、数据适应性方面。本发明利用无监督的聚类算法将利用球哈希二值编码算法得到的二值向量进一步表示为词袋模型。词袋模型中的每个“单词”即为聚类算法得到的聚类中心。使用聚类中心表示基于二值的特征向量,使得该发明在保存了对人脸图像中的局部变化具有鲁棒性的前提下,还能够为算法模型提供更优秀的数据适应性。从而使得在某一应用场景下训练得到的算法模型,可以直接应用于其他应用场景下,而不需要做出任何改变。
6、描述能力方面。本发明利用球哈希算法,该算法在高维原始空间中具有较强的空间封闭能力。对提取得到的像素差值向量进行有效编码。因此,本发明利用的球哈希算法,能够将相同人的人脸图像特征聚集在一起,同时将不同人的人脸图像特征尽可能地分隔。相比于现有技术而言,本发明具有更强的结构信息(包括:底层结构信息和中高层结构信息)描述能力。
本实施例提供的方法,通过基于球哈希的二值编码算法对人脸图像进行特征表示,使人脸识别算法能够同时具有计算存储消耗量小,计算速度快和对人脸图像中的局部变化具有鲁棒性等特点。并且利用K-Means等无监督聚类算法,对学习得到的基于二值的人脸特征向量进行聚类,并得到相应的词袋模型。使得本发明能够对于不同类型的数据(即,不同应用场景下的数据)具有较好的适应性。
本实施例提供的方法,首先提取训练样本中的多个训练人脸图像的局部块中的像素点对应的像素差值向量,然后根据球哈希优化算法得到球哈希函数的参数;进一步的,根据所述球哈希函数的参数对所述像素差值向量进行二值编码,得到所述像素差值向量对应的第一二值向量;然后,对所述第一二值向量进行聚类,获取聚类得到的多个视觉单词;进一步的,提取测试人脸图像的局部块中的像素点对应的像素差值向量;根据所述球哈希函数的参数对所述测试人脸图像对应的多个像素差值向量进行二值编码,得到所述像素差值向量对应的第二二值向量;根据所述视觉单词对所述第二二值向量进行特征表示得到特征向量,并根据所述特征向量进行人脸识别,由于采用了二值编码,因此计算存储消耗量小,计算速度快,而且对局部变化的敏感度较低,而且利用无监督的聚类算法将利用球哈希二值编码算法得到的二值向量进一步表示为词袋模型,数据适应性较高,而且由于采用的是球哈希算法,因此数据描述能力较强。
在上述实施例的基础上,本实施例中,步骤102具体可以通过如下方式实现:
根据如下公式(1)和公式(2)的目标函数进行优化,使得所述公式(1)的取值为n/2,所述公式(2)的取值为n/4,得到第i个球哈希函数的中心点pi c=pi c-1+fi;
vi=|sg|hi(sg)=+1,1≤g≤n|;(1)
vi,j=|sg|hi(sg)=+1,hj(sg)=+1,1≤g≤n|;(2)
其中,
其中,|·|表示变量的非零元素的数量,所述sg为像素差值向量,n表示像素差值向量的个数;hi(sg)和hj(sg)分别表示参数为sg的第i个和第j个球哈希函数;i的取值范围为1至K;j的取值范围为1至K-1;K为大于1的整数;pi c表示在第c次迭代时的第i个球哈希函数的中心点;pi c-1表示在第c-1次迭代时的第i个球哈希函数的中心点;pj c表示在第c次迭代时的第j个球哈希函数的中心点;c为大于0的整数;pi c-1在c=1时的初始值为预设的初始值。
具体地,球哈希优化得到的数据具有平衡的比特分布利于数据携带更多的具有判别性的消息,且哈希函数之间的独立则有利于平衡的二值比特分布。为了实现这两个目标,我们提出了如下的目标函数:
其中,hi(x)表示第i个球哈希函数。hj(x)表示第j个球哈希函数。x表示像素差值向量。为了使学习得到的二值编码数据能够尽可能地满足上述条件,我们使用两阶段的迭代优化算法,分别对空间中的超球体的中心点和半径进行优化。在优化其中一个变量时,使另一个变量保持不变,通过多次迭代运算,最终求得满足上述条件的超球体。为了清楚地表示优化的计算过程,我们设置两个变量来描述上述的目标函数:
vi=|sg|hi(sg)=+1,1≤g≤n|;(1)
vi,j=|sg|hi(sg)=+1,hj(sg)=+1,1≤g≤n|;(2)
根据上述公式(1)和公式(2)进行优化,使得所述公式(1)的取值为n/2,所述公式(2)的取值为n/4,得到第i个球哈希函数的中心点pi c=pi c-1+fi;
其中,|·|表示变量的非零元素的数量,所述sg为像素差值向量,n表示像素差值向量的个数;hi(sg)和hj(sg)分别表示参数为sg的第i个和第j个球哈希函数;i的取值范围为1至K;j的取值范围为1至K-1。vi描述的是在训练样本中的像素差值向量的集合中对于第i个球哈希函数,有多少个数值为+1的像素差值向量,它用于描述式(a)中的变化情况;vi,j描述的是在训练样本中的像素差值向量的集合中对于第i个和第j个球哈希函数的数据点对(像素差值向量对),有多少对数据点(数据点即像素差值向量)满足数值同时为+1的情况,它用于描述式(b)中的变化情况。为了求解上述目标函数,具体的优化过程如下所示:
首先,假设半径固定,计算中心点。
在这种情况下,我们即通过调整中心点的数值,使得学习得到的参数尽可能满足式(2)中的目标函数,即使变量vi,j的数值尽可能接近n/4。对于任意一对第i个和第j个球哈希函数(即两个超球体i和j)而言,当vi,j的数值大于n/4时,表明两个超球体距离过近,需要一个“排斥力”将二者分来;相反,则需要一个“吸引力”将二者拉近。如果万有引力定律一样,超球体j对于超球体i的吸引力或排斥力如下定义:
其中,pi c表示在第c次迭代时的第i个球哈希函数的中心点;pj c表示在第c次迭代时的第j个球哈希函数的中心点。故所有其他超球体中心对超球体i的合力如下所示:
故,第i个球哈希函数的中心点即可被更新为pi c=pi c-1+fi。
其中,pi c-1在c=1时的初始值为预设的初始值,即也可以采用随机的初始值。
在上述实施例的基础上,根据已经求出的中心点计算半径:
根据所述第i个球哈希函数的中心点pi c得到所述第i个球哈希函数的半径为ri=d(pi c,sn/2);
其中,sn/2表示分别将n个像素差值向量与第i个球哈希函数的中心点的距离进行升序排列之后的第n/2个像素差值向量;
d(·)表示计算欧氏距离的函数。
具体的,假设中心点固定,即已经求出中心点,然后计算半径。
在这种情况下,我们即通过调整中心点的数值,使得学习得到的参数尽可能满足式(1)中的目标函数,即使变量vi的数值尽可能接近n/2。在各个像素差值向量已经根据其对于中心点的距离进行升序排序的条件下,我们可以简单地将第i个球哈希函数的半径设置为ri=d(pi c,sn/2),其中d(·)表示计算欧氏距离的函数。
其中,在实际应用中,虽然从理论上来说,上述目标函数(a)和(b)能够得到最小的量化误差,即使得学习得到的二值向量与原有特征向量之间的差值最小。但该目标函数会使得迭代过程变得漫长,又几乎没有提高人脸识别算法的识别准确率。因此,我们考虑利用vi,j表示作为迭代过程停止的指示器。
具体地,理想条件下,vi,j的均值和标准差分别为n/4和0。我们考虑当vi,j的均值和标准差的误差分别为理想情况的10%和15%时,即可以认为该迭代过程已足够收敛,从而停止迭代过程。实验结果表明,在几乎不损失精度的情况下,能够加速上述方法的迭代过程。
在上述实施例的基础上,由于在上述的具体实施例中,将第i个球哈希函数的半径设置为ri=d(pi c,sn/2)。但这种半径赋值方法在sn/2附近数据点比较密集的情况下难以获得很好的区分效果。因此,本实施例中,可以根据如下方式计算半径:
根据所述第i个球哈希函数的中心点pi c以及公式(3)得到第i个球哈希函数的半径ri;
其中,根据公式(4)得到j的取值;
其中,
sj+1表示分别将n个像素差值向量与第i个球哈希函数的中心点的距离进行升序排列之后的第j+1个像素差值向量;sj表示分别将n个像素差值向量与第i个球哈希函数的中心点的距离进行升序排列之后的第j个像素差值向量;
α为预设值。
具体的,在实际应用中,我们可以放松对式(a)的要求,获得基于最大边缘的超球体的半径。同样是在各个像素差值向量已经根据其对于中心点的距离进行升序排序的条件下,我们选择靠近sn/2点附近的一系列数据点,用于最大边缘的优化。
其中,α用于控制对于式(a)的松弛程度,可以为预设值。而最大化边缘的数据点可定义为:
即求使得d(pi c,sj+1)-d(pi c,sj)最大的j的取值,且j∈J。
因此,最终基于最大边缘的超球体半径为:
需要说明的是,对于上述具体实施例而言,由于其基本相应于图1所示的方法实施例,所以相关之处参见图1所示方法实施例的部分说明即可。
图4为本发明基于球哈希二值编码的人脸识别装置一实施例的结构示意图。如图4所示,本实施例的基于球哈希二值编码的人脸识别装置,包括:
第一提取模块401,用于分别将训练样本中的多个训练人脸图像进行局部块的划分,得到所述训练人脸图像对应的多个局部块,并提取各个所述训练人脸图像的各个所述局部块中每个像素点对应的像素差值向量;
优化模块402,用于根据所述像素差值向量和球哈希优化算法得到球哈希函数的参数;所述球哈希函数的参数包括:中心点和半径;
第一编码模块403,用于根据所述球哈希函数的参数对所述像素差值向量进行二值编码,得到所述像素差值向量对应的第一二值向量;
聚类模块404,用于对所述第一二值向量进行聚类,获取聚类得到的多个视觉单词;
第二提取模块405,用于对测试人脸图像进行局部块的划分,得到所述测试人脸图像对应的多个局部块,并提取测试人脸图像中每个所述局部块中每个像素点对应的像素差值向量;
第二编码模块406,用于根据所述球哈希函数的参数对所述测试人脸图像对应的多个像素差值向量进行二值编码,得到所述像素差值向量对应的第二二值向量;
处理模块407,用于根据所述视觉单词对所述第二二值向量进行特征表示得到特征向量,并根据所述特征向量进行人脸识别。
可选地,作为一种可实施的方式,所述第一提取模块401,具体用于:
以每个像素点为中心,以R为半径,提取位于所述像素点四周的邻域像素点,并以顺时针方向依次将所述邻域像素点的像素值与所述像素点的像素值进行差值运算,得到所述像素点对应的N维像素差值向量;R为预设的大于0的整数;N=(2×R+1)×(2×R+1)-1。
可选地,作为一种可实施的方式,所述第二提取模块405,具体用于:
以每个像素点为中心,以R为半径,提取位于所述像素点四周的邻域像素点,并以顺时针方向依次将所述邻域像素点的像素值与所述像素点的像素值进行差值运算,得到所述像素点对应的N维像素差值向量;R为预设的大于0的整数;N=(2×R+1)×(2×R+1)-1。
可选地,作为一种可实施的方式,优化模块402,具体用于:
根据如下公式(1)和公式(2)的目标函数进行优化,使得所述公式(1)的取值为n/2,所述公式(2)的取值为n/4,得到第i个球哈希函数的中心点pi c=pi c-1+fi;
vi=|sg|hi(sg)=+1,1≤g≤n|;(1)
vi,j=|sg|hi(sg)=+1,hj(sg)=+1,1≤g≤n|;(2)
其中,
其中,|·|表示变量的非零元素的数量,所述sg为像素差值向量,n表示像素差值向量的个数;hi(sg)和hj(sg)分别表示参数为sg的第i个和第j个球哈希函数;i的取值范围为1至K;j的取值范围为1至K-1;K为大于1的整数;pi c表示在第c次迭代时的第i个球哈希函数的中心点;pi c-1表示在第c-1次迭代时的第i个球哈希函数的中心点;pj c表示在第c次迭代时的第j个球哈希函数的中心点;c为大于0的整数;pi c-1在c=1时的初始值为预设的初始值。
可选地,作为一种可实施的方式,优化模块402,具体用于:
根据所述第i个球哈希函数的中心点pi c得到所述第i个球哈希函数的半径为ri=d(pi c,sn/2);
其中,sn/2表示分别将n个像素差值向量与第i个球哈希函数的中心点的距离进行升序排列之后的第n/2个像素差值向量;
d(·)表示计算欧氏距离的函数。
可选地,作为一种可实施的方式,优化模块402,具体用于:
根据所述第i个球哈希函数的中心点pi c以及公式(3)得到第i个球哈希函数的半径ri;
其中,根据公式(4)得到j的取值;
其中,
sj+1表示分别将n个像素差值向量与第i个球哈希函数的中心点的距离进行升序排列之后的第j+1个像素差值向量;sj表示分别将n个像素差值向量与第i个球哈希函数的中心点的距离进行升序排列之后的第j个像素差值向量;
α为预设值。
可选地,作为一种可实施的方式,第一编码模块403,具体用于:
将所述像素差值向量分别代入所述球哈希函数中,将所述球哈希函数的值作为所述第一二值向量对应位置的元素。
可选地,作为一种可实施的方式,第二编码模块406,具体用于:
将所述像素差值向量分别代入所述球哈希函数中,将所述球哈希函数的值作为所述第二二值向量对应位置的元素。
可选地,作为一种可实施的方式,聚类模块404,用于:
利用K-Means算法对所述第一二值向量进行聚类,分别将聚类得到的k个类别中的几何中心点作为所述视觉单词;k为预设的大于0的整数。
可选地,作为一种可实施的方式,所述处理模块402,具体用于:
将所述视觉单词的加权和作为特征表示得到的特征向量。
本实施例的装置,可以用于执行如图1所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种基于球哈希二值编码的人脸识别方法,其特征在于,包括:
分别将训练样本中的多个训练人脸图像进行局部块的划分,得到所述训练人脸图像对应的多个局部块,并提取各个所述训练人脸图像的各个所述局部块中每个像素点对应的像素差值向量;
根据所述像素差值向量和球哈希优化算法得到球哈希函数的参数;所述球哈希函数的参数包括:中心点和半径;
根据所述球哈希函数的参数对所述像素差值向量进行二值编码,得到所述像素差值向量对应的第一二值向量;
对所述第一二值向量进行聚类,获取聚类得到的多个视觉单词;
对测试人脸图像进行局部块的划分,得到所述测试人脸图像对应的多个局部块,并提取测试人脸图像中每个所述局部块中每个像素点对应的像素差值向量;
根据所述球哈希函数的参数对所述测试人脸图像对应的多个像素差值向量进行二值编码,得到所述像素差值向量对应的第二二值向量;
根据所述视觉单词对所述第二二值向量进行特征表示得到特征向量,并根据所述特征向量进行人脸识别。
2.根据权利要求1所述的方法,其特征在于,提取各个所述训练人脸图像的各个所述局部块中每个像素点对应的像素差值向量,包括:
以每个像素点为中心,以R为半径,提取位于所述像素点四周的邻域像素点,并以顺时针方向依次将所述邻域像素点的像素值与所述像素点的像素值进行差值运算,得到所述像素点对应的N维像素差值向量;R为预设的大于0的整数;N=(2×R+1)×(2×R+1)-1。
3.根据权利要求1或2所述的方法,其特征在于,根据所述像素差值向量和球哈希优化算法得到球哈希函数的参数,包括:
根据如下公式(1)和公式(2)的目标函数进行优化,使得所述公式(1)的取值为n/2,所述公式(2)的取值为n/4,得到第i个球哈希函数的中心点pi c=pi c-1+fi;
vi=|sg|hi(sg)=+1,1≤g≤n|; (1)
vi,j=|sg|hi(sg)=+1,hj(sg)=+1,1≤g≤n|; (2)
其中,
其中,|·|表示变量的非零元素的数量,所述sg为像素差值向量,n表示像素差值向量的个数;hi(sg)和hj(sg)分别表示参数为sg的第i个和第j个球哈希函数;i的取值范围为1至K;j的取值范围为1至K-1;K为大于1的整数;pi c表示在第c次迭代时的第i个球哈希函数的中心点;pi c-1表示在第c-1次迭代时的第i个球哈希函数的中心点;pj c表示在第c次迭代时的第j个球哈希函数的中心点;c为大于0的整数;pi c-1在c=1时的初始值为预设的初始值。
4.根据权利要求3所述的方法,其特征在于,还包括:
根据所述第i个球哈希函数的中心点pi c得到所述第i个球哈希函数的半径为ri=d(pi c,sn/2);
其中,sn/2表示分别将n个像素差值向量与第i个球哈希函数的中心点的距离进行升序排列之后的第n/2个像素差值向量;
d(·)表示计算欧氏距离的函数。
5.根据权利要求3所述的方法,其特征在于,还包括:
根据所述第i个球哈希函数的中心点pi c以及公式(3)得到第i个球哈希函数的半径ri;
其中,根据公式(4)得到j的取值;
其中,
sj+1表示分别将n个像素差值向量与第i个球哈希函数的中心点的距离进行升序排列之后的第j+1个像素差值向量;sj表示分别将n个像素差值向量与第i个球哈希函数的中心点的距离进行升序排列之后的第j个像素差值向量;α为预设值。
6.根据权利要求1或2所述的方法,其特征在于,根据所述球哈希函数的参数对所述像素差值向量进行二值编码,得到所述像素差值向量对应的第一二值向量,包括:
将所述像素差值向量分别代入所述球哈希函数中,将所述球哈希函数的值作为所述第一二值向量对应位置的元素。
7.根据权利要求1或2所述的方法,其特征在于,对所述第一二值向量进行聚类,获取聚类得到的多个视觉单词,包括:
利用K-Means算法对所述第一二值向量进行聚类,分别将聚类得到的k个类别中的几何中心点作为所述视觉单词;k为预设的大于0的整数。
8.根据权利要求1或2所述的方法,其特征在于,根据所述视觉单词对所述第二二值向量进行特征表示,包括:
将所述视觉单词的加权和作为特征表示得到的特征向量。
9.一种基于球哈希二值编码的人脸识别装置,其特征在于,包括:
第一提取模块,用于分别将训练样本中的多个训练人脸图像进行局部块的划分,得到所述训练人脸图像对应的多个局部块,并提取各个所述训练人脸图像的各个所述局部块中每个像素点对应的像素差值向量;
优化模块,用于根据所述像素差值向量和球哈希优化算法得到球哈希函数的参数;所述球哈希函数的参数包括:中心点和半径;
第一编码模块,用于根据所述球哈希函数的参数对所述像素差值向量进行二值编码,得到所述像素差值向量对应的第一二值向量;
聚类模块,用于对所述第一二值向量进行聚类,获取聚类得到的多个视觉单词;
第二提取模块,用于对测试人脸图像进行局部块的划分,得到所述测试人脸图像对应的多个局部块,并提取测试人脸图像中每个所述局部块中每个像素点对应的像素差值向量;
第二编码模块,用于根据所述球哈希函数的参数对所述测试人脸图像对应的多个像素差值向量进行二值编码,得到所述像素差值向量对应的第二二值向量;
处理模块,用于根据所述视觉单词对所述第二二值向量进行特征表示得到特征向量,并根据所述特征向量进行人脸识别。
10.根据权利要求9所述的装置,其特征在于,所述第一提取模块,具体用于:
以每个像素点为中心,以R为半径,提取位于所述像素点四周的邻域像素点,并以顺时针方向依次将所述邻域像素点的像素值与所述像素点的像素值进行差值运算,得到所述像素点对应的N维像素差值向量;R为预设的大于0的整数;N=(2×R+1)×(2×R+1)-1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610513332.9A CN105930834B (zh) | 2016-07-01 | 2016-07-01 | 基于球哈希二值编码的人脸识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610513332.9A CN105930834B (zh) | 2016-07-01 | 2016-07-01 | 基于球哈希二值编码的人脸识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105930834A true CN105930834A (zh) | 2016-09-07 |
CN105930834B CN105930834B (zh) | 2019-04-09 |
Family
ID=56828481
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610513332.9A Active CN105930834B (zh) | 2016-07-01 | 2016-07-01 | 基于球哈希二值编码的人脸识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105930834B (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106503696A (zh) * | 2016-12-05 | 2017-03-15 | 电子科技大学 | 一种针对视觉映射目标值的增强编码方法 |
CN106503648A (zh) * | 2016-10-20 | 2017-03-15 | 北京邮电大学 | 基于稀疏投影二值编码的人脸识别方法及装置 |
CN106980825A (zh) * | 2017-03-15 | 2017-07-25 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 一种基于归一化像素差特征的人脸姿势分类方法 |
CN107463917A (zh) * | 2017-08-16 | 2017-12-12 | 重庆邮电大学 | 一种基于改进的ltp与二维双向pca融合的人脸特征提取方法 |
CN109086692A (zh) * | 2018-07-16 | 2018-12-25 | 北京建筑大学 | 一种人脸识别装置和方法 |
CN109657623A (zh) * | 2018-12-21 | 2019-04-19 | 湖南星汉数智科技有限公司 | 一种人脸图像相似度计算方法、装置、计算机装置及计算机可读存储介质 |
CN109710792A (zh) * | 2018-12-24 | 2019-05-03 | 西安烽火软件科技有限公司 | 一种基于索引的快速人脸检索系统应用 |
CN110399897A (zh) * | 2019-04-10 | 2019-11-01 | 北京百卓网络技术有限公司 | 图像识别方法和装置 |
RU2714856C1 (ru) * | 2019-03-22 | 2020-02-19 | Общество с ограниченной ответственностью "Ак Барс Цифровые Технологии" | Система идентификации пользователя для совершения электронной сделки для предоставления услуги или покупки товара |
CN115062180A (zh) * | 2022-08-15 | 2022-09-16 | 阿里巴巴(中国)有限公司 | 对象查询的方法、电子设备及存储介质 |
CN117219248A (zh) * | 2023-11-09 | 2023-12-12 | 南通林德安全设备科技有限公司 | 一种用于消毒供应室的医疗器械管理方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090060291A1 (en) * | 2007-09-03 | 2009-03-05 | Sony Corporation | Information processing apparatus, information processing method, and computer program |
CN102982165A (zh) * | 2012-12-10 | 2013-03-20 | 南京大学 | 一种大规模人脸图像检索方法 |
CN103051888A (zh) * | 2011-10-14 | 2013-04-17 | 华晶科技股份有限公司 | 产生动态影像的影像处理方法及其影像获取装置 |
US20150169644A1 (en) * | 2013-01-03 | 2015-06-18 | Google Inc. | Shape-Gain Sketches for Fast Image Similarity Search |
CN105139003A (zh) * | 2015-09-17 | 2015-12-09 | 桂林远望智能通信科技有限公司 | 一种动态人脸识别系统及方法 |
-
2016
- 2016-07-01 CN CN201610513332.9A patent/CN105930834B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090060291A1 (en) * | 2007-09-03 | 2009-03-05 | Sony Corporation | Information processing apparatus, information processing method, and computer program |
CN103051888A (zh) * | 2011-10-14 | 2013-04-17 | 华晶科技股份有限公司 | 产生动态影像的影像处理方法及其影像获取装置 |
CN102982165A (zh) * | 2012-12-10 | 2013-03-20 | 南京大学 | 一种大规模人脸图像检索方法 |
US20150169644A1 (en) * | 2013-01-03 | 2015-06-18 | Google Inc. | Shape-Gain Sketches for Fast Image Similarity Search |
CN105139003A (zh) * | 2015-09-17 | 2015-12-09 | 桂林远望智能通信科技有限公司 | 一种动态人脸识别系统及方法 |
Non-Patent Citations (2)
Title |
---|
李 皓等: "基于球哈希和改进的灰度差算法的视频拷贝检测", 《计算机应用与软件》 * |
李照奎等: "基于差值局部方向模式的人脸特征表示", 《软件学报》 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106503648A (zh) * | 2016-10-20 | 2017-03-15 | 北京邮电大学 | 基于稀疏投影二值编码的人脸识别方法及装置 |
CN106503696B (zh) * | 2016-12-05 | 2019-08-13 | 电子科技大学 | 一种针对视觉映射目标值的增强编码方法 |
CN106503696A (zh) * | 2016-12-05 | 2017-03-15 | 电子科技大学 | 一种针对视觉映射目标值的增强编码方法 |
CN106980825A (zh) * | 2017-03-15 | 2017-07-25 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 一种基于归一化像素差特征的人脸姿势分类方法 |
CN107463917A (zh) * | 2017-08-16 | 2017-12-12 | 重庆邮电大学 | 一种基于改进的ltp与二维双向pca融合的人脸特征提取方法 |
CN107463917B (zh) * | 2017-08-16 | 2021-05-18 | 重庆邮电大学 | 一种基于改进的ltp与二维双向pca融合的人脸特征提取方法 |
CN109086692A (zh) * | 2018-07-16 | 2018-12-25 | 北京建筑大学 | 一种人脸识别装置和方法 |
CN109657623A (zh) * | 2018-12-21 | 2019-04-19 | 湖南星汉数智科技有限公司 | 一种人脸图像相似度计算方法、装置、计算机装置及计算机可读存储介质 |
CN109657623B (zh) * | 2018-12-21 | 2021-07-23 | 湖南星汉数智科技有限公司 | 一种人脸图像相似度计算方法、装置、计算机装置及计算机可读存储介质 |
CN109710792B (zh) * | 2018-12-24 | 2023-02-03 | 西安烽火软件科技有限公司 | 一种基于索引的快速人脸检索系统应用 |
CN109710792A (zh) * | 2018-12-24 | 2019-05-03 | 西安烽火软件科技有限公司 | 一种基于索引的快速人脸检索系统应用 |
RU2714856C1 (ru) * | 2019-03-22 | 2020-02-19 | Общество с ограниченной ответственностью "Ак Барс Цифровые Технологии" | Система идентификации пользователя для совершения электронной сделки для предоставления услуги или покупки товара |
CN110399897A (zh) * | 2019-04-10 | 2019-11-01 | 北京百卓网络技术有限公司 | 图像识别方法和装置 |
CN110399897B (zh) * | 2019-04-10 | 2021-11-02 | 北京百卓网络技术有限公司 | 图像识别方法和装置 |
CN115062180A (zh) * | 2022-08-15 | 2022-09-16 | 阿里巴巴(中国)有限公司 | 对象查询的方法、电子设备及存储介质 |
CN117219248A (zh) * | 2023-11-09 | 2023-12-12 | 南通林德安全设备科技有限公司 | 一种用于消毒供应室的医疗器械管理方法 |
CN117219248B (zh) * | 2023-11-09 | 2024-02-23 | 南通林德安全设备科技有限公司 | 一种用于消毒供应室的医疗器械管理方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105930834B (zh) | 2019-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105930834A (zh) | 基于球哈希二值编码的人脸识别方法及装置 | |
Thai et al. | Image classification using support vector machine and artificial neural network | |
CN106845421B (zh) | 基于多区域特征与度量学习的人脸特征识别方法及系统 | |
CN108564129B (zh) | 一种基于生成对抗网络的轨迹数据分类方法 | |
Wu et al. | Deep convolutional neural network with independent softmax for large scale face recognition | |
CN102663370B (zh) | 一种人脸识别的方法及系统 | |
US20230085401A1 (en) | Method of training an image classification model | |
Ali et al. | Boosted NNE collections for multicultural facial expression recognition | |
CN106022317A (zh) | 人脸识别方法及装置 | |
CN106415594A (zh) | 用于面部验证的方法和系统 | |
CN104239858B (zh) | 一种人脸特征验证的方法和装置 | |
CN106951825A (zh) | 一种人脸图像质量评估系统以及实现方法 | |
CN105303179A (zh) | 指纹识别方法、装置 | |
CN104933428B (zh) | 一种基于张量描述的人脸识别方法及装置 | |
CN104063876A (zh) | 一种交互式图像分割方法 | |
CN108074016B (zh) | 基于位置社交网络的用户关系强度预测方法、装置及设备 | |
CN103136504A (zh) | 人脸识别方法及装置 | |
CN106778796A (zh) | 基于混合式协同训练的人体动作识别方法及系统 | |
CN108681735A (zh) | 基于卷积神经网络深度学习模型的光学字符识别方法 | |
CN109919252A (zh) | 利用少数标注图像生成分类器的方法 | |
CN106778714B (zh) | 基于非线性特征和模型合并的lda人脸识别方法 | |
CN104881684A (zh) | 一种立体图像质量客观评价方法 | |
CN109344709A (zh) | 一种人脸生成伪造图像的检测方法 | |
CN104978569A (zh) | 一种基于稀疏表示的增量人脸识别方法 | |
CN104598898B (zh) | 一种基于多任务拓扑学习的航拍图像快速识别系统及其快速识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |