CN106845462A - 基于三元组诱导的同时选择特征及聚类的人脸识别方法 - Google Patents
基于三元组诱导的同时选择特征及聚类的人脸识别方法 Download PDFInfo
- Publication number
- CN106845462A CN106845462A CN201710166508.2A CN201710166508A CN106845462A CN 106845462 A CN106845462 A CN 106845462A CN 201710166508 A CN201710166508 A CN 201710166508A CN 106845462 A CN106845462 A CN 106845462A
- Authority
- CN
- China
- Prior art keywords
- matrix
- cluster
- feature
- triple
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Abstract
本发明公开一种可提高识别精确率的基于三元组诱导的同时选择特征及聚类的人脸识别方法,特征提取及模型训练按如下步骤进行:首先对获取的样本进行预处理,得到中心的像素部分,通过相同的随机矩阵映射为等长的随机人脸特征列向量,得到由列向量为单位构成的矩阵;构造一个由三元组诱导的图,并按照提出的基于三元组诱导的同时进行人脸特征选择和聚类的一般化框架进行模型训练;利用半二次技术,通过交替最小化增广函数的算法来优化目标函数,学习特征选择矩阵W和聚类伪标签矩阵V。
Description
技术领域
本发明涉及一种人脸识别技术,尤其是一种可提高识别精确率的基于三元组诱导的同时选择特征及聚类的人脸识别方法。
背景技术
目前,人脸识别技术已在视频监控、证件验证、刑侦破案等社会生活的诸多方面发挥着巨大作用。常规的人脸识别技术有特征提取、模型训练及聚类三步骤,其中的模型训练过程是同时选择特征及聚类建立模型的训练。
特征选择根据标签是否给出一般分为两个主要类别:监督型和非监督型。监督特征选择的目的在于选择判决特征(因为已经提供了数据的类别标签,这些标签都包含必要的判决信息),然而要想获得标签信息却费时费力,这就使得许多基于特征选择的任务更具有挑战性。非监督特征选择方法得益于在数据中预先定义好的或潜在的几何结构,然而对于很多非监督特征选择方法,不能保持在每个数据点的邻域中含有的拓扑信息(排序局部性,也就是近邻的相对远近程度),只是简单地将距离作为相似性度量来确定每个数据点的近邻,所以在特征选择之后,一个数据点的某些近邻可能会拥有完全相同的距离排序,甚至是与特征选择之前相反的距离排序,这种情况会对基于距离的聚类结果产生不利影响,影响分类的准确率。
发明内容
本发明是为了解决现有技术所存在的上述技术问题,提供一种可提高识别精确率的基于三元组诱导的同时选择特征及聚类的人脸识别方法。
本发明的技术解决方案是:一种基于三元组诱导的同时选择特征及聚类的人脸识别方法,包括特征提取、模型训练及聚类,其特征在于所述特征提取及模型训练按照如下步骤进行:
步骤S1:对获取的n个样本进行预处理,得到中心的像素部分,用随机矩阵对样本进行映射,使每个样本均得到一个对应的随机人脸特征列向量,即n个样本的原始数据矩阵;
步骤S2:基于三元组诱导的求解模型为:
(1)
式(1)中:
是含有n个样本的原始数据矩阵;
是特征选择矩阵;
是标量常数,取值范围;
和是由目标矩阵分解得到的两个新矩阵,即潜在的正交基矩阵和伪标签矩阵,所述,;
所述,D是对角矩阵,第个对角元素等于;
是一个权重矩阵,其位置的元素为
;
是一个下标集合,对应于的k个最近邻的序号,k为每个样本近邻的数目,是一个反对称矩阵,在位置的元素等于;
步骤S3,基于半二次理论,由式(1)得到需要进行交替最小化的增广函数:
(2)
式中P为存储辅助变量的阶对角矩阵,t为第t次迭代;
交替最小化优化求解目标函数:
a. 保持不变,更新,令关于U的一阶偏导为零,得到零梯度条件,利用正交半非负矩阵分解得到;
b. 保持不变,更新W,在的表达式中,用替代U,然后求解:,利用特征值分解得到W;
交替执行上述a、b,直到算法收敛。
本发明借鉴多种非监督特征选择方法在过滤无标记数据的非重要特征的有效性,很好地保持了数据点的排序局部性,将人脸特征信息置于一个同时进行特征选择和聚类的框架下学习,更加有利于后续基于距离的聚类任务,可以在非监督的情况下选出更有判决力的特征,从而获得最佳识别效果,提高了人脸识别的准确率。
附图说明
图1是本发明实施例的流程图;
图2是本发明实施例ORL人脸数据库中的人脸图像举例。
具体实施方式
本发明的流程如图1所示:与现有的人脸识别方法相同,有三个处理环节,分别是特征提取、模型训练及聚类。与现有技术所不同的是本发明的样本特征提取及模型训练按如下步骤进行:
步骤S1:对获取的n个样本进行预处理,得到中心的像素部分,用随机矩阵对样本进行映射,使每个样本均得到一个对应的随机人脸特征列向量,即n个样本的原始数据矩阵;
步骤S2:构造一个由三元组诱导的图,基于三元组诱导的求解模型为:
(1)
式(1)中:
是含有n个样本的原始数据矩阵;
是投影矩阵,即特征选择矩阵;
是标量常数,取值范围;
和是由目标矩阵分解得到的两个新矩阵,即潜在的正交基矩阵和伪标签矩阵,所述,;
所述,D是对角矩阵,第个对角元素等于;
是一个权重矩阵,其位置的元素为
;
是一个下标集合,对应于的k个最近邻的序号,k为每个样本近邻的数目,是一个反对称矩阵,在位置的元素等于;
上述分类模型增加了对W的正交约束,抑制了选择出的任意两个维度的特征的相似性,正交约束也避免了任意的尺度缩放和全零的平凡解,这使得公式(1)可以选择出更有判决力的特征。
第一部分是基本的特征选择算法模型:
第二部分是保持排序局部性的损失函数。排序局部性(近邻的相对远近程度)描述了数据的局部结构,除了数据点的近邻关系以外,它还强调了每个数据点的近邻的远近排序。对任意数据集,用表示选择的特征组,则给出一个由以及它的近邻和组成的三元组,其对应的选择出来的特征组也构成了一个三元组。设是距离度量,当以下条件成立时,一个特征选择过程就是排序局部性得到保持的:如果,则。
基于此,为每个数据点确定恰当的特征组等价于优化下面的保持排序局部性的损失函数如下:
设是一个权重矩阵,其位置的元素为
用欧式距离表示每个成对距离,上述保持排序局部性的损失函数可以写成的形式,其等价的矩阵表示形式即。
本发明提出的计算权重矩阵的方法是基于三元组的,能同时保持近邻关系和排序信息。计算权重矩阵C后并计算其对应的拉普拉斯矩阵L,其中,D是对角矩阵,第i个对角元素等于。
第三部分是从本分类模型推导出的同时进行特征选择和聚类的一般化框架。一方面,它可以与在映射后的数据上进行K均值聚类有极大的联系;另一方面,它可以与各种基于图的学习方法结合起来。采用基于相似性和最大间隔的图:
当= 0 时,模型(1)等价于同时进行特征选择和K均值聚类;
当时,
或者在每个数据点近邻空间中用其它权重形式计算时,就构造了一个基于相似性的图,利用这种针对每对样本的二元组关系,数据的相似性可以被保持下来;
当时,就构造了一个基于最大间隔的图,利用这种针对每对样本的二元组关系,全局关系得到了保持,最大限度地提高数据整体的可分性,而且能同时保持最小的类内离散度。
本分类模型构造了一个由三元组诱导的图,利用这种针对每个样本的局部邻域的三元组关系,保持了排序局部性。
步骤S3,基于半二次理论,由式(1)得到需要进行交替最小化的增广函数:
(2)
式中P为存储辅助变量的阶对角矩阵,t为第t次迭代;
交替最小化优化求解目标函数:
a.保持不变,更新,令关于U的一阶偏导为零,得到零梯度条件,利用正交半非负矩阵分解得到;
b. 保持不变,更新W,在的表达式中,用替代U,然后求解:,利用特征值分解得到W;
交替执行上述a、b,直到算法收敛(达到最大迭代次数)。
基于半二次理论,由式(1)得到需要进行交替最小化的增广函数的具体步骤如下:
初始化W(选择阶单位阵的个不同的列作为,设置t=0),利用半二次技术,使用交替搜索策略,可以通过交替最小化增广函数来优化目标函数。
对于固定的存在一个共轭函数满足,其中是极小化函数确定的辅助变量,则式中P是一个存储辅助变量的阶对角矩阵,是共轭函数。按如下方式交替最小化增广函数:
其中t代表第t次迭代,
。
交替最小化优化求解目标函数具体步骤如下:
S31,对于训练集中的人脸特征,保持W不变,更新,而正交半非负矩阵分解问题等价于K均值聚类,使用正交半非负矩阵分解的方法更新,令关于U的一阶偏导为零,得到零梯度条件;
S32,保持不变,更新W,在的表达式中,用替代U,然后求解
通过对进行特征值分解可得到上式的解,最优的W由个最小特征值对应的个特征向量组成。
为了详细说明本发明具体实施方式及验证本发明的有效性,将本发明提出的方法应用于一个公开的人脸图像库,即ORL数据库。该数据库包含40个人的400张黑白图像。这些图像中的人脸姿态,光照,遮挡度各异,充分模拟了实际环境。图2展示了本实验所使用的图像,采用由20个男人20个女人的400张图片构成的数据子集。每张人脸图像经过预处理后大小为35×35,使用随机矩阵映射得到1024维列向量作为训练和测试的输入特征。
首先将所有样本数据输入本发明实施例的聚类模型函数进行训练,其中每个样本的近邻参数k设为5,训练完成后得到同时进行特征选择和聚类的结果:特征选择矩阵W和聚类伪标签矩阵V;然后进行K均值聚类,输出人脸识别结果。
下表展示了本发明实验例在精确度(ACC)、归一化互信息(NMI)2个指标上和其他方法的对比,其中LapScore来自于He, X.; Cai, D.; and Niyogi, P.的文章《特征选择中的拉普拉斯评分方法》,MCFS来自于Cai, D.; Zhang, C.; and He, X.的文章《多类簇非监督特征选择方法》,UDFS来自于Yang, Y.; Shen, H.; Ma, Z.; Huang, Z.; and Zhou, X.的文章《非监督学习判决特征选择》,NDFS来自于Li, Z.; Yang, Y.; Liu, J.; Zhou, X.;and Lu, H.的文章《非负判决非监督特征选择》,RUFS来自于Qian, M., and Zhai, C.的文章《鲁棒非监督特征选择》,SOCFS来自于Han, D. and Kim, J.的文章《同时正交基聚类与非监督特征选择》。
结果表明:与现有技术相比,本发明在人脸识别的精确度和归一化互信息上有明显的提高。
Claims (1)
1.一种基于三元组诱导的同时选择特征及聚类的人脸识别方法,包括特征提取、模型训练及聚类,其特征在于所述特征提取及模型训练按照如下步骤进行:
步骤S1:对获取的n个样本进行预处理,得到中心的像素部分,用随机矩阵对样本进行映射,使每个样本均得到一个对应的随机人脸特征列向量,即n个样本的原始数据矩阵;
步骤S2:基于三元组诱导的求解模型为:
(1)
式(1)中:
是含有n个样本的原始数据矩阵;
是特征选择矩阵;
是标量常数,取值范围;
和是由目标矩阵分解得到的两个新矩阵,即潜在的正交基矩阵和伪标签矩阵,所述,;
所述,D是对角矩阵,第个对角元素等于;
是一个权重矩阵,其位置的元素为
;
是一个下标集合,对应于的k个最近邻的序号,k为每个样本近邻的数目,是一个反对称矩阵,在位置的元素等于;
步骤S3,基于半二次理论,由式(1)得到需要进行交替最小化的增广函数:
(2)
式中P为存储辅助变量的阶对角矩阵,t为第t次迭代;
交替最小化优化求解目标函数:
a. 保持不变,更新,令关于U的一阶偏导为零,得到零梯度条件,利用正交半非负矩阵分解得到;
b. 保持不变,更新W,在的表达式中,用替代U,然后求解:,利用特征值分解得到W;
交替执行上述a、b,直到算法收敛。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710166508.2A CN106845462A (zh) | 2017-03-20 | 2017-03-20 | 基于三元组诱导的同时选择特征及聚类的人脸识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710166508.2A CN106845462A (zh) | 2017-03-20 | 2017-03-20 | 基于三元组诱导的同时选择特征及聚类的人脸识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106845462A true CN106845462A (zh) | 2017-06-13 |
Family
ID=59129970
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710166508.2A Pending CN106845462A (zh) | 2017-03-20 | 2017-03-20 | 基于三元组诱导的同时选择特征及聚类的人脸识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106845462A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107330383A (zh) * | 2017-06-18 | 2017-11-07 | 天津大学 | 一种基于深度卷积神经网络的人脸识别方法 |
CN108197670A (zh) * | 2018-01-31 | 2018-06-22 | 国信优易数据有限公司 | 伪标签生成模型训练方法、装置及伪标签生成方法及装置 |
CN109033815A (zh) * | 2018-06-15 | 2018-12-18 | 国网浙江省电力有限公司 | 基于矩阵分解的Webshell检测方法 |
CN109815887A (zh) * | 2019-01-21 | 2019-05-28 | 浙江工业大学 | 一种基于多智能体协作的复杂光照下人脸图像的分类方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103136504A (zh) * | 2011-11-28 | 2013-06-05 | 汉王科技股份有限公司 | 人脸识别方法及装置 |
US20130238667A1 (en) * | 2012-02-23 | 2013-09-12 | Fujitsu Limited | Database, apparatus, and method for storing encoded triples |
CN104166653A (zh) * | 2013-05-17 | 2014-11-26 | 北京百度网讯科技有限公司 | 网站的三元组挖掘方法以及三元组挖掘装置 |
-
2017
- 2017-03-20 CN CN201710166508.2A patent/CN106845462A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103136504A (zh) * | 2011-11-28 | 2013-06-05 | 汉王科技股份有限公司 | 人脸识别方法及装置 |
US20130238667A1 (en) * | 2012-02-23 | 2013-09-12 | Fujitsu Limited | Database, apparatus, and method for storing encoded triples |
CN104166653A (zh) * | 2013-05-17 | 2014-11-26 | 北京百度网讯科技有限公司 | 网站的三元组挖掘方法以及三元组挖掘装置 |
Non-Patent Citations (1)
Title |
---|
郭君: ""基于三元组图模型的数据拓扑结构研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107330383A (zh) * | 2017-06-18 | 2017-11-07 | 天津大学 | 一种基于深度卷积神经网络的人脸识别方法 |
CN108197670A (zh) * | 2018-01-31 | 2018-06-22 | 国信优易数据有限公司 | 伪标签生成模型训练方法、装置及伪标签生成方法及装置 |
CN108197670B (zh) * | 2018-01-31 | 2021-06-15 | 国信优易数据股份有限公司 | 伪标签生成模型训练方法、装置及伪标签生成方法及装置 |
CN109033815A (zh) * | 2018-06-15 | 2018-12-18 | 国网浙江省电力有限公司 | 基于矩阵分解的Webshell检测方法 |
CN109815887A (zh) * | 2019-01-21 | 2019-05-28 | 浙江工业大学 | 一种基于多智能体协作的复杂光照下人脸图像的分类方法 |
CN109815887B (zh) * | 2019-01-21 | 2020-10-16 | 浙江工业大学 | 一种基于多智能体协作的复杂光照下人脸图像的分类方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Huang et al. | Building deep networks on grassmann manifolds | |
Wu et al. | Personnet: Person re-identification with deep convolutional neural networks | |
Yang et al. | KPCA plus LDA: a complete kernel Fisher discriminant framework for feature extraction and recognition | |
WO2019015246A1 (zh) | 图像特征获取 | |
Ali et al. | Boosted NNE collections for multicultural facial expression recognition | |
US8005767B1 (en) | System and method of classifying events | |
Osherov et al. | Increasing cnn robustness to occlusions by reducing filter support | |
CN102609681A (zh) | 基于字典学习模型的人脸识别方法 | |
CN106845462A (zh) | 基于三元组诱导的同时选择特征及聚类的人脸识别方法 | |
Chakraborty et al. | Simultaneous variable weighting and determining the number of clusters—A weighted Gaussian means algorithm | |
CN109034080A (zh) | 多源域自适应的人脸识别方法 | |
Fu et al. | FERLrTc: 2D+ 3D facial expression recognition via low-rank tensor completion | |
CN110781766B (zh) | 基于特征谱正则化的格拉斯曼流形判别分析图像识别方法 | |
CN106991355A (zh) | 基于拓扑保持的解析型字典学习模型的人脸识别方法 | |
CN110751027B (zh) | 一种基于深度多示例学习的行人重识别方法 | |
CN109784405A (zh) | 基于伪标签学习和语义一致性的跨模态检索方法及系统 | |
CN113158955B (zh) | 基于聚类引导和成对度量三元组损失的行人重识别方法 | |
Yu et al. | Graph-regularized non-negative tensor-ring decomposition for multiway representation learning | |
Huang et al. | Complete local Fisher discriminant analysis with Laplacian score ranking for face recognition | |
Xu et al. | Discriminative analysis for symmetric positive definite matrices on lie groups | |
CN114708637A (zh) | 一种基于元学习的人脸动作单元检测方法 | |
CN104572930B (zh) | 数据分类方法及装置 | |
Jia et al. | Multiple metric learning with query adaptive weights and multi-task re-weighting for person re-identification | |
Lan et al. | Soft-constrained nonnegative matrix factorization via normalization | |
CN113743266B (zh) | 基于人工黏菌的人脸识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information | ||
CB03 | Change of inventor or designer information |
Inventor after: Guo Yanqing Inventor after: Zheng Xin Inventor before: Guo Yanqing |
|
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170613 |