CN103854015B - 基于联合稀疏描述的多姿态三维人脸识别方法 - Google Patents
基于联合稀疏描述的多姿态三维人脸识别方法 Download PDFInfo
- Publication number
- CN103854015B CN103854015B CN201410100110.5A CN201410100110A CN103854015B CN 103854015 B CN103854015 B CN 103854015B CN 201410100110 A CN201410100110 A CN 201410100110A CN 103854015 B CN103854015 B CN 103854015B
- Authority
- CN
- China
- Prior art keywords
- description
- joint
- pose
- sparse
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Abstract
本发明公开了一种基于联合稀疏描述的多姿态三维人脸识别方法,用于解决现有多姿态三维人脸识别方法鲁棒性差的技术问题。技术方案是对数据库中每一个三维人脸数据的全部顶点顺次排列,作为列向量构建三维空间联合字典。然后,对给定测试个体的多个视角观测值,将其按列排序,合并为一个矩阵,用关于三维空间联合字典的系数矩阵进行稀疏性描述,并通过构建联合稀疏性约束来实现对多姿态观测数据的稀疏联合求解。最后,基于重建出的稀疏描述矩阵,通过构建一个强制置零函数,对所有多姿态数据合并重建残差,并通过计算残差最小的方法确定测试数据所属的类别。经测试,对姿态变化较大的三维人脸数据,识别率由背景技术的89.8%提高到93.4%。
Description
技术领域
本发明涉及一种多姿态三维人脸识别方法,特别涉及一种基于联合稀疏描述的多姿态三维人脸识别方法。
背景技术
在三维人脸识别的实际应用过程中,由于人脸姿态的变化,容易导致获取的三维数据存在遮挡和数据缺失,因此会造成数据的不可靠性。基于多姿态数据的三维人脸识别能够克服单个姿态数据受遮挡或数据缺失影响,提高识别系统对人脸姿态变化的鲁棒性。
文献“Ishimoto M,Yenwei Chen.Pose-robust face recognition based on3Dshape reconstruction.In:Proceedings of ICNC2009,pp.40-43.”公开了一种多姿态三维人脸识别方法。该方法利用三维重建方法将多个不同姿态的二维人脸数据重建出三维人脸形状模型,辅助完成人脸识别。首先,选取反映整体信息的不同姿态人脸数据,基于三维重建的方法重建出三维人脸形状模型;然后,基于构造出的三维人脸形状模型,通过投影技术获取到新的姿态变化下的人脸数据;最后,基于构建出的多姿态人脸数据完成人脸识别。但是,该方法存在以下问题:首先,该方法中重建出的三维人脸形状模型受二维人脸数据质量的影响较大;其次,采用投影技术获取到的多姿态人脸数据虽然能够反映相应姿态变化下的人脸信息,但是由于获得的多姿态人脸数据均由同一三维人脸形状模型投影产生,彼此相关性非常高,对实际应用中的人脸姿态变化鲁棒性较差。对姿态变化较小三维人脸数据,识别率为92.9%,对于姿态变化较大的三维人脸数据,识别率为89.8%。
发明内容
为了克服现有多姿态三维人脸识别方法鲁棒性差的不足,本发明提供一种基于联合稀疏描述的多姿态三维人脸识别方法。该方法对数据库中的每一个三维人脸数据的全部顶点顺次排列,作为列向量,由此构建三维空间联合字典。然后,对给定测试个体的多个视角观测值,将其按列排序,合并为一个矩阵,用关于三维空间联合字典的系数矩阵进行稀疏性描述,并通过构建联合稀疏性约束来实现对多姿态观测数据的稀疏联合求解。最后,基于重建出的稀疏描述矩阵,通过构建一个强制置零函数,对所有多姿态数据合并重建残差,并通过计算残差最小的方法确定测试数据所属的类别。由于本发明采用联合稀疏描述的思路进行多姿态三维人脸识别,基于多姿态观测值组成的集合来进行人脸分类,能够利用获取到的所有姿态变化观测值的相互关系,避免单独对待每一个观测值时所潜在的错误判别风险,从而提高对姿态变化的鲁棒性,实现了对多姿态三维人脸的识别。
本发明解决其技术问题所采用的技术方案是:一种基于联合稀疏描述的多姿态三维人脸识别方法,其特点是包括以下步骤:
第一步、给定一个三维人脸数据,将全部顶点顺次排列描述网格的拓扑连接结构,作为类字典的列向量。三维人脸数据的每一个顶点都包含三个参数,列向量的每一个元素近似一个结构体,由三个分量组成。
给定同属于类别i的Si个训练人脸数据,i=1,2,...,C,表示在数据库中共有C个不同类别的人脸数据;由这些数据构建的类字典记为Ai,表示为:其中表示属于类别i的第j个训练人脸数据的向量表示,j=1,2,...,Si。
整个训练集的超完备字典A由C个类别的共计S个训练样本的线性组合来构建,其表达式为:
式中,是训练样本的总数。A即为所构建的三维空间联合字典。
第二步、给定一个测试个体的M个不同视角观测值y1,y2,...,yM,将其按列排序,合并为一个单视角矩阵,记为Y=[y1,y2,...,yM],采用关于三维空间联合字典A的系数矩阵α=[α1,α2,...,αM]来进行稀疏性描述。其稀疏描述问题表示如下:
式中,K是稀疏性级别,描述了字典中有效数据元素的个数。
对向量的描述采用建立联合稀疏性约束,在该约束中,多维稀疏性描述向量有着同样的稀疏性类型。多姿态观测样本的稀疏性描述通过对如下的最优化问题的联合求解重建得出。
式中,表示Frobenius范数。是复合范数表达式,其含义为首先对α的每一行进行l2范数求解,然后再对结果向量进行l0范数求解。
第三步、在重建出稀疏描述矩阵后,基于对同一个测试个体的所有视角观测值Y合并重建残差。具体公式为:
式中,作为一个矩阵操作符,能够保留中与第i类所对应的系数值,而将其他值强制置零。采用Frobenius范数||·||F合并所有视图的重建误差。
本发明的有益效果是:该方法对数据库中的每一个三维人脸数据的全部顶点顺次排列,作为列向量,由此构建三维空间联合字典。然后,对给定测试个体的多个视角观测值,将其按列排序,合并为一个矩阵,用关于三维空间联合字典的系数矩阵进行稀疏性描述,并通过构建联合稀疏性约束来实现对多姿态观测数据的稀疏联合求解。最后,基于重建出的稀疏描述矩阵,通过构建一个强制置零函数,对所有多姿态数据合并重建残差,并通过计算残差最小的方法确定测试数据所属的类别。由于本发明采用联合稀疏描述的思路进行多姿态三维人脸识别,基于多姿态观测值组成的集合来进行人脸分类,能够利用获取到的所有姿态变化观测值的相互关系,避免单独对待每一个观测值时所潜在的错误判别风险,从而提高对姿态变化的鲁棒性,实现了对多姿态三维人脸的识别。经测试,对正面姿态三维人脸数据的识别率达到97.2%,对姿态变化较小三维人脸数据,识别率达到95.8%,高于文献方法的92.9%,对于姿态变化较大的三维人脸数据,本发明具有显著的优越性,识别率达到93.4%,远远高于文献方法的识别率89.8%。
以下结合具体实施方式详细说明本发明。
具体实施方式
1三维空间联合字典构建。
给定一个三维人脸数据,将全部顶点顺次排列描述网格的拓扑连接结构,作为类字典的列向量。由于三维人脸数据的每一个顶点都包含三个参数,因此列向量的每一个元素近似一个结构体,由三个分量组成。
给定同属于类别i的Si个训练人脸数据(i=1,2,...,C,表示在数据库中共有C个不同类别的人脸数据),由这些数据构建的类字典记为Ai,表示为:其中表示属于类别i的第j个训练人脸数据的向量表示,j=1,2,...,Si。
整个训练集的超完备字典A可以由C个类别的共计S个训练样本的线性组合来构建,其表达式为:
其中,是训练样本的总数。A即为所构建的三维空间联合字典。
2联合稀疏描述模型构建。
给定一个测试个体的M个不同视角观测值y1,y2,...,yM,将其按列排序,合并为一个单视角矩阵,记为Y=[y1,y2,...,yM],采用关于三维空间联合字典A的系数矩阵α=[α1,α2,...,αM]来进行稀疏性描述。其稀疏描述问题表示如下:
其中K是稀疏性级别,描述了字典中有效数据元素的个数。
为了联合获取到的所有视角图像的信息来进行识别,本发明建立了一种联合稀疏性约束,来用于对向量的描述。在该约束中,多维稀疏性描述向量有着同样的稀疏性类型,换句话说,就是对每一个视角,选择同样的训练样本集对其进行描述,而对于同样训练样本集的系数向量值有可能不同。在该约束下,多姿态观测样本的稀疏性描述能够通过对如下的最优化问题的联合求解重建得出。
式中表示Frobenius范数。是复合范数表达式,其含义为首先对α的每一行进行l2范数求解,然后再对结果向量进行l0范数求解。
3残差类别判定。
在重建出稀疏描述矩阵后,基于对同一个测试个体的所有视角观测值Y合并重建残差。具体公式为:
式中,作为一个矩阵操作符,能够保留中与第i类所对应的系数值,而将其他值强制置零。采用Frobenius范数||·||F合并所有视图的重建误差。
Claims (1)
1.一种基于联合稀疏描述的多姿态三维人脸识别方法,包括以下步骤:
第一步、给定一个三维人脸数据,将全部顶点顺次排列描述网格的拓扑连接结构,作为类字典的列向量;
给定同属于类别i的Si个训练人脸数据,i=1,2,...,C,表示在数据库中共有C个不同类别的人脸数据;由这些数据构建的类字典记为Ai,表示为:其中表示属于类别i的第j个训练人脸数据的向量表示,j=1,2,...,Si;
整个训练集的超完备字典A由C个类别的共计S个训练样本的线性组合来构建,所构建的三维空间联合字典的表达式为:
式中,是训练样本的总数;
第二步、给定一个测试个体的M个不同视角观测值y1,y2,...,yM,将其按列排序,合并为一个单视角矩阵,记为Y=[y1,y2,...,yM],采用关于三维空间联合字典A的系数矩阵α=[α1,α2,...,αM]来进行稀疏性描述;
第三步、在重建出稀疏描述矩阵后,基于对同一个测试个体的所有视角观测值Y合并重建残差;
其特征在于还包括以下数学优化算法:在第二步所述的三维空间联合字典A的系数矩阵α=[α1,α2,...,αM]来进行稀疏性描述中,其稀疏描述问题表示如下:
式中,K是稀疏性级别;
对向量的描述采用建立联合稀疏性约束,在该约束中,多维稀疏性描述向量有着同样的稀疏性类型;多姿态观测样本的稀疏性描述通过对如下的最优化问题的联合求解重建得出;
式中,表示Frobenius范数;是复合范数表达式,其含义为首先对α的每一行进行l2范数求解,然后再对结果向量进行l0范数求解;
在第三步,所述的基于对同一个测试个体的所有视角观测值Y合并重建残差,具体公式为:
式中,作为一个矩阵操作符,能够保留中与第i类所对应的系数值,而将其他值强制置零;采用Frobenius范数||·||F合并所有视图的重建误差。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410100110.5A CN103854015B (zh) | 2014-03-18 | 2014-03-18 | 基于联合稀疏描述的多姿态三维人脸识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410100110.5A CN103854015B (zh) | 2014-03-18 | 2014-03-18 | 基于联合稀疏描述的多姿态三维人脸识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103854015A CN103854015A (zh) | 2014-06-11 |
CN103854015B true CN103854015B (zh) | 2017-06-06 |
Family
ID=50861649
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410100110.5A Active CN103854015B (zh) | 2014-03-18 | 2014-03-18 | 基于联合稀疏描述的多姿态三维人脸识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103854015B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104408767A (zh) * | 2014-11-20 | 2015-03-11 | 浙江大学 | 一种建立一致性三维人脸网格的稀疏变形模型的方法 |
CN108509854B (zh) * | 2018-03-05 | 2020-11-17 | 昆明理工大学 | 一种基于投影矩阵约束结合判别字典学习的行人再识别方法 |
CN110188718B (zh) * | 2019-06-04 | 2021-04-02 | 南京大学 | 一种基于关键帧和联合稀疏表示的无约束人脸识别方法 |
CN112966648B (zh) * | 2021-03-25 | 2023-10-10 | 南京工程学院 | 基于核扩展块字典稀疏表示的遮挡人脸识别方法 |
CN113343885A (zh) * | 2021-06-23 | 2021-09-03 | 杭州天翼智慧城市科技有限公司 | 一种复杂人脸姿态的特征点重建方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102737234A (zh) * | 2012-06-21 | 2012-10-17 | 北京工业大学 | 基于Gabor滤波和联合稀疏模型的人脸识别方法 |
CN103440500A (zh) * | 2013-08-30 | 2013-12-11 | 西北工业大学 | 高光谱遥感图像分类与识别方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8406525B2 (en) * | 2008-01-31 | 2013-03-26 | The Regents Of The University Of California | Recognition via high-dimensional data classification |
-
2014
- 2014-03-18 CN CN201410100110.5A patent/CN103854015B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102737234A (zh) * | 2012-06-21 | 2012-10-17 | 北京工业大学 | 基于Gabor滤波和联合稀疏模型的人脸识别方法 |
CN103440500A (zh) * | 2013-08-30 | 2013-12-11 | 西北工业大学 | 高光谱遥感图像分类与识别方法 |
Non-Patent Citations (3)
Title |
---|
Algorithms for Simultaneous Sparse Approximation;Joel A. Tropp 等;《Eurasip Journal on Applied Signal Processing》;20061231;第572-588页 * |
MULTI-VIEW FACE RECOGNITION VIA JOINT DYNAMIC SPARSE REPRESENTATION-D2;Haichao Zhang 等;《2011 18th IEEE International Conference on Image Processing》;20111231;第3025-3028页 * |
Sparse Representation for 3D Face Recognition;Zhe Guo 等;《2013 Fourth World Congress on Software Engineering》;20131231;第336-338页 * |
Also Published As
Publication number | Publication date |
---|---|
CN103854015A (zh) | 2014-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103854015B (zh) | 基于联合稀疏描述的多姿态三维人脸识别方法 | |
Gomez-Donoso et al. | Lonchanet: A sliced-based cnn architecture for real-time 3d object recognition | |
CN103279980B (zh) | 基于点云数据的树叶建模方法 | |
CN107818580A (zh) | 根据深度图对真实对象进行3d重建 | |
CN106355151A (zh) | 一种基于深度置信网络的三维sar图像目标识别方法 | |
CN105844635B (zh) | 一种基于结构字典的稀疏表示深度图像重建方法 | |
CN105405098B (zh) | 一种基于稀疏表示和自适应滤波的图像超分辨率重建方法 | |
CN102999942A (zh) | 三维人脸重建方法 | |
CN105427360B (zh) | 一种动态网格的误差可控cage序列表示算法 | |
CN104392019A (zh) | 用于脑白质纤维跟踪的高阶扩散张量混合稀疏成像方法 | |
CN109376767A (zh) | 基于深度学习的视网膜oct图像分类方法 | |
CN105981050A (zh) | 用于从人脸图像的数据提取人脸特征的方法和系统 | |
CN106022287A (zh) | 一种基于深度学习与字典表示的跨年龄人脸验证方法 | |
CN102930602A (zh) | 一种基于断层图像的面皮三维表面模型重建方法 | |
CN104103042B (zh) | 一种基于局部相似性和局部选择的非凸压缩感知图像重构方法 | |
CN107346556A (zh) | 一种基于块字典学习和稀疏表达的pet图像重建方法 | |
CN106503659A (zh) | 基于稀疏编码张量分解的动作识别方法 | |
CN110543916A (zh) | 一种缺失多视图数据的分类方法及系统 | |
CN102708589B (zh) | 一种基于特征聚类的三维目标多视点视图建模方法 | |
CN111127490A (zh) | 一种基于循环残差U-Net网络的医学图像分割方法 | |
CN109657408A (zh) | 一种再生核粒子算法实现结构线性静力学仿真方法 | |
CN109325513A (zh) | 一种基于海量单类单幅图像的图像分类网络训练方法 | |
CN104091364B (zh) | 单幅图像超分辨重建方法 | |
CN103839280B (zh) | 一种基于视觉信息的人体姿态跟踪方法 | |
CN103699716A (zh) | 一种个性化三维医学图像驱动的器官虚拟显示方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230728 Address after: 710000 G1-771, 7th Floor, Xixian Talent Building, Century Avenue, Fengdong New City, Xixian New District, Xi'an City, Shaanxi Province Patentee after: Shaanxi Lanshu Zhixing Information Technology Co.,Ltd. Address before: 710072 No. 127 Youyi West Road, Shaanxi, Xi'an Patentee before: Northwestern Polytechnical University |