CN102930510A - 一种人脸图像多角度相互转化方法 - Google Patents
一种人脸图像多角度相互转化方法 Download PDFInfo
- Publication number
- CN102930510A CN102930510A CN201210358748XA CN201210358748A CN102930510A CN 102930510 A CN102930510 A CN 102930510A CN 201210358748X A CN201210358748X A CN 201210358748XA CN 201210358748 A CN201210358748 A CN 201210358748A CN 102930510 A CN102930510 A CN 102930510A
- Authority
- CN
- China
- Prior art keywords
- facial image
- angle
- face image
- training set
- point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000001815 facial effect Effects 0.000 title claims description 21
- 238000011426 transformation method Methods 0.000 title description 2
- 238000000034 method Methods 0.000 claims abstract description 31
- 238000012549 training Methods 0.000 claims abstract description 20
- 239000011159 matrix material Substances 0.000 claims abstract description 19
- 239000013598 vector Substances 0.000 claims abstract description 17
- 230000014509 gene expression Effects 0.000 claims 4
- 230000009466 transformation Effects 0.000 claims 2
- 238000006243 chemical reaction Methods 0.000 abstract description 13
- 230000000694 effects Effects 0.000 abstract description 11
- 230000015572 biosynthetic process Effects 0.000 abstract description 8
- 238000003786 synthesis reaction Methods 0.000 abstract description 8
- 238000004422 calculation algorithm Methods 0.000 abstract description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 2
- 208000004547 Hallucinations Diseases 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000036544 posture Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
Images
Landscapes
- Image Processing (AREA)
Abstract
本发明提供一种人脸图像多角度相互转化方法:将人脸图像表示为像素灰度值的列向量形式;将某角度的单帧输入人脸图像视为高维空间中的一点,同角度训练集人脸图像视为该点的近邻点,将问题转化为局部邻域嵌入非线性降维理论中,求取高维空间某点的近邻点权值问题;利用求解出的权值以及目标角度训练集人脸图像合成目标角度人脸图像;将合成的目标角度人脸图像表示为像素灰度值的矩阵形式;本发明所述人脸图像多角度相互转化方法算法简单,并且在计算速度以及头发和人脸边缘部分合成效果明显优于现有技术。
Description
技术领域
本发明属于数字图像处理技术领域,具体涉及一种人脸图像多角度相互转化方法。
背景技术
人脸图像多角度相互转化是指将一幅输入的某一角度的人脸图像转换为所对应的其它角度(目标角度)的人脸图像。目前国内外仅有为数不多的转化方法被提出。
2004年清华大学Li提出了一种基于Garbor小波变换的方法(文献1:Y.Li and X.Y.Lin,“Face hallucination with pose variation”in Pro.6th IEEE Int.Conf.Automatic Face and Gesture Recognition,2004,pp.723–728);
2005-2008年英国伦敦大学玛丽女王学院Jia提出了基于张量分解的方法(文献2:K.Jia and S.G.Gong,“Multi-modal tensor face for simultaneoussuper-resolution and recognition,”in Proc.IEEE Int.Conf.ComputerVision,2005,pp.1683-1690;文献3:K.Jia and S.G.Gong,“Generalized facesuper-resolution,”IEEETrans.ImageProcessing,vol.17,no.6,pp.873886,Jun.2008);
2006年中山大学陈家大等利用改进的点点对应算法和线性物体类的原理构造正脸合成的方法。(文献4:陈家大、赖剑煌、冯国灿,“一种人脸姿势判别与正脸合成的新方法”,计算机研究与发展,2006)。
上述现有方法的共同缺点是算法复杂、运算量大,而且重建结果中人脸的头发、脸部轮廓部位比较模糊。
发明内容
本发明的目的在于提供一种简单、快速的人脸图像多角度相互转化方法,该方法可以克服现有同类方法算法复杂、运算量大、效果不理想的问题。
为达到上述目的,本发明采用了以下技术方案:
1)选取单帧某角度的人脸图像为输入人脸图像,将输入人脸图像表示为所有像素灰度值的列向量形式;
2)经过步骤1)后,将输入人脸图像视为高维空间中的一点,将与输入人脸图像同角度的训练集人脸图像视为该点的近邻点,然后根据局部邻域嵌入非线性降维理论(文献5:ROWEIS S T,SAUL L K.NonlinearDimensionality Reduction by Locally Linear Embedding[J].Science,2000,22(12):2323-2326)求解近邻点的权值,并在权值求解过程中对局部协方差矩阵进行大常数对角加载以得到权值,所述步骤2)中与输入人脸图像同角度的训练集人脸图像表示为所有像素灰度值的列向量形式;
3)利用步骤2)求解出的权值以及目标角度训练集人脸图像,根据局部邻域嵌入非线性降维理论反算出一个高维空间的点,该高维空间的点即为目标角度人脸图像向量,所述步骤3)中目标角度训练集人脸图像表示为所有像素灰度值的列向量形式;
4)将目标角度人脸图像向量表示为像素灰度值的矩阵形式。
本发明根据局部邻域嵌入非线性降维理论,将人脸图像多角度相互转化问题,转化为求取高维空间某点的近邻点权值问题:
IO为输入人脸图像(表示为所有像素灰度值的列向量形式),被视为高维空间中的一点,表示与输入人脸图像同角度的训练集人脸图像(表示为所有像素灰度值的列向量形式),被视为IO点的近邻点,wm为该高维空间近邻点的权值,M表示与输入人脸图像同角度的训练集人脸图像的个数,被视为近邻点个数。使用ε表示欧式距离,它们关系满足下式
随着wm不同,ε的数值不同;当wm的值为最终权值时,ε取值为最小。
求解出的权值按以下公式计算:
Z=Z′+C×a
,其中Z-1表示矩阵Z的逆矩阵,表示逆矩阵Z-1中第m行、第k列的元素,表示逆矩阵Z-1中第i行、第j列的元素,Z′mk表示Z'中第m行、第k列的元素,IO为输入人脸图像(表示为所有像素灰度值的列向量形式), 均表示与输入人脸图像同角度的训练集人脸图像(表示为所有像素灰度值的列向量形式),a为对角加载常数,随着a取值的减小,转化后图像质量变差,人脸个性成分增加,共性成分减弱,随着a取值的增加,转化后图像质量变平滑,人脸个性成分减弱,共性成分增加,a=50000~1000000,C为单位矩阵,M表示与输入人脸图像同角度的训练集人脸图像的个数,i、j、k、m均为正整数。
本发明所述人脸图像多角度相互转化方法算法简单,计算速度快,转化后图像为包含所有信息的人脸图像,并且在头发和人脸边缘部分合成效果明显优于现有技术。
进一步,关于本发明中权值的求解方法,本发明使用了改进后的文献5的方法。具体的改进是将其中的局部协方差矩阵进行大常数对角加载,这样做可以提高最终结果的图像质量,见图3的效果对比。
附图说明
图1为图像矩阵-向量转换示意图;
图2为转化效果对比:(a)为输入人脸图像;(b)为本发明方法处理后的结果;(c)为文献3方法处理后的结果;(d)为真实图像;
图3为大常数对角加载效果对比:(a)加载(本发明方法);(b)不加载(文献5方法)。
具体实施方式
下面结合附图对本发明作进一步说明。
本发明具体采用以下步骤实现:
步骤一:将输入的单帧某角度人脸图像、各个角度训练集人脸图像分别表示为所有像素灰度值的列向量形式。然后设输入的某角度人脸图像为IO,O为输入人脸的角度,相同角度(O)训练集人脸图像包括M个图像:设目标角度(P)的训练集人脸图像包括M个图像:M=100~200,待合成的目标角度人脸图像为IP,P可以为多个角度或者姿态;
人脸图像所有像素灰度值的矩阵形式与列向量形式的相互转化参见图1:
Z=Z′+C×a
步骤三:合成目标角度P的人脸图像向量:
步骤四:将IP转化为像素灰度值的矩阵形式,得到转化后的角度为P的人脸图像。
本发明的效果
在运算时间方面,本发明在普通计算机上合成一幅64*48大小新角度人脸图像只需要约几秒时间,而文献3需要约4-10分钟时间。
在转化效果方面,本发明与文献3的对比参见图2。图中(a)列为输入图像,(b)列为本发明结果,(c)列为文献3结果,(d)列为真实结果。从图2可以看到,本发明在头发和人脸边缘部分合成效果,明显优于文献3。
文献4的方法和本发明在具体细节和最终效果上完全不同,主要体现在以下方面:
1.文献4方法实施需要一个特定参考图像Rf,本发明不需要。
2.文献4方法需要将人脸图像分解为形状和纹理两部分来进行运算,最后再合并在一起,本发明则不需要。
3.文献4方法得到的权值区分为形状和纹理,而本方面不区分。
4.文献4使用最小二乘方法得到形状和纹理两类权值,本发明使用改进后的文献5的方法得到权值。
5.文献4的线性组合框架是取掉头发和人脸边缘的人脸图像,而本发明涉及的人脸图像包含有头发和人脸边缘等信息。
6.文献4的方法在头发和人脸边缘部分合成效果较差,而本方法相对较好。
7.文献4没有说明其方法是否可以合成正面人脸以外其它角度的人脸图像,而本发明可以合成包括正面人脸在内的多个角度的人脸,例如抬头、低头等姿态。
在适用范围方面,本发明既可以适用于低分辨率的人脸图像,也可以适用于高分辨率的人脸图像。
Claims (2)
1.一种人脸图像多角度相互转化方法,其特征在于,包括以下步骤:
1)选取单帧某角度的人脸图像为输入人脸图像,将输入人脸图像表示为像素灰度值的列向量形式;
2)经过步骤1)后,将输入人脸图像视为高维空间中的一点,将与输入人脸图像同角度的训练集人脸图像视为该点的近邻点,然后根据局部邻域嵌入非线性降维理论求解近邻点的权值,并在权值求解过程中对局部协方差矩阵进行大常数对角加载,所述步骤2)中与输入人脸图像同角度的训练集人脸图像表示为像素灰度值的列向量形式;
3)利用步骤2)求解出的权值以及目标角度训练集人脸图像反算出一个高维空间的点,该高维空间的点即为目标角度人脸图像,所述步骤3)中目标角度训练集人脸图像表示为像素灰度值的列向量形式;
4)将目标角度人脸图像表示为像素灰度值的矩阵形式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210358748.XA CN102930510B (zh) | 2012-09-24 | 2012-09-24 | 一种人脸图像多角度相互转化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210358748.XA CN102930510B (zh) | 2012-09-24 | 2012-09-24 | 一种人脸图像多角度相互转化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102930510A true CN102930510A (zh) | 2013-02-13 |
CN102930510B CN102930510B (zh) | 2016-05-18 |
Family
ID=47645300
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210358748.XA Expired - Fee Related CN102930510B (zh) | 2012-09-24 | 2012-09-24 | 一种人脸图像多角度相互转化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102930510B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107633483A (zh) * | 2017-09-18 | 2018-01-26 | 长安大学 | 光照鲁棒性的人脸图像超分辨率方法 |
CN111145119A (zh) * | 2019-12-25 | 2020-05-12 | 维沃移动通信(杭州)有限公司 | 一种图像处理方法及电子设备 |
-
2012
- 2012-09-24 CN CN201210358748.XA patent/CN102930510B/zh not_active Expired - Fee Related
Non-Patent Citations (6)
Title |
---|
SAM T. ROWEIS AND LAWRENCE K. SAUL: "Nonlinear Dimensionality Reduction by Locally Linear Embedding", 《SCIENCE》 * |
XIANG MA ET AL: "A Simple Approach to Multiview Face Hallucination", 《IEEE SIGNAL PROCESSING LETTERS》 * |
XIANG MA ET AL: "Hallucinating Face by Position-Patch", 《PATTERN RECOGNITION》 * |
李鉴峰: "阵列天线DOA估计算法的研究与改进", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
程春悦 等: "基于可变对角加载的自适应波束形成算法", 《通信理论与信号处理新进展——2005年通信理论与信号处理年会论文集》 * |
马瑞 等: "基于局部线性嵌入(LLE)非线性降维的多流形学习", 《清华大学学报(自然科学版)》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107633483A (zh) * | 2017-09-18 | 2018-01-26 | 长安大学 | 光照鲁棒性的人脸图像超分辨率方法 |
CN111145119A (zh) * | 2019-12-25 | 2020-05-12 | 维沃移动通信(杭州)有限公司 | 一种图像处理方法及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN102930510B (zh) | 2016-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kim et al. | Iterative kernel principal component analysis for image modeling | |
Tappen et al. | A bayesian approach to alignment-based image hallucination | |
Zhang et al. | Hallucinating face in the DCT domain | |
CN101477684A (zh) | 一种利用位置图像块重建的人脸图像超分辨率方法 | |
CN102243711B (zh) | 一种基于邻域嵌套的图像超分辨率重建方法 | |
CN103455991B (zh) | 一种多聚焦图像融合方法 | |
CN103279933B (zh) | 一种基于双层模型的单幅图像超分辨率重建方法 | |
CN105631807B (zh) | 基于稀疏域选取的单帧图像超分辨重建方法 | |
CN103279936B (zh) | 基于画像的人脸伪照片自动合成及修正方法 | |
Choi et al. | Single image super-resolution using global regression based on multiple local linear mappings | |
CN111899168B (zh) | 一种基于特征增强的遥感影像超分辨率重建方法和系统 | |
CN103903236B (zh) | 人脸图像超分辨率重建的方法和装置 | |
CN117651965A (zh) | 使用神经网络的高清图像操作方法和系统 | |
Fang et al. | Uncertainty learning in kernel estimation for multi-stage blind image super-resolution | |
Niu et al. | A super resolution frontal face generation model based on 3DDFA and CBAM | |
López-Tapia et al. | Fast and robust cascade model for multiple degradation single image super-resolution | |
CN108492252A (zh) | 基于二次重建的人脸图像超分辨率重建方法 | |
CN102930510B (zh) | 一种人脸图像多角度相互转化方法 | |
Wu et al. | Gradient-aware blind face inpainting for deep face verification | |
Tan et al. | Tensor recovery via multi-linear augmented Lagrange multiplier method | |
CN103903239B (zh) | 一种视频超分辨率重建方法及其系统 | |
Arya et al. | ADMM optimizer for integrating wavelet-patch and group-based sparse representation for image inpainting | |
Xu et al. | FEMRNet: Feature-enhanced multi-scale residual network for image denoising | |
Khandelwal et al. | W-VDSR: Wavelet-based secure image transmission using machine learning VDSR neural network | |
Shen et al. | Local to non-local: Multi-scale progressive attention network for image restoration |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160518 Termination date: 20160924 |