CN102930510A - 一种人脸图像多角度相互转化方法 - Google Patents

一种人脸图像多角度相互转化方法 Download PDF

Info

Publication number
CN102930510A
CN102930510A CN201210358748XA CN201210358748A CN102930510A CN 102930510 A CN102930510 A CN 102930510A CN 201210358748X A CN201210358748X A CN 201210358748XA CN 201210358748 A CN201210358748 A CN 201210358748A CN 102930510 A CN102930510 A CN 102930510A
Authority
CN
China
Prior art keywords
facial image
angle
training set
input
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210358748XA
Other languages
English (en)
Other versions
CN102930510B (zh
Inventor
马祥
李文敏
宋焕生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changan University
Original Assignee
Changan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changan University filed Critical Changan University
Priority to CN201210358748.XA priority Critical patent/CN102930510B/zh
Publication of CN102930510A publication Critical patent/CN102930510A/zh
Application granted granted Critical
Publication of CN102930510B publication Critical patent/CN102930510B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)

Abstract

本发明提供一种人脸图像多角度相互转化方法:将人脸图像表示为像素灰度值的列向量形式;将某角度的单帧输入人脸图像视为高维空间中的一点,同角度训练集人脸图像视为该点的近邻点,将问题转化为局部邻域嵌入非线性降维理论中,求取高维空间某点的近邻点权值问题;利用求解出的权值以及目标角度训练集人脸图像合成目标角度人脸图像;将合成的目标角度人脸图像表示为像素灰度值的矩阵形式;本发明所述人脸图像多角度相互转化方法算法简单,并且在计算速度以及头发和人脸边缘部分合成效果明显优于现有技术。

Description

一种人脸图像多角度相互转化方法
技术领域
本发明属于数字图像处理技术领域,具体涉及一种人脸图像多角度相互转化方法。
背景技术
人脸图像多角度相互转化是指将一幅输入的某一角度的人脸图像转换为所对应的其它角度(目标角度)的人脸图像。目前国内外仅有为数不多的转化方法被提出。
2004年清华大学Li提出了一种基于Garbor小波变换的方法(文献1:Y.Li and X.Y.Lin,“Face hallucination with pose variation”in Pro.6th IEEE Int.Conf.Automatic Face and Gesture Recognition,2004,pp.723–728);
2005-2008年英国伦敦大学玛丽女王学院Jia提出了基于张量分解的方法(文献2:K.Jia and S.G.Gong,“Multi-modal tensor face for simultaneoussuper-resolution and recognition,”in Proc.IEEE Int.Conf.ComputerVision,2005,pp.1683-1690;文献3:K.Jia and S.G.Gong,“Generalized facesuper-resolution,”IEEETrans.ImageProcessing,vol.17,no.6,pp.873886,Jun.2008);
2006年中山大学陈家大等利用改进的点点对应算法和线性物体类的原理构造正脸合成的方法。(文献4:陈家大、赖剑煌、冯国灿,“一种人脸姿势判别与正脸合成的新方法”,计算机研究与发展,2006)。
上述现有方法的共同缺点是算法复杂、运算量大,而且重建结果中人脸的头发、脸部轮廓部位比较模糊。
发明内容
本发明的目的在于提供一种简单、快速的人脸图像多角度相互转化方法,该方法可以克服现有同类方法算法复杂、运算量大、效果不理想的问题。
为达到上述目的,本发明采用了以下技术方案:
1)选取单帧某角度的人脸图像为输入人脸图像,将输入人脸图像表示为所有像素灰度值的列向量形式;
2)经过步骤1)后,将输入人脸图像视为高维空间中的一点,将与输入人脸图像同角度的训练集人脸图像视为该点的近邻点,然后根据局部邻域嵌入非线性降维理论(文献5:ROWEIS S T,SAUL L K.NonlinearDimensionality Reduction by Locally Linear Embedding[J].Science,2000,22(12):2323-2326)求解近邻点的权值,并在权值求解过程中对局部协方差矩阵进行大常数对角加载以得到权值,所述步骤2)中与输入人脸图像同角度的训练集人脸图像表示为所有像素灰度值的列向量形式;
3)利用步骤2)求解出的权值以及目标角度训练集人脸图像,根据局部邻域嵌入非线性降维理论反算出一个高维空间的点,该高维空间的点即为目标角度人脸图像向量,所述步骤3)中目标角度训练集人脸图像表示为所有像素灰度值的列向量形式;
4)将目标角度人脸图像向量表示为像素灰度值的矩阵形式。
本发明根据局部邻域嵌入非线性降维理论,将人脸图像多角度相互转化问题,转化为求取高维空间某点的近邻点权值问题:
IO为输入人脸图像(表示为所有像素灰度值的列向量形式),被视为高维空间中的一点,
Figure BDA00002182985000031
表示与输入人脸图像同角度的训练集人脸图像(表示为所有像素灰度值的列向量形式),被视为IO点的近邻点,wm为该高维空间近邻点的权值,M表示与输入人脸图像同角度的训练集人脸图像的个数,被视为近邻点个数。使用ε表示欧式距离,它们关系满足下式
ϵ = | | I o - Σ m = 1 M w m T o m | | 2
随着wm不同,ε的数值不同;当wm的值为最终权值时,ε取值为最小。
求解出的权值按以下公式计算:
w m = Σ k = 1 M Z mk - 1 / Σ i = 1 M Σ j = 1 M Z ij - 1
Z=Z′+C×a
Z mk ′ = ( I O - T O m ) T ( I O - T O k )
,其中Z-1表示矩阵Z的逆矩阵,
Figure BDA00002182985000035
表示逆矩阵Z-1中第m行、第k列的元素,
Figure BDA00002182985000036
表示逆矩阵Z-1中第i行、第j列的元素,Z′mk表示Z'中第m行、第k列的元素,IO为输入人脸图像(表示为所有像素灰度值的列向量形式),
Figure BDA00002182985000037
Figure BDA00002182985000038
均表示与输入人脸图像同角度的训练集人脸图像(表示为所有像素灰度值的列向量形式),a为对角加载常数,随着a取值的减小,转化后图像质量变差,人脸个性成分增加,共性成分减弱,随着a取值的增加,转化后图像质量变平滑,人脸个性成分减弱,共性成分增加,a=50000~1000000,C为单位矩阵,M表示与输入人脸图像同角度的训练集人脸图像的个数,i、j、k、m均为正整数。
本发明所述人脸图像多角度相互转化方法算法简单,计算速度快,转化后图像为包含所有信息的人脸图像,并且在头发和人脸边缘部分合成效果明显优于现有技术。
进一步,关于本发明中权值的求解方法,本发明使用了改进后的文献5的方法。具体的改进是将其中的局部协方差矩阵进行大常数对角加载,这样做可以提高最终结果的图像质量,见图3的效果对比。
附图说明
图1为图像矩阵-向量转换示意图;
图2为转化效果对比:(a)为输入人脸图像;(b)为本发明方法处理后的结果;(c)为文献3方法处理后的结果;(d)为真实图像;
图3为大常数对角加载效果对比:(a)加载(本发明方法);(b)不加载(文献5方法)。
具体实施方式
下面结合附图对本发明作进一步说明。
本发明具体采用以下步骤实现:
步骤一:将输入的单帧某角度人脸图像、各个角度训练集人脸图像分别表示为所有像素灰度值的列向量形式。然后设输入的某角度人脸图像为IO,O为输入人脸的角度,相同角度(O)训练集人脸图像
Figure BDA00002182985000041
包括M个图像:
Figure BDA00002182985000042
设目标角度(P)的训练集人脸图像
Figure BDA00002182985000043
包括M个图像:
Figure BDA00002182985000044
M=100~200,待合成的目标角度人脸图像为IP,P可以为多个角度或者姿态;
人脸图像所有像素灰度值的矩阵形式与列向量形式的相互转化参见图1:
步骤二:由输入人脸图像IO,训练集人脸图像
Figure BDA00002182985000051
利用以下公式计算出权值;
w m = Σ k = 1 M Z mk - 1 / Σ i = 1 M Σ j = 1 M Z ij - 1
Z=Z′+C×a
Z mk ′ = ( I O - T O m ) T ( I O - T O k )
,其中
Figure BDA00002182985000054
表示逆矩阵Z-1中第m行第k列元素,Z′mk表示Z'中第m行、第k列的元素,a为局部协方差矩阵对角加载常数,a取500000,C为单位矩阵,i、j、k、m均为正整数,T表示转置。
步骤三:合成目标角度P的人脸图像向量:
I P = Σ m = 1 M T P m w m
步骤四:将IP转化为像素灰度值的矩阵形式,得到转化后的角度为P的人脸图像。
本发明的效果
在运算时间方面,本发明在普通计算机上合成一幅64*48大小新角度人脸图像只需要约几秒时间,而文献3需要约4-10分钟时间。
在转化效果方面,本发明与文献3的对比参见图2。图中(a)列为输入图像,(b)列为本发明结果,(c)列为文献3结果,(d)列为真实结果。从图2可以看到,本发明在头发和人脸边缘部分合成效果,明显优于文献3。
文献4的方法和本发明在具体细节和最终效果上完全不同,主要体现在以下方面:
1.文献4方法实施需要一个特定参考图像Rf,本发明不需要。
2.文献4方法需要将人脸图像分解为形状和纹理两部分来进行运算,最后再合并在一起,本发明则不需要。
3.文献4方法得到的权值区分为形状和纹理,而本方面不区分。
4.文献4使用最小二乘方法得到形状和纹理两类权值,本发明使用改进后的文献5的方法得到权值。
5.文献4的线性组合框架是取掉头发和人脸边缘的人脸图像,而本发明涉及的人脸图像包含有头发和人脸边缘等信息。
6.文献4的方法在头发和人脸边缘部分合成效果较差,而本方法相对较好。
7.文献4没有说明其方法是否可以合成正面人脸以外其它角度的人脸图像,而本发明可以合成包括正面人脸在内的多个角度的人脸,例如抬头、低头等姿态。
在适用范围方面,本发明既可以适用于低分辨率的人脸图像,也可以适用于高分辨率的人脸图像。

Claims (2)

1.一种人脸图像多角度相互转化方法,其特征在于,包括以下步骤:
1)选取单帧某角度的人脸图像为输入人脸图像,将输入人脸图像表示为像素灰度值的列向量形式;
2)经过步骤1)后,将输入人脸图像视为高维空间中的一点,将与输入人脸图像同角度的训练集人脸图像视为该点的近邻点,然后根据局部邻域嵌入非线性降维理论求解近邻点的权值,并在权值求解过程中对局部协方差矩阵进行大常数对角加载,所述步骤2)中与输入人脸图像同角度的训练集人脸图像表示为像素灰度值的列向量形式;
3)利用步骤2)求解出的权值以及目标角度训练集人脸图像反算出一个高维空间的点,该高维空间的点即为目标角度人脸图像,所述步骤3)中目标角度训练集人脸图像表示为像素灰度值的列向量形式;
4)将目标角度人脸图像表示为像素灰度值的矩阵形式。
2.根据权利要求1所述一种人脸图像多角度相互转化方法,其特征在于,求解出的权值按以下公式计算:
w m = Σ k = 1 M Z mk - 1 / Σ i = 1 M Σ j = 1 M Z ij - 1
Z=Z′+C×a
Z mk ′ = ( I O - T O m ) T ( I O - T O k )
,其中Z-1表示矩阵Z的逆矩阵,
Figure FDA00002182984900013
表示Z-1中第m行、第k列的元素,
Figure FDA00002182984900014
表示Z-1中第i行、第j列的元素,Z′mk表示Z'中第m行、第k列的元素,IO为输入人脸图像,
Figure FDA00002182984900015
Figure FDA00002182984900016
均表示与输入人脸图像同角度的训练集人脸图像,a为对角加载常数,a=50000~1000000,C为单位矩阵,M表示与输入人脸图像同角度的训练集人脸图像的个数,i、j、k、m均为正整数。
CN201210358748.XA 2012-09-24 2012-09-24 一种人脸图像多角度相互转化方法 Expired - Fee Related CN102930510B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210358748.XA CN102930510B (zh) 2012-09-24 2012-09-24 一种人脸图像多角度相互转化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210358748.XA CN102930510B (zh) 2012-09-24 2012-09-24 一种人脸图像多角度相互转化方法

Publications (2)

Publication Number Publication Date
CN102930510A true CN102930510A (zh) 2013-02-13
CN102930510B CN102930510B (zh) 2016-05-18

Family

ID=47645300

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210358748.XA Expired - Fee Related CN102930510B (zh) 2012-09-24 2012-09-24 一种人脸图像多角度相互转化方法

Country Status (1)

Country Link
CN (1) CN102930510B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107633483A (zh) * 2017-09-18 2018-01-26 长安大学 光照鲁棒性的人脸图像超分辨率方法
CN111145119A (zh) * 2019-12-25 2020-05-12 维沃移动通信(杭州)有限公司 一种图像处理方法及电子设备

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
SAM T. ROWEIS AND LAWRENCE K. SAUL: "Nonlinear Dimensionality Reduction by Locally Linear Embedding", 《SCIENCE》 *
XIANG MA ET AL: "A Simple Approach to Multiview Face Hallucination", 《IEEE SIGNAL PROCESSING LETTERS》 *
XIANG MA ET AL: "Hallucinating Face by Position-Patch", 《PATTERN RECOGNITION》 *
李鉴峰: "阵列天线DOA估计算法的研究与改进", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
程春悦 等: "基于可变对角加载的自适应波束形成算法", 《通信理论与信号处理新进展——2005年通信理论与信号处理年会论文集》 *
马瑞 等: "基于局部线性嵌入(LLE)非线性降维的多流形学习", 《清华大学学报(自然科学版)》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107633483A (zh) * 2017-09-18 2018-01-26 长安大学 光照鲁棒性的人脸图像超分辨率方法
CN111145119A (zh) * 2019-12-25 2020-05-12 维沃移动通信(杭州)有限公司 一种图像处理方法及电子设备

Also Published As

Publication number Publication date
CN102930510B (zh) 2016-05-18

Similar Documents

Publication Publication Date Title
CN106683067B (zh) 一种基于残差子图像的深度学习超分辨率重建方法
Yan et al. Single image superresolution based on gradient profile sharpness
Zhang et al. Coarse-to-fine learning for single-image super-resolution
CN103150713B (zh) 利用图像块分类稀疏表示与自适应聚合的图像超分辨方法
Zhang et al. Single image super-resolution with multiscale similarity learning
Zhu et al. Image interpolation based on non-local geometric similarities and directional gradients
CN107220957B (zh) 一种利用滚动导向滤波的遥感图像融合方法
Mishra et al. Self-FuseNet: data free unsupervised remote sensing image super-resolution
Li et al. Detail-preserving image super-resolution via recursively dilated residual network
Wu et al. A novel perceptual loss function for single image super-resolution
Tang et al. Single-image super-resolution based on semi-supervised learning
Li et al. Dual-streams edge driven encoder-decoder network for image super-resolution
Vishnukumar et al. Edge preserving single image super-resolution with improved visual quality
Yang et al. Fast multisensor infrared image super-resolution scheme with multiple regression models
CN102930510A (zh) 一种人脸图像多角度相互转化方法
Thuan et al. Edge-focus thermal image super-resolution using generative adversarial network
Zhang et al. Image super-resolution via non-local steering kernel regression regularization
Lu et al. Single image super resolution based on sparse domain selection
Liu et al. A convolutional neural network for image super-resolution using internal dataset
Cai et al. Spherical pseudo-cylindrical representation for omnidirectional image super-resolution
Mostafa et al. An edge detection method for hexagonal images
CN108090870A (zh) 一种基于结构转化自相似的红外图像超分辨率重建方法
CN113450295A (zh) 一种基于差分对比学习的深度图合成方法
Ganesan et al. Comparative Study of Implementation of Very Deep Super Resolution Neural Network and Bicubic Interpolation for Single Image Super Resolution Quality Enhancement
Zhou et al. Fusion of visible and infrared images based on IHS transformation and regional variance matching degree

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160518

Termination date: 20160924

CF01 Termination of patent right due to non-payment of annual fee