CN103325104A - 基于迭代稀疏表达的人脸图像超分辨率重建方法 - Google Patents
基于迭代稀疏表达的人脸图像超分辨率重建方法 Download PDFInfo
- Publication number
- CN103325104A CN103325104A CN2013102296034A CN201310229603A CN103325104A CN 103325104 A CN103325104 A CN 103325104A CN 2013102296034 A CN2013102296034 A CN 2013102296034A CN 201310229603 A CN201310229603 A CN 201310229603A CN 103325104 A CN103325104 A CN 103325104A
- Authority
- CN
- China
- Prior art keywords
- resolution
- image
- low
- human face
- super
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 79
- 230000001815 facial effect Effects 0.000 title claims abstract description 36
- 238000012417 linear regression Methods 0.000 claims abstract description 14
- 230000014509 gene expression Effects 0.000 claims description 48
- 230000004438 eyesight Effects 0.000 claims description 42
- 238000012549 training Methods 0.000 claims description 41
- 239000004744 fabric Substances 0.000 claims description 24
- 238000005457 optimization Methods 0.000 claims description 13
- 230000004304 visual acuity Effects 0.000 claims description 13
- 238000007621 cluster analysis Methods 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 6
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 5
- 230000002860 competitive effect Effects 0.000 claims description 5
- HUTDUHSNJYTCAR-UHFFFAOYSA-N ancymidol Chemical compound C1=CC(OC)=CC=C1C(O)(C=1C=NC=NC=1)C1CC1 HUTDUHSNJYTCAR-UHFFFAOYSA-N 0.000 claims description 3
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000003709 image segmentation Methods 0.000 claims description 2
- 230000009466 transformation Effects 0.000 claims description 2
- 238000002474 experimental method Methods 0.000 description 15
- 238000012360 testing method Methods 0.000 description 9
- 230000008859 change Effects 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 2
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012876 topography Methods 0.000 description 1
Images
Landscapes
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于迭代稀疏表达的人脸图像超分辨率重建方法,包括以下步骤:将低分辨率输入图像进行插值得到高分辨率人脸估计图像;将高分辨率人脸估计图像用一个高分辨率人脸图像字典进行线性表达,并在一定的表达误差下要求非零的表达系数尽可能少;将上述稀疏表达结果作为新的高分辨率人脸估计图像;使用基于局部线性回归方法对上述高分辨率人脸估计图像进行局部细节补偿,得到新的高分辨率人脸估计结果;迭代重复上述步骤,最后收敛到稳定值,完成超分辨率重建。本发明不仅将全局和局部方法用迭代的方式有机地结合在一起,而且提供了一种整合不同的解决图像对齐不准问题的策略,迭代能快速收敛,实现由粗到精的超分辨率重建。
Description
技术领域
本发明涉及图像处理领域,特别涉及一种基于迭代稀疏表达的人脸图像超分辨率重建方法。
背景技术
图像超分辨率的任务是从一个或者多个低分辨率输入图像推断出高分辨率图像。在实际生活中有广泛应用,特别是人脸图像的超分辨率重建在远距离视频监控或者视频处理等方面有着重要的应用。
传统的人脸图像超分辨率方法要求人脸图像根据几个基准点准确对齐,然后利用人脸图像之间的相似性先验知识约束超分辨率重建结果。但实际应用中低分辨率人脸图像由于像素过少通常对齐不准,造成人脸图像之间相似性先验不再满足,从而导致已有人脸图像超分辨率方法失效,降低超分辨率图像质量。
因此,如何解决人脸图像超分辨率对人脸图像对齐不准更加鲁棒是一个非常有意义的问题,但目前远未解决。
发明内容
本发明的主要目的在于克服现有技术的缺点与不足,提供一种基于迭代稀疏表达的人脸图像超分辨率重建方法,该方法对人脸图像对齐不准的情形比较鲁棒,在一定的对齐误差下仍可以得到很好的图像品质。
本发明的目的通过以下的技术方案实现:基于迭代稀疏表达的人脸图像超分辨率重建方法,包括以下步骤:
(1)将低分辨率输入图像进行插值得到高分辨率人脸估计图像;
(2)将高分辨率人脸估计图像进行稀疏表达,即将高分辨率人脸估计图像用一个高分辨率人脸图像字典进行线性表达,并在一定的表达误差下要求非零的表达系数尽可能少;之后将稀疏表达结果作为新的高分辨率人脸估计图像;
(3)使用基于局部线性回归方法得到的残差补偿对步骤(2)所得到的新的高分辨率人脸估计图像进行局部细节补偿,得到补偿后的高分辨率人脸估计图像;
(4)迭代重复步骤(2)和步骤(3),最后收敛到稳定值,完成超分辨率重建。
所述步骤(2)中稀疏表达是指:
min||α||0,s.t.x*=Hα,
其中,x*是高分辨率人脸图像估计值,H=[h1,…hm]是高分辨率人脸图像字典,它包含m个基元素hi,i=1,…,m,α∈Rm×1是以表达系数为元素组成的向量,简称系数向量,||α||0是α的l0范数,即α中非零元素的个数。可以把以上非凸最优化问题用一个凸最优化问题来逼近,得到一个稀疏的近似解:
更进一步的,所述步骤(2)中,高分辨率人脸图像字典H的求解方法如下:
使用基准点对齐预先随机采样得到的一批高分辨率人脸图像;
通过准确定位基准点随机得到B幅对齐准确的高分辨率人脸图像;再通过1-8个像素的误差定位基准点随机得到Q幅对齐不准的高分辨率人脸图像;
将上述图像作为训练样本X=[x1,…,xN]∈Rn×N,其中xi是第i个高分辨率人脸图像样本,n是图像空间维度,N是训练样本个数;
求解以下关于字典H和由N个系数向量组成的矩阵Α=[α1,α2,…,αN]∈Rm×N的联合最优化问题:
其中
优选的,使用基准点对齐人脸图像时采用仿射变换,基准点有三个,即两眼中心和嘴中心。
具体的,所述步骤(3)中,使用基于局部线性回归方法得到残差补偿的方法如下:
对步骤(2)得到的高分辨率人脸估计图像进行下采样,然后被低分辨率输入图像减除,得到低分辨率残差图像,然后对低分辨率残差图像每一处脸部位置上的图像块进行局部线性回归,得到高分辨率残差图像;将高分辨率残差图像与步骤(2)得到的高分辨率人脸估计图像进行相加合并,完成脸部细节信息补偿,得到新的高分辨率人脸估计图像。显然的,新的高分辨率人脸估计图像比之前的更加精确。
更进一步的,所述步骤(3)中,得到低分辨率残差图像的具体步骤是:已知低分辨率输入图像y,以及由步骤(2)得到的高分辨率人脸估计图像Hα*,定义低分辨率残差图像为: 其中S为超分辨率放大倍数,(p,q)是像素的坐标。
更进一步的,所述步骤(3)中,对低分辨率残差图像每一处脸部位置上的图像块进行局部线性回归的方法具体如下:
(3-1)将随机选取的两幅对齐误差一致的不同高分辨率人脸图像相减,得到高分辨率残差图像,依此方法得到W幅训练样本,然后对样本中图像分别进行平滑和降采样得到对应的低分辨率残差图像训练样本;
(3-2)将高、低分辨率残差图像训练样本分块,然后将成对的高分辨率训练残差图像块和低分辨率训练残差图像块的梯度域特征组合在一起,对组合的特征进行聚类分析,聚类得到成对的高分辨率的视觉单词和低分辨率的视觉单词;
(3-3)对每一成对的高分辨率视觉单词和低分辨率视觉单词,计算从低分辨率视觉单词到高分辨率视觉单词的线性回归系数;
(3-4)将输入的低分辨率残差图像分割成图像块,使图像块之间有部分重叠,对于每一个输入的低分辨率残差图像块,先通过计算到各个低分辨率视觉单词样本中心的最小马氏距离来找到它所属的视觉单词,再根据所属视觉单词的线性回归系数,合成对应的高分辨率残差图像块;
(3-5)通过平均重叠部分集成高分辨率残差图像块来得到完整的高分辨率残差图像。
优选的,所述步骤(3-2)中,通过计算水平和竖直的一阶梯度作为局部特征,并且把一个残差图像块的所有像素点的梯度特征连接起来形成一个向量作为梯度域特征,从而得到每一个残差图像块的局部几何特征表示,然后再连接高、低分辨率残差图像块的局部几何特征作为组合的特征。
作为优选方案,所述步骤(3-2)中,聚类分析采用B.J.Frey等人提出的仿射传播聚类算法(参考:B.J.Frey and D.Dueck,“Clustering by passing messagesbetween data points,”Science,2007),该算法是把所有的数据点作为同等的聚类中心的候选,得到初始的聚类结果。
更进一步的,在初始的聚类结果上采取增量方式的竞争学习方法改善聚类结果并且增加训练样本的数量。增量方式的竞争学习方法如下:设经过仿射传播聚类后有N个聚类C1…CN,Xn={xn1,…,xnM}是聚类Cn的M个成员,聚类中心计算为成员的均值协方差矩阵计算公式为对于每一个新的特征向量x,考虑到聚类的采样分布,计算它与每一个聚类中心的马氏距离把x分配到与它的马氏距离最小的聚类并更新这个聚类,假设更新的聚类是Cn,采用留一逼近法找到Cn中“最差的”样本,在Cn中选择一个样本,计算这个样本与Cn中剩下的样本的中心的马氏距离,计算得到的马氏距离最大的样本则为“最差的”样本,如果这个样本距离聚类Cn中心的马氏距离小于它距离其他聚类中心的马氏距离,则聚类Cn保留这个样本,否则去除它并且分配给其他聚类。
优选的,所述步骤(3-3)中计算从低分辨率视觉单词到高分辨率视觉单词的线性回归系数的方法如下:
其中wij就是回归系数;对每一个视觉单词,给定低分辨率训练样本其中是第i个2×2低分辨率训练样本,高分辨率训练样本其中是低分辨率图像块对应的4个高分辨率像素中的第i个像素,令Wi=[wi1,wi2,wi3,wi4]T,则解如下凸最优化问题:
即分别计算出4个高分辨率像素的线性回归系数。
具体的,所述步骤(4)中的迭代重复步骤(2)和步骤(3)是指:在迭代的第n步,给定了当前的高分辨率人脸估计图像值x(n),首先求解如下最优化问题:
再对重构结果Hα(n+1)用高分辨率残差图像补偿得到第n+1步的估计值 其中令λ线性递减为0:
其中M是最大迭代次数。
本发明与现有技术相比,具有如下优点和有益效果:
1、本发明将对齐不准的人脸图像超分辨率问题看成是一个选择不同基元素重建图像的问题。本发明提出的迭代稀疏表达方法可以自适应地选取和输入图像对齐模式相似的基元素进行图像重构,因此即使人脸图像对齐不准,重构的精度也不会受到太大影响。
2、本发明提出的残差补偿方法,能够不依赖于人脸的局部相似性而聚类相似的局部图像块,并通过局部线性回归简单而有效地进行高分辨率残差图像重建,因此人脸图像对齐不准不会对残差补偿过程产生影响。
3、本发明提出了一种优化结合全局与局部方法的超分辨率方法,对全局高分辨率图像的稀疏表达迭代地通过残差补偿进行局部修正。迭代的方式不仅将全局和局部方法有机地结合在一起,而且也提供了一种便利的方式整合不同的解决图像对齐不准问题的策略。实验结果表明迭代能够快速收敛,实现了由粗到精的逐步超分辨率过程。
附图说明
图1是本发明实施例1的字典学习算法流程图;
图2是本发明实施例1的局部线性回归系数学习算法流程图;
图3是本发明实施例1的算法流程图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例1
本实施例基于迭代稀疏表达的人脸图像超分辨率重建方法,包括以下步骤:
(1)将低分辨率输入图像进行插值得到高分辨率人脸估计图像;
(2)将高分辨率人脸估计图像进行稀疏表达,即将高分辨率人脸估计图像用一个高分辨率人脸图像字典进行线性表达,并在一定的表达误差下要求非零的表达系数尽可能少。将稀疏表达结果作为新的高分辨率人脸估计图像;
(3)使用基于局部线性回归方法得到的残差补偿对步骤(2)所得到的新的高分辨率人脸估计图像进行局部细节补偿,得到补偿后的高分辨率人脸估计图像;
(4)迭代重复步骤(2)和步骤(3),最后收敛到稳定值,完成超分辨率重建。
所述步骤(2)中稀疏表达是指:
min||α||0,s.t.x*=Hα,
其中,x*是通过双三次插值将低分辨率输入图像y放大得到的高分辨率人脸图像估计值,H=[h1,…hm]是高分辨率人脸图像字典,它包含m个基元素hi,i=1,…,m,α∈Rm×1是以表达系数为元素组成的向量,简称系数向量,||α||0是α的l0范数,即α中非零元素的个数。可以把以上非凸最优化问题用一个凸最优化问题来逼近,得到一个稀疏的近似解:
上述凸最优化问题可以采用B.Efron等人提出的最小角回归算法(参考:B.Efron,T.Hastie,I.M.Johnstone,and R.Tibshirani,“Least angleregression,”Ann.Statist.,vol.32,no.2,pp.407-499,2004.)。
如图1所示,所述步骤(2)中,高分辨率人脸图像字典H的求解方法如下:
使用三个基准点对齐预先随机采样得到的一批高分辨率人脸图像,即两眼中心和嘴中心。通过准确定位三个基准点随机得到500幅对齐准确的高分辨率人脸图像。再通过8个像素内的误差定位三个基准点随机得到2500幅对齐不准的高分辨率人脸图像。将这些图像做为训练样本X=[x1,…,xN]∈Rn×N,其中xi是第i个高分辨率人脸图像样本,n是图像空间维度,N是训练样本个数。字典学习就是求解以下关于字典H和系数矩阵Α=[α1,α2,…,αN]∈Rm×N的联合最优化问题:
其中具体的,可以采用Mairal等人提出的在线字典学习算法(参考:J.Mairal,F.Bach,J.Ponce,G.Sapiro,“Online learning for matrix factorizationand sparse coding,”Journal of Machine Learning Research,vol.11,pp.19-60,2010.),该算法可以每次只处理一幅训练图像,因此具有很低的硬件存储要求和计算复杂度。
所述步骤(3)中,使用基于局部线性回归方法得到残差补偿的方法如下:对步骤(2)得到的高分辨率人脸估计图像进行下采样,然后被低分辨率输入图像减除,得到低分辨率残差图像,然后对低分辨率残差图像每一处脸部位置上的图像块进行局部线性回归,得到高分辨率残差图像;将高分辨率残差图像与步骤(2)得到的高分辨率人脸估计图像进行相加合并,完成脸部细节信息补偿,得到新的高分辨率人脸估计图像。
本实施例中得到低分辨率残差图像的具体步骤是:已知低分辨率输入图像y,以及由步骤(2)得到的高分辨率人脸估计图像Hα*,定义低分辨率残差图
像为:
其中S为超分辨率放大倍数,(p,q)是像素的坐标。通过基于每一处脸部位置上的图像块的局部线性回归从yl建立高分辨率残差图像xl的估计。
所述步骤(3)中,对低分辨率残差图像每一处脸部位置上的图像块进行局部线性回归的方法具体如下:
(3-1)将随机选取的两幅对齐误差一致的不同高分辨率人脸图像相减,得到高分辨率残差图像,依此方法得到300幅训练样本,然后对样本中图像分别进行平滑和降采样得到对应的低分辨率残差图像训练样本;
(3-2)将高、低分辨率残差图像训练样本分块,然后将成对的高分辨率训练残差图像块和低分辨率训练残差图像块的梯度域特征组合在一起,对组合的特征进行聚类分析,聚类得到成对的高分辨率的视觉单词和低分辨率的视觉单词;
(3-3)对每一成对的高分辨率视觉单词和低分辨率视觉单词,计算从低分辨率视觉单词到高分辨率视觉单词的线性回归系数;
(3-4)将输入的低分辨率残差图像yl分割成图像块,使图像块之间有部分重叠。对于每一个输入的低分辨率残差图像块,先通过计算到各个低分辨率视觉单词样本中心的最小马氏距离来找到它所属的视觉单词。再根据所属视觉单词的线性回归系数,合成对应的高分辨率残差图像块。
(3-5)通过平均重叠部分集成高分辨率残差图像块来得到完整的高分辨率残差图像xl。
如图2所示,所述步骤(3-2)中,本实施例通过计算水平和竖直的一阶梯度作为局部特征,并且把一个残差图像块的所有像素点的梯度特征连接起来形成一个向量作为梯度域特征,从而得到每一个残差图像块的局部几何特征表示,然后再连接高、低分辨率残差图像块的局部几何特征作为组合的特征。
所述步骤(3-2)中,聚类分析采用B.J.Frey等人提出的仿射传播聚类算法(参考:B.J.Frey and D.Dueck,“Clustering by passing messages between datapoints,”Science,2007),该算法是把所有的数据点作为同等的聚类中心的候选,得到初始的聚类结果。
其中,在初始的聚类结果上采取增量方式的竞争学习方法改善聚类结果并且增加训练样本的数量。增量方式的竞争学习方法如下:设经过仿射传播聚类后有N个聚类C1…CN,Xn={xn1,…,xnM}是聚类Cn的M个成员,聚类中心计算为成员的均值 协方差矩阵计算公式为 对于每一个新的特征向量x,考虑到聚类的采样分布,计算它与每一个聚类中心的马氏距离把x分配到与它的马氏距离最小的聚类并更新这个聚类,假设更新的聚类是Cn,采用留一逼近法找到Cn中“最差的”样本,在Cn中选择一个样本,计算这个样本与Cn中剩下的样本的中心的马氏距离,计算得到的马氏距离最大的样本则为“最差的”样本,如果这个样本距离聚类Cn中心的马氏距离小于它距离其他聚类中心的马氏距离,则聚类Cn保留这个样本,否则去除它并且分配给其他聚类。
如图2所示,所述步骤(3-3)中的对每一成对的高分辨率视觉单词和低分辨率视觉单词,计算从低分辨率视觉单词到高分辨率视觉单词的线性回归系数方法按如下给出:给定一个2×2的低分辨率块,对低分辨率网格两倍细分后就形成了一个4×4高分辨率块。高分辨率块中心的4个像素可以用最近邻的4个低分辨率像素通过一个四阶线性插值得到:
其中wij就是回归系数。对每一个视觉单词,给定低分辨率训练样本其中是第i个2×2低分辨率训练样本,高分辨率训练样本其中是低分辨率图像块对应的4个高分辨率像素中的第i个像素。令Wi=[wi1,wi2,wi3,wi4]T,则解如下凸最优化问题:
就可以分别计算出4个高分辨率像素的线性回归系数。
如图3所示,所述步骤(4)中的迭代重复步骤(2)和步骤(3)是指:在迭代的第n步,给定了当前的高分辨率人脸图像估计值x(n),首先求解如下最优化问题:
其中M是最大迭代次数。本实施例一般迭代20次即收敛,并输出最终的高分辨率图像结果x*。
通过以下实验对本实施例所述方法的效果进行说明:实验选择CES-PEAL-R1脸部数据库,该数据库包含1040个人的99594张图像,如表1所示,2个正脸图像的子集被用到两个实验中。本实验中所用到的人脸图像都是通过三个基准点来对齐的:两眼中心和嘴中心。将对齐的高分辨率人脸图像都裁剪成128×96大小,相应的低分辨率图像通过平滑和降采样得到。接下来,一共对三类图像进行超分辨率实验,分别是:对齐准确的人脸,因基准点定位错误而无法准确对齐的人脸,因表情变化而无法准确对齐的人脸。对于前两类测试图像,全局稀疏表达训练集包括标准人脸子库中500幅准确对齐的人脸图像和在高分辨率网格中每个基准点的8个像素对齐误差内随机选择的2500幅未对准的图像。对于第三类有表情的测试图像,全局稀疏表达模型训练集包括标准人脸子库中500幅准确对齐的人脸图像和表情人脸子库中的5种表情下每种表情随机选择300幅共1500幅未对准的图像。另外,对于局部残差补偿的训练集,三类图像的实验都通过随机选择全局稀疏表达模型训练集中对齐模式一致的图像两两相减,得到共300幅残差脸图像。
表1.CAS-PEAL-R1数据库2个子集的内容
将基于优化稀疏表达的方法和已有方法比较,包括金字塔法特征变换法、两步法、LPH法、基于位置块的方法、局部结构法、以及基于稀疏表达的方法。对于结合全局与局部方法的混合法,400幅对齐准确的人脸图像和2000幅对齐不准的人脸图像被用来训练全局模型,剩下的100幅对齐准确的人脸图像和500幅对齐不准的人脸图像用来训练局部模型。
将本发明中字典所包含的基元素个数取为1024。对残差图像块做聚类分析时,从残差脸图像中随机生成100000对高、低分辨率残差块来做训练,其中的40000对用来做相似度传播聚类,60000对用来增量聚类。视觉单词个数设为1000。对于迭代过程,初始的λ选为10。通过实验观测可以得到当迭代的次数超过20次的时候算法可以得到稳定的输出,因此最大迭代次数设为20。
为了量化图像视觉品质,计算2个指标来测量人脸超分辨率重构的图像和真实高分辨率图像的差别,其中一个是均方误差(MSE),公式为 其中是真实高分辨率图像,是重构的人脸图像,W和H分别是图像宽度和高度,N是测试图像的数量,另外一个是结构相似性指标(SSIM)。
第一个实验是对齐准确的人脸图像超分辨率实验。本实验中,从标准人脸子库中选取未用于训练的40幅人脸图像做准确对齐的人脸图像超分辨率测试。本实施例所采用方法,在放大倍数为4时得到的MSE值为99,SSIM值为0.89,这些结果表明本实施例方法持平或优于其它已有的方法,因此本发明对对齐准确的人脸图像超分辨率任务是适用的。
第二个实验是因表情变化而对齐不准的人脸图像超分辨率实验。从表情人脸子库中未用于训练的图像中选取100幅进行测试。本实施例所采用方法,在放大倍数为4时得到的MSE值为112,SSIM值为0.85。由于表情变化使人脸模式更加发散,本实施例所采用方法的结果不如准确对齐时的结果好。但是,与其它已有算法的横向比较下,本方法仍然优于其它已有方法,结果不会产生明显的人工痕迹,非常相似于真实的高分辨率原图。
第三个实验是因基准点定位不准而未对齐人脸图像的超分辨率实验。对高分辨率图像的基准点坐标进行一定范围内的移动来产生对齐不准的高分辨率人脸图像,然后再平滑和降采样获得需要测试的低分辨率图像。因此所说的对齐误差都是相对于高分辨率网格中的基准点坐标来说的。采用和对齐准确人脸图像实验中一样的40幅人脸测试图像,但是人为将基准点坐标在8个像素的范围内移动,也就是以正确坐标为中心的17×17的邻域中采样,这样对于4倍超分辨率问题就相当于在低分辨率网格中有一到两个像素的基准点对齐误差。这里不对更大的定位误差情形进行实验,因为超过8个像素的基准点定位误差会使裁剪出来的人脸图像产生非常大的扭曲和特征损失,这类图像已无法被任何已有的人脸识别系统所使用。本实施例所采用方法,在放大倍数为4时得到的MSE值为140,SSIM值为0.8,本方法仍然鲁棒,在这种程度的对齐误差下效果只比对齐准确时略有降低。
因此,通过上述实验可知,本发明方法相较于现有技术方法,不仅对对齐准确的人脸图像超分辨率任务是适用的,更重要的是,在因表情变化、因基准点定位不准而对齐不准的人脸图像超分辨率实验中仍然能够达到很好的效果,鲁棒性强。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (10)
1.基于迭代稀疏表达的人脸图像超分辨率重建方法,其特征在于,包括以下步骤:
(1)将低分辨率输入图像进行插值得到高分辨率人脸估计图像;
(2)将高分辨率人脸估计图像进行稀疏表达,即将高分辨率人脸估计图像用一个高分辨率人脸图像字典进行线性表达,并在一定的表达误差下要求非零的表达系数尽可能少;之后将稀疏表达结果作为新的高分辨率人脸估计图像;
(3)使用基于局部线性回归方法得到的残差补偿对步骤(2)所得到的新的高分辨率人脸估计图像进行局部细节补偿,得到补偿后的高分辨率人脸估计图像;
(4)迭代重复步骤(2)和步骤(3),最后收敛到稳定值,完成超分辨率重建。
2.根据权利要求1所述的基于迭代稀疏表达的人脸图像超分辨率重建方法,其特征在于,所述步骤(2)中稀疏表达是指:
min||α||0,s.t.x*=Hα,
其中,x*是高分辨率人脸图像估计值,H=[h1,…hm]是高分辨率人脸图像字典,它包含m个基元素hi,i=1,…,m,α∈Rm×1是以表达系数为元素组成的向量,简称系数向量,||α||0是α的l0范数,即α中非零元素的个数。
3.根据权利要求2所述的基于迭代稀疏表达的人脸图像超分辨率重建方法,其特征在于,所述步骤(2)中,高分辨率人脸图像字典H的求解方法如下:
使用基准点对齐预先随机采样得到的一批高分辨率人脸图像;
通过准确定位基准点随机得到B幅对齐准确的高分辨率人脸图像;再通过1-8个像素的误差定位基准点随机得到Q幅对齐不准的高分辨率人脸图像;
将上述图像作为训练样本X=[x1,…,xN]∈Rn×N,其中xi是第i个高分辨率人脸图像样本,n是图像空间维度,N是训练样本个数;
求解以下关于字典H和由N个系数向量组成的矩阵Α=[α1,α2,…,αN]∈Rm×N的联合最优化问题:
其中
4.根据权利要求3所述的基于迭代稀疏表达的人脸图像超分辨率重建方法,其特征在于,使用基准点对齐人脸图像时采用仿射变换,基准点有三个,即两眼中心和嘴中心。
5.根据权利要求1所述的基于迭代稀疏表达的人脸图像超分辨率重建方法,其特征在于,所述步骤(3)中,使用基于局部线性回归方法得到残差补偿的方法如下:
对步骤(2)得到的高分辨率人脸估计图像进行下采样,然后被低分辨率输入图像减除,得到低分辨率残差图像,然后对低分辨率残差图像每一处脸部位置上的图像块进行局部线性回归,得到高分辨率残差图像;将高分辨率残差图像与步骤(2)得到的高分辨率人脸估计图像进行相加合并,完成脸部细节信息补偿,得到新的高分辨率人脸估计图像。
6.根据权利要求5所述的基于迭代稀疏表达的人脸图像超分辨率重建方法,其特征在于,所述步骤(3)中,得到低分辨率残差图像的具体步骤是:已知低分辨率输入图像y,以及由步骤(2)得到的高分辨率人脸估计图像Hα*,定义低分辨率残差图像为: 其中S为超分辨率放大倍数,(p,q)是像素的坐标。
7.根据权利要求5所述的基于迭代稀疏表达的人脸图像超分辨率重建方法,其特征在于,对低分辨率残差图像每一处脸部位置上的图像块进行局部线性回归的方法具体如下:
(3-1)将随机选取的两幅对齐误差一致的不同高分辨率人脸图像相减,得到高分辨率残差图像,依此方法得到W幅训练样本,然后对样本中图像分别进行平滑和降采样得到对应的低分辨率残差图像训练样本;
(3-2)将高、低分辨率残差图像训练样本分块,然后将成对的高分辨率训练残差图像块和低分辨率训练残差图像块的梯度域特征组合在一起,对组合的特征进行聚类分析,聚类得到成对的高分辨率的视觉单词和低分辨率的视觉单词;
(3-3)对每一成对的高分辨率视觉单词和低分辨率视觉单词,计算从低分辨率视觉单词到高分辨率视觉单词的线性回归系数;
(3-4)将输入的低分辨率残差图像分割成图像块,使图像块之间有部分重叠,对于每一个输入的低分辨率残差图像块,先通过计算到各个低分辨率视觉单词样本中心的最小马氏距离来找到它所属的视觉单词,再根据所属视觉单词的线性回归系数,合成对应的高分辨率残差图像块;
(3-5)通过平均重叠部分集成高分辨率残差图像块来得到完整的高分辨率残差图像。
8.根据权利要求7所述的基于迭代稀疏表达的人脸图像超分辨率重建方法,其特征在于,所述步骤(3-2)中,通过计算水平和竖直的一阶梯度作为局部特征,并且把一个残差图像块的所有像素点的梯度特征连接起来形成一个向量作为梯度域特征,从而得到每一个残差图像块的局部几何特征表示,然后再连接高、低分辨率残差图像块的局部几何特征作为组合的特征。
9.根据权利要求7所述的基于迭代稀疏表达的人脸图像超分辨率重建方法,其特征在于,所述步骤(3-2)中,聚类分析采用仿射传播聚类算法,其中在初始的聚类结果上采取增量方式的竞争学习方法。
10.根据权利要求7所述的基于迭代稀疏表达的人脸图像超分辨率重建方法,其特征在于,所述步骤(3-3)中的对每一成对的高分辨率视觉单词和低分辨率视觉单词,计算从低分辨率视觉单词到高分辨率视觉单词的线性回归系数方法如下:
其中wij就是回归系数;对每一个视觉单词,给定低分辨率训练样本其中是第i个2×2低分辨率训练样本,高分辨率训练样本其中是低分辨率图像块对应的4个高分辨率像素中的第i个像素,令Wi=[wi1,wi2,wi3,wi4]T,则解如下凸最优化问题:
即分别计算出4个高分辨率像素的线性回归系数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310229603.4A CN103325104B (zh) | 2013-06-09 | 2013-06-09 | 基于迭代稀疏表达的人脸图像超分辨率重建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310229603.4A CN103325104B (zh) | 2013-06-09 | 2013-06-09 | 基于迭代稀疏表达的人脸图像超分辨率重建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103325104A true CN103325104A (zh) | 2013-09-25 |
CN103325104B CN103325104B (zh) | 2016-05-11 |
Family
ID=49193827
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310229603.4A Active CN103325104B (zh) | 2013-06-09 | 2013-06-09 | 基于迭代稀疏表达的人脸图像超分辨率重建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103325104B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105931181A (zh) * | 2016-04-14 | 2016-09-07 | 武汉大学 | 基于非耦合映射关系的影像超分辨率重建方法及系统 |
CN106157251A (zh) * | 2015-04-01 | 2016-11-23 | 武汉大学 | 一种基于柯西正则化的人脸超分辨率方法 |
CN107392134A (zh) * | 2017-07-14 | 2017-11-24 | 广州智慧城市发展研究院 | 一种基于联合分块的人脸识别方法及系统 |
CN109002758A (zh) * | 2018-06-06 | 2018-12-14 | 武汉理工大学 | 人脸特征点定位方法、装置、设备及存储介质 |
CN109035186A (zh) * | 2018-07-06 | 2018-12-18 | 电子科技大学中山学院 | 基于并行随机采样与传播的地形非特征区域合成方法、装置和电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102136065A (zh) * | 2011-03-28 | 2011-07-27 | 西安电子科技大学 | 基于凸优化的人脸超分辨率方法 |
CN102915527A (zh) * | 2012-10-15 | 2013-02-06 | 中山大学 | 基于形态学成分分析的人脸图像超分辨率重建方法 |
CN103049340A (zh) * | 2012-10-26 | 2013-04-17 | 中山大学 | 基于纹理上下文约束的视觉词汇的图像超分辨率重建方法 |
-
2013
- 2013-06-09 CN CN201310229603.4A patent/CN103325104B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102136065A (zh) * | 2011-03-28 | 2011-07-27 | 西安电子科技大学 | 基于凸优化的人脸超分辨率方法 |
CN102915527A (zh) * | 2012-10-15 | 2013-02-06 | 中山大学 | 基于形态学成分分析的人脸图像超分辨率重建方法 |
CN103049340A (zh) * | 2012-10-26 | 2013-04-17 | 中山大学 | 基于纹理上下文约束的视觉词汇的图像超分辨率重建方法 |
Non-Patent Citations (3)
Title |
---|
XIANG MA等: "Sparse representation and position prior based face hallucination upon classified over-complete dictionaries", 《SIGNAL PROCESSING》 * |
XIANG MA等: "Sparse representation and position prior based face hallucination upon classified over-complete dictionaries", 《SIGNAL PROCESSING》, 3 February 2012 (2012-02-03) * |
黄克斌等: "基于K近邻稀疏编码均值约束的人脸超分辨率算法", 《计算机科学》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106157251A (zh) * | 2015-04-01 | 2016-11-23 | 武汉大学 | 一种基于柯西正则化的人脸超分辨率方法 |
CN106157251B (zh) * | 2015-04-01 | 2018-10-26 | 武汉大学 | 一种基于柯西正则化的人脸超分辨率方法 |
CN105931181A (zh) * | 2016-04-14 | 2016-09-07 | 武汉大学 | 基于非耦合映射关系的影像超分辨率重建方法及系统 |
CN105931181B (zh) * | 2016-04-14 | 2018-10-26 | 武汉大学 | 基于非耦合映射关系的影像超分辨率重建方法及系统 |
CN107392134A (zh) * | 2017-07-14 | 2017-11-24 | 广州智慧城市发展研究院 | 一种基于联合分块的人脸识别方法及系统 |
CN109002758A (zh) * | 2018-06-06 | 2018-12-14 | 武汉理工大学 | 人脸特征点定位方法、装置、设备及存储介质 |
CN109002758B (zh) * | 2018-06-06 | 2021-05-04 | 武汉理工大学 | 人脸特征点定位方法、装置、设备及存储介质 |
CN109035186A (zh) * | 2018-07-06 | 2018-12-18 | 电子科技大学中山学院 | 基于并行随机采样与传播的地形非特征区域合成方法、装置和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN103325104B (zh) | 2016-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110738252B (zh) | 空间自相关的机器学习卫星降水数据降尺度方法、系统 | |
CN106127684B (zh) | 基于双向递归卷积神经网络的图像超分辨率增强方法 | |
CN102156875B (zh) | 基于多任务ksvd字典学习的图像超分辨率重构方法 | |
CN101615290B (zh) | 一种基于典型相关分析的人脸图像超分辨率重建方法 | |
CN101877143B (zh) | 一种二维图像组的三维场景重建方法 | |
CN105654492A (zh) | 基于消费级摄像头的鲁棒实时三维重建方法 | |
CN106204447A (zh) | 基于总变差分和卷积神经网络的超分辨率重建方法 | |
CN102902961A (zh) | 基于k近邻稀疏编码均值约束的人脸超分辨率处理方法 | |
CN103824272A (zh) | 基于k近邻重识别的人脸超分辨率重建方法 | |
CN103325104B (zh) | 基于迭代稀疏表达的人脸图像超分辨率重建方法 | |
CN105046672A (zh) | 一种图像超分辨率重建方法 | |
CN103020935A (zh) | 一种自适应在线字典学习的图像超分辨率方法 | |
CN102136065B (zh) | 基于凸优化的人脸超分辨率方法 | |
CN105469359A (zh) | 基于局部约束低秩表示的人脸超分辨率重建方法 | |
CN107341776A (zh) | 基于稀疏编码与组合映射的单帧超分辨率重建方法 | |
CN103473797B (zh) | 基于压缩感知采样数据修正的空域可缩小图像重构方法 | |
CN103049340A (zh) | 基于纹理上下文约束的视觉词汇的图像超分辨率重建方法 | |
CN104036229A (zh) | 基于回归的主动外观模型初始化方法 | |
CN104657962A (zh) | 基于级联线性回归的图像超分辨重建方法 | |
CN104392462A (zh) | 一种基于显著分割子区域对的sar图像配准方法 | |
Zhou et al. | Improvement of normal estimation for point clouds via simplifying surface fitting | |
CN115984339A (zh) | 基于几何特征精炼与对抗生成网络的双管道点云补全方法 | |
CN103854015B (zh) | 基于联合稀疏描述的多姿态三维人脸识别方法 | |
Zeng et al. | Densely connected transformer with linear self-attention for lightweight image super-resolution | |
CN104091364A (zh) | 单幅图像超分辨重建方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20210901 Address after: 510700 room 2001-1, floor 20, building F, No. 98, Xiangxue 8th Road, Huangpu District, Guangzhou, Guangdong Province (office only) Patentee after: Guangzhou ziweiyun Technology Co.,Ltd. Address before: 510275 No. 135 West Xingang Road, Guangzhou, Guangdong, Haizhuqu District Patentee before: SUN YAT-SEN University |
|
TR01 | Transfer of patent right |