CN110852962A

CN110852962A - 一种基于回归树分类的双重映射学习压缩人脸图像复原方法

Info

Publication number: CN110852962A
Application number: CN201911035976.1A
Authority: CN
Inventors: 刘峰; 邓金晶; 干宗良; 崔子冠
Original assignee: Nanjing University of Posts and Telecommunications
Current assignee: Nanjing University of Posts and Telecommunications
Priority date: 2019-10-29
Filing date: 2019-10-29
Publication date: 2020-02-28
Anticipated expiration: 2039-10-29
Also published as: CN110852962B

Abstract

本发明提供了一种基于回归树分类的双重映射学习压缩人脸图像复原方法。在训练阶段，首先将得到的残差人脸图像不重叠分块，对应位置压缩图像块向外扩展后分块构成训练样本集；再对每个压缩图像块进行二次重叠分块，对得到的每个子块进行多维特征提取再进行回归树分类；通过分类结果引导压缩图像块进行全局回归和多局部线性回归的双重映射；得到的双重映射作为压缩图像块和残差图像块之间的非线性回归模型；将上述模型应用到待清晰的图像块中，得到复原后的残差图像块；按照位置顺序将残差图像块无重叠拼接后再加上压缩图像，得到最终复原后的清晰人脸图像。

Description

一种基于回归树分类的双重映射学习压缩人脸图像复原方法

技术领域

本发明属于数字图像处理领域，特别涉及一种基于回归树分类的双重映射学习压缩人脸图像复原方法。

背景技术

随着近年来人脸检测、人脸识别、人机交互等应用发展火热，以人为处理对象的计算机视觉技术的应用场景越来越丰富，同时人们对于通过图像采集设备得到的人脸图像质量的要求也在逐渐提高。虽说如今手机、电脑等硬件设备已经大幅升级更新，但用户终端接收到的图片质量仍参差不齐，尤其是经过压缩后的人脸图像难以识别，导致后续的高级计算机视觉技术无法达到期望效果。因此压缩人脸图像复原技术的研究具有重要的意义。人脸图像复原技术是通过将采集到的压缩人脸图像，通过事先训练好的压缩复原模型处理得到与压缩人脸图像相同大小的清晰人脸图像。

发明内容

基于上述问题，本发明提出了一种基于回归树分类的双重映射学习压缩人脸图像复原方法，提高了待清晰人脸图像的质量。

为解决上述技术问题，本发明采用如下的技术方案：

一种基于回归树分类的双重映射学习压缩人脸图像复原方法，其步骤如下：

(1)、将一组清晰人脸图像通过图像压缩模型得到一组对应的压缩人脸图像，用清晰人脸图像与得到的压缩人脸图像做差得残差人脸图像，接着将两组图像进行不重叠分块，压缩图像块向外扩展，两者按在图像中的位置顺序排列构建出清晰人脸与扩展的压缩人脸的训练样本集；

(2)、将训练集中扩展的压缩人脸图像块进行重叠分块，对得到的每个压缩人脸图像子块进行多维特征提取；

(3)、将得到的压缩人脸图像子块的多维特征进行回归树分类，对分得的每一类求其双重线性映射矩阵，即局部线性回归子和全局线性回归子；

(4)、将待清晰的人脸图像用大尺寸矩形窗进行不重叠分块，得到扩展的待清晰人脸图像块；利用训练得到的回归树分类结果，对待清晰的人脸图像块寻找所属类对应的双重映射矩阵，再利用双重线性映射矩阵求得对应的清晰人脸图像块；

(5)、将求得的清晰人脸图像块按位置不重叠拼接，再与待清晰人脸图像相加，得到最终的复原人脸图像。

优选的，所述的步骤(1)具体为：

(1.1)、从人脸样本库中取出清晰人脸图像，通过图像压缩模型得到压缩人脸图像。将清晰人脸图像与对应的压缩人脸图像相减，得到残差人脸图像；

(1.2)、采用小尺寸的矩形窗口对残差人脸图像进行不重叠的分块操作，得到残差人脸图像块；同时将对应位置小尺寸的压缩人脸图像块向外扩展，得到对应大尺寸的压缩人脸图像块；

(1.3)、压缩人脸图像块和残差人脸图像块构成压缩与清晰人脸的训练样本集，用表示压缩人脸图像块的样本集，用

表示残差人脸图像块的样本集，其中S表示大尺寸矩形窗口的尺寸，s表示小尺寸矩形窗口的尺寸，M表示样本集中图像块的个数。

优选地，所述步骤(2)具体为：

(2.1)、将扩展的压缩人脸图像块重叠分块得到一系列压缩人脸图像子块；对每个压缩人脸图像子块进行多维特征提取，用得到的结果作为所属图像块的表征；从而引导步骤(3)所述的分类问题。

(2.2)、压缩人脸图像子块的特征提取分为内部特征提取与外部特征提取，对应于子块的纹理、轮廓特征和语义特征；内部特征提取采用简单的边缘提取算子，示为

用式(1)所示的边缘提取算子图像子块进行处理，向量化拉伸后作为该压缩人脸图像子块的纹理特征；

(2.3)、外部特征提取分为三个部分，即压缩人脸图像子块在扩展的压缩人脸图像块中的相对位置，压缩人脸图像子块所属的五官类别，以及压缩人脸图像子块的几何统计特征；首先用式(2)计算压缩人脸图像子块与中心块的相对位置，用两者中心像素的曼哈顿距离之和求得，即

其中，d_m(·)表示曼哈顿距离算子，k表示压缩人脸图像子块子块中心像素，c_i表示中心块的第i个像素。

(2.4)、压缩人脸图像子块所属的五官类别由landmark判定，对于压缩人脸图像子块所属原始压缩人脸图像，由landmark算法可以得到人脸关键点，其中界定了眉毛、眼睛、鼻翼、嘴部和脸颊的轮廓范围；

为规避特征点不精准带来的误差，用五官的最小外接矩形粗略规定五官的位置；得到眼部、鼻子、嘴部和其他部分的五官特征区域划分后，将包含某一区域像素的图像块划分该区域属性；故将子块分为{1,2,3,4}这四类，分别代表眼部、鼻子、嘴部和脸部的其他部分；

(2.5)、压缩人脸图像子块的几何统计特征由子块的主方向角度和强度界定，首先通过计算压缩人脸图像子块的方差来衡量子块的平滑程度；用s_i代表第i个像素点的像素值，那么该压缩人脸图像子块的方差可以表示为

其中

代表压缩人脸图像子块像素的均值，l表示压缩人脸图像子块的总像素数；如求得的图像块方差低于设定的平滑阈值，则将该压缩人脸图像子块归为平滑类，剩下的块通过计算图像块的主方向强度，以预设的强度阈值作为区分，最后通过主方向角度将图像块分为N个方向范围；

压缩人脸图像子块主方向角度与强度的计算步骤如下：

对于一个压缩人脸图像子块，通过式(4)求得子块中第i个像素在整体像素中的梯度g_i，

其中，t(x，y)表示在位置(x,y)处的第i个像素的大小，因此整个压缩人脸图像子块的梯度可以表示为

G＝[g₁，...，g_n]^T (5)

为得到图像的主方向信息，需通过求取梯度表示G的奇异值分解(SVD)，G可被分解为G＝USV^T；在上述分解式中，将矩阵V的第一列v₁选作图像块的主方向向量，第二列v₂则作为图像块的副方向向量，S中对应的特征值为S_1，1和S_2，2；

在此基础上，定义图像块主方向的强度为

定义图像块主方向的角度为

如压缩人脸图像子块计算出来的主方向强度值R小于设定的强度阈值，则将该压缩人脸图像子块归为随机块；根据上述定义对图像块进行分类，可将压缩人脸图像子块分为N类，表示为{1,2,…,N+2}，分别代表平滑块、随机块、以及N个方向块。

优选的，所述步骤(3)具体为：

(3.1)、步骤(1)中所述的残差人脸图像块与扩展的压缩人脸图像块进行向量化处理，得到需要复原的残差图像块特征和压缩图像特征，分别表示为

和

(3.2)、采用由步骤(2)得到的多维特征进行回归树分类，决策树分类通过判断样本是否符合当前叶节点的条件来对样本进行分类，回归树会遍历所有训练样本，找到最优的分割节点j和最优的分割点s；

出于图像复原的目的，用叶节点处训练的回归矩阵来比较不同划分的误差，节点j处的正则线性回归可以表示为式

其中，X表示训练集中的压缩图像块特征构成的矩阵，Y表示训练集中的残差图像块特征构成的矩阵，C_j是在节点j处训练得到的回归矩阵；

(3.3)、最优的分割节点j和最优的分割点s通过式(9)进行评判

其中，R₁(j，s)＝{x|x^j≤s}和R₂(j，s)＝{x|xⁱ＞s}是被划分后的两个区域；通过选择最优的分割节点j和最优的分割点s，遍历所有特征，找到使上式最小时的数对(j,s)；用选定的数对(j,s)划分区域，直到满足停止条件，即误差减小量；

(3.4)、如步骤(3.2)中所述的停止条件可以用在节点j处的误差减小量做衡量标准，当分支后的误差减小量小于给定阈值时，则不再往下分类；节点j处误差减小量的计算公式如式(10)所示：

其中，E_j是拟合误差，由j点的压缩图像块特征与残差图像块特征之间的均方误差求得，如式(11)所示，E_L和E_R是左右两个子节点的加权拟合误差，N_j表示在j点处的训练样本个数；

当分支后的误差减小量小于给定阈值时，则不再往下分类。

优选的，所述步骤(4)具体为：

(4.1)、假设由步骤(3)最终分类得到K类压缩人脸图像子块，首先对每类做压缩图像块特征到残差图像块特征的线性映射；用式(12)得到局部线性映射矩阵M，即

其中，X_k是属于第k类的残差图像块特征，Y_k是属于第k类的压缩图像块特征；所述局部线性映射矩阵M可以由式(13)求得

(4.2)、对于一个扩展的压缩人脸图像块，可由步骤(4.1)求得m个映射矩阵；接下来需要再训练一个全局回归子，可将这m个压缩人脸图像子块的回归子结合起来，从而得到对压缩人脸图像块的双重线性映射矩阵；全局回归子的训练方式与局部线性映射矩阵类似，由式(14)求得

其中，X_c是由m个一次复原人脸图像块拼接而成的图像矩阵；

(4.3)、通过式(15)的乘法操作将两者结合，得最终的双重线性映射矩阵W：

优选的，所述步骤(5)具体为：

(5.1)、按照步骤(1)所述要求将待清晰人脸图像进行不重叠分块再向外扩展，得到扩展的待清晰人脸图像块，接下来以扩展的待清晰人脸图像块为单位进行复原处理；先将扩展的待清晰人脸图像块做向量化表示，同时对每个扩展的待清晰人脸图像块再划分得到一系列待清晰人脸图像子块，对每个待清晰人脸图像子块进行内部特征提取与外部特征提取；

(5.2)、将分割好的待清晰人脸图像子块放入训练好的回归树，得到该待清晰人脸图像子块所属的类以及对应的双重线性映射矩阵。

(5.3)、将待清晰人脸图像特征与上一步得到双重线性映射矩阵相乘，得到复原人脸图像特征；将复原人脸图像特征张成复原人脸图像块后按位置不重叠拼接，得到复原残差人脸图像；最后将复原残差人脸图像与待清晰人脸图像相加，得到最终的复原人脸图像。

本发明具有以下有益效果：1、本发明在人脸图像和清晰人脸图像间建立了不对称的映射关系，该方法能够充分利用压缩图像块区域的邻域像素关系，从而给压缩人脸图像带来更好的复原效果；2、本发明对压缩人脸图像块的子块进行了多维特征映射，该方法可以充分利用子块的结构信息和纹理信息，对人脸五官位置的提取可以充分运用人脸图像的结构化特性，从而有助于更好的分类；3、本发明的分类方法采用回归树分类，该方法可以协同运用图像块的多种特征进行分类，实验表明该分类可以带来更好的回归效果。

附图说明

图1是本发明训练和复原阶段的整体流程示意图；

图2是本发明分块后训练集训练方法的流程示意图。

具体实施方案

下面结合附图和实施实例对本发明作进一步说明。

本发明所述的一种基于回归树分类的双重映射学习压缩人脸图像复原方法，其步骤如下：

(2)、将训练集中的压缩人脸图像块进行重叠分块，对每个压缩人脸图像子块进行多维特征提取；

(4)、将待清晰的人脸图像进行不重叠分块和向外扩展，得到扩展的待清晰人脸图像块；利用训练得到的回归树分类结果，对待清晰的人脸图像块寻找所属类对应的双重映射矩阵，再利用双重线性映射矩阵求得对应的清晰人脸图像块；

优选的，所述步骤(1)具体为：

(1.1)、从人脸样本库中取出大小不限的清晰人脸图像10000幅，然后用webp对清晰人脸图像进行压缩，得到对应的压缩人脸图像。将两者相减得残差人脸图像；

(1.2)、采用2*2的矩形窗口对残差人脸图像进行不重叠的分块操作，同时将对应位置2*2大小的压缩人脸图像块向外扩展，上下左右均向外扩展3格，得到对应8*8大小的扩展的压缩人脸图像块；缺失的边缘像素做填充处理；

(1.3)、将上步得到的残差人脸图像块和压缩人脸图像块对应整合起来，构成清晰与压缩人脸的训练样本集，用

表示压缩人脸图像块的样本集，用表示残差人脸图像块的样本集，其中M表示样本集中图像块的个数。

进一步，所述步骤(2)具体为：

(2.1)、将扩展的压缩人脸图像块用3*3的滑动窗口对其进行步长为1的滑动，每个8*8大小的扩展的压缩人脸图像块可得到36个大小为3*3的相互重叠的压缩人脸图像子块；

(2.2)、对压缩人脸图像子块用式(1)所示的边缘提取算子提取内部特征

该边缘提取算子对3*3大小的压缩人脸图像子块进行处理，可以得到长度为12的压缩人脸图像子块边缘特征；

(2.3)、用式(2)对压缩人脸图像子块在扩展的压缩人脸图像块中的相对位置进行测量

其中，d_m(·)表示曼哈顿距离算子，k表示压缩人脸图像子块中心像素，c_i表示中心块的第i个像素；

(2.4)、用landmark算法得到68个人脸关键点，用五官的最小外接矩形粗略规定五官的位置，从而得到压缩人脸图像子块所属的五官类别；可将压缩人脸图像子块分为{1,2,3,4}四类，分别代表眼部、鼻子、嘴部和其他部分；

(2.5)、压缩人脸图像子块的几何统计特征由压缩人脸图像子块的主方向角度和强度界定，首先通过计算压缩人脸图像子块的方差来衡量子块的平滑程度。由于一个压缩人脸图像子块由9个像素点组成，用s_i代表第i个像素点的像素值，那么该压缩人脸图像子块的方差可以表示为

其中

代表压缩人脸图像子块像素的均值；当求得的图像块低于设定的平滑阈值，将该压缩人脸图像子块归为平滑类，剩下的块通过计算图像块的主方向强度，以预设的强度阈值作为区分，最后通过主方向角度将图像块分为8个方向范围；

压缩人脸图像子块主方向角度与强度的计算步骤如下：

对于一个压缩人脸图像子块，通过式(4)求得压缩人脸图像子块中第i个像素在整体像素中的梯度g_i：

G＝[g₁，...，g_n]^T (5)

(2.6)、通过求取梯度表示G的奇异值分解(SVD)来得到图像的主方向信息，G可被分解为G＝USV^T；在这个分解式中，将矩阵V的第一列v₁选作图像块的主方向向量，第二列v₂则作为图像块的副方向向量，S中对应的特征值为S_1，1和S_2，2；

在此基础上，定义图像块主方向的强度为

定义图像块主方向的角度为

因此，如果压缩人脸图像子块计算出来的主方向强度值R小于设定的强度阈值，则将该压缩人脸图像子块归为随机块；根据上述定义对图像块进行分类，可以将压缩人脸图像子块分为10类，表示为{1,2,…,10}，分别代表平滑块、随机块、以及8个方向块。

进一步，所述步骤(3)具体为：

(3.1)、将步骤(1)中得到的残差人脸图像块向量化处理，得到需复原的残差图像块特征

和压缩图像特征

(3.2)、采用由步骤(2)得到的多维特征进行回归树分类，用叶节点处训练的回归矩阵来比较不同划分的误差，节点j处的正则线性回归可以表示为式

其中，X表示训练集中的压缩图像特征构成的矩阵，Y表示训练集中的残差图像块特征构成的矩阵，C_j是在节点j处训练得到的回归矩阵，λ是正则化系数，设为0.001；

(3.3)、最优的分割节点j和最优的分割点s通过式(9)进行评判

其中，R₁(j，s)＝{x|x^j≤s}和R₂(j，s)＝{x|x^j＞s}是被划分后的两个区域；

(3.4)、当分支后的误差减小量小于给定阈值时，则不再往下分类，节点j处误差减小量的计算公式如式(10)所示：

当分支后的误差减小量小于给定阈值时，则不再往下分类。

进一步，所述步骤(4)具体为：

(4.1)、由式(12)得到局部线性映射矩阵M，即

其中，X_k是属于第k类的残差图像块特征，Y_k是属于第k类的8×8的压缩图像块特征，这里的稀疏系数λ＝0.001；对于一个8×8的扩展的压缩人脸图像块，可求得36个映射矩阵；经过推导，局部线性映射矩阵M可以由式(13)求得

(4.2)、对于一个扩展的压缩人脸图像块，可由步骤S41求得m个映射矩阵。接下来需要再训练一个全局回归子，可将这m个压缩人脸图像子块的回归子结合起来，从而得到对压缩人脸图像块的双重线性映射矩阵。全局回归子的训练方式与局部线性映射矩阵类似，由式(14)求得

其中，X_c是由36个一次复原人脸图像块拼接而成的图像矩阵；

(4.3)、通过式(15)的乘法操作可以将两者结合起来，得到最终的双重线性映射矩阵W：

进一步，所述步骤(5)具体为：

(5.1)、按照步骤(1)所述要求将待清晰人脸图像进行不重叠分块再向外扩展，得到扩展的待清晰人脸图像块，接下来以扩展的待清晰人脸图像块为单位进行复原处理。先将扩展的待清晰人脸图像块做向量化表示，同时对每个扩展的待清晰人脸图像块再划分得到一系列待清晰人脸图像子块，对每个待清晰人脸图像子块进行内部特征提取与外部特征提取；

(5.2)、将分割好的待清晰人脸图像子块放入训练好的回归树，得到该待清晰人脸图像子块所属的类以及对应的双重线性映射矩阵；

Claims

1.一种基于回归树分类的双重映射学习压缩人脸图像复原方法，其特征在于，其步骤如下：

2.根据权力要求1所述的一种基于回归树分类的双重映射学习压缩人脸图像复原方法，其特征在于，所述的步骤(1)具体为：

3.根据权力要求1所述的一种基于回归树分类的双重映射学习压缩人脸图像复原方法，其特征在于，所述步骤(2)具体为：

(2.1)、将扩展的压缩人脸图像块重叠分块得到一系列压缩人脸图像子块；对每个压缩人脸图像子块进行多维特征提取，用得到的结果作为所属图像块的表征；引导步骤(3)所述的分类问题；

h₁＝[1 -1]

其中，d_m(·)表示曼哈顿距离算子，k表示压缩人脸图像子块子块中心像素，c_i表示中心块的第i个像素；

(2.4)、压缩人脸图像子块所属的五官类别由landmark判定，对压缩人脸图像子块所属原始压缩人脸图像，由landmark算法得到人脸关键点，其中界定了眉毛、眼睛、鼻翼、嘴部和脸颊的轮廓范围；

用五官的最小外接矩形粗略规定五官的位置；得到眼部、鼻子、嘴部和其他部分的五官特征区域划分后，将包含某一区域像素的图像块划分该区域属性；将子块分为{1,2,3,4}这四类，分别代表眼部、鼻子、嘴部和脸部的其他部分；

其中代表压缩人脸图像子块像素的均值，l表示压缩人脸图像子块的总像素数；如求得的图像块方差低于设定的平滑阈值，则将该压缩人脸图像子块归为平滑类，剩下的块通过计算图像块的主方向强度，以预设的强度阈值作为区分，最后通过主方向角度将图像块分为N个方向范围；

其中，压缩人脸图像子块主方向角度与强度的计算步骤如下：

G＝[g₁，...，g_n]^T (5)

为得到图像的主方向信息，需通过求取梯度表示G的奇异值分解，G可被分解为G＝USV^T；在上述分解式中，将矩阵V的第一列v₁选作图像块的主方向向量，第二列v₂则作为图像块的副方向向量，S中对应的特征值为S_1，1和S_2，2；

在此基础上，定义图像块主方向的强度为

定义图像块主方向的角度为

如压缩人脸图像子块计算出来的主方向强度值R小于设定的强度阈值，则将该压缩人脸图像子块归为随机块；根据上述定义对图像块进行分类，将压缩人脸图像子块分为N类，表示为{1,2,…,N+2}，分别代表平滑块、随机块、以及N个方向块。

4.根据权力要求1所述的一种基于回归树分类的双重映射学习压缩人脸图像复原方法，其特征在于，所述步骤(3)具体为：

和

(3.3)、最优的分割节点j和最优的分割点s通过式(9)进行评判

其中，R₁(j，s)＝{x|x^j≤s}和R₂(j，s)＝{x|x^j＞s}是被划分后的两个区域；通过选择最优的分割节点j和最优的分割点s，遍历所有特征，找到使上式最小时的数对(j,s)；用选定的数对(j,s)划分区域，直到满足停止条件，即误差减小量；

当分支后的误差减小量小于给定阈值时，则不再往下分类。

5.根据权力要求1所述的一种基于回归树分类的双重映射学习压缩人脸图像复原方法，其特征在于，所述步骤(4)具体为：

(4.2)、对于一个扩展的压缩人脸图像块，由步骤(4.1)求得m个映射矩阵；再训练一个全局回归子，将这m个压缩人脸图像子块的回归子结合，得到对压缩人脸图像块的双重线性映射矩阵；全局回归子的训练方式与局部线性映射矩阵类似，由式(14)求得

其中，X_c是由m个一次复原人脸图像块拼接而成的图像矩阵；

6.根据权力要求1所述的一种基于回归树分类的双重映射学习压缩人脸图像复原方法，其特征在于，所述步骤(5)具体为：

(5.1)、按照步骤(1)所述要求将待清晰人脸图像进行不重叠分块再向外扩展，得到扩展的待清晰人脸图像块，再以扩展的待清晰人脸图像块为单位进行复原处理；先将扩展的待清晰人脸图像块做向量化表示，同时对每个扩展的待清晰人脸图像块再划分得到一系列待清晰人脸图像子块，对每个待清晰人脸图像子块进行内部特征提取与外部特征提取；