CN111275646B

CN111275646B - 一种基于深度学习知识蒸馏技术的保边图像平滑方法

Info

Publication number: CN111275646B
Application number: CN202010066280.1A
Authority: CN
Inventors: 徐君; 程明明; 刘志昂; 韩琦
Original assignee: Nankai University
Current assignee: Nankai University
Priority date: 2020-01-20
Filing date: 2020-01-20
Publication date: 2022-04-26
Anticipated expiration: 2040-01-20
Also published as: CN111275646A

Abstract

一种基于深度学习知识蒸馏技术的保边图像平滑方法，属于图像处理技术领域。该方法基于新型的深度学习知识蒸馏技术，将边缘检测老师网络的边缘检测能力蒸馏到图像平滑学生网络里，从而使得学生网络具有保边的图像平滑能力。其中学生网络的任务是进行图像平滑，老师网络的任务是提取结构性边缘的信息。利用老师网络向学生网络进行结构性边缘知识的蒸馏迁移，使学生网络在进行图像平滑的任务的同时，具备老师网络的保留结构性边缘能力。本发明能够在不额外引入保留边缘信息的深度网络前提下保留图像平滑的结构性边缘，克服了传统图像平滑增强方法中如不能很好地保留图像边缘信息、模糊等图像质量损失的视觉影响，极大地提高了图像平滑的效果。

Description

一种基于深度学习知识蒸馏技术的保边图像平滑方法

技术领域

本发明属于图像处理技术领域，特别涉及到一种基于新型深度学习知识蒸馏技术的保边图像平滑方法。

背景技术

近年来随着多媒体技术的蓬勃发展，以及工业界的广泛需求，图像处理技术的应用场景不断扩大。现有的图像可以分为全局结构和局部纹理的融合，图像的纹理在一定程度上会影响图像结构信息的自动提取。此外，由于人们对拍照技术的需求，在拍摄人脸时会需要对脸部进行“磨皮”美化，从而使人脸显得更加美观。在进行风格迁移的时候，需要保留结构边缘而忽略具体纹理信息。基于这些需求，我们在拍摄图像后需要对图像进行保边性的平滑处理，从而使其更好地用于后续的图像美化、分析和处理。图像平滑技术是为了某种特定的需求，保留图像中的全局结构信息，去除图像中的局部纹理信息的一类计算机视觉任务。图像平滑的主要目的是通过增强图像结构相对于图像纹理的视觉效果，使得平滑后的图像更加便于人类或者机器进行分析和处理。图像平滑技术已经被广泛应用于各大手机拍照技术和社交媒体等领域中，在我们的生活中发挥着十分重要的作用。例如，美颜相机通常利用图像平滑技术对人脸进行平滑处理。

然而，在图像平滑任务中，还存在一些亟待解决的难点。比如图像平滑技术如何更好地保留结构性边缘的信息。人类直接通过人眼可以本能地在一幅图像复杂的纹理信息中提取有意义的结构性信息。然而，计算机程序很难自动区分图像中的结构信息和纹理信息，现有的图像平滑技术可能会为了去掉纹理信息而把结构的边缘部分也平滑掉。保留边缘的图像平滑技术可以在去除纹理的同时自动保留结构性边缘信息，这是一项非常具有挑战性的任务，对于计算机视觉应用非常重要。

Hinton等人在2015年公开的文章Distilling the knowledge in a NeuralNetwork(NIPS 2014 Deep Learning Workshop)首次提出了深度学习知识蒸馏的框架，引入“学生网络”与“老师网络”的概念，目的是将多个训练后的老师网络的知识集中迁移到一个学生网络中。这里利用知识蒸馏将分类数据集的“硬标签”推广到“软化标签”，从而可以学习到不同标签的图像之间的相似程度。训练好老师网络后，老师网络具备了提供隐藏在标签外的额外判别性和相似性知识，再通过知识蒸馏技术将该知识迁移到学生网络中。近年来随着计算设备的完善与改进，神经网络发展十分迅速。由于其具有强大的表示能力，目前神经网络已经被广泛应用于计算机视觉、自然语言处理等研究领域。目前关于神经网络的一大研究热点在于将神经网络部署在便携嵌入式设备中。由于神经网络本身的性质，往往其参数量越大则其模型性能越强。但是网络模型参数越多，网络需要占用更多的内存资源，运行也极为耗时，这与工业界占用资源少、运算时间短的需求相悖。而知识蒸馏技术可以有助于解决这一问题。知识蒸馏技术利用一个或多个具有大参数量的老师网络去提升一个具有小参数量的学生网络的性能。学生网络很可能最终性能无法与老师网络媲美，但是却比脱离老师网络而单独训练的学生网络更加强大。

然而常用的深度学习知识蒸馏方法并不能直接用在保边图像平滑任务里。其原因是在我们的任务里，老师网络主要是提取结构性边缘信息，学生网络主要是去除图像中的局部纹理。直接用训练好的老师网络来蒸馏学生网络，只能得到具有图像边缘提取和检测的学生网络，并不能得到具有图像平滑能力的学生网络。因此，我们提出一种新型的基于深度学习知识蒸馏技术，并运用到保边图像平滑任务里。这个方法可以在完成图像平滑任务的同时，具备保留结构性边缘的能力。

发明内容

本发明需要解决的技术问题是针对图像平滑任务中，在图像纹理被去掉的同时，保留图像的结构性边缘信息。本发明的目的是提出一种基于新型的深度学习知识蒸馏技术，将老师网络的提取结构性边缘能力向图像平滑的学生网络进行知识迁移，使学生网络在进行图像平滑的同时，可以具备老师网络的保留结构性边缘能力。

本发明的实现过程如下：

可选的，选择已有的深度学习模型或者重新训练一个深度学习模型作为老师网络，包括：

训练深度神经网络进行边缘检测任务；

可选的，利用老师网络辅助训练图像平滑学生网络，迭代包括：

将输入图像I输入到学生网络，得到平滑图像Is；

将输入图像I与平滑后的平滑图像Is分别输入到老师网络，得到输入图像的结构性边缘标签Ie与平滑图像的结构性边缘信息Ise；

将输入图像I利用现有常用的图像平滑算法(如L0)得到平滑图像标签Igt；

利用损失函数分别计算平滑图像Is与平滑图像标签Igt之间的距离损失，以及平滑图像的结构性边缘信息Ise与输入图像的结构性边缘标签Ie之间的距离损失；

对两种损失进行加权求和得到距离损失总和；

利用损失总和对学生网络进行梯度回传，更新学生网络参数。

利用多次上述迭代训练学生网络。

与现有技术相比，本发明的有益效果为：通过老师网络计算额外的结构性边缘信息计算损失来更新学生网络，使得学生网络不仅能够学习到图像平滑的能力，同时还能具备老师网络的保留结构性边缘的能力。这样可以弥补现有图像平滑方法中图像平滑无法很好保留结构性边缘的负面影响。

附图说明

图1为一种基于新型的深度学习知识蒸馏技术的保边图像平滑方法流程图。

图2为一种基于新型的深度学习知识蒸馏技术的保边图像平滑方法模型示意图。

具体实施方式

下面将结合本发明实例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实例仅仅是本发明的一部分实施例，而不是全部的实施例。在不脱离本发明的原理情况下，对本发明实施例做出变化、修改、替换和变形都属于本发明保护的范围。

本发明实施例提供了一种基于知识蒸馏技术的图像增强深度学习方法，流程如图1所示，所述方法包括：

S1、选择老师网络计算结构性边缘图。

可选的，结构性边缘信息为图像里的描述图像内容结构信息的边缘分布图；

可选的，选择已经训练好的可以提取结构性边缘信息的深度神经网络作为老师网络，也可以重新训练一个有类似功能的深度神经网络模型，这里可以采用 Holistic EdgeDetection边缘检测模型或经典的VGG模型，利用老师网络辅助训练图像平滑学生网络。

S2、由学生网络计算平滑图像。

可选的，学生网络结构使用经典深度神经网络，如VGG或者残差神经网络；

输入图像I经学生网络平滑后得到平滑图像Is，具体的，将待平滑图像输入到深度神经网络模型(如常用的VGGNet，拥有5个由卷积层，修正线性单元和最大池化操作组成的模块，3个全连接层和修正线性单元组成的模块，最后1 个softmax层)中，设计神经网络结构是“由图像预测图像”的结构(如之前介绍的VGGNet)，模型输出的是一幅与输入图像I尺寸相同的经过图像平滑后的输出图像。

S3、由老师网络计算结构性边缘信息标签与平滑后图像的结构性边缘信息。

具体的，将输入图像I与平滑图像Is分别输入到边缘检测老师网络，由老师网络预测出输入图像的结构性边缘标签Ie与平滑图像的结构性边缘信息Ise。在边缘检测老师网络中输入图像的结构性边缘标签Ie作为输入图像的边缘图像，平滑图像的结构性边缘信息Ise为边缘检测老师网络在平滑后图像上检测到的边缘图像。

S4、计算学生网络的损失来更新学生网络参数。

可选的，利用常用损失函数(比如L2范数，L1范数，交叉熵)分别计算平滑图像Is与平滑图像标签Igt之间的损失||Is-Igt||_{F}^{2}，以及平滑图像的结构性边缘信息Ise与输入图像的结构性边缘标签Ie之间的损失 ||Ise-Ie||_{F}^{2}；本发明中平滑图像标签Igt是将输入图像I利用现有常用的图像平滑算法(如L0)得到。

具体的，对两种损失进行加权求和得到损失总和，利用损失总和对学生网络进行常规的梯度回传(可通过深度学习框架PyTorch或Tensorflow里的SGD， Adam算法自动实现)，更新学生网络参数。

S5、多次迭代训练学生网络。

具体的，利用上述更新方式不断更新学习学生网络参数，训练学生网络，模型示意图如图2所示。训练过程中固定老师网络参数，即在训练学生网络的期间不更新老师网络参数。

Claims

1.一种基于深度学习知识蒸馏技术的保边图像平滑方法，其特征在于：将老师网络的提取结构性边缘能力向图像平滑的学生网络进行知识迁移，使学生网络在进行图像平滑的同时，具备老师网络的保留结构性边缘能力，该方法包含如下步骤：

S1、训练保留结构性边缘的深度神经网络作为老师网络；

S2、将输入图像输入到学生网络，网络输出的是一幅与输入图像尺寸相同的经过图像增强后的平滑图像；

S3、将输入图像与平滑后的平滑图像分别输入到老师网络，得到输入图像的结构性边缘标签与平滑图像的结构性边缘信息；

将输入图像利用现有常用的图像平滑算法得到平滑图像标签；

S4、利用常用损失函数分别计算平滑图像与平滑图像标签之间的损失，以及平滑图像的结构性边缘信息与输入图像的结构性边缘标签之间的损失；对两种损失进行加权求和得到损失总和，利用损失总和对学生网络进行常规的梯度回传，更新学生网络参数；

S5、利用上述更新方式不断更新学习学生网络参数，训练学生网络的模型参数。

2.根据权利要求1所述的基于深度学习知识蒸馏技术的保边图像平滑方法，其特征在于：将输入图像与平滑图像分别输入到老师网络，提取输入图像的结构性边缘标签与平滑图像的结构性边缘信息，将边缘检测老师网络提取的输入图像的结构性边缘标签作为输入图像的边缘图像，将平滑图像的结构性边缘信息作为平滑后图像的边缘图像。

3.根据权利要求1所述的基于深度学习知识蒸馏技术的保边图像平滑方法，其特征在于：学生网络总的损失函数由两部分损失加权求和构成，一部分是利用常见损失函数计算平滑后图像与平滑图像标签之间的损失，另一部分是利用常见损失函数计算平滑图像的结构性边缘信息与输入图像的结构性边缘标签之间的损失。

4.根据权利要求1或2所述的基于深度学习知识蒸馏技术的保边图像平滑方法，其特征在于：老师网络是预先训练好的，训练学生网络过程中并不更新老师网络参数。