CN115147283A

CN115147283A - 一种图像重建方法、装置、设备及介质

Info

Publication number: CN115147283A
Application number: CN202210924691.9A
Authority: CN
Inventors: 陈鹏; 陈宇; 胡启昶; 李腾; 李发成; 张如高; 虞正华
Original assignee: Magic Vision Intelligent Technology Wuhan Co ltd
Current assignee: Suzhou Moshi Intelligent Technology Co ltd
Priority date: 2022-08-03
Filing date: 2022-08-03
Publication date: 2022-10-04

Abstract

本发明公开了一种图像重建方法、装置、设备及介质，涉及计算机视觉领域，该方法包括：将第一分辨率的图像输入至训练好的超分辨率卷积神经网络模型中，得到超分辨率卷积神经网络模型输出的第二分辨率的图像；超分辨率卷积神经网络模型中所有卷积层、批归一化层、点加层和上采样层均通过量化处理进行模型计算位宽的压缩；超分辨率卷积神经网络模型在训练过程中通过自监督损失函数使得量化前后的数据的误差在预设范围内。本发明极大地降低了模型的计算复杂度，能带来超分辨率卷积神经网络模型在实际应用时运行速度、功耗、访存带宽等方面的优势；通过自监督损失函数约束量化系数，稳定训练过程，有效地提高了超分辨率卷积神经网络模型的量化精度。

Description

一种图像重建方法、装置、设备及介质

技术领域

本发明涉及计算机视觉领域，具体涉及一种图像重建方法、装置、设备及介质。

背景技术

图像的超分辨率（Super-Resolution，SR）算法是计算机视觉领域中的一个重要的研究领域，超分辨率算法旨在将第一个低分辨率（Low Resolution，LR）的图像转化或者说重建成一张高分辨率（High Resolution，HR）的图像，超分辨率算法在监控设备、卫星图像和医学影像等领域都有重要的应用价值。

随着深度神经网络特别是深度卷积神经网络（Deep Convolution NeuralNetwork，DCNN）被广泛地应用到计算机视觉中的各个领域。经研究表明深度学习算法在超分辨领域能取得比传统算法更好的效果。然而，深度学习算法的高计算量阻碍了该类算法在超分辨领域的部署，特别是超分辨网络中每个特征图的分辨率一般都比较大，对系统的计算能力、存储和数据传输带宽都有着较高的要求。因此，需要使用到模型量化等技术对基于深度学习算法的超分辨网络结构进行压缩，使得这些算法能够在实际平台上更加高效低完成部署。

综上，能够对大幅度降低面向超分辨任务的基于深度学习算法计算复杂度的模型是目前亟待解决的重要课题。

发明内容

有鉴于此，本发明实施例提供了一种图像重建方法、装置、设备及介质，以解决基于深度学习算法的超分辨网络模型实际部署时对系统资源要求较高的问题。

根据第一方面，本发明实施例提供了一种图像重建方法，所述方法包括：

将第一分辨率的图像输入至训练好的超分辨率卷积神经网络模型中，得到超分辨率卷积神经网络模型输出的第二分辨率的图像；第二分辨率高于第一分辨率；

超分辨率卷积神经网络模型中所有卷积层、批归一化层、点加层和上采样层均通过量化处理进行模型计算位宽的压缩；超分辨率卷积神经网络模型在训练过程中通过自监督损失函数使得量化前后的数据的误差在预设范围内，且，超分辨率卷积神经网络模型最终的损失函数是基于自监督损失函数对初始的损失函数进行更新后得到的。

结合第一方面，在第一方面第一实施方式中，所述卷积层的输入数据通过公式（2）进行量化处理：

（2）

其中，

表示数据

的量化值；

表示量化系数；

表示卷积层的输入数据，为特征值或者权重；

表示量化位宽，

表示量化的最小范围，

表示量化的最大范围；

表示进行四舍五入的整取函数；

，

表示数据

经过量化后的整数部分；

，

表示数据

经过量化后的浮点部分。

结合第一方面第一实施方式，输入数据经过量化后，所述卷积层通过公式（3）进行卷积运算：

（3）

其中，

表示所述卷积层经过量化后的特征值；

表示所述卷积层经过量化后的权重；

表示所述卷积层的输出数据；

表示数据

的整数部分；

表示数据

的浮点部分；

表示数据

的整数部分；

表示数据

的浮点部分；

，

表示数据

的整数部分；

，

表示数据

的浮点部分。

结合第一方面第一实施方式，在第一方面第三实施方式中，所述批归一化层的输入数据通过公式（5）进行量化处理：

（5）

其中，

；

；

表示批归一化层经过量化后的输出数据；

表示距离该批归一化层最近的前置的卷积层经过量化后的输出数据的浮点部分；

表示距离该批归一化层最近的前置的卷积层经过量化后的输出数据的整数部分；

表示批归一化层的均值；

表示批归一化层的方差；

表示批归一化层用来避免

造成的除法溢出错误的常数；

表示批归一化层的归一化系数；

表示批归一化层的偏置；

表示数据

经过量化后的浮点部分；

表示数据

经过量化后的整数部分；

表示进行四舍五入的取整函数。

结合第一方面第三实施方式，在第一方面第四实施方式中，所述点加层的输入数据通过公式（6）进行量化处理：

)=

（6）

其中，

表示点加层的其中一个经过量化后的输入数据；

表示点加层的另一个经过量化后的输入数据；

表示点加层经过量化后的输出数据；

表示数据

经过量化后的浮点部分；

表示数据

经过量化后的整数部分；

表示数据

经过量化后的浮点部分；

表示数据

经过量化后的整数部分；

表示数据

经过量化的浮点部分；

表示数据

经过量化后的整数部分；

。

结合第一方面第一实施方式至第四实施方式的任一项，在第一方面第五实施方式中，所述自监督损失函数

为：

其中，

表示

阶范数；

表示数据

的量化值。

结合第一方面第五实施方式，在第一方面第六实施方式中，所述损失函数

为：

其中，

表示自监督损失函数

的超参系数；

表示最终的损失函数；

表示原始的损失函数。

第二方面，本发明实施例还提供一种图像重建装置，所述装置包括：

图像重建模块，用于将第一分辨率的图像输入至训练好的超分辨率卷积神经网络模型中，得到超分辨率卷积神经网络模型输出的第二分辨率的图像；第二分辨率高于第一分辨率；

超分辨率卷积神经网络模型中所有卷积层、批归一化层、点加层和上采样层均通过量化处理进行网络结构的压缩；超分辨率卷积神经网络模型在训练过程中通过自监督损失函数使得量化前后的数据的差值在预设范围内，且，超分辨率卷积神经网络模型的损失函数是基于自监督损失函数得到的。

第三方面，本发明实施例还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述图像重建方法的步骤。

第四方面，本发明实施例还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述图像重建方法的步骤。

第五方面，本发明实施例还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述图像重建方法的步骤。

本发明提供的图像重建方法、装置、设备及介质，区别于其他对超分辨算法的压缩方案，本申请中将基于深度学习的超分辨率卷积神经网络模型中所有层全部进行量化处理，既尽可能低实现了对模型计算位宽的压缩，还端到端地实现了低分辨图像到高分辨图像的映射，极大地降低了模型的计算复杂度，能带来超分辨率卷积神经网络模型在实际应用时运行速度、功耗、访存带宽等方面的优势；另外本申请还通过自监督损失函数约束量化过程中的量化系数，使得量化的过程更加平稳，既稳定了模型的训练过程，还有效地提高了超分辨率卷积神经网络模型的量化精度。

附图说明

通过参考附图会更加清楚的理解本发明的特征和优点，附图是示意性的而不应理解为对本发明进行任何限制，在附图中：

图1示出了本发明提供的图像重建方法的流程示意图；

图2示出了本发明提供的图像重建装置的结构示意图；

图3示出了本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

SR算法是计算机视觉领域中的一个重要的研究领域，SR算法旨在将低分辨率的图像转化或者重建成高分辨率的图像。由于信息损失，图片分辨率转换的问题属于一种病态问题，对SR算法的设计提出有巨大的挑战。深度神经网络（Convolution Neural Network，DNN）特别是DCNN被广泛地应用到计算机视觉中的各个领域，当然深度神经网络也可以应用于超分辨算法领域。

深度学习算法的高计算量阻碍了该类算法在超分辨算法领域的部署，由于超分辨算法是像素级别的重建算法，相应的深度学习网络中没有类似图像分类、物体检测等算法通过池化层用来降低中间特征图的分辨率。面向超分辨的深度学习模型所需要的中间特征图为原始输入大小或者网络输出大小，也就是超分辨网络中每个特征图的分辨率一般都比较大，这样意味着超分辨的深度学习模型对系统计算能力、存储能力和数据传输带宽都有着较高的要求。在实际部署时，有必要对模型进行压缩，来降低对系统的资源需求。因此，需要使用模型量化等技术对基于深度学习的SR模型的计算位宽进行压缩，对该类算法在实际平台的部署有着关键的意义。

目前针对深度学习的SR网络模型的压缩方案一般有两个方向，其一是进行结构化剪枝，缩小网络的宽度和深度，另外在网络的大部分层使用低分辨率的特征图，在网络输出层才提升特征图的分辨率；其二是对深度学习超分辨算法进行模型量化，将原来32位位宽的浮点计算转化为8位或者更低位宽。在一些方案中，这两个方向可以叠加使用，互不影响。

然而，第二个方向或者第一、第二方向相结合的方案只量化了超分辨算法中的部分层，仍有一些算子没有量化，特别是网络结构的首尾层，留作全精度的计算量仍非常庞大繁杂，给网络结构的实际部署造成了很大的困难。

下面结合图1描述本发明的图像重建方法，该方法包括以下步骤：

S10、将第一分辨率的图像输入至训练好的超分辨率卷积神经网络模型中，得到超分辨率卷积神经网络模型输出的第二分辨率的图像，在本实施例中，第二分辨率高于第一分辨率，第一分辨率为低分辨率，第二分辨率为高分辨率。

超分辨率卷积神经网络模型中所有卷积层（conv）、批归一化层（BatchNormalization）、点加层（Element-wise Add）以及上采样层（Upsample或者Pixelshuffle）均通过量化处理进行网络结构的压缩。

超分辨率卷积神经网络模型在训练过程中通过自监督损失函数使得量化前后的数据的误差在预设范围内，且，超分辨率卷积神经网络模型最终的损失函数是基于自监督损失函数对初始的损失函数进行更新后得到的。

本发明提供的图像重建方法，区别于其他对超分辨算法的压缩方案，本申请中将基于深度学习的超分辨率卷积神经网络模型中所有层全部进行量化处理，既尽可能低实现了对模型计算位宽的压缩，还端到端地实现了低分辨图像到高分辨图像的映射，极大地降低了模型的计算复杂度，能带来超分辨率卷积神经网络模型在实际应用时运行速度、功耗、访存带宽等方面的优势；另外本申请还通过自监督损失函数约束量化过程中的量化系数，使得量化的过程更加平稳，既稳定了模型的训练过程，还有效地提高了超分辨率卷积神经网络模型的量化精度。

应用于计算机视觉领域的超分辨网络模型，其主要工作为：接收一张低分辨率的输入图像，由网络模型预测并输出一张高分辨率的输出图像。当超高分辨网络模型使用深度学习处理超分辨任务时，其网络结构一般包含三个层（模块）：特征提取层（FeatureExtraction）、非线性映射层（Non-linear Mapping)和超分辨重建层（SR ImageReconstruction），特征提取层用于进行图像块的提取和特征表示，非线性映射层用于进行特征非线性映射，超分辨重建层用于进行最终的图像重建。

在最简单的超分辨网络模型中，这三层分别为一个卷积层，并且这三个卷积层的卷积核尺寸有所区别，更复杂的，这三层每一层都可以为复合结构，即具有多个子网络层，另外，网络结构中也可以存在很多跨层链接。

例如，超分辨率卷积神经网络（Super-Resolution Convolutional NeuralNetwork，SRCNN）首先使用双三次（bicubic）插值将输入的低分辨率图像放大成目标尺寸，接着通过三层的卷积层（特征提取层、非线性映射层以及超分辨重建层）拟合非线性映射，最后输出得到高分辨率图像。

如公式（1）所示，形式化地，给定低分辨率的输入

，经过特征提取层、非线性映射层和超分辨重建层这三个层的处理后生成高分辨率的图像输出，公式（1）为：

（1）

其中，

表示特征提取模块；

表示非线性映射模块；

表示超分辨重建模块。

现有采用量化对超分辨网络模型进行压缩时只量化了非线性映射部层，而另外两个首尾层也就是则保留成全精度计算。这种压缩方式为超分辨网络模型在实际平台的部署中，需要硬件平台同时拥有全精度处理和量化位宽两种主要精度的计算。然而，特征提取模块和超分辨重建层的计算量占整个模型的计算量的比例在很多场景中都不可忽视，例如对于2倍放大任务，这两个模块在图像超分辨率残差网络结构（Super-Resolution Residualnetwork，SRResnet）和增强型深度超分辨率网络（Enhanced Deep Super-Resolutionnetwork，EDSR）中分别占用约15.6%和11.4%的计算量，在4倍放大任务中，这两个模块分别占用SRResnet和EDSR的约45.1%和38.7%的计算量。

因此，本申请中将模型中所有层（模块）均进行量化的方案会提升模型在硬件平台的部署效率。更具体的，基于深度神经网络的超分辨网络模型中，网络结构中通常包含有卷积层、批归一化层、点加层以及上采样层，本申请提供的全量化超分辨网络结构，即将所有类型的层都量化为整型计算。

具体的，卷积层的输入数据通过公式（2）进行量化处理：

（2）

其中，

表示数据

的量化值；

表示量化系数；

表示卷积层的输入数据，为特征值或者权重；

表示量化位宽，

表示量化的最小范围，

表示量化的最大范围；

表示进行四舍五入的整取函数；

，

表示数据

经过量化后的整数部分；

，

表示数据

经过量化后的浮点部分；

以及

构成了量化范围，当

为无符号或者非负区间的数值，

为0，

为1，当

为有符号的数值，

为-1，

为1。

之后，卷积层的输入数据经过量化后，卷积层通过公式（3）进行卷积运算：

（3）

其中，

表示所述卷积层经过量化后的特征值；

表示所述卷积层经过量化后的权重；

表示所述卷积层的输出数据；

表示数据

的整数部分；

表示数据

的浮点部分；

表示数据

的整数部分；

表示数据

的浮点部分；

，

表示数据

的整数部分；

，

表示数据

的浮点部分。

在批归一化层中通过（4）计算得到BN层的准确值，公式（4）为：

（4）

在本申请中，批归一化层的输入数据通过公式（5）进行量化处理：

（5）

其中，

；

；

表示批归一化层经过量化后的输出数据；

表示批归一化层的均值；

表示批归一化层的方差；

表示批归一化层用来避免

造成的除法溢出错误的常数；

表示批归一化层的归一化系数；

表示批归一化层的偏置；

表示数据

经过量化后的浮点部分；

表示数据

经过量化后的整数部分；

表示进行四舍五入的取整函数。

即，对BN层量化时即只需要将BN层中的偏置（bias）项进行取整就可。

点加层的输入数据通过公式（6）进行量化处理：

)=

（6）

其中，

表示点加层的其中一个经过量化后的输入数据；

表示点加层的另一个经过量化后的输入数据；

表示点加层经过量化后的输出数据；

表示数据

经过量化后的浮点部分；

表示数据

经过量化后的整数部分；

表示数据

经过量化后的浮点部分；

表示数据

经过量化后的整数部分；

表示数据

经过量化的浮点部分；

表示数据

经过量化后的整数部分；

。

由于上采样层只进行了数据的形状调整即只改变排列顺序，没有具体的数值计算，因此不需要量化。

在本实施例中，超分辨率卷积神经网络模型经过量化后的量化数据有两个组成部分，其中浮点部分是调整量化后数据范围时使用，只在训练过程中辅助计算，用于辅助神经网络的梯度优化；在实际部署中，计算只牵涉到取整的部分即整数部分，也就是只使用量化数据的整数部分，保证整个超分辨率卷积神经网络模型的计算为全整型计算。

由于现有技术中相关压缩工作只量化了超分辨算法中的一部分操作，经过量化后，仍有大量计算保持全精度的计算，给算法在实际环境部署带来的巨大的挑战。

为了降低基于深度学习的超分辨算法的计算复杂度，本申请提出一种全量化的量化策略，该策略对于超分辨率卷积神经网络模型，将模型中的所有层都做位宽量化，而不是其中的部分层，并且通过对所有牵涉数值计算的层都给出量化公式，整个超分辨算法能端到端地运行在低比特整型计算单元上，能呈数量级地降低算法的计算复杂度和存储复杂度，使得模型的计算复杂度有着数量级的降低，为超分辨网络在移动端平台上的部署带来的巨大的便利，使得整个超分辨算法能端到端地运行在整型计算部件上，有效地提升了执行效率。

在本申请中，自监督损失函数

为：

其中，

表示

阶范数；

表示数据

的量化值，

可以为卷积层、批归一化层、点加层或者上采样层中任一层的输入数据

经过量化后的量化值；自监督损失函数通过约束一个数据量化前和量化后的数据误差，模型的量化训练中能够变得更加平稳，最终训练得到的模型精度也会得到提高。优选的，

的值为1。

因此，最后整个模型的损失函数

为：

其中，

表示自监督损失函数

的超参系数；

表示最终的损失函数；

表示原始的损失函数。可以看出最终的损失函数是基于自监督损失函数，对初始的损失函数进行更新后得到的。

为了提升超分辨率卷积神经网络模型的任务精度，本申请提出一种自监督的损失函数（SQCL），该自监督损失函数对一个数据量化前和量化后的数据进行约束，使得数据量化前和量化后的数据尽可能一致也就是差值在预设范围内，具体的，该自监督损失函数使用了p阶范数作为约束手段。理论上，本申请提出的自监督损失函数可以使用任何阶的范数，为了获取更好的约束效果，在本实施例中，在实际部署时采用p=1，即一阶范数效果最好。

由于现有技术中相关压缩工作还是使用原来的训练数据和超分辨自有的损失函数对量化参数进行训练。然而，对于低比特量化而言，特别是将网络中所有层都量化了之后，网络训练变得很不稳定，最终可能影响了网络量化得精度。

为了提升超分辨率卷积神经网络模型量化后精度有损失的问题，本本申请提出一种自监督损失函数，通过自监督损失函数的设置，超分辨率卷积神经网络模型在训练过程中的数据分布更加稳定，数据量化前和量化后的数据范围更加贴近，提升量化精度的效果，模型的量化精度有了大幅度的提升。

下面对本发明提供的图像重建装置进行描述，下文描述的图像重建装置与上文描述的图像重建方法可相互对应参照。

下面结合图1描述本发明的图像重建装置，该装置包括：

图像重建模块10，用于将第一分辨率的图像输入至训练好的超分辨率卷积神经网络模型中，得到超分辨率卷积神经网络模型输出的第二分辨率的图像，在本实施例中，第二分辨率高于第一分辨率，第一分辨率为低分辨率，第二分辨率为高分辨率。

超分辨率卷积神经网络模型在训练过程中通过自监督损失函数使得量化前后的数据的差值在预设范围内，且，超分辨率卷积神经网络模型的损失函数是基于自监督损失函数得到的。

本发明提供的图像重建装置，区别于其他对超分辨算法的压缩方案，本申请中将基于深度学习的超分辨率卷积神经网络模型中所有层全部进行量化处理，既尽可能低实现了对模型计算位宽的压缩，还端到端地实现了低分辨图像到高分辨图像的映射，极大地降低了模型的计算复杂度，能带来超分辨率卷积神经网络模型在实际应用时运行速度、功耗、访存带宽等方面的优势；另外本申请还通过自监督损失函数约束量化过程中的量化系数，使得量化的过程更加平稳，既稳定了模型的训练过程，还有效地提高了超分辨率卷积神经网络模型的量化精度。

图3示例了一种电子设备的实体结构示意图，如图3所示，该电子设备可以包括：处理器(processor)210、通信接口(Communications Interface)220、存储器(memory)230和通信总线240，其中，处理器210，通信接口220，存储器230通过通信总线240完成相互间的通信。处理器210可以调用存储器230中的逻辑命令，以执行图像重建方法，该方法包括：

此外，上述的存储器230中的逻辑命令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干命令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括计算机程序，计算机程序可存储在非暂态计算机可读存储介质上，所述计算机程序被处理器执行时，计算机能够执行上述各方法所提供的图像重建方法，该方法包括：

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各方法提供的图像重建方法，该方法包括：

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干命令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。