CN111047515A

CN111047515A - 一种基于注意力机制的空洞卷积神经网络图像超分辨率重建方法

Info

Publication number: CN111047515A
Application number: CN201911387641.6A
Authority: CN
Inventors: 宋昭漾; 赵小强; 徐铸业; 惠永永; 常启慧; 牟淼; 姚红娟; 刘舒宁; 张和慧; 魏伟
Original assignee: Lanzhou University of Technology
Current assignee: Lanzhou University of Technology
Priority date: 2019-12-29
Filing date: 2019-12-29
Publication date: 2020-04-21
Anticipated expiration: 2039-12-29
Also published as: CN111047515B

Abstract

本发明提供了一种基于注意力机制的空洞卷积神经网络图像超分辨率重建方法，该方法设计了基于注意力机制的空洞卷积模块、多通道基于注意力机制的空洞卷积模块、注意力残差块、多通道特征提取模块，在此基础上设计了基于注意力机制的空洞卷积神经网络。本发明方法提出使用空洞卷积实现多种不同尺寸的感受野去提取低分辨率图像特征信息，并利用注意力块提取图像高频信息。同时为了充分利用低分辨率图像特征信息之间的相关性并提取更多的特征信息，该方法设计了多通道基于注意力机制的空洞卷积模块，该模块采用多通道的方式使用不同的感受野对低分辨率图像进行特征提取，然后使用注意力残差块对各个通道提取到的特征进行深度的特征提取，有效提高了图像超分辨率重建效果。

Description

一种基于注意力机制的空洞卷积神经网络图像超分辨率重建方法

技术领域

本发明属于计算机视觉技术领域，涉及一种基于注意力机制的空洞卷积神经网络图像超分辨率重建方法。

背景技术

视觉是人类观察世界、认知世界的重要手段，人类从外界获取的信息约有75％来自视觉系统，因此计算机视觉这门学科应运而生。计算机视觉是指用计算机来实现人类的视觉功能，也就是用计算机来实现对客观世界的识别，即实现人类视觉系统的某些功能。而在计算机视觉中，图像超分辨率重建技术是一项应用广泛且十分重要的技术。

图像超分辨率重建是指由一幅低分辨率图像或图像序列恢复出高分辨率图像，其被广泛应用于卫星图像、城市监控、医疗等领域。由于在许多应用领域中需求的增长，图像超分辨率重建已经成为研究的热点。由于低分辨率图像细节信息的丢失，所以超分辨率重建从本质上来说是一个病态问题。尽管在过去十年中已经取得了很多重要的进展，但是如何重建出更好的高分辨率图像仍然是一项基本且具有挑战性的任务。

近年来，基于深度学习的图像超分辨率重建算法被广泛提出并取得不错的效果。Dong等人首次将深度学习应用到超分辨率重建，提出了基于卷积神经网络的超分辨率重建算法(Super-Resolution Convolutional Neural Network,SRCNN)，SRCNN算法使用了一个3层卷积网络实现从低分辨率图像到高分辨率图像端到端的学习，使得图像重建效果相比传统算法得到了较大提高。Kim等人提出了基于深度卷积网络的图像超分辨率重建算法(Very Deep Convolution Network Super-Resolution,VDSR)，该算法将残差结构应用到超分辨率重建中，使得卷积神经网络层数加深到20层，能够提取到图像更多的特征信息，图像重建效果大大提高。Lai等人提出基于拉普拉斯金字塔结构的超分辨率重建算法(Laplacian Pyramid Super-Resolution Network,LapSRN)，该算法通过逐步上采样的方式进行重建。Ledig等人提出了基于生成对抗网络的超分辨率重建算法(Super-ResolutionGenerative Adversarial Network,SRGAN)，该算法将生成对抗网络结构应用到超分辨率重建中，并利用感知损失和对抗损失作为损失函数，使得重建的效果更逼真。Lim等人提出基于增强的深度残差网络图像超分辨率重建算法(Enhanced Deep Residual Network forSingle Image Super-Resolution,EDSR),该算法删除了原始残差块中的多余模块，使用了更多的卷积层提取到更丰富的特征信息，从而获得了更好的图像重建性能。

虽然，上述的基于深度学习的图像超分辨率重建算法都取得不错的重建效果，但是他们都是使用固定的感受野去提取低分辨率图像特征信息，不能充分利用低分辨率图像特征信息之间的相关性提取到更多的特征信息，从而使得图像超分辨率重建效果受到限制。

发明内容

本发明的目的在于针对现有技术存在的问题，提出一种基于注意力机制的空洞卷积神经网络图像超分辨率重建方法。

为此，本发明采用如下技术方案：

一种基于注意力机制的空洞卷积神经网络图像超分辨率重建方法，包括如下步骤：

步骤1：选择训练数据集和测试数据集，并对训练数据集图像进行增强处理，扩充训练数据集图像；

步骤2：将步骤1得到的训练数据集图像进行1/N比例下采样处理，得到对应的低分辨率图像，其中N为缩放因子；

步骤3：将步骤1得到的训练数据集图像裁剪成H×W的图像块，将步骤2得到的低分辨率图像裁剪成H/N×W/N的图像块；

步骤4：将步骤3得到的两种图像块作为高分辨率图像和低分辨率图像样本对，生成HDF5的训练数据集文件；

步骤5：设计基于注意力机制的空洞卷积神经网络

5.1：设计基于注意力机制的空洞卷积模块

基于注意力机制的空洞卷积模块是由一个空洞卷积层和一个注意力块端对端的连接组成，空洞卷积层的输出端连接注意力块的输入端，同时空洞卷积层的输出端与注意力块的输出端相乘构成基于注意力机制的空洞卷积模块的输出；

5.2：设计多通道基于注意力机制的空洞卷积模块

多通道基于注意力机制的空洞卷积模块由m个不同空洞卷积系数d₁、d₂、…d_m的基于注意力机制的空洞卷积模块和特征融合模块组成，m个不同空洞卷积系数的基于注意力机制的空洞卷积模块以并联的方式连接并将它们的输出端都连接在特征融合模块；

5.3：设计注意力残差块

注意力残差块由一个残差块和一个注意力块端对端的连接组成，残差块的输出端连接注意力块的输入端，同时残差块的输出端与注意力块的输出端相乘构成注意力残差块的输出；

5.4：构建多通道特征提取模块

多通道特征提取模块由多通道基于注意力机制的空洞卷积模块和注意力残差块端对端的连接组成；

5.5：设计基于注意力机制的空洞卷积神经网络

基于注意力机制的空洞卷积神经网络由四部分组成，分别是输入模块、深层特征提取模块、上采样模块、输出模块，其中：

输入模块和输出模块都是由卷积核尺寸大小为3×3的卷积层组成，深层特征提取模块是由n个步骤5.4多通道特征提取模块和一个卷积层串联组成，并以残差的方式连接而成；

上采样模块是由亚像素卷积层组成；

步骤6：训练基于注意力机制的空洞卷积神经网络

6.1：设置损失函数，以此最小化重建的图像与对应真实的高分辨率图像的损失值来估计网络参数；

6.2：选择优化算法，对网络进行迭代训练；

6.3：选择图像超分辨率重建评价指标来客观评价基于注意力机制的空洞卷积神经网络模型的重建性能；

6.4：设置步骤5.2中多通道基于注意力机制的空洞卷积模块的m和d₁、d₂、…d_m的值；

6.5：设置训练参数，包括训练的学习率、迭代次数和批训练样本值；

6.6：用步骤4生成的HDF5训练数据集文件按照步骤6.5设置的参数，训练基于注意力机制的空洞卷积神经网络，生成网络模型；

6.7：使用测试数据集对步骤6.6得到的网络模型进行测试，记录图像重建性能指标值；然后返回步骤6.4，设置不同的m和d₁、d₂、…d_m值，继续训练并测试，最后，保存最高的图像重建性能指标值对应的一组m和d₁、d₂、…d_m值，并以此得到最终的基于注意力机制的空洞卷积神经网络模型；

步骤7：将低分辨率图像输入到上述基于注意力机制的空洞卷积神经网络模型中，输出得到重建后的高分辨率图像。

本发明方法提出使用空洞卷积实现多种不同尺寸的感受野去提取低分辨率图像特征信息，并利用注意力块提取图像高频信息。同时为了充分利用低分辨率图像特征信息之间的相关性并提取更多的特征信息，该方法设计了多通道基于注意力机制的空洞卷积模块，该模块采用多通道的方式使用不同的感受野对低分辨率图像进行特征提取，然后使用注意力残差块对各个通道提取到的特征进行深度的特征提取，有效提高了图像超分辨率重建效果。

本发明的有益效果具体在于：

(1)设计了基于注意力机制的空洞卷积模块。与传统卷积层相比，基于注意力机制的空洞卷积模块在没有增加过多参数和计算量的情况下拥有更大的感受野，能够提取更多的低分辨率图像特征信息，并利用注意力块充分提取图像的高频信息；

(2)设计了多通道基于注意力机制的空洞卷积模块。多通道基于注意力机制的空洞卷积模块有m个不同空洞卷积系数的基于注意力机制的空洞卷积模块来对低分辨率图像进行特征提取，能够充分利用低分辨率图像特征信息之间的相关性提取到更多的特征信息。同时多通道基于注意力机制的空洞卷积模块能对不同通道的特征信息进行融合；

(3)设计了注意力残差块。注意力残差块可以对多通道基于注意力机制的空洞卷积模块获得的特征进行再次深度提取，获得更多的图像高频信息，使得重建的图像拥有更丰富的纹理和细节。

附图说明

图1为本发明设计的基于注意力机制的空洞卷积模块的结构示意图；

图2为本发明设计的多通道基于注意力机制的空洞卷积模块的结构示意图；

图3为本发明设计的注意力残差块的结构示意图；

图4为本发明设计的多通道特征提取模块的结构示意图；

图5为本发明设计的基于注意力机制的空洞卷积神经网络的结构图；

图6为本发明方法与各种其他方法对鸟、小孩、蝴蝶分别重建得到的效果图片对比。

具体实施方式

下面通过具体实施例对本发明技术方案进行进一步的说明。

一种基于注意力机制的空洞卷积神经网络图像超分辨率重建方法，该方法设计了基于注意力机制的空洞卷积模块、多通道基于注意力机制的空洞卷积模块、注意力残差块、多通道特征提取模块，在此基础上设计了基于注意力机制的空洞卷积神经网络。其具体包括以下步骤：

步骤1：选用DIV2K图像数据集作为训练本发明基于注意力机制的空洞卷积神经网络的数据集，选用Set5图像数据集、Set14图像数据集和Urban100图像数据集作为测试本发明基于注意力机制的空洞卷积神经网络的数据集。对DIV2K图像数据集进行90°、180°、270°旋转和按0.9、0.8、0.7、0.6的比例缩放，以此扩充训练数据集图像；

步骤2：使用双三次插值算法(Bicubic算法)，将步骤1得到的训练数据集图像进行1/N比例下采样处理，获得对应的低分辨率图像。其中N为缩放因子，N的取值根据需要重建的倍数选定；

步骤3：将步骤1得到的训练数据集图像裁剪成尺寸为H×W的图像块，将步骤2得到的低分辨率图像裁剪成尺寸为H/N×W/N的图像块；

步骤4：将步骤3得到的两种图像块作为高分辨率图像和低分辨率图像样本对(IHR，ILR)，生成HDF5的训练数据集文件；

步骤5：设计基于注意力机制的空洞卷积神经网络

5.1：设计基于注意力机制的空洞卷积模块

如图1所示，本发明设计的基于注意力机制的空洞卷积模块是由一个空洞卷积层和一个注意力块端对端的连接组成，空洞卷积层的输出端连接注意力块的输入端，同时空洞卷积层的输出端与注意力块的输出端相乘构成基于注意力机制的空洞卷积模块的输出。其中注意力块由平均池化层、卷积层、激活函数ReLU、卷积层和Sigmoid函数依次串联组成。注意力块中的两个卷积层的卷积核尺寸为k1×k1(k1＝1)，移动步长为1，填充为0。空洞卷积层的卷积核尺寸为k2×k2(k2＝3)，移动步长为1，填充为p，空洞系数为d。

5.2：设计多通道基于注意力机制的空洞卷积模块

如图2所示，本发明设计的多通道基于注意力机制的空洞卷积模块由m(m＝3)个不同空洞卷积系数(d₁,d₂,d₃)的基于注意力机制的空洞卷积模块和特征融合模块组成，其中m(m＝3)个不同空洞卷积系数(d₁,d₂,d₃)的基于注意力机制的空洞卷积模块的空洞卷积层的卷积核尺寸都是k2×k2(k2＝3)，移动步长都为s＝1，每个空洞卷积层的输入通道(In_channel)＝输出通道(Out_channel)＝64，在由公式(1)可得

由公式(1)计算可得，当空洞卷积系数d₁＝1，对应的填充为p₁＝1，当空洞卷积系数d₂＝4，对应的填充为p₂＝4，当空洞卷积系数d₃＝8，对应的填充为p₃＝8。m(m＝3)个不同空洞卷积系数的基于注意力机制的空洞卷积模块以并联的方式连接并将它们的输出端都连接在特征融合模块。特征融合模块的卷积核尺寸为k1×k1(k1＝1)，移动步长s＝1，填充为0。

5.3：设计注意力残差块

如图3所示，本发明设计的注意力残差块由一个残差块和一个注意力块端对端的连接组成，残差块的输出端连接注意力块的输入端，同时残差块的输出端与注意力块的输出端相乘构成注意力残差块的输出。残差块是由卷积层、激活函数、卷积层串联组成一个整体，以残差的方式连接而成，其中残差块的两个卷积层的卷积核为k2×k2(k2＝3)，移动步长为1，填充为1，激活函数为ReLU。注意力块由平均池化层、卷积层、激活函数ReLU、卷积层和Sigmoid函数串联组成，其中注意力块中的两个卷积层的卷积核尺寸为k1×k1(k1＝1)，移动步长为1，填充为0。

5.4：构建多通道特征提取模块

如图4所示，本发明设计的多通道特征提取模块由一个上述多通道基于注意力机制的空洞卷积模块和一个上述注意力残差块端对端的连接组成。

5.5：设计基于注意力机制的空洞卷积神经网络

如图5所示，本发明设计的基于注意力机制的空洞卷积神经网络由四部分组成，具体是由输入模块、深层特征提取模块、上采样模块、输出模块依次组成。输入模块是由一个卷积层组成，该卷积层的卷积核尺寸为k2×k2(k2＝3)，移动步长为1，填充为1，输入通道(In_channel)为3，输出通道(Out_channel)为64。深层特征提取模块是由n(n＝12)个多通道特征提取模块和一个卷积层串联组成一个整体，以残差的方式连接而成，其中卷积层的卷积核尺寸为k2×k2(k2＝3)，移动步长为1，填充为1，多通道特征提取模块结构在步骤5.4中做了详细介绍，深度特征提取模块中所有的卷积层的输入通道(In_channel)为64，输出通道(Out_channel)为64。上采样模块是由亚像素卷积层组成，其中亚像素卷积层的卷积核尺寸为k2×k2(k2＝3)，移动步长为1，填充为1，输入通道(In_channel)为64，输出通道(Out_channel)为256，亚像素卷积将尺寸大小为H×W×c×r²的特征图像重新排列成尺寸为rH×rW×c的特征图像。输出模块是由一个卷积层构成，该卷积层的卷积核尺寸为k2×k2(k2＝3)，移动步长为1，填充为1，输入通道(In_channel)为64，输出通道(Out_channel)为3。

步骤6：训练基于注意力机制的空洞卷积神经网络

6.1：构建均方误差函数作为损失函数，以此最小化重建的图像与对应的真实高分辨率图像的损失来估计网络参数θ，均方误差函数的表达形式为：

式中，n代表训练样本的数量，L表示均方误差函数，X_i表示真实高分辨率图像，Y_i表示重建的图像。

6.2：使用Adam优化算法，对网络进行迭代训练。

6.3：使用峰值信噪比(Peak Signal to Noise Ratio,PSNR)和结构相似度(Structural SIMilarity,SSIM)作为评价指标来客观评价基于注意力机制的空洞卷积神经网络模型的重建性能；

峰值信噪比PSNR和结构相似度SSIM指标的计算公式如式(3)和式(4)所示：

式中，M、N表示为图像的尺寸，f表示为真实的高分辨率图像，

表示为重建的高分辨率图像，μ_f和

分别表示为真实高分辨率图像和重建图像的平均灰度值，σ_f和

分别表示为真实高分辨率图像和重建图像的方差，

表示为真实高分辨率图像和重建图像的协方差，C₁和C₂为常数，且C₁＝(k₁L)²，C₂＝(k₂L)²，k₁＝0.01，k₂＝0.03，L是像素值的动态范围；

6.4：设置步骤5.2中多通道基于注意力机制的空洞卷积模块的m和d₁、d₂、…d_m的值；m和d_m为整数，且取值范围如下：m＝1、2、…5，d_m＝1、2、…9。

6.5：设置训练参数，本实施例中，学习率初始设置为0.0001，迭代次数初始设置为200，批训练样本值batchsize初始设置为16。

6.6：用步骤4生成的HDF5训练数据集文件按照步骤6.5设置的参数，训练基于注意力机制的空洞卷积神经网络，生成网络模型。

6.7：使用Set5测试数据集、Set14测试数据集和Urban100测试数据集对步骤6.6得到的网络模型进行测试，记录得到的PSNR和SSIM值。然后返回步骤6.4，设置不同的m和(d₁,d₂,…,d_m)值，继续训练并测试。最后，对比不同的m和(d₁,d₂,…,d_m)值得到PSNR和SSIM值，在综合考虑计算量的情况下，选取最高的PSNR和SSIM值对应的m和(d₁,d₂,…,d_m)值作为基于注意力机制的空洞卷积神经网络的参数值，并以此得到最终的基于注意力机制的空洞卷积神经网络模型。

步骤7：将低分辨率图像输入到基于注意力机制的空洞卷积神经网络模型中，输出得到重建后的高分辨率图像。

Claims

1.一种基于注意力机制的空洞卷积神经网络图像超分辨率重建方法，其特征在于，包括如下步骤：

步骤5：设计基于注意力机制的空洞卷积神经网络

5.1：设计基于注意力机制的空洞卷积模块

5.2：设计多通道基于注意力机制的空洞卷积模块

5.3：设计注意力残差块

5.4：构建多通道特征提取模块

5.5：设计基于注意力机制的空洞卷积神经网络

上采样模块是由亚像素卷积层组成；

步骤6：训练基于注意力机制的空洞卷积神经网络

6.2：选择优化算法，对网络进行迭代训练；

2.根据权利要求1所述的一种基于注意力机制的空洞卷积神经网络图像超分辨率重建方法，其特征在于，步骤1中，对训练数据集图像进行旋转和比例缩放的增强处理，以此扩充训练数据集图像。

3.根据权利要求1所述的一种基于注意力机制的空洞卷积神经网络图像超分辨率重建方法，其特征在于，步骤5.1中：

所述注意力块依次由平均池化层、卷积层、激活函数ReLU、卷积层和Sigmoid函数串联组成，注意力块中的卷积层的卷积核尺寸为1×1，所述空洞卷积层的卷积核尺寸为3×3。

4.根据权利要求1所述的一种基于注意力机制的空洞卷积神经网络图像超分辨率重建方法，其特征在于，步骤5.2中：特征融合模块由一个卷积核尺寸为1×1的卷积层组成。

5.根据权利要求1所述的一种基于注意力机制的空洞卷积神经网络图像超分辨率重建方法，其特征在于，步骤5.3中：

残差块是由卷积层、激活函数ReLU、卷积层依次串联组成，并以残差的方式连接而成，其中卷积层的卷积核尺寸为3×3。

6.根据权利要求1所述的一种基于注意力机制的空洞卷积神经网络图像超分辨率重建方法，其特征在于，步骤6.1中：设置均方误差函数作为损失函数。

7.根据权利要求1所述的一种基于注意力机制的空洞卷积神经网络图像超分辨率重建方法，其特征在于，步骤6.2中，使用Adam优化算法，对网络进行迭代训练。

8.根据权利要求1所述的一种基于注意力机制的空洞卷积神经网络图像超分辨率重建方法，其特征在于，步骤6.3中，使用峰值信噪比PSNR和结构相似度SSIM作为评价指标来客观评价基于注意力机制的空洞卷积神经网络模型的重建性能。

9.根据权利要求1所述的一种基于注意力机制的空洞卷积神经网络图像超分辨率重建方法，其特征在于，步骤6.5中，学习率初始设置为0.0001，迭代次数初始设置为200，批训练样本值batchsize初始设置为16。

10.根据权利要求1所述的一种基于注意力机制的空洞卷积神经网络图像超分辨率重建方法，其特征在于，步骤6.4中，m和d_m为整数，且取值范围如下：m＝1、2、…5，d_m＝1、2、…9。