CN110415170A - 一种基于多尺度注意力卷积神经网络的图像超分辨率方法 - Google Patents
一种基于多尺度注意力卷积神经网络的图像超分辨率方法 Download PDFInfo
- Publication number
- CN110415170A CN110415170A CN201910551507.9A CN201910551507A CN110415170A CN 110415170 A CN110415170 A CN 110415170A CN 201910551507 A CN201910551507 A CN 201910551507A CN 110415170 A CN110415170 A CN 110415170A
- Authority
- CN
- China
- Prior art keywords
- image
- resolution
- multiple dimensioned
- attention
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 29
- 238000012549 training Methods 0.000 claims abstract description 29
- 238000000605 extraction Methods 0.000 claims abstract description 20
- 230000003321 amplification Effects 0.000 claims abstract description 6
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 6
- 238000012360 testing method Methods 0.000 claims description 12
- 230000004913 activation Effects 0.000 claims description 11
- 230000000644 propagated effect Effects 0.000 claims description 10
- 239000000284 extract Substances 0.000 claims description 9
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 5
- 238000013480 data collection Methods 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 238000005096 rolling process Methods 0.000 claims 2
- 230000004069 differentiation Effects 0.000 abstract description 2
- 239000012141 concentrate Substances 0.000 abstract 1
- 230000008569 process Effects 0.000 description 7
- 238000013135 deep learning Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 101100365548 Caenorhabditis elegans set-14 gene Proteins 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000003475 lamination Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4046—Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
- G06T3/4076—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution using the original low-resolution images to iteratively correct the high-resolution images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30168—Image quality inspection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开一种基于多尺度注意力卷积神经网络的图像超分辨率方法,通过使用多尺度结构和注意力机制,不仅使得卷积神经网络能够提取到图像中的丰富信息,并且能对提取的特征进行重要性区分,使得卷积神经网络的学习可以区分重要信息和干扰信息,提升学习效率。同时,本发明使用了密集连接和残差连接的方式,加强了梯度的反向传播,避免了梯度不稳定的问题,增强了特征的重用性,充分利用低分辨图像中的特征,模型的训练速度得到提高,模型参数进一步减少。另外,本发明在图像放大阶段使用亚像素卷积层的方法,将学习到的像素值按照一定规律填充到高分辨率图像中,而不需要经过计算,使得运算集中在小尺度阶段,减少了运算量,提高了图像重建速度。
Description
技术领域
本发明属于计算机视觉领域,尤其涉及一种基于多尺度注意力卷积神经网络的图像超分辨率方法。
背景技术
现今,人民生活水平日益提高,手机、摄像机、照相机等电子设备,在生活中十分常见,扮演着记录和分享美好时刻的角色。另外,在交通安全、公安刑侦、医疗影像、遥感卫星、军事侦察等公共领域,图像视频数据也是十分重要,往往图像和视频数据的质量起着至关重要的作用。同时,在一些其他的计算机视觉任务中,高质量的图像和视频有助于提升任务的表现,从多任务学习中可以明显看到这一点。
图像作为重要的信息载体,其中人对外界的感知能力,视觉占到百分之七十,是人们获得信息的最重要的途径。图像质量的衡量指标主要是图像分辨率,代表单位面积内像素点的多少。在分辨率小的图像中,包含的信息少,细节缺失严重,往往不能满足人们的需求。高分辨率的图像,在细节方面更清晰,蕴含的信息较多,因此高分辨率的图像在各个领域都需求很大。然而,在客观条件的限制下,往往得不到质量高的图像。从解决这些客观限制的角度上,一方面成本很高,另一方面一些技术难以突破。受限于这些客观条件,往往得到的是模糊,缺失细节的低分辨率图像,不能满足使用要求。图像超分辨率重建技术就是为了增强图像分辨率、提高图像质量。因此,研究先进的图像超分辨率重建技术是十分关键的。
图像超分辨率重建方法是计算机视觉领域的研究热点,产生了许多优秀的方法,它们可以分为三类:基于插值的方法、基于重构的方法、基于学习的方法。其中,基于学习的方法又可以分为,传统学习方法和深度学习方法,深度学习的方法在计算机视觉领域表现出色,是目前主流的研究方向。基于深度学习的图像超分辨率重建方法,主要有基于卷积神经网络的图像超分辨率方法和基于生成对抗神经网络的图像超分辨方法两大类。在2016年Dong等人在《Image super-resolution using deep convolutional networks》论文中提出了SRCNN,是深度学习在图像超分辨率算法中的开山之作。SRCNN构建了三层的卷积神经网络,利用网络的非线性,学习低分辨率图像和高分辨率图像之间的映射关系,通过大量的数据训练后,SRCNN的效果明显优于以往方法。此后,激励了许多学者对基于深度学习的图像超分辨率方法的大量研究,推动了这一领域的发展。然而,把图像超分辨率算法,简单的当作使用神经网络学习,低分辨率图像到高分辨率图像映射关系,效果并不好。
本发明根据图像超分辨率重建任务的特点设计了基于多尺度注意力卷积神经网络的图像超分辨率方法,使用多尺度单元和注意力单元,有效提取低分辨率图像中的信息,而且能够有效利用有益信息,避免冗余信息干扰。使用残差结构和密集连接结构,增强梯度流动,优化信息传播和重用,有效提升可训练的网络深度,也大大减少了网络的参数量,提高网络的训练以及使用速度。使用亚像素卷积层作为特征图放大的操作,能够减少运算量。
发明内容
本发明为了解决上述技术问题提供了一种基于多尺度注意力卷积神经网络的图像超分辨率方法。
本发明的技术方案为一种基于多尺度注意力卷积神经网络的图像超分辨率方法,包括以下步骤:
一种基于多尺度注意力卷积神经网络的图像超分辨率方法,其特征在于,其包括以下步骤:
步骤1,根据图像超分辨率领域常用的公开数据集制作训练集(ILR HHR);
使用图像超分辨率重建领域常用的DIV2K数据集,DIV2K数据集包含了L张2K分辨率的高质量图像,其中训练集M张,测试集N张,验证集P张,它们包含了丰富的场景,可以用于训练和测试模型;具体而言,首先,从DIV2K训练数据集中随机抽取16张图像,包括低分辨率图像和其对应的高分辨率图像;然后,在低分辨率图像中随机选取32*32大小的图像区域,接着选取低分辨率图像区域对应高分辨率图像块,共同组成训练数据集(ILR HHR);
步骤2,构建多尺度注意力卷积神经网络:
步骤2.1,构建多尺度单元,具体是在网络前向传播方向,将前一层特征图,输入到多尺度单元的四个多尺度分支里;第一个分支是卷积核大小为1的卷积层;第二个分支是一个卷积核大小为3的卷积层,后接卷积核大小为1的卷积层;第三个分支是一个卷积核大小为5的卷积层,后接卷积核大小为1的卷积层;第四个分支是一个卷积核大小为7的卷积层,后接卷积核大小为1的卷积层;在四个分支的卷积层中,除了卷积核尺寸为1的卷积层,其卷积核个数均为A个外,其他的卷积层个数均为B个;最后,将四个分支得到的特征图在通道上叠加,输出到注意力单元;
步骤2.2,构建注意力单元,具体是将步骤2.1得到的特征图,首先经过全局平均池化,得到特征向量;然后,将得到的向量输入到两个全连接层,第一个全连接层节点数量为输入的特征图数量的四分之一,第二个节点数等于输入特征图数量;接着,对全连接层的输出,使用Sigmoid函数激活,得到的向量数值在0和1之间;最后,将激活后的向量和步骤2.1得到的特征图相乘,对每个特征图重要程度进行区分;
步骤2.3,构建多尺度单元和注意力单元结合的残差结构块,具体是将输入到多尺度单元的特征图和经过多尺度单元和注意力单元运算之后的结果,进行相加,形成残差结构;
步骤2.4,构建基本特征提取单元,具体是使用C个步骤2.3得到的多尺度单元和注意力单元结合的残差结构块串联,形成基本特征提取单元;
步骤2.5,构建整体网络结构,具体是由四个阶段构成,首先是浅层特征提取阶段,由卷积核大小为3的单个卷积层组成,然后是主要特征提取阶段,是由K个步骤2.4得到的基本特征提取单元通过密集连接的方式组成,接着是特征图放大阶段,使用亚像素卷积层的方式把特征图放大到所需尺寸,最后是重建高分辨率图像阶段,采用单个卷积层根据前面阶段得到的特征图重建出高分辨率图像;
步骤3,使用步骤1得到的训练集,训练集中的低分辨率图像ILR作为输入,原始高分辨率图像HHR作为目标;通过前向传播得到网络输出Hhr,与原始高分辨率图像进行比较,计算误差;
minw,b∑(HHR-Hhr)2(1)
其中,w和b分别是网络参数权重和偏置;
步骤4,使用优化器Adam,参数设置为默认,对网络进行迭代训练,根据每一次前向传播计算的误差,通过反向传播和梯度下降法不断优化模型,最终得到训练好的网络模型;
步骤5,利用训练好的模型,对测试集进行测试,将方法得到的图像和原始高分辨率图像进行比较,计算峰值信噪比PSNR和结构相似性SSIM客观指标。
在上述的一种基于多尺度注意力卷积神经网络的图像超分辨率方法,采用多尺度和注意力单元结合,输入的特征图经过该单元后,每个特征图会有一个权重,代表了特征图的重要性。
在上述的一种基于多尺度注意力卷积神经网络的图像超分辨率方法,网络模型中激活函数具体是,注意力单元的第二个全连接层使用Sigmoid激活函数,其他卷积层均为ReLu激活函数。
在上述的一种基于多尺度注意力卷积神经网络的图像超分辨率方法,网络结构的具体配置为A=8、B=32、C=4、K=10。
在上述的一种基于多尺度注意力卷积神经网络的图像超分辨率方法,将网络重建出来的高分辨率图像和原始高分辨率图像转换到YCbCr空间,在Y通道上计算峰值信噪比PSNR和SSIM结构相似性指标。
本发明使用多尺度单元和注意力单元,具有高效提取和利用特征的能力,在极大地提取丰富的特征同时,又能避免冗余信息的干扰。采用了密集连接和残差连接的方式,优化了信息的传递流动,加强了梯度传播,避免了梯度不稳定,还可以增强特征的重用,充分利用低分辨率图像的信息。使用亚像素卷积层,把运算集中在小尺度的阶段,可以减少运算量,提高了训练和使用的速度。
附图说明
图1是本发明一种基于多尺度注意力卷积神经网络的图像超分辨率方法的模型结构图。
图2是本发明一种基于多尺度注意力卷积神经网络的图像超分辨率方法的多尺度注意力单元结构图。
图3是本发明一种基于多尺度注意力卷积神经网络的图像超分辨率方法的基本特征提取单元结构图。
图4是输入的测试低分辨率图像。
图5是基于双三次插值的高分辨率重建图像。
图6是基于Aplus算法的高分辨率重建图像。
图7是基于卷积神经网络的SRCNN算法的高分辨率重建图像。
图8是基于卷积神经网络的VDSR算法的高分辨率重建图像。
具体实施方式
本发明公开了一种基于多尺度注意力卷积神经网络的图像超分辨率方法,利用了多尺度单元、注意力单元、密集连接结构、残差结构、亚像素卷积层的优点,能够高效重建出高分辨率图像。本发明的方法具体包括以下步骤:
步骤1,根据图像超分辨率领域常用的公开数据集制作训练集(ILR HHR);
本发明使用图像超分辨率重建领域常用的DIV2K数据集,DIV2K数据集包含了L张2K分辨率的高质量图像,其中训练集M张,测试集N张,验证集P张,它们包含了丰富的场景,可以用于训练和测试模型。具体而言,首先,从DIV2K训练数据集中随机抽取16张图像,包括低分辨率图像和对应的高分辨率图像。然后,在低分辨率图像中随机选取32*32大小的图像块,接着选取低分辨率图像块对应高分辨率图像块,共同组成训练数据集(ILR HHR)。
实施例具体的实施过程说明如下:
DIV2K数据集包含1000张高清图像,训练集800张,测试集100张,验证集100张。在训练集中随机选取16张低分辨率图像和高分辨率图像对。然后,在每张低分辨率图像中随机选取32*32大小的图像区域,再选取与之对应的高分辨率图像区域,对于2倍放大任务,高分辨率图像块大小为64*64,3倍情况下,高分辨率图像块大小是96*96,4倍放大任务是128*128的高分辨率图像块。共同构成训练数据集。
步骤2,构建多尺度注意力卷积神经网络:
步骤2.1,构建多尺度单元,具体是在网络前向传播方向,将前一层特征图,输入到多尺度单元的四个多尺度分支里。第一个分支是卷积核大小为1的卷积层。第二个分支是一个卷积核大小为3的卷积层,后接卷积核大小为1的卷积层。第三个分支是一个卷积核大小为5的卷积层,后接卷积核大小为1的卷积层。第四个分支是一个卷积核大小为7的卷积层,后接卷积核大小为1的卷积层。在四个分支的卷积层中,除了卷积核尺寸为1的卷积层,其卷积核个数均为A个外,其他的卷积层个数均为B个。最后,将四个分支得到的特征图在通道上叠加,输出到注意力单元。
实施例具体的实施过程说明如下:
卷积核尺寸为1的卷积层个数为A=8,其他尺寸卷积核的卷积层个数为B=32,卷积层的激活函数均为ReLu激活函数。
步骤2.2,构建注意力单元,具体是将步骤2.1得到的特征图,首先经过全局平均池化。然后,将得到的向量输入到两个全连接层,第一个全连接层节点数量为输入的特征图数量的四分之一,第二个节点数等于输入特征图数量。接着,对全连接层的输出,使用Sigmoid函数激活,得到的向量数值在0和1之间。最后,将激活后的向量和步骤2.1得到的特征图相乘,对每个特征图重要程度进行区分。
步骤2.3,构建多尺度单元和注意力单元结合的残差结构块,具体是将输入到多尺度单元的特征图和经过多尺度单元和注意力单元运算之后的结果,进行相加,形成残差结构。
步骤2.4,构建基本特征提取单元,具体是使用C个步骤2.3得到的多尺度单元和注意力单元结合的残差结构块串联,形成基本特征提取单元。
实施例具体的实施过程说明如下:
基本特征提取单元由C=4个多尺度单元和注意单元组成的残差结构块串联,用于提取丰富的特征。
步骤2.5,构建整体网络结构,具体是由四个阶段构成,首先是浅层特征提取阶段,由卷积核大小为3的单个卷积层组成,然后是主要特征提取阶段,是由K个步骤2.4得到的基本特征提取单元通过密集连接的方式组成,接着是特征图放大阶段,是使用亚像素卷积层的方式把特征图放大到所需尺寸,最后是重建高分辨率图像阶段,采用单个卷积层根据前面阶段得到的特征图重建出高分辨率图像。
实施例具体的实施过程说明如下:
整体网络中,浅层特征提取阶段的卷积层,卷积核个数是32。主要特征提取阶段由K=10个步骤2.4中的基本特征提取单元通过密集连接方式组合而成。主要特征提取阶段,卷积层是3层,输出三通道的特征图。
步骤3,使用步骤1得到的训练集,训练集中的低分辨率图像ILR作为输入,原始高分辨率图像HHR作为目标。通过前向传播得到网络输出Hhr,与原始高分辨率图像进行比较,计算误差。
minw,b∑(HHR-Hhr)2 (1)
其中,w和b分别是网络参数权重和偏置。
实施例具体的实施过程说明如下:
首先将图像数据归一化,把像素值除以255,得到的数值在0和1之间。数据张量维度是16*32*32*3,输入到步骤2得到的模型中,经过前向传播得到模型的输出,也就是重建出的高分辨率图像。将它和原始的高分辨率图像比较,计算两者之间的均方误差。
步骤4,使用优化器Adam,参数设置为默认,对网络进行迭代训练,根据每一次前向传播计算的误差,通过反向传播和梯度下降法不断优化模型,最终得到训练好的网络模型。
实施例具体的实施过程说明如下:
Adam是一种动量优化器,具有方便高效的优点,可以适应目标函数,能够快速得到优良的结果,在深度学习领域得到广泛使用。在Adam优化器的参数设置上,本发明设置β1=0.9,β2=0.999,学习率设置为0.001,总训练代数为50万。
步骤5,利用训练好的模型,对测试集进行测试,将方法得到的图像和原始高分辨率图像进行比较,计算PSNR(峰值信噪比)和SSIM(结构相似性)指标。
实施例具体的实施过程说明如下:
为了验证算法的效果,本发明在图像超分辨率重建领域的常用测试集Set5、Set14、BSD100,和其他算法进行了对比。图(4)是输入的低分辨率图像,图(5)是双三次插值得到的结果,图(6)是Aplus算法得到的结果,图(7)是SRCNN算法得到的重建结果,图(8)是本发明提出的方法得到的结果。从对比结果中可以看出本发明提出的算法重建出来的图像在细节上更加清晰,恢复出来更多的高频信息。在PSNR(峰值信噪比)和SSIM(结构相似性)客观指标上,通过表1可以看出算法有效性。
本发明采用了上述的技术方案,采用了多种最先进的技术,提高了图像超分辨率重建的质量。具体的创新点包括以下的几点:(1)本发明使用了多尺度和注意力单元,多尺度的结构可以提取低分辨率图像包含的各种信息,充分挖掘有用特征。注意力结构能够对提取的大量的特征进行有用性重要性的区分,避免了干扰信息,能够有效利用信息。(2)密集连接和残差连接方式,在基本的特征提取单元中使用了密集连接的方式,在多尺度注意力单元使用残差连接方式,能够加强梯度传播,避免梯度消失,在特征重用方面更加优秀,有助于浅层信息的流动和使用,将浅层信息和深层信息有效的结合,重建出逼真的高分辨率图像。(3)使用了亚像素卷积层的方式对特征图进行放大,将卷积神经网络特征提取阶段得到的特征,直接排列到大尺度的图像中,减少了计算量,保证了重建的速度。
表1
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
Claims (5)
1.一种基于多尺度注意力卷积神经网络的图像超分辨率方法,其特征在于,其包括以下步骤:
步骤1,根据图像超分辨率领域常用的公开数据集制作训练集(ILR HHR);
使用图像超分辨率重建领域常用的DIV2K数据集,DIV2K数据集包含了L张2K分辨率的高质量图像,其中训练集M张,测试集N张,验证集P张,它们包含了丰富的场景,可以用于训练和测试模型;具体而言,首先,从DIV2K训练数据集中随机抽取16张图像,包括低分辨率图像和其对应的高分辨率图像;然后,在低分辨率图像中随机选取32*32大小的图像区域,接着选取低分辨率图像区域对应高分辨率图像块,共同组成训练数据集(ILR HHR);
步骤2,构建多尺度注意力卷积神经网络:
步骤2.1,构建多尺度单元,具体是在网络前向传播方向,将前一层特征图,输入到多尺度单元的四个多尺度分支里;第一个分支是卷积核大小为1的卷积层;第二个分支是一个卷积核大小为3的卷积层,后接卷积核大小为1的卷积层;第三个分支是一个卷积核大小为5的卷积层,后接卷积核大小为1的卷积层;第四个分支是一个卷积核大小为7的卷积层,后接卷积核大小为1的卷积层;在四个分支的卷积层中,除了卷积核尺寸为1的卷积层,其卷积核个数均为A个外,其他的卷积层个数均为B个;最后,将四个分支得到的特征图在通道上叠加,输出到注意力单元;
步骤2.2,构建注意力单元,具体是将步骤2.1得到的特征图,首先经过全局平均池化,得到特征向量;然后,将得到的向量输入到两个全连接层,第一个全连接层节点数量为输入的特征图数量的四分之一,第二个节点数等于输入特征图数量;接着,对全连接层的输出,使用Sigmoid函数激活,得到的向量数值在0和1之间;最后,将激活后的向量和步骤2.1得到的特征图相乘,对每个特征图重要程度进行区分;
步骤2.3,构建多尺度单元和注意力单元结合的残差结构块,具体是将输入到多尺度单元的特征图和经过多尺度单元和注意力单元运算之后的结果,进行相加,形成残差结构;
步骤2.4,构建基本特征提取单元,具体是使用C个步骤2.3得到的多尺度单元和注意力单元结合的残差结构块串联,形成基本特征提取单元;
步骤2.5,构建整体网络结构,具体是由四个阶段构成,首先是浅层特征提取阶段,由卷积核大小为3的单个卷积层组成,然后是主要特征提取阶段,是由K个步骤2.4得到的基本特征提取单元通过密集连接的方式组成,接着是特征图放大阶段,使用亚像素卷积层的方式把特征图放大到所需尺寸,最后是重建高分辨率图像阶段,采用单个卷积层根据前面阶段得到的特征图重建出高分辨率图像;
步骤3,使用步骤1得到的训练集,训练集中的低分辨率图像ILR作为输入,原始高分辨率图像HHR作为目标;通过前向传播得到网络输出Hhr,与原始高分辨率图像进行比较,计算误差;
minw,b∑(HHR-Hhr)2 (1)
其中,w和b分别是网络参数权重和偏置;
步骤4,使用优化器Adam,参数设置为默认,对网络进行迭代训练,根据每一次前向传播计算的误差,通过反向传播和梯度下降法不断优化模型,最终得到训练好的网络模型;
步骤5,利用训练好的模型,对测试集进行测试,将方法得到的图像和原始高分辨率图像进行比较,计算峰值信噪比PSNR和结构相似性SSIM客观指标。
2.根据权利要求1所述的一种基于多尺度注意力卷积神经网络的图像超分辨率方法,其特征在于:采用多尺度和注意力单元结合,输入的特征图经过该单元后,每个特征图会有一个权重,代表了特征图的重要性。
3.根据权利要求1所述的一种基于多尺度注意力卷积神经网络的图像超分辨率方法,其特征在于:网络模型中激活函数具体是,注意力单元的第二个全连接层使用Sigmoid激活函数,其他卷积层均为ReLu激活函数。
4.根据权利要求1所述的一种基于多尺度注意力卷积神经网络的图像超分辨率方法,其特征在于:网络结构的具体配置为A=8、B=32、C=4、K=10。
5.根据权利要求1所述的一种基于多尺度注意力卷积神经网络的图像超分辨率方法,其特征在于:将网络重建出来的高分辨率图像和原始高分辨率图像转换到YCbCr空间,在Y通道上计算峰值信噪比PSNR和SSIM结构相似性指标。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910551507.9A CN110415170B (zh) | 2019-06-24 | 2019-06-24 | 一种基于多尺度注意力卷积神经网络的图像超分辨率方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910551507.9A CN110415170B (zh) | 2019-06-24 | 2019-06-24 | 一种基于多尺度注意力卷积神经网络的图像超分辨率方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110415170A true CN110415170A (zh) | 2019-11-05 |
CN110415170B CN110415170B (zh) | 2022-12-16 |
Family
ID=68359656
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910551507.9A Active CN110415170B (zh) | 2019-06-24 | 2019-06-24 | 一种基于多尺度注意力卷积神经网络的图像超分辨率方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110415170B (zh) |
Cited By (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110825900A (zh) * | 2019-11-07 | 2020-02-21 | 重庆紫光华山智安科技有限公司 | 特征重构层的训练方法、图像特征的重构方法及相关装置 |
CN110991511A (zh) * | 2019-11-26 | 2020-04-10 | 中原工学院 | 一种基于深度卷积神经网络的向日葵作物种子分拣方法 |
CN111047515A (zh) * | 2019-12-29 | 2020-04-21 | 兰州理工大学 | 一种基于注意力机制的空洞卷积神经网络图像超分辨率重建方法 |
CN111080588A (zh) * | 2019-12-04 | 2020-04-28 | 南京航空航天大学 | 基于多尺度神经网络的快速胎儿mr图像大脑提取方法 |
CN111160413A (zh) * | 2019-12-12 | 2020-05-15 | 天津大学 | 一种基于多尺度特征融合的甲状腺结节分类方法 |
CN111160458A (zh) * | 2019-12-29 | 2020-05-15 | 浪潮电子信息产业股份有限公司 | 一种图像处理系统及其卷积神经网络 |
CN111179167A (zh) * | 2019-12-12 | 2020-05-19 | 天津大学 | 一种基于多阶段注意力增强网络的图像超分辨方法 |
CN111275637A (zh) * | 2020-01-15 | 2020-06-12 | 北京工业大学 | 一种基于注意力模型的非均匀运动模糊图像自适应复原方法 |
CN111382685A (zh) * | 2020-03-04 | 2020-07-07 | 电子科技大学 | 一种基于深度学习的场景识别方法和系统 |
CN111461978A (zh) * | 2020-03-30 | 2020-07-28 | 北京工业大学 | 一种基于注意力机制的逐分辨率提升图像超分辨率复原方法 |
CN111583115A (zh) * | 2020-04-30 | 2020-08-25 | 西安交通大学 | 基于深度注意力网络的单幅图像超分辨率重建方法及系统 |
CN111598781A (zh) * | 2020-05-15 | 2020-08-28 | 宜宾电子科技大学研究院 | 一种基于混合高阶注意网络的图像超分辨率方法 |
CN111798921A (zh) * | 2020-06-22 | 2020-10-20 | 武汉大学 | 一种基于多尺度注意力卷积神经网络的rna结合蛋白预测方法及装置 |
CN111810124A (zh) * | 2020-06-24 | 2020-10-23 | 中国石油大学(华东) | 一种基于特征重标定残差卷积神经网络模型的抽油机井故障诊断方法 |
CN112102176A (zh) * | 2020-07-27 | 2020-12-18 | 中山大学 | 基于多尺度密集混合注意力神经网络的图像去雨方法 |
CN112435164A (zh) * | 2020-11-23 | 2021-03-02 | 浙江工业大学 | 基于多尺度生成对抗网络的低剂量ct肺部图像的同时超分辨率和去噪方法 |
CN112634238A (zh) * | 2020-12-25 | 2021-04-09 | 武汉大学 | 一种基于注意力模块的图像质量评价方法 |
CN112801904A (zh) * | 2021-02-01 | 2021-05-14 | 武汉大学 | 一种基于卷积神经网络的混合退化图像增强方法 |
CN112862688A (zh) * | 2021-03-08 | 2021-05-28 | 西华大学 | 基于跨尺度注意力网络的图像超分辨率重建模型及方法 |
CN112926482A (zh) * | 2021-03-10 | 2021-06-08 | 辽宁工程技术大学 | 一种基于多尺度残差卷积神经网络的道路提取方法 |
CN112950570A (zh) * | 2021-02-25 | 2021-06-11 | 昆明理工大学 | 一种结合深度学习与密集连续中心点的裂纹检测方法 |
CN113052210A (zh) * | 2021-03-11 | 2021-06-29 | 北京工业大学 | 一种基于卷积神经网络的快速低光照目标检测方法 |
CN113096017A (zh) * | 2021-04-14 | 2021-07-09 | 南京林业大学 | 基于深度坐标注意力网络模型的图像超分辨率重建方法 |
CN113222822A (zh) * | 2021-06-02 | 2021-08-06 | 西安电子科技大学 | 基于多尺度变换的高光谱图像超分辨率重建方法 |
CN113298714A (zh) * | 2021-05-24 | 2021-08-24 | 西北工业大学 | 一种基于深度学习的图像跨尺度超分辨率方法 |
CN113409195A (zh) * | 2021-07-06 | 2021-09-17 | 中国标准化研究院 | 基于改进的深度卷积神经网络的图像超分辨率重建方法 |
CN113421237A (zh) * | 2021-06-18 | 2021-09-21 | 西安电子科技大学 | 基于深度特征迁移学习的无参考图像质量评价方法 |
CN113506222A (zh) * | 2021-07-30 | 2021-10-15 | 合肥工业大学 | 一种基于卷积神经网络的多模态图像超分辨方法 |
CN113766250A (zh) * | 2020-09-29 | 2021-12-07 | 四川大学 | 一种基于采样重构和特征增强的压缩图像质量提升方法 |
CN113892955A (zh) * | 2021-10-18 | 2022-01-07 | 上海乐普云智科技股份有限公司 | 基于人工智能模型定位qrs波并进行分类的方法和装置 |
CN114066873A (zh) * | 2021-11-24 | 2022-02-18 | 袁兰 | 一种利用ct图像检测骨质疏松的方法及装置 |
CN114331830A (zh) * | 2021-11-04 | 2022-04-12 | 西安理工大学 | 一种基于多尺度残差注意力的超分辨率重建方法 |
CN114830168A (zh) * | 2020-11-16 | 2022-07-29 | 京东方科技集团股份有限公司 | 图像重建方法、电子设备和计算机可读存储介质 |
CN117132472A (zh) * | 2023-10-08 | 2023-11-28 | 兰州理工大学 | 基于前向-反向可分离自注意力的图像超分辨率重建方法 |
CN117372261A (zh) * | 2023-12-04 | 2024-01-09 | 无锡日联科技股份有限公司 | 基于卷积神经网络的分辨率重建方法、装置、设备及介质 |
CN117132472B (zh) * | 2023-10-08 | 2024-05-31 | 兰州理工大学 | 基于前向-反向可分离自注意力的图像超分辨率重建方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106991646A (zh) * | 2017-03-28 | 2017-07-28 | 福建帝视信息科技有限公司 | 一种基于密集连接网络的图像超分辨率方法 |
WO2017219263A1 (zh) * | 2016-06-22 | 2017-12-28 | 中国科学院自动化研究所 | 基于双向递归卷积神经网络的图像超分辨率增强方法 |
CN109903228A (zh) * | 2019-02-28 | 2019-06-18 | 合肥工业大学 | 一种基于卷积神经网络的图像超分辨率重建方法 |
-
2019
- 2019-06-24 CN CN201910551507.9A patent/CN110415170B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017219263A1 (zh) * | 2016-06-22 | 2017-12-28 | 中国科学院自动化研究所 | 基于双向递归卷积神经网络的图像超分辨率增强方法 |
CN106991646A (zh) * | 2017-03-28 | 2017-07-28 | 福建帝视信息科技有限公司 | 一种基于密集连接网络的图像超分辨率方法 |
CN109903228A (zh) * | 2019-02-28 | 2019-06-18 | 合肥工业大学 | 一种基于卷积神经网络的图像超分辨率重建方法 |
Cited By (54)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110825900A (zh) * | 2019-11-07 | 2020-02-21 | 重庆紫光华山智安科技有限公司 | 特征重构层的训练方法、图像特征的重构方法及相关装置 |
CN110991511A (zh) * | 2019-11-26 | 2020-04-10 | 中原工学院 | 一种基于深度卷积神经网络的向日葵作物种子分拣方法 |
CN111080588A (zh) * | 2019-12-04 | 2020-04-28 | 南京航空航天大学 | 基于多尺度神经网络的快速胎儿mr图像大脑提取方法 |
CN111179167A (zh) * | 2019-12-12 | 2020-05-19 | 天津大学 | 一种基于多阶段注意力增强网络的图像超分辨方法 |
CN111160413A (zh) * | 2019-12-12 | 2020-05-15 | 天津大学 | 一种基于多尺度特征融合的甲状腺结节分类方法 |
CN111179167B (zh) * | 2019-12-12 | 2023-05-16 | 天津大学 | 一种基于多阶段注意力增强网络的图像超分辨方法 |
CN111160413B (zh) * | 2019-12-12 | 2023-11-17 | 天津大学 | 一种基于多尺度特征融合的甲状腺结节分类方法 |
CN111160458A (zh) * | 2019-12-29 | 2020-05-15 | 浪潮电子信息产业股份有限公司 | 一种图像处理系统及其卷积神经网络 |
CN111047515A (zh) * | 2019-12-29 | 2020-04-21 | 兰州理工大学 | 一种基于注意力机制的空洞卷积神经网络图像超分辨率重建方法 |
CN111160458B (zh) * | 2019-12-29 | 2022-04-22 | 浪潮电子信息产业股份有限公司 | 一种图像处理系统及其卷积神经网络 |
CN111047515B (zh) * | 2019-12-29 | 2024-01-09 | 兰州理工大学 | 一种基于注意力机制的空洞卷积神经网络图像超分辨率重建方法 |
CN111275637A (zh) * | 2020-01-15 | 2020-06-12 | 北京工业大学 | 一种基于注意力模型的非均匀运动模糊图像自适应复原方法 |
CN111275637B (zh) * | 2020-01-15 | 2024-01-30 | 北京工业大学 | 一种基于注意力模型的非均匀运动模糊图像自适应复原方法 |
CN111382685A (zh) * | 2020-03-04 | 2020-07-07 | 电子科技大学 | 一种基于深度学习的场景识别方法和系统 |
CN111461978A (zh) * | 2020-03-30 | 2020-07-28 | 北京工业大学 | 一种基于注意力机制的逐分辨率提升图像超分辨率复原方法 |
CN111583115A (zh) * | 2020-04-30 | 2020-08-25 | 西安交通大学 | 基于深度注意力网络的单幅图像超分辨率重建方法及系统 |
CN111583115B (zh) * | 2020-04-30 | 2023-09-05 | 西安交通大学 | 基于深度注意力网络的单幅图像超分辨率重建方法及系统 |
CN111598781A (zh) * | 2020-05-15 | 2020-08-28 | 宜宾电子科技大学研究院 | 一种基于混合高阶注意网络的图像超分辨率方法 |
CN111798921A (zh) * | 2020-06-22 | 2020-10-20 | 武汉大学 | 一种基于多尺度注意力卷积神经网络的rna结合蛋白预测方法及装置 |
CN111810124A (zh) * | 2020-06-24 | 2020-10-23 | 中国石油大学(华东) | 一种基于特征重标定残差卷积神经网络模型的抽油机井故障诊断方法 |
CN111810124B (zh) * | 2020-06-24 | 2023-09-22 | 中国石油大学(华东) | 一种基于特征重标定残差卷积神经网络模型的抽油机井故障诊断方法 |
CN112102176A (zh) * | 2020-07-27 | 2020-12-18 | 中山大学 | 基于多尺度密集混合注意力神经网络的图像去雨方法 |
CN113766250A (zh) * | 2020-09-29 | 2021-12-07 | 四川大学 | 一种基于采样重构和特征增强的压缩图像质量提升方法 |
CN113766250B (zh) * | 2020-09-29 | 2022-05-27 | 四川大学 | 一种基于采样重构和特征增强的压缩图像质量提升方法 |
CN114830168A (zh) * | 2020-11-16 | 2022-07-29 | 京东方科技集团股份有限公司 | 图像重建方法、电子设备和计算机可读存储介质 |
CN112435164A (zh) * | 2020-11-23 | 2021-03-02 | 浙江工业大学 | 基于多尺度生成对抗网络的低剂量ct肺部图像的同时超分辨率和去噪方法 |
CN112435164B (zh) * | 2020-11-23 | 2024-04-30 | 浙江工业大学 | 基于多尺度生成对抗网络的低剂量ct肺部图像的同时超分辨率和去噪方法 |
CN112634238B (zh) * | 2020-12-25 | 2024-03-08 | 武汉大学 | 一种基于注意力模块的图像质量评价方法 |
CN112634238A (zh) * | 2020-12-25 | 2021-04-09 | 武汉大学 | 一种基于注意力模块的图像质量评价方法 |
CN112801904A (zh) * | 2021-02-01 | 2021-05-14 | 武汉大学 | 一种基于卷积神经网络的混合退化图像增强方法 |
CN112950570A (zh) * | 2021-02-25 | 2021-06-11 | 昆明理工大学 | 一种结合深度学习与密集连续中心点的裂纹检测方法 |
CN112862688B (zh) * | 2021-03-08 | 2021-11-23 | 西华大学 | 基于跨尺度注意力网络的图像超分辨率重建系统及方法 |
CN112862688A (zh) * | 2021-03-08 | 2021-05-28 | 西华大学 | 基于跨尺度注意力网络的图像超分辨率重建模型及方法 |
CN112926482A (zh) * | 2021-03-10 | 2021-06-08 | 辽宁工程技术大学 | 一种基于多尺度残差卷积神经网络的道路提取方法 |
CN113052210B (zh) * | 2021-03-11 | 2024-04-26 | 北京工业大学 | 一种基于卷积神经网络的快速低光照目标检测方法 |
CN113052210A (zh) * | 2021-03-11 | 2021-06-29 | 北京工业大学 | 一种基于卷积神经网络的快速低光照目标检测方法 |
CN113096017B (zh) * | 2021-04-14 | 2022-01-25 | 南京林业大学 | 基于深度坐标注意力网络模型的图像超分辨率重建方法 |
CN113096017A (zh) * | 2021-04-14 | 2021-07-09 | 南京林业大学 | 基于深度坐标注意力网络模型的图像超分辨率重建方法 |
CN113298714A (zh) * | 2021-05-24 | 2021-08-24 | 西北工业大学 | 一种基于深度学习的图像跨尺度超分辨率方法 |
CN113298714B (zh) * | 2021-05-24 | 2024-04-26 | 西北工业大学 | 一种基于深度学习的图像跨尺度超分辨率方法 |
CN113222822A (zh) * | 2021-06-02 | 2021-08-06 | 西安电子科技大学 | 基于多尺度变换的高光谱图像超分辨率重建方法 |
CN113222822B (zh) * | 2021-06-02 | 2023-01-24 | 西安电子科技大学 | 基于多尺度变换的高光谱图像超分辨率重建方法 |
CN113421237A (zh) * | 2021-06-18 | 2021-09-21 | 西安电子科技大学 | 基于深度特征迁移学习的无参考图像质量评价方法 |
CN113409195A (zh) * | 2021-07-06 | 2021-09-17 | 中国标准化研究院 | 基于改进的深度卷积神经网络的图像超分辨率重建方法 |
CN113506222B (zh) * | 2021-07-30 | 2024-03-01 | 合肥工业大学 | 一种基于卷积神经网络的多模态图像超分辨方法 |
CN113506222A (zh) * | 2021-07-30 | 2021-10-15 | 合肥工业大学 | 一种基于卷积神经网络的多模态图像超分辨方法 |
CN113892955B (zh) * | 2021-10-18 | 2024-03-29 | 上海乐普云智科技股份有限公司 | 基于人工智能模型定位qrs波并进行分类的方法和装置 |
CN113892955A (zh) * | 2021-10-18 | 2022-01-07 | 上海乐普云智科技股份有限公司 | 基于人工智能模型定位qrs波并进行分类的方法和装置 |
CN114331830A (zh) * | 2021-11-04 | 2022-04-12 | 西安理工大学 | 一种基于多尺度残差注意力的超分辨率重建方法 |
CN114066873A (zh) * | 2021-11-24 | 2022-02-18 | 袁兰 | 一种利用ct图像检测骨质疏松的方法及装置 |
CN117132472A (zh) * | 2023-10-08 | 2023-11-28 | 兰州理工大学 | 基于前向-反向可分离自注意力的图像超分辨率重建方法 |
CN117132472B (zh) * | 2023-10-08 | 2024-05-31 | 兰州理工大学 | 基于前向-反向可分离自注意力的图像超分辨率重建方法 |
CN117372261A (zh) * | 2023-12-04 | 2024-01-09 | 无锡日联科技股份有限公司 | 基于卷积神经网络的分辨率重建方法、装置、设备及介质 |
CN117372261B (zh) * | 2023-12-04 | 2024-02-27 | 无锡日联科技股份有限公司 | 基于卷积神经网络的分辨率重建方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110415170B (zh) | 2022-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110415170A (zh) | 一种基于多尺度注意力卷积神经网络的图像超分辨率方法 | |
CN113065558B (zh) | 一种结合注意力机制的轻量级小目标检测方法 | |
CN110135366B (zh) | 基于多尺度生成对抗网络的遮挡行人重识别方法 | |
Ancuti et al. | Ntire 2020 challenge on nonhomogeneous dehazing | |
CN112507997B (zh) | 一种基于多尺度卷积和感受野特征融合的人脸超分辨系统 | |
WO2021018163A1 (zh) | 神经网络的搜索方法及装置 | |
CN111127308B (zh) | 用于局部遮挡下单样本人脸识别的镜像特征重排修复方法 | |
CN107154023A (zh) | 基于生成对抗网络和亚像素卷积的人脸超分辨率重建方法 | |
CN110232653A (zh) | 快速轻型超分辨率重建密集残差网络 | |
CN111861961A (zh) | 单幅图像超分辨率的多尺度残差融合模型及其复原方法 | |
CN113344806A (zh) | 一种基于全局特征融合注意力网络的图像去雾方法与系统 | |
Zhang et al. | Semantic-aware dehazing network with adaptive feature fusion | |
Xiao et al. | TTST: A top-k token selective transformer for remote sensing image super-resolution | |
CN109584162A (zh) | 一种基于生成网络的图像超分辨率重构的方法 | |
CN110660020A (zh) | 一种基于融合互信息的对抗生成网络的图像超分辨率方法 | |
CN113610087B (zh) | 一种基于先验超分辨率的图像小目标检测方法及存储介质 | |
Wei et al. | Bidirectional hybrid lstm based recurrent neural network for multi-view stereo | |
CN112907448A (zh) | 一种任意比率图像超分辨率方法、系统、设备及存储介质 | |
Kan et al. | A GAN-based input-size flexibility model for single image dehazing | |
Zheng et al. | Double-branch dehazing network based on self-calibrated attentional convolution | |
CN117391938B (zh) | 一种红外图像超分辨率重建方法、系统、设备及终端 | |
CN106203442B (zh) | 一种基于深度学习的拷贝图像特征提取方法 | |
Zhang et al. | Global guidance-based integration network for salient object detection in low-light images | |
Li et al. | Adversarial feature hybrid framework for steganography with shifted window local loss | |
Li et al. | Semantic prior-driven fused contextual transformation network for image inpainting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |