CN112967185A - 基于频率域损失函数的图像超分辨率算法 - Google Patents

基于频率域损失函数的图像超分辨率算法 Download PDF

Info

Publication number
CN112967185A
CN112967185A CN202110190379.7A CN202110190379A CN112967185A CN 112967185 A CN112967185 A CN 112967185A CN 202110190379 A CN202110190379 A CN 202110190379A CN 112967185 A CN112967185 A CN 112967185A
Authority
CN
China
Prior art keywords
resolution
super
loss function
image
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110190379.7A
Other languages
English (en)
Inventor
张怡
荆明娥
范益波
曾晓洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fudan University
Original Assignee
Fudan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fudan University filed Critical Fudan University
Priority to CN202110190379.7A priority Critical patent/CN112967185A/zh
Publication of CN112967185A publication Critical patent/CN112967185A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4053Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4046Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明属于计算机视觉技术领域,具体为一种基于频率域损失函数的图像超分辨率算法。该算法在超分辨率算法常用的损失函数上加以改进,在损失函数中加入真值图和预测图的频率域信息,使得算法在学习过程中能够更加关注预测图和真值图之间的高频信息差异,从而获得复原效果更好的高分辨率图片。本算法包括:获取超分辨率训练数据集;搭建超分辨率卷积神经网络,包括特征提取、特征学习、特征重建三个模块;利用提出的基于频率的损失函数训练网络,通过梯度反向传播算法更新网络的参数;网络训练好后,输入低分辨率图片即可对其进行超分辨率重建。本发明算法能够更好的恢复出图片中的高频细节,并且可以方便地应用于其他超分辨率网络。

Description

基于频率域损失函数的图像超分辨率算法
技术领域
本发明属于计算机视觉计技术领域,具体涉及基于频率域损失函数的图像超分辨率算法。
背景技术
图像超分辨率算法旨在从低分辨率(LR)图像中重建出更多细节的高分辨率(HR)图像,由于其在安全监控、遥感图像、医学成像、生活娱乐等领域有着广泛的应用,目前已成为了计算机视觉中的一个热门研究课题。随着深度学习的发展,基于深度学习的图像超分辨率算法得到了广泛的研究。
目前常见的基于深度学习的图像超分辨率算法框架可以分为:预上采样、后上采样和逐步上采样。预上采样框架先利用传统上采样方法对低分辨率图像进行放大,然后将放大后的图片输入到网络重建确实的细节,这种框架中上采样任务已通过传统算法完成,从而学习难度降低,但是,由于其在高分辨率空间进行计算,所以这种框架的时间和空间成本很大。后上采样框架是端到端的学习过程,由于上采样层在模型的末尾,因此大多数的计算量仅发生在低分辨率空间,降低了复杂度,成为了超分辨率领域中最为常用的一种框架。逐步上采样框架则是针对后上采样框架在上采样倍数过大时学习困难提出的解决方案,这种框架会分阶段地逐步重建图像至目标尺寸,但是这种框架设计较为复杂,且训练难度大,需要和更高级的训练策略相配合。
图像超分辨率网络常选择L2或L1损失函数来指导训练,这两个损失函数在空间域直观地对比了预测图像和真值图像之间的差异,网络训练的过程就是最小化损失函数的过程。这两种损失函数训练得到的网络通常都会获得较好的PSNR值(用于评估超分辨率模型的性能)。由于L2和L1损失函数代表平均的像素差异,因此模型恢复的图像在视觉上会有平滑的边缘,缺乏高频的细节。因此本发明提出了一种新的基于图像频率信息的损失函数,使得算法在训练过程中可以直接关注高频信息的学习,从而恢复出细节更丰富的图片。
发明内容
为了克服现有损失函数的不足,恢复出来的图像有平滑的视觉效果,本发明提出了一种基于频率域损失函数的图像超分辨率算法,使得网络在学习过程中能够直接地关注高频信息的学习,恢复出更多的细节。
本发明算法在超分辨率算法常用的损失函数上加以改进,使得算法能够更好的恢复出图片中的高频细节,并且可以方便地应用于其他超分辨率网络。
本发明提供的基于频率域损失函数的图像超分辨率算法,其中,使用的损失函数中包含真值图和预测图的频率信息,使在训练过程中可以直接关注高频信息的学习,从而恢复出细节更丰富的图片,具体步骤如下:
步骤1.获取并处理训练集,具体过程如下。
1.1使用超分辨率数据集DIV2K[4],构建对应的低分辨率数据集,组成高-低分辨率训练样本对;
1.2预处理训练集,并利用数据增强的方法对训练集进行扩充,并将低分辨率图像切割为50x50的大小作为输入。
步骤2.搭建超分辨率卷积神经网络,分为特征提取、特征学习、特征重建三个模块;特征提取模块用于初步提取图像特征,由一个卷积层构成;特征学习模块用于细化图像细节特征,由于恒等学习比较困难,因此这部分采用了残差学习的方法,残差路径包括了18个卷积层,每个卷积层后面紧跟着ReLU激活层;特征重建模块采用meta-Upscale上采样模块,对学习到的特征进行重建,构成最终的高分辨率图像。
步骤3.设计基于频率的损失函数,来指导网络训练,损失函数定义如下:
Figure BDA0002943881590000021
Figure BDA0002943881590000022
Figure BDA0002943881590000023
其中,y和yp分别表示高分辨率真值图片和高分辨率预测图片,F(·)表示图像的傅里叶变换,将图像从空间域转换成频率域表示;所述的损失函数SmoothL1F loss用频率域的表示代替空间域的表示,从而直接比较预测值和真实值的频率信息之间的差异,能够更好地指导网络学习丢失的高频信息。
步骤4.利用步骤1得到的训练集、步骤3设计的损失函数,训练步骤2搭建好的超分辨率卷积神经网络,通过梯度反向传播算法更新网络的参数,直到收敛,得到训练好的超分辨率卷积神经网络;
网络训练中,选择优化器为ADAM[6],其中参数设置为β1=0.9,β2=0.999,∈=10-8;网络参数的初始化采用均值为0,方差为0.01的高斯分布随机初始化;学习率初始化为1e-4,并且每200个epoch会衰减一半;网络的总训练轮数为1000epoch。
步骤5.测试阶段,将低分辨率图片输入训练好的超分辨率卷积神经网络,即可对其进行超分辨率重建,得到超分辨率图片。
本发明提出的方法能够更好的恢复出图片中的高频细节,并且可以方便地应用于其他超分辨率网络。
附图说明
图1本发明算法框架。
图2本发明中的超分辨率网络模型。
具体实施方式
本发明中,采用提出的基于频率的损失函数,用于超分辨率网络的训练,整个算法流程图如图1所示。该算法的工作过程如下。
1.对超分辨率训练集DIV2K进行预处理。首先利用Matlab中的imresize函数对DIV2K中的图片进行bicubic操作得到低分辨率数据集,和DIV2K中的图像组成高-低分辨率训练样本对。然后通过对训练集中的图片随机进行水平翻转、垂直翻转以及旋转90°得到一个扩充的训练集。为了使得网络能够更快的收敛,训练过程中随机在低分辨率图片上裁剪出50x50大小的图像块作为网络的输入。
2.搭建超分辨率卷积神经网络,分为特征提取,特征学习,特征重建三个部分;特征提取模块用于初步提取图像特征,由一个3x3卷积层构成;特征学习模块用于细化图像细节特征,由于恒等学习比较困难,因此这部分采用了残差学习的方法,残差路径包括了18个3x3卷积层,每个卷积层后面紧跟着ReLU激活层;特征重建模块采用了meta-Upscale上采样模块,对学习到的特征进行重建,构成最终的高分辨率图像。整个网络的特征通道数设置为64。
3.设计基于频率的损失函数来指导网络训练,损失函数定义如下:
Figure BDA0002943881590000031
Figure BDA0002943881590000032
Figure BDA0002943881590000033
其中y和yp分别表示高分辨率真值图片和高分辨率预测图片,F(·)表示图像的傅里叶变换,将图像从空间域转换成频率域表示。所述的损失函数SmoothL1F loss用频率域的表示代替空间域的表示,从而直接比较预测值和真实值的频率信息之间的差异,能够更好地指导网络学习丢失的高频信息。
4.训练超分辨率模型,具体步骤如下:
4.1初始化网络参数,采用均值为0,方差为0.01的高斯分布随机初始化;
4.2学习率初始化为1e-4,每200个epoch衰减一半;
4.3将大小为50x50低分辨率图像输入到网络中,得到高分辨率预测图片;
4.4将高分辨率预测图片和对应的高分辨率真值图片代入步骤3设计的损失函数得到损失值,通过梯度反向传播算法对网络参数进行优化调整,网络训练选择的优化器为ADAM,其中参数设置为β1=0.9,β2=0.999,∈=10-8;
4.5反复重复4.3-4.4步骤直至训练1000epoch,网络收敛。
5.测试阶段,将需要重建的低分辨率图片输入到网络中,即可对其进行超分辨率重建。
本实验使用3个标准数据集Set5、Set14、BSD100作为测试集,并使用峰值信噪比PSNR和结构相似性SSIM来评估本算法的准确性,测试结果如表1所示。表1中对比了不同损失函数训练得到的网络效果,表明本发明提出的频率域损失函数能够更好地指导网络训练,得到效果更好的重建图片。
表1
Figure BDA0002943881590000041
参考文献
[1]Dong C,Loy C C,He K,et al.Image super-resolution using deepconvolutional networks[J].IEEE transactions on pattern analysis and machineintelligence,2015,38(2):295-307.
[2]Kim J,Kwon Lee J,Mu Lee K.Accurate image super-resolution usingvery deep convolutional networks[C]//Proceedings of the IEEE conference oncomputer vision and pattern recognition.2016:1646-1654.
[3]Tai Y,Yang J,Liu X.Image super-resolution via deep recursiveresidualnetwork[C]//Proceedings of the IEEE conference on computer vision andpatternrecognition.2017:3147-3155.
[4]Lim B,Son S,Kim H,et al.Enhanced deep residual networks for singleimagesuper-resolution[C]//Proceedings of the IEEE conference on computervision andpattern recognition workshops.2017:136-144.
[5]Hu X,Mu H,Zhang X,et al.Meta-SR:A magnification-arbitrary networkforsuper-resolution[C]//Proceedings of the IEEE Conference on Computer VisionandPattern Recognition.2019:1575-1584.
[6]Kingma,Diederik P.,and Jimmy Ba.Adam:A method for stochasticoptimization.arXiv preprint arXiv:1412.6980(2014).。

Claims (2)

1.一种基于频率域损失函数的图像超分辨率算法,其中,使用的损失函数中包含真值图和预测图的频率信息,使在训练过程中可以直接关注高频信息的学习,从而恢复出细节更丰富的图片,具体步骤如下:
步骤1.获取并处理训练集,具体过程如下:
1.1使用超分辨率数据集DIV2K,构建对应的低分辨率数据集,组成高-低分辨率训练样本对;
1.2预处理训练集,并利用数据增强的方法对训练集进行扩充,并将低分辨率图像切割为50x50的大小作为输入;
步骤2.搭建超分辨率卷积神经网络,分为特征提取、特征学习、特征重建三个模块;特征提取模块用于初步提取图像特征,由一个卷积层构成;特征学习模块用于细化图像细节特征,具体采用残差学习的方法,残差路径包括18个卷积层,每个卷积层后面紧跟着ReLU激活层;特征重建模块采用meta-Upscale上采样模块,对学习到的特征进行重建,构成最终的高分辨率图像;
步骤3.设计基于频率的损失函数,来指导网络训练,损失函数定义如下:
Figure FDA0002943881580000011
Figure FDA0002943881580000012
Figure FDA0002943881580000013
其中,y和yp分别表示高分辨率真值图片和高分辨率预测图片,F(·)表示图像的傅里叶变换,将图像从空间域转换成频率域表示;所述的损失函数SmoothL1F loss用频率域的表示代替空间域的表示;
步骤4.利用步骤1得到的训练集、步骤3设计的损失函数,训练步骤2搭建好的超分辨率卷积神经网络,通过梯度反向传播算法更新网络的参数,直到收敛,得到训练好的超分辨率卷积神经网络;
步骤5.测试,将低分辨率图片输入训练好的超分辨率卷积神经网络,即可对其进行超分辨率重建,得到超分辨率图片。
2.根据权利要求1所述的基于频率域损失函数的图像超分辨率算法,其特征在于,步骤4中,网络训练选择的优化器为ADAM,其中参数设置为β1=0.9,β2=0.999,∈=10-8;网络参数的初始化采用均值为0,方差为0.01的高斯分布随机初始化;学习率初始化为1e-4,并且每200个epoch会衰减一半;网络的总训练轮数为1000epoch。
CN202110190379.7A 2021-02-18 2021-02-18 基于频率域损失函数的图像超分辨率算法 Pending CN112967185A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110190379.7A CN112967185A (zh) 2021-02-18 2021-02-18 基于频率域损失函数的图像超分辨率算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110190379.7A CN112967185A (zh) 2021-02-18 2021-02-18 基于频率域损失函数的图像超分辨率算法

Publications (1)

Publication Number Publication Date
CN112967185A true CN112967185A (zh) 2021-06-15

Family

ID=76285153

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110190379.7A Pending CN112967185A (zh) 2021-02-18 2021-02-18 基于频率域损失函数的图像超分辨率算法

Country Status (1)

Country Link
CN (1) CN112967185A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113409192A (zh) * 2021-06-17 2021-09-17 Oppo广东移动通信有限公司 超分辨率芯片、超分辨率算法的更新方法和电子设备
CN114549673A (zh) * 2022-02-25 2022-05-27 电子科技大学 一种基于学习频域信息预处理图像的图像压缩方法
WO2023093481A1 (zh) * 2021-11-25 2023-06-01 北京字跳网络技术有限公司 基于傅里叶域的超分图像处理方法、装置、设备及介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2787425A1 (en) * 2010-03-12 2011-09-15 The Boeing Company Super-resolution imaging radar
US8184044B1 (en) * 2010-03-12 2012-05-22 The Boeing Company Super resolution radar image extraction procedure
US20180075581A1 (en) * 2016-09-15 2018-03-15 Twitter, Inc. Super resolution using a generative adversarial network
CN110580680A (zh) * 2019-09-09 2019-12-17 武汉工程大学 基于组合学习的人脸超分辨率方法及装置
CN111383742A (zh) * 2018-12-27 2020-07-07 深圳先进技术研究院 一种医学成像模型的建立方法、装置、设备及存储介质
CN111461978A (zh) * 2020-03-30 2020-07-28 北京工业大学 一种基于注意力机制的逐分辨率提升图像超分辨率复原方法
WO2021022929A1 (zh) * 2019-08-08 2021-02-11 齐鲁工业大学 一种单帧图像超分辨率重建方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2787425A1 (en) * 2010-03-12 2011-09-15 The Boeing Company Super-resolution imaging radar
US8184044B1 (en) * 2010-03-12 2012-05-22 The Boeing Company Super resolution radar image extraction procedure
US20180075581A1 (en) * 2016-09-15 2018-03-15 Twitter, Inc. Super resolution using a generative adversarial network
CN111383742A (zh) * 2018-12-27 2020-07-07 深圳先进技术研究院 一种医学成像模型的建立方法、装置、设备及存储介质
WO2021022929A1 (zh) * 2019-08-08 2021-02-11 齐鲁工业大学 一种单帧图像超分辨率重建方法
CN110580680A (zh) * 2019-09-09 2019-12-17 武汉工程大学 基于组合学习的人脸超分辨率方法及装置
CN111461978A (zh) * 2020-03-30 2020-07-28 北京工业大学 一种基于注意力机制的逐分辨率提升图像超分辨率复原方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
KEEPGOING18: "smooth L1损失函数", 《HTTPS://WWW.CNBLOGS.COM/PACINO12134/P/11407897.HTML》 *
XUECAI HU 等: "Meta-SR: A Magnification-Arbitrary Network for Super-Resolution", 《2019 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 *
钮孟洋: "图像超分辨率重建算法研究", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113409192A (zh) * 2021-06-17 2021-09-17 Oppo广东移动通信有限公司 超分辨率芯片、超分辨率算法的更新方法和电子设备
WO2023093481A1 (zh) * 2021-11-25 2023-06-01 北京字跳网络技术有限公司 基于傅里叶域的超分图像处理方法、装置、设备及介质
CN114549673A (zh) * 2022-02-25 2022-05-27 电子科技大学 一种基于学习频域信息预处理图像的图像压缩方法
CN114549673B (zh) * 2022-02-25 2023-06-23 电子科技大学 一种基于学习频域信息预处理图像的图像压缩方法

Similar Documents

Publication Publication Date Title
Liang et al. Details or artifacts: A locally discriminative learning approach to realistic image super-resolution
CN112967185A (zh) 基于频率域损失函数的图像超分辨率算法
CN107610194B (zh) 基于多尺度融合cnn的磁共振图像超分辨率重建方法
CN109035142B (zh) 一种对抗网络结合航拍图像先验的卫星图像超分辨方法
CN107633486A (zh) 基于三维全卷积神经网络的结构磁共振图像去噪方法
CN109214989B (zh) 基于多方向特征预测先验的单幅图像超分辨率重建方法
CN108090871A (zh) 一种基于卷积神经网络的多对比度磁共振图像重建方法
CN109472743B (zh) 遥感图像的超分辨率重建方法
CN110443768B (zh) 基于多重一致性约束的单帧图像超分辨率重建方法
CN106952228A (zh) 基于图像非局部自相似性的单幅图像的超分辨率重建方法
Fu et al. Image super-resolution based on generative adversarial networks: a brief review
CN111242865A (zh) 基于生成式对抗网络的眼底图像增强方法
Yang et al. Image super-resolution based on deep neural network of multiple attention mechanism
CN112950480A (zh) 一种融合多感受野和密集残差注意的超分辨率重建方法
CN113506222A (zh) 一种基于卷积神经网络的多模态图像超分辨方法
CN116029902A (zh) 一种基于知识蒸馏的无监督真实世界图像超分辨方法
CN112037304A (zh) 基于swi相位图像的两阶段的边缘增强qsm重建方法
CN114926883A (zh) 一种满足多种降质模型的人脸图像处理方法
CN114926337A (zh) 基于CNN和Transformer混合网络的单幅图像超分辨率重建方法及系统
Chen et al. Guided dual networks for single image super-resolution
CN109272450A (zh) 一种基于卷积神经网络的图像超分方法
Yang et al. RSAMSR: A deep neural network based on residual self-encoding and attention mechanism for image super-resolution
CN115880158B (zh) 一种基于变分自编码的盲图像超分辨率重建方法及系统
CN115511733A (zh) 一种图像退化建模方法、神经网络训练方法和装置
CN115311135A (zh) 一种基于3dcnn的各向同性mri分辨率重建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210615

WD01 Invention patent application deemed withdrawn after publication