CN115759202A - 一种可变空洞卷积的稠密图像超分辨率网络 - Google Patents

一种可变空洞卷积的稠密图像超分辨率网络 Download PDF

Info

Publication number
CN115759202A
CN115759202A CN202211466653.XA CN202211466653A CN115759202A CN 115759202 A CN115759202 A CN 115759202A CN 202211466653 A CN202211466653 A CN 202211466653A CN 115759202 A CN115759202 A CN 115759202A
Authority
CN
China
Prior art keywords
convbc
relu
convolution
resolution
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211466653.XA
Other languages
English (en)
Other versions
CN115759202B (zh
Inventor
张云飞
曹黎俊
王孝群
蔡占毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Jiyuan Medical Technology Co ltd
Original Assignee
Jiangsu Jiyuan Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Jiyuan Medical Technology Co ltd filed Critical Jiangsu Jiyuan Medical Technology Co ltd
Priority to CN202211466653.XA priority Critical patent/CN115759202B/zh
Publication of CN115759202A publication Critical patent/CN115759202A/zh
Application granted granted Critical
Publication of CN115759202B publication Critical patent/CN115759202B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Image Processing (AREA)

Abstract

本发明提供一种可变空洞卷积的稠密图像超分辨率网络,其特征在于,包括多个依次串接的基本单元BN‑ReLU‑ConvBCN,且最后一个所述基本单元BN‑ReLU‑ConvBCN的输出端依次连接2个卷积层和1个反卷积层;其中,每个所述基本单元BN‑ReLU‑ConvBCN中的BN为归一化层,ReLU为损失函数L,ConvBCN为卷积操作,通过ConvBCN卷积操作获取特征图;输入原始图像,输出高分辨率图像。本发明有效提升不同尺度图像目标的超分辨率网络效果。训练中引入了改进的损失函数,并且随着训练轮次的深入动态调整损失函数,这样的结构给整个网络带来了减轻梯度消失问题、加强特征传播、支持特征复用的优点。

Description

一种可变空洞卷积的稠密图像超分辨率网络
技术领域
本发明属于图像处理技术领域,具体涉及一种可变空洞卷积的稠密图像超分辨率网络。
背景技术
空洞卷积也叫扩张卷积,简单来说就是在卷积核元素之间加入一些空格(零)来扩大卷积核的过程。由此,有效的感受野大小随之增长,而参数的数量却没有变化。
对于深度学习网络来说,感受野的大小往往是固定的,也就是跟卷积核的尺寸是相关的;而对于各种图像目标来说,其目标的大小决定的图像细节往往又是不同的,这就决定了深度学习网络对同一图像目标的最佳感受野并不相同。
目前的深度学习方法,往往采用固定尺度的滤波器,通过大量的滤波器和多层次的滤波器,来解决目标大小不同造成的最佳感受野不同的问题。如果能从底层开始选择多尺度的滤波器来解决最佳感受野选择的问题,理论上可以提升训练效率和处理效果。
发明内容
发明目的:针对上述现有技术,提出一种可变空洞卷积的稠密图像超分辨率网络;
技术方案:一种可变空洞卷积的稠密图像超分辨率网络,包括多个依次串接的基本单元BN-ReLU-ConvBCN,且最后一个所述基本单元BN-ReLU-ConvBCN的输出端依次连接2个卷积层和1个反卷积层;
其中,每个所述基本单元BN-ReLU-ConvBCN中的BN为归一化层,ReLU为损失函数L,ConvBCN为卷积操作,通过ConvBCN卷积操作获取单通道特征图;向第一个所述基本单元BN-ReLU-ConvBCN输入原始图像,反卷积层输出高分辨率图像。
优选的,损失函数L的计算公式为:
Figure BDA0003956509190000021
式中,i表示高分辨率图像的像素序号,m为像素的个数,yi表示像素序号i处的像数值,
Figure BDA0003956509190000022
表示超分辨率后在像素序号i处的像素值,αr为参数且满足αr∈[0,1]。
优选的,按照计算损失函数L和反向梯度优化的方式,开始训练,在刚开始训练的轮次,αr取值为0.8-0.9,随着迭代次数的增加,αr取值逐渐变小,每迭代2000次,αr减少0.1。
优选的,所述特征图的获取包括:记原始空洞卷积核BC为3x3大小,水平方向插入0的操作记为i,表示在水平方向均匀、对称的插入i行零值;垂直方向插入0的操作记为j,表示垂直方向均匀、对称的插入j行零值;其中i,j∈[0,N),且均为整数,获得N2个扩充后的空洞卷积核,将N2个空洞卷积核作为一组,输出为N2个特征图,将N2个特征图通过1x1xN2的卷积核,获得一个单通道的特征图,该操作记为ConvBCN
有益效果:本发明有效提升不同尺度图像目标的超分辨率网络效果。训练中引入了改进的损失函数,并且随着训练轮次的深入动态调整损失函数,这样的结构给整个网络带来了减轻梯度消失问题、加强特征传播、支持特征复用的优点。
附图说明:
图1为BC00结构示意图;
图2为BC11结构示意图。
具体实施方式
下面对本发明做更进一步的解释。
一种可变空洞卷积的稠密图像超分辨率网络,有效提升不同尺度图像目标的超分辨率网络效果。
不同的空洞卷积结果,可以用1x1滤波器融合,相当于选择了不同空洞卷积子的权重。这样的逻辑符合图像细节的一般构成,总是存在低频的细节和高频的细节,他们理应由不同的滤波器来描述特征。这里提出了一系列的空洞卷积子,可以获取不同尺度的图像细节特征,从而更好地描述图像细节。具体步骤如下:
记空洞卷积子BC为3x3大小。水平方向插入0的操作记为i,表示水平方向均匀、对称的插入2*i行零值,垂直方向插入0的操作记为j,表示垂直方向均匀、对称的插入2*j行零值。则初始空洞卷积子也可以记为BC00,插零值的位置均为BC00的中心位置的两侧。BC10表示在水平方向插入2行零值,垂直方向不操作,可以得到一个5x3的卷积子。BC11表示水平和垂直方向均插入两行零值。如图1所示,圈表示存在滤波器参数。
对于i,j∈[0,N),且为整数,可以获得N2个空洞卷积子,作为一组,输出为N2个特征图,N2特征图通过1x1xN2的卷积子,获得一个单通道的特征图。该操作可以记为ConvBCN
网络的基本结构为BN-ReLU-ConvBCN,每层的空洞卷积组个数为32-256个不等。原始图像输入网络,经过5个基本单元BN-ReLU-ConvBCN,后连接2个卷积层,输出再经过1个反卷积层,提高分辨率,最终输出高分辨率图像。
损失函数使用像素值损失,为了克服训练中的噪声、高频信号等影响,在计算损失函数的时候使用如下的公式:
Figure BDA0003956509190000031
式中,i表示像素序号,总共有m个像素。yi表示位置i处的像数值,
Figure BDA0003956509190000032
表示超分辨率后在i处的像素值。
Figure BDA0003956509190000033
就是传统意义上的L1损失函数。αr是一个跟训练迭代轮次相关的参数,αr∈[0,1],当αr=0时,公式等同于传统L1损失函数。在刚开始训练的轮次,αr取值相对较大,可以移植噪声和高频信号对模型收敛的影响,当随着训练轮次的深入,αr取值逐渐变大。实际中采取步进调整的策略,每迭代2000次,αr减少0.1。即有:αr=1-Rstep/2000*0.1,其中Rstep表示训练的轮次。
在网络结构上,将每一层的BN-ReLU-ConvBCN特征都输入给之后的所有层,使所有层的特征都串联起来。
本发明使用一种动态选择最佳感受野的网络结构,有效提升不同尺度图像目标的超分辨率网络效果。训练中引入了改进的L1损失函数,并且随着训练轮次的深入动态调整损失函数,这样的结构给整个网络带来了减轻梯度消失问题、加强特征传播、支持特征复用的优点。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (4)

1.一种可变空洞卷积的稠密图像超分辨率网络,其特征在于,包括多个依次串接的基本单元BN-ReLU-ConvBCN,且最后一个所述基本单元BN-ReLU-ConvBCN的输出端依次连接2个卷积层和1个反卷积层;
其中,每个所述基本单元BN-ReLU-ConvBCN中的BN为归一化层,ReLU为损失函数L,ConvBCN为卷积操作,通过ConvBCN卷积操作获取单通道特征图;向第一个所述基本单元BN-ReLU-ConvBCN输入原始图像,反卷积层输出高分辨率图像。
2.如权利要求1所述的一种可变空洞卷积的稠密图像超分辨率网络,其特征在于,损失函数L的计算公式为:
Figure FDA0003956509180000011
式中,i表示高分辨率图像的像素序号,m为像素的个数,yi表示像素序号i处的像数值,
Figure FDA0003956509180000012
表示超分辨率后在像素序号i处的像素值,αr为参数且满足αr∈[0,1]。
3.如权利要求2所述的一种可变空洞卷积的稠密图像超分辨率网络,其特征在于,按照计算损失函数L和反向梯度优化的方式,开始训练,在刚开始训练的轮次,αr取值为0.8-0.9,随着迭代次数的增加,αr取值逐渐变小,每迭代2000次,αr减少0.1。
4.如权利要求3所述的一种可变空洞卷积的稠密图像超分辨率网络,其特征在于,所述特征图的获取包括:记原始空洞卷积核BC为3x3大小,水平方向插入0的操作记为i,表示在水平方向均匀、对称的插入i行零值;垂直方向插入0的操作记为j,表示垂直方向均匀、对称的插入j行零值;其中i,j∈[0,N),且均为整数,获得N2个扩充后的空洞卷积核,将N2个空洞卷积核作为一组,输出为N2个特征图,将N2个特征图通过1x1xN2的卷积核,获得一个单通道的特征图,该操作记为ConvBCN
CN202211466653.XA 2022-11-22 2022-11-22 一种可变空洞卷积的稠密图像超分辨率方法 Active CN115759202B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211466653.XA CN115759202B (zh) 2022-11-22 2022-11-22 一种可变空洞卷积的稠密图像超分辨率方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211466653.XA CN115759202B (zh) 2022-11-22 2022-11-22 一种可变空洞卷积的稠密图像超分辨率方法

Publications (2)

Publication Number Publication Date
CN115759202A true CN115759202A (zh) 2023-03-07
CN115759202B CN115759202B (zh) 2023-11-28

Family

ID=85335336

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211466653.XA Active CN115759202B (zh) 2022-11-22 2022-11-22 一种可变空洞卷积的稠密图像超分辨率方法

Country Status (1)

Country Link
CN (1) CN115759202B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117407663A (zh) * 2023-12-15 2024-01-16 山东科技大学 一种基于卷积神经网络的全波形数据去噪方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108776969A (zh) * 2018-05-24 2018-11-09 复旦大学 基于全卷积网络的乳腺超声图像肿瘤分割方法
CN109086807A (zh) * 2018-07-16 2018-12-25 哈尔滨工程大学 一种基于空洞卷积堆叠网络的半监督光流学习方法
CN109389556A (zh) * 2018-09-21 2019-02-26 五邑大学 一种多尺度空洞卷积神经网络超分辨率重构方法及装置
CN109919838A (zh) * 2019-01-17 2019-06-21 华南理工大学 基于注意力机制提升轮廓清晰度的超声图像超分辨率重建方法
CN111028153A (zh) * 2019-12-09 2020-04-17 南京理工大学 图像处理和神经网络训练方法、装置及计算机设备
CN111353940A (zh) * 2020-03-31 2020-06-30 成都信息工程大学 一种基于深度学习迭代上下采样的图像超分辨率重建方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108776969A (zh) * 2018-05-24 2018-11-09 复旦大学 基于全卷积网络的乳腺超声图像肿瘤分割方法
CN109086807A (zh) * 2018-07-16 2018-12-25 哈尔滨工程大学 一种基于空洞卷积堆叠网络的半监督光流学习方法
CN109389556A (zh) * 2018-09-21 2019-02-26 五邑大学 一种多尺度空洞卷积神经网络超分辨率重构方法及装置
CN109919838A (zh) * 2019-01-17 2019-06-21 华南理工大学 基于注意力机制提升轮廓清晰度的超声图像超分辨率重建方法
CN111028153A (zh) * 2019-12-09 2020-04-17 南京理工大学 图像处理和神经网络训练方法、装置及计算机设备
CN111353940A (zh) * 2020-03-31 2020-06-30 成都信息工程大学 一种基于深度学习迭代上下采样的图像超分辨率重建方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117407663A (zh) * 2023-12-15 2024-01-16 山东科技大学 一种基于卷积神经网络的全波形数据去噪方法
CN117407663B (zh) * 2023-12-15 2024-03-26 山东科技大学 一种基于卷积神经网络的全波形数据去噪方法

Also Published As

Publication number Publication date
CN115759202B (zh) 2023-11-28

Similar Documents

Publication Publication Date Title
CN108776969B (zh) 基于全卷积网络的乳腺超声图像肿瘤分割方法
CN109087273B (zh) 基于增强的神经网络的图像复原方法、存储介质及系统
Xie et al. Learning frequency-aware dynamic network for efficient super-resolution
CN110992262A (zh) 一种基于生成对抗网络的遥感图像超分辨重建方法
CN108847223B (zh) 一种基于深度残差神经网络的语音识别方法
CN109993096A (zh) 一种面向视频目标检测的光流多层帧特征传播及聚合方法
CN111915490A (zh) 一种基于多尺度特征的车牌图像超分辨率重建模型及方法
CN110706214B (zh) 融合条件随机与残差的三维U-Net大脑肿瘤分割方法
CN115759202A (zh) 一种可变空洞卷积的稠密图像超分辨率网络
CN107146228A (zh) 一种基于先验知识的大脑磁共振图像超体素生成方法
CN111695624B (zh) 数据增强策略的更新方法、装置、设备及存储介质
CN114283320B (zh) 基于全卷积的无分支结构目标检测方法
CN101527774B (zh) 一种图像点阵质量优化方法及装置
CN109255777A (zh) 一种结合小波变换和感知哈希算法的图像相似度计算方法
CN114936518A (zh) 一种拉伸/压缩弹簧设计参数求解方法
CN113643336B (zh) 基于球极坐标系深度神经网络的三维图像刚性匹配方法
CN114444690B (zh) 一种基于任务扩增的迁移攻击方法
CN116309545A (zh) 一种面向医学显微图像的单阶段细胞核实例分割方法
CN112419407B (zh) 基于云团边缘识别的云团位移矢量计算方法及装置
CN109308683A (zh) 一种柔性集成电路基板图像超分辨率重建的方法
Hassan et al. A new formula on the conjugate gradient method for removing impulse noise images
CN111783977B (zh) 一种基于分区域梯度更新的神经网络训练过程中间值存储压缩方法和装置
CN108805286A (zh) 基于高阶残留量化的高性能网络加速方法
CN113011561A (zh) 一种基于对数极空间卷积对数据进行处理的方法
CN108198128A (zh) 一种alpha通道边界腐蚀的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant