CN115759202A - 一种可变空洞卷积的稠密图像超分辨率网络 - Google Patents
一种可变空洞卷积的稠密图像超分辨率网络 Download PDFInfo
- Publication number
- CN115759202A CN115759202A CN202211466653.XA CN202211466653A CN115759202A CN 115759202 A CN115759202 A CN 115759202A CN 202211466653 A CN202211466653 A CN 202211466653A CN 115759202 A CN115759202 A CN 115759202A
- Authority
- CN
- China
- Prior art keywords
- convbc
- relu
- convolution
- resolution
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 7
- 238000010586 diagram Methods 0.000 claims abstract description 6
- 238000010606 normalization Methods 0.000 claims abstract description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 5
- 230000008034 disappearance Effects 0.000 abstract description 3
- 238000005728 strengthening Methods 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 11
- 238000013135 deep learning Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000010339 dilation Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Image Processing (AREA)
Abstract
本发明提供一种可变空洞卷积的稠密图像超分辨率网络,其特征在于,包括多个依次串接的基本单元BN‑ReLU‑ConvBCN,且最后一个所述基本单元BN‑ReLU‑ConvBCN的输出端依次连接2个卷积层和1个反卷积层;其中,每个所述基本单元BN‑ReLU‑ConvBCN中的BN为归一化层,ReLU为损失函数L,ConvBCN为卷积操作,通过ConvBCN卷积操作获取特征图;输入原始图像,输出高分辨率图像。本发明有效提升不同尺度图像目标的超分辨率网络效果。训练中引入了改进的损失函数,并且随着训练轮次的深入动态调整损失函数,这样的结构给整个网络带来了减轻梯度消失问题、加强特征传播、支持特征复用的优点。
Description
技术领域
本发明属于图像处理技术领域,具体涉及一种可变空洞卷积的稠密图像超分辨率网络。
背景技术
空洞卷积也叫扩张卷积,简单来说就是在卷积核元素之间加入一些空格(零)来扩大卷积核的过程。由此,有效的感受野大小随之增长,而参数的数量却没有变化。
对于深度学习网络来说,感受野的大小往往是固定的,也就是跟卷积核的尺寸是相关的;而对于各种图像目标来说,其目标的大小决定的图像细节往往又是不同的,这就决定了深度学习网络对同一图像目标的最佳感受野并不相同。
目前的深度学习方法,往往采用固定尺度的滤波器,通过大量的滤波器和多层次的滤波器,来解决目标大小不同造成的最佳感受野不同的问题。如果能从底层开始选择多尺度的滤波器来解决最佳感受野选择的问题,理论上可以提升训练效率和处理效果。
发明内容
发明目的:针对上述现有技术,提出一种可变空洞卷积的稠密图像超分辨率网络;
技术方案:一种可变空洞卷积的稠密图像超分辨率网络,包括多个依次串接的基本单元BN-ReLU-ConvBCN,且最后一个所述基本单元BN-ReLU-ConvBCN的输出端依次连接2个卷积层和1个反卷积层;
其中,每个所述基本单元BN-ReLU-ConvBCN中的BN为归一化层,ReLU为损失函数L,ConvBCN为卷积操作,通过ConvBCN卷积操作获取单通道特征图;向第一个所述基本单元BN-ReLU-ConvBCN输入原始图像,反卷积层输出高分辨率图像。
优选的,损失函数L的计算公式为:
优选的,按照计算损失函数L和反向梯度优化的方式,开始训练,在刚开始训练的轮次,αr取值为0.8-0.9,随着迭代次数的增加,αr取值逐渐变小,每迭代2000次,αr减少0.1。
优选的,所述特征图的获取包括:记原始空洞卷积核BC为3x3大小,水平方向插入0的操作记为i,表示在水平方向均匀、对称的插入i行零值;垂直方向插入0的操作记为j,表示垂直方向均匀、对称的插入j行零值;其中i,j∈[0,N),且均为整数,获得N2个扩充后的空洞卷积核,将N2个空洞卷积核作为一组,输出为N2个特征图,将N2个特征图通过1x1xN2的卷积核,获得一个单通道的特征图,该操作记为ConvBCN。
有益效果:本发明有效提升不同尺度图像目标的超分辨率网络效果。训练中引入了改进的损失函数,并且随着训练轮次的深入动态调整损失函数,这样的结构给整个网络带来了减轻梯度消失问题、加强特征传播、支持特征复用的优点。
附图说明:
图1为BC00结构示意图;
图2为BC11结构示意图。
具体实施方式
下面对本发明做更进一步的解释。
一种可变空洞卷积的稠密图像超分辨率网络,有效提升不同尺度图像目标的超分辨率网络效果。
不同的空洞卷积结果,可以用1x1滤波器融合,相当于选择了不同空洞卷积子的权重。这样的逻辑符合图像细节的一般构成,总是存在低频的细节和高频的细节,他们理应由不同的滤波器来描述特征。这里提出了一系列的空洞卷积子,可以获取不同尺度的图像细节特征,从而更好地描述图像细节。具体步骤如下:
记空洞卷积子BC为3x3大小。水平方向插入0的操作记为i,表示水平方向均匀、对称的插入2*i行零值,垂直方向插入0的操作记为j,表示垂直方向均匀、对称的插入2*j行零值。则初始空洞卷积子也可以记为BC00,插零值的位置均为BC00的中心位置的两侧。BC10表示在水平方向插入2行零值,垂直方向不操作,可以得到一个5x3的卷积子。BC11表示水平和垂直方向均插入两行零值。如图1所示,圈表示存在滤波器参数。
对于i,j∈[0,N),且为整数,可以获得N2个空洞卷积子,作为一组,输出为N2个特征图,N2特征图通过1x1xN2的卷积子,获得一个单通道的特征图。该操作可以记为ConvBCN。
网络的基本结构为BN-ReLU-ConvBCN,每层的空洞卷积组个数为32-256个不等。原始图像输入网络,经过5个基本单元BN-ReLU-ConvBCN,后连接2个卷积层,输出再经过1个反卷积层,提高分辨率,最终输出高分辨率图像。
损失函数使用像素值损失,为了克服训练中的噪声、高频信号等影响,在计算损失函数的时候使用如下的公式:
式中,i表示像素序号,总共有m个像素。yi表示位置i处的像数值,表示超分辨率后在i处的像素值。就是传统意义上的L1损失函数。αr是一个跟训练迭代轮次相关的参数,αr∈[0,1],当αr=0时,公式等同于传统L1损失函数。在刚开始训练的轮次,αr取值相对较大,可以移植噪声和高频信号对模型收敛的影响,当随着训练轮次的深入,αr取值逐渐变大。实际中采取步进调整的策略,每迭代2000次,αr减少0.1。即有:αr=1-Rstep/2000*0.1,其中Rstep表示训练的轮次。
在网络结构上,将每一层的BN-ReLU-ConvBCN特征都输入给之后的所有层,使所有层的特征都串联起来。
本发明使用一种动态选择最佳感受野的网络结构,有效提升不同尺度图像目标的超分辨率网络效果。训练中引入了改进的L1损失函数,并且随着训练轮次的深入动态调整损失函数,这样的结构给整个网络带来了减轻梯度消失问题、加强特征传播、支持特征复用的优点。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (4)
1.一种可变空洞卷积的稠密图像超分辨率网络,其特征在于,包括多个依次串接的基本单元BN-ReLU-ConvBCN,且最后一个所述基本单元BN-ReLU-ConvBCN的输出端依次连接2个卷积层和1个反卷积层;
其中,每个所述基本单元BN-ReLU-ConvBCN中的BN为归一化层,ReLU为损失函数L,ConvBCN为卷积操作,通过ConvBCN卷积操作获取单通道特征图;向第一个所述基本单元BN-ReLU-ConvBCN输入原始图像,反卷积层输出高分辨率图像。
3.如权利要求2所述的一种可变空洞卷积的稠密图像超分辨率网络,其特征在于,按照计算损失函数L和反向梯度优化的方式,开始训练,在刚开始训练的轮次,αr取值为0.8-0.9,随着迭代次数的增加,αr取值逐渐变小,每迭代2000次,αr减少0.1。
4.如权利要求3所述的一种可变空洞卷积的稠密图像超分辨率网络,其特征在于,所述特征图的获取包括:记原始空洞卷积核BC为3x3大小,水平方向插入0的操作记为i,表示在水平方向均匀、对称的插入i行零值;垂直方向插入0的操作记为j,表示垂直方向均匀、对称的插入j行零值;其中i,j∈[0,N),且均为整数,获得N2个扩充后的空洞卷积核,将N2个空洞卷积核作为一组,输出为N2个特征图,将N2个特征图通过1x1xN2的卷积核,获得一个单通道的特征图,该操作记为ConvBCN。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211466653.XA CN115759202B (zh) | 2022-11-22 | 2022-11-22 | 一种可变空洞卷积的稠密图像超分辨率方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211466653.XA CN115759202B (zh) | 2022-11-22 | 2022-11-22 | 一种可变空洞卷积的稠密图像超分辨率方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115759202A true CN115759202A (zh) | 2023-03-07 |
CN115759202B CN115759202B (zh) | 2023-11-28 |
Family
ID=85335336
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211466653.XA Active CN115759202B (zh) | 2022-11-22 | 2022-11-22 | 一种可变空洞卷积的稠密图像超分辨率方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115759202B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117407663A (zh) * | 2023-12-15 | 2024-01-16 | 山东科技大学 | 一种基于卷积神经网络的全波形数据去噪方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108776969A (zh) * | 2018-05-24 | 2018-11-09 | 复旦大学 | 基于全卷积网络的乳腺超声图像肿瘤分割方法 |
CN109086807A (zh) * | 2018-07-16 | 2018-12-25 | 哈尔滨工程大学 | 一种基于空洞卷积堆叠网络的半监督光流学习方法 |
CN109389556A (zh) * | 2018-09-21 | 2019-02-26 | 五邑大学 | 一种多尺度空洞卷积神经网络超分辨率重构方法及装置 |
CN109919838A (zh) * | 2019-01-17 | 2019-06-21 | 华南理工大学 | 基于注意力机制提升轮廓清晰度的超声图像超分辨率重建方法 |
CN111028153A (zh) * | 2019-12-09 | 2020-04-17 | 南京理工大学 | 图像处理和神经网络训练方法、装置及计算机设备 |
CN111353940A (zh) * | 2020-03-31 | 2020-06-30 | 成都信息工程大学 | 一种基于深度学习迭代上下采样的图像超分辨率重建方法 |
-
2022
- 2022-11-22 CN CN202211466653.XA patent/CN115759202B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108776969A (zh) * | 2018-05-24 | 2018-11-09 | 复旦大学 | 基于全卷积网络的乳腺超声图像肿瘤分割方法 |
CN109086807A (zh) * | 2018-07-16 | 2018-12-25 | 哈尔滨工程大学 | 一种基于空洞卷积堆叠网络的半监督光流学习方法 |
CN109389556A (zh) * | 2018-09-21 | 2019-02-26 | 五邑大学 | 一种多尺度空洞卷积神经网络超分辨率重构方法及装置 |
CN109919838A (zh) * | 2019-01-17 | 2019-06-21 | 华南理工大学 | 基于注意力机制提升轮廓清晰度的超声图像超分辨率重建方法 |
CN111028153A (zh) * | 2019-12-09 | 2020-04-17 | 南京理工大学 | 图像处理和神经网络训练方法、装置及计算机设备 |
CN111353940A (zh) * | 2020-03-31 | 2020-06-30 | 成都信息工程大学 | 一种基于深度学习迭代上下采样的图像超分辨率重建方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117407663A (zh) * | 2023-12-15 | 2024-01-16 | 山东科技大学 | 一种基于卷积神经网络的全波形数据去噪方法 |
CN117407663B (zh) * | 2023-12-15 | 2024-03-26 | 山东科技大学 | 一种基于卷积神经网络的全波形数据去噪方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115759202B (zh) | 2023-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108776969B (zh) | 基于全卷积网络的乳腺超声图像肿瘤分割方法 | |
CN109087273B (zh) | 基于增强的神经网络的图像复原方法、存储介质及系统 | |
Xie et al. | Learning frequency-aware dynamic network for efficient super-resolution | |
CN110992262A (zh) | 一种基于生成对抗网络的遥感图像超分辨重建方法 | |
CN108847223B (zh) | 一种基于深度残差神经网络的语音识别方法 | |
CN109993096A (zh) | 一种面向视频目标检测的光流多层帧特征传播及聚合方法 | |
CN111915490A (zh) | 一种基于多尺度特征的车牌图像超分辨率重建模型及方法 | |
CN110706214B (zh) | 融合条件随机与残差的三维U-Net大脑肿瘤分割方法 | |
CN115759202A (zh) | 一种可变空洞卷积的稠密图像超分辨率网络 | |
CN107146228A (zh) | 一种基于先验知识的大脑磁共振图像超体素生成方法 | |
CN111695624B (zh) | 数据增强策略的更新方法、装置、设备及存储介质 | |
CN114283320B (zh) | 基于全卷积的无分支结构目标检测方法 | |
CN101527774B (zh) | 一种图像点阵质量优化方法及装置 | |
CN109255777A (zh) | 一种结合小波变换和感知哈希算法的图像相似度计算方法 | |
CN114936518A (zh) | 一种拉伸/压缩弹簧设计参数求解方法 | |
CN113643336B (zh) | 基于球极坐标系深度神经网络的三维图像刚性匹配方法 | |
CN114444690B (zh) | 一种基于任务扩增的迁移攻击方法 | |
CN116309545A (zh) | 一种面向医学显微图像的单阶段细胞核实例分割方法 | |
CN112419407B (zh) | 基于云团边缘识别的云团位移矢量计算方法及装置 | |
CN109308683A (zh) | 一种柔性集成电路基板图像超分辨率重建的方法 | |
Hassan et al. | A new formula on the conjugate gradient method for removing impulse noise images | |
CN111783977B (zh) | 一种基于分区域梯度更新的神经网络训练过程中间值存储压缩方法和装置 | |
CN108805286A (zh) | 基于高阶残留量化的高性能网络加速方法 | |
CN113011561A (zh) | 一种基于对数极空间卷积对数据进行处理的方法 | |
CN108198128A (zh) | 一种alpha通道边界腐蚀的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |