CN108537104A - 基于全图观测的压缩感知网络及感知损失重构方法 - Google Patents

基于全图观测的压缩感知网络及感知损失重构方法 Download PDF

Info

Publication number
CN108537104A
CN108537104A CN201810086400.7A CN201810086400A CN108537104A CN 108537104 A CN108537104 A CN 108537104A CN 201810086400 A CN201810086400 A CN 201810086400A CN 108537104 A CN108537104 A CN 108537104A
Authority
CN
China
Prior art keywords
network
image
convolutional layer
layer
lamination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810086400.7A
Other languages
English (en)
Inventor
石光明
杜江
王陈业
谢雪梅
汪芳羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201810086400.7A priority Critical patent/CN108537104A/zh
Publication of CN108537104A publication Critical patent/CN108537104A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于全图观测的压缩感知网络及感知损失重构方法,主要解决现有网络恢复的重构图像具有块效应的问题。其包括观测子网络和重构子网络,该观测子网络包括第一卷积层;重构子网络包括反卷积层、第二卷积层、第一Relu激活层、第三卷积层、第二Relu激活层和第四卷积层;第一卷积层、反卷积层、第二卷积层、第一Relu激活层、第三卷积层、第二Relu激活层、第四卷积层从左至右依次连接,且反卷积层的输出端与第四卷积层的输出端相连接。利用所述网络在训练过程中引入感知损失,使重构图像的结构信息更明晰。用本发明网络进行图像重构避免了块效应,提高了图像恢复质量,强化了重构图像的语义信息,可用于图像处理。

Description

基于全图观测的压缩感知网络及感知损失重构方法
技术领域
本发明属于压缩感知技术领域,主要涉及到一种全图观测的压缩感知网络及感知损失重构方法,可用于图像处理。
背景技术
在大量的实际问题中,人们倾向于尽量少地采集数据,或者由于客观条件所限不得不采集不完整的数据。传统的图像压缩是基于奈奎斯特定理采样进行数据采集,并从数据本身特性出发,寻找并剔除数据中隐含的冗余度。这样造成的结果是,数据压缩必须在数据完整采集之后,压缩过程要求复杂的算法,这和大量采集并处理信号的设备性能是矛盾的。压缩感知的概念就是为了解决这一问题提出的,它能以远低于奈奎斯特频率直接采集压缩后的信号,并通过数值最优问题准确重构出原始信号。
目前,针对压缩感知理论的图像恢复方法的研究,主要集中在利用传统的贪婪算法,迭代阈值法或者引入深度学习的方法进行图像重构。其中迭代阈值法和贪婪算法都需要大量的迭代运算,耗时长。所以最近的研究逐渐转向利用深度学习方法来进行图像重构。已有的深度学习的方法一般是将大图分成小块,利用高斯矩阵作为观测矩阵,再构建学习网络作为恢复网络依次恢复块图像。这种将大图分割成小图的方法会造成重构出的图像具有明显的块效应,在较低的观测率下恢复出来的图像模糊,语义信息不明显,而且需要保证有大量的训练数据集,训练过程时间长,不适用于在较低观测率下的图像重构。
发明内容
本发明的目的在于针对已有技术的不足,提出一种基于全图观测的压缩感知网络及感知损失重构方法,以在任意观测率下避免出现块效应,尤其是在低观测下大幅度提高图像恢复质量。
本发明的技术思路是:通过直接采用带有重叠的卷积层对完整图像进行统一采样,在图像重构上采用残差连接,避免块效应的出现;通过在训练网络的过程中引入感知损失,提高图像恢复质量,使得重构图像结构更清晰,其实现方案包括如下:
1.一种基于全图观测的压缩感知网络,包括观测子网络和重构子网络,其特征在于:
所述观测子网络,包括第一卷积层;
所述重构子网络,包括反卷积层、第二卷积层、第一Relu激活层、第三卷积层、第二Relu激活层和第四卷积层;
该第一卷积层、反卷积层、第二卷积层、第一Relu激活层、第三卷积层、第二Relu激活层、第四卷积层从左至右依次连接,且反卷积层的输出端与第四卷积层的输出端相连接。
2.一种利用上述网络进行感知损失重构的方法,包括:
1)下载DIV2K数据集,共包含800张训练图片,对数据集里的每张图片进行下采样,形成256×256大小的训练数据集;
2)训练网络:
2a)将训练数据集输入到全图观测的压缩感知网络中,得到输出图像
2b)将训练数据集中的输入图像y与输出图像分别送到分类网络Vgg19的输入端,在Vgg19的中间层输出对应的特征图像,计算特征图像之间的欧式距离作为感知损失L;
2c)将感知损失L反向传播,得到该网络的每一层损失总数δ;
2d)利用每一层的损失总数δ,采用随机梯度下降算法更新网络权值参数W;
2e)重复2a)-2d)共6250次,得到训练好的图像重构网络;
3)将任意测试图像输入训练好的图像重构网络,得到重构图像。
本发明与现有技术相比具有以下优点:
1.图像结构完整
现有的利用深度学习方法来处理图像重构问题,是将大图分成小图来输入网络,会损失掉原图块与块之间的结构信息,造成恢复的图像有明显的块效应。而本发明采用卷积层作为观测网络,由于卷积操作对图像进行交叠采样,既可以采样到图像块与块之间的位置信息,又可保证能完整采集到图像的结构信息,使得经网络恢复后的重构图像没有块效应,图像结构完整。
2.图像语义信息强
现有的网络训练中将输入图像与输出图像的欧式距离作为损失函数,所恢复的重构图像比较模糊,语义信息不够强烈;
本发明由于将输入图像与输出图像分别送入分类网络Vgg19的输入端,在Vgg19中间层输出对应的特征图像,提取二者特征图像的欧式距离作为感知损失,旨在通过Vgg19这个分类网络,加强了整个网络对图像语义信息的采样与重构。
测试结果表明,本发明的重构图像相较于传统方式有更清晰图像轮廓,图像语义信息更加强烈,即使在极低的观测率下,该网络仍能恢复出清晰的语义信息。
附图说明
图1为本发明的网络结构图;
图2为用本发明网络进行图像重构的实现流程图;
图3为现有的Monarch,Boats图像标准图;
图4为用本发明在选取1%环境观测率与不同感知损失计算层时,对图3的重构图像结果图。
图5为用本发明在选取4%环境观测率与不同感知损失计算层时,对图3的重构图像结果图。
具体实施方式:
下面结合附图对本发明的实施例和效果做进一步详细描述。
参照图1,本发明全图观测的压缩感知网络,由两个子网络组成,一是观测子网络,二是重构子网络。其中:
观测子网络,包括第一卷积层;
重构子网络,包括反卷积层、第二卷积层、第一Relu激活层、第三卷积层、第二Relu激活层和第四卷积层;该第一Relu激活层是从第二卷积层的输出x1和0中取最大值,作为第一Relu激活层的输出f1,即f1=max(0,x1),该第二Relu激活层是从第三卷积层的输出x2和0中取最大值,作为第二Relu激活层的输出f2,即f2=max(0,x2);
这两个子网络的连接关系如下:
将观测子网络与重构子网络进行左右连接,即将第一卷积层、反卷积层、第二卷积层、第一Relu激活层、第三卷积层、第二Relu激活层、第四卷积层从左至右依次连接,并将反卷积层的输出端与第四卷积层的输出端相连接,构成基于全图观测的压缩感知网络。
上述网络的各层参数需要根据重构图像的大小和环境观测量去设定,在本实例中,第一卷积层中卷积厚度k1根据环境观测量设置,当环境观测量分别为1%,4%,10%,25%时,卷积厚度k1的设置分别为3,10,26,64,卷积大小h1=32×32,步长s1=16;
反卷积层中的反卷积大小h2=32×32,步长s2=16,k2=1;
第二卷积层中的卷积大小h3=11×11,步长s3=1,k3=64;
第三卷积层中的卷积大小h4=1×1,步长s4=1,k4=32;
第四卷积层中的卷积大小h5=7×7,步长s5=1,k5=1;
上述参数的设定仅是本发明的一个实例,并不构成对本发明的限制。
参照图2,利用上述网络进行感知损失图像重构的实现步骤如下:
步骤1,获取训练数据集。
下载DIV2K数据集,得到共包含800张的训练图片,对该数据集里的每张图片进行下采样处理,形成256×256大小的灰度图训练数据集。
步骤2,训练网络。
(2a)将训练数据集输入到本发明构建的上述基于全图观测的压缩感知网络中得到输出图像该输出图像的像素点值与输入图像y的像素点值及权值参数{W}有关,其中{W}代表基于压缩感知的分块观测全图重构网络中的5组权值参数,5组权值参数分别对应网络的5层;在本实例中每层的权重参数和偏置参数设置相同,即权重参数初始值均设置为平均值为0、方差为0.001的高斯随机数,偏置参数初始值均设置为常数0;
(2b)将训练数据集中的输入图像y与输出图像分别送到分类网络Vgg19的输入端;所述分类网络Vgg19,是一个已经训练好的公开网络,其结构表一所示。
表一Vgg19
从表一可见,分类网络Vgg19共有19个主干块,包括16个卷积块、3个全连接块,其中每个卷积块内包括两层,依次是卷积层和Relu层,全连接块包括两层,第17,第18全连接块内依次是全连接层和Relu层,第19全连接块内依次是全连接层和softmax层。
上述16个卷积块、3个全连接块按从输入到输出方向依次连接。
除主干之外还有五个池化层,分别连接在第2,第3卷积块之间、第4,第5卷积块之间、第8,第9卷积块之间、第12,第13卷积块之间、第16卷积块和第17全连接块之间。
(2c)在Vgg19的中间层输出对应的特征图像,计算特征图像之间的欧式距离作为感知损失L;
其中代表输入图像y送入Vgg19后,在Vgg19网络的第j层输出特征图像,代表输出图像送入Vgg19后,在Vgg19网络的第j层输出特征图像,代表差的2范数平方,L为感知损失。
在本实例中,中间层选取了Vgg19的第四卷积块内的Relu2_2层和第8卷积块内的Relu3_4层,即j=9和j=18;
(2d)将感知损失L反向传播,得到该网络的每一层的损失总数δl
δl=[(Wl+1)Tδl+1]⊙σ(zl)l=1,2,…,5,
其中⊙表示Hadamard乘积,用于矩阵或向量点对点的乘法运算;l表示网络的第l层,Wl+1表示网络的l+1层权值参数,zl表示网络第l层的输入,σ(zl)表示网络第l层对应的输出,δl表示网络第l层的损失总数,损失总数δl最后一层为感知损失L,即δ5为L;
(2e)利用每一层的损失总数δl,采用随机梯度下降算法更新网络每层的权值参数,得到更新后网络每层的权值参数W′l
其中,等式左边的W′l为更新后网络的第l层权值参数,等式右边的Wl为当前计算时未更新的网络第l层的权值参数,δl表示网络第l层的损失总数,α表示网络的学习率,本实例中α设置为3×10-9
(2f)重复(2a)-(2e)共6250次,得到训练好的图像重构网络。
步骤3,测试网络。
(3a)获取测试数据集:
本实例中,测试数据集包括但不限于现有的Monarch、Parrots、Barbara、Boats、Cameraman、Fingerprint、Flinstones、Foreman、House、Lena256、peppers256这11张标准测试图像,图3展示了其中的Monarch和Boats这两张图像标准图;
(3b)将测试图像输入到训练好的图像重构网络,得到重构图像。
本发明的效果可通过以下测试实例进一步说明:
一.测试条件:
在环境观测量为1%时,取基于全图观测的压缩感知网络的第一卷积层卷积厚度k1为3,训练时分别取Vgg19的第四卷积块内的Relu2_2和第8卷积块内的Relu3_4作为感知损失计算层,其余网络参数如上所述,构成两个网络。
在环境观测量为4%时,取基于全图观测的压缩感知网络的第一卷积层卷积厚度k1为10,训练时分别取Vgg19的第四卷积块内的Relu2_2和第8卷积块内的Relu3_4作为感知损失计算层,其余网络参数如上所述,再构成两个网络。
二.测试实验内容
测试实验1.分别对这四个网络进行训练,得到训练好的网络;
将如图3所示的两张测试图像分别送入经过训练好的这四个不同网络,得到在环境观测量为1%时的重构图像,如图4所示,在环境观测量为4%时的重构图像,如图5所示。
其中:图4(a)和图5(a)对应图3(a)感知损失为第四卷积块的情况;
图4(b)和图5(b)对应图3(b)感知损失为第四卷积块的情况;
图4(c)和图5(c)对应图3(a)感知损失为第八卷积块的情况;
图4(d)和图5(d)对应图3(b)感知损失为第八卷积块的情况;
从图4和图5可见,图像经过基于全图观测的压缩感知网络恢复出的重构图像都无块效应,且在低环境观测量下,保留了较强的结构信息。
测试实验2.将包含Monarch、Parrots、Barbara、Boats、Cameraman、Fingerprint、Flinstones、Foreman、House、Lena256、peppers256这11张标准测试图像分别送入经过训练好的这四个不同网络,分别得到不同环境观测量和感知损失计算层下的重构图像,并对这些重构图像的峰值信噪比PSNR进行测试,结果如表二:
表二重构图像的PSNR
从表二可见,在低环境观测率下,重构图像的PSNR均有较高的数值。

Claims (8)

1.基于全图观测的压缩感知网络,包括观测子网络和重构子网络,其特征在于:
所述观测子网络,包括第一卷积层;
所述重构子网络,包括反卷积层、第二卷积层、第一Relu激活层、第三卷积层、第二Relu激活层和第四卷积层;
该第一卷积层、反卷积层、第二卷积层、第一Relu激活层、第三卷积层、第二Relu激活层、第四卷积层从左至右依次连接,且反卷积层的输出端与第四卷积层的输出端相连接。
2.根据权利要求1所述的网络,特征在于:第一Relu激活层,第二Relu激活层均通过如下公式激活后输出给下一层:
f(x)=max(0,x),
f(x)是指激活层的输出,x是指激活层的输入,max(0,x)是指取0和x中的最大值。
3.根据权利要求1所述的网络,特征在于:
第一卷积层中的卷积大小h1为32×32,步长s1为16,该卷积层的厚度k1与设定的环境观测率r呈正相关;
第二卷积层中的卷积大小h3为11×11,步长s3为1,厚度k3为64;
第三卷积层中的卷积大小h4为1×1,步长s4为1,厚度k4为32;
第四卷积层中的卷积大小h5为7×7,步长s5为1,厚度k5为1。
4.根据权利要求1所述的网络,特征在于:反卷积层中的反卷积大小h2与步长s2与第一卷积层相同,即h2等于h1,s2等于s1,厚度k2与网络输入图像一致。
5.基于全图观测的压缩感知网络进行感知损失图像重构的方法,包括:
1)下载DIV2K数据集,共包含800张训练图片,对数据集里的每张图片进行下采样,形成256×256大小的训练数据集;
2)训练网络:
2a)将训练数据集输入到全图观测的压缩感知网络中,得到输出图像
2b)将训练数据集中的输入图像y与输出图像分别送到分类网络Vgg19的输入端,在Vgg19的中间层输出对应的特征图像,计算特征图像之间的欧式距离作为感知损失L;
2c)将感知损失L反向传播,得到该网络的每一层损失总数δ;
2d)利用每一层的损失总数δ,采用随机梯度下降算法更新网络权值参数W;
2e)重复2a)-2d)共6250次,得到训练好的图像重构网络;
3)将任意测试图像输入训练好的图像重构网络,得到重构图像。
6.根据权利要求5所述的方法,其特征在于:步骤2b)中计算特征图像之间的欧式距离作为感知损失L,通过如下公式计算:
其中代表输入图像y送入Vgg19后,在Vgg19网络的第j层输出特征图像,代表输出图像送入Vgg19后,在Vgg19网络的第j层输出特征图像,代表差的2范数平方,L为感知损失。
7.根据权利要求5所述的方法,其特征在于:步骤2c)中将感知损失L反向传播,得到网络的每一层损失总数δ,通过如下公式进行:
δl=[(Wl+1)Tδl+1]⊙σ(zl)l=1,2,…,5.
其中⊙表示Hadamard乘积,用于矩阵或向量点对点的乘法运算;l表示网络的第l层,Wl +1表示网络的l+1层权值参数,zl表示网络第l层的输入,σ(zl)表示网络第l层对应的输出,δl表示网络第l层的损失总数,损失总数δ的最后一层即为感知损失L。
8.根据权利要求5所述的方法,其特征在于:步骤2d)中采用随机梯度下降算法更新网络权值参数W,通过如下公式进行:
其中等式左边的W′l为更新后网络的第l层权值参数,等式右边的Wl为当前计算时未更新的网络第l层的权值参数,δl表示网络第l层的损失总数,α表示网络的学习率。
CN201810086400.7A 2018-01-30 2018-01-30 基于全图观测的压缩感知网络及感知损失重构方法 Pending CN108537104A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810086400.7A CN108537104A (zh) 2018-01-30 2018-01-30 基于全图观测的压缩感知网络及感知损失重构方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810086400.7A CN108537104A (zh) 2018-01-30 2018-01-30 基于全图观测的压缩感知网络及感知损失重构方法

Publications (1)

Publication Number Publication Date
CN108537104A true CN108537104A (zh) 2018-09-14

Family

ID=63486210

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810086400.7A Pending CN108537104A (zh) 2018-01-30 2018-01-30 基于全图观测的压缩感知网络及感知损失重构方法

Country Status (1)

Country Link
CN (1) CN108537104A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110222717A (zh) * 2019-05-09 2019-09-10 华为技术有限公司 图像处理方法和装置
CN111046893A (zh) * 2018-10-12 2020-04-21 富士通株式会社 图像相似性确定方法和装置、图像处理方法和装置
CN110210548B (zh) * 2019-05-27 2021-03-16 清华大学深圳研究生院 一种基于强化学习的图片动态自适应压缩方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106910185A (zh) * 2017-01-13 2017-06-30 陕西师范大学 一种基于cnn深度学习的dbcc分类模型及构建方法
CN107610192A (zh) * 2017-09-30 2018-01-19 西安电子科技大学 基于深度学习的自适应观测压缩感知图像重构方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106910185A (zh) * 2017-01-13 2017-06-30 陕西师范大学 一种基于cnn深度学习的dbcc分类模型及构建方法
CN107610192A (zh) * 2017-09-30 2018-01-19 西安电子科技大学 基于深度学习的自适应观测压缩感知图像重构方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
TAO PAN: ""Perceptual Loss with Fully Convolutional for Image Residual Denoising"", 《CHINESE CONFERENCE ON PATTERN RECOGNITION》 *
XUEMEI XIE等: ""Fully-Convolutional Measurement Network for Compressive Sensing Image Reconstruction"", 《ARXIV》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111046893A (zh) * 2018-10-12 2020-04-21 富士通株式会社 图像相似性确定方法和装置、图像处理方法和装置
CN111046893B (zh) * 2018-10-12 2024-02-02 富士通株式会社 图像相似性确定方法和装置、图像处理方法和装置
CN110222717A (zh) * 2019-05-09 2019-09-10 华为技术有限公司 图像处理方法和装置
CN110210548B (zh) * 2019-05-27 2021-03-16 清华大学深圳研究生院 一种基于强化学习的图片动态自适应压缩方法

Similar Documents

Publication Publication Date Title
CN109241491A (zh) 基于联合低秩和稀疏表示的张量结构性缺失填充方法
CN111145116B (zh) 一种基于生成对抗网络的海面雨天图像样本增广方法
CN107784676B (zh) 基于自动编码器网络的压缩感知测量矩阵优化方法和系统
CN109949257A (zh) 基于深度学习的感兴趣区域压缩感知图像重构方法
CN112465718B (zh) 一种基于生成对抗网络的两阶段图像修复方法
CN108154499B (zh) 一种基于k-svd学习字典的机织物纹理瑕疵检测方法
CN112818764B (zh) 一种基于特征重建模型的低分辨率图像人脸表情识别方法
CN112116601B (zh) 基于生成对抗残差网络的压缩感知采样重建方法及系统
CN108537104A (zh) 基于全图观测的压缩感知网络及感知损失重构方法
CN107491793B (zh) 一种基于稀疏散射全卷积的极化sar图像分类方法
CN108734675A (zh) 基于混合稀疏先验模型的图像复原方法
CN107085835B (zh) 基于四元数加权核范数最小的彩色图像去噪方法
CN109816646B (zh) 一种基于退化决策逻辑的无参考图像质量评价方法
CN101017373A (zh) 工业过程多分辨率软测量仪表及方法
CN107240136A (zh) 一种基于深度学习模型的静态图像压缩方法
CN115526891B (zh) 一种缺陷数据集的生成模型的训练方法及相关装置
CN110599585A (zh) 基于深度学习的单图像人体三维重建方法及装置
CN105957022A (zh) 低秩矩阵重建带有随机值脉冲噪声缺失图像恢复方法
CN111882516B (zh) 一种基于视觉显著性和深度神经网络的图像质量评价方法
Morzelona Human visual system quality assessment in the images using the IQA model integrated with automated machine learning model
CN115760814A (zh) 一种基于双耦合深度神经网络的遥感图像融合方法及系统
CN114565594A (zh) 基于软掩膜对比损失的图像异常检测方法
CN107680036A (zh) 基于卷积深度堆叠网络的联合稀疏向量并行重建方法
CN108510464A (zh) 基于分块观测的压缩感知网络及全图重构方法
CN111539434B (zh) 基于相似度的红外弱小目标检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180914