CN110348487B - 一种基于深度学习的高光谱图像压缩方法及装置 - Google Patents

一种基于深度学习的高光谱图像压缩方法及装置 Download PDF

Info

Publication number
CN110348487B
CN110348487B CN201910512008.9A CN201910512008A CN110348487B CN 110348487 B CN110348487 B CN 110348487B CN 201910512008 A CN201910512008 A CN 201910512008A CN 110348487 B CN110348487 B CN 110348487B
Authority
CN
China
Prior art keywords
image
quantization
network
layer
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201910512008.9A
Other languages
English (en)
Other versions
CN110348487A (zh
Inventor
种衍文
李浩南
潘少明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201910512008.9A priority Critical patent/CN110348487B/zh
Publication of CN110348487A publication Critical patent/CN110348487A/zh
Application granted granted Critical
Publication of CN110348487B publication Critical patent/CN110348487B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/008Vector quantisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Abstract

本发明公开了一种基于深度学习的高光谱图像压缩方法,首先,选取训练图像,将训练图像的尺寸大小随机裁剪为32×32大小作为训练集,然后将训练集输入到搭建好的压缩网络模型中进行训练,得到包含编码网络、量化网络和解码网络的压缩模型。通过将待压缩的图像输入到编码网络中,根据编码网络的计算结果得到编码后的特征图,然后将得到的特征图输入到量化网络中进行量化计算,得到码流,最后将量化后的结果输入到解码网络,通过解码网络模型的计算得到重建后的图像。本发明可以实现对高光谱图像的压缩,并提升压缩效果。

Description

一种基于深度学习的高光谱图像压缩方法及装置
技术领域
本发明涉及高光谱图像压缩技术领域,具体涉及一种基于深度学习的高光谱图像压缩方法及装置。
背景技术
相较于自然图像,高光谱图像包含了二维空间信息和一维光谱信息。其中,每个光谱波段分别对应一幅二维图像,且不同波段相同位置的像素构成一条光谱曲线。利用不同地物所具有的光谱曲线差异,高光谱图像被广泛应用于国民经济的各个领域。随着高分遥感成像技术的应用普及,如何有效的压缩由于遥感图像光谱和空间分辨率显著提升所带来的传输和存储数据量激增等挑战是高光谱图像应用过程中亟待解决的问题。
新兴的图像处理方法深度学习(Deep Learning)通过从大量训练样本中学习目标的特征来完成特定的任务。目前深度学习已经在图像分类、目标检测、行人再识别等多个图像处理的领域取得了重大成就。
目前,现有的深度学习技术多用于普通可见光图像的压缩,而基于深度学习的高光谱图像压缩技术还是比较少的。Toderici等提出了基于长短时记忆网络的、可变比率的图像压缩算法。算法将一张32×32大小的图像输入到网络中,通过减少图像的尺度和调节特征图的个数,实现对图像的压缩,然后通过解码网络实现图像信息的还原。Balle等使用卷积神经网络来实现图像的压缩。网络包含分析变换结构,量化结构和合成变换结构三个部分,这些结构主要由卷积层、图像降采样层、GDN归一化层等组成。Li等提出了基于图像内容加权的图像压缩技术,此方法针对不同的图像内容使用不同的比特率编码,它在传统自编码器结构的基础上,加入了重要性图概念,通过重要性图来实现不同图像内容的码率控制。
本申请发明人在实施本发明的过程中,发现现有技术的方法,至少存在如下技术问题:
但是现有技术中采用的上述方法都是针对可见光图像的压缩,而不是针对高光谱图像的压缩,普通图像一般只有3个波段,而高光谱图像的波段数拥有几十个到上百个,甚至更多,现有的方法无法实现对高光谱图像的压缩或者压缩效果较差。
发明内容
有鉴于此,本发明提供了一种基于深度学习的高光谱图像压缩方法及装置,用以解决或者至少部分解决现有的方法无法实现对高光谱图像的压缩或者压缩效果较差的技术问题。
本发明提供了一种基于深度学习的高光谱图像压缩方法,包括:
步骤S1:选取预设数量的图像作为训练图像,将训练图像的尺寸大小随机裁剪为32×32大小作为训练集,其中,训练图像包括普通图像和高光谱图像;
步骤S2:将训练集输入到预先搭建的压缩网络模型中,对压缩网络模型进行训练,获得训练后的压缩网络模型,其中,训练后的压缩网络模型包括编码网络、量化网络以及和解码网络;
步骤S3:将待压缩图像输入训练后的压缩网络模型,通过编码网络提取待压缩图像的特征后得到编码后的特征图,通过量化网络对编码后的特征图进行量化计算,得到量化结果,将其作为压缩后的图像,且通过解码网络对量化结果的解码计算对压缩后的图像进行恢复。
在一种实施方式中,步骤S2中训练过程采用的损失函数为:
Figure BDA0002093796950000021
其中,N表示图像中像素点的个数,X为原始图像的像素点数值,Y为恢复图像的像素点数值。
在一种实施方式中,编码网络包括输入层input、卷积层Conv2D、激活层PRelu、残差单元ResUnit、归一化层BatchNorm,步骤S3中通过编码网络提取待压缩图像的特征后得到编码后的特征图,包括:
将待压缩的图像输入input层后,通过步长为2的Conv2D层将待压缩图像的尺寸变为原来的二分之一,得到第一特征图,然后进入PRelu层和ResUnit;
第一特征图再次经过一个步长为2的Conv2D层,得到第二特征图,第二特征图的尺寸变为第一特征图的二分之一,再经过BatchNorm层和PRelu层;以此类推,经过三个Conv2D层之后,得到第三特征图的尺寸为待压缩图像的八分之一,最后通过一个Conv2D层调整特征图的数量,将第三特征图作为编码后的特征图。
在一种实施方式中,量化网络包括一个卷积层、一个激活层Tanh和一个量化层,步骤S3中通过量化网络对编码后的特征图进行量化计算,得到量化结果,具体包括:
将编码后的特征图输入到量化网络的卷积层,调整特征图的输出数量,然后进入Tanh层,将数据映射到(-1,1)的区间内,然后进入量化层进行量化计算,将小于或等于0的数据变为-1,把大于0的数据变为1,得到量化结果。
在一种实施方式中,量化计算的量化公式为:
Figure BDA0002093796950000031
其中,X表示图像特征图元素的值,Q(X)为量化后的结果。
在一种实施方式中,解码网络包括上分支和下分支,步骤S3中解码网络对量化结果的解码计算对压缩后的图像进行恢复,具体包括:
通过上分支对量化结果进行解码计算,得到第一解码结果;
通过下分支对量化结果进行解码计算,得到第二解码结果;
将第一解码结果和第二解码结果相加,得到恢复图像。
基于同样的发明构思,本发明第二方面提供了一种基于深度学习的高光谱图像压缩装置,包括:
预处理模块,用于选取预设数量的图像作为训练图像,将训练图像的尺寸大小随机裁剪为32×32大小作为训练集,其中,训练图像包括普通图像和高光谱图像;
模型训练模块,用于将训练集输入到预先搭建的压缩网络模型中,对压缩网络模型进行训练,获得训练后的压缩网络模型,其中,训练后的压缩网络模型包括编码网络、量化网络以及和解码网络;
图像压缩模块,用于将待压缩图像输入训练后的压缩网络模型,通过编码网络提取待压缩图像的特征后得到编码后的特征图,通过量化网络对编码后的特征图进行量化计算,得到量化结果,将其作为压缩后的图像,且通过解码网络对量化结果的解码计算对压缩后的图像进行恢复。
本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:
本发明提供的一种基于深度学习的高光谱图像压缩方法,首先选取训练图像,将训练图像的尺寸大小随机裁剪为32×32大小作为训练集,然后把训练集输入到搭建好的的压缩网络模型中,开始网络模型的训练,训练完成后的压缩网络模型包括三个网络,分别为编码网络、量化网络和解码网络。得到压缩后网络模型后,就可以进行图像的压缩、量化和重建了。将待压缩的图像输入到编码模型中,根据编码模型的计算结果得到编码后的特征图,然后将编码后的特征图输入到量化网络模型中进行量化计算,得到码流即量化结果,也就是压缩后的图像,从而完成图像的压缩。并且,将量化后的结果输入到解码网络,通过解码网络的计算可以得到重建后的图像,即可以对压缩后的图像进行恢复。
由于本发明的方法在选取训练图像时,将高光谱图像做了预处理,使得高光谱图像可以和普通图像一起作为模型的训练集,从而进行训练,使得本发明中的模型可以对高光谱图像进行处理,并且,通过设置包含三个网络的压缩模型,通过编码网络的编码后可以提取图像特征,将图像进行压缩,进一步地,通过量化网络的量化的作用,可以将浮点型数据变为整型数据,减少数据占用的比特数,从而可以进一步提升压缩效果。解决了现有技术中无法实现对高光谱图像的压缩或者压缩效果较差的技术问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种基于深度学习的高光谱图像压缩方法的流程示意图;
图2为本发明实例的总体技术流程图;
图3为本发明中采用的压缩网络模型结构示意图;
图4为存储在计算机硬盘上的压缩后的二进制数据的示意图;
图5为具体实例中待压缩图像(左图)和压缩重建后图像(右图)的示意图;
图6为本发明提供的一种基于深度学习的高光谱图像压缩装置的结构框图。
具体实施方式
本发明的目的在于针对现有技术中无法实现对高光谱图像的压缩或者压缩效果较差的技术问题,提供的一种基于深度学习的高光谱图像压缩方法及装置,从而对高光谱图像进行压缩、并改善压缩效果的目的。
为达到上述目的,本发明的主要构思如下:
首先,选取训练图像,将训练图像的尺寸大小随机裁剪为32×32大小作为训练集,然后将训练集输入到搭建好的的压缩网络模型中,开始网络模型的训练,训练完成后得到包含三个网络的压缩模型,它们分别为编码网络、量化网络和解码网络。接着,将待压缩的图像输入到编码网络中,根据编码网络的计算结果得到编码后的特征图,得到的特征图输入到量化网络中进行量化计算,得到码流,最后把量化后的结果输入到解码网络,根据解码网络的计算得到重建后的图像。本发明采用的方法相比与现有技术中的同类方法,提升了恢复图像的质量,有较强的实用性。
总体来说,本发明相对于现有技术而言,具有如下优点或者有益技术效果。
(1)本发明充分考虑了图像的特征信息,采用深度学习技术,对图像的特征进行自动的获取,网络模型学习到了深层次的图像特征信息。为后续解压缩创造了有利条件。
(2)本发明基于深度学习技术对图像进行编码和解码,在编码的过程中,经过多次下采样,进一步减少了数据量,提升了压缩率。
(3)本专利依托国家自然科学基金完成(基金号:61572372,41671382)。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
本发明实施例提供了一种基于深度学习的高光谱图像压缩方法,请参见图1,该方法包括:
步骤S1:选取预设数量的图像作为训练图像,将训练图像的尺寸大小随机裁剪为32×32大小作为训练集,其中,训练图像包括普通图像和高光谱图像。
具体来说,预设数量可以根据实际情况进行设置。本发明选取的训练图像包括普通图像和高光谱图像,为了使得本发明的网络模型可以对高光谱图像进行压缩,本发明对高光谱图像进行了预处理,并将普通图像和高光谱图像进行剪裁后一起作为训练集。
步骤S2:将训练集输入到预先搭建的压缩网络模型中,对压缩网络模型进行训练,获得训练后的压缩网络模型,其中,训练后的压缩网络模型包括编码网络、量化网络以及和解码网络。
具体来说,预先搭建的压缩网络模型可以利用Pytorch的深度学习框架搭建压缩网络模型。
步骤S3:将待压缩图像输入训练后的压缩网络模型,通过编码网络提取待压缩图像的特征后得到编码后的特征图,通过量化网络对编码后的特征图进行量化计算,得到量化结果,将其作为压缩后的图像,且通过解码网络对量化结果的解码计算对压缩后的图像进行恢复。
具体来说,当训练好由编码网络、量化网络和解码网络共同组成的网络模型后,则可以利用训练后的压缩网络模型对待压缩图像进行压缩了。具体表现为图像经过编码网络进行编码后,得到尺寸只有原图像的1/8大小的特征图,将特征图输入到量化网络得到二进制的码流数据,最后将二进制数据输入到解码网络,得到恢复的图像。
请参见图2,为本发明实例的总体流程图,编码器对应编码网络、量化器对应量化网络,解码器对应解码网络,输入图像进入解码器进行特征提取后,再进入量化器得到码流,即为压缩后的图像,码流再通过解码器的作用,则可以得到输出图像。
在一种实施方式中,步骤S2中训练过程采用的损失函数为:
Figure BDA0002093796950000061
其中,N表示图像中像素点的个数,X为原始图像的像素点数值,Y为恢复图像的像素点数值。
在一种实施方式中,编码网络包括输入层input、卷积层Conv2D、激活层PRelu、残差单元ResUnit、归一化层BatchNorm,步骤S3中通过编码网络提取待压缩图像的特征后得到编码后的特征图,包括:
将待压缩的图像输入input层后,通过步长为2的Conv2D层将待压缩图像的尺寸变为原来的二分之一,得到第一特征图,然后进入PRelu层和ResUnit;
第一特征图再次经过一个步长为2的Conv2D层,得到第二特征图,第二特征图的尺寸变为第一特征图的二分之一,再经过BatchNorm层和PRelu层;以此类推,经过三个Conv2D层之后,得到第三特征图的尺寸为待压缩图像的八分之一,最后通过一个Conv2D层调整特征图的数量,将第三特征图作为编码后的特征图。
具体来说,编码网络的主要作用是提取图像特征,将待压缩图像的尺寸进行压缩。请参见图3,为本发明中采用的压缩网络模型结构示意图,其中的编码网络依次包括input层、Conv2D层、PRelu层、ResUnit、Conv2D层、BatchNorm层、PRelu层、Conv2D层、BatchNorm层、PRelu层、ResUnit和Conv2D层。
输入待压缩图像后,利用Pytorch内置的卷积计算,其中,前三个卷积层(也称为下采样层)是用来进行下采样的,最后一个卷积层是用来调整网络特征图数量的。前三个卷积层的步长为2,这样就可以对图像进行下采样操作,每经过一个下采样层,特征图尺寸就变为原来的1/2,经过三个下采样层之后,得到输入图像的特征图,特征图的尺寸为待压缩图像的1/8。
在一种实施方式中,量化网络包括一个卷积层、一个激活层Tanh和一个量化层,步骤S3中通过量化网络对编码后的特征图进行量化计算,得到量化结果,具体包括:
将编码后的特征图输入到量化网络的卷积层,调整特征图的输出数量,然后进入Tanh层,将数据映射到(-1,1)的区间内,然后进入量化层进行量化计算,将小于或等于0的数据变为-1,把大于0的数据变为1,得到量化结果。
具体来说,量化网络Binarizer依次包括卷积层、Tanh层和量化层,通过将编码网络输出的特征图输入到量化网络进行量化计算,得到二进制的数值。
在一种实施方式中,量化计算的量化公式为:
Figure BDA0002093796950000071
其中,X表示图像特征图元素的值,Q(X)为量化后的结果。
在一种实施方式中,解码网络包括上分支和下分支,步骤S3中解码网络对量化结果的解码计算对压缩后的图像进行恢复,具体包括:
通过上分支对量化结果进行解码计算,得到第一解码结果;
通过下分支对量化结果进行解码计算,得到第二解码结果;
将第一解码结果和第二解码结果相加,得到恢复图像。
具体来说,将量化后的数据输入到解码网络,利用Pytorch内置的卷积层和上采样层进行计算,每经过一个上采样层,图像尺寸就变为原来的两倍,经过3个上采样层之后,图像变为待压缩图像的尺寸大小,恢复出原始的图像。
在具体的实施过程中,将量化后的数据输入到解码网络,解码网络有两个分支(上分支和下分支)同时进行解码计算。编码通过上分支的PixelShuffle(上采样层)、Conv2D(卷积层)、PRelu(激活层)、ResUnit(残差单元)、PixelShuffle、Conv2D、PRelu、PixelShuffle、Conv2D、PRelu、Conv2D解码计算,以及下分支的PixelShuffle、Conv2D、LeakyRelu(激活层)、PixelShuffle、Conv2D、LeakyRelu、PixelShuffle、Conv2D、LeakyRelu的解码计算,最后将上下两个分支的计算结果相加,共同输出作为重建图像。
其中,PixelShuffle主要是实现特征图的上采样操作,使得特征图的尺寸大小翻倍。其它如Conv2D是卷积计算,ResUnit是为了加速网络的收敛速度,防止梯度消失。PRelu(激活层)和LeakyRelu(激活层)都是为了实现神经网络的非线性。Leaky ReLU是给所有负值赋予一个非零斜率a,a为一个固定值,而PRelu中的a是一个非固定值。本发明通过设置两个分支,可以进一步提升图像的恢复质量。
下面结合具体实例,详细介绍本发明中具体的压缩流程。
以32×32×3的图像作为训练图像,256×256×3的图像作为测试图像,这样做的好处是,训练图像尺寸较小有利于网络模型的快速训练,测试图像则是对网络模型的压缩效果进行测试。当然测试图像也可以选择与训练图像尺寸大小一致。主要步骤包括:
1.训练网络模型:
1.1将五万张可见光图像与高光谱子图像进行随机裁剪,变为尺寸为32×32×3的图像块。
1.2将裁剪好的图像块转换为张量,然后输入网络模型进行网络模型的训练,全部数据迭代200次,得到训练好的网络模型。训练使用的损失函数如下:
Figure BDA0002093796950000091
2.编码网络提取图像特征:
2.1对于256×256×3的高光谱子图像,原始图像的数据量为196.6KB(千字节),输入到编码网络进行特征提取,获得尺寸为32×32×C的特征图,此处C取16。根据C的大小可以调整压缩率。
3.特征图量化操作:
把编码层输出的特征图输入到量化网络进行量化计算,得到二进制的数值,即获得数据量大小为32×32×16个二进制数,占用存储空间为2KB。
4.解码网络恢复图像:
把量化后的数据输入到解码网络,利用Pytorch内置的卷积层和上采样层进行计算,每经过一个上采样层,图像尺寸就变为原来的两倍,经过3个上采样层之后,图像变为待压缩图像的尺寸大小,恢复出原始的图像。随后重复2,3,4三个过程,直到所有高光谱子图像完成这些操作。
其中,图4为存储在计算机硬盘上的压缩后的二进制数据的示意图,图5为具体实例中待压缩图像(左图)和压缩重建后图像(右图)的示意图;
总体来说,本发明是一种应用于高光谱图像压缩的方法,与现有的技术相比具有以下优点:
(1)本发明充分考虑了图像的特征信息,采用深度学习技术,对图像的特征进行自动的获取,网络模型学习到了深层次的图像特征信息。为后续解压缩创造了有利条件。
(2)本发明基于深度学习技术对图像进行编码和解码,在编码的过程中,经过多次下采样,进一步减少了数据量,提升了压缩率。
(3)本专利依托国家自然科学基金完成(基金号:61572372,41671382)。
基于同一发明构思,本申请还提供了与实施例一中一种基于深度学习的高光谱图像压缩方法对应的装置,详见实施例二。
实施例二
本实施例提供了一种基于深度学习的高光谱图像压缩装置,请参见图6,该装置包括:
预处理模块201,用于选取预设数量的图像作为训练图像,将训练图像的尺寸大小随机裁剪为32×32大小作为训练集,其中,训练图像包括普通图像和高光谱图像;
模型训练模块202,用于将训练集输入到预先搭建的压缩网络模型中,对压缩网络模型进行训练,获得训练后的压缩网络模型,其中,训练后的压缩网络模型包括编码网络、量化网络以及和解码网络;
图像压缩模块203,用于将待压缩图像输入训练后的压缩网络模型,通过编码网络提取待压缩图像的特征后得到编码后的特征图,通过量化网络对编码后的特征图进行量化计算,得到量化结果,将其作为压缩后的图像,且通过解码网络对量化结果的解码计算对压缩后的图像进行恢复。
由于本发明实施例二所介绍的装置,为实施本发明实施例一中基于深度学习的高光谱图像压缩方法所采用的装置,,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该装置,的具体结构及变形,故而在此不再赘述。凡是本发明实施例一的方法所采用的装置,都属于本发明所欲保护的范围。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (4)

1.一种基于深度学习的高光谱图像压缩方法,其特征在于,包括:
步骤S1:选取预设数量的图像作为训练图像,将训练图像的尺寸大小随机裁剪为32×32大小作为训练集,其中,训练图像包括普通图像和高光谱图像;
步骤S2:将训练集输入到预先搭建的压缩网络模型中,对压缩网络模型进行训练,获得训练后的压缩网络模型,其中,训练后的压缩网络模型包括编码网络、量化网络和解码网络;
步骤S3:将待压缩图像输入训练后的压缩网络模型,通过编码网络提取待压缩图像的特征后得到编码后的特征图,通过量化网络对编码后的特征图进行量化计算,得到量化结果,将其作为压缩后的图像,且通过解码网络对量化结果的解码计算对压缩后的图像进行恢复;
其中,编码网络包括输入层input、卷积层Conv2D、激活层PRelu、残差单元ResUnit、归一化层BatchNorm,步骤S3中通过编码网络提取待压缩图像的特征后得到编码后的特征图,包括:
将待压缩的图像输入input层后,通过步长为2的Conv2D层将待压缩图像的尺寸变为原来的二分之一,得到第一特征图,然后进入PRelu层和ResUnit;
第一特征图再次经过一个步长为2的Conv2D层,得到第二特征图,第二特征图的尺寸变为第一特征图的二分之一,再经过BatchNorm层和PRelu层;以此类推,经过三个Conv2D层之后,得到第三特征图的尺寸为待压缩图像的八分之一,最后通过一个Conv2D层调整特征图的数量,将第三特征图作为编码后的特征图;
量化网络包括一个卷积层、一个激活层Tanh和一个量化层,步骤S3中通过量化网络对编码后的特征图进行量化计算,得到量化结果,具体包括:
将编码后的特征图输入到量化网络的卷积层,调整特征图的输出数量,然后进入Tanh层,将特征图元素值数据映射到(-1,1)的区间内,然后进入量化层进行量化计算,将小于或等于0的数据变为-1,把大于0的数据变为1,得到量化结果;
解码网络包括上分支和下分支,步骤S3中解码网络对量化结果的解码计算对压缩后的图像进行恢复,具体包括:
通过上分支对量化结果进行解码计算,得到第一解码结果;
通过下分支对量化结果进行解码计算,得到第二解码结果;
将第一解码结果和第二解码结果相加,得到恢复图像。
2.如权利要求1所述的方法,其特征在于,步骤S2中训练过程采用的损失函数为:
Figure FDA0003086180830000021
其中,N表示图像中像素点的个数,X为原始图像的像素点数值,Y为恢复图像的像素点数值。
3.如权利要求1所述的方法,其特征在于,量化计算的量化公式为:
Figure FDA0003086180830000022
其中,X表示图像特征图元素的值,Q(X)为量化后的结果。
4.一种基于深度学习的高光谱图像压缩装置,其特征在于,包括:
预处理模块,用于选取预设数量的图像作为训练图像,将训练图像的尺寸大小随机裁剪为32×32大小作为训练集,其中,训练图像包括普通图像和高光谱图像;
模型训练模块,用于将训练集输入到预先搭建的压缩网络模型中,对压缩网络模型进行训练,获得训练后的压缩网络模型,其中,训练后的压缩网络模型包括编码网络、量化网络和解码网络;
图像压缩模块,用于将待压缩图像输入训练后的压缩网络模型,通过编码网络提取待压缩图像的特征后得到编码后的特征图,通过量化网络对编码后的特征图进行量化计算,得到量化结果,将其作为压缩后的图像,且通过解码网络对量化结果的解码计算对压缩后的图像进行恢复;
其中,编码网络包括输入层input、卷积层Conv2D、激活层PRelu、残差单元ResUnit、归一化层BatchNorm,通过编码网络提取待压缩图像的特征后得到编码后的特征图,包括:
将待压缩的图像输入input层后,通过步长为2的Conv2D层将待压缩图像的尺寸变为原来的二分之一,得到第一特征图,然后进入PRelu层和ResUnit;
第一特征图再次经过一个步长为2的Conv2D层,得到第二特征图,第二特征图的尺寸变为第一特征图的二分之一,再经过BatchNorm层和PRelu层;以此类推,经过三个Conv2D层之后,得到第三特征图的尺寸为待压缩图像的八分之一,最后通过一个Conv2D层调整特征图的数量,将第三特征图作为编码后的特征图;
量化网络包括一个卷积层、一个激活层Tanh和一个量化层,通过量化网络对编码后的特征图进行量化计算,得到量化结果,具体包括:
将编码后的特征图输入到量化网络的卷积层,调整特征图的输出数量,然后进入Tanh层,将特征图元素值数据映射到(-1,1)的区间内,然后进入量化层进行量化计算,将小于或等于0的数据变为-1,把大于0的数据变为1,得到量化结果;
解码网络包括上分支和下分支,解码网络对量化结果的解码计算对压缩后的图像进行恢复,具体包括:
通过上分支对量化结果进行解码计算,得到第一解码结果;
通过下分支对量化结果进行解码计算,得到第二解码结果;
将第一解码结果和第二解码结果相加,得到恢复图像。
CN201910512008.9A 2019-06-13 2019-06-13 一种基于深度学习的高光谱图像压缩方法及装置 Expired - Fee Related CN110348487B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910512008.9A CN110348487B (zh) 2019-06-13 2019-06-13 一种基于深度学习的高光谱图像压缩方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910512008.9A CN110348487B (zh) 2019-06-13 2019-06-13 一种基于深度学习的高光谱图像压缩方法及装置

Publications (2)

Publication Number Publication Date
CN110348487A CN110348487A (zh) 2019-10-18
CN110348487B true CN110348487B (zh) 2021-07-20

Family

ID=68181953

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910512008.9A Expired - Fee Related CN110348487B (zh) 2019-06-13 2019-06-13 一种基于深度学习的高光谱图像压缩方法及装置

Country Status (1)

Country Link
CN (1) CN110348487B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110796251A (zh) * 2019-10-28 2020-02-14 天津大学 基于卷积神经网络的图像压缩优化方法
CN110880194A (zh) * 2019-12-03 2020-03-13 山东浪潮人工智能研究院有限公司 一种基于卷积神经网络的图像压缩方法
CN112950729A (zh) * 2019-12-10 2021-06-11 山东浪潮人工智能研究院有限公司 一种基于自编码器和熵编码的图像压缩方法
CN111031312B (zh) * 2019-12-16 2022-02-25 山东浪潮科学研究院有限公司 基于网络实现注意力机制的图像压缩方法
CN111080729B (zh) * 2019-12-24 2023-06-13 山东浪潮科学研究院有限公司 基于Attention机制的训练图片压缩网络的构建方法及系统
CN113256744B (zh) * 2020-02-10 2023-03-24 武汉Tcl集团工业研究院有限公司 一种图像编码、解码方法及系统
CN111340901B (zh) * 2020-02-19 2023-08-11 国网浙江省电力有限公司 基于生成式对抗网络的复杂环境下输电网图片的压缩方法
CN111401373B (zh) * 2020-03-04 2022-02-15 武汉大学 基于分组非对称卷积的高效语义分割方法
CN111538707A (zh) * 2020-04-29 2020-08-14 济南浪潮高新科技投资发展有限公司 一种用于区块链存储的商品指纹特征压缩的方法
CN112767503B (zh) * 2021-01-15 2022-08-12 北京航空航天大学 一种基于jpeg压缩编码的数字病理全切片图像快速分析方法
CN113393543B (zh) * 2021-06-15 2022-07-01 武汉大学 高光谱图像压缩方法、装置、设备及可读存储介质
CN113706641B (zh) * 2021-08-11 2023-08-15 武汉大学 一种基于空间和光谱内容重要性的高光谱图像压缩方法
CN114245126B (zh) * 2021-11-26 2022-10-14 电子科技大学 一种纹理协同的深度特征图压缩方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105163121A (zh) * 2015-08-24 2015-12-16 西安电子科技大学 基于深度自编码网络的大压缩比卫星遥感图像压缩方法
CN106997581A (zh) * 2017-03-01 2017-08-01 杭州电子科技大学 一种利用深度学习重建高光谱图像的方法
CN108960333A (zh) * 2018-07-12 2018-12-07 西安电子科技大学 基于深度学习的高光谱图像无损压缩方法
CN109495744A (zh) * 2018-10-29 2019-03-19 西安电子科技大学 基于联合生成对抗网络的大倍率遥感影像压缩方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101883274B (zh) * 2009-05-08 2013-05-22 中国科学院沈阳自动化研究所 一种空谱联合预测的高光谱图像无损压缩方法
CN103179397A (zh) * 2013-03-04 2013-06-26 中国科学院长春光学精密机械与物理研究所 一种高光谱图像压缩与重构装置及方法
US11645835B2 (en) * 2017-08-30 2023-05-09 Board Of Regents, The University Of Texas System Hypercomplex deep learning methods, architectures, and apparatus for multimodal small, medium, and large-scale data representation, analysis, and applications
CN109285132B (zh) * 2018-09-20 2022-05-17 南京大学 一种基于频域编码的光谱重建方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105163121A (zh) * 2015-08-24 2015-12-16 西安电子科技大学 基于深度自编码网络的大压缩比卫星遥感图像压缩方法
CN106997581A (zh) * 2017-03-01 2017-08-01 杭州电子科技大学 一种利用深度学习重建高光谱图像的方法
CN108960333A (zh) * 2018-07-12 2018-12-07 西安电子科技大学 基于深度学习的高光谱图像无损压缩方法
CN109495744A (zh) * 2018-10-29 2019-03-19 西安电子科技大学 基于联合生成对抗网络的大倍率遥感影像压缩方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
"Class probability propagation of supervised information based on sparse subspace clustering for hyperspectral images";Qing Yan等;《Remote Sensing》;20170930;第9卷(第10期);第1-18页 *
"Compression of hyperspectral remote sensing images by tensor approach";Lefei Zhang等;《Neurocomputing》;20150105;第147卷;第358-363页 *
"Hyperspectral Image Compression and Reconstruction Based on Block-Sparse Dictionary Learning";Yanwen Chong等;《Journal of the Indian Society of Remote Sensing》;20180731;第46卷(第7期);第1171-1186页 *
"基于块稀疏表达模式的高光谱图像压缩";种衍文等;《华中科技大学学报(自然科学版)》;20171231;第45卷(第12期);第60-65、72页 *
"基于解析字典的图像压缩方法";冯宗伟等;《武汉大学学报·信息科学版》;20180228;第43卷(第2期);第262-267、274页 *

Also Published As

Publication number Publication date
CN110348487A (zh) 2019-10-18

Similar Documents

Publication Publication Date Title
CN110348487B (zh) 一种基于深度学习的高光谱图像压缩方法及装置
CN112801901A (zh) 基于分块多尺度卷积神经网络的图像去模糊算法
CN110349087B (zh) 基于适应性卷积的rgb-d图像高质量网格生成方法
CN111340901B (zh) 基于生成式对抗网络的复杂环境下输电网图片的压缩方法
CN111683250A (zh) 一种基于深度学习的生成式遥感图像压缩方法
CN116051549B (zh) 一种太阳能电池片缺陷分割方法、系统、介质及设备
CN113554058A (zh) 视觉目标图像分辨率增强的方法、系统、装置及存储介质
CN115131675A (zh) 一种基于参考影像纹理迁移的遥感影像压缩方法及系统
CN112258436A (zh) 图像处理模型的训练方法、装置、图像处理方法及模型
CN112150400A (zh) 图像增强方法、装置和电子设备
CN109672885B (zh) 一种用于矿井智能监控的视频图像编解码方法
CN115631107A (zh) 边缘引导的单幅图像噪声去除
CN112132158A (zh) 一种基于自编码网络的可视化图片信息嵌入方法
CN114638768A (zh) 一种基于动态关联学习网络的图像去雨方法、系统及设备
CN113962882A (zh) 一种基于可控金字塔小波网络的jpeg图像压缩伪影消除方法
CN113379606A (zh) 一种基于预训练生成模型的人脸超分辨方法
CN111882512A (zh) 基于深度学习的图像融合方法、装置、设备和存储介质
Zeng et al. U-net-based multispectral image generation from an rgb image
CN116095321A (zh) 显著性区域图像编解码方法、系统、设备及存储介质
CN115187775A (zh) 一种遥感图像语义分割方法及装置
CN115294222A (zh) 图像编码方法及图像处理方法、终端及介质
CN115239563A (zh) 一种基于神经网络的点云属性有损压缩装置及方法
CN114219738A (zh) 单幅图像多尺度超分辨重建网络结构及方法
CN113256603A (zh) 一种双流网络二次融合的显著性物体检测方法
CN113554719A (zh) 一种图像编码方法、解码方法、存储介质及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210720

CF01 Termination of patent right due to non-payment of annual fee