CN112149712A - 一种高效的高光谱遥感数据压缩与分类模型的构建方法 - Google Patents

一种高效的高光谱遥感数据压缩与分类模型的构建方法 Download PDF

Info

Publication number
CN112149712A
CN112149712A CN202010837881.8A CN202010837881A CN112149712A CN 112149712 A CN112149712 A CN 112149712A CN 202010837881 A CN202010837881 A CN 202010837881A CN 112149712 A CN112149712 A CN 112149712A
Authority
CN
China
Prior art keywords
cae
classification
compression
hyperspectral
remote sensing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010837881.8A
Other languages
English (en)
Other versions
CN112149712B (zh
Inventor
蒋伟
陈分雄
许祎晗
廖森辉
韩荣
王杰
熊鹏涛
叶佳慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Geosciences
Original Assignee
China University of Geosciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Geosciences filed Critical China University of Geosciences
Priority to CN202010837881.8A priority Critical patent/CN112149712B/zh
Publication of CN112149712A publication Critical patent/CN112149712A/zh
Application granted granted Critical
Publication of CN112149712B publication Critical patent/CN112149712B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture

Abstract

本发明提供一种高效的高光谱遥感数据压缩与分类模型,具体步骤:对原始高光谱数据进行预处理,并将其分割成单个的高光谱像素;将全卷积自动编码器网络的编码部分的输出设计为二值输出,得到具有高效光谱压缩的自动编码器CAE,将CAE与逻辑回归LR分类器结合设计出具有高效光谱压缩与快速分类的联合深度学习网络CAE_LR,将CAE_LR与JPEG2000结合设计出具有光谱和空间全维度压缩与分类的方法CAE_LR+JP2;将训练完成的CAE_LR与JPEG2000结合进行率失真优化,实现CAE_LR+JP2在各个比特率下的最佳率失真性能;本发明设计的CAE_LR+JP2模型有效地提升了星载高光谱传感器与地面接收站之间的高光谱数据的压缩和分类的精度及速度。

Description

一种高效的高光谱遥感数据压缩与分类模型的构建方法
技术领域
本发明涉及航天技术与人工智能技术领域,尤其涉及一种高效的高光谱遥感数据压缩与分类模型的构建方法。
背景技术
高光谱遥感是用很窄而连续的光谱通道对地物持续遥感成像的技术。在可见光到短波红外波段其光谱分辨率高达纳米数量级,通常具有波段多的特点,光谱通道数多达数十甚至数百个以上,而且各光谱通道间往往是连续的。高光谱数据逐渐成为监视地球表面的有价值的工具,并且在各种各样的应用场景中使用,包括农业,矿物学,监测,物理学,天文学和环境科学等。2019年3月正式投入使用的高分五号是中国国内光谱分辨率最高的遥感卫星,也是国际上首次实现对大气和陆地进行综合观测的全谱段高光谱卫星,可实现多种观测数据融合应用,为中国环境监测、资源勘查、防灾减灾等行业提供高质量、高可靠的高光谱数据,在中国高光谱分辨率遥感卫星应用方面具有示范作用,在掌握高光谱遥感信息资源自主权、满足国家需求等方面具有重大战略意义。
现有的一些高光谱数据有损压缩算法在降低存储设备成本和带宽方面起着重要作用,并且解压缩后的数据在诸如HS图像分类等应用中具有良好的性能,但数据的解压缩和特征再提取需要耗费大量的时间,导致分类的实时性受到影响。由于现有的高光谱数据有损压缩算法几乎没有考虑应用场景如分类的实时性,因此,寻找一种高效方法实现高光谱数据的实时压缩与分类是很有必要的。
受深度学习方法在许多应用中成功的启发,研究人员开始在遥感应用中使用深度神经网络,并于2014年首次开始将深度学习应用于高光谱图像的特征提取与分类,并取得了比传统方法更好的效果。CAE是一种深度学习模型,基于卷积神经网络(CNN)和栈式自编码器(SAE)。CAE采用局部连接(Local Connection)、权值共享(WeightSharing)卷积层、池化操作等替换SAE全连接层,极大缩减了网络参数。由于CAE具有的这些优点,本发明使用改进的CAE来对高光谱数据的光谱维度进行特征提取和分类。
发明内容
有鉴于此,本发明提供一种高效的高光谱遥感数据压缩与分类模型的构建方法。
一种高效的高光谱遥感数据压缩与分类模型的构建方法,包括以下步骤:
S1:使用星载高光谱传感器采集地面高光谱遥感数据;
S2:对S1采集的高光谱遥感数据进行预处理,将预处理之后的高光谱遥感数据进行均值归一化处理,并将归一化后的数据集分割成单个的高光谱像素,从中随机采样得到训练数据集;
S3:将全卷积自动编码器网络的编码部分的输出设计为二值输出,得到具有高效光谱压缩的自动编码器CAE;
S4:将S3中的CAE与基于卷积神经网络的逻辑回归分类器CNN_LR结合构建高效光谱压缩与快速分类的联合深度学习网络CAE_LR;
S5:使用训练数据集对S4构建的CAE_LR进行训练,得到CAE_LR模型的参数,并将训练完成的不同结构的CAE_LR与JPEG2000结合进行率失真优化,构建具有光谱和空间全维度压缩与分类结构CAE_LR+JP2。
进一步地,S1中使用的高光谱遥感数据由AVIRIS高光谱传感器在美国Indiana州西北部的IndianPines测试场收集,称为IndianPines。
进一步地,步骤S2将S1中高光谱遥感数据集的频谱中吸水带的频段和部分低信噪比频段剔除,然后对高光谱遥感数据集进行均值归一化处理,最后将数据集分割成单个的高光谱像素,从中随机采样得到训练集。
进一步地,S3的具体步骤为:
(1)将传统的卷积自动编码器的池化层和反池化层去除,改用卷积和转置卷积实现上采样和下采样,成为一个全卷积自编码器;
(2)将全卷积自编码器的编码输出层的激活函数替换为tanh,将输出归一化至[-1,1]区间;
(3)使用伯努利分布对输出进行二值化处理得到具有高效光谱压缩的自动编码器CAE。
进一步地,自动编码器CAE的代价函数计算公式如下:
Figure BDA0002640360700000031
其中,recon_loss表示重构损失函数,m为采取批处理训练mini-batch的尺寸,xij表示一个mini-batch中的第i个输入高光谱像素xi∈Rn的第j个元素,
Figure BDA0002640360700000032
表示一个mini-batch中的第i个重构高光谱像素
Figure BDA0002640360700000033
的第j个元素,n为向量xi
Figure BDA0002640360700000034
的长度。
进一步地,在S4中,将基于卷积神经网络的逻辑回归分类器CNN_LR与CAE进行组合形成CAE_LR,并将其作为一个整体进行训练,同时优化重构误差与分类误差,得到的CAE_LR模型同时具备压缩与快速分类的能力。
进一步地,CNN_LR的代价函数如下:
Figure BDA0002640360700000041
其中,class_loss为分类损失函数,m采取批处理训练mini-batch的尺寸,yij表示一个mini-batch中的第i个输入矢量xi的真实类别标签yi∈Rk的第j个元素,
Figure BDA0002640360700000042
表示表示一个mini-batch中的第i个重构矢量
Figure BDA0002640360700000043
的预测类别标签
Figure BDA0002640360700000044
的第j个元素,k为向量yi
Figure BDA0002640360700000045
的长度;
CAE_LR的代价函数为:
total_loss=recon_loss+α*class_loss
其中,recon_loss为重构损失函数,class_loss为分类损失函数,total_loss为CAE_LR的总体损失函数,α为平衡因子,调节重构损失函数与分类损失函数在总损失函数的权重。
进一步地,使用IndianPines对所述CAE_LR进行训练,使用ADAM优化算法对CAE_LR模型训练时的学习率进行更新,使用BP算法对模型权重参数进行微调。
进一步地,在S5中,将多个输出神经元数量不同的CAE_LR进行训练,得到实现不同压缩倍数的CAE_LR模型,倍数范围为16倍~320倍,然后将不同压缩倍数下的CAE_LR模型与JPEG2000结合进行率失真优化,均衡重构误差与分类误差,实现CAE_LR+JP2在比特率范围0.05bpppb~1.0bpppb下的总体分类精度接近或超过未压缩数据的分类精度v,重构数据的峰值信噪比在43dB以上,根据实际压缩倍数的需求选择相应压缩倍数的CAE_LR+JP2模型。
本发明提供的技术方案带来的有益效果是:(1)在高倍率(最高可达320倍)下压缩时的分类精度仍然能保证接近未压缩数据的分类精度;(2)不需要重构压缩数据即可进行分类,可以有效提升分类速度;(3)本发明中使用的神经网络可以使用GPU加速,有效地提升了星载(机载)高光谱传感器与地面接收站之间的高光谱数据的压缩与重构和分类的速度。
附图说明
图1是本发明一种高效的高光谱遥感数据压缩与分类模型的构建方法的流程图;
图2是本发明一种高效的高光谱遥感数据压缩与分类模型的构建方法中CAE的结构图;
图3是本发明一种高效的高光谱遥感数据压缩与分类模型的构建方法中CNN_LR的结构图;
图4是本发明一种高效的高光谱遥感数据压缩与分类模型的构建方法中CAE_LR的结构图;
图5是本发明一种高效的高光谱遥感数据压缩与分类模型的构建方法中CAE_LR+JP2的结构图;
图6是本发明一种高效的高光谱遥感数据压缩与分类模型的构建方法中重构图像结果图;
图7是本发明一种高效的高光谱遥感数据压缩与分类模型的构建方法中CAE输出压缩神经元数量与图像重构质量的关系图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地描述。
请参考图1,本发明提供的一种高效的高光谱遥感数据压缩与分类模型的构建方法,具体步骤如下:
S1:使用星载高光谱传感器采集地面高光谱遥感数据,使用的高光谱遥感数据由AVIRIS高光谱传感器在美国Indiana州西北部的IndianPines测试场收集,包含224个频段,称为IndianPines。
S2:对S1采集的高光谱遥感数据进行预处理,将IndianPines数据集的频谱中吸水带的频段和部分低信噪比频段剔除,剔除的频段序号为104~108,150~163以及220,变成200个频段;因为吸水带和低信噪比频段的信号较微弱,且对于光谱的分类影响不大,裁剪部分频段可以减少计算量,以及200个频段相比224个频段更适合CAE重构阶段的上采样;然后对频段剔除后的高光谱数据进行均值归一化处理,最后将数据集分割成单个的高光谱像素,从中随机采样得到训练集和测试集。
S3:将全卷积自动编码器网络的编码部分的输出设计为二值输出,得到具有高效光谱压缩的自动编码器CAE,CAE是一种基于卷积神经网络(CNN)和栈式自编码器(SAE)的变种结构;标准的CNN包含卷积层、激活层和池化层,对于压缩任务而言,本实施例需要保留光谱的精确的轮廓信息,但池化会破坏轮廓信息以及降低光谱分辨率;因此,本实施例的CAE不使用池化,而是在编码端采用全卷积层实现光谱矢量下采样降维,相应地在解码端使用转置卷积进行上采样重构光谱矢量。
压缩光谱信息的CAE结构如图2所示,CAE编码器的输入为单个高光谱像素矢量,经过多个卷积层下采样和非线性激活等操作提取特征,再经过一个全连接层输出压缩表示,编码器压缩的特征作为解码器的输入,解码器经过一个全连接层和多个反卷积上采样以及非线性激活等操作,重构高光谱像素矢量。
本实施例采用均方根误差作为CAE的代价函数,网络的训练采用BP算法和批处理更新策略,代价函数计算公式如下式所示:
Figure BDA0002640360700000071
其中,recon_loss表示重构损失函数,m为采取批处理训练mini-batch的尺寸,xij表示一个mini-batch中的第i个输入高光谱像素xi∈Rn的第j个元素,
Figure BDA0002640360700000072
表示一个mini-batch中的第i个重构高光谱像素
Figure BDA0002640360700000073
的第j个元素,n为向量xi
Figure BDA0002640360700000074
的长度。
CAE网络的内部参数如表1所示:
表1 CAE网络结构参数
Figure BDA0002640360700000075
其中,In表示网络的输入层,Conv和Deconv表示卷积层和转置卷积层。FC表示全连接层;Fold和unfold表示全连接层与卷积层或转置卷积层之间的展开层和折叠层;Bin表示二值化层,M表示自编码器的编码输出神经元数量;k表示预测标签
Figure BDA0002640360700000087
的维度;本实施例在所有全连接层后面都使用dropout来防止过拟合,使用tanh激活函数来进行二值化前的归一化。
S4:将基于卷积神经网络的逻辑回归分类器CNN_LR与CAE进行组合形成CAE_LR,并将其作为一个整体进行训练,同时优化重构误差与分类误差,使得到的逻辑回归模型同时具备压缩与快速分类的能力。
如图3所示,是一个基于卷积神经网络的逻辑回归分类器,简称CNN_LR,分为特征提取部分和逻辑回归部分,特征提取部分使用卷积网络,逻辑回归部分使用全连接网络。
对于CNN_LR网络的训练,采取了批处理更新策略,CNN_LR网络的代价函数如下式所示。
Figure BDA0002640360700000081
其中,class_loss为分类损失函数,m采取批处理训练mini-batch的尺寸,yij表示一个mini-batch中的第i个输入矢量xi的真实类别标签yi∈Rk的第j个元素,
Figure BDA0002640360700000082
表示表示一个mini-batch中的第i个重构矢量
Figure BDA0002640360700000083
的预测类别标签
Figure BDA0002640360700000084
的第j个元素,k为向量yi
Figure BDA0002640360700000085
的长度;
CNN_LR网络的内部参数如表2所示:
表2 CNN_LR网络结构参数
Figure BDA0002640360700000086
Figure BDA0002640360700000091
其中,softmax激活函数用于分类。
为了可以直接利用CAE网络抽取的压缩表示特征来进行图像分类,本实施例将CAE与CNN_LR分类器进行联合训练,称这种结构为CAE_LR,如图4所示,CAE_LR的代价函数如下式所示:
total_loss=recon_loss+α*class_loss (3)
其中,recon_loss为重构损失函数,class_loss为分类损失函数,total_loss为CAE_LR的总体损失函数,α为平衡因子,调节重构损失函数与分类损失函数在总损失函数的权重。
如图4所示,CAE_LR分为编码器、解码器和逻辑回归部分;编码器从原始向量x中得到压缩表示z,分类器直接从中得到预测标签
Figure BDA0002640360700000093
同时解码器可以利用z重构
Figure BDA0002640360700000094
CAE_LR网络的内部参数如表3所示:
表3 CAE_LR网络结构参数
Figure BDA0002640360700000092
其中,表1中CAE的二值化层的输出为表3的输入。
CAE对光谱的压缩完成后,使用JPEG2000算法对形成的二值图像进行压缩,进行空间去冗余以及熵编码等步骤,对于JPEG2000的单张图片比特率的分配方式,本实施例采用BIRA(band-independent rate allocation)算法,即更重要的分量使用更高的比特率,图像分量的方差决定图像分量重要性,方差越大意味着分量越重要,比特率分配公式如下式所示。
Figure BDA0002640360700000101
其中,Ri表示第i个频段的比特率,R表示总体比特率,N频段数量,σi表示第i个频段的图像的方差,σj表示第j个频段的图像的方差。
S5:在S5中,将多个输出神经元数量不同的CAE_LR进行训练,得到实现不同压缩倍数的CAE_LR模型,倍数范围为16倍~320倍,然后将不同压缩倍数下的CAE_LR模型与JPEG2000结合进行率失真优化,均衡重构误差与分类误差,得到不同压缩倍数下的优化后的CAE_LR+JP2模型,实现CAE_LR+JP2在比特率范围0.05bpppb~1.0bpppb下的总体分类精度接近或超过未压缩数据的分类精度v,v=84.92%,重构数据的峰值信噪比在43dB以上,根据实际压缩倍数的需求选择相应压缩倍数的CAE_LR+JP2模型;相比未优化的CAE_LR,在不同压缩倍数下CAE_LR+JP2的分类精度最高提升了约6%,峰值信噪比最高提升了约3dB,CAE_LR+JP2结构如图5所示。
该结构用于整个高光谱图像的测试;包括编码部分和解码部分,编码部分如下:
(1)从高光谱图像I中得到单个的高光谱像素矢量x,都使用编码器和二值化器得到一个降维和二值化的矢量z(B)
(2)将所有的z(B)按照其在I中对应的位置重新组合成二值化多光谱图I(B)
(3)经过比特率分配后利用JPEG2000算法实现二值化多光谱图I(B)的压缩得到比特流。
解码部分如下:
(1)利用JPEG2000算法从比特流中恢复二值图像
Figure BDA0002640360700000111
然后从中得到单个的二值化矢量
Figure BDA0002640360700000112
(2)对于每个二值化矢量
Figure BDA0002640360700000113
都利用解码器得到重构高光谱像素矢量
Figure BDA0002640360700000114
或者利用CAE_LR的分类器进行快速分类得到
Figure BDA0002640360700000115
(3)最后将所有的
Figure BDA0002640360700000116
按照其在
Figure BDA0002640360700000117
中对应的位置重新组合得到重构高光谱图
Figure BDA0002640360700000118
接下来将通过三个实验来展示本发明的压缩、重构和分类的性能。
实验1:CAE与CAE_LR网络训练后对测试样本的重构结果
实验1的目的是对比单独学习光谱压缩效果和光谱压缩与分类联合学习效果。CAE和CAE_LR训练选用优化器ADAM,初始学习率lr设置为1e-3,式(1)、(2)、(3)中的m设置为300,训练轮数epoches设置为3000,CAE_LR的代价函数中的α=0.1,表1和2中的dropout1设置为0.5,dropout2设置为0.5,为了比较各个压缩比特率{0.05bpppb,0.1bpppb,0.2bpppb,0.3bpppb,0.4bpppb,0.5bpppb,0.6bpppb,0.7bpppb,0.8bpppb,0.9bpppb,1.0bpppb}下CAE和CAE_LR网络的性能,设置表1中自编码器的编码输出神经元数量M的值为{10,20,40,60,80,100,120,140,160,180,200},各训练了11个CAE和CAE_LR网络。在测试集上进行测试,得到图6。
图6给出了IndianPines数据集上的一张图像,在CAE和CAE_LR在M=10(0.05bpppb),M=200(1.0bpppb)下的重构图;(a)为原图(bpppb=16),(b)为CAE,M=10(0.05bpppb),(c)为CAE_LR,M=10(0.05bpppb),(d)为CAE,M=200(1.0bpppb),(e)CAE_LR,M=200(1.0bpppb);观察到,在M=10(0.05bppb)时,重构光谱(图像)与原始光谱(图像)存在比较明显的误差,而在M=200(1.0bpppb)时,几乎看不到明显误差。
图7给出了CAE和CAE_LR的M对MPSNR的影响,观察到,CAE_LR的图像重构质量MPSNR普遍低于CAE,但是在M较小,小于20时,CAE_LR的图像重构质量MPSNR高于CAE,另外,CAE_LR与CAE的峰值信噪比MPSNR差值始终在1dB内。实验一表明,将LR与CAE联合训练,在适当的α平衡因子下,只会对自编码器的重构精度造成有限的负面影响。
实验2:测试CAE_LR+JP2模型的重构与分类效果并与CNN_LR,CAE+LR,CAE_LR等模型进行对比;
CAE+LR与CAE_LR结构相似,但CAE与LR单独训练,CNN_LR结构的分类器直接对原始数据进行特征提取和分类,得到的分类结果作为CAE+LR,CAE_LR和CAE_LR+JP2的参考,结果如表4所示;
表4 CAE+LR,CAE_LR和CAE_LR+JP2在各个比特率下的重构与分类表现
Figure BDA0002640360700000121
表4给出了在0.05bpppb到1.0bpppb范围内的各种比特率下使用CAE+L R,CAE_LR与CAE_LR+JP2的分类精度与MPSNR,观察到在所有的比特率下,CAE+LR分类精度远远低于原始数据,而CAE_LR的分类精度接近原始数据。表明单独训练CAE的压缩特征与分类特征并不完全相容。CAE_LR+J PEG2000相比CAE_LR,在各个比特率下,不论是在图像重构质量还是分类精度上均获得了提升,并且在部分比特率下超越原始数据分类精度,表明光谱-空间联合压缩的重构和分类效果要好于光谱单独压缩与分类。观察到,表4中,CAE_LR+JP2的分类精度随着比特率的增加而单调减少,且分类精度越来越接近CAE_LR,表明CAE_LR+JP2方法在低比特率下压缩更具有优势。
实验3:测试CAE_LR与CAE_LR+JP2模型的压缩重构时间与分类时间并分析其实时性能;
其中CAE_LR只有光谱压缩时间没有空间压缩时间,所以在分类前不需要空间解压缩。而CAE_LR有光谱压缩时间和空间压缩时间,所以和分类时间还需要加上空间解压缩时间,结果如表5所示。
表5 CAE_LR和CAE_LR+JP2在各个比特率下的压缩重构时间与分类时间
Figure BDA0002640360700000131
表5显示CAE_LR和CAE_LR+JP2在各个比特率下对高光谱图像的光谱压缩时间均在25ms内,解压缩时间在15ms内,而CAE_LR+JP2在各个比特率下对高光谱图像的空间压缩时间在5ms内,解压缩时间在2ms内,表明CAE_LR和CAE_LR+JP2对高光谱图像的压缩和解压缩解压缩具有良好的实时性能。CAE_LR和CAE_LR+JP2的分类器在各个比特率下对高光谱图像的分类时间均在1ms内,其中CAE_LR+JP2的总分类时间还需要加上空间解压缩的5ms。表明CAE_LR和CAE_LR+JP2对高光谱图像的分类具有良好的实时性能。另外,表4和表5表明,相比CAE_LR,CAE_LR+JP2在提升了重构精度和分类精度的代价是增加了一定的压缩与解压缩时间,但增加的时间在5ms内,仍然具有很好的实时性。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (9)

1.一种高效的高光谱遥感数据压缩与分类模型的构建方法,其特征在于,包括以下步骤:
S1:使用星载高光谱传感器采集地面高光谱遥感数据;
S2:对S1采集的高光谱遥感数据进行预处理,将预处理之后的高光谱遥感数据进行均值归一化处理,并将归一化后的数据集分割成单个的高光谱像素,从中随机采样得到训练数据集;
S3:将全卷积自动编码器网络的编码部分的输出设计为二值输出,得到具有高效光谱压缩的自动编码器CAE;
S4:将S3中的CAE与基于卷积神经网络的逻辑回归分类器CNN_LR结合构建高效光谱压缩与快速分类的联合深度学习网络CAE_LR;
S5:使用训练数据集对S4构建的CAE_LR进行训练,得到CAE_LR模型的参数,并将训练完成的不同结构的CAE_LR与JPEG2000结合进行率失真优化,构建具有光谱和空间全维度压缩与分类结构CAE_LR+JP2。
2.根据权利要求1所述的一种高效的高光谱遥感数据压缩与分类模型的构建方法,其特征在于,S1中使用的高光谱遥感数据由AVIRIS高光谱传感器在美国Indiana州西北部的IndianPines测试场收集,称为Indian Pines。
3.根据权利要求1所述的一种高效的高光谱遥感数据压缩与分类模型的构建方法,其特征在于,步骤S2将S1中高光谱遥感数据集的频谱中吸水带的频段和部分低信噪比频段剔除,然后对高光谱遥感数据集进行均值归一化处理,最后将数据集分割成单个的高光谱像素,从中随机采样得到训练集。
4.根据权利要求1所述的一种高效的高光谱遥感数据压缩与分类模型的构建方法,其特征在于,S3的具体步骤为:
(1)将传统的卷积自动编码器的池化层和反池化层去除,改用卷积和转置卷积实现上采样和下采样,成为一个全卷积自编码器;
(2)将全卷积自编码器的编码输出层的激活函数替换为tanh,将输出归一化至[-1,1]区间;
(3)使用伯努利分布对输出进行二值化处理得到具有高效光谱压缩的自动编码器CAE。
5.根据权利要求4所述的一种高效的高光谱遥感数据压缩与分类模型的构建方法,其特征在于,自动编码器CAE的代价函数计算公式如下:
Figure FDA0002640360690000021
其中,recon_loss表示重构损失函数,m为采取批处理训练mini-batch的尺寸,xij表示一个mini-batch中的第i个输入高光谱像素xi∈Rn的第j个元素,
Figure FDA0002640360690000022
表示一个mini-batch中的第i个重构高光谱像素
Figure FDA0002640360690000023
的第j个元素,n为向量xi
Figure FDA0002640360690000024
的长度。
6.根据权利要求1所述的一种高效的高光谱遥感数据压缩与分类模型的构建方法,其特征在于,在S4中,将基于卷积神经网络的逻辑回归分类器CNN_LR与CAE进行组合形成CAE_LR,并将其作为一个整体进行训练,同时优化重构误差与分类误差,得到的CAE_LR模型同时具备压缩与快速分类的能力。
7.根据权利要求6所述的一种高效的高光谱遥感数据压缩与分类模型的构建方法,其特征在于,CNN_LR的代价函数如下:
Figure FDA0002640360690000025
其中,class_loss为分类损失函数,m采取批处理训练mini-batch的尺寸,yij表示一个mini-batch中的第i个输入矢量xi的真实类别标签yi∈Rk的第j个元素,
Figure FDA0002640360690000031
表示表示一个mini-batch中的第i个重构矢量
Figure FDA0002640360690000032
的预测类别标签
Figure FDA0002640360690000033
的第j个元素,k为向量yi
Figure FDA0002640360690000034
的长度;
CAE_LR的代价函数为:
total_loss=recon_loss+α*class_loss
其中,recon_loss为重构损失函数,class_loss为分类损失函数,total_loss为CAE_LR的总体损失函数,α为平衡因子,调节重构损失函数与分类损失函数在总损失函数的权重。
8.根据权利要求6所述的一种高效的高光谱遥感数据压缩与分类模型的构建方法,其特征在于,使用Indian Pines对所述CAE_LR进行训练,使用ADAM优化算法对CAE_LR模型训练时的学习率进行更新,使用BP算法对模型权重参数进行微调。
9.根据权利要求1所述的一种高效的高光谱遥感数据压缩与分类模型的构建方法,其特征在于,在S5中,将多个输出神经元数量不同的CAE_LR进行训练,得到实现不同压缩倍数的CAE_LR模型,倍数范围为16倍~320倍,然后将不同压缩倍数下的CAE_LR模型与JPEG2000结合进行率失真优化,均衡重构误差与分类误差,实现CAE_LR+JP2在比特率范围0.05bpppb~1.0bpppb下的总体分类精度接近或超过未压缩数据的分类精度v,重构数据的峰值信噪比在43dB以上,根据实际压缩倍数的需求选择相应压缩倍数的CAE_LR+JP2模型。
CN202010837881.8A 2020-08-19 2020-08-19 一种高效的高光谱遥感数据压缩与分类模型的构建方法 Active CN112149712B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010837881.8A CN112149712B (zh) 2020-08-19 2020-08-19 一种高效的高光谱遥感数据压缩与分类模型的构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010837881.8A CN112149712B (zh) 2020-08-19 2020-08-19 一种高效的高光谱遥感数据压缩与分类模型的构建方法

Publications (2)

Publication Number Publication Date
CN112149712A true CN112149712A (zh) 2020-12-29
CN112149712B CN112149712B (zh) 2023-06-06

Family

ID=73888796

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010837881.8A Active CN112149712B (zh) 2020-08-19 2020-08-19 一种高效的高光谱遥感数据压缩与分类模型的构建方法

Country Status (1)

Country Link
CN (1) CN112149712B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113069115A (zh) * 2021-03-09 2021-07-06 清华大学 一种情绪识别方法、电子设备及存储介质
CN113328755A (zh) * 2021-05-11 2021-08-31 内蒙古工业大学 一种面向边缘计算的压缩数据传输方法

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020064313A1 (en) * 2000-11-29 2002-05-30 Xerox Corporation Rate-distortion optimization system and method for image compression
US6539122B1 (en) * 1997-04-04 2003-03-25 General Dynamics Decision Systems, Inc. Adaptive wavelet coding of hyperspectral imagery
US20030059121A1 (en) * 2001-07-23 2003-03-27 Eastman Kodak Company System and method for controlling image compression based on image emphasis
US20090018801A1 (en) * 2007-07-09 2009-01-15 Irina Gladkova Lossless compression algorithm for hyperspectral data
US20090067491A1 (en) * 2007-09-07 2009-03-12 Microsoft Corporation Learning-Based Image Compression
CN107122733A (zh) * 2017-04-25 2017-09-01 西安电子科技大学 基于nsct和sae的高光谱图像分类方法
CN107145836A (zh) * 2017-04-13 2017-09-08 西安电子科技大学 基于栈式边界辨别自编码器的高光谱图像分类方法
CN107590515A (zh) * 2017-09-14 2018-01-16 西安电子科技大学 基于熵率超像素分割的自编码器的高光谱图像分类方法
CN108898156A (zh) * 2018-05-28 2018-11-27 江苏大学 一种基于高光谱图像的绿色青椒识别方法
US20180365822A1 (en) * 2017-06-19 2018-12-20 ImpactVision, Inc. System and method for hyperspectral image processing to identify foreign object
CN109889848A (zh) * 2019-02-22 2019-06-14 山东师范大学 基于卷积自编码器的多描述编码、解码方法及系统
US10381105B1 (en) * 2017-01-24 2019-08-13 Bao Personalized beauty system
CN110321941A (zh) * 2019-06-24 2019-10-11 西北工业大学 可鉴别性特征学习的高光谱图像压缩和分类方法
US20190373293A1 (en) * 2019-08-19 2019-12-05 Intel Corporation Visual quality optimized video compression
CN110555395A (zh) * 2019-08-19 2019-12-10 浙江大学 一种油菜冠层氮素含量等级分类评估方法
CN110852304A (zh) * 2019-11-22 2020-02-28 重庆大学 基于深度学习方法的高光谱数据处理方法

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6539122B1 (en) * 1997-04-04 2003-03-25 General Dynamics Decision Systems, Inc. Adaptive wavelet coding of hyperspectral imagery
US20020064313A1 (en) * 2000-11-29 2002-05-30 Xerox Corporation Rate-distortion optimization system and method for image compression
US20030059121A1 (en) * 2001-07-23 2003-03-27 Eastman Kodak Company System and method for controlling image compression based on image emphasis
US20090018801A1 (en) * 2007-07-09 2009-01-15 Irina Gladkova Lossless compression algorithm for hyperspectral data
US20090067491A1 (en) * 2007-09-07 2009-03-12 Microsoft Corporation Learning-Based Image Compression
US10381105B1 (en) * 2017-01-24 2019-08-13 Bao Personalized beauty system
CN107145836A (zh) * 2017-04-13 2017-09-08 西安电子科技大学 基于栈式边界辨别自编码器的高光谱图像分类方法
CN107122733A (zh) * 2017-04-25 2017-09-01 西安电子科技大学 基于nsct和sae的高光谱图像分类方法
US20180365822A1 (en) * 2017-06-19 2018-12-20 ImpactVision, Inc. System and method for hyperspectral image processing to identify foreign object
CN107590515A (zh) * 2017-09-14 2018-01-16 西安电子科技大学 基于熵率超像素分割的自编码器的高光谱图像分类方法
CN108898156A (zh) * 2018-05-28 2018-11-27 江苏大学 一种基于高光谱图像的绿色青椒识别方法
CN109889848A (zh) * 2019-02-22 2019-06-14 山东师范大学 基于卷积自编码器的多描述编码、解码方法及系统
CN110321941A (zh) * 2019-06-24 2019-10-11 西北工业大学 可鉴别性特征学习的高光谱图像压缩和分类方法
US20190373293A1 (en) * 2019-08-19 2019-12-05 Intel Corporation Visual quality optimized video compression
CN110555395A (zh) * 2019-08-19 2019-12-10 浙江大学 一种油菜冠层氮素含量等级分类评估方法
CN110852304A (zh) * 2019-11-22 2020-02-28 重庆大学 基于深度学习方法的高光谱数据处理方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HAIMENG ZHAO 等: "CAE-ADMM: IMPLICIT BITRATE OPTIMIZATION VIA ADMM-BASED PRUNING IN COMPRESSIVE AUTOENCODERS", 《ARXIV.ORG》 *
JIANLIN LIU 等: "CBN-VAE: A Data Compression Model with E cient Convolutional Structure for Wireless Sensor Networks", 《SENSORS》 *
林瑶瑶 等: "JPEG 2000 和JPEG-LS 的实现及遥感影像压缩失真分析", 《测绘与 空间地理信息》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113069115A (zh) * 2021-03-09 2021-07-06 清华大学 一种情绪识别方法、电子设备及存储介质
CN113328755A (zh) * 2021-05-11 2021-08-31 内蒙古工业大学 一种面向边缘计算的压缩数据传输方法
CN113328755B (zh) * 2021-05-11 2022-09-16 内蒙古工业大学 一种面向边缘计算的压缩数据传输方法

Also Published As

Publication number Publication date
CN112149712B (zh) 2023-06-06

Similar Documents

Publication Publication Date Title
Zhang et al. Image restoration: From sparse and low-rank priors to deep priors [lecture notes]
CN110348487B (zh) 一种基于深度学习的高光谱图像压缩方法及装置
CN111080567A (zh) 基于多尺度动态卷积神经网络的遥感图像融合方法及系统
CN110020693B (zh) 基于特征注意和特征改善网络的极化sar图像分类方法
CN112149712B (zh) 一种高效的高光谱遥感数据压缩与分类模型的构建方法
Dua et al. Convolution neural network based lossy compression of hyperspectral images
CN112149652A (zh) 用于高光谱图像有损压缩的空谱联合深度卷积网络方法
CN114998167B (zh) 一种基于空间-光谱联合低秩的高光谱与多光谱图像融合方法
CN113962882B (zh) 一种基于可控金字塔小波网络的jpeg图像压缩伪影消除方法
Wen et al. DeepCASD: An end-to-end approach for multi-spectral image super-resolution
Feng et al. Sub clustering K-SVD: size variable dictionary learning for sparse representations
Salvador et al. Evolutionary approach to improve wavelet transforms for image compression in embedded systems
Hilles Sofm and vector quantization for image compression by component
CN114511470B (zh) 一种基于注意力机制的双分支全色锐化方法
CN114862733A (zh) 结合光谱解混先验和可学习退化约束的高光谱图像融合方法
CN111107360B (zh) 一种光谱-空间维联合的高光谱图像无损压缩方法及系统
Han et al. Edge-Guided Remote Sensing Image Compression
Liu et al. Ensemble CNN in transform domains for image super-resolution from small data sets
CN108596831B (zh) 一种基于AdaBoost实例回归的超分辨率重建方法
Rasti et al. Hyperspectral image restoration using wavelets
Yang et al. Learning adaptive filter banks for hierarchical image representation
CN113393543B (zh) 高光谱图像压缩方法、装置、设备及可读存储介质
Webster et al. Robust spectral based compression of hyperspectral images using LSTM autoencoders
CN116594061B (zh) 一种基于多尺度u形注意网络的地震数据去噪方法
CN110222754B (zh) 基于张量分析的全分辨率深度卷积神经网络图像分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant