CN104244017A

CN104244017A - 压缩编码高光谱遥感图像的多层次码书矢量量化方法

Info

Publication number: CN104244017A
Application number: CN201410482379.4A
Authority: CN
Inventors: 陈善学; 郑文静; 张佳佳; 杨亚娟
Original assignee: Chongqing University of Post and Telecommunications
Current assignee: Chongqing University of Post and Telecommunications
Priority date: 2014-09-19
Filing date: 2014-09-19
Publication date: 2014-12-24
Anticipated expiration: 2034-09-19
Also published as: CN104244017B

Abstract

本发明公开一种压缩编码高光谱遥感图像的多层次码书矢量量化方法，涉及图像处理技术领域，该方法根据失真情况将高光谱图像的光谱矢量分割为低维、中维、高维三个部分，然后对失真较大的低维部分采用大尺寸码书，失真不大的中维部分采用中尺寸码书，失真较小的高维部分采用小尺寸码书，这样采用多层次码书，并结合离散度排序后仅提取低维部分四分之一分量训练编码索引的方式，能在相同压缩比下，达到有效降低高光谱图像的量化失真的同时，明显减少各项计算量的目标。本发明能在较小的计算复杂度条件下，以更快的速度实现高光谱图像更高质量的压缩编码，具有实际应用的价值，是一种压缩性能较好的高光谱图像有损、近无损压缩方案。

Description

压缩编码高光谱遥感图像的多层次码书矢量量化方法

技术领域

本发明属于高光谱遥感图像处理领域，具体涉及一种压缩编码高光谱遥感图像的多层次码书矢量量化方案。

背景技术

近年来，传统的二维彩色图像已经远远不能满足人们的需求，取而代之的是高光谱图像的应用越来越广泛。高光谱图像是高光谱成像光谱仪以纳米级的波段宽度，在几百个谱带上对目标进行连续的光谱成像而形成的光谱图像，被定义为二维空间域和一维光谱域组成的三维立体数据。这种特殊的图像不同于普通的二维灰度图像和彩色图像，它具有以下一些特点：1)细节丰富、纹理复杂。每个相同空间位置的地面目标都对应几百个光谱波段的像素值，这些像素值是传感器在某特定波长所接收到的强度返回值，可以细致精确地反映出地物目标在该波段的光谱特征。2)具有很高的谱间分辨率，谱间相关性强。高光谱图像的波段数目多达几百个，光谱分辨率达纳米级，如此高的光谱分辨率使得相邻波段相同地物目标的光谱特性十分接近，所以谱间相关性很高，大部分相邻两个波段的互相关系数都接近1。3)空间分辨率相对较低，空间相关性较普通图像弱。这是因为高光谱图像的空间分辨率一般为几米，地面目标可能只占几个或更少的像元，使相同波段像素值的连续性差。4)特性相似的地物具有相似的光谱曲线。每一个相同空间位置的地物目标都对应一组像素值，把这些像素值按波长大小的顺序组合起来就可以构成应该空间位置地物目标的一条光谱曲线，曲线的精确形状是严格依赖于该空间位置地物的类型和性质的，所以从光谱曲线的相似程度可以确定地物目标的分类。

由于高光谱图像比一般图像含有更为丰富的信息，使得它们在很多领域都发挥了重要的作用，例如，地质勘探、农业科研、水文监测、生物医学、植被研究、军事侦察等，而且其应用前景十分广阔。但是，随着高光谱遥感技术的发展，高光谱遥感成像光谱仪在空间和谱间分辨率指标不断提高，这使得高光谱图像的数据量也在急剧增长。为了保证海量高光谱数据得到高效的采样、传输、存储和应用，迫切需要研究出高质量的高光谱图像压缩编码技术。

现有的高光谱图像压缩方法，基本可以分为三大类：1)基于预测技术的压缩方法。其原理是利用临近像素的相关性，用某种顺序扫描图像，同时用已经编码过的临近像素的线性组合来预测当前像素，然后只传递预测误差到接收端，原始图像就可以通过误差图像得到精确的地恢复。可以看出基于预测技术的压缩方法一般用于无损压缩。该类方法对高光谱图像的压缩流程一般是：波段排序、预测和编码。2)基于变换技术的压缩方法。基于变换技术的压缩方法既可以用于有损压缩也可以用于无损压缩，其原理是将图像数据映射到变换域，以去除像素间的相关性，使图像的大部分能量集中在少数幅值较大的变换系数上，而其他幅值较小的变换系数表示的是图像相对一些不重要的细节分量，通过利用较少的码字描述幅值较大的系数所代表的主要能量成分，而量化掉幅值较小的变换系数所代表的细节分量达到压缩的目的。3)基于矢量量化技术的方法。矢量量化主要用于有损或者近无损压缩，它将输入信号分块重组成矢量数据，然后直接对矢量数据进行量化编码，是一种十分高效的压缩手段。自从1980年Linde等人提出LBG(Linde Bazo Gray)算法以来，矢量量化技术得到了不断发展和完善，压缩质量和计算复杂度都得到了很大改善。图3是传统的LBG方法流程框图，图4是矢量维数分割量化的超光谱图像压缩方法流程图。

三大类方法中基于预测技术的压缩方法压缩质量高，但是压缩比低；基于变换技术的压缩方法可以按要求实现不同程度的压缩，甚至可以完全重构原图像，但是变换改变了图像原有的特性，且有的变换需要非常大的计算量；基于矢量量化技术的压缩方法压缩比高、编解码简单，能快速地实现高光谱图像的有损或者近无损压缩，有效降低高光谱图像的数据量，但图像恢复质量低，且其矢量量化方案均采用统一的码书量化各维分量，缺乏对数据的适应性。

发明内容

本发明针对现有高光谱图像各种压缩方法，或压缩质量高但计算复杂度大，或计算量小但图像恢复质量低，且其矢量量化方案均采用统一的码书量化各维分量，缺乏对数据的适应性的问题，提出了一种压缩编码高光谱遥感图像的多层次码书矢量量化方案。该方案根据失真情况，将高光谱图像的光谱矢量分割为低维部分、中维部分、高维部分三个部分，然后对失真较大的低维部分采用大尺寸码书，失真不大的中维部分采用中尺寸码书，失真较小的高维部分采用小尺寸码书。相同压缩比下，该方案能在有效提高高光谱图像的压缩质量的同时，大幅度降低计算复杂度，快速高效地完成高光谱遥感图像的有损或近无损压缩。

一种压缩编码高光谱遥感图像的多层次码书矢量量化方法，读取高光谱图像三维数据，截取要压缩的子块转化为二维矩阵形式的原始矢量数据，将原始矢量数据分割为低维部分、中维部分、高维部分；然后对三部分矢量数据分别作哈达玛Hadamard变换和离散度排序预处理，得到预处理后的三部分矢量数据；对预处理后的三部分矢量数据分别截取矢量数据的前1/4维分量组成低维部分、中维部分、高维部分训练子矢量数据，剩余的3/4维分量作为对应部分的尾部子矢量数据；根据基本码书尺寸设置码书尺寸为多层次码书，对各部分训练子矢量数据进行矢量量化，得到迭代的训练子矢量码字索引和训练子矢量码书；根据训练子矢量码字索引分别对三部分尾部子矢量数据编码，得到三部分尾部子矢量码书和码字索引；分别整理各部分码书，得到三部分空域最终完整码书和最终码字索引，完成高光谱图像数据块的压缩编码。所述分割原则为：三部分矢量的维数分别都满足2的整数次幂，若不满足则在矢量末尾补零将维数扩展为最接近2的整数次幂，三部分矢量维数之和等于或接近原矢量维数。预处理具体为：先作Hadamard变换，将各部分矢量数据中每个行矢量右乘一个相同维数的Hadamard方阵；计算各部分矢量数据中每维分量的离散度，某维分量的离散度等于该维分量的最大值与该维分量的最小值的差值；将各部分矢量的离散度值分别进行降序排序，记录排序索引，按照排序索引分别重新排列对应部分矢量数据的各维分量。设定码书尺寸为多层次码书具体为，根据基本码书尺寸N设定低维部分训练子矢量码书尺寸N₁、中维部分训练子矢量码书尺寸N₂、高维部分训练子矢量码书尺寸N₃，N₁、N₂、N₃为N的倍数，其中，N₁＞N₂＞N₃。进行矢量量化进一步包括：搜索每个训练子矢量的最佳匹配码字，并将训练子矢量划分到对应的胞腔中，记录对应的码字索引，直到所有的训练子矢量都训练完成，以各胞腔的质心代替原来胞腔对应的码字，保存最后一次迭代产生的低维训练子矢量码书和码字索引、中维训练子矢量码书和码字索引、高维训练子矢量码书和码字索引。进行矢量量化进一步包括：获取初始码书和初始码字索引，计算训练矢量集中的各训练子矢量的2范数，并将其按升序排序，记录排序索引，按照该索引重新排序各训练子矢量，对各训练子矢量平均分组后取每组最后一个组成初始码书，各训练子矢量的分组号作为其对应的初始码字索引。得到三部分尾部子矢量码书和码字索引具体为：将三部分训练子矢量码字索引作为对应部分的尾部子矢量编码索引，按照编码索引将所有尾部子矢量分配到各个胞腔中，以各胞腔的质心作为码字，得到各部分尾部子矢量码书。整理各部分码书具体包括，将训练子矢量码书作为前1/4维分量，尾部子矢量码书作为后3/4分量，连接成对应部分的Hadamard变换域完整码书；再对各部分Hadamard变换域完整码书进行离散度反排序、Hadamard反变换得到各部分空域最终完整码书，将训练子矢量码字索引作为空域最终码字索引。

搜索每个训练子矢量的最佳匹配码字进一步包括：按照当前训练矢量X对应的码字索引I(i)找到码书W中第I(i)个码字Y_op，计算X和Y_op之间的欧式距离作为当前最小失真按照Y_op为中心上下搜索，输入下一个要判断的码字Y_j；计算D₁＝(Norm_X-Norm_Y(j))²，其中Norm_X为X的2范数，Norm_Y(j)为当前判断码字Y_j的2范数，若D₁≥D_min，且Norm_X≥Norm_Y(j)，则排除码字Y_k(k＝1,…,j)，若Norm_X≤Norm_Y(j)，则排除码字Y_k(k＝j,…,N)；若不满足D₁≥D_min，计算D₂＝(X₁-Y_j1)²+(V_X-V_Y(j))²，若不等式D₂≥D_min成立，则排除码字Y_j，否则，计算X与Y_j的累积失真

D_{q} (X, Y_{j}) = Σ_{k = 1}^{q} {(X_{k} - Y_{jk})}^{2} (q = 2, . . ., m),

若不等式D_q(X,Y_j)≥D_min成立，则排除码字Y_j，如直到q＝m，不等式D_q(X,Y_j)≥D_min均不成立，则当前码字Y_j为训练矢量X对应的最匹配码字，其中，k表示第k维分量，m表示训练矢量X的维数，N为码书W的尺寸，V_X为当前训练矢量X的方差，V_Y(j)为当前码字Y_j的方差，X_k为X的第k维分量，X₁为X的第一维分量，Y_j1为Y_j的第一维分量。

该方案的实现过程主要包括以下几个阶段：

训练子矢量数据获取阶段：读取高光谱图像三维数据，截取要编码的子块转化为二维矩阵形式的矢量数据，然后将矢量数据分割为低维、中维、高维三个部分；对分割出的三部分矢量分别作两步预处理，即先作Hadamard(哈达玛)变换、再作离散度排序，得到预处理后的三部分矢量数据；分别截取预处理后的三部分矢量数据的前四分之一维分量组成各部分训练子矢量数据并保存，剩下的后四分之三维分量保存为尾部子矢量数据。

训练子矢量数据矢量量化阶段：设定码书尺寸为多层次码书；设置迭代次数或失真阈值作为训练结束的条件；按照训练子矢量范数排序，平均分组取最后一个的方式获取各部分训练子矢量初始码书，分组号即为训练子矢量的初始码字索引；对各部分训练子矢量进行迭代训练，可利用高效三步排除不等式算法快速搜索每个训练子矢量的最佳匹配码字，并将训练子矢量划分到对应的胞腔中，记录对应的码字索引，直到所有的训练子矢量都训练完成时，本次迭代结束，更新码书，以各胞腔的质心代替原来胞腔对应的码字；判断是否满足迭代结束的条件，若满足则终止训练，并保存最后一次迭代产生的各部分训练子矢量码书和训练子矢量码字索引，否则，继续下一轮训练。

尾部子矢量数据编码阶段：直接将三部分训练子矢量码字索引作为对应部分的尾部子矢量数据编码索引，按照编码索引将所有尾部子矢量分配到各个胞腔中，以各胞腔的质心作为码字，得到各部分尾部子矢量码书。

码书连接整理阶段：直接将训练子矢量码书作为前1/4维分量，尾部子矢量码书作为后3/4分量，连接成对应部分的哈达玛Hadamard变换域完整码书；再对各码书进行离散度反排序、Hadamard反变换得到各部分空域最终完整码书和最终码字索引，从而完成整个图像的压缩。

通过上述过程可以看出，采用矢量量化对数据进行压缩编码，编码后只需要传输最终码书以及各个训练矢量对应的码字索引，压缩比大，解码过程只需要在接收端根据码字索引值在码书中查找到对应的码字代替训练矢量，解码过程简单。且用矢量量化压缩高光谱图像可以充分利用高光谱图像的很强的谱间相关性。但是，高光谱图像的矢量量化性能还能得到进一步提升，因为实验发现失真随着维数升高而基本呈现递减的趋势，即低维部分失真大，高维部分失真小，且高维部分随着码书的增大，对图像的压缩质量的提高很小；而低维部分失真相对较大，随着码书增大，图像的压缩质量提高比较明显，如果各维分量都采用统一大小的码书量化就会造成存储量的浪费。因此，提出多层次码书矢量量化用于压缩高光谱图像，对矢量进行分割采用不同大小的码书进行量化，低维部分码书大，高维部分码书小，可以有效提高高光谱图像的压缩性能。

附图说明：

图1是美国喷气实验室提供的高光谱图像Lunar Lake压缩质量与压缩比关系；

图2是美国喷气实验室提供的高光谱图像Cuprite压缩质量与压缩比关系；

图3是传统的LBG方法流程框图；

图4是矢量维数分割量化的超光谱图像压缩方法；

图5是本发明方案流程图。

具体实施方式

以下使用具体事例和附图对本发明方案作进一步说明。图5所示为本发明方案流程图。本发明提出的压缩编码高光谱遥感图像的多层次码书矢量量化方案，主要包括以下几个阶段：

训练子矢量数据矢量量化阶段：设定码书尺寸为多层次码书；设置迭代次数或失真阈值作为训练结束的条件；按照训练子矢量范数排序，平均分组取最后一个的方式获取各部分训练子矢量初始码书，分组号即为训练子矢量的初始码字索引；对各部分训练子矢量进行迭代训练，利用高效三步排除不等式算法快速搜索每个训练子矢量的最佳匹配码字，并将训练子矢量划分到对应的胞腔中，记录对应的码字索引，直到所有的训练子矢量都训练完成时，本次迭代结束，更新码书，以各胞腔的质心来代替原来胞腔对应的码字；判断是否满足迭代结束的条件，若满足则终止训练，并保存最后一次迭代产生的各部分训练子矢量码书和训练子矢量码字索引，否则，继续下一轮训练。

码书连接整理阶段：直接将训练子矢量码书作为前1/4维分量，尾部子矢量码书作为后3/4分量，连接成对应部分的Hadamard变换域完整码书；再对各码书进行离散度反排序、Hadamard反变换得到各部分空域最终完整码书和最终码字索引，从而完成整个图像的压缩。

以下举例进一步说明本发明的实施具体包括：

读取三维的高光谱图像数据，截取要编码的子块，转化为二维矩阵形式的矢量数据B，转化的方式可为把同一空间位置的各个像素值按照波段序号从小到大按顺序组成一个行矢量数据，存入B中。

将B分割为低维、中维、高维三部分，分割原则为：三部分矢量的维数都满足2的整数次幂，如果某部分不满足，则在矢量末尾补零将维数扩展到最接近的2的整数次幂；低维部分矢量维数较少，中维部分矢量维数居中，高维部分矢量维数较多；三部分矢量维数之和等于(或尽量接近)原矢量维数。

对分割出的三部分矢量分别作两步预处理，即先作Hadamard变换，将每个行矢量右乘一个相同维数的Hadamard方阵；再作离散度排序，计算每一维分量的离散度等于该维分量的最大值与该维分量的最小值的差值，将各部分矢量的离散度值进行降序排序，记录三部分离散度排序索引，并按照这三个索引分别重新排序对应部分矢量的各维分量，得到预处理后的各部分矢量数据。

分别截取预处理后的三部分矢量数据的前四分之一维分量作为对应部分的训练子矢量数据并保存，剩下的后四分之三维分量保存为不参与训练的尾部子矢量数据。

设定码书尺寸为多层次码书，首先设定基本码书尺寸N的值，然后设定低维部分训练子矢量码书尺寸、中维部分训练子矢量码书尺寸、高维部分训练子矢量码书尺寸，设置迭代次数ite或失真阈值e作为训练结束的条件。如设定低维部分训练子矢量码书尺寸为基本码书尺寸N的四倍，即N₁＝4×N，设定中维部分训练子矢量码书尺寸为基本码书尺寸N的二倍，即N₂＝2×N，设定高维部分训练子矢量码书尺寸为基本码书尺寸N的四分之一，即N₃＝N/4。

分别计算三部分训练子矢量的2范数，并按升序排序，记录排序索引，然后按照排序索引分别重排序对应部分的训练子矢量，对重排序后的各部分训练子矢量按照设定的码书尺寸进行平均分组，依次选取每组最后一个组成各部分初始码书，且将每个训练子矢量的分组号作为其初始码字索引。

对各部分训练子矢量进行迭代训练，搜索每个训练子矢量的最佳匹配码字，并将训练子矢量划分到对应的胞腔中，记录对应的码字索引，直到所有的训练子矢量都训练完成时，本次迭代结束，更新码书，以各胞腔的质心来代替原来胞腔对应的码字。

判断迭代次数ite是否已经达到预先设定的值，或者判断本次迭代产生的平均失真与前一次迭代产生的平均失真之间的相对误差是否小于设定的失真阈值e。若满足迭代结束的条件，则终止训练，并保存最后一次迭代产生的三部分训练子矢量码书和码字索引；否则，继续进行下一迭代。

直接将三部分训练子矢量码字索引作为对应部分的尾部子矢量编码索引，按照编码索引将所有尾部子矢量分配到各个胞腔中，以各胞腔的质心作为码字，得到各部分尾部子矢量码书。

直接将训练子矢量码书作为前1/4维分量，尾部子矢量码书作为后3/4分量，连接成对应部分的Hadamard变换域完整码书；再对各部分Hadamard变换域完整码书进行离散度反排序、Hadamard反变换得到各部分空域最终完整码书，将训练子矢量码字索引直接作为空域最终码字索引。打包各部分空域最终完整码书和空域最终码字索引进行存储和传输，从而完成整个图像的压缩。

搜索每个训练子矢量的最佳匹配码字具体可为：

准备阶段：计算码书中所有码字的2范数并按升序排序，记录排序索引，然后将码书W中的码字按照该排序索引重排序，得到新的码书W，且按该排序索引调整训练矢量码字索引I中的值与新的码书W对应，再按照当前训练矢量X对应的码字索引I(i)找到码书W中第I(i)个码字Y_op，计算X和Y_op之间的欧式距离作为当前最小失真按照Y_op为中心上下搜索的顺序，输入下一个要判断的码字Y_j。

第一步排除不等式：计算D₁＝(Norm_X-Norm_Y(j))²，其中为X的2范数，为当前判断码字Y_j的2范数，X_k表示训练矢量X的第k维分量,k表示当前维数，m表示训练矢量X的维数。判断不等式D₁≥D_min是否成立，若成立则进一步判断Norm_X与Norm_Y(j)的关系，若Norm_X≥Norm_Y(j)，则排除码字Y_k(k＝1,…,j)；若Norm_X≤Norm_Y(j)，则排除码字Y_k(k＝j,…,N)，N为码书W的尺寸。若不等式D₁≥D_min不成立，则进入第二步排除不等式判断。

第二步排除不等式：计算D₂＝(X₁-Y_j1)²+(V_X-V_Y(j))²，其中为当前训练矢量X的方差，为当前码字Y_j的方差，k表示第k维分量，m表示训练矢量X的维数，X₁为X的第一维分量，Y_j1为Y_j的第一维分量，k表示第k维分量，m表示训练矢量的维数。判断不等式D₂≥D_min是否成立，若成立，则排除码字Y_j，否则进入第三步排除不等式判断。

第三步排除不等式：采用PDS搜索(部分失真搜索，partial distortion search)。即计算X与Y_j的累积失真

D_{q} (X, Y_{j}) = Σ_{k = 1}^{q} {(X_{k} - Y_{jk})}^{2} (q = 2, . . ., m),

其中k表示第k维分量，m是训练矢量X的维数。q从2逐渐变化到m的过程可以构成m-1个部分失真不等式，若其中有某一步不等式D_q(X,Y_j)≥D_min成立，则排除码字Y_j，否则q增加1继续进行判断，直到q＝m，若还未排除码字Y_j，则当前码字Y_j为训练矢量X对应的新的失真最小的码字，即最匹配码字，并把X对应的码字索引更新为IT(i)＝j，把X对应的最小失真D_min更新为当前码字Y_j和X之间的欧式距离

D_{\min} = d (X, Y_{j}) = Σ_{k = 1}^{m} {(X_{k} - Y_{jk})}^{2} .

实验中使用的是高光谱图像Lunar Lake和Cuprite的第一场景，来源于美国喷气实验室提供的免费高光谱数据集AVIRIS，这些数据源被绝大多数研究者使用，研究结果具有可比性。Lunar Lake图像和Cuprite图像的尺寸为512×614×224，表示图像含有512行614列和224个光谱波段。为了处理方便，分别截取Lunar Lake图像和Cuprite图像第一场景中前256行前256列和所有224光谱波段的图像，组成256×256×224的子图像块数据，提取此子图像块每一相同空间位置对应的224个波段的像素值按波段从小到大组合成一个行矢量数据依次存在二维矩阵B中，如此，将三维子图像块数据转化为二维矩阵数据B(65536,224)，B的每一行代表一个224维的原始行矢量数据，对应一个空间位置，B的每一列表示一个光谱波段，对应相同空间位置一幅完整的256×256的二维图像。

分割原始矢量数据为三个部分

将原始矢量数据B分割为三个部分：低维矢量数据BL、中维矢量数据BM、高维部分矢量数据BH，分割原则为：分割原则为：三部分矢量的维数都满足2的整数次幂，如果某部分不满足，则在矢量末尾补零将维数扩展到最接近的2的整数次幂；低维部分矢量维数较少，中维部分矢量维数居中，高维部分矢量维数较多；三部分矢量维数之和尽量接近原矢量维数。

实验中矢量数据B的维数为224，按照分割原则将B分割为矢量维数为32、64、128的三个部分，即BL(65536,32)为截取B的1-32维分量所得，BM(65536,64)为截取B的33-96维分量所得，BH(65536,128)为截取B的97-224维分量所得。

对分割出的三部分矢量数据分别作作Hadamard变换

对一个维数为m的行矢量进行Hadamard变换的方式为将矢量右乘一个规格为m×m的Hadamard方阵。因此，对分割出的三部分矢量数据分别作Hadamard变换，即对分割出的低维部分矢量数据BL、中维部分矢量数据BM、高维部分矢量数据BH中的每个行矢量都右乘一个相同维数的Hadamard方阵，得到Hadamard变换域的三部分矢量数据BLH、BMH、BHH。

实验中，根据数据情况，对分割出的三部分矢量数据分别作Hadamard变换的具体操作为：将BL(65536,32)中每个行矢量右乘一个Hadamard方阵H(32×32)得BLH；将BM(65536,64)中每个行矢量右乘一个Hadamard方阵H(64×64)得BMH；将BH中每个行矢量右乘一个Hadamard方阵H(128×128)得BHH。

矢量的Hadamard变换具有变换计算量小，变换速度快的优势。这是因为Hadamard方阵中只含有1和-1两种元素，变换仅需简单的加减运算不需要乘法运算，且矢量的Hadamard变换有快速算法。

矢量的Hadamard变换的具有如下性质：令H_m为m×m的Hadamard矩阵，

H_{1} = [\begin{matrix} 1 & 1 \\ 1 & - 1 \end{matrix}], H_{m + 1} = [\begin{matrix} H_{m} & H_{m} \\ H_{m} & - H_{m} \end{matrix}],

记x为空域中维数为m的行矢量，X为矢量x经Hadamard变换后的矢量，则x的Hadamard变换定义为X＝xH_m，则矢量Hadamard变换的性质可以表述为：

X₁＝s_x，s_x是空域中矢量x各维分量之和，X₁是x经Hadamard变换后所得矢量X的第一维分量，即Hadamard域中矢量的第一维分量是对应空域中矢量各分量的和值；

l_x ²表示空域中矢量x的范数，L_x ²表示x经Hadamard变换后所得矢量X的范数，即Hadamard域中矢量范数是对应空域中矢量范数的m倍；

D(X,Y_j)＝md(x,y_j)，d(x,y_j)为空域中矢量x和码字y_j的欧氏距离，D(X,Y_j)是对应的Hadamard域中矢量X和码字Y_j的欧式距离，即Hadamard域中的矢量失真是空域中失真的m倍，由此看出，在Hadamard域搜索最佳码字和在空域搜索是等价的。

分别获取三部分训练子矢量数据

对Hadamard变换域的三部分矢量数据BLH、BMH、BHH分别计算离散度对应得到低维离散度disL，中维离散度disM，高维离散度disH，某维分量的离散度等于该维分量的最大值与该维分量的最小值的差值。分别对disL、disM、disH中的值作升序排序对应得到低维离散度索引ILdis、中维离散度索引IMdis、高维离散度索引IHdis。将Hadamard变换域的低维部分矢量数据BLH的各维分量按ILdis重新排序得BLD，将Hadamard变换域的中维部分矢量数据BMH的各维分量按IMdis重新排序得BMD，将Hadamard变换域的高维部分矢量数据BHH的各维分量按IHdis重新排序得BHD。分别截取BLD、BMD、BHD的前1/4维分量组成低维训练子矢量数据TL、中维训练子矢量数据TM、高维训练子矢量数据TH，剩余的后3/4维分量保存为对应的低维尾部子矢量数据TailL、中维尾部子矢量数据TailM、高维尾部子矢量数据TailH。

实验中，根据数据情况，截取离散度排序后的低维矢量数据BLD(65536,32)的前8维组成低维训练子矢量数据TL(65536,8)，剩下的24维分量保存为低维尾部子矢量数据TailL(65536,24)。截取离散度排序后的中维部分矢量数据BMD(65536,64)的前16维组成中维训练子矢量数据TM(65536,16)，剩下的48维分量保存为中维尾部子矢量数据TailM(65536,48)。截取离散度排序后的高维部分矢量数据BHD(65536,128)的前32维组成高维训练子矢量数据TH(65536,32)，剩下的96维分量保存为高维尾部子矢量数据TailH(65536,96)。

设定码书尺寸和迭代结束的条件

设定码书尺寸为多层次码书，首先设定基本码书尺寸N的值，然后，设定低维码书尺寸N₁为N的四倍，即N₁＝4×N，中维码书尺寸为N的二倍，即N₂＝2×N，高维码书尺寸为N的四分之一，即N₃＝N/4。

设置迭代次数为ite或设置失真阈值为e作为训练结束的条件。

获取三部分训练子矢量数据的初始码书和初始码字索引

计算低维训练子矢量数据TL中行矢量的范数NormLT并按升序排序得排序索引ILNorm，并按ILNorm重新排序TL中行矢量得BLNorm，将BLNorm中的行矢量按低维码书尺寸平均分成N₁组，依次选取每组最后一个组成低维训练子矢量初始码书CLTs，且将每个行矢量的分组号作为其初始码字索引得低维训练子矢量初始码字索引ILTs。计算中维训练子矢量数据TM中行矢量的范数NormMT并按升序排序得排序索引IMNorm，并按IMNorm重新排序TM中行矢量得BMNorm，将BMNorm中的行矢量按中维码书尺寸平均分成N₂组，依次选取每组最后一个组成中维训练子矢量初始码书CMTs，且将每个行矢量的分组号作为其初始码字索引得中维训练子矢量初始码字索引IMTs。计算高维训练子矢量数据TH中行矢量的范数NormHT并按升序排序得排序索引IHNorm，并按IHNorm重新排序TH中行矢量得BHNorm，将BHNorm中的行矢量按高维码书尺寸平均分成N₃组，依次选取每组最后一个组成高维训练子矢量初始码书CHTs，且将每个行矢量的分组号作为其初始码字索引得高维训练子矢量初始码字索引IHTs。

对三部分训练子矢量数据进行矢量量化训练

对三部分训练子矢量数据TL、TM、TH中的行矢量，分别利用高效三步排除不等式算法快速搜索每个训练子矢量的最佳匹配码字，并将训练子矢量划分到对应的胞腔中，记录对应的码字索引，直到所有的训练子矢量都训练完成时，本次迭代结束，更新码书，以各胞腔的质心来代替原来胞腔对应的码字；判断是否满足迭代结束的条件，若满足则终止训练，并保存最后一次迭代产生的低维训练子矢量码书CLT和码字索引ILT、中维训练子矢量码书CMT和码字索引IMT、高维训练子矢量码书CHT和码字索引IHT。

对三部分尾部子矢量数据进行编码

直接将低维训练子矢量码字索引ILT作为低维尾部子矢量编码索引，按照编码索引将低维尾部子矢量数据TailL中的行矢量分配到各个胞腔中，以各胞腔的质心作为码字得低维尾部子矢量码书CLTail。直接将中维训练子矢量码字索引IMT作为中维尾部子矢量编码索引，按照编码索引将中维尾部子矢量数据TailM中的行矢量分配到各个胞腔中，以各胞腔的质心作为码字得中维尾部子矢量码书CMTail。直接将高维训练子矢量码字索引IHT作为高维尾部子矢量编码索引，按照编码索引将高维尾部子矢量数据TailH中的行矢量分配到各个胞腔中，以各胞腔的质心作为码字得高维尾部子矢量码书CHTail。

对三部分码书进行连接整理

直接将训练子矢量码书作为前1/4维分量，尾部子矢量码书作为后3/4分量，连接成对应部分的Hadamard变换域完整码书；再对各部分Hadamard变换域完整码书进行离散度反排序、Hadamard反变换得到各部分空域最终完整码书，如果该部分矢量数据在数据预处理阶段作了添加零扩维处理，则Hadamard反变换后去除码字末尾添加零的那几维。将训练子矢量码字索引直接作为空域最终码字索引。

根据数据情况，直接将低维训练子矢量码书CLT作为前8维分量，低维尾部子矢量码书CLTail作为后24维分量，连接成低维部分Hadamard变换域完整码书CLw(N₁,32)。直接将中维训练子矢量码书CMT作为前16维分量，中维尾部子矢量码书CMTail作为后48维分量，连接成中维部分Hadamard变换域完整码书CMw(N₂,64)。直接将高维训练子矢量码书CHT作为前32维分量，高维尾部子矢量码书CHTail作为后96维分量，连接成高维部分Hadamard变换域完整码书CHw(N₃,128)。将CLw、CMw、CHw分别进行离散度反排序、Hadamard反变换得到低维空域最终完整码书CLept、中维空域最终完整码书CMept、高维空域最终完整码书CHept。将ILT直接作为低维空域最终码字索引，将IMT直接作为中维空域最终码字索引，将IHT直接作为高维空域最终码字索引。

在MATLAB7.9软件平台下结合附图对本发明方案的实例进行详细说明。

使用的实验数据是高光谱图像Lunar Lake和Cuprite，规格为512×614×224，其每个像素用两个字节的带符号整数表示。仿真实验对全搜索LBG方法、矢量维数分割量化的超光谱图像压缩方法和本发明方案3种方法进行了仿真对比。仿真中，矢量维数分割量化的超光谱图像压缩方法对各部分矢量数据采用统一尺寸的码书，即设定的基本码书N，以下将该方法简称为统一码书方法。

以下举例说明本方案的实施：

训练子矢量数据获取阶段：

步骤1：在路径中准备好要编码的高光谱图像，使用MATLAB函数库中的fopen函数和fread函数快速读取出要编码的高光谱图像，得到三维的高光谱数据矩阵Cubic(512,614,224)，表示高光谱图像含有512行、614列和224个光谱波段。

步骤2：截取Cubic的前256行、前256列和所有224个波段的数据得到要压缩的数据子块Cubic_sub(256,256,224)。

步骤3：将Cubic_Sub转化为矩阵形式的矢量数据B(65536,224)。转化方式为将Cubic_Sub的前2维按顺序扫描为B的第1维，Cubic_Sub的第3维扫描为矩阵B的第2维，B的每一行代表一个行矢量数据。

步骤4：截取B的1-32维分量组成低维矢量数据BL(65536,32)、截取B的33-96维分量组成中维矢量数据BM(65536,64)、截取B的97-224维分量组成高维矢量数据BH(65536,128)。

步骤5：将BL中的每个行矢量右乘一个32维的Hadamard方阵H(32,32)得到BLH(65536,32)，将BM中每个行矢量右乘一个64维的Hadamard方阵H(64,64)得BMH，将BH中每个行矢量右乘一个128维的Hadamard方阵H(128,128)得BHH。

步骤6：计算BLH中行矢量各维分量的离散度disL(1,32)，计算BMH中行矢量各维分量的离散度disM(1,64)，计算BHH中行矢量各维分量的离散度disH(1,128)，某维分量的离散度等于该维分量的最大值与该维分量的最小值的差值。对disL中的值作升序排序得排序索引ILdis，将BLH中行矢量的各维分量按ILdis重排序得BLD，对disM中的值作升序排序得排序索引IMdis，将BMH中行矢量的各维分量按IMdis重排序得BMD，对disH中的值作升序排序得排序索引IHdis，将BHH中行矢量的各维分量按IHdis重排序得BHD。

步骤7：截取BLD的前8维组成低维训练子矢量数据TL(65536,8)，剩下的24维分量保存为低维尾部子矢量数据TailL(65536,24)。截取BMD(65536,64)的前16维组成中维训练子矢量数据TM(65536,16)，剩下的48维分量保存为中维尾部子矢量数据TailM(65536,48)。截取BHD的前32维组成高维训练子矢量数据TH(65536,32)，剩下的96维分量保存为高维尾部子矢量数据TailH。

训练子矢量数据矢量量化阶段：

步骤1：设定基本码书尺寸N的值，然后设定低维码书尺寸N₁＝4×N，设定中维码书尺寸N₂＝2×N，设定高维码书尺寸N₃＝N/4。设置迭代次数为ite＝10。

步骤2：计算TL中行矢量的2范数NormLT并按升序排序得ILNorm，并按ILNorm重新排序TL中行矢量得BLNorm，将BLNorm中的行矢量平均分成N₁组，依次选取每组最后一个组成低维训练子矢量初始码书CLTs，每个行矢量的分组号作为其初始码字索引得低维训练子矢量初始码字索引ILTs。计算TM中行矢量的2范数NormMT并按升序排序得IMNorm，并按IMNorm重新排序TM中行矢量得BMNorm，将BMNorm中的行矢量按平均分成N₂组，依次选取每组最后一个组成中维训练子矢量初始码书CMTs，每个行矢量的分组号作为其初始码字索引得中维训练子矢量初始码字索引IMTs。计算TH中行矢量的2范数NormHT并按升序排序得排序索引IHNorm，并按IHNorm重新排序TH中行矢量得BHNorm，将BHNorm中的行矢量按平均分成N₃组，依次选取每组最后一个组成高维训练子矢量初始码书CHTs，每个行矢量的分组号作为其初始码字索引得高维训练子矢量初始码字索引IHTs。

步骤3：依次输入TL、TM、TH作为当前训练矢量数据TT。

步骤4：计算TT中行矢量的范数NormTT(65536,1)，代表TT中的第i个行矢量X的范数；计算TT中行矢量的方差VXTT(65536,1)，代表TT中的第i个行矢量X的方差。其中k表示第k维分量，m表示TT中行矢量的维数。

步骤5：输入当前训练矢量数据TT对应的初始码书Ws和初始码字索引Is，设定训练过程中的码书变量为W、码字索引变量为I，令W＝Ws，I＝Is。

步骤6：初始化胞腔训练矢量之和的变量Sum(N,m)为全零矩阵，初始化胞腔训练矢量个数的变量Count(1,N)为全零矢量，m表示训练矢量数据TT中训练矢量的维数，N为当前训练矢量数据TT对应的码书尺寸。

步骤7：计算码书W中所有码字的2范数并按升序排序，记录排序索引IWnorm，然后将W中的码字按照IWnorm重排序得到新的码书W。按IWnorm调整码字索引I中的值与新码书W对应。

步骤8：计算W中码字的范数NormW(N,1)，代表码书W中的第j个码字Y_j的范数；计算W中码字的方差VWTT(N,1)，代表W中第j个码字Y_j的方差。其中k表示第k维分量，m表示W中码字的维数，N为当前训练矢量数据TT对应的码书尺寸。

步骤9：按顺序输入TT中第i个行矢量X作为当前训练矢量，按照X对应的码字索引I(i)找到码书W中第I(i)个码字Y_op，计算X和Y_op之间的欧式距离作为当前最小失真

D_{\min} = Σ_{k = 1}^{m} {(X_{k} - Y_{op})}^{2} .

步骤10：按照Y_op为中心上下搜索的顺序，输入下一个要判断的码字Y_j。计算D₁＝(NormTT(i)-NormW(j))²，其中NormTT(i)为X的范数，NormW(j)为码字Y_j的范数。判断不等式D₁≥D_min是否成立，若成立，则进一步判断NormTT(i)与NormW(j)的关系，若NormTT(i)≥NormW(j)，则排除码字Y_k(k＝1,…,j)，若NormTT(i)≤NormW(j)，则排除码字Y_k(k＝j,…,N)，N为当前训练矢量数据TT对应的码书尺寸；若不等式D₁≥D_min不成立，则进入训练子矢量数据矢量量化阶段步骤11进行下一步判断。

步骤11：计算D₂＝(X₁-Y_j1)²+(VXTT(i)-VWTT(j))²，其中VXTT(i)为X的方差，VWTT(j)为码字Y_j的方差，X₁为X的第一维分量，Y_j1为Y_j的第一维分量。判断不等式D₂≥D_min是否成立，若成立，则排除码字Y_j，否则进入训练子矢量数据矢量量化阶段步骤12进行下一步判断。

步骤12：PDS搜索：

1.1令变量q＝2；

1.2计算X与码字Y_j的累积失真k表示第k维分量；

1.3判断不等式D_q(X,Y_j)≥D_min是否成立，若成立则排除码字Y_j，转入训练子矢量数据矢量量化阶段步骤13；否则执行q＝q+1，转入下一步；

1.4判断q≤m是否成立，m表示TT中行矢量的维数，若成立则转入训练子矢量数据矢量量化阶段步骤12中的b)继续判断；否则认为Y_j为X对应的新的失真最小的码字，即最匹配码字，并把X对应的码字索引更新为I(i)＝j，把X对应的最小失真D_min更新为Y_j和X之间的欧式距离

D_{\min} = d (X, Y_{j}) = Σ_{k = 1}^{m} {(X_{k} - Y_{jk})}^{2} .

步骤13：判断是否W中的码字都已经比较完毕，若完毕则转入下一步；否则转入训练子矢量数据矢量量化阶段步骤10。

步骤14：将X划分到对应的胞腔I(i)中，即把X对应胞腔I(i)的训练矢量之和变量Sum(I(i)，：)更新为Sum(I(i)，：)＝Sum(I(i)，：)+X，同时把X对应胞腔的训练矢量个数变量更新为Count(I(i))＝Count(I(i))+1。

步骤15：判断是否当前训练矢量数据TT中的行矢量都已经训练完毕，若训练完毕则本轮迭代结束，更新码书W，以各胞腔的质心代替原来胞腔对应的码字，即更新W为W(k，：)＝Sum(k，：)./Count(k)，k∈{1,2,…,N₁}代表第k个胞腔，然后转入下一步；否则转入训练子矢量数据矢量量化阶段步骤9。

步骤16：判断迭代次数是否已经达到设定的次数ite＝10，若已经达到则转入下一步；否则转入训练子矢量数据矢量量化阶段步骤6继续下一次迭代。

步骤17：分别保存最后一次迭代产生的低维训练子矢量码书CLT和码字索引ILT、中维训练子矢量码书CMT和码字索引IMT、高维训练子矢量码书CHT和码字索引IHT。

尾部子矢量数据编码阶段：

步骤1：直接将ILT作为低维尾部子矢量数据编码索引，按照ILT将TailL中所有行矢量分配到各个胞腔中，以各胞腔的质心作为码字，得低维尾部子矢量码书CLTail。

步骤2：直接将IMT作为中维尾部子矢量数据编码索引，按照IMT将TailM中所有行矢量分配到各个胞腔中，以各胞腔的质心作为码字，得中维尾部子矢量码书CMTail。

步骤3：直接将IHT作为高维尾部子矢量数据编码索引，按照IHT将TailH中所有行矢量分配到各个胞腔中，以各胞腔的质心作为码字，得高维尾部子矢量码书CHTail。

码书连接整理阶段：

步骤1：直接将CLT作为前8维分量，CLTail作为后24维分量，连接成低维部分Hadamard变换域完整码书CLw(N₁,32)。

步骤2：直接将CMT作为前16维分量，CMTail作为后48维分量，连接成中维部分Hadamard变换域完整码书CMw(N₂,64)。

步骤3：直接将CHT作为前32维分量，CHTail作为后96维分量，连接成高维部分Hadamard变换域完整码书CHw(N₃,128)。

步骤4：将CLw、CMw、CHw分别进行离散度反排序、Hadamard反变换得到低维空域最终完整码书CLept、中维空域最终完整码书CMept、高维空域最终完整码书CHept。将ILT直接作为低维空域最终码字索引，将IMT直接作为中维空域最终码字索引，将IHT直接作为高维空域最终码字索引。压缩结束。

只需分别打包CLept和ILT，CMept和IMT，CHept和IHT进行传输。在接收端只需按照ILT将CLept中的码字排列起来得到BL_Re，按照IMT将CMept中的码字排列起来得到BM_Re，按照IHT将CHept中的码字排列起来得到BH_Re。再将BL_Re作为低维部分、BM_Re作为中维部分、BH_Re作为高维部分直接连接起来，得到空域最终恢复的矢量数据B_Re，最后经过维数变换即可得到恢复的三维高光谱图像数据块。

高光谱图像的压缩性能主要用峰值信噪比(PSNR，单位：dB)、信噪比(SNR，单位：dB)、压缩比(CR)、以及计算复杂度三个指标来进行评价，这3个指标的具体计算方式如下：

①PSNR计算公式：

PSNR = 10 * \log 10 (\frac{{(Peaksignal)}^{2}}{MSE}) (dB)

其中，Peaksignal表示原高光谱图像所有像素值中的最大像素值，MSE表示整个高光谱图像的均方误差；

MSE计算公式：

MSE = (Σ_{i = 1}^{row} Σ_{j = 1}^{col} {(B (i, j) - B_Re (i, j))}^{2}) / Pixel_Count

其中，B是原始矢量数据矩阵，B_Re是压缩后恢复的矢量数据矩阵，Pixel_Count表示原高光谱图像的像素总个数，row和col分别表示B的总行数和总列数。

②SNR计算公式：

SNR = 10 * \log 10 (\frac{Power_Aver}{MSE}) (dB)

其中，Power_Aver表示原高光谱图像的平均功率，MSE表示整个高光谱图像的均方误差；

Power_Aver计算公式：

Power_Aver = (Σ_{i = 1}^{row} Σ_{j = 1}^{col} B {(i, j)}^{2}) / Pixel_Count

其中，row和col分别表示原矢量数据矩阵B的总行数和总列数。

③CR计算公式：

CR = \frac{Pixel_Count \times 16}{(N_{1} \times m_{1} \times 16 + N_{2} \times m_{2} \times 16 + N_{3} \times m_{3} \times 16) + row \times (\log_{2} (N_{1}) + \log_{2} (N_{2}) + \log_{2} (N_{3}))}

其中，Pixel_Count表示原高光谱图像的像素总个数，N₁为低维部分矢量数据的码书尺寸，N₂为中维部分矢量数据的码书尺寸，N₃为高维部分矢量数据的码书尺寸，m₁为恢复的低维部分矢量数据BL_Re，m₂为恢复的低维部分矢量数据BM_Re，m₃为恢复的低维部分矢量数据BH_Re，每个像素值用2个字节即16bit存储，row表示原矢量数据矩阵B的总行数，即矢量总个数。

④计算复杂度计算公式：

其中，ComputeCount₁表示比较计算(com)总次数，ComputeCount₂表示乘法计算(×)总次数，ComputeCount₃表示加法计算(±)总次数，ComputeCount₄表示开平方计算(sqrt)总次数，ite表示编码中训练过程的迭代次数，Vector_Count表示原矢量数据矩阵B中的矢量个数。

以高光谱图像Lunar Lake和Cuprite的第一场景的部分数据作为仿真测试数据，设置迭代次数ite＝10次，其他参数设置相同，通过以上四个评价指标对LBG方法、矢量维数分割量化的超光谱图像压缩方法和本发明方案进行了实验对比，实验结果如下：

表1列出了Lunar Lake图像经过3种方法处理后的压缩质量比较；表2列出了Cuprite图像经过3种方法处理后的压缩质量比较；表3列出了Lunar Lake图像经过3种方法处理后的计算复杂度；表4列出了Cuprite图像经过3种方法处理后的计算复杂度；表5列出了Lunar Lake图像经过3种方法处理后的计算量分析；表6列出了Cuprite图像经过3种方法处理后的计算量分析。

表1.Lunar Lake图像经过3种方法处理后的压缩质量比较

表2.Cuprite图像经过3种方法处理后的压缩质量比较

表3.Lunar Lake图像经过3种方法处理后的各项计算量比较

表4.图像经过3种方法处理后的各项计算量比较

表5.Lunar Lake图像经过3种方法处理后的计算量分析

表6.Cuprite图像经过3种方法处理后的计算量分析

从实验结果可以看出：压缩质量方面，本文提出的压缩方案相比于其它两种方法(LBG方法和统一码书方法)，在不同基本码书尺寸下，压缩质量有不同程度的提升。以峰值性噪比指标为例。与LBG方法相比：Lunar Lake图像最少提高4.36dB在基本码书尺寸为1024时，最多提高4.90dB在基本码书尺寸为512时，平均提高4.62dB；Cuprite图像最少提高4.25dB在基本码书尺寸为1024时，最多提高5.00dB在基本码书尺寸为256时，平均提高4.63dB。与统一码书方法相比：Lunar Lake图像最少提高1.49dB在基本码书尺寸为1024时，最多提高2.25dB在基本码书尺寸为64时，平均提高1.93dB；Cuprite图像最少提高1.24dB在基本码书尺寸为1024时，最多提高2.54dB在基本码书尺寸为64时，平均提高1.85dB。总之，本文提出的压缩方案相比于LBG方法峰值信噪比平均提高4.62dB，而和统一码书方法相比，峰值信噪比平均提高1.89dB。从图1和图2，高光谱图像压缩质量与压缩比关系中也可以看出，在相同压缩比条件下，本文压缩方案的压缩质量明显优于其它两种方法。

计算复杂度方面，本文提出的压缩方案相比于其它两种方法(LBG方法和统一码书方法)，在不同基本码书尺寸下，计算复杂度总体上有较大地降低。与LBG方法相比：Lunar Lake图像和Cuprite图像的比较计算次数都略有增加，开平方计算次数平均增加0.57次，基本可忽略不计，但是本文方案的乘法计算次数平均仅为LBG方法的约2/1000，加法计算次数平均仅为LBG方法的约3/1000，计算复杂度的主要部分，乘法和加法计算次数得到大幅度减少。与统一码书方法相比：Lunar Lake图像和Cuprite图像的比较计算次数平均为统一码书方法的约1/2，开平方计算次数平均增加0.28次，基本可忽略不计，乘法计算次数平均仅为统一码书方法的约1/5，加法计算次数平均仅为统一码书方法的约3/10。总之，本文方案与LBG方法相比，比较计算略有增加，但是计算复杂度的主要部分，乘法计算和加法计算的次数都得到大幅度降低；本文方案与统一码书方法相比，比较、乘法和加法计算次数得到较大幅度减少。本文压缩方案的计算复杂度总体上明显低于其它两种方法。

综上所述，本文提出的压缩方案，与LBG方法和统一码书方法相比较，在相同压缩比条件下，明显降低了计算复杂度，提高了恢复图像的质量。能更快速有效地实现高光谱图像更高质量的压缩编码。高光谱图像信息丰富、应用价值大，但波段数多、数据量巨大，本文提出的压缩方案计算量更少，压缩失真更小，且操作流程较简单，具有实际应用的价值，可以作为高光谱图像的一种完整的快速的有损、近无损压缩方案。

Claims

1.一种压缩编码高光谱遥感图像的多层次码书矢量量化方法，其特征在于，读取高光谱图像三维数据，截取要压缩的子块转化为二维矩阵形式的原始矢量数据，将原始矢量数据分割为低维部分、中维部分、高维部分；然后对三部分矢量数据分别作哈达玛Hadamard变换和离散度排序预处理，得到预处理后的三部分矢量数据；对预处理后的三部分矢量数据分别截取矢量数据的前1/4维分量组成低维部分、中维部分、高维部分训练子矢量数据，剩余的3/4维分量作为对应部分的尾部子矢量数据；设置码书尺寸为多层次码书，对各部分训练子矢量数据进行矢量量化，得到迭代的训练子矢量码字索引和训练子矢量码书；根据训练子矢量码字索引分别对三部分尾部子矢量数据编码，得到三部分尾部子矢量码书和码字索引；分别整理各部分码书，得到三部分空域最终完整码书和最终码字索引，完成高光谱图像数据块的压缩编码。

2.根据权利要求1所述的方法，其特征在于，所述分割原则为：三部分矢量的维数分别都满足2的整数次幂，若不满足则在矢量末尾补零将维数扩展为最接近2的整数次幂，三部分矢量维数之和等于或接近原矢量维数。

3.根据权利要求1所述的方法，其特征在于，预处理具体为：对三部分矢量数据分别作Hadamard变换，将各部分矢量数据中每个行矢量右乘一个相同维数的Hadamard方阵；根据某维分量的最大值与最小值计算各部分矢量数据中该维分量的离散度；将各部分矢量的离散度值分别进行降序排序，记录排序索引，按照排序索引分别重新排列对应部分矢量数据的各维分量。

4.根据权利要求1所述的方法，其特征在于，设定码书尺寸为多层次码书具体为，根据基本码书尺寸N设定低维部分训练子矢量码书尺寸N₁、中维部分训练子矢量码书尺寸N₂、高维部分训练子矢量码书尺寸N₃，其中，N₁、N₂、N₃为N的倍数，N₁＞N₂＞N₃。

5.根据权利要求1所述的方法，其特征在于，进行矢量量化进一步包括：搜索每个训练子矢量的最佳匹配码字，并将训练子矢量划分到对应的胞腔中，记录对应的码字索引，直到所有的训练子矢量都训练完成，以各胞腔的质心代替原来胞腔对应的码字，保存最后一次迭代产生的低维训练子矢量码书和码字索引、中维训练子矢量码书和码字索引、高维训练子矢量码书和码字索引。

6.根据权利要求1所述的方法，其特征在于，进行矢量量化进一步包括：获取初始码书和初始码字索引，计算训练矢量集中的各训练子矢量的2范数，并将其按升序排序，记录排序索引，按照该索引重新排序各训练子矢量，对各训练子矢量平均分组后取每组最后一个组成初始码书，各训练子矢量的分组号作为其对应的初始码字索引。

7.根据权利要求1所述的方法，其特征在于，得到三部分尾部子矢量码书和码字索引具体为：将三部分训练子矢量码字索引作为对应部分的尾部子矢量编码索引，按照编码索引将所有尾部子矢量分配到各个胞腔中，以各胞腔的质心作为码字，得到各部分尾部子矢量码书。

8.根据权利要求1所述的方法，其特征在于，整理各部分码书具体包括，将训练子矢量码书作为前1/4维分量，尾部子矢量码书作为后3/4维分量，连接成对应部分的Hadamard变换域完整码书；再对各部分Hadamard变换域完整码书进行离散度反排序，Hadamard反变换得到各部分空域最终完整码书，将训练子矢量码字索引作为空域最终码字索引。

9.根据权利要求5所述的方法，其特征在于，搜索每个训练子矢量的最佳匹配码字进一步包括：按照当前训练矢量X对应的码字索引I(i)找到码书W中第I(i)个码字Y_op，计算X与Y_op之间的欧式距离作为当前最小失真按照Y_op为中心上下搜索，输入当前判断码字Y_j；计算D₁＝(Norm_X-Norm_Y(j))²，其中Norm_X为X的2范数，Norm_Y(j)为当前判断码字Y_j的2范数，若D₁≥D_min，且Norm_X≥Norm_Y(j)，则排除码字Y_k(k＝1,…,j)，若Norm_X≤Norm_Y(j)，则排除码字Y_k(k＝j,…,N)；若不满足D₁≥D_min，计算D₂＝(X₁-Y_j1)²+(V_X-V_Y(j))²，若不等式D₂≥D_min成立，则排除码字Y_j，否则，计算X与Y_j的累积失真

D_{q} (X, Y_{j}) = Σ_{k = 1}^{q} {(X_{k} - Y_{jk})}^{2} (q = 2, . . ., m),