WO2022041678A1

WO2022041678A1 - 张量协作图判别分析遥感图像特征提取方法

Info

Publication number: WO2022041678A1
Application number: PCT/CN2021/079598
Authority: WO
Inventors: 潘磊; 代翔; 杨露; 陈伟晴; 高翔
Original assignee: 西南电子技术研究所（中国电子科技集团公司第十研究所）
Priority date: 2020-08-30
Filing date: 2021-03-08
Publication date: 2022-03-03
Also published as: CN112101381A; US20230186606A1; CN112101381B

Abstract

一种张量协作图判别分析遥感图像特征提取方法：以每个像素为中心截取三维的张量数据块；按比例将实验数据划分成训练集和测试集；计算当前训练像素与每个类别训练数据的欧式距离，构建对角权重约束矩阵；然后，设计带约束的L2范数协作表示模型，构建图权重矩阵和张量局部保持投影模型；求取对应张量数据块每一个维度的投影矩阵；最后，利用低维投影矩阵得到三维低维表示的训练集和测试集，并按特征维展开成列向量的形式，将提取到的低维特征输入支持向量机分类器进行分类，判定测试集的类别，以分类效果评估特征提取的性能。

Description

张量协作图判别分析遥感图像特征提取方法

技术领域

本发明涉及图像处理领域的图像特征提取，具体涉及遥感图像的图判别分析特征提取技术，尤其是张量协作图判别分析遥感图像特征提取方法。

背景技术

在许多应用领域，特别是在云计算、移动互联网、大数据应用方面，会产生大量的高维高阶的数据，采用张量的数学形式能够恰当地表示这些具有多维结构的数据。这些数据往往含有大量的冗余信息，需要对其进行有效地降维。在模式识别中，特征提取(降维)和分类是两个关键步骤。大多经典的特征提取和分类的算法都是基于向量数据的，处理张量数据时需要将其向量化。张量数据向量化的过程会破坏数据的内部结构，维数也会显著增加，使算法的计算量和复杂度也显著增加。在模式识别中经常遇到张量形式的模式.如，灰度图像是二阶张量，彩色图像是三阶张量.为了处理的需要，数据常被人为组装成张量模式，如，环境监控中的数据可视为以时间、位置和类型为模式的三阶张量，网络图挖掘、网络辩论及人脸识别中都用到张量形式的模式。然而在传统统计模式识别中，数据一般采用向量模式表示，即无论原始数据是一维向量、两维矩阵还是高阶张量，几乎总是转换成对应的向量模式来处理。为了便于有效地分析和研究，往往需要对给定的遥感图像用更为简单明确的数值、符号或图形来表征，它们反映了图像中基本的重要的信息，称之为图像的特征。图像特征是图像分析的重要依据，获取图像特征信息的操作称为特征提取。它作为模式识别、图像理解或信息量压缩的基础是很重要的。图像特征的提取和选择是图像处理过程中很重要的环节，对后续图像分类有着重要的影响，并且对于图像数据具有样本少，维数高的特点，要从图像中提取有用的信息，必须对图像特征进行降维处理，特征提取与特征选择就是最有效的降维方法，其目的是得到一个反映数据本质结构、识别率更高的特征子空间。

随着遥感技术的发展，获得遥感图像的波段数不断增多，为我们了解地物提供了极其丰富的遥感信息，这有助于完成更加细致的遥感地物分类和目标识别，然而波段的增多也必然导致信息的冗余和数据处理复杂度的增加。虽然每一种图像数据都可能包含了一些用于自动分类的信息，但就某些指定的地物分类而言，并不是所获得的全部波段图像数据都可用。由于图像中同一类别的光谱差异，造成训练样本并没有很好的代表性。训练样本的选取和评估需花费较多的人力、时间。如果不加区别地将大量原始图像直接用来分类，不仅数据量太大，计算复杂，而且分类的效果也不一定好。由于图像中各类别的光谱特征会随时间、地形等变化，不同图像以及不同时段的图像之间的光谱集群组无法保持其连续性，从而使其不同图像之间的对比变得困难。传统的人工解译遥感影像的方式已经很难应用，取而代之的是计算机全自动提取遥感影像信息的方法。但是相应的数据处理算法普遍存在自适应能力不足的缺点。为了有效地实现分类识别，必须对原始采样数据进行变换，得到最能反映本质的特征，这就是特征提取和选择的过程。所谓的高光谱图像特征提取是指在去除冗余、保留有效信息的基础上对光谱维进行维数约减，以降低数据的复杂度。高光谱图像分类是指利用不同地物具有不同的光谱特征信息，来区分图像中不同地物的类别。

高光谱遥感对地观测技术为地物探测提供精细化的影像数据，高光谱图像为多光谱图像，包含几十甚至上百个具有丰富光谱特征的连续波段，这些数据不但包含了丰富的地物光谱信息，还包含了分辨率越来越高的空间结构信息。然而波段的增多也必然导致信息的冗余和数据处理复杂度的增加。高光谱图像的这些波段之间具有很强的相关性，不仅带来了极大的信息冗余，也增加了高光谱数据分类的计算负担。此外，样本维数高、数量少所导致的“Hughes现象”(也称为维数的诅咒)，也使得高光谱数据分类更具挑战性。因此，特征提取成为了高光谱图像分析的关键预处理步骤。

通常，根据是否使用样本先验信息，将特征提取方法大致地分为无监督和有监督两种类型。主成分分析(Principal Component Analysis,PCA)是一种最经典的无监督特征提取方法，其目的是寻找一个使得数据方差最大化的线性变换矩阵，以将数据蕴含的重要信息保留在投影得到的低维特征中。由于未使用样本的的先验标签信息，无监督方法的性能通常难以满足实际应用需求。为了利用数据的先验信息进一步提高数据处理性能，学者在有监督特征提取方面做了大量的研究工作。线性判别分析(Linear Discriminant Analysis,LDA)是最经典有监督特征提取方法，其目标是寻找一个投影变换，使得投影得到的子空间中作为瑞利商的Fisher比值最大，以增强低维特征的可分性。然而，在小样本情况下(small-sample-size,SSS)，LDA的性能通常欠佳。在高光谱遥感影像分类问题中，由于训练样本数量常常远小于光谱特征维数，因此，直接使用常规的线性判别分析算法必然会遭遇到上述小样本问题。为了解决这一问题，研究学者基于LDA提出了大量的判别分析方法。随着稀疏表示(Sparse Representation，SR)在人脸识别方向的成功应用，大量研究学者将稀疏表示引入高光谱图像特征提取与分类领域，提出了稀疏图嵌入、稀疏图判别分析等方法，在特征提取的性能上取得较大突破。后来，基于低秩表示理论提出了低秩图嵌入的方法。

实际上，前面介绍的特征提取方法都是在向量空间的基础上发展而来的，在高光谱图像分析中通常是以光谱向量作为基本研究单位的。然而，研究表明空间信息在高光谱图像处理中起着至关重要的作用，充分利用其空间结构信息能够提高高光谱图像的特征提取和分类性能。因而，结合空间信息开展高光谱图像特征提取研究成为研究热点。早期基于空谱特征的降维方法同时考虑空间信息和光谱信息虽然在一定程度上带来性能的提升，但这些方法需将空谱特征向转化为向量形式进行分析，通常会造成局部像素之间的空间联系丢失。

尽管人们提出了很多特征提取算法，但现有的特征提取算法基本上还处于实验阶段，其准确性、实用性、通用性等方面离大规模实际应用的要求还有很大差距。综合来看，现有的高光谱图像特征提取算法尚存在两个问题：(1)特征提取算法模型的复杂度过高，以L1范数为基础的稀疏图嵌入和以核范数为基础的低秩图嵌入在求解图权重矩阵的过程中涉及复杂的求解过程；(2)高光谱图像空间信息利用不充分，部分方法通过局部正则化的方式保持像素的局部信息，空间信息的利用存在局限性。

发明内容

本发明至少部分实施例提供了一种复杂度低、特征提取性能好的有监督特征提取方法，以至少部分地解决相关技术中针对高光谱数据光谱维度高、信息冗余大及现有方法复杂度高、空间信息挖掘不充分等问题。

在本发明其中一实施例中，提供了一种张量协作图判别分析遥感图像特征提取方法，包括如下步骤：

首先，设定正方形的滑动窗口尺寸，将高光谱数据的第一个像素作为起点，以每个像素为中心截取得到三维的张量数据块；根据得到的数据块按比例将实验数据划分成训练集和测试集，并将每个数据块按光谱维展开成一个列向量；计算当前训练像素与每个类别训练数据的欧式距离，进而构建对角权重约束矩阵；然后，设计带约束的L2范数协作表示模型，计算当前训练像素在每个类别训练数据下的表示系数，构建图权重矩阵和张量局部保持投影模型；通过张量局部保持投影模型求得对应张量数据块每一个维度的投影矩阵；最后，利用低维投影矩阵得到三维低维表示的训练集和测试集，并按特征维展开成列向量的形式，将提取到的低维特征输入支持向量机分类器进行分类，判定测试集的类别，以分类效果评估特征提取的性能。

本发明实施例相比于现有技术的技术效果在于：

(1)本发明实施例从算法复杂度和空间信息挖掘两个方面，构建了一种张量协作图判别分析特征提取模型，技术着眼于L2范数稀疏约束、权重约束矩阵、张量表示等前沿的数学理论，并给出了模型的优化求解。

(2)本发明实施例利用L2范数构建带约束的协作表示模型来求解训练集中每个像素的表示系数。与稀疏图判别分析模型相比，基于L2范数的协作表示模型通过模型求导可以得到闭式解，避免了稀疏图模型中L1范数的正交匹配追踪方法求解的高复杂度；与协作图判别分析模型相比，本发明实施例设计了权重约束矩阵，可以约束模型尽可能选择与当前像素相似的训练数据进行表示，改善了表示系数的质量。

(3)本发明实施例以张量分析的数学理论为工具，针对基于张量数据的特征提取和分类算法现有的一些问题，采用张量表示的方法挖掘高光谱数据的空间结构信息。高光谱数据，是由两个空间维和一个光谱维组成的三维立体数据与三阶张量非常契合。因此采用张量数据块的方式进行协作表示运算，能够更好地保留数据的空间邻域信息，提升表示系数的准确性。

本发明实施例的核心是构建带权重约束的张量协作表示模型，实现高光谱数据的光谱信息和空间信息的有效挖掘，提升了低维特征的判别能力。只要是有关图像特征提取或降维，本发明都是有效的。仿真实验表明，本发明实施例在高光谱图像特征提取的性能上明显优于稀疏图判别分析方法、协作图判别分析方法以及其它的空谱特征提取方法。

本发明实施例适用于高光谱图像特征提取。

附图说明

图1是根据本发明其中一实施例的张量协作图判别分析遥感图像特征提取示意图；

图2是根据本发明其中一实施例的张量协作图判别分析图像特征提取流程图；

图3是根据本发明其中一实施例的三阶张量的模3展开示意图；

为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本发明进一步详细说明。

具体实施方式

参阅图1-图3。根据本发明其中一实施例，首先，设定正方形的滑动窗口尺寸，将高光谱数据的第一个像素作为起点，以每个像素为中心截取得到三维的张量数据块；根据得到的数据块按比例将实验数据划分成训练集和测试集，并将每个数据块按光谱维展开成一个列向量；计算当前训练像素与每个类别训练数据的欧式距离，进而构建对角权重约束矩阵；然后，设计带约束的L2范数协作表示模型，计算当前训练像素在每个类别训练数据下的表示系数，构建图权重矩阵和张量局部保持投影模型；通过张量局部保持投影模型求得对应张量数据块每一个维度的投影矩阵；最后，利用低维投影矩阵得到三维低维表示的训练集和测试集，并按特征维展开成列向量的形式，将提取到的低维特征输入支持向量机分类器进行分类，判定测试集的类别，以分类效果评估特征提取的性能。

参阅图2。本发明实施例具体包括以下步骤：

步骤1，在可选实施例中，将输入的原始高光谱数据

按设置的滑动窗口尺寸切割成三阶张量块，根据一定的比例将张量数据块划分为训练集和测试集，其中A和B分别表示高光谱数据的两个空间维，D表示高光谱数据的光谱维，R表示实数空间。

滑动窗口尺寸设置为w×w，则切割的一个三阶张量数据块可以表示为

根据比例划分得到的训练集由包含了C个类别的N个样本组成，表示为

第l类的样本表示为

其中l＝1,2,…，C，

其中，

表示训练集中的第i个数据块，1≤i≤N，N _l表示第l类的训练样本个数，

表示第l类的训练中的第i个数据块。

测试集由M个样本组成，表示为

其中，

表示第j个测试数据块，1≤j≤M。

参见图3。步骤2，在权重约束矩阵构建中，将训练集中的数据块按类别划分成C个子数据集，第l个子数据集为

共有Nl个样本，将第l个子数据集

中的第i个样本

按模3展开成向量形式

与第l类子数据集中第j个样本的欧式距离为

最终获得(N _l-1)个欧式距离，其中，1≤j≤N _l,j≠i，||·|| ₂表示L2范数。本发明实施例采用类内表示的方法，因此，在计算欧式距离

时不包含

与其自身的欧式距离。将(N _l-1)个欧式距离作为对称矩阵的对角线元素，构建如下所示第l类的权重约束矩阵

步骤3，在带权重约束的协作表示模型构建中，采用L2范数实现训练样本

表示系数的稀疏约束，降低模型的复杂度，同时以权重约束矩阵提升表示系数的表示能力。本实施例采用类内表示的方法，即训练样本

仅用同属于第l类的样本进行表示学习，带权重约束的协作表示模型构建如下：

其中，arg min表示目标函数的最小值，

表示字典，其中的元素包含去掉

的(N _l-1)个样本，样本的维度为Dw ²，

表示矩阵L2范数的平方，

表示

以X ^l′为字典时的表示系数，λ表示正则化参数。

步骤4，带权重约束的协作表示模型求解。协作表示模型以L2范数为基础，采用求导的方式，即可得到表示系数

的最优解

其中，T表示矩阵的转置，(·) ^-1表示矩阵的逆。

步骤5，在图权重矩阵构建中，根据表示系数

得到第 _l类的图权重系数表示为

最终由训练样本构建的图权重矩阵为

其中，W _i表示第i类的类内权重矩阵，i＝1,2,…,C，C表示高光谱数据中的类别总数。

步骤6，在投影矩阵求解中，本实施例采用张量局部保持投影算法求解高光谱数据块中三个维度的投影，如下表达式所示，

其中，min表示目标函数最小值，∑表示求和运算，

表示第i个数据块按第n模运算，× _n表示第n模相乘，U _n表示第n模上的投影矩阵，W _i,j表示图权重矩阵的行号为i、列号位j的元素，Tr(·)表示矩阵的迹，

表示第i个数据块的n模展开。

步骤7，在计算训练集和测试集的低维特征中，根据步骤6中求得的三个维度上的投影矩阵U ₁、U ₂、U ₃，计算训练集和测试集的低维特征：

其中

和

分别表示训练集

和测试集

的低维特征。

步骤8，采用支持向量机分类器计算特征提取后测试集样本的类别，使用训练集的低维特征

训练支持向量机分类器，随后对测试集低维特征

进行分类，以测试集样本类别分类的准确率评估特征提取算法的性能。

以上所述的具体实施例，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施例而已，并不用于限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

一种张量协作图判别分析遥感图像特征提取方法，包括：

设定正方形的滑动窗口尺寸，将输入的原始高光谱数据的第一个像素作为起点，以每个像素为中心截取得到三维的张量数据块；根据得到的数据块按比例将实验数据划分成训练集和测试集，并将每个数据块按光谱维展开成一个列向量；计算当前训练像素与每个类别训练数据的欧式距离，进而构建对角权重约束矩阵；设计带约束的L2范数协作表示模型，计算当前训练像素在每个类别训练数据下的表示系数，构建图权重矩阵和张量局部保持投影模型；通过张量局部保持投影模型求得对应张量数据块每一个维度的投影矩阵；利用低维投影矩阵得到三维低维表示的训练集和测试集，并按特征维展开成列向量的形式，将提取到的低维特征输入支持向量机分类器进行分类，判定测试集的类别，以分类效果评估特征提取的性能。
如权利要求1所述的张量协作图判别分析遥感图像特征提取方法，其中：输入的原始高光谱数据
按设置的滑动窗口尺寸切割成三阶张量块，其中A和B分别表示高光谱数据的两个空间维，D表示高光谱数据的光谱维，R表示实数空间。
如权利要求1所述的张量协作图判别分析遥感图像特征提取方法，其中：滑动窗口尺寸设置为w×w，则切割的一个三阶张量数据块表示为
根据比例划分得到的训练集由包含了C个类别的N个样本组成，表示为
第l类的样本表示为
其中l＝1,2,…,C，
其中，
表示训练集中的第i个数据块，1≤i≤N，N _l表示第l类的训练样本个数，
表示第l类的训练中的第i个数据块。
如利要求3所述的张量协作图判别分析遥感图像特征提取方法，其中：测试集由M个样本组成，表示为
其中，
表示第j个测试数据块，1≤j≤M。
如权利要求1所述的张量协作图判别分析遥感图像特征提取方法，其中：在权重约束矩阵构建中，将训练集中的数据块按类别划分成C个子数据集，第l个子数据集为
共有N _l个样本，将第l个子数据集
中的第i个样本
按模3展开成向量形式
与第l类子数据集中第j个样本的欧式距离为
获得(N _l-1)个欧式距离，其中，1≤j≤N _l,j≠i，||·|| ₂表示L2范数。
如权利要求1所述的张量协作图判别分析遥感图像特征提取方法，其中：在计算欧式距离
时不包含
与其自身的欧式距离，将(N _l-1)个欧式距离作为对称矩阵的对角线元素，构建如下所示第l类的权重约束矩阵
如权利要求1所述的张量协作图判别分析遥感图像特征提取方法，其中：在带权重约束的协作表示模型构建中，采用L2范数实现训练样本
表示系数的稀疏约束，降低模型的复杂度，同时以权重约束矩阵提升表示系数的表示能力。本实施例采用类内表示的方法，即训练样本
仅用同属于第l类的样本进行表示学习，带权重约束的协作表示模型构建如下：

其中，arg min表示目标函数的最小值，
表示字典，其中的元素包含去掉
的(N _l-1)个样本，样本的维度为Dw ²，
表示矩阵L2范数的平方，

表示
以X ^l′为字典时的表示系数，λ表示正则化参数。
如权利要求1所述的张量协作图判别分析遥感图像特征提取方法，其中：协作表示模型以L2范数为基础，采用求导的方式，即可得到表示系数
的最优解

其中，T表示矩阵的转置，(·) ^-1表示矩阵的逆。
如权利要求1所述的张量协作图判别分析遥感图像特征提取方法，其中：在投影矩阵求解中，采用张量局部保持投影算法求解高光谱数据块中三个维度的投影，如下表达式所示，

其中，min表示目标函数最小值，∑表示求和运算，
表示第i个数据块按第n模运算，× _n表示第n模相乘，U _n表示第n模上的投影矩阵，W _i,j表示图权重矩阵的行号为i、列号位j的元素，Tr(·)表示矩阵的迹，
表示第i个数据块的n模展开。
如权利要求1所述的张量协作图判别分析遥感图像特征提取方法，其中：在计算训练集和测试集的低维特征中，根据步骤6中求得的三个维度上的投影矩阵U ₁、U ₂、U ₃，计算训练集和测试集的低维特征：
其中
和
分别表示训练集
和测试集
的低维特征。