CN110443296B

CN110443296B - 面向高光谱图像分类的数据自适应激活函数学习方法

Info

Publication number: CN110443296B
Application number: CN201910696238.5A
Authority: CN
Inventors: 魏巍; 李宇; 张锦阳; 王聪; 张艳宁
Original assignee: Northwestern Polytechnical University
Current assignee: Northwestern Polytechnical University
Priority date: 2019-07-30
Filing date: 2019-07-30
Publication date: 2022-05-06
Anticipated expiration: 2039-07-30
Also published as: CN110443296A

Abstract

本发明公开了一种面向高光谱图像分类的数据自适应激活函数学习方法，用于解决现有高光谱图像分类方法准确率差的技术问题。技术方案是利用高光谱数据的光谱信息和空间信息，旨在学习基于特定数据的激活函数来进行高光谱图像分类。通过对常见的激活函数进行分析，发现激活函数可以用激活映射与输入特征相乘的方式来表示。因此，本发明通过构建一个两层的神经网络来学习激活映射。神经网络从通道和光谱两方面进行学习，分别构建了符合二者特性的激活函数，从而提高了图像分类准确率。经测试，在Indian Pines数据集上，基于通道和光谱的激活函数的分类准确率分别平均提高2.17％和4.03％。

Description

面向高光谱图像分类的数据自适应激活函数学习方法

技术领域

本发明涉及一种高光谱图像分类方法，特别是涉及一种面向高光谱图像分类的数据自适应激活函数学习方法。

背景技术

高光谱图像(Hyperspectral Image，HSI)同时包含细致的空间信息和丰富的光谱信息，被广泛用于地形分类、环境检测和地质调查等遥感领域。高光谱图像分类是高光谱图像分析中的一项重要任务，目的是为每个像素分配一个定义过的标签，其可以被简单划分为传统的机器学习方法和深度学习方法。传统的机器学习方法包括支持向量机(Supportvector machine，SVM)、多项式逻辑回归(Multinomial logistic regression，MLR)等，虽然这些方法简单有效，但是浅层结构使它们无法在具有挑战性的情况下学习足够有用的特征。深度学习方法以其强大的特征表达能力在高光谱分类中占据主导地位，其中卷积神经网络被广泛应用。卷积神经网络(Convolutional Neural Network，CNN)通常包括卷积层、池化层和激活函数，其中激活函数的作用是将非线性因素引入到神经网络中，从而能够达到逼近任意非线性模型的目的，以提高分类器性能。

文献“Slavkovikj V,Verstockt S,De Neve W,et al.Hyperspectral imageclassification with convolutional neural networks[C]//Proceedings of the 23rdACM international conference on Multimedia.ACM,2015:1159-1162.”使用卷积神经网络对高光谱数据进行分类。其使用双曲正切函数(Tanh)作为激活函数，尽管得到的随机梯度下降(Stochastic gradient descent,SGD)的收敛速度相对较快，但是由于Tanh是预先定义的函数，由固定的数学公式表达且被应用于所有数据，没有充分考虑到数据本身的特性，从而降低了高光谱图像分类的准确率。如果激活函数能够更好的适应特定的数据集，就可以获得最佳的分类效果。

发明内容

为了克服现有高光谱图像分类方法准确率差的不足，本发明提供一种面向高光谱图像分类的数据自适应激活函数学习方法。该方法利用高光谱数据的光谱信息和空间信息，旨在学习基于特定数据的激活函数来进行高光谱图像分类。通过对常见的激活函数进行分析，发现激活函数可以用激活映射与输入特征相乘的方式来表示。因此，本发明通过构建一个两层的神经网络来学习激活映射。神经网络从通道和光谱两方面进行学习，分别构建了符合二者特性的激活函数，从而提高了图像分类准确率。

本发明解决其技术问题所采用的技术方案是：一种面向高光谱图像分类的数据自适应激活函数学习方法，其特点是包括以下步骤：

步骤一、定义三维高光谱数据为

包含r行、c列和b个波段。为了简便，将

重排为二维矩阵

n＝r×c表示像素数目，并且

对于给定的高光谱数据，采用四层卷积神经网络对其进行分类，每一层卷积神经网络中嵌入所提出的激活函数。卷积操作Conv(·)如下：

其中，

为卷积操作，

表示卷积核，

表示需要进行卷积操作的像素点，num为卷积核大小，weight_j为卷积操作的权重，

表示卷积后特征图的像素点，b'表示经过卷积操作后像素点的光谱维度。对输入数据进行卷积后，得到卷积层的输出特征

m表示卷积核的数目。

所建立的卷积神经网络分类器的结构为，第一层卷积层，输出空间的维度为32，一维卷积窗口的大小为8，卷积步长为3，padding设置为valid，并用所提激活函数激活；第二层卷积层，输出空间的维度为64，一维卷积窗口的大小为3，卷积步长为2，padding设置为valid，并用所提激活函数激活；第三层卷积层，输出空间的维度为128，一维卷积窗口的大小为3，卷积步长为2，padding设置为valid，并用所提激活函数激活；全连接层输出空间的维度为输入数据的类别数。分类器使用SGD及Adam优化器对交叉熵损失函数进行优化。

步骤二、建模基于通道的激活函数，并将其嵌入在卷积神经网络分类器中。将卷积神经网络分类器中每一层卷积操作后的输出作为激活函数的输入

首先根据公式(1)使用卷积操作Conv(·)基于

提取浅层特征得到

b_channel表示激活函数学习模块中卷积后的光谱维数，c_channel示卷积后的通道数。

接着对其使用平均池化操作AvgPool(·)进行聚合，原始特征的通道信息被完全保留，通过收缩光谱维度b_channel，f_c的第c_j个通道由下式池化：

将池化后的特征

映射到全连接层FC(·)，得到基于特征的通道信息的激活映射

G_c(f)＝σ(FC(AvgPool(Conv(f)))) (3)

这里，σ(·)表示Sigmoid激活函数。

在基于通道的激活函数建模过程中，所使用的网络结构为：卷积层输出空间的维度为

一维卷积窗口的大小为

卷积步长为1，padding设置为valid，并用Sigmoid激活函数激活；全连接层全连接层输出空间的维度为m。

步骤三、建模基于光谱的激活函数，并将其嵌入在卷积神经网络分类器中。同样，将卷积神经网络分类器中每一层卷积操作后的输出作为激活函数的输入

使用平均池化AvgPool(·)聚合通道信息，以便于简化特征提取，通过收缩通道维度m，f的第b'_j个光谱波段由下式池化：

将保留了光谱信息的特征

映射到多层感知机MLP(·)，从而学习到基于特征的光谱信息的激活映射

G_s(f)＝σ(MLP(AvgPool(f))) (5)

在基于通道的激活函数建模过程中，MLP(·)使用的网络结构为：第一层全连接层输出空间的维度为

第二层全连接层输出空间的维度为b'。

步骤四、将学习到的激活映射与原始特征相乘，即得到针对特定数据的激活函数

基于通道的激活函数由以下公式得到：

这里，操作

表示矩阵乘法。

基于光谱的激活函数由以下公式得到：

本发明的有益效果是：该方法利用高光谱数据的光谱信息和空间信息，旨在学习基于特定数据的激活函数来进行高光谱图像分类。通过对常见的激活函数进行分析，发现激活函数可以用激活映射与输入特征相乘的方式来表示。因此，本发明通过构建一个两层的神经网络来学习激活映射。神经网络从通道和光谱两方面进行学习，分别构建了符合二者特性的激活函数，从而提高了图像分类准确率。

本发明使用两层的神经网络，充分应用高光谱数据的通道信息和光谱信息，分别从通道、光谱的两个方面学习激活映射。由此，可以学习到针对特定的高光谱数据的激活函数，这些函数没有固定的表达式，随着不同数据的变化而变化，这也能更加充分的考虑到某个特定数据集的数据特性。对比现有主流的激活函数：Sigmoid、Tanh和ReLU，本发明在三个基准数据集上，均取得了较好的分类结果。在三个数据集上分别以全局分类准确率(Overall accuracy，OA)为基准对以上方法进行评估。在IndianPines数据集上，基于通道和光谱的激活函数的分类准确率分别平均提高2.17％、4.03％，在Salinas数据集上，基于通道和光谱的激活函数的分类准确率分别平均提高1.14％、1.33％，在Botswana数据集上，基于通道和光谱的激活函数的分类准确率分别平均提高1.09％、1.51％。

下面结合具体实施方式对本发明作详细说明。

具体实施方式

CNN是一个性能良好的非线性分类器，包括卷积层、全连接层和激活函数。其中激活函数的优化大大提高了模型的计算性能。常用的激活函数包括Sigmoid、Tanh和ReLU等函数，其中ReLU由于实际计算中具备的高性能而在多种人工神经网络得到了广泛应用。

上述激活函数适用于任何数据

(w表示图像的宽，h表示图像的高，ch表示图像的通道数)，因此ReLU激活函数可以用下述公式来进行表述：

公式(9)也可以表述为：

其中

操作表示元素乘法，I(X)是用来表明变量X对于集合依赖性的指示函数，表示激活函数的映射是固定的且有限制的。因此使用更加通用的函数G(X)来表示激活函数的映射，该函数包括但不限于I(X)，其可通过CNN拟合得到。因此，进一步将公式(9)泛化为：

f(X)表示分类器网络中的使用的激活函数，X是激活函数的输入数据。事实上，ReLU和其他的多种激活函数都可以按照公式(10)的形式进行公式化表达。核心思想即为对CNN不同层提出了一个更为具体化和有针对性的映射表达G(X)，以提高整个CNN的分类准确率。

设计两层神经网络来模拟映射函数G(X)，具体实现方式分为基于通道的激活函数映射学习和基于光谱的激活函数映射学习。

本发明面向高光谱图像分类的数据自适应激活函数学习方法具体步骤如下：

步骤一、数据自适应的激活函数。

三维高光谱图像通常被定义为

其中r表示行数，c表示列数，b表示光谱维度。为了方便，将

重新排列为二维矩阵

这里n＝r×c表示像素数并且

对于给定的像素h_i∈H，利用卷积神经网络对其进行分类。用于分类的卷积神经网络包含四层卷积层，卷积操作Conv(·)具体如下：

其中，

表示卷积核，

(b'表示经过卷积操作后像素点的光谱维度)表示经过卷积操作后的特征图中的像素点。对全部输入数据经过卷积操作后，即可得到卷积层的输出特征

(也即激活函数的输入)，m表示卷积核的数目。

所建立的卷积神经网络分类器的结构为：第一层卷积层，输出空间的维度为32，一维卷积窗口的大小为8，卷积步长为3，padding设置为valid，并用所提激活函数激活；第二层卷积层，输出空间的维度为64，一维卷积窗口的大小为3，卷积步长为2，padding设置为valid，并用所提激活函数激活；第三层卷积层，输出空间的维度为128，一维卷积窗口的大小为3，卷积步长为2，padding设置为valid，并用所提激活函数激活；全连接层输出空间的维度为输入数据的类别数。

下面，通过h_conv作为示例来查看如何分别建模数据自适应的激活函数，为方便起见，将每一层卷积后的输出作为激活函数的输入

步骤二、基于通道的激活函数映射学习。

首先，对图像的原始特征f执行卷积操作以提取低级特征，通过卷积操作Conv(·)即可得到中间特征

这里b_channel表示激活函数学习模块中卷积后的光谱维数，c_channel示卷积后的通道数。

由于在之前的HSI分类任务中平均池化被验证有较好的性能，使用平均池化AvgPool(·)来聚合中间特征f_c的光谱信息，以f_c的第c_j通道为例：

因此可以得到一个新特征

接着基于此特征，使用一层全连接层FC(·)来合并学习到的特征并得到最终的基于通道的激活映射

G_c(f)＝σ(FC(AvgPool(Conv(f)))) (3)

这里，σ(·)是Sigmoid激活函数。

在基于通道的激活函数建模过程中，所使用的网络结构为：卷积层，输出空间的维度为

一维卷积窗口的大小为

步骤三、基于光谱的激活函数映射学习。

同样采用平均池化操作AvgPool(·)来聚合特征

的通道信息，以保留特征的光谱信息。以f的第b'_j波段为例：

将保留了光谱信息的特征

映射到多层感知机MLP(·)(Multilayerperceptron，MLP)，从而学习到基于特征的光谱信息的激活映射

G_s(f)＝σ(MLP(AvgPool(f))) (5)

在基于通道的激活函数建模过程中，MLP(·)使用的网络结构为：第一层全连接层，输出空间的维度为

第二层全连接层全连接层输出空间的维度为b'。

步骤四、激活函数。

将学习到的激活映射与原始特征相乘，即得到针对特定数据的激活函数

如基于通道的激活函数可由以下公式得到：

这里，操作

表示矩阵乘法。

基于光谱的激活函数可由以下公式得到：

对比现有主流的激活函数：Sigmoid、Tanh和ReLU，本发明在三个基准数据集上，均取得了较好的分类结果。在三个数据集上分别以全局分类准确率(Overall accuracy，OA)为基准对以上方法进行评估。在Indian Pines数据集上，基于通道和光谱的激活函数的分类准确率分别平均提高2.17％、4.03％，在Salinas数据集上，基于通道和光谱的激活函数的分类准确率分别平均提高1.14％、1.33％，在Botswana数据集上，基于通道和光谱的激活函数的分类准确率分别平均提高1.09％、1.51％。

Claims

1.一种面向高光谱图像分类的数据自适应激活函数学习方法，其特征在于包括以下步骤：

步骤一、定义三维高光谱数据为

包含r行、c列和b个波段；为了简便，将

重排为二维矩阵

n＝r×c表示像素数目，并且

对于给定的高光谱数据，采用四层卷积神经网络对其进行分类，每一层卷积神经网络中嵌入激活函数；卷积操作Conv(·)如下：

其中，

为卷积操作，

表示卷积核，

表示卷积后特征图的像素点，b'表示经过卷积操作后像素点的光谱维度；对输入数据进行卷积后，得到卷积层的输出特征

m表示卷积核的数目；

所建立的卷积神经网络分类器的结构为，第一层卷积层，输出空间的维度为32，一维卷积窗口的大小为8，卷积步长为3，padding设置为valid，并用激活函数激活；第二层卷积层，输出空间的维度为64，一维卷积窗口的大小为3，卷积步长为2，padding设置为valid，并用激活函数激活；第三层卷积层，输出空间的维度为128，一维卷积窗口的大小为3，卷积步长为2，padding设置为valid，并用激活函数激活；全连接层输出空间的维度为输入数据的类别数；分类器使用SGD及Adam优化器对交叉熵损失函数进行优化；

步骤二、建模基于通道的激活函数，并将其嵌入在卷积神经网络分类器中；将卷积神经网络分类器中每一层卷积操作后的输出作为激活函数的输入