CN110443296B - 面向高光谱图像分类的数据自适应激活函数学习方法 - Google Patents
面向高光谱图像分类的数据自适应激活函数学习方法 Download PDFInfo
- Publication number
- CN110443296B CN110443296B CN201910696238.5A CN201910696238A CN110443296B CN 110443296 B CN110443296 B CN 110443296B CN 201910696238 A CN201910696238 A CN 201910696238A CN 110443296 B CN110443296 B CN 110443296B
- Authority
- CN
- China
- Prior art keywords
- convolution
- activation function
- layer
- activation
- channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种面向高光谱图像分类的数据自适应激活函数学习方法,用于解决现有高光谱图像分类方法准确率差的技术问题。技术方案是利用高光谱数据的光谱信息和空间信息,旨在学习基于特定数据的激活函数来进行高光谱图像分类。通过对常见的激活函数进行分析,发现激活函数可以用激活映射与输入特征相乘的方式来表示。因此,本发明通过构建一个两层的神经网络来学习激活映射。神经网络从通道和光谱两方面进行学习,分别构建了符合二者特性的激活函数,从而提高了图像分类准确率。经测试,在Indian Pines数据集上,基于通道和光谱的激活函数的分类准确率分别平均提高2.17%和4.03%。
Description
技术领域
本发明涉及一种高光谱图像分类方法,特别是涉及一种面向高光谱图像分类的数据自适应激活函数学习方法。
背景技术
高光谱图像(Hyperspectral Image,HSI)同时包含细致的空间信息和丰富的光谱信息,被广泛用于地形分类、环境检测和地质调查等遥感领域。高光谱图像分类是高光谱图像分析中的一项重要任务,目的是为每个像素分配一个定义过的标签,其可以被简单划分为传统的机器学习方法和深度学习方法。传统的机器学习方法包括支持向量机(Supportvector machine,SVM)、多项式逻辑回归(Multinomial logistic regression,MLR)等,虽然这些方法简单有效,但是浅层结构使它们无法在具有挑战性的情况下学习足够有用的特征。深度学习方法以其强大的特征表达能力在高光谱分类中占据主导地位,其中卷积神经网络被广泛应用。卷积神经网络(Convolutional Neural Network,CNN)通常包括卷积层、池化层和激活函数,其中激活函数的作用是将非线性因素引入到神经网络中,从而能够达到逼近任意非线性模型的目的,以提高分类器性能。
文献“Slavkovikj V,Verstockt S,De Neve W,et al.Hyperspectral imageclassification with convolutional neural networks[C]//Proceedings of the 23rdACM international conference on Multimedia.ACM,2015:1159-1162.”使用卷积神经网络对高光谱数据进行分类。其使用双曲正切函数(Tanh)作为激活函数,尽管得到的随机梯度下降(Stochastic gradient descent,SGD)的收敛速度相对较快,但是由于Tanh是预先定义的函数,由固定的数学公式表达且被应用于所有数据,没有充分考虑到数据本身的特性,从而降低了高光谱图像分类的准确率。如果激活函数能够更好的适应特定的数据集,就可以获得最佳的分类效果。
发明内容
为了克服现有高光谱图像分类方法准确率差的不足,本发明提供一种面向高光谱图像分类的数据自适应激活函数学习方法。该方法利用高光谱数据的光谱信息和空间信息,旨在学习基于特定数据的激活函数来进行高光谱图像分类。通过对常见的激活函数进行分析,发现激活函数可以用激活映射与输入特征相乘的方式来表示。因此,本发明通过构建一个两层的神经网络来学习激活映射。神经网络从通道和光谱两方面进行学习,分别构建了符合二者特性的激活函数,从而提高了图像分类准确率。
本发明解决其技术问题所采用的技术方案是:一种面向高光谱图像分类的数据自适应激活函数学习方法,其特点是包括以下步骤:
步骤一、定义三维高光谱数据为包含r行、c列和b个波段。为了简便,将重排为二维矩阵n=r×c表示像素数目,并且对于给定的高光谱数据,采用四层卷积神经网络对其进行分类,每一层卷积神经网络中嵌入所提出的激活函数。卷积操作Conv(·)如下:
其中,为卷积操作,表示卷积核,表示需要进行卷积操作的像素点,num为卷积核大小,weightj为卷积操作的权重,表示卷积后特征图的像素点,b'表示经过卷积操作后像素点的光谱维度。对输入数据进行卷积后,得到卷积层的输出特征m表示卷积核的数目。
所建立的卷积神经网络分类器的结构为,第一层卷积层,输出空间的维度为32,一维卷积窗口的大小为8,卷积步长为3,padding设置为valid,并用所提激活函数激活;第二层卷积层,输出空间的维度为64,一维卷积窗口的大小为3,卷积步长为2,padding设置为valid,并用所提激活函数激活;第三层卷积层,输出空间的维度为128,一维卷积窗口的大小为3,卷积步长为2,padding设置为valid,并用所提激活函数激活;全连接层输出空间的维度为输入数据的类别数。分类器使用SGD及Adam优化器对交叉熵损失函数进行优化。
接着对其使用平均池化操作AvgPool(·)进行聚合,原始特征的通道信息被完全保留,通过收缩光谱维度bchannel,fc的第cj个通道由下式池化:
Gc(f)=σ(FC(AvgPool(Conv(f)))) (3)
这里,σ(·)表示Sigmoid激活函数。
在基于通道的激活函数建模过程中,所使用的网络结构为:卷积层输出空间的维度为一维卷积窗口的大小为卷积步长为1,padding设置为valid,并用Sigmoid激活函数激活;全连接层全连接层输出空间的维度为m。
步骤三、建模基于光谱的激活函数,并将其嵌入在卷积神经网络分类器中。同样,将卷积神经网络分类器中每一层卷积操作后的输出作为激活函数的输入使用平均池化AvgPool(·)聚合通道信息,以便于简化特征提取,通过收缩通道维度m,f的第b'j个光谱波段由下式池化:
Gs(f)=σ(MLP(AvgPool(f))) (5)
基于光谱的激活函数由以下公式得到:
本发明的有益效果是:该方法利用高光谱数据的光谱信息和空间信息,旨在学习基于特定数据的激活函数来进行高光谱图像分类。通过对常见的激活函数进行分析,发现激活函数可以用激活映射与输入特征相乘的方式来表示。因此,本发明通过构建一个两层的神经网络来学习激活映射。神经网络从通道和光谱两方面进行学习,分别构建了符合二者特性的激活函数,从而提高了图像分类准确率。
本发明使用两层的神经网络,充分应用高光谱数据的通道信息和光谱信息,分别从通道、光谱的两个方面学习激活映射。由此,可以学习到针对特定的高光谱数据的激活函数,这些函数没有固定的表达式,随着不同数据的变化而变化,这也能更加充分的考虑到某个特定数据集的数据特性。对比现有主流的激活函数:Sigmoid、Tanh和ReLU,本发明在三个基准数据集上,均取得了较好的分类结果。在三个数据集上分别以全局分类准确率(Overall accuracy,OA)为基准对以上方法进行评估。在IndianPines数据集上,基于通道和光谱的激活函数的分类准确率分别平均提高2.17%、4.03%,在Salinas数据集上,基于通道和光谱的激活函数的分类准确率分别平均提高1.14%、1.33%,在Botswana数据集上,基于通道和光谱的激活函数的分类准确率分别平均提高1.09%、1.51%。
下面结合具体实施方式对本发明作详细说明。
具体实施方式
CNN是一个性能良好的非线性分类器,包括卷积层、全连接层和激活函数。其中激活函数的优化大大提高了模型的计算性能。常用的激活函数包括Sigmoid、Tanh和ReLU等函数,其中ReLU由于实际计算中具备的高性能而在多种人工神经网络得到了广泛应用。
公式(9)也可以表述为:
其中操作表示元素乘法,I(X)是用来表明变量X对于集合依赖性的指示函数,表示激活函数的映射是固定的且有限制的。因此使用更加通用的函数G(X)来表示激活函数的映射,该函数包括但不限于I(X),其可通过CNN拟合得到。因此,进一步将公式(9)泛化为:
f(X)表示分类器网络中的使用的激活函数,X是激活函数的输入数据。事实上,ReLU和其他的多种激活函数都可以按照公式(10)的形式进行公式化表达。核心思想即为对CNN不同层提出了一个更为具体化和有针对性的映射表达G(X),以提高整个CNN的分类准确率。
设计两层神经网络来模拟映射函数G(X),具体实现方式分为基于通道的激活函数映射学习和基于光谱的激活函数映射学习。
本发明面向高光谱图像分类的数据自适应激活函数学习方法具体步骤如下:
步骤一、数据自适应的激活函数。
对于给定的像素hi∈H,利用卷积神经网络对其进行分类。用于分类的卷积神经网络包含四层卷积层,卷积操作Conv(·)具体如下:
其中,表示卷积核,表示需要进行卷积操作的像素点,num为卷积核大小,weightj为卷积操作的权重,(b'表示经过卷积操作后像素点的光谱维度)表示经过卷积操作后的特征图中的像素点。对全部输入数据经过卷积操作后,即可得到卷积层的输出特征(也即激活函数的输入),m表示卷积核的数目。
所建立的卷积神经网络分类器的结构为:第一层卷积层,输出空间的维度为32,一维卷积窗口的大小为8,卷积步长为3,padding设置为valid,并用所提激活函数激活;第二层卷积层,输出空间的维度为64,一维卷积窗口的大小为3,卷积步长为2,padding设置为valid,并用所提激活函数激活;第三层卷积层,输出空间的维度为128,一维卷积窗口的大小为3,卷积步长为2,padding设置为valid,并用所提激活函数激活;全连接层输出空间的维度为输入数据的类别数。
步骤二、基于通道的激活函数映射学习。
由于在之前的HSI分类任务中平均池化被验证有较好的性能,使用平均池化AvgPool(·)来聚合中间特征fc的光谱信息,以fc的第cj通道为例:
Gc(f)=σ(FC(AvgPool(Conv(f)))) (3)
这里,σ(·)是Sigmoid激活函数。
在基于通道的激活函数建模过程中,所使用的网络结构为:卷积层,输出空间的维度为一维卷积窗口的大小为卷积步长为1,padding设置为valid,并用Sigmoid激活函数激活;全连接层全连接层输出空间的维度为m。
步骤三、基于光谱的激活函数映射学习。
Gs(f)=σ(MLP(AvgPool(f))) (5)
步骤四、激活函数。
基于光谱的激活函数可由以下公式得到:
对比现有主流的激活函数:Sigmoid、Tanh和ReLU,本发明在三个基准数据集上,均取得了较好的分类结果。在三个数据集上分别以全局分类准确率(Overall accuracy,OA)为基准对以上方法进行评估。在Indian Pines数据集上,基于通道和光谱的激活函数的分类准确率分别平均提高2.17%、4.03%,在Salinas数据集上,基于通道和光谱的激活函数的分类准确率分别平均提高1.14%、1.33%,在Botswana数据集上,基于通道和光谱的激活函数的分类准确率分别平均提高1.09%、1.51%。
Claims (1)
1.一种面向高光谱图像分类的数据自适应激活函数学习方法,其特征在于包括以下步骤:
步骤一、定义三维高光谱数据为包含r行、c列和b个波段;为了简便,将重排为二维矩阵n=r×c表示像素数目,并且对于给定的高光谱数据,采用四层卷积神经网络对其进行分类,每一层卷积神经网络中嵌入激活函数;卷积操作Conv(·)如下:
其中,为卷积操作,表示卷积核,表示需要进行卷积操作的像素点,num为卷积核大小,weightj为卷积操作的权重,表示卷积后特征图的像素点,b'表示经过卷积操作后像素点的光谱维度;对输入数据进行卷积后,得到卷积层的输出特征m表示卷积核的数目;
所建立的卷积神经网络分类器的结构为,第一层卷积层,输出空间的维度为32,一维卷积窗口的大小为8,卷积步长为3,padding设置为valid,并用激活函数激活;第二层卷积层,输出空间的维度为64,一维卷积窗口的大小为3,卷积步长为2,padding设置为valid,并用激活函数激活;第三层卷积层,输出空间的维度为128,一维卷积窗口的大小为3,卷积步长为2,padding设置为valid,并用激活函数激活;全连接层输出空间的维度为输入数据的类别数;分类器使用SGD及Adam优化器对交叉熵损失函数进行优化;
Gc(f)=σ(FC(AvgPool(Conv(f)))) (3)
这里,σ(·)表示Sigmoid激活函数;
在基于通道的激活函数建模过程中,所使用的网络结构为:卷积层输出空间的维度为一维卷积窗口的大小为卷积步长为1,padding设置为valid,并用Sigmoid激活函数激活;全连接层输出空间的维度为m;
步骤三、建模基于光谱的激活函数,并将其嵌入在卷积神经网络分类器中;同样,将卷积神经网络分类器中每一层卷积操作后的输出作为激活函数的输入使用平均池化AvgPool(·)聚合通道信息,以便于简化特征提取,通过收缩通道维度m,f的第b'j个光谱波段由下式池化:
Gs(f)=σ(MLP(AvgPool(f))) (5)
基于光谱的激活函数由以下公式得到:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910696238.5A CN110443296B (zh) | 2019-07-30 | 2019-07-30 | 面向高光谱图像分类的数据自适应激活函数学习方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910696238.5A CN110443296B (zh) | 2019-07-30 | 2019-07-30 | 面向高光谱图像分类的数据自适应激活函数学习方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110443296A CN110443296A (zh) | 2019-11-12 |
CN110443296B true CN110443296B (zh) | 2022-05-06 |
Family
ID=68432327
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910696238.5A Active CN110443296B (zh) | 2019-07-30 | 2019-07-30 | 面向高光谱图像分类的数据自适应激活函数学习方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110443296B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111242228B (zh) * | 2020-01-16 | 2024-02-27 | 武汉轻工大学 | 高光谱图像分类方法、装置、设备及存储介质 |
CN111797941A (zh) * | 2020-07-20 | 2020-10-20 | 中国科学院长春光学精密机械与物理研究所 | 携带光谱信息和空间信息的图像分类方法及系统 |
CN112200063A (zh) * | 2020-09-30 | 2021-01-08 | 湖南理工学院 | 一种基于神经网络和注意力机制的高效波段加权预处理方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0575716A1 (en) * | 1993-04-08 | 1993-12-29 | Andrzej Cichocki | A neural network and signal processing units |
CN107122708A (zh) * | 2017-03-17 | 2017-09-01 | 广东工业大学 | 基于卷积神经网络与超限学习机的高光谱图像分类算法 |
CN107316013A (zh) * | 2017-06-14 | 2017-11-03 | 西安电子科技大学 | 基于nsct变换和dcnn的高光谱图像分类方法 |
CN107704917A (zh) * | 2017-08-24 | 2018-02-16 | 北京理工大学 | 一种有效训练深度卷积神经网络的方法 |
CN108830330A (zh) * | 2018-06-22 | 2018-11-16 | 西安电子科技大学 | 基于自适应特征融合残差网的多光谱图像分类方法 |
CN108898213A (zh) * | 2018-06-19 | 2018-11-27 | 浙江工业大学 | 一种面向深度神经网络的自适应激活函数参数调节方法 |
CN109376804A (zh) * | 2018-12-19 | 2019-02-22 | 中国地质大学(武汉) | 基于注意力机制和卷积神经网络高光谱遥感图像分类方法 |
CN109389080A (zh) * | 2018-09-30 | 2019-02-26 | 西安电子科技大学 | 基于半监督wgan-gp的高光谱图像分类方法 |
CN109711269A (zh) * | 2018-12-03 | 2019-05-03 | 辽宁工程技术大学 | 一种基于3d卷积谱空特征融合的高光谱图像分类算法 |
CN109766858A (zh) * | 2019-01-16 | 2019-05-17 | 中国人民解放军国防科技大学 | 结合双边滤波的三维卷积神经网络高光谱影像分类方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10262205B2 (en) * | 2015-07-28 | 2019-04-16 | Chiman KWAN | Method and system for collaborative multi-satellite remote sensing |
-
2019
- 2019-07-30 CN CN201910696238.5A patent/CN110443296B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0575716A1 (en) * | 1993-04-08 | 1993-12-29 | Andrzej Cichocki | A neural network and signal processing units |
CN107122708A (zh) * | 2017-03-17 | 2017-09-01 | 广东工业大学 | 基于卷积神经网络与超限学习机的高光谱图像分类算法 |
CN107316013A (zh) * | 2017-06-14 | 2017-11-03 | 西安电子科技大学 | 基于nsct变换和dcnn的高光谱图像分类方法 |
CN107704917A (zh) * | 2017-08-24 | 2018-02-16 | 北京理工大学 | 一种有效训练深度卷积神经网络的方法 |
CN108898213A (zh) * | 2018-06-19 | 2018-11-27 | 浙江工业大学 | 一种面向深度神经网络的自适应激活函数参数调节方法 |
CN108830330A (zh) * | 2018-06-22 | 2018-11-16 | 西安电子科技大学 | 基于自适应特征融合残差网的多光谱图像分类方法 |
CN109389080A (zh) * | 2018-09-30 | 2019-02-26 | 西安电子科技大学 | 基于半监督wgan-gp的高光谱图像分类方法 |
CN109711269A (zh) * | 2018-12-03 | 2019-05-03 | 辽宁工程技术大学 | 一种基于3d卷积谱空特征融合的高光谱图像分类算法 |
CN109376804A (zh) * | 2018-12-19 | 2019-02-22 | 中国地质大学(武汉) | 基于注意力机制和卷积神经网络高光谱遥感图像分类方法 |
CN109766858A (zh) * | 2019-01-16 | 2019-05-17 | 中国人民解放军国防科技大学 | 结合双边滤波的三维卷积神经网络高光谱影像分类方法 |
Non-Patent Citations (4)
Title |
---|
Convolutional Neural Networks Based Hyperspectral Image Classification Method with Adaptive Kernels;Chen Ding 等;《remote sensing》;20170616;第9卷(第6期);1-15 * |
INTEGRATING SPECTRAL AND SPATIAL INFORMATION INTO DEEP CONVOLUTIONAL NEURAL NETWORKS FOR HYPERSPECTRAL CLASSIFICATION;Shaohui Mei 等;《IGARSS 2016》;20161231;5067-5070 * |
基于卷积神经网络的高光谱图像谱-空联合分类;付光远 等;《科学技术与工程》;20170731;第17卷(第21期);268-274 * |
基于深度卷积神经网络的高光谱遥感图像分类;罗建华 等;《西华大学学报( 自然科学版)》;20170731;第36卷(第4期);13-20 * |
Also Published As
Publication number | Publication date |
---|---|
CN110443296A (zh) | 2019-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110210313B (zh) | 基于多尺度pca-3d-cnn空谱联合的高光谱遥感影像分类方法 | |
CN111191736B (zh) | 基于深度特征交叉融合的高光谱图像分类方法 | |
CN109685115B (zh) | 一种双线性特征融合的细粒度概念模型及学习方法 | |
CN111695467B (zh) | 基于超像素样本扩充的空谱全卷积高光谱图像分类方法 | |
CN110443296B (zh) | 面向高光谱图像分类的数据自适应激活函数学习方法 | |
CN110348399B (zh) | 基于原型学习机制和多维残差网络的高光谱智能分类方法 | |
US9710697B2 (en) | Method and system for exacting face features from data of face images | |
CN108460391B (zh) | 基于生成对抗网络的高光谱图像无监督特征提取方法 | |
CN105320965A (zh) | 基于深度卷积神经网络的空谱联合的高光谱图像分类方法 | |
CN111310598B (zh) | 一种基于3维和2维混合卷积的高光谱遥感图像分类方法 | |
CN111667019B (zh) | 基于可变形分离卷积的高光谱图像分类方法 | |
CN112801881A (zh) | 一种高分辨率高光谱计算成像方法、系统及介质 | |
CN113902622B (zh) | 基于深度先验联合注意力的光谱超分辨率方法 | |
CN113095409A (zh) | 基于注意力机制和权值共享的高光谱图像分类方法 | |
Suresh et al. | Performance analysis of different CNN architecture with different optimisers for plant disease classification | |
CN116309070A (zh) | 一种高光谱遥感图像超分辨率重建方法、装置及计算机设备 | |
CN110689065A (zh) | 一种基于扁平混合卷积神经网络的高光谱图像分类方法 | |
Paul et al. | Dimensionality reduction using band correlation and variance measure from discrete wavelet transformed hyperspectral imagery | |
CN115564996A (zh) | 一种基于注意力联合网络的高光谱遥感图像分类方法 | |
CN114937173A (zh) | 一种基于动态图卷积网络的高光谱图像快速分类方法 | |
CN112464891A (zh) | 一种高光谱图像分类方法 | |
CN115861076A (zh) | 基于矩阵分解网络的无监督高光谱图像超分辨率方法 | |
CN110766082A (zh) | 一种基于迁移学习的植物叶片病虫害程度分类方法 | |
CN113723472A (zh) | 一种基于动态滤波等变卷积网络模型的图像分类方法 | |
Song et al. | Using dual-channel CNN to classify hyperspectral image based on spatial-spectral information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |