CN108491864B

CN108491864B - 基于自动确定卷积核大小卷积神经网络的高光谱图像分类

Info

Publication number: CN108491864B
Application number: CN201810163343.8A
Authority: CN
Inventors: 张艳宁; 丁晨; 李映; 夏勇; 张磊
Original assignee: Northwestern Polytechnical University
Current assignee: Northwestern Polytechnical University
Priority date: 2018-02-27
Filing date: 2018-02-27
Publication date: 2020-05-01
Anticipated expiration: 2038-02-27
Also published as: CN108491864A

Abstract

本发明提供了一种基于自动确定卷积核大小卷积神经网络的高光谱图像分类方法。首先，用K‑means算法对多组不同大小的图像块样本进行聚类处理；然后，设计一种新的针对不同尺寸且各类别数量呈非均匀分布样本聚类结果的评价指标，对不同尺寸样本聚类结果进行评价，根据评价结果确定自适应卷积核；最后，对自适应卷积核的卷积神经网络进行训练，并利用训练好的网络对高光谱图像进行分类。由于利用聚类处理和指标评价得到的自适应卷积核可以更加有效的表征数据信息，利用本发明方法可以得到更好的高光谱图像分类结果。

Description

基于自动确定卷积核大小卷积神经网络的高光谱图像分类

技术领域

本发明属高光谱图像处理技术领域，具体涉及一种基于自动确定卷积核大小卷积神经网络的高光谱图像分类方法。

背景技术

目前存在的高光谱图像像素级分类方法主要有两类：一类是基于人工设计特征的；另一类是基于深度学习特征的。文献“Ding C,Li Y,Xia Y,et al.ConvolutionalNeural Networks Based Hyperspectral Image Classification Method with AdaptiveKernels[J].Remote Sensing,2017,9(6):618.”公开了一种基于深度学习的高光谱图像分类方法，其卷积核可以通过预先学习得到，而且自适应卷积核的数量可以通过文献设计方法求得。该文献提出将改进的基于密度峰值快速寻找的聚类算法(modified clusteringby fast search and find of density peaks，简称MCFSFDP算法)用于提前学习卷积神经网络卷积核，并且自适应的确定卷积核的数量，并将此提前学习卷积核的卷积神经网络(convolutioanal neural network，CNN)应用到高光谱图像分类中，并得到了有效的分类结果。文献中所用的MCFSFDP聚类算法提前学习的卷积核需要经验进行卷积核大小设定，但是，人工经验设定的卷积核大小往往不能最优的表征数据信息的特点。

发明内容

为了克服现有基于卷积核提前学习的卷积神经网络结构中卷积核大小需要人工设定且无法自适应表征数据信息特点的问题，本发明公开了一种基于自动确定卷积核大小卷积神经网络的高光谱图像分类方法，将基于K-means聚类算法引入到卷积神经网络的卷积核学习中去，即先用K-means算法对多组不同大小的样本进行聚类处理，然后，设计一种新的针对不同尺寸且各类别数量呈非均匀分布样本聚类结果的评价指标，对不同尺寸样本聚类结果进行评价，根据评价结果确定自适应卷积核，最后，将学习到的卷积核引入卷积神经网络并对网络的全连接层进行训练，利用训练好的网络对高光谱图像进行分类。

一种基于自动确定卷积核大小卷积神经网络的高光谱图像分类方法，其特征在于包括以下步骤：

步骤一：从高光谱图像中随机提取带有维度信息且大小为m×m×h的图像块作为卷积神经网络的样本，其中，m为正整数，h为高光谱图像波段数，所述卷积神经网络的样本中一半作为训练样本，另一半作为测试样本；再从训练样本中，选取大小为n×n×h且n值不同的G组图像块作为聚类样本数据，其中，n为正整数，每组所包含的图像块数量相同，且聚类样本图像块的尺寸小于训练样本图像块的尺寸，G的取值范围为[1,13]。

步骤二：利用K-means聚类方法分别对不同尺寸的G组图像块样本数据进行聚类处理，得到不同尺寸图像块样本的聚类结果。

步骤三：利用

对不同尺寸图像块样本的聚类结果进行评估，使得EI值最大的图像块样本大小即被确定为自适应卷积核大小，此尺寸图像块的聚类中心即被确定为卷积核。

其中，D_inner为按照

计算得到的类内距离，D_inter为按照

计算得到的类间距离，f表示第f个聚类类别，f＝1,…,F，F为类别总数，F的取值为50，D_inner(f)为按照

计算得到的类别f的类内距离，N_f为类别f所包含数据点的数量，

表示类f中的第K_f个数据点

与类中心点

之间的距离，w^f＝N_f/N为类f的权重，N为所有类所包含数据点的总数，e^f为与类别f数据点数量相关的权重系数，即按数据点数量从小到大依次排列各类别，数据点数量最少的类对应的ef值为1/F，数据点数量最多的类对应的ef值为1，中间类别的ef值依次2/F、3/F、…、(F-1)/F；D_M(r,t)为标准化后的类r和类t的聚类中心点之间的距离，即先按照

计算得到的类r和类t的聚类中心点之间的距离，

为类r的中心点，

为类t的中心点，r＝1,…,F，t＝1,…,F，然后按照

进行标准化处理，其中，

表示取D′_M(r,t)的最大值。

步骤四：将图像块训练样本输入基于步骤三得到的自适应卷积核的CNN网络进行训练，得到训练好的网络。所述的CNN网络结构包括输入层、卷积层、池化层、全连接层和一个Softmax分类器，按照梯度下降法对最后的全连接层和Softmax分类器进行训练。

步骤五：利用训练好的网络对图像块测试样本进行分类，得到分类结果。

本发明的有益效果是：由于将K-means算法应用于CNN网络卷积核的确定中，并采用一种新的针对不同尺寸且各类别数量呈非均匀分布的样本聚类结果的评价指标来评估其聚类结果，可以自适应确定卷积核的尺寸大小，且学习到的卷积核可以更加有效的表征数据信息，得到更好的高光谱图像分类结果。

附图说明

图1是本发明的一种自动确定卷积核大小卷积神经网络的高光谱图像分类方法流程图

图2是本发明的自适应卷积核的卷积神经网络结构示意图

具体实施方式

下面结合附图和实施例对本发明进一步说明，本发明包括但不仅限于下述实施例。

如图1所示，本发明提供了一种自动确定卷积核大小卷积神经网络的高光谱图像分类方法，具体步骤如下：

1、数据预处理

从高光谱图像中随机提取M个带有维度信息、大小为m×m×h的图像块作为卷积神经网络的训练样本与测试样本，训练样本与测试样本的个数均为M/2。一般，m的取值范围为[5,27]，M的取值范围为5000～10000，本实施例中m为27，M为5000，h为光谱数，即高光谱图像波段数。

然后，再从训练样本图像块中，选取不同尺寸大小的G组图像块作为聚类样本数据，其中，每组所包含的图像块数量相同，且聚类样本图像块的尺寸小于训练样本图像块的尺寸，G的取值范围为1～13。本实施例选取大小分别为6×6×h，8×8×h…，22×22×h的共9组图像块样本，每组各包含10000个相同大小的图像块。

2、利用K-means方法进行聚类处理

利用K-means聚类方法对9组聚类样本数据分别进行聚类处理，得到其对应的聚类结果。具体为：

(1)将一组聚类样本数据中的每一个图像块都拉成列向量，作为聚类样本数据点。设初始类别数为50，从数据点中随机抽取50个数据点作为初始聚类中心，这50个聚类中心记作μ₁,...,μ_f,...,μ₅₀，f＝1,...,50。

(2)对于任一个数据点P_j，计算它与每个聚类中心u_f的距离，并以与数据点P_j距离最近的聚类中心的类别作为这个数据点P_j的类别，如公式(1)所示：

表示数据点P_j所属的类别。

(3)对于属于同一个类别f的所有c_f个数据点P_j，按下式重新计算得到其新的聚类中心μ′_f：

其中，c_f为属于同一类别f的数据点个数；

(4)重复步骤(2)-(3)Z次(Z＝400)，得到最终数据点类别的聚类结果，及其最终的聚类中心。

所有9组图像块都分别进行如上所述的聚类处理后，分别得到其对应的聚类结果，即每组数据点所属类别和其聚类中心。

3、确定自适应卷积核

对于每组聚类结果，分别按如下过程进行评估，确定评估结果最优的图像块尺寸为自适应卷积核的尺寸大小，此尺寸图像块样本数据的聚类中心即被确定为卷积核。

(1)计算类内距离D_inner。类f中每个数据点与类中心

的类内距离为：

其中，

表示类f中的第K_f个数据点，K_f＝1,2,···,N_f，N_f为类别f所包含数据点的数量，f＝1,...,50。

按下式计算得到每个类别所有数据点的类内距离的加权和：

以每个类别所包含数据点的数量N_f为权重，即：

w^f＝N_f/N (5)

再按各类数据点数量从小到大依次排列各个类别，数据点数量最少的类对应权重为1/50，数据点数量最多的类对应权重为50/50，中间权重依次分别为2/50到49/50，得到另一种权重，记为e^f。

按下式计算类别f的类内距离为：

D_inner(f)＝w^f·e^f·D′_inner(f)/N_f (6)

最后，计算所有类别的类内距离为：

(2)计算类间距离D_inter。

首先，计算得到各个类中心的类间距离矩阵D_M。由于聚类中心有50个，所以D_M的大小为50×50，D_M中的每个元素按

计算得到，r＝1,...,50，t＝1,...,50，

分别代表类r和类t的类中心。对此距离矩阵做标准化处理，即：

D_M＝D_M/max(D_M) (8)

其中，max(D_M)表示矩阵D_M中所有元素的最大值。

然后，按下式计算得到最终的类间距离D_inter：

(3)对每组聚类结果都按照以下公式计算其评价指标EI：

使得评价指标EI值最大的聚类样本尺寸，即图像块的大小为自适应卷积核大小，该类样本的聚类中心对应的图像块为自适应卷积核。

由于EI值的确定引入了各类别中样本数量这个重要影响因素，因此EI针对不同尺寸且各类别数量呈非均匀分布的样本聚类结果有着更加准确的评价效果。

4、基于自适应卷积核的CNN训练

将图像块训练样本输入基于步骤3得到的自适应卷积核的CNN，进行网络训练，得到训练好的网络。其中，CNN网络结构如图2所示，包括：输入层、卷积层、池化层、全连接层和一个Softmax分类器。

经过第k个卷积核后的特征图为：

其中，x表示训练样本图像块与测试样本图像块，k＝1,...,50，σ表示限制线性单元函数(RELU)，ω∈R^n×n×h，k代表第k个卷积核，x∈R^m×m×h，f∈R^{(m-n+1)×(m-n+1)}。

再经降采样后第k个特征图为：

其中，g∈R^{(m-n+1)/p×(m-n+1)/p}，p为空间局部尺寸，并且1≤i，j≤(m-n+1)/p。

利用梯度下降法训练最后的全连接层及Softmax分类器，最终得到训练好的网络。

5、高光谱图像分类

将测试样本图像块输入训练好的CNN网络，得到分类结果。

Claims

1.一种基于自动确定卷积核大小卷积神经网络的高光谱图像分类方法，其特征在于包括以下步骤：

步骤一：从高光谱图像中随机提取带有维度信息且大小为m×m×h的图像块作为卷积神经网络的样本，其中，m为正整数，h为高光谱图像波段数，所述卷积神经网络的样本中一半作为训练样本，另一半作为测试样本；再从所述训练样本中，选取大小为n×n×h且n值不同的G组图像块作为聚类样本数据，其中，n为正整数，每组所包含的图像块数量相同，且聚类样本图像块的尺寸小于训练样本图像块的尺寸，G的取值范围为[1,13]；

步骤二：利用K-means聚类方法分别对不同尺寸的G组图像块样本数据进行聚类处理，得到不同尺寸图像块样本的聚类结果；

步骤三：利用

对不同尺寸图像块样本的聚类结果进行评估，使得EI值最大的图像块样本大小即被确定为自适应卷积核大小，此尺寸图像块的聚类中心即被确定为卷积核；