CN108491864B - 基于自动确定卷积核大小卷积神经网络的高光谱图像分类 - Google Patents
基于自动确定卷积核大小卷积神经网络的高光谱图像分类 Download PDFInfo
- Publication number
- CN108491864B CN108491864B CN201810163343.8A CN201810163343A CN108491864B CN 108491864 B CN108491864 B CN 108491864B CN 201810163343 A CN201810163343 A CN 201810163343A CN 108491864 B CN108491864 B CN 108491864B
- Authority
- CN
- China
- Prior art keywords
- class
- clustering
- samples
- neural network
- size
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 19
- 238000000034 method Methods 0.000 claims abstract description 22
- 238000012549 training Methods 0.000 claims abstract description 21
- 238000012360 testing method Methods 0.000 claims description 8
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 238000003064 k means clustering Methods 0.000 claims description 3
- 238000011176 pooling Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 2
- 230000003044 adaptive effect Effects 0.000 abstract description 10
- 238000011156 evaluation Methods 0.000 abstract description 10
- 238000009828 non-uniform distribution Methods 0.000 abstract description 4
- 238000012545 processing Methods 0.000 abstract description 4
- 238000013528 artificial neural network Methods 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种基于自动确定卷积核大小卷积神经网络的高光谱图像分类方法。首先,用K‑means算法对多组不同大小的图像块样本进行聚类处理;然后,设计一种新的针对不同尺寸且各类别数量呈非均匀分布样本聚类结果的评价指标,对不同尺寸样本聚类结果进行评价,根据评价结果确定自适应卷积核;最后,对自适应卷积核的卷积神经网络进行训练,并利用训练好的网络对高光谱图像进行分类。由于利用聚类处理和指标评价得到的自适应卷积核可以更加有效的表征数据信息,利用本发明方法可以得到更好的高光谱图像分类结果。
Description
技术领域
本发明属高光谱图像处理技术领域,具体涉及一种基于自动确定卷积核大小卷积神经网络的高光谱图像分类方法。
背景技术
目前存在的高光谱图像像素级分类方法主要有两类:一类是基于人工设计特征的;另一类是基于深度学习特征的。文献“Ding C,Li Y,Xia Y,et al.ConvolutionalNeural Networks Based Hyperspectral Image Classification Method with AdaptiveKernels[J].Remote Sensing,2017,9(6):618.”公开了一种基于深度学习的高光谱图像分类方法,其卷积核可以通过预先学习得到,而且自适应卷积核的数量可以通过文献设计方法求得。该文献提出将改进的基于密度峰值快速寻找的聚类算法(modified clusteringby fast search and find of density peaks,简称MCFSFDP算法)用于提前学习卷积神经网络卷积核,并且自适应的确定卷积核的数量,并将此提前学习卷积核的卷积神经网络(convolutioanal neural network,CNN)应用到高光谱图像分类中,并得到了有效的分类结果。文献中所用的MCFSFDP聚类算法提前学习的卷积核需要经验进行卷积核大小设定,但是,人工经验设定的卷积核大小往往不能最优的表征数据信息的特点。
发明内容
为了克服现有基于卷积核提前学习的卷积神经网络结构中卷积核大小需要人工设定且无法自适应表征数据信息特点的问题,本发明公开了一种基于自动确定卷积核大小卷积神经网络的高光谱图像分类方法,将基于K-means聚类算法引入到卷积神经网络的卷积核学习中去,即先用K-means算法对多组不同大小的样本进行聚类处理,然后,设计一种新的针对不同尺寸且各类别数量呈非均匀分布样本聚类结果的评价指标,对不同尺寸样本聚类结果进行评价,根据评价结果确定自适应卷积核,最后,将学习到的卷积核引入卷积神经网络并对网络的全连接层进行训练,利用训练好的网络对高光谱图像进行分类。
一种基于自动确定卷积核大小卷积神经网络的高光谱图像分类方法,其特征在于包括以下步骤:
步骤一:从高光谱图像中随机提取带有维度信息且大小为m×m×h的图像块作为卷积神经网络的样本,其中,m为正整数,h为高光谱图像波段数,所述卷积神经网络的样本中一半作为训练样本,另一半作为测试样本;再从训练样本中,选取大小为n×n×h且n值不同的G组图像块作为聚类样本数据,其中,n为正整数,每组所包含的图像块数量相同,且聚类样本图像块的尺寸小于训练样本图像块的尺寸,G的取值范围为[1,13]。
步骤二:利用K-means聚类方法分别对不同尺寸的G组图像块样本数据进行聚类处理,得到不同尺寸图像块样本的聚类结果。
其中,Dinner为按照计算得到的类内距离,Dinter为按照计算得到的类间距离,f表示第f个聚类类别,f=1,…,F,F为类别总数,F的取值为50,Dinner(f)为按照计算得到的类别f的类内距离,Nf为类别f所包含数据点的数量,表示类f中的第Kf个数据点与类中心点之间的距离,wf=Nf/N为类f的权重,N为所有类所包含数据点的总数,ef为与类别f数据点数量相关的权重系数,即按数据点数量从小到大依次排列各类别,数据点数量最少的类对应的ef值为1/F,数据点数量最多的类对应的ef值为1,中间类别的ef值依次2/F、3/F、…、(F-1)/F;DM(r,t)为标准化后的类r和类t的聚类中心点之间的距离,即先按照计算得到的类r和类t的聚类中心点之间的距离,为类r的中心点,为类t的中心点,r=1,…,F,t=1,…,F,然后按照进行标准化处理,其中,表示取D′M(r,t)的最大值。
步骤四:将图像块训练样本输入基于步骤三得到的自适应卷积核的CNN网络进行训练,得到训练好的网络。所述的CNN网络结构包括输入层、卷积层、池化层、全连接层和一个Softmax分类器,按照梯度下降法对最后的全连接层和Softmax分类器进行训练。
步骤五:利用训练好的网络对图像块测试样本进行分类,得到分类结果。
本发明的有益效果是:由于将K-means算法应用于CNN网络卷积核的确定中,并采用一种新的针对不同尺寸且各类别数量呈非均匀分布的样本聚类结果的评价指标来评估其聚类结果,可以自适应确定卷积核的尺寸大小,且学习到的卷积核可以更加有效的表征数据信息,得到更好的高光谱图像分类结果。
附图说明
图1是本发明的一种自动确定卷积核大小卷积神经网络的高光谱图像分类方法流程图
图2是本发明的自适应卷积核的卷积神经网络结构示意图
具体实施方式
下面结合附图和实施例对本发明进一步说明,本发明包括但不仅限于下述实施例。
如图1所示,本发明提供了一种自动确定卷积核大小卷积神经网络的高光谱图像分类方法,具体步骤如下:
1、数据预处理
从高光谱图像中随机提取M个带有维度信息、大小为m×m×h的图像块作为卷积神经网络的训练样本与测试样本,训练样本与测试样本的个数均为M/2。一般,m的取值范围为[5,27],M的取值范围为5000~10000,本实施例中m为27,M为5000,h为光谱数,即高光谱图像波段数。
然后,再从训练样本图像块中,选取不同尺寸大小的G组图像块作为聚类样本数据,其中,每组所包含的图像块数量相同,且聚类样本图像块的尺寸小于训练样本图像块的尺寸,G的取值范围为1~13。本实施例选取大小分别为6×6×h,8×8×h…,22×22×h的共9组图像块样本,每组各包含10000个相同大小的图像块。
2、利用K-means方法进行聚类处理
利用K-means聚类方法对9组聚类样本数据分别进行聚类处理,得到其对应的聚类结果。具体为:
(1)将一组聚类样本数据中的每一个图像块都拉成列向量,作为聚类样本数据点。设初始类别数为50,从数据点中随机抽取50个数据点作为初始聚类中心,这50个聚类中心记作μ1,...,μf,...,μ50,f=1,...,50。
(2)对于任一个数据点Pj,计算它与每个聚类中心uf的距离,并以与数据点Pj距离最近的聚类中心的类别作为这个数据点Pj的类别,如公式(1)所示:
(3)对于属于同一个类别f的所有cf个数据点Pj,按下式重新计算得到其新的聚类中心μ′f:
其中,cf为属于同一类别f的数据点个数;
(4)重复步骤(2)-(3)Z次(Z=400),得到最终数据点类别的聚类结果,及其最终的聚类中心。
所有9组图像块都分别进行如上所述的聚类处理后,分别得到其对应的聚类结果,即每组数据点所属类别和其聚类中心。
3、确定自适应卷积核
对于每组聚类结果,分别按如下过程进行评估,确定评估结果最优的图像块尺寸为自适应卷积核的尺寸大小,此尺寸图像块样本数据的聚类中心即被确定为卷积核。
按下式计算得到每个类别所有数据点的类内距离的加权和:
以每个类别所包含数据点的数量Nf为权重,即:
wf=Nf/N (5)
再按各类数据点数量从小到大依次排列各个类别,数据点数量最少的类对应权重为1/50,数据点数量最多的类对应权重为50/50,中间权重依次分别为2/50到49/50,得到另一种权重,记为ef。
按下式计算类别f的类内距离为:
Dinner(f)=wf·ef·D′inner(f)/Nf (6)
最后,计算所有类别的类内距离为:
(2)计算类间距离Dinter。
首先,计算得到各个类中心的类间距离矩阵DM。由于聚类中心有50个,所以DM的大小为50×50,DM中的每个元素按计算得到,r=1,...,50,t=1,...,50,分别代表类r和类t的类中心。对此距离矩阵做标准化处理,即:
DM=DM/max(DM) (8)
其中,max(DM)表示矩阵DM中所有元素的最大值。
然后,按下式计算得到最终的类间距离Dinter:
(3)对每组聚类结果都按照以下公式计算其评价指标EI:
使得评价指标EI值最大的聚类样本尺寸,即图像块的大小为自适应卷积核大小,该类样本的聚类中心对应的图像块为自适应卷积核。
由于EI值的确定引入了各类别中样本数量这个重要影响因素,因此EI针对不同尺寸且各类别数量呈非均匀分布的样本聚类结果有着更加准确的评价效果。
4、基于自适应卷积核的CNN训练
将图像块训练样本输入基于步骤3得到的自适应卷积核的CNN,进行网络训练,得到训练好的网络。其中,CNN网络结构如图2所示,包括:输入层、卷积层、池化层、全连接层和一个Softmax分类器。
经过第k个卷积核后的特征图为:
其中,x表示训练样本图像块与测试样本图像块,k=1,...,50,σ表示限制线性单元函数(RELU),ω∈Rn×n×h,k代表第k个卷积核,x∈Rm×m×h,f∈R(m-n+1)×(m-n+1)。
再经降采样后第k个特征图为:
其中,g∈R(m-n+1)/p×(m-n+1)/p,p为空间局部尺寸,并且1≤i,j≤(m-n+1)/p。
利用梯度下降法训练最后的全连接层及Softmax分类器,最终得到训练好的网络。
5、高光谱图像分类
将测试样本图像块输入训练好的CNN网络,得到分类结果。
Claims (1)
1.一种基于自动确定卷积核大小卷积神经网络的高光谱图像分类方法,其特征在于包括以下步骤:
步骤一:从高光谱图像中随机提取带有维度信息且大小为m×m×h的图像块作为卷积神经网络的样本,其中,m为正整数,h为高光谱图像波段数,所述卷积神经网络的样本中一半作为训练样本,另一半作为测试样本;再从所述训练样本中,选取大小为n×n×h且n值不同的G组图像块作为聚类样本数据,其中,n为正整数,每组所包含的图像块数量相同,且聚类样本图像块的尺寸小于训练样本图像块的尺寸,G的取值范围为[1,13];
步骤二:利用K-means聚类方法分别对不同尺寸的G组图像块样本数据进行聚类处理,得到不同尺寸图像块样本的聚类结果;
其中,Dinner为按照计算得到的类内距离,Dinter为按照计算得到的类间距离,f表示第f个聚类类别,f=1,…,F,F为类别总数,F的取值为50,Dinner(f)为按照计算得到的类别f的类内距离,Nf为类别f所包含数据点的数量,表示类f中的第Kf个数据点与类中心点之间的距离,wf=Nf/N为类f的权重,N为所有类所包含数据点的总数,ef为与类别f数据点数量相关的权重系数,即按数据点数量从小到大依次排列各类别,数据点数量最少的类对应的ef值为1/F,数据点数量最多的类对应的ef值为1,中间类别的ef值依次2/F、3/F、…、(F-1)/F;DM(r,t)为标准化后的类r和类t的聚类中心点之间的距离,即先按照计算得到的类r和类t的聚类中心点之间的距离,为类r的中心点,为类t的中心点,r=1,…,F,t=1,…,F,然后按照进行标准化处理,其中,表示取D′M(r,t)的最大值;
步骤四:将图像块训练样本输入基于步骤三得到的自适应卷积核的CNN网络进行训练,得到训练好的网络;所述的CNN网络结构包括输入层、卷积层、池化层、全连接层和一个Softmax分类器,按照梯度下降法对最后的全连接层和Softmax分类器进行训练;
步骤五:利用训练好的网络对图像块测试样本进行分类,得到分类结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810163343.8A CN108491864B (zh) | 2018-02-27 | 2018-02-27 | 基于自动确定卷积核大小卷积神经网络的高光谱图像分类 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810163343.8A CN108491864B (zh) | 2018-02-27 | 2018-02-27 | 基于自动确定卷积核大小卷积神经网络的高光谱图像分类 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108491864A CN108491864A (zh) | 2018-09-04 |
CN108491864B true CN108491864B (zh) | 2020-05-01 |
Family
ID=63340770
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810163343.8A Active CN108491864B (zh) | 2018-02-27 | 2018-02-27 | 基于自动确定卷积核大小卷积神经网络的高光谱图像分类 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108491864B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110009015A (zh) * | 2019-03-25 | 2019-07-12 | 西北工业大学 | 基于轻量化网络和半监督聚类的高光谱小样本分类方法 |
CN110119447B (zh) * | 2019-04-26 | 2023-06-16 | 平安科技(深圳)有限公司 | 自编码神经网络处理方法、装置、计算机设备及存储介质 |
CN110309868A (zh) * | 2019-06-24 | 2019-10-08 | 西北工业大学 | 结合无监督学习的高光谱图像分类方法 |
CN110321941A (zh) * | 2019-06-24 | 2019-10-11 | 西北工业大学 | 可鉴别性特征学习的高光谱图像压缩和分类方法 |
CN110533107B (zh) * | 2019-08-30 | 2020-11-13 | 中国科学院半导体研究所 | 梯度增强型Softmax分类器系统、训练信号产生方法及其应用 |
CN110942012A (zh) * | 2019-11-22 | 2020-03-31 | 上海眼控科技股份有限公司 | 图像特征提取方法、行人重识别方法、装置和计算机设备 |
CN111144464B (zh) * | 2019-12-17 | 2023-04-07 | 金陵科技学院 | 基于CNN-Kmeans算法水果自动识别方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106503743A (zh) * | 2016-10-31 | 2017-03-15 | 天津大学 | 一种数量多且维数高的图像局部特征点自适应聚类方法 |
CN106874923A (zh) * | 2015-12-14 | 2017-06-20 | 阿里巴巴集团控股有限公司 | 一种商品的风格分类确定方法及装置 |
CN107203783A (zh) * | 2017-05-24 | 2017-09-26 | 西北工业大学 | 基于自适应卷积核卷积神经网络的遥感图像像素级分类方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7970237B2 (en) * | 2007-08-01 | 2011-06-28 | Adobe Systems Incorporated | Spatially-varying convolutions for rendering glossy reflection effects |
-
2018
- 2018-02-27 CN CN201810163343.8A patent/CN108491864B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106874923A (zh) * | 2015-12-14 | 2017-06-20 | 阿里巴巴集团控股有限公司 | 一种商品的风格分类确定方法及装置 |
CN106503743A (zh) * | 2016-10-31 | 2017-03-15 | 天津大学 | 一种数量多且维数高的图像局部特征点自适应聚类方法 |
CN107203783A (zh) * | 2017-05-24 | 2017-09-26 | 西北工业大学 | 基于自适应卷积核卷积神经网络的遥感图像像素级分类方法 |
Non-Patent Citations (2)
Title |
---|
Martin Längkvist 等.Classification and Segmentation of Satellite Orthoimagery Using Convolutional Neural Networks.《remote sensing》.2016,第1-21页. * |
基于核自适应的近邻传播聚类算法;付迎丁 等;《计算机应用研究》;20120531;第29卷(第5期);第1644-1647,1650页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108491864A (zh) | 2018-09-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108491864B (zh) | 基于自动确定卷积核大小卷积神经网络的高光谱图像分类 | |
CN107633255B (zh) | 一种深度学习模式下的岩石岩性自动识别分类方法 | |
CN110728224B (zh) | 一种基于注意力机制深度Contourlet网络的遥感图像分类方法 | |
CN110334765B (zh) | 基于注意力机制多尺度深度学习的遥感影像分类方法 | |
CN110321830B (zh) | 一种基于神经网络的中文字符串图片ocr识别方法 | |
CN102819745B (zh) | 一种基于AdaBoost的高光谱遥感影像分类方法 | |
CN104484681B (zh) | 基于空间信息和集成学习的高光谱遥感影像分类方法 | |
CN109376786A (zh) | 一种图像分类方法、装置、终端设备及可读存储介质 | |
CN110197205A (zh) | 一种多特征来源残差网络的图像识别方法 | |
CN112613536B (zh) | 一种基于smote和深度学习的近红外光谱柴油牌号识别方法 | |
CN109344891A (zh) | 一种基于深度神经网络的高光谱遥感数据分类方法 | |
CN108446599B (zh) | 一种p值统计量建模独立性的高光谱图像波段快速选择方法 | |
CN108764366A (zh) | 针对非均衡数据的特征选择和聚类抽样集成二分类方法 | |
CN111222545B (zh) | 基于线性规划增量学习的图像分类方法 | |
CN112633337A (zh) | 一种基于聚类和边界点的不平衡数据处理方法 | |
CN106548041A (zh) | 一种基于先验信息和并行二进制微粒群算法的肿瘤关键基因识别方法 | |
CN110569780A (zh) | 一种基于深度迁移学习的高精度人脸识别方法 | |
CN108268890A (zh) | 一种高光谱图像分类方法 | |
CN108877947A (zh) | 基于迭代均值聚类的深度样本学习方法 | |
CN108920477A (zh) | 一种基于二叉树结构的不平衡数据处理方法 | |
CN113989536A (zh) | 一种基于布谷鸟搜索算法的番茄病害识别方法 | |
CN106570514A (zh) | 一种基于词袋模型和支持向量机的汽车轮毂分类方法 | |
CN104732246B (zh) | 一种半监督协同训练高光谱图像分类方法 | |
CN109741313B (zh) | 独立成分分析和卷积神经网络的无参考图像质量评价方法 | |
CN108304546B (zh) | 一种基于内容相似度和Softmax分类器的医学图像检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |