CN112131931A - 基于注意力机制的深度森林高光谱图像分类方法和系统 - Google Patents
基于注意力机制的深度森林高光谱图像分类方法和系统 Download PDFInfo
- Publication number
- CN112131931A CN112131931A CN202010789788.4A CN202010789788A CN112131931A CN 112131931 A CN112131931 A CN 112131931A CN 202010789788 A CN202010789788 A CN 202010789788A CN 112131931 A CN112131931 A CN 112131931A
- Authority
- CN
- China
- Prior art keywords
- forest
- layer
- hyperspectral image
- attention
- attention mechanism
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000007246 mechanism Effects 0.000 title claims abstract description 52
- 238000000034 method Methods 0.000 title claims abstract description 38
- 239000013598 vector Substances 0.000 claims abstract description 93
- 238000012549 training Methods 0.000 claims abstract description 41
- 230000003595 spectral effect Effects 0.000 claims abstract description 19
- 230000009467 reduction Effects 0.000 claims abstract description 15
- 238000003491 array Methods 0.000 claims description 36
- 238000007637 random forest analysis Methods 0.000 claims description 24
- 238000001228 spectrum Methods 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 7
- 230000001965 increasing effect Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000004927 fusion Effects 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 description 11
- 239000011159 matrix material Substances 0.000 description 10
- 238000003066 decision tree Methods 0.000 description 9
- 238000000513 principal component analysis Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 3
- 239000000470 constituent Substances 0.000 description 3
- 238000002790 cross-validation Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Astronomy & Astrophysics (AREA)
- Remote Sensing (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及基于注意力机制的深度森林高光谱图像分类方法和系统,包括以下步骤:将原始的高光谱图像数据集作为训练集,将训练集进行降维操作,生成低维数据集,在低维数据集中提取光谱向量数组;将光谱向量数组输入基于注意力机制的深度森林模型进行训练,生成训练好的基于注意力机制的深度森林模型;将待分类原始的高光谱图像数据集经降维后输入训练好的基于注意力机制的深度森林模型,生成分类标签。本发明提供的基于注意力机制的深度森林高光谱图像分类方法和系统,将注意力机制结合到深度森林架构中并用于高光谱图像分类;在高光谱图像分类任务中,通过对中间特征进行注意力增强操作,实现特征的自适应细化,提高分类性能。
Description
技术领域
本发明涉及图像分类领域,尤其涉及基于注意力机制的深度森林高光谱图像分类方法和系统。
背景技术
图像分类是一种模式识别领域的研究任务,一般的图像分类是对一幅图像进行特征提取,之后匹配最相近的类别作为输出。高光谱图像分类与普通的RGB三通道图像分类不同,高光谱图像分类是对单个像元进行类别划分,其类别归属于每一个像素点。高光谱图像分类除了数据格式具有特殊性以外,光谱维度和空间维度也具有其自身的特点,光谱特征是一维的具有连续属性的向量,空间场景是内容复杂且包含所有待分类样本的空间信息。基于注意力机制的深度森林高光谱图像分类方法将注意力机制结合到深度森林架构中,通过对中间特征进行注意力增强操作,实现特征的自适应细化,提高分类性能。
随着深度学习的火热发展,以深度神经网络为代表的深度学习算法在高光谱图像分类任务中实现了较好的应用,大量的深度学习框架在高光谱图像分类中实现了精度的跳跃式提升。然而,由于高光谱数据的特殊性和复杂性,目前基于深度神经网络的高光谱图像分类方法存在着对训练样本数量要求高、调参困难、模型过拟合等难点。因此,高光谱图像分类问题需从数据角度出发,设计具有良好性能的特征提取和分类框架,在尽可能降低代表及样本的需求同时,提高分类性能。
深度森林能够较好地弥补上述缺陷,从深度森林提出至今,许多将深度森林或深度森林改进算法应用到高光谱图像分类中的应用都实现了较好的效果。然而,深度森林算法对于更深层特征的提取能力相对弱了一些,尤其是针对高维的高光谱数据,如何对光谱信息进行特征的强化与细化,是深度森林分类框架的一个改进方向。
注意力机制通过定位到感兴趣信息区域,增强该部分特征并抑制无用信息,将注意力机制引入深度森林算法中,能够结合深度森林算法的优点,并在此基础上实现重要信息聚焦以及特征自适应细化的目的。本发明在深度森林的算法框架中,利用一层森林计算特征重要性,并将所得到的特征重要性向量进行融合,获得注意力向量数组。通过使用注意力向量数组对中间特征进行注意力增强。
发明内容
本发明提供了基于注意力机制的深度森林高光谱图像分类方法和系统,解决了现有技术中深度学习模型存在对样本数量要求高、模型调参困难以及训练代价高等问题。
本发明为解决其技术问题,提供了基于注意力机制的深度森林高光谱图像分类方法和系统,包括以下步骤:
S1、将原始的高光谱图像数据集作为训练集,将所述训练集进行降维操作,生成低维数据集,在所述低维数据集中提取光谱向量数组;
S2、将所述光谱向量数组输入基于注意力机制的深度森林模型进行训练,生成训练好的基于注意力机制的深度森林模型;
S3、将待分类的高光谱图像数据集采用与步骤S1相同的方法得到光谱向量数组输入所述训练好的基于注意力机制的深度森林模型,生成所述原始的高光谱图像数据集对应的分类标签。
进一步的,本发明的基于注意力机制的深度森林高光谱图像分类方法,步骤S1具体为:将所述训练集中相关系数较大的高维特征变量重新组合,生成低维的线性无关变量,所述低维的线性无关变量组成的数组即为所述光谱向量数组。
进一步的,本发明的基于注意力机制的深度森林高光谱图像分类方法,步骤S2中所述基于注意力机制的深度森林模型分为注意力增强层和级联森林层。
进一步的,本发明的基于注意力机制的深度森林高光谱图像分类方法,所述注意力增强层的训练过程具体为:计算所述光谱向量数组中各向量的特征重要度,所述特征重要度为各向量在所述光谱向量数组中的贡献程度,将所述各向量的特征重要度组成的数组作为注意力向量数组,将所述注意力向量数组与所述光谱向量数组进行加权融合,生成特征向量数组。
进一步的,本发明的基于注意力机制的深度森林高光谱图像分类方法,所述级联森林层的训练过程具体为:
S21、将所述特征向量数组输入所述级联森林层的第i层森林,生成k个m维的第i层的类概率数组;
S22、提取所述特征向量数组中前50%重要性的特征向量生成n维的加权向量数组,将所述加权向量数组与所述第i层的类概率数组首尾相连,生成k个n+m维的第i+1层森林的输入向量数组,所述第i+1层森林的输入向量数组输入所述级联森林层的第i+1层森林,生成k个m维的第i+1层的类概率数组;所述i为正整数,从1开始逐渐增加;所述k为所述级联森林层的每层森林中的森林个数;
S23、若得到的类概率数组中的各个类概率增加幅度小于预设值,则表示生成了k个训练好的类概率数组,进入步骤S24,否则返回步骤S22;
S24、将所述k个训练好的类概率数组输入分类层森林,所述分类层森林将所述k个训练好的类概率数组分别进行平均计算,生成最终的预测结果数组,取所述最终的预测结果数组中的最大值,根据该最大值所属的森林以及k个森林与分类标签的对应关系确定输入的数据集对应的分类标签。
进一步的,本发明的基于注意力机制的深度森林高光谱图像分类方法,所述级联森林层由多层森林级联组成,每层森林由随机森林和完全随机树森林组成;所述随机森林由普通随机树构成,所述完全随机树森林由完全随机树构成。
进一步的,本发明的基于注意力机制的深度森林高光谱图像分类系统,包括以下模块:
降维模块,用于将原始的高光谱图像数据集作为训练集,将所述训练集进行降维操作,生成低维数据集,在所述低维数据集中提取光谱向量数组;
训练模块,用于将所述光谱向量数组输入基于注意力机制的深度森林模型进行训练,生成训练好的基于注意力机制的深度森林模型;
分类模块,用于将待分类的高光谱图像数据集采用与降维模块中相同的方法得到光谱向量数组输入所述训练好的基于注意力机制的深度森林模型,生成所述原始的高光谱图像数据集对应的分类标签。
进一步的,本发明的基于注意力机制的深度森林高光谱图像分类系统,降维模块的作用具体为:将所述训练集中相关系数较大的高维特征变量重新组合,生成低维的线性无关变量,所述低维的线性无关变量组成的数组即为所述光谱向量数组。
进一步的,本发明的基于注意力机制的深度森林高光谱图像分类系统,训练模块中所述基于注意力机制的深度森林模型分为注意力增强层和级联森林层。
与现有技术相比,本发明的有益效果在于:
1.将注意力机制结合到深度森林架构中并用于高光谱图像分类;
2.在高光谱图像分类任务中,通过对中间特征进行注意力增强操作,实现特征的自适应细化,提高分类性能。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1为本发明的方法流程图;
图2为本发明的整体框架图;
图3为本发明的整体框架图中级联森林层的算法框架图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,下面结合附图和具体实施例对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参考图1和图2,本发明提出的基于注意力机制的深度森林高光谱图像分类方法,包括以下步骤:
S1、将原始的高光谱图像数据集作为训练集,将所述训练集进行降维操作,生成低维数据集,在所述低维数据集中提取光谱向量数组;
S2、将所述光谱向量数组输入基于注意力机制的深度森林模型进行训练,生成训练好的基于注意力机制的深度森林模型;
S3、将待分类的高光谱图像数据集采用与步骤S1相同的方法得到光谱向量数组输入所述训练好的基于注意力机制的深度森林模型,生成所述原始的高光谱图像数据集对应的分类标签。
步骤S1具体为:将所述训练集中相关系数较大的高维特征变量重新组合,生成低维的线性无关变量,所述低维的线性无关变量组成的数组即为所述光谱向量数组。
原始的高光谱图像数据集波段多、维数高、数据量大,且存在数据冗余。为了降低“维数灾难”带来的影响,在降低数据维数的同时,尽可能减少信息损失。所提出的分类框架首先对原始的高光谱图像进行光谱维度上的约束,通过保留若干主成分,达到数据的降维与冗余信息剔除的目的。该步骤采用的降维方法为主成分分析法(PCA),通过将高维的高光谱图像数据投影到低维的子空间,把相关系数较大的高维特征变量重新组合,形成低维的线性无关的一组变量。
PCA算法在处理原始高光谱图像时,主要包含以下步骤:
1、数据标准化。标准化可以使高光谱数据中所有变量及数值在相似的范围内,如果不进行标准化操作,可能导致结果出现偏差。标准化Z的计算方法为:
通过这一步骤,高光谱数据中所有变量将按照标准和可比较的比例进行缩放。
2、计算协方差矩阵。PCA有助于识别高光谱数据集中要素之间的相关性和依赖性,协方差矩阵表示数据集中不同变量之间的相关性。协方差矩阵通常在数学上被定义为一个p×p矩阵,在高光谱图像中,p表示高光谱图像的维数,矩阵中的每个元素代表相应变量的协方差。对于一个带有变量a和b的高光谱波段场景,其协方差就是一个2×2的矩阵,如下所示:
其中,Cov(a,a)代表变量与其自身的协方差,也就是变量a的方差;Cov(b,b)代表变量b的方差;Cov(a,b)代表变量a与变量b的协方差,由于协方差是可交换的,所以Cov(a,b)=Cov(b,a)。因此,在协方差矩阵中,协方差值表示两个变量相互依存的程度,如果协方差值为负,则表示各个变量之间成反比,反之则表示各个变量彼此成正比。
3、计算特征向量和特征值。从协方差矩阵中计算得到特征向量和特征值,而主成分是通过对原始向量进行转换,取部分转换后的向量进行的重新表示,在主成分的提取过程中,原先散布在初始向量中的绝大部分信息经过压缩并重新整合。如果要保留高光谱图像数据中前5个空间维数,则将计算5个主要成分,因此第1个主要成分存储了最大可能的信息,第2个主要成分存储了剩余的最大信息,依此类推。
特征向量和特征值这两个代数公式总是成对计算,即对于每个特征向量都有对应的一个特征值,需要计算的特征向量的数量决定了数据的维数。高光谱图像是一个3维数据集,其特征向量和特征值的个数为3。特征向量是使用协方差矩阵来了解数据中最大方差量,由于高光谱图像数据中更多的差异表示有关该数据的更多信息,特征向量用于识别和计算主成分。另一方面,特征值仅表示各个特征向量的标量,因此,特征向量和特征值将用于计算高光谱图像数据的主成分。
4、计算主要成分。在计算出特征向量和特征值后,需要对其进行降序排序,较高的特征值对应的特征向量具有更重要的地位,特征值最高的特征向量作为第一主成分,之后以此类推。因此,可以删除重要性较低的主要成分,以减小数据的尺寸。所筛选出来的主成分组成特征矩阵,其中包含所有具有最大数据信息的重要数据变量。
5、减少高光谱图像数据集的维数。PCA算法的最后一步是将原始高光谱图像数据与最终的主要成分进行重新排列,这些最终的主要成分代表数据集的最大和最重要信息。为了用新形成的主成分替换原始高光谱图像数据集,只需将其与原始高光谱图像数据的转置相乘,所获得数据作为降维后的低维数据集。
步骤S2中所述基于注意力机制的深度森林模型分为注意力增强层和级联森林层,所述注意力增强层为随机森林模型,所述级联森林层由多层森林级联组成,每层森林由随机森林和完全随机树森林组成;所述随机森林由普通随机树构成,所述完全随机树森林由完全随机树构成。
所述注意力增强层的训练过程具体为:计算所述光谱向量数组中各向量的特征重要度,所述特征重要度为各向量在所述光谱向量数组中的贡献程度,将所述各向量的特征重要度组成的数组作为注意力向量数组,将所述注意力向量数组与所述光谱向量数组进行加权融合,生成特征向量数组。
在随机森林中,所生成的数十甚至数百棵树,都是从定义为B的袋中进行自主抽样法抽取数据,而称没有选中的数据为袋外数据(Out-Of-Bag,OOB)。定义C为全部数据,且C一定是包含B的。定义Xn×p为一个矩阵数据集,该数据集中的数据具有p个特征,且该数据集的总数据量为n。定义y为类标记向量,该向量是1维的标签向量,向量中的值代表着数据集中所对应数据的类别值。数据中的特征值可以在输入到随机森林中时,进行随机排列,而随机森林可以通过获得重新排列的特征输入时所对应的误差,进而计算特征重要度。在随机森林算法中,每一个特征xj都对应一组特征置换测试,且该特征置换测试是重新排列的。在袋外数据中,通过使用原始特征排序的特征与重新排列的特征,比较各种情况下的分类误差,进而衡量特征重要度。也就是说,如果袋外数据的分类误差变大,那么则是因为重新排序后,特征的区分度下降,重要的特征信息被置换。定义T为随机森林中决策树的个数,同时决策树的个数与建立的袋外数据测试集的个数相同。因此,在一定范围内,决策树的个数越多,衡量特征重要度的程度越准确。定义特征重要度为Ja,公式如下:
注意力增强层的主要功能是计算输入光谱向量数组中各向量重要性,即对最终得到的结果贡献性。将所有特征重要度级联,组成注意力向量数组,该模型可以反映每个向量发挥的作用,并且该模型具有十分轻量化的属性。由于框架分类器使用的深度森林结构中,基础分类器是随机森林,因此由随机森林训练得到的注意力向量数组更能反映该特征用于后续多层森林的训练时所体现的价值。当得到注意力向量数组时,与光谱向量数组进行加权融合。加权融合的目的主要是为了防止特征重要度值极低时,对数据造成不平衡干扰,因此,提高相应权重倍数并进行特征归一化处理,将更有助于注意力机制的作用发挥。
请参考图3,所述级联森林层的训练过程具体为:
S21、将所述特征向量数组输入所述级联森林层的第i层森林,生成k个m维的第i层的类概率数组;
S22、提取所述特征向量数组中前50%重要性的特征向量生成n维的加权向量数组,将所述加权向量数组与所述第i层的类概率数组首尾相连,生成k个n+m维的第i+1层森林的输入向量数组,所述第i+1层森林的输入向量数组输入所述级联森林层的第i+1层森林,生成k个m维的第i+1层的类概率数组;所述i为正整数,从1开始逐渐增加;所述k为所述级联森林层的每层森林中的森林个数;
S23、若得到的类概率数组中的各个类概率增加幅度小于预设值,则表示生成了k个训练好的类概率数组,进入步骤S24,否则返回步骤S22;
S24、将所述k个训练好的类概率数组输入分类层森林,所述分类层森林将所述k个训练好的类概率数组分别进行平均计算,生成最终的预测结果数组,取所述最终的预测结果数组中的最大值,根据该最大值所属的森林以及k个森林与分类标签的对应关系确定输入的数据集对应的分类标签。
深度森林是一种基于随机森林的多层级连森林构架,通过“集成再集成”的模式进行表征学习。在深度森林中,每层森林的组成单元是随机森林和完全随机树森林,而随机森林和完全随机树森林的最小组成单元是决策树。深度森林的层数通过自适应确定,即在验证数据集上进行k折交叉验证,每训练完成一层森林时,如果验证精度没有明显提升,则森林的层数将不再增加。
训练每一层森林时,其输入数据也是通过级联的方式进行输入。当一层森林训练完成后,会计算得到输出的类概率,这一层所有森林输出的类概率进行连接,之后再与原始输入向量连接后,输入到下一层森林。在集成学习中,基分类器的差异性和多样性能有效帮助解释多分类器系统的工作机理,构造效果更好的集成系统。因此,深度森林中的组成森林具有不同的种类以实现更优的投票机制与分类结果。
在每个森林中,所有决策树的类概率通过投票的方式产生。森林中每个决策树产生的类概率对应类别相加,之后再进行数值平均化,所得概率为该随机森林的输出类概率。每个决策树的各类别预测概率之和为1,且每个森林的各类别预测概率之和也为1,在随机森林得到各类别预测概率之后,取概率值最大的类别作为预测投票类别。
深度森林包含随机森林和完全随机树森林这两种类型的森林,其中随机森林是由普通随机树构成,完全随机树森林是由完全随机树构成。普通随机树和完全随机树的区别主要在于节点的划分方式不同,组成随机森林的决策树在节点划分时,在整个特征空间中先选取个特征作为节点划分的候选特征,其中d为特征总个数。之后在候选特征中选择具有最佳Gini值的特征作为节点划分的属性特征。组成完全随机树森林的决策树则具有完全随机的性质,即在划分节点时,随机选取特征空间中的特征作为节点划分的属性特征。
在深度森林的层数自适应确定以后,中间层输出的类概率向量连接后输入到最后的分类层森林,分类层森林中的所有随机森林和完全随机树森林对来自中间层森林的中间特征向量进行分类,将所有单独森林的分类结果进行逐类别取平均,最后将对应类概率最大的类别作为最终的预测结果。因此,深度森林被设置的这种框架和组成形式,弥补了深度神经网络中存在的一些缺陷,如作用机理可解释、可并行训练以及超参数少等。
在本发明中,与原始的深度森林不同,原始的深度森林将前一层森林的输出类概率与原始特征连接,而所提出的算法只级联重要特征,进一步降低了数据维数和处理复杂度。
所提出的分类框架中,深度森林的层数仍然是通过折交叉验证决定,但与原始深度森林算法不同的是,该框架中的深度森林进行交叉验证时,额外拓展的层数为2层,即当森林的层数增加2层时,精度仍未提高,则森林的扩展停止,森林的层数确定为2层前的层数。该步骤在有效降低过拟合的同时,也减少了计算量,缩减了训练时间。每一层的森林的输出,与重要特征相连后,输入到下一层森林,直至最后一层。当特征输入到最后一层时,输出的类概率将不作为特征,只作为预测概率,并通过计算该层森林中所有随机森林输出的平均值,在平均各类别的类概率后,选择最大值所对应的类别,作为最终的预测类别。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。
Claims (9)
1.基于注意力机制的深度森林高光谱图像分类方法,其特征在于,包括以下步骤:
S1、将原始的高光谱图像数据集作为训练集,将所述训练集进行降维操作,生成低维数据集,在所述低维数据集中提取光谱向量数组;
S2、将所述光谱向量数组输入基于注意力机制的深度森林模型进行训练,生成训练好的基于注意力机制的深度森林模型;
S3、将待分类的高光谱图像数据集采用与步骤S1相同的方法得到光谱向量数组输入所述训练好的基于注意力机制的深度森林模型,生成所述原始的高光谱图像数据集对应的分类标签。
2.根据权利要求1所述的基于注意力机制的深度森林高光谱图像分类方法,其特征在于,步骤S1具体为:将所述训练集中相关系数较大的高维特征变量重新组合,生成低维的线性无关变量,所述低维的线性无关变量组成的数组即为所述光谱向量数组。
3.根据权利要求1所述的基于注意力机制的深度森林高光谱图像分类方法,其特征在于,步骤S2中所述基于注意力机制的深度森林模型分为注意力增强层和级联森林层。
4.根据权利要求3所述的基于注意力机制的深度森林高光谱图像分类方法,其特征在于,所述注意力增强层的训练过程具体为:计算所述光谱向量数组中各向量的特征重要度,所述特征重要度为各向量在所述光谱向量数组中的贡献程度,将所述各向量的特征重要度组成的数组作为注意力向量数组,将所述注意力向量数组与所述光谱向量数组进行加权融合,生成特征向量数组。
5.根据权利要求4所述的基于注意力机制的深度森林高光谱图像分类方法,其特征在于,所述级联森林层的训练过程具体为:
S21、将所述特征向量数组输入所述级联森林层的第i层森林,生成k个m维的第i层的类概率数组;
S22、提取所述特征向量数组中前50%重要性的特征向量生成n维的加权向量数组,将所述加权向量数组与所述第i层的类概率数组首尾相连,生成k个n+m维的第i+1层森林的输入向量数组,所述第i+1层森林的输入向量数组输入所述级联森林层的第i+1层森林,生成k个m维的第i+1层的类概率数组;所述i为正整数,从1开始逐渐增加;所述k为所述级联森林层的每层森林中的森林个数;
S23、若得到的类概率数组中的各个类概率增加幅度小于预设值,则表示生成了k个训练好的类概率数组,进入步骤S24,否则返回步骤S22;
S24、将所述k个训练好的类概率数组输入分类层森林,所述分类层森林将所述k个训练好的类概率数组分别进行平均计算,生成最终的预测结果数组,取所述最终的预测结果数组中的最大值,根据该最大值所属的森林以及k个森林与分类标签的对应关系确定输入的数据集对应的分类标签。
6.根据权利要求3所述的基于注意力机制的深度森林高光谱图像分类方法,其特征在于,所述级联森林层由多层森林级联组成,每层森林由随机森林和完全随机树森林组成;所述随机森林由普通随机树构成,所述完全随机树森林由完全随机树构成。
7.基于注意力机制的深度森林高光谱图像分类系统,其特征在于,包括以下模块:
降维模块,用于将原始的高光谱图像数据集作为训练集,将所述训练集进行降维操作,生成低维数据集,在所述低维数据集中提取光谱向量数组;
训练模块,用于将所述光谱向量数组输入基于注意力机制的深度森林模型进行训练,生成训练好的基于注意力机制的深度森林模型;
分类模块,用于将待分类的高光谱图像数据集采用与降维模块中相同的方法得到光谱向量数组输入所述训练好的基于注意力机制的深度森林模型,生成所述原始的高光谱图像数据集对应的分类标签。
8.根据权利要求7所述的基于注意力机制的深度森林高光谱图像分类系统,其特征在于,降维模块的作用具体为:将所述训练集中相关系数较大的高维特征变量重新组合,生成低维的线性无关变量,所述低维的线性无关变量组成的数组即为所述光谱向量数组。
9.根据权利要求7所述的基于注意力机制的深度森林高光谱图像分类系统,其特征在于,训练模块中所述基于注意力机制的深度森林模型分为注意力增强层和级联森林层。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010789788.4A CN112131931B (zh) | 2020-08-07 | 2020-08-07 | 基于注意力机制的深度森林高光谱图像分类方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010789788.4A CN112131931B (zh) | 2020-08-07 | 2020-08-07 | 基于注意力机制的深度森林高光谱图像分类方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112131931A true CN112131931A (zh) | 2020-12-25 |
CN112131931B CN112131931B (zh) | 2023-08-29 |
Family
ID=73851154
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010789788.4A Active CN112131931B (zh) | 2020-08-07 | 2020-08-07 | 基于注意力机制的深度森林高光谱图像分类方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112131931B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113052259A (zh) * | 2021-04-14 | 2021-06-29 | 西南交通大学 | 一种基于联合投票网络的交通场景天气分类方法 |
CN113221972A (zh) * | 2021-04-26 | 2021-08-06 | 西安电子科技大学 | 基于加权深度随机森林的不平衡高光谱数据分类方法 |
CN113379657A (zh) * | 2021-05-19 | 2021-09-10 | 上海壁仞智能科技有限公司 | 基于随机矩阵的图像处理方法及装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150025508A (ko) * | 2013-08-30 | 2015-03-10 | 계명대학교 산학협력단 | 공유 지역 특징을 이용한 다시점 객체 검출 방법 |
WO2017053037A1 (en) * | 2015-09-25 | 2017-03-30 | Board Of Regents, The University Of Texas System | Classifying images and videos |
CN108614992A (zh) * | 2018-03-19 | 2018-10-02 | 中国地质大学(武汉) | 一种高光谱遥感图像的分类方法、设备及存储设备 |
CN108764138A (zh) * | 2018-05-29 | 2018-11-06 | 南京信息工程大学 | 一种基于多维多粒度级联森林的高原地区云雪分类方法 |
CN110309800A (zh) * | 2019-07-05 | 2019-10-08 | 中国科学技术大学 | 一种林火烟雾探测方法及装置 |
CN110796163A (zh) * | 2019-09-19 | 2020-02-14 | 中国地质大学(武汉) | 一种顾及光谱重要性的高光谱影像空谱分类方法及装置 |
US20200219619A1 (en) * | 2018-12-20 | 2020-07-09 | Oregon Health & Science University | Subtyping heterogeneous disorders using functional random forest models |
CN111414875A (zh) * | 2020-03-26 | 2020-07-14 | 电子科技大学 | 基于深度回归森林的三维点云头部姿态估计系统 |
-
2020
- 2020-08-07 CN CN202010789788.4A patent/CN112131931B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150025508A (ko) * | 2013-08-30 | 2015-03-10 | 계명대학교 산학협력단 | 공유 지역 특징을 이용한 다시점 객체 검출 방법 |
WO2017053037A1 (en) * | 2015-09-25 | 2017-03-30 | Board Of Regents, The University Of Texas System | Classifying images and videos |
CN108614992A (zh) * | 2018-03-19 | 2018-10-02 | 中国地质大学(武汉) | 一种高光谱遥感图像的分类方法、设备及存储设备 |
CN108764138A (zh) * | 2018-05-29 | 2018-11-06 | 南京信息工程大学 | 一种基于多维多粒度级联森林的高原地区云雪分类方法 |
US20200219619A1 (en) * | 2018-12-20 | 2020-07-09 | Oregon Health & Science University | Subtyping heterogeneous disorders using functional random forest models |
CN110309800A (zh) * | 2019-07-05 | 2019-10-08 | 中国科学技术大学 | 一种林火烟雾探测方法及装置 |
CN110796163A (zh) * | 2019-09-19 | 2020-02-14 | 中国地质大学(武汉) | 一种顾及光谱重要性的高光谱影像空谱分类方法及装置 |
CN111414875A (zh) * | 2020-03-26 | 2020-07-14 | 电子科技大学 | 基于深度回归森林的三维点云头部姿态估计系统 |
Non-Patent Citations (4)
Title |
---|
张家颖 等: "基于深度学习的网络流量分类识别研究", 《天津理工大学学报》 * |
武复宇;王雪;丁建伟;杜培军;谭琨;: "高光谱遥感影像多级联森林深度网络分类算法", 遥感学报, no. 04 * |
汪敏 等: "深度迁移学习在高光谱遥感图像分类中的研究现状与展望", 《青岛科技大学学报(自然科学版)》 * |
潘剑飞: "基于Attention深度随机森林的社区演化事件预测", 《电子学报》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113052259A (zh) * | 2021-04-14 | 2021-06-29 | 西南交通大学 | 一种基于联合投票网络的交通场景天气分类方法 |
CN113221972A (zh) * | 2021-04-26 | 2021-08-06 | 西安电子科技大学 | 基于加权深度随机森林的不平衡高光谱数据分类方法 |
CN113221972B (zh) * | 2021-04-26 | 2024-02-13 | 西安电子科技大学 | 基于加权深度随机森林的不平衡高光谱数据分类方法 |
CN113379657A (zh) * | 2021-05-19 | 2021-09-10 | 上海壁仞智能科技有限公司 | 基于随机矩阵的图像处理方法及装置 |
CN113379657B (zh) * | 2021-05-19 | 2022-11-25 | 上海壁仞智能科技有限公司 | 基于随机矩阵的图像处理方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112131931B (zh) | 2023-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112131931A (zh) | 基于注意力机制的深度森林高光谱图像分类方法和系统 | |
Arteaga et al. | Deep learning for power system security assessment | |
Jiu et al. | Deep kernel map networks for image annotation | |
Sumithra et al. | A review of various linear and non linear dimensionality reduction techniques | |
Puggini et al. | Forward selection component analysis: Algorithms and applications | |
WO2002003256A1 (en) | Method and system for the dynamic analysis of data | |
CN114022176A (zh) | 一种电商平台上的商品销量预测的方法及电子设备 | |
US20220309779A1 (en) | Neural network training and application method, device and storage medium | |
Gatto et al. | Tensor analysis with n-mode generalized difference subspace | |
CN107169500A (zh) | 一种基于邻域粗糙集约减的谱聚类方法及系统 | |
CN111027636A (zh) | 基于多标签学习的无监督特征选择方法及系统 | |
CN113065520A (zh) | 一种面向多模态数据的遥感图像分类方法 | |
CN116977723A (zh) | 基于空间-光谱混合自注意力机制的高光谱图像分类方法 | |
Hennig | Asymmetric linear dimension reduction for classification | |
CN109460872B (zh) | 一种面向移动通信用户流失不平衡数据预测方法 | |
Kuo et al. | Embeddings and attention in predictive modeling | |
Higuchi et al. | Robust principal component analysis with adaptive selection for tuning parameters | |
Nibbering et al. | Multiclass-penalized logistic regression | |
Jang et al. | A reparametrization-invariant sharpness measure based on information geometry | |
Paul et al. | Non-iterative online sequential learning strategy for autoencoder and classifier | |
Ortner et al. | Robust and sparse multigroup classification by the optimal scoring approach | |
CN115984113A (zh) | 谱-空超图正则化稀疏自表示的高光谱波段选择方法 | |
US20220138526A1 (en) | Method of executing classification process using machine learning model, information processing device, and non-transitory computer-readable medium storing computer program | |
Chou et al. | Merging deep neural networks for mobile devices | |
Häcker et al. | Robust manufacturing inspection and classification with machine vision |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240118 Address after: 230000 floor 1, building 2, phase I, e-commerce Park, Jinggang Road, Shushan Economic Development Zone, Hefei City, Anhui Province Patentee after: Dragon totem Technology (Hefei) Co.,Ltd. Address before: 430000 Lu Mill Road, Hongshan District, Wuhan, Hubei Province, No. 388 Patentee before: CHINA University OF GEOSCIENCES (WUHAN CITY) |