CN114898217A - 基于神经网络架构搜索的高光谱分类方法 - Google Patents

基于神经网络架构搜索的高光谱分类方法 Download PDF

Info

Publication number
CN114898217A
CN114898217A CN202210677414.2A CN202210677414A CN114898217A CN 114898217 A CN114898217 A CN 114898217A CN 202210677414 A CN202210677414 A CN 202210677414A CN 114898217 A CN114898217 A CN 114898217A
Authority
CN
China
Prior art keywords
architecture
search
utilizing
operations
neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210677414.2A
Other languages
English (en)
Inventor
王爱丽
宋璎珞
丁姗姗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin University of Science and Technology
Original Assignee
Harbin University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin University of Science and Technology filed Critical Harbin University of Science and Technology
Priority to CN202210677414.2A priority Critical patent/CN114898217A/zh
Publication of CN114898217A publication Critical patent/CN114898217A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/194Terrestrial scenes using hyperspectral data, i.e. more or other wavelengths than RGB
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Remote Sensing (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于神经架构搜索的高光谱图像分类方法,属于图像分类技术领域,该方法依次执行以下步骤:输入高光谱图像(HSI),利用滑动窗口裁剪为32×32像素的样本并划分训练样本、验证样本和测试样本;利用6种预设操作构建神经架构搜索(NAS)的空间,将训练样本输入该空间;利用梯度算法的搜索策略搜索出候选网络结构,搜索过程中利用β‑衰减对体系结构参数进行正则化;使用置信学习率进行结构梯度权重更新;将搜索到的预设操作组成基础单元,并连接构成最优神经网络架构;利用最优神经网络架构对HSI进行分类,获取分类结果。本发明是基于神经网络搜索的高光谱图像分类方法,在包含6种预设操作构建的搜索空间中进行最优架构的搜索,并利用β‑衰减正则化提高了NAS的泛化能力,利用置信学习率提高了NAS运算速度,同时减轻了过拟合现象,有效的提高了高光谱图像的分类精度,为后续神经架构搜索算法在高光谱图像分类研究以及相关应用提供了良好思路。

Description

基于神经网络架构搜索的高光谱分类方法
技术领域
本发明基于神经网络架构搜索的高光谱分类方法,属于遥感图像分类、智能解译技术领域。
背景技术
高光谱图像是通过高光谱成像仪获取的图像,光谱信息和空间维度信息十分丰富,因此被广泛应用于精准农业、海洋水文监测、大气环境监测等领域。高光谱图像分类是指为场景中的每个像素分配一个类别的任务。由于高光谱图像涉及的领域广泛且深远,因此高光谱图像分类是遥感领域的重点研究方向。
近年来,深度学习的崛起推动高光谱图像分类得到进一步发展。传统的CNN架构需要依靠手工进行设计以及参数的调整,同时会耗费大量的时间和精力。在这种情况下,自动生成神经网络架构的方法,即神经网络架构搜索(NeuralArchitecture Search,NAS),引起了人们的大量关注。NAS通过松弛搜索空间,使其变得连续可微,然后通过梯度下降法学习每个操作的权重,优化结构的性能,使结构搜索更加高效。
发明内容
针对上述问题,本发明提供了基于神经架构搜索的高光谱图像分类方法,输入待分类的高光谱图像后利用采用滑动窗口的策略对HSI图像进行裁剪并划分训练样本、验证样本和测试样本,利用6种预设操作构建NAS的空间,将训练样本输入该空间,利用梯度算法的搜索策略搜索出候选网络结构,搜索过程中利用β-衰减对体系结构参数进行正则化。利用CLR进行结构梯度权重更新,将搜索到的预设操作组成基础单元,并连接构成最优神经网络架构;最后利用最优神经网络架构对HSI进行分类获得分类结果。
本发明的目的是这样实现的:
步骤a、输入待分类的高光谱图像;
步骤b、利用采用滑动窗口的策略对HSI图像进行裁剪并划分训练样本、验证样本和测试样本;
步骤c、利用6种预设操作构建NAS的空间,将训练样本输入该空间;
步骤d、利用梯度算法的搜索策略搜索出候选网络结构,搜索过程中利用β-衰减对体系结构参数进行正则化;
步骤e、利用CLR进行结构梯度权重更新;
步骤f、将搜索到的预设操作组成基础单元,并连接构成最优神经网络架构;
步骤g、利用最优神经网络架构对HSI进行分类获得分类结果;
基于神经架构搜索的高光谱图像分类方法,包括以下步骤:
根据权利要求1所述的基于神经架构搜索的高光谱图像分类方法,其特征在于,步骤b具体为,通过采用滑动窗口的策略对样本进行的裁剪,窗口大小为32×32,重叠率设为50%。从样本中随机选择300个样本作为训练数据集,200个样本作为验证数据集,剩余样本作为测试集;
根据权利要求1所述的基于神经架构搜索的高光谱图像分类方法,其特征在于,步骤c具体为:
步骤c1、设
Figure BDA0003696774010000021
是有向边上的一组候选操作集,由架构参数α(m,n)参数化获得预设操作,每条边上的预设操作一共包括6种。分别是空操作(None)、跳接操作(Skip-Connect,Skip)、最大池化操作(Max pooling)、可分离卷积操作(SeparateConv)、空洞卷积操作(Dilated-Conv)、平均池化操作(Avg pooling),其中各项操作的卷积核为3×3、5×5以及7×7,将以上操作定义为搜索空间内的候选操作集
Figure BDA0003696774010000022
步骤c2、将训练样本输入该空间;
根据权利要求1所述的基于神经架构搜索的高光谱图像分类方法,其特征在于,步骤d具体为:
步骤d1、利用Softmax函数,将离散搜索空间变为连续空间;
为了使搜索空间连续,αo (m,n)将候选操作集
Figure BDA0003696774010000023
中离散化的操作转化为所有可能操作的Softmax算法的集合;
Figure BDA0003696774010000024
其中:
Figure BDA0003696774010000025
表示的是所有可能操作的集合,操作集中所有系数的和为1。αo (m,n)表示的是节点m和n之间的架构参数(m=0,1,…,N-1;n=0,1,…,N-1),每个单元中最多设置N个节点。
步骤d2、经过Softmax操作之后获得架构参数的集合βk (m,n),对参数βk (m,n)进行衰减正则化;
Figure BDA0003696774010000026
其中:βk (m,n)为节点m和节点n之间的架构参数的结合,k为可选操作所代表的个数。
步骤d3、NAS利用Softmax激活的体系结构参数集β来表示每个操作符的可能性,对β进行衰减正则化可以限制其值过大,能够提高架构搜索过程中的鲁棒性和体系结构泛化性。
根据权利要求1所述的基于神经架构搜索的高光谱图像分类方法,其特征在于,步骤e具体为:
步骤e1、经过Softmax操作之后,对所有混合操作中的架构参数α={α(m,n)}络权重w进行联合学习,根据节点计算,使用交叉熵公式计算训练过程中的损失值,分别获取
Figure BDA0003696774010000031
Figure BDA0003696774010000032
步骤e2、根据
Figure BDA0003696774010000033
Figure BDA0003696774010000034
对网络参数与结构参数进行双向优化,获得网络权重参数w,在训练数据集中对w进行训练获得网络参数的最优值,一轮训练过程之后,各个节点之间的结构权重平均分配;
步骤e3、根据损失值对网络参数和结构参数进行双层优化,利用CLR对原体系结构权重的初始学习率进行更新,建立置信梯度,按照本步骤实现循环权重更新;
Figure BDA0003696774010000035
其中:t表示目前训练的当前epoch次数,δ表示置信因子,本发明取δ=2,
lrα是NAS架构的学习率,默认设置为lrα=0.0003。
根据权利要求1所述的基于神经架构搜索的高光谱图像分类方法,其特征在于,步骤f具体为,
步骤f1、进行权重更新之后,取每个单元的节点之前2个最大权重的预设操作,将操作和节点之间进行连接,构建用于下采样的缩减单元和正常采样的正常单元;
步骤f2、正常单元中所有预设操作的步长均为1,因此其输出的特征图的大小保持不变。缩减单元所有预设操作的步长均为2,并且被插入在网络深度的1/3和2/3处。将缩减单元和正常单元进行连接获得最优神经网络架构;
根据权利要求1所述的基于神经架构搜索的高光谱图像分类方法,其特征在于,步骤g具体为,利用最优神经网络架构对HSI进行分类获得分类结果。
有益效果:
传统的CNN架构需要手工进行设计及调整参数,会耗费大量的时间和精力。本发明是基于神经网络搜索的高光谱图像分类方法,在包含6种预设操作构建的搜索空间中进行最优架构的搜索,利用β-衰减正则化对搜索结构的泛化能力进行提高,利用置信学习率提高了模型的运算速度,同时减轻了过拟合现象,有效的提高了高光谱图像的分类精度,为后续的神经架构搜索算法在高光谱图像分类研究及相关应用提供了良好思路。
附图说明
图1是本发明基于神经架构搜索的高光谱图像分类方法的流程图。
图2是本发明基于神经架构搜索的高光谱图像分类方法的搜索过程图。
图3是本发明方法中β-衰减正则化原理示意图。
图4是本发明方法中CLR原理示意图。
图5是本发明方法中Indian Pines数据集搜索到的正常单元的结构示意图。
图6是本发明方法中Indian Pines数据集搜索到的缩减单元的结构示意图。
图7是本发明方法中Pavia University数据集搜索到的正常单元的结构示意图。
图8是本发明方法中Pavia University数据集搜索到的缩减单元的结构示意图。
图9是本发明方法中的Indian Pines数据集中的分类结果图。
图10是本发明方法中的Pavia University数据集中的分类结果图。
具体实施方式
下面结合附图对本发明具体实施方式作进一步详细描述。
本具体实施方式下的基于神经架构搜索的高光谱图像分类方法,流程图如图1所示,网络原理示意图如图2所示,包括以下步骤:
步骤a、输入待分类的高光谱图像;
在本具体实施方式中,采用Indian Pines和Pavia University两个公开的数据集。
(1)Indian Pines数据集:由AVIRIS传感器在美国印第安纳州西北部的IndianPines农业试验场上空获得。原始数据共224个波段,去除4个零波段和20个水体吸收波段(104-108,150-163,220),余下200个波段供实验研究,范围为0.4到2.5μm,空间大小为145×145像素。
(2)Pavia University数据集:由ROSIS-03传感器在意大利的帕维亚大学(University of Pavia)上空获得。数据集的大小为610×340像素,空间分辨率为1.3m,原始数据具有115个波段,光谱覆盖范围为0.43到0.86μm,去除其中12个噪声波段,余下103个波段供实验研究。城市类别为9类。
步骤b、利用采用滑动窗口的策略对HSI图像进行裁剪并划分训练样本、验证样本和测试样本;
通过采用滑动窗口的策略对样本进行的裁剪,窗口大小为32×32,重叠率设为50%。从样本中随机选择300个样本作为训练数据集,200个样本作为验证数据集。训练数据集用于训练模型中每个神经元的权重和偏差,而架构变量则是基于验证数据集进行实际优化。获得最优架构之后,所有剩余的标记样本作为测试数据集,以评估最优网络架构的性能并且获得最终的分类结果。
步骤c、利用6种预设操作构建NAS的空间并将训练样本输入该空间
步骤c1、设
Figure BDA0003696774010000051
是有向边上的一组候选操作集,由架构参数α(m,n)参数化获得预设操作,每条边上的预设操作一共包括6种。分别是空操作(None)、跳接操作(Skip-Connect,Skip)、最大池化操作(Max pooling)、可分离卷积操作(SeparateConv)、空洞卷积操作(Dilated-Conv)、平均池化操作(Avg pooling),其中各项操作的卷积核为3×3、5×5以及7×7,将以上操作定义为搜索空间内的候选操作集
Figure BDA0003696774010000052
步骤c2、将训练样本输入搜索空间;
步骤d、利用梯度算法的搜索策略搜索出候选网络结构,搜索过程中利用β-衰减对体系结构参数进行正则化;
步骤d1、利用Softmax函数,将离散搜索空间变为连续空间;
为了使搜索空间连续,αo (m,n)将候选操作集
Figure BDA0003696774010000053
中离散化的操作转化为所有可能操作的Softmax算法的集合;
Figure BDA0003696774010000054
其中:
Figure BDA0003696774010000055
表示的是所有可能操作的集合,操作集中所有系数的和为1。αo (m,n)表示的是节点m和n之间的架构参数(m=0,1,…,N-1、n=0,1,…,N-1),每个单元中最多设置N
个节点。
步骤d2、经过Softmax操作之后获得架构参数的集合βk (m,n),对参数βk (m,n)进行衰减正则化;
Figure BDA0003696774010000056
其中:βk (m,n)为节点m和节点n之间的架构参数的结合,k为可选操作所代表的个数。
当节点x(m)与x(n)之间的最终操作都是从
Figure BDA00036967740100000510
中选择的,因此为每个候选操作定义了一个操作系数
Figure BDA0003696774010000057
该系数是由架构参数
Figure BDA0003696774010000058
参数化为
Figure BDA0003696774010000059
内所有可能的操作的Softmax运算的混合。因此从节点x(m)到x(n)的信息流是所有候选操作的加权和。
Figure BDA0003696774010000061
Figure BDA0003696774010000062
其中:操作集中所有系数的和为1。此外,两个节点之间所有混合操作的权值是由维度为
Figure BDA0003696774010000063
的向量αo (m,n)参数化得到的。
整个网络是由重复的单元堆叠而成的。每个单元都是由几条有向边和N个节点组成的有向无环图(DAG),在N个节点中包含了两个输入节点,一个输出节点,剩余的N-3个是中间节点。将每个节点定义为x(m)(m=0,1,…,N-1),它代表一个特征图。当前单元的输入节点的信息是从其前面的两个单元的输出节点获得的,输出节点是该单元中所有中间节点的深度级联。单元中的有向边代表了从中间节点x(m)到x(n)的信息流,它由候选操作组成。在每条有向边上都有预设操作o(m,n)与其相关联,该候选操作将信息从节点x(m)传输到节点x(n),根据同一单元中在它之前的所有节点计算获得节点x(n)的输出。
Figure BDA0003696774010000064
其中:设
Figure BDA0003696774010000065
是有向边上的一组候选操作集。在NAS中,每条有向边的预设操作是由架构参数α(m,n)参数化获得的。
经过Softmax操作之后进行β-衰减正则化,为了便于分析,从正则化的默认设置开始,考虑结构参数α的单步更新,如下式所示。
Figure BDA0003696774010000066
其中:ηα
Figure BDA0003696774010000067
分别是结构参数的学习率和相应的损失。
步骤d3、NAS的搜索使用Softmax激活的体系结构参数集β来表示每个操作符的可能性,对β的显示正则化可以限制其值过大,能够提高架构搜索过程中的鲁棒性和体系结构泛化性。
为了简单起见,使用θ函数(α为自变量)来表示β-衰减正则化的整体影响,为了实现类似于通过α进行权重衰减的上述β正则化,可以得到如下统一公式:
Figure BDA0003696774010000068
Figure BDA0003696774010000069
其中:F为映射函数,F决定了α对β的影响。因此需要具备更加合适的映射函数F将上式代入结构参数α的单步更新公式中,可以得到
Figure BDA0003696774010000071
以及
Figure BDA0003696774010000072
然后将前者除以后者。
Figure BDA0003696774010000073
如上所示,映射函数决定了决定了α对β的影响,为了避免无效的正则化以及避免较大变化幅度,使α的梯度等于F映射函数值。
Figure BDA0003696774010000074
梯度值获取之后,β正则化损失值为如下:
Figure BDA0003696774010000075
将α的梯度公式代入
Figure BDA0003696774010000076
Figure BDA0003696774010000077
相除公式可得到β-衰减正则化的影响:
Figure BDA0003696774010000078
其中,可以看到θ随着α的增加而减少,α越大θ越小,α越小θ越大,β的值被约束为更接近其平均值,从而实现类似于权重衰减的效果,因此被成为β-衰减正则化。
步骤e、利用CLR进行结构梯度权重更新;
步骤e1、经过Softmax操作之后结构得到了松弛,神经架构搜索对所有混合操作中的架构参数α={α(m,n)}络权重w进行联合学习,使用交叉熵公式计算训练过程中的损失值,分别获取
Figure BDA0003696774010000079
Figure BDA00036967740100000710
通过前面定义的搜索空间,目的是为了通过梯度下降算法优化α={α(m,n)}矩阵,将神经网络原有的权重称为w。使用交叉熵公式计算训练过程中的损失值,分别获取
Figure BDA00036967740100000711
Figure BDA00036967740100000712
为了实现端到端的优化,架构搜索的过程希望两个矩阵能够使得结果更好,因此开展双层优化。
步骤e2、根据
Figure BDA00036967740100000713
Figure BDA00036967740100000714
对网络参数与结构参数进行双向优化,获得网络权重参数w,在训练数据集中对w进行训练获得网络参数的最优值,一轮训练过程之后,各个节点之间的结构权重平均分配。
在搜索过程中双层优化是有严格层次的,为了使两者能够同时达到优化的策略,流程是在训练集上固定α={α(m,n)}矩阵的值,再利用梯度下降w的值,在验证集上固定w的值,再利用梯度下降α={α(m,n)}的值,循环往复获得更加理想的值,搜索的目的是寻找最佳的架构α*,来最小化验证损失
Figure BDA0003696774010000081
具体实现公式如下:
Figure BDA0003696774010000082
Figure BDA0003696774010000083
其中:网络权重w是通过最小化训练损失
Figure BDA0003696774010000084
得到的。NAS用双层优化解决了这个问题,α是高级变量,w是低级变量
步骤e3、根据损失值对网络参数和结构参数进行双层优化,利用CLR进行结构权重更新,利用CLR对原体系结构权重的初始学习率进行更新,建立置信梯度,计算和网络权重相关的梯度,最后实现权重更新
为了缓解连续松弛策略之后导致的梯度更新速度容易受到影响以及防止出现梯度爆炸的问题,引入CLR,对于架构搜索过程中的置信学习率应该随着体系结构权重的更新训练时间而增加,缓解模型的过拟合现象,具体定义如下:
Figure BDA0003696774010000085
其中:t表示目前训练的当前epoch次数,δ表示置信因子,本发明取δ=2,
lrα是NAS架构的学习率,默认设置为lrα=0.0003。
验证样本输入到模型之后,获得
Figure BDA0003696774010000086
利用
Figure BDA0003696774010000087
计算与架构权重相关的梯度,如下:
Figure BDA0003696774010000088
网络权重w是通过最小化训练损失
Figure BDA0003696774010000089
得到的。α是操作权重,神经网络原有的权重称为w。
建立置信梯度:
Figure BDA00036967740100000810
在获得置信梯度gradα和操作权重α之后,这样搜索网络就成了一个双层优化问题。搜索阶段的整体训练环节如下所示:
Figure BDA00036967740100000811
Figure BDA0003696774010000091
Figure BDA0003696774010000092
为训练环节交叉熵损失函数,α*(w)为网络权重为w时的固定架构权重α。
搜索阶段的验证环节为:
Figure BDA0003696774010000093
Figure BDA0003696774010000094
其中:
Figure BDA0003696774010000095
为验证环节交叉熵损失函数,w*(α)为架构权重为α时的固定网络权重w。
通过双层优化之后,训练环节和验证环节交替实现权重更新。
步骤f、将搜索到的预设操作组成基础单元,并连接构成最优神经网络架构;
步骤f1、权重更新后获得α={α(m,n)}矩阵,使得权重最大的边被保存下来,所以这个结构收敛之后需要生成最终单元。对于每一个节点来说,最多保留两个权重最大的边。对于两节点的边,只保留权重最大的一条边。计算并且取每个单元的节点之前2个最大权重的操作,将操作和节点之间进行连接,构建用于下采样的缩减单元和正常采样的正常单元;
步骤f2、正常单元中所有预设操作的步长均为1,因此其输出的特征图的大小保持不变。缩减单元所有预设操作的步长均为2,并且被插入在网络深度的1/3和2/3处。将缩减单元和正常单元进行连接获得最优神经网络架构
步骤g、利用最优神经网络架构对HSI进行分类获得分类结果。
为了主观评价分类效果,图5和图6分别显示了Indian Pines数据集和PaviaUniversity数据集的真值图以及各方法分类结果的伪彩色图。各分类方法的顺序与表1中分类方法的顺序相同。
表1和表2分别展示了本发明所提出的方法和其它对比方法在两种数据集上的详细分类结果。很明显,本发明方法比所有对比方法的分类性能更好,它在两种数据集上的所有分类指标都达到了最高,其中OA分别达到了96.60%和97.61%。
可以看出,相比于经典方法支持向量机(EMP-SVM)和几种先进的方法,包括光谱-空间残差网络(SSRN)、残差神经网络(ResNet)和Cutout改进的NAS(CNAS)方法,本发明更贴近真实地物分布,错误分类的面积大大减少,进一步证明了所提方法在高光谱数据分类中的有效性。
表1 Indian Pines数据集不同分类方法的分类精度比较(%)
Figure BDA0003696774010000101
表2 Pavia University数据集不同分类方法的分类精度比较(%)
Figure BDA0003696774010000102

Claims (7)

1.基于神经架构搜索的高光谱图像分类方法,其特征在于,包括以下步骤:
步骤a、输入待分类的高光谱图像;
步骤b、利用采用滑动窗口的策略对HSI图像进行裁剪并划分训练样本、验证样本和测试样本;
步骤c、利用6种预设操作构建神经架构搜索(NAS)的空间,将训练样本输入该空间;
步骤d、利用梯度算法的搜索策略搜索出候选网络结构,搜索过程中利用β-衰减对体系结构参数进行正则化;
步骤e、利用置信学习率(CLR)进行结构梯度权重更新;
步骤f、将搜索到的预设操作组成基础单元,并连接构成最优神经网络架构;
步骤g、利用最优神经网络架构对HSI进行分类,获得分类结果。
2.根据权利要求1所述的基于神经架构搜索的高光谱图像分类方法,其特征在于,步骤b具体为,通过采用滑动窗口的策略对样本进行的裁剪,窗口大小为32×32,重叠率设为50%。从样本中随机选择300个样本作为训练数据集,200个样本作为验证数据集,剩余样本作为测试集。
3.根据权利要求1所述的基于神经架构搜索的高光谱图像分类方法,其特征在于,步骤c具体为:
步骤c1、设
Figure DEST_PATH_BDA0003696774010000021
是有向边上的一组候选操作集,由架构参数α(m,n)参数化获得预设操作,每条边上的预设操作一共包括6种。分别是空操作(None)、跳接操作(Skip-Connect,Skip)、最大池化操作(Max pooling)、可分离卷积操作(Separate Conv)、空洞卷积操作(Dilated-Conv)、平均池化操作(Avg pooling),其中各项操作的卷积核为3×3、5×5以及7×7,将以上操作定义为搜索空间内的候选操作集O;
步骤c2、将训练样本输入搜索空间。
4.根据权利要求1所述的基于神经架构搜索的高光谱图像分类方法,其特征在于,步骤d具体为:
步骤d1、利用Softmax函数,将离散搜索空间变为连续空间;
为了使搜索空间连续,αo (m,n)将候选操作集O中离散化的操作转化为所有可能操作的Softmax算法的集合;
Figure FDA0003696773000000021
其中:
Figure FDA0003696773000000022
表示的是所有可能操作的集合,操作集中所有系数的和为1。αo (m,n)表示的是节点之间的架构参数(m=0,1,…,N-1;n=0,1,…,N-1),每个单元中最多设置N个节点,
步骤d2、经过Softmax操作之后获得架构参数的集合βk (m,n),对参数βk (m,n)进行衰减正则化;
Figure FDA0003696773000000023
其中:βk (m,n)为节点m和节点n之间的架构参数的结合,k为可选操作所代表的个数。
步骤d3、NAS利用Softmax激活的体系结构参数集β来表示每个操作符的可能性,对β进行衰减正则化可以限制其值过大,能够提高体系结构泛化性。
5.根据权利要求1所述的基于神经架构搜索的高光谱图像分类方法,其特征在于,步骤e具体为:
步骤e1、经过Softmax操作之后,对所有混合操作中的架构参数α={α(m,n)}网络权重w进行联合学习,根据节点计算,使用交叉熵公式计算训练过程中的损失值,分别获取训练损失值(Ltrain)和验证损失值(Lval);
步骤e2、根据Ltrain和Lval对网络参数与结构参数进行双向优化,获得网络权重参数w,在训练数据集中对w进行训练获得网络参数的最优值,一轮训练过程之后,各个节点之间的结构权重平均分配;
步骤e3、根据损失值对网络参数和结构参数进行双层优化,利用CLR对原体系结构权重的初始学习率进行更新,建立置信梯度,按照本步骤实现循环权重更新;
Figure FDA0003696773000000024
其中:t表示目前训练的当前epoch次数,δ表示置信因子,本发明取δ=2,lrα是NAS架构的学习率,默认设置为lrα=0.0003。
6.根据权利要求1所述的基于神经架构搜索的高光谱图像分类方法,其特征在于,步骤f具体为,
步骤f1、进行权重更新之后,取每个单元(Cell)的节点之前2个最大权重的预设操作,将操作和节点之间进行连接,构建用于下采样的缩减单元和正常采样的正常单元;
步骤f2、正常单元中所有预设操作的步长均为1,因此其输出的特征图的大小保持不变。缩减单元所有预设操作的步长均为2,并且被插入在网络深度的1/3和2/3处。将缩减单元和正常单元进行连接获得最优神经网络架构。
7.根据权利要求1所述的基于神经架构搜索的高光谱图像分类方法,其特征在于,步骤g具体为,利用最优神经网络架构对HSI进行分类获得分类结果。
CN202210677414.2A 2022-06-15 2022-06-15 基于神经网络架构搜索的高光谱分类方法 Pending CN114898217A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210677414.2A CN114898217A (zh) 2022-06-15 2022-06-15 基于神经网络架构搜索的高光谱分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210677414.2A CN114898217A (zh) 2022-06-15 2022-06-15 基于神经网络架构搜索的高光谱分类方法

Publications (1)

Publication Number Publication Date
CN114898217A true CN114898217A (zh) 2022-08-12

Family

ID=82727779

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210677414.2A Pending CN114898217A (zh) 2022-06-15 2022-06-15 基于神经网络架构搜索的高光谱分类方法

Country Status (1)

Country Link
CN (1) CN114898217A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115249315A (zh) * 2022-09-21 2022-10-28 之江实验室 面向异构计算设备的深度学习图像分类方法及装置
CN117036911A (zh) * 2023-10-10 2023-11-10 华侨大学 一种基于神经架构搜索的车辆再辨识轻量化方法及系统
US11887353B1 (en) 2022-09-21 2024-01-30 Zhejiang Lab Deep learning image classification oriented to heterogeneous computing device

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115249315A (zh) * 2022-09-21 2022-10-28 之江实验室 面向异构计算设备的深度学习图像分类方法及装置
CN115249315B (zh) * 2022-09-21 2023-02-03 之江实验室 面向异构计算设备的深度学习图像分类方法及装置
US11887353B1 (en) 2022-09-21 2024-01-30 Zhejiang Lab Deep learning image classification oriented to heterogeneous computing device
CN117036911A (zh) * 2023-10-10 2023-11-10 华侨大学 一种基于神经架构搜索的车辆再辨识轻量化方法及系统

Similar Documents

Publication Publication Date Title
CN110728224B (zh) 一种基于注意力机制深度Contourlet网络的遥感图像分类方法
CN114898217A (zh) 基于神经网络架构搜索的高光谱分类方法
Audebert et al. Generative adversarial networks for realistic synthesis of hyperspectral samples
CN109978041B (zh) 一种基于交替更新卷积神经网络的高光谱图像分类方法
CN113011397B (zh) 基于遥感图像4D-FractalNet的多因素蓝藻水华预测方法
CN112699899A (zh) 一种基于生成对抗网络的高光谱图像特征提取方法
CN114937173A (zh) 一种基于动态图卷积网络的高光谱图像快速分类方法
CN115393719A (zh) 结合空谱域自适应与集成学习的高光谱图像分类方法
CN111160392A (zh) 一种基于小波宽度学习系统的高光谱分类方法
Feng et al. Hyperspectral band selection based on ternary weight convolutional neural network
CN114399642A (zh) 一种卷积神经网络荧光光谱特征提取方法
Xu et al. Wisdom: Weighted incremental spatio-temporal multi-task learning via tensor decomposition
CN116312860B (zh) 基于监督迁移学习的农产品可溶性固形物预测方法
CN116758349A (zh) 基于多尺度超像素节点聚合图卷积残差网络的高光谱图像分类方法
CN116912550A (zh) 一种基于地物依赖关系的异构卷积网络遥感影像土地利用并行分类方法
Pan et al. Enhanced FCN for farmland extraction from remote sensing image
CN116229254A (zh) 一种近海浮筏和深水养殖区的遥感提取方法
CN113433514B (zh) 基于展开式深度网络的参数自学习干扰抑制方法
Liang et al. Hyperspectral image recognition based on artificial neural network
CN112288694B (zh) 基于掩膜区域卷积神经网络的变电设备缺陷识别的方法
CN114998725A (zh) 基于自适应空谱注意力核生成网络的高光谱图像分类方法
CN115147742A (zh) 基于3d深度卷积神经网络的小样本高光谱图像分类方法
CN113723281A (zh) 基于局部自适应尺度集成学习的高分辨率影像分类方法
Ardiansyah et al. 2D-Multinomial elastic net to classify rice growth phases based on images
Rauss et al. Deep greedy learning under thermal variability in full diurnal cycles

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination