CN116704328A - 地物分类方法、装置、电子设备及存储介质 - Google Patents
地物分类方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN116704328A CN116704328A CN202310449774.1A CN202310449774A CN116704328A CN 116704328 A CN116704328 A CN 116704328A CN 202310449774 A CN202310449774 A CN 202310449774A CN 116704328 A CN116704328 A CN 116704328A
- Authority
- CN
- China
- Prior art keywords
- feature
- target
- features
- initial
- global
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000003993 interaction Effects 0.000 claims abstract description 55
- 238000013145 classification model Methods 0.000 claims abstract description 45
- 238000000605 extraction Methods 0.000 claims description 41
- 230000004044 response Effects 0.000 claims description 23
- 230000004927 fusion Effects 0.000 claims description 14
- 238000007781 pre-processing Methods 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 10
- 238000010606 normalization Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 7
- 238000005070 sampling Methods 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 5
- 230000008447 perception Effects 0.000 claims description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000013527 convolutional neural network Methods 0.000 description 12
- 230000008649 adaptation response Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/194—Terrestrial scenes using hyperspectral data, i.e. more or other wavelengths than RGB
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/42—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Remote Sensing (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本申请提供一种地物分类方法、装置、电子设备及存储介质,涉及人工智能技术领域。所述方法包括将高光谱遥感图像输入到目标分类模型,得到目标分类模型输出的地物分类结果;其中,目标分类模型包括:交互模块,用于执行以下步骤:对初始全局特征进行上采样,得到第一上采样特征,并基于第一上采样特征和初始局部特征得到目标局部特征;对初始局部特征进行下采样,得到第一下采样特征,并基于第一下采样特征和初始全局特征得到目标全局特征。本申请实施例提供的地物分类方法、装置、电子设备及存储介质,可以提高高光谱遥感图像的信息表达能力,从而提高基于高光谱遥感图像进行地物分类的精度。
Description
技术领域
本申请涉及人工智能技术领域,尤其涉及一种地物分类方法、装置、电子设备及存储介质。
背景技术
高光谱遥感图像拥有至少100个波段,相较于RGB图像包含更加丰富的地物信息。使用高光谱遥感图像进行地物分类,在及时掌握城市功能分区、农作物分布情况等方面具有很大的优势。
然而,高光谱遥感图像的地物分类存在以下问题:(1)因现有深度学习模型多侧重于局部特征提取,导致模型的信息表达不全,无法满足高精度的地物分类需求;(2)因图像中存在尺寸较小的目标,现有方法提取的特征无法与之匹配,导致漏分与误分现象。
发明内容
本申请实施例提供一种地物分类方法、装置、电子设备及存储介质,可以提高高光谱遥感图像的信息表达能力,从而提高基于高光谱遥感图像进行地物分类的精度。
第一方面,本申请实施例提供一种地物分类方法,包括:
将高光谱遥感图像输入到目标分类模型,得到所述目标分类模型输出的地物分类结果;
其中,所述目标分类模型包括:
预处理模块,用于提取所述高光谱遥感图像的浅层特征;
提取模块,用于基于所述浅层特征确定所述高光谱遥感图像的初始全局特征和初始局部特征;
交互模块,用于执行以下步骤:
对所述初始全局特征进行上采样,得到第一上采样特征,并基于所述第一上采样特征和所述初始局部特征得到目标局部特征;
对所述初始局部特征进行下采样,得到第一下采样特征,并基于所述第一下采样特征和所述初始全局特征得到目标全局特征;
分类模块,用于基于所述目标局部特征以及所述目标全局特征得到所述地物分类结果。
在一个实施例中,所述交互模块具体用于:
重复执行如下目标步骤:
对第一全局特征进行上采样,得到第二上采样特征,并基于所述第二上采样特征和第一局部特征得到第二局部特征;
对所述第一局部特征进行下采样,得到第二下采样特征,并基于所述第二下采样特征和所述第一全局特征得到第二全局特征;
其中,所述初始全局特征为第一次执行所述目标步骤时对应的所述第一全局特征,所述初始局部特征为第一次执行所述目标步骤时对应的所述第一局部特征;
在第N次执行所述目标步骤时,所述第一全局特征为第N-1次执行所述目标步骤时对应的所述第二全局特征;所述第一局部特征为第N-1次执行所述目标步骤时对应的所述第二局部特征;N>1,且N为整数;
所述目标全局特征为最后一次执行所述目标步骤时对应的所述第二全局特征;所述目标局部特征为最后一次执行所述目标步骤时对应的所述第二局部特征。
在一个实施例中,所述交互模块,具体用于:
对所述初始全局特征进行上采样,得到与所述初始局部特征大小相同的所述第一上采样特征;
对所述初始局部特征以及所述第一上采样特征进行融合,得到第一融合特征;
对所述第一融合特征进行多次卷积操作,得到第一响应权重图;
对所述第一上采样特征以及所述第一响应权重图进行元素乘法计算,得到第一中间特征;
对所述第一中间特征以及所述初始局部特征进行残差链接,得到所述目标局部特征。
在一个实施例中,所述交互模块,具体用于:
对所述初始局部特征进行下采样,得到与所述初始全局特征大小相同的所述第一下采样特征;
对所述初始全局特征以及所述第一下采样特征进行融合,得到第二融合特征;
对所述第二融合特征进行多次归一化操作,得到第二响应权重图;
对所述第一下采样特征以及所述第二响应权重图进行元素乘法计算,得到第二中间特征;
对所述第二中间特征以及所述初始全局特征进行残差链接,得到所述目标全局特征。
在一个实施例中,所述提取模块具体用于:
对所述浅层特征进行归一化处理,得到第一特征;
对所述第一特征进行注意力特征提取,得到第二特征;
对所述第二特征进行归一化处理,得到第三特征;
对所述第三特征进行多层感知映射,得到所述初始全局特征。
在一个实施例中,所述提取模块具体用于:
对所述浅层特征进行卷积处理,得到所述初始局部特征。
在一个实施例中,所述特征提取交互模块是通过如下方式训练的:
基于高光谱遥感图像样本及其对应的地物分类结果,对初始分类模型进行训练,得到所述目标分类模型。
第二方面,本申请实施例提供一种地物分类装置,包括:
分类模块,用于将高光谱遥感图像输入到目标分类模型,得到所述目标分类模型输出的高光谱遥感图像分类结果;
其中,所述目标分类模型包括:
预处理模块,用于提取所述高光谱遥感图像的浅层特征;
提取模块,用于基于所述浅层特征确定所述高光谱遥感图像的初始全局特征和初始局部特征;
交互模块,用于执行以下步骤:
对所述初始全局特征进行上采样,得到第一上采样特征,并基于所述第一上采样特征和所述初始局部特征得到目标局部特征;
对所述初始局部特征进行下采样,得到第一下采样特征,并基于所述第一下采样特征和所述初始全局特征得到目标全局特征;
分类模块,用于基于所述目标局部特征以及所述目标全局特征得到所述高光谱遥感图像分类结果。
第三方面,本申请还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面所述的方法。
第四方面,本申请还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所述的方法。
本申请实施例提供的地物分类方法、装置、电子设备及存储介质,通过对高光谱遥感图像提取初始全局特征与初始局部特征,并对两者进行交互得到目标全局特征与目标局部特征,一方面提高了特征提取的多线性,增强了地物信息的纹理信息与特征;另一方面增强了全局和局部特征之间的交互,从而提高了高光谱遥感图像信息表达能力,得到了更好的特征提取效果,有效提升了最终的分类精度。
附图说明
为了更清楚地说明本申请或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的地物分类方法的流程示意图;
图2是本申请实施例提供的提取目标全局特征与目标局部特征的流程示意图;
图3是本申请实施例提供的提取初始全局特征与初始局部特征的流程示意图;
图4是本申请实施例提供的地物分类装置的结构示意图;
图5是本申请实施例提供的电子设备的实体结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请中的附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
发明人在创造本申请的过程中,考虑了如下方面:
基于高光谱遥感图像进行地物分类的方法通常可分为三类:基于传统机器学习方法、基于深度卷积神经网络方法以及基于转换器方法。
基于传统机器学习方法有支持向量机(Support Vector Machine,SVM),K-最近邻算法(K-Nearest Neighbor,KNN)等;基于深度卷积神经网络方法有卷积神经网络模型(Convolutional Neural Network,CNN),具有注意力机制的卷积神经网络模型(AttentionCNN)等;基于转换器方法有Transformer模型等。
基于传统机器学习方法大多依靠人工进行特征提取,不一定能够符合多样性变化,其鲁棒性与普适性较差;基于深度卷积神经网络模型侧重于提取局部特征,特征形式单一,而且无法提取全局特征,导致信息表达不够清晰,精度提升有瓶颈;基于转换器模型可以提取全局特征,但是无法捕获局部纹理特征等,导致信息表达不全,无法进一步提高分类精度。
图1是本申请实施例提供的地物分类方法的流程示意图。参照图1,本申请实施例提供一种地物分类方法,可以包括:
步骤110、将高光谱遥感图像输入到目标分类模型,得到目标分类模型输出的地物分类结果;
其中,目标分类模型包括:
预处理模块,用于提取高光谱遥感图像的浅层特征;
提取模块,用于基于浅层特征确定高光谱遥感图像的初始全局特征和初始局部特征;
交互模块,用于执行以下步骤:
对初始全局特征进行上采样,得到第一上采样特征,并基于第一上采样特征和初始局部特征得到目标局部特征;
对初始局部特征进行下采样,得到第一下采样特征,并基于第一下采样特征和初始全局特征得到目标全局特征;
分类模块,用于基于目标局部特征以及目标全局特征得到地物分类结果。
需要说明的是,本申请实施例提供的地物分类方法的执行主体可以是计算机设备,例如手机、平板电脑、笔记本电脑、掌上电脑等。下面以执行该地物分类方法的分类系统作为执行主体为例,来说明本申请实施例提供的地物分类方法。
高光谱遥感图像包含丰富的地物信息,可以基于高光谱遥感图像进行地物分类。在步骤110中,分类系统的目标分类模型可以对高光谱遥感图像进行预处理并基于处理后的图像得到目标全局特征和目标局部特征,并进一步基于目标全局特征和目标局部特征识别相关地物的类别。将高光谱遥感图像输入到目标分类模型,目标分类模型即可以输出地物分类结果。
具体地,目标分类模型可以包括:
预处理模块,可以用于提取高光谱遥感图像的浅层特征。预处理模块可以对输入的高光谱遥感图像进行卷积处理和归一化处理。具体地,可以采用一个3*3的卷积层(Convolutional Layer,Conv)以及一个批量归一化层(Batch Normalization,BN)提取浅层特征,用于下一步操作。
提取模块,可以用于基于浅层特征确定高光谱遥感图像的初始全局特征和初始局部特征。提取模块可以先将浅层特征进行归一化处理,然后将浅层特征输入到网络模型中进行深层特征提取,得到深层特征的输出结果,即为初始全局特征和初始局部特征。
交互模块,可以包含自适应响应交互模块(Adaptive Response Fusion Module,ARFM),自适应响应交互模块包含一个双自注意块和一个上/下采样层,用于选择相应的全局/局部特征和一个上/下层来转换全局/局部特征。交互模块可以用于对初始全局特征进行上采样,得到第一上采样特征,并基于第一上采样特征和初始局部特征得到目标局部特征;对初始局部特征进行下采样,得到第一下采样特征,并基于第一下采样特征和初始全局特征得到目标全局特征。
分类模块,可以用于基于目标局部特征以及目标全局特征得到地物分类结果。目标局部特征和目标全局特征包含了丰富的有关地物分类的信息,分类模块可以基于此对地物进行分类,并输出分类结果。
本申请实施例提供的地物分类方法,通过对高光谱遥感图像提取初始全局特征与初始局部特征,并对两者进行交互得到目标全局特征与目标局部特征,一方面提高了特征提取的多线性,增强了地物信息的纹理信息与特征;另一方面增强了全局和局部特征之间的交互,从而提高了高光谱遥感图像信息表达能力,得到了更好的特征提取效果,有效提升了最终的分类精度。
在一个实施例中,交互模块具体用于:
重复执行如下目标步骤:
对第一全局特征进行上采样,得到第二上采样特征,并基于第二上采样特征和第一局部特征得到第二局部特征;
对第一局部特征进行下采样,得到第二下采样特征,并基于第二下采样特征和第一全局特征得到第二全局特征;
其中,初始全局特征为第一次执行所述目标步骤时对应的第一全局特征,初始局部特征为第一次执行所述目标步骤时对应的第一局部特征;
在第N次执行所述目标步骤时,第一全局特征为第N-1次执行目标步骤时对应的第二全局特征;第一局部特征为第N-1次执行目标步骤时对应的第二局部特征;N>1,且N为整数;
目标全局特征为最后一次执行目标步骤时对应的第二全局特征;目标局部特征为最后一次执行目标步骤时对应的第二局部特征。
交互模块可以重复执行以下目标步骤:通过上采样层对第一全局特征进行上采样,得到第二上采样特征,并基于第二上采样特征和第一局部特征的交互得到第二局部特征;通过下采样层对第一局部特征进行下采样,得到第二下采样特征,并基于第二下采样特征和第一全局特征的交互得到第二全局特征。
其中,提取模块得到的初始全局特征即为交互模块第一次执行目标步骤时对应的第一全局特征;提取模块得到的初始局部特征即为交互模块第一次执行所述目标步骤时对应的第一局部特征。
在交互模块第N次执行目标步骤时,第一全局特征为第N-1次执行目标步骤时对应的第二全局特征;第一局部特征为第N-1次执行目标步骤时对应的第二局部特征;其中,N>1,且N为整数。例如,在交互模块第2次执行目标步骤时,第一全局特征为第1次执行目标步骤是对应的第二全局特征,第一局部特征为第1次执行目标步骤时对应的第二局部特征。
交互模块最终得到的目标全局特征为最后一次执行目标步骤时对应的第二全局特征;交互模块最终得到的目标局部特征为最后一次执行目标步骤时对应的第二局部特征。
本申请实施例提供的地物分类方法,交互模块可以重复提取并处理全局特征与局部特征,提高了目标全局特征和目标局部特征的精度,从而能够获得更好的特征提取效果,有效提升最终的分类精度。
在一个实施例中,交互模块具体用于:
对初始全局特征进行上采样,得到与初始局部特征大小相同的第一上采样特征;
对初始局部特征以及第一上采样特征进行融合,得到第一融合特征;
对第一融合特征进行多次卷积操作,得到第一响应权重图;
对第一上采样特征以及第一响应权重图进行元素乘法计算,得到第一中间特征;
对第一中间特征以及初始局部特征进行残差链接,得到目标局部特征。
如图2所示,交互模块可以使用自适应响应交互模块的上采样操作即“Up”操作将初始全局特征FG进行上采样,转换为第一上采样特征。第一上采样特征与初始局部特征FL大小相同。然后将第一上采样特征视为关键映射(Key map)(K),将初始局部特征FL视为查询映射(Query map)(Q),对初始局部特征FL以及第一上采样特征进行融合,得到第一融合特征。自适应响应交互模块可以使用两个1*1的卷积层θ和δ对第一融合特征进行多次卷积操作,得到第一响应权重图(Response weight,RW)。然后对第一上采样特征以及第一响应权重图进行元素乘法计算,得到第一中间特征,对第一中间特征以及初始局部特征FL进行残差链接,即进行矩阵相加,得到目标局部特征具体的计算公式如下:
Q=FL,K=WUp(FG),V=WUp(FG),
RW=WθWδconcate(Q,K),
其中WUp,Wθ,和Wδ是“Up”,θ,δ的权重。“concate”代表融合操作。“RW”是响应权重图。
本申请实施例提供的地物分类方法,通过将全局特征的上采样特征与初始局部特征融合,并进行卷积操作和残差链接,得到目标局部特征。提高了目标局部特征的有效性,从而提升了最终的分类精度。
在一个实施例中,交互模块具体用于:
对初始局部特征进行下采样,得到与初始全局特征大小相同的第一下采样特征;
对初始全局特征以及第一下采样特征进行融合,得到第二融合特征;
对第二融合特征进行多次归一化操作,得到第二响应权重图;
对第一下采样特征以及第二响应权重图进行元素乘法计算,得到第二中间特征;
对第二中间特征以及初始全局特征进行残差链接,得到目标全局特征。
如图2所示,交互模块可以使用自适应响应交互模块的下采样操作即“Down”操作将初始局部特征FL映射为第一下采样特征,然后将第一下采样特征作为关键映射(Keymap)(K),将初始全局特征FG作为查询映射(Query map)(Q),对初始全局特征FG以及第一下采样特征进行融,得到第二融合特征。自适应响应交互模块可以使用两个Layer Norm层和/>对第二融合特征进行多次归一化操作,得到第二响应权重图,对第一下采样特征以及第二响应权重图进行元素乘法算,得到第二中间特征。最后,自适应响应交互模块对第二中间特征与原始全局特征FG进行残差链接,得到目标全局特征/>具体的计算公式如下:
Q=FG,K=WDown(FL),V=WDown(FL),
其中WDown,和/>是“Down”,/> 的权重。“concate”代表融合操作。“RW”是响应权重图。
本申请实施例提供的地物分类方法,通过将局部特征的下采样特征与初始局部特征融合,并进行归一操作和残差链接,得到目标全局特征。提高了目标全局特征的有效性,从而提升了最终的分类精度。
在一个实施例中,提取模块具体用于:
对浅层特征进行归一化处理,得到第一特征;
对第一特征进行注意力特征提取,得到第二特征;
对第二特征进行归一化处理,得到第三特征;
对第三特征进行多层感知映射,得到初始全局特征。
如图3所示,提取模块包括转换器模块(Trans stages),可以基于LayerNorm层对预处理模块提取的浅层特征进行归一化处理,得到第一特征。然后基于多注意力层(Multi-head Self-attention,MHSA)进行注意力特征提取,得到第二特征。对第二特征基于LayerNorm层进行归一化处理,得到第三特征。然后基于多层感知层(MultilayerPerceptron,MLP)对第三特征进行多层感知映射,从而得到初始全局特征。
本申请实施例提供的地物分类方法,通过提取模块对浅层特征进行归一化、注意力特征提取和多层感知映射,得到初始全局特征,有利于保证后续地物分类步骤的进行和地物分类结果的准确性。
在一个实施例中,提取模块具体用于:
对所述浅层特征进行卷积处理,得到所述初始局部特征。
如图3所示,提取模块包括卷积神经模块(CNN blocks),可以基于两个3*3的Conv层对预处理模块的浅层特征进行卷积处理并基于BN层进行归一化,提取深层特征,然后基于一个1*1的Conv层和BN层对提取的深层特征进行特征变化并进行残差链接,从而得到初始局部特征。
本申请实施例提供的地物分类方法,通过提取模块对浅层特征进行卷积处理,得到初始局部特征,有利于保证后续地物分类步骤的进行和地物分类结果的准确性。
在一个实施例中,特征提取交互模块是通过如下方式训练的:
基于高光谱遥感图像样本及其对应的地物分类结果,对初始分类模型进行训练,得到所述目标分类模型。
目标模型可以以多张高光谱遥感图像作为样本,将高光谱遥感图像样本对应的地物分类结果作为标签,对初始分类模型进行训练,当初始模型的准确率达到目标要求时,可以得到目标分类模型。当目标分类模型接收到高光谱遥感图像时,可以识别并输出对应的地物分类结果。
本申请实施例提供的地物分类方法,通过训练得到目标分类模型,可以自动化基于高光谱遥感图像识别地物类别,而且可以基于实际需要不断优化迭代,从而提高了地物分类的效率和准确率。
综上所述,本申请提出一种基于转换器模块和卷积神经模块混合的地物分类方法,通过混合转换器与卷积神经网络模块,并利用自适应响应模块,增加特征提取的多样性,增强地物信息的纹理信息与特征,并利用自适应响应交互模块,增强了全局和局部特征之间的交互,提高了高光谱遥感图像的信息表达能力。
本申请既能够解决高光谱遥感图像的高维特性和信息冗余且传统机器学习鲁棒性差的问题,又能够解决深度卷积神经网络模型和转换器模型信息表达不全的问题,可以进一步提高地物分类准确率。
下面对本申请实施例提供的地物分类装置进行描述,下文描述的地物分类装置与上文描述的地物分类方法可相互对应参照。
图4是本申请实施例提供的地物分类装置的结构示意图。参照图2,本申请实施例提供的地物分类装置,可以包括:
分类模块410,用于将高光谱遥感图像输入到目标分类模型,得到所述目标分类模型输出的高光谱遥感图像分类结果;
其中,所述目标分类模型包括:
预处理模块411,用于提取所述高光谱遥感图像的浅层特征;
提取模块412,用于基于所述浅层特征确定所述高光谱遥感图像的初始全局特征和初始局部特征;
交互模块413,用于执行以下步骤:
对所述初始全局特征进行上采样,得到第一上采样特征,并基于所述第一上采样特征和所述初始局部特征得到目标局部特征;
对所述初始局部特征进行下采样,得到第一下采样特征,并基于所述第一下采样特征和所述初始全局特征得到目标全局特征;
分类模块414,用于基于所述目标局部特征以及所述目标全局特征得到所述高光谱遥感图像分类结果。
本申请实施例提供的地物分类装置,通过对高光谱遥感图像提取初始全局特征与初始局部特征,并对两者进行交互得到目标全局特征与目标局部特征,一方面提高了特征提取的多线性,增强了地物信息的纹理信息与特征;另一方面增强了全局和局部特征之间的交互,从而提高了高光谱遥感图像信息表达能力,得到了更好的特征提取效果,有效提升了最终的分类精度。在一个实施例中,交互模块413具体用于:
重复执行如下目标步骤:
对第一全局特征进行上采样,得到第二上采样特征,并基于所述第二上采样特征和第一局部特征得到第二局部特征;
对所述第一局部特征进行下采样,得到第二下采样特征,并基于所述第二下采样特征和所述第一全局特征得到第二全局特征;
其中,所述初始全局特征为第一次执行所述目标步骤时对应的所述第一全局特征,所述初始局部特征为第一次执行所述目标步骤时对应的所述第一局部特征;
在第N次执行所述目标步骤时,所述第一全局特征为第N-1次执行所述目标步骤时对应的所述第二全局特征;所述第一局部特征为第N-1次执行所述目标步骤时对应的所述第二局部特征;N>1,且N为整数;
所述目标全局特征为最后一次执行所述目标步骤时对应的所述第二全局特征;所述目标局部特征为最后一次执行所述目标步骤时对应的所述第二局部特征。
在一个实施例中,交互模块413还用于:
对所述初始全局特征进行上采样,得到与所述初始局部特征大小相同的所述第一上采样特征;
对所述初始局部特征以及所述第一上采样特征进行融合,得到第一融合特征;
对所述第一融合特征进行多次卷积操作,得到第一响应权重图;
对所述第一上采样特征以及所述第一响应权重图进行元素乘法计算,得到第一中间特征;
对所述第一中间特征以及所述初始局部特征进行残差链接,得到所述目标局部特征。
在一个实施例中,交互模块413还用于:
对所述初始局部特征进行下采样,得到与所述初始全局特征大小相同的所述第一下采样特征;
对所述初始全局特征以及所述第一下采样特征进行融合,得到第二融合特征;
对所述第二融合特征进行多次归一化操作,得到第二响应权重图;
对所述第一下采样特征以及所述第二响应权重图进行元素乘法计算,得到第二中间特征;
对所述第二中间特征以及所述初始全局特征进行残差链接,得到所述目标全局特征。
在一个实施例中,提取模块412具体用于:
对所述浅层特征进行归一化处理,得到第一特征;
对所述第一特征进行注意力特征提取,得到第二特征;
对所述第二特征进行归一化处理,得到第三特征;
对所述第三特征进行多层感知映射,得到所述初始全局特征。
在一个实施例中,提取模块412还用于:
对所述浅层特征进行卷积处理,得到所述初始局部特征。
在一个实施例中,特征提取交互模块413是通过如下方式训练的:
基于高光谱遥感图像样本及其对应的地物分类结果,对初始分类模型进行训练,得到所述目标分类模型。
在此需要说明的是,本申请实施例提供的地物分类装置基于上述地物分类方法能够达到相同的技术效果,在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。
图5示例了一种电子设备的实体结构示意图,如图5所示,该电子设备可以包括:处理器(processor)510、通信接口(Communication Interface)520、存储器(memory)530和通信总线540,其中,处理器510,通信接口520,存储器530通过通信总线540完成相互间的通信。处理器510可以调用存储器530中的计算机程序,以执行地物分类方法,例如包括:
将高光谱遥感图像输入到目标分类模型,得到所述目标分类模型输出的地物分类结果;
其中,所述目标分类模型包括:
预处理模块,用于提取所述高光谱遥感图像的浅层特征;
提取模块,用于基于所述浅层特征确定所述高光谱遥感图像的初始全局特征和初始局部特征;
交互模块,用于执行以下步骤:
对所述初始全局特征进行上采样,得到第一上采样特征,并基于所述第一上采样特征和所述初始局部特征得到目标局部特征;
对所述初始局部特征进行下采样,得到第一下采样特征,并基于所述第一下采样特征和所述初始全局特征得到目标全局特征;
分类模块,用于基于所述目标局部特征以及所述目标全局特征得到所述地物分类结果。
此外,上述的存储器530中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的地物分类方法的步骤,例如包括:
将高光谱遥感图像输入到目标分类模型,得到所述目标分类模型输出的地物分类结果;
其中,所述目标分类模型包括:
预处理模块,用于提取所述高光谱遥感图像的浅层特征;
提取模块,用于基于所述浅层特征确定所述高光谱遥感图像的初始全局特征和初始局部特征;
交互模块,用于执行以下步骤:
对所述初始全局特征进行上采样,得到第一上采样特征,并基于所述第一上采样特征和所述初始局部特征得到目标局部特征;
对所述初始局部特征进行下采样,得到第一下采样特征,并基于所述第一下采样特征和所述初始全局特征得到目标全局特征;
分类模块,用于基于所述目标局部特征以及所述目标全局特征得到所述地物分类结果。
所述处理器可读存储介质可以是处理器能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器(例如软盘、硬盘、磁带、磁光盘(MO)等)、光学存储器(例如CD、DVD、BD、HVD等)、以及半导体存储器(例如ROM、EPROM、EEPROM、非易失性存储器(NANDFLASH)、固态硬盘(SSD))等。
又一方面,本申请实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述地物分类方法,例如包括:
将高光谱遥感图像输入到目标分类模型,得到所述目标分类模型输出的地物分类结果;
其中,所述目标分类模型包括:
预处理模块,用于提取所述高光谱遥感图像的浅层特征;
提取模块,用于基于所述浅层特征确定所述高光谱遥感图像的初始全局特征和初始局部特征;
交互模块,用于执行以下步骤:
对所述初始全局特征进行上采样,得到第一上采样特征,并基于所述第一上采样特征和所述初始局部特征得到目标局部特征;
对所述初始局部特征进行下采样,得到第一下采样特征,并基于所述第一下采样特征和所述初始全局特征得到目标全局特征;
分类模块,用于基于所述目标局部特征以及所述目标全局特征得到所述地物分类结果。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (10)
1.一种地物分类方法,其特征在于,包括:
将高光谱遥感图像输入到目标分类模型,得到所述目标分类模型输出的地物分类结果;
其中,所述目标分类模型包括:
预处理模块,用于提取所述高光谱遥感图像的浅层特征;
提取模块,用于基于所述浅层特征确定所述高光谱遥感图像的初始全局特征和初始局部特征;
交互模块,用于执行以下步骤:
对所述初始全局特征进行上采样,得到第一上采样特征,并基于所述第一上采样特征和所述初始局部特征得到目标局部特征;
对所述初始局部特征进行下采样,得到第一下采样特征,并基于所述第一下采样特征和所述初始全局特征得到目标全局特征;
分类模块,用于基于所述目标局部特征以及所述目标全局特征得到所述地物分类结果。
2.根据权利要求1所述的地物分类方法,其特征在于,所述交互模块具体用于:
重复执行如下目标步骤:
对第一全局特征进行上采样,得到第二上采样特征,并基于所述第二上采样特征和第一局部特征得到第二局部特征;
对所述第一局部特征进行下采样,得到第二下采样特征,并基于所述第二下采样特征和所述第一全局特征得到第二全局特征;
其中,所述初始全局特征为第一次执行所述目标步骤时对应的所述第一全局特征,所述初始局部特征为第一次执行所述目标步骤时对应的所述第一局部特征;
在第N次执行所述目标步骤时,所述第一全局特征为第N-1次执行所述目标步骤时对应的所述第二全局特征;所述第一局部特征为第N-1次执行所述目标步骤时对应的所述第二局部特征;N>1,且N为整数;
所述目标全局特征为最后一次执行所述目标步骤时对应的所述第二全局特征;所述目标局部特征为最后一次执行所述目标步骤时对应的所述第二局部特征。
3.根据权利要求1所述的地物分类方法,其特征在于,所述交互模块,具体用于:
对所述初始全局特征进行上采样,得到与所述初始局部特征大小相同的所述第一上采样特征;
对所述初始局部特征以及所述第一上采样特征进行融合,得到第一融合特征;
对所述第一融合特征进行多次卷积操作,得到第一响应权重图;
对所述第一上采样特征以及所述第一响应权重图进行元素乘法计算,得到第一中间特征;
对所述第一中间特征以及所述初始局部特征进行残差链接,得到所述目标局部特征。
4.根据权利要求1所述的地物分类方法,其特征在于,所述交互模块,具体用于:
对所述初始局部特征进行下采样,得到与所述初始全局特征大小相同的所述第一下采样特征;
对所述初始全局特征以及所述第一下采样特征进行融合,得到第二融合特征;
对所述第二融合特征进行多次归一化操作,得到第二响应权重图;
对所述第一下采样特征以及所述第二响应权重图进行元素乘法计算,得到第二中间特征;
对所述第二中间特征以及所述初始全局特征进行残差链接,得到所述目标全局特征。
5.根据权利要求1所述的地物分类方法,其特征在于,所述提取模块具体用于:
对所述浅层特征进行归一化处理,得到第一特征;
对所述第一特征进行注意力特征提取,得到第二特征;
对所述第二特征进行归一化处理,得到第三特征;
对所述第三特征进行多层感知映射,得到所述初始全局特征。
6.根据权利要求1所述的地物分类方法,其特征在于,所述提取模块具体用于:
对所述浅层特征进行卷积处理,得到所述初始局部特征。
7.根据权利要求1至6任一项所述的地物分类方法,其特征在于,所述特征提取交互模块是通过如下方式训练的:
基于高光谱遥感图像样本及其对应的高地物分类结果,对初始分类模型进行训练,得到所述目标分类模型。
8.一种地物分类装置,其特征在于,包括:
分类模块,用于将高光谱遥感图像输入到目标分类模型,得到所述目标分类模型输出的高光谱遥感图像分类结果;
其中,所述目标分类模型包括:
预处理模块,用于提取所述高光谱遥感图像的浅层特征;
提取模块,用于基于所述浅层特征确定所述高光谱遥感图像的初始全局特征和初始局部特征;
交互模块,用于执行以下步骤:
对所述初始全局特征进行上采样,得到第一上采样特征,并基于所述第一上采样特征和所述初始局部特征得到目标局部特征;
对所述初始局部特征进行下采样,得到第一下采样特征,并基于所述第一下采样特征和所述初始全局特征得到目标全局特征;
分类模块,用于基于所述目标局部特征以及所述目标全局特征得到所述高光谱遥感图像分类结果。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述的地物分类方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的地物分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310449774.1A CN116704328A (zh) | 2023-04-24 | 2023-04-24 | 地物分类方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310449774.1A CN116704328A (zh) | 2023-04-24 | 2023-04-24 | 地物分类方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116704328A true CN116704328A (zh) | 2023-09-05 |
Family
ID=87836353
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310449774.1A Pending CN116704328A (zh) | 2023-04-24 | 2023-04-24 | 地物分类方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116704328A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113298235A (zh) * | 2021-06-10 | 2021-08-24 | 浙江传媒学院 | 一种多分支深度自注意力变换网络的神经网络架构及实现方法 |
CN113743346A (zh) * | 2021-09-13 | 2021-12-03 | 北京航空航天大学 | 图像识别方法、装置、电子设备及存储介质 |
CN114743017A (zh) * | 2022-04-15 | 2022-07-12 | 北京化工大学 | 基于Transformer全局与局部注意力交互的目标检测方法 |
CN114898157A (zh) * | 2022-05-23 | 2022-08-12 | 河南大学 | 用于高光谱图像分类的全局学习装置及方法 |
CN114898106A (zh) * | 2022-05-26 | 2022-08-12 | 华北水利水电大学 | 基于rgb-t多源图像数据的显著性目标检测方法 |
CN115797781A (zh) * | 2022-12-30 | 2023-03-14 | 中国工商银行股份有限公司 | 农作物识别方法、装置、计算机设备和存储介质 |
-
2023
- 2023-04-24 CN CN202310449774.1A patent/CN116704328A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113298235A (zh) * | 2021-06-10 | 2021-08-24 | 浙江传媒学院 | 一种多分支深度自注意力变换网络的神经网络架构及实现方法 |
CN113743346A (zh) * | 2021-09-13 | 2021-12-03 | 北京航空航天大学 | 图像识别方法、装置、电子设备及存储介质 |
CN114743017A (zh) * | 2022-04-15 | 2022-07-12 | 北京化工大学 | 基于Transformer全局与局部注意力交互的目标检测方法 |
CN114898157A (zh) * | 2022-05-23 | 2022-08-12 | 河南大学 | 用于高光谱图像分类的全局学习装置及方法 |
CN114898106A (zh) * | 2022-05-26 | 2022-08-12 | 华北水利水电大学 | 基于rgb-t多源图像数据的显著性目标检测方法 |
CN115797781A (zh) * | 2022-12-30 | 2023-03-14 | 中国工商银行股份有限公司 | 农作物识别方法、装置、计算机设备和存储介质 |
Non-Patent Citations (2)
Title |
---|
BO ZHAO等: "3M-CDNet-V2: An Efficient Medium-Weight Neural Network for Remote Sensing Image Change Detection", 《IEEE ACCESS》, vol. 10, pages 89581 * |
张艳月: "基于深度特征融合的遥感图像分类算法研究", 《中国优秀硕士学位论文全文数据库工程科技Ⅱ辑》, no. 01, pages 028 - 175 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yu et al. | Stacked convolutional sparse denoising auto-encoder for identification of defect patterns in semiconductor wafer map | |
US20210012198A1 (en) | Method for training deep neural network and apparatus | |
US20210133483A1 (en) | Object detection based on pixel differences | |
US9424493B2 (en) | Generic object detection in images | |
US10354199B2 (en) | Transductive adaptation of classifiers without source data | |
WO2022116856A1 (zh) | 一种模型结构、模型训练方法、图像增强方法及设备 | |
CN111027576B (zh) | 基于协同显著性生成式对抗网络的协同显著性检测方法 | |
Singh et al. | A study of moment based features on handwritten digit recognition | |
EP2243089A2 (en) | Method for training a learning machine having a deep multi-layered network with labeled and unlabeled training data | |
WO2018071424A1 (en) | All-in-one convolutional neural network for face analysis | |
CN115937655B (zh) | 多阶特征交互的目标检测模型及其构建方法、装置及应用 | |
CN112789626A (zh) | 可扩展和压缩的神经网络数据储存系统 | |
US20200387783A1 (en) | Fast Nearest Neighbor Search for Output Generation of Convolutional Neural Networks | |
CN115222998B (zh) | 一种图像分类方法 | |
Menaga et al. | Deep learning: a recent computing platform for multimedia information retrieval | |
US20240046067A1 (en) | Data processing method and related device | |
CN116129174A (zh) | 基于特征细化自监督学习的广义零样本图像分类方法 | |
WO2022063076A1 (zh) | 对抗样本的识别方法及装置 | |
CN113743521B (zh) | 一种基于多尺度上下文感知的目标检测方法 | |
CN116758092A (zh) | 图像分割方法、装置、电子设备及存储介质 | |
CN116704328A (zh) | 地物分类方法、装置、电子设备及存储介质 | |
CN116543250A (zh) | 一种基于类注意力传输的模型压缩方法 | |
CN111008992A (zh) | 目标跟踪方法、装置和系统及存储介质 | |
CN115713769A (zh) | 文本检测模型的训练方法、装置、计算机设备和存储介质 | |
CN116030290A (zh) | 在设备上检测数字对象并且生成对象掩膜 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |