CN115439740A - 耕地识别方法、装置、设备及存储介质 - Google Patents
耕地识别方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN115439740A CN115439740A CN202210937606.2A CN202210937606A CN115439740A CN 115439740 A CN115439740 A CN 115439740A CN 202210937606 A CN202210937606 A CN 202210937606A CN 115439740 A CN115439740 A CN 115439740A
- Authority
- CN
- China
- Prior art keywords
- feature map
- farmland
- coding
- decoding
- identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/182—Network patterns, e.g. roads or rivers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种耕地识别方法、装置、设备及存储介质,包括:获取待识别影像数据;将待识别影像数据输入至耕地识别模型,以利用耕地识别模型对待识别影像数据进行多任务识别,输出耕地范围结果和耕地边界识别结果;其中,耕地识别模型是基于待训练遥感影像以及待训练遥感影像样本对应的耕地范围结果标签和耕地边界识别结果标签,进行空间注意力机制的多任务训练获得。本发明通过采用基于空间注意力机制的耕地识别模型进行耕地范围和耕地边界多任务识别,增加对行道树和田间道路的识别能力,通过增加空间注意力机制,可突出其重点特征和细节信息的技术手段,从而解决了耕地识别准确性较低的技术问题,提高了耕地识别的准确性。
Description
技术领域
本发明涉及耕地应用技术领域,尤其涉及一种耕地识别方法、装置、设备及存储介质。
背景技术
耕地资源是保障粮食安全的基础,中国耕地面积广阔,要进行耕地的非农化、非粮化、耕地的弃耕与休耕监测,精准的耕地识别十分有必要。
但是耕地农业景观复杂多样,地块面积小且较为破碎,田间道路、行道树的存在,大大增加了耕地识别的难度。近年来,随着中高分辨率影像的大量普及,利用中高分辨率影像,能够从视觉上区分出耕地、行道树以及田间道路,但是由于行道树的遮挡,且行道树本身体现出来的植被信息,难以从视觉上准确将田间道路和行道树从耕地图斑中区分出来,导致耕地识别的准确性较低。
发明内容
本发明提供一种耕地识别方法、装置、设备及存储介质,用以解决现有技术中由于行道树的遮挡,且行道树本身体现出来的植被信息,难以准确将田间道路和行道树从耕地图斑中区分出来的缺陷,旨在提耕地识别的准确性。
本发明提供一种耕地识别,包括:
获取待识别影像数据;
将所述待识别影像数据输入至耕地识别模型,以利用所述耕地识别模型对所述待识别影像数据进行多任务识别,输出耕地范围结果和耕地边界识别结果;
其中,所述耕地识别模型是基于预先收集的待训练遥感影像以及所述待训练遥感影像对应的耕地范围结果标签和耕地边界识别结果标签,进行空间注意力机制的多任务训练获得。
可选地,根据本发明提供的一种耕地识别,所述耕地识别模型包括编码模块、解码模块、空间注意力模块和多任务像素分类模块,其中:
所述编码模块包括若干个串联的编码单元,除最后一个编码单元外每个编码单元包括残差块和最大池化层,最后一个编码单元包括残差块;
所述解码模块包括若干个串联的解码单元,每个解码单元包括上采样层、特征连接层和残差块;
各个编码单元中的残差块的输出通过所述空间注意力模块进行优化处理后输入至对应的解码单元中;
最后一个解码单元的残差块的输出作为所述多任务像素分类模块的输入。
可选地,根据本发明提供的一种耕地识别,所述通过预先训练的耕地识别模型,对所述待识别影像数据进行多任务识别,得到所述待识别影像数据对应的耕地范围和耕地边界,包括:
通过第一个编码单元中的残差块对所述待识别影像数据进行特征提取,得到第一编码单元中残差块输出的编码特征图;
通过第一个编码单元中的最大池化层对所述编码特征图进行池化处理,得到池化处理特征图,并将所述池化处理特征图作为下一个编码单元的输入,直至得到最后一个编码单元中残差块输出的编码特征图;
在除最后一个编码单元外各个编码单元输出的编码特征图中筛选得到与最后一个编码单元的编码特征图相匹配的第一目标编码特征图;
通过所述空间注意力模块对所述第一目标编码特征图和所述最后一个编码单元的编码特征图进行特征优化,得到第一优化特征图;
通过第一个解码单元中的上采样层对所述最后一个编码单元的编码特征图进行上采样处理,得到第一上采样特征图;
通过所述特征连接层对所述第一优化特征图和所述第一上采样特征图进行特征连接,得到第一目标连接特征图;
通过第一个解码单元中的残差块对所述第一目标连接特征图进行解码,得到当前解码单元输出的解码特征图;
基于各所述编码单元输出的编码特征图以及所述当前解码单元输出的解码特征图,确定下一个解码单元中残差块的输入特征图,直至得到最后一个编码单元输出的解码特征图;
将所述最后一个解码单元输出的解码特征图输入至所述多任务像素分类模块,得到所述耕地范围结果和所述耕地边界识别结果。
可选地,根据本发明提供的一种耕地识别,所述基于各所述编码单元输出的编码特征图以及所述当前解码单元输出的解码特征图,确定下一个解码单元中残差块的输入特征图,直至得到最后一个编码单元输出的解码特征图,包括:
基于各所述编码单元中残差块输出的编码特征图,筛选得到与所述当前解码单元的解码特征图相匹配的第二目标编码特征图;
通过所述空间注意力模块对所述第二目标编码特征图和所述解码特征图进行特征优化,得到第二优化特征图;
通过当前解码单元的下一个解码单元中的上采样层对当前解码单元的输出的解码特征图进行上采样处理,得到第二上采样特征图;
通过所述下一个解码单元中的特征连接层对所述第二优化特征图和所述第二上采样特征图进行特征连接,得到第二目标连接特征图,并将所述第二目标连接特征图作为所述下一个解码单元中残差块的输入,以得到所述下一个解码单元的解码特征图;
返回执行所述基于各所述编码单元中残差块输出的编码特征图,筛选得到与所述当前解码单元的解码特征图相匹配的第二目标编码特征图的步骤,直至得到最后一个解码单元输出的解码特征图。
可选地,根据本发明提供的一种耕地识别,所述空间注意力模块包括第一卷积层、第二卷积层、第三卷积层和、滤波器和第一上采样层,所述通过所述空间注意力模块对所述第二目标编码特征图和所述解码特征图进行特征优化,得到第二优化特征图,包括:
通过所述第一卷积层对所述第二目标编码特征图进行卷积处理,得到第一特征图;
通过所述第二卷积层对所述解码特征图进行卷积处理,得到第二特征图;
通过所述第三卷积层和所述滤波器对所述第一特征图和所述第二特征图进行卷积处理,得到第三特征图;
通过所述第一上采样层对所述第三特征图进行上采样处理,得到第四特征图;
基于所述第四特征图,对所述第二目标编码特征图进行更新处理,得到所述第二优化特征图。
可选地,根据本发明提供的一种耕地识别,所述耕地识别模型基于如下步骤训练得到:
获取待训练遥感影像;
将所述待训练遥感影像输入待训练耕地识别模型,输出训练耕地范围结果和训练耕地边界结果;
基于所述训练耕地范围结果、训练耕地边界结果、所述待训练遥感影像对应的耕地范围结果标签和耕地边界识别结果标签,计算得到目标损失值;
基于所述目标损失值,对所述待训练耕地识别模型进行空间注意力机制的多任务迭代训练,得到所述耕地识别模型。
可选地,根据本发明提供的一种耕地识别,所述基于所述训练耕地范围结果、训练耕地边界结果、所述待训练遥感影像对应的耕地范围结果标签和耕地边界识别结果标签,通过预先设置的目标损失函数,计算得到目标损失值,包括:
通过预先设置的目标损失函数,计算所述训练耕地范围结果和所述耕地范围结果标签之间的第一损失值,以及计算所述训练耕地边界结果和所述耕地边界识别结果标签之间的第二损失值;
基于所述第一损失值、所述第二损失值以及所述第一损失值和所述第二损失值之间的权重,计算得到所述目标损失值。
本发明还提供一种耕地识别装置,包括:
获取模块,用于获取待识别影像数据;
多任务识别模块,用于将所述待识别影像数据输入至耕地识别模型,以利用所述耕地识别模型对所述待识别影像数据进行多任务识别,输出耕地范围结果和耕地边界识别结果;
其中,所述耕地识别模型是基于预先收集的待训练遥感影像以及所述待训练遥感影像对应的耕地范围结果标签和耕地边界识别结果标签,进行空间注意力机制的多任务训练获得。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述耕地识别方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述耕地识别方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述耕地识别方法。
本发明提供的耕地识别方法、装置、设备及存储介质,通过获取待识别影像数据;将所述待识别影像数据输入至耕地识别模型,以利用所述耕地识别模型对所述待识别影像数据进行多任务识别,输出耕地范围结果和耕地边界识别结果;其中,所述耕地识别模型是基于预先收集的待训练遥感影像以及所述待训练遥感影像对应的耕地范围结果标签和耕地边界识别结果标签,进行空间注意力机制的多任务训练获得,实现了通过构建基于空间注意力机制的双任务学习的耕地识别模型,以同时进行耕地范围识别和耕地边界识别,并且通过学习耕地边界这一任务,提高耕地的边界识别能力,从而增加对行道树和田间道路的识别能力,另外地,通过增加空间注意力机制,可突出其重点特征和细节信息,使得耕地区域识别的精度更高。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的耕地识别方法的流程示意图之一;
图2为本发明提供的耕地识别方法中残差块的结构示意图;
图3为本发明提供的耕地识别方法中空间注意力模块的结果示意图;
图4是本发明提供的耕地识别方法的流程示意图之二;
图5是本发明提供的耕地识别装置的结构示意图;
图6是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明一个或多个实施例。在本发明一个或多个实施例中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本发明一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本发明一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本发明一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
下面结合图1-图6对本发明示例实施方式进行详细说明。
如图1所示的是本发明实施例的一种耕地识别方法的流程图。如图1所示,该耕地识别方法方法包括:
步骤S10,获取待识别影像数据;
需要说明的是,所述待识别影像数据为包括影像的宽度、高度和影像的通道数对应的遥感影像数据,遥感影像可以从公共的遥感影像数据集中获取,也可以从现有的地理信息系统中爬取遥感影像瓦片拼接而成或者通过其他在线采集的方式获取,所述待识别影像数据包括影像的高度、宽度和通道数等信息,例如:获取256×256×4的待识别影像数据,也即,高度为256,宽度为256,通道数为4,通道可包括红、绿、蓝和近红外4个通道。
步骤S20,将所述待识别影像数据输入至耕地识别模型,以利用所述耕地识别模型对所述待识别影像数据进行多任务识别,输出耕地范围结果和耕地边界识别结果;其中,所述耕地识别模型是基于预先收集的待训练遥感影像以及所述待训练遥感影像对应的耕地范围结果标签和耕地边界识别结果标签,进行空间注意力机制的多任务训练获得。
需要说明的是,所述耕地识别模型包括编码模块、解码模块、空间注意力模块和多任务像素分类模块,其中,所述编码模块包括若干个串联的编码单元,除最后一个编码单元外每个编码单元包括残差块和最大池化层,最后一个编码单元包括残差块,上一个编码单元中最大池化层的输出即为下一个编码单元中残差块的输入。
进一步需要说明的是,所述解码模块包括若干个串联的解码单元,每个解码单元包括上采样层、特征连接层和残差块,其中,每一个解码单元中残差块的输入特征图为将上一个解码单元输出的解码特征图和编码模块中进行下采样(或最大池化处理)后与解码特征图处于同级层的特征图进行处理后,再和所述上一个解码单元输出的解码特征图进行上采样后的特征图进行特征连接的特征图,更进一步地,各个编码单元的残差块的输出通过所述空间注意力模块进行优化处理后输入至对应解码单元中,最后一个解码单元的残差块的输出作为所述多任务像素分类模块的输入,所述多任务包括耕地范围识别任务和耕地边界识别任务,可同时进行耕地范围和耕地边界的识别,提高耕地边界识别的能力。
作为一种可实施方式,将所述待识别影像数据输入至所述预先训练好的耕地识别模型中的编码模块,以对所述待识别影像数据进行编码处理,具体地,通过第一个编码单元中的残差块对所述待识别影像数据进行卷积处理,得到当前编码单元中残差块输出的编码特征图,进而通过最大池化层将所述编码特征图进行最大池化处理,从而降低所述编码特征图中的高度和宽度,得到当前最大池化层输出的池化处理特征图,进而将所述池化处理特征图作为下一个编码单元的输入,以此类推,直至得到最后一个编码单元中残差块输出的编码特征图,例如,参照表1,其中,第一个编码单元残差块输出尺寸为256×256×32的编码特征图,尺寸为256×256×32的编码特征图进行最大池化处理后得到128×128×32的特征图,所述128×128×32的特征图作为下一个编码单元残差块的输入。
进一步地,在得到最后一个编码单元中残差块输出的编码特征图后进入到解码阶段,此时,最后一个编码单元输出的编码特征图会进入到解码模块中的第一个解码单元中,进而基于所述最后一个编码单元输出的编码特征图的特征尺寸大小,在除最后一个编码单元外各个编码单元输出的编码特征图中,查找与最后一个编码单元的编码特征图相匹配的第一目标编码特征图,进而通过所述空间注意力模块对所述第一目标编码特征图和所述最后一个编码单元输出的编码特征图进行特征优化处理,并且通过当前解码单元的上采样层对所述最后一个编码单元输出的编码特征图进行上采样处理,进而通过调整连接层将上采样处理得到的特征图和进行特征优化处理的特征图进行特征连接,从而将特征连接得到的目标连接特征图作为所述第一个解码单元中残差块的输入,进一步地,通过第一个解码单元残差块对所述目标连接特征图进行残差处理,得到当前解码单元残差块输出的解码特征图,进而基于所述解码特征图,在各个编码单元输出的编码特征图中,确定与所述解码特征图相匹配的目标编码特征图,以基于解码特征图和目标编码特征图,确定下一个解码单元残差块的输入,其中,确定下一个解码单元残差块的输入与上述确定第一个解码单元残差块的输入的具体过程基本相同,在此不再赘述,直至得到最后一个解码单元残差块输出的解码特征图,通过所述多任务像素分类模块中的卷积层对所述最后一个解码单元输出的解码特征图进行卷积处理,由于本实施例进行耕地范围和耕地边界多任务识别,所述卷积层数量为至少2个,从而得到耕地范围特征图和耕地边界特征图,基于所述耕地范围特征图和所述耕地边界特征图,识别到特征图中每一个像素点对应的耕地范围结果或者耕地边界识别结果。
例如:参照图1,最后一个解码单元残差块输出的是尺寸为256×256×32的解码特征图,经过两个卷积核为1×1的卷积层对所述256×256×32的解码特征图极性卷积处理,得到两个尺寸为256×256×1的特征图。
表1
本发明实施例通过上述方案,也即:获取待识别影像数据;将所述待识别影像数据输入至耕地识别模型,以利用所述耕地识别模型对所述待识别影像数据进行多任务识别,输出耕地范围结果和耕地边界识别结果;其中,所述耕地识别模型是基于预先收集的待训练遥感影像以及所述待训练遥感影像对应的耕地范围结果标签和耕地边界识别结果标签,进行空间注意力机制的多任务训练获得,实现了通过构建基于空间注意力机制的双任务学习的耕地识别模型,以同时进行耕地范围识别和耕地边界识别,并且通过学习耕地边界这一任务,提高耕地的边界识别能力,从而增加对行道树和田间道路的识别能力,另外地,通过增加空间注意力机制,可突出其重点特征和细节信息,使得耕地区域识别精度更高。
基于第一实施例,在本发明的另一实施例中,在上述步骤S20:通过预先训练的耕地识别模型,对所述待识别影像数据进行多任务识别,得到所述待识别影像数据对应的耕地范围和耕地边界,包括:
步骤S21,通过第一个编码单元中的残差块对所述待识别影像数据进行特征提取,得到第一编码单元中残差块输出的编码特征图;
需要说明的是,残差块包括多个卷积层,其中,每个卷积层后伴随一个批标准化层(batch normalization layers)和一个dropout层。
作为一种可实施方式,具体地,将所述待识别影像数据输入至所述第一个编码单元中的残差块中,以提取所述待识别影像数据中的特征,得到所述编码特征图,处理公式如下:
yl=h(xl)+F(xl,θl)
其中,xl表示残差块的输入(本实施例中的待识别影像数据),yl表示残差块的输出(本实施例中的编码特征图),F(xl,θl)代表残差部分。结合图2,图2为本发明提供的耕地识别方法中残差块的结构示意图, 代表一个卷积核大小为1×1的卷积层,可增加或者降低特征层中的通道数,使其与F(xl,θl)的输出一致,F(xl,θl)包括了两个卷积核大小为3×3的卷积层,并跟随一个批标准化层(batch normalization layers)和一个dropout层,使用same padding填充的方法进行填充,保证输出特征的宽度和高度与输入一致。卷积核的数量与输入特征层的通道数量一致,dropout层将随机的单元赋值为0,从而防止模型过拟合。
步骤S22,通过第一个编码单元中的最大池化层对所述编码特征图进行池化处理,得到池化处理特征图,并将所述池化处理特征图作为下一个编码单元的输入,直至得到最后一个编码单元中残差块输出的编码特征图;
作为一种可实施方式,具体地,将所述编码特征图输入至第一个编码单元中最大池化层,以对所述编码特征图进行最大池化操作,从而输出2×2区域的最大值,得到所述当前编码单元输出的池化处理特征图,并将所述池化处理特征图作为下一个编码单元的输入,以通过所述下一个编码单元的残差块以及最大池化层进行相应的处理,直至得到最后一个编码单元中残差块输出的编码特征图。
可以理解地,参照上述表1,输入待识别影像数据的尺寸为256×256×4,通过第一个编码单元中残差块处理后得到的特征图的尺寸为256×256×32,进而通过第一个编码单元中的最大池化层进行池化处理,高度和宽度缩小,得到的特征图的尺寸为128×128×32,从而将128×128×32的特征图作为下一个编码单元中残差块的输入,以此类推,直至得到最后一个编码单元输出的编码特征图。
步骤S23,在除最后一个编码单元外各个编码单元输出的编码特征图中筛选得到与最后一个编码单元的编码特征图相匹配的第一目标编码特征图;
步骤S24,通过所述空间注意力模块对所述第一目标编码特征图和所述最后一个编码单元的编码特征图进行特征优化,得到第一优化特征图;
在本实施例中,在编码阶段完成之后进入到解码阶段,此时,最后一个编码单元输出的编码特征图会进入到解码模块中的第一个解码单元中,进而基于所述最后一个编码单元输出的编码特征图的特征尺寸大小,在其余各编码单元输出的编码特征图中,确定与最后一个编码单元的编码特征图相匹配的第一目标编码特征图,需要说明的是,第一目标编码特征图的特征尺寸大小是最后一个编码单元输出的编码特征图的2倍。
进一步地,通过所述空间注意力模块中的卷积层分别对所述第一目标编码特征图和所述最后一个编码单元输出的编码特征图进行卷积处理,具体地,所述空间注意力模块包括第一卷积层、第二卷积层、第三卷积层、滤波器和第一上采样层,通过第一卷积层对所述第一目标编码特征图进行卷积处理,其中,所述第一卷积层为具有kernel卷积核=2×2,stride卷积步长=2×2和same padding填充的卷积层,从而减少所述第一目标编码特征图中的高度和宽度,进而通过第二卷积层对所述最后一个编码单元输出的编码特征图进行卷积处理,其中,所述第二卷积层为基于1×1的卷积层,用于调整所述最后一个编码单元输出的编码特征图的通道数,从而使得所述第一目标编码特征图和所述最后一个编码单元输出的编码特征图进行卷积处理后的特征尺寸大小相同,进一步地,通过第三卷积层和滤波器对卷积处理后的第一目标编码特征图以及最后一个编码单元输出的编码特征图进行处理,其中,所述第三卷积层为基于1×1的卷积层,进而通过所述第一上采样层将处理后的特征图进行上采样,最后将上采样得到的特征图更新所述第一目标编码特征图,得到所述第一优化特征图。
可以理解地,例如:针对解码模块的第一个解码单元,最后一个编码单元输出的编码特征图,尺寸为16×16×512,基于其余各个编码单元输出的编码特征图对应的特征尺寸大小,确定特征尺寸大小是32×32×256对应的编码特征图为所述第一目标编码特征图,两者分别经过卷积处理变成尺寸为16×16×256的特征图,进而经过一个卷积层和1×1的滤波器处理后被转换成尺寸为16×16×1的特征图。接下来,学到的特征将被上采样处理得到尺寸为32×32×1的特征图。最后这个值将被用来更新所述第一目标编码特征图,输出的第一优化特征图的尺寸为32×32×256。
步骤S25,通过第一个解码单元中的上采样层对所述最后一个编码单元的编码特征图进行上采样处理,得到第一上采样特征图;
步骤S26,通过所述特征连接层对所述第一优化特征图和所述第一上采样特征图进行特征连接,得到第一目标连接特征图;
在本实施例中,具体地,将所述最后一个编码单元的编码特征图输入至第一个解码单元中上采样层中,以对所述最后一个编码单元的编码特征图进行上采样处理,得到第一上采样特征图,进而通过所述特征连接层对所述第一优化特征图和所述第一上采样特征图进行特征连接,得到第一目标连接特征图。
沿用上述步骤S24中的例子,第一优化特征图的尺寸为32×32×256,对所述最后一个编码单元的编码特征图进行上采样处理,得到尺寸为32×32×512,进而进行特征拼接后得到尺寸为32×32×(512+256)的第一目标连接特征图。
步骤S27,通过第一个解码单元中的残差块对所述第一目标连接特征图进行解码,得到当前解码单元输出的解码特征图;
在本实施例中,具体地,将第一目标连接特征图输入至所述解码单元中残差块中,从而对所述第一目标连接特征图进行解码处理,得到当前解码单元输出的解码特征图。
步骤S28,基于各所述编码单元输出的编码特征图以及所述当前解码单元输出的解码特征图,确定下一个解码单元中残差块的输入特征图,直至得到最后一个编码单元输出的解码特征图;
其中,所述基于各所述编码单元输出的编码特征图以及所述当前解码单元输出的解码特征图,确定下一个解码单元中残差块的输入特征图,直至得到最后一个编码单元输出的解码特征图,包括:
步骤S281,基于各所述编码单元中残差块输出的编码特征图,筛选得到与所述当前解码单元的解码特征图相匹配的第二目标编码特征图;
在本实施例中,具体地,基于所述当前解码单元的解码特征图的特征尺寸大小,在各编码单元输出的编码特征图中,筛选得到与当前解码单元的解码特征图相匹配的第二目标编码特征图,需要说明的是,第二目标编码特征图的特征尺寸大小通常是当前解码单元的解码特征图的2倍,本实施例中第二目标编码特征图确定过程和上述步骤S24中确定第一目标编码特征图的过程基本相同,在此不再赘述。
步骤S282,通过所述空间注意力模块对所述第二目标编码特征图和所述解码特征图进行特征优化,得到第二优化特征图;
其中,所述通过所述空间注意力模块对所述第二目标编码特征图和所述解码特征图进行特征优化,得到第二优化特征图,包括:
步骤S2821,通过所述第一卷积层对所述第二目标编码特征图进行卷积处理,得到第一特征图;
步骤S2822,通过所述第二卷积层对所述解码特征图进行卷积处理,得到第二特征图;
步骤S2823,通过所述第三卷积层和所述滤波器对所述第一特征图和所述第二特征图进行卷积处理,得到第三特征图;
步骤S2824,通过所述第一上采样层对所述第三特征图进行上采样处理,得到第四特征图;
步骤S2825,基于所述第四特征图,对所述第二目标编码特征图进行更新处理,得到所述第二优化特征图。
在本实施例中,通过所述空间注意力模块中的卷积层分别对所述第二目标编码特征图和所述解码特征图进行卷积处理,具体地,结合图3,图3为本发明提供的耕地识别方法中空间注意力模块的结果示意图,通过第一卷积层对所述第二目标编码特征图进行卷积处理,其中,所述第一卷积层为具有kernel卷积核为2×2,stride卷积步长为2×2和samepadding填充的卷积层,进而通过第二卷积层对所述解码特征图进行卷积处理,其中,所述第二卷积层为具有卷积核为1×1的卷积层,用于调整所述解码特征图的通道数,从而使得所述第二目标编码特征图和所述解码特征图进行卷积处理后的特征尺寸大小相同,进一步地,通过第三卷积层和滤波器对卷积处理后的第二目标编码特征图以及解码特征图进行处理,其中,所述第三卷积层为具有卷积核为1×1的卷积层,所述滤波器为1×1的滤波器,并通过第一上采样层将处理后的特征图进行上采样,最后将上采样得到的特征图更新所述第二目标编码特征图,得到所述第二优化特征图。
例如:参照表1,针对解码模块的第八个解码单元,残差块输出解码特征图的尺寸为128×128×64,在各个编码单元残差块输出的编码特征图中,确定特征尺寸大小是256×256×32对应的编码特征图为所述第二目标编码特征图,两者分别经过卷积处理后变成128×128×32,再经过一个卷积核1×1的卷积层和1×1的滤波器处理后,得到尺寸Wie128×128×1的特征图。接下来,学到的特征将被上采样处理形成尺寸为256×256×1的特征图。最后这个值将被用来更新所述第一目标编码特征图,输出的第二优化特征图的尺寸为256×256×32。本实施例中特征优化过程和上述步骤S24中特征优化过程基本相同,在此不再赘述,其中,特征优化公式如下:
其中,xl表示编码单元残差块输出的编码特征图,xh表示解码单元残差块输出的解码特征图或者最后一个编码单元残差块输出的编码特征图,例如,参照表1,当最后一个编码单元残差块输出的编码特征图进入第一个解码单元时,xh表示最后一个编码单元残差块输出的编码特征图。表示一个卷积核为1×1的卷积层,主要用于调整特征图xh的通道数,代表一个具有1×1卷积核的卷积层,跟随着一个Sigmoid激活函数层,g(xl,xh)的输出将会是w×h×1的特征层,w表示特征图的宽度,h表示特征图的高度,表示xl通过乘以g(xl,xh)实现更新。
步骤S283,通过当前解码单元的下一个解码单元中的上采样层对当前解码单元的输出的解码特征图进行上采样处理,得到第二上采样特征图;
步骤S284,通过所述下一个解码单元中的特征连接层对所述第二优化特征图和所述第二上采样特征图进行特征连接,得到第二目标连接特征图,并将所述第二目标连接特征图作为所述下一个解码单元中残差块的输入,以得到所述下一个解码单元的解码特征图;返回执行所述基于各所述编码单元中残差块输出的编码特征图,筛选得到与所述当前解码单元的解码特征图相匹配的第二目标编码特征图的步骤,直至得到最后一个解码单元输出的解码特征图。
在本实施例中,具体地,将所述上一个解码单元输出的解码特征图输入至下一个解码单元中上采样层中,以对上一个解码单元输出的解码特征图进行上采样处理,得到第二上采样特征图,进而通过所述特征连接层对所述第二优化特征图和所述第二上采样特征图进行特征连接,得到第二目标连接特征图,其中,本实施例中确定目标连接特征图的过程和上述步骤A25至A26确定目标连接特征图的过程基本相同,在此不再赘述。
进一步地,将所述第二目标连接特征图作为所述下一个解码单元中残差块的输入特征图,以得到所述下一个解码单元的解码特征图;从而返回执行所述基于各所述编码单元中残差块输出的编码特征图,筛选得到与所述当前解码单元的解码特征图相匹配的第二目标编码特征图的步骤,直至得到最后一个解码单元输出的解码特征图。
步骤S29,将所述最后一个解码单元输出的解码特征图输入至所述多任务像素分类模块,得到所述耕地范围结果和所述耕地边界识别结果。
在本实施例中,具体地,将所述最后一个解码单元输出的解码特征图输入至所述多任务像素分类模块,通过所述多任务像素分类模块中的卷积层对所述最后一个解码单元输出的解码特征图进行处理,其中,由于本实施例进行耕地范围和耕地边界多任务识别,所述卷积层数量为至少2个,每一个卷积层的卷积核为1×1,从而得到耕地范围特征图和耕地边界特征图,基于所述耕地范围特征图和所述耕地边界特征图,识别到特征图中每一个像素点对应的耕地范围结果或者耕地边界识别结果,从而实现端到端像素级的分类。
参照表1,最后一个解码单元的残差块输出的解码特征图的尺寸大小为256×256×32,多任务像素分类模块包括2个卷积层,卷积核为1×1,在每个卷积层中,对于耕地范围和耕地边界,将尺寸大小为256×256×32的解码特征图缩小到两个256×256×1的特征图,并输出每一点像素点对应的耕地范围结果和耕地边界识别结果。
本发明实施例通过上述方案,实现了通过若干个串联的编码单元对待识别影像数据进行处理的编码特征图,进而通过空间注意力模块将各个编码单元的编码特征图和上一个残差块输出的特征图进行处理,得到各个解码单元残缺块的输入,使得模型能够学习到耕地的空间范围特征,并且基于耕地范围和耕地边界双任务的识别,增加了对行道树和田间道路的识别能力,从而准确将田间道路和行道树从耕地图斑中区分出来,有效提高耕地识别的精度。
参照图4,基于第一实施例,在本发明的另一实施例中,所述耕地识别模型基于如下步骤训练得到:
步骤A10,获取待训练遥感影像;
需要说明的是,所述待训练遥感影像包括若干个带有标记信息的遥感影像,所述标记信息为用于标记遥感影像中的像素点是否属于耕地办结或者耕地范围的信息,例如,属于耕地边界对应的像素点标记为1,不属于耕地边界对应的像素点为0。
步骤A20,将所述待训练遥感影像输入待训练耕地识别模型,输出训练耕地范围结果和训练耕地边界结果;
步骤A30,基于所述训练耕地范围结果、训练耕地边界结果、所述待训练遥感影像对应的耕地范围结果标签和耕地边界识别结果标签,计算得到目标损失值;
步骤A40,基于所述目标损失值,对所述待训练耕地识别模型进行空间注意力机制的多任务迭代训练,得到所述耕地识别模型。
上述步骤A30:基于所述训练耕地范围结果、训练耕地边界结果、所述待训练遥感影像对应的耕地范围结果标签和耕地边界识别结果标签,计算得到目标损失值,包括:
步骤A31,通过预先设置的目标损失函数,计算所述训练耕地范围结果和所述耕地范围结果标签之间的第一损失值,以及计算所述训练耕地边界结果和所述耕地边界识别结果标签之间的第二损失值;
步骤A32,基于所述第一损失值、所述第二损失值以及所述第一损失值和所述第二损失值之间的权重,计算得到所述目标损失值。
需要说明的是,所述待训练耕地识别模型为基于U-net模型的编码器-解码器架构耦合的分割模型,在本实施例中,还增加了空间注意力机制模块,从而更好地提取耕地的空间范围。
作为一种可实施方式,将所述待训练遥感影像输入至所述待训练耕地识别模型,以对所述待训练遥感影像进行类别预测,获得预测类别标签,具体地,将所述待训练遥感影像输入待训练耕地识别模型,通过对所述待训练耕地识别模型中编码模块进行数据处理,其中,所述编码模块包括若干个串联的编码单元,除最后一个编码单元外每个编码单元包括依次连接的残差块和最大池化层,最后一个编码单元包括残差块,上一个编码单元中最大池化层的输出即为下一个编码单元中残差块的输入,从而得到每一个编码单元输出的编码特征图,增加残差块可以解决梯度爆炸或者消失的问题,所述数据处理包括但是不限定于卷积、池化等。
进一步地,在得到最后一个编码单元输出的编码特征图后,进入解码阶段,待训练耕地识别模型中的解码模块包括若干个串联的解码单元,每个解码单元包括上采样层、特征连接层和残差块,其中,解码单元中残差块的输入为将前一个残差块输出的特征图进行上采样后得到的特征图和编码模块相对应位置输出的编码特征图进行特征连接的结果,确定解码单元中残差块的输入与上述步骤S20的过程基本相同,在此不再赘述,从而得到最后一个解码单元残差块输出的解码特征图,进而对所述最后一个解码单元残差块输出的解码特征图进行卷积操作,得到耕地范围特征图和耕地边界特征图,从而输出耕地范围特征图和耕地边界特征图分别对应的识别结果,所述识别结果包括训练耕地范围结果和训练耕地边界结果。
通过预先设置的目标损失函数,计算所述训练耕地范围结果和所述耕地范围结果标签之间的第一损失值,以及计算所述训练耕地边界结果和所述耕地边界识别结果标签之间的第二损失值,其中,所述目标损失函数包括Dice损失函数、Hinge损失函数和交叉熵损失函数等,优选地,选取Dice损失函数,公式如下:
其中,A表示识别结果,B表示待训练遥感影像的标记信息,smooth是一个平滑因子,设为1。
进而基于所述第一损失值、所述第二损失值以及两者之间的权重,计算得到目标损失值,计算公式如下:
Ltotal=a1LDice1+a2LDice2
其中,Ltotal表示所述目标模型损失,LDice1表示所述第一损失值,LDice2表示所述第二损失值,a1和a2表示所述第一损失值与所述第二损失值分别对应的权重,a1+a2=1,优选地,设置a1=a2=0.5。
进一步地,基于所述目标损失值,迭代更新所述待训练耕地识别模型的参数,进而判断更新后的待训练耕地识别模型是否均满足预设训练结束条件,若满足,则将更新后的待训练耕地识别模型作为耕地识别模型,若不满足,则返回获取待训练遥感影像的步骤,以继续迭代训练模型,其中,所述预设训练结束条件包括损失收敛和达到最大迭代次数阈值等。
本发明实施例通过上述方案,实现了基于待训练遥感影像进行多任务模型训练,从而使得模型能够识别到耕地范围和耕地边界,增加对行道树和田间道路的识别能力,从而准确将田间道路和行道树从耕地图斑中区分出来,并且还增加空间注意力机制,使得模型能够学习到耕地的空间范围特征,从而提高耕地识别的精度。
下面对本发明提供的耕地识别装置进行描述,下文描述的耕地识别装置与上文描述的耕地识别方法可相互对应参照。
如图5所示,本发明实施例的一种耕地识别装置,该装置包括:
获取模块10,用于获取待识别影像数据;
多任务识别模块20,用于将所述待识别影像数据输入至耕地识别模型,以利用所述耕地识别模型对所述待识别影像数据进行多任务识别,输出耕地范围结果和耕地边界识别结果;
其中,所述耕地识别模型是基于预先收集的待训练遥感影像以及所述待训练遥感影像对应的耕地范围结果标签和耕地边界识别结果标签,进行空间注意力机制的多任务训练获得。
可选地,所述多任务识别模块20还用于:
通过第一个编码单元中的残差块对所述待识别影像数据进行特征提取,得到第一编码单元中残差块输出的编码特征图;
通过第一个编码单元中最大池化层对所述编码特征图进行池化处理,得到池化处理特征图,并将所述池化处理特征图作为下一个编码单元的输入,直至得到最后一个编码单元中残差块输出的编码特征图;
在除最后一个编码单元外各个编码单元输出的编码特征图中筛选得到与最后一个编码单元的编码特征图相匹配的第一目标编码特征图;
通过所述空间注意力模块对所述第一目标编码特征图和所述最后一个编码单元的编码特征图进行特征优化,得到第一优化特征图;
通过第一个解码单元中的上采样层对所述最后一个编码单元的编码特征图进行上采样处理,得到第一上采样特征图;
通过所述特征连接层对所述第一优化特征图和所述第一上采样特征图进行特征连接,得到第一目标连接特征图;
通过第一个解码单元中的残差块对所述第一目标连接特征图进行解码,得到当前解码单元输出的解码特征图;
基于各所述编码单元输出的编码特征图以及所述当前解码单元输出的解码特征图,确定下一个解码单元中残差块的输入特征图,直至得到最后一个编码单元输出的解码特征图;
将所述最后一个解码单元输出的解码特征图输入至所述多任务像素分类模块,得到所述耕地范围结果和所述耕地边界识别结果。
可选地,所述多任务识别模块20还用于:
基于各所述编码单元中残差块输出的编码特征图,筛选得到与所述当前解码单元的解码特征图相匹配的第二目标编码特征图;
通过所述空间注意力模块对所述第二目标编码特征图和所述解码特征图进行特征优化,得到第二优化特征图;
通过当前解码单元的下一个解码单元中的上采样层对当前解码单元的输出的解码特征图进行上采样处理,得到第二上采样特征图;
通过所述下一个解码单元中的特征连接层对所述第二优化特征图和所述第二上采样特征图进行特征连接,得到第二目标连接特征图,并将所述第二目标连接特征图作为所述下一个解码单元中残差块的输入,以得到所述下一个解码单元的解码特征图;
返回执行所述基于各所述编码单元中残差块输出的编码特征图,筛选得到与所述当前解码单元的解码特征图相匹配的第二目标编码特征图的步骤,直至得到最后一个解码单元输出的解码特征图。
可选地,所述多任务识别模块20还用于:
通过所述第一卷积层对所述第二目标编码特征图进行卷积处理,得到第一特征图;
通过所述第二卷积层对所述解码特征图进行卷积处理,得到第二特征图;
通过所述第三卷积层和所述滤波器对所述第一特征图和所述第二特征图进行卷积处理,得到第三特征图;
通过所述第一上采样层对所述第三特征图进行上采样处理,得到第四特征图;
基于所述第四特征图,对所述第二目标编码特征图进行更新处理,得到所述第二优化特征图。
可选地,所述耕地识别装置还包括:
获取待训练遥感影像;
将所述待训练遥感影像输入待训练耕地识别模型,输出训练耕地范围结果和训练耕地边界结果;
基于所述训练耕地范围结果、训练耕地边界结果、所述待训练遥感影像对应的耕地范围结果标签和耕地边界识别结果标签,计算得到目标损失值;
基于所述目标损失值,对所述待训练耕地识别模型进行空间注意力机制的多任务迭代训练,得到所述耕地识别模型。
可选地,所述耕地识别装置还包括:
通过预先设置的目标损失函数,计算所述训练耕地范围结果和所述耕地范围结果标签之间的第一损失值,以及计算所述训练耕地边界结果和所述耕地边界识别结果标签之间的第二损失值;
基于所述第一损失值、所述第二损失值以及所述第一损失值和所述第二损失值之间的权重,计算得到所述目标损失值。
在此需要说明的是,本申请实施例提供的上述装置,能够实现上述方法实施例所实现的所有方法步骤,且能够达到相同技术效果,在此不再对本实施例中与方法实施例相同部分及有益效果进行具体赘述。
图6示例了一种电子设备的实体结构示意图,该电子设备可以包括:处理器(processor)610、存储器(memory)620、通信接口(Communications Interface)630和通信总线640,其中,处理器610、存储器620和通信接口630通过通信总线640完成相互间的通信。处理器610可以调用存储器620中的逻辑指令,以执行耕地识别方法,该方法包括:获取待识别影像数据;将所述待识别影像数据输入至耕地识别模型,以利用所述耕地识别模型对所述待识别影像数据进行多任务识别,输出耕地范围结果和耕地边界识别结果;其中,所述耕地识别模型是基于预先收集的待训练遥感影像以及所述待训练遥感影像对应的耕地范围结果标签和耕地边界识别结果标签,进行空间注意力机制的多任务训练获得。
此外,上述的存储器620中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的耕地识别方法,该方法包括:获取待识别影像数据;将所述待识别影像数据输入至耕地识别模型,以利用所述耕地识别模型对所述待识别影像数据进行多任务识别,输出耕地范围结果和耕地边界识别结果;其中,所述耕地识别模型是基于预先收集的待训练遥感影像以及所述待训练遥感影像对应的耕地范围结果标签和耕地边界识别结果标签,进行空间注意力机制的多任务训练获得。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的耕地识别方法,该方法包括:获取待识别影像数据;将所述待识别影像数据输入至耕地识别模型,以利用所述耕地识别模型对所述待识别影像数据进行多任务识别,输出耕地范围结果和耕地边界识别结果;其中,所述耕地识别模型是基于预先收集的待训练遥感影像以及所述待训练遥感影像对应的耕地范围结果标签和耕地边界识别结果标签,进行空间注意力机制的多任务训练获得。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种耕地识别方法,其特征在于,包括:
获取待识别影像数据;
将所述待识别影像数据输入至耕地识别模型,以利用所述耕地识别模型对所述待识别影像数据进行多任务识别,输出耕地范围结果和耕地边界识别结果;
其中,所述耕地识别模型是基于预先收集的待训练遥感影像以及所述待训练遥感影像对应的耕地范围结果标签和耕地边界识别结果标签,进行空间注意力机制的多任务训练获得。
2.根据权利要求1所述的耕地识别方法,其特征在于,所述耕地识别模型包括编码模块、解码模块、空间注意力模块和多任务像素分类模块,其中:
所述编码模块包括若干个串联的编码单元,除最后一个编码单元外每个编码单元包括残差块和最大池化层,最后一个编码单元包括残差块;
所述解码模块包括若干个串联的解码单元,每个解码单元包括上采样层、特征连接层和残差块;
各个编码单元中的残差块的输出通过所述空间注意力模块进行优化处理后输入至对应的解码单元中;
最后一个解码单元的残差块的输出作为所述多任务像素分类模块的输入。
3.根据权利要求2所述的耕地识别方法,其特征在于,所述通过预先训练的耕地识别模型,对所述待识别影像数据进行多任务识别,得到所述待识别影像数据对应的耕地范围和耕地边界,包括:
通过第一个编码单元中的残差块对所述待识别影像数据进行特征提取,得到第一编码单元中残差块输出的编码特征图;
通过第一个编码单元中的最大池化层对所述编码特征图进行池化处理,得到池化处理特征图,并将所述池化处理特征图作为下一个编码单元的输入,直至得到最后一个编码单元中残差块输出的编码特征图;
在除最后一个编码单元外各个编码单元输出的编码特征图中筛选得到与最后一个编码单元的编码特征图相匹配的第一目标编码特征图;
通过所述空间注意力模块对所述第一目标编码特征图和所述最后一个编码单元的编码特征图进行特征优化,得到第一优化特征图;
通过第一个解码单元中的上采样层对所述最后一个编码单元的编码特征图进行上采样处理,得到第一上采样特征图;
通过所述特征连接层对所述第一优化特征图和所述第一上采样特征图进行特征连接,得到第一目标连接特征图;
通过第一个解码单元中的残差块对所述第一目标连接特征图进行解码,得到当前解码单元输出的解码特征图;
基于各所述编码单元输出的编码特征图以及所述当前解码单元输出的解码特征图,确定下一个解码单元中残差块的输入特征图,直至得到最后一个编码单元输出的解码特征图;
将所述最后一个解码单元输出的解码特征图输入至所述多任务像素分类模块,得到所述耕地范围结果和所述耕地边界识别结果。
4.根据权利要求3所述的耕地识别方法,其特征在于,所述基于各所述编码单元输出的编码特征图以及所述当前解码单元输出的解码特征图,确定下一个解码单元中残差块的输入特征图,直至得到最后一个编码单元输出的解码特征图,包括:
基于各所述编码单元中残差块输出的编码特征图,筛选得到与所述当前解码单元的解码特征图相匹配的第二目标编码特征图;
通过所述空间注意力模块对所述第二目标编码特征图和所述解码特征图进行特征优化,得到第二优化特征图;
通过当前解码单元的下一个解码单元中的上采样层对当前解码单元的输出的解码特征图进行上采样处理,得到第二上采样特征图;
通过所述下一个解码单元中的特征连接层对所述第二优化特征图和所述第二上采样特征图进行特征连接,得到第二目标连接特征图,并将所述第二目标连接特征图作为所述下一个解码单元中残差块的输入,以得到所述下一个解码单元的解码特征图;
返回执行所述基于各所述编码单元中残差块输出的编码特征图,筛选得到与所述当前解码单元的解码特征图相匹配的第二目标编码特征图的步骤,直至得到最后一个解码单元输出的解码特征图。
5.根据权利要求4所述的耕地识别方法,其特征在于,所述空间注意力模块包括第一卷积层、第二卷积层、第三卷积层、滤波器和第一上采样层,所述通过所述空间注意力模块对所述第二目标编码特征图和所述解码特征图进行特征优化,得到第二优化特征图,包括:
通过所述第一卷积层对所述第二目标编码特征图进行卷积处理,得到第一特征图;
通过所述第二卷积层对所述解码特征图进行卷积处理,得到第二特征图;
通过所述第三卷积层和所述滤波器对所述第一特征图和所述第二特征图进行卷积处理,得到第三特征图;
通过所述第一上采样层对所述第三特征图进行上采样处理,得到第四特征图;
基于所述第四特征图,对所述第二目标编码特征图进行更新处理,得到所述第二优化特征图。
6.根据权利要求1所述的耕地识别方法,其特征在于,所述耕地识别模型基于如下步骤训练得到:
获取待训练遥感影像;
将所述待训练遥感影像输入待训练耕地识别模型,输出训练耕地范围结果和训练耕地边界结果;
基于所述训练耕地范围结果、训练耕地边界结果、所述待训练遥感影像对应的耕地范围结果标签和耕地边界识别结果标签,计算得到目标损失值;
基于所述目标损失值,对所述待训练耕地识别模型进行空间注意力机制的多任务迭代训练,得到所述耕地识别模型。
7.根据权利要求6所述的耕地识别方法,其特征在于,所述基于所述训练耕地范围结果、训练耕地边界结果、所述待训练遥感影像对应的耕地范围结果标签和耕地边界识别结果标签,通过预先设置的目标损失函数,计算得到目标损失值,包括:
通过预先设置的目标损失函数,计算所述训练耕地范围结果和所述耕地范围结果标签之间的第一损失值,以及计算所述训练耕地边界结果和所述耕地边界识别结果标签之间的第二损失值;
基于所述第一损失值、所述第二损失值以及所述第一损失值和所述第二损失值之间的权重,计算得到所述目标损失值。
8.一种耕地识别装置,其特征在于,包括:
获取模块,用于获取待识别影像数据;
多任务识别模块,用于将所述待识别影像数据输入至耕地识别模型,以利用所述耕地识别模型对所述待识别影像数据进行多任务识别,输出耕地范围结果和耕地边界识别结果;
其中,所述耕地识别模型是基于预先收集的待训练遥感影像以及所述待训练遥感影像对应的耕地范围结果标签和耕地边界识别结果标签,进行空间注意力机制的多任务训练获得。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述耕地识别方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述耕地识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210937606.2A CN115439740A (zh) | 2022-08-05 | 2022-08-05 | 耕地识别方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210937606.2A CN115439740A (zh) | 2022-08-05 | 2022-08-05 | 耕地识别方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115439740A true CN115439740A (zh) | 2022-12-06 |
Family
ID=84243533
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210937606.2A Pending CN115439740A (zh) | 2022-08-05 | 2022-08-05 | 耕地识别方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115439740A (zh) |
-
2022
- 2022-08-05 CN CN202210937606.2A patent/CN115439740A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111986099B (zh) | 基于融合残差修正的卷积神经网络的耕地监测方法及系统 | |
CN110428428B (zh) | 一种图像语义分割方法、电子设备和可读存储介质 | |
CN107145836B (zh) | 基于栈式边界辨别自编码器的高光谱图像分类方法 | |
CN108090447A (zh) | 双分支深层结构下的高光谱图像分类方法及装置 | |
CN113780296A (zh) | 基于多尺度信息融合的遥感图像语义分割方法及系统 | |
Kamath et al. | Classification of paddy crop and weeds using semantic segmentation | |
CN113159300A (zh) | 图像检测神经网络模型及其训练方法、图像检测方法 | |
CN113743417B (zh) | 语义分割方法和语义分割装置 | |
Doi et al. | The effect of focal loss in semantic segmentation of high resolution aerial image | |
CN113066037B (zh) | 基于图注意力机制的多光谱与全色图像融合方法及系统 | |
CN114399480A (zh) | 蔬菜叶片病害严重程度检测方法及装置 | |
Rezk et al. | An efficient plant disease recognition system using hybrid convolutional neural networks (cnns) and conditional random fields (crfs) for smart iot applications in agriculture | |
CN115861837A (zh) | 基于Ares-UNet++网络的耕地识别方法及相关装置 | |
CN116740422A (zh) | 基于多模态注意力融合技术的遥感图像分类方法及装置 | |
CN115439757A (zh) | 一种基于遥感影像的水质污染源溯源方法、装置以及设备 | |
CN115471675A (zh) | 一种基于频域增强的伪装对象检测方法 | |
CN115375548A (zh) | 一种超分辨率的遥感图像生成方法、系统、设备和介质 | |
CN116543165B (zh) | 一种基于双通道复合深度网络的遥感图像果树分割方法 | |
Qiao et al. | Rotation is all you need: Cross dimensional residual interaction for hyperspectral image classification | |
CN113673369A (zh) | 遥感图像场景规划方法、装置、电子设备和存储介质 | |
CN115620122A (zh) | 神经网络模型的训练方法、图像重识别方法及相关设备 | |
CN116503677B (zh) | 一种湿地分类信息提取方法、系统、电子设备及存储介质 | |
Moradi et al. | Potential evaluation of visible-thermal UAV image fusion for individual tree detection based on convolutional neural network | |
CN112580484A (zh) | 基于深度学习的遥感影像玉米秸秆覆盖识别方法及装置 | |
Albert et al. | Land use classification using conditional random fields for the verification of geospatial databases |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |