CN113011350A

CN113011350A - 一种地域图像的识别处理方法、装置及电子设备

Info

Publication number: CN113011350A
Application number: CN202110313783.9A
Authority: CN
Inventors: 李世行; 吴海山; 殷磊
Original assignee: WeBank Co Ltd
Current assignee: WeBank Co Ltd
Priority date: 2021-03-24
Filing date: 2021-03-24
Publication date: 2021-06-22

Abstract

本申请提供了一种地域图像的识别处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品；方法包括：对待识别地域图像进行特征提取处理，基于从待识别地域图像提取的图像特征，对待识别图像进行语义分割处理和/或边缘检测处理，得到与至少一个地块对应的区域；基于至少一个地块对应的区域，从待识别地域图像中裁剪出至少一个地块的图像；通过预设尺寸切割地块的图像，得到对应的子块图像；基于子块图像的图像特征获取子块图像内对象的分类结果，并基于子块图像内对象的分类结果，确定地块覆盖的对象类型。通过本申请，能够快速的识别地域图像中的地块，并精确的分类，得到地块覆盖的对象类型。

Description

一种地域图像的识别处理方法、装置及电子设备

技术领域

本申请涉及图像处理技术，尤其涉及一种地域图像的识别处理方法、装置、电子设备及计算机可读存储介质。

背景技术

基于卫星遥感技术或无人机航拍技术拍摄地面图像，并进行地域图像识别分析，是地域图像应用研究方面的重点研究方向之一。

图像分割处理，是一种把图像分割成多个具备特定性质、特定类别的区域的过程，图像分割处理时一种结合图像处理和图像分析的技术。

图像分类处理，是根据各自在图像信息中所反映的不同特征，把不同类别的目标区分开来的图像处理方法，是利用计算机对图像进行定量分析，把图像或图像中的每个像元或区域划归为若干个类别中的某一种，以代替人的视觉判读。

在地域图像处理场景中，通常是对地域图像进行分割、分类处理，以掌握地域图像中地块的类型分布。但是，已有技术提供的地域图像处理主要是像素级、基于规则或机器学习的方法，特征提取方法传统低效，精度不高，深度学习方法通常受限于真实数据的获取难度，无法有效的进行网络模型的训练，预测地块地块类型时会与真实数据存在偏差，识别精度和准确度低。

发明内容

本申请实施例提供一种地域图像的识别处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品，能够快速的识别地域图像中的地块，并精确地分类，得到地块覆盖的对象类型。

本申请实施例的技术方案是这样实现的：

本申请实施例提供一种地域图像的识别处理方法，包括：

对待识别地域图像进行特征提取处理，基于从所述待识别地域图像提取的图像特征，对所述待识别地域图像进行语义分割处理和/或边缘检测处理，得到与至少一个地块对应的区域；

基于所述至少一个地块对应的区域，从所述待识别地域图像中裁剪出所述至少一个地块的图像；

通过预设尺寸切割所述地块的图像，得到对应的子块图像；

基于所述子块图像的图像特征获取所述子块图像内对象的分类结果，并基于所述子块图像内对象的分类结果，确定所述地块覆盖的对象类型。

本申请实施例提供一种地域图像的识别处理装置，包括：

图像处理模块，用于对待识别地域图像进行特征提取处理，基于从所述待识别地域图像提取的图像特征，对所述待识别地域图像进行语义分割处理和/或边缘检测处理，得到与至少一个地块对应的区域；

图像裁剪模块，用于基于所述至少一个地块对应的区域，从所述待识别地域图像中裁剪出所述至少一个地块的图像；

图像切割模块，用于通过预设尺寸切割所述地块的图像，得到对应的子块图像；

地块类型确定模块，用于基于所述子块图像的图像特征获取所述子块图像内对象的分类结果，并基于所述子块图像内对象的分类结果，确定所述地块覆盖的对象类型地块类型确定地块类型确定。

在上述方案中，所述图像处理模块，还用于：

基于从所述待识别地域图像提取的图像特征，对所述待识别地域图像进行语义识别，得到至少一个地块的语义区域；

基于从所述待识别地域图像提取的图像特征，对所述待识别地域图像进行边缘检测，得到至少一个地块的边界信息；

基于所述边界信息对所述语义区域进行切割处理，得到与至少一个地块对应的区域。

在上述方案中，所述图像处理模块，还用于：

基于从所述待识别地域图像提取的图像特征，对所述待识别地域图像进行语义识别，确定至少一个语义区域，以作为与至少一个地块对应的区域；

或者，

基于从所述待识别地域图像提取的图像特征，对所述待识别地域图像进行边缘检测，得到多个边缘线，所述边缘线包括所述待识别地域图像中与相邻像素点之间的灰度差值大于预定差值阈值的像素点；

确定所述边缘线组成的至少一个区域，以作为至少一个地块对应的区域。

在上述方案中，所述语义分割处理和/或边缘检测处理是通过地块裁剪模型实现的；所述地域图像的识别处理装置，还包括：

地块裁剪模型训练模块，用于基于预标注信息在地域图像样本中确定感兴趣区域；其中，所述预标注信息用于指示所述感兴趣区域的位置，所述感兴趣区域表征地块对应的区域；

对所述感兴趣区域的图像进行腐蚀处理，得到所述地域图像样本的标签图像；

基于所述地域图像样本以及对应的标签图像训练所述地块裁剪模型。

在上述方案中，所述图像切割模块，还用于：

针对每个地块执行以下处理：

在所述地块中，确定中心点；

确定以所述中心点为几何中心、且符合预设尺寸的规则几何图形，基于所述规则几何图形切割所述地块的图像，得到与所述地块对应的子块图像。

在上述方案中，所述地块类型确定模块，还用于：

将所述子块图像的图像特征映射为对应多个候选的分类结果的概率；

将超出概率阈值的概率对应的对象类别，作为所述子块图像内对象的分类结果。

在上述方案中，所述地块类型确定模块，还用于：

当至少两个候选的对象类别对应的概率超过概率阈值时，将所述至少两个超出概率阈值的概率对应的对象类别，作为所述子块图像内对象的分类结果，或者，将最大概率对应的对象类别，作为所述子块图像内对象的分类结果。

在上述方案中，所述地块类型确定模块，还用于：

对所述子块图像进行特征提取处理，基于从所述子块图像提取的图像特征对所述子块图像内的对象进行分类处理，得到所述子块图像内对象的分类结果。

在上述方案中，所述所述分类处理是通过分类模型实现的，所述装置还包括：

分类模型训练模块，用于初始化分类模型的模型参数；通过所述分类模型对训练样本集合中的子块图像样本进行类别预测，得到所述子块图像样本的预测对象类别；确定所述子块图像样本的预标注对象类别与所述预测对象类别的误差，基于所述误差在所述分类模型中进行反向传播，以更新所述分类模型的模型参数。

在上述方案中，所述装置还包括：

样本构建模块，用于基于多个预标注坐标点，在地域图像样本中确定每个预标注坐标点所在的地块；通过预设尺寸从所述地域图像样本中切割出每个预标注坐标点所在的地块的图像，得到对应的子块图像样本；基于所述子块图像样本以及对应的标注对象类别，构建所述训练样本集合。

本申请实施例提供一种电子设备，包括：

存储器，用于存储可执行指令；

处理器，用于执行所述存储器中存储的可执行指令时，实现本申请实施例提供的地域图像的识别处理方法。

本申请实施例提供一种计算机可读存储介质，存储有可执行指令，用于引起处理器执行时，实现本申请实施例提供的地域图像的识别处理方法。

本申请实施例提供一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现本申请实施例提供的地域图像的识别处理方法。

本申请实施例具有以下有益效果：

对地域遥感图像进行地块识别和裁剪处理，能够快速准确的获得地块的图像，以适用于地块级图像的分类，相较于图像逐像素分割并分类的处理方式降低了处理难度，减少了地块之间划分不清晰影响识别精度的问题，基于地块图像以预设尺寸进行切割处理，得到与地块对应的子块图像样本，基于对相应子块样本进行类别预测得到的分类结果确定地块覆盖的对象类别，相较于全图随机取样进行分类识别的准确程度更高，且节约了计算资源。

附图说明

图1是本申请实施例提供的地域图像的识别处理系统的一个可选的结构示意图；

图2是本申请实施例提供的电子设备的一个可选的结构示意图；

图3A是本申请实施例提供的地域图像的识别处理方法的一个可选的流程示意图；

图3B是本申请实施例提供的地域图像的识别处理方法的一个可选的流程示意图；

图4是本申请实施例提供的地块裁剪模型的训练方法的一个可选的流程示意图；

图5是本申请实施例提供的分类模型的训练方法的一个可选的流程示意图；

图6是本申请实施例提供的分类模型的训练方法的一个可选的流程示意图；

图7A是本申请实施例提供的初始的地域图像的一个可选的示意图；

图7B是本申请实施例提供的地域图像的语义分割图的一个可选的示意图；

图7C是本申请实施例提供的地域图像的边缘强度图一个可选的示意图；

图7D是本申请实施例提供的基于地域图像识别的地块区域的一个可选的示意图；

图8是本申请实施例提供的采样窗口的一个可选的示意图；

图9A是本申请实施例提供的基于一个分类模型进行分类处理的可选的示意图；

图9B是本申请实施例提供的基于多个分类模型进行分类处理的可选的示意图；

图9C是本申请实施例提供的基于多个分类模型进行分类处理的可选的示意图；

图10A是本申请实施例提供的初始的地域图像的一个可选的示意图；

图10B是本申请实施例提供的地域图像的标签图像的一个可选的示意图；

图10C是本申请实施例提供的地域图像的标签图像的一个可选的示意图；

图11是本申请实施例提供的分类模型的训练方法的流程示意图；

图12是本申请实施例提供的地块裁剪模型的训练方法的流程示意图；

图13是本申请实施例提供的地域图像的识别处理方法的流程示意图。

具体实施方式

为了使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请作进一步地详细描述，所描述的实施例不应视为对本申请的限制，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本申请保护的范围。

在以下的描述中，涉及到“一些实施例”，其描述了所有可能实施例的子集，但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集，并且可以在不冲突的情况下相互结合。

如果申请文件中出现“第一/第二”的类似描述则增加以下的说明，在以下的描述中，所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象，不代表针对对象的特定排序，可以理解地，“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序，以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的，不是旨在限制本申请。

目前的遥感图像识别模型受限于充足的训练样本，不易直接的进行语义分割，特征提取简单而精度低；而利用深度学习模型进行地域图像识别时，受限于真实的数据需要人工实地获取，定点任意，成本高，没有充足的数据量，识别的效率和准确率低。

基于此，本申请实施例提供一种地域图像的识别处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品，能够快速的识别地域图像中的地块，并精确的分类，得到地块覆盖的类型。

首先对本申请实施例提供的地域图像的识别处理系统进行说明，参见图1，图1是本申请实施例提供的地域图像的识别处理系统100的一个可选的架构示意图，终端400通过网络300连接服务器200，网络300可以是广域网或者局域网，又或者是二者的组合，使用无线链路实现数据传输。在一些实施例中，终端400可以是笔记本电脑，台式计算机等，但并不局限于此。服务器200可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。网络300可以是广域网或者局域网，又或者是二者的组合。终端400以及服务器200可以通过有线或无线通信方式进行直接或间接地连接，本申请实施例中不做限制。

终端400，用于获取地域遥感图像，并将地域遥感图像发送至服务器200。这里，获取的地域图像不限于遥感图像，还可以是通过其他方式采集的地域图像，例如无人机拍摄等，下文不再重复说明。

服务器200，用于接收地域遥感图像，对待识别地域图像进行特征提取处理，基于从所述待识别地域图像提取的图像特征，对所述待识别地域图像进行语义分割处理和/或边缘检测处理，得到与至少一个地块对应的区域；基于所述至少一个地块对应的区域，从所述待识别地域图像中裁剪出所述至少一个地块的图像；通过预设尺寸切割所述地块的图像，得到对应的子块图像；基于所述子块图像的图像特征获取所述子块图像内对象的分类结果，并基于所述子块图像内对象的分类结果，确定所述地块覆盖的对象类型，并得到遥感图像的地块分类图，将地块分类图返回至终端400。

在其他示例中，终端400可以获取地域遥感图像，并基于地域遥感图像实施本申请提供的地域图像的识别处理方法，得到遥感图像的地块分类图，并通过在终端界面显示地块分类图。

参见图2，图2是本申请实施例提供的电子设备500的一个可选的结构示意图，在实际应用中，电子设备500可以实施为图1中的终端400或服务器200，以电子设备为图1所示的服务器200为例，对实施本申请实施例的地域图像的识别处理方法的电子设备进行说明。图2所示的电子设备500包括：至少一个处理器510、存储器550、至少一个网络接口520和用户接口530。电子设备500中的各个组件通过总线系统540耦合在一起。可以理解，总线系统540用于实现这些组件之间的连接通信。总线系统540除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图2中将各种总线都标为总线系统540。

处理器510可以是一种集成电路芯片，具有信号的处理能力，例如通用处理器、数字信号处理器(DSP，Digital Signal Processor)，或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等，其中，通用处理器可以是微处理器或者任何常规的处理器等。

存储器550可以是可移除的，不可移除的或其组合。示例性的硬件设备包括固态存储器，硬盘驱动器，光盘驱动器等。存储器550包括在物理位置上远离处理器510的一个或多个存储设备。

存储器550包括易失性存储器或非易失性存储器，也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM，Read Only Memory)，易失性存储器可以是随机存取存储器(RAM，Random Access Memory)。本申请实施例描述的存储器550旨在包括任意适合类别的存储器。

在一些实施例中，存储器550能够存储数据以支持各种操作，这些数据的示例包括程序、模块和数据结构或者其子集或超集，下面示例性说明。

操作系统551，包括用于处理各种基本系统服务和执行硬件相关任务的系统程序，例如框架层、核心库层、驱动层等，用于实现各种基础业务以及处理基于硬件的任务；网络通信模块552，用于经由一个或多个(有线或无线)网络接口520到达其他计算设备，示例性的网络接口520包括：蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB，UniversalSerial Bus)等。

在一些实施例中，本申请实施例提供的地域图像的识别处理装置可以采用软件方式实现，图2示出了存储在存储器550中的地域图像的识别处理装置555，其可以是程序和插件等形式的软件，包括以下软件模块：图像处理模块5551、图像裁剪模块5552、图像切割模块5553、地块类型确定模块5554，这些模块是逻辑上的，因此根据所实现的功能可以进行任意的组合或进一步拆分。将在下文中说明各个模块的功能。

在另一些实施例中，本申请实施例提供的地域图像的识别处理装置可以采用硬件方式实现，作为示例，本申请实施例提供的地域图像的识别处理装置可以是采用硬件译码处理器形式的处理器，其被编程以执行本申请实施例提供的地域图像的识别处理方法，例如，硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC，Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD，ProgrammableLogic Device)、复杂可编程逻辑器件(CPLD，Complex Programmable Logic Device)、现场可编程门阵列(FPGA，Field-Programmable Gate Array)或其他电子元件。

基于上述对本申请实施例的地域图像的识别处理系统和电子设备的说明，接下来对本申请实施例提供的地域图像的识别处理方法进行说明。在一些实施例中，本申请实施例提供的地域图像的识别处理方法可以由服务器单独实施，或由服务器及终端协同实施。

将结合本申请实施例提供的地域图像的识别处理系统的示例性应用和实施，说明本申请实施例提供的地域图像的识别处理方法。

参见图3A，图3A是本申请实施例提供的地域图像的识别处理方法的一个可选的流程示意图，将结合图3A示出的步骤进行说明。图3A示出的步骤可以由服务器(例如图1示出的服务器200)执行，下文不再重复说明。

在步骤101中，对待识别地域图像进行特征提取处理，基于从所述待识别地域图像提取的图像特征，对所述待识别地域图像进行语义分割处理和/或边缘检测处理，得到与至少一个地块对应的区域。

这里，待识别地域图像可以是采用任意方式采集的，例如卫星遥感、无人机航拍、航空飞机拍摄等。

在一些实施例中，步骤1011可以通过如下方式实现：对待识别地域图像进行特征提取处理，基于从待识别地域图像提取的图像特征，对待识别地域图像进行语义识别，确定至少一个地块的语义区域，以作为与至少一个地块对应的区域。

需要说明的是，图像特征可以是语义特征，用于指向感兴趣区域的位置；例如，基于语义特征确定感兴趣区域与非感兴趣区域，感兴趣区域可以是包含地块的区域，具体地，还可以是种植有(例如：农作物)的地块区域，非感兴趣区域可以包括少量的目的地办事区域、道路区域以及建筑区域等其他区域；图像语义分割，就是自动分割并识别出图像的不同区域的内容，并给定不同区域的内容以相应的类别，在本申请实施例中，语义分割是指在地域图像中识别出感兴趣区域和感兴趣区域，感兴趣区域的内容是包含地块的区域，相应的类别为地块所覆盖的对象类别，非感兴趣区域的内容是其他非地块的区域，相应的类别为其他类别。示例性地，感兴趣区域还可以为种植有作物的地块区域，相应的类别为类别，非感兴趣区域的内容是其他非的区域，相应的类别为其他类别。

在实际实施时，语义识别处理可以通过语义分割模型实现。这里，语义分割模型的类型可以是U型卷积神经网络U-net模型、全卷积神经网络(FCN，Fully ConvolutionalNetworks)模型、深度神经网络模型等，本申请实施例对此不加限定。

在实际实施时，以全卷积神经网络FCN模型为例，在经过若干堆叠的卷积和池化层进行语义特征提取和下采样处理后，可以得到原图对应的语义特征分割结果图，并利用双线性插值等方法将语义特征分割结果图的长宽上采样到原图大小，以实现像素级别端到端(End-To-End)的语义分割，得到相应的语义分割图，语义分割图中包括表征不同类别的不同区域。

例如，通过本申请实施例中的语义分割模型，在地域图像中提取语义特征，对待识别地域图像进行语义识别，得到与原图像尺寸相同的语义分割图，语义分割图中包括至少一个语义区域，语义区域用于指示感兴趣区域，即语义区域覆盖的图像中的图像类别是地块所覆盖的对象的类别，将语义识别处理得到的至少一个语义区域作为至少一个地块覆盖的区域。

在另一些实施例中，步骤1011还可以通过如下方式实现：对待识别地域图像进行特征提取处理，基于待识别地域图像提取的图像特征，对待识别地域图像进行边缘检测，得到多个边缘线，边缘线包括待识别地域图像中与相邻像素点之间的灰度差值大于预定差值阈值的像素点；确定边缘线组成的至少一个区域，以作为至少一个地块对应的区域。

需要说明的是，图像特征还可以是边缘特征，用于指向目标区域的边界轮廓信息；例如，基于边缘特征确定边缘线以及由边缘线交汇的目标区域，这里，目标区域可以是覆盖的地块区域。

在实际实施时，边缘检测处理可以通过边缘检测的机器学习模型实现。这里，边缘检测的机器学习模型可以是丰富卷积特征(RCF，Richer Convolutional Features)模型，整体嵌套边缘检测(HED，Holistically Nested Edge Detection)模型、深度神经网络模型等，本申请实施例对此不加限定。

在实际实施时，以HED模型为例，HED模型是一种高精度的深度边缘检测网络，边缘检测网络是基于对于图像被标注的边缘概率映射图作为训练样本来训练得到的，边缘概率映射图的值的范围为[0,1]。这里，0为没有标注为边缘像素，1为被标注为边缘像素。该边缘检测网络通过在VGG16模型的每个卷积层上加上反卷积层，共五个上采样层，并将这些上采样层串联到一起进行卷积操作形成边缘强度图，在边缘强度图中，表征目标区域的边界信息的像素值为第一像素值，其余部分的像素值为第二像素值。

例如，通过边缘检测模型在地域图像中提取边缘特征，对待识别地域图像进行边缘检测，得到与原图像尺寸相同的边缘强度图，边缘强度图中包括边缘线和其他区域(其他区域包括：由边缘线包围组成的内部区域、未被边缘线包围且并未检测出边缘线的区域)，将边缘线组成的内部区域确定为至少一个地块覆盖的区域。

在实际实施时，边缘检测处理还可以通过包括各种边缘检测规则的边缘检测算法方法实现。具体的，边缘检测算法通常是基于图像中不同区域的边界上像素的灰度值变化比较剧烈的特点识别目标区域的边缘，如果将图片从空间域通过傅里叶变换到频率域，边缘部分就对应着高频部分。例如，并行微分算子法是一种常见的边缘检测算法，利用相邻区域的像素值不连续的性质，采用一阶或者二阶导数来检测边缘点，在其他实施例中，边缘检测算法还可以是Robert算法、Sobel算法、Prewitt算法等，本申请实施例对此不加限定。

在一些实施例中，步骤1011可以通过如下方式实现：基于从待识别地域图像提取的图像特征，对待识别地域图像进行语义识别，得到至少一个地块的语义区域；基于从待识别地域图像提取的图像特征，对待识别地域图像进行边缘检测，得到至少一个地块的边界信息；基于边界信息，对语义区域进行切割处理，得到与至少一个地块对应的区域。需要说明的是，本申请实施例的语义识别处理可以通过上文记载的语义分割模型实现、边缘检测处理可以通过上文记载的边缘检测模型实现。

在一些实施例中，参照本申请实施例上文的记载，利用语义分割模型提取待识别地域图像的语义特征，基于语义特征进行语义识别，得到语义分割图；利用边缘检测模型提取待识别图像的边缘特征，基于边缘特征进行边缘检测，得到边缘强度图。

这里，语义分割图和边缘强度图可以为二值化的图像。例如，在语义分割图中，表征感兴趣区域的语义区域的像素值为第一像素值，非感兴趣区域的像素值为第二像素值；在边缘强度图中，表征目标区域的边界信息的像素值为第一像素值，其余部分的像素值为第二像素值。这里，第一像素值可以为“1”，第二像素值可以为“0”。

在一些实施例中，参见图7A、图7B、图7C、图7D，图7A示出了原始的地域图像，图7B示出了经过边缘检测处理后得到的边缘强度图，图7C示出了语分割处理后的语义分割图，图7D示出了经过语义分割和边缘检测处理得到的结果示意图。在实际实施时，基于边界信息，对语义区域进行切割处理，得到与至少一个地块对应的区域可以通过以下方式得到：基于边界信息确定相应的地块在语义分割图中的轮廓区域，将轮廓区域对应的像素值赋值为第二像素值，得到语义区域中像素值为第二像素值的目标像素点，将目标像素点在语义区域中去除，将得到的区域作为至少一个地块的区域。例如，根据图7B示出的边界信息71对图7C示出的相应的语义区域72切割处理得到图7D示出至少一个地块的区域73。

通过语义分割处理和边缘检测处理得到至少一个地块的区域的方式，对于紧密相连的地块，能够有效的将相邻地块的边界明显分割出来，地块之间边界清晰，减轻后续的分类识别过程的难度，提升分类识别处理的精度。

在步骤102中，基于至少一个地块对应的区域，从待识别地域图像中裁剪出至少一个地块的图像。

在一些实施例中，基于至少一个地块对应的区域，确定地块在待识别地域图像中的位置，以从待识别地域图像的对应位置区域裁剪出至少一个地块的图像。

在一些实施例中，承接上文，当地块的区域是通过语义识别的方式获得时，通过以下方式裁剪：将语义识别处理得到的至少一个语义区域在待识别地域图像中对应位置区域的图像裁剪出来，得到至少一个地块的图像。

在另一些实施例中，承接上文，当地块的区域是通过边缘检测的方式获得时，通过以下方式裁剪：根据边缘检测处理得到的边缘线组成的边界信息，可以将边缘线包围的内部区域在待识别地域图像中对应位置区域的图像裁剪出来，得到至少一个地块的图像。

在另一些实施例中，承接上文，当地块的区域是通过边缘检测和语义识别的方式获得时，通过以下方式裁剪：在待识别地域图像中建立第一像素坐标系，在语义分割图中建立第二像素坐标系，并得到第一像素坐标系与第二像素坐标系之间的坐标映射关系；确定至少一个地块对应的区域在第二像素坐标系中的像素坐标，通过像素坐标得到至少一个地块在语义分割图中的区域位置，并基于坐标映射关系将像素坐标映射至第一像素坐标系中的目标像素坐标，得到至少一个地块在待识别地域图像中的区域位置，基于位置的对应关系，从待识别地域图像的对应位置区域裁剪出至少一个地块的图像。这里，裁剪处理可以包括：基于像素级别的像素矩阵相乘处理，也可以图层叠加、掩膜处理等方式，本申请实施例对此不加限定。

通过本申请实施例提供的地块裁剪模型，在地域图像中快速准确的识别得到多个边界明晰的地块，减少了人工处理的成本，以便于后续在地块级的图像中进一步识别地块中覆盖的对象类型，提高了地块识别的精度。

在一些实施例中，本申请实施例中，语义分割处理和/或边缘检测处理是通过地块裁剪模型实现的。地块裁剪模型的训练过程可以在图3A示出的步骤101之前实现。参见图4，图4是本申请实施例提供的地块裁剪模型的训练方法的一个可选的流程示意图，图3A示出的步骤101的步骤是通过预训练的地块裁剪模型实现的，在获取地块裁剪模型之前，通过图4示出的步骤201-203获取样本数据和标签数据用于训练上述地块裁剪模型，将结合步骤进行说明。

在步骤201中，基于预标注信息，在地域图像样本中确定感兴趣区域；其中，预标注信息用于指示感兴趣区域的位置，感兴趣区域表征地块对应的区域。

需要说明的是，预标注信息可以是获取的人工标注的标记信息，人工标注可以使用开源的标注软件制作地块边缘分割标签，如labelme、ArcGIS等标注软件，依据地域图像样本中真实的地块的边界绘制边界切割信息，标记出感兴趣区域的位置，并赋予地块语义属性，语义属性可以用以区分感兴趣区域和非感兴趣区域，感兴趣区域表征覆盖地块的区域。

在步骤202中，对感兴趣区域的图像进行腐蚀处理，得到地域图像样本的标签图像。需要说明的是，腐蚀处理是一种形态学图像处理方式，形态学图像处理是在图像中移动一个结构元素，然后将结构元素与对应的二值图像进行交、并等集合运算，腐蚀可以理解为“领域”被蚕食，即将图像中的边缘腐蚀掉。例如将图像中高亮区域或白色部分进行缩减细化,其运行结果图比原图的高亮区域更小。在另一些实施例中，还可以将感兴趣区域的图像进行边界留白处理，以得到地域图像样本的标签图像，这里，边界留白处理可以为在相应的二值图像中将感兴趣区域和感兴趣区域的边界赋予不同的像素值。在一些实施例中，在对感兴趣区域的图像进行腐蚀处理或边界留白处理后，得到与地域图像样本对应的标签图像，需要说明的是，标签图像可以是基于预标记信息形成的面标签图以及线标签图。

参见图10A、图10B，图10A本申请实施例提供的采样窗口的一个可选的示意图，图10B是本申请实施例提供的地域图像的标签图像的一个可选的示意图，这里，面标签图可以是进行二值化处理的图像，图10B中感兴趣区域11的像素值为第一值，用于指示地块区域，非感兴趣区域12的像素值为第二值，用于指示其他区域。例如，第一值可以为“1”，第二值可以为“0”。

参见图10C，图10C是本申请实施例提供的地域图像的标签图像的一个可选的示意图，线标签图也可以是进行二值化处理的图像，图10C中地块的边界轮廓13的像素值可以为第一值，其余部分14的像素值可以为第二值。例如，第一值可以为“1”，第二值可以为“0”。

在步骤203中，基于地域图像样本以及对应的标签图像预训练地块裁剪模型；其中，地块裁剪模型的类型包括：边缘检测模型、语义分割模型。

在一些实施例中，步骤203的步骤可以通过以下方式实现：初始化地块裁剪模型的模型参数；通过地块裁剪模型对地域图像样本进行特征提取和地块裁剪处理，得到地域图像样本的地块裁剪图像；确定地块裁剪图像与标签图像的误差更新地块裁剪模型的模型参数。

在一些实施例中，可以基于地域图像和面标签图构成的训练样本训练语义分割模型、或基于地域图像以及线标签图构成的训练样本训练边缘检测模型，还可以基于面标签图和线标签图进行融合处理后形成的融合标签图像训练地块裁剪模型用以实施本申请实施例步骤101中的地块裁剪处理。上述通过训练地块裁剪模型分割待识别地域图像的方式，能够减少人工成本，快速的分割出多个地块，以便于针对每个地块进行准确识别和分类，提高了地块识别的效率。

在步骤103中，通过预设尺寸切割地块的图像，得到对应的子块图像。

在一些实施例中，步骤103可以通过以下方式实现：针对每个地块执行以下处理：在地块中确定中心点；确定以所述中心点为几何中心、且符合预设尺寸的规则几何图形，基于所述规则几何图形切割地块的图像，得到与所述地块对应的子块图像。

在实际实施时，以预设尺寸构建采样窗口，由于地块一般成块状、方体，如果采样窗口过大，会引入其他类别信息或噪声，造成识别精度的下降；如果采样窗口过小，则不能包含充分的如地块边界等信息，因此，采样窗口尺寸的设置通常是在真实的地域遥感图像数据上经过大量的实验测评确定，一般来说，选择尽可能包裹地块的预设尺寸。例如，可以通过对遥感图像进行区域像素聚类处理取众数得到预设尺寸，也可以根据遥感图像的空间分辨率等图像参数设置，本申请实施例对此不加限定。

示例性的，参见图8，图8是本申请实施例提供的采样窗口的一个可选的示意图。针对每个地块中的中心点，生成一个固定尺寸的采样窗口，以固定尺寸(即预设尺寸)切割地块图像，得到与每个地块对应的子块图像。其中，预设尺寸一般为以上述中心点为中心的规则几何图形，例如，规则几何图形可以为圆形、矩形、正方形等。

这里，固定尺寸可以用参数size表示，例如，固定尺寸size可以为圆形的半径值、矩形的长宽值或正方形的边长值等。参见图8，图8示出的采样窗口81是以取样点为中心，左上偏移size/2，右下偏移size/2构建的正方形采样窗口81，通过几何图像处理方法获取每个地块的中心点，基于地块的中心点，分别利用预设尺寸的采样窗口81对地块图像进行切割，得到尺寸与采样窗口尺寸一致的子块图像。

在另一些实施例中，步骤103还可以通过以下方式实现：在每个地块中，以上述中心点为中心，分别以预设尺寸切割地块的图像，得到与地块对应的多个子块图像。

例如，以取样点为中心，以预设尺寸为采样窗口大小，从不同方向上切割地块的图像，得到与地块对应的多个子块图像。

在另一些实施例中，步骤103还可以通过以下方式实现：在每个地块中随机获取多个取样点；基于每个取样点，分别以预设尺寸切割地块的图像，得到与每个地块对应的多个子块图像。

上述通过根据预设尺寸切割图像的方式，能够适应地块级图像的采样处理，相较于全图随机采样和预测，提升了图像识别的精度。

在步骤104中，基于所述子块图像的图像特征获取所述子块图像内对象的分类结果，并基于所述子块图像内对象的分类结果，确定所述地块覆盖的对象类型。

在一些实施例中，步骤104的方法可以通过至少一个分类模型实现，这里，分类模型可以为包括多个卷积层、池化层以及输出层的深度神经网络模型，例如，分类模型可以为残差网络模型ResNet、稠密连接网络模型DenseNet等。

在一些实施例中，参见图9A，图9A是本申请实施例提供的基于一个分类模型进行分类处理的可选的示意图。这里，通过一个分类模型对于地块对应的一个子块图像进行特征提取处理和分类处理。

在另一些实施例中，参见图9B，图9B是本申请实施例提供的基于多个分类模型进行分类处理的可选的示意图。这里，每个分类模型可以是图9A示出的分类模型的结构，以下不再重复说明。以预设尺寸切割每个地块图像可以得到与地块对应的多个子块图像时，步骤103的方法可以通过同一个分类模型执行以下处理：利用同一个分类模型分别对子块图像1、子块图像2至子块图像n进行特征提取处理，基于从每个子块图像提取的图像特征对每个子块图像进行分类处理，分别得到子块图像1的分类结果、子块图像2的分类结果至子块图像n的分类结果。

在另一些实施例中，参见图9C，图9C是本申请实施例提供的基于多个分类模型进行分类处理的可选的示意图。以预设尺寸切割每个地块图像可以得到与地块对应的多个子块图像时，步骤103的方法可以通过同一个分类模型执行以下处理：利用分类模型1对子块图像1进行特征提取处理，基于从子块图像1提取的图像特征，对子块图像1进行分类处理，得到子块图像1的分类结果；利用分类模型2对子块图像2进行特征提取处理，基于从子块图像2提取的图像特征，对子块图像2进行分类处理，得到子块图像2的分类结果；依次利用n个分类模型分别对n个图像子块进行分类处理，得到相应的n个分类结果。

这里，多个分类模型是通过多个训练样本子集训练得到，其中，每个分类模型的训练样本子集不同或不完全相同。

通过多个分类模型一对一地对每个子块图像分别进行分类处理得到对应的预测类别，能够避免通过一个分类模型对子块图像识别的偏差导致的错误识别，保证了地块识别的稳定性。

参见图3B，图3B为本申请实施例提供的地域图像的识别处理方法的流程示意图，步骤104中的方法可以通过步骤1041-1043实现，下面结合图3B示出的步骤1041-1044进行说明。

在步骤1041中，对子块图像进行特征提取，得到对应子块图像的图像特征。

在对子块图像进行特征提取处理之前，对子块图像进行辐射校正、几何矫正、滤波处理等操作，得到预处理后的子块图像。将预处理后的子块图像输入分类模型的卷积层进行特征提取，得到多个特征图，将对应的特征图输入池化层进行下采样处理，保留较强的图像特征，经过多次卷积和池化处理后得到子块图像对应的图像特征。

本申请实施例中，基于所述子块图像的图像特征获取所述子块图像内对象的分类结果，可以通过如下方式实现：对所述子块图像进行特征提取处理，基于从所述子块图像提取的图像特征对所述子块图像内的对象进行分类处理，得到所述子块图像内对象的分类结果。需要说明的是，图像特征用于指示图像子块的类别，子块图像的分类可以是二分类或者多分类，对于二分类，候选的类别的数目为两个，对于多分类，候选的类别的数目为多个。

在步骤1042中，将子块图像的图像特征映射为对应多个候选的分类结果的概率；

在一些实施例中，通过分类模型的输出层对子块图像进行类别预测，这里，输出层可以是softmax层。本申请实施例提供的输出层具备多个softmax映射函数，将子块图像中提取的图像特征进行映射和归一化处理，得到对应多个候选类别的概率。

示例性的，子块图像的类别表征当前图像内覆盖的对象的对象类别。在一些实施例中，若提取的地块的图像为农作物地块对应的图像，则相应的对象可以为不同类别的农作物，示例性地，候选的对象类别可以为玉米、水稻、棉花，根据图像特征，对子块图像进行类别预测，将图像特征映射为属于玉米类别的第一概率值、属于水稻类别的第二概率以及属于棉花类别的第三概率。

在步骤1043中，将超出概率阈值的概率对应的对象类别，作为子块图像内对象的分类结果。

需要说明的是，概率阈值表征概率的门限值，示例性的，可以将概率阈值设定为60％，对于概率超过60％对应的候选的对象类别，通常为该图像子块中大面积或全部覆盖的对象的对象类别。

在一些实施例中，当至少两个候选的对象类别对应的概率超过概率阈值时，将至少两个超出概率阈值的概率对应的对象类别，作为子块图像内对象的分类结果。

这里，子块图像中可以兼容至少两种类别的对象，将超过概率阈值的概率对应的对象类别作为当前子块图像的分类结果，即确定当前子块图像中的对象属于哪种或哪几种对象类别。

示例性的，承接上述示例，属于玉米类别的第一概率、属于水稻类别的第二概率以及属于棉花类别的第三概率中，第一概率、第二概率超过了概率阈值，可以将“玉米”和“水稻”作为图像子块的对象类别，即确定当前子块图像表征的区域种植了玉米和水稻两种农作物。

在另一些实施例中，当至少两个候选的对象类别对应的概率超过概率阈值时，确定概率最大的对象类别，将最大概率对应的对象类别，作为子块图像的分类结果。

这里，子块图像中仅包含同一类别的对象，将超过概率阈值的概率中概率值最大的对象类别，作为子块图像的分类结果，即确定当前图像子块中的对象最大可能是哪种类别的对象。

示例性的，承接上述示例，属于玉米类别的第一概率、属于水稻类别的第二概率以及属于棉花类别的第三概率中，第一概率、第二概率超过了概率阈值，且第一概率的值最大，可以将“玉米”作为图像子块的对象类别，即确定当前子块图像表征的区域种植了玉米作物。

通过上述实施例，为每个地块中非单一类别植种植的情形提供了更完善的地块识别处理方式，保证了对地块中多种对象类型的精准识别。

在一些实施例中，如果对应多个候选的对象类别的概率均未超过概率阈值时，判定类别预测失败，确定当前图像子块中未准确识别出对象类型，可利用分类模型对当前图像子块重新识别，或基于当前类别预测失败的图像子块丰富分类模型的训练集，用以更新分类模型，提高分类模型的识别精度。

此时，若与真实结果相比，预测结果错误，可以基于当前识别失败的图像丰富分类模型的训练集，用以更新分类模型，提高分类模型的识别精度。

通过上述实施例，使分类模型能够就错误识别的图像进行充分学习，从而纠正分类模型之前的识别错误，提高了分类精度。

在步骤1044中，基于子块图像内对象的分类结果，确定地块覆盖的对象类型。

在一些实施例中，将子块图像中包含的对象的分类结果表征的对象类型，作为当前子块图像对应的地块覆盖的对象类型。

在另一些实施例中，以预设尺寸切割每个地块图像可以得到与地块对应的多个子块图像时，步骤1044的方法可以通过多数投票的方法实现。例如：确定多个子块图像中属于相同对象类别的子块图像的数量；将数量最多的子块图像对应对象类别，确定为地块覆盖的对象类别。

在一些实施例中，步骤104之后，根据预设规则针对不同的类别为各个地块进行不同的着色处理，得到地域遥感图像的地块分类图。其中，预设规则可以为不同对象类别和颜色的对应关系。

例如，针对每个地块的类别，为当前地块对应的图像区域的像素给出不同颜色的着色标注，以得到地块分类图。例如，将表征玉米农作物地块的图像区域着色为黄色、将表征水稻农作物地块的图像区域的着色为绿色、将表征棉花农作物地块的图像区域着色为红色，以此得到携带不同着色的地域遥感图像的地块分类图。

在另一些实施例中，预设规则可以包括不同对象类别和标签的对应关系。

例如，针对每个地块的类别，在当前地块对应的图像区域给出不同标签，以得到地块分类图。例如，在表征玉米农作物地块的图像区域展示“玉米”标签、在表征水稻农作物地块的图像区域展示“水稻”标签、将表征棉花农作物地块的图像区域展示“棉花”标签，以此得到携带标签的地域遥感图像的地块分类图。

上述实施例中，基于地块裁剪模型对图像进行分割处理能够快速的得到地块的图像，将复杂的地域遥感图像简单化处理为地块级区域，并减少人工的难度和成本，并且，针对地块级的图像，以预设尺寸切割地块的图像，得到与地块对应有效的子块图像样本，根据预训练的分类模型对子块图像进行类别预测得到分类结果，以确定地块覆盖的对象类别，提高地块识别的准确率，从而提升地块分类的精度，提高地块分类识别的应用价值。

参见图5，图5是本申请实施例提供的分类模型的训练方法的一个可选的流程示意图，本申请实施例中的分类处理是通过分类模型实现的，这里，分类模型可以是图9A、图9B、图9C示出的任意一个分类模型，下文不再重复说明。在获取分类模型之前，通过图5示出的步骤301-303训练上述分类模型，将结合步骤进行说明。

在步骤301中，初始化分类模型的模型参数。

在步骤302中，通过分类模型对训练样本集合中的子块图像样本进行类别预测，得到子块图像样本的预测对象类别。

这里，对子块图像样本进行类别预测，得到子块图像样本的预测对象类别，参照本申请实施例上文记载的分类处理的方式，在此不做赘述。

在步骤303中，确定子块图像样本的预标注对象类别与预测对象类别的误差，基于误差在分类模型中进行反向传播，以更新分类模型的模型参数。

这里，对反向传播进行说明，将图像特征输入到神经网络模型的输入层，经过隐藏层，最后达到输出层并输出预测对象类别，这是神经网络模型的前向传播过程，由于神经网络模型的输出结果与实际结果有差异，则计算输出结果与实际结果之间的差异，并将该差异从输出层向隐藏层反向传播，直至传播到输入层，在反向传播的过程中，根据误差调整模型参数的值；不断迭代上述过程，直至损失函数收敛。

参见图6，是本申请实施例提供的分类模型的训练方法的一个可选的流程示意图，图3A示出的步骤103的步骤是通过至少一个分类模型实现的，在获取分类模型之前，通过图6示出的步骤401-403构建训练样本集合用以训练至少一个分类模型：

在步骤401中，基于多个预标注坐标点，在地域图像样本中确定每个预标注坐标点所在的地块。

在一些实施例中，在获取地域图像样本之前，一般针对感兴趣区域进行实地考察和取样，例如，在实际的农田区域中获取采样点和当前采样点的属性(种植的农作物类型)，并携带全球定位系统GPS仪器定点拍照，以记录当前采样点属性和坐标位置作为预标注坐标点。

在一些实施例中，在地域图像样本中确定每个预标注坐标点所在的地块可以通过直接目视解译实现：通过人眼观测遥感图像数据，分辨坐标点所在的地块区域，根据人工添加的点信息标注作为约束，得到每个预标注坐标点所在的地块。

在另一些实施例中，在地域图像样本中确定每个预标注坐标点所在的地块还可以通过开源的标注工具或其他的聚类模型实现，本申请对此不加限定。

需要说明的是，由于采样点一般为地块内任意一点，在用方框取样获取训练样本时可能取得边缘，不足以代表地块内对象的特征，通过上述实施例的方法基于坐标点扩充地块，以针对每个地块进行采样识别，减少图像的碎片化，提升了后续采样的效率和图像识别的准确度。

在步骤402中，通过预设尺寸从地域图像样本中切割出每个预标注坐标点所在的地块的图像，得到对应的子块图像样本。

这里，预设尺寸为本申请实施例上文中的固定尺寸，预设尺寸为以中心点为中心的规则几何图形。通过预设尺寸从地域图像样本中切割地块图像得到对应的子块图像的处理参照本申请实施例上文的实施方式，在此不做赘述。

在步骤403中，基于子块图像样本以及对应的标注对象类别，构建训练样本集合。

在一些实施例中，将基于预标注坐标点扩充的相应地块的标注对象类别作为对应同一地块的一个或多个子块图像样本对应的标注对象类别，以上述子块图像样本以及对应的预标注对象类别作为训练样本，构建训练样本集合，用以训练至少一个分类模型。

在一些实施例中，构建训练样本集合，训练多个分类模型用以实现本申请实施例中针对子块图像的分类处理，例如，从上述训练样本集合中抽取训练样本子集，以用于训练每个分类模型的，其中，每个分类模型的训练样本子集不同或不完全相同。

在一些实施例中，可以通过样本放回抽取的方式构建多个训练样本集合用以训练多个分类模型。示例性的，在上述训练样本集合中，随机选取多个子训练样本，构建训练样本子集1，利用训练样本子集1，预训练分类模型1，将上述多个子训练样本放回训练样本集合，继续随机选取多个训练样本，构建训练样本子集2，预训练分类模型2；依次重复将样本放回再随机抽取训练样本，得到i个训练样本子集，预训练得到相应的i子分类模型；其中，i≥1，多个训练样本子集不完全相同。

在另一些实施例中，还可以通过样本无放回抽取的方式构建多个训练样本集合用以训练多个分类模型。示例性的，在上述训练样本集合中，随机选取多个子训练样本，构建训练样本子集1，预训练分类模型1；在剩余训练样本集合中，再随机选取多个子训练样本，构建训练样本子集2；预训练分类模型2；依次在剩余训练样本集合抽取训练样本，得到i个训练样本子集，预训练得到相应的i个子分类模型，其中，i≥1，多个训练样本子集完全不同。

需要说明的是，训练i个分类模型参照本申请实施例上文的分类模型训练方法，在此不做赘述。

这里，通过构建训练多个样本子集用以训练多个子分类模型，可能每一个模型的模型效果并不是最优的，但是综合考虑所有模型的输出结果，就会得到准确率较高的输出结果，减少使用一个分类模型进行特征提取和分类处理的误差，提升子块图像分类识别的准确性。

下面，将说明本申请实施例在一个实际的应用场景中的示例性应用。

以地域的农作物识别的场景为例，为了提高农作物识别的效率和准确性，需要基于地域遥感图像，识别农田地块，并基于地块级图像确定农田地块中农作物作物的种植类型，明晰农作物的确切分布情况，以获得农作物分类图。

目前的遥感农作物识别模型主要是像素级、基于规则或机器学习的方法，如马氏距离法、平行六面体分类法、支持向量机等，其特征提取方法传统低效、人工设计，不适应于复杂地区的农作物识别，精度不高，碎片化严重。虽然深度学习在特征提取具备优势，但是真实的农作物数据需要人工实地获取，定点任意，成本高，没有充足的数据量，难以直接用于深度神经网络、语义分割模型的训练，无法快速、准确的得到农作物的分布状态。

图11是本申请实施例提出的分类模型的训练方法的流程示意图，本申请实施例提供的地域图像的识别处理方法可以通过地块裁剪模型和分类模型实现，参见图11，图11示出了上述分类模型的训练阶段的方法，结合下文的步骤501-步骤504进行说明。

步骤501：获取实地调查的坐标和农作物种植类型。

在实际实施时，实验人员对具体的农田区域实地考察，携带全球定位系统GPS仪器定点拍照，记录多个采样点的坐标位置以及采样点的属性(农作物种植类型)。

步骤502：获取地域遥感图像，制作遥感图像地块级农田标注，以坐标所在位置扩充为整块农田。

在一些实施例中，坐标一般为农田内任意一点，传统的方框取样获取训练样本时可能取得农田地块边缘，覆盖非农田区域(例如道路、杂草等)或其他地块区域(例如种植不同类型农作物的农田地块)，不足以代表农田地块作物的特征，因此，根据步骤501记录的采样点的坐标位置和作物类型，人工扩充农田地块，制作地块级农作物标注。

例如，通过人工观测遥感图像数据，分辨坐标点所在的农田地块区域，根据人工添加的点信息标注作为约束，得到每个预标注坐标点所在的农田地块，通常来说，考虑到农作物的生长需要，通常一个农田地块区域种植一种类型的农作物。

步骤503：基于每个农田地块以及标注的农作物类型，取农田地块中的中心点，切割出训练样本图像。

例如，获取每个农田地块的中心点作为取样点，将固定尺寸size作为预设尺寸，以取样点为中心，偏移左上size/2，右下size/2，作为采样窗口，参见图8中的采样窗口81。基于采样窗口，在地块级遥感图像中裁剪出一个size大小的图片作为训练样本图像，例如，可以选取25*25*3的采样窗口进行图像切割，根据取样点位置通过采样窗口裁剪size大小的图像，以得到农田地块对应的训练样本图像。

需要说明的是，固定尺寸size的需要预先设定，根据大量实验数据和先验知识确定，一般要求盖住少量的地块外界，以使采样窗口尽可能的包裹整块农田。

步骤504：根据训练样本图像和对应的农作物类型标记，使用深度学习训练得到农作物分类模型M1(即分类模型)。

这里，农作物分类模型M1可以为残差网络模型ResNet、稠密连接网络模型DenseNet、或自定义的深度学习模型。

在一些实施例中，以农田地块对应的训练样本图像和标注的农作物类型构建训练样本集，将训练样本集输入农作物分类模型M1，通过农作物分类模型M1对训练样本集合中的子块图像样本进行类别预测，得到子块图像样本的预测植物类别，确定标注的农作物类型与预测的植物类别之间的误差，根据误差更新上述地块分类模型M1的模型参数。

图12是本申请实施例提出的地块裁剪模型的训练方法的流程示意图，本申请实施例提供的地域图像的识别处理方法可以通过地块裁剪模型和分类模型实现，参见图12，图12示出了上述地块裁剪模型(包括本申请上文的语义分割模型和边缘检测模型)的训练阶段的方法，下面结合下文的步骤601-步骤603进行说明。

步骤601：获取地域遥感图像。

这里，地域遥感图像可以面向县级、市级、省级甚至全国的农业区域，通过无人机航拍、遥感卫星等方式进行采集。

步骤602：制作遥感图像地块级农田分割标注。

具体的，由于农作物类型受到时间、天气影响大，从图像上难以精确区分，无法结合遥感图像得到每个局部地块区域的真实种植类型，但是地块分割标注制作容易，可以直接目视解译，使用开源的标注软件制作农田地块分割标签，如labelme、ArcGIS等标注软件，根据地块分割标签对遥感图像进行切割处理，分割出种植农作物的农田地块，得到包含多个农田地块的地块级标签图像。这里，为了区分挨得很近的不同地块，进行人工标注时故意对边界留白，或者对标注的每一块农田地块做形态学腐蚀操作。这里，地块级标签图像可以是面标签图像以及线标签图像。这里，面标签图像、线标签图像可以是进行二值化处理的图像，面标签图像中用于指示农作物地块区域的像素值为第一值，用于指示其他区域的像素值为第二值。线标签图像中用于标识地块的边界轮廓部分的像素值为第一值，其余部分的像素值为第二值。

步骤603：基于地域遥感图像样本和地块级标签图像，使用深度学习训练得到地块分割模型M2(即地块裁剪模型)。

在实际实施时，地块分割模型M2可以包括语义分割模型和边缘检测模型，基于地域图像和面标签图构成的训练样本训练语义分割模型，基于地域图像以及线标签图构成的训练样本训练边缘检测模型，还可以基于面标签图和线标签图进行融合处理后形成的融合标签图像训练地块分割模型M2。

这里，地块分割模型M2可以U型卷积神经网络U-Net模型、全卷积网络模型FCN模型或自定义的深度学习模型。

图13是本申请实施例提出的地域图像的识别处理方法的流程示意图，参见图13，基于本申请实施例训练的地块裁剪模型和分类模型可以对遥感图像中的农作物地区进行分类处理，得到相应的农作物分类图，如图13示出的基于本申请实施例训练的地块裁剪模型和分类模型进行地块识别的测试阶段，结合下文的步骤701-步骤706进行说明。

本申请实施例提供了农作物识别的测试方法。

需要说明的是，本申请实施例提供的农作物识别的测试方法可以在实际的农作物识别的场景中应用，在获取到农业地区的地域图像时，可以利用类似的方法实现农作物的识别。

步骤701：获取测试图像数据。

需要说明的是，测试图像数据可以为地域遥感图像集，例如，通过无人机定点航拍、卫星拍摄等方式等渠道采集的农业地域范围的遥感图像集。

步骤702：利用地块分割模型M2进行农田地块分割。

这里，基于上述示例训练的地块分割模型M2对地域图像进行特征提取，基于提取的图像特征对地域图像进行语义识别和/或边缘检测处理，识别覆盖农作物的农田区域，对所述地域图像进行切割处理，得到包括农田地块的图像。

步骤703：取农田地块中心点，切割出测试样本。

例如，对每个农田地块，获取农田地块的中心点a，将a作为中心点，以本申请实施例上文提供的固定尺寸size对当前农田地块的图像进行裁剪，得到对应的测试样本图像(子块图像)。

步骤704：使用农作物分类模型M1进行农作物分类。

在一些实施例中，使用农作物分类模型M1对样本图像进行特征提取处理，根据图像特征对所述样本图像进行类别预测，将图像特征映射为对应多个候选农作物类别的概率，将超出概率阈值且概率值最大对应的农作物类别，作为样本图像的分类结果。

需要说明的是，分类结果一般是取具有最大概率的类作为结果的，概率和加起来一般是100％。示例性的，若候选农作物的类别为“玉米”、“水稻”“其他”，对于一个农田地块，利用农作物分类模型分别对当前地块对应的样本图像进行特征提取和分类处理，得到预测类别为“玉米”的概率为20％，预测类别为“水稻”的概率为70％，预测类别为“棉花”的概率为10％，由于预测类别为水稻的概率最大，可以判定，当前样本图像中的种植农作物类型为“水稻”。

步骤705：将分类结果赋值给相应的地块。

在一些实施例中，将样本图像对应的分类结果赋值给原地块的a，确定以a为中心点的所在农田地块的种植农作物类型。

在另一些实施例中，若基于每个农田地块的中心点对相应的农田地块的图像进行切割得到M个对应的样本图像，并利用农作物分类模型对样本图像进行类别预测，得到M个分类结果，统计M个分类结果中属于相同分类结果的数量，将数量最多的分类结果确定为M个图像样本对应的农田地块的分类结果，将分类结果赋值给当前地块。其中，M为正整数，M＞1。

步骤706：重复执行步骤703-705，得到测试图像的农作物分类图。

在一些实施例中，利用农作物分类模型分别对多个农田地块进行分类预测，得到每个地块的分类结果，根据预设规则针对不同的农作物类别为各个农田地块进行不同的着色或添加标签，得到地域遥感图像的农作物分类图。其中，预设规则可以为不同植物类别和颜色的对应关系或不同植物类别和标签的对应关系。

例如，将表征玉米农作物地块的图像区域着色为黄色、将表征水稻农作物地块的图像区域的着色为绿色、将表征棉花农作物地块的图像区域着色为红色，以此得到携带不同着色的地域遥感图像的地块分类图。

通过本申请实施例在真实数据的农田地块中获取样本数据，根据标注数据训练地块分割模型和农作物分类模型，降低的农作物识别的数据需求，减少了人工成本，进行农作物识别测试时通过首先利用地块分割模型分割出农田地块，然后利用农作物分类模型，对每个地块进行中心点开窗取样，利用农作物分类模型对对应的样本进行分类预测，将得到的结果赋值给每个地块，以得到农作物识别结果，从而提升农作物分类的精度，提升农作物识别的应用价值。

下面继续说明本申请实施例提供的地域图像的识别处理装置555的实施为软件模块的示例性结构，在一些实施例中，如图2所示，存储在存储器550的地域图像的识别处理装置555中的软件模块可以包括：图像处理模块5551，用于对待识别地域图像进行特征提取处理，基于从所述待识别地域图像提取的图像特征，对所述待识别地域图像进行语义分割处理和/或边缘检测处理，得到与至少一个地块对应的区域；图像裁剪模块5552，用于基于所述至少一个地块对应的区域，从所述待识别地域图像中裁剪出所述至少一个地块的图像；图像切割模块5553，用于通过预设尺寸切割所述地块的图像，得到对应的子块图像；地块类型确定模块5554，用于基于所述子块图像的图像特征获取所述子块图像内对象的分类结果，并基于所述子块图像内对象的分类结果，确定所述地块覆盖的对象类型。

在一些实施例中，所述图像处理模块5551，还用于基于从所述待识别地域图像提取的图像特征，对所述待识别地域图像进行语义识别，得到至少一个地块的语义区域；基于从所述待识别地域图像提取的图像特征，对所述待识别地域图像进行边缘检测，得到至少一个地块的边界信息；基于所述边界信息对所述语义区域进行切割处理，得到与至少一个地块对应的区域。

在一些实施例中，所述图像处理模块5551，还用于基于从所述待识别地域图像提取的图像特征，对所述待识别地域图像进行语义识别，确定至少一个语义区域，以作为与至少一个地块对应的区域；或者，基于从所述待识别地域图像提取的图像特征，对所述待识别地域图像进行边缘检测，得到多个边缘线，所述边缘线包括所述待识别地域图像中与相邻像素点之间的灰度差值大于预定差值阈值的像素点；确定所述边缘线组成的至少一个区域，以作为至少一个地块对应的区域。

在一些实施例中，所述语义分割处理和/或边缘检测处理是通过地块裁剪模型实现的；所述地域图像的识别处理装置，还包括地块裁剪模型训练模块，用于基于预标注信息在地域图像样本中确定感兴趣区域；其中，所述预标注信息用于指示所述感兴趣区域的位置，所述感兴趣区域表征地块对应的区域；对所述感兴趣区域的图像进行腐蚀处理，得到所述地域图像样本的标签图像；基于所述地域图像样本以及对应的标签图像训练所述地块裁剪模型。

在一些实施例中，所述图像切割模块5553，还用于针对每个地块执行以下处理：在所述地块中，确定中心点；确定以所述中心点为几何中心、且符合预设尺寸的规则几何图形，基于所述规则几何图形切割所述地块的图像，得到与所述地块对应的子块图像。

在一些实施例中，所述地块类型确定模块5554，还用于将所述子块图像的图像特征映射为对应多个候选的分类结果的概率；将超出概率阈值的概率对应的对象类别，作为所述子块图像内对象的分类结果。

在一些实施例中，所述地块类型确定模块5554，还用于当至少两个候选的对象类别对应的概率超过概率阈值时，将所述至少两个超出概率阈值的概率对应的对象类别，作为所述子块图像内对象的分类结果，或者，将最大概率对应的对象类别，作为所述子块图像内对象的分类结果。

在一些实施例中，所述地块类型确定模块5554，还用于对所述子块图像进行特征提取处理，基于从所述子块图像提取的图像特征对所述子块图像内的对象进行分类处理，得到所述子块图像内对象的分类结果。

在一些实施例中，所述所述分类处理是通过分类模型实现的，所述装置还包括：分类模型训练模块，用于初始化分类模型的模型参数；通过所述分类模型对训练样本集合中的子块图像样本进行类别预测，得到所述子块图像样本的预测对象类别；确定所述子块图像样本的预标注对象类别与所述预测对象类别的误差，基于所述误差在所述分类模型中进行反向传播，以更新所述分类模型的模型参数。

在一些实施例中，所述装置还包括：样本构建模块，用于基于多个预标注坐标点，在地域图像样本中确定每个预标注坐标点所在的地块；通过预设尺寸从所述地域图像样本中切割出每个预标注坐标点所在的地块的图像，得到对应的子块图像样本；基于所述子块图像样本以及对应的标注对象类别，构建所述训练样本集合。地块类型确定地块类型确定。

需要说明的是，本申请实施例装置的描述，与上述方法实施例的描述是类似的，具有同方法实施例相似的有益效果，因此不做赘述。

本申请实施例提供了一种电子设备，包括：存储器，用于存储可执行指令；处理器，用于执行存储器中存储的可执行指令时，实现本申请实施例提供的地域图像的识别处理方法。

本申请实施例提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行本申请实施例上述的地域图像的识别处理方法。

本申请实施例提供一种存储有可执行指令的计算机可读存储介质，其中存储有可执行指令，当可执行指令被处理器执行时，将引起处理器执行本申请实施例提供的方法，例如，如图3A和图3B等示出的地域图像的识别处理方法。

在一些实施例中，计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器；也可以是包括上述存储器之一或任意组合的各种设备。

在一些实施例中，可执行指令可以采用程序、软件、软件模块、脚本或代码的形式，按任意形式的编程语言(包括编译或解释语言，或者声明性或过程性语言)来编写，并且其可按任意形式部署，包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。

作为示例，可执行指令可以但不一定对应于文件系统中的文件，可以可被存储在保存其它程序或数据的文件的一部分，例如，存储在超文本标记语言(HTML，Hyper TextMarkup Language)文档中的一个或多个脚本中，存储在专用于所讨论的程序的单个文件中，或者，存储在多个协同文件(例如，存储一个或多个模块、子程序或代码部分的文件)中。

作为示例，可执行指令可被部署为在一个计算设备上执行，或者在位于一个地点的多个计算设备上执行，又或者，在分布在多个地点且通过通信网络互连的多个计算设备上执行。

综上所述，基于地块分割模型进行分割处理能够快速的得到地块的图像，将复杂的地域遥感图像简单化处理为地块级区域，减少人工的难度和成本，并且，针对地块级的图像，以预设尺寸切割地块的图像，得到与地块对应有效的子块图像样本，根据预训练的分类模型对子块图像进行类别预测得到分类结果，以确定地块覆盖的对象类别，提高田地块识别的准确率，从而提升地块分类的精度，提高地块识别的应用价值。

以上所述，仅为本申请的实施例而已，并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等，均包含在本申请的保护范围之内。

Claims

1.一种地域图像的识别处理方法，其特征在于，所述方法包括：

通过预设尺寸切割所述地块的图像，得到对应的子块图像；

2.根据权利要求1所述的方法，其特征在于，所述基于从所述待识别地域图像提取的图像特征，对所述待识别地域图像进行语义分割处理和/或边缘检测处理，得到与至少一个地块对应的区域，包括：

3.根据权利要求1所述的方法，其特征在于，所述基于从所述待识别地域图像提取的图像特征，对所述待识别地域图像进行语义分割处理和/或边缘检测处理，得到与至少一个地块对应的区域，包括：

或者，

4.根据权利要求1至3任一项所述的方法，其特征在于，

所述语义分割处理和/或边缘检测处理是通过地块裁剪模型实现的；

在对所述待识别地域图像进行特征提取处理之前，所述方法还包括：

基于预标注信息，在地域图像样本中确定感兴趣区域；其中，所述预标注信息用于指示所述感兴趣区域的位置，所述感兴趣区域表征所述地块对应的区域；

5.根据权利要求1所述的方法，其特征在于，所述通过预设尺寸切割所述地块的图像，得到对应的子块图像，包括：

针对每个地块执行以下处理：

在所述地块中，确定中心点；

6.根据权利要求1所述的方法，其特征在于，所述基于所述子块图像的图像特征获取所述子块图像内对象的分类结果，包括：

7.根据权利要求6所述的方法，其特征在于，所述将超出概率阈值的概率对应的对象类别，作为所述子块图像内对象的分类结果，包括：

8.根据权利要求1所述的方法，其特征在于，所述基于所述子块图像的图像特征获取所述子块图像内对象的分类结果，包括：

9.根据权利要求8所述的方法，其特征在于，

所述分类处理是通过分类模型实现的，在对所述子块图像进行特征提取处理之前，所述方法还包括：

通过以下方式训练所述分类模型：

初始化所述分类模型的模型参数；

通过所述分类模型对训练样本集合中的子块图像样本进行类别预测，得到所述子块图像样本的预测对象类别；

确定所述子块图像样本的预标注对象类别与所述预测对象类别的误差，基于所述误差在所述分类模型中进行反向传播，以更新所述分类模型的模型参数。

10.根据权利要求9所述的方法，其特征在于，在训练所述分类模型之前，所述方法还包括：

基于多个预标注坐标点，在地域图像样本中确定每个预标注坐标点所在的地块；

通过预设尺寸从所述地域图像样本中切割出每个预标注坐标点所在的地块的图像，得到对应的子块图像样本；

基于所述子块图像样本以及对应的标注对象类别，构建所述训练样本集合。

11.一种地域图像的识别处理装置，其特征在于，包括：

地块区域获取模块，用于对待识别地域图像进行特征提取处理，基于从所述待识别地域图像提取的图像特征，对所述待识别地域图像进行语义分割处理和/或边缘检测处理，得到与至少一个地块对应的区域；

地块类型确定地块类型确定模块，用于基于所述子块图像的图像特征获取所述子块图像内对象的分类结果，并基于所述子块图像内对象的分类结果，确定所述地块覆盖的对象类型。

12.一种电子设备，其特征在于，包括：

存储器，用于存储可执行指令；

处理器，用于执行所述存储器中存储的可执行指令时，实现权利要求1至10任一项所述的地域图像的识别处理方法。

13.一种计算机可读存储介质，其特征在于，存储有可执行指令，用于被处理器执行时，实现权利要求1至10任一项所述的地域图像的识别处理方法。

14.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至10任一项所述的地域图像的识别处理方法。