CN114743121A

CN114743121A - 图像处理方法、图像处理模型的训练方法及装置

Info

Publication number: CN114743121A
Application number: CN202210249256.0A
Authority: CN
Inventors: 张佳颖; 邱一晋; 张晓娟
Original assignee: Industrial and Commercial Bank of China Ltd ICBC
Current assignee: Industrial and Commercial Bank of China Ltd ICBC
Priority date: 2022-03-14
Filing date: 2022-03-14
Publication date: 2022-07-12

Abstract

本公开提供了一种图像处理方法、图像处理模型的训练方法及装置、电子设备和计算机可读存储介质，可以应用于图像处理技术领域和金融领域。该图像处理方法包括：获取目标图像，其中，目标图像包括至少一个目标对象；对目标图像进行识别，得到图像识别结果，其中，图像识别结果包括目标对象的位置信息和类别信息；以及根据位置信息和类别信息，对图像识别结果进行处理，得到图像处理结果。

Description

图像处理方法、图像处理模型的训练方法及装置

技术领域

本公开涉及图像处理技术领域和金融领域，更具体地，涉及一种图像处理方法、图像处理模型的训练方法及装置、电子设备、计算机可读存储介质和一种计算机程序产品。

背景技术

随着图像处理技术的发展，针对遥感图像的处理已广泛应用于贷款人资产调查、风险管理分析、城市规划分析、港口运营评估、农作物期货交易等场景中。

在实现本公开构思的过程中，发明人发现相关技术中至少存在如下问题：在对遥感图像进行图像分割处理以得到目标检测物时，现存的遥感图像分割方法无法避免图像处理过程中冗余背景信息的干扰。

发明内容

有鉴于此，本公开提供了一种图像处理方法、图像处理模型的训练方法及装置、电子设备、计算机可读存储介质和计算机程序产品。

根据本公开的另一个方面，提供了一种图像处理方法，包括：

获取目标图像，其中，上述目标图像包括至少一个目标对象；

对上述目标图像进行识别，得到图像识别结果，其中，上述图像识别结果包括上述目标对象的位置信息和类别信息；以及

根据上述位置信息和上述类别信息，对上述图像识别结果进行处理，得到图像处理结果。

根据本公开的实施例，上述对上述目标图像进行识别，得到图像识别结果包括：

对上述目标图像进行处理，得到多个目标图像块；

对上述多个目标图像块中的每个目标图像块分别进行处理，得到与上述每个目标图像块对应的至少一个预测窗口；

利用非极大值抑制算法，对与上述每个目标图像块对应的上述至少一个预测窗口进行处理，得到至少一个目标窗口；以及

根据上述至少一个目标窗口，对上述目标图像进行处理，得到上述图像识别结果。

根据本公开的实施例，上述根据上述位置信息和上述类别信息，对上述图像识别结果进行处理，得到图像处理结果包括：

根据上述位置信息和上述类别信息，对上述图像识别结果进行处理，得到关联信息和目标位置信息；以及

根据上述关联信息和上述目标位置信息，对上述图像识别结果进行分割，得到上述图像处理结果。

根据本公开的实施例，上述图像识别结果是利用图像处理模型包括的目标对象识别模块处理上述目标图像得到的，上述图像处理结果是利用图像处理模型包括的目标对象分割模块处理上述图像识别结果得到的。

根据本公开的实施例，上述目标对象识别模块包括YOLO V3神经网络，上述目标对象分割模块包括融合注意力机制的U-Net神经网络。

根据本公开的实施例，上述图像处理方法还包括，在上述获取目标图像之前：

获取原始图像，其中，上述原始图像包括上述目标对象的原始位置信息和上述类别信息；

对上述原始图像进行裁剪处理，得到与上述原始图像对应的多个裁剪图像；以及

对上述多个裁剪图像中的每个裁剪图像分别进行预处理，得到与上述每个裁剪图像对应的上述目标图像。

根据本公开的实施例，上述对上述多个裁剪图像中的每个裁剪图像分别进行预处理，得到与上述每个裁剪图像对应的上述目标图像包括：

对上述多个裁剪图像中的每个裁剪图像分别进行图像锐化处理，得到多个锐化图像；

对上述多个锐化图像中的每个锐化图像分别进行图像去噪处理，得到多个去噪图像；以及

对上述多个去噪图像中的每个去噪图像分别进行图像增强处理，得到上述目标图像。

根据本公开的一个方面，提供了一种图像处理模型的训练方法，包括：

获取多个样本图像，其中，上述多个样本图像中的每个样本图像均包括至少一个目标对象；

根据上述多个样本图像生成训练样本数据集，其中，上述训练样本数据集包括上述目标对象的位置信息和上述类别信息；以及

利用上述训练样本数据集训练上述图像处理模型，得到经训练的图像处理模型。

根据本公开的实施例，上述图像处理模型包括目标对象识别模块和目标对象分割模块；

上述方法还包括：

根据上述多个样本图像生成初始训练样本数据集；

利用上述初始训练样本数据集训练上述目标对象识别模块，得到经训练的目标对象识别模块；

上述利用上述训练样本数据集训练上述图像处理模型，得到经训练的图像处理模型包括：

在保持上述经训练的目标对象识别模块的模型参数不变的情况下，利用上述训练样本数据集训练上述目标对象分割模块，得到经训练的图像处理模型。

根据本公开的实施例，上述利用上述训练样本数据集训练上述图像处理模型，得到经训练的图像处理模型包括：

将上述训练样本数据集划分为训练集、验证集和测试集；

利用上述训练集和上述验证集训练上述图像处理模型，得到待测试的图像处理模型；以及

利用上述测试集对上述待测试的图像处理模型进行训练，得到上述经训练的图像处理模型以及对应的测试结果，其中，上述测试结果用于表征上述待测试的图像处理模型的预测准确度。

根据本公开的另一个方面，提供了一种图像处理装置，包括：

第一获取模块，用于获取目标图像，其中，上述目标图像包括至少一个目标对象；

识别模块，用于对上述目标对象进行识别，得到图像识别结果，其中，上述图像识别结果包括上述目标对象的位置信息和类别信息；以及

处理模块，用于根据上述位置信息和上述类别信息，对上述图像识别结果进行处理，得到图像处理结果。

根据本公开的另一个方面，提供了一种图像处理模型的训练装置，包括：

第二获取模块，用于获取多个样本图像，其中，上述多个样本图像中的每个样本图像均包括至少一个目标对象；

生成模块，用于根据上述多个样本图像生成训练样本数据集，其中，上述训练样本数据集包括上述目标对象的位置信息和上述类别信息；以及

训练模块，用于利用上述训练样本数据集训练上述图像处理模型，得到经训练的图像处理模型。

根据本公开的另一个方面，提供了一种电子设备，包括：

一个或多个处理器；

存储器，用于存储一个或多个指令，

其中，当上述一个或多个指令被上述一个或多个处理器执行时，使得上述一个或多个处理器实现如上所述的方法。

根据本公开的另一个方面，提供了一种计算机可读存储介质，其上存储有可执行指令，上述可执行指令被处理器执行时使处理器实现如上所述的方法。

根据本公开的另一个方面，提供了一种计算机程序产品，上述计算机程序产品包括计算机可执行指令，上述计算机可执行指令在被执行时用于实现如上所述的方法。

根据本公开的实施例，首先通过对目标图像中的目标对象进行初步识别，得到图像识别结果，然后再根据得到的目标对象的位置信息和类别信息，对该图像识别结果进行进一步处理，得到图像处理结果。通过上述技术手段，至少部分地克服了相关技术中无法避免图像处理过程中冗余背景信息的干扰的技术问题，通过将识别与处理结合，实现了减少图像处理中背景冗余信息的干扰，提高了图像处理的准确性的技术效果。

附图说明

通过以下参照附图对本公开实施例的描述，本公开的上述以及其他目的、特征和优点将更为清楚，在附图中：

图1示意性示出了根据本公开实施例的可以应用图像处理方法、图像处理模型的训练方法的系统架构图；

图2示意性示出了根据本公开实施例的图像处理方法的流程图；

图3示意性示出了根据本公开实施例的融合注意力机制的U-Net神经网络的示意图；

图4示意性示出了根据本公开实施例的得到目标图像的方法流程图；

图5示意性示出了根据本公开实施例的图像预处理的方法流程图；

图6示意性示出了根据本公开实施例的图像处理模型的训练方法的流程图；

图7示意性示出了根据本公开实施例的图像处理装置的结构框图；

图8示意性示出了根据本公开实施例的图像处理模型的训练装置的结构框图；以及

图9示意性示出了根据本公开实施例的适于实现图像处理方法、图像处理模型的训练方法的电子设备的框图。

具体实施方式

以下，将参照附图来描述本公开的实施例。但是应该理解，这些描述只是示例性的，而并非要限制本公开的范围。在下面的详细描述中，为便于解释，阐述了许多具体的细节以提供对本公开实施例的全面理解。然而，明显地，一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外，在以下说明中，省略了对公知结构和技术的描述，以避免不必要地混淆本公开的概念。

在此使用的术语仅仅是为了描述具体实施例，而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在，但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。

在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义，除非另外定义。应注意，这里使用的术语应解释为具有与本说明书的上下文相一致的含义，而不应以理想化或过于刻板的方式来解释。

在使用类似于“A、B和C等中至少一个”这样的表述的情况下，一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如，“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下，一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如，“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。

在本公开的技术方案中，所涉及的用户个人信息的获取，存储和应用等，均符合相关法律法规的规定，采取了必要保密措施，且不违背公序良俗。

在本公开的技术方案中，在获取或采集用户个人信息之前，均获取了用户的授权或同意。

在进行工程类贷款中的施工进程监管时，传统业务模式需要由有关负责人实时跟进项目进展，导致监管效率较低，遥感技术应运而生。

随着图像处理技术的发展，在将遥感图像应用于贷款人资产调查、风险管理分析、城市规划分析、港口运营评估、农作物期货交易等场景中时，需要先对遥感图像进行图像分割处理，得到例如建筑物等目标以供后续目标检测分析使用。

在实现本公开构思的过程中，发明人发现相关技术中至少存在如下问题：由于遥感图像的背景复杂，地物结构多样，现存的遥感图像分割方法无法避免图像处理过程中冗余背景信息的干扰。

为了至少部分地解决相关技术中存在的技术问题，本公开提供了一种图像处理方法、图像处理模型的训练方法及装置、电子设备和计算机可读存储介质，可以应用于图像处理技术领域和金融领域。该图像处理方法包括：获取目标图像，其中，目标图像包括至少一个目标对象；对目标图像进行识别，得到图像识别结果，其中，图像识别结果包括目标对象的位置信和类别信息；以及根据位置信息和类别信息，对图像识别结果进行处理，得到图像处理结果。

需要说明的是，本公开实施例提供的图像处理方法、图像处理模型的训练方法和装置可用于图像处理技术领域和金融领域，例如可以应用于银行进行贷款人的资产调查。本公开实施例提供的图像处理方法、图像处理模型的训练方法和装置也可用于除图像处理技术领域和金融领域之外的任意领域，例如可以应用于分析城市规划。本公开实施例提供的图像处理方法、图像处理模型的训练方法和装置的应用领域不做限定。

图1示意性示出了根据本公开实施例的可以应用图像处理方法、图像处理模型的训练方法的系统架构。需要注意的是，图1所示仅为可以应用本公开实施例的系统架构的示例，以帮助本领域技术人员理解本公开的技术内容，但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。

如图1所示，根据该实施例的系统架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线和/或无线通信链路等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用，例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端和/或社交平台软件等(仅为示例)。

终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器，例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理，并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。

需要说明的是，本公开实施例所提供的图像处理方法、图像处理模型的训练方法一般可以由服务器105执行。相应地，本公开实施例所提供的图像处理装置、图像处理模型的训练装置一般可以设置于服务器105中。本公开实施例所提供的图像处理方法、图像处理模型的训练方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地，本公开实施例所提供的图像处理装置、图像处理模型的训练装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。或者，本公开实施例所提供的图像处理方法、图像处理模型的训练方法也可以由终端设备101、102、或103执行，或者也可以由不同于终端设备101、102、或103的其他终端设备执行。相应地，本公开实施例所提供的图像处理装置、图像处理模型的训练装置也可以设置于终端设备101、102、或103中，或设置于不同于终端设备101、102、或103的其他终端设备中。

例如，原始图像可以原本存储在终端设备101、102、或103中的任意一个(例如，终端设备101，但不限于此)之中，或者存储在外部存储设备上并可以导入到终端设备101中。然后，终端设备101可以在本地执行本公开实施例所提供的图像处理方法、图像处理模型的训练方法，或者将原始图像发送到其他终端设备、服务器、或服务器集群，并由接收该原始图像的其他终端设备、服务器、或服务器集群来执行本公开实施例所提供的图像处理方法、图像处理模型的训练方法。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

图2示意性示出了根据本公开实施例的图像处理方法的流程图。

如图2所示，该图像处理方法包括操作S201～S203。

在操作S201，获取目标图像，其中，目标图像包括至少一个目标对象。

根据本公开的实施例，目标图像可以包括遥感影像，遥感影像可以包括记录各种地物电磁波大小的胶片或照片，例如航空像片和卫星相片等。可以通过遥感影像读取模块对来自专业卫星公司使用卫星定期拍摄并上传的图像进行读取。

在操作S202，对目标图像进行识别，得到图像识别结果，其中，图像识别结果包括目标对象的位置信息和类别信息。

根据本公开的实施例，例如可以采用卷积神经网络(Convolutional NeuralNetworks，CNN)对目标图像进行识别。需要说明的是，该卷积神经网络仅是示例性实施例，但不限于此，还可以包括本领域已知的其他图像识别方法，只要能够对目标图像进行识别得到图像识别结果即可。

根据本公开的实施例，图像识别结果可以包括光谱特征、空间特征和纹理特征等。

根据本公开的实施例，类别信息可以包括建筑物、交通工具、绿化物等，目标对象可以包括单个建筑物、汽车、草地等。

在操作S203，根据位置信息和类别信息，对图像识别结果进行处理，得到图像处理结果。

根据本公开的实施例，例如可以采用全卷积神经网络(Fully ConvolutionalNetworks，FCN)对图像识别结果进行处理。需要说明的是，该全卷积神经网络仅是示例性实施例，但不限于此，还可以包括本领域已知的其他图像处理方法，只要能够对目标图像进行处理得到图像处理结果即可。

下面参考图3～图5，结合具体实施例对图2所示的方法做进一步说明。

图3示意性示出了根据本公开实施例的融合注意力机制的U-Net神经网络的示意图。

根据本公开的实施例，图像识别结果是利用图像处理模型包括的目标对象识别模块处理目标图像得到的，图像处理结果是利用图像处理模型包括的目标对象分割模块处理图像识别结果得到的。

根据本公开的实施例，目标对象识别模块包括YOLO V3神经网络，目标对象分割模块包括融合注意力机制的U-Net神经网络。

根据本公开的实施例，YOLO(You Only Look Once)V3神经网络可以对目标图像进行初步识别，从而得到包含建筑群的图像识别结果。

如图3所示，U-Net神经网络包括编码的收缩路径301和解码的扩张路径302。收缩路径301可以通过下采样提取输入的图像识别结果3010的上下文关联信息，扩张路径302可以通过上采样得到包括精准定位信息的图像处理结果3020。

收缩路径301中包括四组交替的卷积操作和池化操作。卷积操作包括第一卷积层3011、第二卷积层3013、第三卷积层3015和第四卷积层3017。每个卷积层包括两个3×3的卷积核(无填充卷积，Unpadded Convolution)，使用线性整流函数(Linear RectificationFunction，ReLU)作为激活函数。池化操作包括第一池化层3012、第二池化层3014、第三池化层3016、第四池化层3018。每个池化层包括步长为2的2×2的最大池化层，可以使特征通道数量加倍。

扩张路径302中四组交替的上采样操作和卷积操作。上采样操作包括第一上采样层3021、第二上采样层3023、第三上采样层3025华人第四上采样层3027。每个上采样层包括两个3×3的卷积核。卷积操作包括第五卷积层3022、第六卷积层3024、第七卷积层3026和第八卷积层3028。每个卷积层包括2个2×2的卷积核，使用ReLU激活函数，以便减少特征通道数量，级联收缩路径301得到的特征图。

在输出层，还使用了第九卷积层3029。第九卷积层3029使用1×1的卷积核进行卷积运算，将每个64维的特征向量映射到网络的输出层。

根据本公开的实施例，为了提高U-Net网络的分割性能，在跳跃连接上还融合了注意力机制，包括第一注意力层3031、第二注意力层3032和第三注意力层3033，可以增强原U-Net网络在收缩路径学习到的图像特征，从而更好地与扩张路径的特征图级联。

根据本公开的实施例，可以首先在空间维度进行自适应平均池化(AdaptiveAverage Pooling)，然后通过两个全连接卷积层(Fully Convolution)学习到通道注意力，并用sigmoid函数进行归一化得到通道注意力图(Channel Attention Map)，接着将通道注意力图与原特征相乘，得到加权后的特征，最后将加权后的特征与扩张路径得到的特征图级联，用于后续网络的特征学习，以便完成图像分割处理。

根据本公开的实施例，通过利用YOLO V3神经网络进行初步识别，可以得到包含建筑群的图像识别结果，然后利用融合注意力机制的U-Net神经网络进行进一步分割，可以对建筑群中的单个建筑物进行进一步分割，得到图像处理结果。通过将两个神经网络相结合，可以对目标对象进行精确定位，提高了在遥感图像中分割目标对象的准确率。

根据本公开的实施例，对目标图像进行识别，得到图像识别结果包括：

对目标图像进行处理，得到多个目标图像块。对多个目标图像块中的每个目标图像块分别进行处理，得到与每个目标图像块对应的至少一个预测窗口。利用非极大值抑制算法，对与每个目标图像块对应的至少一个预测窗口进行处理，得到至少一个目标窗口。以及根据至少一个目标窗口，对目标图像进行处理，得到图像识别结果。

根据本公开的实施例，通过对目标图像进行识别，可以在识别图像中目标对象的类别信息的基础上，定位目标对象的位置信息，并可以根据该位置信息和类别信息，将目标对象框选出来得到图像识别结果。

根据本公开的实施例，可以将目标图像划分成S×S个目标图像块，每个目标图像块可以检测中心点落在该图像块内的目标对象；然后可以在每个目标图像块上预测B个预测窗口，并确定每个预测窗口的置信度以及每个预测窗口在多个类别上的概率；根据以上预测出的总计S×S×B个预测窗口，可以根据阈值去除可能性比较低的窗口，也可以利用非极大值抑制(Non-Maximum Suppression，NMS)去除冗余窗口，确定目标窗口；目标图像上包含目标对象的目标区域可以被目标窗口框选出来，进而可以根据目标窗口裁剪出包括目标对象的图像以便于后续进一步处理。

根据本公开的实施例，可以筛选出每个类别中得分大于一定阈值的预测窗口并按照得分进行排序，然后可以利用预测窗口的位置和得分进行非极大抑制，从而得出概率最大的目标窗口。

根据本公开的实施例，通过处理目标图像，然后处理得到的目标图像块，再利用非极大值抑制算法对得到的预测窗口进行处理，得到目标窗口，以便通过进一步处理得到图像识别结果。通过从目标图像块中识别并框选出预测窗口，可以进一步缩小需要处理的区域，再通过非极大值抑制算法，可以去除冗余窗口，提高了图像识别结果的精度。

根据本公开的实施例，根据位置信息和类别信息，对图像识别结果进行处理，得到图像处理结果包括：

根据位置信息和类别信息，对图像识别结果进行处理，得到关联信息和目标位置信息。根据关联信息和目标位置信息，对图像识别结果进行分割，得到图像处理结果。

根据本公开的实施例，通过对目标图像进行识别可以初步框选出建筑群的大致范围，进而可以将经初步筛选得到的图像识别结果输入融合注意力机制的U-Net神经网络以便进一步分割出目标建筑的轮廓。

根据本公开的实施例，当目标对象为建筑物时，可以根据图像处理结果确定目标对象的数量，从而可以进一步观察房地产项目的施工进程，评估企业的运营状况等。

根据本公开的实施例，通过对图像识别结果进行处理，可以得到表征目标对象位置的目标位置信息，以及表征单个目标对象与目标对象群之间的关联信息，以便于对图像识别结果进行进一步的精细分割。

图4示意性示出了根据本公开实施例的得到目标图像的方法流程图。

如图4所示，该得到目标图像的方法包括操作S401～S403。

在操作S401，获取原始图像，其中，原始图像包括目标对象的原始位置信息和类别信息。

在操作S402，对原始图像进行裁剪处理，得到与原始图像对应的多个裁剪图像。

根据本公开的实施例，裁剪处理可以按照从左往右，从上至下的顺序进行，裁剪步长step可以按照式(1)的标准。

其中，C_n表示在原始图像中移动256像素之后的待裁剪图像的右下角坐标，S_max表示原始图像的右下角坐标，C_n-1表示上一张从原始图像中裁剪出的图像的右下角坐标。

根据本公开的实施例，可以通过裁剪处理将原始图像裁剪成尺寸为1024×1024的若干张像素相同的裁剪图像。

在操作S403，对多个裁剪图像中的每个裁剪图像分别进行预处理，得到与每个裁剪图像对应的目标图像。

根据本公开的实施例，通过对原始图像进行裁剪处理，可以将遥感图像随机裁剪得到多个像素相同的裁剪图像，从而能够减少图像处理模型的结构复杂性以及降低对处理器的需求。

图5示意性示出了根据本公开实施例的图像预处理的方法流程图。

如图5所示，该图像预处理的方法包括操作S501～S503。

在操作S501，对多个裁剪图像中的每个裁剪图像分别进行图像锐化处理，得到多个锐化图像。

根据本公开的实施例，可以利用拉普拉斯算子对裁剪图像进行图像锐化处理，产生描述灰度突变的拉普拉斯图像，从而使灰度反差增强，然后再将拉普拉斯图像与裁剪图像叠加而产生锐化图像，从而提高模糊图像的清晰度。

在操作S502，对多个锐化图像中的每个锐化图像分别进行图像去噪处理，得到多个去噪图像。

根据本公开的实施例，可以通过NL-Means(Non-Local Means，非局部平均)算法、BM3D(Block-matching and 3D Filtering，三维块匹配滤波)算法、高斯滤波器等对锐化图像进行图像去噪处理。

在操作S503，对多个去噪图像中的每个去噪图像分别进行图像增强处理，得到目标图像。

根据本公开的实施例，可以通过直方图均衡化(Histogram Equalization，HE)、自适应直方图均衡化(Adaptive Hisogram Equalization，AHE)、限制对比度自适应直方图均衡化(Contrast Limited Adaptive Hitogram Equalization，CLAHE)、自适应局部区域伸展(Local Region Stretch，LRS)直方图均衡化等进行图像增强处理，以便将去噪图像的直方图分布变成近似均匀分布，得到目标图像。

根据本公开的实施例，通过对裁剪图像进行图像锐化处理，可以突出像素值快速变化的区域以便完成边缘检测；通过进行图像去噪处理，可以滤除随机分布和正态分布的噪声；通过进行图像增强处理，可以增强图像的对比度。通过上述图像预处理方法，可以提高目标图像的质量，以便于提高图像处理结果的精度。

图6意性示出了根据本公开实施例的图像处理模型的训练方法的流程图。

如图6所示，该图像处理模型的训练方法包括操作S601～S603。

在操作S601，获取多个样本图像，其中，多个样本图像中的每个样本图像均包括至少一个目标对象。

根据本公开的实施例，样本图像可以包括遥感影像。

在操作S602，根据多个样本图像生成训练样本数据集，其中，训练样本数据集包括目标对象的位置信息和类别信息。

在操作S603，利用训练样本数据集训练图像处理模型，得到经训练的图像处理模型。

根据本公开的实施例，可以通过对样本图像中的目标对象进行标注确定位置信息和类别信息，并利用训练样本数据集训练得到图像处理模型。

根据本公开的实施例，当利用图像处理模型对样本图像进行处理时，能够准确地得到图像处理结果，从而实现了提高图像处理的准确率，以及降低人工处理成本的技术效果。

根据本公开的实施例，图像处理模型包括目标对象识别模块和目标对象分割模块，图像处理方法还包括：

根据多个样本图像生成初始训练样本数据集。利用初始训练样本数据集训练目标对象识别模块，得到经训练的目标对象识别模块。

利用训练样本数据集训练图像处理模型，得到经训练的图像处理模型包括：

在保持经训练的目标对象识别模块的模型参数不变的情况下，利用训练样本数据集训练目标对象分割模块，得到经训练的图像处理模型。

根据本公开的实施例，利用训练样本数据集训练图像处理模型，得到经训练的图像处理模型包括：

将训练样本数据集划分为训练集、验证集和测试集。利用训练集和验证集训练图像处理模型，得到待测试的图像处理模型。利用测试集对待测试的图像处理模型进行训练，得到经训练的图像处理模型以及对应的测试结果，测试结果用于表征待测试的图像处理模型的预测准确度。

根据本公开的实施例，训练集可以用于估计模型，验证集可以用于确定模型的网络结构或者控制模型复杂程度的参数，测试集可以用于检验模型的性能。

根据本公开的实施例，可以采用交叉验证法，通过对训练集、验证集进行不同的划分来对模型进行多组不同的训练和验证，以便解决测试结果过于片面以及训练数据不足的问题。

根据本公开的实施例，通过利用初始训练样本数据集训练得到目标对象识别模块，并利用训练样本数据集训练得到目标对象分割模块，在利用图像处理模型对样本图像进行处理时，可以识别提取到更充分的特征，提高图像识别的准确率。

图7示意性示出了根据本公开实施例的图像处理装置的结构框图。

如图7所示，图像处理装置700包括第一获取模块701、识别模块702和处理模块703。

第一获取模块701，用于获取目标图像，其中，目标图像包括至少一个目标对象。

识别模块702，用于对目标对象进行识别，得到图像识别结果，其中，图像识别结果包括目标对象的位置信息和类别信息。

处理模块703，用于根据位置信息和类别信息，对图像识别结果进行处理，得到图像处理结果。

根据本公开的实施例，识别模块702包括第一处理单元、第二处理单元、第三处理单元和第四处理单元。

第一处理单元，用于对目标图像进行处理，得到多个目标图像块。

第二处理单元，用于对多个目标图像块中的每个目标图像块分别进行处理，得到与每个目标图像块对应的至少一个预测窗口。

第三处理单元，用于利用非极大值抑制算法，对与每个目标图像块对应的至少一个预测窗口进行处理，得到至少一个目标窗口。

第四处理单元，用于根据至少一个目标窗口，对目标图像进行处理，得到图像识别结果。

根据本公开的实施例，处理模块703包括第五处理单元和分割单元。

第五处理单元，用于根据位置信息和类别信息，对图像识别结果进行处理，得到关联信息和目标位置信息。

分割单元，用于根据关联信息和目标位置信息，对图像识别结果进行分割，得到图像处理结果。

根据本公开的实施例，图像处理装置700还包括第三获取模块、裁剪模块和预处理模块。

第三获取模块，用于获取原始图像，其中，原始图像包括目标对象的原始位置信息和类别信息。

裁剪模块，用于对原始图像进行裁剪处理，得到与原始图像对应的多个裁剪图像。

预处理模块，用于对多个裁剪图像中的每个裁剪图像分别进行预处理，得到与每个裁剪图像对应的目标图像。

根据本公开的实施例，预处理模块包括第六处理单元、第七处理单元和第八处理单元。

第六处理单元，用于对多个裁剪图像中的每个裁剪图像分别进行图像锐化处理，得到多个锐化图像。

第七处理单元，用于对多个锐化图像中的每个锐化图像分别进行图像去噪处理，得到多个去噪图像。

第八处理单元，用于对多个去噪图像中的每个去噪图像分别进行图像增强处理，得到目标图像。

图8示意性示出了根据本公开实施例的图像处理模型的训练装置的结构框图。

如图8所示，图像处理模型的训练装置800包括第二获取模块801、生成模块802和训练模块803。

第二获取模块801，用于获取多个样本图像，其中，多个样本图像中的每个样本图像均包括至少一个目标对象。

生成模块802，用于根据多个样本图像生成训练样本数据集，其中，训练样本数据集包括目标对象的位置信息和类别信息。

训练模块803，用于利用训练样本数据集训练图像处理模型，得到经训练的图像处理模型。

根据本公开的实施例，图像处理模型包括目标对象识别模块和目标对象分割模块。

根据本公开的实施例，生成模块802包括生成单元。

生成单元，用于根据多个样本图像生成初始训练样本数据集。

根据本公开的实施例，训练模块803包括第一训练单元和第二训练单元。

第一训练单元，用于利用初始训练样本数据集训练目标对象识别模块，得到经训练的目标对象识别模块。

第二训练单元，用于在保持经训练的目标对象识别模块的模型参数不变的情况下，利用训练样本数据集训练目标对象分割模块，得到经训练的图像处理模型。

根据本公开的实施例，训练模块803还包括划分单元、第三训练单元和第四训练单元。

划分单元，用于将训练样本数据集划分为训练集、验证集和测试集。

第三训练单元，用于利用训练集和验证集训练图像处理模型，得到待测试的图像处理模型。

第四训练单元，用于利用测试集对待测试的图像处理模型进行训练，得到经训练的图像处理模型以及对应的测试结果，其中，测试结果用于表征待测试的图像处理模型的预测准确度。

根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路，例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC)，或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现，或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者，根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块，当该计算机程序模块被运行时，可以执行相应的功能。

例如，第一获取模块701、识别模块702、处理模块703、第二获取模块801、生成模块802和训练模块803中的任意多个可以合并在一个模块/单元/子单元中实现，或者其中的任意一个模块/单元/子单元可以被拆分成多个模块/单元/子单元。或者，这些模块/单元/子单元中的一个或多个模块/单元/子单元的至少部分功能可以与其他模块/单元/子单元的至少部分功能相结合，并在一个模块/单元/子单元中实现。根据本公开的实施例，第一获取模块701、识别模块702、处理模块703、第二获取模块801、生成模块802和训练模块803中的至少一个可以至少被部分地实现为硬件电路，例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC)，或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现，或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者，第一获取模块701、识别模块702、处理模块703、第二获取模块801、生成模块802和训练模块803中的至少一个可以至少被部分地实现为计算机程序模块，当该计算机程序模块被运行时，可以执行相应的功能。

需要说明的是，本公开的实施例中图像处理装置部分与本公开的实施例中图像处理方法部分是相对应的，图像处理装置部分的描述具体参考图像处理方法部分，在此不再赘述。本公开的实施例中图像处理模型的训练装置部分与本公开的实施例中图像处理模型的训练方法部分是相对应的，图像处理模型的训练装置部分的描述具体参考图像处理模型的训练方法部分，在此不再赘述。

图9示意性示出了根据本公开实施例的适于实现图像处理方法、图像处理模型的训练方法的电子设备的框图。图9示出的电子设备仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图9所示，根据本公开实施例的计算机电子设备900包括处理器901，其可以根据存储在只读存储器(ROM)902中的程序或者从存储部分909加载到随机访问存储器(RAM)903中的程序而执行各种适当的动作和处理。处理器901例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如，专用集成电路(ASIC))，等等。处理器901还可以包括用于缓存用途的板载存储器。处理器901可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。

在RAM 903中，存储有电子设备900操作所需的各种程序和数据。处理器901、ROM902以及RAM 903通过总线904彼此相连。处理器901通过执行ROM 902和/或RAM 903中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意，所述程序也可以存储在除ROM 902和RAM 903以外的一个或多个存储器中。处理器901也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。

根据本公开的实施例，电子设备900还可以包括输入/输出(I/O)接口905，输入/输出(I/O)接口905也连接至总线904。电子设备900还可以包括连接至I/O接口905的以下部件中的一项或多项：包括键盘、鼠标等的输入部分906；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分907；包括硬盘等的存储部分908；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接至I/O接口905。可拆卸介质911，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器910上，以便于从其上读出的计算机程序根据需要被安装入存储部分908。

根据本公开的实施例，根据本公开实施例的方法流程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读存储介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分909从网络上被下载和安装，和/或从可拆卸介质911被安装。在该计算机程序被处理器901执行时，执行本公开实施例的系统中限定的上述功能。根据本公开的实施例，上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。

本公开还提供了一种计算机可读存储介质，该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的；也可以是单独存在，而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序，当上述一个或者多个程序被执行时，实现根据本公开实施例的方法。

根据本公开的实施例，计算机可读存储介质可以是非易失性的计算机可读存储介质。例如可以包括但不限于：便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

例如，根据本公开的实施例，计算机可读存储介质可以包括上文描述的ROM 902和/或RAM 903和/或ROM 902和RAM 903以外的一个或多个存储器。

本公开的实施例还包括一种计算机程序产品，其包括计算机程序，该计算机程序包含用于执行本公开实施例所提供的方法的程序代码，当计算机程序产品在电子设备上运行时，该程序代码用于使电子设备实现本公开实施例所提供的图像处理方法、图像处理模型的训练方法。

在该计算机程序被处理器901执行时，执行本公开实施例的系统/装置中限定的上述功能。根据本公开的实施例，上文描述的系统、装置、模块、单元等可以通过计算机程序模块来实现。

在一种实施例中，该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中，该计算机程序也可以在网络介质上以信号的形式进行传输、分发，并通过通信部分909被下载和安装，和/或从可拆卸介质911被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输，包括但不限于：无线、有线等等，或者上述的任意合适的组合。

根据本公开的实施例，可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码，具体地，可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如Java，C++，python，“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。本领域技术人员可以理解，本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合，即使这样的组合或结合没有明确记载于本公开中。特别地，在不脱离本公开精神和教导的情况下，本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。

以上对本公开的实施例进行了描述。但是，这些实施例仅仅是为了说明的目的，而并非为了限制本公开的范围。尽管在以上分别描述了各实施例，但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围，本领域技术人员可以做出多种替代和修改，这些替代和修改都应落在本公开的范围之内。

Claims

1.一种图像处理方法，包括：

获取目标图像，其中，所述目标图像包括至少一个目标对象；

对所述目标图像进行识别，得到图像识别结果，其中，所述图像识别结果包括所述目标对象的位置信息和类别信息；以及

根据所述位置信息和所述类别信息，对所述图像识别结果进行处理，得到图像处理结果。

2.根据权利要求1所述的方法，其中，所述对所述目标图像进行识别，得到图像识别结果包括：

对所述目标图像进行处理，得到多个目标图像块；

对所述多个目标图像块中的每个目标图像块分别进行处理，得到与所述每个目标图像块对应的至少一个预测窗口；

利用非极大值抑制算法，对与所述每个目标图像块对应的所述至少一个预测窗口进行处理，得到至少一个目标窗口；以及

根据所述至少一个目标窗口，对所述目标图像进行处理，得到所述图像识别结果。

3.根据权利要求2所述的方法，其中，所述根据所述位置信息和所述类别信息，对所述图像识别结果进行处理，得到图像处理结果包括：

根据所述位置信息和所述类别信息，对所述图像识别结果进行处理，得到关联信息和目标位置信息；以及

根据所述关联信息和所述目标位置信息，对所述图像识别结果进行分割，得到所述图像处理结果。

4.根据权利要求1至3中任一项所述的方法，其中，所述图像识别结果是利用图像处理模型包括的目标对象识别模块处理所述目标图像得到的，所述图像处理结果是利用图像处理模型包括的目标对象分割模块处理所述图像识别结果得到的。

5.根据权利要求4所述的方法，其中，所述目标对象识别模块包括YOLO V3神经网络，所述目标对象分割模块包括融合注意力机制的U-Net神经网络。

6.根据权利要求1所述的方法，还包括，在所述获取目标图像之前：

获取原始图像，其中，所述原始图像包括所述目标对象的原始位置信息和所述类别信息；

对所述原始图像进行裁剪处理，得到与所述原始图像对应的多个裁剪图像；以及

对所述多个裁剪图像中的每个裁剪图像分别进行预处理，得到与所述每个裁剪图像对应的所述目标图像。

7.根据权利要求6所述的方法，其中，所述对所述多个裁剪图像中的每个裁剪图像分别进行预处理，得到与所述每个裁剪图像对应的所述目标图像包括：

对所述多个裁剪图像中的每个裁剪图像分别进行图像锐化处理，得到多个锐化图像；

对所述多个锐化图像中的每个锐化图像分别进行图像去噪处理，得到多个去噪图像；以及

对所述多个去噪图像中的每个去噪图像分别进行图像增强处理，得到所述目标图像。

8.一种图像处理模型的训练方法，包括：

获取多个样本图像，其中，所述多个样本图像中的每个样本图像均包括至少一个目标对象；

根据所述多个样本图像生成训练样本数据集，其中，所述训练样本数据集包括所述目标对象的位置信息和所述类别信息；以及

利用所述训练样本数据集训练所述图像处理模型，得到经训练的图像处理模型。

9.根据权利要求8所述的方法，其中，所述图像处理模型包括目标对象识别模块和目标对象分割模块；

所述方法还包括：

根据所述多个样本图像生成初始训练样本数据集；

利用所述初始训练样本数据集训练所述目标对象识别模块，得到经训练的目标对象识别模块；

所述利用所述训练样本数据集训练所述图像处理模型，得到经训练的图像处理模型包括：

在保持所述经训练的目标对象识别模块的模型参数不变的情况下，利用所述训练样本数据集训练所述目标对象分割模块，得到经训练的图像处理模型。

10.根据权利要求8或9所述的方法，其中，所述利用所述训练样本数据集训练所述图像处理模型，得到经训练的图像处理模型包括：

将所述训练样本数据集划分为训练集、验证集和测试集；

利用所述训练集和所述验证集训练所述图像处理模型，得到待测试的图像处理模型；以及

利用所述测试集对所述待测试的图像处理模型进行训练，得到所述经训练的图像处理模型以及对应的测试结果，其中，所述测试结果用于表征所述待测试的图像处理模型的预测准确度。

11.一种图像处理装置，包括：

第一获取模块，用于获取目标图像，其中，所述目标图像包括至少一个目标对象；

识别模块，用于对所述目标对象进行识别，得到图像识别结果，其中，所述图像识别结果包括所述目标对象的位置信息和类别信息；以及

处理模块，用于根据所述位置信息和所述类别信息，对所述图像识别结果进行处理，得到图像处理结果。

12.一种图像处理模型的训练装置，包括：

第二获取模块，用于获取多个样本图像，其中，所述多个样本图像中的每个样本图像均包括至少一个目标对象以及所述至少一个目标对象的原始位置信息和类别信息；

生成模块，用于根据所述多个目标图像生成训练样本数据集，其中，所述训练样本数据集包括所述目标对象的位置信息和所述类别信息；以及

训练模块，用于利用所述训练样本数据集训练所述图像处理模型，得到经训练的图像处理模型。

13.一种电子设备，包括：

一个或多个处理器；

存储器，用于存储一个或多个指令，

其中，当所述一个或多个指令被所述一个或多个处理器执行时，使得所述一个或多个处理器实现权利要求1至10中任一项所述的方法。

14.一种计算机可读存储介质，其上存储有可执行指令，所述可执行指令被处理器执行时使处理器实现权利要求1至10中任一项所述的方法。

15.一种计算机程序产品，所述计算机程序产品包括计算机可执行指令，所述计算机可执行指令在被执行时用于实现权利要求1至10中任一项所述的方法。