CN111931799A

CN111931799A - 图像识别方法及装置

Info

Publication number: CN111931799A
Application number: CN201910395441.9A
Authority: CN
Inventors: 周厚谦; 钟辉强; 刘亮; 尹存祥; 方军; 骆金昌
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2019-05-13
Filing date: 2019-05-13
Publication date: 2020-11-13
Anticipated expiration: 2039-05-13
Also published as: CN111931799B

Abstract

本发明提出一种图像识别方法及装置，其中方法包括：通过获取待识别的图像；将所述待识别的图像输入多个预设的深度残差网络，得到多个识别结果；识别结果为图像中存在目标对象的概率；深度残差网络对应的训练数据中，正样本与负样本的数量一致；根据所述多个识别结果，确定所述待识别的图像中是否存在所述目标对象。由此，相比采用单个模型进行识别，通过多个预设的深度残差网络分别对待识别的图像进行识别，弥补单个模型因欠采样可能出现的识别错误问题，识别准确度更高。此外，深度残差网络是更深层次的神经网络，相比于诸如CNN、深层的卷积神经网络AlexNet等深层网络和非深度学习的方法，能够学习到更多与图片标签相关的特征，分类性能提升明显。

Description

图像识别方法及装置

技术领域

本发明涉及数据处理技术领域，尤其涉及一种图像识别方法及装置。

背景技术

目前，图像识别算法主要包括：非深度学习的图像识别算法例如SVM(支持向量机，Support Vector Machine)等，以及深度学习的图像识别算法例如CNN(卷积神经网络，Convolutional Neural Networks)、深层的卷积神经网络AlexNet等。其中，非深度学习的算法需要人为构造滤波器或者特征等，费时费力，效果差。诸如CNN、深层的卷积神经网络AlexNet等深度学习的算法，深度较浅时难以很好的学习图像特征；深度较深时优化困难，准确度容易出现饱和，甚至下降。

因此，如何更好地进行图像识别成为亟待解决的技术问题。

发明内容

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本发明的第一个目的在于提出一种图像识别方法，用于解决现有技术中循环神经网络模型计算时间长，并行计算效率低下的问题。

本发明的第二个目的在于提出一种图像识别装置。

本发明的第三个目的在于提出另一种图像识别装置。

本发明的第四个目的在于提出一种非临时性计算机可读存储介质。

本发明的第五个目的在于提出一种计算机程序产品。

为达上述目的，本发明第一方面实施例提出了一种图像识别方法，包括：

获取待识别的图像；

将所述待识别的图像输入多个预设的深度残差网络，得到多个识别结果；所述识别结果为，所述待识别的图像中存在目标对象的概率；所述深度残差网络对应的训练数据中，正样本的数量和负样本的数量一致；所述正样本为存在所述目标对象的样本图像；所述负样本为未存在所述目标对象的样本图像；

根据所述多个识别结果，确定所述待识别的图像中是否存在所述目标对象。

进一步地，所述将所述待识别的图像输入多个预设的深度残差网络，得到多个识别结果之前，还包括：

获取初始的深度残差网络；所述初始的深度残差网络的全连接输出层神经元个数为1，且激活函数为sigmod函数；

获取样本数据；所述样本数据包括：正样本集合和负样本集合；

按照所述正样本集合中的正样本数量，对所述负样本集合进行欠采样，得到多个负样本子集合；所述负样本子集合中负样本数量与所述正样本数量一致；

根据所述正样本集合和所述多个负样本子集合，确定多个训练数据，采用所述多个训练数据分别对所述初始的深度残差网络进行训练，得到多个预设的深度残差网络。

进一步地，所述负样本子集合的数量，根据所述正样本集合中正样本数量以及所述负样本集合中负样本数量确定；

所述预设的深度残差网络的数量与所述负样本子集合的数量一致。

进一步地，所述按照所述正样本集合中的正样本数量，对所述负样本集合进行欠采样，得到多个负样本子集合之前，还包括：

对所述正样本集合中的正样本以及所述负样本集合中的负样本进行尺寸统一以及归一化处理，得到归一化处理后的正样本集合和负样本集合；

对所述正样本集合中的正样本以及所述负样本集合中的负样本进行图像增强处理，根据增强处理后的图像更新所述正样本集合和所述负样本集合；所述增强处理包括：旋转处理。

进一步地，所述获取初始的深度残差网络，包括：

获取经过ImageNet图像数据集预训练的深度残差网络；

将所述预训练的深度残差网络的全连接层的神经元个数缩减至1，激活函数采用sigmod函数，得到所述初始的深度残差网络。

进一步地，所述根据所述多个识别结果，确定所述待识别的图像中是否存在所述目标对象，包括：

获取所述多个识别结果中第一识别结果的数量和第二识别结果的数量；所述第一识别结果为对应的概率大于预设概率阈值的识别结果；所述第二识别结果为对应的概率小于等于预设概率阈值的识别结果；

若所述第一识别结果的数量大于或等于所述第二识别结果的数量，则确定所述待识别的图像中存在目标对象；

若所述第一识别结果的数量小于所述第二识别结果的数量，则确定所述待识别的图像中不存在目标图像。

进一步地，所述预设概率阈值的确定方式为，

获取样本数据；

将所述样本数据中负样本数量与总样本数量的比值，确定为所述预设概率阈值。

进一步地，所述待识别的图像为遥感卫星图像；

所述目标对象为以下对象中的任意一种：烟囱、烟雾、裸露工地。

本发明实施例的图像识别方法，通过获取待识别的图像；将所述待识别的图像输入多个预设的深度残差网络，得到多个识别结果；根据所述多个识别结果，确定所述待识别的图像中是否存在所述目标对象。由此，相比采用单个模型进行识别，通过多个预设的深度残差网络分别对待识别的图像进行识别，弥补单个模型因欠采样可能出现的识别错误问题，识别准确度更高。此外，深度残差网络是更深层次的神经网络，相比于诸如CNN、深层的卷积神经网络AlexNet等深层网络和非深度学习的方法，能够学习到更多与图片标签相关的特征，分类性能提升明显。

为达上述目的，本发明第二方面实施例提出了一种图像识别装置，包括：

获取模块，用于获取待识别的图像；

输入模块，用于将所述待识别的图像输入多个预设的深度残差网络，得到多个识别结果；所述识别结果为，所述待识别的图像中存在目标对象的概率；所述深度残差网络对应的训练数据中，正样本的数量和负样本的数量一致；所述正样本为存在所述目标对象的样本图像；所述负样本为未存在所述目标对象的样本图像；

确定模块，用于根据所述多个识别结果，确定所述待识别的图像中是否存在所述目标对象。

进一步地，所述装置还包括：欠采样模块和训练模块；

所述获取模块，还用于获取初始的深度残差网络；所述初始的深度残差网络的全连接输出层神经元个数为1，且激活函数为sigmod函数；

所述获取模块，还用于获取样本数据；所述样本数据包括：正样本集合和负样本集合；

所述欠采样模块，用于按照所述正样本集合中的正样本数量，对所述负样本集合进行欠采样，得到多个负样本子集合；所述负样本子集合中负样本数量与所述正样本数量一致；

所述训练模块，用于根据所述正样本集合和所述多个负样本子集合，确定多个训练数据，采用所述多个训练数据分别对所述初始的深度残差网络进行训练，得到多个预设的深度残差网络。

进一步地，所述装置还包括：归一化处理模块和增强处理模块；

所述归一化处理模块，用于对所述正样本集合中的正样本以及所述负样本集合中的负样本进行尺寸统一以及归一化处理，得到归一化处理后的正样本集合和负样本集合；

所述增强处理模块，用于对所述正样本集合中的正样本以及所述负样本集合中的负样本进行图像增强处理，根据增强处理后的图像更新所述正样本集合和所述负样本集合；所述增强处理包括：旋转处理。

进一步地，所述获取模块具体用于，

获取经过ImageNet图像数据集预训练的深度残差网络；

进一步地，所述确定模块具体用于，

若所述第一识别结果的数量大于等于所述第二识别结果的数量，则确定所述待识别的图像中存在目标对象；

进一步地，所述预设概率阈值的确定方式为，

获取样本数据；

进一步地，所述待识别的图像为遥感卫星图像；

所述目标对象为以下对象中的任意一种或者多种：烟囱、烟雾、裸露工地。

本发明实施例的图像识别装置，通过获取待识别的图像；将所述待识别的图像输入多个预设的深度残差网络，得到多个识别结果；根据所述多个识别结果，确定所述待识别的图像中是否存在所述目标对象。由此，相比采用单个模型进行识别，通过多个预设的深度残差网络分别对待识别的图像进行识别，弥补单个模型因欠采样可能出现的识别错误问题，识别准确度更高。此外，深度残差网络是更深层次的神经网络，相比于诸如CNN、深层的卷积神经网络AlexNet等深层网络和非深度学习的方法，能够学习到更多与图片标签相关的特征，分类性能提升明显。

为达上述目的，本发明第三方面实施例提出了另一种图像识别装置，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如上所述的图像识别方法。

为了实现上述目的，本发明第四方面实施例提出了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上所述的图像识别方法。

为了实现上述目的，本发明第五方面实施例提出了一种计算机程序产品，当所述计算机程序产品中的指令处理器执行时，实现如上所述的图像识别方法。

本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1为本发明实施例提供的一种图像识别方法的流程示意图；

图2为本发明实施例提供的一种图像识别方法的流程示意图；

图3为本发明实施例提供的一种图像识别装置的结构示意图；

图4为本发明实施例提供的另一种图像识别装置的结构示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

下面参考附图描述本发明实施例的图像识别方法及装置。

图1为本发明实施例提供的一种图像识别方法的流程示意图。本发明提供的图像识别方法的执行主体为图像识别装置，图像识别装置可以为终端设备、服务器等硬件设备，或者为硬件设备上安装的软件。

如图1所示，该图像识别方法包括以下步骤：

S101、获取待识别的图像。

本实施例中，待识别的图像可以是任意的图像，例如，地面相机拍摄的图像、无人机拍摄的图像或复杂的遥感卫星图像。

S102、将所述待识别的图像输入多个预设的深度残差网络，得到多个识别结果；所述识别结果为，所述待识别的图像中存在目标对象的概率；所述深度残差网络对应的训练数据中，正样本的数量和负样本的数量一致；所述正样本为存在所述目标对象的样本图像；所述负样本为未存在所述目标对象的样本图像。

本实施例中，事先针对不同的目标对象训练出对应的多个预设的深度残差网络。例如，目标对象为以下对象中的任意一种：烟囱、烟雾、裸露工地。则在训练时，会训练得到烟囱的多个预设的深度残差网络，烟雾的多个预设的深度残差网络，裸露工地的多个预设的深度残差网络。

本实施例中，深度残差网络是更深层次的神经网络，相比于非深层网络和非深度学习的方法，能够学习到更多与图片标签相关的特征，分类性能提升明显。深度残差网络基于网络层同等映射的思想，提出了残差学习的框架，通过短路机制加入残差单元(不引入额外参数)，解决了多层网络训练优化困难问题，能够防止更深层网络出现退化问题和减少过拟合。

本实施例中，采用多个预设的深度残差网络对待识别的图像进行识别，相比仅仅采用单个预设的深度残差网络对待识别的图像进行识别，弥补单个预设的深度残差网络因欠采样可能出现的识别错误问题，识别准确度更高。

具体地，多个预设的深度残差网络分别对待识别的图像进行识别，并输出对应的识别结果。识别结果为，所述待识别的图像中存在目标对象的概率；所述深度残差网络对应的训练数据中，正样本的数量和负样本的数量一致；所述正样本为存在所述目标对象的样本图像；所述负样本为未存在所述目标对象的样本图像。

S103、根据所述多个识别结果，确定所述待识别的图像中是否存在所述目标对象。

本实施例中，由于多个预设的深度残差网络是经过不同的训练数据得到的，不同的预设的深度残差网络之间存在差异性，可能有的预设的深度残差网络识别出待识别的图像中存在目标对象，可能有的预设的深度残差网络识别出待识别的图像中不存在目标对象。

本实施例中，步骤S103的具体实现方式包括以下步骤：

S1031、获取所述多个识别结果中第一识别结果的数量和第二识别结果的数量。

具体地，所述第一识别结果为对应的概率大于预设概率阈值的识别结果；所述第二识别结果为对应的概率小于等于预设概率阈值的识别结果。

其中，预设概率阈值的确定方式为，获取样本数据；将所述样本数据中负样本数量与总样本数量的比值，确定为所述预设概率阈值。例如，样本数据中500个负样本，800个正样本，预设概率阈值为5/7。

S1032、若所述第一识别结果的数量大于或等于所述第二识别结果的数量，则确定所述待识别的图像中存在目标对象。

S1033、若所述第一识别结果的数量小于所述第二识别结果的数量，则确定所述待识别的图像中不存在目标图像。

以本实施例的图像识别方法应用到复杂的遥感卫星烟囱场景为例，遥感卫星数据具有观察范围大，覆盖广的优点，可以观测到部分地面监控数据覆盖较少的区域，识别出这部分区域的污染源是污染监测和污染治理的重要一环，其中工厂企业的烟囱代表着该工厂企业的潜在排污行为，识别定位出遥感卫星图片数据中的烟囱，有利于污染监测和环境执法。通过该方法，可以从海量的遥感卫星数据图片中定位出包含烟囱的相关场景图片，从而定位出潜在的大气污染源。

本发明实施例提供的图像识别方法，通过获取待识别的图像；将所述待识别的图像输入多个预设的深度残差网络，得到多个识别结果；所述识别结果为，所述待识别的图像中存在目标对象的概率；所述深度残差网络对应的训练数据中，正样本的数量和负样本的数量一致；所述正样本为存在所述目标对象的样本图像；所述负样本为未存在所述目标对象的样本图像；根据所述多个识别结果，确定所述待识别的图像中是否存在所述目标对象。由此，相比采用单个模型进行识别，通过多个预设的深度残差网络分别对待识别的图像进行识别，弥补单个模型因欠采样可能出现的识别错误问题，识别准确度更高。此外，深度残差网络是更深层次的神经网络，相比于诸如CNN、深层的卷积神经网络AlexNet等深层网络和非深度学习的方法，能够学习到更多与图片标签相关的特征，分类性能提升明显。

图2为本发明实施例提供的又一种图像识别方法的流程示意图。本实施例主要是对如何得到预设的深度残差网络进行说明。

如图2所示，在图1所示的实施例的基础上，该图像识别方法包括以下步骤：

S201、获取初始的深度残差网络；所述初始的深度残差网络的全连接输出层神经元个数为1，且激活函数为sigmod函数。

具体地，深度残差网络解决的问题就是更深层次网络的收敛问题，基于网络层同等映射的思想，即在浅层的网络上面堆积深层网络，极端情况下也仅仅是对浅层网络的复制，不应该出现网络退化的现象。深度残差网络提出了一种残差学习的框架，通过在网络结构中加入残差单元，在多层网络的输入和输出之间建立一个直接的连接，这个连接在输入和输出层特征维度相同时不会额外增加参数，同时能够无损传播梯度，减少了梯度消失问题的出现。

由于本实施例中所需预设的深度残差网络本质为对待识别的图像进行二分类模型，故在选取初始的深度残差网络的全连接输出层神经元个数为1，即模型输出为一个数值，经过激活函数得到待识别图像对应的概率值。

进一步地，步骤S201的具体实现方式为：获取经过ImageNet图像数据集预训练的深度残差网络；将所述预训练的深度残差网络的全连接层的神经元个数缩减至1，激活函数采用sigmod函数，得到所述初始的深度残差网络。

本实施例中，为了训练出识别性能更好的残差网络模型同时加快模型训练的收敛速度，采用经过ImageNet图像数据集预训练的深度残差网络，初始化经过ImageNet图像数据集预训练的深度残差网络的权重参数，同时将预训练的深度残差网络的全连接输出层神经个数为缩减至1，激活函数使用sigmod(sigmoid为S型函数)，得到初始的深度残差网络。

其中，ImageNet图像数据集，是为了促进计算机图像识别技术的发展而设立的一个大型图像数据集，其图片数量最多，分辨率最高，含有的类别更多，有上千个图像类别，其中，有超过百万的图片有明确的类别标注和图像中物体位置的标注。

需要指出的是，使用在ImageNet数据集预训练的残差网络模型，再在自有数据的基础上进行训练。由于底层网络提取特征的通用性，相比于直接训练，提升了预设的深度残差网络模型的识别效果且极大提高预设的深度残差网络的收敛速度。

S202、获取样本数据；所述样本数据包括：正样本集合和负样本集合。

具体地，正样本集合包括多个存在目标对象的样本图像，负样本集合包括多个未存在目标对象的样本图像。

本实施例中，可以从公开的遥感卫星数据集中获取样本数据。以目标对象为烟囱为例，

公开的遥感卫星数据集中包含了海量的飞机、房屋、发电站等场景图片，对每张海量的场景图片进行人工分辨，若场景图片中存在烟囱，则将该场景图片识别为正样本，若场景图片中不存在烟囱，则将该场景图片识别为负样本。

进一步地，为了在海量且情况更复杂的卫星遥感数据识别出目标对象，可以通过网络抓取技术收集了大量的专业卫星地图数据，对从专业卫星地图数据获取的未标注数据作为负样本进行训练。当然，为了提高深度残差网络的识别准确度，对获取专业卫星地图数据获取的未标注数据进行人工筛选，剔除存在目标对象的图像，将未标注数据中的不存在目标对象的图像作为负样本进行训练。其中，专业卫星地图数据例如为谷歌卫星地图数据。

S203、按照所述正样本集合中的正样本数量，对所述负样本集合进行欠采样，得到多个负样本子集合；所述负样本子集合中负样本数量与所述正样本数量一致。

本实施例中，为了训练多个具备一定差异性的预设的深度残差网络，考虑到正样本集合和负样本集合的样本数量不均衡，负样本的数量远大于正样本的数量，在训练的时候使用全量的正样本，并随机抽取与正样本同等数量的负样本进行训练，使训练时正负样本均衡。每次随机抽取出的负样本和正样本结合都可训练出一个预设的深度残差网络，重复多次便得到了多个预设的深度残差网络。

具体地，对负样本集合进行欠采样，得到多个负样本子集合，每个负样本子集合中负样本数量与正样本集合中的正样本数量一致。

其中，负样本子集合的数量，根据所述正样本集合中正样本数量以及所述负样本集合中负样本数量确定，例如，负样本子集合的数量为负样本集合中的负样本数量与正样本集合中的正样本数量的商或者，负样本集合中的负样本数量与正样本集合中的正样本数量的商减预设值，其中，预设值例如为1。

例如，正样本集合中有100个正样本，负样本集合中有100*100个负样本，对负样本集合进行负采样，得到100个负样本子集合，每个负样本子集合包括100个负样本。

进一步地，在步骤S203之前，所述方法还包括：

S205、对所述正样本集合中的正样本以及所述负样本集合中的负样本进行尺寸统一以及归一化处理，得到归一化处理后的正样本集合和负样本集合。

本实施例中，为了便于训练，将正样本集合中的正样本以及所述负样本集合中的负样本进行尺寸统一，以样本为图片为例，即将各个图片缩放至相同的尺寸大小。

本实施例中，为了提高模型训练的收敛速度，对正样本和负样本进行归一化处理。以样本为图片为例，统计出所有图片的RGB通道的均值，统计出所有图片RGB通道的均值，每张图片的每个像素都减去各通道相应的均值并除以255使得每张图片的RGB通道值变为0到1之间的浮点值。

S206、对所述正样本集合中的正样本以及所述负样本集合中的负样本进行图像增强处理，根据增强处理后的图像更新所述正样本集合和所述负样本集合；所述增强处理包括：旋转处理。

本实施例中，为了增加训练样本，使用图像增强方法。以样本为图片为例，每次对图片旋转45度，便可以得到新的图片，旋转一周，相当于样本增至8倍。

S204、根据所述正样本集合和所述多个负样本子集合，确定多个训练数据，采用所述多个训练数据分别对所述初始的深度残差网络进行训练，得到多个预设的深度残差网络。

本实施例中，预设的深度残差网络的数量与负样本子集合的数量一致。具体地，将正样本集合和一个负样本子集合对初始的深度残差网络进行训练，得到一个预设的深度残差网络，重复多次便得到了多个具备一定差异性的预设的深度残差网络。

例如，多个负样本子集合为100个负样本子集合，采用正样本集合和一个负样本子集合组成一组训练数据，共得到100组训练数据，采用每组训练数据训练初始的深度残差网络，得到一个预设的深度残差网络，100组训练数据能得到100个预设的深度残差网络。

本发明实施例提供的图像识别方法，通过获取初始的深度残差网络；所述初始的深度残差网络的全连接输出层神经元个数为1，且激活函数为sigmod函数；获取样本数据；所述样本数据包括：正样本集合和负样本集合；按照所述正样本集合中的正样本数量，对所述负样本集合进行欠采样，得到多个负样本子集合；所述负样本子集合中负样本数量与所述正样本数量一致；根据所述正样本集合和所述多个负样本子集合，确定多个训练数据，采用所述多个训练数据分别对所述初始的深度残差网络进行训练，得到多个预设的深度残差网络。从而根据正样本集合和一个负样本子集合对初始的深度残差网络进行训练，得到一个预设的深度残差网络，重复多次便得到了多个具备一定差异性的预设的深度残差网络，为采用多个预设的深度残差网络对待识别的图像进行共同决策提供基础。

图3为本发明实施例提供的一种图像识别装置的结构示意图。如图3所示，包括：获取模块11、输入模块12和确定模块13。

获取模块11，用于获取待识别的图像；

输入模块12，用于将所述待识别的图像输入多个预设的深度残差网络，得到多个识别结果；所述识别结果为，所述待识别的图像中存在目标对象的概率；所述深度残差网络对应的训练数据中，正样本的数量和负样本的数量一致；所述正样本为存在所述目标对象的样本图像；所述负样本为未存在所述目标对象的样本图像；

确定模块13，用于根据所述多个识别结果，确定所述待识别的图像中是否存在所述目标对象。

进一步地，所述装置还包括：欠采样模块和训练模块；

所述获取模块11，还用于获取样本数据；所述样本数据包括：正样本集合和负样本集合；

进一步地，所述获取模块11具体用于，

获取经过ImageNet图像数据集预训练的深度残差网络；

进一步地，所述确定模块13具体用于，

进一步地，所述预设概率阈值的确定方式为，

获取样本数据；

进一步地，所述待识别的图像为遥感卫星图像；

需要说明的是，前述对图像识别方法实施例的解释说明也适用于该实施例的图像识别装置，此处不再赘述。

本发明实施例的图像识别装置，通过获取待识别的图像；将所述待识别的图像输入多个预设的深度残差网络，得到多个识别结果；所述识别结果为，所述待识别的图像中存在目标对象的概率；所述深度残差网络对应的训练数据中，正样本的数量和负样本的数量一致；所述正样本为存在所述目标对象的样本图像；所述负样本为未存在所述目标对象的样本图像；根据所述多个识别结果，确定所述待识别的图像中是否存在所述目标对象。由此，相比采用单个模型进行识别，通过多个预设的深度残差网络分别对待识别的图像进行识别，弥补单个模型因欠采样可能出现的识别错误问题，识别准确度更高。此外，深度残差网络是更深层次的神经网络，相比于诸如CNN、深层的卷积神经网络AlexNet等深层网络和非深度学习的方法，能够学习到更多与图片标签相关的特征，分类性能提升明显。

图4为本发明实施例提供的另一种图像识别装置的结构示意图。该图像识别装置包括：

存储器1001、处理器1002及存储在存储器1001上并可在处理器1002上运行的计算机程序。

处理器1002执行所述程序时实现上述实施例中提供的图像识别方法。

进一步地，图像识别装置还包括：

通信接口1003，用于存储器1001和处理器1002之间的通信。

存储器1001，用于存放可在处理器1002上运行的计算机程序。

存储器1001可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

处理器1002，用于执行所述程序时实现上述实施例所述的图像识别方法。

如果存储器1001、处理器1002和通信接口1003独立实现，则通信接口1003、存储器1001和处理器1002可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构(Industry Standard Architecture，简称为ISA)总线、外部设备互连(Peripheral Component，简称为PCI)总线或扩展工业标准体系结构(Extended IndustryStandard Architecture，简称为EISA)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图4中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

可选的，在具体实现上，如果存储器1001、处理器1002及通信接口1003，集成在一块芯片上实现，则存储器1001、处理器1002及通信接口1003可以通过内部接口完成相互间的通信。

处理器1002可能是一个中央处理器(Central Processing Unit，简称为CPU)，或者是特定集成电路(Application Specific Integrated Circuit，简称为ASIC)，或者是被配置成实施本发明实施例的一个或多个集成电路。

本发明还提供一种非临时性计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上所述的图像识别方法。

本发明还提供一种计算机程序产品，当所述计算机程序产品中的指令处理器执行时，实现如上所述的图像识别方法。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如，如果用硬件来实现和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种图像识别方法，其特征在于，包括：

获取待识别的图像；

2.根据权利要求1所述的方法，其特征在于，所述将所述待识别的图像输入多个预设的深度残差网络，得到多个识别结果之前，还包括：

3.根据权利要求2所述的方法，其特征在于，所述负样本子集合的数量，根据所述正样本集合中正样本数量以及所述负样本集合中负样本数量确定；

4.根据权利要求2所述的方法，其特征在于，所述按照所述正样本集合中的正样本数量，对所述负样本集合进行欠采样，得到多个负样本子集合之前，还包括：

5.根据权利要求2所述的方法，其特征在于，所述获取初始的深度残差网络，包括：

获取经过ImageNet图像数据集预训练的深度残差网络；

6.根据权利要求1所述的方法，其特征在于，所述根据所述多个识别结果，确定所述待识别的图像中是否存在所述目标对象，包括：

7.根据权利要求6所述的方法，其特征在于，所述预设概率阈值的确定方式为，

获取样本数据；

8.根据权利要求1-7任一项所述的方法，其特征在于，所述待识别的图像为遥感卫星图像；

9.一种图像识别装置，其特征在于，包括：

获取模块，用于获取待识别的图像；

10.根据权利要求9所述的装置，其特征在于，还包括：欠采样模块和训练模块；

11.根据权利要求10所述的装置，其特征在于，所述负样本子集合的数量，根据所述正样本集合中正样本数量以及所述负样本集合中负样本数量确定；

12.根据权利要求10所述的装置，其特征在于，还包括：归一化处理模块和增强处理模块；

13.根据权利要求10所述的装置，其特征在于，所述获取模块具体用于，

获取经过ImageNet图像数据集预训练的深度残差网络；

14.根据权利要求9所述的装置，其特征在于，所述确定模块具体用于，

15.根据权利要求14所述的装置，其特征在于，所述预设概率阈值的确定方式为，

获取样本数据；

16.根据权利要求9-15任一项所述的装置，其特征在于，所述待识别的图像为遥感卫星图像；

17.一种图像识别装置，其特征在于，包括：

存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1-8中任一所述的图像识别方法。

18.一种非临时性计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-8中任一所述的图像识别方法。

19.一种计算机程序产品，当所述计算机程序产品中的指令处理器执行时，实现如权利要求1-8中任一所述的图像识别方法。