CN106355188A

CN106355188A - 图像检测方法及装置

Info

Publication number: CN106355188A
Application number: CN201510408021.1A
Authority: CN
Inventors: 祝健飞; 刘彬; 刘扬; 陈宇; 高洋; 安山; 赵小伟; 张洪明
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2015-07-13
Filing date: 2015-07-13
Publication date: 2017-01-25
Anticipated expiration: 2035-07-13
Also published as: CN106355188B

Abstract

本申请实施例公开了一种图像检测方法和装置，所述方法包括：利用检测框分类模型，获取待检测图像中属于目标物体概率最高的目标物体检测框；其中，所述检测框分类模型预先根据标注目标物体的第一类样本图像训练得到；抽取所述目标物体检测框中的图像特征；根据所述目标物体检测框的图像特征，利用目标物体分类器，检测所述目标物体检测框是否为目标物体；其中，所述目标物体分类器预先根据第二类样本图像中目标物体的正样本以及目标物体的负样本进行训练得到。本申请实施例实现了待检测图像的有效检测，提高了图像检测精确度。

Description

图像检测方法及装置

技术领域

本申请属于图像处理技术领域，具体地说，涉及一种图像检测方法及装置。

背景技术

在图像存在复杂背景的情况下，如何将目标物体从图像的背景中检测出来，是图像处理过程经常遇到的问题。特别是目标物体为人体时，在不同的技术应用中均有涉及。

现有技术中，以检测图像中的人体为例，绝大多数的图像检测流程一般是：首先构造人工设计的规则或者图像特征(如人体轮廓特征，人体区域直方图特征，人体关键点特征等)，然后训练检测模型或者分类模型，最后通过得到的检测器或者分类器在图像中定位出人体的位置。

但是，现有的这种图像检测方案，图像检测的精确度还有待提高。

发明内容

有鉴于此，本申请所要解决的技术问题是提供了一种图像检测方法及装置，实现了图像有效检测，提高了图像检测的精确度。

为了解决上述技术问题，本申请公开了一种图像检测方法及装置。

一种图像检测方法，包括：

利用检测框分类模型，获取待检测图像中属于目标物体概率最高的目标物体检测框；其中，所述检测框分类模型预先根据标注目标物体的第一类样本图像训练得到；

抽取所述目标物体检测框中的图像特征；

根据所述目标物体检测框的图像特征，利用目标物体分类器，检测所述目标物体检测框是否为目标物体；其中，所述目标物体分类器预先根据第二类样本图像中目标物体的正样本以及负样本进行训练得到。

优选地，在检测所述目标物体检测框不是目标物体时，所述方法还包括：

利用候选框提取算法，抽取所述待检测图像中的目标物体候选框；

针对每一目标物体候选框，抽取所述目标物体候选框中的图像特征，并根据所述目标物体候选框的图像特征，利用所述目标物体分类器，确定所述目标物体候选框是否为目标物体。

优选地，所述利用检测框分类模型为全卷积网络FCN分类模型；

所述利用检测框分类模型，获取待检测图像属于目标物体的概率最高的目标物体检测框包括：

利用FCN分类模型，获得待检测图像中属于目标物体概率最高的目标物体检测框；所述FCN分类模型预先根据标注目标物体的第一类样本图像，对FCN网络结构训练得到。

优选地，所述抽取所述目标物体检测框中的图像特征包括：

利用卷积神经网络CNN模型，抽取所述目标物体检测框的CNN特征；

其中，所述CNN模型预先根据第二类样本图像中的目标物体正样本以及负样本对CNN网络结构进行训练得到；所述CNN模型训练时的目标物体正样本为第二类样本图像中与目标物体标注框重合度大于第一预设值的目标物体候选框；目标物体负样本为第二类样本图像中与目标物体标注框重合度小于第二预设值的物体候选框；

所述目标物体分类器训练时的目标物体正样本为第二类样本图像中的样本物体标注框；负样本为与所述目标物体标注框重合度小于第三预设值的目标物体候选框。

优选地，在检测所述目标物体检测框为目标物体之后，所述方法还包括：

利用第一检测框回归模型对所述目标物体检测框进行修正，得到调整之后的检测框，并在所述待检测图像中输出所述调整之后的检测框；

其中，所述第一检测框回归模型预先根据所述第一类样本图像的目标物体标注框与目标物体检测框的误差训练得到。

优选地，所述根据所述目标检测框的图像特征，利用目标物体分类器，检测所述目标物体检测框是否为目标物体包括：

根据所述目标检测框的图像特征，利用目标物体分类器，获得所述目标物体检测框为目标物体的置信度；

根据所述目标物体检测框的置信度，确定所述目标物体检测框是否为目标物体，其中，在所述目标物体检测框的置信度大于第一阈值时，确定所述目标候选框为目标物体；

所述根据所述目标物体候选框的图像特征，利用目标物体分类器，检测所述目标物体候选框是否为目标物体包括：

根据所述目标候选框的图像特征，利用目标物体分类器，获得所述目标物体候选框为目标物体的置信度；

根据所述目标物体候选框的置信度，确定所述目标物体候选框是否为目标物体；其中，在所述目标物体候选框的置信度大于第一阈值时，确定所述目标候选框为目标物体。

优选地，在确定所述目标物体候选框为目标物体之后，所述方法还包括：

从置信度大于第一阈值的目标物体候选框中，对于重合度大于重合阈值的任意两个目标物体候选框，选择置信度最大的目标物体候选框作为目标物体结果框；

利用第二检测框回归模型对所述目标物体结果框进行修正，得到调整之后的目标物体结果框，并在所述待检测图像中输出所述调整之后的目标物体结果框；

其中，所述第二检测框回归模型预先根据第二类样本图像的目标物体标注框，以及第二类样本图像的目标物体结果框的误差训练得到；

所述第二类样本图像的目标物体结果框按照下述方式确定：

获取第二类样本图像中的目标物体候选框；

针对所述第二类样本图像中的每一目标物体候选框，抽取所述目标物体候选框中的图像特征，并根据所述图像特征，利用所述目标物体分类器，获得置信度大于第一阈值的目标物体候选框；

从所述置信度大于第一阈值的目标物体候选框中，对于重合度大于重合阈值的任意两个目标物体候选框，选择置信度最大的目标物体候选框作为所述第二类样本图像的目标物体结果框。

一种图像检测装置，包括：

检测框获取模块，用于利用检测框分类模型，获取待检测图像中属于目标物体概率最高的目标物体检测框；其中，所述检测框分类模型预先根据标注目标物体的第一类样本图像训练得到；

第一特征抽取模块，用于抽取所述目标物体检测框中的图像特征；

第一检测模块，用于根据所述目标物体检测框的图像特征，利用目标物体分类器，检测所述目标物体检测框是否为目标物体；其中，所述目标物体分类器预先根据第二类样本图像中目标物体的正样本以及目标物体的负样本进行训练得到。

优选地，所述装置还包括：

候选框获取模块，用于在第一检测模块检测所述目标物体检测框不是目标物体时，利用候选框提取算法，抽取所述待检测图像中的目标物体候选框；

第二特征抽取模块，用于针对每一目标物体候选框，抽取所述目标物体候选框中的图像特征；

第二检测模块，用于根据所述目标物体候选框的图像特征，利用所述目标物体分类器，确定所述目标物体候选框是否为目标物体。

优选地，所述检测框分类模型为全卷积网络FCN分类模型；

所述检测框获取模块具体用于利用FCN分类模型，获得待检测图像中属于目标物体概率最高的目标物体检测框；所述FCN分类模型预先根据标注目标物体的样本图像，对FCN网络结构训练得到。

优选地，所述第一特征抽取模块具体用于利用卷积神经网络CNN模型，抽取所述目标物体检测框的CNN特征；

其中，所述CNN模型预先根据第二类样本图像中的目标物体正样本以及负样本对CNN网络结构进行训练得到；所述CNN模型训练时的目标物体正样本为样本图像中与目标物体标注框重合度大于第一预设值的目标物体候选框；目标物体负样本为样本图像中与目标物体标注框重合度小于第二预设值的样本物体候选框；

则所述目标物体分类器训练时的目标物体正样本为第二类样本图像中的样本物体标注框；负样本为与所述目标物体标注框重合度小于第三预设值的目标物体候选框。

优选地，还包括：

第一调整模块，用于利用第一检测框回归模型对所述目标物体检测框进行修正，得到调整之后的目标物体检测框；

第二输出模块，用于在所述待检测图像中输出所述调整之后的目标物体检测框；

其中，所述第一检测框回归模型预先根据第一类样本图像的目标物体标注框与目标物体检测框的误差训练得到。

优选地，所述第一检测模块包括：

第一置信度获取单元，用于根据所述目标检测框的图像特征，利用目标物体分类器，获得所述目标物体检测框为目标物体的置信度；

第一检测单元，用于根据所述目标物体检测框的置信度，确定所述目标物体检测框是否为目标物体，其中，在所述目标物体检测框的置信度大于第一阈值时，确定所述目标候选框为目标物体；

所述第二检测模块包括：

第二置信度获取单元，用于根据所述目标候选框的图像特征，利用目标物体分类器，获得所述目标物体候选框为目标物体的置信度；

第二检测单元，用于根据所述目标物体候选框的置信度，确定所述目标物体候选框是否为目标物体；其中，在所述目标物体候选框的置信度大于第一阈值时，确定所述目标候选框为目标物体。

优选地，还包括：

结果框获取模块，用于从置信度大于第一阈值的目标物体候选框中，对于重合度大于重合阈值的任意两个目标物体候选框，选择置信度最大的目标物体候选框作为目标物体结果框；

第二调整模块，用于利用第二检测框回归模型对所述目标物体结果框进行修正，得到调整之后的目标物体结果框；

第二输出模块，用于在所述待检测图像中输出所述调整之后的目标物体结果框；

所述第二类样本图像的目标物体结果框按照下述方式确定：

获取第二类样本图像中的目标物体候选框；

从所述置信度大于第一阈值的目标物体候选框中，对于重合度大于重合阈值的任意两个目标物体候选框，选择置信度最大的目标物体候选框作为所述第二类样本图像目标物体结果框。

与现有技术相比，本申请可以获得包括以下技术效果：

利用预先训练得到的检测框分类模型，获得待检测图像中的目标物体检测框，利用预先训练好的目标物体分类器，对该目标物体检测框进行验证，确定其是否为目标物体，实现了待检测图像的有效检测，提高了图像检测精确度。

当然，实施本申请的任一产品必不一定需要同时达到以上所述的所有技术效果。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是本申请实施例的图像检测方法一实施例的流程图；

图2是本申请实施例的图像检测方法又一实施例的流程图；

图3是本申请实施例的图像检测方法又一实施例的流程图；

图4是本申请实施例的图像检测装置一实施例的流程图；

图5是本申请实施例的图像检测装置又一实施例的流程图；

图6是本申请实施例的图像检测装置又一实施例的流程图。

具体实施方式

以下将配合附图及实施例来详细说明本申请的实施方式，藉此对本申请如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解并据以实施。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括非暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

图1为本申请实施例提供的一种图像检测方法一个实施例的流程图，该方法可以包括以下几个步骤：

101：利用检测框分类模型，获取待检测图像属于目标物体的概率最高的目标物体检测框。

其中，所述检测框分类模型预先根据标注目标物体的第一类样本图像训练得到。

目标物体检测框是指待检测图像中可能包括目标物体的一个预设形状的区域，在实际应用中，为了方便检测，预设形状通常设定为矩形。

在预先训练阶段，首先在每一个第一类样本图像中标注出目标物体，利用标注目标物体的第一类样本图像对分类模型进行训练，即可以得到检测框分类模型。该分类模型可以是能够通过训练，实现分类的任意模型。

其中，第一类样本图像标注的目标物体为像素级别的，即已知样本图像中目标物体的每一个像素点的像素值。

利用检测框分类模型，可以获得待检测图像中不同预设形状区域属于目标物体的概率图，进而可以得到属于目标物体概率最高的预设形状区域，作为目标物体检测框。

102：抽取所述目标物体检测框中的图像特征。

103：根据所述目标物体检测框的图像特征，利用目标物体分类器，检测所述目标物体检测框是否为目标物体。

其中，所述目标物体分类器预先根据第二类样本图像中的目标物体的正样本以及目标物体的负样本进行训练得到。

第一类样本图像标注的目标物体为像素级别的，即已知样本图像中目标物体的每一个像素点的像素值。

第二类样本图像可以与第一类样本图像不同，目标物体的正样本以及负样本为样本图像中的预设形状区域，该预设形状具体可以是矩形。

正样本可以是指第二类样本图像中属于目标物体的概率大于第一阈值值的预设形状区域，负样本可以是指第二类样本图像中属于目标物体的概率小于第二阈值的预设形状区域。第二阈值小于等于第一阈值。

在一个第二类样本图像中可能获得多个正样本以及多个负样本。当然为了提高检测准确度，正样本以及负样本的选择还可以采用其他方式，在下面实施例中会进行介绍。

第一类样本图像和第二类样本图像可以为相同样本图像。

检测得到目标物体检测框即为目标物体时，即可以在待检测图像中输出该目标物体检测框的位置，也即目标物体对应的位置。如果检测得到目标物体检测框不是目标物体，则可以确定该待检测图像中不存在目标物体。

本申请实施例中，首先利用预先训练得到的检测框分类模型，获得待检测图像中的目标物体检测框，然后，进一步的，利用预先训练好的目标物体分类器，对该目标物体检测框进行验证，确定其是否为目标物体，从而实现了待检测图像的有效检测，进一步提高了检测精确度。

在一个实际应用中，该目标物体即为人体，通过本申请实施例的图像检测，即能够检测出图像中人体位置。

图像中人体检测广泛应用于不同的场景中，比如监控视频、电视媒体、电子商务等。

在电子商务场景中，可以用于服装搜索，服装区域通常即为人体所在位置，因此通过人体检测，可以将商品图片中的服装区域检测出来，进而实现服装搜索。

由于电商平台的模特图片变化万千，拍摄的角度、光照条件、背景情况等多种多样，尤其人体本身也具有非常大的可变性，不同的体型、不同的姿态、不同穿着等，而服装搜索对速度的要求和准确度都比较高。通过本申请实施例即可以实现快速且准确的人体检测。

为了提高目标物体检测框的精确度，保证获取的目标物体检测框更接近目标物体。

因此，作为又一个实施例，该检测框分类模型具体为FCN(FullConvolutional Network，全卷积网络)分类模型，预先根据标注目标物体的第一类样本图像，对FCN网络结构训练得到。该第一类样本图像中包括目标物体，预先对目标物体进行标注，且标注的目标物体为像素级别的，即已知目标物体的每一个像素值。

将待检测图像送入FCN分类模型中，可以得到图像的不同预设形状区域属于目标物体的一个概率图，根据这个概率图即可以得到可能存在目标物体的预设形状区域，即作为目标物体检测框。

通过FCN分类模型，使得得到目标物体检测框更加精确。

为了使得待检测图像能够利用检测框分类模型，可以首先将待检测图像进行归一化，调整待检测图像的大小，使得待检测图像的大小与检测框分类模型训练时的第一类样本图像尺寸一样，在实际应用中，归一化尺寸可以取长宽分别为228。

作为又一个实施例，为了进一步提高图像检测的准确度，在检测所述目标物体检测框为目标物体之后，所述方法还可以包括：

其中，第一类样本图像的目标物体检测框具体可以是利用所述FCN分类模型获取的。

该第一检测框回归模型可以使用SVR(support vector regression，支持向量回归)实现。

由于获取的目标物体检测框为目标物体的概率并非百分之百，此外，待检测图像中存在多个目标物体时，可能也会影响利用检测框分类模型得到的目标物体检测框的准确度。

为了避免漏检和误检，进一步的提高检测的精确度。如图2所示，在本申请的又一个实施例中，该方法可以包括以下几个步骤：

201：利用检测框分类模型，获取待检测图像中属于目标物体的概率最高的目标物体检测框。

其中，所述检测框分类模型预先根据标注目标物体的样本图像训练得到。

202：抽取所述目标物体检测框中的图像特征。

203：根据所述目标物体检测框的图像特征，利用目标物体分类器，检测所述目标物体检测框是否为目标物体，如果否，执行步骤204，如果是，结束流程。

其中，所述目标物体分类器预先根据样本图像中的目标物体正样本以目标物体及负样本进行训练得到。

其中，步骤201～步骤203的操作与上述实施例中步骤101～步骤103的操作相同，在此不再赘述。

204：利用候选框提取算法，抽取获取所述待检测图像中目标物体候选框。

其中，候选框提取算法可以有多种实现方式，比如selective search(选择性搜索)、bing(Binarized Normed Gradients二值归一化梯度)、GOP(Geodesic Object Proposals，测地的物体候选框)、edgebox(边缘框)等，与现有技术相同，在此不再赘述。

目标物体候选框是指待检测图像中可能包括目标物体的一个预设形状的区域。为了与通过检测框分类模型获取的目标物体检测框进行区分，命名为目标物体候选框。

利用候选框提取算法，抽取的目标物体候选框通常数量很多，可能有几百甚至几千个。

205：针对每一目标物体候选框，抽取所述目标物体候选框中的图像特征。

206：根据所述目标物体候选框的图像特征，利用所述目标物体分类器，检测所述目标物体候选框是否为目标物体，如果是则结束流程，如果否执行步骤207。

207：确定待检测图像中不存在目标物体。

检测框以及候选框可以均为待检测图像中可能包括目标物体的矩形区域。

在确定目标物体候选框为目标物体之后，可以在待检测图像中为目标物体的目标物体候选框的位置。

若不存在为目标物体的目标物体候选框，则可以确定待检测图像中不存在目标物体。

本申请实施例，首先对待检测图像，选择一个属于目标物体概率最高的目标物体检测框，针对该目标物体检测框，利用预先训练的目标物体分类器进行检测，确定是否为目标物体；如果目标物体检测框不是目标物体的情况下，还可以选择待检测图像中可能为目标物体的多个目标物体候选框，针对每一个目标物体候选框，利用预先训练的目标物体分类器进行检测，确定是否为目标物体。在目标物体检测框是目标物体的情况下，则不需要继续进行检测，从而可以提高图像检测的效率。而在目标物体检测框不是目标物体的情况，还可以采用目标物体候选框的方式，确定目标物体候选框是否为目标物体，从而还保证了检测的精度。在图像中存在多个目标物体的情况下，由于目标物体检测框只有一个，因此还可以避免图像误检的情况。

其中，本申请实施例中的图像特征可以具体为CNN(Convolutional NeuralNetwork，卷积神经网络)特征，CNN特征在图像内容的表达能力上远超过传统的手工设置的特征，对于光照变化、姿态变化、形变、复杂纹理、复杂背景等等都具有很好的鲁棒性。

因此，上述实施例中，该抽取所述目标物体检测框中的图像特征可以具体是：

利用卷积神经网络CNN模型，抽取所述目标物体检测框的CNN特征。

该CNN模型预先根据第二类样本图像的目标物体的正样本以及负样本，对CNN网络结构预先训练得到。

其中，CNN模型训练时的目标物体的正样本以及负样本，与目标物体分类器训练时的目标物体的正样本以及负样本，可以不同。

作为一种可能的实现方式，CNN模型的训练需要较多的正样本，因此所述CNN模型训练时的目标物体正样本可以选择样第二类本图像中与目标物体标注框重合度大于第一预设值的目标物体候选框；所述目标物体负样本为第二类样本图像中与目标物体标注框重合度小于第二预设值的物体候选框；

而所述目标物体分类器训练时的目标物体正样本可以为第二类样本图像中的目标物体标注框；负样本可以是与所述目标物体标注框重合度小于第三预设值的目标物体候选框。

样本图像中的目标物体标注框为样本图像中目标物体所在的区域，可以由人为预先标注。

样本图像中的目标物体候选框可以采用候选框提取算法，从样本图像中抽取得到。

标注框与候选框的重合度越高，表明候选框越接近目标物体；重合度越低，表明候选框为目标物体的可能性更低。

通过正样本和负样本的训练，使得训练后的CNN模型抽取的CNN特征更加准确，使得目标物体分类器能够有效将目标物体和非目标物体区分。

同样，作为又一个实施例，步骤105中：针对每一目标物体候选框，抽取所述目标物体候选框中的图像特征可以具体是：

针对每一目标物体候选框，利用卷积神经网络CNN模型，抽取所述目标物体候选框中的图像特征。

本申请实施例中，目标物体分类器可以采用SVM((Support VectorMachine，支持向量机)实现。

将图像特征输入目标物体分类器，具体得到的是一个置信度值。

当图像特征为目标物体检测框的图像特征，则得到是目标物体检测框属于目标物体的置信度。当图像特征为目标物体候选框的图像特征，则得到是目标物体候选框属于目标物体的置信度。

在置信度大于第一阈值时，可以确定目标物体检测框或者目标物体标候选框为目标物体。

为了减少计算负担，在利用候选框提取算法，得到多个目标物体候选框之后，可以利用先验规则进行过滤，过滤掉不太可能存在人体的候选框。该先验规则比如可以是候选框的长宽比，候选框占图像的最小比例等。如果候选框占图像的比特不满足预设规则，或者长宽比不满足预设规则，则可以将其过滤掉。

作为又一个实施例，为了简化检测结果，在确定所述目标物体候选框为目标物体之后，所述方法还可以包括：

从置信度大于第一阈值的目标物体候选框中，对于重合度大于重合阈值的任意两个目标物体候选框，选择置信度最大的目标物体候选框作为目标物体结果框。

任意两个目标物体候选框的重合度大于重合阈值，可以表明该任意两个目标物体候选框表示的为同一个目标物体，因此可以只留下置信度大的目标候选框作为目标物体结果框。

该重合阈值可以根据实际应用情况设置，比如可以是大于等于30％。

最终获得的目标物体结果框即可以作为目标物体在待检测图像中的区域，在待检测图像中输出该目标物体结果框。

另外，作为又一个实施例，为了提高检测结果的准确度，在确定出待检测图像的目标物体结果框之后，还可以对其进行修改，因此所述方法还可以包括：

所述第二类样本图像的样标物体结果框可以按照下述方式确定：

获取第二类样本图像中的目标物体候选框；具体可以是利用候选框提取算法，抽取第二类样本图像中的目标物体候选框；

从置信度大于第一阈值的目标物体候选框中，对于重合度大于重合阈值的任意两个目标物体候选框，选择置信度最大的目标物体候选框作为所述第二类样本图像的目标物体结果框。

下面以目标物体是人体为例，来详细描述本申请的技术方案，如图3所示，为本申请实施例提供的一种图像检测方法又一个实施例的流程图，该方法可以包括以下几个步骤：

301：将待检测图像进行归一化，并利用FCN分类模型，获取待检测图像属于人体的概率最高的人体检测框。

该FCN分类模型预先按照下述方式训练得到：

获取包含人体的大量第一类样本图像；

在该第一类样本图像中标注出人体；

利用该标注人体的第一类样本图像，对FCN网络结果进行训练，得到FCN分类模型。

302：利用CNN模型，抽取所述人体检测框中的图像特征。

该CNN模型可以预先按照下述方式训练得到：

获取包含人体的大量第二类样本图像，并标注出人体位置，作为人体标注框；

利用候选框提取算法，得到第二类样本图像中样本人体候选框；

将样本人体候选框中，与人体标注框重合度大于第一预设值的样本人体候选框作为人体正样本；与人体标准库重合度小于第二预设值的样本人体候选框作为人体负样本；第二预设值小于等于第一预设值；

利用该人体正样本与人体负样本，对CNN网络结构进行训练，得到CNN模型。

303：根据所述人体检测框的CNN特征，利用SVM分类器，检测所述人体检测框是否为人体，如果是，执行步骤304，如果是，执行步骤306。

其中，该SVM分类器预先按照下述方式训练得到：

将第二类样本图像中，样本图像中的人体标注框作为正样本；将与所述人体标注框重合度小于第三预设值的样本人体候选框作为负样本；

利用该正样本与负样本，对SVM进行训练，得到SVM分类器。

其中，SVM的目标函数可以为：

\begin{matrix} \min_{ω} \frac{1}{2} | | ω | |^{2} + C Σ_{i = 1}^{N} ϵ_{i} & s . t . & y \times (< ω, x > + b) &GreaterEqual; 1 - ϵ_{i} \end{matrix}

其中，ω是垂直于分类超平面的向量，C是权重系数，ε是松弛变量，x为正样本或负样本，y是正样本标号或者负样本标号，N是样本数量，b是偏移量。

人体检测框的CNN特征输入SVM分类器，可以得到人体检测框的置信度，根据置信度即可以确定人体检测框是否为人体。

在置信度大于第一阈值时，则可以确定人体检测框为人体，否则则可以确定人体检测框不是人体。

304：利用第一检测框回归模型对所述人体检测框进行修正，得到调整之后的检测框。

其中，该第一检测回归模型预先根据第一类样本图像的目标物体标注框与目标物体检测框的误差训练得到。

305：在所述待检测图像中输出所述调整之后的检测框。

其中，所述第一检测框回归模型预先根据第一类样本图像的样本人体标注框与样本人体检测框的误差训练得到。

306：将所述待检测图像重新进行归一化，并利用候选框提取算法，抽取所述待检测图像中人体候选框。

其中，候选框提取算法可以有多种实现方式，比如selective search、bing、GOP、edgebox等，与现有技术相同，在此不再赘述。

其中，该重新归一化的尺寸，与初始归一化的尺寸不同，该重新归一化的尺寸保证与第二类样本图像训练时的尺寸一致。

307：将所述人体候选框进行过滤，得到过滤之后的人体候选框。

308：针对每一过滤之后的人体候选框，利用卷积神经网络CNN模型，抽取所述人体候选框中的CNN特征。

309：根据所述人体候选框的CNN特征，利用所述SVM分类器，确定所述人体候选框是否为人体，如果是，执行步骤310，如果否，执行步骤313。

将人体候选框的CNN特征输入到SVM分类器，即可以得到人体候选框的置信度。

如果人体候选框的置信度大于第一阈值，则可以确定人体候选框为人体，否则，确定人体候选框不是人体。

310：从置信度大于第一阈值的人体候选框中，对于重合度大于重合阈值的任意两个人体候选框，选择置信度最大的人体候选框作为人体结果框。

311：利用第二检测框回归模型对所述人体结果框进行修正，得到调整之后的人体结果框。

其中，所述第二检测框回归模型预先根据第二类样本图像的目标物体标注框，以及第二类样本图像的目标物体结果框的误差训练得到。

312：在所述待检测图像中输出所述调整之后的人体结果框；

313：确定所述待检测图像中不存在人体

本实施例中，由于FCN分类模型对目标物体的预测是非常快速的，且比较准确，利用CNN以及SVM，进一步保证了检测的精度，若通过CNN+SVM判断该检测框不是人体，还可以通过抽取候选框进行进一步的判定，如果为人体，则可以结束流程，从而既保证了检测的速度，又保证了检测的精度。

图4为本申请实施例提供的一种图像检测装置一个实施例的结构示意图，该装置可以包括：

检测框获取模块401，用于利用检测框分类模型，获取待检测图像中属于目标物体概率最高的目标物体检测框；其中，所述检测框分类模型预先根据标注目标物体的第一类样本图像训练得到；

第一特征抽取模块402，用于抽取所述目标物体检测框中的图像特征；

第一检测模块403，用于根据所述目标物体检测框的图像特征，利用目标物体分类器，检测所述目标物体检测框是否为目标物体；其中，所述目标物体分类器预先根据第二类样本图像中目标物体的正样本以及目标物体的负样本进行训练得到。

本申请实施例中，首先利用预先训练得到的检测框分类模型，获得待检测图像中的目标物体检测狂，然后，进一步的，利用预先训练好的目标物体分类器，对该目标物体检测框进行验证，确定其是否为目标物体，从而实现了待检测图像的有效检测，进一步提高了检测精确度。

作为又一个实施例，该检测框分类模型具体为FCN分类模型。

因此，所述检测框获取模块401具体用于利用FCN分类模型，获得待检测图像中属于目标物体概率最高的目标物体检测框；所述FCN分类模型预先根据标注目标物体的样本图像，对FCN网络结构训练得到。

通过FCN分类模型，使得得到目标物体检测框更加精确。

为了使得待检测图像能够利用检测框分类模型，该检测框获取模块具体可以将待检测图像进行归一化，利用FCN分类模型，获得归一化之后的待检测图像中属于目标物体概率最高的目标物体检测框；

通过归一化，可以调整待检测图像的大小，使得待检测图像的大小与检测框分类模型训练时的第一类样本图像尺寸一样，在实际应用中，归一化尺寸可以取长宽分别为228。

为了避免漏检和误检，进一步的提高检测的精确度。如图5所示，在本申请的又一个实施例中，该装置可以包括：

候选框获取模块404，用于在第一检测模块403检测所述目标物体检测框不是目标物体时，利用候选框提取算法，抽取所述待检测图像中的目标物体候选框；

第二特征抽取模块405，用于针对每一目标物体候选框，抽取所述目标物体候选框中的图像特征；

第二检测模块406，用于根据所述目标物体候选框的图像特征，利用所述目标物体分类器，确定所述目标物体候选框是否为目标物体；

本申请实施例，首先对待检测图像，选择一个属于目标物体概率最高的目标物体检测框，针对该目标物体检测框，利用预先训练的目标物体分类器进行检测，确定是否为目标物体；如果目标物体检测框不是目标物体的情况下，还可以选择待检测图像中可能为目标物体的多个目标物体候选框，针对每一个目标物体候选框，利用预先训练的目标物体分类器进行检测，确定是否为目标物体。在目标物体检测框是目标物体的情况下，则不需要继续进行检测，从而可以提高图像检测的效率。而在目标物体检测框不是目标物体的情况，还可以采用目标物体候选框的方式，确定目标物体候选框是否为目标物体，从而还保证了检测的精度，在图像中存在多个目标物体的情况下，可以避免图像误检的情况。

作为又一个实施例，为了进一步提高图像检测的准确度，如图6所述，该装置还可以包括：

第一调整模块407，用于在检测所述目标物体检测框为目标物体之后，利用第一检测框回归模型对所述目标物体检测框进行修正，得到调整之后的检测框；

第二输出模块408，用于在所述待检测图像中输出所述调整之后的检测框；

其中，本申请实施例中的图像特征可以具体为CNN特征，CNN特征在图像内容的表达能力上远超过传统的手工设置的特征，对于光照变化、姿态变化、形变、复杂纹理、复杂背景等等都具有很好的鲁棒性。

因此，如图6所示，该装置中，第一特征抽取模块402具体用于利用卷积神经网络CNN模型，抽取所述目标物体检测框的CNN特征；

作为又一个实施例，该第二特征抽取模块403可以具体用于针对每一目标物体候选框，利用卷积神经网络CNN模型，抽取所述目标物体候选框中的图像特征。

本申请实施例中，将图像特征输入目标物体分类器，具体得到的是一个置信度值。当图像特征为目标物体检测框的图像特征，则得到是目标物体检测框属于目标物体的置信度。当图像特征为目标物体候选框的图像特征，则得到是目标物体候选框属于目标物体的置信度。

因此，如图6所示，该第一检测模块403可以包括：

第一置信度获取单元601，用于根据所述目标检测框的图像特征，利用目标物体分类器，获得所述目标物体检测框为目标物体的置信度；

第一检测单元602，用于根据所述目标物体检测框的置信度，确定所述目标物体检测框是否为目标物体，其中，在所述目标物体检测框的置信度大于第一阈值时，确定所述目标候选框为目标物体；

该第二检测模块406可以包括：

第二置信度获取单元603，用于根据所述目标候选框的图像特征，利用目标物体分类器，获得所述目标物体候选框为目标物体的置信度；

第二检测单元604，用于根据所述目标物体候选框的置信度，确定所述目标物体候选框是否为目标物体；其中，在所述目标物体候选框的置信度大于第一阈值时，确定所述目标候选框为目标物体。

作为又一个实施例，为了简化检测结果，在确定所述目标物体候选框为目标物体之后，如图6所示，该装置可以包括：

结果框获取模块409，用于从置信度大于第一阈值的目标物体候选框中，对于重合度大于重合阈值的任意两个目标物体候选框，选择置信度最大的目标物体候选框作为目标物体结果框。

第二调整模块410，用于利用第二检测框回归模型对所述目标物体结果框进行修正，得到调整之后的目标物体结果框；

第二输出模块411，用于在所述待检测图像中输出所述调整之后的目标物体结果框；

所述第二类样本图像的目标物体结果框按照下述方式确定：

获取第二类样本图像中的目标物体候选框；

从置信度大于第一阈值的目标物体候选框中，对于重合度大于重合阈值的任意两个目标物体候选框，选择置信度最大的目标物体候选框作为该第二类样本图像的目标物体结果框。

本申请实施例中，由于FCN分类模型对目标物体的预测是非常快速的，且比较准确，利用CNN以及SVM，进一步保证了检测的精度，若通过CNN+SVM判断该检测框不是人体，还可以通过抽取候选框进行进一步的判定，如果为人体，则可以结束流程，从而既保证了检测的速度，又保证了检测的精度。

如在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可理解，硬件制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名称的差异来作为区分组件的方式，而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”为一开放式用语，故应解释成“包含但不限定于”。“大致”是指在可接收的误差范围内，本领域技术人员能够在一定误差范围内解决所述技术问题，基本达到所述技术效果。此外，“耦接”一词在此包含任何直接及间接的电性耦接手段。因此，若文中描述一第一装置耦接于一第二装置，则代表所述第一装置可直接电性耦接于所述第二装置，或通过其他装置或耦接手段间接地电性耦接至所述第二装置。说明书后续描述为实施本申请的较佳实施方式，然所述描述乃以说明本申请的一般原则为目的，并非用以限定本申请的范围。本申请的保护范围当视所附权利要求所界定者为准。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的商品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。

上述说明示出并描述了本申请的若干优选实施例，但如前所述，应当理解本申请并非局限于本文所披露的形式，不应看作是对其他实施例的排除，而可用于各种其他组合、修改和环境，并能够在本文所述申请构想范围内，通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本申请的精神和范围，则都应在本申请所附权利要求的保护范围内。

Claims

1.一种图像检测方法，其特征在于，包括：

抽取所述目标物体检测框中的图像特征；

2.如权利要求1所述的方法，其特征在于，在检测所述目标物体检测框不是目标物体时，所述方法还包括：

3.如权利要求1或2所述的方法，其特征在于，所述检测框分类模型为全卷积网络FCN分类模型；

4.如权利要求1或2所述的方法，其特征在于，所述抽取所述目标物体检测框中的图像特征包括：

5.如权利要求1所述的方法，其特征在于，在检测所述目标物体检测框为目标物体之后，所述方法还包括：

6.如权利要求2或5所述的方法，其特征在于，所述根据所述目标检测框的图像特征，利用目标物体分类器，检测所述目标物体检测框是否为目标物体包括：

7.如权利要求6所述的方法，其特征在于，在确定所述目标物体候选框为目标物体之后，所述方法还包括：

所述第二类样本图像的目标物体结果框按照下述方式确定：

获取第二类样本图像中的目标物体候选框；

8.一种图像检测装置，其特征在于，包括：

9.如权利要求8所述的装置，其特征在于，还包括：

10.如权利要求8所述的装置，其特征在于，所述检测框分类模型为全卷积网络FCN分类模型；

11.如权利要求8或9所述的装置，其特征在于，所述第一特征抽取模块具体用于利用卷积神经网络CNN模型，抽取所述目标物体检测框的CNN特征；

12.如权利要求8所述的装置，其特征在于，还包括：

13.如权利要求8或12所述的装置，其特征在于，所述第一检测模块包括：

所述第二检测模块包括：

14.如权利要求13所述的装置，其特征在于，还包括：

所述第二类样本图像的目标物体结果框按照下述方式确定：

获取第二类样本图像中的目标物体候选框；