CN105868708B

CN105868708B - 一种图像目标识别方法及装置

Info

Publication number: CN105868708B
Application number: CN201610182790.9A
Authority: CN
Inventors: 翁超
Original assignee: Ruijie Networks Co Ltd
Current assignee: Ruijie Networks Co Ltd
Priority date: 2016-03-28
Filing date: 2016-03-28
Publication date: 2019-09-20
Anticipated expiration: 2036-03-28
Also published as: CN105868708A

Abstract

本发明实施例提供一种图像目标识别方法及装置，涉及图像处理领域，实现高实时性及高精确度的图像目标识别。具体方案包括：通过在原始图像中，基于Vibe前景提取算法提取出位于预设的有效检测区域内的M个候选检测区域；根据M个候选检测区域的HOG特征扫描结合SVM分类器检测的检测结果，获取N个第一目标区域；若所述M个候选检测区域中存在漏检区域，根据每个所述漏检区域在所述原始图像中的位置分布区域，获取Q个第二目标区域；对所有目标区域进行运动追踪，得到目标识别结果。本发明用于图像目标识别。

Description

一种图像目标识别方法及装置

技术领域

本发明涉及图像处理领域，尤其涉及一种图像目标识别方法及装置。

背景技术

在商业竞争日益激烈的今天，有效的商业管理已经成为商业营销成败的重要因素。通过在经营区域安装客流统计设备(摄像头)，精准的检测统计每个入口实时客流进出人数，以便于根据数据科学的商业管理。

目前检测统计的过程是基于行人特征来训练分类器来进行，具体是将获取的视频图像逐帧扫描并对比分类器进行识别，常用的识别方法是梯度方向直方图(histogram oforiented gradient，简称HOG)特征扫描结合支持向量机(support vector machine，简称svm)分类器。

在处理每帧图像时，HOG特征扫描结合图像金字塔模型对原始图像进行识别，过程耗时长，使得客流统计实时性不够。目前，为了提高客流统计的实时性，在HOG特征扫描图像前，对原始图像进行前景预处理，得到有效的、感兴趣的检测区域再利用HOG特征去扫描，以缩小扫描范围，缩短检测时间。

目前采用的前景预处理算法有码本算法、背景差分算法等，一方面，这些算法的背景模型需要大量的视频帧图训练才能初始化，即应用程序启动时无法马上使用，将造成一定的漏检；另一方面，这些算法在前景区域提取上的性能和准确率不高，存在将人头区域判定为背景区域的可能，使得后续的HOG特征无法扫描到被判定为背景区域的人头而导致漏检。

因此，在处理图像进行客流统计的过程中，高实时性且高精确度的识别，是一个亟待解决的问题。

发明内容

本发明实施例提供一种图像目标识别方法及装置，实现高实时性且精准的图像识别。

为达到上述目的，本发明的实施例采用如下技术方案：

第一方面，提供一种图像目标识别方法，包括：

在原始图像中，基于视觉背景提取器(visual background extractor，简称Vibe)前景提取算法提取出位于预设的有效检测区域内的M个候选检测区域；其中，所述M大于或等于1；

根据所述M个候选检测区域的HOG特征扫描结合SVM分类器检测的检测结果，获取N个第一目标区域；其中，所述N大于或等于0

若所述M个候选检测区域中存在漏检区域，根据每个所述漏检区域在所述原始图像中的位置分布区域，获取Q个第二目标区域；其中，所述漏检区域为所述M个候选检测区域中，未获取到第一目标区域的候选检测区域；所述Q大于或等于0；

对所有目标区域中每个目标区域进行运动追踪，得到目标识别结果；其中，所述所有目标区域包括所述第一目标区域和所述第二目标区域，或者，所述第一目标区域，或者，所述第二目标区域。

第二方面，提供一种图像目标识别装置，所述装置包括：

提取单元，用于在原始图像中，基于视觉背景提取器Vibe前景提取算法提取出位于预设的有效检测区域内的M个候选检测区域；其中，所述M大于或等于1；

获取单元，用于根据所述M个候选检测区域的梯度方向直方图HOG特征扫描结合支持向量机SVM分类器检测的检测结果，获取N个第一目标区域；其中，所述N大于或等于0；

若所述M个候选检测区域中存在漏检区域，所述获取单元还用于根据每个所述漏检区域在所述原始图像中的位置分布区域，获取Q个第二目标区域；其中，所述漏检区域为所述M个候选检测区域中，未获取到第一目标区域的候选检测区域；所述Q大于或等于0；

追踪单元，用于对所有目标区域中每个目标区域进行运动追踪，得到目标识别结果；其中，所述所有目标区域包括所述第一目标区域和所述第二目标区域，或者，所述第一目标区域，或者，所述第二目标区域。

本发明实施例提供的图像目标识别方法及装置，通过在原始图像中，基于Vibe前景提取算法提取出位于预设的有效检测区域内的M个候选检测区域；根据M个候选检测区域的HOG特征扫描结合SVM分类器检测的检测结果，获取N个第一目标区域；若所述M个候选检测区域中存在漏检区域，根据每个所述漏检区域在所述原始图像中的位置分布区域，获取Q个第二目标区域；对所有目标区域进行运动追踪，得到目标识别结果。一方面，在原始图像中设置了有效检测区域，缩小了扫描区域，提高了实时性；另一方面，在有效检测区域中通过Vibe前景提取算法提取出候选检测区域，进一步缩小了扫描区域，更好的提高了实时性；同时，由于Vibe前景提取算法只需要一帧图像即可完成初始化，初始化时间短，减小了由于初始化导致的漏检率；再一方面，基于Vibe前景提取算法得到的候选检测区域，可以获取到漏检区域，并基于图像中目标分布特征补充漏检区域中的目标区域，降低了漏检率；因此，本发明的方案兼顾了实时性和精确度，是一种高实时性及高精确度的图像目标识别。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种图像目标识别装置的结构示意图；

图2为本发明实施例提供的一种图像目标识别方法的流程示意图；

图3为本发明实施例提供的一种区域位置关系图；

图4为本发明实施例提供的一种判断前景点的示意图；

图4A为本发明实施例提供的一种前景点集合外接矩形区域示意图；

图5为本发明实施例提供的另一种图像目标识别装置的结构示意图；

图6为本发明实施例提供的再一种图像目标识别装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供的图像目标识别方法，应用于本发明实施例提供的图像目标识别装置，该设备可以为客流统计系统中的计算机的部分或全部。图1示出的是与本发明各实施例相关的图像目标识别装置的结构示意图。

如图1所示，该图像目标识别装置10可以包括：处理器101、存储器102、通信总线103。处理器101可以通过运行或执行存储在存储器102内的软件程序和/或模块，以及调用存储在存储器102内的数据，执行图像目标识别装置10的各种功能。通信总线103用于连接图像目标识别装置10中的各个单元，可以是工业标准体系结构(Industry StandardArchitecture，简称为ISA)总线、外部设备互连(Peripheral Component，简称为PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture，简称为EISA)总线等。该总线103可以分为地址总线、数据总线、控制总线等。为便于表示，图1中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

下面结合附图，对本发明的实施例进行具体阐述。为了更详细的描述方案内容，本发明的实施例中采用多个示例予以说明，需要说明的是，示例仅是以举例的形式描述相关内容，并不是对实现过程、形式及内容等的具体限定。

实施例一

本发明实施例一提供一种图像目标识别方法，如图2所示，所述方法可以包括：

S201、在原始图像中，基于Vibe前景提取算法提取出位于预设的有效检测区域内的M个候选检测区域。

其中，所述M大于或等于1。所述原始图像可以为视频中的一帧图像。

需要说明的是，在原始图像中，基于Vibe前景提取算法提取候选检测区域时，可能获取不到候选检测区域，或者，可能获取不到位于预设的有效检测区域内的候选检测区域，此时，则认为原始检测图像无效，不进行后续处理。

具体的，在实际应用中，采集的图像中并不是全部区域都对于后续的识别处理是有效的，在这种情况下，可以根据经验数据，认为采集的图像中有一部分有效区域，可能出现目标，而有效区域之外的区域绝对不可能出现目标，这样，就可以预先设置一个预设的有效检测区域，该区域比原始图像面积小，集中在目标可能出现的范围；当采集到原始图像时，仅处理原始图像中预设的有效检测区域内的区域，很好的提高了处理速度。

示例性的，假设在人流统计的场景中，摄像头拍摄出入口的视频图像，预设的有效检测区域可以为：视频中行人出入通道的边界作为左右范围，以自定义的进出统计线作为上下范围所围成的区域，即该区域比原图面积小，集中在行人出入范围。

示例性的，如图3所示，示意出了一种图像目标识别过程中，原始图像、预设的有效检测区域，以及从有效检测区域中得到的候选检测区域、候选检测区域中包括的目标的位置关系。

需要说明的是，上述示例只是以举例的形式，对预设的有效检测区域的位置进行说明，并不是对此的限定。在实际应用中，可以根据实际需求设定预设的有效检测区域，本发明对此不进行限定。

具体的，S201的具体执行过程可以通过下述两种方案中的任意一种实现：

第一种方案：

在第一种方案中，执行S201的过程可以包括下述步骤1和步骤2：

步骤1、基于Vibe前景提取算法，识别原始图像中预设的有效检测区域中每个像素点为前景点或背景点，得到有效检测区域的前景图。

需要说明的是，Vibe前景提取算法已经是常规的技术，本发明实施例中对算法过程不再进行赘述，仅简要描述与本发明相关的内容。

具体的可选的，Vibe前景提取算法识别一个像素点为前景点或背景点的过程可以包括：

计算像素点与像素点位置的背景样本集中每一个样本点的距离，若与像素点之间的距离小于或等于预设统计半径的样本点的数量，大于或等于预设门限值，则像素点为背景点，否则为前景点。

统计该像素点的样本集中，落入以该像素点为中心，以预设统计半径为半径的区域中的样本点数量，若大于或等于预设门限值，则像素点为背景点，否则为前景点。

示例性的，如图4所示，以判断图像中X点处的像素点前景点还是背景点为例，对该过程进行说明。

假设X点处的像素值V(X)，X处的背景样本集(样本集大小为6，即包括6个样本)为M(x)＝{V1,V2,...V6}，统计落在以X处为中心R为半径的区域中样本的数量为2个；假设预设门限值为2，则认为X点为背景点。

进一步的，在识别出有效检测区域的中每个像素点为前景点或背景点后，得到有效检测区域的前景图的过程可以包括：

将前景点的像素值设置为255，将背景点的像素点设置为0，则得到有效检测区域的前景图。

需要说明的是，预设统计半径的取值、预设门限值的取值，可以根据实际需求设定，本发明对此不进行具体限定。

进一步的，在Vibe前景提取算法中，通过更新策略更新背景样本集，本发明对该过程在此不在进行赘述。

具体的，得到前景图，即得到了原始图像中哪些像素点是前景点，哪些像素点是背景点。

步骤2、将有效检测区域的前景图中，任意两个前景点之间距离间隔小于或等于第一预设阈值的前景点集合的外接矩形区域，作为一个候选检测区域，得到M个候选检测区域。

其中，第一预设阈值为预先设置的，一个目标区域中任意两个前景点的距离间隔的最大值。

具体的，当两个前景点之间的距离间隔小于或等于第一预设阈值，则认为这两个前景点属于同一个目标区域；当两个前景点之间的距离间隔大于第一预设阈值，则认为这两个前景点属于不同的目标区域。

进一步可选的，执行步骤2的具体过程，包括：获取前景图中每两个前景点的距离间隔，将任意两个前景点之间距离间隔小于或等于第一预设阈值的前景点记录为一个前景点集合，得到至少一个前景点集合，获取所述至少一个前景点集合中每个前景点集合的外接矩形区域，则作为一个候选检测区域。

其中，一个前景点集合的外接矩形区域，包括：以该前景点集合中位置上最上方的前景点的横向为外接矩形区域的一个边长，以该前景点集合中位置上最下方的前景点的横向为外接矩形区域的另一个边长，以该前景点集合中位置上最左方的前景点的纵向为外接矩形区域的另一个边长，以该前景点集合中位置上最右方的前景点的纵向为外接矩形区域的另一个边长，得到外接矩形区域。

示例性的，如图4A所示，假设一个前景点集合中包括的前景点有10个，该前景点集合的外接矩形区域为图4A中的实线框区域。

第二种方案：

在第二种方案中，执行S201的过程可以包括下述步骤1和步骤2：

步骤1、基于Vibe前景提取算法，识别原始图像中每个像素点为前景点或背景点，得到原始图像的前景图。

步骤2、将原始图像的前景图中，任意两个前景点之间距离间隔小于或等于第一预设阈值的前景点集合的外接矩形区域，作为一个候选检测区域，过滤去除位于预设的有效检测区域之外的候选检测区域，得到M个候选检测区域。

需要说明的是，步骤2的执行过程，已经在上述第一种方案中进行了详细描述，此处不再进行赘述。

其中，上述两种方案中，均要求候选检测区域的长宽大于或等于所述HOG特征扫描时金字塔模型中最小图层与预设检测窗口两者中的较小区域的长宽。

进一步的，若通过前景点集合的外接矩形区域获取的一个候选检测区域的长宽不满足上述条件，则从中心网外扩大该矩形区域，使得候选检测区域的长宽满足上述条件。

进一步的，在上述两种方案中，执行步骤2之前，若前景图中分布有离散的点，则进行图像处理，使得离散的点可以加入前景点集合中，本发明对于该过程不再进行赘述。

S202、根据M个候选检测区域的HOG特征扫描结合SVM分类器检测的检测结果，获取N个第一目标区域。

其中，所述N大于或等于0。

进一步的，在执行S202之前，需要分别对每个候选检测区域，进行HOG特征扫描结合SVM分类器检测。

进一步的，在描述S202的执行过程之前，先简要对HOG特征扫描结合SVM分类器检测的过程描述如下：

具体的，HOG特征扫描结合SVM分类器检测可以包括：依次进行HOG特征扫描、与基于HOG特征的SVM分类器比较、聚类合并及过滤操作。

进一步的，进行HOG特征扫描时，结合的金字塔模型的中止条件为直至某一图层的图像长宽小于检测窗口的大小，默认最多64层。

进一步的，当采集的原始图像稍大，按照金字塔模型对每个图层从头到尾全部扫描，导致处理速度慢，影响实时性，因此，本发明的方案中提出，可以限制HOG特征扫描时，结合的金字塔模型的层数在出现目标的图层，大大减少需要扫描的图层，提高处理速度。

具体的，所述限制HOG特征扫描时，结合的金字塔模型的层数在出现目标的图层可以实现为：HOG特征扫描时的金字塔模型为从原始图像层至预设层数；其中，预设层数为预设的能识别出目标的临界层。

需要说明的是，本发明对于预设层数的具体内容不进行限定，可以根据实际需求设定。

优选的，在人流识别时，预设层数可以取将大人人头缩小到与小孩人头大小相近的那一层。

其中，基于HOG特征的SVM分类器，是采用大量的目标图像训练生成，本发明对训练过程不再进行赘述。

可选的，所述过滤操作包括下述操作中的至少一种：过滤去除所述检测结果中合并数小于第四预设阈值的备选区域，过滤去除所述检测结果中被其他备选区域包含的备选区域。

其中，检测结果包括的每个备选区域，均经过了聚类合并，一个备选区域由Y个过程区域合并而来，就称为这个备选区域的合并数为Y。

需要说明的是，第四预设阈值的取值，可以根据实际需求设定，本发明对此不进行具体限定。第四预设阈值越高，成为目标区域的条件越严格，可能漏检率更高，第四预设阈值越低，误检率越高。

优选的，所述第四预设阈值可以大于或等于1。

进一步优选的，所述第四预设阈值可以为3。

其中，检测结果中包括的多个备选区域，面积大小可能不同，根据备选区域的坐标，可以判断备选区域是不是被其他备选区域包含，如果出现被包含的情况，则将被包含的滤除。

当然，所述过滤操作还可以包括其他过滤方式，本发明对此不进行具体限定。

需要说明的是，依次进行HOG特征扫描、与基于HOG特征的SVM分类器比较、聚类合并及过滤操作为常规技术，本发明对于该过程不再进行赘述。

进一步的，对每个候选检测区域执行HOG特征扫描结合SVM分类器检测后，可以得到M个候选检测区域的HOG特征扫描结合SVM分类器检测的检测结果，该检测结果中包括多个备选区域；其中，一个备选区域的大小为预设的检测窗口的大小。

具体的，在对每个候选检测区域执行HOG特征扫描结合SVM分类器检测时，对一个候选检测区域执行HOG特征扫描结合SVM分类器检测，可能获取不到备选区域，也可能获取到多个备选区域。

进一步的，接下来详细描述S202的具体执行过程。

具体的，执行S202的过程，可以包括但不限于下述两种方案：

第一种方案：假设M个候选检测区域的HOG特征扫描结合SVM分类器检测的检测结果包括X个备选区域，所述X大于或等于所述N。

在第一种方案中，执行S202的过程，可以包括下述步骤A至步骤C：

步骤A、将原始图像转换为HSV颜色空间图，并分解得到亮度分量图。

其中，HSV颜色空间图是根据颜色的直观特性创建的一种颜色空间,也称六角锥体模型。这个模型中颜色的参数分别是：色调(Hue，简称H)，饱和度(Saturation，简称S)，明度(Value，简称V)。

需要说明的是，将图像转换为HSV颜色空间图并分解得到亮度分量图的过程，本发明实施例不进行限定，可以根据实际需求实现，此处不再进行赘述。

步骤B、根据亮度分量图，分别统计获取每个所述备选区域的亮度参数。

需要说明的是，在步骤B中，获取每一个备选区域的亮度参数的过程均相同，此处仅以一个备选区域为例，对执行步骤B的过程进行详细描述；其中，所述一个备选区域为所述X个备选区域中任一个备选区域。

需要说明的是，根据亮度参数的定义不同，根据亮度分量图，统计获取第一备选区域的亮度参数的过程也不同。

可选的，对于第一备选区域，根据亮度分量图，统计获取第一备选区域的亮度参数，可以通过下述两种实现方式中任意一种实现：

第一种实现方式：定义亮度参数为亮度概率值。

在该实现方式中，对于第一备选区域，根据亮度分量图，统计获取第一备选区域的亮度参数具体可以包括：

将亮度分量取值划分为S个亮度预设区间；统计第一备选区域的参考区域在亮度分量图的对应区域中，亮度值位于每个亮度预设区间的像素点数量，并归一化为第一备选区域在每个亮度预设区间的概率值；将第一备选区域在统计亮度预设区间的概率值之和作为第一备选区域的亮度概率值。

其中，所述统计亮度预设区间为S个亮度预设区间中的至少一个。

可选的，第二备选区域的参考区域为所述第二备选区域，或者，第二备选区域的参考区域为进行所述HOG特征扫描时金字塔模型中首次扫描的包括第二备选区域的区域。所述第二备选区域为所述X个备选区域中任一个备选区域。

需要说明的是，可以根据实际需求，设定S的取值，本发明对此不进行具体限定。

优选的，所述S可以为7。

需要说明的是，可以根据实际需求，设定统计亮度预设区间的个数，以及在S个亮度预设区间中的位置，本发明对此不进行具体限定。

示例性的，假设备选区域的参考区域为矩形j，根据矩形j的坐标，可以获取原始图像的亮度分量图中矩形j位置的对应区域，大小与矩形j大小一致。

将亮度分量的取值范围0至255，均分为S＝7个亮度预设区间，不整除的可以取整，假设划分后的7个亮度预设区间分别为：亮度预设区间1(0～36)、亮度预设区间2(37～73)、亮度预设区间3(74～110)、亮度预设区间4(111～147)、亮度预设区间5(148～184)、亮度预设区间6(185～221)、亮度预设区间7(222～255)。

假设原始图像的亮度分量图中矩形j位置的对应区域中，共包括300个像素点，根据每个像素点的亮度值，统计得到：这300个像素点中，80个像素点的亮度值处于亮度预设区间1，归一化为27％；75个像素点的亮度值处于亮度预设区间2，归一化为25％；62个像素点的亮度值处于亮度预设区间3，归一化为21％；45个像素点的亮度值处于亮度预设区间4，归一化为15％；28个像素点的亮度值处于亮度预设区间5，归一化为10％；8个像素点的亮度值处于亮度预设区间6，归一化为3％；2个像素点的亮度值处于亮度预设区间7，归一化为1％。

假设统计亮度预设区间为7个亮度预设区间中的亮度预设区间1和亮度预设区间2，那么，该备选区域的亮度概率值则为27％+25％＝52％。

第二种实现方式：定义亮度参数为亮度值。

在该实现方式中，对于第三备选区域，根据亮度分量图，统计获取第三备选区域的亮度参数具体可以包括：

统计第三备选区域的参考区域在亮度分量图的对应区域中，所有像素点的亮度值之和，作为第三备选区域的亮度值。

需要说明的是，上面仅示例说明了两种根据亮度分量图，统计一个备选区域的亮度参数的方法，并不是对此的具体限定。

步骤C、从X个备选区域中，选取亮度参数满足预设条件的备选区域，作为N个第一目标区域。

其中，亮度参数满足预设条件的备选区域，则认为是包括目标的区域，则保留，否则丢弃。

需要说明的是，根据亮度参数的定义不同，预设条件的内容不同。

可选的，若亮度参数为亮度概率值，所述预设条件可以为亮度概率值大于或等于概率值门限。

需要说明的是，概率值门限可以根据实际需求设定，本发明对此不进行具体限定。

可选的，若亮度参数为亮度值，所述预设条件可以为亮度值小于或等于亮度门限。

需要说明的是，亮度门限可以根据实际需求设定，本发明对此不进行具体限定。

第二种方案：

将检测结果中包括的备选区域，直接作为N个第一目标区域。

对比而言，上述第一种方案通过亮度分量的分类，将由于亮度原因(比如影子、反光、水渍、污渍等)造成的误检排除，降低了误检率。

可选的，通过S202，一个候选检测区域可以得到多个第一目标区域，也可能获取不到第一目标区域。

进一步的，在执行S202之后，可以根据获取的N个第一目标区域，与M个候选检测区域的归属关系，判断M个候选检测区域中是否存在漏检区域。

其中，所述漏检区域为所述M个候选检测区域中，未获取到第一目标区域的候选检测区域。

可选的，若M个候选检测区域中存在漏检区域，则执行S203和S204；若M个候选检测区域中不存在漏检区域，且N不等于0，则直接执行S204。

S203、根据每个漏检区域在原始图像中的位置分布区域，获取Q个第二目标区域。

其中，Q大于或等于0。

当Q等于0时，说明漏检区域中并不包含目标。

进一步的，若N等于0，且Q等于0，说明原始图像中不存在目标，则结束流程，丢弃该原始图像。

其中，漏检区域在原始图像中的位置分布区域，是指漏检区域在原始图像中的具体位置，可以根据漏检区域的坐标获取。

具体的，执行S203的过程，可以通过下述两种方案中的任意一种实现：

方案A、

分别获取每个漏检区域的灰度图，并进行二值化，得到每个漏检区域的二值图；

确定每个漏检区域在各自的二值图中，目标位置中黑色像素点最多的预设检测窗口大小的区域为第二目标区域，得到Q个第二目标区域；其中，所述目标区域为所述位置分布区域在所述二值图中的对应区域。

可选的，获取一个漏检区域的灰度图的过程可以包括：先获取原始图像的灰度图，根据该漏检区域的坐标，获取原始图像灰度图中，该漏检区域位置的区域，则为该漏检区域的灰度图。

可选的，获取一个漏检区域的灰度图的过程可以包括：先获取原始图像的灰度图，将该漏检区域的前景图与原始图像的灰度图与运算的结果，与漏检区域的前景图取反的结果，进行加运算，则为该漏检区域的灰度图。

其中，将一个灰度图二值化的过程可以为：将灰度图中每个像素点的像素值与第五预设阈值比较，若大于或等于，则将该像素点的像素值置为255，若小于，则将该像素点的像素值置为0。

下面通过举例说明一个漏检区域的在该漏检区域的二值图中的目标位置。

示例性的，假设漏检区域位于原始图像的左上角，横向占据原始图像长度的前六分之一，纵向占据原始图像宽度的上五分之一，那么该漏检区域在自身的二值图中的目标区域则为二值图中的左上角，横向占据二值图长度的前六分之一，纵向占据二值图的上五分之一的区域。

同样的，假设漏检区域位于原始图像的中间位置，横向占据原始图像长度上的X1至X2，纵向占据原始图像宽度上的Y1至Y2，那么该漏检区域在自身的二值图中的目标区域则为二值图中的中间位置，横向占据二值图长度上的X1至X2，纵向占据上的Y1至Y2。

其他以此类推，不再一一赘述。

方案B、

将每个漏检区域在各自的前景图中，目标位置中黑色像素点最多的预设检测窗口大小的区域为第二目标区域，得到Q个第二目标区域；其中，所述目标区域为所述位置分布区域在所述二值图中的对应区域。

需要说明的是，上面仅是列举了两种执行S203的方案，并不是对执行S203的过程的具体限定。凡是根据每个漏检区域在原始图像中的位置分布区域，获取Q个第二目标区域，都属于本发明的保护范围。

S204、对所有目标区域中每个目标区域进行运动追踪，得到目标识别结果。

其中，所有目标区域包括第一目标区域和第二目标区域，或者，第一目标区域，或者，第二目标区域。

其中，若在执行S204之前，执行了S203，则所有目标区域包括N个第一目标区域和Q个第二目标区域。

需要说明的是，所有目标区域包括的是N个第一目标区域和Q个第二目标区域；因此，所有目标区域包括的具体内容，取决于N与Q的值。

具体的，当N等于0，Q不等于0时，所有目标区域仅包括第二目标区域；当N不等于0，Q等于0时，所有目标区域仅包括第一目标区域。

若在执行S204之前，未执行S203，则所有目标区域包括N个第一目标区域。

进一步的，运动追踪可以将多帧图像中识别出的同一个目标，辨认为同一个目标，防止误检。

具体的，执行S204的具体过程，可以通过下述两种方案中任一种实现，本发明对此不进行具体限定。

方案一、

采用常规的卡尔曼追踪法实现。

本发明对常规的卡尔曼追踪法的过程在此不再进行赘述。

方案二、

可选的，在通过方案二执行S204时，需判断是否已经存在历史数据；根据是否存在历史数据，S204的执行过程不同。

需要说明的是，对每个目标区域执行S204的过程相同，此处仅以第三目标区域或第四目标区域为例，对执行S204的过程进行描述。其中，第三目标区域或第四目标区域为所有目标区域中任一个目标区域。

具体的，若在执行S204时，不存在历史数据，对于第三目标区域，执行S204的具体过程可以包括：

将第三目标区域作为离散点保存为历史数据。

这样一来，下次进行运动追踪时，则有历史数据可参考。

具体的，若在执行S204时，存在历史数据，对于第四目标区域，执行S204的具体过程，可以包括：

对第四目标区域，结合历史数据进行运动追踪，得到目标识别结果。

进一步的，历史数据包括至少一个轨迹线，轨迹线包括按序排列的至少一个目标。

其中，在历史数据中，可以将多次识别为同一个目标的目标区域按序保存为一个轨迹线，记录了个目标的运动轨迹。

可选的，在历史数据包括的轨迹线中，目标区域可以按时间顺序或者其他顺序记录，本发明对此不进行具体限定。

进一步具体的，对第四目标区域，结合历史数据进行运动追踪，得到目标识别结果的具体过程，可以包括：

判断历史数据中是否存在最后一个目标区域与第四目标区域的位置距离小于或等于第二预设阈值的轨迹线。其中，轨迹线中最后一个目标区域是指轨迹线中按序排列的至少一个目标中最后一个目标区域。

若历史数据中不存在最后一个目标区域与第四目标区域的位置距离小于或等于第二预设阈值的轨迹线，将第四目标区域作为离散点保存至历史数据中。在这种情况中，第四目标区域在历史数据中不属于任何一个轨迹线。

若历史数据中存在与第四目标区域的位置距离小于或等于第二预设阈值的轨迹线，再判断第四目标区域的位置是否符合该轨迹线的移动特征。

若第四目标区域与历史数据中第一轨迹线中最后一个目标的位置距离小于或等于第二预设阈值，且第四目标区域的位置符合第一轨迹线的移动特征，则将第四目标区域作为所述第一轨迹线的最后一个目标保存。在这种情况中，第四目标区域在历史数据中属于第一轨迹线。其中，第一轨迹线为历史数据中任意一个轨迹线。

进一步的，历史数据中一个离散点也可以是一个轨迹线。当一个轨迹线为一个离散点时，该轨迹线的最后一个目标就是这个离散点。

也就是说，当判断第四目标区域与历史数据中第一轨迹线中最后一个目标的位置距离小于或等于第二预设阈值，且第四目标区域的位置符合所述第一轨迹线的移动特征，说明第四目标区域中的目标已经被之前的图像识别过程检测到，则记录为同一个目标(将第四目标区域作为所述第一轨迹线的最后一个目标保存)即可。

其中，第四目标区域的位置符合所述第一轨迹线的移动特征，是指根据第一轨迹线的方向、角度、速度等运动参数，计算出的在获取第四目标区域的时间目标应该移动到的位置就是第四目标区域的位置区域，则说明第四目标区域的位置符合所述第一轨迹线的移动特征。

若第四目标区域与所述历史数据中第一轨迹线中最后一个目标的位置距离小于或等于第二预设阈值，但第四目标区域的位置不符合第一轨迹线的移动特征，将第四目标区域作为离散点保存至历史数据中。

示例性的，假设在对一帧图像识别后，得到目标区域A，且无历史图像，则将目标区域A保存为历史数据，构成一个轨迹线。

再对下一帧图像识别后，得到目标区域B，此时有历史图像，且确定目标区域B与历史数据中目标区域A构成的轨迹线中最后一个目标(目标区域A)的位置距离小于第二预设阈值，且目标区域B的位置符合目标区域A构成的轨迹线的移动特征，将目标区域B保存为历史数据中目标区域A构成的轨迹线的最后一个目标，即，此时历史数据中包括目标区域A和目标区域B构成的一个轨迹线，且目标区域B为该轨迹线的最后一个目标区域。

再对下一帧图像识别后，得到目标区域C，此时有历史图像，且确定目标区域C，与历史数据中目标区域A和目标区域B构成的轨迹线中最后一个目标(目标区域B)的位置距离小于第二预设阈值，且目标区域C的位置符合目标区域A和目标区域B构成的轨迹线的移动特征，将目标区域C保存为历史数据中目标区域A和目标区域B构成的轨迹线的最后一个目标，即，此时历史数据中包括依次由目标区域A、目标区域B和目标区域C构成的一个轨迹线，且目标区域C为该轨迹线的最后一个目标区域。

需要说明的是，上述示例只是通过举例的方式对运动追踪的过程进行简要说明，并不是对该过程的具体限定。

需要说明的是，本发明对于根据第一轨迹线的方向、角度、速度等运动参数，计算出的在获取第四目标区域的时间目标应该移动到的位置的过程不进行赘述。

还需要说明的是，第二预设阈值的取值可以根据实际需求设定，本发明对此不进行具体限定。

进一步的，当判断历史数据中不存在最后一个目标区域与第四目标区域的位置距离小于或等于第二预设阈值的轨迹线，或者，若判断第四目标区域与历史数据中第一轨迹线中最后一个目标的位置距离小于或等于第二预设阈值，但第四目标区域的位置不符合第一轨迹线的移动特征，则说明第四目标区域中包括的目标是第一次出现或者是误检，将第四目标区域作为离散点保存至历史数据中，以便后续帧图像识别时，结合参考。

进一步的，当采用上述方案二进行运动追踪时，所述方法还可以包括：将历史数据中的过期离散点清除；其中，获取所述过期离散点的图像帧数与当前图像帧数间隔大于或等于第三预设阈值。

其中，过期的离散点说明是误检，清除可以提高图像目标识别的准确度，降低误检率。

需要说明的是，执行将历史数据中的过期离散点清除时，可以周期性执行，例如每处理一帧原始图像，执行一次清除，或者，也可以定期执行，本发明对于执行将历史数据中的过期离散点清除的时刻不进行具体限定。

本发明实施例提供的图像目标识别方法，通过在原始图像中，基于Vibe前景提取算法提取出位于预设的有效检测区域内的M个候选检测区域；根据M个候选检测区域的HOG特征扫描结合SVM分类器检测的检测结果，获取N个第一目标区域；若所述M个候选检测区域中存在漏检区域，根据每个所述漏检区域在所述原始图像中的位置分布区域，获取Q个第二目标区域；对所有目标区域，结合历史数据进行运动追踪，得到目标识别结果。一方面，在原始图像中设置了有效检测区域，缩小了扫描区域，提高了实时性；另一方面，在有效检测区域中通过Vibe前景提取算法提取出候选检测区域，进一步缩小了扫描区域，更好的提高了实时性；同时，由于Vibe前景提取算法只需要一帧图像即可完成初始化，初始化时间短，减小了由于初始化导致的漏检率；再一方面，基于Vibe前景提取算法得到的候选检测区域，可以获取到漏检区域，并基于图像中目标分布特征补充漏检区域中的目标区域，降低了漏检率；因此，本发明的方案兼顾了实时性和精确度，是一种高实时性及高精确度的图像目标识别。

实施例二

本发明实施例二提供一种图像目标识别装置50，参见图5，所述装置50可以包括：

提取单元501，用于在原始图像中，基于Vibe前景提取算法提取出位于预设的有效检测区域内的M个候选检测区域。其中，所述M大于或等于1。

获取单元502，用于根据M个候选检测区域的HOG特征扫描结合SVM分类器检测的检测结果，获取N个第一目标区域。其中，所述N大于或等于0。

若M个候选检测区域中存在漏检区域，所述获取单元502还用于，根据每个漏检区域在原始图像中的位置分布区域，获取Q个第二目标区域。其中，所述漏检区域为所述M个候选检测区域中，未获取到第一目标区域的候选检测区域。所述Q大于或等于0。

追踪单元503，用于对所有目标区域中每个目标区域进行运动追踪，得到目标识别结果。其中，所述所有目标区域包括所述第一目标区域和所述第二目标区域，或者，所述第一目标区域，或者，所述第二目标区域。

可选的，提取单元501具体可以用于：

基于Vibe前景提取算法，识别所述原始图像中预设的有效检测区域中每个像素点为前景点或背景点，得到所述有效检测区域的前景图；

将所述有效检测区域的前景图中，任意两个前景点之间距离间隔小于或等于第一预设阈值的前景点集合的外接矩形区域，作为一个候选检测区域，据此得到M个候选检测区域；其中，所述候选检测区域的长宽大于或等于所述HOG特征扫描时金字塔模型中最小图层与预设检测窗口两者中的较小区域的长宽。

进一步可选的，提取单元501具体可以用于：

基于Vibe前景提取算法，识别所述原始图像中每个像素点为前景点或背景点，得到所述原始图像的前景图；

将所述原始图像的前景图中，任意两个前景点之间距离间隔小于或等于第一预设阈值的前景点集合的外接矩形区域，作为一个候选检测区域，过滤去除位于预设的有效检测区域之外的候选检测区域，据此得到M个候选检测区域；其中，所述候选检测区域的长宽大于或等于所述HOG特征扫描时金字塔模型中最小图层与预设检测窗口两者中的较小区域的长宽。

优选的，所述HOG特征扫描时的金字塔模型为从原始图像层至预设层数。其中，预设层数为预设的能识别出目标的临界层。

具体的，所述M个候选检测区域的HOG特征扫描结合SVM分类器检测的检测结果包括X个备选区域，所述获取单元502具体可以用于：

将所述原始图像转换为HSV颜色空间图，并分解得到亮度分量图；

根据所述亮度分量图，分别统计获取每个所述备选区域的亮度参数；

从所述X个备选区域中，选取亮度参数满足预设条件的备选区域，作为所述N个第一目标区域。

进一步可选的，所述亮度参数为亮度概率值，所述预设条件为亮度概率值大于或等于概率值门限。相应的，对于第一备选区域，所述获取单元502具体可以用于：

将亮度分量取值划分为S个亮度预设区间；

统计所述第一备选区域的参考区域在所述亮度分量图的对应区域中，亮度值位于每个所述亮度预设区间的像素点数量，并归一化为所述第一备选区域在每个所述亮度预设区间的概率值；其中，所述第一备选区域为所述X个备选区域中任一个备选区域；第二备选区域的参考区域为所述第二备选区域，或者为进行所述HOG特征扫描时金字塔模型中首次扫描的包括所述第二备选区域的区域；所述第二备选区域为所述X个备选区域中任一个备选区域；

将所述第一备选区域在统计亮度预设区间的概率值之和作为所述第一备选区域的亮度概率值；其中，所述统计亮度预设区间为所述S个亮度预设区间中的至少一个。

进一步可选的，所述亮度参数为亮度值，所述预设条件为亮度值小于或等于亮度门限。相应的，对于第三备选区域，所述获取单元503具体可以用于：

统计所述第三备选区域的参考区域在所述亮度分量图的对应区域中，所有像素点的亮度值之和，作为所述第三备选区域的亮度值；其中，所述第三备选区域为所述X个备选区域中任一个备选区域；第四备选区域的参考区域为所述第四备选区域，或者为进行所述HOG特征扫描时金字塔模型中首次扫描的包括所述第四备选区域的区域；所述第四备选区域为所述X个备选区域中任一个备选区域。

进一步的，所述获取单元502具体可以用于：

分别获取每个所述漏检区域的灰度图，并进行二值化，得到每个所述漏检区域的二值图；

确定每个所述漏检区域在各自的二值图中，目标区域中黑色像素点最多的预设检测窗口大小的区域为第二目标区域，得到所述Q个第二目标区域；其中，所述目标区域为所述位置分布区域在所述二值图中的对应区域。

可选的，若不存在历史数据，对于第三目标区域，所述追踪单元503具体可以用于：

将第三目标区域作为离散点保存为历史数据；其中，所述第三目标区域为所述所有目标区域中任一个目标区域。

可选的，若存在历史数据，对于第四目标区域，所述追踪单元503具体可以用于：

对第四目标区域，结合历史数据进行运动追踪，得到目标识别结果；其中，所述第四目标区域为所述所有目标区域中任一个目标区域。

进一步的，所述历史数据包括至少一个轨迹线，所述轨迹线包括按序排列的至少一个目标；所述追踪单元503具体可以用于：

若所述第四目标区域与所述历史数据中第一轨迹线中最后一个目标的位置距离小于或等于第二预设阈值，且所述第四目标区域的位置符合所述第一轨迹线的移动特征，则将所述第四目标区域作为所述第一轨迹线的最后一个目标保存；

若所述历史数据中不存在最后一个目标区域与所述第四目标区域的位置距离小于或等于所述第二预设阈值的轨迹线，或者，若所述第四目标区域与所述历史数据中第一轨迹线中最后一个目标的位置距离小于或等于第二预设阈值，但所述第四目标区域的位置不符合所述第一轨迹线的移动特征，将所述第四目标区域作为离散点保存至所述历史数据中。

进一步的，参见图6，所述装置50还可以包括：

清除单元504，用于将所述历史数据中的过期离散点清除；其中，获取所述过期离散点的图像帧数与当前图像帧数间隔大于或等于第三预设阈值。

本发明实施例提供的图像目标识别装置50，通过在原始图像中，基于Vibe前景提取算法提取出位于预设的有效检测区域内的M个候选检测区域；根据M个候选检测区域的HOG特征扫描结合SVM分类器检测的检测结果，获取N个第一目标区域；若所述M个候选检测区域中存在漏检区域，根据每个所述漏检区域在所述原始图像中的位置分布区域，获取Q个第二目标区域；对所有目标区域，结合历史数据进行运动追踪，得到目标识别结果。一方面，在原始图像中设置了有效检测区域，缩小了扫描区域，提高了实时性；另一方面，在有效检测区域中通过Vibe前景提取算法提取出候选检测区域，进一步缩小了扫描区域，更好的提高了实时性；同时，由于Vibe前景提取算法只需要一帧图像即可完成初始化，初始化时间短，减小了由于初始化导致的漏检率；再一方面，基于Vibe前景提取算法得到的候选检测区域，可以获取到漏检区域，并基于图像中目标分布特征补充漏检区域中的目标区域，降低了漏检率；因此，本发明的方案兼顾了实时性和精确度，是一种高实时性及高精确度的图像目标识别。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理包括，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，简称ROM)、随机存取存储器(Random Access Memory，简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种图像目标识别方法，其特征在于，包括：

在原始图像中，基于视觉背景提取器Vibe前景提取算法提取出位于预设的有效检测区域内的M个候选检测区域；其中，所述M大于或等于1；

根据所述M个候选检测区域的梯度方向直方图HOG特征扫描结合支持向量机SVM分类器检测的检测结果，获取N个第一目标区域；其中，所述N大于或等于0；

对所有目标区域中每个目标区域进行运动追踪，得到目标识别结果；其中，所述所有目标区域包括所述第一目标区域和所述第二目标区域，或者，所述第一目标区域，或者，所述第二目标区域；

存在历史数据，对于第四目标区域，对所述第四目标区域进行运动追踪，得到目标识别结果，包括：

对所述第四目标区域，结合历史数据进行运动追踪，得到目标识别结果；其中，所述第四目标区域为所述所有目标区域中任一个目标区域；

所述历史数据包括至少一个轨迹线，所述轨迹线包括按序排列的至少一个目标；所述对所述第四目标区域，结合历史数据进行运动追踪，得到目标识别结果，包括：

2.根据权利要求1所述的方法，其特征在于，所述在原始图像中，基于Vibe前景提取算法提取出位于预设的有效检测区域内的M个候选检测区域，包括：

3.根据权利要求1所述的方法，其特征在于，所述在原始图像中，基于Vibe前景提取算法提取出位于预设的有效检测区域内的M个候选检测区域，包括：

4.根据权利要求1-3任一项所述的方法，其特征在于，所述HOG特征扫描时的金字塔模型为从原始图像层至预设层数；其中，预设层数为预设的能识别出目标的临界层。

5.根据权利要求1-3任一项所述的方法，其特征在于，所述M个候选检测区域的HOG特征扫描结合SVM分类器检测的检测结果包括X个备选区域，所述根据所述M候选检测区域的HOG特征扫描结合SVM分类器检测的检测结果，获取N个第一目标区域，包括：

6.根据权利要求5所述的方法，其特征在于，所述亮度参数为亮度概率值，所述预设条件为亮度概率值大于或等于概率值门限；

对于第一备选区域，根据所述亮度分量图，统计获取所述第一备选区域的亮度参数，包括：

将亮度分量取值划分为S个亮度预设区间；

7.根据权利要求5所述的方法，其特征在于，所述亮度参数为亮度值，所述预设条件为亮度值小于或等于亮度门限；

对于第三备选区域，根据所述亮度分量图，统计获取所述第三备选区域的亮度参数，包括：

8.根据权利要求1-3任一项所述的方法，其特征在于，所述根据每个所述漏检区域在所述原始图像中的位置分布区域，获取Q个第二目标区域，包括：

9.根据权利要求1-3任一项所述的方法，其特征在于，不存在历史数据，对于第三目标区域，对所述第三目标区域进行运动追踪，得到目标识别结果，包括：

将所述第三目标区域作为离散点保存为历史数据；其中，所述第三目标区域为所述所有目标区域中任一个目标区域。

10.根据权利要求1所述的方法，其特征在于，所述方法还包括：

将所述历史数据中的过期离散点清除；其中，获取所述过期离散点的图像帧数与当前图像帧数间隔大于或等于第三预设阈值。

11.一种图像目标识别装置，其特征在于，所述装置包括：

若所述M个候选检测区域中存在漏检区域，所述获取单元还用于，根据每个所述漏检区域在所述原始图像中的位置分布区域，获取Q个第二目标区域；其中，所述漏检区域为所述M个候选检测区域中，未获取到第一目标区域的候选检测区域；所述Q大于或等于0；

追踪单元，用于对所有目标区域中每个目标区域进行运动追踪，得到目标识别结果；其中，所述所有目标区域包括所述第一目标区域和所述第二目标区域，或者，所述第一目标区域，或者，所述第二目标区域；

存在历史数据时，对于第四目标区域，所述追踪单元具体用于：

所述历史数据包括至少一个轨迹线，所述轨迹线包括按序排列的至少一个目标；所述追踪单元具体用于：

12.根据权利要求11所述的装置，其特征在于，所述M个候选检测区域的HOG特征扫描结合SVM分类器检测的检测结果包括X个备选区域，所述获取单元具体用于：

13.根据权利要求11或12所述的装置，其特征在于，不存在历史数据时，对于第三目标区域，所述追踪单元具体用于：