CN104301585A

CN104301585A - 一种运动场景中特定种类目标实时检测方法

Info

Publication number: CN104301585A
Application number: CN201410490143.5A
Authority: CN
Inventors: 孙宁; 吴秦龙; 秦浩; 李晓飞
Original assignee: Nanjing Post and Telecommunication University
Current assignee: Nanjing Post and Telecommunication University; Nanjing University of Posts and Telecommunications
Priority date: 2014-09-24
Filing date: 2014-09-24
Publication date: 2015-01-21

Abstract

本发明提出了一种运动场景中特定种类目标实时检测方法，所述方法首先对获取的视频帧序列进行单帧的显著性检测，获得概率最大地包含疑似目标的显著性区域，然后利用离线训练的深度学习特定目标分类器对多个显著性区域进行目标分类判定，确定每个显著性区域的属性；发现关注的特定种类目标后，以当前帧显著性检测结果为起始，实现目标后续运动轨迹的跟踪和记录。本发明所述方法能够在摄像机承载平台运动的条件下，基于单帧图像快速确定少量疑似目标的显著性区域，减少了全图搜索的计算量，使得算法满足实时计算的条件；采用的深信度网络具有多个隐含层，拥有比浅层网络更加优异的特征表达能力，对于光照、外观大幅变化的目标图像，仍能获得优良的分类性能。

Description

一种运动场景中特定种类目标实时检测方法

技术领域

本发明属于视频图像处理技术领域，具体涉及一种运动场景中特定种类目标实时检测方法。

背景技术

动态背景下的运动目标检测技术是计算机视觉中的一个重要课题，也是计算机视觉系统的关键底层技术，目的是通过计算机视觉系统的关键底层技术，目的是通过计算机视觉从运动的背景图像中提取感兴趣的目标，并对目标的位置和姿态等信息进行快速实施的检测。随着计算机处理能力的显著提高，该技术在众多领域都有越来越广泛的应用。

在现代军事系统中，运动目标检测室雷达扫描系统和各种精确武器打击系统的关键技术，有着广泛的应用，比如：对空监视中实时多目标检测、机载或舰载前视图像制导技术、导弹动态测量等。仅凭一双肉眼，人类很难去捕捉和分析飞机、导弹等高速运动目标的运动轨迹和姿态，必须通过计算机视觉去准确高速的监测和捕捉目标，对目标位置的检测越准确就越能提高防御能力和命中率。

现阶段有很多目标检测的方法，比如说：hog特征和SVM分类的行人检测技术、可变部件模型（DPM）检测技术等，这些检测方法都是基于全图不同尺寸的滑动扫描从而实现目标检测的，这类方法虽然有着很高的精确度，但是计算复杂度较高，处理速度并不能达到实时的要求。

基于视觉显著性区域检测对于图像处理过程有着非常重要的意义，注意是人类信息加工过程中的一项重要的心里调节机制，它能够对优先的信息加工资员进行分配，使感知具备选择能力。如果能够将这种机制引入图像分析领域，将计算资源优先分配给那些容易引起观察者注意的区域，这样必将极大地提高现有的图像处理分析方法的工作效率。

发明内容

本发明要解决的技术问题在于克服现有技术的不足，提出一种基运动场景中特定种类目标实时检测方法，针对摄像机获得的原始视频序列图像，首先对获取的视频帧序列进行单帧的显著性检测，获得概率最大地包含前景目标的显著性区域，然后利用离线训练的深度学习分类器对多个显著性区域进行分类判别，最终检测出某类目标，并对目标实行后续的跟踪、记录其运动轨迹，以服务其他应用。

为了解决上述技术问题，本发明采用的技术方案是：

一种运动场景中特定种类目标实时检测方法，包括以下步骤：

步骤A：采集视频图像帧；

步骤B：对单帧视频图像进行处理，利用亮度特征进行显著性检测，得到该单帧视频图像对应的显著性特征图；

步骤C：针对步骤B得到的显著性特征图，采用基于区域增长的图像分割方法，选择连通域最大的前N个显著性区域，得到对应的N个最小外接矩形子图像；N为自然数；

步骤D：在视频图像帧中，提取步骤C中所述N个显著性区域所对应的N个最小外接矩形子图像，利用预先离线训练好的深信度网络图像分类器进行分类判别；

步骤E：若步骤D中分类判别结果为特定种类目标，则判定该矩形子图像为所需检测的特定目标；

步骤F：对检测出的特定目标进行标注并显示。

步骤A中，所述采集视频图像帧，使用可见光摄像机，所述可见光摄像机的承载平台进行水平和上下运动。

步骤A中，所述采集视频图像帧，对每帧视频图像的长宽分别进行m倍压缩，m为自然数。

步骤D中，所述深信度网络图像分类器是基于受限玻尔兹曼机RBM的4层深信度网络，包括1个输入层，2个隐含层和1个分类层。

步骤F中，对检测出的特定目标进行标注并显示，其内容包括运动速度、运动方向、目标大小。

本发明的有益效果：

附图说明

图1为一种运动场景中特定种类目标实时检测方法的整体流程图。

具体实施方式

为使本发明一种运动场景中特定种类目标实时检测方法要解决的技术问题、技术方案和技术效果更加清楚，下面将以坦克目标为例，结合附图对本发明作进一步详细说明。

图1为本发明方法的整体流程图，一种基运动场景中特定种类目标实时检测方法，包括显著性检测、目标分类和检测输出三大步骤。

详细流程如下：

A．通过模拟视频的编解码捕获视频帧图像，对原始图像长宽分别进行2倍的压缩，从而减少后续操作的计算量；

B．对单帧视频图像进行处理，利用亮度特征进行显著性检测，得到单帧图像对应的显著性图，本发明使用基于Itti模型的显著性区域检测方法（详见L. Itti, C. Koch, and E. Niebur. A model of saliency-based visual attention for rapid scene analysis. IEEE TPAMI, 20(11):1254–1259, 1998），该方法基于底层视觉特征，该模型拟生物体视觉注意机制的选择性注意算法考虑局部特征，其特征包括像素点在颜色、亮度、方向三个方面与周边背景的对比值，本发明主要使用亮度这一特征。主要包括两个步骤：（1）特征提取；（2）显著图生成。；

C．显著图中大部分像素值为0，其余被认为显著的区域像素值大于0，选择连通域最大的前两个显著性区域，则这两个区域被认为人眼最先关注的区域也是最可存在前景的区域，以最小外接矩形的形式给出；

D．将步骤C中两个显著性区域对应原始图像的矩形区作为分类器的输入，给离线训练好的深信度网络的坦克分类器进行分类判别，该深度学习分类器基于RBM（受限玻尔兹曼机）深层网络建立的，该网络能在实现数据降维的基础上精确地实现分类功能，将4800张正负样本作为输入学习后，得到一个四层的深信度网络（784-500-500-2000-2）该网络能够达到97.8%正确率的坦克二分类；

E．在显著性检测的快速前景提取和深信度网络的准确判别的基础上将分类器输出结果为坦克的显著性区域作为检测结果显示，其他分类结果则不显示；

F．对检测结果进行跟踪并记录其运动参数，包括运动速度、运动方向和目标大小，从而应用后续的各类处理。

显然，本领域技术人员应当理解，对上述本发明所公开的一种运动场景中特定种类目标实时检测方法，还可以在不脱离本发明内容的基础上做出各种改进。因此，本发明的保护范围应当由所附的权利要求书的内容确定。

Claims

1.一种运动场景中特定种类目标实时检测方法，其特征在于：包括以下步骤：

步骤A：采集视频图像帧；

步骤F：对检测出的特定目标进行标注并显示。

2.根据权利要求1所述的一种运动场景中特定种类目标实时检测方法，其特征在于：步骤A中，所述采集视频图像帧，使用可见光摄像机，所述可见光摄像机的承载平台进行水平和上下运动。

3.根据权利要求1所述的一种运动场景中特定种类目标实时检测方法，其特征在于：步骤A中，对每帧视频图像的长宽分别进行m倍压缩，m为自然数。

4.根据权利要求1所述的一种运动场景中特定种类目标实时检测方法，其特征在于：步骤D中，所述深信度网络图像分类器是基于受限玻尔兹曼机RBM的4层深信度网络，包括1个输入层，2个隐含层和1个分类层。

5.根据权利要求1所述的一种运动场景中特定种类目标实时检测方法，其特征在于：步骤F中，对检测出的特定目标进行标注并显示，其内容包括运动速度、运动方向、目标大小。