CN110781721B

CN110781721B - 一种基于改进vibe算法的户外场景运动目标检测方法

Info

Publication number: CN110781721B
Application number: CN201910837917.XA
Authority: CN
Inventors: 李文书
Original assignee: Wenzhou Shixin Technology Co ltd
Current assignee: Wenzhou Shixin Technology Co ltd
Priority date: 2019-09-05
Filing date: 2019-09-05
Publication date: 2024-04-30
Anticipated expiration: 2039-09-05
Also published as: CN110781721A

Abstract

本发明涉及一种基于改进VIBE算法的户外场景运动目标检测方法，将视频流的任一视频帧使用三帧差法进行运动目标检测得到前景二值图R _k1、使用VIBE算法进行运动目标检测得到前景二值图R _k2，对R _k1预处理、去除噪声后进行聚类，得到带有运动目标的二值图R _k3 ^’，匹配R _k2和R _k3 ^’，获得两者重叠的感兴趣区域输出到R _k，将R _k形态学处理，得到检测的运动目标。本发明光照适应性好，对环境动态变化不敏感，检测效果明显优于常规检测方法，提取目标轮廓完整，无“噪声”，目标边缘清晰，无“孔洞”，动态环境适应性好，检测效果稳定，检测速度可满足系统实时性需求，对后续目标跟踪和行为分析的准确性有很大的帮助。

Description

一种基于改进VIBE算法的户外场景运动目标检测方法

技术领域

本发明涉及数据识别；数据表示；记录载体；记录载体的处理的技术领域，特别涉及一种用于阅读或识别印刷或书写字符或者用于识别图形的基于改进VIBE算法的户外场景运动目标检测方法。

背景技术

运动目标检测也称为前景目标检测，是视频分析技术研究领域的一个重要内容，也是运动目标跟踪和分析的前提，在智能视频监控系统中起着基础性的作用。视频流中，目标跟踪和异常行为分析的效果与运动目标检测的准确性息息相关；按照摄像机视角是否固定，背景分为动态和静态两类。

理想的运动目标检测算法应该满足四个要求：

一是实时性好，不能因目标检测算法时间开销过大导致视频流播放卡顿；

二是准确性高，能否准确从视频帧中提取运动目标是衡量运动目标检测算法的重要指标，也是后续目标跟踪、行为分析的基础；

三是鲁棒性强，算法要对检测场景的动态环境变化产生的噪声信号有良好的抗干扰能力；

四是普适性良好，能在不同的场景中快速准确的进行运动目标检测。

现有技术中，能同时满足以上四点要求的运动目标检测算法很难得到。监控场景的复杂多样性造成单一算法的适应性和可靠性有限，特别是对于户外场景运动目标检测，其光照处于时刻变化中，较室内场景的环境动态性高，由于环境的复杂，检测效率低、检测效果不尽理想。

发明内容

为了解决现有技术中的问题，本发明提供一种优化的基于改进VIBE算法的户外场景运动目标检测方法。

本发明所采用的技术方案是，一种基于改进VIBE算法的户外场景运动目标检测方法，所述方法包括以下步骤：

步骤1：获得户外场景视频流；

步骤2：将视频流的任一视频帧I_k使用三帧差法进行运动目标检测，得到前景二值图R_k1；将视频流的任一帧I_k使用VIBE算法进行运动目标检测，得到前景二值图R_k2；

步骤3：对前景二值图R_k1进行预处理，得到去除噪声的二值图R_k3；

步骤4：对二值图R_k3进行聚类处理，得到带有运动目标的二值图R_k3’；

步骤5：匹配前景二值图R_k2和二值图R_k3’，获得前景二值图R_k2和二值图R_k3’中重叠的感兴趣区域，输出到二值图R_k；

步骤6：将二值图R_k进行形态学处理，得到检测的运动目标。

优选地，所述步骤2中，获得前景二值图R_k1包括以下步骤：

步骤2.1.1：获得当前视频帧I_k的前一帧I_k-1及后一帧I_k+1；

步骤2.1.2：以I_k-1及I_k+1分别与I_k进行差分运算，得到差分图像D_k-1和D_k+1；

步骤2.1.3：将差分图像D_k-1和D_k+1分别进行二值化处理，得到D_k-1’和D_k+1’，以D_k-1’和D_k+1’进行或运算，得到二值图T_k；

步骤2.1.4：将T_k进行形态学滤波，得到运动目标的前景二值图R_k1。

优选地，所述步骤2中，获得前景二值图R_k2包括以下步骤：

步骤2.2.1：获得任一视频帧I₀，为视频帧中的每个像素建立长度为N的样本集；

步骤2.2.2：将视频帧I_k中的像素点与对应的样本集中的样本进行比较；

步骤2.2.3：若视频帧I_k中的像素点与样本集中对应的像素点的距离小于R的采样点数量大于阈值T，则当前像素点属于背景点，否则为前景点；重复步骤2.2.3直至遍历所有的像素点；

步骤2.2.4：获得前景二值图R_k2。

优选地，所述步骤2.2.1中，样本集的采样值包括任一像素点自身的像素值以及所述像素点的邻域像素点的像素值。

优选地，当任一像素点被判断为背景点时，所述像素点对样本集中的任一样本进行更新的概率为1/α，所述像素点将邻域像素点的样本集合替换为当前像素点的样本集合的概率为1/α；α为时间因子，α＞0。

优选地，所述步骤3包括以下步骤：

步骤3.1：对前景二值图R_k1进行连通域检测，得到连通域集合Ω；

步骤3.2：计算每个连通域的面积，过滤面积小于T_area的连通域；

步骤3.3：得到去除噪声的二值图R_k3。

优选地，所述步骤4包括以下步骤：

步骤4.1：对二值图R_k3中像素值为255的像素点使用DBSCAN算法进行聚类处理，得到类簇集合C＝{C₁,C₂,…,C_n}，n≥1；

步骤4.2：对集合中的每个类簇Ci划分外接矩形rect[i]，1≤i≤n；

步骤4.3：得到带有运动目标的二值图R_k3’。

优选地，所述步骤5包括以下步骤：

步骤5.1：基于二值图R_k3’中的外接矩形rect[i]确定感兴趣区域；

步骤5.2：提取前景二值图R_k2中对应所述感兴趣区域的部分，与二值图R_k3’中的感兴趣区域进行或运算；

步骤5.3：完成所有感兴趣区域的匹配运算，将结果输出到二值图R_k。

优选地，所述步骤6中，二值图R_k进行形态学处理包括以下步骤：

步骤6.1：对二值图R_k过滤面积小于阈值T₁的连通域；

步骤6.2：对处理后的图像进行膨胀操作；

步骤6.3：对膨胀操作后的图像进行腐蚀操作，得到目标增强后的图像。

本发明提供了一种优化的基于改进VIBE算法的户外场景运动目标检测方法，通过将视频流的任一视频帧I_k使用三帧差法进行运动目标检测得到前景二值图R_k1、使用VIBE算法进行运动目标检测得到前景二值图R_k2，对前景二值图R_k1进行预处理、去除噪声后进行聚类处理，得到带有运动目标的二值图R_k3’，匹配前景二值图R_k2和二值图R_k3’，获得前景二值图R_k2和二值图R_k3’中重叠的感兴趣区域，输出到二值图R_k，最后将二值图R_k进行形态学处理，得到检测的运动目标。

本发明的光照适应性好，对环境的动态变化不敏感，检测效果明显优于帧差法、背景差分法、VIBE背景建模等常规的检测方法，提取目标轮廓完整，无“噪声”，目标边缘清晰，无“孔洞”现象，动态环境适应性好，检测效果稳定，检测速度可满足系统实时性的需求，优异的检测效果对后续目标跟踪和行为分析的准确性有很大的帮助。

附图说明

图1为本发明的流程图。

具体实施方式

下面结合实施例对本发明做进一步的详细描述，但本发明的保护范围并不限于此。

本发明涉及一种基于改进VIBE算法的户外场景运动目标检测方法，所述方法包括以下步骤。

步骤1：获得户外场景视频流。

本发明中，以k作为下标进行顺序标识。

步骤2：将视频流的任一视频帧I_k使用三帧差法进行运动目标检测，得到前景二值图R_k1；将视频流的任一帧I_k使用VIBE算法进行运动目标检测，得到前景二值图R_k2。

所述步骤2中，获得前景二值图R_k1包括以下步骤：

步骤2.1.1：获得当前视频帧I_k的前一帧I_k-1及后一帧I_k+1；

所述步骤2中，获得前景二值图R_k2包括以下步骤：

所述步骤2.2.1中，样本集的采样值包括任一像素点自身的像素值以及所述像素点的邻域像素点的像素值。

步骤2.2.4：获得前景二值图R_k2。

当任一像素点被判断为背景点时，所述像素点对样本集中的任一样本进行更新的概率为1/α，所述像素点将邻域像素点的样本集合替换为当前像素点的样本集合的概率为1/α；α为时间因子，α＞0。

本发明中，传统的VIBE算法作为像素级别的运动目标检测算法，只用一帧即可完成背景建模，算法简单快速，占用硬件少，检测准确度高，尤其对于光照变化和背景物体变更等问题，VIBE算法表现出优秀的抗干扰能力，但VIBE算法本身存在“鬼影”和“噪声”问题；而三帧差法对前景目标运动状态突然改变产生的“鬼影”现象有出色的抑制作用，但又容易出现“空洞”和“断边”的现象，故本发明将两种算法进行结合，提出一种改进的VIBE算法。

本发明中，首先通过三帧差法和DBSCAN聚类算法对VIBE算法的“鬼影”现象进行抑制，再通过VIBE算法对三帧差法的“空洞”和“断边”现象进行改善，达到两种算法优势互补的目的。

本发明中，VIBE背景建模主要分为模型初始化、模型匹配、模型更新三部分；在初始帧中，VIBE算法为每个像素设立长度为N的样本集，采样值包括自身像素值以及该像素邻域位置的像素值；模型初始化完成后，将后续每帧图像中的像素点与该位置对应样本集中的样本进行比较，以此来判定该像素值属于背景还是前景；最后，在实时视频监控中，由于监控场景中的背景存在动态变化，如光照变化、背景物体变更等，为提升算法的普适性和鲁棒性，VIBE算法对背景模型也采用一定的更新的策略。

本发明中，主要采用随机更新策略，按照一定概率对样本中的背景点进行更新。当一个像素点判断为背景点时，它有1/α的概率对样本集中的一个样本进行更新，也有1/α的概率将邻域像素点的样本集合替换为该像素点的样本集合，α是可以设置的时间因子；这种替换方式依据的原理是像素值空间传播特性，使得可实现样本值在其生命周期内的平滑变化。

步骤3：对前景二值图R_k1进行预处理，得到去除噪声的二值图R_k3。

所述步骤3包括以下步骤：

步骤3.3：得到去除噪声的二值图R_k3。

本发明中，由于三帧差法将差分图进行了“或”操作，使得检测结果图同时保留了两幅图中的信息，虽然改善了检测目标的“孔洞”和“断边”问题，但同时也使得“噪声”现象变得严重，故步骤3先行去除了不符合面积要求的部分噪点，便于后续的处理。

步骤4：对二值图R_k3进行聚类处理，得到带有运动目标的二值图R_k3’。

所述步骤4包括以下步骤：

步骤4.2：对集合中的每个类簇C_i划分外接矩形rect[i]，1≤i≤n；

步骤4.3：得到带有运动目标的二值图R_k3’。

本发明中，采用DBSCAN(Density-Based Spatial Clustering of Applicationswith Noise)算法对二值图R_k3进行聚类处理，DBSCAN是一种应用广泛的基于密度的聚类算法，将具有足够密度的区域划分为簇，并可在具有噪声的空间数据库中发现任意形状的簇。

本发明中，设二维样本集D＝{p₁,p₂,…,p_m}，数据集元素为坐标点，邻域参数为(ε,MinPts)；样本距离度量方式为欧式距离，其中，p_i.x、p_i.y为坐标点p_i的横、纵坐标；

DBSCAN具体聚类过程如下：

1)初始化核心对象集合Ω＝Φ，初始化聚类簇数k＝0，初始化未访问样本集合Γ＝D，簇划分C＝Φ。

2)遍历数据集所有元素，若元素p_j满足式(2-6)核心对象条件，将p_j加入核心对象集合Ω：Ω＝Ω∪{p_j}。

3)如果Ω＝Φ则算法结束，否则转入步骤(4)。

4)从核心对象集合Ω中随机选择一个核心对象o，初始化当前簇核心对象队列Ω，Ω_cur＝{o}。初始化类别序号k＝k+1，初始化当前簇样本集合C_k＝{o}，更新未访问样本集合Γ＝Γ-{o}。

5)若当前簇核心对象队列Ω_cur＝Φ，则当前聚类簇C_k生成完毕。更新簇划分C＝{C₁,C₂,…C_k},更新核心对象集合Ω＝Ω-C_k，转入步骤(3)。

6)在当前簇核心对象队列Ω_cur中取出一个核心对象o'，找出所有的ε邻域子样本集N_ε(o')，令△＝N_ε(o')∩Γ。更新当前簇样本集合C_k＝C_k∪△，更新未访问样本集合Γ＝Γ-△，更新Ω_cur＝Ω_cur∪(△∩Ω)-o'，转入步骤(5)。

输出结果为：簇划分C＝{C₁,C₂,…,C_k}。

本发明中，相较K-Means聚类算法、均值漂移聚类算法等经典聚类算法，DBSCAN算法具有聚类速度快且能有效处理噪声点和发现任意形状的空间聚类并且聚类前不需要知道有多少簇的显著优点；一般来说，本发明的视频流均为320×240规格视频，用于聚类的样本元素为坐标点，数据量较少，维度低，且聚类间距小，因此可以充分发挥DBSCAN算法优点，避免DBSCAN算法的不足对聚类效果的影响。

步骤5：匹配前景二值图R_k2和二值图R_k3’，获得前景二值图R_k2和二值图R_k3’中重叠的感兴趣区域，输出到二值图R_k。

所述步骤5包括以下步骤：

本发明中，过滤小面积连通域、去除噪点后得到R_k3，使用DBSCAN算法聚类R_k3中的白色前景像素点后得到类簇，每一个类簇所在区域为一个目标的所在位置，在通过DBSCAN算法聚类确定前景目标位置后，再将VIBE算法检测的前景图再同位置进行相“或”操作即输出最终的运动目标检测图R_k。

步骤6：将二值图R_k进行形态学处理，得到检测的运动目标。

所述步骤6中，二值图R_k进行形态学处理包括以下步骤：

步骤6.1：对二值图R_k过滤面积小于阈值T₁的连通域；

步骤6.2：对处理后的图像进行膨胀操作；

本发明中，形态学是在生物学形态与结构的研究中衍生出的专门研究生物形式本质的学科，形态学操作运算主要用于二值图中的噪点消除、目标增强以及物体形态量化等。

本发明中，膨胀操作是指使用滑动窗口遍历二值图求图像局部最大值的操作；一般情况下，定义结构元素T，T是一个二维矩阵，矩阵元素值为0或1，T内有一个可定义的锚点，锚点通常定义为T的中心点，用T的锚点扫描原始图像的每一个像素，将T与其覆盖的局部二值图像做“与”操作，若“与”操作结果都为0，则该像素值为0，否则为1；经膨胀操作处理后原图白色像素部分向其邻域扩张，前景目标内部“孔洞”现象消失，但图像噪点面积也因膨胀操作进一步扩大。

本发明中，腐蚀操作和膨胀相反，是一种通过滑动窗口遍历二值图求图像局部最小值的形态学操作运算，即在最后，若“与”操作结果都为1,则该像素值为1，否则为0即可；通过腐蚀操作，图像白色像素部分向其邻域缩减，有锐化图像边缘信息的作用，“噪声”消失，但同时目标内部“孔洞”现象加剧。

本发明中，由于主要用于对监控场景中行人发生的异常行为进行告警，只需检测面积较大的运动目标用于后续行人检测即可，面积很小的运动目标如落叶、蝴蝶等应直接过滤，因此通过过滤小面积连通域的方法直接将噪点和小面积运动目标去除，然后在进行“闭运算”改善目标内部“空洞”现象，图像“噪声”和“孔洞”现象均得到很好的改善。

本发明中，将图像进行先膨胀后腐蚀的操作，为闭运算操作，通过闭运算可改善目标内部“孔洞”现象，且目标以外的“噪声”不会加剧。

本发明通过将视频流的任一视频帧I_k使用三帧差法进行运动目标检测得到前景二值图R_k1、使用VIBE算法进行运动目标检测得到前景二值图R_k2，对前景二值图R_k1进行预处理、去除噪声后进行聚类处理，得到带有运动目标的二值图R_k3’，匹配前景二值图R_k2和二值图R_k3’，获得前景二值图R_k2和二值图R_k3’中重叠的感兴趣区域，输出到二值图R_k，最后将二值图R_k进行形态学处理，得到检测的运动目标。

Claims

1.一种基于改进VIBE算法的户外场景运动目标检测方法，其特征在于：所述方法包括以下步骤：

步骤1：获得户外场景视频流；

步骤2：将视频流的任一视频帧I _k使用三帧差法进行运动目标检测，获得前景二值图R _k1包括以下步骤：

步骤2.1.1：获得当前视频帧I _k的前一帧I _k-1及后一帧I _k+1；

步骤2.1.2：以I _k-1及I _k+1分别与I _k进行差分运算，得到差分图像D _k-1和D _k+1；

步骤2.1.3：将差分图像D _k-1和D _k+1分别进行二值化处理，得到D _k-1 ^’和D _k+1 ^’，以D _k-1 ^’和D _k+1 ^’进行或运算，得到二值图T _k；

步骤2.1.4：将T _k进行形态学滤波，得到运动目标的前景二值图R _k1；

将视频流的任一帧I _k使用VIBE算法进行运动目标检测，得到前景二值图R _k2；

步骤3：包括以下步骤：

步骤3.1：对前景二值图R _k1进行连通域检测，得到连通域集合Ω；

步骤3.2：计算每个连通域的面积，过滤面积小于T _area的连通域；

步骤3.3：得到去除噪声的二值图R _k3；

步骤4：对二值图R _k3进行聚类处理，得到带有运动目标的二值图R _k3 ^’；

步骤5：匹配前景二值图R _k2和二值图R _k3 ^’，获得前景二值图R _k2和二值图R _k3 ^’中重叠的感兴趣区域，输出到二值图R _k；

步骤6：将二值图R _k进行形态学处理，得到检测的运动目标。

2.根据权利要求1所述的一种基于改进VIBE算法的户外场景运动目标检测方法，其特征在于：所述步骤2中，获得前景二值图R _k2包括以下步骤：

步骤2.2.1：获得任一视频帧I ₀，为视频帧中的每个像素建立长度为N的样本集；

步骤2.2.2：将视频帧I _k中的像素点与对应的样本集中的样本进行比较；

步骤2.2.3：若视频帧I _k中的像素点与样本集中对应的像素点的距离小于R的采样点数量大于阈值T，则当前像素点属于背景点，否则为前景点；重复步骤2.2.3直至遍历所有的像素点；

步骤2.2.4：获得前景二值图R _k2。

3.根据权利要求2所述的一种基于改进VIBE算法的户外场景运动目标检测方法，其特征在于：所述步骤2.2.1中，样本集的采样值包括任一像素点自身的像素值以及所述像素点的邻域像素点的像素值。

4.根据权利要求2所述的一种基于改进VIBE算法的户外场景运动目标检测方法，其特征在于：当任一像素点被判断为背景点时，所述像素点对样本集中的任一样本进行更新的概率为1/α，所述像素点将邻域像素点的样本集合替换为当前像素点的样本集合的概率为1/α；α为时间因子，α＞0。

5.根据权利要求1所述的一种基于改进VIBE算法的户外场景运动目标检测方法，其特征在于：所述步骤4包括以下步骤：

步骤4.1：对二值图R _k3中像素值为255的像素点使用DBSCAN算法进行聚类处理，得到类簇集合C={C ₁ ,C ₂ ,…,C _n }，n≥1；

步骤4.2：对集合中的每个类簇C _i划分外接矩形rect[i]，1≤i≤n；

步骤4.3：得到带有运动目标的二值图R _k3 ^’。

6.根据权利要求5所述的一种基于改进VIBE算法的户外场景运动目标检测方法，其特征在于：所述步骤5包括以下步骤：

步骤5.1：基于二值图R _k3 ^’中的外接矩形rect[i]确定感兴趣区域；

步骤5.2：提取前景二值图R _k2中对应所述感兴趣区域的部分，与二值图R _k3 ^’中的感兴趣区域进行或运算；

步骤5.3：完成所有感兴趣区域的匹配运算，将结果输出到二值图R _k。

7.根据权利要求1所述的一种基于改进VIBE算法的户外场景运动目标检测方法，其特征在于：所述步骤6中，二值图R _k进行形态学处理包括以下步骤：

步骤6.1：对二值图R _k过滤面积小于阈值T ₁的连通域；

步骤6.2：对处理后的图像进行膨胀操作；