CN110781721B - 一种基于改进vibe算法的户外场景运动目标检测方法 - Google Patents
一种基于改进vibe算法的户外场景运动目标检测方法 Download PDFInfo
- Publication number
- CN110781721B CN110781721B CN201910837917.XA CN201910837917A CN110781721B CN 110781721 B CN110781721 B CN 110781721B CN 201910837917 A CN201910837917 A CN 201910837917A CN 110781721 B CN110781721 B CN 110781721B
- Authority
- CN
- China
- Prior art keywords
- binary image
- moving object
- steps
- pixel
- foreground
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 51
- 238000000034 method Methods 0.000 claims abstract description 30
- 230000000877 morphologic effect Effects 0.000 claims abstract description 14
- 238000012545 processing Methods 0.000 claims abstract description 10
- 238000001914 filtration Methods 0.000 claims description 11
- 238000005070 sampling Methods 0.000 claims description 7
- 230000007797 corrosion Effects 0.000 claims description 5
- 238000005260 corrosion Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 abstract description 13
- 238000005286 illumination Methods 0.000 abstract description 6
- 238000007781 pre-processing Methods 0.000 abstract description 5
- 238000000605 extraction Methods 0.000 abstract description 3
- 230000007613 environmental effect Effects 0.000 abstract 1
- 238000012544 monitoring process Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 206010000117 Abnormal behaviour Diseases 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 241000255777 Lepidoptera Species 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
- G06T5/30—Erosion or dilatation, e.g. thinning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/155—Segmentation; Edge detection involving morphological operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/187—Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/215—Motion-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/35—Categorising the entire scene, e.g. birthday party or wedding scene
- G06V20/38—Outdoor scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于改进VIBE算法的户外场景运动目标检测方法,将视频流的任一视频帧使用三帧差法进行运动目标检测得到前景二值图R k1 、使用VIBE算法进行运动目标检测得到前景二值图R k2 ,对R k1 预处理、去除噪声后进行聚类,得到带有运动目标的二值图R k3 ’ ,匹配R k2 和R k3 ’ ,获得两者重叠的感兴趣区域输出到R k ,将R k 形态学处理,得到检测的运动目标。本发明光照适应性好,对环境动态变化不敏感,检测效果明显优于常规检测方法,提取目标轮廓完整,无“噪声”,目标边缘清晰,无“孔洞”,动态环境适应性好,检测效果稳定,检测速度可满足系统实时性需求,对后续目标跟踪和行为分析的准确性有很大的帮助。
Description
技术领域
本发明涉及数据识别;数据表示;记录载体;记录载体的处理的技术领域,特别涉及一种用于阅读或识别印刷或书写字符或者用于识别图形的基于改进VIBE算法的户外场景运动目标检测方法。
背景技术
运动目标检测也称为前景目标检测,是视频分析技术研究领域的一个重要内容,也是运动目标跟踪和分析的前提,在智能视频监控系统中起着基础性的作用。视频流中,目标跟踪和异常行为分析的效果与运动目标检测的准确性息息相关;按照摄像机视角是否固定,背景分为动态和静态两类。
理想的运动目标检测算法应该满足四个要求:
一是实时性好,不能因目标检测算法时间开销过大导致视频流播放卡顿;
二是准确性高,能否准确从视频帧中提取运动目标是衡量运动目标检测算法的重要指标,也是后续目标跟踪、行为分析的基础;
三是鲁棒性强,算法要对检测场景的动态环境变化产生的噪声信号有良好的抗干扰能力;
四是普适性良好,能在不同的场景中快速准确的进行运动目标检测。
现有技术中,能同时满足以上四点要求的运动目标检测算法很难得到。监控场景的复杂多样性造成单一算法的适应性和可靠性有限,特别是对于户外场景运动目标检测,其光照处于时刻变化中,较室内场景的环境动态性高,由于环境的复杂,检测效率低、检测效果不尽理想。
发明内容
为了解决现有技术中的问题,本发明提供一种优化的基于改进VIBE算法的户外场景运动目标检测方法。
本发明所采用的技术方案是,一种基于改进VIBE算法的户外场景运动目标检测方法,所述方法包括以下步骤:
步骤1:获得户外场景视频流;
步骤2:将视频流的任一视频帧Ik使用三帧差法进行运动目标检测,得到前景二值图Rk1;将视频流的任一帧Ik使用VIBE算法进行运动目标检测,得到前景二值图Rk2;
步骤3:对前景二值图Rk1进行预处理,得到去除噪声的二值图Rk3;
步骤4:对二值图Rk3进行聚类处理,得到带有运动目标的二值图Rk3’;
步骤5:匹配前景二值图Rk2和二值图Rk3’,获得前景二值图Rk2和二值图Rk3’中重叠的感兴趣区域,输出到二值图Rk;
步骤6:将二值图Rk进行形态学处理,得到检测的运动目标。
优选地,所述步骤2中,获得前景二值图Rk1包括以下步骤:
步骤2.1.1:获得当前视频帧Ik的前一帧Ik-1及后一帧Ik+1;
步骤2.1.2:以Ik-1及Ik+1分别与Ik进行差分运算,得到差分图像Dk-1和Dk+1;
步骤2.1.3:将差分图像Dk-1和Dk+1分别进行二值化处理,得到Dk-1’和Dk+1’,以Dk-1’和Dk+1’进行或运算,得到二值图Tk;
步骤2.1.4:将Tk进行形态学滤波,得到运动目标的前景二值图Rk1。
优选地,所述步骤2中,获得前景二值图Rk2包括以下步骤:
步骤2.2.1:获得任一视频帧I0,为视频帧中的每个像素建立长度为N的样本集;
步骤2.2.2:将视频帧Ik中的像素点与对应的样本集中的样本进行比较;
步骤2.2.3:若视频帧Ik中的像素点与样本集中对应的像素点的距离小于R的采样点数量大于阈值T,则当前像素点属于背景点,否则为前景点;重复步骤2.2.3直至遍历所有的像素点;
步骤2.2.4:获得前景二值图Rk2。
优选地,所述步骤2.2.1中,样本集的采样值包括任一像素点自身的像素值以及所述像素点的邻域像素点的像素值。
优选地,当任一像素点被判断为背景点时,所述像素点对样本集中的任一样本进行更新的概率为1/α,所述像素点将邻域像素点的样本集合替换为当前像素点的样本集合的概率为1/α;α为时间因子,α>0。
优选地,所述步骤3包括以下步骤:
步骤3.1:对前景二值图Rk1进行连通域检测,得到连通域集合Ω;
步骤3.2:计算每个连通域的面积,过滤面积小于Tarea的连通域;
步骤3.3:得到去除噪声的二值图Rk3。
优选地,所述步骤4包括以下步骤:
步骤4.1:对二值图Rk3中像素值为255的像素点使用DBSCAN算法进行聚类处理,得到类簇集合C={C1,C2,…,Cn},n≥1;
步骤4.2:对集合中的每个类簇Ci划分外接矩形rect[i],1≤i≤n;
步骤4.3:得到带有运动目标的二值图Rk3’。
优选地,所述步骤5包括以下步骤:
步骤5.1:基于二值图Rk3’中的外接矩形rect[i]确定感兴趣区域;
步骤5.2:提取前景二值图Rk2中对应所述感兴趣区域的部分,与二值图Rk3’中的感兴趣区域进行或运算;
步骤5.3:完成所有感兴趣区域的匹配运算,将结果输出到二值图Rk。
优选地,所述步骤6中,二值图Rk进行形态学处理包括以下步骤:
步骤6.1:对二值图Rk过滤面积小于阈值T1的连通域;
步骤6.2:对处理后的图像进行膨胀操作;
步骤6.3:对膨胀操作后的图像进行腐蚀操作,得到目标增强后的图像。
本发明提供了一种优化的基于改进VIBE算法的户外场景运动目标检测方法,通过将视频流的任一视频帧Ik使用三帧差法进行运动目标检测得到前景二值图Rk1、使用VIBE算法进行运动目标检测得到前景二值图Rk2,对前景二值图Rk1进行预处理、去除噪声后进行聚类处理,得到带有运动目标的二值图Rk3’,匹配前景二值图Rk2和二值图Rk3’,获得前景二值图Rk2和二值图Rk3’中重叠的感兴趣区域,输出到二值图Rk,最后将二值图Rk进行形态学处理,得到检测的运动目标。
本发明的光照适应性好,对环境的动态变化不敏感,检测效果明显优于帧差法、背景差分法、VIBE背景建模等常规的检测方法,提取目标轮廓完整,无“噪声”,目标边缘清晰,无“孔洞”现象,动态环境适应性好,检测效果稳定,检测速度可满足系统实时性的需求,优异的检测效果对后续目标跟踪和行为分析的准确性有很大的帮助。
附图说明
图1为本发明的流程图。
具体实施方式
下面结合实施例对本发明做进一步的详细描述,但本发明的保护范围并不限于此。
本发明涉及一种基于改进VIBE算法的户外场景运动目标检测方法,所述方法包括以下步骤。
步骤1:获得户外场景视频流。
本发明中,以k作为下标进行顺序标识。
步骤2:将视频流的任一视频帧Ik使用三帧差法进行运动目标检测,得到前景二值图Rk1;将视频流的任一帧Ik使用VIBE算法进行运动目标检测,得到前景二值图Rk2。
所述步骤2中,获得前景二值图Rk1包括以下步骤:
步骤2.1.1:获得当前视频帧Ik的前一帧Ik-1及后一帧Ik+1;
步骤2.1.2:以Ik-1及Ik+1分别与Ik进行差分运算,得到差分图像Dk-1和Dk+1;
步骤2.1.3:将差分图像Dk-1和Dk+1分别进行二值化处理,得到Dk-1’和Dk+1’,以Dk-1’和Dk+1’进行或运算,得到二值图Tk;
步骤2.1.4:将Tk进行形态学滤波,得到运动目标的前景二值图Rk1。
所述步骤2中,获得前景二值图Rk2包括以下步骤:
步骤2.2.1:获得任一视频帧I0,为视频帧中的每个像素建立长度为N的样本集;
所述步骤2.2.1中,样本集的采样值包括任一像素点自身的像素值以及所述像素点的邻域像素点的像素值。
步骤2.2.2:将视频帧Ik中的像素点与对应的样本集中的样本进行比较;
步骤2.2.3:若视频帧Ik中的像素点与样本集中对应的像素点的距离小于R的采样点数量大于阈值T,则当前像素点属于背景点,否则为前景点;重复步骤2.2.3直至遍历所有的像素点;
步骤2.2.4:获得前景二值图Rk2。
当任一像素点被判断为背景点时,所述像素点对样本集中的任一样本进行更新的概率为1/α,所述像素点将邻域像素点的样本集合替换为当前像素点的样本集合的概率为1/α;α为时间因子,α>0。
本发明中,传统的VIBE算法作为像素级别的运动目标检测算法,只用一帧即可完成背景建模,算法简单快速,占用硬件少,检测准确度高,尤其对于光照变化和背景物体变更等问题,VIBE算法表现出优秀的抗干扰能力,但VIBE算法本身存在“鬼影”和“噪声”问题;而三帧差法对前景目标运动状态突然改变产生的“鬼影”现象有出色的抑制作用,但又容易出现“空洞”和“断边”的现象,故本发明将两种算法进行结合,提出一种改进的VIBE算法。
本发明中,首先通过三帧差法和DBSCAN聚类算法对VIBE算法的“鬼影”现象进行抑制,再通过VIBE算法对三帧差法的“空洞”和“断边”现象进行改善,达到两种算法优势互补的目的。
本发明中,VIBE背景建模主要分为模型初始化、模型匹配、模型更新三部分;在初始帧中,VIBE算法为每个像素设立长度为N的样本集,采样值包括自身像素值以及该像素邻域位置的像素值;模型初始化完成后,将后续每帧图像中的像素点与该位置对应样本集中的样本进行比较,以此来判定该像素值属于背景还是前景;最后,在实时视频监控中,由于监控场景中的背景存在动态变化,如光照变化、背景物体变更等,为提升算法的普适性和鲁棒性,VIBE算法对背景模型也采用一定的更新的策略。
本发明中,主要采用随机更新策略,按照一定概率对样本中的背景点进行更新。当一个像素点判断为背景点时,它有1/α的概率对样本集中的一个样本进行更新,也有1/α的概率将邻域像素点的样本集合替换为该像素点的样本集合,α是可以设置的时间因子;这种替换方式依据的原理是像素值空间传播特性,使得可实现样本值在其生命周期内的平滑变化。
步骤3:对前景二值图Rk1进行预处理,得到去除噪声的二值图Rk3。
所述步骤3包括以下步骤:
步骤3.1:对前景二值图Rk1进行连通域检测,得到连通域集合Ω;
步骤3.2:计算每个连通域的面积,过滤面积小于Tarea的连通域;
步骤3.3:得到去除噪声的二值图Rk3。
本发明中,由于三帧差法将差分图进行了“或”操作,使得检测结果图同时保留了两幅图中的信息,虽然改善了检测目标的“孔洞”和“断边”问题,但同时也使得“噪声”现象变得严重,故步骤3先行去除了不符合面积要求的部分噪点,便于后续的处理。
步骤4:对二值图Rk3进行聚类处理,得到带有运动目标的二值图Rk3’。
所述步骤4包括以下步骤:
步骤4.1:对二值图Rk3中像素值为255的像素点使用DBSCAN算法进行聚类处理,得到类簇集合C={C1,C2,…,Cn},n≥1;
步骤4.2:对集合中的每个类簇Ci划分外接矩形rect[i],1≤i≤n;
步骤4.3:得到带有运动目标的二值图Rk3’。
本发明中,采用DBSCAN(Density-Based Spatial Clustering of Applicationswith Noise)算法对二值图Rk3进行聚类处理,DBSCAN是一种应用广泛的基于密度的聚类算法,将具有足够密度的区域划分为簇,并可在具有噪声的空间数据库中发现任意形状的簇。
本发明中,设二维样本集D={p1,p2,…,pm},数据集元素为坐标点,邻域参数为(ε,MinPts);样本距离度量方式为欧式距离,其中,pi.x、pi.y为坐标点pi的横、纵坐标;
DBSCAN具体聚类过程如下:
1)初始化核心对象集合Ω=Φ,初始化聚类簇数k=0,初始化未访问样本集合Γ=D,簇划分C=Φ。
2)遍历数据集所有元素,若元素pj满足式(2-6)核心对象条件,将pj加入核心对象集合Ω:Ω=Ω∪{pj}。
3)如果Ω=Φ则算法结束,否则转入步骤(4)。
4)从核心对象集合Ω中随机选择一个核心对象o,初始化当前簇核心对象队列Ω,Ωcur={o}。初始化类别序号k=k+1,初始化当前簇样本集合Ck={o},更新未访问样本集合Γ=Γ-{o}。
5)若当前簇核心对象队列Ωcur=Φ,则当前聚类簇Ck生成完毕。更新簇划分C={C1,C2,…Ck},更新核心对象集合Ω=Ω-Ck,转入步骤(3)。
6)在当前簇核心对象队列Ωcur中取出一个核心对象o',找出所有的ε邻域子样本集Nε(o'),令△=Nε(o')∩Γ。更新当前簇样本集合Ck=Ck∪△,更新未访问样本集合Γ=Γ-△,更新Ωcur=Ωcur∪(△∩Ω)-o',转入步骤(5)。
输出结果为:簇划分C={C1,C2,…,Ck}。
本发明中,相较K-Means聚类算法、均值漂移聚类算法等经典聚类算法,DBSCAN算法具有聚类速度快且能有效处理噪声点和发现任意形状的空间聚类并且聚类前不需要知道有多少簇的显著优点;一般来说,本发明的视频流均为320×240规格视频,用于聚类的样本元素为坐标点,数据量较少,维度低,且聚类间距小,因此可以充分发挥DBSCAN算法优点,避免DBSCAN算法的不足对聚类效果的影响。
步骤5:匹配前景二值图Rk2和二值图Rk3’,获得前景二值图Rk2和二值图Rk3’中重叠的感兴趣区域,输出到二值图Rk。
所述步骤5包括以下步骤:
步骤5.1:基于二值图Rk3’中的外接矩形rect[i]确定感兴趣区域;
步骤5.2:提取前景二值图Rk2中对应所述感兴趣区域的部分,与二值图Rk3’中的感兴趣区域进行或运算;
步骤5.3:完成所有感兴趣区域的匹配运算,将结果输出到二值图Rk。
本发明中,过滤小面积连通域、去除噪点后得到Rk3,使用DBSCAN算法聚类Rk3中的白色前景像素点后得到类簇,每一个类簇所在区域为一个目标的所在位置,在通过DBSCAN算法聚类确定前景目标位置后,再将VIBE算法检测的前景图再同位置进行相“或”操作即输出最终的运动目标检测图Rk。
步骤6:将二值图Rk进行形态学处理,得到检测的运动目标。
所述步骤6中,二值图Rk进行形态学处理包括以下步骤:
步骤6.1:对二值图Rk过滤面积小于阈值T1的连通域;
步骤6.2:对处理后的图像进行膨胀操作;
步骤6.3:对膨胀操作后的图像进行腐蚀操作,得到目标增强后的图像。
本发明中,形态学是在生物学形态与结构的研究中衍生出的专门研究生物形式本质的学科,形态学操作运算主要用于二值图中的噪点消除、目标增强以及物体形态量化等。
本发明中,膨胀操作是指使用滑动窗口遍历二值图求图像局部最大值的操作;一般情况下,定义结构元素T,T是一个二维矩阵,矩阵元素值为0或1,T内有一个可定义的锚点,锚点通常定义为T的中心点,用T的锚点扫描原始图像的每一个像素,将T与其覆盖的局部二值图像做“与”操作,若“与”操作结果都为0,则该像素值为0,否则为1;经膨胀操作处理后原图白色像素部分向其邻域扩张,前景目标内部“孔洞”现象消失,但图像噪点面积也因膨胀操作进一步扩大。
本发明中,腐蚀操作和膨胀相反,是一种通过滑动窗口遍历二值图求图像局部最小值的形态学操作运算,即在最后,若“与”操作结果都为1,则该像素值为1,否则为0即可;通过腐蚀操作,图像白色像素部分向其邻域缩减,有锐化图像边缘信息的作用,“噪声”消失,但同时目标内部“孔洞”现象加剧。
本发明中,由于主要用于对监控场景中行人发生的异常行为进行告警,只需检测面积较大的运动目标用于后续行人检测即可,面积很小的运动目标如落叶、蝴蝶等应直接过滤,因此通过过滤小面积连通域的方法直接将噪点和小面积运动目标去除,然后在进行“闭运算”改善目标内部“空洞”现象,图像“噪声”和“孔洞”现象均得到很好的改善。
本发明中,将图像进行先膨胀后腐蚀的操作,为闭运算操作,通过闭运算可改善目标内部“孔洞”现象,且目标以外的“噪声”不会加剧。
本发明通过将视频流的任一视频帧Ik使用三帧差法进行运动目标检测得到前景二值图Rk1、使用VIBE算法进行运动目标检测得到前景二值图Rk2,对前景二值图Rk1进行预处理、去除噪声后进行聚类处理,得到带有运动目标的二值图Rk3’,匹配前景二值图Rk2和二值图Rk3’,获得前景二值图Rk2和二值图Rk3’中重叠的感兴趣区域,输出到二值图Rk,最后将二值图Rk进行形态学处理,得到检测的运动目标。
本发明的光照适应性好,对环境的动态变化不敏感,检测效果明显优于帧差法、背景差分法、VIBE背景建模等常规的检测方法,提取目标轮廓完整,无“噪声”,目标边缘清晰,无“孔洞”现象,动态环境适应性好,检测效果稳定,检测速度可满足系统实时性的需求,优异的检测效果对后续目标跟踪和行为分析的准确性有很大的帮助。
Claims (7)
1.一种基于改进VIBE算法的户外场景运动目标检测方法,其特征在于:所述方法包括以下步骤:
步骤1:获得户外场景视频流;
步骤2:将视频流的任一视频帧I k 使用三帧差法进行运动目标检测,获得前景二值图R k1 包括以下步骤:
步骤2.1.1:获得当前视频帧I k 的前一帧I k-1 及后一帧I k+1 ;
步骤2.1.2:以I k-1 及I k+1 分别与I k 进行差分运算,得到差分图像D k-1 和D k+1 ;
步骤2.1.3:将差分图像D k-1 和D k+1 分别进行二值化处理,得到D k-1 ’ 和D k+1 ’ ,以D k-1 ’ 和D k+1 ’ 进行或运算,得到二值图T k ;
步骤2.1.4:将T k 进行形态学滤波,得到运动目标的前景二值图R k1 ;
将视频流的任一帧I k 使用VIBE算法进行运动目标检测,得到前景二值图R k2 ;
步骤3:包括以下步骤:
步骤3.1:对前景二值图R k1 进行连通域检测,得到连通域集合Ω;
步骤3.2:计算每个连通域的面积,过滤面积小于T area 的连通域;
步骤3.3:得到去除噪声的二值图R k3 ;
步骤4:对二值图R k3 进行聚类处理,得到带有运动目标的二值图R k3 ’ ;
步骤5:匹配前景二值图R k2 和二值图R k3 ’ ,获得前景二值图R k2 和二值图R k3 ’ 中重叠的感兴趣区域,输出到二值图R k ;
步骤6:将二值图R k 进行形态学处理,得到检测的运动目标。
2.根据权利要求1所述的一种基于改进VIBE算法的户外场景运动目标检测方法,其特征在于:所述步骤2中,获得前景二值图R k2 包括以下步骤:
步骤2.2.1:获得任一视频帧I 0 ,为视频帧中的每个像素建立长度为N的样本集;
步骤2.2.2:将视频帧I k 中的像素点与对应的样本集中的样本进行比较;
步骤2.2.3:若视频帧I k 中的像素点与样本集中对应的像素点的距离小于R的采样点数量大于阈值T,则当前像素点属于背景点,否则为前景点;重复步骤2.2.3直至遍历所有的像素点;
步骤2.2.4:获得前景二值图R k2 。
3.根据权利要求2所述的一种基于改进VIBE算法的户外场景运动目标检测方法,其特征在于:所述步骤2.2.1中,样本集的采样值包括任一像素点自身的像素值以及所述像素点的邻域像素点的像素值。
4.根据权利要求2所述的一种基于改进VIBE算法的户外场景运动目标检测方法,其特征在于:当任一像素点被判断为背景点时,所述像素点对样本集中的任一样本进行更新的概率为1/α,所述像素点将邻域像素点的样本集合替换为当前像素点的样本集合的概率为1/α;α为时间因子,α>0。
5.根据权利要求1所述的一种基于改进VIBE算法的户外场景运动目标检测方法,其特征在于:所述步骤4包括以下步骤:
步骤4.1:对二值图R k3 中像素值为255的像素点使用DBSCAN算法进行聚类处理,得到类簇集合C={C 1 ,C 2 ,…,C n },n≥1;
步骤4.2:对集合中的每个类簇C i 划分外接矩形rect[i],1≤i≤n;
步骤4.3:得到带有运动目标的二值图R k3 ’ 。
6.根据权利要求5所述的一种基于改进VIBE算法的户外场景运动目标检测方法,其特征在于:所述步骤5包括以下步骤:
步骤5.1:基于二值图R k3 ’ 中的外接矩形rect[i]确定感兴趣区域;
步骤5.2:提取前景二值图R k2 中对应所述感兴趣区域的部分,与二值图R k3 ’ 中的感兴趣区域进行或运算;
步骤5.3:完成所有感兴趣区域的匹配运算,将结果输出到二值图R k 。
7.根据权利要求1所述的一种基于改进VIBE算法的户外场景运动目标检测方法,其特征在于:所述步骤6中,二值图R k 进行形态学处理包括以下步骤:
步骤6.1:对二值图R k 过滤面积小于阈值T 1 的连通域;
步骤6.2:对处理后的图像进行膨胀操作;
步骤6.3:对膨胀操作后的图像进行腐蚀操作,得到目标增强后的图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910837917.XA CN110781721B (zh) | 2019-09-05 | 2019-09-05 | 一种基于改进vibe算法的户外场景运动目标检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910837917.XA CN110781721B (zh) | 2019-09-05 | 2019-09-05 | 一种基于改进vibe算法的户外场景运动目标检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110781721A CN110781721A (zh) | 2020-02-11 |
CN110781721B true CN110781721B (zh) | 2024-04-30 |
Family
ID=69384042
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910837917.XA Active CN110781721B (zh) | 2019-09-05 | 2019-09-05 | 一种基于改进vibe算法的户外场景运动目标检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110781721B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111507237A (zh) * | 2020-04-13 | 2020-08-07 | 北京巨视科技有限公司 | 一种应用在高速公路上基于视频的异常事件检测方法与装置 |
CN111753693B (zh) * | 2020-06-15 | 2024-01-19 | 西安工业大学 | 一种静态场景下目标检测方法 |
CN112070036A (zh) * | 2020-09-11 | 2020-12-11 | 联通物联网有限责任公司 | 基于多帧图片的目标检测方法、装置及存储介质 |
CN112861685B (zh) * | 2021-01-29 | 2022-08-30 | 亿景智联(北京)科技有限公司 | 基于射线爆发思想提取地图影像中区域地理信息的方法 |
CN112862854A (zh) * | 2021-02-08 | 2021-05-28 | 桂林电子科技大学 | 一种改进kcf算法的多无人机跟踪方法 |
CN114693556B (zh) * | 2022-03-25 | 2023-06-27 | 英特灵达信息技术(深圳)有限公司 | 一种高空抛物帧差法运动目标检测去拖影方法 |
CN117788466A (zh) * | 2024-02-26 | 2024-03-29 | 国科大杭州高等研究院 | 一种非制冷红外视频序列危险气体成像泄漏检测方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107330924A (zh) * | 2017-07-07 | 2017-11-07 | 郑州仁峰软件开发有限公司 | 一种基于单目摄像头识别运动物体的方法 |
CN109377515A (zh) * | 2018-08-03 | 2019-02-22 | 佛山市顺德区中山大学研究院 | 一种基于改进ViBe算法的运动目标检测方法及系统 |
-
2019
- 2019-09-05 CN CN201910837917.XA patent/CN110781721B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107330924A (zh) * | 2017-07-07 | 2017-11-07 | 郑州仁峰软件开发有限公司 | 一种基于单目摄像头识别运动物体的方法 |
CN109377515A (zh) * | 2018-08-03 | 2019-02-22 | 佛山市顺德区中山大学研究院 | 一种基于改进ViBe算法的运动目标检测方法及系统 |
Non-Patent Citations (2)
Title |
---|
杨依忠 等.基于改进 ViBe 算法与三帧差法的运动检测算法.《合 肥 工 业 大 学 学 报 (自 然 科 学 版 )》.2018,第41卷(第8期),全文. * |
白一帆 等.基于 Vibe 和三帧差法的目标检测算法.《湖南科技大学学报( 自然科学版)》.2018,第33卷(第2期),第54-59页. * |
Also Published As
Publication number | Publication date |
---|---|
CN110781721A (zh) | 2020-02-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110781721B (zh) | 一种基于改进vibe算法的户外场景运动目标检测方法 | |
Xu et al. | Background modeling methods in video analysis: A review and comparative evaluation | |
US20230289979A1 (en) | A method for video moving object detection based on relative statistical characteristics of image pixels | |
Liu et al. | SAR image change detection based on mathematical morphology and the K-means clustering algorithm | |
CN102096821B (zh) | 基于复杂网络理论的强干扰环境下的车牌识别方法 | |
Zhao et al. | Object detection based on a robust and accurate statistical multi-point-pair model | |
CN109345472A (zh) | 一种复杂场景的红外运动小目标检测方法 | |
CN111340855A (zh) | 一种基于轨迹预测的道路移动目标检测方法 | |
CN105741319B (zh) | 基于盲目更新策略和前景模型的改进视觉背景提取方法 | |
CN109934224A (zh) | 基于马尔科夫随机场和视觉对比机制的小目标检测方法 | |
Yang et al. | A vehicle license plate recognition system based on fixed color collocation | |
CN110008900B (zh) | 一种由区域到目标的可见光遥感图像候选目标提取方法 | |
CN113792606B (zh) | 基于多目标追踪的低成本自监督行人重识别模型构建方法 | |
Chen et al. | A unified model sharing framework for moving object detection | |
CN114119621A (zh) | 基于深度编解码融合网络的sar遥感图像水域分割方法 | |
Liu et al. | DISCOV: A framework for discovering objects in video | |
CN107301655B (zh) | 一种基于背景建模的视频移动目标侦测方法 | |
CN110310263B (zh) | 一种基于显著性分析和背景先验的sar图像居民区检测方法 | |
CN112434730A (zh) | 一种基于GoogleNet的视频图像质量异常分类方法 | |
Zeng et al. | A universal sample-based background subtraction method for traffic surveillance videos | |
CN111767856A (zh) | 基于灰度值统计分布模型的红外小目标检测算法 | |
US20060147085A1 (en) | Modeling scenes in videos using spectral similarity | |
CN108038872B (zh) | 一种基于动静态目标检测与实时压缩感知追踪研究方法 | |
Cheng et al. | A novel improved ViBe algorithm to accelerate the ghost suppression | |
UKINKAR et al. | Object detection in dynamic background using image segmentation: A review |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |