CN105427341A - 基于多变分水平集的复杂背景视频图像多目标检测方法 - Google Patents

基于多变分水平集的复杂背景视频图像多目标检测方法 Download PDF

Info

Publication number
CN105427341A
CN105427341A CN201510765947.6A CN201510765947A CN105427341A CN 105427341 A CN105427341 A CN 105427341A CN 201510765947 A CN201510765947 A CN 201510765947A CN 105427341 A CN105427341 A CN 105427341A
Authority
CN
China
Prior art keywords
moving target
zero level
level collection
represent
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510765947.6A
Other languages
English (en)
Other versions
CN105427341B (zh
Inventor
余航
冯冬竹
戴浩
何晓川
刘清华
范琳琳
许录平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
CETC 54 Research Institute
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201510765947.6A priority Critical patent/CN105427341B/zh
Publication of CN105427341A publication Critical patent/CN105427341A/zh
Application granted granted Critical
Publication of CN105427341B publication Critical patent/CN105427341B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于多变分水平集的复杂背景视频图像多目标检测方法,其实现步骤为:(1)输入影像格式的视频图像;(2)选取三帧图像;(3)获得二值图像;(4)去除干扰噪声;(5)获得运动目标的零水平集;(6)用多变分水平集方法更新运动目标零水平集;(7)判断更新的运动目标零水平集是否与第二帧图像中运动目标的边缘重合;(8)输出第二帧图像中运动目标的检测结果。本发明解决了运动目标零水平集为固定曲线的问题,以及对多个运动目标检测时采用图像区域全局信息使得检测结果彼此干扰的不足,具有较高的检测准确度,可应用于视频图像中多个运动目标的检测。

Description

基于多变分水平集的复杂背景视频图像多目标检测方法
技术领域
本发明属于图像处理技术领域,更进一步涉及视频图像多目标检测技术领域中的一种基于多变分水平集的复杂背景视频图像多目标检测方法。本发明可用于识别视频图像中是否存在运动目标,并在复杂的图像背景下将所识别的多个运动目标检测出来。
背景技术
运动目标检测是指从序列图像中检测出变化区域并将运动目标从背景图像中提取出来,能够将序列图像中变化的前景区域从各帧图像中分割出来。通常情况下,目标分类、跟踪和行为理解等后处理过程仅仅考虑图像中对应于运动目标的像素区域,因此运动目标的正确检测与分割对于后期处理非常重要。然而,由于场景的动态变化,如天气、光照、阴影以及杂乱背景干扰等影响,使得运动目标的检测与分割相当困难。根据摄像头是否保持静止,运动检测分为静态背景和动态背景。大多数视频监控系统的摄像头是固定的,因此静态背景下运动目标检测算法受到广泛关注,常用的方法有帧差法、光流法和背景差法等。
杨莉,张荣国,胡静,刘焜等人在论文“基于c-v模型的运动目标水平集提取方法”(《太原科技大学学报》2012年8月第33卷第4期)中提出了一种基于c-v模型的运动目标水平集提取方法。该方法使用改进的帧间差分法对运动区域进行初始检测,通过相邻视频帧的相减,选用自适应阈值判断出当前视频中的运动目标像素,经形态学处理去除噪声干扰后通过定义最小化能量函数构建运动目标轮廓提取的水平集c-v模型,从而实现运动目标的检测。该方法存在的不足之处是,对于运动目标的零水平集是采用固定的曲线来进行,此方法会导致非运动目标被误检测为运动目标,从而降低了检测的准确性。
宋丽叶,傅希林等人在其发表的论文“无需重新初始化水平集的多相水平集图像分割方法”(《山东师范大学学报》2012年3月第27卷第1期)中提出了一种无需重新初始化水平集的多相水平集图像分割方法。该方法根据Vese-Chan提出的多相模型的区域竞争思想,结合图像区域全局信息的能量函数作为模型的外部能量项,引入内部变形能量约束水平集函数来逼近符号距离函数,避免了重新初始化水平集函数的过程,提高了计算速度和分割效果,同时也实现了对图像中多相目标的检测。该方法的不足之处是,由于该方法结合图像区域全局信息,而不能对局部区域进行检测,当该方法用于含有多个运动目标零水平检测时,每个运动目标零水平集都会受到其他运动目标零水平集的干扰,影响检测准确度。
刘利雄,陈孟娟等人在其所申请的专利“一种基于水平集的多目标图像分割方法”(申请专利号:201310029907.6,公开号:CN103093473A)中提出了一种基于水平集的多目标图像分割方法。该方法首先在要分割的图像上画一个或多个闭合曲线作为初始轮廓,其次使用基于区域的主动轮廓模型,对初试轮廓进行迭代演化,最终得到目标的轮廓曲线。其所述的基于区域的主动轮廓模型充分考虑了图像的局部灰度信息,因此,能够分割灰度不均匀图像;将模型推广到多阶,能够对多目标图像进行分割。该方法存在的不足之处是,零水平集的位置是随机选择,且零水平集的个数也并不是根据其目标的个数来确定,对于复杂场景下的多目标检测,会将背景判断成目标,从而影响检测的精确度。
发明内容
本发明的目的在于针对上述已有技术的不足,提出基于多变分水平集的复杂背景视频图像多目标检测方法。本发明降低了检测复杂度,又较好避免了复杂背景下将背景误检测成运动目标的情况,提高了检测的准确性。
本发明具体步骤包括如下:
(1)输入影像格式的视频图像:
(2)从输入的视频图像中选取运动目标明显的连续三帧视频图像,将其依次定义为第一帧视频图像I1,第二帧视频图像I2,第三帧视频图像I3
(3)获得二值图像:
采用帧间差分法,对所选取的连续三帧图像进行帧间差分,获得二值图像B;
(4)去除干扰噪声:
采用形态学函数,对二值图像中除了目标之外存在的其他干扰噪声进行除噪,得到去除噪声后的二值图像I;
(5)获得运动目标的零水平集:
(5a)采用K-means聚类算法,对去除噪声后的二值图像I进行聚类,分别获得聚类类别中所有数据点到该聚类中心的距离之和、聚类类别中所有数据点的个数、聚类中心共三个数据;
(5b)以聚类类别中所有数据点到该类聚类中心的距离之和与该聚类类别中所有数据点的个数相比的结果作为半径,以聚类中心点作为圆心所得到的圆即为运动目标的零水平集φk
(6)用多变分水平集方法更新运动目标零水平集:
(6a)按照下式,计算运动目标零水平集的内部能量:
W ( φ ) = μ 2 Σ k = 1 K ∫ Ω ( | ▿ φ k | - 1 ) 2 d x d y
其中,W(φ)表示运动目标零水平集的内部能量,φ表示运动目标零水平集φk的集合,μ表示对内部能量的约束系数,其取值范围为0<μ<0.25,k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号,k=1,2,…,K,K表示运动目标总数,∑表示求和操作,∫表示求积分操作,Ω表示第二帧视频图像I2的平面集合,|·|表示取绝对值操作,▽表示求梯度算子操作,φk表示运动目标的零水平集,x表示运动目标零水平集φk的横轴坐标值,y表示运动目标零水平集φk的纵轴坐标值;
(6b)按照下式,得到第二帧视频图像I2中运动目标的边缘:
g = 1 1 + | ▿ G * I 2 | 2
其中,g表示第二帧视频图像I2中运动目标的边缘,|·|表示取绝对值操作,▽表示求梯度算子操作,G表示高斯核,*表示卷积操作,I2表示连续三帧视频图像中的第二帧视频图像;
(6c)按照下式,计算运动目标零水平集的长度:
L g ( φ ) = Σ k = 1 K ∫ Ω g δ ( φ k ) | ▿ φ k | d x d y
其中,Lg(φ)表示运动目标零水平集的长度,g表示第二帧视频图像I2中运动目标的边缘,φ表示运动目标零水平集φk的集合,φk表示运动目标零水平集,k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号,k=1,2,…,K,K表示运动目标总数,∑表示求和操作,∫表示求积分操作,Ω表示第二帧视频图像I2的平面集合,δ表示单变量的Dirac函数,|·|表示取绝对值操作,▽表示求梯度算子操作,x表示运动目标零水平集φk的横轴坐标值,y表示运动目标零水平集φk的纵轴坐标值;
(6d)按照下式,计算运动目标区域的面积:
A g ( φ ) = Σ k = 1 K ∫ Ω g H ( - φ k ) d x d y
其中,Ag(φ)表示运动目标区域的面积,g表示第二帧视频图像I2中运动目标的边缘,φ表示运动目标零水平集φk的集合,φk表示运动目标零水平集,k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号,k=1,2,…,K,K表示运动目标总数,∑表示求和操作,∫表示求积分操作,Ω表示第二帧视频图像I2的平面集合,H表示Heaviside函数,x表示运动目标零水平集φk的横轴坐标值,y表示运动目标零水平集φk的纵轴坐标值;
(6e)按照下式,计算运动目标零水平集的外部能量:
ϵ g , λ k , v k ( φ ) = Σ k = 1 K λ k L g ( φ ) + Σ k = 1 K v k A g ( φ )
其中,表示运动目标零水平集的外部能量,g表示第二帧视频图像I2中运动目标的边缘,λk表示运动目标零水平集长度的约束系数,其取值为0<λk<10的整数,k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号,k=1,2,…,K,K表示运动目标总数,vk表示运动目标区域面积的约束系数,φ表示运动目标零水平集φk的集合,其取值为-5<vk<5且vk≠0,∑表示求和操作,Lg(φ)表示运动目标零水平集的长度,Ag(φ)表示运动目标区域的面积;
(6f)按照下式,计算运动目标零水平集的总能量:
ϵ ( φ ) = W ( φ ) + ϵ g , λ k , v k ( φ )
其中,ε(φ)表示运动目标零水平集的总能量,φ表示运动目标零水平集φk的集合,W(φ)表示运动目标零水平集的内部能量,表示运动目标零水平集的外部能量,g表示第二帧视频图像I2中运动目标的轮廓,λk表示运动目标零水平集长度的约束系数,其取值为0<λk<10的整数,k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号,vk表示运动目标区域面积的约束系数,其取值为-5<vk<5且vk≠0;
(6g)按照下式,对运动目标零水平集进行水平集演化,得到更新的运动目标零水平集:
∂ φ k ∂ t = μ [ Δφ k - d i v ( ▿ φ | ▿ φ | ) ] + δ ( φ k ) [ Σ k = 1 K λ k d i v ( g ▿ φ k | ▿ φ k | ) ] + Σ k = 1 K v k g δ ( φ k )
其中,表示更新的运动目标零水平集,表示求导操作,φk表示运动目标零水平集,φ表示运动目标零水平集φk的集合,k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号,k=1,2,…,K,K表示运动目标总数,t表示迭代步长,μ表示对内部能量的约束系数,其取值范围为0<μ<0.25,Δ表示求拉普拉斯算子操作,div(·)表示求矢量的散度,▽表示求梯度算子操作,|·|表示取绝对值操作,δ表示单变量的Dirac函数,∑表示求和操作,λk表示运动目标零水平集长度的约束系数,其取值为0<λk<10的整数,g表示第二帧视频图像I2中运动目标的边缘,vk表示目标区域面积的约束系数,其取值为-5<vk<5且vk≠0;
(7)判断更新的运动目标零水平集是否与第二帧视频图像I2中运动目标的边缘重合,若是,执行步骤(8),否则,执行步骤(6);
(8)输出第二帧视频图像I2中运动目标的检测结果。
本发明与现有技术相比具有以下优点:
第一,由于本发明采用k-means聚类算法来获取运动目标的零水平集和运动目标零水平集的位置,并根据运动目标的个数来确定运动目标零水平集的个数,避免了现有技术中运动目标的零水平集是由固定的曲线来获得,导致非运动目标被误检测为运动目标及现有技术采用零水平集的位置是随机选择,零水平集的个数不是根据其运动目标的个数来确定,对于复杂场景下的多目标检测,会将背景判断成目标,检测能力不高的不足,使得本发明提高了视频图像中运动目标检测的准确度。
第二,由于本发明采用多变分水平集方法来更新运动目标零水平集,避免了现有技术采用图像区域全局信息,而不能对局部区域进行检测,当含有多个运动目标检测时,每个运动目标零水平集都会受到其他运动目标零水平集的干扰的不足,综合考虑了运动目标零水平集的位置及个数,使得本发明提高了视频图像中复杂背景多目标检测的准确性。
附图说明
图1是本发明的流程图;
图2是本发明本发明对含有多个运动目标的视频图像进行运动目标检测的效果图。
具体实施方式
下面结合附图对本发明做进一步的详细描述。
参照附图1,对本发明的步骤做进一步的详细描述。
步骤1:输入影像格式的视频图像。
步骤2:从输入的视频图像中选取运动目标明显的连续三帧视频图像,将其依次定义为第一帧视频图像I1,第二帧视频图像I2,第三帧视频图像I3
步骤3:获得二值图像。
采用帧间差分法,对所选取的连续三帧图像进行帧间差分,获得二值图像B。
帧间差分法具体步骤如下:
用所选取的连续三帧视频图像中的第一帧视频图像I1减去第二帧视频图像I2,得到差分后的图像B1
用所选取的连续三帧视频图像中的第二帧视频图像I2减去第三帧视频图像I3,得到差分后的图像B2
将两个差分后的图像B1和B2进行相“与”,得到二值图像B。
在本发明中对选取的连续三帧视频图像采用上述的帧间差分算法进行帧间差分运算得到的二值图像如附图2(a)所示。在图2(a)中运动目标为白色的区域,背景为黑色的区域。通过图2可以看出,在视频图像中存在噪声干扰,将背景误当成目标,因此,在黑色背景区域中包含有少数的白色小点。
步骤4:去除干扰噪声。
采用形态学函数,对二值图像中除了目标之外存在的其他干扰噪声进行除噪,得到去除噪声后的二值图像I。
在本发明中对所得到的二值图像采用形态学函数为MATLAB软件自带的bewareaopen函数处理,所得到的去除噪声后的二值图像如附图2(b)所示。在图2(b)中运动目标为白色的区域,背景为黑色的区域。由图2(b)可以看出,去除了在二值图像中背景区域存在的白色小点,去除了二值图像中在背景中存在的噪声干扰,从而减小背景噪声对目标检测时的影响,提高检测的准确度。
步骤5:获得运动目标的零水平集。
采用K-means聚类算法,对去除噪声后的二值图像I进行聚类,分别获得聚类类别中所有数据点到该聚类中心的距离之和、聚类类别中所有数据点的个数、聚类中心共三个数据。
k-means聚类算法的具体步骤如下:
从去除噪声后的二值图像I中随机选取K个中心点,其中,K表示运动目标总数。
按照下式,遍历去除噪声后的二值图像I中的所有数据点,将每个数据点划分到最近的中心点中:
min J ( C ) = Σ k = 1 K Σ x i ∈ C k m k i d i s t ( x i , s k ) 2
其中,J(C)表示去除噪声后的二值图像I中每个数据点到其划分的中心点的距离,C表示将去除噪声后的二值图像I中的数据点划分后得到的聚类类别集合,min(·)表示取最小值操作,∑表示求和操作,mki表示系数,i表示去除噪声后的二值图像I中数据点的序号,k表示对去除噪声后的二值图像I中的数据点划分后得到的聚类类别的序号,k=1,2,…,K,K表示运动目标总数,dist(·)表示距离函数,xi表示去除噪声后的二值图像I中的第i个数据点,sk表示去除噪声后的二值图像I划分后得到的第k类聚类类别的聚类中心点,Ck表示去除噪声后的二值图像I划分后得到的第k类聚类类别,∈表示属于操作。
按照下式,计算去除噪声后的二值图像I划分后得到的每个聚类类别的平均值,将该平均值作为新的聚类中心点:
s k = 1 n k Σ i = 1 n k x i k
其中,sk表示去除噪声后的二值图像I划分后得到的第k类聚类类别的聚类中心点,k表示对去除噪声后的二值图像I中的数据点划分后得到的聚类类别的序号,nk表示去除噪声后的二值图像I中的数据点划分后得到的第k个聚类类别中数据点的个数,∑表示求和操作,表示对去除噪声后的二值图像I中的数据点划分后得到的第k个聚类类别中第i个数据点,i表示去除噪声后的二值图像I中的数据点的序号。
以聚类类别中所有数据点到该类聚类中心的距离之和与该聚类类别中所有数据点的个数相比的结果作为半径,以聚类中心点作为圆心所得到的圆即为运动目标的零水平集φk
本发明中获得运动目标的零水平集的具体步骤如下:
按照下式,计算运动目标零水平集的半径:
Rk=Dk/Nk
其中,Rk表示运动目标零水平集的半径,Dk表示在去除噪声后的二值图像I中第k类聚类类别中的所有数据点到该类聚类中心的距离之和,Nk表示在去除噪声后的二值图像I中属于第k类聚类类别的所有数据点的个数,k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号。
以运动目标零水平集的半径Rk为半径,以去除噪声后的二值图像I聚类得到的第k类聚类类别的聚类中心sk为圆心做圆,得到运动目标的零水平集φk
在本发明中,对去除噪声的二值图像进行k-means聚类算法得到运动目标的零水平集,将运动目标的水平集放于第二帧视频图像中得到示意图如附图2(c)所示。在附图2(c)中三辆小车为运动目标,分别在三辆小车上的三个白色的圆圈为运动目标的零水平集。从图中可以看出,运动目标的零水平集处于运动目标上,且与目标的大小几乎相近,从而在能够确定运动目标的同时,也为后续多变分水平集方法更新运动目标零水平集时缩短了所需要的时间。
步骤6:用多变分水平集方法更新运动目标零水平集。
按照下式,计算运动目标零水平集的内部能量:
W ( φ ) = μ 2 Σ k = 1 K ∫ Ω ( | ▿ φ k | - 1 ) 2 d x d y
其中,W(φ)表示运动目标零水平集的内部能量,φ表示运动目标零水平集φk的集合,μ表示对内部能量的约束系数,其取值范围为0<μ<0.25,k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号,k=1,2,…,K,K表示运动目标总数,∑表示求和操作,∫表示求积分操作,Ω表示第二帧视频图像I2的平面集合,|·|表示取绝对值操作,▽表示求梯度算子操作,φk表示运动目标的零水平集,x表示运动目标零水平集φk的横轴坐标值,y表示运动目标零水平集φk的纵轴坐标值。
按照下式,得到第二帧视频图像I2中运动目标的边缘:
g = 1 1 + | ▿ G * I 2 | 2
其中,g表示第二帧视频图像I2中运动目标的边缘,|·|表示取绝对值操作,▽表示求梯度算子操作,G表示高斯核,*表示卷积操作,I2表示连续三帧视频图像中的第二帧视频图像。
按照下式,计算运动目标零水平集的长度:
L g ( φ ) = Σ k = 1 K ∫ Ω g δ ( φ k ) | ▿ φ k | d x d y
其中,Lg(φ)表示运动目标零水平集的长度,g表示第二帧视频图像I2中运动目标的边缘,φ表示运动目标零水平集φk的集合,φk表示运动目标零水平集,k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号,k=1,2,…,K,K表示运动目标总数,∑表示求和操作,∫表示求积分操作,Ω表示第二帧视频图像I2的平面集合,δ表示单变量的Dirac函数,|·|表示取绝对值操作,▽表示求梯度算子操作,x表示运动目标零水平集φk的横轴坐标值,y表示运动目标零水平集φk的纵轴坐标值。
按照下式,计算运动目标区域的面积:
A g ( φ ) = Σ k = 1 K ∫ Ω g H ( - φ k ) d x d y
其中,Ag(φ)表示运动目标区域的面积,g表示第二帧视频图像I2中运动目标的边缘,φ表示运动目标零水平集φk的集合,φk表示运动目标零水平集,k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号,k=1,2,…,K,K表示运动目标总数,∑表示求和操作,∫表示求积分操作,Ω表示第二帧视频图像I2的平面集合,H表示Heaviside函数,x表示运动目标零水平集φk的横轴坐标值,y表示运动目标零水平集φk的纵轴坐标值。
按照下式,计算运动目标零水平集的外部能量:
ϵ g , λ k , v k ( φ ) = Σ k = 1 K λ k L g ( φ ) + Σ k = 1 K v k A g ( φ )
其中,表示运动目标零水平集的外部能量,g表示第二帧视频图像I2中运动目标的边缘,λk表示运动目标零水平集长度的约束系数,其取值为0<λk<10的整数,k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号,k=1,2,…,K,K表示运动目标总数,vk表示运动目标区域面积的约束系数,φ表示运动目标零水平集φk的集合,其取值为-5<vk<5且vk≠0,∑表示求和操作,Lg(φ)表示运动目标零水平集的长度,Ag(φ)表示运动目标区域的面积。
按照下式,计算运动目标零水平集的总能量:
ϵ ( φ ) = W ( φ ) + ϵ g , λ k , v k ( φ )
其中,ε(φ)表示运动目标零水平集的总能量,φ表示运动目标零水平集φk的集合,W(φ)表示运动目标零水平集的内部能量,表示运动目标零水平集的外部能量,g表示第二帧视频图像I2中运动目标的轮廓,λk表示运动目标零水平集长度的约束系数,其取值为0<λk<10的整数,k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号,vk表示运动目标区域面积的约束系数,其取值为-5<vk<5且vk≠0。
按照下式,对运动目标零水平集进行水平集演化,得到更新的运动目标零水平集:
∂ φ k ∂ t = μ [ Δφ k - d i v ( ▿ φ | ▿ φ | ) ] + δ ( φ k ) [ Σ k = 1 K λ k d i v ( g ▿ φ k | ▿ φ k | ) ] + Σ k = 1 K v k g δ ( φ k )
其中,表示更新的运动目标零水平集,表示求导操作,φk表示运动目标零水平集,φ表示运动目标零水平集φk的集合,k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号,k=1,2,…,K,K表示运动目标总数,t表示迭代步长,μ表示对内部能量的约束系数,其取值范围为0<μ<0.25,Δ表示求拉普拉斯算子操作,div(·)表示求矢量的散度,▽表示求梯度算子操作,|·|表示取绝对值操作,δ表示单变量的Dirac函数,∑表示求和操作,λk表示运动目标零水平集长度的约束系数,其取值为0<λk<10的整数,g表示第二帧视频图像I2中运动目标的边缘,vk表示目标区域面积的约束系数,其取值为-5<vk<5且vk≠0。
步骤7:判断更新的运动目标零水平集是否与第二帧视频图像I2中运动目标的边缘重合,若是,执行步骤(8),否则,执行步骤(6);
步骤8:输出第二帧视频图像I2中运动目标的检测结果。
下面结合仿真实验对本发明的效果做进一步的描述。
1、仿真条件:
本发明的仿真在操作系统为windows7,CPU为Intel(R)core(TM)i5-2400,基本频率3.20GHz,内存4GB的硬件环境和MatlabR2011b的软件环境下进行的。在进行实验时,时间的迭代步长为Δt=5,内部能量的约束系数为μ=0.2/Δt,运动目标零水平集长度的约束系数为λ=5,目标区域面积的约束系数为v=1.5。
2、仿真内容:
本发明仿真实验所用数据为ComputerVisionandRoboticsResearch中的highwayⅡ测试视频中选取的第291,292和293帧视频图像,视频图像尺寸为320×240像素。
3、仿真结果分析:
本发明仿真实验为对含有多个运动目标的视频图像进行运动目标检测。如图2所示,图2(a)为对highwayⅡ测试视频中所选取的包含多个运动目标的第291,292和293帧视频图像进行帧间差分运算后所获得的二值图像;图2(b)为对图2(a)的二值图像采用形态学函数bewareaopen函数进行去除噪声处理,得到去除噪声的二值图像;图2(c)为对图2(b)的去除噪声的二值图像进行k-means聚类得到运动目标零水平集,将运动目标零水平集显示在第二帧视频图像中,得到运动目标零水平集的示意图;图2(d)为采用多变分水平集对图2(c)中的运动目标零水平集更新得到的对含有多个运动目标的视频图像进行运动目标检测的效果图。
在图2(d)中,小车为运动目标,白色曲线为运动目标零水平集。通过图2(d)可以看出,本发明能够使得运动目标零水平集与运动目标的边缘轮廓重合,能够准确检测出在复杂背景下的多个运动目标,所得到的检测结果具有较高的准确度。

Claims (4)

1.一种基于多变分水平集的复杂背景视频图像多目标检测方法,包括如下步骤:
(1)输入影像格式的视频图像:
(2)从输入的视频图像中选取运动目标明显的连续三帧视频图像,将其依次定义为第一帧视频图像I1,第二帧视频图像I2,第三帧视频图像I3
(3)获得二值图像:
采用帧间差分法,对所选取的连续三帧图像进行帧间差分,获得二值图像B;
(4)去除干扰噪声:
采用形态学函数,对二值图像中除了目标之外存在的其他干扰噪声进行除噪,得到去除噪声后的二值图像I;
(5)获得运动目标的零水平集:
(5a)采用K-means聚类算法,对去除噪声后的二值图像I进行聚类,分别获得聚类类别中所有数据点到该聚类中心的距离之和、聚类类别中所有数据点的个数、聚类中心共三个数据;
(5b)以聚类类别中所有数据点到该类聚类中心的距离之和与该聚类类别中所有数据点的个数相比的结果作为半径,以聚类中心点作为圆心所得到的圆即为运动目标的零水平集φk
(6)用多变分水平集方法更新运动目标零水平集:
(6a)按照下式,计算运动目标零水平集的内部能量:
W ( φ ) = μ 2 Σ k = 1 K ∫ Ω ( | ▿ φ k | - 1 ) 2 d x d y
其中,W(φ)表示运动目标零水平集的内部能量,φ表示运动目标零水平集φk的集合,μ表示对内部能量的约束系数,其取值范围为0<μ<0.25,k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号,k=1,2,…,K,K表示运动目标总数,Σ表示求和操作,∫表示求积分操作,Ω表示第二帧视频图像I2的平面集合,|·|表示取绝对值操作,▽表示求梯度算子操作,φk表示运动目标的零水平集,x表示运动目标零水平集φk的横轴坐标值,y表示运动目标零水平集φk的纵轴坐标值;
(6b)按照下式,得到第二帧视频图像I2中运动目标的边缘:
g = 1 1 + | ▿ G * I 2 | 2
其中,g表示第二帧视频图像I2中运动目标的边缘,|·|表示取绝对值操作,▽表示求梯度算子操作,G表示高斯核,*表示卷积操作,I2表示连续三帧视频图像中的第二帧视频图像;
(6c)按照下式,计算运动目标零水平集的长度:
L g ( φ ) = Σ k = 1 K ∫ Ω g δ ( φ k ) | ▿ φ k | d x d y
其中,Lg(φ)表示运动目标零水平集的长度,g表示第二帧视频图像I2中运动目标的边缘,φ表示运动目标零水平集φk的集合,φk表示运动目标零水平集,k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号,k=1,2,…,K,K表示运动目标总数,Σ表示求和操作,∫表示求积分操作,Ω表示第二帧视频图像I2的平面集合,δ表示单变量的Dirac函数,|·|表示取绝对值操作,▽表示求梯度算子操作,x表示运动目标零水平集φk的横轴坐标值,y表示运动目标零水平集φk的纵轴坐标值;
(6d)按照下式,计算运动目标区域的面积:
A g ( φ ) = Σ k = 1 K ∫ Ω g H ( - φ k ) d x d y
其中,Ag(φ)表示运动目标区域的面积,g表示第二帧视频图像I2中运动目标的边缘,φ表示运动目标零水平集φk的集合,φk表示运动目标零水平集,k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号,k=1,2,…,K,K表示运动目标总数,Σ表示求和操作,∫表示求积分操作,Ω表示第二帧视频图像I2的平面集合,H表示Heaviside函数,x表示运动目标零水平集φk的横轴坐标值,y表示运动目标零水平集φk的纵轴坐标值;
(6e)按照下式,计算运动目标零水平集的外部能量:
ϵ g , λ k , v k ( φ ) = Σ k = 1 K λ k L g ( φ ) + Σ k = 1 K v k A g ( φ )
其中,表示运动目标零水平集的外部能量,g表示第二帧视频图像I2中运动目标的边缘,λk表示运动目标零水平集长度的约束系数,其取值为0<λk<10的整数,k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号,k=1,2,…,K,K表示运动目标总数,vk表示运动目标区域面积的约束系数,φ表示运动目标零水平集φk的集合,其取值为-5<vk<5且vk≠0,Σ表示求和操作,Lg(φ)表示运动目标零水平集的长度,Ag(φ)表示运动目标区域的面积;
(6f)按照下式,计算运动目标零水平集的总能量:
ϵ ( φ ) = W ( φ ) + ϵ g , λ k , v k ( φ )
其中,ε(φ)表示运动目标零水平集的总能量,φ表示运动目标零水平集φk的集合,W(φ)表示运动目标零水平集的内部能量,表示运动目标零水平集的外部能量,g表示第二帧视频图像I2中运动目标的轮廓,λk表示运动目标零水平集长度的约束系数,其取值为0<λk<10的整数,k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号,vk表示运动目标区域面积的约束系数,其取值为-5<vk<5且vk≠0;
(6g)按照下式,对运动目标零水平集进行水平集演化,得到更新的运动目标零水平集:
∂ φ k ∂ t = μ [ Δφ k - d i v ( ▿ φ | ▿ φ | ) ] + δ ( φ k ) [ Σ k = 1 K λ k d i v ( g ▿ φ k | ▿ φ k | ) ] + Σ k = 1 K v k g δ ( φ k )
其中,表示更新的运动目标零水平集,表示求导操作,φk表示运动目标零水平集,φ表示运动目标零水平集φk的集合,k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号,k=1,2,…,K,K表示运动目标总数,t表示迭代步长,μ表示对内部能量的约束系数,其取值范围为0<μ<0.25,Δ表示求拉普拉斯算子操作,div(·)表示求矢量的散度,▽表示求梯度算子操作,|·|表示取绝对值操作,δ表示单变量的Dirac函数,Σ表示求和操作,λk表示运动目标零水平集长度的约束系数,其取值为0<λk<10的整数,g表示第二帧视频图像I2中运动目标的边缘,vk表示目标区域面积的约束系数,其取值为-5<vk<5且vk≠0;
(7)判断更新的运动目标零水平集是否与第二帧视频图像I2中运动目标的边缘重合,若是,执行步骤(8),否则,执行步骤(6);
(8)输出第二帧视频图像I2中运动目标的检测结果。
2.根据权利要求1所述的基于多变分水平集的复杂背景视频图像多目标检测方法,其特征在于:步骤(3)所述帧间差分法的具体步骤如下:
第一步,用所选取的连续三帧视频图像中的第一帧视频图像I1减去第二帧视频图像I2,得到差分后的图像B1
第二步,用所选取的连续三帧视频图像中的第二帧视频图像I2减去第三帧视频图像I3,得到差分后的图像B2
第三步,将两个差分后的图像B1和B2进行相“与”,得到二值图像B。
3.根据权利要求1所述的基于多变分水平集的复杂背景视频图像多目标检测方法,其特征在于:步骤(5a)所述的K-means聚类算法的具体步骤如下:
第一步,从去除噪声后的二值图像I中随机选取K个中心点,其中,K表示运动目标总数;
第二步,按照下式,遍历去除噪声后的二值图像I中的所有数据点,将每个数据点划分到最近的中心点中:
min J ( C ) = Σ k = 1 K Σ x i ∈ C k m k i d i s t ( x i , s k ) 2
其中,J(C)表示去除噪声后的二值图像I中每个数据点到其划分的中心点的距离,C表示将去除噪声后的二值图像I中的数据点划分后得到的聚类类别集合,min(·)表示取最小值操作,Σ表示求和操作,mki表示系数,i表示去除噪声后的二值图像I中数据点的序号,k表示对去除噪声后的二值图像I中的数据点划分后得到的聚类类别的序号,k=1,2,…,K,K表示运动目标总数,dist(·)表示距离函数,xi表示去除噪声后的二值图像I中的第i个数据点,sk表示去除噪声后的二值图像I划分后得到的第k类聚类类别的聚类中心点,Ck表示去除噪声后的二值图像I划分后得到的第k类聚类类别,∈表示属于操作;
第三步,按照下式,计算去除噪声后的二值图像I划分后得到的每个聚类类别的平均值,将该平均值作为新的聚类中心点:
s k = 1 n k Σ i = 1 n k x i k
其中,sk表示去除噪声后的二值图像I划分后得到的第k类聚类类别的聚类中心点,k表示对去除噪声后的二值图像I中的数据点划分后得到的聚类类别的序号,nk表示去除噪声后的二值图像I中的数据点划分后得到的第k个聚类类别中数据点的个数,Σ表示求和操作,表示对去除噪声后的二值图像I中的数据点划分后得到的第k个聚类类别中第i个数据点,i表示去除噪声后的二值图像I中的数据点的序号。
4.根据权利要求1所述的基于多变分水平集的复杂背景视频图像多目标检测方法,其特征在于:步骤(5b)所述的获得运动目标的零水平集的具体步骤如下:
第一步,按照下式,计算运动目标零水平集的半径:
Rk=Dk/Nk
其中,Rk表示运动目标零水平集的半径,Dk表示在去除噪声后的二值图像I中第k类聚类类别中的所有数据点到该类聚类中心的距离之和,Nk表示在去除噪声后的二值图像I中属于第k类聚类类别的所有数据点的个数,k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号;
第二步,以运动目标零水平集的半径Rk为半径,以去除噪声后的二值图像I聚类得到的第k类聚类类别的聚类中心sk为圆心做圆,得到运动目标的零水平集φk
CN201510765947.6A 2015-11-11 2015-11-11 基于多变分水平集的复杂背景视频图像多目标检测方法 Expired - Fee Related CN105427341B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510765947.6A CN105427341B (zh) 2015-11-11 2015-11-11 基于多变分水平集的复杂背景视频图像多目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510765947.6A CN105427341B (zh) 2015-11-11 2015-11-11 基于多变分水平集的复杂背景视频图像多目标检测方法

Publications (2)

Publication Number Publication Date
CN105427341A true CN105427341A (zh) 2016-03-23
CN105427341B CN105427341B (zh) 2018-06-01

Family

ID=55505521

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510765947.6A Expired - Fee Related CN105427341B (zh) 2015-11-11 2015-11-11 基于多变分水平集的复杂背景视频图像多目标检测方法

Country Status (1)

Country Link
CN (1) CN105427341B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106169186A (zh) * 2016-07-01 2016-11-30 西安电子科技大学 基于水平集运动目标检测中获取初始轮廓的方法
CN108242057A (zh) * 2017-09-22 2018-07-03 西安电子科技大学 基于嵌入边界约束因子的局部主动轮廓图像分割方法
CN110309240A (zh) * 2018-03-14 2019-10-08 北京京东尚科信息技术有限公司 去除动态目标的方法和装置
CN112509030A (zh) * 2020-12-14 2021-03-16 华中科技大学 多目标检测的植物测量方法、系统、计算机设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050169533A1 (en) * 2004-01-29 2005-08-04 Nikolaos Paragyios Prior knowledge, level set representations and visual grouping
CN101567084A (zh) * 2009-06-05 2009-10-28 西安电子科技大学 基于水平集和分水岭相结合的图像轮廓检测方法
CN101639935A (zh) * 2009-09-07 2010-02-03 南京理工大学 基于几何活动轮廓目标跟踪的数字人连续切片图像分割方法
CN102354396A (zh) * 2011-09-23 2012-02-15 清华大学深圳研究生院 基于水平集函数的灰度不均匀图像分割方法
CN103123724A (zh) * 2013-02-27 2013-05-29 中山大学 一种基于连分式水平集的高清图像自动分割方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050169533A1 (en) * 2004-01-29 2005-08-04 Nikolaos Paragyios Prior knowledge, level set representations and visual grouping
CN101567084A (zh) * 2009-06-05 2009-10-28 西安电子科技大学 基于水平集和分水岭相结合的图像轮廓检测方法
CN101639935A (zh) * 2009-09-07 2010-02-03 南京理工大学 基于几何活动轮廓目标跟踪的数字人连续切片图像分割方法
CN102354396A (zh) * 2011-09-23 2012-02-15 清华大学深圳研究生院 基于水平集函数的灰度不均匀图像分割方法
CN103123724A (zh) * 2013-02-27 2013-05-29 中山大学 一种基于连分式水平集的高清图像自动分割方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
L.A.VESE,T.F.CHAN: "A Multiphase Level Set Framework for Image Segentation Using the Mumford and Shah Mode", 《INTERNATIONAL JOURNAL OF COMPUTER VISIO》 *
杨莉等: "基于C-V模型的运动目标水平集提取方法", 《太原科技大学学报》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106169186A (zh) * 2016-07-01 2016-11-30 西安电子科技大学 基于水平集运动目标检测中获取初始轮廓的方法
CN108242057A (zh) * 2017-09-22 2018-07-03 西安电子科技大学 基于嵌入边界约束因子的局部主动轮廓图像分割方法
CN108242057B (zh) * 2017-09-22 2020-04-07 西安电子科技大学 基于嵌入边界约束因子的局部主动轮廓图像分割方法
CN110309240A (zh) * 2018-03-14 2019-10-08 北京京东尚科信息技术有限公司 去除动态目标的方法和装置
CN112509030A (zh) * 2020-12-14 2021-03-16 华中科技大学 多目标检测的植物测量方法、系统、计算机设备及介质
CN112509030B (zh) * 2020-12-14 2022-05-31 华中科技大学 多目标检测的植物测量方法、系统、计算机设备及介质

Also Published As

Publication number Publication date
CN105427341B (zh) 2018-06-01

Similar Documents

Publication Publication Date Title
Cheng et al. Accurate urban road centerline extraction from VHR imagery via multiscale segmentation and tensor voting
US20210183097A1 (en) Spare Part Identification Using a Locally Learned 3D Landmark Database
Alidoost et al. A CNN-based approach for automatic building detection and recognition of roof types using a single aerial image
US8798377B2 (en) Efficient scale-space extraction and description of interest points
US9959466B2 (en) Object tracking apparatus and method and camera
Zhang et al. Deep active contour network for medical image segmentation
CN107808138B (zh) 一种基于FasterR-CNN的通信信号识别方法
US10984222B2 (en) Method, apparatus and system for 3D face tracking
Cai et al. Saliency-guided level set model for automatic object segmentation
CN105427341A (zh) 基于多变分水平集的复杂背景视频图像多目标检测方法
US20150193656A1 (en) Performing hand gesture recognition using 2d image data
US11544855B2 (en) Method and apparatus for tracking target
CN103839256B (zh) 基于小波分解的多尺度水平集的sar图像变化检测方法
CN110889421A (zh) 目标物检测方法及装置
CN104318559A (zh) 用于视频图像匹配的特征点快速检测方法
CN112164093A (zh) 一种基于边缘特征和相关滤波的人物自动跟踪方法
CN108764343B (zh) 一种跟踪算法中的跟踪目标框的定位方法
Ma et al. Image segmentation via mean curvature regularized Mumford-Shah model and thresholding
Hou et al. A variational formulation for fingerprint orientation modeling
Tanathong et al. Using GPS/INS data to enhance image matching for real-time aerial triangulation
CN109191489B (zh) 一种飞行器着陆标志的检测跟踪方法与系统
Dzyubachyk et al. A variational model for level-set based cell tracking in time-lapse fluorescence microscopy images
Yu et al. Small object detection in forward-looking infrared images with sea clutter using context-driven Bayesian saliency model
KR20130059680A (ko) 얼굴 영상에서의 기술어 추출 시스템 및 그 방법
Pribošek et al. Automating shockwave segmentation in low-contrast coherent shadowgraphy

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Yu Hang

Inventor after: Feng Dongzhu

Inventor after: Dai Hao

Inventor after: He Xiaochuan

Inventor after: Liu Qinghua

Inventor after: Fan Linlin

Inventor after: Xu Luping

Inventor after: Wang Shicheng

Inventor after: Yu Junna

Inventor before: Yu Hang

Inventor before: Feng Dongzhu

Inventor before: Dai Hao

Inventor before: He Xiaochuan

Inventor before: Liu Qinghua

Inventor before: Fan Linlin

Inventor before: Xu Luping

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20180223

Address after: Xi'an City, Shaanxi province Taibai Road 710071 No. 2

Applicant after: Xidian University

Applicant after: No.54 Inst., China Electronic Sci. & Tech. Group Co.

Address before: Xi'an City, Shaanxi province Taibai Road 710071 No. 2

Applicant before: Xidian University

GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180601

Termination date: 20181111