CN105427341A

CN105427341A - 基于多变分水平集的复杂背景视频图像多目标检测方法

Info

Publication number: CN105427341A
Application number: CN201510765947.6A
Authority: CN
Inventors: 余航; 冯冬竹; 戴浩; 何晓川; 刘清华; 范琳琳; 许录平
Original assignee: Xidian University
Current assignee: Xidian University; CETC 54 Research Institute
Priority date: 2015-11-11
Filing date: 2015-11-11
Publication date: 2016-03-23
Anticipated expiration: 2035-11-11
Also published as: CN105427341B

Abstract

本发明公开了一种基于多变分水平集的复杂背景视频图像多目标检测方法，其实现步骤为：(1)输入影像格式的视频图像；(2)选取三帧图像；(3)获得二值图像；(4)去除干扰噪声；(5)获得运动目标的零水平集；(6)用多变分水平集方法更新运动目标零水平集；(7)判断更新的运动目标零水平集是否与第二帧图像中运动目标的边缘重合；(8)输出第二帧图像中运动目标的检测结果。本发明解决了运动目标零水平集为固定曲线的问题，以及对多个运动目标检测时采用图像区域全局信息使得检测结果彼此干扰的不足，具有较高的检测准确度，可应用于视频图像中多个运动目标的检测。

Description

基于多变分水平集的复杂背景视频图像多目标检测方法

技术领域

本发明属于图像处理技术领域，更进一步涉及视频图像多目标检测技术领域中的一种基于多变分水平集的复杂背景视频图像多目标检测方法。本发明可用于识别视频图像中是否存在运动目标，并在复杂的图像背景下将所识别的多个运动目标检测出来。

背景技术

运动目标检测是指从序列图像中检测出变化区域并将运动目标从背景图像中提取出来，能够将序列图像中变化的前景区域从各帧图像中分割出来。通常情况下，目标分类、跟踪和行为理解等后处理过程仅仅考虑图像中对应于运动目标的像素区域，因此运动目标的正确检测与分割对于后期处理非常重要。然而，由于场景的动态变化，如天气、光照、阴影以及杂乱背景干扰等影响，使得运动目标的检测与分割相当困难。根据摄像头是否保持静止，运动检测分为静态背景和动态背景。大多数视频监控系统的摄像头是固定的，因此静态背景下运动目标检测算法受到广泛关注，常用的方法有帧差法、光流法和背景差法等。

杨莉，张荣国，胡静，刘焜等人在论文“基于c-v模型的运动目标水平集提取方法”(《太原科技大学学报》2012年8月第33卷第4期)中提出了一种基于c-v模型的运动目标水平集提取方法。该方法使用改进的帧间差分法对运动区域进行初始检测，通过相邻视频帧的相减，选用自适应阈值判断出当前视频中的运动目标像素，经形态学处理去除噪声干扰后通过定义最小化能量函数构建运动目标轮廓提取的水平集c-v模型，从而实现运动目标的检测。该方法存在的不足之处是，对于运动目标的零水平集是采用固定的曲线来进行，此方法会导致非运动目标被误检测为运动目标，从而降低了检测的准确性。

宋丽叶，傅希林等人在其发表的论文“无需重新初始化水平集的多相水平集图像分割方法”(《山东师范大学学报》2012年3月第27卷第1期)中提出了一种无需重新初始化水平集的多相水平集图像分割方法。该方法根据Vese-Chan提出的多相模型的区域竞争思想，结合图像区域全局信息的能量函数作为模型的外部能量项，引入内部变形能量约束水平集函数来逼近符号距离函数，避免了重新初始化水平集函数的过程，提高了计算速度和分割效果，同时也实现了对图像中多相目标的检测。该方法的不足之处是，由于该方法结合图像区域全局信息，而不能对局部区域进行检测，当该方法用于含有多个运动目标零水平检测时，每个运动目标零水平集都会受到其他运动目标零水平集的干扰，影响检测准确度。

刘利雄，陈孟娟等人在其所申请的专利“一种基于水平集的多目标图像分割方法”(申请专利号：201310029907.6，公开号：CN103093473A)中提出了一种基于水平集的多目标图像分割方法。该方法首先在要分割的图像上画一个或多个闭合曲线作为初始轮廓，其次使用基于区域的主动轮廓模型，对初试轮廓进行迭代演化，最终得到目标的轮廓曲线。其所述的基于区域的主动轮廓模型充分考虑了图像的局部灰度信息，因此，能够分割灰度不均匀图像；将模型推广到多阶，能够对多目标图像进行分割。该方法存在的不足之处是，零水平集的位置是随机选择，且零水平集的个数也并不是根据其目标的个数来确定，对于复杂场景下的多目标检测，会将背景判断成目标，从而影响检测的精确度。

发明内容

本发明的目的在于针对上述已有技术的不足，提出基于多变分水平集的复杂背景视频图像多目标检测方法。本发明降低了检测复杂度，又较好避免了复杂背景下将背景误检测成运动目标的情况，提高了检测的准确性。

本发明具体步骤包括如下：

(1)输入影像格式的视频图像：

(2)从输入的视频图像中选取运动目标明显的连续三帧视频图像，将其依次定义为第一帧视频图像I₁，第二帧视频图像I₂，第三帧视频图像I₃；

(3)获得二值图像：

采用帧间差分法，对所选取的连续三帧图像进行帧间差分，获得二值图像B；

(4)去除干扰噪声：

采用形态学函数，对二值图像中除了目标之外存在的其他干扰噪声进行除噪，得到去除噪声后的二值图像I；

(5)获得运动目标的零水平集：

(5a)采用K-means聚类算法，对去除噪声后的二值图像I进行聚类，分别获得聚类类别中所有数据点到该聚类中心的距离之和、聚类类别中所有数据点的个数、聚类中心共三个数据；

(5b)以聚类类别中所有数据点到该类聚类中心的距离之和与该聚类类别中所有数据点的个数相比的结果作为半径，以聚类中心点作为圆心所得到的圆即为运动目标的零水平集φ_k；

(6)用多变分水平集方法更新运动目标零水平集：

(6a)按照下式，计算运动目标零水平集的内部能量：

W (φ) = \frac{μ}{2} Σ_{k = 1}^{K} {&Integral;}_{Ω} {(| &dtri; φ_{k} | - 1)}^{2} d x d y

其中，W(φ)表示运动目标零水平集的内部能量，φ表示运动目标零水平集φ_k的集合，μ表示对内部能量的约束系数，其取值范围为0＜μ＜0.25，k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号，k＝1,2,…,K，K表示运动目标总数，∑表示求和操作，∫表示求积分操作，Ω表示第二帧视频图像I₂的平面集合，|·|表示取绝对值操作，▽表示求梯度算子操作，φ_k表示运动目标的零水平集，x表示运动目标零水平集φ_k的横轴坐标值，y表示运动目标零水平集φ_k的纵轴坐标值；

(6b)按照下式，得到第二帧视频图像I₂中运动目标的边缘：

g = \frac{1}{1 + | &dtri; G * I_{2} |^{2}}

其中，g表示第二帧视频图像I₂中运动目标的边缘，|·|表示取绝对值操作，▽表示求梯度算子操作，G表示高斯核，*表示卷积操作，I₂表示连续三帧视频图像中的第二帧视频图像；

(6c)按照下式，计算运动目标零水平集的长度：

L_{g} (φ) = Σ_{k = 1}^{K} {&Integral;}_{Ω} g δ (φ_{k}) | &dtri; φ_{k} | d x d y

其中，L_g(φ)表示运动目标零水平集的长度，g表示第二帧视频图像I₂中运动目标的边缘，φ表示运动目标零水平集φ_k的集合，φ_k表示运动目标零水平集，k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号，k＝1,2,…,K，K表示运动目标总数，∑表示求和操作，∫表示求积分操作，Ω表示第二帧视频图像I₂的平面集合，δ表示单变量的Dirac函数，|·|表示取绝对值操作，▽表示求梯度算子操作，x表示运动目标零水平集φ_k的横轴坐标值，y表示运动目标零水平集φ_k的纵轴坐标值；

(6d)按照下式，计算运动目标区域的面积：

A_{g} (φ) = Σ_{k = 1}^{K} {&Integral;}_{Ω} g H (- φ_{k}) d x d y

其中，A_g(φ)表示运动目标区域的面积，g表示第二帧视频图像I₂中运动目标的边缘，φ表示运动目标零水平集φ_k的集合，φ_k表示运动目标零水平集，k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号，k＝1,2,…,K，K表示运动目标总数，∑表示求和操作，∫表示求积分操作，Ω表示第二帧视频图像I₂的平面集合，H表示Heaviside函数，x表示运动目标零水平集φ_k的横轴坐标值，y表示运动目标零水平集φ_k的纵轴坐标值；

(6e)按照下式，计算运动目标零水平集的外部能量：

ϵ_{g, λ_{k}, v_{k}} (φ) = Σ_{k = 1}^{K} λ_{k} L_{g} (φ) + Σ_{k = 1}^{K} v_{k} A_{g} (φ)

其中，表示运动目标零水平集的外部能量，g表示第二帧视频图像I₂中运动目标的边缘，λ_k表示运动目标零水平集长度的约束系数，其取值为0＜λ_k＜10的整数，k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号，k＝1,2,…,K，K表示运动目标总数，v_k表示运动目标区域面积的约束系数，φ表示运动目标零水平集φ_k的集合，其取值为-5＜v_k＜5且v_k≠0，∑表示求和操作，L_g(φ)表示运动目标零水平集的长度，A_g(φ)表示运动目标区域的面积；

(6f)按照下式，计算运动目标零水平集的总能量：

ϵ (φ) = W (φ) + ϵ_{g, λ_{k}, v_{k}} (φ)

其中，ε(φ)表示运动目标零水平集的总能量，φ表示运动目标零水平集φ_k的集合，W(φ)表示运动目标零水平集的内部能量，表示运动目标零水平集的外部能量，g表示第二帧视频图像I₂中运动目标的轮廓，λ_k表示运动目标零水平集长度的约束系数，其取值为0＜λ_k＜10的整数，k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号，v_k表示运动目标区域面积的约束系数，其取值为-5＜v_k＜5且v_k≠0；

(6g)按照下式，对运动目标零水平集进行水平集演化，得到更新的运动目标零水平集：

\frac{\partial φ_{k}}{\partial t} = μ [{Δφ}_{k} - d i v (\frac{&dtri; φ}{| &dtri; φ |})] + δ (φ_{k}) [Σ_{k = 1}^{K} λ_{k} d i v (g \frac{&dtri; φ_{k}}{| &dtri; φ_{k} |})] + Σ_{k = 1}^{K} v_{k} g δ (φ_{k})

其中，表示更新的运动目标零水平集，表示求导操作，φ_k表示运动目标零水平集，φ表示运动目标零水平集φ_k的集合，k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号，k＝1,2,…,K，K表示运动目标总数，t表示迭代步长，μ表示对内部能量的约束系数，其取值范围为0＜μ＜0.25，Δ表示求拉普拉斯算子操作，div(·)表示求矢量的散度，▽表示求梯度算子操作，|·|表示取绝对值操作，δ表示单变量的Dirac函数，∑表示求和操作，λ_k表示运动目标零水平集长度的约束系数，其取值为0＜λ_k＜10的整数，g表示第二帧视频图像I₂中运动目标的边缘，v_k表示目标区域面积的约束系数，其取值为-5＜v_k＜5且v_k≠0；

(7)判断更新的运动目标零水平集是否与第二帧视频图像I₂中运动目标的边缘重合，若是，执行步骤(8)，否则，执行步骤(6)；

(8)输出第二帧视频图像I₂中运动目标的检测结果。

本发明与现有技术相比具有以下优点：

第一，由于本发明采用k-means聚类算法来获取运动目标的零水平集和运动目标零水平集的位置，并根据运动目标的个数来确定运动目标零水平集的个数，避免了现有技术中运动目标的零水平集是由固定的曲线来获得，导致非运动目标被误检测为运动目标及现有技术采用零水平集的位置是随机选择，零水平集的个数不是根据其运动目标的个数来确定，对于复杂场景下的多目标检测，会将背景判断成目标，检测能力不高的不足，使得本发明提高了视频图像中运动目标检测的准确度。

第二，由于本发明采用多变分水平集方法来更新运动目标零水平集，避免了现有技术采用图像区域全局信息，而不能对局部区域进行检测，当含有多个运动目标检测时，每个运动目标零水平集都会受到其他运动目标零水平集的干扰的不足，综合考虑了运动目标零水平集的位置及个数，使得本发明提高了视频图像中复杂背景多目标检测的准确性。

附图说明

图1是本发明的流程图；

图2是本发明本发明对含有多个运动目标的视频图像进行运动目标检测的效果图。

具体实施方式

下面结合附图对本发明做进一步的详细描述。

参照附图1，对本发明的步骤做进一步的详细描述。

步骤1：输入影像格式的视频图像。

步骤2：从输入的视频图像中选取运动目标明显的连续三帧视频图像，将其依次定义为第一帧视频图像I₁，第二帧视频图像I₂，第三帧视频图像I₃。

步骤3：获得二值图像。

采用帧间差分法，对所选取的连续三帧图像进行帧间差分，获得二值图像B。

帧间差分法具体步骤如下：

用所选取的连续三帧视频图像中的第一帧视频图像I₁减去第二帧视频图像I₂，得到差分后的图像B¹。

用所选取的连续三帧视频图像中的第二帧视频图像I₂减去第三帧视频图像I₃，得到差分后的图像B²。

将两个差分后的图像B¹和B²进行相“与”，得到二值图像B。

在本发明中对选取的连续三帧视频图像采用上述的帧间差分算法进行帧间差分运算得到的二值图像如附图2(a)所示。在图2(a)中运动目标为白色的区域，背景为黑色的区域。通过图2可以看出，在视频图像中存在噪声干扰，将背景误当成目标，因此，在黑色背景区域中包含有少数的白色小点。

步骤4：去除干扰噪声。

采用形态学函数，对二值图像中除了目标之外存在的其他干扰噪声进行除噪，得到去除噪声后的二值图像I。

在本发明中对所得到的二值图像采用形态学函数为MATLAB软件自带的bewareaopen函数处理，所得到的去除噪声后的二值图像如附图2(b)所示。在图2(b)中运动目标为白色的区域，背景为黑色的区域。由图2(b)可以看出，去除了在二值图像中背景区域存在的白色小点，去除了二值图像中在背景中存在的噪声干扰，从而减小背景噪声对目标检测时的影响，提高检测的准确度。

步骤5：获得运动目标的零水平集。

采用K-means聚类算法，对去除噪声后的二值图像I进行聚类，分别获得聚类类别中所有数据点到该聚类中心的距离之和、聚类类别中所有数据点的个数、聚类中心共三个数据。

k-means聚类算法的具体步骤如下：

从去除噪声后的二值图像I中随机选取K个中心点，其中，K表示运动目标总数。

按照下式，遍历去除噪声后的二值图像I中的所有数据点，将每个数据点划分到最近的中心点中：

\begin{matrix} \min & J (C) = Σ_{k = 1}^{K} \underset{x_{i} &Element; C_{k}}{Σ} m_{k i} d i s t {(x_{i}, s_{k})}^{2} \end{matrix}

其中，J(C)表示去除噪声后的二值图像I中每个数据点到其划分的中心点的距离，C表示将去除噪声后的二值图像I中的数据点划分后得到的聚类类别集合，min(·)表示取最小值操作，∑表示求和操作，m_ki表示系数，i表示去除噪声后的二值图像I中数据点的序号，k表示对去除噪声后的二值图像I中的数据点划分后得到的聚类类别的序号，k＝1,2,…,K，K表示运动目标总数，dist(·)表示距离函数，x_i表示去除噪声后的二值图像I中的第i个数据点，s_k表示去除噪声后的二值图像I划分后得到的第k类聚类类别的聚类中心点，C_k表示去除噪声后的二值图像I划分后得到的第k类聚类类别，∈表示属于操作。

按照下式，计算去除噪声后的二值图像I划分后得到的每个聚类类别的平均值，将该平均值作为新的聚类中心点：

s_{k} = \frac{1}{n_{k}} Σ_{i = 1}^{n_{k}} x_{i}^{k}

其中，s_k表示去除噪声后的二值图像I划分后得到的第k类聚类类别的聚类中心点，k表示对去除噪声后的二值图像I中的数据点划分后得到的聚类类别的序号，n_k表示去除噪声后的二值图像I中的数据点划分后得到的第k个聚类类别中数据点的个数，∑表示求和操作，表示对去除噪声后的二值图像I中的数据点划分后得到的第k个聚类类别中第i个数据点，i表示去除噪声后的二值图像I中的数据点的序号。

以聚类类别中所有数据点到该类聚类中心的距离之和与该聚类类别中所有数据点的个数相比的结果作为半径，以聚类中心点作为圆心所得到的圆即为运动目标的零水平集φ_k。

本发明中获得运动目标的零水平集的具体步骤如下：

按照下式，计算运动目标零水平集的半径：

R_k＝D_k/N_k

其中，R_k表示运动目标零水平集的半径，D_k表示在去除噪声后的二值图像I中第k类聚类类别中的所有数据点到该类聚类中心的距离之和，N_k表示在去除噪声后的二值图像I中属于第k类聚类类别的所有数据点的个数，k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号。

以运动目标零水平集的半径R_k为半径，以去除噪声后的二值图像I聚类得到的第k类聚类类别的聚类中心s_k为圆心做圆，得到运动目标的零水平集φ_k。

在本发明中，对去除噪声的二值图像进行k-means聚类算法得到运动目标的零水平集，将运动目标的水平集放于第二帧视频图像中得到示意图如附图2(c)所示。在附图2(c)中三辆小车为运动目标，分别在三辆小车上的三个白色的圆圈为运动目标的零水平集。从图中可以看出，运动目标的零水平集处于运动目标上，且与目标的大小几乎相近，从而在能够确定运动目标的同时，也为后续多变分水平集方法更新运动目标零水平集时缩短了所需要的时间。

步骤6：用多变分水平集方法更新运动目标零水平集。

按照下式，计算运动目标零水平集的内部能量：

W (φ) = \frac{μ}{2} Σ_{k = 1}^{K} {&Integral;}_{Ω} {(| &dtri; φ_{k} | - 1)}^{2} d x d y

其中，W(φ)表示运动目标零水平集的内部能量，φ表示运动目标零水平集φ_k的集合，μ表示对内部能量的约束系数，其取值范围为0＜μ＜0.25，k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号，k＝1,2,…,K，K表示运动目标总数，∑表示求和操作，∫表示求积分操作，Ω表示第二帧视频图像I₂的平面集合，|·|表示取绝对值操作，▽表示求梯度算子操作，φ_k表示运动目标的零水平集，x表示运动目标零水平集φ_k的横轴坐标值，y表示运动目标零水平集φ_k的纵轴坐标值。

按照下式，得到第二帧视频图像I₂中运动目标的边缘：

g = \frac{1}{1 + | &dtri; G * I_{2} |^{2}}

其中，g表示第二帧视频图像I₂中运动目标的边缘，|·|表示取绝对值操作，▽表示求梯度算子操作，G表示高斯核，*表示卷积操作，I₂表示连续三帧视频图像中的第二帧视频图像。

按照下式，计算运动目标零水平集的长度：

L_{g} (φ) = Σ_{k = 1}^{K} {&Integral;}_{Ω} g δ (φ_{k}) | &dtri; φ_{k} | d x d y

其中，L_g(φ)表示运动目标零水平集的长度，g表示第二帧视频图像I₂中运动目标的边缘，φ表示运动目标零水平集φ_k的集合，φ_k表示运动目标零水平集，k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号，k＝1,2,…,K，K表示运动目标总数，∑表示求和操作，∫表示求积分操作，Ω表示第二帧视频图像I₂的平面集合，δ表示单变量的Dirac函数，|·|表示取绝对值操作，▽表示求梯度算子操作，x表示运动目标零水平集φ_k的横轴坐标值，y表示运动目标零水平集φ_k的纵轴坐标值。

按照下式，计算运动目标区域的面积：

A_{g} (φ) = Σ_{k = 1}^{K} {&Integral;}_{Ω} g H (- φ_{k}) d x d y

其中，A_g(φ)表示运动目标区域的面积，g表示第二帧视频图像I₂中运动目标的边缘，φ表示运动目标零水平集φ_k的集合，φ_k表示运动目标零水平集，k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号，k＝1,2,…,K，K表示运动目标总数，∑表示求和操作，∫表示求积分操作，Ω表示第二帧视频图像I₂的平面集合，H表示Heaviside函数，x表示运动目标零水平集φ_k的横轴坐标值，y表示运动目标零水平集φ_k的纵轴坐标值。

按照下式，计算运动目标零水平集的外部能量：

ϵ_{g, λ_{k}, v_{k}} (φ) = Σ_{k = 1}^{K} λ_{k} L_{g} (φ) + Σ_{k = 1}^{K} v_{k} A_{g} (φ)

其中，表示运动目标零水平集的外部能量，g表示第二帧视频图像I₂中运动目标的边缘，λ_k表示运动目标零水平集长度的约束系数，其取值为0＜λ_k＜10的整数，k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号，k＝1,2,…,K，K表示运动目标总数，v_k表示运动目标区域面积的约束系数，φ表示运动目标零水平集φ_k的集合，其取值为-5＜v_k＜5且v_k≠0，∑表示求和操作，L_g(φ)表示运动目标零水平集的长度，A_g(φ)表示运动目标区域的面积。

按照下式，计算运动目标零水平集的总能量：

ϵ (φ) = W (φ) + ϵ_{g, λ_{k}, v_{k}} (φ)

其中，ε(φ)表示运动目标零水平集的总能量，φ表示运动目标零水平集φ_k的集合，W(φ)表示运动目标零水平集的内部能量，表示运动目标零水平集的外部能量，g表示第二帧视频图像I₂中运动目标的轮廓，λ_k表示运动目标零水平集长度的约束系数，其取值为0＜λ_k＜10的整数，k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号，v_k表示运动目标区域面积的约束系数，其取值为-5＜v_k＜5且v_k≠0。

按照下式，对运动目标零水平集进行水平集演化，得到更新的运动目标零水平集：

\frac{\partial φ_{k}}{\partial t} = μ [{Δφ}_{k} - d i v (\frac{&dtri; φ}{| &dtri; φ |})] + δ (φ_{k}) [Σ_{k = 1}^{K} λ_{k} d i v (g \frac{&dtri; φ_{k}}{| &dtri; φ_{k} |})] + Σ_{k = 1}^{K} v_{k} g δ (φ_{k})

其中，表示更新的运动目标零水平集，表示求导操作，φ_k表示运动目标零水平集，φ表示运动目标零水平集φ_k的集合，k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号，k＝1,2,…,K，K表示运动目标总数，t表示迭代步长，μ表示对内部能量的约束系数，其取值范围为0＜μ＜0.25，Δ表示求拉普拉斯算子操作，div(·)表示求矢量的散度，▽表示求梯度算子操作，|·|表示取绝对值操作，δ表示单变量的Dirac函数，∑表示求和操作，λ_k表示运动目标零水平集长度的约束系数，其取值为0＜λ_k＜10的整数，g表示第二帧视频图像I₂中运动目标的边缘，v_k表示目标区域面积的约束系数，其取值为-5＜v_k＜5且v_k≠0。

步骤7：判断更新的运动目标零水平集是否与第二帧视频图像I₂中运动目标的边缘重合，若是，执行步骤(8)，否则，执行步骤(6)；

步骤8：输出第二帧视频图像I₂中运动目标的检测结果。

下面结合仿真实验对本发明的效果做进一步的描述。

1、仿真条件：

本发明的仿真在操作系统为windows7，CPU为Intel(R)core(TM)i5-2400，基本频率3.20GHz，内存4GB的硬件环境和MatlabR2011b的软件环境下进行的。在进行实验时，时间的迭代步长为Δt＝5，内部能量的约束系数为μ＝0.2/Δt，运动目标零水平集长度的约束系数为λ＝5，目标区域面积的约束系数为v＝1.5。

2、仿真内容：

本发明仿真实验所用数据为ComputerVisionandRoboticsResearch中的highwayⅡ测试视频中选取的第291,292和293帧视频图像，视频图像尺寸为320×240像素。

3、仿真结果分析：

本发明仿真实验为对含有多个运动目标的视频图像进行运动目标检测。如图2所示，图2(a)为对highwayⅡ测试视频中所选取的包含多个运动目标的第291,292和293帧视频图像进行帧间差分运算后所获得的二值图像；图2(b)为对图2(a)的二值图像采用形态学函数bewareaopen函数进行去除噪声处理，得到去除噪声的二值图像；图2(c)为对图2(b)的去除噪声的二值图像进行k-means聚类得到运动目标零水平集，将运动目标零水平集显示在第二帧视频图像中，得到运动目标零水平集的示意图；图2(d)为采用多变分水平集对图2(c)中的运动目标零水平集更新得到的对含有多个运动目标的视频图像进行运动目标检测的效果图。

在图2(d)中，小车为运动目标，白色曲线为运动目标零水平集。通过图2(d)可以看出，本发明能够使得运动目标零水平集与运动目标的边缘轮廓重合，能够准确检测出在复杂背景下的多个运动目标，所得到的检测结果具有较高的准确度。

Claims

1.一种基于多变分水平集的复杂背景视频图像多目标检测方法，包括如下步骤：

(1)输入影像格式的视频图像：

(3)获得二值图像：

(4)去除干扰噪声：

(5)获得运动目标的零水平集：

(6)用多变分水平集方法更新运动目标零水平集：

(6a)按照下式，计算运动目标零水平集的内部能量：

W (φ) = \frac{μ}{2} Σ_{k = 1}^{K} {&Integral;}_{Ω} {(| &dtri; φ_{k} | - 1)}^{2} d x d y

其中，W(φ)表示运动目标零水平集的内部能量，φ表示运动目标零水平集φ_k的集合，μ表示对内部能量的约束系数，其取值范围为0＜μ＜0.25，k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号，k＝1,2,…,K，K表示运动目标总数，Σ表示求和操作，∫表示求积分操作，Ω表示第二帧视频图像I₂的平面集合，|·|表示取绝对值操作，▽表示求梯度算子操作，φ_k表示运动目标的零水平集，x表示运动目标零水平集φ_k的横轴坐标值，y表示运动目标零水平集φ_k的纵轴坐标值；

(6b)按照下式，得到第二帧视频图像I₂中运动目标的边缘：

g = \frac{1}{1 + | &dtri; G * I_{2} |^{2}}

(6c)按照下式，计算运动目标零水平集的长度：

L_{g} (φ) = Σ_{k = 1}^{K} {&Integral;}_{Ω} g δ (φ_{k}) | &dtri; φ_{k} | d x d y

其中，L_g(φ)表示运动目标零水平集的长度，g表示第二帧视频图像I₂中运动目标的边缘，φ表示运动目标零水平集φ_k的集合，φ_k表示运动目标零水平集，k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号，k＝1,2,…,K，K表示运动目标总数，Σ表示求和操作，∫表示求积分操作，Ω表示第二帧视频图像I₂的平面集合，δ表示单变量的Dirac函数，|·|表示取绝对值操作，▽表示求梯度算子操作，x表示运动目标零水平集φ_k的横轴坐标值，y表示运动目标零水平集φ_k的纵轴坐标值；

(6d)按照下式，计算运动目标区域的面积：

A_{g} (φ) = Σ_{k = 1}^{K} {&Integral;}_{Ω} g H (- φ_{k}) d x d y

其中，A_g(φ)表示运动目标区域的面积，g表示第二帧视频图像I₂中运动目标的边缘，φ表示运动目标零水平集φ_k的集合，φ_k表示运动目标零水平集，k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号，k＝1,2,…,K，K表示运动目标总数，Σ表示求和操作，∫表示求积分操作，Ω表示第二帧视频图像I₂的平面集合，H表示Heaviside函数，x表示运动目标零水平集φ_k的横轴坐标值，y表示运动目标零水平集φ_k的纵轴坐标值；

(6e)按照下式，计算运动目标零水平集的外部能量：

ϵ_{g, λ_{k}, v_{k}} (φ) = Σ_{k = 1}^{K} λ_{k} L_{g} (φ) + Σ_{k = 1}^{K} v_{k} A_{g} (φ)

其中，表示运动目标零水平集的外部能量，g表示第二帧视频图像I₂中运动目标的边缘，λ_k表示运动目标零水平集长度的约束系数，其取值为0＜λ_k＜10的整数，k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号，k＝1,2,…,K，K表示运动目标总数，v_k表示运动目标区域面积的约束系数，φ表示运动目标零水平集φ_k的集合，其取值为-5＜v_k＜5且v_k≠0，Σ表示求和操作，L_g(φ)表示运动目标零水平集的长度，A_g(φ)表示运动目标区域的面积；

(6f)按照下式，计算运动目标零水平集的总能量：

ϵ (φ) = W (φ) + ϵ_{g, λ_{k}, v_{k}} (φ)

\frac{\partial φ_{k}}{\partial t} = μ [{Δφ}_{k} - d i v (\frac{&dtri; φ}{| &dtri; φ |})] + δ (φ_{k}) [Σ_{k = 1}^{K} λ_{k} d i v (g \frac{&dtri; φ_{k}}{| &dtri; φ_{k} |})] + Σ_{k = 1}^{K} v_{k} g δ (φ_{k})

其中，表示更新的运动目标零水平集，表示求导操作，φ_k表示运动目标零水平集，φ表示运动目标零水平集φ_k的集合，k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号，k＝1,2,…,K，K表示运动目标总数，t表示迭代步长，μ表示对内部能量的约束系数，其取值范围为0＜μ＜0.25，Δ表示求拉普拉斯算子操作，div(·)表示求矢量的散度，▽表示求梯度算子操作，|·|表示取绝对值操作，δ表示单变量的Dirac函数，Σ表示求和操作，λ_k表示运动目标零水平集长度的约束系数，其取值为0＜λ_k＜10的整数，g表示第二帧视频图像I₂中运动目标的边缘，v_k表示目标区域面积的约束系数，其取值为-5＜v_k＜5且v_k≠0；

(8)输出第二帧视频图像I₂中运动目标的检测结果。

2.根据权利要求1所述的基于多变分水平集的复杂背景视频图像多目标检测方法，其特征在于：步骤(3)所述帧间差分法的具体步骤如下：

第一步，用所选取的连续三帧视频图像中的第一帧视频图像I₁减去第二帧视频图像I₂，得到差分后的图像B¹；

第二步，用所选取的连续三帧视频图像中的第二帧视频图像I₂减去第三帧视频图像I₃，得到差分后的图像B²；

第三步，将两个差分后的图像B¹和B²进行相“与”，得到二值图像B。

3.根据权利要求1所述的基于多变分水平集的复杂背景视频图像多目标检测方法，其特征在于：步骤(5a)所述的K-means聚类算法的具体步骤如下：

第一步，从去除噪声后的二值图像I中随机选取K个中心点，其中，K表示运动目标总数；

第二步，按照下式，遍历去除噪声后的二值图像I中的所有数据点，将每个数据点划分到最近的中心点中：

\min J (C) = Σ_{k = 1}^{K} \underset{x_{i} &Element; C_{k}}{Σ} m_{k i} d i s t {(x_{i}, s_{k})}^{2}

其中，J(C)表示去除噪声后的二值图像I中每个数据点到其划分的中心点的距离，C表示将去除噪声后的二值图像I中的数据点划分后得到的聚类类别集合，min(·)表示取最小值操作，Σ表示求和操作，m_ki表示系数，i表示去除噪声后的二值图像I中数据点的序号，k表示对去除噪声后的二值图像I中的数据点划分后得到的聚类类别的序号，k＝1,2,…,K，K表示运动目标总数，dist(·)表示距离函数，x_i表示去除噪声后的二值图像I中的第i个数据点，s_k表示去除噪声后的二值图像I划分后得到的第k类聚类类别的聚类中心点，C_k表示去除噪声后的二值图像I划分后得到的第k类聚类类别，∈表示属于操作；

第三步，按照下式，计算去除噪声后的二值图像I划分后得到的每个聚类类别的平均值，将该平均值作为新的聚类中心点：

s_{k} = \frac{1}{n_{k}} Σ_{i = 1}^{n_{k}} x_{i}^{k}

其中，s_k表示去除噪声后的二值图像I划分后得到的第k类聚类类别的聚类中心点，k表示对去除噪声后的二值图像I中的数据点划分后得到的聚类类别的序号，n_k表示去除噪声后的二值图像I中的数据点划分后得到的第k个聚类类别中数据点的个数，Σ表示求和操作，表示对去除噪声后的二值图像I中的数据点划分后得到的第k个聚类类别中第i个数据点，i表示去除噪声后的二值图像I中的数据点的序号。

4.根据权利要求1所述的基于多变分水平集的复杂背景视频图像多目标检测方法，其特征在于：步骤(5b)所述的获得运动目标的零水平集的具体步骤如下：

第一步，按照下式，计算运动目标零水平集的半径：

R_k＝D_k/N_k

其中，R_k表示运动目标零水平集的半径，D_k表示在去除噪声后的二值图像I中第k类聚类类别中的所有数据点到该类聚类中心的距离之和，N_k表示在去除噪声后的二值图像I中属于第k类聚类类别的所有数据点的个数，k表示对去除噪声后的二值图像I中的数据点聚类后得到的聚类类别的序号；

第二步，以运动目标零水平集的半径R_k为半径，以去除噪声后的二值图像I聚类得到的第k类聚类类别的聚类中心s_k为圆心做圆，得到运动目标的零水平集φ_k。