CN113936030A

CN113936030A - 基于卷积编码的运动目标检测方法及系统

Info

Publication number: CN113936030A
Application number: CN202111133777.1A
Authority: CN
Inventors: 周祚峰; 吴清泉; 刘才钰
Original assignee: Xi'an Xiguang Industrial Development Co ltd
Current assignee: Xi'an Xiguang Industrial Development Co ltd
Priority date: 2021-09-27
Filing date: 2021-09-27
Publication date: 2022-01-14

Abstract

本发明公开了一种基于卷积编码的运动目标检测方法和系统，方法包括如下步骤：步骤1：采集待检测的彩色视频，所述的待检测的彩色视频包括M帧图像，M为正整数；步骤2：建立三通道卷积编码模板；步骤3：将待检测的彩色视频逐帧输入步骤2得到的三通道卷积编码模型进行编码，逐帧输出每帧图像的编码结果，根据每帧的编码结果进行逐帧筛选并标记出每帧的运动目标存在区域。本发明减少了计算量，提高了对于运动目标的检测速度，缩减了硬件成本。此外，与现有方法相比，本发明很大程度上消除了阴影对于运动目标检测的干扰，提高了运动目标检测的精度。

Description

基于卷积编码的运动目标检测方法及系统

技术领域

本发明属于计算机视觉技术领域，具体涉及一种基于卷积编码的运动目标检测方法及系统。

背景技术

运动目标检测问题一直是计算机视觉领域的一个重点，应用场景也十分广泛，在安防告警、家庭监控、道路交通、行车导航、视频会议等诸多场景都有所应用。

国内外科学家们提出了许多运动目标检测的算法，Wren等提出了采用单高斯模型描述背景，该模型适用于静态稳定的背景，难以胜任复杂环境下的目标检测任务。为解决单高斯模型难以描述复杂背景的问题。Stauffer等提出使用混合高斯模型GMM(gaussianmixture model)拟合背景，实现了复杂背景下的目标检测，但在遇到简单背景时，会错误学习前景的灰度导致目标丢失且训练复杂度高阈值选取困难。除上述参数模型外还有无参模型，如码本模型为每个像素建立多个码字，并计算各个码字的上下界，能有效针对不同场景实现分割，但该算法一旦在建立过程中出现前景，则会导致码字错误，直到下次更新码字前都会一直导致误检，且无法适应较剧烈的环境变化。Barnich提出了无参模型Vibe,能够快速建模，并利用邻域像素采取随机策略更新背景，能有效适应各类环境，但对更新速率要求严格，太快会将目标吸收产生空洞，反之则易产生鬼影无法适应环境变化，且Vibe使用固定阈值灰度视频下召回率较低。闵卫东等提出了改进的Vibe模型，对鬼影问题进行了优化，但仍无法解决慢速前景产生空洞的问题。同样使用无参模型的还有Elgammal提出的核密度估计法KDE(kernel density estimation)，通过统计像素点的直方图得到背景的分布，并使用核密度函数估计每个点为背景的概率，相比高斯建模更能反映真实的分布，对复杂背景估计更加准确，缺点是仅能得到概率，判断阈值设置困难，且计算概率复杂度较高。

除了传统方法近年来深度学习在运动目标检测方面也有所应用。但是无论传统方法还是深度学习的方法都存在明显的缺点。例如，传统方法鲁棒性不够，当存在多种干扰的情况下检测效果差强人意。深度学习的方法虽然在鲁棒性上有较大的提升，但是数据集的制作与完善是一直存在的难题，尤其是在现实生活中存在各种各样的运动目标，数据集很难将这些目标都覆盖，此外深度学习的方法对于硬件要求过高限制了其大规模的应用。

发明内容

本发明的目的在于提供一种基于卷积编码的运动目标检测方法及系统，用以解决现有技术中运动目标检测方法的抗干扰能力弱、检测精度差、检测速度慢等一系列问题。

为了实现上述任务，本发明采用以下技术方案：

一种基于卷积编码的运动目标检测方法，包括如下步骤：

步骤1：采集待检测的彩色视频，所述的待检测的彩色视频包括M帧图像，M为正整数；

步骤2：建立三通道卷积编码模板，所述的三通道卷积编码模板的尺寸为N×N/2×3且N∈[6,8,10]，所述的三通道卷积编码模板包括左右两个子模板所述子模板的尺寸为N/2×N/2×3，所述的左子模板内每个像素点的三通道的权重均为负，所述的右子模板内每个像素点的三通道的权重均为正，所述的左右两个子模板内每个像素点的三通道的权重之和的绝对值为

步骤3：将待检测的彩色视频逐帧输入步骤2得到的三通道卷积编码模型进行编码，逐帧输出每帧图像的编码结果，根据每帧的编码结果进行逐帧筛选并标记出每帧的运动目标存在区域；

其中，对于第m帧，m∈[1,M]，第m帧图像的编码结果为第m-1帧图像编码得到的数字序列和第m帧图像编码得到的数字序列做差后得到的数字序列，m＝1时，第1帧图像的编码结果为第1帧图像编码得到的数字序列，根据第m帧编码结果进行筛选时，筛选出第m帧图像的编码结果中小于阈值的值，并将第m帧图像的编码结果中小于阈值的值对应的卷积区域标记为第m+1帧的运动目标存在区域。

进一步的，步骤2中每个像素点的三通道的权重的取值包括均值方案或比例分配方案，其中均值方案为每个像素点的三通道的权重均为

比例分配方案为根据每个像素点三通道中各通道值的比例分配每个像素点的三通道的权重。

进一步的，步骤2中，N＝6。

进一步的，步骤4中，阈值的取值为5-10。

一种基于卷积编码的运动目标检测系统，包括数据采集模块、三通道卷积编码模板和输出模块；

所述的数据采集模块用于采集待检测的彩色视频，所述的待检测的彩色视频包括M帧图像，M为正整数；

所述的三通道卷积编码模板的尺寸为N×N/2×3且N∈[6,8,10]，所述的三通道卷积编码模板包括左右两个子模板所述子模板的尺寸为N/2×N/2×3，所述的左子模板内每个像素点的三通道的权重均为负，所述的右子模板内每个像素点的三通道的权重均为正，所述的左右两个子模板内每个像素点的三通道的权重之和的绝对值为

所述输出模块用于将待检测的彩色视频逐帧三通道卷积编码模型进行编码，逐帧输出每帧图像的编码结果，根据每帧的编码结果进行逐帧筛选并标记出每帧的运动目标存在区域；

其中，对于第m帧，m∈[1,M]，第m帧图像的编码结果为第m-1帧图像编码得到的数字序列和第m帧图像编码得到的数字序列做差后得到的数字序列，根据第m帧编码结果进行筛选时，筛选出第m帧图像的编码结果中小于阈值的值，并将第m帧图像的编码结果中小于阈值的值对应的卷积区域标记为第m+1帧的运动目标存在区域。

进一步的，所述基于卷积编码的运动目标检测系统可设置在摄像头本地的数据存储及处理的单元内。

本发明与现有技术相比具有以下技术特点：

(1)本发明设计了一种简单高效的编码模板将背景模型简化为数字序列，减少了计算量，提高了对于运动目标的检测速度，缩减了硬件成本。

(2)本发明很大程度上消除了阴影对于运动目标检测的干扰，提高了运动目标检测的精度。

(3)目前的主流算法大多是建立复杂的数学模型例如GMM、KNN等。而本方法利用了图像编码的思想使用卷积模板将每一帧图像简化为数字序列，而且帧间差分运算也是在数字序列之间展开，极大的节约了计算开支。

(3)本发明并未使用目标识别，而是利用了帧间信息找到了运动的目标并没有对运动目标分类。在运动目标检测领域深度学习一直都有明显的不足，首先运动目标的种类不定，现实中任何物体都有可能发生运动，也即都有可能是运动物体，如果要用深度学习解决运动目标检测问题需要准备大规模多种类的数据集然而这是不太可能的，其次深度学习的方法对算力要求高也就意味着部署成本高，要大规模应用不太可能。

(4)本发明的方法简单高效，部署便捷，能在任意一个监控摄像头上部署，实现部分的智能监控功能。

附图说明

图1是设定的卷积编码模板图；

图2是算法流程图；

图3是与其他方法的实验对比图。

具体实施方式

以下给出本发明的具体实施方式，需要说明的是本发明并不局限于以下具体实施例，凡在本申请技术方案基础上做的等同变换均落入本发明的保护范围。

首先对本方案中出现的技术词语进行解释说明：

RGB：红(R)、绿(G)、蓝(B)三个颜色通道。

在本实施例中公开了一种基于卷积编码的运动目标检测方法，包括如下步骤：

步骤2：建立三通道卷积编码模板，所述的三通道卷积编码模板的尺寸为N×N×3且N∈[6,8,10]，所述的三通道卷积编码模板包括左右两个子模板所述子模板的尺寸为N/2×N/2×3，所述的左子模板内每个像素点的三通道的权重均为负，所述的右子模板内每个像素点的三通道的权重均为正，所述的左右两个子模板内每个像素点的三通道的权重之和的绝对值为

其中，对于第m帧，m∈[1,M]，第m帧图像的编码结果为第m-1帧图像编码得到的数字序列和第m帧图像编码得到的数字序列做差后得到的数字序列，m＝1时，第1帧图像的编码结果为第1帧图像编码得到的数字序列；根据第m帧编码结果进行筛选时，筛选出第m帧图像的编码结果中小于阈值的值，并将第m帧图像的编码结果中小于阈值的值对应的卷积区域标记为第m+1帧的运动目标存在区域。

经过对于大量阴影区域的分析，发现阴影区域在图片上的表现为大面积亮度相同的纯黑色区域，即这一区域上所有像素点在BGR通道上的值十分接近甚至完全相等，通过发明设计的卷积编码模板这些阴影区域都会被编码为一串接近于零的数字序列。

具体的，步骤2中每个像素点的三通道的权重的取值包括均值方案或比例分配方案，其中均值方案为每个像素点的三通道的权重均为

具体的，步骤2中，N＝6，随着数值增大抗干扰能力增强，但是检测小运动目标的能力减弱，因此6×3是多次实验得到的最优值。

具体的，N＝6即每个像素点的BGR通道上的权重都为1/27，RBG三通道上的权重之和为1/9，保证左负右正的原则，左子区域所有权重之和为-1，右子区域所有权重之和为1。

具体的，步骤3中，执行卷积操作时，卷积步长设置为(6，3)，padding操作为复制当前图像帧最外层像素，将得到的卷积结果展开成一串数字序列。

具体的，步骤4中，阈值的取值为5-10。

在本实施例中公开了一种基于卷积编码的运动目标检测系统，包括数据采集模块、三通道卷积编码模板、编码模块和输出模块；

所述的三通道卷积编码模板的三通道卷积编码模板的尺寸为N×N×3且N∈{6、8、10}，所述的三通道卷积编码模板包括左右两个子区域，所述子区域的尺寸为N/2×N/2，所述的左子区域内每个像素点的三通道的权重均为负，所述的右子区域内每个像素点的三通道的权重均为正，所述的左右两个子区域内每个像素点的三通道的权重之和的绝对值为

所述的编码模块用于将待检测的彩色视频逐帧输入三通道卷积编码模型进行编码，依次输出每帧图像的编码结果，其中，第1帧图像的编码结果为第1帧图像编码得到的数字序列，第M帧图像的编码结果为第M-1帧图像编码得到的数字序列和第M帧图像编码得到的数字序列做差后得到的数字序列；

输出模块用于依次将待检测的彩色视频的每一帧进行筛选并标记出每一帧的运动目标存在区域；其中，对当前帧图像的编码结果中进行筛选时，筛选出当前帧图像的编码结果中小于阈值的值，并将当前帧图像的编码结果中小于阈值的值对应的卷积区域标记为下一帧的运动目标存在区域。

优选的，所述基于卷积编码的运动目标检测系统可设置在摄像头本地的数据存储及处理的单元内，实现部分的智能监控功能。

具体的，本实施例中运动目标检测系统能够应用于自动驾驶领域，区别于传统的GMM、KNN等检测模型，由于处理算法极大程度节约了计算开支，针对有阴影的目标区域，检测精度很高，符合自动驾驶对于运算速度和精度双重追求。同时，本实施例的运动目标检测系统能够应用于智能交通领域，在公安系统中可以为监控摄像头提供实时识别和捕捉的功能，具有大规模应用的前景。

实施例1

在本实施例中公开了一种基于卷积编码的运动目标检测方法，选取了四段不同场景的视频作为检测对象，这四段视频都存在大量的阴影干扰，如图3所示，整体的检测精度和速度对比表如表1、表2所示。从结果上我们可以看到，与其他方法相比本方法几乎没有将阴影检测为运动目标，此外本方法在速度和精度上都有明显的提高。

从本实施例中的实验结果看出本发明能提高检测精度，本发明设计的卷积模板很好的考虑了实际情况可能出现的亮度突变问题。由于在一定区域内亮度变化是保持一致的，卷积模板采用左负右正的原则就就抵消了这一变化。此外6×6×3的卷积模板兼有均值滤波的效果在一定程度上消除了噪点的影响。最后本文的卷积模板解决了运动目标检测中影子的干扰这一大难题。这三个方面的优点使得本文的方法在精度上有提高。

本方法与当前主流算法的处理速度对比表、检测精度对比表如下所示：

表1检测速度对比表；

表2综合精确度Fmeasure对比表

以处理高速公路-I这段视频为例，选取均值权重模板如图1。先对视频首帧图像进行卷积编码展开成一串数字序列，再对后一帧图像进行卷积编码得到一串数字序列，后一帧图像的数字序列与前一帧图像的数字序列相减得到结果序列。在这段视频上我们设定的阈值为5即结果序列中所有小于5对应的卷积区域都为存在运动目标的区域。

Claims

1.一种基于卷积编码的运动目标检测方法，其特征在于，包括如下步骤：

2.如权利要求1所述的基于卷积编码的运动目标检测方法，其特征在于，步骤2中每个像素点的三通道的权重的取值包括均值方案或比例分配方案，其中均值方案为每个像素点的三通道的权重均为

3.如权利要求1所述的基于卷积编码的运动目标检测方法，其特征在于，步骤2中，N＝6。

4.如权利要求1所述的基于卷积编码的运动目标检测方法，其特征在于，步骤4中，阈值的取值为5-10。

5.一种基于卷积编码的运动目标检测系统，其特征在于，包括数据采集模块、三通道卷积编码模板和输出模块；

6.如权利要求5所述的基于卷积编码的运动目标检测系统，其特征在于，所述基于卷积编码的运动目标检测系统可设置在摄像头本地的数据存储及处理的单元内。