CN111402298A

CN111402298A - 基于目标检测与轨迹分析的粮库视频数据压缩方法

Info

Publication number: CN111402298A
Application number: CN202010233879.XA
Authority: CN
Inventors: 曹杰; 张剑书; 申冬琴; 毛波; 徐彩云; 赵慕阶
Original assignee: Yunjing Business Intelligence Research Institute Nanjing Co ltd; Nanjing University of Finance and Economics
Current assignee: Yunjing Business Intelligence Research Institute Nanjing Co ltd; Nanjing University of Finance and Economics
Priority date: 2020-03-30
Filing date: 2020-03-30
Publication date: 2020-07-10

Abstract

本发明公开了一种基于目标检测与轨迹分析的粮库视频数据压缩方法，通过监控摄像头采集粮库中的实时视频监控数据；通过目标检测算法分析摄像头获取到的视频监控数据，从中提取存在运动目标的有效帧以及目标的位置和子图信息；采用卷积神经网络模型对目标子图进行目标识别操作，获取目标的类别信息；基于从同一个摄像头采集到的连续多帧图片中采集到的目标信息进行目标匹配和跟踪，获取目标在当前场景下的运动轨迹数据；基于各监控摄像头采集到的信息，构建图像数据、标签数据和轨迹数据的存储架构，实现数据的高效存储。本发明的方法可以从海量的监控视频数据中提取并存储出与运动目标相关的有效数据，提高存储资源的利用率。

Description

基于目标检测与轨迹分析的粮库视频数据压缩方法

技术领域

本发明涉及一种在粮库监控场景中，基于智能视频监控技术提取运动目标的图像和运动轨迹数据，减少视频监控数据存储量的粮库视频数据压缩方法。

背景技术

视频监控系统是粮库信息化建设过程中的重要环节。在一个粮库视频监控系统中，会在系统覆盖区域部署大量的监控摄像头，在这种情况下，每个摄像头每天都会产生相当可观的数据量。

在传统的视频监控系统中，为了保证实时监控异常行为并及时采取有效措施，需要监控人员一刻不停的监看视频。然而，面对粮库中如此巨大的监控规模和视频数据量，通过人工查看的方式来处理和筛查这些视频已经远远跟不上实际应用的要求。

上述问题是在粮库视频数据压缩过程中应当予以考虑并解决的问题。

发明内容

发明目的：本发明的目的是提供一种基于目标检测与轨迹分析的粮库视频数据压缩方法解决现有技术中存在的传统的粮库视频监控系统中存在的智能化水平低，数据冗余且查询不变的问题。本发明针对粮库中部署的视频监控系统，通过智能视频分析技术，提供一种基于目标检测与轨迹分析的粮库视频数据压缩方法，提取视频监控系统覆盖区域的目标信息和目标运动轨迹信息，以实现对海量视频监控数据的压缩。

技术方案：

一种基于目标检测与轨迹分析的粮库视频数据压缩方法，包括以下步骤：

S1、在粮库中部署监控摄像头，构建视频监控系统，通过监控摄像头采集粮库中的实时视频监控数据；

S2、通过目标检测算法分析摄像头获取到的视频监控数据，从中提取存在运动目标的有效帧以及目标的位置和子图信息；

S3、采用卷积神经网络模型对目标子图进行目标识别操作，获取目标的类别信息；

S4、基于从同一个摄像头采集到的连续多帧图片中采集到的目标信息进行目标匹配和跟踪，获取目标在当前监控场景下的运动轨迹数据；

S5、基于粮库视频监控系统中的各监控摄像头采集到的信息，构建图像数据、标签数据和轨迹数据的存储架构，实现数据的高效存储。

进一步地，步骤S2具体为：

S21、以5帧每秒的采样频率采集各摄像头获取到的当前监控场景下的监控图片序列；

S22、通过非参数化背景建模的方法构建背景模型，分割背景和前景，得到分割后的二值图片；

S23、采用帧间差分法处理步骤S22中得到的二值图片，并通过形态学操作进行降噪，得到差分二值图片；

S24、通过分析S23中的差分二值图片中的连通域，判断目标发生运动变化的部分是否超过给定阈值，并在此基础之上判定该帧是否为存在运动目标的有效帧，保存视频流中的有效帧，同时保存有效帧中运动目标的子图以及运动目标的位置信息。

进一步地，步骤S3具体为：

S31、基于开源数据集Microsoft COCO结合在粮库中采集到的实际监控数据构建用于目标识别的训练数据集，训练数据集中包括图片数据和标签数据，标签数据由图片中包含的目标的类别信息以及位置信息组成；

S32、针对分类任务和训练数据集的规模，构建卷积神经网络模型；

S33、调整训练参数，设置迭代次数，训练卷积神经网络模型中的参数，得到基于卷积神经网络模型的目标分类器；

S34、将步骤2中得到的目标子图导入步骤S33中得到的神经网络模型，对子图中的目标进行分类识别，得到子图中的目标的类别信息。

进一步地，步骤S4中，对相邻帧中的目标基于目标的类别信息、位置信息和图像特征信息进行匹配，并提取目标的运动轨迹数据，具体为：

S41、将相邻时间节点中的运动目标根据步骤S3中提取的类别信息分类，不同类别的目标分别进行匹配；

S42、分别对当前时间节点中的各类目标计算其与前一时间节点中的所有同类目标之间的距离，并选择距离最近且未超过设定阈值的3个目标作为备选；

S43、计算当前时间节点中的目标子图与前一时间节点中与其距离最近的那3个目标子图的直方图相似度，直方图相似度最高的即为相邻时间节点中的同一目标；

S44、将S43中得到的所有相邻时间节点中的同一目标连接起来即为该目标在当前场景下的运动轨迹。

有益效果：该种基于目标检测与轨迹分析的粮库视频数据压缩方法，与传统的无差别存储的视频监控系统相比，基于智能视频监控技术的粮库视频数据压缩方法可以从海量的监控视频数据中提取并存储出与运动目标相关的有效数据，提高存储资源的利用率。该种基于目标检测与轨迹分析的粮库视频数据压缩方法完全通过视频分析算法提取监控数据中的运动目标信息和目标的运动轨迹信息，可以在不需要太大的人力资源介入的情况下，取得较高的准确性和效率。

附图说明

图1是本发明实施例基于目标检测与轨迹分析的粮库视频数据压缩方法的流程示意图。

图2是实施例中有效帧提取的流程示意图。

图3是实施例中构建的神经网络结构的说明示意图。

图4是实施例中目标匹配过程的流程示意图。

具体实施方式

下面结合附图对本发明作进一步说明：

实施例

一种基于目标检测与轨迹分析的粮库视频数据压缩方法，如图1，包括以下步骤，

S1、在粮库中部署监控摄像头，摄像头高度优选在2.5米到3米之间，调整摄像头角度以减少监控死角，构建视频监控系统，通过监控摄像头采集粮库中的实时视频监控数据；

S2、对视频监控系统中的每一个监控摄像头以5帧/秒的采样频率采集监控场景下的图像数据，并分别通过基于非参数化模型和帧间差分思想的目标检测模型对采集到的图像序列，这可以有效地抑制背景中的噪声的干扰，并高效地保存图像序列中的运动目标的位置和目标子图信息，具体流程如图2所示，具体实施步骤如下：

S21、对粮库视频监控系统中的各摄像头，设定采用频率为5帧每秒，采集各摄像头覆盖的监控场景下的监控图像序列，并将采集到的图像以“摄像头ID+日期+时间+序号”的格式命名；

S22、基于非参数化模型，通过图像序列中的前3张图像中各像素点的像素值，估计其像素值的概率密度，并以此构建当前场景的背景模型，对于后续采集到的图片，通过与构建的背景模型进行背景差分和连通域分析分割背景和前景，得到分割后的二值图像f_k′；

S23、利用帧间差分的思路处理步骤22中相邻的二值图像f_k′和f_k-1′，以进一步消除前景中的噪声，再通过腐蚀和膨胀等一系列的形态学操作进行进一步的降噪处理，最大程度上减小噪声的干扰，得到分割后的差分二值图像R_k′；

S24、对S23中得到的差分二值图像R_k′进行连通域分析，判断每个连通域中的像素点的个数是否超过设定的阈值T_p，T_p＝图像的像素值×10％，若超过则该连通域表示图中的一个运动目标，否则该连通域则是干扰。保存视频流中存在运动目标的有效帧，同时保存该帧中运动目标的子图以及运动目标的位置信息，其余的帧不再存储。

S3、根据粮库视频监控系统的应用需求构建训练数据集，训练基于卷积神经网络的目标识别模型，并通过该模型分析步骤2中提取出的运动目标子图，判断有效帧中的运动目标的类别，基于卷积神经网络的模型可以实现高准确率和高效率的目标识别；

S31、选择人、车辆、地磅、大门、窗户、粮食、烟雾、火焰这些粮库中常见的目标作为待检测的目标类别构建训练数据集，训练数据集中的图像来源于开源数据集MicrosoftCOCO以及通过粮库中部署的视频监控系统采集到的实际监控图像数据，其中的标签数据包括图像中的目标的类别和位置信息；

S32、构建9层卷积神经网络模型，如图3所示，包括3个卷积层用于图像特征提取；3个池化层对输入特征图像进行压缩，在减小图像尺寸简化网络计算复杂度的同时压缩特征，以提取图像的主要特征；两个全连接层连接输入图像的所有特征，并在其中引入dropout策略，在模型训练的测试过程中随机地删除第一个隐含层的部分神经元，可以有效地减轻过拟合问题的发生，设置丢弃概率为0.3；最后一层为输出层，激活函数为ReLU函数，输出为该目标分别属于不同类别的概率，输出的类别标签包括8类，因此输出层的神经元个数为8。

S33、将训练数据集中的图像数据的大小统一缩放为224×224像素单位，输入卷积神经网络模型，其中70％的数据作为训练集，30％的数据作为验证集，采用随机梯度下降法优化神经网络模型，每迭代1000次计算一次模型在验证集上的准确率，待准确率收敛时，停止训练，保存卷积神经网络的参数，得到目标分类模型；

S34、将步骤2中得到的运动目标子图输入步骤33中训练得到的基于卷积神经网络的目标分类模型，得到子图中目标的类型信息。

S4、对当前时间节点中的每一个目标，结合目标的类别信息、位置信息以及图像特征信息对前一个时间节点中的所有目标进行筛选，寻找前一个时间节点中唯一与当前时间节点中的目标相匹配的那个目标，如图4所示，并在此基础上提取监控场景中的各目标的运动轨迹，可以实现在目标匹配过程中的准确率和效率的平衡；

S41、对于当前时间节点中的某个运动目标P，选择前一时间节点中所有的同类别目标作为待匹配的目标集合；

S42、计算目标P与S41中抽取出的待匹配的目标集合中的每个目标之间的像素距离，若计算得到的所有的距离大小都大于阈值T_d，则认为目标P为监控场景中在当前时间节点中新出现的目标，否则选择从待匹配的目标集合中删除距离较远的目标，仅保留像素距离小于阈值T_d且距离最近的三个目标；

S43、对于目标P和S42中抽取出的待匹配的目标集合中的三个目标，统一将目标子图缩放到128×128像素单位，通过加权平均法进行灰度化处理，并计算灰度子图的直方图，再分别计算目标P与三个待匹配目标的子图的灰度直方图重合度，选择灰度直方图重合度最高的那个目标作为前一时间节点中与P相匹配的目标Q；

S44、将各相邻时间节点中的相同目标两两相连地串联起来即可得到该目标在当前监控场景中的运动轨迹数据

S5、构建新的存储架构，将视频监控系统采集和分析得到的数据进行高效的存储；

S51、对于图像数据的存储，以每小时一帧的采样频率存储当前监控场景下的背景数据，并以“摄像头ID+日期+小时”的格式命名并存储在与之匹配的以“摄像头ID+日期+小时”命名的文件夹下，同时步骤S2中采集到的运动目标子图以“摄像头ID+日期+时间+序号+子图序号”的格式命名并存储在相应的以“摄像头ID+日期+小时”命名的文件夹下；

S52、将S2中提取出的目标的位置信息以及S3中提取出的目标的类型信息存储到数据库中，以对应的目标子图的文件名为主键，并在数据库中添加对应子图的存储路径；

S53、将S4中提取出的目标轨迹数据存储到数据库中，以轨迹中第一个目标和最后一个目标对应的子图的文件名首尾相连作为主键，轨迹数据由一连串的目标子图的文件名按序组合而成。

实施例的基于目标检测与轨迹分析的粮库视频数据压缩方法，通过粮库中部署的视频监控系统采集原始视频监控数据；通过基于非参数化模型和帧间差分模型从大量的图像序列数据中抽取出包含运动目标的有效帧及目标的位置信息和子图信息，这两种模型的结合可以在运动检查的过程中很大程度上降低背景中的噪声的干扰，；针对粮库监控场景，构建目标识别数据集并基于卷积神经网络训练目标识别模型，通过该模型对目标子图中的目标进行目标分类，获取运动目标的类别信息，基于卷积神经网络构建的目标识别模型具有很高的识别准确率，配合高性能计算的硬件条件可以达到100帧/秒的高识别效率；基于目标子图的类别信息、位置信息以及颜色特征信息对相邻时间节点中的目标进行匹配和轨迹融合，根据计算量的由低到高，逐步筛选候选集合中的目标，寻找相邻时间节点中的匹配目标，并在此基础上得到最终的目标在监控场景中连续时间运行轨迹数据；构建新的存储架构，将通过视频监控系统采集和分析得到的运动目标的图像数据、位置数据、轨迹数据，连同当前监控场景的背景数据进行高效的存储。

实施例的基于目标检测与轨迹分析的粮库视频数据压缩方法，与传统的无差别存储并通过人工查询回看的视频监控系统相比，可以大大降低数据存储的成本和人力成本，且利用数据库存储运动目标的各类信息，可以更方便和快速地定位需要查询的内容，查询的效率更高。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种基于目标检测与轨迹分析的粮库视频数据压缩方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于目标检测与轨迹分析的粮库视频数据压缩方法，其特征在于，步骤S2具体为：

3.根据权利要求1所述的基于目标检测与轨迹分析的粮库视频数据压缩方法，其特征在于，步骤S3具体为：

4.根据权利要求1所述的基于目标检测与轨迹分析的粮库视频数据压缩方法，其特征在于，步骤S4中，对相邻帧中的目标基于目标的类别信息、位置信息和图像特征信息进行匹配，并提取目标的运动轨迹数据，具体为：