CN114926555B

CN114926555B - 一种安防监控设备数据智能压缩方法与系统

Info

Publication number: CN114926555B
Application number: CN202210298169.4A
Authority: CN
Inventors: 张保海; 张保生; 邓嵩
Original assignee: Jiangsu Yuli New Energy Technology Co ltd
Current assignee: Shaanxi Huarui Information System Technology Co.,Ltd.
Priority date: 2022-03-25
Filing date: 2022-03-25
Publication date: 2023-10-24
Anticipated expiration: 2042-03-25
Also published as: CN114926555A

Abstract

本发明涉及人工智能领域，具体涉及一种安防监控设备数据智能压缩方法与系统，该方法包括以下步骤：对安防监控设备视频进行预处理得到第一背景帧图像和第二背景帧图像，获取第一背景帧图像与第二背景帧图像之间的任意图像记为中间帧图像，利用变分自编码网络的编码端得到第一模型、第二模型、第三模型；获取第二模型与第三模型的差值作为中间帧图像的第一压缩数据；将从第二模型上重新采样的特征向量输入全连接网络，根据全连接网络输出的特征向量得到中间帧图像的第二压缩数据；中间帧图像的压缩结果包括第一模型、第一压缩数据、第二压缩数据。本发明能够较大程度上减少视频的存储数据量。

Description

一种安防监控设备数据智能压缩方法与系统

技术领域

本发明涉及人工智能领域，具体涉及一种安防监控设备数据智能压缩方法与系统。

背景技术

在建筑工地中由于建筑作业过程可能出现安全风险，例如高空坠物、建筑设备失控等，会造成人员和财产的损失，为了实现对建筑工地的安全管理需要在建筑工地安装安防监控设备，对施工场所进行监控，用于风险预警或安全监测。在这个过程中会产生大量的视频数据，这些视频数据会占用大量的存储空间，为了节省存储空间，简单做法是删除掉过时的视频数据，但这样会丢失以前的监控数据，不利于安全事故的回顾分析、事故取证调查与追责等。现有的方法是利用视频压缩技术对图像压缩，减少存储空间，但是现有的视频压缩技术压缩量依然不足，压缩后的视频占据存储空间依然较大。

发明内容

为了解决上述技术问题，本发明的目的在于提供一种安防监控设备数据智能压缩方法，该方法所采用的技术方案具体如下：

对安防监控设备视频进行预处理得到第一背景帧图像和第二背景帧图像，利用变分自编码网络的编码端对第一背景帧图像进行压缩处理得到第一模型；

获取第一背景帧图像与第二背景帧图像之间的任意图像记为中间帧图像，将中间帧图像的前景区域与与其前一帧图像的背景区域融合得到合成图像，利用变分自编码网络的编码端对合成图像进行压缩处理得到第二模型；

将中间帧图像的前一帧图像输入变分自编码网络得到第三模型；获取第二模型与第三模型的差值作为中间帧图像的第一压缩数据；

将从第二模型上重新采样的特征向量输入全连接网络，根据全连接网络输出的特征向量得到中间帧图像的第二压缩数据；中间帧图像的压缩结果包括第一模型、第一压缩数据、第二压缩数据。

优选地，所述第一模型、第二模型、第三模型为2*K或K*2的矩阵，其中K表示变分自编码网络编码端输出的高斯模型的个数，矩阵中元素为高斯模型的均值参数或方差参数。

优选地，所述根据全连接网络输出的特征向量得到中间帧图像的第二压缩数据包括：第二压缩数据与特征向量维度相同，若特征向量中元素大于或等于预设阈值，则第二压缩数据中对应维度的元素取值为1，否则，取值为0。

优选地，所述第二压缩数据满足以下约束条件：将中间帧图像输入变分自编码网络，得到第四模型，计算第三模型与第四模型的差值得到差值矩阵；将第二压缩数据所有维度元素作为矩阵的主对角线元素，得到特征遮罩矩阵；特征遮罩矩阵与差值矩阵的哈达玛积等于第一压缩数据。

优选地，所述变分自编码网络的损失包括：利用变分自编码网络解码端对第四模型进行解压缩处理得到中间帧图像的第一解压缩数据；根据第一压缩数据与参考高斯模型的KL散度、以及第一解压缩数据与中间帧图像的差值得到第一子损失；利用变分自编码网络解码端对合成图像进行解压缩处理得到中间帧图像的第二解压缩数据；获取特征遮罩矩阵与差值矩阵的乘积，根据所述乘积与第一压缩数据的差值、以及第二解压缩数据与中间帧图像的差值得到第二子损失；获取与中间帧图像近邻的图像的第一压缩数据，得到第一压缩数据集合，获取第一压缩数据集合内所有第一压缩数据与中间帧图像的第一压缩数据的KL散度之和得到第三子损失；第一子损失、第二子损失、以及第三子损失之和构成神经网络的整体损失。

本发明还提供了提供一种安防监控设备数据智能压缩系统，该系统包括：

数据处理模块，用于对安防监控设备视频进行预处理得到第一背景帧图像和第二背景帧图像，利用变分自编码网络的编码端对第一背景帧图像进行压缩处理得到第一模型；获取第一背景帧图像与第二背景帧图像之间的任意图像记为中间帧图像，将中间帧图像的前景区域与其前一帧图像的背景区域融合得到合成图像，利用变分自编码网络的编码端对合成图像进行压缩处理得到第二模型；将中间帧图像的前一帧图像输入变分自编码网络得到第三模型；

数据压缩模块，用于获取第二模型与第三模型的差值作为中间帧图像的第一压缩数据；将从第二模型上重新采样的特征向量输入全连接网络，根据全连接网络输出的特征向量得到中间帧图像的第二压缩数据；中间帧图像的压缩结果包括第一模型、第一压缩数据、第二压缩数据。

本发明实施例至少具有如下有益效果：

本发明利用变分自编码网络对监控设备视频进行压缩获得压缩数据，通过存储压缩数据能够较大程度上减少视频的存储数据量。本发明通过多项损失约束变分自编码网络，使其在具有良好压缩效果的同时具有较高的还原精度，在大量压缩视频数据之后，给出解压缩方法，使得压缩后的视频数据能够被准确解压缩出来。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案和优点，下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它附图。

图1为方法流程图。

具体实施方式

为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效，以下结合附图及较佳实施例，对依据本发明提出的一种安防监控设备数据智能压缩方法与系统，其具体实施方式、结构、特征及其功效，详细说明如下。在下述说明中，不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外，一或多个实施例中的特定特征、结构、或特点可由任何合适形式组合。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。

下面结合附图具体的说明本发明所提供的一种安防监控设备数据智能压缩方法与系统的具体方案。

本发明利用变分自编码网络对监控设备视频进行压缩获得压缩数据，并且将后一帧图像的前景信息融入前一帧图像的背景区域中后再利用该变分自编码网络获得第一压缩数据，进而可根据前一帧图像的压缩结果和第一压缩数据获得后一帧图像的压缩结果，使得只需存储视频中背景帧的压缩结果和第一压缩数据，其他图像帧可根据这些压缩结果间接获得，从而来大大减少视频的存储数据量。

具体来说，在本发明中，变分自编码网络的损失函数通过使用前景重构损失项，使得变分自编码网络能够从前一帧图像和后一帧图像的前景信息中获得第一压缩数据，可以根据前一帧图像的压缩结果与第一压缩数据获得后一帧图像的压缩结果，并且通过相同前景约束项，使得具有相同前景特征的图像获得相同的第一压缩数据，进一步减少视频压缩后的数据存储量。并且本发明在大量压缩视频数据后，给出解压缩方法，使得压缩后的视频能够被准确解压缩出来。

请参阅图1，其示出了本发明一个实施例提供的一种安防监控设备数据智能压缩方法的步骤流程图，该方法包括以下步骤：

首先，对安防监控设备视频进行预处理得到第一背景帧图像和第二背景帧图像。

建筑工地上安装相机，相机固定视角，视野中包含施工场地，施工场地中包含施工人员、施工机械、建筑材料等。相机实时采集施工场地的图像数据，生成大量视频数据，这些视频数据实时的被存储进数据库中。

获取过时的视频数据，这些视频数据失去了时效性，但是又不能删除，本发明对这些视频数据进行压缩。将视频中的每帧图像转换为灰度图。利用高斯混合背景建模获取视频中每帧图像的前景与背景区域，前景区域表示有运动的物体，背景区域表示静止的物体。如果某帧图像没有前景区域，那么该帧视为静态帧，否则视为动态帧。将视频中连续的静态帧剔除掉只保留一帧，经过这样预处理后获得第一背景帧图像和第二背景帧图像。需要说明的是，一段视频中可能存在多个背景帧，本实施例以两个背景帧图像之间的视频段为例说明安防监控视频压缩方法，其他视频段等同。

接着，对中间帧图像进行压缩：利用变分自编码网络的编码端对第一背景帧图像进行压缩处理得到第一模型；获取第一背景帧图像与第二背景帧图像之间的任意图像记为中间帧图像，将中间帧图像的前景区域与其前一帧图像的背景区域融合得到合成图像，利用变分自编码网络的编码端对合成图像进行压缩处理得到第二模型；将中间帧图像的前一帧图像输入变分自编码网络得到第三模型；获取第二模型与第三模型的差值作为中间帧图像的第一压缩数据。将从第二模型上重新采样的特征向量输入全连接网络，根据全连接网络输出的特征向量得到中间帧图像的第二压缩数据；中间帧图像的压缩结果包括第一模型、第一压缩数据、第二压缩数据。第二压缩数据满足以下约束条件：将中间帧图像输入变分自编码网络，得到第四模型，计算第三模型与第四模型的差值得到差值矩阵；特征遮罩矩阵与差值矩阵的哈达玛积等于第一压缩数据，该约束条件通过变分自编码网络的训练实现，也是变分自编码网络训练的目标之一。通过该步骤得到的压缩数据不仅压缩率高，而且能够准确还原原始数据。

(1)搭建用于压缩数据的变分自编码网络和全连接网络。

变分自编码网络包括编码端、解码端，编码端对输入的图像数据输出高维的高斯分布特征，解码端对根据高斯分布特征得到的隐码进行解码得到解压缩数据。全连接网络的输入是在第二模型上重新采样的特征向量，根据全连接网络的输出可以得到第二压缩数据。变分自编码网络和全连接网络构成本发明的压缩网络。

压缩网络的训练数据包括大量连续中间帧图像。假设第一背景帧图像记为I_m，第二背景帧图像记为I_n，获取第一背景帧图像与第二背景帧图像之间的任意图像记为中间帧图像I_i。利用混合高斯背景建模获取视频中每帧图像的前景区域，设中间帧图像I_i的前景区域为二值图I1_i。

(2)利用中间帧图像对搭建的网络进行训练的过程如下：

(a)将中间帧图像I_i输入变分自编码网络中，变分自编码网络的编码端输出一个高斯模型，这个高斯模型的参数记为第四模型G_i，变分自编码网络的解码端的输出图像记为中间帧图像I_i的第一解压缩数据其中，由中间帧图像I_i获得模型G_i的过程视为压缩过程，由第四模型G_i获得的第一解压缩数据/>过程视为解压缩过程。高斯模型G_i表示的是高维的高斯模型参数，该参数为2*K或K*2的矩阵，其中K表示变分自编码网络编码端输出的高斯模型的个数，矩阵中的元素为高斯模型的均值参数或方差参数。

(b)将中间帧图像I_i的前景区域I1_i与前一帧图像I_i-1的背景区域融合得到合成图像I2_i：

I2_i＝I1_i⊙(1-I1_i)+I1_i⊙I_i

其中，I1_i、I_i为二维矩阵，I1_i⊙I_i表示这两个矩阵的哈达玛积，(1－I1_i)表示对I1_i进行反相，即利用1减去I1_i中每个元素得到(1－I1_i)。

(c)将合成图像I2_i输入变分自编码网络中，变分自编码网络的编码端输出的高斯模型参数记为第二模型G2_i，变分自编码网络的解码端输出的结果为第二解压缩数据将中间帧图像I_i的前一帧图像I_i-1输入变分自编码网络中得到高斯模型参数记为第三模型G_i-1。第二模型G2_i相对第三模型G_i-1的变化量记为中间帧图像的第一压缩数据ΔG_i＝G2_i－G_i-1，第一压缩数据ΔG_i表示在前帧图像融合进来的在后帧图像的前景特征。

(d)将从第二模型上重新采样的特征向量输入全连接网络，根据全连接网络输出的特征向量得到中间帧图像的第二压缩数据。其中，第二压缩数据与特征向量维度相同，若特征向量中元素大于或等于预设阈值，则第二压缩数据中对应维度的元素取值为1，否则，取值为0；将第二压缩数据的各维度元素作为矩阵的主对角线元素，得到特征遮罩矩阵。

具体地，从第二模型上重新采样一个特征向量v1，然后将特征向量v1输入FC网络中，本实施例中该FC网络由两层全连接神经网络构成，根据其输出的特征向量为v2得到中间帧图像的第二压缩数据，且第二压缩数据与特征向量v2维度相同，若特征向量中元素大于或等于预设阈值，则第二压缩数据中对应维度的元素取值为1，否则，取值为0。将第二压缩数据的各维度元素作为矩阵的主对角线元素，得到特征遮罩矩阵M_i，该矩阵主对角线之外的所有元素均为0，第二压缩数据记为m_i。假设m_i中第k个维度为m_ik，那么：

其中，v2_k表示v2第k个维度的取值。m_i中所有维度元素作为一个K×K矩阵的主对角线上的元素，这个矩阵就是M_i。

(e)根据(a-d)得到的数据计算变分自编码网络的损失Loss，利用该损失结合梯度下降法更新变分自编码网络的网络参数。

变分自编码网络的损失具体为：利用变分自编码网络解码端对第四模型进行解压缩处理得到中间帧图像的第一解压缩数据；根据第一压缩数据与参考高斯模型的KL散度、以及第一解压缩数据与中间帧图像的差值得到第一子损失；利用变分自编码网络解码端对合成图像进行解压缩处理得到中间帧图像的第二解压缩数据；获取特征遮罩矩阵与差值矩阵的乘积，根据所述乘积与第一压缩数据的差值、以及第二解压缩数据与中间帧图像的差值得到第二子损失；获取与中间帧图像近邻的图像的第一压缩数据，得到第一压缩数据集合，获取第一压缩数据集合内所有第一压缩数据与中间帧图像的第一压缩数据的KL散度之和得到第三子损失；第一子损失、第二子损失、以及第三子损失之和构成神经网络的整体损失，用式子表示为Loss＝L1+L2+L3。

该式称为常规损失项，是变分自编码网络常用的损失函数，其中G₀为参考高斯模型表示一个K维的正态高斯函数模型，其各维度的均值为0，方差为1。/>获取方法为：由第四模型G_i进行解压缩处理得到的中间帧图像的第一解压缩数据KL(ΔG_i,G₀)表示ΔG_i与G₀两个高斯函数的KL散度，KL(ΔG_i,G₀)越小，表示ΔG_i越趋近于表示/>与I_i差值的L2范数。

该式为前景重构损失项。其中G_i-1获取方法是将前一帧图像I_i-1输入上一次更新完参数之后的变分自编码网络中获得的高斯模型参数；G_i－G_i-1为差值矩阵。ΔG_i为中间帧图像的第一压缩数据，M_i为特征遮罩矩阵。第二解压缩数据I2_i ^*获取方法为将合成图像输入上一次更新完参数后的变分自编码网络，其解码端输出的就是第二解压缩数据/>

L3＝∑_qi∈SiKL(ΔG_i,q_i)×1/N_i，该式为前景约束项。其中S_i表示与中间帧图像近邻的图像的第一压缩数据集合，q_i表示这个集合中任意一个高斯模型。S_i的获取方法为：上述可知，中间帧图像I_i对应第二压缩数据m_i，根据中间帧图像I_i之外的第j帧图像I_j，也获得对应的压缩数据m_j，获取所有满足条件的j：条件一、获取m_j与m_i；条件二、i和j满足|j－i|<N。这些j所对应的ΔG_j构成的集合记为S_i，本实施例中N＝50。即中间帧图像和其附近的第j帧图像有相同的第一压缩数据，表示具有的前景特征相同。N_i表示集合S_i的元素数量。期望KL(ΔG_i,q_i)取值较小，这样一来，就能够让具有相同前景特征的高斯模型相同，目的是当ΔG_i,q_i的分布相似时，只需要存储ΔG_i、q_i其中一个就行，进而进一步减少存储量。

(3)数据压缩。

通过(a-e)将变分自编码网络与全连接网络训练好之后即可对待压缩视频进行压缩。中间帧图像的压缩结果包括第一模型、第一压缩数据、第二压缩数据。同时还应当存储视频段的第一背景帧图像的压缩数据G_m。具体地，将第一背景帧图像I_m输入变分自编码网络中，变分自编码网络的编码端输出一个高斯模型，这个高斯模型的参数记为第一模型G_m。

由上述步骤可知第三模型记为G_i-1、第四模型记为G_i。则差值矩阵为G_i－G_i-1，特征遮罩矩阵与差值矩阵的哈达玛积近似等于第一压缩数据可表示为这样只需知道G_i-1和ΔG_i以及M_i，就能获得G_i，不用再存储G_i便可将I_i解压缩出来，只要M_i和ΔG_i占用的存储空间少，那么就节省了存储空间。即原本需要将G_i-1与G_i一同存储起来的，但是现在只需存储G_i-1和ΔG_i以及M_i即可，这样就节省了存储空间。

同时，对于第一背景帧图像I_m和第二背景帧图像I_n，m＜n；对于中间帧图像I_i，m＜i＜n，获取其对应的ΔG_i和M_i，因此对于第一背景帧图像I_m和第二背景帧图像I_n中间的视频片段来说，只需要存储G_m、G_i-1、ΔG_i和M_i即可，其中i＝m+1,m+2,…,n-1。

其中G_i-1所占的存储空间较大，但是ΔG_i和M_i中大多元素为0，即ΔG_i和M_i是稀疏的，因此ΔG_i和M_i的存储的数据量远远小于G_i-1的数据量的，而且存在不同的i，使得ΔG_i或M_i可能相同的，因此整体来看，G_i-1、ΔG_i和M_i(i＝m+1,m+2,…,n-1)的占据的存储空间十分小，这样一来就将第一背景帧图像I_m和第二背景帧图像I_n中间的视频片段进行了大量压缩。按照这种方法可将所有视频中所有视频片段进行压缩存储。

同时，给出中间帧图像的解压缩方法。

中间帧图像I_i的解压缩方法为：首先根据G_i-1、ΔG_i和M_i(i＝m+1,m+2,…,n-1)获得G_i，具体地，由可知：

然后将G_i输入变分自编码网络的解码端获得解压缩结果至此获得了每帧图像的解压缩方法。

实施例2：

本实施例提供一种安防监控设备数据智能压缩系统，该系统包括：

数据处理模块，用于对安防监控设备视频进行预处理得到第一背景帧图像和第二背景帧图像，利用变分自编码网络的编码端对第一背景帧图像进行压缩处理得到第一模型；获取第一背景帧图像与第二背景帧图像之间的任意图像记为中间帧图像，将中间帧图像的前景区域与其前一帧图像的背景区域融合得到合成图像，利用变分自编码网络的编码端对合成图像进行压缩处理得到第二模型；将中间帧图像的前一帧图像输入变分自编码网络得到第三模型

需要说明的是：上述本发明实施例先后顺序仅仅为了描述，不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种安防监控设备数据智能压缩方法，其特征在于，该方法包括以下步骤：

获取第一背景帧图像与第二背景帧图像之间的任意图像记为中间帧图像，将中间帧图像的前景区域与其前一帧图像的背景区域融合得到合成图像，利用变分自编码网络的编码端对合成图像进行压缩处理得到第二模型；

将从第二模型上重新采样的特征向量输入全连接网络，根据全连接网络输出的特征向量得到中间帧图像的第二压缩数据；中间帧图像的压缩结果包括第一模型、第一压缩数据、第二压缩数据；

所述根据全连接网络输出的特征向量得到中间帧图像的第二压缩数据包括：

第二压缩数据与特征向量维度相同，若特征向量中元素大于或等于预设阈值，则第二压缩数据中对应维度的元素取值为1，否则，取值为0；

所述第二压缩数据满足以下约束条件：

将中间帧图像输入变分自编码网络，得到第四模型，计算第三模型与第四模型的差值得到差值矩阵；

将第二压缩数据所有维度元素作为矩阵的主对角线元素，得到特征遮罩矩阵；

特征遮罩矩阵与差值矩阵的哈达玛积等于第一压缩数据。

2.根据权利要求1所述的方法，其特征在于，所述第一模型、第二模型、第三模型为2*K或K*2的矩阵，其中K表示变分自编码网络编码端输出的高斯模型的个数，矩阵中元素为高斯模型的均值参数或方差参数。

3.根据权利要求1所述的方法，其特征在于，所述变分自编码网络的损失包括：

利用变分自编码网络解码端对第四模型进行解压缩处理得到中间帧图像的第一解压缩数据；根据第一压缩数据与参考高斯模型的KL散度、以及第一解压缩数据与中间帧图像的差值得到第一子损失；

利用变分自编码网络解码端对合成图像进行解压缩处理得到中间帧图像的第二解压缩数据；获取特征遮罩矩阵与差值矩阵的乘积，根据所述乘积与第一压缩数据的差值、以及第二解压缩数据与中间帧图像的差值得到第二子损失；

获取与中间帧图像近邻的图像的第一压缩数据，得到第一压缩数据集合，获取第一压缩数据集合内所有第一压缩数据与中间帧图像的第一压缩数据的KL散度之和得到第三子损失；

第一子损失、第二子损失、以及第三子损失之和构成神经网络的整体损失。

4.一种安防监控设备数据智能压缩系统，其特征在于，该系统包括：

数据压缩模块，用于获取第二模型与第三模型的差值作为中间帧图像的第一压缩数据；将从第二模型上重新采样的特征向量输入全连接网络，根据全连接网络输出的特征向量得到中间帧图像的第二压缩数据；中间帧图像的压缩结果包括第一模型、第一压缩数据、第二压缩数据；

所述第二压缩数据满足以下约束条件：

特征遮罩矩阵与差值矩阵的哈达玛积等于第一压缩数据。

5.根据权利要求4所述的系统，其特征在于，所述第一模型、第二模型、第三模型为2*K或K*2的矩阵，其中K表示变分自编码网络编码端输出的高斯模型的个数，矩阵中元素为高斯模型的均值参数或方差参数。

6.根据权利要求4所述的系统，其特征在于，所述变分自编码网络的损失包括：