CN114926555B - 一种安防监控设备数据智能压缩方法与系统 - Google Patents
一种安防监控设备数据智能压缩方法与系统 Download PDFInfo
- Publication number
- CN114926555B CN114926555B CN202210298169.4A CN202210298169A CN114926555B CN 114926555 B CN114926555 B CN 114926555B CN 202210298169 A CN202210298169 A CN 202210298169A CN 114926555 B CN114926555 B CN 114926555B
- Authority
- CN
- China
- Prior art keywords
- frame image
- model
- compressed data
- intermediate frame
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007906 compression Methods 0.000 title claims abstract description 43
- 230000006835 compression Effects 0.000 title claims abstract description 42
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000012544 monitoring process Methods 0.000 title claims abstract description 23
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 239000011159 matrix material Substances 0.000 claims description 48
- 239000002131 composite material Substances 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 11
- 238000013528 artificial neural network Methods 0.000 claims description 5
- 238000013144 data compression Methods 0.000 claims description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000010276 construction Methods 0.000 description 11
- 230000006837 decompression Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 239000004566 building material Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/002—Image coding using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明涉及人工智能领域,具体涉及一种安防监控设备数据智能压缩方法与系统,该方法包括以下步骤:对安防监控设备视频进行预处理得到第一背景帧图像和第二背景帧图像,获取第一背景帧图像与第二背景帧图像之间的任意图像记为中间帧图像,利用变分自编码网络的编码端得到第一模型、第二模型、第三模型;获取第二模型与第三模型的差值作为中间帧图像的第一压缩数据;将从第二模型上重新采样的特征向量输入全连接网络,根据全连接网络输出的特征向量得到中间帧图像的第二压缩数据;中间帧图像的压缩结果包括第一模型、第一压缩数据、第二压缩数据。本发明能够较大程度上减少视频的存储数据量。
Description
技术领域
本发明涉及人工智能领域,具体涉及一种安防监控设备数据智能压缩方法与系统。
背景技术
在建筑工地中由于建筑作业过程可能出现安全风险,例如高空坠物、建筑设备失控等,会造成人员和财产的损失,为了实现对建筑工地的安全管理需要在建筑工地安装安防监控设备,对施工场所进行监控,用于风险预警或安全监测。在这个过程中会产生大量的视频数据,这些视频数据会占用大量的存储空间,为了节省存储空间,简单做法是删除掉过时的视频数据,但这样会丢失以前的监控数据,不利于安全事故的回顾分析、事故取证调查与追责等。现有的方法是利用视频压缩技术对图像压缩,减少存储空间,但是现有的视频压缩技术压缩量依然不足,压缩后的视频占据存储空间依然较大。
发明内容
为了解决上述技术问题,本发明的目的在于提供一种安防监控设备数据智能压缩方法,该方法所采用的技术方案具体如下:
对安防监控设备视频进行预处理得到第一背景帧图像和第二背景帧图像,利用变分自编码网络的编码端对第一背景帧图像进行压缩处理得到第一模型;
获取第一背景帧图像与第二背景帧图像之间的任意图像记为中间帧图像,将中间帧图像的前景区域与与其前一帧图像的背景区域融合得到合成图像,利用变分自编码网络的编码端对合成图像进行压缩处理得到第二模型;
将中间帧图像的前一帧图像输入变分自编码网络得到第三模型;获取第二模型与第三模型的差值作为中间帧图像的第一压缩数据;
将从第二模型上重新采样的特征向量输入全连接网络,根据全连接网络输出的特征向量得到中间帧图像的第二压缩数据;中间帧图像的压缩结果包括第一模型、第一压缩数据、第二压缩数据。
优选地,所述第一模型、第二模型、第三模型为2*K或K*2的矩阵,其中K表示变分自编码网络编码端输出的高斯模型的个数,矩阵中元素为高斯模型的均值参数或方差参数。
优选地,所述根据全连接网络输出的特征向量得到中间帧图像的第二压缩数据包括:第二压缩数据与特征向量维度相同,若特征向量中元素大于或等于预设阈值,则第二压缩数据中对应维度的元素取值为1,否则,取值为0。
优选地,所述第二压缩数据满足以下约束条件:将中间帧图像输入变分自编码网络,得到第四模型,计算第三模型与第四模型的差值得到差值矩阵;将第二压缩数据所有维度元素作为矩阵的主对角线元素,得到特征遮罩矩阵;特征遮罩矩阵与差值矩阵的哈达玛积等于第一压缩数据。
优选地,所述变分自编码网络的损失包括:利用变分自编码网络解码端对第四模型进行解压缩处理得到中间帧图像的第一解压缩数据;根据第一压缩数据与参考高斯模型的KL散度、以及第一解压缩数据与中间帧图像的差值得到第一子损失;利用变分自编码网络解码端对合成图像进行解压缩处理得到中间帧图像的第二解压缩数据;获取特征遮罩矩阵与差值矩阵的乘积,根据所述乘积与第一压缩数据的差值、以及第二解压缩数据与中间帧图像的差值得到第二子损失;获取与中间帧图像近邻的图像的第一压缩数据,得到第一压缩数据集合,获取第一压缩数据集合内所有第一压缩数据与中间帧图像的第一压缩数据的KL散度之和得到第三子损失;第一子损失、第二子损失、以及第三子损失之和构成神经网络的整体损失。
本发明还提供了提供一种安防监控设备数据智能压缩系统,该系统包括:
数据处理模块,用于对安防监控设备视频进行预处理得到第一背景帧图像和第二背景帧图像,利用变分自编码网络的编码端对第一背景帧图像进行压缩处理得到第一模型;获取第一背景帧图像与第二背景帧图像之间的任意图像记为中间帧图像,将中间帧图像的前景区域与其前一帧图像的背景区域融合得到合成图像,利用变分自编码网络的编码端对合成图像进行压缩处理得到第二模型;将中间帧图像的前一帧图像输入变分自编码网络得到第三模型;
数据压缩模块,用于获取第二模型与第三模型的差值作为中间帧图像的第一压缩数据;将从第二模型上重新采样的特征向量输入全连接网络,根据全连接网络输出的特征向量得到中间帧图像的第二压缩数据;中间帧图像的压缩结果包括第一模型、第一压缩数据、第二压缩数据。
本发明实施例至少具有如下有益效果:
本发明利用变分自编码网络对监控设备视频进行压缩获得压缩数据,通过存储压缩数据能够较大程度上减少视频的存储数据量。本发明通过多项损失约束变分自编码网络,使其在具有良好压缩效果的同时具有较高的还原精度,在大量压缩视频数据之后,给出解压缩方法,使得压缩后的视频数据能够被准确解压缩出来。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为方法流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种安防监控设备数据智能压缩方法与系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构、或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种安防监控设备数据智能压缩方法与系统的具体方案。
本发明利用变分自编码网络对监控设备视频进行压缩获得压缩数据,并且将后一帧图像的前景信息融入前一帧图像的背景区域中后再利用该变分自编码网络获得第一压缩数据,进而可根据前一帧图像的压缩结果和第一压缩数据获得后一帧图像的压缩结果,使得只需存储视频中背景帧的压缩结果和第一压缩数据,其他图像帧可根据这些压缩结果间接获得,从而来大大减少视频的存储数据量。
具体来说,在本发明中,变分自编码网络的损失函数通过使用前景重构损失项,使得变分自编码网络能够从前一帧图像和后一帧图像的前景信息中获得第一压缩数据,可以根据前一帧图像的压缩结果与第一压缩数据获得后一帧图像的压缩结果,并且通过相同前景约束项,使得具有相同前景特征的图像获得相同的第一压缩数据,进一步减少视频压缩后的数据存储量。并且本发明在大量压缩视频数据后,给出解压缩方法,使得压缩后的视频能够被准确解压缩出来。
请参阅图1,其示出了本发明一个实施例提供的一种安防监控设备数据智能压缩方法的步骤流程图,该方法包括以下步骤:
首先,对安防监控设备视频进行预处理得到第一背景帧图像和第二背景帧图像。
建筑工地上安装相机,相机固定视角,视野中包含施工场地,施工场地中包含施工人员、施工机械、建筑材料等。相机实时采集施工场地的图像数据,生成大量视频数据,这些视频数据实时的被存储进数据库中。
获取过时的视频数据,这些视频数据失去了时效性,但是又不能删除,本发明对这些视频数据进行压缩。将视频中的每帧图像转换为灰度图。利用高斯混合背景建模获取视频中每帧图像的前景与背景区域,前景区域表示有运动的物体,背景区域表示静止的物体。如果某帧图像没有前景区域,那么该帧视为静态帧,否则视为动态帧。将视频中连续的静态帧剔除掉只保留一帧,经过这样预处理后获得第一背景帧图像和第二背景帧图像。需要说明的是,一段视频中可能存在多个背景帧,本实施例以两个背景帧图像之间的视频段为例说明安防监控视频压缩方法,其他视频段等同。
接着,对中间帧图像进行压缩:利用变分自编码网络的编码端对第一背景帧图像进行压缩处理得到第一模型;获取第一背景帧图像与第二背景帧图像之间的任意图像记为中间帧图像,将中间帧图像的前景区域与其前一帧图像的背景区域融合得到合成图像,利用变分自编码网络的编码端对合成图像进行压缩处理得到第二模型;将中间帧图像的前一帧图像输入变分自编码网络得到第三模型;获取第二模型与第三模型的差值作为中间帧图像的第一压缩数据。将从第二模型上重新采样的特征向量输入全连接网络,根据全连接网络输出的特征向量得到中间帧图像的第二压缩数据;中间帧图像的压缩结果包括第一模型、第一压缩数据、第二压缩数据。第二压缩数据满足以下约束条件:将中间帧图像输入变分自编码网络,得到第四模型,计算第三模型与第四模型的差值得到差值矩阵;特征遮罩矩阵与差值矩阵的哈达玛积等于第一压缩数据,该约束条件通过变分自编码网络的训练实现,也是变分自编码网络训练的目标之一。通过该步骤得到的压缩数据不仅压缩率高,而且能够准确还原原始数据。
(1)搭建用于压缩数据的变分自编码网络和全连接网络。
变分自编码网络包括编码端、解码端,编码端对输入的图像数据输出高维的高斯分布特征,解码端对根据高斯分布特征得到的隐码进行解码得到解压缩数据。全连接网络的输入是在第二模型上重新采样的特征向量,根据全连接网络的输出可以得到第二压缩数据。变分自编码网络和全连接网络构成本发明的压缩网络。
压缩网络的训练数据包括大量连续中间帧图像。假设第一背景帧图像记为Im,第二背景帧图像记为In,获取第一背景帧图像与第二背景帧图像之间的任意图像记为中间帧图像Ii。利用混合高斯背景建模获取视频中每帧图像的前景区域,设中间帧图像Ii的前景区域为二值图I1i。
(2)利用中间帧图像对搭建的网络进行训练的过程如下:
(a)将中间帧图像Ii输入变分自编码网络中,变分自编码网络的编码端输出一个高斯模型,这个高斯模型的参数记为第四模型Gi,变分自编码网络的解码端的输出图像记为中间帧图像Ii的第一解压缩数据其中,由中间帧图像Ii获得模型Gi的过程视为压缩过程,由第四模型Gi获得的第一解压缩数据/>过程视为解压缩过程。高斯模型Gi表示的是高维的高斯模型参数,该参数为2*K或K*2的矩阵,其中K表示变分自编码网络编码端输出的高斯模型的个数,矩阵中的元素为高斯模型的均值参数或方差参数。
(b)将中间帧图像Ii的前景区域I1i与前一帧图像Ii-1的背景区域融合得到合成图像I2i:
I2i=I1i⊙(1-I1i)+I1i⊙Ii
其中,I1i、Ii为二维矩阵,I1i⊙Ii表示这两个矩阵的哈达玛积,(1-I1i)表示对I1i进行反相,即利用1减去I1i中每个元素得到(1-I1i)。
(c)将合成图像I2i输入变分自编码网络中,变分自编码网络的编码端输出的高斯模型参数记为第二模型G2i,变分自编码网络的解码端输出的结果为第二解压缩数据将中间帧图像Ii的前一帧图像Ii-1输入变分自编码网络中得到高斯模型参数记为第三模型Gi-1。第二模型G2i相对第三模型Gi-1的变化量记为中间帧图像的第一压缩数据ΔGi=G2i-Gi-1,第一压缩数据ΔGi表示在前帧图像融合进来的在后帧图像的前景特征。
(d)将从第二模型上重新采样的特征向量输入全连接网络,根据全连接网络输出的特征向量得到中间帧图像的第二压缩数据。其中,第二压缩数据与特征向量维度相同,若特征向量中元素大于或等于预设阈值,则第二压缩数据中对应维度的元素取值为1,否则,取值为0;将第二压缩数据的各维度元素作为矩阵的主对角线元素,得到特征遮罩矩阵。
具体地,从第二模型上重新采样一个特征向量v1,然后将特征向量v1输入FC网络中,本实施例中该FC网络由两层全连接神经网络构成,根据其输出的特征向量为v2得到中间帧图像的第二压缩数据,且第二压缩数据与特征向量v2维度相同,若特征向量中元素大于或等于预设阈值,则第二压缩数据中对应维度的元素取值为1,否则,取值为0。将第二压缩数据的各维度元素作为矩阵的主对角线元素,得到特征遮罩矩阵Mi,该矩阵主对角线之外的所有元素均为0,第二压缩数据记为mi。假设mi中第k个维度为mik,那么:
其中,v2k表示v2第k个维度的取值。mi中所有维度元素作为一个K×K矩阵的主对角线上的元素,这个矩阵就是Mi。
(e)根据(a-d)得到的数据计算变分自编码网络的损失Loss,利用该损失结合梯度下降法更新变分自编码网络的网络参数。
变分自编码网络的损失具体为:利用变分自编码网络解码端对第四模型进行解压缩处理得到中间帧图像的第一解压缩数据;根据第一压缩数据与参考高斯模型的KL散度、以及第一解压缩数据与中间帧图像的差值得到第一子损失;利用变分自编码网络解码端对合成图像进行解压缩处理得到中间帧图像的第二解压缩数据;获取特征遮罩矩阵与差值矩阵的乘积,根据所述乘积与第一压缩数据的差值、以及第二解压缩数据与中间帧图像的差值得到第二子损失;获取与中间帧图像近邻的图像的第一压缩数据,得到第一压缩数据集合,获取第一压缩数据集合内所有第一压缩数据与中间帧图像的第一压缩数据的KL散度之和得到第三子损失;第一子损失、第二子损失、以及第三子损失之和构成神经网络的整体损失,用式子表示为Loss=L1+L2+L3。
该式称为常规损失项,是变分自编码网络常用的损失函数,其中G0为参考高斯模型表示一个K维的正态高斯函数模型,其各维度的均值为0,方差为1。/>获取方法为:由第四模型Gi进行解压缩处理得到的中间帧图像的第一解压缩数据KL(ΔGi,G0)表示ΔGi与G0两个高斯函数的KL散度,KL(ΔGi,G0)越小,表示ΔGi越趋近于 表示/>与Ii差值的L2范数。
该式为前景重构损失项。其中Gi-1获取方法是将前一帧图像Ii-1输入上一次更新完参数之后的变分自编码网络中获得的高斯模型参数;Gi-Gi-1为差值矩阵。ΔGi为中间帧图像的第一压缩数据,Mi为特征遮罩矩阵。第二解压缩数据I2i *获取方法为将合成图像输入上一次更新完参数后的变分自编码网络,其解码端输出的就是第二解压缩数据/>
L3=∑qi∈SiKL(ΔGi,qi)×1/Ni,该式为前景约束项。其中Si表示与中间帧图像近邻的图像的第一压缩数据集合,qi表示这个集合中任意一个高斯模型。Si的获取方法为:上述可知,中间帧图像Ii对应第二压缩数据mi,根据中间帧图像Ii之外的第j帧图像Ij,也获得对应的压缩数据mj,获取所有满足条件的j:条件一、获取mj与mi;条件二、i和j满足|j-i|<N。这些j所对应的ΔGj构成的集合记为Si,本实施例中N=50。即中间帧图像和其附近的第j帧图像有相同的第一压缩数据,表示具有的前景特征相同。Ni表示集合Si的元素数量。期望KL(ΔGi,qi)取值较小,这样一来,就能够让具有相同前景特征的高斯模型相同,目的是当ΔGi,qi的分布相似时,只需要存储ΔGi、qi其中一个就行,进而进一步减少存储量。
(3)数据压缩。
通过(a-e)将变分自编码网络与全连接网络训练好之后即可对待压缩视频进行压缩。中间帧图像的压缩结果包括第一模型、第一压缩数据、第二压缩数据。同时还应当存储视频段的第一背景帧图像的压缩数据Gm。具体地,将第一背景帧图像Im输入变分自编码网络中,变分自编码网络的编码端输出一个高斯模型,这个高斯模型的参数记为第一模型Gm。
由上述步骤可知第三模型记为Gi-1、第四模型记为Gi。则差值矩阵为Gi-Gi-1,特征遮罩矩阵与差值矩阵的哈达玛积近似等于第一压缩数据可表示为这样只需知道Gi-1和ΔGi以及Mi,就能获得Gi,不用再存储Gi便可将Ii解压缩出来,只要Mi和ΔGi占用的存储空间少,那么就节省了存储空间。即原本需要将Gi-1与Gi一同存储起来的,但是现在只需存储Gi-1和ΔGi以及Mi即可,这样就节省了存储空间。
同时,对于第一背景帧图像Im和第二背景帧图像In,m<n;对于中间帧图像Ii,m<i<n,获取其对应的ΔGi和Mi,因此对于第一背景帧图像Im和第二背景帧图像In中间的视频片段来说,只需要存储Gm、Gi-1、ΔGi和Mi即可,其中i=m+1,m+2,…,n-1。
其中Gi-1所占的存储空间较大,但是ΔGi和Mi中大多元素为0,即ΔGi和Mi是稀疏的,因此ΔGi和Mi的存储的数据量远远小于Gi-1的数据量的,而且存在不同的i,使得ΔGi或Mi可能相同的,因此整体来看,Gi-1、ΔGi和Mi(i=m+1,m+2,…,n-1)的占据的存储空间十分小,这样一来就将第一背景帧图像Im和第二背景帧图像In中间的视频片段进行了大量压缩。按照这种方法可将所有视频中所有视频片段进行压缩存储。
同时,给出中间帧图像的解压缩方法。
中间帧图像Ii的解压缩方法为:首先根据Gi-1、ΔGi和Mi(i=m+1,m+2,…,n-1)获得Gi,具体地,由可知:
然后将Gi输入变分自编码网络的解码端获得解压缩结果至此获得了每帧图像的解压缩方法。
实施例2:
本实施例提供一种安防监控设备数据智能压缩系统,该系统包括:
数据处理模块,用于对安防监控设备视频进行预处理得到第一背景帧图像和第二背景帧图像,利用变分自编码网络的编码端对第一背景帧图像进行压缩处理得到第一模型;获取第一背景帧图像与第二背景帧图像之间的任意图像记为中间帧图像,将中间帧图像的前景区域与其前一帧图像的背景区域融合得到合成图像,利用变分自编码网络的编码端对合成图像进行压缩处理得到第二模型;将中间帧图像的前一帧图像输入变分自编码网络得到第三模型
数据压缩模块,用于获取第二模型与第三模型的差值作为中间帧图像的第一压缩数据;将从第二模型上重新采样的特征向量输入全连接网络,根据全连接网络输出的特征向量得到中间帧图像的第二压缩数据;中间帧图像的压缩结果包括第一模型、第一压缩数据、第二压缩数据。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种安防监控设备数据智能压缩方法,其特征在于,该方法包括以下步骤:
对安防监控设备视频进行预处理得到第一背景帧图像和第二背景帧图像,利用变分自编码网络的编码端对第一背景帧图像进行压缩处理得到第一模型;
获取第一背景帧图像与第二背景帧图像之间的任意图像记为中间帧图像,将中间帧图像的前景区域与其前一帧图像的背景区域融合得到合成图像,利用变分自编码网络的编码端对合成图像进行压缩处理得到第二模型;
将中间帧图像的前一帧图像输入变分自编码网络得到第三模型;获取第二模型与第三模型的差值作为中间帧图像的第一压缩数据;
将从第二模型上重新采样的特征向量输入全连接网络,根据全连接网络输出的特征向量得到中间帧图像的第二压缩数据;中间帧图像的压缩结果包括第一模型、第一压缩数据、第二压缩数据;
所述根据全连接网络输出的特征向量得到中间帧图像的第二压缩数据包括:
第二压缩数据与特征向量维度相同,若特征向量中元素大于或等于预设阈值,则第二压缩数据中对应维度的元素取值为1,否则,取值为0;
所述第二压缩数据满足以下约束条件:
将中间帧图像输入变分自编码网络,得到第四模型,计算第三模型与第四模型的差值得到差值矩阵;
将第二压缩数据所有维度元素作为矩阵的主对角线元素,得到特征遮罩矩阵;
特征遮罩矩阵与差值矩阵的哈达玛积等于第一压缩数据。
2.根据权利要求1所述的方法,其特征在于,所述第一模型、第二模型、第三模型为2*K或K*2的矩阵,其中K表示变分自编码网络编码端输出的高斯模型的个数,矩阵中元素为高斯模型的均值参数或方差参数。
3.根据权利要求1所述的方法,其特征在于,所述变分自编码网络的损失包括:
利用变分自编码网络解码端对第四模型进行解压缩处理得到中间帧图像的第一解压缩数据;根据第一压缩数据与参考高斯模型的KL散度、以及第一解压缩数据与中间帧图像的差值得到第一子损失;
利用变分自编码网络解码端对合成图像进行解压缩处理得到中间帧图像的第二解压缩数据;获取特征遮罩矩阵与差值矩阵的乘积,根据所述乘积与第一压缩数据的差值、以及第二解压缩数据与中间帧图像的差值得到第二子损失;
获取与中间帧图像近邻的图像的第一压缩数据,得到第一压缩数据集合,获取第一压缩数据集合内所有第一压缩数据与中间帧图像的第一压缩数据的KL散度之和得到第三子损失;
第一子损失、第二子损失、以及第三子损失之和构成神经网络的整体损失。
4.一种安防监控设备数据智能压缩系统,其特征在于,该系统包括:
数据处理模块,用于对安防监控设备视频进行预处理得到第一背景帧图像和第二背景帧图像,利用变分自编码网络的编码端对第一背景帧图像进行压缩处理得到第一模型;获取第一背景帧图像与第二背景帧图像之间的任意图像记为中间帧图像,将中间帧图像的前景区域与其前一帧图像的背景区域融合得到合成图像,利用变分自编码网络的编码端对合成图像进行压缩处理得到第二模型;将中间帧图像的前一帧图像输入变分自编码网络得到第三模型;
数据压缩模块,用于获取第二模型与第三模型的差值作为中间帧图像的第一压缩数据;将从第二模型上重新采样的特征向量输入全连接网络,根据全连接网络输出的特征向量得到中间帧图像的第二压缩数据;中间帧图像的压缩结果包括第一模型、第一压缩数据、第二压缩数据;
所述根据全连接网络输出的特征向量得到中间帧图像的第二压缩数据包括:
第二压缩数据与特征向量维度相同,若特征向量中元素大于或等于预设阈值,则第二压缩数据中对应维度的元素取值为1,否则,取值为0;
所述第二压缩数据满足以下约束条件:
将中间帧图像输入变分自编码网络,得到第四模型,计算第三模型与第四模型的差值得到差值矩阵;
将第二压缩数据所有维度元素作为矩阵的主对角线元素,得到特征遮罩矩阵;
特征遮罩矩阵与差值矩阵的哈达玛积等于第一压缩数据。
5.根据权利要求4所述的系统,其特征在于,所述第一模型、第二模型、第三模型为2*K或K*2的矩阵,其中K表示变分自编码网络编码端输出的高斯模型的个数,矩阵中元素为高斯模型的均值参数或方差参数。
6.根据权利要求4所述的系统,其特征在于,所述变分自编码网络的损失包括:
利用变分自编码网络解码端对第四模型进行解压缩处理得到中间帧图像的第一解压缩数据;根据第一压缩数据与参考高斯模型的KL散度、以及第一解压缩数据与中间帧图像的差值得到第一子损失;
利用变分自编码网络解码端对合成图像进行解压缩处理得到中间帧图像的第二解压缩数据;获取特征遮罩矩阵与差值矩阵的乘积,根据所述乘积与第一压缩数据的差值、以及第二解压缩数据与中间帧图像的差值得到第二子损失;
获取与中间帧图像近邻的图像的第一压缩数据,得到第一压缩数据集合,获取第一压缩数据集合内所有第一压缩数据与中间帧图像的第一压缩数据的KL散度之和得到第三子损失;
第一子损失、第二子损失、以及第三子损失之和构成神经网络的整体损失。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210298169.4A CN114926555B (zh) | 2022-03-25 | 2022-03-25 | 一种安防监控设备数据智能压缩方法与系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210298169.4A CN114926555B (zh) | 2022-03-25 | 2022-03-25 | 一种安防监控设备数据智能压缩方法与系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114926555A CN114926555A (zh) | 2022-08-19 |
CN114926555B true CN114926555B (zh) | 2023-10-24 |
Family
ID=82805606
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210298169.4A Active CN114926555B (zh) | 2022-03-25 | 2022-03-25 | 一种安防监控设备数据智能压缩方法与系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114926555B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003010727A1 (en) * | 2001-07-25 | 2003-02-06 | Vislog Technology Pte Ltd. | Method and apparatus for processing image data |
US10373300B1 (en) * | 2019-04-29 | 2019-08-06 | Deep Render Ltd. | System and method for lossy image and video compression and transmission utilizing neural networks |
CN111476133A (zh) * | 2020-03-30 | 2020-07-31 | 杭州电子科技大学 | 面向无人驾驶的前背景编解码器网络目标提取方法 |
CN111565318A (zh) * | 2020-05-06 | 2020-08-21 | 中国科学院重庆绿色智能技术研究院 | 一种基于稀疏样本的视频压缩方法 |
CN112200096A (zh) * | 2020-10-14 | 2021-01-08 | 公安部第三研究所 | 基于压缩视频实现实时异常行为识别的方法、装置及其存储介质 |
CN112712472A (zh) * | 2019-10-25 | 2021-04-27 | 北京三星通信技术研究有限公司 | 图像处理方法、装置、电子设备及计算机可读存储介质 |
WO2021164176A1 (zh) * | 2020-02-20 | 2021-08-26 | 北京大学 | 基于深度学习的端到端视频压缩方法、系统及存储介质 |
-
2022
- 2022-03-25 CN CN202210298169.4A patent/CN114926555B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003010727A1 (en) * | 2001-07-25 | 2003-02-06 | Vislog Technology Pte Ltd. | Method and apparatus for processing image data |
US10373300B1 (en) * | 2019-04-29 | 2019-08-06 | Deep Render Ltd. | System and method for lossy image and video compression and transmission utilizing neural networks |
CN112712472A (zh) * | 2019-10-25 | 2021-04-27 | 北京三星通信技术研究有限公司 | 图像处理方法、装置、电子设备及计算机可读存储介质 |
WO2021164176A1 (zh) * | 2020-02-20 | 2021-08-26 | 北京大学 | 基于深度学习的端到端视频压缩方法、系统及存储介质 |
CN111476133A (zh) * | 2020-03-30 | 2020-07-31 | 杭州电子科技大学 | 面向无人驾驶的前背景编解码器网络目标提取方法 |
CN111565318A (zh) * | 2020-05-06 | 2020-08-21 | 中国科学院重庆绿色智能技术研究院 | 一种基于稀疏样本的视频压缩方法 |
CN112200096A (zh) * | 2020-10-14 | 2021-01-08 | 公安部第三研究所 | 基于压缩视频实现实时异常行为识别的方法、装置及其存储介质 |
Non-Patent Citations (2)
Title |
---|
Compression of Vehicle Trajectories with a Variational Autoencoder;Rákos Olivér 等;《Applied Sciences》;全文 * |
面向视频传感器网络的视频压缩方法设计;陈龙飞;余涛;;计算机时代(第04期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114926555A (zh) | 2022-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105611303B (zh) | 图像压缩系统、解压缩系统、训练方法和装置、显示装置 | |
CN110517329B (zh) | 一种基于语义分析的深度学习图像压缩方法 | |
DE69736852T2 (de) | Codierung- und Decodierungssystem für bewegte Bilder mit beliebig geformten Objekten | |
DE202012013410U1 (de) | Bildkompression mit SUB-Auflösungsbildern | |
DE602004001993T2 (de) | Transformations basiertes restbewegungsrahmen kodierungsverfahren mit übervollständiger basis und zugehörige vorrichtung zur videokompression | |
CN111598059A (zh) | 犯罪预测模型的训练方法、装置及电子设备 | |
CN113961736A (zh) | 文本生成图像的方法、装置、计算机设备和存储介质 | |
CN105357523A (zh) | 一种基于hosvd算法视频压缩系统及方法 | |
CN114926555B (zh) | 一种安防监控设备数据智能压缩方法与系统 | |
CN107371026B (zh) | 一种视频数据多重压缩及重构方法 | |
Hu et al. | UAV image high fidelity compression algorithm based on generative adversarial networks under complex disaster conditions | |
CN113507605B (zh) | 基于人工智能的危险区域监控视频压缩存储方法和系统 | |
Mei et al. | Learn a compression for objection detection-vae with a bridge | |
CN109474824A (zh) | 图像压缩方法 | |
CN112702607B (zh) | 一种基于光流决策的智能视频压缩方法及装置 | |
CN113626917A (zh) | 基于全景技术和bim模型的构件工程量算量方法及系统 | |
CN110610508B (zh) | 一种静态视频分析方法及系统 | |
Kamble et al. | Color video compression based on fractal coding using quadtree weighted finite automata | |
Wang et al. | Deep image compression with multi-stage representation | |
CN111263163A (zh) | 一种基于手机平台的深度视频压缩框架的实现方法 | |
DE102006049232B4 (de) | Verfahren und Vorrichtung zur Vermeidung von Fehlern beim Runden von Werten nach Durchführung einer inversen diskreten Kosinus-Transformation | |
Rahali et al. | Analysis of image compression approaches using wavelet transform and Kohonen’s network | |
DE102021207643A1 (de) | Überwachungsanordnung und Verfahren zur Überwachung | |
Cilingir et al. | Image Compression Using Deep Learning | |
CN116934598B (zh) | 一种多尺度特征融合的轻量级遥感图像超分方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20231220 Address after: No. 3, 19th Floor, Jierui Intelligent Building, No. 5 South Second Ring West Section, Lianhu District, Xi'an City, Shaanxi Province, 710000 Patentee after: Shaanxi Huarui Information System Technology Co.,Ltd. Address before: 221100 A307, university entrepreneurship Park, high tech Zone, No. 99, University Road, Tongshan District, Xuzhou City, Jiangsu Province Patentee before: Jiangsu Yuli New Energy Technology Co.,Ltd. |
|
TR01 | Transfer of patent right |