CN104883567B

CN104883567B - 一种基于过完备字典的视频监控图像压缩方法

Info

Publication number: CN104883567B
Application number: CN201510313822.XA
Authority: CN
Inventors: 王中元; 朱婧雅
Original assignee: Wuhan University WHU
Current assignee: Zhuhai Dahengqin Technology Development Co Ltd
Priority date: 2015-06-09
Filing date: 2015-06-09
Publication date: 2017-12-12
Anticipated expiration: 2035-06-09
Also published as: CN104883567A

Abstract

本发明公开了一种基于过完备字典的视频监控图像压缩方法，包括字典训练过程和图像压缩过程。在字典训练过程中，选取一部分监控图像作为样本，通过自适应学习的方法训练字典，同时对字典学习的过程进行误差控制，使得重构图像能够达到人们所期望的质量。在图像压缩的过程中，基于该字典对图像进行稀疏表达，同时提出了一种自适应图像分块方法，使稀疏表达过程中系数的个数最少。最后根据输出数据特点设计量化和编码方法，以尽量减少图像压缩后的数据量。本发明可以预先对重构图像的质量进行设置，并且在压缩过程中根据图像内容更进行自适应的分块，能够在保证重构图像质量的同时提高图像的压缩效率。

Description

一种基于过完备字典的视频监控图像压缩方法

技术领域

本发明属于数字图像技术领域，涉及一种视频监控图像压缩方法，具体涉及一种基于过完备字典的视频监控图像压缩方法。

背景技术

随着大数据，云计算，物联网等新兴技术的发展，平安城市的建设已经逐渐展开。视频监控系统作为平安城市建设中的重要组成部分，在城市安全和交通管理等方面发挥了核心作用。在某些应用场景中，对视频监控中图像的采集是其中的重要环节，例如在智能监控报警系统中，摄像机捕捉的视频数据可以被自动分析，当检测到异常行为或可疑目标时，会迅速向监控人员发送实时快照图片。在交通视频监控中，也需要对大量不连续的视频监控图像进行采集。例如高速公路收费站需要对每个经过的车辆进行拍照存档，为之后可能的调查提供方便。在日常的公路监控系统中，为了识别违章车辆的牌照，也要对其拍摄十幅左右的图像才能进行后续的处理。而原始监控图像数据量巨大，由于存储空间和网络带宽的限制，视频监控图像在需要经过压缩才能进行存储或传输，因此，如何高效的对视频监控图像进行压缩亟待解决的问题。

传统的图像压缩方法基于预设的字典对图像进行变换，例如JPEG中采用了DCT字典，JPEG2000中采用了小波字典，作为目前广泛使用的两种图像压缩方法，JPEG和JPEG2000对一般图像具有优秀的压缩效果。然而对某些具有一定特征的图像，例如人脸图像，由于预设的字典没有考虑该类图像的特点，所以难以得到最佳的图像压缩效果，而采用基于学习的字典则能够主动适应图像的特点，已被证明对人脸图像的压缩有良好的效果。但是目前对特定种类图像压缩的研究主要集中在人脸图像上，对其他类型的图像则少有涉及。

发明内容

为了解决上述技术问题，本发明提供了一种基于过完备字典的视频监控图像压缩方法，该方法采用基于学习的过完备字典对图像进行压缩，在保证图像重构质量的前提下提高了图像的压缩效率。

本发明所采用的技术方案是：一种基于过完备字典的视频监控图像压缩方法，其特征在于，包括以下步骤：

步骤1：选取部分视频监控图像作为训练样本，将训练样本图像分成16×16、8×8和4×4的图像块；

步骤2：去除作为训练样本的图像块的均值；

步骤3：分别以去掉均值的16×16、8×8和4×4的图像块作为训练样本，并进行字典训练获取三个大小不同的过完备字典；

步骤4：将原始图像分成多个16×16的图像块；

步骤5：从第一个16×16的图像块开始，将其分成4个8×8的图像块和16个4×4的图像块；

步骤6：去除步骤5中的16×16的图像块、8×8的图像块和4×4的图像块的均值；

步骤7：对步骤6中去均值后的每个图像块基于对应大小的字典进行稀疏表达；

步骤8：以稀疏表达结果中系数的个数作为标准，确定最优的分块模式并存储，同时存储最优分块模式所对应的图像块均值和稀疏矩阵；

步骤9：分别对分块模式，图像块均值和稀疏矩阵进行量化和编码；

步骤10：判断是否是最后一个16×16的图像块，如果不是则转到步骤5，若果是则结束。

作为优选，步骤3中采用K-SVD算法进行字典训练，并在字典训练的过程中利用算式：

；

对图像信号表达误差ε进行控制；其中n表示图像的位深，b表示图像块的边长，PSNR表示图像客观质量评价指标。

作为优选，步骤中7中采用OMP算法进行稀疏表达，利用算式：

对重构图像信号表达误差进行控制，其中n表示图像的位深，b表示图像块的边长，PSNR表示图像客观质量评价指标。

作为优选，步骤中9中采用霍夫曼编码方法对稀疏矩阵的系数值编码，通过对多幅图像稀疏表达过程中量化后的系数进行统计，在编解码端设置固定的霍夫曼码表。

本发明提出的一种基于过完备字典的视频监控图像压缩方法，包括字典训练过程和图像压缩过程。在字典训练过程中，选取一部分监控图像作为样本，通过自适应学习的方法训练字典，同时对字典学习的过程进行误差控制，使得重构图像能够达到人们所期望的质量。在图像压缩的过程中，基于该字典对图像进行稀疏表达，同时提出了一种自适应图像分块方法，使稀疏表达过程中系数的个数最少。最后根据输出数据特点设计量化和编码方法，以尽量减少图像压缩后的数据量。

本发明具有以下优点和积极效果：

1)本发明能够根据对实际需求，对字典训练及稀疏表达中的信号误差进行灵活的调整，对重构图像质量进行控制。

2)本发明能够在保证重构的视频监控图像的质量的同时显著提高图像的压缩效率。

附图说明

图1本发明实施例的流程图。

具体实施方式

为了便于本领域普通技术人员理解和实施本发明，下面结合附图及实施例对本发明作进一步的详细描述，应当理解，此处所描述的实施示例仅用于说明和解释本发明，并不用于限定本发明。

请见图1，本发明提供的一种基于过完备字典的视频监控图像压缩方法，包括以下步骤：

步骤2：去除作为训练样本的图像块的均值；

步骤3：分别以去掉均值的16×16、8×8和4×4的图像块作为训练样本，并采用K-SVD算法进行字典训练获取三个大小不同的过完备字典；采用K-SVD算法进行字典训练，并在字典训练的过程中利用算式：

对图像信号表达误差ε进行控制，其中n表示图像的位深，b表示图像块的边长，PSNR表示图像客观质量评价指标；

步骤7：对步骤6中去均值后的每个图像块，采用OMP算法进行稀疏表达，利用算式：

对重构图像信号表达误差ε进行控制，其中n表示图像的位深，b表示图像块的边长，PSNR表示图像客观质量评价指标；

具体来说，16×16块中每个8×8的图像块被分为四个4×4的图像块，如果表达这四个4×4的图像块所需要的系数少于表达原始8×8图像块所需要的系数，那么在分块模式中记录这个8×8的图像块分为更小的4×4块来进行稀疏表达，反之则记录该8×8图像块不分块。对于一个16×16的块，对其中的四个8×8块都进行上述操作后，可以得到系数的总个数，这时再对16×16的块进行稀疏表达，如果直接表达一个16×16的块所需要的系数更少，则更改之前的分块模式，记录该16×16的图像块不分块，反之则保留之前的分块模式。最后存储最优分块模式所对应的图像块均值和稀疏矩阵；

步骤9：分别对分块模式，图像块均值和稀疏矩阵进行量化和编码；其中采用霍夫曼编码方法对稀疏矩阵的系数值编码，通过对多幅图像稀疏表达过程中量化后的系数进行统计，在编解码端设置固定的霍夫曼码表；

本发明可以预先对重构图像的质量进行设置，并且在压缩过程中根据图像内容更进行自适应的分块，能够在保证重构图像质量的同时提高图像的压缩效率。

应当理解的是，本说明书未详细阐述的部分均属于现有技术。

应当理解的是，上述针对较佳实施例的描述较为详细，并不能因此而认为是对本发明专利保护范围的限制，本领域的普通技术人员在本发明的启示下，在不脱离本发明权利要求所保护的范围情况下，还可以做出替换或变形，均落入本发明的保护范围之内，本发明的请求保护范围应以所附权利要求为准。

Claims

1.一种基于过完备字典的视频监控图像压缩方法，其特征在于，包括以下步骤：

步骤1：选取部分视频监控图像作为训练样本，将训练样本图像独立进行三次分割，分成三个大小不同的图像块集合，图像块的大小分别为16×16、8×8、4×4；

步骤2：去除作为训练样本的图像块的均值；

步骤4：将原始图像分成多个16×16的图像块；

步骤8：以稀疏表达结果中系数的个数作为标准，确定最优分块模式并存储，同时存储最优分块模式所对应的图像块均值和稀疏矩阵；

具体实现过程是：16×16的图像块中每个8×8的图像块被分为四个4×4的图像块，如果表达这四个4×4的图像块所需要的系数少于表达原始8×8图像块所需要的系数，那么在最优分块模式中记录这个8×8的图像块分为更小的4×4的图像块来进行稀疏表达，反之则记录该8×8图像块不分块；对于一个16×16的图像块，对其中的四个8×8的图像块都进行相同操作后，得到系数的总个数，这时再对16×16的图像块进行稀疏表达，如果直接表达一个16×16的图像块所需要的系数更少，则更改之前的最优分块模式，记录该16×16的图像块不分块，反之则保留之前的最优分块模式；最后存储最优分块模式所对应的图像块均值和稀疏矩阵；

步骤9：分别对最优分块模式，图像块均值和稀疏矩阵进行量化和编码；

2.根据权利要求1所述的基于过完备字典的视频监控图像压缩方法，其特征在于：步骤3中采用K-SVD算法进行字典训练，并在字典训练的过程中利用算式：

<mrow> <mi>&epsiv;</mi> <mo>=</mo> <mfrac> <mrow> <mo>(</mo> <msup> <mn>2</mn> <mi>n</mi> </msup> <mo>-</mo> <mn>1</mn> <mo>)</mo> <mi>b</mi> </mrow> <msqrt> <msup> <mn>10</mn> <mfrac> <mrow> <mi>P</mi> <mi>S</mi> <mi>N</mi> <mi>R</mi> </mrow> <mn>10</mn> </mfrac> </msup> </msqrt> </mfrac> <mo>;</mo> </mrow> ；

3.根据权利要求1所述的基于过完备字典的视频监控图像压缩方法，其特征在于：步骤中7中采用OMP算法进行稀疏表达，利用算式：

<mrow> <mi>&epsiv;</mi> <mo>=</mo> <mfrac> <mrow> <mo>(</mo> <msup> <mn>2</mn> <mi>n</mi> </msup> <mo>-</mo> <mn>1</mn> <mo>)</mo> <mi>b</mi> </mrow> <msqrt> <msup> <mn>10</mn> <mfrac> <mrow> <mi>P</mi> <mi>S</mi> <mi>N</mi> <mi>R</mi> </mrow> <mn>10</mn> </mfrac> </msup> </msqrt> </mfrac> <mo>;</mo> </mrow>

4.根据权利要求1所述的基于过完备字典的视频监控图像压缩方法，其特征在于：步骤中9中采用霍夫曼编码方法对稀疏矩阵的系数值编码，通过对多幅图像稀疏表达过程中量化后的系数进行统计，在编解码端设置固定的霍夫曼码表。