CN104883567B - 一种基于过完备字典的视频监控图像压缩方法 - Google Patents

一种基于过完备字典的视频监控图像压缩方法 Download PDF

Info

Publication number
CN104883567B
CN104883567B CN201510313822.XA CN201510313822A CN104883567B CN 104883567 B CN104883567 B CN 104883567B CN 201510313822 A CN201510313822 A CN 201510313822A CN 104883567 B CN104883567 B CN 104883567B
Authority
CN
China
Prior art keywords
image
image block
dictionary
mrow
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510313822.XA
Other languages
English (en)
Other versions
CN104883567A (zh
Inventor
王中元
朱婧雅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Dahengqin Technology Development Co Ltd
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201510313822.XA priority Critical patent/CN104883567B/zh
Publication of CN104883567A publication Critical patent/CN104883567A/zh
Application granted granted Critical
Publication of CN104883567B publication Critical patent/CN104883567B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • H04N7/181Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a plurality of remote sources

Abstract

本发明公开了一种基于过完备字典的视频监控图像压缩方法,包括字典训练过程和图像压缩过程。在字典训练过程中,选取一部分监控图像作为样本,通过自适应学习的方法训练字典,同时对字典学习的过程进行误差控制,使得重构图像能够达到人们所期望的质量。在图像压缩的过程中,基于该字典对图像进行稀疏表达,同时提出了一种自适应图像分块方法,使稀疏表达过程中系数的个数最少。最后根据输出数据特点设计量化和编码方法,以尽量减少图像压缩后的数据量。本发明可以预先对重构图像的质量进行设置,并且在压缩过程中根据图像内容更进行自适应的分块,能够在保证重构图像质量的同时提高图像的压缩效率。

Description

一种基于过完备字典的视频监控图像压缩方法
技术领域
本发明属于数字图像技术领域,涉及一种视频监控图像压缩方法,具体涉及一种基于过完备字典的视频监控图像压缩方法。
背景技术
随着大数据,云计算,物联网等新兴技术的发展,平安城市的建设已经逐渐展开。视频监控系统作为平安城市建设中的重要组成部分,在城市安全和交通管理等方面发挥了核心作用。在某些应用场景中,对视频监控中图像的采集是其中的重要环节,例如在智能监控报警系统中,摄像机捕捉的视频数据可以被自动分析,当检测到异常行为或可疑目标时,会迅速向监控人员发送实时快照图片。在交通视频监控中,也需要对大量不连续的视频监控图像进行采集。例如高速公路收费站需要对每个经过的车辆进行拍照存档,为之后可能的调查提供方便。在日常的公路监控系统中,为了识别违章车辆的牌照,也要对其拍摄十幅左右的图像才能进行后续的处理。而原始监控图像数据量巨大,由于存储空间和网络带宽的限制,视频监控图像在需要经过压缩才能进行存储或传输,因此,如何高效的对视频监控图像进行压缩亟待解决的问题。
传统的图像压缩方法基于预设的字典对图像进行变换,例如JPEG中采用了DCT字典,JPEG2000中采用了小波字典,作为目前广泛使用的两种图像压缩方法,JPEG和JPEG2000对一般图像具有优秀的压缩效果。然而对某些具有一定特征的图像,例如人脸图像,由于预设的字典没有考虑该类图像的特点,所以难以得到最佳的图像压缩效果,而采用基于学习的字典则能够主动适应图像的特点,已被证明对人脸图像的压缩有良好的效果。但是目前对特定种类图像压缩的研究主要集中在人脸图像上,对其他类型的图像则少有涉及。
发明内容
为了解决上述技术问题,本发明提供了一种基于过完备字典的视频监控图像压缩方法,该方法采用基于学习的过完备字典对图像进行压缩,在保证图像重构质量的前提下提高了图像的压缩效率。
本发明所采用的技术方案是:一种基于过完备字典的视频监控图像压缩方法,其特征在于,包括以下步骤:
步骤1:选取部分视频监控图像作为训练样本,将训练样本图像分成16×16、8×8和4×4的图像块;
步骤2:去除作为训练样本的图像块的均值;
步骤3:分别以去掉均值的16×16、8×8和4×4的图像块作为训练样本,并进行字典训练获取三个大小不同的过完备字典;
步骤4:将原始图像分成多个16×16的图像块;
步骤5:从第一个16×16的图像块开始,将其分成4个8×8的图像块和16个4×4的图像块;
步骤6:去除步骤5中的16×16的图像块、8×8的图像块和4×4的图像块的均值;
步骤7:对步骤6中去均值后的每个图像块基于对应大小的字典进行稀疏表达;
步骤8:以稀疏表达结果中系数的个数作为标准,确定最优的分块模式并存储,同时存储最优分块模式所对应的图像块均值和稀疏矩阵;
步骤9:分别对分块模式,图像块均值和稀疏矩阵进行量化和编码;
步骤10:判断是否是最后一个16×16的图像块,如果不是则转到步骤5,若果是则结束。
作为优选,步骤3中采用K-SVD算法进行字典训练,并在字典训练的过程中利用算式:
对图像信号表达误差ε进行控制;其中n表示图像的位深,b表示图像块的边长,PSNR表示图像客观质量评价指标。
作为优选,步骤中7中采用OMP算法进行稀疏表达,利用算式:
对重构图像信号表达误差进行控制,其中n表示图像的位深,b表示图像块的边长,PSNR表示图像客观质量评价指标。
作为优选,步骤中9中采用霍夫曼编码方法对稀疏矩阵的系数值编码,通过对多幅图像稀疏表达过程中量化后的系数进行统计,在编解码端设置固定的霍夫曼码表。
本发明提出的一种基于过完备字典的视频监控图像压缩方法,包括字典训练过程和图像压缩过程。在字典训练过程中,选取一部分监控图像作为样本,通过自适应学习的方法训练字典,同时对字典学习的过程进行误差控制,使得重构图像能够达到人们所期望的质量。在图像压缩的过程中,基于该字典对图像进行稀疏表达,同时提出了一种自适应图像分块方法,使稀疏表达过程中系数的个数最少。最后根据输出数据特点设计量化和编码方法,以尽量减少图像压缩后的数据量。
本发明具有以下优点和积极效果:
1)本发明能够根据对实际需求,对字典训练及稀疏表达中的信号误差进行灵活的调整,对重构图像质量进行控制。
2)本发明能够在保证重构的视频监控图像的质量的同时显著提高图像的压缩效率。
附图说明
图1本发明实施例的流程图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
请见图1,本发明提供的一种基于过完备字典的视频监控图像压缩方法,包括以下步骤:
步骤1:选取部分视频监控图像作为训练样本,将训练样本图像分成16×16、8×8和4×4的图像块;
步骤2:去除作为训练样本的图像块的均值;
步骤3:分别以去掉均值的16×16、8×8和4×4的图像块作为训练样本,并采用K-SVD算法进行字典训练获取三个大小不同的过完备字典;采用K-SVD算法进行字典训练,并在字典训练的过程中利用算式:
对图像信号表达误差ε进行控制,其中n表示图像的位深,b表示图像块的边长,PSNR表示图像客观质量评价指标;
步骤5:从第一个16×16的图像块开始,将其分成4个8×8的图像块和16个4×4的图像块;
步骤6:去除步骤5中的16×16的图像块、8×8的图像块和4×4的图像块的均值;
步骤7:对步骤6中去均值后的每个图像块,采用OMP算法进行稀疏表达,利用算式:
对重构图像信号表达误差ε进行控制,其中n表示图像的位深,b表示图像块的边长,PSNR表示图像客观质量评价指标;
步骤8:以稀疏表达结果中系数的个数作为标准,确定最优的分块模式并存储,同时存储最优分块模式所对应的图像块均值和稀疏矩阵;
具体来说,16×16块中每个8×8的图像块被分为四个4×4的图像块,如果表达这四个4×4的图像块所需要的系数少于表达原始8×8图像块所需要的系数,那么在分块模式中记录这个8×8的图像块分为更小的4×4块来进行稀疏表达,反之则记录该8×8图像块不分块。对于一个16×16的块,对其中的四个8×8块都进行上述操作后,可以得到系数的总个数,这时再对16×16的块进行稀疏表达,如果直接表达一个16×16的块所需要的系数更少,则更改之前的分块模式,记录该16×16的图像块不分块,反之则保留之前的分块模式。最后存储最优分块模式所对应的图像块均值和稀疏矩阵;
步骤9:分别对分块模式,图像块均值和稀疏矩阵进行量化和编码;其中采用霍夫曼编码方法对稀疏矩阵的系数值编码,通过对多幅图像稀疏表达过程中量化后的系数进行统计,在编解码端设置固定的霍夫曼码表;
步骤10:判断是否是最后一个16×16的图像块,如果不是则转到步骤5,若果是则结束。
本发明可以预先对重构图像的质量进行设置,并且在压缩过程中根据图像内容更进行自适应的分块,能够在保证重构图像质量的同时提高图像的压缩效率。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

Claims (4)

1.一种基于过完备字典的视频监控图像压缩方法,其特征在于,包括以下步骤:
步骤1:选取部分视频监控图像作为训练样本,将训练样本图像独立进行三次分割,分成三个大小不同的图像块集合,图像块的大小分别为16×16、8×8、4×4;
步骤2:去除作为训练样本的图像块的均值;
步骤3:分别以去掉均值的16×16、8×8和4×4的图像块作为训练样本,并进行字典训练获取三个大小不同的过完备字典;
步骤4:将原始图像分成多个16×16的图像块;
步骤5:从第一个16×16的图像块开始,将其分成4个8×8的图像块和16个4×4的图像块;
步骤6:去除步骤5中的16×16的图像块、8×8的图像块和4×4的图像块的均值;
步骤7:对步骤6中去均值后的每个图像块基于对应大小的字典进行稀疏表达;
步骤8:以稀疏表达结果中系数的个数作为标准,确定最优分块模式并存储,同时存储最优分块模式所对应的图像块均值和稀疏矩阵;
具体实现过程是:16×16的图像块中每个8×8的图像块被分为四个4×4的图像块,如果表达这四个4×4的图像块所需要的系数少于表达原始8×8图像块所需要的系数,那么在最优分块模式中记录这个8×8的图像块分为更小的4×4的图像块来进行稀疏表达,反之则记录该8×8图像块不分块;对于一个16×16的图像块,对其中的四个8×8的图像块都进行相同操作后,得到系数的总个数,这时再对16×16的图像块进行稀疏表达,如果直接表达一个16×16的图像块所需要的系数更少,则更改之前的最优分块模式,记录该16×16的图像块不分块,反之则保留之前的最优分块模式;最后存储最优分块模式所对应的图像块均值和稀疏矩阵;
步骤9:分别对最优分块模式,图像块均值和稀疏矩阵进行量化和编码;
步骤10:判断是否是最后一个16×16的图像块,如果不是则转到步骤5,若果是则结束。
2.根据权利要求1所述的基于过完备字典的视频监控图像压缩方法,其特征在于:步骤3中采用K-SVD算法进行字典训练,并在字典训练的过程中利用算式:
<mrow> <mi>&amp;epsiv;</mi> <mo>=</mo> <mfrac> <mrow> <mo>(</mo> <msup> <mn>2</mn> <mi>n</mi> </msup> <mo>-</mo> <mn>1</mn> <mo>)</mo> <mi>b</mi> </mrow> <msqrt> <msup> <mn>10</mn> <mfrac> <mrow> <mi>P</mi> <mi>S</mi> <mi>N</mi> <mi>R</mi> </mrow> <mn>10</mn> </mfrac> </msup> </msqrt> </mfrac> <mo>;</mo> </mrow>
对图像信号表达误差ε进行控制;其中n表示图像的位深,b表示图像块的边长,PSNR表示图像客观质量评价指标。
3.根据权利要求1所述的基于过完备字典的视频监控图像压缩方法,其特征在于:步骤中7中采用OMP算法进行稀疏表达,利用算式:
<mrow> <mi>&amp;epsiv;</mi> <mo>=</mo> <mfrac> <mrow> <mo>(</mo> <msup> <mn>2</mn> <mi>n</mi> </msup> <mo>-</mo> <mn>1</mn> <mo>)</mo> <mi>b</mi> </mrow> <msqrt> <msup> <mn>10</mn> <mfrac> <mrow> <mi>P</mi> <mi>S</mi> <mi>N</mi> <mi>R</mi> </mrow> <mn>10</mn> </mfrac> </msup> </msqrt> </mfrac> <mo>;</mo> </mrow>
对重构图像信号表达误差进行控制,其中n表示图像的位深,b表示图像块的边长,PSNR表示图像客观质量评价指标。
4.根据权利要求1所述的基于过完备字典的视频监控图像压缩方法,其特征在于:步骤中9中采用霍夫曼编码方法对稀疏矩阵的系数值编码,通过对多幅图像稀疏表达过程中量化后的系数进行统计,在编解码端设置固定的霍夫曼码表。
CN201510313822.XA 2015-06-09 2015-06-09 一种基于过完备字典的视频监控图像压缩方法 Active CN104883567B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510313822.XA CN104883567B (zh) 2015-06-09 2015-06-09 一种基于过完备字典的视频监控图像压缩方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510313822.XA CN104883567B (zh) 2015-06-09 2015-06-09 一种基于过完备字典的视频监控图像压缩方法

Publications (2)

Publication Number Publication Date
CN104883567A CN104883567A (zh) 2015-09-02
CN104883567B true CN104883567B (zh) 2017-12-12

Family

ID=53950885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510313822.XA Active CN104883567B (zh) 2015-06-09 2015-06-09 一种基于过完备字典的视频监控图像压缩方法

Country Status (1)

Country Link
CN (1) CN104883567B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115294409B (zh) * 2022-10-08 2023-08-04 福州胜蓝智能科技有限公司 一种用于安防监控的视频处理方法、系统及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102156875A (zh) * 2011-03-25 2011-08-17 西安电子科技大学 基于多任务ksvd字典学习的图像超分辨率重构方法
CN103489203A (zh) * 2013-01-31 2014-01-01 清华大学 基于字典学习的图像编码方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102156875A (zh) * 2011-03-25 2011-08-17 西安电子科技大学 基于多任务ksvd字典学习的图像超分辨率重构方法
CN103489203A (zh) * 2013-01-31 2014-01-01 清华大学 基于字典学习的图像编码方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于压缩传感的图像过完备字典涉及;赵睿,于华楠;《东北电力大学学报》;20120831;第32卷(第4期);第44-47页 *
基于快速稀疏表示的医学图像压缩;赵海峰,鲁毓苗,陆明,陈思宝;《计算机工程》;20140430;第40卷(第4期);第233-236页 *
基于稀疏表示的SAR图像压缩方法;蔡红;《计算机工程与应用》;20120716;第24卷(第48期);第177-181页 *

Also Published As

Publication number Publication date
CN104883567A (zh) 2015-09-02

Similar Documents

Publication Publication Date Title
EP3179720B1 (en) Quantization method and apparatus in encoding/decoding
CN106231214A (zh) 基于可调宏块的高速cmos传感器图像近似无损压缩方法
WO2022067656A1 (zh) 一种图像处理方法及装置
CN102238374B (zh) 对图像数据进行压缩编码的方法和装置
CN103716623B (zh) 基于加权量化的视频压缩编解码方法及编解码器
CN101917622B (zh) 14bit位宽图像压缩硬件编码器
TWI513291B (zh) 影像處理的方法、裝置及電腦可讀取媒體
CN101841713B (zh) 降低编码码率的视频编码方法及系统
CN112565777A (zh) 基于深度学习模型视频数据传输方法、系统、介质及设备
CN111787218A (zh) 一种基于数字视网膜技术的监控相机
CN104883567B (zh) 一种基于过完备字典的视频监控图像压缩方法
Lu et al. Preprocessing enhanced image compression for machine vision
CN101577825B (zh) 压缩视频超分辨率中交互式量化噪声计算方法
CN102833511A (zh) 一种基于sdi高清视频的存储方法及其装置
CN106791844B (zh) 一种图像无损压缩装置及方法
CN102131082A (zh) 图像处理装置和图像处理方法
CN205356576U (zh) 一种治安监控用摄像采集装置
CN115131673A (zh) 一种面向任务的遥感影像压缩方法及系统
CN115460415A (zh) 一种面向人机混合视觉的视频压缩方法
CN104079930A (zh) 一种遥感影像压缩系统的实现方法
US20170332077A1 (en) Image re-encoding method and device thereof
CN105007490B (zh) 基于OmapL138芯片的Jpeg压缩算法
CN112468826B (zh) 一种基于多层gan的vvc环路滤波方法及系统
CN109168008B (zh) 一种基于云分布式海量交通视频信息处理方法
WO2024007843A1 (zh) 一种编解码方法、装置及计算机设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20201009

Address after: 519000 unit 1, No. 33, Haihe street, Hengqin New District, Zhuhai City, Guangdong Province

Patentee after: ZHUHAI DAHENGQIN TECHNOLOGY DEVELOPMENT Co.,Ltd.

Address before: 430072 Hubei Province, Wuhan city Wuchang District of Wuhan University Luojiashan

Patentee before: WUHAN University