CN106254879B - 一种应用自编码神经网络的有损图像压缩方法 - Google Patents

一种应用自编码神经网络的有损图像压缩方法 Download PDF

Info

Publication number
CN106254879B
CN106254879B CN201610798881.5A CN201610798881A CN106254879B CN 106254879 B CN106254879 B CN 106254879B CN 201610798881 A CN201610798881 A CN 201610798881A CN 106254879 B CN106254879 B CN 106254879B
Authority
CN
China
Prior art keywords
image
weight matrix
neural network
lossy compression
compression method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610798881.5A
Other languages
English (en)
Other versions
CN106254879A (zh
Inventor
王平
李青海
简宋全
窦钰景
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Fine Point Data Polytron Technologies Inc
Original Assignee
Guangdong Fine Point Data Polytron Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Fine Point Data Polytron Technologies Inc filed Critical Guangdong Fine Point Data Polytron Technologies Inc
Priority to CN201610798881.5A priority Critical patent/CN106254879B/zh
Publication of CN106254879A publication Critical patent/CN106254879A/zh
Application granted granted Critical
Publication of CN106254879B publication Critical patent/CN106254879B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Processing (AREA)

Abstract

本发明提供一种应用自编码神经网络的有损图像压缩方法,该方法包括:步骤S1:对有损图像进行预处理得到采样图像;步骤S2:建立自编码神经网络模型;步骤S3:根据所述自编码神经网络模型计算隐藏层图像;步骤S4:将所述隐藏层图像作为新的采样图像进行后续压缩处理,得到最终的压缩图像。与现有技术相比,本发明提供的一种应用自编码神经网络的有损图像压缩方法由于在构造映射器的过程中使用了自编码神经网络使得图像再一次进行了冗杂信息的处理,即所谓的图像降维处理;同时该网络有着类似提取特征的作用,意味着在解压还原图像的过程中可以利用隐藏层特征的作用达到一定的去噪效果,提升了压缩率的同时还有着提升图像质量的效果。

Description

一种应用自编码神经网络的有损图像压缩方法
技术领域
本发明涉及图像处理技术领域,具体涉及一种应用自编码神经网络的有损图像压缩方法。
背景技术
随着大数据时代的到来,数据以爆炸性的速度增长着,巨量的数据携带着信息在人们之间传递着,而图像作为人类感知世界的视觉基础,是人类获取信息、表达信息和传递信息的重要手段。因此,如何保证图像准确快速地传递成为数字图像处理重要的问题之一,最直接的方法就是对图像进行压缩,即减少表示数字图像时需要的数据量,这样传递图像时既可以提高速率同时也可以保证图像信息的完整性与准确性。图像压缩正是图像处理的重要的一项关键技术,划分为有损图像压缩以及无损图像压缩。后者由于其解压后图像的完整性而被医疗行业等需要高精度图像的机构组织广泛使用,而有损图像压缩技术拥有保证重要信息量的完整情况下丢失一部分不必要的信息这一特性,从而因其更高的压缩率在一般的个人及其他机构更受欢迎。但是,传统的有损图像压缩技术的压缩率较低。
鉴于上述缺陷,本发明创作者经过长时间的研究和实践终于获得了本发明。
发明内容
为解决上述技术缺陷,本发明采用的技术方案在于,提供一种应用自编码神经网络的有损图像压缩方法,该方法包括以下步骤:
步骤S1:对有损图像进行预处理得到采样图像;
步骤S2:建立自编码神经网络模型;
步骤S3:根据所述自编码神经网络模型计算隐藏层图像;
步骤S4:将所述隐藏层图像作为新的采样图像进行后续压缩处理,得到最终的压缩图像。
较佳的,所述步骤S1具体包括:对原始有损图像进行颜色模式转换,并根据需要确定图像采样方式对转换后的图像进行采样,得到对应图像的采样图像。
较佳的,所述颜色模式转换具体为把RGB颜色空间转化为YCrCb颜色空间。
较佳的,所述图像采样方式包括:YUV411和YUV422,其意义为Y、Cb、Cr三个分量的数据取样比例一般是4:1:1或者4:2:2。
较佳的,所述步骤S2具体包括如下步骤:
步骤S21:将采样图像的转换为像素矩阵再变成一维数组,设像素为N;
步骤S22:根据压缩率的需要设置隐藏层的神经元数目M,M<N;
步骤S23:训练自编码神经网络,得到最终的对应的两个权重矩阵,并将这两个权重矩阵记录为第一权重矩阵和第二权重矩阵,所述第一权重矩阵为输入层到隐藏层的连接矩阵,所述第二权重矩阵为隐藏层到输出层的连接矩阵;
步骤S24:将所述第一权重矩阵放到映射器中,将所述第二权重矩阵放到逆映射器中。
较佳的,所述步骤S23具体包括以下步骤:
步骤S231:初始化自编码神经网络,给各权值分别赋一个区间[-1,1]内的随机数,设定误差值e;
步骤S232:将采用图像的一维数组输入自编码神经网络;
步骤S233:计算采样图像的实际像素输出;
步骤S234:计算实际像素输出与相应的理想像素输出的误差E;
步骤S235:判断误差E是否小于设定的误差值e,若是,则执行步骤S236,若否,则执行步骤S237;
步骤S236:输出对应的两个权重矩阵结果;
步骤S237:输出对应的两个权重矩阵结果,调整对应的两个权重矩阵,重新计算输出像素结果,直至误差收敛,输出最终的对应的两个权重矩阵结果;
步骤S238:将对应的这两个权重矩阵记录为第一权重矩阵和第二权重矩阵,第一权重矩阵为输入层到隐藏层的连接矩阵,第二权重矩阵为隐藏层到输出层的连接矩阵。
较佳的,所述步骤S3具体包括:根据所述第一权重矩阵对采样图像进行处理,得到相应的隐藏层向量,并将该隐藏层向量按照从左到右,从上到下的顺序转化为图像像素格式,并且未能填补的像素以0填补,即得到隐藏层图像。
较佳的,所述步骤S4具体包括:对新的采样图像进行分层、离散余弦变换、Zigzag扫描排序、量化、DC系数的差分脉冲调制编码、DC系数的中间格式计算、AC系数的游程长度编码、AC系数的中间格式计算和熵编码。
与现有技术相比,本发明提供的一种应用自编码神经网络的有损图像压缩方法具有以下好处:
(1)该方法结合了图像处理方法与机器学习方法,使得该有损图像压缩方法既有图像处理方法的直观性和易理解性,也有着机器学习方法的严谨性以及准确性。
(2)利用自编码神经网络,不仅可以利用隐藏层达到图像压缩的效果,还可以根据输入以及隐藏层之间的权重联结定义出图像的特征,其中的隐藏神经元可能代表着图像重要的特征,这样就使得该压缩下不仅没有去掉有用的信息,还会保存相对重要的图形特征,有利于在压缩图片的同时对图像处理其他技术产生有用的信息。
(3)由于在构造映射器的过程中使用了自编码神经网络使得图像再一次进行了冗杂信息的处理,即所谓的图像降维处理;同时该网络有着类似提取特征的作用,意味着在解压还原图像的过程中可以利用隐藏层特征的作用达到一定的去噪效果,提升了压缩率的同时还有着提升图像质量的效果,一举多得。
附图说明
为了更清楚地说明本发明各实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。
图1为本发明的一种应用自编码神经网络的有损图像压缩方法流程图;
图2为建立自编码神经网络模型的流程图;
图3为自编码神经网络训练的流程图。
具体实施方式
以下结合附图,对本发明上述的和另外的技术特征和优点作更详细的说明。
如图1所示,为本发明的一种应用自编码神经网络的有损图像压缩方法流程图,该方法包括以下步骤:
步骤S1:对有损图像进行预处理得到采样图像。
具体的,所述预处理包括:对原始有损图像进行颜色模式转换,并根据需要确定图像采样方式对转换后的图像进行采样,得到对应图像的采样图像。颜色模式转换具体为把RGB颜色空间转化为YCrCb颜色空间。通常采用两种采样方式:YUV411和YUV422。对应地,其意义为Y、Cb、Cr三个分量的数据取样比例一般是4:1:1或者4:2:2。
步骤S2:建立自编码神经网络模型。
如图2所示,为建立自编码神经网络模型的流程图,具体包括如下步骤:
步骤S21:将采样图像的转换为像素矩阵再变成一维数组,设像素为N。
步骤S22:根据压缩率的需要设置隐藏层的神经元数目M,M<N。
步骤S23:训练自编码神经网络,得到最终的对应的两个权重矩阵,并将这两个权重矩阵记录为第一权重矩阵和第二权重矩阵,第一权重矩阵为输入层到隐藏层的连接矩阵,第二权重矩阵为隐藏层到输出层的连接矩阵。
步骤S24:将第一权重矩阵放到映射器中,将第二权重矩阵放到逆映射器中。
如图3所示,为自编码神经网络训练的流程图,具体包括以下步骤:
步骤S231:初始化自编码神经网络,给各权值分别赋一个区间[-1,1]内的随机数,设定误差值e。
步骤S232:将采用图像的一维数组输入自编码神经网络。
步骤S233:计算采样图像的实际像素输出。
步骤S234:计算实际像素输出与相应的理想像素输出的误差E。
如第i个像素的误差为:Ei=(Oi-Yi)2/2,而自编码神经网络关于整幅图像的误差为:ΣEi
步骤S235:判断误差E是否小于设定的误差值e,若是,则执行步骤S236,若否,则执行步骤S237。
步骤S236:输出对应的两个权重矩阵结果。
步骤S237:输出对应的两个权重矩阵结果,调整对应的两个权重矩阵,重新计算输出像素结果,直至误差收敛,输出最终的对应的两个权重矩阵结果。
步骤S238:将对应的这两个权重矩阵记录为第一权重矩阵和第二权重矩阵,第一权重矩阵为输入层到隐藏层的连接矩阵,第二权重矩阵为隐藏层到输出层的连接矩阵。
步骤S3:根据自编码神经网络模型计算隐藏层图像。
具体的,根据训练后确定的第一权重矩阵对采样图像进行处理,得到相应的隐藏层向量,并将该隐藏层向量按照从左到右,从上到下的顺序转化为图像像素格式,并且未能填补的像素以0填补,即得到隐藏层图像。
步骤S4:将隐藏层图像作为新的采样图像进行后续压缩处理,得到最终的压缩图像。
具体的,将隐藏层图像作为新的采样图像进行后续压缩处理包括:对新的采样图像进行分层、离散余弦变换(DCT)、Zigzag扫描排序、量化、DC系数的差分脉冲调制编码、DC系数的中间格式计算、AC系数的游程长度编码、AC系数的中间格式计算、熵编码。
由于只在构造映射器的过程中用到了自编码神经网络,那么,该方法下的解压技术也只是在逆映射器的构造中添加对应的第二权重矩阵来把隐藏层图像近似转化为原图像。类似压缩过程,把隐藏层图像转化为一维向量并截取前M项,对截取后的向量应用权重矩阵2得到对应的近似采样图像,最后根据该采样图像还原图像。
本发明提供的一种应用自编码神经网络的有损图像压缩方法具有以下好处:
(1)该方法结合了图像处理方法与机器学习方法,使得该有损图像压缩方法既有图像处理方法的直观性和易理解性,也有着机器学习方法的严谨性以及准确性。
(2)利用自编码神经网络,不仅可以利用隐藏层达到图像压缩的效果,还可以根据输入以及隐藏层之间的权重联结定义出图像的特征,其中的隐藏神经元可能代表着图像重要的特征,这样就使得该压缩下不仅没有去掉有用的信息,还会保存相对重要的图形特征,有利于在压缩图片的同时对图像处理其他技术产生有用的信息。
(3)由于在构造映射器的过程中使用了自编码神经网络使得图像再一次进行了冗杂信息的处理,即所谓的图像降维处理;同时该网络有着类似提取特征的作用,意味着在解压还原图像的过程中可以利用隐藏层特征的作用达到一定的去噪效果,提升了压缩率的同时还有着提升图像质量的效果,一举多得。
以上所述仅为本发明的较佳实施例,对本发明而言仅仅是说明性的,而非限制性的。本专业技术人员理解,在本发明权利要求所限定的精神和范围内可对其进行许多改变,修改,甚至等效,但都将落入本发明的保护范围内。

Claims (7)

1.一种应用自编码神经网络的有损图像压缩方法,其特征在于,该方法包括以下步骤:
步骤S1:对有损图像进行预处理得到采样图像;
步骤S2:建立自编码神经网络模型;
步骤S3:根据所述自编码神经网络模型计算隐藏层图像;
步骤S4:将所述隐藏层图像作为新的采样图像进行后续压缩处理,得到最终的压缩图像;
所述步骤S2具体包括如下步骤:
步骤S21:将采样图像的转换为像素矩阵再变成一维数组:,设像素为N;
步骤S22:根据压缩率的需要设置隐藏层的神经元数目M,M<N;
步骤S23:训练自编码神经网络,得到最终的对应的两个权重矩阵,并将这两个权重矩阵记录为第一权重矩阵和第二权重矩阵,所述第一权重矩阵为输入层到隐藏层的连接矩阵,所述第二权重矩阵为隐藏层到输出层的连接矩阵,其中,所述第一权重矩阵和所述第二权重矩阵在所述自编码神经网络的训练过程中可动态调整使误差小于设定误差值以得到最终的权重矩阵;
步骤S24:将所述第一权重矩阵放到映射器中,将所述第二权重矩阵放到逆映射器中。
2.根据权利要求1所述的有损图像压缩方法,其特征在于,所述步骤S1具体包括:对原始有损图像进行颜色模式转换,并根据需要确定图像采样方式对转换后的图像进行采样,得到对应图像的采样图像。
3.根据权利要求2所述的有损图像压缩方法,其特征在于,所述颜色模式转换具体为把RGB颜色空间转化为YCrCb颜色空间。
4.根据权利要求3所述的有损图像压缩方法,其特征在于,所述图像采样方式包括:YUV411和YUV422,其意义为Y、Cb、Cr三个分量的数据取样比例一般是4:1:1或者4:2:2。
5.根据权利要求1所述的有损图像压缩方法,其特征在于,所述步骤S23具体包括以下步骤:
步骤S231:初始化自编码神经网络,给各权值分别赋一个区间[-1,1]内的随机数,设定误差值e;
步骤S232:将采用图像的一维数组输入自编码神经网络;
步骤S233:计算采样图像的实际像素输出;
步骤S234:计算实际像素输出与相应的理想像素输出的误差E;
步骤S235:判断误差E是否小于设定的误差值e,若是,则执行步骤S236,若否,则执行步骤S237;
步骤S236:输出对应的两个权重矩阵结果;
步骤S237:输出对应的两个权重矩阵结果,调整对应的两个权重矩阵,重新计算输出像素结果,直至误差收敛,输出最终的对应的两个权重矩阵结果;
步骤S238:将对应的这两个权重矩阵记录为第一权重矩阵和第二权重矩阵,第一权重矩阵为输入层到隐藏层的连接矩阵,第二权重矩阵为隐藏层到输出层的连接矩阵。
6.根据权利要求5所述的有损图像压缩方法,其特征在于,所述步骤S3具体包括:根据所述第一权重矩阵对采样图像进行处理,得到相应的隐藏层向量,并将该隐藏层向量按照从左到右,从上到下的顺序转化为图像像素格式,并且未能填补的像素以0填补,即得到隐藏层图像。
7.根据权利要求6所述的有损图像压缩方法,其特征在于,所述步骤S4具体包括:对新的采样图像进行分层、离散余弦变换、Zigzag扫描排序、量化、DC系数的差分脉冲调制编码、DC系数的中间格式计算、AC系数的游程长度编码、AC系数的中间格式计算和熵编码。
CN201610798881.5A 2016-08-31 2016-08-31 一种应用自编码神经网络的有损图像压缩方法 Active CN106254879B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610798881.5A CN106254879B (zh) 2016-08-31 2016-08-31 一种应用自编码神经网络的有损图像压缩方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610798881.5A CN106254879B (zh) 2016-08-31 2016-08-31 一种应用自编码神经网络的有损图像压缩方法

Publications (2)

Publication Number Publication Date
CN106254879A CN106254879A (zh) 2016-12-21
CN106254879B true CN106254879B (zh) 2019-11-08

Family

ID=58080789

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610798881.5A Active CN106254879B (zh) 2016-08-31 2016-08-31 一种应用自编码神经网络的有损图像压缩方法

Country Status (1)

Country Link
CN (1) CN106254879B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107665128B (zh) * 2017-09-13 2021-11-19 深信服科技股份有限公司 图像处理方法、系统、服务器及可读存储介质
CN109547784A (zh) * 2017-09-21 2019-03-29 华为技术有限公司 一种编码、解码方法及装置
US10839259B2 (en) 2017-10-27 2020-11-17 Google Llc Attention-based image generation neural networks
CN109842799B (zh) * 2017-11-29 2021-02-09 杭州海康威视数字技术股份有限公司 颜色分量的帧内预测方法、装置及计算机设备
CN108776818A (zh) * 2018-06-05 2018-11-09 北京航空航天大学 轴承特征提取方法、轴承剩余寿命预测方法和装置
CN112470472B (zh) * 2018-06-11 2023-03-24 无锡安科迪智能技术有限公司 盲压缩采样方法、装置及成像系统
CN111031312B (zh) * 2019-12-16 2022-02-25 山东浪潮科学研究院有限公司 基于网络实现注意力机制的图像压缩方法
CN112437311A (zh) * 2020-11-23 2021-03-02 黄晓红 一种视频序列压缩编码方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02202777A (ja) * 1989-01-31 1990-08-10 Sharp Corp 画像圧縮方法
CN1106600A (zh) * 1994-02-05 1995-08-09 华邦电子股份有限公司 以对称编码实现色彩空间转换的方法
CN1405735A (zh) * 2002-11-08 2003-03-26 北京工业大学 基于感知器的彩色图像无损压缩方法
CN101094402A (zh) * 2007-07-13 2007-12-26 青岛大学 基于神经网络与svm的图像编码方法
CN101795344A (zh) * 2010-03-02 2010-08-04 北京大学 数字全息图像压缩、解码方法及系统、传输方法及系统
CN105163121A (zh) * 2015-08-24 2015-12-16 西安电子科技大学 基于深度自编码网络的大压缩比卫星遥感图像压缩方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02202777A (ja) * 1989-01-31 1990-08-10 Sharp Corp 画像圧縮方法
CN1106600A (zh) * 1994-02-05 1995-08-09 华邦电子股份有限公司 以对称编码实现色彩空间转换的方法
CN1405735A (zh) * 2002-11-08 2003-03-26 北京工业大学 基于感知器的彩色图像无损压缩方法
CN101094402A (zh) * 2007-07-13 2007-12-26 青岛大学 基于神经网络与svm的图像编码方法
CN101795344A (zh) * 2010-03-02 2010-08-04 北京大学 数字全息图像压缩、解码方法及系统、传输方法及系统
CN105163121A (zh) * 2015-08-24 2015-12-16 西安电子科技大学 基于深度自编码网络的大压缩比卫星遥感图像压缩方法

Also Published As

Publication number Publication date
CN106254879A (zh) 2016-12-21

Similar Documents

Publication Publication Date Title
CN106254879B (zh) 一种应用自编码神经网络的有损图像压缩方法
CN110087092B (zh) 基于图像重构卷积神经网络的低码率视频编解码方法
JP2021520082A (ja) ビデオ符号化のための機械学習モデルの量子化パラメータに適用される非線形関数の使用
CN106385584B (zh) 基于空域相关性的分布式视频压缩感知自适应采样编码方法
CN107027025B (zh) 一种基于宏像素块自适应预测的光场图像压缩方法
CN101729891B (zh) 一种多视点深度视频的编码方法
CN104199627B (zh) 基于多尺度在线字典学习的可分级视频编码系统
CN110870310A (zh) 图像编码方法和装置
CN105392009B (zh) 基于块自适应采样和超分辨率重建的低码率图像编码方法
CN106303521B (zh) 一种基于感知敏感度的hevc率失真优化方法
EP1931149A3 (en) Rate control for image coding
CN101841713B (zh) 降低编码码率的视频编码方法及系统
CN107645662A (zh) 一种彩色图像压缩方法
CN107211133A (zh) 反量化变换系数的方法、装置及解码设备
CN103780909A (zh) 编码器、解码器及编码方法、解码方法
WO2017043941A1 (ko) 예측 각도에 따른 그래프 기반 변환을 이용하여 비디오 신호를 처리하는 방법 및 장치
CN106791836A (zh) 一种基于一对多网络的减少图像压缩效应的方法
Alam et al. An improved JPEG image compression algorithm by modifying luminance quantization table
CN112019854B (zh) 基于深度学习神经网络的环路滤波方法
CN110352599A (zh) 用于视频处理的方法和设备
CN103297773B (zh) 基于jnd模型的图像编码方法
CN103096052B (zh) 一种图像编码、解码的方法和装置
CN110084843A (zh) 一种应用于家具三维打印的基于深度学习的图像压缩方法
CN107146260B (zh) 一种基于均方误差的图像压缩感知采样方法
CN104320661B (zh) 基于差分熵和结构相似性的图像编码质量预测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Room 701, 7th floor, Building A, 906 Tianhe Road, Tianhe District, Guangzhou City, Guangdong Province, 510000

Applicant after: Guangdong fine point data Polytron Technologies Inc

Address before: 510630 906 hi tech building, Tianhe North Road, Guangzhou, Guangdong A-701

Applicant before: Guangzhou Jing Dian computing machine Science and Technology Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant