CN110730347A - 图像压缩方法、装置及电子设备 - Google Patents

图像压缩方法、装置及电子设备 Download PDF

Info

Publication number
CN110730347A
CN110730347A CN201911199756.2A CN201911199756A CN110730347A CN 110730347 A CN110730347 A CN 110730347A CN 201911199756 A CN201911199756 A CN 201911199756A CN 110730347 A CN110730347 A CN 110730347A
Authority
CN
China
Prior art keywords
image
network
coding
convolutional
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911199756.2A
Other languages
English (en)
Inventor
周雷
孙振鉷
武祥吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Map Duck Mdt Infotech Ltd
Original Assignee
Hefei Map Duck Mdt Infotech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei Map Duck Mdt Infotech Ltd filed Critical Hefei Map Duck Mdt Infotech Ltd
Publication of CN110730347A publication Critical patent/CN110730347A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明实施例提供了一种图像压缩方法、装置及电子设备,所述图像压缩方法包括:获取图像;根据第一图像编解码网络对所述图像进行处理,得到所述图像的特征通道;根据第一图像编解码网络对所述特征通道中满足条件的通道进行压缩,得到第一压缩图像比特流;根据第一图像编解码网络对所述第一压缩图像比特流进行解压缩,得到第一重建图像;根据第二图像编解码网络对所述第一重建图像进行压缩,得到压缩后的图像比特流;该方法可有效地提高压缩比,并有很大的性能提升空间。

Description

图像压缩方法、装置及电子设备
技术领域
本发明涉及图像压缩领域,特别涉及一种图像压缩方法、装置及电子设备。
背景技术
目前的图像编码方法存在压缩率不高等问题。
发明内容
为了解决上述问题,本发明实施例提供了一种图像压缩方法。
根据本发明的第一方面,提供了一种图像压缩方法,包括:
获取图像;
根据第一图像编解码网络对所述图像进行处理,得到所述图像的特征通道;
根据第一图像编解码网络对所述特征通道中满足条件的通道进行压缩,得到第一压缩图像比特流;
根据第一图像编解码网络对所述第一压缩图像比特流进行解压缩,得到第一重建图像;
根据第二图像编解码网络对所述第一重建图像进行压缩,得到压缩后的图像比特流。
进一步地,所述条件包括所述通道的特征值处于预设范围区间。
进一步地,所述第一图像编解码网络和第二图像编解码网络为卷积神经网络,所述各个网络的结构相同和/或不同。
进一步地,所述第一图像编解码网络包括下采样卷积网络、上采样卷积网络以及超参网络,其中所述下采样卷积网络所述上采样卷积网络可以为多个。
进一步地,所述第二图像编解码网络包括下采样卷积网络和上采样卷积网络,其中所述下采样卷积网络所述上采样卷积网络可以为多个。
根据本发明的第二方面,提供了一种图像压缩装置,包括:
获取模块,用于获取图像;
处理模块,用于根据第一图像编解码网络对所述图像进行处理,得到所述图像的特征通道;
条件压缩模块,用于根据第一图像编解码网络对所述特征通道中满足条件的通道进行压缩,得到第一压缩图像比特流;
解压模块,用于根据第一图像编解码网络对所述第一压缩图像比特流进行解压缩,得到第一重建图像;
压缩模块,用于根据第二图像编解码网络对所述第一重建图像进行压缩,得到压缩后的图像比特流。
进一步地,所述条件包括所述通道的特征值处于预设范围区间。
进一步地,所述第一图像编解码网络和第二图像编解码网络为卷积神经网络,所述各个网络的结构相同和/或不同。
进一步地,所述第一图像编解码网络包括下采样卷积网络、上采样卷积网络以及超参网络,其中所述下采样卷积网络所述上采样卷积网络可以为多个;
所述第二图像编解码网络包括下采样卷积网络和上采样卷积网络,其中所述下采样卷积网络所述上采样卷积网络可以为多个。
根据本发明的第三方面,提供了一种电子设备,包括:
存储器,用于存储程序;
处理器,耦合至所述存储器,用于执行所述程序,所述程序运行时执行本发明提供的方法。
本发明实施例提供一种图像压缩方法、装置及电子设备,能有效地提高压缩比。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的图像压缩方法流程图;
图2是本发明实施例提供的第一图像编解码网络的训练方法流程图;
图3是本发明实施例提供的第一图像编解码网络的训练方法流程图;
图4是本发明实施例提供的三层卷积神经网络示意图;
图5是本发明实施例提供的自编码网络示意图;
图6是本发明实施例提供的第二图像编解码网络的训练方法示意图;
图7是本发明实施例提供的第二图像编解码网络的训练方法示意图;
图8是本发明实施例提供的图像压缩装置示意图;
图9是本发明实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
作为本发明的一个实施例,所述图像压缩方法如图1所示,包括:
步骤102,获取图像。
具体的,当对图片进行压缩时,获取该图片对应的图像,当对视频中的全部或者部分视频帧进行压缩时,获取待压缩的视频帧。
步骤104,根据第一图像编解码网络对所述图像进行处理,得到所述图像的特征通道。
具体的,根据第一图像编码网络提取所述图像的特征,得到所述图像的特征通道。
步骤106,根据第一图像编解码网络对所述特征通道中满足条件的通道进行压缩,得到第一压缩图像比特流。
实际处理过程中可以观察到只有在特定通道上特征的分布较大,而在其他大部分通道上特征分布很稀疏,分布范围很小,整通道几乎是0的值,偶尔会有±1出现,因此可以将这些分布稀疏的通道全部设置为0,再进行压缩,从而达到增加压缩比的目的。在一种可能的实施例中,可以按比例选择通道,例如将所有通道按分布范围从大到小进行排序,将处于后80%的通道设置为0,这里也可以设置其他比例,或者根据实际情况动态调节该比例,本发明对此不做限制。在一种可能的实施例中可以根据通道分布的大小进行选择,例如将通道分布小于一定值的通道设置为0,该值可以预先设定也可以根据实际情况动态调节,本发明对此不做限制。
步骤108,根据第一图像编解码网络对所述第一压缩图像比特流进行解压缩,得到第一重建图像。
具体的,根据第一图像编解码网络对所述第一压缩图像比特流进行至少次上采样解压,每次上采样倍数为2或者其他可能的倍数,得到第一重建图像。
步骤110,根据第二图像编解码网络对所述第一重建图像进行压缩,得到压缩后的图像比特流。
具体的,根据第二图像编解码网络对所述第一重建图像进行至少一次下采样压缩,得到压缩后的图像比特流。
作为本发明的一个实施例,所述第一图像编解码网络的训练方法如图2所示,包括:
步骤202,获取图像。
具体的,获取待训练的图像。
步骤204,通过特征提取网络提取所述图像的特征。
具体的,可以通过自编码网络提取所述图像的特征。
自编码网络的作用是将数据从图像空间x,转换到数据编码空间y,它包含一个编码器fe。编码器的作用是将图像像素值x转换为压缩特征y=fe(x)。
步骤206,对所述特征对应的通道中满足条件的通道进行压缩,得到第一压缩图像比特流。
实际处理过程中可以观察到只有在特定通道上特征的分布较大,而在其他大部分通道上特征分布很稀疏,分布范围很小,整通道几乎是0的值,偶尔会有±1出现,因此可以将这些分布稀疏的通道全部设置为0,再进行压缩,从而达到增加压缩比的目的。在一种可能的实施例中,可以按比例选择通道,例如将所有通道按分布范围从大到小进行排序,将处于后80%的通道设置为0,这里也可以设置其他比例,或者根据实际情况动态调节该比例,本发明对此不做限制。在一种可能的实施例中可以根据通道分布的大小进行选择,例如将通道分布小于一定值的通道设置为0,该值可以预先设定也可以根据实际情况动态调节,本发明对此不做限制。
步骤208,根据概率模型对所述特征进行估计,得到码率估计结果。
具体的,包括:
根据概率模型对分布进行估计,并根据熵进行码率估计,得到所述码率估计结果。
码率可用熵的结构进行建模,公式为:
Figure BDA0002295571890000051
其中,R表示码率,Q表示量化,P表示概率模型,
Figure BDA0002295571890000052
表示量化后的特征。
可以使用带参数的方式对先验分布进行拟合,然后用数据驱动的方式对先验概率模型进行学习。
步骤210,将所述第一压缩图像比特流输入解码网络,得到第二重建图像。
具体的,
根据自解码网络,对码所述特征进行解码,得到第二重建图像。
步骤212,将所述第二重建图像与所述图像进行比较,并根据所述码率估计得到率-失真优化结果。
具体的,
将所述第二重建图像和所述图像进行比较,得到失真残差;
根据所述码率估计结果和所述失真残差得到所述率-失真优化结果。
在压缩模型中,失真D可以用均方误差(MSE)
Figure BDA0002295571890000061
进行表示,其中,x表示所述图像(也称为原始图像或输入图像),
Figure BDA0002295571890000062
表示重建图像,或使用如MS-SSIM之类的主观失真进行计算。根据对码率和失真进行加权的损失函数R+λD对自编码压缩算法进行端到端的优化,其中R表示码率,D表示失真,λ表示权重,在优化过程中,首先定义损失函数,然后可使用反向传播算法对网络参数进行优化。
步骤214,根据所述率-失真优化结果对所述特征提取网络的参数进行调整。
具体的,根据所述率-失真优化结果对所述特征提取网络的参数进行训练,并根据训练结果对所述参数进行优化。
作为本发明的一个实施例,所述第一图像编解码网络的训练方法如图3所示,包括:
步骤302,获取图像。
具体的,获取待训练的图像。
步骤304,通过特征提取网络提取所述图像的特征。
具体的,采用如图4所示的三层卷积神经网络对所述图像的特征进行提取,在一种可选的方式中,将每层卷积神经网络得到的结果都作为输入来计算得到最终的特征,即通过将每层卷积后得到的归一化特征再次进行卷积并作为级联的输入。
步骤306,对特征进行量化,得到量化后的特征。
具体的,包括:
在训练过程中,使用加性均匀噪声设计量化器,表示方式为
Figure BDA0002295571890000071
其中∈是随机噪声。其中变量
Figure BDA0002295571890000072
的熵能用变量的熵进行估计,因此在实际使用该模型的过程中,可以使用
Figure BDA0002295571890000074
作为量化操作,这样一种方式下,也能对码率进行准确的估计。
步骤308,对所述量化后的特征对应的通道中满足条件的通道进行压缩,得到第一压缩图像比特流。
实际处理过程中可以观察到只有在特定通道上特征的分布较大,而在其他大部分通道上特征分布很稀疏,分布范围很小,整通道几乎是0的值,偶尔会有±1出现,因此可以将这些分布稀疏的通道全部设置为0,再进行压缩,从而达到增加压缩比的目的。在一种可能的实施例中,可以按比例选择通道,例如将所有通道按分布范围从大到小进行排序,将处于后80%的通道设置为0,这里也可以设置其他比例,或者根据实际情况动态调节该比例,本发明对此不做限制。在一种可能的实施例中可以根据通道分布的大小进行选择,例如将通道分布小于一定值的通道设置为0,该值可以预先设定也可以根据实际情况动态调节,本发明对此不做限制。
步骤310,根据概率模型对所述特征进行估计,得到码率估计结果。
具体的,包括:
根据概率模型对分布进行估计,并根据熵进行码率估计,得到所述码率估计结果。
自然图像的数据分布一般被认为是符合高斯分布,所以可以采用零均值,方差表示为
Figure BDA0002295571890000081
的拉普拉斯分布对特征yi的概率分布进行建模,概率的公式如下所示:
其中μ表示平均分布,
Figure BDA0002295571890000084
表示超参数网络的压缩特征。
进一步地,可以采用自编码网络对方差
Figure BDA0002295571890000085
进行学习,自编码网络的结构如图5所示,表示压缩特征作为超参数自编码网络的输入,对标准差分布进行学习,在超参自编码网络中,变量z的表示公式为:z=he(y),其中he表示超参数学习网络的编码器,然后进行量化,量化公式为
Figure BDA0002295571890000087
然后被量化后的表示可作为附加变量进行传输。
特征的码率可用熵的结构进行建模可以使用带参数的方式对先验分布进行拟合,然后用数据驱动的方式对先验概率模型进行学习。
步骤312,将第一压缩图像比特流输入解码网络,得到第三重建图像。
具体的,
根据自解码网络,对量化后的特征进行解码,得到第三重建图像。
步骤314,将所述第三重建图像与所述图像进行比较,并根据所述码率估计得到率-失真优化结果。
具体的,
将所述第三重建图像和所述图像进行比较,得到失真残差;
根据所述码率估计结果和所述失真残差得到所述率-失真优化结果。
在压缩模型中,失真D可以用均方误差(MSE)
Figure BDA0002295571890000089
进行表示,或使用如MS-SSIM之类的主观失真进行计算。对码率和失真进行加权的损失函数R+λD用以对自编码压缩算法进行端到端的优化,在优化过程中,首先定义损失函数,然后可使用反向传播算法对网络参数进行优化。
考虑到码率约束,可以构建一个进行码率有效分配的优化算法,训练多个压缩模型,在一定的码率约束下,为每张图选择最优的压缩模型,每张图的最优配置,通过优化以下的优化问题进行选择,具体公式为:
Figure BDA0002295571890000091
其中,D表示失真,xi表示所述图像,
Figure BDA0002295571890000092
表示第三重建图像,
Figure BDA0002295571890000093
表示第i张图选择第j个编码模型。
步骤316,根据所述率-失真优化结果对所述特征提取网络的参数进行调整。
具体的,采用梯度反向传播算法对卷积神经网络的参数进行更新。
作为本发明的一个实施例,所述第二图像编解码网络的训练方法如图6所示,包括:
步骤602,通过特征提取网络提取由第一图像编解码网络生成的第一重建图像的特征。
具体的,所述第一重建图像为步骤210或步骤312中生成的重建图像,可以通过自编码网络提取所述第一重建图像的特征。
自编码网络的作用是将数据从图像空间x,转换到数据编码空间y,它包含一个编码器fe。编码器的作用是将图像像素值x转换为压缩特征y=fe(x)。
步骤604,根据概率模型对所述特征进行估计,得到码率估计结果。
具体的,包括:
根据概率模型对分布进行估计,并根据熵进行码率估计,得到所述码率估计结果。
码率可用熵的结构进行建模,公式为:
Figure BDA0002295571890000094
其中,R表示码率,Q表示量化,P表示概率模型,
Figure BDA0002295571890000095
表示量化后的特征。
可以使用带参数的方式对先验分布进行拟合,然后用数据驱动的方式对先验概率模型进行学习。
步骤606,将所述特征输入解码网络,得到第四重建图像。
具体的,
根据自解码网络,对码所述特征进行解码,得到第四重建图像。
步骤608,将所述第四重建图像与步骤202或步骤302中所述图像进行比较,并根据所述码率估计得到率-失真优化结果。
具体的,
将所述第四重建图像和所述图像进行比较,得到失真残差;
根据所述码率估计结果和所述失真残差得到所述率-失真优化结果。
在压缩模型中,失真D可以用均方误差(MSE)
Figure BDA0002295571890000101
进行表示,其中,x表示所述图像(也称为原始图像或输入图像),
Figure BDA0002295571890000102
表示重建图像,或使用如MS-SSIM之类的主观失真进行计算。根据对码率和失真进行加权的损失函数R+λD对自编码压缩算法进行端到端的优化,其中R表示码率,D表示失真,λ表示权重,在优化过程中,首先定义损失函数,然后可使用反向传播算法对网络参数进行优化。
步骤610,根据所述率-失真优化结果对所述特征提取网络的参数进行调整。
具体的,根据所述率-失真优化结果对所述特征提取网络的参数进行训练,并根据训练结果对所述参数进行优化。
作为本发明的一个实施例,所述第二图像编解码网络的训练方法如图7所示,包括:
步骤702,通过特征提取网络提取由第一图像编解码网络生成的第一重建图像的特征。
具体的,所述第一重建图像为步骤210或步骤312中生成的重建图像,可以通过自编码网络提取所述第一重建图像的特征。
采用如图4所示的三层卷积神经网络对所述第一重建图像的特征进行提取,在一种可选的方式中,将每层卷积神经网络得到的结果都作为输入来计算得到最终的特征,即通过将每层卷积后得到的归一化特征再次进行卷积并作为级联的输入。
步骤704,根据概率模型对所述特征进行估计,得到码率估计结果。
具体的,包括:
根据概率模型对分布进行估计,并根据熵进行码率估计,得到所述码率估计结果。
自然图像的数据分布一般被认为是符合高斯分布,所以可以采用零均值,方差表示为
Figure BDA0002295571890000111
的拉普拉斯分布
Figure BDA0002295571890000112
对特征yi的概率分布进行建模,概率的公式如下所示:
Figure BDA0002295571890000113
其中μ表示平均分布,
Figure BDA0002295571890000114
表示超参数网络的压缩特征。
进一步地,可以采用自编码网络对方差
Figure BDA0002295571890000115
进行学习,自编码网络的结构如图5所示,
Figure BDA0002295571890000116
表示压缩特征作为超参数自编码网络的输入,对标准差分布进行学习,在超参自编码网络中,变量z的表示公式为:z=he(y),其中he表示超参数学习网络的编码器,然后进行量化,量化公式为
Figure BDA0002295571890000117
然后被量化后的表示可作为附加变量进行传输。
特征的码率可用熵的结构进行建模
Figure BDA0002295571890000118
可以使用带参数的方式对先验分布进行拟合,然后用数据驱动的方式对先验概率模型进行学习。
步骤706,对特征进行量化,得到量化后的特征。
具体的,包括:
在训练过程中,使用加性均匀噪声设计量化器,表示方式为
Figure BDA0002295571890000119
其中∈是随机噪声。其中变量
Figure BDA00022955718900001110
的熵能用变量
Figure BDA00022955718900001111
的熵进行估计,因此在实际使用该模型的过程中,可以使用
Figure BDA00022955718900001112
作为量化操作,这样一种方式下,也能对码率进行准确的估计。
步骤708,将量化后的特征输入解码网络,得到第五重建图像。
具体的,
根据自解码网络,对量化后的特征进行解码,得到第五重建图像。
步骤710,将所述第五重建图像与所述图像进行比较,并根据所述码率估计得到率-失真优化结果。
具体的,
将所述第五重建图像和所述图像进行比较,得到失真残差;
根据所述码率估计结果和所述失真残差得到所述率-失真优化结果。
在压缩模型中,失真D可以用均方误差(MSE)
Figure BDA0002295571890000121
进行表示,或使用如MS-SSIM之类的主观失真进行计算。对码率和失真进行加权的损失函数R+λ用以对自编码压缩算法进行端到端的优化,在优化过程中,首先定义损失函数,然后可使用反向传播算法对网络参数进行优化。
考虑到码率约束,可以构建一个进行码率有效分配的优化算法,训练多个压缩模型,在一定的码率约束下,为每张图选择最优的压缩模型,每张图的最优配置,通过优化以下的优化问题进行选择,具体公式为:
Figure BDA0002295571890000122
其中,D表示失真,xi表示所述图像,
Figure BDA0002295571890000123
表示第五重建图像,
Figure BDA0002295571890000124
表示第i张图选择第j个编码模型。
步骤712,根据所述率-失真优化结果对所述特征提取网络的参数进行调整。
具体的,采用梯度反向传播算法对卷积神经网络的参数进行更新。
作为本发明的一个实施例,提供了一种图像压缩装置,如图8所示,包括:
获取模块801,用于获取图像;
处理模块802,用于根据第一图像编解码网络对所述图像进行处理,得到所述图像的特征通道;
条件压缩模块803,用于根据第一图像编解码网络对所述特征通道中满足条件的通道进行压缩,得到第一压缩图像比特流;
解压模块804,用于根据第一图像编解码网络对所述第一压缩图像比特流进行解压缩,得到第一重建图像;
压缩模块805,用于根据第二图像编解码网络对所述第一重建图像进行压缩,得到压缩后的图像比特流。
作为本发明的一个实施例,提供了一种电子设备,如图9所示,包括:
存储器901和处理器902。
存储器901,用于存储程序。
除上述程序之外,存储器901还可以被配置为存储其它各种数据以支持在电子设备上的操作。这些数据的示例包括用于在电子设备上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。
存储器901可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),快闪存储器,磁盘或光盘。
处理器902,耦合至存储器901,用于执行存储器901中的程序,所述程序运行时执行如图1至图7中任意一种方法。
上述的具体处理操作已经在前面的实施例中进行了详细描述,在此不再赘述。

Claims (10)

1.一种图像压缩方法,其特征在于,所述方法包括:
获取图像;
根据第一图像编解码网络对所述图像进行处理,得到所述图像的特征通道;
根据第一图像编解码网络对所述特征通道中满足条件的通道进行压缩,得到第一压缩图像比特流;
根据第一图像编解码网络对所述第一压缩图像比特流进行解压缩,得到第一重建图像;
根据第二图像编解码网络对所述第一重建图像进行压缩,得到压缩后的图像比特流。
2.根据权利要求1所述的方法,其特征在于,所述条件包括所述通道的特征值处于预设范围区间。
3.根据权利要求1所述的方法,其特征在于,所述第一图像编解码网络和第二图像编解码网络为卷积神经网络,所述各个网络的结构相同和/或不同。
4.根据权利要求1所述的方法,其特征在于,所述第一图像编解码网络包括下采样卷积网络、上采样卷积网络以及超参网络,其中所述下采样卷积网络所述上采样卷积网络可以为多个。
5.根据权利要求1所述的方法,其特征在于,所述第二图像编解码网络包括下采样卷积网络和上采样卷积网络,其中所述下采样卷积网络所述上采样卷积网络可以为多个。
6.一种图像压缩装置,其特征在于,所述装置包括:
获取模块,用于获取图像;
处理模块,用于根据第一图像编解码网络对所述图像进行处理,得到所述图像的特征通道;
条件压缩模块,用于根据第一图像编解码网络对所述特征通道中满足条件的通道进行压缩,得到第一压缩图像比特流;
解压模块,用于根据第一图像编解码网络对所述第一压缩图像比特流进行解压缩,得到第一重建图像;
压缩模块,用于根据第二图像编解码网络对所述第一重建图像进行压缩,得到压缩后的图像比特流。
7.根据权利要求6所述的装置,其特征在于,所述条件包括所述通道的特征值处于预设范围区间。
8.根据权利要求6所述的装置,其特征在于,所述第一图像编解码网络和第二图像编解码网络为卷积神经网络,所述各个网络的结构相同和/或不同。
9.根据权利要求6所述的装置,其特征在于,所述第一图像编解码网络包括下采样卷积网络、上采样卷积网络以及超参网络,其中所述下采样卷积网络所述上采样卷积网络可以为多个;
所述第二图像编解码网络包括下采样卷积网络和上采样卷积网络,其中所述下采样卷积网络所述上采样卷积网络可以为多个。
10.一种电子设备,包括:
存储器,用于存储程序;
处理器,耦合至所述存储器,用于执行所述程序,所述程序运行时执行权利要求1-5中任意一项权利要求所述的方法。
CN201911199756.2A 2019-04-24 2019-11-29 图像压缩方法、装置及电子设备 Pending CN110730347A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201910347410 2019-04-24
CN2019103474106 2019-04-24

Publications (1)

Publication Number Publication Date
CN110730347A true CN110730347A (zh) 2020-01-24

Family

ID=69226290

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911199756.2A Pending CN110730347A (zh) 2019-04-24 2019-11-29 图像压缩方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN110730347A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113313774A (zh) * 2020-02-26 2021-08-27 华为技术有限公司 图像处理方法、装置、电子设备及存储介质
CN113438481A (zh) * 2020-03-23 2021-09-24 富士通株式会社 训练方法、图像编码方法、图像解码方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150063575A1 (en) * 2013-08-28 2015-03-05 Texas Instruments Incorporated Acoustic Sound Signature Detection Based on Sparse Features
CN106991651A (zh) * 2016-12-12 2017-07-28 南昌大学 基于合成分析反卷积网络的快速成像方法及系统
CN107909147A (zh) * 2017-11-16 2018-04-13 深圳市华尊科技股份有限公司 一种数据处理方法及装置
CN109495741A (zh) * 2018-11-29 2019-03-19 四川大学 基于自适应下采样和深度学习的图像压缩方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150063575A1 (en) * 2013-08-28 2015-03-05 Texas Instruments Incorporated Acoustic Sound Signature Detection Based on Sparse Features
CN106991651A (zh) * 2016-12-12 2017-07-28 南昌大学 基于合成分析反卷积网络的快速成像方法及系统
CN107909147A (zh) * 2017-11-16 2018-04-13 深圳市华尊科技股份有限公司 一种数据处理方法及装置
CN109495741A (zh) * 2018-11-29 2019-03-19 四川大学 基于自适应下采样和深度学习的图像压缩方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
YIHUI HE等: "channel pruning for accelerating very deep neural networks", 《ARXIV.ORG》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113313774A (zh) * 2020-02-26 2021-08-27 华为技术有限公司 图像处理方法、装置、电子设备及存储介质
WO2021169408A1 (zh) * 2020-02-26 2021-09-02 华为技术有限公司 图像处理方法、装置、电子设备及存储介质
CN113438481A (zh) * 2020-03-23 2021-09-24 富士通株式会社 训练方法、图像编码方法、图像解码方法及装置
CN113438481B (zh) * 2020-03-23 2024-04-12 富士通株式会社 训练方法、图像编码方法、图像解码方法及装置

Similar Documents

Publication Publication Date Title
CN111641832B (zh) 编码方法、解码方法、装置、电子设备及存储介质
CN101563926A (zh) 图像压缩与解压缩
CN110024391B (zh) 用于编码和解码数字图像或视频流的方法和装置
US5719961A (en) Adaptive technique for encoder and decoder signal transformation
CN110753225A (zh) 一种视频压缩方法、装置及终端设备
Kozhemiakin et al. Image quality prediction for DCT-based compression
EP2145476B1 (en) Image compression and decompression using the pixon method
CN111163314A (zh) 一种图像压缩方法及系统
CN112218094A (zh) 一种基于dct系数预测的jpeg图像去压缩效应方法
CN110730347A (zh) 图像压缩方法、装置及电子设备
CN116916036A (zh) 视频压缩方法、装置及系统
CN111050170A (zh) 基于gan的图片压缩系统构建方法、压缩系统及方法
Chen et al. Neural network-based video compression artifact reduction using temporal correlation and sparsity prior predictions
WO2000048090A1 (en) An image compression system and method of determining quantisation parameters therefor
CN111163320A (zh) 一种视频压缩方法及系统
CN111161363A (zh) 一种图像编码模型训练方法及装置
CN110717948A (zh) 一种图像后处理方法、系统及终端设备
CN110234011B (zh) 一种视频压缩方法及系统
CN115550650A (zh) 一种有效调节参考帧图像压缩率的方法及装置、电子设备
CN111565314A (zh) 图像压缩方法、编解码网络训练方法、装置及电子设备
CN118176730A (zh) 解码方法、编码方法、解码器、编码器和编解码系统
CN111565317A (zh) 图像压缩方法、编解码网络训练方法、装置及电子设备
CN114501034B (zh) 基于离散高斯混合超先验和Mask的图像压缩方法及介质
CN118413675B (zh) 一种基于上下文渐进式三平面编码图像压缩算法及终端设备
JP7075012B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200124