CN113382243A - 图像压缩方法、装置、电子设备和存储介质 - Google Patents
图像压缩方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN113382243A CN113382243A CN202110655903.3A CN202110655903A CN113382243A CN 113382243 A CN113382243 A CN 113382243A CN 202110655903 A CN202110655903 A CN 202110655903A CN 113382243 A CN113382243 A CN 113382243A
- Authority
- CN
- China
- Prior art keywords
- image
- image generation
- generation network
- network
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000006835 compression Effects 0.000 title claims abstract description 108
- 238000007906 compression Methods 0.000 title claims abstract description 108
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000012549 training Methods 0.000 claims abstract description 81
- 238000005070 sampling Methods 0.000 claims description 41
- 238000003491 array Methods 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 16
- 238000006243 chemical reaction Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 9
- 230000009467 reduction Effects 0.000 abstract description 6
- 238000004891 communication Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/48—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Abstract
本发明提供一种图像压缩方法、装置、电子设备和存储介质,所述方法包括:给定一个图像生成网络和一个低行列数的二维多通道的随机数组,基于待压缩图像以及随机数组,对初始图像生成网络进行迭代训练,使生成网络产生的图像与目标图像逼近,最终确定图像生成网络的网络参数;将图像生成网络的网络参数以及随机数组作为待压缩图像的压缩信息表示。本发明基于待压缩图像以及随机数组,对初始图像生成网络进行迭代训练,从而使得训练得到的图像生成网络能够输出逼近待压缩图像的生成图像,并以图像生成网络的网络参数和随机数组作为待压缩图像的压缩信息表示,不仅使得待压缩图像能够以较大压缩程度进行压缩,并且能够保证图像的还原精度。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种图像压缩方法、装置、电子设备和存储介质。
背景技术
图像压缩是经典图像处理应用。传统图像压缩方法通常是在编码时将图像数据本身或数据在变换域的系数压缩保存,解码时根据系数利用反变换解压还原图像。
例如,传统的有损图像压缩方法是将图像(如JPEG或JPEG2000格式图像)去除部分色值信息,变换到频域或小波域,再去除部分变换域系数并改进编码方式,从而实现整体的压缩。该方法依赖于大量图像与人类视觉特征的先验知识与实验,涉及参数的预先训练和调优。同时,图像还原后的精度损失与压缩程度相关,即若要减小还原损失,则需要降低压缩程度,导致图像保存数据量大;若要减小图像保存数据量,则需要提高压缩程度,导致还原损失增大。
发明内容
本发明提供一种图像压缩方法、装置、电子设备和存储介质,用以解决现有技术中图像压缩依赖于先验知识且在图像压缩程度过高时图像还原损失较大的缺陷。
本发明提供一种图像压缩方法,包括:
确定待压缩图像,并给定一个初始图像生成网络和一个低行列数的多通道二维随机数组;
基于待压缩图像以及所述随机数组,对所述初始图像生成网络进行迭代训练,得到图像生成网络,并确定所述图像生成网络的网络参数;
将所述图像生成网络的网络参数以及所述随机数组作为所述待压缩图像的压缩信息表示。
根据本发明提供的一种图像压缩方法,还包括:
以分辨率相同的多个子图像对所述待压缩图像进行分割,所述多个子图像的分辨率给定,所述多个子图像所合成的区域大于或等于所述待压缩图像;其中,当所述多个子图像所合成的区域大于所述待压缩图像时,对所述多个子图像所合成的区域中未包含所述待压缩图像的部分进行随机填充。
根据本发明提供的一种图像压缩方法,所述基于所述待压缩图像以及所述随机数组,对所述初始图像生成网络进行迭代训练,包括:
将所述多个子图像中每一个子图像所对应的随机数组输入至所述初始图像生成网络,得到所述初始图像生成网络输出的所述随机数组对应的生成子图像;
基于每一个所述子图像以及所述对应的生成子图像,对所述初始图像生成网络进行迭代训练,以得到每一个所述子图像所对应的图像生成网络,并确定所述图像生成网络的网络参数。
根据本发明提供的一种图像压缩方法,所述将所述多个子图像中每一个子图像所对应的随机数组输入至所述初始图像生成网络,得到所述初始图像生成网络输出的所述随机数组对应的生成子图像,包括:
将每一个所述子图像所对应的随机数组输入至所述初始图像生成网络所包含的至少一个上采样层中的第一个上采样层,由所述至少一个上采样层对所述随机数组进行逐级上采样,依次得到至少一个更高行列数的多通道二维采样随机数组,所述至少一个采样随机数组中的最后一个采样随机数组的行列数与对应子图像的分辨率相同;
将所述最后一个采样随机数组输入至所述初始图像生成网络的图像转换层,得到所述图像转换层输出的所述随机数组对应的生成子图像。根据本发明提供的一种图像压缩方法,所述初始图像生成网络还包括位于每一个所述上采样层之后的自定义网络层。
根据本发明提供的一种图像压缩方法,在确定所述图像生成网络的网络参数,之后还包括:
以所述图像生成网络的网络参数更新所述初始图像生成网络的网络参数后,将所述随机数组输入至所述初始图像生成网络,得到所述初始图像生成网络输出的解压子图像;
对各解压子图像进行合并,得到所述待压缩图像。
根据本发明提供的一种图像压缩方法,所述初始图像生成网络的网络参数包括固定网络参数和训练网络参数,所述固定网络参数是预先设置的;
所述对初始图像生成网络进行迭代训练,包括:
仅对所述初始图像生成网络的训练网络参数进行迭代训练。
根据本发明提供的一种图像压缩方法,所述随机数组包括多个子数组;
所述基于所述待压缩图像以及所述随机数组,对所述初始图像生成网络进行迭代训练,得到图像生成网络,包括:
基于所述待压缩图像以及所述随机数组中的各子数组,分别对所述初始图像生成网络进行迭代训练,得到各子数组对应的图像生成子网络,并确定各图像生成子网络的损失函数值;
将迭代后最小损失函数值对应的图像生成子网络作为所述图像生成网络。
根据本发明提供的一种图像压缩方法,所述随机数组存储于数组数据库中;所述数组数据库中包括多个不同的随机数组,且各随机数组携带有对应的标签;
所述将所述图像生成网络的网络参数以及所述随机数组作为所述待压缩图像的压缩信息表示,包括:
将所述图像生成网络的网络参数以及所述随机数组对应的标签作为所述待压缩图像的压缩信息表示。
本发明还提供一种图像压缩装置,包括:
随机数生成单元,用于确定待压缩图像,并给定一个初始图像生成网络和一个低行列数的多通道二维随机数组;
训练单元,用于基于所述待压缩图像以及所述随机数组,对所述初始图像生成网络进行迭代训练,得到图像生成网络,并确定所述图像生成网络的网络参数;
压缩单元,用于将所述图像生成网络的网络参数以及所述随机数组作为所述待压缩图像的压缩信息表示。
本发明还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述图像压缩方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述图像压缩方法的步骤。
本发明提供的图像压缩方法、装置、电子设备和存储介质,基于待压缩图像以及随机数组,对初始图像生成网络进行迭代训练,从而使得训练得到的图像生成网络能够输出逼近待压缩图像的生成图像,并以图像生成网络的网络参数和随机数组作为待压缩图像的压缩信息表示,不仅使得待压缩图像能够以较大压缩程度进行压缩,并且能够保证图像的还原精度。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的图像压缩方法的流程示意图之一;
图2是本发明提供的图像压缩方法的流程示意图之二;
图3是本发明提供的图像压缩装置的结构示意图;
图4是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
传统图像压缩方法是在编码时将图像数据本身或数据在变换域的系数压缩保存,解码时根据系数利用反变换解压还原图像。以JPEG或JPEG2000压缩格式的有损图像压缩方法为例,传统压缩方法是将图像去除部分色值信息,变换到频域或小波域,再去除部分变换域系数并改进编码方式,从而实现整体的压缩。
然而,传统方法依赖于大量图像与人类视觉特征的先验知识与实验,涉及参数的预先训练和调优,不易设计。同时,图像还原后的精度损失与压缩程度相关,即若要减小还原损失,则需要降低压缩程度,导致图像保存数据量大;若要减小图像保存数据量,则需要提高压缩程度,导致还原损失增大。
对此,本发明提供一种图像压缩方法。图1是本发明提供的图像压缩方法的流程示意图,如图1所示,该方法包括如下步骤:
步骤110、确定待压缩图像,并给定一个初始图像生成网络和一个低行列数的多通道二维随机数组。
具体地,待压缩图像可能存在冗余数据,如图像中相邻像素间的相关性引起的空间冗余;图像序列中不同帧之间存在相关性引起的时间冗余;不同彩色平面或频谱带的相关性引起的频谱冗余等。若待压缩图像的数据量较大,则会影响图像的存储、传输、处理,因此需要去除待压缩图像中的多余数据,减少表示待压缩图像时需要的数据量,即对待压缩图像进行压缩处理,以便于图像后续存储、传输、处理等。其中,待压缩图像可以为RGB图像,图像格式可以为JPEG、JPEG2000等,本发明实施例对此不作具体限定。
在对待压缩图像进行压缩时,可以选择行列数小于待压缩图像分辨率的随机数组,作为待压缩图像对应的低行列数的多通道二维随机数组。例如,待压缩图像的分辨率为128×128,则选取的随机数组的维度可以为4×4。此外,初始图像生成网络是指预先定义的生成网络,其可以基于随机数组输出一个生成图像。
步骤120、基于待压缩图像以及随机数组,对初始图像生成网络进行迭代训练,得到图像生成网络,并确定图像生成网络的网络参数。
具体地,初始图像生成网络可以基于随机数组输出一个生成图像,将该生成图像作为训练样本,并将待压缩图像作为训练样本标签,对初始图像生成网络进行迭代训练,从而可以基于初始图像生成网络的损失函数值不断更新其网络参数。当损失函数值最小时,迭代训练完成,得到图像生成网络。由于图像生成网络的损失函数值最小,因此基于该图像生成网络得到的生成图像与待压缩图像最接近。需要说明的是,在设计初始图像生成网络时,初始图像生成网络的网络参数数量远远低于待压缩图像的像素个数,从而可以实现后续对待压缩图像的压缩。
步骤130、将图像生成网络的网络参数以及随机数组作为待压缩图像的压缩信息表示。
具体地,当将随机数组输入至图像生成网络后,可以得到生成图像,且生成图像与待压缩图像最接近。由于低行列数的多通道二维随机数组的行列数远小于待压缩图像的分辨率,即随机数组的数据量远小于待压缩图像的数据量,同时网络参数的数量远低于待压缩图像的像素个数,因此本发明实施将图像生成网络的网络参数以及随机数组作为待压缩图像的压缩信息表示,即可实现对待压缩图像的压缩。当需要还原图像时,以图像生成网络的网络参数更新初始图像生成网络的网络参数后,将随机数组输入初始图像生成网络中,即可得到原始图像(待压缩图像)。
可以理解的是,对于不同的待压缩图像,按照本发明实施例的方法,获取各待压缩图像对应的图像生成网络的网络参数和随机数组,即可灵活地对不同的待压缩图像进行压缩。
相较于传统方法中依赖于大量图像与人类视觉特征的先验知识和预训练,本发明实施例基于待压缩图像以及随机数组,对初始图像生成网络进行迭代训练,使得训练得到的图像生成网络能够输出逼近原始图像(待压缩图像)的生成图像,即本发明实施例提供的图像生成网络不依赖于大量的先验知识和预训练,能够简便且快捷实现对待压缩图像的压缩和还原。同时,还原图像的质量与图像生成网络的网络参数相关,与待压缩图像的压缩程度无关,从而本发明实施例在保证较高图像压缩程度的同时,还能保证图像的还原精度,即降低图像还原损失。
本发明实施例提供的图像压缩方法,基于待压缩图像以及随机数组,对初始图像生成网络进行迭代训练,从而使得训练得到的图像生成网络能够输出逼近待压缩图像的生成图像,并以图像生成网络的网络参数和随机数组作为待压缩图像的压缩信息表示,不仅使得待压缩图像能够以较大压缩程度进行压缩,并且能够保证图像的还原精度。
基于上述实施例,还包括:
以分辨率相同的多个子图像对待压缩图像进行分割,多个子图像的分辨率给定,多个子图像所合成的区域大于或等于待压缩图像;其中,当多个子图像所合成的区域大于待压缩图像时,对多个子图像所合成的区域中未包含待压缩图像的部分进行随机填充。
具体地,如图2所示,可以基于预设尺寸(如尺寸n×n)将待压缩图像分割为多个大小相同的子图像,则各子图像的分辨率为n×n。在将待压缩图像分割为多个子图像之后,基于子图像的分辨率,确定子图像对应的随机数组,其中,随机数组的行列数小于子图像的分辨率。
当多个子图像所合成的区域等于待压缩图像时,表明待压缩图像正好可以分割成分辨率相同的多个子图像;当多个子图像所合成的区域大于待压缩图像时,表明待压缩图像的分辨率不是子图像分辨率的整数倍,此时,需要将边缘处分辨率不足的子图像进行随机填充,以保证所有子图像的分辨率相同。
例如,若待压缩图像的分辨率为1024×1024,给定子图像的分辨率为128×128,则正好可以将待压缩图像分割为64个大小相同的子图像,且各子图像的分辨率为128×128,在确定各子图像后,则选取对应的随机数组的行列数可以为4×4,此时8个子图像所合成的区域分辨率等于待压缩图像的分辨率。若待压缩图像的分辨率为512×480,给定子图像的分辨率为128×128,此时若将待压缩图像分割为16个大小相同的子图像,且各子图像的分辨率为128×128,由于待压缩图像分辨率中480不是128的整数倍,导致16张子图像中存在4张子图像存在未包含待压缩图像的部分,从而需要对这4张子图像中未包含待压缩图像的部分进行随机填充。
基于上述任一实施例,基于待压缩图像以及随机数组,对初始图像生成网络进行迭代训练,包括:
将多个子图像中每一个子图像所对应的随机数组输入至初始图像生成网络,得到初始图像生成网络输出的随机数组对应的生成子图像;
基于每一个子图像以及生成子图像,对初始图像生成网络进行迭代训练,以得到每一个子图像所对应的图像生成网络,并确定图像生成网络的网络参数。
具体地,初始图像生成网络是指预先定义的生成网络,其可以基于子图像对应的随机数组输出对应的生成子图像,将该生成子图像作为训练样本,并将子图像作为训练样本标签,对初始图像生成网络进行迭代训练,从而可以基于初始图像生成网络的损失函数值不断更新其网络参数。当损失函数值最小时,迭代训练完成,得到每一个子图像对应的图像生成网络,并将图像生成网络的网络参数以及子图像对应的随机数组作为该子图像的压缩信息表示,从而可以将数据量较小的网络参数以及随机数组进行保存,若需要还原该子图像,只需要以迭代训练后的网络参数更新初始图像生成网络的网络参数后,将随机数组输入初始图像生成网络中,即可获取高质量的原始子图像。
基于上述任一实施例,将多个子图像中每一个子图像所对应的随机数组输入至初始图像生成网络,得到初始图像生成网络输出的随机数组对应的生成子图像,包括:
将每一个子图像对应的随机数组输入至初始图像生成网络所包含的至少一个上采样层中的第一个上采样层,由至少一个上采样层对随机数组进行逐级上采样,依次得到至少一个更高行列数的多通道二维采样随机数组,至少一个采样随机数组中的最后一个采样随机数组的行列数与对应子图像的分辨率相同;
将最后一个采样随机数组输入至初始图像生成网络的图像转换层,得到图像转换层输出的随机数组对应的生成子图像。
具体地,将每一个子图像对应的随机数组输入至初始图像生成网络所包含的至少一个上采样层中的第一个上采样层,由至少一个上采样层对随机数组进行逐级上采样,依次得到至少一个更高行列数的多通道二维采样随机数组,其中,至少一个采样随机数组中的最后一个采样随机数组的行列数与对应子图像的分辨率相同。然后将最后一个采样随机数组输入至初始图像生成网络的图像转换层,得到图像转换层输出的随机数组对应的生成图像,从而可以基于该生成图像和对应的子图像对初始图像生成网络进行迭代训练,获取压缩信息表示。
如图2所示,将子图像对应的随机数组Z输入至初始图像生成网络G中,首先初始图像生成网络G对随机数组Z进行上采样,直至得到的高行列数数组与子图像的分辨率度一致,然后经过最后一层图像转换层输出对应的生成图像,用于与子图像对初始图像生成网络进行迭代训练。其中,初始图像生成网络G可以包括若干层结构,每层结构包含一个上采样层和一个自定义网络层,自定义网络层可以采用EfficientNet的MBBlock模块深度神经网络,从而可以通过调节一个参数实现快速对网络进行调节。初始图像生成网络的最后一层除了包含一个上采样层和一个自定义网络层外,还包含一个图像转换层,从而可以实现参数空间到图像空间的转换,将高行列数度数组转换为生成图像,用于迭代训练。
基于上述任一实施例,初始图像生成网络还包括位于每一个上采样层之后的自定义网络层。
具体地,初始图像生成网络可以包括若干层结构,每层结构包含一个上采样层和位于上采样层之后的自定义网络层,自定义网络层可以采用EfficientNet的MBBlock模块深度神经网络,从而可以通过调节一个参数实现快速对网络进行调节。
基于上述任一实施例,在确定图像生成网络的网络参数,之后还包括:
以图像生成网络的网络参数更新初始图像生成网络的网络参数后,将随机数组输入至初始图像生成网络,得到初始图像生成网络输出的解压子图像;
对各解压子图像进行合并,得到待压缩图像。
具体地,在确定图像生成网络的网络参数之后,可以保存图像生成网络的网络参数以及对应的随机数组,当需要获取原始的子图像(即解压子图像)时,只需要调出存储的图像生成网络的网络参数以及对应的随机数组,并以图像生成网络的网络参数更新初始图像生成网络的网络参数,进而再将随机数组输入至初始图像生成网络之后,可以得到解压子图像,实现高精度还原图像。同时,本发明实施例在获取解压子图像时,也不需要对初始图像生成网络重新训练,只需要更新初始图像生成网络的网络参数即可,大幅度提高了图像的还原效率。
基于上述任一实施例,初始图像生成网络的网络参数包括固定网络参数和训练网络参数,固定网络参数是预先设置的;
对初始图像生成网络进行迭代训练,包括:
仅对初始图像生成网络的训练网络参数进行迭代训练。
具体地,初始图像生成网络的网络参数可能包含大量的参数,如不包含固定网络参数和训练网络参数,其中固定网络参数在训练过程中是固定值,可以根据实验情况设置;训练网络参数在训练过程中是变量。
由于待压缩图像是以图像生成网络的网络参数和随机数组作为压缩信息表示,因此图像生成网络的网络参数中数据量的大小可以用来衡量图像压缩率(压缩率=图像压缩后的大小/图像压缩前的大小),即网络参数数据量越小,对应的图像压缩率越小,压缩程度越高。
因此,为了进一步减小图像压缩率,本发明实施例仅对初始图像生成网络的训练网络参数进行迭代训练,而不对固定网络参数进行迭代训练,从而以训练网络参数和随机数组作为图像的压缩信息表示,减小了网络参数数据量,进而减小了图像压缩率。
基于上述任一实施例,随机数组包括多个子数组;
基于待压缩图像以及随机数组,对初始图像生成网络进行迭代训练,得到图像生成网络,包括:
基于待压缩图像以及随机数组中的各子数组,分别对初始图像生成网络进行迭代训练,得到各子数组对应的图像生成子网络,并确定各图像生成子网络的损失函数值;
将迭代后最小损失函数值对应的图像生成子网络作为图像生成网络。
具体地,随机数组包括多个数子组,即针对一个待压缩图像,可以确定多个子数组,并基于待压缩图像以及随机数组中的各子数组,分别对初始图像生成网络进行迭代训练,得到各子数组对应的图像生成子网络,并确定各图像生成子网络的损失函数值,将最小损失函数值对应的图像生成子网络作为图像生成网络,同时以对应的子数组和图像生成网络的网络参数作为待压缩图像的压缩信息表示。
由此可见,本发明实施例选取多个子数组进行迭代训练,并将最小损失函数对应的子数组作为压缩信息表示,即从多个子数组中筛选出最优的子数组进行压缩信息表示,从而能够高精度高质量还原待压缩图像。
基于上述任一实施例,随机数组存储于数组数据库中;数组数据库中包括多个不同的随机数组,且各随机数组携带有对应的标签;
将图像生成网络的网络参数以及随机数组作为待压缩图像的压缩信息表示,包括:
将图像生成网络的网络参数以及随机数组对应的标签作为待压缩图像的压缩信息表示。
具体地,随机数组可以存储于数组数据库中,同时各随机数组携带有对应的标签,即标签与各随机数组存在映射关系,基于标签可以快速获取对应的随机数组。因此,在获取图像生成网络的网络参数之后,可以将该网络参数和随机数组对应的标签作为压缩信息表示,从而可以进一步减小压缩信息表示的数据量,降低压缩率。
例如,本发明实施例可以在编码器中预先定义几组随机数组,并对各随机数组进行编号,编码时,随机产生编号,选取对应随机数组,在确定图像生成网络的网络参数之后,保存该网络参数以及随机数组对应的编号即可,从而可以进一步降低压缩率。
下面对本发明提供的图像压缩装置进行描述,下文描述的图像压缩装置与上文描述的图像压缩方法可相互对应参照。
基于上述任一实施例,本发明提供一种图像压缩装置,如图3所示,该装置包括:
随机数生成单元310,将所述待压缩图像分割为多个子图像,子图像的分辨率给定,多余的部分可以随机填充成分辨率相同的子图;给定一个初始图像生成网络和一个低行列数的二维多通道的随机数组。
训练单元320,用于基于所述待压缩图像以及所述随机数组,对初始图像生成网络进行迭代训练,得到图像生成网络,并确定所述图像生成网络的网络参数;
压缩单元330,用于将所述图像生成网络的网络参数以及所述随机数组作为所述待压缩图像的压缩信息表示。
基于上述任一实施例,还包括:
分割单元,用于以分辨率相同的多个子图像对所述待压缩图像进行分割,所述多个子图像的分辨率给定,所述多个子图像所合成的区域大于或等于所述待压缩图像;其中,当所述多个子图像所合成的区域大于所述待压缩图像时,对所述多个子图像所合成的区域中未包含所述待压缩图像的部分进行随机填充。
基于上述任一实施例,所述训练单元320,包括:
生成单元,用于将所述多个子图像中每一个子图像所对应的随机数组输入至所述初始图像生成网络,得到所述初始图像生成网络输出的所述随机数组对应的生成子图像;
迭代单元,用于基于每一个所述子图像以及所述对应的生成子图像,对所述初始图像生成网络进行迭代训练,以得到每一个所述子图像所对应的图像生成网络,并确定所述图像生成网络的网络参数。
基于上述任一实施例,所述生成单元,包括:
上采样单元,用于将每一个所述子图像所对应的随机数组输入至所述初始图像生成网络所包含的至少一个上采样层中的第一个上采样层,由所述至少一个上采样层对所述随机数组进行逐级上采样,依次得到至少一个更高行列数的多通道二维采样随机数组,所述至少一个采样随机数组中的最后一个采样随机数组的行列数与对应子图像的分辨率相同;
转换单元,用于将最后一个采样随机数组输入至所述初始图像生成网络的图像转换层,得到所述图像转换层输出的所述随机数组对应的生成子图像。
基于上述任一实施例,所述初始图像生成网络还包括位于每一个所述上采样层之后的自定义网络层。
基于上述任一实施例,还包括:
解压单元,用于在确定所述图像生成网络的网络参数之后,以所述图像生成网络的网络参数更新所述初始图像生成网络的网络参数后,将所述随机数组输入至所述初始图像生成网络,得到所述初始图像生成网络输出的解压子图像;
合并单元,用于对各解压子图像进行合并,得到所述待压缩图像。
基于上述任一实施例,所述初始图像生成网络的网络参数包括固定网络参数和训练网络参数,所述固定网络参数是预先设置的;
所述训练单元320,用于:
仅对所述初始图像生成网络的训练网络参数进行迭代训练。
基于上述任一实施例,所述随机数组包括多个子数组;
所述训练单元320,包括:
子网络训练单元,用于基于所述待压缩图像以及所述随机数组中的各子数组,分别对初始图像生成网络进行迭代训练,得到各子数组对应的图像生成子网络,并确定各图像生成子网络的损失函数值;
筛选单元,用于将迭代后最小损失函数值对应的图像生成子网络作为所述图像生成网络。
基于上述任一实施例,所述随机数组存储于数组数据库中;所述数组数据库中包括多个不同的随机数组,且各随机数组携带有对应的标签;
所述压缩单元330,用于:将所述图像生成网络的网络参数以及所述随机数组对应的标签作为所述待压缩图像的压缩信息表示。
图4是本发明提供的电子设备的结构示意图,如图4所示,该电子设备可以包括:处理器(processor)410、存储器(memory)420、通信接口(CommunicationsInterface)430和通信总线440,其中,处理器410,存储器420,通信接口430通过通信总线440完成相互间的通信。处理器410可以调用存储器420中的逻辑指令,以执行图像压缩方法,该方法包括:确定待压缩图像,并给定一个初始图像生成网络和一个低行列数的多通道二维随机数组;基于所述待压缩图像以及所述随机数组,对所述初始图像生成网络进行迭代训练,得到图像生成网络,并确定所述图像生成网络的网络参数;将所述图像生成网络的网络参数以及所述随机数组作为所述待压缩图像的压缩信息表示。
此外,上述的存储器420中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的图像压缩方法,该方法包括:确定待压缩图像,并给定一个初始图像生成网络和一个低行列数的多通道二维随机数组;基于所述待压缩图像以及所述随机数组,对所述初始图像生成网络进行迭代训练,得到图像生成网络,并确定所述图像生成网络的网络参数;将所述图像生成网络的网络参数以及所述随机数组作为所述待压缩图像的压缩信息表示。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的图像压缩方法,该方法包括:确定待压缩图像,并给定一个初始图像生成网络和一个低行列数的多通道二维随机数组;基于所述待压缩图像以及所述随机数组,对所述初始图像生成网络进行迭代训练,得到图像生成网络,并确定所述图像生成网络的网络参数;将所述图像生成网络的网络参数以及所述随机数组作为所述待压缩图像的压缩信息表示。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (12)
1.一种图像压缩方法,其特征在于,包括:
确定待压缩图像,并给定一个初始图像生成网络和一个低行列数的多通道二维随机数组;
基于所述待压缩图像以及所述随机数组,对所述初始图像生成网络进行迭代训练,得到图像生成网络,并确定所述图像生成网络的网络参数;
将所述图像生成网络的网络参数以及所述随机数组作为所述待压缩图像的压缩信息表示。
2.根据权利要求1所述的图像压缩方法,其特征在于,还包括:
以分辨率相同的多个子图像对所述待压缩图像进行分割,所述多个子图像的分辨率给定,所述多个子图像所合成的区域大于或等于所述待压缩图像;其中,当所述多个子图像所合成的区域大于所述待压缩图像时,对所述多个子图像所合成的区域中未包含所述待压缩图像的部分进行随机填充。
3.根据权利要求2所述的图像压缩方法,其特征在于,所述基于所述待压缩图像以及所述随机数组,对所述初始图像生成网络进行迭代训练,包括:
将所述多个子图像中每一个子图像所对应的随机数组输入至所述初始图像生成网络,得到所述初始图像生成网络输出的所述随机数组对应的生成子图像;
基于每一个所述子图像以及所述对应的生成子图像,对所述初始图像生成网络进行迭代训练,以得到每一个所述子图像所对应的图像生成网络,并确定所述图像生成网络的网络参数。
4.根据权利要求3所述的图像压缩方法,其特征在于,所述将所述多个子图像中每一个子图像所对应的随机数组输入至所述初始图像生成网络,得到所述初始图像生成网络输出的所述随机数组对应的生成子图像,包括:
将每一个所述子图像所对应的随机数组输入至所述初始图像生成网络所包含的至少一个上采样层中的第一个上采样层,由所述至少一个上采样层对所述随机数组进行逐级上采样,依次得到至少一个更高行列数的多通道二维采样随机数组,所述至少一个采样随机数组中的最后一个采样随机数组的行列数与对应子图像的分辨率相同;
将所述最后一个采样随机数组输入至所述初始图像生成网络的图像转换层,得到所述图像转换层输出的所述随机数组对应的生成子图像。
5.根据权利要求4所述的图像压缩方法,其特征在于,所述初始图像生成网络还包括位于每一个所述上采样层之后的自定义网络层。
6.根据权利要求3所述的图像压缩方法,其特征在于,在确定所述图像生成网络的网络参数,之后还包括:
以所述图像生成网络的网络参数更新所述初始图像生成网络的网络参数后,将所述随机数组输入至所述初始图像生成网络,得到所述初始图像生成网络输出的解压子图像;
对各解压子图像进行合并,得到所述待压缩图像。
7.根据权利要求1至6任一项所述的图像压缩方法,其特征在于,所述初始图像生成网络的网络参数包括固定网络参数和训练网络参数,所述固定网络参数是预先设置的;
所述对所述初始图像生成网络进行迭代训练,包括:
仅对所述初始图像生成网络的所述训练网络参数进行迭代训练。
8.根据权利要求1至6任一项所述的图像压缩方法,其特征在于,所述随机数组包括多个子数组;
所述基于所述待压缩图像以及所述随机数组,对所述初始图像生成网络进行迭代训练,得到图像生成网络,包括:
基于所述待压缩图像以及所述随机数组中的各子数组,分别对所述初始图像生成网络进行迭代训练,得到各子数组对应的图像生成子网络,并确定各图像生成子网络的损失函数值;
将迭代后最小损失函数值对应的图像生成子网络作为所述图像生成网络。
9.根据权利要求1至6任一项所述的图像压缩方法,其特征在于,所述随机数组存储于数组数据库中;所述数组数据库中包括多个不同的随机数组,且各随机数组携带有对应的标签;
所述将所述图像生成网络的网络参数以及所述随机数组作为所述待压缩图像的压缩信息表示,包括:
将所述图像生成网络的网络参数以及所述随机数组对应的标签作为所述待压缩图像的压缩信息表示。
10.一种图像压缩装置,其特征在于,包括:
随机数生成单元,用于确定待压缩图像,并给定一个初始图像生成网络和一个低行列数的多通道二维随机数组;
训练单元,用于基于所述待压缩图像以及所述随机数组,对所述初始图像生成网络进行迭代训练,得到图像生成网络,并确定所述图像生成网络的网络参数;
压缩单元,用于将所述图像生成网络的网络参数以及所述随机数组作为所述待压缩图像的压缩信息表示。
11.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至9任一项所述图像压缩方法的步骤。
12.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至9任一项所述图像压缩方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110655903.3A CN113382243B (zh) | 2021-06-11 | 2021-06-11 | 图像压缩方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110655903.3A CN113382243B (zh) | 2021-06-11 | 2021-06-11 | 图像压缩方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113382243A true CN113382243A (zh) | 2021-09-10 |
CN113382243B CN113382243B (zh) | 2022-11-01 |
Family
ID=77574146
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110655903.3A Active CN113382243B (zh) | 2021-06-11 | 2021-06-11 | 图像压缩方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113382243B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108846355A (zh) * | 2018-06-11 | 2018-11-20 | 腾讯科技(深圳)有限公司 | 图像处理方法、人脸识别方法、装置和计算机设备 |
CN109996073A (zh) * | 2019-02-26 | 2019-07-09 | 山东师范大学 | 一种图像压缩方法、系统、可读存储介质及计算机设备 |
CN111563841A (zh) * | 2019-11-13 | 2020-08-21 | 南京信息工程大学 | 一种基于生成对抗网络的高分辨率图像生成方法 |
-
2021
- 2021-06-11 CN CN202110655903.3A patent/CN113382243B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108846355A (zh) * | 2018-06-11 | 2018-11-20 | 腾讯科技(深圳)有限公司 | 图像处理方法、人脸识别方法、装置和计算机设备 |
CN109996073A (zh) * | 2019-02-26 | 2019-07-09 | 山东师范大学 | 一种图像压缩方法、系统、可读存储介质及计算机设备 |
CN111563841A (zh) * | 2019-11-13 | 2020-08-21 | 南京信息工程大学 | 一种基于生成对抗网络的高分辨率图像生成方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113382243B (zh) | 2022-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4718609B2 (ja) | 多次元デジタル信号のフィルタリング方法及び装置、並びに、関連する符号化/復号化方法及び装置 | |
JP2004532577A (ja) | 非直交基本関数を用いて色画像を効率的に符号化する方法および装置 | |
CN112906874B (zh) | 卷积神经网络特征图数据压缩方法及装置 | |
KR20210094054A (ko) | 데이터 어레이들의 비트 평면 인코딩 | |
US8249372B2 (en) | Methods and devices for coding and decoding multidimensional digital signals | |
US20040096117A1 (en) | Vector quantization of images | |
CN110650339A (zh) | 一种视频压缩方法、装置及终端设备 | |
US8045824B2 (en) | Wavelet transformation-based image encoder, decoder and method for generating thumbnail image | |
CN117939172A (zh) | 图像处理方法及系统、解压缩方法、设备及介质 | |
CN113382243B (zh) | 图像压缩方法、装置、电子设备和存储介质 | |
Thakker et al. | Lossy Image Compression-A Comparison Between Wavelet Transform, Principal Component Analysis, K-Means and Autoencoders | |
JPH02131621A (ja) | ディジタル信号の適応符号化方法 | |
US6633679B1 (en) | Visually lossless still image compression for CMYK, CMY and Postscript formats | |
US20200336751A1 (en) | Resilient image compression and decompression | |
JP3833224B2 (ja) | 符号化方法及び装置、並びにコンピュータプログラム及びコンピュータ可読記憶媒体 | |
Zhou et al. | Efficient network removing feature redundancy for single image super-resolution | |
JP2017525185A (ja) | ウェーブレット変換行列に適応可能な高精度化及び量子化方法 | |
CA2964019C (en) | Method for encoding a matrix, in particular a matrix representative of a still or video image, using a wavelet transform | |
CN118264818A (zh) | 图像压缩方法、装置、设备及存储介质 | |
RU2500067C2 (ru) | Способ сжатия изображения | |
Ayadi et al. | A FPGA-based implementation of JPEG encoder | |
CN116916033B (zh) | 一种基于随机自适应傅里叶分解的联合时空视频压缩方法 | |
Abdulrazzaq et al. | The multi-quantization process with matrix size reduction is applied to compress images with strip structure light that is commonly used in 3D reconstructions | |
CN112927146A (zh) | 压缩图像复原方法、装置、设备和存储介质 | |
Kamatar et al. | Image Compression Using Mapping Transform with Pixel Elimination |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address | ||
CP03 | Change of name, title or address |
Address after: 201114 room 1302, 13 / F, building 16, 2388 Chenhang Road, Minhang District, Shanghai Patentee after: Shanghai Bi Ren Technology Co.,Ltd. Country or region after: China Address before: 201114 room 1302, 13 / F, building 16, 2388 Chenhang Road, Minhang District, Shanghai Patentee before: Shanghai Bilin Intelligent Technology Co.,Ltd. Country or region before: China |