CN114501011A - 图像压缩方法、图像解压缩方法及装置 - Google Patents

图像压缩方法、图像解压缩方法及装置 Download PDF

Info

Publication number
CN114501011A
CN114501011A CN202210163126.5A CN202210163126A CN114501011A CN 114501011 A CN114501011 A CN 114501011A CN 202210163126 A CN202210163126 A CN 202210163126A CN 114501011 A CN114501011 A CN 114501011A
Authority
CN
China
Prior art keywords
feature
channel
feature map
determining
compression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210163126.5A
Other languages
English (en)
Other versions
CN114501011B (zh
Inventor
何岱岚
杨孜名
王岩
秦红伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sensetime Technology Development Co Ltd
Original Assignee
Beijing Sensetime Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sensetime Technology Development Co Ltd filed Critical Beijing Sensetime Technology Development Co Ltd
Priority to CN202210163126.5A priority Critical patent/CN114501011B/zh
Publication of CN114501011A publication Critical patent/CN114501011A/zh
Priority to PCT/CN2022/100500 priority patent/WO2023159820A1/zh
Application granted granted Critical
Publication of CN114501011B publication Critical patent/CN114501011B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本公开提供了一种图像压缩方法、图像解压缩方法及装置,其中,图像压缩方法包括:获取目标图像,并对目标图像进行特征提取,得到包含多个通道的第一特征图;对第一特征图的通道进行分组处理,得到多个第二特征图;对第二特征图进行空间上下文特征提取,确定第二特征图对应的第一空间冗余特征;以及对第二特征图进行通道上下文特征提取,确定第二特征图对应的第一通道冗余特征;基于各第二特征图对应的第一空间冗余特征和第一通道冗余特征,确定各第二特征图分别对应的压缩信息;根据各第二特征图分别对应的压缩信息,确定目标图像对应的第一压缩数据,以及基于第一特征图进行深度压缩处理,确定目标图像对应的第二压缩数据。

Description

图像压缩方法、图像解压缩方法及装置
技术领域
本公开涉及图像处理技术领域,具体而言,涉及一种图像压缩方法、图像解压缩方法及装置。
背景技术
图像压缩是指以较少的比特有损或无损地表示原来的像素矩阵的技术,也称为图像编码。图像数据之所以能被压缩,是因为数据中存在着冗余。图像数据的冗余表现为图像中相邻像素点间的相关性引起的空间冗余等,图像压缩的目标就是通过去除这些冗余来减少表示图像数据时所需的比特数。由于图像数据量的庞大,在存储、传输、处理时较为困难,因此,如何进行图像压缩成为了该领域内亟待解决的问题。
发明内容
本公开实施例至少提供一种图像压缩方法、图像解压缩方法及装置。
第一方面,本公开实施例提供了一种图像压缩方法,包括:
获取目标图像,并对所述目标图像进行特征提取,得到包含多个通道的第一特征图;
对所述第一特征图的通道进行分组处理,得到多个第二特征图;
对所述第二特征图进行空间上下文特征提取,确定所述第二特征图对应的第一空间冗余特征;以及对所述第二特征图进行通道上下文特征提取,确定所述第二特征图对应的第一通道冗余特征;
基于各第二特征图对应的第一空间冗余特征和第一通道冗余特征,确定各所述第二特征图分别对应的压缩信息;
根据各所述第二特征图分别对应的压缩信息,确定所述目标图像对应的第一压缩数据,以及基于所述第一特征图进行深度压缩处理,确定所述目标图像对应的第二压缩数据,所述第一压缩数据和所述第二压缩数据构成所述目标图像对应的目标压缩结果。
这样,通过对进行特征提取后得到的第一特征图进行分组处理,得到多个第二特征图,并通过对所述第二特征图进行空间上下文特征提取和通道上下文特征提取,可以同时对所述第二特征图进行空间冗余压缩和通道冗余压缩,由此可以提高所述目标图像的压缩编码率;之后再基于第一空间冗余特征和第一通道冗余特征进行图像压缩,降低了目标图像对应的目标压缩结果的尺寸。
一种可能的实施方式中,在得到所述第一特征图之后,所述方法还包括:
对所述第一特征图进行量化处理;
所述对所述第一特征图的通道进行分组处理,得到多个第二特征图,包括:
基于预设的多个目标通道个数对经过量化处理的所述第一特征图的通道进行分组处理,得到多个预设分组,每个预设分组的通道值构成一个第二特征图;其中,各第二特征图所包含的通道个数不完全相同。
这样,通过多个目标通道个数对所述第一特征图进行非均匀分组,可以使得分组处理后的各第二特征图中包含的目标图像的语义信息相近,从而提高所述目标图像的编码压缩率;另一方面,相较于对所述第一特征图进行均匀分组,需要更少的分组数,从而可以提高后续分组运算时的计算速度,从而提高对所述目标图像的压缩效率。
一种可能的实施方式中,所述对所述第二特征图进行空间上下文特征提取,确定所述第二特征图对应的第一空间冗余特征,包括:
针对任一所述第二特征图,基于空间上下文模型依次确定该第二特征图的各通道分别对应的第一空间冗余特征;该第二特征图的各通道分别对应的第一空间冗余特征构成该第二特征图对应的第一空间冗余特征。
一种可能的实施方式中,所述方法还包括根据以下方法确定第二特征图的各通道对应的第一空间冗余特征:
针对任一第二特征图的任一通道,将该通道之前的通道的通道值输入至所述空间上下文模型,确定该通道对应的第一空间冗余特征;
任一第二特征图的第一个通道对应的第一空间冗余特征为空。
这样,通过将该通道之前的通道的通道值输入至空间上下文模型,可以确定该通道与之前各通道的空间冗余,从而能够更好的进行图像压缩,提高图像的编码压缩率。
一种可能的实施方式中,所述对所述第二特征图进行通道上下文特征提取,确定所述第二特征图对应的第一通道冗余特征,包括:
针对第N+1个第二特征图,将前N个第二特征图输入至通道自回归模型,确定第N+1个第二特征图对应的第一通道冗余特征;其中,N为正整数,第一个第二特征图的第一通道冗余特征为空,第N+1个第二特征图的通道在所述第一特征图中的通道编号大于前N个第二特征图的通道编号。
这样,通过将该第二特征图之前的第二特征图输入至通道自回归模型,可以确定该第二特征图与之前各第二特征图的通道冗余,从而能够更好的进行图像压缩,提高图像的编码压缩率。
一种可能的实施方式中,所述基于各第二特征图对应的第一空间冗余特征和第一通道冗余特征,确定各所述第二特征图分别对应的压缩信息,包括:
确定与所述目标图像对应的编码概率特征;
针对任一第二特征图,基于该第二特征图对应的第一空间冗余特征、第一通道冗余特征以及所述编码概率特征,确定该第二特征图对应的压缩信息。
这样,由于所述编码概率特征能够辅助所述目标图像进行熵编码,因此通过将所述编码概率特征添加至所述目标图像对应的压缩信息中,可以进一步的提高所述目标图像的编码压缩率。
一种可能的实施方式中,所述确定与所述目标图像对应的编码概率特征,包括:
基于先验编码器对所述第一特征图进行编码处理,得到所述目标图像对应的第三特征图;
对所述第三特征图进行量化处理,并基于先验解码器对量化处理后的所述第三特征图进行解码处理,得到所述编码概率特征。
一种可能的实施方式中,所述基于所述第一特征图进行深度压缩处理,确定所述目标图像对应的第二压缩数据,包括:
在基于所述第一特征图得到量化处理后的第三特征图后,将量化处理后的第三特征图输入至第一熵编码模型,得到所述第一熵编码模型输出的第二压缩数据。
这样,通过将量化处理后的第三特征图输入至熵编码模型,得到第二压缩数据,使得在图像解压缩过程中可以通过对所述第二压缩数据进行解压缩处理,得到用于辅助图像解压缩的编码概率特征。
一种可能的实施方式中,所述针对任一第二特征图,基于该第二特征图对应的第一空间冗余特征、第一通道冗余特征以及所述编码概率特征,确定该第二特征图对应的压缩信息,包括:
对所述第一空间冗余特征、第一通道冗余特征以及编码概率特征进行拼接处理,得到拼接处理后的目标张量;
基于参数生成网络对所述目标张量进行特征提取,生成该第二特征图对应的压缩信息。
这样,通过对所述第一空间冗余特征、第一通道冗余特征以及编码概率特征进行拼接处理,并基于参数生成网络对拼接处理后得到的目标张量进行特征提取,使得得到的第二特征图对应的压缩信息中包含了目标图像在多个维度下的压缩信息,从而可以提高所述目标图像的压缩编码率。
一种可能的实施方式中,所述根据各所述第二特征图分别对应的压缩信息,确定所述目标图像对应的第一压缩数据,包括:
将所述第一特征图和各第二特征图分别对应的压缩信息输出至第二熵编码模型,得到所述第二熵编码模型输出的第一压缩数据。
第二方面,本公开实施例提供了一种图像解压缩方法,包括:
获取基于第一方面任一所述的方法压缩得到的目标压缩结果;
对所述目标压缩结果进行解码,得到所述目标图像。
一种可能的实施方式中,所述对所述目标压缩结果进行解码,得到所述目标图像,包括:
对所述目标压缩结果进行第一解码处理,得到多个第二特征图;
将所述多个第二特征图的通道进行拼接,得到第一特征图;
对所述第一特征图进行第二解码处理,得到所述目标图像。
一种可能的实施方式中,所述对所述目标压缩结果进行第一解码处理,得到多个第二特征图,包括:
对所述目标压缩结果中的第二压缩数据进行解码处理,得到目标图像对应的编码概率特征;
针对待解压缩的第M+1个通道,对已解压缩的前M个通道的取值进行空间上下文特征提取和通道上下文特征提取,确定所述第M+1个通道对应的压缩信息;其中,第一个通道的压缩信息是基于所述编码概率特征确定的;
基于第M+1个通道对应的压缩信息对所述目标压缩结果中的第一压缩数据进行解码处理,确定第M+1个通道的取值;其中,属于同一预设分组的各通道的取值构成一个第二特征图。
一种可能的实施方式中,所述对所述目标压缩结果中的第二压缩数据进行解码处理,得到目标图像对应的编码概率特征,包括:
将所述第二压缩数据输入至第一熵解码模型,得到所述第一熵解码模型输出的第四特征图;
对所述第四特征图进行解码处理,得到所述编码概率特征。
一种可能的实施方式中,所述第M+1个通道属于第K个预设分组;其中,K为正整数;
所述针对待解压缩的第M+1个通道,对已解压缩的前M个通道的取值进行空间上下文特征提取和通道上下文特征提取,确定所述第M+1个通道对应的压缩信息,包括:
对所述第K个预设分组中通道编号小于M+1的通道值进行空间上下文特征提取,确定所述第M+1个通道对应的第二空间冗余特征;以及对前K-1个预设分组对应的第二特征图进行通道上下文特征提取,确定所述第M+1个通道对应的第二通道冗余特征;
基于所述第二空间冗余特征、所述第二通道冗余特征和所述编码概率特征,确定所述第M+1个通道对应的压缩信息。
一种可能的实施方式中,所述基于第M+1个通道对应的压缩信息对所述目标压缩结果中的第一压缩数据进行解码处理,确定第M+1个通道的取值,包括:
将所述第M+1个通道对应的压缩信息和所述第一压缩数据输入至第二熵解码模型,确定第M+1个通道的取值。
第三方面,本公开实施例还提供一种图像压缩装置,包括:
获取模块,用于获取目标图像,并对所述目标图像进行特征提取,得到包含多个通道的第一特征图;
分组模块,用于对所述第一特征图的通道进行分组处理,得到多个第二特征图;
特征提取模块,用于对所述第二特征图进行空间上下文特征提取,确定所述第二特征图对应的第一空间冗余特征;以及对所述第二特征图进行通道上下文特征提取,确定所述第二特征图对应的第一通道冗余特征;
第一确定模块,用于基于各第二特征图对应的第一空间冗余特征和第一通道冗余特征,确定各所述第二特征图分别对应的压缩信息;
第二确定模块,用于根据各所述第二特征图分别对应的压缩信息,确定所述目标图像对应的第一压缩数据,以及基于所述第一特征图进行深度压缩处理,确定所述目标图像对应的第二压缩数据,所述第一压缩数据和所述第二压缩数据构成所述目标图像对应的目标压缩结果。
一种可能的实施方式中,在得到所述第一特征图之后,所述获取模块还用于:
对所述第一特征图进行量化处理;
所述分组模块,在对所述第一特征图的通道进行分组处理,得到多个第二特征图时,用于:
基于预设的多个目标通道个数对经过量化处理的所述第一特征图的通道进行分组处理,得到多个预设分组,每个预设分组的通道值构成一个第二特征图;其中,各第二特征图所包含的通道个数不完全相同。
一种可能的实施方式中,所述特征提取模块,在对所述第二特征图进行空间上下文特征提取,确定所述第二特征图对应的第一空间冗余特征时,用于:
针对任一所述第二特征图,基于空间上下文模型依次确定该第二特征图的各通道分别对应的第一空间冗余特征;该第二特征图的各通道分别对应的第一空间冗余特征构成该第二特征图对应的第一空间冗余特征。
一种可能的实施方式中,所述特征提取模块还用于根据以下步骤确定第二特征图的各通道对应的第一空间冗余特征:
针对任一第二特征图的任一通道,将该通道之前的通道的通道值输入至所述空间上下文模型,确定该通道对应的第一空间冗余特征;
任一第二特征图的第一个通道对应的第一空间冗余特征为空。
一种可能的实施方式中,所述特征提取模块,在对所述第二特征图进行通道上下文特征提取,确定所述第二特征图对应的第一通道冗余特征时,用于:
针对第N+1个第二特征图,将前N个第二特征图输入至通道自回归模型,确定第N+1个第二特征图对应的第一通道冗余特征;其中,N为正整数,第一个第二特征图的第一通道冗余特征为空,第N+1个第二特征图的通道在所述第一特征图中的通道编号大于前N个第二特征图的通道编号。
一种可能的实施方式中,所述第一确定模块,在基于各第二特征图对应的第一空间冗余特征和第一通道冗余特征,确定各所述第二特征图分别对应的压缩信息时,用于:
确定与所述目标图像对应的编码概率特征;
针对任一第二特征图,基于该第二特征图对应的第一空间冗余特征、第一通道冗余特征以及所述编码概率特征,确定该第二特征图对应的压缩信息。
一种可能的实施方式中,所述第一确定模块,在确定与所述目标图像对应的编码概率特征时,用于:
基于先验编码器对所述第一特征图进行编码处理,得到所述目标图像对应的第三特征图;
对所述第三特征图进行量化处理,并基于先验解码器对量化处理后的所述第三特征图进行解码处理,得到所述编码概率特征。
一种可能的实施方式中,所述第二确定模块,在基于所述第一特征图进行深度压缩处理,确定所述目标图像对应的第二压缩数据时,用于:
在基于所述第一特征图得到量化处理后的第三特征图后,将量化处理后的第三特征图输入至第一熵编码模型,得到所述第一熵编码模型输出的第二压缩数据。
一种可能的实施方式中,所述第一确定模块,在针对任一第二特征图,基于该第二特征图对应的第一空间冗余特征、第一通道冗余特征以及所述编码概率特征,确定该第二特征图对应的压缩信息时,用于:
对所述第一空间冗余特征、第一通道冗余特征以及编码概率特征进行拼接处理,得到拼接处理后的目标张量;
基于参数生成网络对所述目标张量进行特征提取,生成该第二特征图对应的压缩信息。
一种可能的实施方式中,所述第二确定模块,在根据各所述第二特征图分别对应的压缩信息,确定所述目标图像对应的第一压缩数据时,用于:
将所述第一特征图和各第二特征图分别对应的压缩信息输出至第二熵编码模型,得到所述第二熵编码模型输出的第一压缩数据。
第四方面,本公开实施例还提供一种图像解压缩装置,包括:
第二获取模块,用于获取基于第一方面中任一所述的方法压缩得到的目标压缩结果;
解码模块,用于对所述目标压缩结果进行解码,得到所述目标图像。
一种可能的实施方式中,所述解码模块,在对所述目标压缩结果进行解码,得到所述目标图像时,用于:
对所述目标压缩结果进行第一解码处理,得到多个第二特征图;
将所述多个第二特征图的通道进行拼接,得到第一特征图;
对所述第一特征图进行第二解码处理,得到所述目标图像。
一种可能的实施方式中,所述解码模块,在对所述目标压缩结果进行第一解码处理,得到多个第二特征图时,用于:
对所述目标压缩结果中的第二压缩数据进行解码处理,得到目标图像对应的编码概率特征;
针对待解压缩的第M+1个通道,对已解压缩的前M个通道的取值进行空间上下文特征提取和通道上下文特征提取,确定所述第M+1个通道对应的压缩信息;其中,第一个通道的压缩信息是基于所述编码概率特征确定的;
基于第M+1个通道对应的压缩信息对所述目标压缩结果中的第一压缩数据进行解码处理,确定第M+1个通道的取值;其中,属于同一预设分组的各通道的取值构成一个第二特征图。
一种可能的实施方式中,所述解码模块,在对所述目标压缩结果中的第二压缩数据进行解码处理,得到目标图像对应的编码概率特征时,用于:
将所述第二压缩数据输入至第一熵解码模型,得到所述第一熵解码模型输出的第四特征图;
对所述第四特征图进行解码处理,得到所述编码概率特征。
一种可能的实施方式中,所述第M+1个通道属于第K个预设分组;其中,K为正整数;
所述解码模块,在针对待解压缩的第M+1个通道,对已解压缩的前M个通道的取值进行空间上下文特征提取和通道上下文特征提取,确定所述第M+1个通道对应的压缩信息时,用于:
对所述第K个预设分组中通道编号小于M+1的通道值进行空间上下文特征提取,确定所述第M+1个通道对应的第二空间冗余特征;以及对前K-1个预设分组对应的第二特征图进行通道上下文特征提取,确定所述第M+1个通道对应的第二通道冗余特征;
基于所述第二空间冗余特征、所述第二通道冗余特征和所述编码概率特征,确定所述第M+1个通道对应的压缩信息。
一种可能的实施方式中,所述解码模块,在基于第M+1个通道对应的压缩信息对所述目标压缩结果中的第一压缩数据进行解码处理,确定第M+1个通道的取值时,用于:
将所述第M+1个通道对应的压缩信息和所述第一压缩数据输入至第二熵解码模型,确定第M+1个通道的取值。
第五方面,本公开实施例还提供一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面或第二方面中,任一种可能的实施方式中的步骤。
第六方面,本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面或第二方面中,任一种可能的实施方式中的步骤。
关于上述图像解压缩方法、图像解压缩装置、图像压缩装置、计算机设备、及计算机可读存储介质的效果描述参见上述图像压缩方法的说明,这里不再赘述。
为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本公开实施例所提供的一种图像压缩方法的流程图;
图2a示出了本公开实施例所提供的图像压缩方法中,通道自回归模型的网络结构的示意图;
图2b示出了本公开实施例所提供的图像压缩方法中,先验解码器的网络结构的示意图;
图2c示出了本公开实施例所提供的图像压缩方法中,参数生成网络的网络结构的示意图;
图3示出了本公开实施例所提供的图像压缩方法中,确定各第二特征图分别对应的压缩信息的具体方法的流程图;
图4示出了本公开实施例所提供的图像压缩方法中,确定与目标图像对应的编码概率特征的具体方法的流程图;
图5示出了本公开实施例所提供的图像压缩方法中,确定第二特征图对应的压缩信息的具体方法的流程图;
图6示出了本公开实施例所提供的一种图像解压缩方法的流程图;
图7示出了本公开实施例所提供的图像解压缩方法中,得到解压缩后的目标图像的具体方法的流程图;
图8示出了本公开实施例所提供的图像解压缩方法中,得到第二特征图的具体方法的流程图;
图9示出了本公开实施例提供的一种图像编解码方法的整体流程图;
图10示出了本公开实施例提供的一种并行特征提取模块的结构示意图;
图11示出了本公开实施例所提供的一种图像压缩装置的架构示意图;
图12示出了本公开实施例所提供的一种图像解压缩装置的架构示意图;
图13示出了本公开实施例所提供的一种计算机设备的结构示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
本文中术语“和/或”,仅仅是描述一种关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
经研究发现,图像数据之所以能被压缩,是因为数据中存在着冗余。图像数据的冗余表现为图像中相邻像素点间的相关性引起的空间冗余等,图像压缩的目标就是通过去除这些冗余来减少表示图像数据时所需的比特数。由于图像数据量的庞大,在存储、传输、处理时较为困难,因此,如何进行图像压缩成为了该领域内亟待解决的问题。
基于上述研究,本公开提供了一种图像压缩方法、图像解压缩方法及装置,通过对进行特征提取后得到的第一特征图进行分组处理,得到多个第二特征图,并通过对所述第二特征图进行空间上下文特征提取和通道上下文特征提取,可以同时对所述第二特征图进行空间冗余压缩和通道冗余压缩,由此可以提高所述目标图像的压缩编码率;之后再基于第一空间冗余特征和第一通道冗余特征进行图像压缩,降低了目标图像对应的目标压缩结果的尺寸。
为便于对本实施例进行理解,首先对本公开实施例所公开的一种图像压缩方法进行详细介绍,本公开实施例所提供的图像压缩方法的执行主体一般为具有一定计算能力的计算机设备,该计算机设备例如包括:终端设备或服务器或其它处理设备,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、车载设备、可穿戴设备等。在一些可能的实现方式中,该图像压缩方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
参见图1所示,为本公开实施例提供的图像压缩方法的流程图,所述方法包括S101~S105,其中:
S101:获取目标图像,并对所述目标图像进行特征提取,得到包含多个通道的第一特征图。
S102:对所述第一特征图的通道进行分组处理,得到多个第二特征图。
S103:对所述第二特征图进行空间上下文特征提取,确定所述第二特征图对应的第一空间冗余特征;以及对所述第二特征图进行通道上下文特征提取,确定所述第二特征图对应的第一通道冗余特征。
S104:基于各第二特征图对应的第一空间冗余特征和第一通道冗余特征,确定各所述第二特征图分别对应的压缩信息。
S105:根据各所述第二特征图分别对应的压缩信息,确定所述目标图像对应的第一压缩数据,以及基于所述第一特征图进行深度压缩处理,确定所述目标图像对应的第二压缩数据,所述第一压缩数据和所述第二压缩数据构成所述目标图像对应的目标压缩结果。
以下是对上述步骤的详细介绍。
针对S101,所述目标图像即为需要进行压缩的图像,在对所述目标图像进行特征提取时,可以将所述目标图像输入至特征提取网络中,得到所述特征提取网络输出的所述目标图像对应的第一特征图,其中,所述特征提取网络为可以进行深度学习的神经网络,比如卷积神经网络等。
进一步的,在得到所述第一特征图之后,还可以对所述第一特征图进行量化处理,以便于后续根据量化处理后的第一特征图进行相应处理,从而确保所述目标图像的压缩效果。
S102:对所述第一特征图的通道进行分组处理,得到多个第二特征图。
一种可能的实施方式中,在对所述第一特征图的通道进行分组处理时,可以基于预设的多个目标通道个数对经过量化处理的所述第一特征图的通道进行分组处理,得到多个预设分组,每个预设分组的通道值构成一个第二特征图;其中,各第二特征图所包含的通道个数不完全相同。
具体的,由于在特征提取时目标图像的语义信息往往会富集在第一特征图中通道编号靠前的通道中,为了使得各第二特征图中包含的目标图像的语义信息相近,以提高所述目标图像的编码压缩率,在根据所述第一特征图的通道编号进行从前往后的分组处理时,可以依次确定所述目标通道个数中的最小通道个数,并根据当前的最小通道个数进行分组处理,分组完成后即可将当前使用的最小通道个数进行删除(若有多个相同的最小通道个数,每次只删除一个),然后返回执行确定最小通道个数的步骤,直至删除全部的目标通道个数,若此时还有剩余的通道,则可以将剩余的通道全部都划分到同一个分组中,从而完成对所述第一特征图中全部通道的分组处理。
示例性的,以所述第一特征图的通道为通道1~通道640,所述目标通道个数依次为16、16、32、64、128为例,可以根据所述目标通道个数将所述第一特征图的通道分为6组,每组对应的通道编号依次为通道1~通道16、通道17~通道32、通道33~通道64、通道65~通道128、通道129~通道256、通道257~通道640,从而可以得到6个第二特征图。
这样,通过对所述第一特征图的非均匀分组,可以使得分组处理后的各第二特征图中包含的目标图像的语义信息相近,从而提高所述目标图像的编码压缩率;另一方面,相较于对所述第一特征图进行均匀分组,需要更少的分组数,从而可以提高后续分组运算时的计算速度,从而提高对所述目标图像的压缩效率。
S103:对所述第二特征图进行空间上下文特征提取,确定所述第二特征图对应的第一空间冗余特征;以及对所述第二特征图进行通道上下文特征提取,确定所述第二特征图对应的第一通道冗余特征。
一种可能的实施方式中,针对任一所述第二特征图,在确定该第二特征图对应的第一空间冗余特征时,可以基于空间上下文模型依次确定该第二特征图的各通道分别对应的第一空间冗余特征;该第二特征图的各通道分别对应的第一空间冗余特征构成该第二特征图对应的第一空间冗余特征。
这里,所述空间上下文模型为可以进行深度学习的神经网络,比如卷积神经网络等。
示例性的,以所述空间上下文模型为卷积神经网络为例,所述空间上下文模型的网络结构可以是卷积层-激活层-卷积层-激活层-卷积层,通过多层的卷积网络可以更好的提取所述第二特征图的第一空间冗余特征。
具体的,在确定任一所述第二特征图的各通道分别对于的第一空间冗余时,可以根据该第二特征图中各通道的通道编号,由小到大依次确定各通道分别对应的第一空间冗余特征。
一种可能的实施方式中,针对任一第二特征图的任一通道,在确定该通道对应的第一空间冗余特征时,可以将该通道之前的通道的通道值输入至所述空间上下文模型,确定该通道对应的第一空间冗余特征。
这里,该通道之前的通道的通道值即为该通道之前各通道的取值,任一第二特征图的第一个通道对应的第一空间冗余特征为空,各第二特征图的第一个通道并不一定是第一特征图的第一个通道。
承接上例,以6个第二特征图中各通道在第一特征图中对应的通道编号依次为通道1~通道16、通道17~通道32、通道33~通道64、通道65~通道128、通道129~通道256、通道257~通道640为例,则各第二特征图的第一个通道在所述第一特征图中对应的通道编号依次为通道1、通道17、通道33、通道65、通道129、通道257。
示例性的,以第二特征图A中包含6个通道为例,在确定所述第二特征图A中第6个通道对应的第一空间冗余特征时,可以将所述第二特征图A中的第1~5个通道分别对应的通道值输入至所述空间上下文模型,得到所述空间上下文模型输出的所述第二特征图中第6个通道对应的第一空间冗余特征。
这样,通过将该通道之前的通道的通道值输入至空间上下文模型,可以确定该通道与之前各通道的空间冗余,从而能够更好的进行图像压缩,提高图像的编码压缩率。
一种可能的实施方式中,针对第N+1个第二特征图,在确定该第二特征图对应的第一通道冗余特征时,可以将前N个第二特征图输入至通道自回归模型,确定第N+1个第二特征图对应的第一通道冗余特征。
其中,N为正整数,第一个第二特征图的第一通道冗余特征为空,第N+1个第二特征图的通道在所述第一特征图中的通道编号大于前N个第二特征图的通道编号,所述通道自回归模型为可以进行深度学习的神经网络,比如卷积神经网络等。
示例性的,以所述通道自回归模型为卷积神经网络为例,所述通道自回归模型的网络结构可以如图2a所示,图2a中,所述通道自回归模型的网络结构为卷积层-激活层-卷积层-激活层-卷积层,其中各卷积层的卷积核为5×5,步长为1,激活层对应的激活函数为ReLU函数,通过多层的卷积网络可以更好的提取所述第二特征图的第一通道冗余特征。
具体的,在确定所述第二特征图对应的第一通道冗余特征时,可以根据各第二特征图中的通道在所述第一特征图中的通道编号,从小到大依次进行确定,从而得到各所述第二特征图分别对应的第一通道冗余特征。
示例性的,以第1~6个第二特征图中的通道在第一特征图中的通道编号分别为通道1~通道16、通道17~通道32、通道33~通道64、通道65~通道128、通道129~通道256、通道257~通道640例,在确定第5个特征图对应的第一通道冗余特征时,可以将第1~4个所述第二特征图中各通道的通道值(也即所述第一特征图中的通道1~通道128的通道值)输入至所述通道自回归模型,得到所述通道自回归模型输出的第5个第二特征图对应的第一通道冗余特征。
这样,通过将该第二特征图之前的第二特征图输入至通道自回归模型,可以确定该第二特征图与之前各第二特征图的通道冗余,从而能够更好的进行图像压缩,提高图像的编码压缩率。
S104:基于各第二特征图对应的第一空间冗余特征和第一通道冗余特征,确定各所述第二特征图分别对应的压缩信息。
这里,针对任一所述第二特征图,与该第二特征图对应的压缩信息为压缩该第二特征图时所需要使用的信息,比如该第二特征图对应的压缩编码的概率信息(比如算术编码时使用的概率信息,包括均值、标准差、方差中的至少一项)或者符号序列等。
一种可能的实施方式中,如图3所示,可以通过以下步骤确定各第二特征图分别对应的压缩信息:
S301:确定与所述目标图像对应的编码概率特征。
这里,所述概率编码特征可以包括所述目标图像中的低频信息和局部的空间相关性信息等用于辅助编码的特征,通过将所述编码概率特征添加至所述目标图像对应的压缩信息中,可以进一步的提高所述目标图像的编码压缩率。
一种可能的实施方式中,如图4所示,可以通过以下步骤确定与所述目标图像对应的编码概率特征:
S3011:基于先验编码器对所述第一特征图进行编码处理,得到所述目标图像对应的第三特征图。
这里,所述先验编码器为可以进行深度学习的神经网络,比如卷积神经网络等,用于对所述第一特征图进行编码处理。
具体的,在基于先验编码器对所述第一特征图进行编码处理时,可以将所述目标图像对应的第一特征图输入至所述先验编码器,得到所述先验编码器输出的所述目标图像对应的第三特征图。
S3012:对所述第三特征图进行量化处理,并基于先验解码器对量化处理后的所述第三特征图进行解码处理,得到所述编码概率特征。
这里,所述先验解码器为可以进行深度学习的神经网络,比如卷积神经网络等,用于对量化处理后的第三特征图进行解码处理。
示例性的,以所述先验解码器为卷积神经网络为例,所述先验解码器的网络结构可以如图2b所示,图2b中,所述先验解码器的网络结构为转置卷积层-激活层-转置卷积层-激活层-转置卷积层,其中各卷积层的卷积核依次为3×3、5×5、5×5,步长依次为1、2、2,激活层对应的激活函数为ReLU函数,通过多层的卷积网络可以更好的对所述第三特征图进行解码处理。
具体的,在基于先验解码器对量化处理后的所述第三特征图进行解码处理时,可以将所述目标图像对应的量化处理后的第三特征图输入至所述先验解码器,得到所述先验解码器输出的所述目标图像对应的编码概率特征。
S302:针对任一第二特征图,基于该第二特征图对应的第一空间冗余特征、第一通道冗余特征以及所述编码概率特征,确定该第二特征图对应的压缩信息。
这里,针对任一所述第二特征图,可以依次确定该第二特征图中各通道分别对应的压缩信息,各通道分别对应的压缩信息构成该第二特征图对应的压缩信息。
一种可能的实施方式中,如图5所示,可以通过以下步骤确定第二特征图对应的压缩信息:
S3021:对所述第一空间冗余特征、第一通道冗余特征以及编码概率特征进行拼接处理,得到拼接处理后的目标张量。
这里,针对任一第二特征图的任一通道,在对所述第一空间冗余特征、第一通道冗余特征以及编码概率特征进行拼接处理时,可以按照预设的拼接顺序将该通道对应的第一空间冗余特征、该通道所在的第二特征图对应的第一通道冗余特征以及概率编码特征进行拼接处理,从而得到拼接处理的目标张量。
这样,由于所述编码概率特征能够辅助所述目标图像进行熵编码,因此通过将所述编码概率特征添加至所述目标图像对应的压缩信息中,可以进一步的提高所述目标图像的编码压缩率。
S3022:基于参数生成网络对所述目标张量进行特征提取,生成该第二特征图对应的压缩信息。
这里,所述参数生成网络为可以进行深度学习的神经网络,比如卷积神经网络等,用于对任一所述第二特征图中的各通道分别对应的目标张量进行特征提取,从而得到该第二特征图中各通道分别对应的压缩信息,各通道分别对应的压缩信息构成该第二特征图对应的压缩信息。
示例性的,以所述参数生成网络为卷积神经网络为例,所述参数生成网络的网络结构可以如图2c所示,图2c中,所述参数生成网络的网络结构为卷积层-激活层-卷积层-激活层-卷积层,其中各卷积层的卷积核为1×1,步长为1,激活层对应的激活函数为ReLU函数,通过多层的卷积网络可以更好的对所述目标张量进行特征提取,从而生成第二特征图对应的压缩信息。
这样,通过对所述第一空间冗余特征、第一通道冗余特征以及编码概率特征进行拼接处理,并基于参数生成网络对拼接处理后得到的目标张量进行特征提取,使得得到的第二特征图对应的压缩信息中包含了目标图像在多个维度下的压缩信息,从而可以提高所述目标图像的压缩编码率。
S105:根据各所述第二特征图分别对应的压缩信息,确定所述目标图像对应的第一压缩数据,以及基于所述第一特征图进行深度压缩处理,确定所述目标图像对应的第二压缩数据,所述第一压缩数据和所述第二压缩数据构成所述目标图像对应的目标压缩结果。
一种可能的实施方式中,在确定所述目标图像对应的第一压缩数据时,可以将所述第一特征图和各第二特征图分别对应的压缩信息输出至第二熵编码模型,得到所述第二熵编码模型输出的第一压缩数据。
这里,所述第二熵编码模型可以是任意形式的概率模型,比如高斯分布模型等。
一种可能的实施方式中,在确定所述目标图像对应的第二压缩数据时,可以在基于所述第一特征图得到量化处理后的第三特征图后,将量化处理后的第三特征图输入至第一熵编码模型,得到所述第一熵编码模型输出的第二压缩数据。
这里,所述第一熵编码模型可以是任意形式的概率模型,比如高斯分布模型等。优选的,所述第一熵编码模型和所述第二熵编码模型可以是相同形式的概率模型,比如所述第一熵编码模型和所述第二熵编码模型可以均为高斯分布模型。
这样,通过将量化处理后的第三特征图输入至熵编码模型,得到第二压缩数据,使得在图像解压缩过程中可以通过对所述第二压缩数据进行解压缩处理,得到用于辅助图像解压缩的编码概率特征。
本公开实施例提供的图像压缩方法,通过对进行特征提取后得到的第一特征图进行分组处理,得到多个第二特征图,并通过对所述第二特征图进行空间上下文特征提取和通道上下文特征提取,可以同时对所述第二特征图进行空间冗余压缩和通道冗余压缩,由此可以提高所述目标图像的压缩编码率;之后再基于第一空间冗余特征和第一通道冗余特征进行图像压缩,降低了目标图像对应的目标压缩结果的尺寸。
参见图6所示,为本公开实施例提供的图像解压缩方法的流程图,所述方法包括S601~S602,其中:
S601:获取基于本公开实施例提供任一所述的方法压缩得到的目标压缩结果。
S602:对所述目标压缩结果进行解码,得到所述目标图像。
以下是对上述步骤的详细介绍。
一种可能的实施方式中,如图7所示,可以通过以下步骤得到解压缩后的目标图像:
S701:对所述目标压缩结果进行第一解码处理,得到多个第二特征图。
这里,所述目标压缩结果包括第一压缩数据和第二压缩数据,所述第二压缩数据用于对所述第一压缩数据进行压缩处理,因此在对所述目标压缩结果进行第一解码处理时,可以先对所述目标压缩结果中的第一压缩数据先进行解码处理,然后再对所述目标压缩结果中的第二压缩数据进行解码处理。
一种可能的实施方式中,如图8所示,可以通过以下步骤得到第二特征图:
S7011:对所述目标压缩结果中的第二压缩数据进行解码处理,得到目标图像对应的编码概率特征。
一种可能的实施方式中,在所述第二压缩数据进行解码处理时,可以将所述第二压缩数据输入至第一熵解码模型,得到所述第一熵解码模型输出的第四特征图;对所述第四特征图进行解码处理,得到所述编码概率特征。
这里,所述第一熵解码模型和所述第一熵编码模型可以是相同形式的概率模型,比如所述第一熵编码模型和所述第一熵解码模型可以均为高斯分布模型,所述第一熵解码模型用于对经过所述第一熵编码模型处理后得到的第二压缩数据进行解码处理,从而得到所述第四特征图。
具体的,对所述第四特征图进行解码处理的过程与上文对所述第三特征图进行解码处理的过程相同,可以基于所述先验解码器对所述第四特征图进行解码处理,从而得到所述编码概率特征。
S7012:针对待解压缩的第M+1个通道,对已解压缩的前M个通道的取值进行空间上下文特征提取和通道上下文特征提取,确定所述第M+1个通道对应的压缩信息。
其中,第一个通道的压缩信息是基于所述编码概率特征确定的,所述第M+1个通道属于第K个预设分组;其中,K为正整数。
一种可能的实施方式中,在确定第M+1个通道对应的压缩信息时,可以对所述第K个预设分组中通道编号小于M+1的通道值进行空间上下文特征提取,确定所述第M+1个通道对应的第二空间冗余特征;以及对前K-1个预设分组对应的第二特征图进行通道上下文特征提取,确定所述第M+1个通道对应的第二通道冗余特征;基于所述第二空间冗余特征、所述第二通道冗余特征和所述编码概率特征,确定所述第M+1个通道对应的压缩信息。
这里,针对第M+1个通道,在进行空间上下文特征提取时,可以将第K个预设分组中通道编号小于M+1的通道值输入至所述空间上下文模型,得到所述空间上下文模型输出的所述第M+1个通道对应的第二空间冗余特征;在进行通道上下文特征提取时,可以将前K-1个预设分组对应的第二特征图输入至所述通道自回归模型,得到所述通道自回归模型输出的所述第M+1个通道对应的第二通道冗余特征。
具体的,在确定所述第M+1个通道对应的压缩信息时,可以对所述第二空间冗余特征、第二通道冗余特征以及编码概率特征进行拼接处理,得到拼接处理后的第M+1个通道对应的目标张量;基于参数生成网络对第M+1个通道对应的目标张量进行特征提取,得到所述第M+1个通道对应的压缩信息。
示例性的,以各预设分组中包含的通道编号依次为通道1~通道16、通道17~通道32、通道33~通道64为例,在确定通道20(即第20个通道)对应的压缩信息时,可以将通道17~通道19的通道值输入至空间上下文模型,得到所述空间上下文模型输出的所述通道20对应的第二空间冗余特征;以及,可以将第1个预设分组(即通道1~通道16)对应的第二特征图输入值通道自回归模型,得到所述通道自回归模型输出的所述通道20对应的第二通道冗余特征,基于所述通道20对应的第二通道冗余特征和第二空间冗余特征,即可确定出所述通道20对应的压缩信息。
S7013:基于第M+1个通道对应的压缩信息对所述目标压缩结果中的第一压缩数据进行解码处理,确定第M+1个通道的取值;其中,属于同一预设分组的各通道的取值构成一个第二特征图。
具体的,在确定第M+1个通道的取值时,可以将所述第M+1个通道对应的压缩信息和所述第一压缩数据输入至第二熵解码模型,确定第M+1个通道的取值。
这里,所述第二熵解码模型和所述第二熵编码模型可以是相同形式的概率模型,比如所述第二熵编码模型和所述第二熵解码模型可以均为高斯分布模型,所述第二熵解码模型用于对经过所述第二熵编码模型处理后得到的第一压缩数据进行解码处理,从而得到各通道的取值。
S702:将所述多个第二特征图的通道进行拼接,得到第一特征图。
S703:对所述第一特征图进行第二解码处理,得到所述目标图像。
这里,在对所述第一特征图进行第二解码处理时,可以将所述第一特征图输入至训练好的目标神经网络中,得到所述目标神经网络输出的所述第一特征图对应的目标图像,其中,所述目标神经网络为可以进行深度学习的神经网络,比如卷积神经网络等。
下面,将结合具体的实施方式,对上述图像压缩方法和图像解压缩方法进行整体描述。参见图9所示,为本公开实施例提供的一种图像编解码方法的整体流程图,该流程图中,与图像编码相关的部分(即进行图像压缩)采用实线进行表示,与图像解码相关的部分(即进行图像解压缩)采用虚线进行表示。
首先,先对图像编码的过程进行描述。图像编码的过程主要包括以下几个步骤:
1、在获取到目标图像后,将目标图像输入至特征提取网络,得到目标图像对应的第一特征图。
2、一方面,将第一特征图输入至量化器进行量化处理;另一方面,将第一特征图输入至先验编码器进行编码后,得到所述目标图像对应的第三特征图,然后将第三特征图进行量化处理后,输入至先验解码器,得到编码概率特征;
3、将量化处理后的第一特征图以及编码概率特征输入至并行特征提取模块,得到目标图像对应的压缩信息;
其中,所述并行特征提取模块用于并行提取通道第二特征图的通道冗余特征和空间冗余特征;具体的,所述并行特征提取模块的结构如图10所示,包括通道自回归模型、空间上下文模型、特征拼接单元、参数生成网络。具体的得到压缩信息的过程参照上述实施例,在此将不再赘述。
4、在得到压缩信息之后,将压缩信息和量化处理后的第一特征图输入至第二熵编码模型中,得到目标图像对应的第一压缩数据;同时,量化处理后的第三特征图输入至第一熵编码模型中,得到目标图像对应的第二压缩数据。
在得到第一压缩数据和第二压缩数据之后,至此目标图像的压缩过程完成。
其次,再对图像解码的过程进行描述。图像解码的过程主要包括以下几个步骤:
1、首先第一熵解码模型,对所述第二压缩数据进行熵解码处理,得到第四特征图;
2、将第四特征图输入至先验解码器,得到编码概率特征;
3、在首次解码时,将编码概率特征输入至并行特征提取模型,进行循环解码,得到各个通道的通道值。
具体的,图10中的y<K表示第K个第二特征图(也即第K组通道)之前的全部第二特征图(也即前K-1组通道);
Figure BDA0003515561690000161
表示第K个特征图中的第i个通道之前各通道的通道值;
Figure BDA0003515561690000162
表示第K个特征图中的第i个通道的通道值,在进行图像解码的过程中,所述第二熵解码模型可以根据输入的压缩信息,依次确定出各通道的通道值
Figure BDA0003515561690000163
,并进一步确定出
Figure BDA0003515561690000164
和y<K,其中,K为正整数。
4、在确定各个通道的通道值之后,可以确定第一特征图,然后将第一特征图输入至目标神经网络,解码得到所述目标图像。
具体的,并行特征提取网络在进行循环解码时,示例性的可以参照上述实施例的描述,在此将不再赘述。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
基于同一发明构思,本公开实施例中还提供了与图像压缩方法对应的图像压缩装置,由于本公开实施例中的装置解决问题的原理与本公开实施例上述图像压缩方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
参照图11所示,为本公开实施例提供的一种图像压缩装置的架构示意图,所述装置包括:获取模块1101、分组模块1102、特征提取模块1103、第一确定模块1104、第二确定模块1105;其中,
获取模块1101,用于获取目标图像,并对所述目标图像进行特征提取,得到包含多个通道的第一特征图;
分组模块1102,用于对所述第一特征图的通道进行分组处理,得到多个第二特征图;
特征提取模块1103,用于对所述第二特征图进行空间上下文特征提取,确定所述第二特征图对应的第一空间冗余特征;以及对所述第二特征图进行通道上下文特征提取,确定所述第二特征图对应的第一通道冗余特征;
第一确定模块1104,用于基于各第二特征图对应的第一空间冗余特征和第一通道冗余特征,确定各所述第二特征图分别对应的压缩信息;
第二确定模块1105,用于根据各所述第二特征图分别对应的压缩信息,确定所述目标图像对应的第一压缩数据,以及基于所述第一特征图进行深度压缩处理,确定所述目标图像对应的第二压缩数据,所述第一压缩数据和所述第二压缩数据构成所述目标图像对应的目标压缩结果。
一种可能的实施方式中,在得到所述第一特征图之后,所述获取模块1101还用于:
对所述第一特征图进行量化处理;
所述分组模块1102,在对所述第一特征图的通道进行分组处理,得到多个第二特征图时,用于:
基于预设的多个目标通道个数对经过量化处理的所述第一特征图的通道进行分组处理,得到多个预设分组,每个预设分组的通道值构成一个第二特征图;其中,各第二特征图所包含的通道个数不完全相同。
一种可能的实施方式中,所述特征提取模块1103,在对所述第二特征图进行空间上下文特征提取,确定所述第二特征图对应的第一空间冗余特征时,用于:
针对任一所述第二特征图,基于空间上下文模型依次确定该第二特征图的各通道分别对应的第一空间冗余特征;该第二特征图的各通道分别对应的第一空间冗余特征构成该第二特征图对应的第一空间冗余特征。
一种可能的实施方式中,所述特征提取模块1103还用于根据以下步骤确定第二特征图的各通道对应的第一空间冗余特征:
针对任一第二特征图的任一通道,将该通道之前的通道的通道值输入至所述空间上下文模型,确定该通道对应的第一空间冗余特征;
任一第二特征图的第一个通道对应的第一空间冗余特征为空。
一种可能的实施方式中,所述特征提取模块1103,在对所述第二特征图进行通道上下文特征提取,确定所述第二特征图对应的第一通道冗余特征时,用于:
针对第N+1个第二特征图,将前N个第二特征图输入至通道自回归模型,确定第N+1个第二特征图对应的第一通道冗余特征;其中,N为正整数,第一个第二特征图的第一通道冗余特征为空,第N+1个第二特征图的通道在所述第一特征图中的通道编号大于前N个第二特征图的通道编号。
一种可能的实施方式中,所述第一确定模块1104,在基于各第二特征图对应的第一空间冗余特征和第一通道冗余特征,确定各所述第二特征图分别对应的压缩信息时,用于:
确定与所述目标图像对应的编码概率特征;
针对任一第二特征图,基于该第二特征图对应的第一空间冗余特征、第一通道冗余特征以及所述编码概率特征,确定该第二特征图对应的压缩信息。
一种可能的实施方式中,所述第一确定模块1104,在确定与所述目标图像对应的编码概率特征时,用于:
基于先验编码器对所述第一特征图进行编码处理,得到所述目标图像对应的第三特征图;
对所述第三特征图进行量化处理,并基于先验解码器对量化处理后的所述第三特征图进行解码处理,得到所述编码概率特征。
一种可能的实施方式中,所述第二确定模块1105,在基于所述第一特征图进行深度压缩处理,确定所述目标图像对应的第二压缩数据时,用于:
在基于所述第一特征图得到量化处理后的第三特征图后,将量化处理后的第三特征图输入至第一熵编码模型,得到所述第一熵编码模型输出的第二压缩数据。
一种可能的实施方式中,所述第一确定模块1104,在针对任一第二特征图,基于该第二特征图对应的第一空间冗余特征、第一通道冗余特征以及所述编码概率特征,确定该第二特征图对应的压缩信息时,用于:
对所述第一空间冗余特征、第一通道冗余特征以及编码概率特征进行拼接处理,得到拼接处理后的目标张量;
基于参数生成网络对所述目标张量进行特征提取,生成该第二特征图对应的压缩信息。
一种可能的实施方式中,所述第二确定模块1105,在根据各所述第二特征图分别对应的压缩信息,确定所述目标图像对应的第一压缩数据时,用于:
将所述第一特征图和各第二特征图分别对应的压缩信息输出至第二熵编码模型,得到所述第二熵编码模型输出的第一压缩数据。
本公开实施例提供的图像压缩装置,通过对进行特征提取后得到的第一特征图进行分组处理,得到多个第二特征图,并通过对所述第二特征图进行空间上下文特征提取和通道上下文特征提取,可以同时对所述第二特征图进行空间冗余压缩和通道冗余压缩,由此可以提高所述目标图像的压缩编码率;之后再基于第一空间冗余特征和第一通道冗余特征进行图像压缩,降低了目标图像对应的目标压缩结果的尺寸。
参照图12所示,为本公开实施例提供的一种图像解压缩装置的架构示意图,所述装置包括:第二获取模块1201和解码模块1202;其中,
第二获取模块1201,用于获取基于本公开实施例中任一所述的方法压缩得到的目标压缩结果;
解码模块1202,用于对所述目标压缩结果进行解码,得到所述目标图像。
一种可能的实施方式中,所述解码模块1202,在对所述目标压缩结果进行解码,得到所述目标图像时,用于:
对所述目标压缩结果进行第一解码处理,得到多个第二特征图;
将所述多个第二特征图的通道进行拼接,得到第一特征图;
对所述第一特征图进行第二解码处理,得到所述目标图像。
一种可能的实施方式中,所述解码模块1202,在对所述目标压缩结果进行第一解码处理,得到多个第二特征图时,用于:
对所述目标压缩结果中的第二压缩数据进行解码处理,得到目标图像对应的编码概率特征;
针对待解压缩的第M+1个通道,对已解压缩的前M个通道的取值进行空间上下文特征提取和通道上下文特征提取,确定所述第M+1个通道对应的压缩信息;其中,第一个通道的压缩信息是基于所述编码概率特征确定的;
基于第M+1个通道对应的压缩信息对所述目标压缩结果中的第一压缩数据进行解码处理,确定第M+1个通道的取值;其中,属于同一预设分组的各通道的取值构成一个第二特征图。
一种可能的实施方式中,所述解码模块1202,在对所述目标压缩结果中的第二压缩数据进行解码处理,得到目标图像对应的编码概率特征时,用于:
将所述第二压缩数据输入至第一熵解码模型,得到所述第一熵解码模型输出的第四特征图;
对所述第四特征图进行解码处理,得到所述编码概率特征。
一种可能的实施方式中,所述第M+1个通道属于第K个预设分组;其中,K为正整数;
所述解码模块1202,在针对待解压缩的第M+1个通道,对已解压缩的前M个通道的取值进行空间上下文特征提取和通道上下文特征提取,确定所述第M+1个通道对应的压缩信息时,用于:
对所述第K个预设分组中通道编号小于M+1的通道值进行空间上下文特征提取,确定所述第M+1个通道对应的第二空间冗余特征;以及对前K-1个预设分组对应的第二特征图进行通道上下文特征提取,确定所述第M+1个通道对应的第二通道冗余特征;
基于所述第二空间冗余特征、所述第二通道冗余特征和所述编码概率特征,确定所述第M+1个通道对应的压缩信息。
一种可能的实施方式中,所述解码模块1202,在基于第M+1个通道对应的压缩信息对所述目标压缩结果中的第一压缩数据进行解码处理,确定第M+1个通道的取值时,用于:
将所述第M+1个通道对应的压缩信息和所述第一压缩数据输入至第二熵解码模型,确定第M+1个通道的取值。
关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
基于同一技术构思,本公开实施例还提供了一种计算机设备。参照图13所示,为本公开实施例提供的计算机设备1300的结构示意图,包括处理器1301、存储器1302、和总线1303。其中,存储器1302用于存储执行指令,包括内存13021和外部存储器13022;这里的内存13021也称内存储器,用于暂时存放处理器1301中的运算数据,以及与硬盘等外部存储器13022交换的数据,处理器1301通过内存13021与外部存储器13022进行数据交换,当计算机设备1300运行时,处理器1301与存储器1302之间通过总线1303通信,使得处理器1301在执行以下指令:
获取目标图像,并对所述目标图像进行特征提取,得到包含多个通道的第一特征图;
对所述第一特征图的通道进行分组处理,得到多个第二特征图;
对所述第二特征图进行空间上下文特征提取,确定所述第二特征图对应的第一空间冗余特征;以及对所述第二特征图进行通道上下文特征提取,确定所述第二特征图对应的第一通道冗余特征;
基于各第二特征图对应的第一空间冗余特征和第一通道冗余特征,确定各所述第二特征图分别对应的压缩信息;
根据各所述第二特征图分别对应的压缩信息,确定所述目标图像对应的第一压缩数据,以及基于所述第一特征图进行深度压缩处理,确定所述目标图像对应的第二压缩数据,所述第一压缩数据和所述第二压缩数据构成所述目标图像对应的目标压缩结果;或者,
使得处理器1301在执行以下指令:
获取基于本公开实施例中任一所述的方法压缩得到的目标压缩结果;
对所述目标压缩结果进行解码,得到所述目标图像。
本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的图像压缩方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。
本公开实施例还提供一种计算机程序产品,该计算机程序产品承载有程序代码,所述程序代码包括的指令可用于执行上述方法实施例中所述的图像压缩方法的步骤,具体可参见上述方法实施例,在此不再赘述。
其中,上述计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。

Claims (20)

1.一种图像压缩方法,其特征在于,包括:
获取目标图像,并对所述目标图像进行特征提取,得到包含多个通道的第一特征图;
对所述第一特征图的通道进行分组处理,得到多个第二特征图;
对所述第二特征图进行空间上下文特征提取,确定所述第二特征图对应的第一空间冗余特征;以及对所述第二特征图进行通道上下文特征提取,确定所述第二特征图对应的第一通道冗余特征;
基于各第二特征图对应的第一空间冗余特征和第一通道冗余特征,确定各所述第二特征图分别对应的压缩信息;
根据各所述第二特征图分别对应的压缩信息,确定所述目标图像对应的第一压缩数据,以及基于所述第一特征图进行深度压缩处理,确定所述目标图像对应的第二压缩数据,所述第一压缩数据和所述第二压缩数据构成所述目标图像对应的目标压缩结果。
2.根据权利要求1所述的方法,其特征在于,在得到所述第一特征图之后,所述方法还包括:
对所述第一特征图进行量化处理;
所述对所述第一特征图的通道进行分组处理,得到多个第二特征图,包括:
基于预设的多个目标通道个数对经过量化处理的所述第一特征图的通道进行分组处理,得到多个预设分组,每个预设分组的通道值构成一个第二特征图;其中,各第二特征图所包含的通道个数不完全相同。
3.根据权利要求1或2所述的方法,其特征在于,所述对所述第二特征图进行空间上下文特征提取,确定所述第二特征图对应的第一空间冗余特征,包括:
针对任一所述第二特征图,基于空间上下文模型依次确定该第二特征图的各通道分别对应的第一空间冗余特征;该第二特征图的各通道分别对应的第一空间冗余特征构成该第二特征图对应的第一空间冗余特征。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括根据以下方法确定第二特征图的各通道对应的第一空间冗余特征:
针对任一第二特征图的任一通道,将该通道之前的通道的通道值输入至所述空间上下文模型,确定该通道对应的第一空间冗余特征;
任一第二特征图的第一个通道对应的第一空间冗余特征为空。
5.根据权利要求1~4任一所述的方法,其特征在于,所述对所述第二特征图进行通道上下文特征提取,确定所述第二特征图对应的第一通道冗余特征,包括:
针对第N+1个第二特征图,将前N个第二特征图输入至通道自回归模型,确定第N+1个第二特征图对应的第一通道冗余特征;其中,N为正整数,第一个第二特征图的第一通道冗余特征为空,第N+1个第二特征图的通道在所述第一特征图中的通道编号大于前N个第二特征图的通道编号。
6.根据权利要求1~5任一所述的方法,其特征在于,所述基于各第二特征图对应的第一空间冗余特征和第一通道冗余特征,确定各所述第二特征图分别对应的压缩信息,包括:
确定与所述目标图像对应的编码概率特征;
针对任一第二特征图,基于该第二特征图对应的第一空间冗余特征、第一通道冗余特征以及所述编码概率特征,确定该第二特征图对应的压缩信息。
7.根据权利要求6所述的方法,其特征在于,所述确定与所述目标图像对应的编码概率特征,包括:
基于先验编码器对所述第一特征图进行编码处理,得到所述目标图像对应的第三特征图;
对所述第三特征图进行量化处理,并基于先验解码器对量化处理后的所述第三特征图进行解码处理,得到所述编码概率特征。
8.根据权利要求7所述的方法,其特征在于,所述基于所述第一特征图进行深度压缩处理,确定所述目标图像对应的第二压缩数据,包括:
在基于所述第一特征图得到量化处理后的第三特征图后,将量化处理后的第三特征图输入至第一熵编码模型,得到所述第一熵编码模型输出的第二压缩数据。
9.根据权利要求6~8任一所述的方法,其特征在于,所述针对任一第二特征图,基于该第二特征图对应的第一空间冗余特征、第一通道冗余特征以及所述编码概率特征,确定该第二特征图对应的压缩信息,包括:
对所述第一空间冗余特征、第一通道冗余特征以及编码概率特征进行拼接处理,得到拼接处理后的目标张量;
基于参数生成网络对所述目标张量进行特征提取,生成该第二特征图对应的压缩信息。
10.根据权利要求1~9任一所述的方法,其特征在于,所述根据各所述第二特征图分别对应的压缩信息,确定所述目标图像对应的第一压缩数据,包括:
将所述第一特征图和各第二特征图分别对应的压缩信息输出至第二熵编码模型,得到所述第二熵编码模型输出的第一压缩数据。
11.一种图像解压缩方法,其特征在于,包括:
获取基于权利要求1~10任一所述的方法压缩得到的目标压缩结果;
对所述目标压缩结果进行解码,得到所述目标图像。
12.根据权利要求11所述的方法,其特征在于,所述对所述目标压缩结果进行解码,得到所述目标图像,包括:
对所述目标压缩结果进行第一解码处理,得到多个第二特征图;
将所述多个第二特征图的通道进行拼接,得到第一特征图;
对所述第一特征图进行第二解码处理,得到所述目标图像。
13.根据权利要求12所述的方法,其特征在于,所述对所述目标压缩结果进行第一解码处理,得到多个第二特征图,包括:
对所述目标压缩结果中的第二压缩数据进行解码处理,得到目标图像对应的编码概率特征;
针对待解压缩的第M+1个通道,对已解压缩的前M个通道的取值进行空间上下文特征提取和通道上下文特征提取,确定所述第M+1个通道对应的压缩信息;其中,第一个通道的压缩信息是基于所述编码概率特征确定的;
基于第M+1个通道对应的压缩信息对所述目标压缩结果中的第一压缩数据进行解码处理,确定第M+1个通道的取值;其中,属于同一预设分组的各通道的取值构成一个第二特征图。
14.根据权利要求13所述的方法,其特征在于,所述对所述目标压缩结果中的第二压缩数据进行解码处理,得到目标图像对应的编码概率特征,包括:
将所述第二压缩数据输入至第一熵解码模型,得到所述第一熵解码模型输出的第四特征图;
对所述第四特征图进行解码处理,得到所述编码概率特征。
15.根据权利要求13或14所述的方法,其特征在于,所述第M+1个通道属于第K个预设分组;其中,K为正整数;
所述针对待解压缩的第M+1个通道,对已解压缩的前M个通道的取值进行空间上下文特征提取和通道上下文特征提取,确定所述第M+1个通道对应的压缩信息,包括:
对所述第K个预设分组中通道编号小于M+1的通道值进行空间上下文特征提取,确定所述第M+1个通道对应的第二空间冗余特征;以及对前K-1个预设分组对应的第二特征图进行通道上下文特征提取,确定所述第M+1个通道对应的第二通道冗余特征;
基于所述第二空间冗余特征、所述第二通道冗余特征和所述编码概率特征,确定所述第M+1个通道对应的压缩信息。
16.根据权利要求13或14所述的方法,其特征在于,所述基于第M+1个通道对应的压缩信息对所述目标压缩结果中的第一压缩数据进行解码处理,确定第M+1个通道的取值,包括:
将所述第M+1个通道对应的压缩信息和所述第一压缩数据输入至第二熵解码模型,确定第M+1个通道的取值。
17.一种图像压缩装置,其特征在于,包括:
获取模块,用于获取目标图像,并对所述目标图像进行特征提取,得到包含多个通道的第一特征图;
分组模块,用于对所述第一特征图的通道进行分组处理,得到多个第二特征图;
特征提取模块,用于对所述第二特征图进行空间上下文特征提取,确定所述第二特征图对应的第一空间冗余特征;以及对所述第二特征图进行通道上下文特征提取,确定所述第二特征图对应的第一通道冗余特征;
第一确定模块,用于基于各第二特征图对应的第一空间冗余特征和第一通道冗余特征,确定各所述第二特征图分别对应的压缩信息;
第二确定模块,用于根据各所述第二特征图分别对应的压缩信息,确定所述目标图像对应的第一压缩数据,以及基于所述第一特征图进行深度压缩处理,确定所述目标图像对应的第二压缩数据,所述第一压缩数据和所述第二压缩数据构成所述目标图像对应的目标压缩结果。
18.一种图像解压缩装置,其特征在于,包括:
第二获取模块,用于获取基于权利要求1~10任一所述的方法压缩得到的目标压缩结果;
解码模块,用于对所述目标压缩结果进行解码,得到所述目标图像。
19.一种计算机设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至10任一所述的图像压缩方法的步骤;或者,执行如权利要求11至16任一所述的图像解压缩方法的步骤。
20.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至10任一所述的图像压缩方法的步骤;或者,执行如权利要求11至16任一所述的图像解压缩方法的步骤。
CN202210163126.5A 2022-02-22 2022-02-22 图像压缩方法、图像解压缩方法及装置 Active CN114501011B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210163126.5A CN114501011B (zh) 2022-02-22 2022-02-22 图像压缩方法、图像解压缩方法及装置
PCT/CN2022/100500 WO2023159820A1 (zh) 2022-02-22 2022-06-22 图像压缩方法、图像解压缩方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210163126.5A CN114501011B (zh) 2022-02-22 2022-02-22 图像压缩方法、图像解压缩方法及装置

Publications (2)

Publication Number Publication Date
CN114501011A true CN114501011A (zh) 2022-05-13
CN114501011B CN114501011B (zh) 2023-04-21

Family

ID=81482235

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210163126.5A Active CN114501011B (zh) 2022-02-22 2022-02-22 图像压缩方法、图像解压缩方法及装置

Country Status (2)

Country Link
CN (1) CN114501011B (zh)
WO (1) WO2023159820A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023159820A1 (zh) * 2022-02-22 2023-08-31 上海商汤智能科技有限公司 图像压缩方法、图像解压缩方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200160565A1 (en) * 2018-11-19 2020-05-21 Zhan Ma Methods And Apparatuses For Learned Image Compression
US20200372684A1 (en) * 2019-05-22 2020-11-26 Fujitsu Limited Image coding apparatus, probability model generating apparatus and image compression system
US20200382806A1 (en) * 2019-05-31 2020-12-03 Apple Inc. Efficient coding of source video sequences partitioned into tiles
CN112866694A (zh) * 2020-12-31 2021-05-28 杭州电子科技大学 联合非对称卷积块和条件上下文的智能图像压缩优化方法
CN113747163A (zh) * 2021-08-17 2021-12-03 上海交通大学 基于上下文重组建模的图像编码、解码方法及压缩方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7535387B1 (en) * 2007-09-10 2009-05-19 Xilinx, Inc. Methods and systems for implementing context adaptive binary arithmetic coding
WO2018218249A1 (en) * 2017-05-26 2018-11-29 Google Llc Tiled image compression using neural networks
CN111988609A (zh) * 2019-05-22 2020-11-24 富士通株式会社 图像编码装置、概率模型生成装置和图像解码装置
CN113079378B (zh) * 2021-04-15 2022-08-16 杭州海康威视数字技术股份有限公司 图像处理方法、装置和电子设备
CN114501011B (zh) * 2022-02-22 2023-04-21 北京市商汤科技开发有限公司 图像压缩方法、图像解压缩方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200160565A1 (en) * 2018-11-19 2020-05-21 Zhan Ma Methods And Apparatuses For Learned Image Compression
US20200372684A1 (en) * 2019-05-22 2020-11-26 Fujitsu Limited Image coding apparatus, probability model generating apparatus and image compression system
US20200382806A1 (en) * 2019-05-31 2020-12-03 Apple Inc. Efficient coding of source video sequences partitioned into tiles
CN112866694A (zh) * 2020-12-31 2021-05-28 杭州电子科技大学 联合非对称卷积块和条件上下文的智能图像压缩优化方法
CN113747163A (zh) * 2021-08-17 2021-12-03 上海交通大学 基于上下文重组建模的图像编码、解码方法及压缩方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ZONGYU GUO: "Causal Contextual Prediction for Learned Image Compression" *
于恒: "基于深度学习的图像压缩算法研究综述" *
朱俊;高陈强;陈志乾;谌放;: "基于注意力机制和离散高斯混合模型的端到端图像压缩方法" *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023159820A1 (zh) * 2022-02-22 2023-08-31 上海商汤智能科技有限公司 图像压缩方法、图像解压缩方法及装置

Also Published As

Publication number Publication date
CN114501011B (zh) 2023-04-21
WO2023159820A1 (zh) 2023-08-31

Similar Documents

Publication Publication Date Title
CN105684316B (zh) 一种Polar码编码方法、装置
CN110119745B (zh) 深度学习模型的压缩方法、装置、计算机设备及存储介质
KR100969764B1 (ko) 메쉬 모델로 구현된 3차원 데이터의 부호화 및 복호화 방법
CN110677651A (zh) 一种视频压缩方法
CN110663048A (zh) 用于深度神经网络的执行方法、执行装置、学习方法、学习装置以及程序
CN111727445A (zh) 局部熵编码的数据压缩
CN111246206B (zh) 一种基于自编码器的光流信息压缩方法及装置
CN110753225A (zh) 一种视频压缩方法、装置及终端设备
WO2022028197A1 (zh) 一种图像处理方法及其设备
CN113747163A (zh) 基于上下文重组建模的图像编码、解码方法及压缩方法
CN115208414A (zh) 数据压缩方法、数据压缩装置、计算机设备及存储介质
CN114501011B (zh) 图像压缩方法、图像解压缩方法及装置
CN109474826B (zh) 图片压缩方法、装置、电子设备及存储介质
CN113554719B (zh) 一种图像编码方法、解码方法、存储介质及终端设备
CN112052916B (zh) 基于神经网络的数据处理方法、装置以及可读存储介质
CN115361559A (zh) 图像编码方法、图像解码方法、装置以及存储介质
CN116566397A (zh) 编码、解码方法、编码器、解码器、电子设备及存储介质
CN111049836A (zh) 数据处理方法、电子设备及计算机可读存储介质
CN110913220A (zh) 一种视频帧编码方法、装置及终端设备
WO2014000443A1 (zh) 一种图像数据压缩和解压缩方法、装置
WO2024011417A1 (zh) 编解码方法、解码器、编码器及计算机可读存储介质
CN117915107B (zh) 图像压缩系统、图像压缩方法、存储介质与芯片
CN113595557B (zh) 一种数据处理的方法和装置
CN112200301B (zh) 卷积计算装置及方法
CN114663536B (zh) 一种图像压缩方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant