WO2023159883A1

WO2023159883A1 - 图像处理方法及装置、电子设备、存储介质、计算机程序和计算机程序产品

Info

Publication number: WO2023159883A1
Application number: PCT/CN2022/110266
Authority: WO
Inventors: 郭莉娜; 王岩; 王园园; 秦红伟
Original assignee: 上海商汤智能科技有限公司
Priority date: 2022-02-25
Filing date: 2022-08-04
Publication date: 2023-08-31
Also published as: CN114554226A

Abstract

本公开涉及一种图像处理方法及装置、电子设备、存储介质、计算机程序和计算机程序产品，所述方法包括：提取待压缩JPEG图像对应的三个颜色分量的初始DCT系数；分别对所述三个颜色分量的初始DCT系数按照不同频率进行排列，得到所述三个颜色分量的目标DCT系数；对所述三个颜色分量的目标DCT系数进行熵编码，得到所述待压缩JPEG图像对应的目标压缩数据。

Description

图像处理方法及装置、电子设备、存储介质、计算机程序和计算机程序产品

相关申请的交叉引用

本公开基于申请号为202210178603.5、申请日为2022年02月25日、申请名称为“图像处理方法及装置、电子设备和存储介质”的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此引入本公开作为参考。

技术领域

本公开涉及但不限于计算机技术领域，尤其涉及一种图像处理方法及装置、电子设备、存储介质、计算机程序和计算机程序产品。

背景技术

联合图像专家组(Joint Photographic Experts Group，JPEG)标准目前是被广泛支持和使用的图像压缩标准。在数据中心、云存储和云文件系统中心广泛存在。根据调查，在Dropbox这类云存储文件系统中，JPEG占据35％。然而，由于JPEG技术本身的限制，依靠手工设计的压缩模块，很难充分消除数据冗余。为了节约海量的存储和带宽资源，需要对当前已经存在的海量JPEG文件进行进一步压缩。

发明内容

本公开实施例提出了一种图像处理方法及装置、电子设备、存储介质、计算机程序和计算机程序产品。

根据本公开实施例的一方面，提供了一种图像处理方法，包括：提取待压缩联合图像专家组JPEG图像对应的三个颜色分量的初始离散余弦变换DCT系数；分别对所述三个颜色分量的初始DCT系数按照不同频率进行排列，得到所述三个颜色分量的目标DCT系数；对所述三个颜色分量的目标DCT系数进行熵编码，得到所述待压缩JPEG图像对应的目标压缩数据。

根据本公开实施例的一方面，提供了一种图像处理装置，包括：DCT系数提取部分，配置为提取待压缩JPEG图像对应的三个颜色分量的初始变换DCT系数；DCT系数重排部分，配置为分别对所述三个颜色分量的初始DCT系数按照不同频率进行排列，得到所述三个颜色分量的目标DCT系数；熵编码部分，配置为对所述三个颜色分量的目标DCT系数进行熵编码，得到所述待压缩JPEG图像对应的目标压缩数据。

根据本公开实施例的一方面，提供了一种电子设备，包括：处理器；用于存储处理器可执行指令的存储器；其中，所述处理器被配置为调用所述存储器存储的指令，以执行上述方法。

根据本公开实施例的一方面，提供了一种计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令被处理器执行时实现上述方法。

根据本公开实施例的一方面，提供了一种计算机程序，所述计算机程序包括计算机可读代码，在计算机可读代码在设备上运行的情况下，设备中的处理器执行时实现上述方法。

根据本公开实施例的一方面，提供了一种计算机程序产品，所述计算机程序产品包括计算机程序或指令，在所述计算机程序或指令在电子设备上运行的情况下，使得所述电子设备执行时实现上述方法。

在本公开实施例中，提取待压缩JPEG图像对应的三个颜色分量的初始离散余弦变换(Discrete Cosine Transform，DCT)系数，分别对三个颜色分量的初始DCT系数按照频率进行排列，得到三个颜色分量的目标DCT系数，对三个颜色分量的目标DCT系数进行熵编码，得到待压缩JPEG图像对应的目标压缩数据，以实现端到端地对待压缩JPEG图像进行图像压缩，从而有效消除待压缩JPEG图像在空间维度和通道维度的冗余，降低待压缩JPEG图像的数据大小，提高待压缩JPEG图像的压缩率。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，而非限制本公开。根据下面参考附图对示例性实施例的详细说明，本公开的其它特征及方面将变得清楚。

附图说明

为了更清楚地说明本公开实施例的技术方案，下面将对本公开实施例中所需要使用的附图进行说明。

此处的附图被并入说明书中并构成本说明书的一部分，这些附图示出了符合本公开的实施例，并与说明书一起用于说明本公开的技术方案。

图1示出根据本公开实施例的一种图像处理方法的流程图；

图2示出根据本公开实施例的初始DCT系数的示意图；

图3示出根据本公开实施例的对图2所示的初始DCT系数按照不同频率进行排列的示意图；

图4示出根据本公开实施例的图像编解码神经网络的示意图；

图5示出根据本公开实施例的确定Y分量对应的DCT系数矩阵的示意图；

图6示出根据本公开实施例的MLCC模型的示意图；

图7示出根据本公开实施例的一种图像处理装置的框图；

图8示出根据本公开实施例的一种电子设备的框图。

具体实施方式

以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面，但是除非特别指出，不必按比例绘制附图。

在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。

本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合，例如，包括A、B、C中的至少一种，可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。

另外，为了更好地说明本公开，在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解，没有某些具体细节，本公开同样可以实施。在一些实例中，对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述，以便于凸显本公开的主旨。

JPEG标准目前是被广泛支持和使用的图像压缩标准。在数据中心、云存储和云文件系统中心广泛存在。根据调查，在Dropbox这类云存储文件系统中，JPEG占据35％。然而，由于JPEG技术本身的限制，依靠手工设计的压缩模块，很难充分消除数据冗余。

相关技术中，JPEG已经被大量图像压缩技术所超越，例如：JPEG2000、BPG、VVC/H.266帧内编码以及大量基于深度学习的图像压缩技术。尽管这些压缩技术在压缩率上取得了显著优于JPEG的效果，但是这些压缩技术仍未得到广泛的支持和使用。而且，这些压缩技术显著不同于JPEG，因此也无法处理已经存在的海量JPEG文件。

为了处理已经存在的海量JPEG文件，相关技术中利用一些压缩技术在JPEG的基础上引入了无损压缩，使得在保证原始JPEG文件无损的情况下，压缩JPEG文件的体积，从而节约海量的存储和带宽资源。这些压缩技术包括Lepton、Packjpg、MozJPEG、JPEGrescan、JPEG XL、Cmix等。这些压缩技术通常需要通过特征工程的方式，人工设计预测器和上下文模型，导致这些压缩技术的压缩率较低。

本公开实施例提供的图像处理方法，可以应用于对已经存在的海量JPEG文件进行再压缩，提取待压缩JPEG图像对应的三个颜色分量的初始DCT系数，分别对三个颜色分量的初始DCT系数按照不同频率进行排列，得到三个颜色分量的目标DCT系数，对三个颜色分量的目标DCT系数进行熵编码，得到待压缩JPEG图像对应的目标压缩数据，以实现端到端地对待压缩JPEG图像进行图像压缩，从而有效消除待压缩JPEG图像在空间维度和通道维度的冗余，降低待压缩JPEG图像的数据大小，提高待压缩JPEG图像的压缩率

下面详细介绍本公开实施例提供的用于对待压缩JPEG图像进行再压缩的图像处理方法。

图1示出根据本公开实施例的一种图像处理方法的流程图。该图像处理方法可以由终端设备或服务器等电子设备执行，终端设备可以为用户设备(User Equipment，UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字助理(Personal Digital Assistant，PDA)、手持设备、计算设备、车载设备、可穿戴设备等，该图像处理方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。或者，可通过服务器执行该图像处理方法。如图1所示，该图像处理方法包括步骤S11至S13：

在S11中，提取待压缩JPEG图像对应的三个颜色分量的初始DCT系数。

在需要对待压缩JPEG图像进行再压缩的情况下，从待压缩JPEG图像的码流中提取出三个颜色分量的初始DCT系数，以执行后续再压缩过程。

在S12中，分别对三个颜色分量的初始DCT系数按照不同频率进行排列，得到三个颜色分量的目标DCT系数。

图2示出根据本公开实施例的初始DCT系数的示意图。图2所示的可以是任意一个颜色分量的初始DCT系数。如图2所示，初始DCT系数的大小是16×16×1，其中包括4个8×8×1大小的DCT块，每个DCT块中包括64个不同频率的系数。其中，不同DCT块中相对位置相同的系数具有相同的频率，相对位置不同的系数具有不同的频率。如图2所示，每个DCT块中包括0～63个不同位置。每个DCT块中0位置的系数频率相同，1位置的系数频率相同，以此类推。

对初始DCT系数按照不同频率进行排列，可以目标DCT系数。后文会结合本公开可能的实现方式，对初始DCT系数按照不同频率进行排列得到目标DCT系数的过程做详细描述，此处不做赘述。

在S13中，对三个颜色分量的目标DCT系数进行熵编码，得到待压缩JPEG图像对应的目标压缩数据。

本公开实施例对三个颜色分量的目标DCT系数进行熵编码，有效消除待压缩JPEG图像在空间维度和通道维度的冗余，以实现端到端地对待压缩JPEG图像进行图像压缩，得到目标压缩数据。后文会结合本公开可能的实现方式，对每个颜色分量的目标DCT系数进行熵编码的过程做详细描述，此处不做赘述。

在本公开实施例中，提取待压缩JPEG图像对应的三个颜色分量的初始DCT系数，分别对三个颜色分量的初始DCT系数按照不同频率进行排列，得到三个颜色分量的目标DCT系数，对三个颜色分量的目标DCT系数进行熵编码，得到待压缩JPEG图像对应的目标压缩数据，以实现端到端地对待压缩JPEG图像进行图像压缩，从而有效消除待压缩JPEG图像在空间维度和通道维度的冗余，降低待压缩JPEG图像的数据大小，提高待压缩JPEG图像的压缩率。

在一种可能的实现方式中，分别对三个颜色分量的初始DCT系数按照不同频率进行排列，得到三个颜色分量的目标DCT系数，包括：针对任意一个颜色分量的初始DCT系数，从初始DCT系数中，将相同频率的系数构成空间维度，将不同频率的系数构成通道维度，得到多通道DCT子系数；对初始DCT系数进行zigzag扫描(即“之”字形扫描)，确定zigzag排序；基于zigzag排序，对多通道DCT子系数在通道维度进行排列，得到初始DCT系数对应的目标DCT系数。

针对任意一个颜色分量，对该颜色分量的初始DCT系数进行预处理，按照不同频率在通道维度进行zigzag排序，以使得得到的该颜色分量的目标DCT系数，在空间维度和通道维度上都存在一定结构性的冗余信息，后续编码过程可以充分利用这些冗余信息，有效实现在空间维度和通道维度对该颜色分量的目标DCT系数进行熵编码。

图3示出根据本公开实施例的对图2所示的初始DCT系数按照不同频率进行排列的示意图。如图3所示，针对图2所示的16×16×1大小的初始DCT系数，提取初始DCT系数中相同频率的系数构成空间维度，不同频率的系数构成通道维度，得到64个通道的DCT子系数，每个通道的DCT子系数在空间维度的大小是2×2。

对图2所示的初始DCT系数进行zigzag扫描，得到zigzag排序，其中，zigzag排序是对不同DCT块中的位置进行重新排序。针对每个DCT块，zigzag排序为0、1、8、16、9、2、3、……、61、54、47、55、62、63。

基于上述zigzag排序，对64个通道的DCT子系数在通道维度上进行重新排序，得到图3中的目标DCT系数，其中，目标DCT系数的大小是2×2×64。

在一种可能的实现方式中，对三个颜色分量的目标DCT系数进行熵编码，得到待压缩JPEG图像对应的目标压缩数据，包括：利用图像编解码神经网络，对三个颜色分量的目标DCT系数进行熵编码，得到目标压缩数据。

利用预先训练好的，用于对待压缩JPEG图像进行无损再压缩的图像编解码神经网络模型，对三个颜色分量的目标DCT系数进行熵编码，实现端到端地对待压缩JPEG图像进行图像压缩，从而直接输出待压缩JPEG图像对应的目标压缩数据，有效提高待压缩JPEG图像的压缩率。

在一种可能的实现方式中，三个颜色分量包括：一个亮度分量Y和两个色度分量Cb和Cr。

相对于Cb分量和Cr分量，Y分量包含待压缩JPEG图像中更丰富的信息。

在一种可能的实现方式中，图像编解码神经网络中包括多级跨通道自回归熵编码模型(Multi-Level Cross-Channel Entropy Model，MLCC)，目标压缩数据中包括Y分量对应的编码信息；利用图像编解码神经网络，对三个颜色分量的目标DCT系数进行熵编码，得到目标压缩数据，包括：利用MLCC模型，对三个颜色分量中的Y分量在通道维度进行多级通道自回归熵编码，得到Y分量对应的编码信息。

由于Y分量包含待压缩JPEG图像中更丰富的信息，因此，利用MLCC模型对Y分量在通道维度进行多级通道自回归熵编码，以有效降低Y分量的内部数据冗余，实现对Y分量的目标DCT系数进行熵编码，降低Y分量的数据大小。

图4示出根据本公开实施例的图像压缩神经网络的示意图。如图4所示，图像编解码神经网络中包括跨颜色熵编码模型401(Cross-color Entropy Model)和MLCC模型402。

仍以上述图4为例，如图4所示，在对待压缩JPEG图像的三个颜色分量的初始DCT系数进行预处理，得到Y、Cb、Cr三个颜色分量的目标DCT系数之后，如图4所示，将Y、Cb、Cr三个颜色分量的目标DCT系数输入图像编解码神经网络的跨颜色熵编码模型401，进行后续编码处理。

在一种可能的实现方式中，在对三个颜色分量的目标DCT系数进行熵编码之前，该图像处理方法还包括：对三个颜色分量的目标DCT系数进行融合，得到融合后DCT系数；基于融合后DCT系数，确定共享超先验信息；对共享超先验信息进行拆分，得到每个颜色分量对应的编码先验信息。

对三个颜色分量的目标DCT系数进行融合得到融合后DCT系数，以使得可以利用不同颜色分量之间的相关性，基于融合后DCT系数确定共享超先验信息，进而再通过对共享超先验信息进行拆分，可以得到每个颜色分量对应的编码先验信息，以用于后续编码处理。

仍以上述图4为例，如图4所示，跨颜色熵编码模型中包括系数融合模块4011(Coefficient Fusion Model，CFM)、超级编码器4012(Hyper Encoder)、量化模块4013(Q)、超级解码器4014(Hyper Decoder)、系数先验拆分模块4015(Coefficient Prior Split Model，CPSM)、熵参数预测模块4016(Entropy Parameters)。

利用系数融合模块4011对Y、Cb、Cr三个颜色分量的目标DCT系数进行融合，得到融合后DCT系数。由于待压缩JPEG图像可能有YCbCr 4:4:4、YCbCr 4:1:1、YCbCr 4:2:0等不同分辨率格式，在待压缩JPEG图像不是YCbCr 4:4:4这种全分辨率格式的情况下，为了使得Y、Cb、Cr三个颜色分量能够更好地融合，需要在融合之前对Y、Cb、Cr三个颜色分量进行分辨率对齐。

在一些实施例中，在待压缩JPEG图像是YCbCr 4:2:0这种分辨率格式的情况下，可以表示Cb分量和Cr分量具有相同的分辨率，Y分量的分辨率是Cb分量、Cr分量的2倍，此时，对Y分量的目标DCT系数进行2倍下采样处理，以使得下采样之后的Y分量的目标DCT系数，与Cb分量的目标DCT系数、Cr分量的目标DCT系数具有相同的分辨率，进而，对下采样之后的Y分量的目标DCT系数、Cb分量的目标DCT系数、Cr分量的目标DCT系数进行融合，得到融合后DCT系数。

仍以上述图4为例，如图4所示，系数融合模块4011输出的融合后DCT系数，输入超级编码器4012进行超先验预测，得到初始超先验信息z，进而将超级编码器4012输出的初始超先验信息z，输入量化模块4013进行量化，从而有效得到共享超先验信息

量化模块4013输出的共享超先验信息

经过超级解码器4014和系数先验拆分模块4015之后，有效拆分得到三个颜色分量对应的编码先验信息：Cr分量对应的编码先验信息Cr _prior、Cb分量对应的编码先验信息Cb _prior、Y分量对应的编码先验信息Y _prior。

在一种可能的实现方式中，目标压缩数据包括：超先验编码信息、Cr分量对应的编码信息、Cb分量对应的编码信息、Y分量对应的编码信息；对三个颜色分量的目标DCT系数进行熵编码，得到待压缩JPEG图像对应的目标压缩数据，包括：对共享超先验信息进行熵编码，得到超先验编码信息；基于每个颜色分量对应的编码先验信息，依次对Cr分量的目标DCT系数、Cb分量的目标DCT系数、Y分量的目标DCT系数进行熵编码，得到Cr分量对应的编码信息、Cb分量对应的编码信息、Y分量对应的编码信息。

依次对超先验编码信息、Cr分量的目标DCT系数、Cb分量的目标DCT系数、Y分量的目标DCT系数进行熵编码，有效消除待压缩JPEG图像在空间维度和通道维度的冗余，得到压缩后的目标压缩数据。

在一种可能的实现方式中，熵编码为算术编码。

利用熵编码中的算术编码对待压缩JPEG图像进行压缩，可以有效提高压缩效果。

仍以上述图4为例，图4所示的跨颜色熵编码模型401和MLCC模型402中均包括算术编码器403(Arithmetic Encoder，AE)，用于进行算术编码。

在确定共享超先验信息

之后，可以进一步对共享超先验信息

进行熵编码，以及将编码后得到的共享超先验编码信息，作为附加信息存储在目标压缩数据中。

仍以上述图4为例，如图4所示，跨颜色熵编码模型中还包括因式熵模块4017(Factorized Entropy)，利用因式熵模块4017和算术编码器403(AE)，对共享超先验信息

进行算术编码，得到共享超先验编码信息。

在一种可能的实现方式中，基于每个颜色分量对应的编码先验信息，依次对Cr分量的目标DCT系数、Cb分量的目标DCT系数、Y分量的目标DCT系数进行熵编码，得到Cr分量对应的编码信息、Cb分量对应的编码信息、Y分量对应的编码信息，包括：基于Cr分量对应的编码先验信息，对Cr分量的目标DCT系数进行熵编码，得到Cr分量对应的编码信息；基于Cb分量对应的编码先验信息、Cr分量的目标DCT系数，对Cb分量的目标DCT系数进行熵编码，得到Cb分量对应的编码信息；基于Y分量对应的编码先验信息、Cr分量的目标DCT系数、Cb分量的目标DCT系数，对Y分量的目标DCT系数进行熵编码，得到Y分量对应的编码信息。

基于Cr分量对应的编码先验信息，直接对Cr分量的目标DCT系数进行熵编码；在对Cr分量的目标DCT系数进行熵编码完成之后，利用Cb分量对应的编码先验信息，以Cr分量的目标DCT系数作为上下文信息，有效对Cb分量的目标DCT系数进行熵编码；在对Cb分量的目标DCT系数进行熵编码完成之后，利用Y分量对应的编码先验信息，以Cr分量的目标DCT系数、Cr分量的目标DCT系数作为上下文信息，有效对Y分量的目标DCT系数进行熵编码，从而有效消除不同颜色分量之间的数据冗余。

在一种可能的实现方式中，基于Cr分量对应的编码先验信息，对Cr分量的目标DCT系数进行熵编码，得到Cr分量对应的编码信息，包括：基于Cr分量对应的编码先验信息，确定Cr分量的目标DCT系数对应的概率质量函数(Probability Mass Function，PMF)；基于Cr分量的目标DCT系数对应的PMF，对Cr分量的目标DCT系数进行熵编码，得到Cr分量对应的编码信息。

基于Cr分量对应的编码先验信息，确定Cr分量的目标DCT系数对应的PMF，以有效实现对Cr分量的目标DCT系数进行熵编码，降低Cr分量的数据大小。

仍以上述图4为例，如图4所述，利用Cr分量对应的编码先验信息Cr _prior，直接确定Cr分量的目标DCT系数对应的PMF，进而利用算术编码器403，基于Cr分量的目标DCT系数对应的PMF对Cr分量的目标DCT系数进行算术编码，得到Cr分量对应的编码信息。

在一种可能的实现方式中，基于Cb分量对应的编码先验信息、Cr分量的目标DCT系数，对Cb分量的目标DCT系数进行熵编码，得到Cb分量对应的编码信息，包括：基于Cb分量对应的编码先验信息、Cr分量的目标DCT系数，确定Cb分量的目标DCT系数对应的PMF；基于Cb分量的目标DCT系数对应的PMF，对Cb分量的目标DCT系数进行熵编码，得到Cb分量对应的编码信息。

为了充分利用Cr分量和Cb分量之间结构上的冗余信息，在对Cr分量进行熵编码之后，将Cr分量的目标DCT系数作为上下文信息，以使得基于Cb分量对应的编码先验信息、Cr分量的目标DCT系数，确定Cb分量的目标DCT系数对应的PMF，以有效实现对Cb分量的目标DCT系数进行熵编码，降低Cb分量的数据大小。

仍以上述图4为例，如图4所示，跨颜色熵编码模型401中还包括熵参数预测模块4016(Entropy Parameters)，在对Cr分量的目标DCT系数进行熵编码之后，将Cr分量的目标DCT系数、Cb分量对应的编码先验信息Cb _prior输入熵参数预测模块4016，以使得利用熵参数预测模块4016，输出Cb分量的目标DCT系数对应的PMF。进而利用算术编码器403，基于Cb分量的目标DCT系数对应的PMF对Cb分量的目标DCT系数进行算术编码，得到Cb分量对应的编码信息。

在一种可能的实现方式中，基于Y分量对应的编码先验信息、Cr分量的目标DCT系数、Cb分量的目标DCT系数，对Y分量的目标DCT系数进行熵编码，得到Y分量对应的编码信息，包括：基于Y分量对应的编码先验信息、Cr分量的目标DCT系数、Cb分量的目标DCT系数，确定Y分量对应的概率分布参数；基于Y分量对应的概率分布参数，利用多级通道自回归，对Y分量的目标DCT系数进行熵编码，得到Y分量对应的编码信息。

为了充分利用Cr分量、Cb分量、Y分量之间结构上的冗余信息，在对Cr分量、Cb分量进行熵编码之后，将Cr分量的目标DCT系数、Cb分量的目标DCT系数作为上下文信息，以使得基于Y分量对应的编码先验信息、Cr分量的目标DCT系数、Cb分量的目标DCT系数，确定Y分量对应的概率分布参数，由于Y分量包含待压缩JPEG图像中更丰富的信息，直接基于Y分量对应的概率分布参数构建用于熵编码的PMF并不准确，因此，基于Y分量对应的概率分布参数，利用多级通道自回归，以有效降低Y分量的内部数据冗余，实现对Y分量的目标DCT系数进行熵编码，降低Y分量的数据大小。

在待压缩JPEG图像不是YCbCr 4:4:4这种全分辨率格式的情况下，为了使得Cb、Cr分量能够更好地作为Y分量的上下文信息，需要对Y、Cb、Cr三个颜色分量进行分辨率对齐。

在一些实施例中，在待压缩JPEG图像是YCbCr 4:2:0这种分辨率格式的情况下，可以表示Cb、Cr分量具有相同的分辨率，Y分量的分辨率是Cb、Cr分量的2倍，此时，分别对Cb、Cr分量的目标DCT系数进行2倍上采样处理，以使得上采样之后的Cb、Cr分量的目标DCT系数，与Y分量的目标DCT系数具有相同的分辨率。

仍以上述图4为例，如图4所示，跨颜色熵编码模型401中还包括上采样模块404(Up)，利用上采样模块分别对Cb、Cr分量的目标DCT系数进行上采样处理，以使得上采样之后的Cb、Cr分量的目标DCT系数，与Y分量的目标DCT系数具有相同的分辨率。进而，对上采样之后的Cb、Cr分量的目标DCT系数进行融合之后，连同Y分量对应的编码先验信息Y _prior，输入熵参数预测模块4016，以使得利用熵参数预测模块 4016，输出Y分量对应的概率分布参数hyper _y。

将Y分量对应的概率分布参数hyper _y、Y分量的目标DCT系数，输入MLCC模型402，以实现利用多级通道自回归，对Y分量的目标DCT系数进行熵编码，得到Y分量对应的编码信息。

在一种可能的实现方式中，基于Y分量对应的概率分布参数，利用多级通道自回归，对Y分量的目标DCT系数进行熵编码，得到Y分量对应的编码信息，包括：对Y分量的目标DCT系数进行空间维度到通道维度的转换，得到Y分量的转换后DCT系数；按照预设矩阵形式，对Y分量的转换后DCT系数进行拆解，得到Y分量对应的DCT系数矩阵；基于Y分量对应的概率分布参数，利用多级通道自回归，对DCT系数矩阵进行熵编码，得到Y分量对应的编码信息。

确定Y分量对应的DCT系数矩阵，进而基于Y分量对应的概率分布参数，基于Y分量对应的概率分布参数，有效利用DCT系数矩阵中存在的结构性的冗余信息，对DCT系数矩阵进行多级通道自回归式的熵编码，降低Y分量的数据大小。

图5示出根据本公开实施例的确定Y分量对应的DCT系数矩阵的示意图。在Y分量的初始DCT系数的大小是32×32×1的情况下，利用图3所示的对初始DCT系数按照不同频率进行排列的方式，对32×32×1大小的Y分量的初始DCT系数进行排列之后，可以得到图5所示的4×4×64大小的Y分量的目标DCT系数。

如图5所示，在空间维度将Y分量的目标DCT系数进行2×2大小的分区，每个分区中包括1～4个不同位置，进而对分区之后的Y分量的目标DCT系数进行空间维度到通道维度501(Space-to-depth)的转换，得到Y分量的转换后DCT系数，如图5所示，Y分量的转换后DCT系数的大小为2×2×(64×4)，即Y分量的转换后DCT系数在通道维度从64个通道增加到256个通道。

在一种可能的实现方式中，按照预设矩阵形式，对Y分量的转换后DCT系数进行拆解，得到Y分量对应的DCT系数矩阵，包括：按照预设矩阵形式，对Y分量的转换后DCT系数进行空间维度的拆解，得到DCT系数矩阵的多个行；对DCT系数矩阵的每一行进行通道维度的拆解，得到每一行的多个列。

按照预设矩阵形式，对Y分量的转换后DCT系数进行空间维度和通道维度的拆解，以使得拆解之后得到的DCT系数矩阵的行、列具有一定结构性的冗余信息，以使得可以利用该冗余信息，有效实现后续对DCT系数矩阵进行多级通道自回归式的熵编码。

仍以上述图5为例，如图5所示，按照预设矩阵形式，对2×2×(64×4)大小的Y分量的转换后DCT系数在空间维度进行行拆解502(Row Split)，得到DCT系数矩阵中的四个行：r ⁽¹⁾、r ⁽²⁾、r ⁽³⁾、r ⁽⁴⁾，每一行中包括2×2×64大小的DCT系数。

针对DCT系数矩阵中2×2×64大小的每一行，在通道维度进行列拆解503(Column Split)，得到每一行中的多个列：

其中，i＝1、2、3、4。

每一行中的列数n，以及每列中包含的通道数均相同，具体取值可以根据实际情况进行设置，本公开对此不作具体限定。

例如，n＝9，即DCT系数矩阵的每一行中包括9个列：

其中，i＝1、2、3、4，j＝1、2、……、9。其中，每个列包括的通道数分别是28、8、7、6、5、4、3、2、1。则对r ⁽¹⁾在通道维度进行拆分之后，得到r ⁽¹⁾中的9个列：

对r ⁽²⁾、r ⁽³⁾、r ⁽⁴⁾在通道维度的拆分与此类似，此处不做赘述。

在拆解得到Y分量对应的DCT系数矩阵之后，基于Y分量对应的概率分布参数，对DCT系数矩阵进行多级通道自回归式的熵编码。

图6示出根据本公开实施例的MLCC模型的示意图。如图6所示，MLCC模型包括外部通道模块601(Outer Channel)和内部通道模块602(Inner Channel)。

外部通道模块601中包括空间维度到通道维度转换单元6011(Space-to-depth)、行拆解单元6012(Row Split)。利用空间维度到通道维度转换单元6011，对Y分量的目标DCT系数进行空间维度到通道维度的转换，得到Y分量的转换后DCT系数Y'。进而，利用行拆解单元6012，对Y分量的转换后DCT系数Y'在空间维度进行行拆解，得到DCT系数矩阵中的四个行：r ⁽¹⁾、r ⁽²⁾、r ⁽³⁾、r ⁽⁴⁾，拆解得到的四个行输入对应的内部通道模块602进行多级通道自回归式的熵编码。

在一种可能的实现方式中，基于Y分量对应的概率分布参数，利用多级通道自回归，对DCT系数矩阵进行熵编码，得到Y分量对应的编码信息，包括：基于Y分量对应的概率分布参数，利用多级通道自回归，依次确定DCT系数矩阵的每一行中每一列对应的PMF；利用DCT系数矩阵的每一行中每一列对应的PMF，对DCT系数矩阵的每一行中每一列进行熵编码，得到DCT系数矩阵的每一行中每一列对应的编码信息；其中，DCT系数矩阵的每一行中每一列对应的编码信息，构成Y分量对应的编码信息。

为了充分利用DCT系数矩阵中每一行每一列之间结构上的冗余信息，基于Y分量对应的概率分布参数，利用多级通道自回归，依次确定DCT系数矩阵的每一行中每一列对应的PMF，以有效实现对DCT系数矩阵的每一行中每一列进行熵编码，降低Y分量的数据大小。

仍以上述图6为例，针对DCT系数矩阵的第i行r ⁽ⁱ⁾中的每一列，确定第i行r ⁽ⁱ⁾中的每一列对应的PMF，进而利用第i行r ⁽ⁱ⁾中的每一列对应的PMF，对第i行r ⁽ⁱ⁾中的每一列进行熵编码。

在一种可能的实现方式中，基于Y分量对应的概率分布参数，利用多级通道自回归，依次确定DCT系数矩阵的每一行中每一列对应的PMF，包括：基于Y分量对应的概率分布参数，利用多级通道自回归，依次确定DCT系数矩阵中每一行对应的编码先验信息；针对DCT系数矩阵的第i行，基于第i行对应的编码先验信息，利用多级通道自回归，确定第i行中每一列对应的PMF，其中，i表示行数。

基于Y分量对应的概率分布参数，利用多级通道自回归，依次确定DCT系数矩阵中每一行对应的编码先验信息，进而针对DCT系数矩阵中的任意第i行，可以基于第i行对应的编码先验信息，利用多级通道自回归，确定第i行中每一列对应的准确度较高的PMF，以用于后续对第i行中每一列进行熵编码。

在一种可能的实现方式中，基于Y分量对应的概率分布参数，利用多级通道自回归，依次确定DCT系数矩阵中每一行对应的编码先验信息，包括：针对DCT系数矩阵的第1行，基于Y分量对应的概率分布参数，确定第1行对应的编码先验信息；在i>1的情况下，针对DCT系数矩阵的第i行，基于Y分量对应的概率分布参数、DCT系数矩阵的第1行至第i-1行，确定第i行对应的编码先验信息。其中，i>1为i大于1.

针对DCT系数矩阵中每一行，除了第1行仅基于Y分量对应的概率分布参数确定其对应的编码先验信息之外，剩余的其它任意第i行，均以之前的第1行至第i-1行作为上下文信息，来确定其对应的编码先验信息，以实现在行方向上的自回归，提高每行对应的编码先验信息的准确性。

针对DCT系数矩阵中第i行，在确定第i行对应的编码先验信息之后，利用第i行对应的编码先验信息，对第i行中的每一列进行熵编码，在对第i行中的所有列进行熵编码完成之后，再以第i行作为上下文信息，确定第i+1行对应的编码先验信息。

仍以上述图6为例，如图6所示，利用空间维度到通道维度转换单元6011，对Y分量对应的概率分布参数hyper _y进行空间维度到通道维度的转换，得到转换后概率分布参数h'。

如图6所示，外部通道模块601中还包括参数模块6013(Param)，将转换后概率分布参数h'输入参数模块6013，输出DCT系数矩阵的第1行对应的编码先验信息pri ⁽¹⁾；将DCT系数矩阵的第1行r ⁽¹⁾、第1行对应的编码先验信息pri ⁽¹⁾输入内部通道模块602，以对DCT系数矩阵的第1行r ⁽¹⁾中的每一列进行熵编码。

在对DCT系数矩阵的第1行r ⁽¹⁾中的所有列进行熵编码之后，将转换后概率分布参数h'、DCT系数矩阵的第1行r ⁽¹⁾合并之后输入参数模块6013，输出DCT系数矩阵的第2行对应的编码先验信息pri ⁽²⁾；将DCT系数矩阵的第2行r ⁽²⁾、第2行对应的编码先验信息pri ⁽²⁾输入内部通道模块602，以对DCT系数矩阵的第2行r ⁽²⁾中的每一列进行熵编码。

在对DCT系数矩阵的第2行r ⁽²⁾中的所有列进行熵编码之后，将转换后概率分布参数h'、DCT系数矩阵的第1行r ⁽¹⁾、DCT系数矩阵的第2行r ⁽²⁾合并之后输入参数模块6013，输出DCT系数矩阵的第3行对应的编码先验信息pri ⁽³⁾；将DCT系数矩阵的第3行r ⁽³⁾、第3行对应的编码先验信息pri ⁽³⁾输入内部通道模块602，以对DCT系数矩阵的第3行r ⁽³⁾中的每一列进行熵编码。

在对DCT系数矩阵的第3行r ⁽³⁾中的所有列进行熵编码之后，将转换后概率分布参数h'、DCT系数矩阵的第1行r ⁽¹⁾、DCT系数矩阵的第2行r ⁽²⁾、DCT系数矩阵的第3行r ⁽³⁾合并之后输入参数模块6013，输出DCT系数矩阵的第4行对应的编码先验信息pri ⁽⁴⁾；将DCT系数矩阵的第4行r ⁽⁴⁾、第4行对应的编码先验信息pri ⁽⁴⁾输入内部通道模块602，以对DCT系数矩阵的第4行r ⁽⁴⁾中的每一列进行熵编码。

在一种可能的实现方式中，基于第i行对应的编码先验信息，利用多级通道自回归，确定第i行中每一列对应的PMF，包括：针对DCT系数矩阵的第i行第1列，基于第i行对应的编码先验信息，确定第i行第1列对应的PMF；在j>1的情况下，针对DCT系数矩阵的第i行第j列，基于第i行对应的编码先验信息、DCT系数矩阵的第i行中第1列至第j-1列，确定第i行第j列对应的PMF，其中，j表示列数。

针对DCT系数矩阵任意第i行中的每一列，除了第1列仅基于第i行对应的编码先验信息确定其对应的PMF之外，剩余的其它任意第j列，均以之前的第1列至第j-1列作为上下文信息，来确定其对应的PMF，以实现在列方向上的自回归，提高第i行中每一列对应的PMF的准确性。

针对DCT系数矩阵中第i行中的第j列，在确定第i行第j列对应的PMF之后，利用第i行第j列对应的PMF，对第i行第j列进行熵编码，在对第i行第j列进行熵编码完成之后，再以第i行第j列作为上下文信息，确定第i行第j+1列对应的PMF。

仍以上述图6为例，如图6所示，内部通道模块602中包括列拆解单元6021(Column Split)，针对DCT系数矩阵的第i行r ⁽ⁱ⁾，利用列拆解单元6021，对DCT系数矩阵的第i行r ⁽ⁱ⁾在通道维度进行行拆解，得到DCT系数矩阵的第i行r ⁽ⁱ⁾中的n个列：

针对DCT系数矩阵的第i行r ⁽ⁱ⁾中的第1列

将第i行r ⁽ⁱ⁾对应的编码先验信息pri ⁽ⁱ⁾输入参数模块6013，输出第i行r ⁽ⁱ⁾中的第1列

对应的PMF，进而基于第i行r ⁽ⁱ⁾中的第1列

对应的PMF，对第i行r ⁽ⁱ⁾中的第1列

进行熵编码。

在对第i行r ⁽ⁱ⁾中的第1列

进行熵编码之后，将第i行r ⁽ⁱ⁾对应的编码先验信息pri ⁽ⁱ⁾、第i行r ⁽ⁱ⁾中的第1列

合并之后输入参数模块6013，输出第i行r ⁽ⁱ⁾中的第2列

对应的PMF，进而基于第i行r ⁽ⁱ⁾中的第2列

对应的PMF，对第i行r ⁽ⁱ⁾中的第2列

进行熵编码。

在对第i行r ⁽ⁱ⁾中的第2列

第i行r ⁽ⁱ⁾中的第2列合并之后输入参数模块6013，输出第i行r ⁽ⁱ⁾中的第3列

对应的PMF，进而基于第i行r ⁽ⁱ⁾中的第3列

对应的PMF，对第i行r ⁽ⁱ⁾中的第3列

进行熵编码。

以此类推，直至完成对第i行r ⁽ⁱ⁾中所有列的熵编码，此处不做赘述。

在一种可能的实现方式中，利用DCT系数矩阵的每一行中每一列对应的PMF，对DCT系数矩阵的每一行中每一列进行熵编码，得到DCT系数矩阵的每一行中每一列对应的编码信息，包括：在i≥1且j≥1的情况下，针对DCT系数矩阵的第i行第j列，基于第i行第j列对应的PMF，对第i行第j列进行熵编码，得到第i行第j列对应的编码信息。其中，i≥1且j≥1为i大于且等于1和j大于且等于1。

基于DCT系数矩阵的第i行第j列对应的PMF，对第i行第j列进行熵编码，得到第i行第j列对应的编码信息，从而有效降低第i行第j列的数据大小。

仍以上述图6为例，如图6所示，基于第i行r ⁽ⁱ⁾中的第1列

对应的PMF，利用AE，对第i行r ⁽ⁱ⁾中的第1列

进行算术编码，得到第i行r ⁽ⁱ⁾中的第1列

对应的编码信息；基于第i行r ⁽ⁱ⁾中的第2列

对应的PMF，利用AE，对第i行r ⁽ⁱ⁾中的第2列

进行算术编码，得到第i行r ⁽ⁱ⁾中的第2列

对应的编码信息；以此类推，直至完成对第i行r ⁽ⁱ⁾中所有列的算术编码，此处不做赘述。

实际应用中，在对待压缩JPEG图像进行熵编码得到目标压缩数据后，若存在查看待压缩JPEG图像的需求，需要对目标压缩数据进行熵解码，以得到待压缩JPEG图像。

在对目标压缩数据进行熵解码，得到待压缩JPEG图像的解码过程中，可以通过对共享超先验编码信息进行熵解码，得到共享超先验信息

进而再通过对共享超先验信息

进行拆分，可以在解码过程中得到每个颜色分量对应的编码先验信息，以用于对每个颜色分量的编码信息进行后续解码处理。

仍以上述图4为例，如图4所示，跨颜色熵编码模型401中还包括算术解码器405(Arithmetic Decoder，AD)，在解码过程中，利用因式熵模块4017和算术解码器405，对共享超先验编码信息进行熵解码，得到共享超先验信息

进而利用超级解码器4014、系数先验拆分模块4015，以使得在编码过程有效拆分得到，用于对Cr分量对应的编码信息进行熵解码的编码先验信息Cr _prior、用于对Cb分量对应的编码信息进行熵解码的编码先验信息Cb _prior、用于对Y分量对应的编码信息进行熵解码的编码先验信息Y _prior。

利用Cr分量对应的编码先验信息Cr _prior，对Cr分量对应的编码信息进行熵解码的过程，是利用Cr分量对应的编码先验信息Cr _prior，对Cr分量的目标DCT系数进行熵编码的逆过程；在对Cr分量对应的编码信息进行熵解码得到Cr分量的目标DCT系数之后，利用Cb分量对应的编码先验信息Cb _prior、Cr分量的目标DCT系数，对Cb分量对应的编码信息进行熵解码的过程，是利用Cb分量对应的编码先验信息Cb _prior、Cr分量的目标DCT系数，对Cb分量的目标DCT系数进行熵编码的逆过程；在对Cr分量、Cb分量对应的编码信息进行熵解码得到Cr分量、Cb分量的目标DCT系数之后，利用Y分量对应的编码先验信息Y _prior、Cr分量的目标DCT系数、Cb分量的目标DCT系数，对Y分量对应的编码信息进行熵解码的过程，是利用Y分量对应的编码先验信息Y _prior、Cr分量的目标DCT系数、Cb分量的目标DCT系数，对Y分量的目标DCT系数进行熵编码的逆过程；具体熵解码过程此处不做赘述。

在一种可能的实现方式中，该图像处理方法还包括：对初始神经网络进行网络训练，得到目标图像编解码神经网络。

初始神经网络的网络结构与目标图像编解码神经网络的网络结构相同，通过对初始神经网络进行网络训练，以得到目标图像编解码神经网络中跨颜色熵编码模型和MLCC模型的网络参数。网络训练的具体过程可以采用相关技术中的网络训练过程，本公开实施例对此不做具体限定。

可以理解，本公开提及的上述各个方法实施例，在不违背原理逻辑的情况下，均可以彼此相互结合形成结合后的实施例，限于篇幅，本公开不再赘述。本领域技术人员可以理解，在具体实施方式的上述方法中，各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。

此外，本公开还提供了图像处理装置、电子设备、计算机可读存储介质、计算机程序和计算机程序产品，上述均可用来实现本公开提供的任一种图像处理方法，相应技术方案和描述和参见方法部分的相应记载，不再赘述。

图7示出根据本公开实施例的一种图像处理装置的框图。如图7所示，装置70包括：

DCT系数提取部分71，配置为提取待压缩JPEG图像对应的三个颜色分量的初始变换DCT系数；

DCT系数重排部分72，配置为分别对三个颜色分量的初始DCT系数按照不同频率进行排列，得到三个颜色分量的目标DCT系数；

熵编码部分73，配置为对三个颜色分量的目标DCT系数进行熵编码，得到所述待压缩JPEG图像对应的目标压缩数据。

在一种可能的实现方式中，DCT系数重排部分72，具体配置为：

针对任意一个颜色分量的初始DCT系数，从初始DCT系数中，将相同频率的系数构成空间维度，将不同频率的系数构成通道维度，得到多通道DCT子系数；

对初始DCT系数进行zigzag扫描，确定zigzag排序；

基于zigzag排序，对多通道DCT子系数在通道维度进行排列，得到初始DCT系数对应的目标DCT系数。

在一种可能的实现方式中，三个颜色分量包括：亮度分量Y和色度分量Cb、Cr；目标压缩数据包括：超先验编码信息、Cr分量对应的编码信息、Cb分量对应的编码信息、Y分量对应的编码信息；

熵编码部分73，包括：

超先验信息编码子部分，配置为对共享超先验信息进行熵编码，得到超先验编码信息；

颜色分量编码子部分，配置为基于每个颜色分量对应的编码先验信息，依次对Cr分量的目标DCT系数、Cb分量的目标DCT系数、Y分量的目标DCT系数进行熵编码，得到Cr分量对应的编码信息、Cb分量对应的编码信息、Y分量对应的编码信息。

在一种可能的实现方式中，装置70还包括：系数融合部分，配置为在对三个颜色分量的目标DCT系数进行熵编码之前，对三个颜色分量的目标DCT系数进行融合，得到融合后DCT系数；

共享超先验信息确定部分，配置为基于融合后DCT系数，确定共享超先验信息；

编码先验信息确定部分，配置为对共享超先验信息进行拆分，得到每个颜色分量对应的编码先验信息。

在一种可能的实现方式中，颜色分量编码子部分，包括：

Cr分量编码单元，配置为基于Cr分量对应的编码先验信息，对Cr分量的目标DCT系数进行熵编码，得到Cr分量对应的编码信息；

Cb分量编码单元，配置为基于Cb分量对应的编码先验信息、Cr分量的目标DCT系数，对Cb分量的目标DCT系数进行熵编码，得到Cb分量对应的编码信息；

Y分量编码单元，配置为基于Y分量对应的编码先验信息、Cr分量的目标DCT系数、Cb分量的目标DCT系数，对Y分量的目标DCT系数进行熵编码，得到Y分量对应的编码信息。

在一种可能的实现方式中，Cr分量编码单元，具体配置为：

基于Cr分量对应的编码先验信息，确定Cr分量的目标DCT系数对应的PMF；

基于Cr分量的目标DCT系数对应的PMF，对Cr分量的目标DCT系数进行熵编码，得到Cr分量对应的编码信息。

在一种可能的实现方式中，Cb分量编码单元，具体配置为：

基于Cb分量对应的编码先验信息、Cr分量的目标DCT系数，确定Cb分量的目标DCT系数对应的PMF；

基于Cb分量的目标DCT系数对应的PMF，对Cb分量的目标DCT系数进行熵编码，得到Cb分量对应的编码信息。

在一种可能的实现方式中，Y分量编码单元，包括：

概率分布参数确定子单元，配置为基于Y分量对应的编码先验信息、Cr分量的目标DCT系数、Cb分量的目标DCT系数，确定Y分量对应的概率分布参数；

Y分量编码子单元，配置为基于Y分量对应的概率分布参数，利用多级通道自回归，对Y分量的目标DCT系数进行熵编码，得到Y分量对应的编码信息。

在一种可能的实现方式中，Y分量编码子单元，具体配置为：

对Y分量的目标DCT系数进行空间维度到通道维度的转换，得到Y分量的转换后DCT系数；

按照预设矩阵形式，对Y分量的转换后DCT系数进行拆解，得到Y分量对应的DCT系数矩阵；

基于Y分量对应的概率分布参数，利用多级通道自回归，对DCT系数矩阵进行熵编码，得到Y分量对应的编码信息。

在一种可能的实现方式中，Y分量编码子单元，还具体配置为：

按照预设矩阵形式，对Y分量的转换后DCT系数进行空间维度的拆解，得到DCT系数矩阵的多个行；

对DCT系数矩阵的每一行进行通道维度的拆解，得到每一行的多个列；

将多个行和多个行中每一行的多个列，确定为Y分量对应的DCT系数矩阵。

基于Y分量对应的概率分布参数，利用多级通道自回归，依次确定DCT系数矩阵的每一行中每一列对应的PMF；

利用DCT系数矩阵的每一行中每一列对应的PMF，对DCT系数矩阵的每一行中每一列进行熵编码，得到DCT系数矩阵的每一行中每一列对应的编码信息；

其中，DCT系数矩阵的每一行中每一列对应的编码信息，构成Y分量对应的编码信息。

基于Y分量对应的概率分布参数，利用多级通道自回归，依次确定DCT系数矩阵中每一行对应的编码先验信息；

针对DCT系数矩阵的第i行，基于第i行对应的编码先验信息，利用多级通道自回归，确定第i行中每一列对应的PMF，其中，i表示行数。

针对DCT系数矩阵的第1行，基于Y分量对应的概率分布参数，确定第1行对应的编码先验信息；

在i>1的情况下，针对DCT系数矩阵的第i行，基于Y分量对应的概率分布参数、DCT系数矩阵的第1行至第i-1行，确定第i行对应的编码先验信息。

针对DCT系数矩阵的第i行第1列，基于第i行对应的编码先验信息，确定第i行第1列对应的PMF；

在j>1的情况下，针对DCT系数矩阵的第i行第j列，基于第i行对应的编码先验信息、DCT系数矩阵的第i行中的第1列至第j-1列，确定第i行第j列对应的PMF，其中，j表示列数。

在i≥1且j≥1的情况下，针对DCT系数矩阵的第i行第j列，基于第i行第j列对应的PMF，对第i行第j列进行熵编码，得到第i行第j列对应的编码信息。

在一种可能的实现方式中，熵编码为算术编码。

在一种可能的实现方式中，熵编码部分73，具体配置为：

利用图像编解码神经网络，对三个颜色分量的目标DCT系数进行熵编码，得到目标压缩数据。

在一种可能的实现方式中，图像编解码神经网络中包括MLCC模型，目标压缩数据中包括亮度分量Y对应的编码信息；

熵编码部分73，具体配置为：

利用MLCC模型，对三个颜色分量中的Y分量在通道维度进行多级通道自回归熵编码，得到Y分量对应的编码信息。

在本实施例中，DCT系数提取部分71、DCT系数重排部分72、熵编码部分73均可以是处理器或处理组件。

该方法与计算机系统的内部结构存在特定技术关联，且能够解决如何提升硬件运算效率或执行效果的技术问题(包括减少数据存储量、减少数据传输量、提高硬件处理速度等)，从而获得符合自然规律的计算机系统内部性能改进的技术效果。

在一些实施例中，本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法，其具体实现可以参照上文方法实施例的描述，为了简洁，这里不再赘述。

本公开实施例还提出一种计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令被处理器执行时实现上述方法。计算机可读存储介质可以是易失性或非易失性计算机可读存储介质。

本公开实施例还提出一种电子设备，包括：处理器；用于存储处理器可执行指令的存储器；其中，所述处理器被配置为调用所述存储器存储的指令，以执行上述方法。

电子设备可以被提供为终端、服务器或其它形态的设备。

图8示出根据本公开实施例的一种电子设备的框图。参照图8，电子设备800可以是用户设备(User Equipment，UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理(Personal Digital Assistant，PDA)、手持设备、计算设备、车载设备、可穿戴设备等终端设备。

参照图8，该电子设备80的硬件实体包括：处理器81、通信接口82和存储器83，其中：

处理器81通常控制电子设备80的总体操作。

通信接口82可以使电子设备通过网络与其他终端或服务器通信。

存储器83配置为存储由处理器81可执行的指令和应用，还可以缓存待处理器81以及电子设备80中各模块待处理或已经处理的数据(例如，图像数据、音频数据、语音通信数据和视频通信数据)，可以通过闪存(FLASH)或随机访问存储器(Random Access Memory，RAM)实现。处理器81、通信接口82和存储器83之间可以通过总线84进行数据传输。

本公开实施例还提供了一种计算机程序，所述计算机程序包括计算机可读代码，在计算机可读代码在设备上运行的情况下，设备中的处理器执行时实现上述方法。

本公开实施例还提供了一种计算机程序产品，包括计算机可读代码，或者承载有计算机可读代码的非易失性计算机可读存储介质，当所述计算机可读代码在电子设备的处理器中运行时，所述电子设备中的处理器执行上述方法。

本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质，其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。

计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是(但不限于)电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身，诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如，通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备，或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令，并转发该计算机可读程序指令，以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码，所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等，以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中，通过利用计算机可读程序指令的状态信息来个性化定制电子电路，例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)，该电子电路可以执行计算机可读程序指令，从而实现本公开的各个方面。

这里参照根据本公开实施例的方法、装置(系统)、计算机程序和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解，流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合，都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器，从而生产出一种机器，使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时，产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中，这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作，从而，存储有指令的计算机可读介质则包括一个制造品，其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上，使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤，以产生计算机实现的过程，从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法、计算机程序和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分，所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中，所述计算机程序产品具体体现为计算机存储介质，在另一个可选实施例中，计算机程序产品具体体现为软件产品，例如软件开发包(Software Development Kit，SDK)等等。

上文对各个实施例的描述倾向于强调各个实施例之间的不同之处，其相同或相似之处可以互相参考，为了简洁，本文不再赘述。

本领域技术人员可以理解，在具体实施方式的上述方法中，各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定，各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。

若本公开技术方案涉及个人信息，应用本公开技术方案的产品在处理个人信息前，已明确告知个人信息处理规则，并取得个人自主同意。若本公开技术方案涉及敏感个人信息，应用本公开技术方案的产品在处理敏感个人信息前，已取得个人单独同意，并且同时满足“明示同意”的要求。例如，在摄像头等个人信息采集装置处，设置明确显著的标识告知已进入个人信息采集范围，将会对个人信息进行采集，若个人自愿进入采集范围即视为同意对其个人信息进行采集；或者在个人信息处理的装置上，利用明显的标识/信息告知个人信息处理规则的情况下，通过弹窗信息或请个人自行上传其个人信息等方式获得个人授权；其中，个人信息处理规则可包括个人信息处理者、个人信息处理目的、处理方式以及处理的个人信息种类等信息。

以上已经描述了本公开的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进，或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims

一种图像处理方法，包括：

提取待压缩联合图像专家组JPEG图像对应的三个颜色分量的初始离散余弦变换DCT系数；

分别对所述三个颜色分量的初始DCT系数按照不同频率进行排列，得到所述三个颜色分量的目标DCT系数；

对所述三个颜色分量的目标DCT系数进行熵编码，得到所述待压缩JPEG图像对应的目标压缩数据。
根据权利要求1所述的方法，其中，所述分别对所述三个颜色分量的初始DCT系数按照不同频率进行排列，得到所述三个颜色分量的目标DCT系数，包括：

针对任意一个颜色分量的初始DCT系数，从所述初始DCT系数中，将相同频率的系数构成空间维度，将不同频率的系数构成通道维度，得到多通道DCT子系数；

对所述初始DCT系数进行之字形zigzag扫描，确定zigzag排序；

基于所述zigzag排序，对所述多通道DCT子系数在通道维度进行排列，得到所述初始DCT系数对应的目标DCT系数。
根据权利要求2所述的方法，其中，所述三个颜色分量包括：亮度分量Y和色度分量Cb、Cr；所述目标压缩数据包括：超先验编码信息、Cr分量对应的编码信息、Cb分量对应的编码信息、Y分量对应的编码信息；

所述对所述三个颜色分量的目标DCT系数进行熵编码，得到所述待压缩JPEG图像对应的目标压缩数据，包括：

对共享超先验信息进行熵编码，得到所述超先验编码信息；

基于每个颜色分量对应的编码先验信息，依次对所述Cr分量的目标DCT系数、所述Cb分量的目标DCT系数、所述Y分量的目标DCT系数进行熵编码，得到所述Cr分量对应的编码信息、所述Cb分量对应的编码信息、所述Y分量对应的编码信息。
根据权利要求3所述的方法，其中，在对所述三个颜色分量的目标DCT系数进行熵编码之前，所述方法还包括：

对所述三个颜色分量的目标DCT系数进行融合，得到融合后DCT系数；

基于所述融合后DCT系数，确定所述共享超先验信息；

对所述共享超先验信息进行拆分，得到所述每个颜色分量对应的编码先验信息。
根据权利要求3或4所述的方法，其中，所述基于每个颜色分量对应的编码先验信息，依次对所述Cr分量的目标DCT系数、所述Cb分量的目标DCT系数、所述Y分量的目标DCT系数进行熵编码，得到所述Cr分量对应的编码信息、所述Cb分量对应的编码信息、所述Y分量对应的编码信息，包括：

基于所述Cr分量对应的编码先验信息，对所述Cr分量的目标DCT系数进行熵编码，得到所述Cr分量对应的编码信息；

基于所述Cb分量对应的编码先验信息、所述Cr分量的目标DCT系数，对所述Cb分量的目标DCT系数进行熵编码，得到所述Cb分量对应的编码信息；

基于所述Y分量对应的编码先验信息、所述Cr分量的目标DCT系数、所述Cb分量的目标DCT系数，对所述Y分量的目标DCT系数进行熵编码，得到所述Y分量对应的编码信息。
根据权利要求5所述的方法，其中，所述基于所述Cr分量对应的编码先验信息，对所述Cr分量的目标DCT系数进行熵编码，得到所述Cr分量对应的编码信息，包括：

基于所述Cr分量对应的编码先验信息，确定所述Cr分量的目标DCT系数对应的概率质量函数PMF；

基于所述Cr分量的目标DCT系数对应的PMF，对所述Cr分量的目标DCT系数进行熵编码，得到所述Cr分量对应的编码信息。
根据权利要求5或6所述的方法，其中，所述基于所述Cb分量对应的编码先验信息、所述Cr分量的目标DCT系数，对所述Cb分量的目标DCT系数进行熵编码，得到所述Cb分量对应的编码信息，包括：

基于所述Cb分量对应的编码先验信息、所述Cr分量的目标DCT系数，确定所述Cb分量的目标DCT系数对应的PMF；

基于所述Cb分量的目标DCT系数对应的PMF，对所述Cb分量的目标DCT系数进行熵编码，得到所述Cb分量对应的编码信息。
根据权利要求5至7中任意一项所述的方法，其中，所述基于所述Y分量对应的编码先验信息、所述Cr分量的目标DCT系数、所述Cb分量的目标DCT系数，对所述Y分量的目标DCT系数进行熵编码，得到所述Y分量对应的编码信息，包括：

基于所述Y分量对应的编码先验信息、所述Cr分量的目标DCT系数、所述Cb分量的目标DCT系数，确定所述Y分量对应的概率分布参数；

基于所述Y分量对应的概率分布参数，利用多级通道自回归，对所述Y分量的目标DCT系数进行熵编码，得到所述Y分量对应的编码信息。
根据权利要求8所述的方法，其中，所述基于所述Y分量对应的概率分布参数，利用多级通道自回归，对所述Y分量的目标DCT系数进行熵编码，得到所述Y分量对应的编码信息，包括：

对所述Y分量的目标DCT系数进行空间维度到通道维度的转换，得到所述Y分量的转换后DCT系数；

按照预设矩阵形式，对所述Y分量的转换后DCT系数进行拆解，得到所述Y分量对应的DCT系数矩阵；

基于所述Y分量对应的概率分布参数，利用多级通道自回归，对所述DCT系数矩阵进行熵编码，得到所述Y分量对应的编码信息。
根据权利要求9所述的方法，其中，所述按照预设矩阵形式，对所述Y分量的转换后DCT系数进行拆解，得到所述Y分量对应的DCT系数矩阵，包括：

按照所述预设矩阵形式，对所述Y分量的转换后DCT系数进行空间维度的拆解，得到所述DCT系数矩阵的多个行；

对所述DCT系数矩阵的每一行进行通道维度的拆解，得到每一行的多个列；

将所述多个行和所述多个行中每一行的多个列，确定为所述Y分量对应的DCT系数矩阵。
根据权利要求10所述的方法，其中，所述基于所述Y分量对应的概率分布参数，利用多级通道自回归，对所述DCT系数矩阵进行熵编码，得到所述Y分量对应的编码信息，包括：

基于所述Y分量对应的概率分布参数，利用多级通道自回归，依次确定所述DCT系数矩阵的每一行中每一列对应的PMF；

利用所述DCT系数矩阵的每一行中每一列对应的PMF，对所述DCT系数矩阵的每一行中每一列进行熵编码，得到所述DCT系数矩阵的每一行中每一列对应的编码信息；

其中，所述DCT系数矩阵的每一行中每一列对应的编码信息，构成所述Y分量对应的编码信息。
根据权利要求11所述的方法，其中，所述基于所述Y分量对应的概率分布参数，利用多级通道自回归，依次确定所述DCT系数矩阵的每一行中每一列对应的PMF，包括：

基于所述Y分量对应的概率分布参数，利用多级通道自回归，依次确定所述DCT系数矩阵中每一行对应的编码先验信息；

针对所述DCT系数矩阵的第i行，基于所述第i行对应的编码先验信息，利用多级通道自回归，确定所述第i行中每一列对应的PMF，其中，i表示行数。
根据权利要求12所述的方法，其中，所述基于所述Y分量对应的概率分布参数，利用多级通道自回归，依次确定所述DCT系数矩阵中每一行对应的编码先验信息，包括：

针对所述DCT系数矩阵的第1行，基于所述Y分量对应的概率分布参数，确定所述第1行对应的编码先验信息；

在i>1的情况下，针对所述DCT系数矩阵的第i行，基于所述Y分量对应的概率分布参数、所述DCT系数矩阵的第1行至第i-1行，确定所述第i行对应的编码先验信息。
根据权利要求12或13所述的方法，其中，所述基于所述第i行对应的编码先验信息，利用多级通道自回归，确定所述第i行中每一列对应的PMF，包括：

针对所述DCT系数矩阵的第i行第1列，基于所述第i行对应的编码先验信息，确定所述第i行第1列对应的PMF；

在j>1的情况下，针对所述DCT系数矩阵的第i行第j列，基于所述第i行对应的编码先验信息、所述DCT系数矩阵的第i行中的第1列至第j-1列，确定所述第i行第j列对应的PMF，其中，j表示列数。
根据权利要求11至14中任意一项所述的方法，其中，所述利用所述DCT系数矩阵的每一行中每一列对应的PMF，对所述DCT系数矩阵的每一行中每一列进行熵编码，得到所述DCT系数矩阵的每一行中每一列对应的编码信息，包括：

在i≥1且j≥1的情况下，针对所述DCT系数矩阵的第i行第j列，基于所述第i行第j列对应的PMF，对所述第i行第j列进行熵编码，得到所述第i行第j列对应的编码信息。
根据权利要求1至15中任意一项所述的方法，其中，所述熵编码为算术编码。
根据权利要求1至16中任意一项所述的方法，其中，所述对所述三个颜色分量的目标DCT系数进行熵编码，得到所述待压缩JPEG图像对应的目标压缩数据，包括：

利用图像编解码神经网络，对所述三个颜色分量的目标DCT系数进行熵编码，得到所述目标压缩数据。
根据权利要求17所述的方法，其中，所述图像编解码神经网络中包括多级跨通道自回归熵编码MLCC模型，所述目标压缩数据中包括亮度分量Y对应的编码信息；

所述利用图像编解码神经网络，对所述三个颜色分量的目标DCT系数进行熵编码，得到所述目标压缩数据，包括：

利用所述MLCC模型，对所述三个颜色分量中的Y分量在通道维度进行多级通道自回归熵编码，得到所述Y分量对应的编码信息。
一种图像处理装置，包括：

DCT系数提取部分，配置为提取待压缩JPEG图像对应的三个颜色分量的初始变换DCT系数；

DCT系数重排部分，配置为分别对所述三个颜色分量的初始DCT系数按照不同频率进行排列，得到所述三个颜色分量的目标DCT系数；

熵编码部分，配置为对所述三个颜色分量的目标DCT系数进行熵编码，得到所述待压缩JPEG图像对应的目标压缩数据。
一种电子设备，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为调用所述存储器存储的指令，以执行权利要求1至18中任意一项所述的方法。
一种计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令被处理器执行时实现权利要求1至18中任意一项所述的方法。
一种计算机程序，所述计算机程序包括计算机可读代码，在计算机可读代码在设备上运行的情况下，设备中的处理器执行权利要求1至18中任意一项所述的方法。
一种计算机程序产品，所述计算机程序产品包括计算机程序或指令，在所述计算机程序或指令在电子设备上运行的情况下，使得所述电子设备执行权利要求1至18中任意一项所述的方法。