CN107770525B

CN107770525B - 一种图像编码的方法及装置

Info

Publication number: CN107770525B
Application number: CN201610671497.9A
Authority: CN
Inventors: 徐威; 李耀辉
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2016-08-15
Filing date: 2016-08-15
Publication date: 2020-07-24
Anticipated expiration: 2036-08-15
Also published as: CN107770525A

Abstract

本发明公开了一种图像编码的方法及装置，用于解决现有技术中目标区域与背景区域的衔接部分不自然，压缩后的图像主观质量差的问题。所述方法包括：确定出目标图像的显著图；将所述显著图划分为多个编码树单元CTU，确定出每个CTU的显著值，其中，所述每个CTU的显著值为所述每个CTU中包含的大于或等于设定比例的像素点的显著值的均值；根据所述每个CTU的显著值、以及率损失代价，确定所述每个CTU的预测编码；对所述每个CTU进行变换编码；对变换编码后的每个CTU按照相应的量化步长系数进行量化编码。由于每个CTU的显著值不同，因此对变换编码后的每个CTU采用的量化步长系数也不同，提高了压缩后的图像主观质量。

Description

一种图像编码的方法及装置

技术领域

本发明涉及图像编码领域，尤其涉及一种图像编码的方法及装置。

背景技术

随着网络传输技术的发展，图像由于内容丰富多样、表现力强，成为了人们传播信息的主要媒介。未经压缩的图像需要大量的数据来表征，不适宜直接对其进行传输和存储，需要对其进行压缩处理，当网络传输环境处于高比特率和中比特率时，压缩后的图像具有优异的限失真性能，图像质量较好；但当网络传输环境处于低比特率时，压缩后的图像会出现明显的方块效应，失真较大，主观视觉质量差。

在现有技术中，为了避免方块效应，当网络传输环境处于低比特率时，采用基于感兴趣区域的图像编码方法，图像中的感兴趣区域为所述图像中的目标区域，目标区域以外的区域为背景区域，目标区域采用低压缩比进行编码，背景区域采用高压缩比进行编码，导致两个区域的衔接部分在压缩后的图像中产生不自然的突变效果，影响压缩后图像的主观质量。

发明内容

本发明的目的是提供一种图像编码的方法及装置，以解决现有技术中目标区域与背景区域的衔接部分不自然，压缩后的图像主观质量差的问题。

第一方面，本发明实施例提出一种图像编码的方法，该方法包括：

确定出表示目标图像中各区域显著程度的显著图；将所述显著图划分为多个编码树单元CTU，确定出每个CTU的显著值，其中，所述每个CTU的显著值为所述每个CTU中包含的大于或等于设定比例的像素点的显著值的均值；将所述每个CTU的显著值、以及每个CTU的率损失代价，输入至预先训练好的逻辑回归模型，确定出所述逻辑回归模型输出的数值，根据所述逻辑回归模型输出的数值，确定所述每个CTU是否划分为子编码单元CU，最终确定出每个CTU的预测编码；对所述每个预测编码后的CTU进行变换编码；对变换编码后的每个CTU按照相应的量化步长系数进行量化编码。

本发明实施例中由于每个CTU的显著值不同，因此对变换编码后的每个CTU采用的量化步长系数也不同，目标图像中不同区域的压缩比是线性缓慢变化的，提高了压缩后的图像主观质量。

结合第一方面，在第一种可能的实现方式中，根据所述每个CTU的显著值、以及率损失代价，确定所述每个CTU的预测编码，包括：

根据所述每个CTU划分出的子编码单元CU的显著值、以及所述CU的率损失代价，确定出所述每个CTU的预测编码。

本发明实施例中，根据CU的显著值、以及CU的率损失代价，确定每个CTU的预测编码，减少了预测编码的时间，提高了预测编码的效率。

结合第一方面和第一方面的第一种可能的实现方式，在第二种可能的实现方式中，根据所述每个CTU划分出的子编码单元CU的显著值、以及率损失代价，确定出所述每个CTU的预测编码，包括：

将所述每个CTU划分出的CU中任一CU的显著值、以及所述任一CU率损失代价，输入至预先训练好的逻辑回归模型，确定出所述逻辑回归模型输出的数值；根据所述逻辑回归模型输出的数值，判断所述任一CU是否划分为下一级的CU，确定出所述每个CTU的预测编码，其中，若所述逻辑回归模型输出的数值大于设定阈值时，所述任一CU划分为下一级的CU；若所述逻辑回归模型输出的数值小于或的等于所述设定阈值时，所述任一CU不划分。

结合第一方面，在第三种可能的实现方式中，对变换编码后的每个CTU按照相应的量化步长系数进行量化编码，包括：

根据所述每个CTU的显著值，将所述变换编码后的所述每个CTU划分至不同的显著值区域，所述显著值区域为显著图中根据显著值的大小划分的区域；对每个显著值区域中的所述变换编码后的所述每个CTU按照相应的量化步长系数进行量化编码，其中，所述量化步长系数与所述每个CTU所在的显著值区域相关。

本发明实施例中，根据每个CTU所属的显著值区域，确定所述每个CTU的量化步长系数，控制每个CTU的拉伸，提高了压缩后图像的主观质量。

结合第一方面，在第四种可能的实现方式中，对变换编码后的每个CTU按照相应的量化步长系数进行量化编码之后，还包括：

将量化编码后的所述每个CTU进行环路后处理和熵编码，确定出编码后的压缩图像文件。

第二方面，本发明实施例提出一种图像编码的装置，该装置包括：

确定模块，用于确定出目标图像的显著图；

划分模块，用于将所述显著图划分为多个编码树单元CTU，确定出每个CTU的显著值，其中，所述每个CTU的显著值为所述每个CTU中包含的大于或等于设定比例的像素点的显著值的均值；

预测模块，用于根据所述每个CTU的显著值、以及率损失代价，确定所述每个CTU的预测编码；

变换模块，用于对所述每个CTU进行变换编码；

量化模块，用于对变换编码后的每个CTU按照相应的量化步长系数进行量化编码。

结合第二方面，在第一种可能的实现方式中，所述预测模块具体用于：

根据所述每个CTU划分出的子编码单元CU的显著值、以及率损失代价，确定出所述每个CTU的预测编码。

结合第二方面和第二方面的第一种可能的实现方式，在第二种可能的实现方式中，所述预测模块具体用于：

将所述每个CTU划分出的CU中任一CU的显著值、以及率损失代价，输入至预先训练好的逻辑回归模型，确定出所述逻辑回归模型输出的数值；

根据所述逻辑回归模型输出的数值，判断所述任一CU是否划分为下一级的CU，确定出所述每个CTU的预测编码，其中，若所述逻辑回归模型输出的数值大于设定阈值时，所述任一CU划分为下一级的CU；若所述逻辑回归模型输出的数值小于或的等于所述设定阈值时，所述任一CU不划分。

结合第二方面，在第三种可能的实现方式中，所述量化模块具体用于：

根据所述每个CTU的显著值，将所述变换编码后的所述每个CTU划分至不同的显著值区域；

对每个显著值区域中的所述变换编码后的所述每个CTU按照相应的量化步长系数进行量化编码，其中，所述量化步长系数与所述每个CTU所在的显著值区域相关。

结合第二方面，在第四种可能的实现方式中，该装置还包括：

处理模块，用于将量化编码后的所述每个CTU进行环路后处理和熵编码，确定出压缩图像文件。

第三方面，本发明实施例提出一种图像编码系统，包括处理器、以及与该处理器连接的存储器，其中：

存储器，用于存储预设的计算机程序，存储器中存储了确定模块程序5101、划分模块程序、预测模块程序、变换模块程序以及量化模块程序；

处理器，用于读取存储器中存储的确定模块程序，执行下列过程：

确定出目标图像的显著图；

处理器，用于读取存储器中存储的划分模块程序，执行下列过程：

将所述显著图划分为多个编码树单元CTU，确定出每个CTU的显著值，其中，所述每个CTU的显著值为所述每个CTU中包含的大于或等于设定比例的像素点的显著值的均值；

处理器，用于读取存储器中存储的预测模块程序，执行下列过程：

根据所述每个CTU的显著值、以及率损失代价，确定所述每个CTU的预测编码；

处理器，用于读取存储器中存储的变换模块程序，执行下列过程：

对所述每个CTU进行变换编码；

处理器，用于读取存储器中存储的量化模块程序，执行下列过程：

对变换编码后的每个CTU按照相应的量化步长系数进行量化编码。

结合第三方面，在第一种可能的实现方式中，所述处理器具体执行下列过程：

结合第三方面和第三方面的第一种可能的实现方式，在第二种可能的实现方式中，所述处理器具体执行下列过程：

结合第三方面，在第三种可能的实现方式中，所述处理器具体执行下列过程：

结合第三方面，在第四种可能的实现方式中，所述处理器还执行下列过程：

将量化编码后的所述每个CTU进行环路后处理和熵编码，确定出压缩图像文件。

附图说明

图1为本发明实施例提供的一种图像编码方法的流程示意图；

图2为本发明实施例提供的一种目标图像生成显著图的示意图；

图3为本发明实施例提供的一种CTU预测编码的示意图；

图4为本发明实施例提供的一种图像编码装置的结构示意图；

图5为本发明实施例提供的一种图像编码系统的硬件结构示意图。

具体实施方式

下面结合说明书附图对本发明实施例作进一步详细描述。应当理解，此处所描述的实施例仅用于说明和解释本发明，并不用于限定本发明。

通过网络进行图像传输时，可以先对网络传输环境进行判段，再确定使用的编码方式；当网络传输环境处于低比特率范围时，采用本发明提出的图像编码方式对目标图像进行编码，当网络传输环境处于中比特率范围、或高比特率范围时，可以选择客观保真度优先的编码模式，若用户需要选择节约流量但主观质量不变的图像编码模式，也可以采用本发明提出的图像编码方式对目标图像进行编码。

本发明实施例提供了一种图像编码的方法，如图1所示，该方法包括以下过程：

S11、图像处理器将获取到的目标图像采用显著性目标检测的显著性方法进行处理，确定出目标图像的显著图，具体实现如图2所示。

其中，所述显著图由灰度图表示，灰度值即显著值，灰度值越高的像素点组成区域的显著程度越高，显著值越大。

具体的，所述显著性目标检测的显著性方法采用超像素技术或基于图论的图像分割方法确定出显著图，本发明对确定出显著图的其它方法不做限定。

S12、图像处理器将所述显著图等分为多个大小相等且互不重叠的CTU，其中，每个CTU的大小可以为64*64，即每个CTU的长为第1个像素点至第64个像素点之间的距离，宽为第1个像素点至第64个像素点之间的距离。然后通过每个CTU中包含的大于或等于设定比例的像素点的显著值的均值，确定出每个CTU的显著值。

本发明实施例中，通过每个CTU中包含的大于或等于设定比例的像素点的显著值的均值，确定出每个CTU的显著值时，包含以下两种方式：

方式一、将所述每个CTU中包含的全部像素点的显著值的均值作为该CTU的显著值。

方式二、将所述每个CTU中包含的大于或等于设定比例的像素点的显著值的均值作为该CTU的显著值。

举例说明：假设所述设定比例为百分之八十，所述每个CTU的显著值为所述每个CTU中包含的大于或等于百分之八十的像素点的显著值的均值，本发明实施例中，所述设定比例的取值根据经验或需要确定，本发明对其不做限定。

S13、图像处理器根据步骤S12中确定出的每个CTU的显著值、以及CTU的率损失代价，确定出每个CTU的预测编码，其中，所述CTU的率损失代价是在35中预测模式下计算出的率损失代价中最小值。

将所述每个CTU的显著值、以及率损失代价，输入至预先训练好的逻辑回归模型，确定出所述逻辑回归模型输出的数值；根据所述逻辑回归模型输出的数值，判断所述CTU是否划分为下一级的CU，确定出所述每个CTU的预测编码，其中，若所述逻辑回归模型输出的数值大于设定阈值时，所述CTU划分为下一级的CU；若所述逻辑回归模型输出的数值小于或的等于所述设定阈值时，所述CTU不划分。其中，所述设定阈值可以设置为0.5，也可以设置为其它数值，本发明实施例中对其不做限定。

本发明实施例中，还可以根据所述每个CTU划分出的子编码单元CU的显著值、以及率损失代价，确定出所述每个CTU的预测编码，其中，所述CU的率损失代价是在35中预测模式下计算出的率损失代价中最小值。

将所述每个CTU划分出的CU中任一CU的显著值、以及率损失代价，输入至预先训练好的逻辑回归模型，确定出所述逻辑回归模型输出的数值；根据所述逻辑回归模型输出的数值，判断所述任一CU是否划分为下一级的CU，确定出所述每个CTU的预测编码，其中，若所述逻辑回归模型输出的数值大于设定阈值时，所述任一CU划分为下一级的CU；若所述逻辑回归模型输出的数值小于或的等于所述设定阈值时，所述任一CU不划分。其中，所述设定阈值可以设置为0.5，也可以设置为其它数值，本发明实施例中对其不做限定。

所述逻辑回归模型是根据采集到的一定数目需要继续划分的CU的显著值、率损失代价、和一定数目不需要继续划分CU的显著值、率损失代价训练得到的。

举例说明：将第一层中一个CTU(也可以用CU₁表示)的显著值、率损失代价输入到逻辑回归模型，所述逻辑回归模型输出的数值大于设定阈值，确定出所述CTU需要进行四叉树划分，划分为CU_2,1、CU_2,2、CU_2,3和CU_2,4，为第二层CU；将所述CU_2,1、CU_2,2、CU_2,3和CU_2,4，的显著值、率损失代价分别输入到逻辑回归模型中，输入CU_2,1和CU_2,4,的显著值、率损失代价时，逻辑回归模型输出的数值大于设定阈值，所述CU_2,1和CU_2,4进行四叉树划分，CU_2,1划分为CU_3,1,1、CU_3,1,2、CU_3,1,3和CU_3,1,4；CU_2,4划分为CU_3,4,1、CU_3,4,2、CU_3,4,3和CU_3,4,4；所述CU_3,1,1、CU_3,1,2、CU_3,1,3、CU_3,1,4、CU_3,4,1、CU_3,4,2、CU_3,4,3和CU_3,4,4作为第三层CU，输入CU_2,2和CU_2,3的显著值、率损失代价时，逻辑回归模型输出的数值小于或等于设定阈值，不进行划分；将所述CU_3,1,1、CU_3,1,2、CU_3,1,3、CU_3,1,4、CU_3,4,1、CU_3,4,2、CU_3,4,3和CU_3,4,4的显著值、率损失代价分别输入到逻辑回归模型中，输入CU_3,1,1和CU_3,4,1的显著值、率损失代价时，逻辑回归模型输出的数值大于设定阈值，所述CU_3,1,1和CU_3,4,1进行四叉树划分，CU_3,1,1划分为CU_4,1,1,1、CU_4,1,1,2、CU_4,1,1,3和CU_4,1,1,4；CU_3,4,1划分为CU_4,4,1,1、CU_4,4,1,2、CU_4,4,1,3和CU_4,1,1,4；所述CU_4,1,1,1、CU_4,1,1,2、CU_4,1,1,3和CU_4,1,1,4、CU_4,4,1,1、CU_4,4,1,2、CU_4,4,1,3和CU_4,1,1,4作为第四层CU；输入CU_3,1,2、CU_3,1,3、CU_3,1,4、CU_3,4,2、CU_3,4,3和CU_3,4,4的显著值、率损失代价时，逻辑回归模型输出的数值小于或等于设定阈值，不进行划分，所述CTU的预测编码如图3所示。

S14、图像编码服务器将预测编码后的每个CTU采用离散余弦变换进行变换编码，确定出在每个CTU变换后在变换域中不同数值。

本发明实施例中，还可以采用离散正弦变化对预测编码后的CTU进行变换编码。

S15、图像编码服务器将变换编码得到的变换域中的数值按照相应的量化步长系数进行量化编码，得到量化编码确定出的离散幅值。

本发明实施例中，根据所述每个CTU的显著值，将所述变换编码后的所述每个CTU划分至不同的显著值区域；

举例说明：假设存在低显著值区域、中显著值区域和高显著值区域，将所述变换编码后的所述每个CTU根据显著值，划分至不同的显著值区域后，首先，确定出属于高显著值区域的N个CTU，所述高显著值区域中包含的N个CTU的显著性均值为

其中，

表示高显著值区域中第i个CTU的显著值，N为大于等于1的正整数。

然后，对每个显著值区域中的所述变换编码后的所述每个CTU按照相应的量化步长系数进行量化编码，具体包含以下三种情况：

情况一、对高显著值区域包含的高显著值的CTU，采用量化步长Qstep进行量化：

Z＝floor(c/Q_step+f)

其中，c表示离散余弦变换(Discrete Cosine Transform,DCT)系数，Q_step表示量化步长，floor(.)为向下取整函数，f变数控制舍入关系，Z表示量化后的值。

情况二、对中显著值区域中包含的中显著值的CTU，根据中显著值的CTU的显著值

对量化步长进行轻度拉伸的量化：

其中，

表示中显著值区域中第i个CTU的显著值。

情况三、对低显著值区域中包含的低显著值的CTU，根据低显著值的CTU的显著值

对量化步长进行较大拉伸的量化：

其中，

表示低显著值区域中第i个CTU的显著值，b为一较小的常数，为防止分母为0，a为比例控制系数，取值介于0～1之间，为防止当

和

的比值过大，造成量化步长拉伸过度，导致图像质量损失过大，主观视觉受到影响。

本发明实施例中，在步骤S15之后，还包括：

图像处理器将量化编码后的所述每个CTU进行环路后处理和熵编码，将量化编码后得到的离散幅值转化为二进制数值，即确定出压缩图像文件。

基于同一发明构思，本发明实施例提供的一种图像编码的装置，如图4所示，该装置包括：

确定模块41，用于确定出目标图像的显著图；

划分模块42，用于将所述显著图划分为多个编码树单元CTU，确定出每个CTU的显著值，其中，所述每个CTU的显著值为所述每个CTU中包含的大于或等于设定比例的像素点的显著值的均值；

预测模块43，用于根据所述每个CTU的显著值、以及率损失代价，确定所述每个CTU的预测编码；

变换模块44，用于对所述每个CTU进行变换编码；

量化模块45，用于对变换编码后的每个CTU按照相应的量化步长系数进行量化编码。

可选的，所述预测模块具体用于：

可选的，所述量化模块具体用于：

可选的，该装置还包括：

下面结合优选的硬件结构，对本发明实施例提供的装置的结构、处理方式进行说明。

本发明实施例提出一种图像编码系统，如图5所示，包括处理器500、以及与该处理器连接的存储器510，其中：

存储器510，用于存储预设的计算机程序，存储器510中存储了确定模块程序5101、划分模块程序5102、预测模块程序5103、变换模块程序5104以及量化模块程序5105；

处理器500，用于读取存储器510中存储的确定模块程序5101，执行下列过程：

确定出目标图像的显著图；

处理器500，用于读取存储器510中存储的划分模块程序5102，执行下列过程：

处理器500，用于读取存储器510中存储的预测模块程序5103，执行下列过程：

处理器500，用于读取存储器510中存储的变换模块程序5104，执行下列过程：

对所述每个CTU进行变换编码；

处理器500，用于读取存储器510中存储的量化模块程序5105，执行下列过程：

可选的，所述处理器500具体执行下列过程：

可选的，所述处理器500还执行下列过程：

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种图像编码的方法，其特征在于，该方法包括：

确定出目标图像的显著图；所述显著图由灰度图表示；

对所述每个CTU进行变换编码；

对变换编码后的每个CTU按照相应的量化步长系数进行量化编码；所述每个CTU相应的量化步长系数与所述每个CTU的显著值相关。

2.如权利要求1所述的方法，其特征在于，根据所述每个CTU的显著值、以及率损失代价，确定所述每个CTU的预测编码，包括：

3.如权利要求2所述的方法，其特征在于，根据所述每个CTU划分出的子编码单元CU的显著值、以及率损失代价，确定出所述每个CTU的预测编码，包括：

4.如权利要求1所述的方法，其特征在于，对变换编码后的每个CTU按照相应的量化步长系数进行量化编码，包括：

5.如权利要求1所述的方法，其特征在于，对变换编码后的每个CTU按照相应的量化步长系数进行量化编码之后，还包括：

6.一种图像编码的装置，其特征在于，该装置包括：

确定模块，用于确定出目标图像的显著图；所述显著图由灰度图表示；

变换模块，用于对所述每个CTU进行变换编码；

量化模块，用于对变换编码后的每个CTU按照相应的量化步长系数进行量化编码；所述每个CTU相应的量化步长系数与所述每个CTU的显著值相关。

7.如权利要求6所述的装置，其特征在于，所述预测模块具体用于：

8.如权利要求7所述的装置，其特征在于，所述预测模块具体用于：

9.如权利要求6所述的装置，其特征在于，所述量化模块具体用于：

10.如权利要求6所述的装置，其特征在于，该装置还包括：