CN107770525A - 一种图像编码的方法及装置 - Google Patents

一种图像编码的方法及装置 Download PDF

Info

Publication number
CN107770525A
CN107770525A CN201610671497.9A CN201610671497A CN107770525A CN 107770525 A CN107770525 A CN 107770525A CN 201610671497 A CN201610671497 A CN 201610671497A CN 107770525 A CN107770525 A CN 107770525A
Authority
CN
China
Prior art keywords
ctu
saliency value
coding
value
divided
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610671497.9A
Other languages
English (en)
Other versions
CN107770525B (zh
Inventor
徐威
李耀辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201610671497.9A priority Critical patent/CN107770525B/zh
Publication of CN107770525A publication Critical patent/CN107770525A/zh
Application granted granted Critical
Publication of CN107770525B publication Critical patent/CN107770525B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种图像编码的方法及装置,用于解决现有技术中目标区域与背景区域的衔接部分不自然,压缩后的图像主观质量差的问题。所述方法包括:确定出目标图像的显著图;将所述显著图划分为多个编码树单元CTU,确定出每个CTU的显著值,其中,所述每个CTU的显著值为所述每个CTU中包含的大于或等于设定比例的像素点的显著值的均值;根据所述每个CTU的显著值、以及率损失代价,确定所述每个CTU的预测编码;对所述每个CTU进行变换编码;对变换编码后的每个CTU按照相应的量化步长系数进行量化编码。由于每个CTU的显著值不同,因此对变换编码后的每个CTU采用的量化步长系数也不同,提高了压缩后的图像主观质量。

Description

一种图像编码的方法及装置
技术领域
本发明涉及图像编码领域,尤其涉及一种图像编码的方法及装置。
背景技术
随着网络传输技术的发展,图像由于内容丰富多样、表现力强,成为了人们传播信息的主要媒介。未经压缩的图像需要大量的数据来表征,不适宜直接对其进行传输和存储,需要对其进行压缩处理,当网络传输环境处于高比特率和中比特率时,压缩后的图像具有优异的限失真性能,图像质量较好;但当网络传输环境处于低比特率时,压缩后的图像会出现明显的方块效应,失真较大,主观视觉质量差。
在现有技术中,为了避免方块效应,当网络传输环境处于低比特率时,采用基于感兴趣区域的图像编码方法,图像中的感兴趣区域为所述图像中的目标区域,目标区域以外的区域为背景区域,目标区域采用低压缩比进行编码,背景区域采用高压缩比进行编码,导致两个区域的衔接部分在压缩后的图像中产生不自然的突变效果,影响压缩后图像的主观质量。
发明内容
本发明的目的是提供一种图像编码的方法及装置,以解决现有技术中目标区域与背景区域的衔接部分不自然,压缩后的图像主观质量差的问题。
第一方面,本发明实施例提出一种图像编码的方法,该方法包括:
确定出表示目标图像中各区域显著程度的显著图;将所述显著图划分为多个编码树单元CTU,确定出每个CTU的显著值,其中,所述每个CTU的显著值为所述每个CTU中包含的大于或等于设定比例的像素点的显著值的均值;将所述每个CTU的显著值、以及每个CTU的率损失代价,输入至预先训练好的逻辑回归模型,确定出所述逻辑回归模型输出的数值,根据所述逻辑回归模型输出的数值,确定所述每个CTU是否划分为子编码单元CU,最终确定出每个CTU的预测编码;对所述每个预测编码后的CTU进行变换编码;对变换编码后的每个CTU按照相应的量化步长系数进行量化编码。
本发明实施例中由于每个CTU的显著值不同,因此对变换编码后的每个CTU采用的量化步长系数也不同,目标图像中不同区域的压缩比是线性缓慢变化的,提高了压缩后的图像主观质量。
结合第一方面,在第一种可能的实现方式中,根据所述每个CTU的显著值、以及率损失代价,确定所述每个CTU的预测编码,包括:
根据所述每个CTU划分出的子编码单元CU的显著值、以及所述CU的率损失代价,确定出所述每个CTU的预测编码。
本发明实施例中,根据CU的显著值、以及CU的率损失代价,确定每个CTU的预测编码,减少了预测编码的时间,提高了预测编码的效率。
结合第一方面和第一方面的第一种可能的实现方式,在第二种可能的实现方式中,根据所述每个CTU划分出的子编码单元CU的显著值、以及率损失代价,确定出所述每个CTU的预测编码,包括:
将所述每个CTU划分出的CU中任一CU的显著值、以及所述任一CU率损失代价,输入至预先训练好的逻辑回归模型,确定出所述逻辑回归模型输出的数值;根据所述逻辑回归模型输出的数值,判断所述任一CU是否划分为下一级的CU,确定出所述每个CTU的预测编码,其中,若所述逻辑回归模型输出的数值大于设定阈值时,所述任一CU划分为下一级的CU;若所述逻辑回归模型输出的数值小于或的等于所述设定阈值时,所述任一CU不划分。
结合第一方面,在第三种可能的实现方式中,对变换编码后的每个CTU按照相应的量化步长系数进行量化编码,包括:
根据所述每个CTU的显著值,将所述变换编码后的所述每个CTU划分至不同的显著值区域,所述显著值区域为显著图中根据显著值的大小划分的区域;对每个显著值区域中的所述变换编码后的所述每个CTU按照相应的量化步长系数进行量化编码,其中,所述量化步长系数与所述每个CTU所在的显著值区域相关。
本发明实施例中,根据每个CTU所属的显著值区域,确定所述每个CTU的量化步长系数,控制每个CTU的拉伸,提高了压缩后图像的主观质量。
结合第一方面,在第四种可能的实现方式中,对变换编码后的每个CTU按照相应的量化步长系数进行量化编码之后,还包括:
将量化编码后的所述每个CTU进行环路后处理和熵编码,确定出编码后的压缩图像文件。
第二方面,本发明实施例提出一种图像编码的装置,该装置包括:
确定模块,用于确定出目标图像的显著图;
划分模块,用于将所述显著图划分为多个编码树单元CTU,确定出每个CTU的显著值,其中,所述每个CTU的显著值为所述每个CTU中包含的大于或等于设定比例的像素点的显著值的均值;
预测模块,用于根据所述每个CTU的显著值、以及率损失代价,确定所述每个CTU的预测编码;
变换模块,用于对所述每个CTU进行变换编码;
量化模块,用于对变换编码后的每个CTU按照相应的量化步长系数进行量化编码。
结合第二方面,在第一种可能的实现方式中,所述预测模块具体用于:
根据所述每个CTU划分出的子编码单元CU的显著值、以及率损失代价,确定出所述每个CTU的预测编码。
结合第二方面和第二方面的第一种可能的实现方式,在第二种可能的实现方式中,所述预测模块具体用于:
将所述每个CTU划分出的CU中任一CU的显著值、以及率损失代价,输入至预先训练好的逻辑回归模型,确定出所述逻辑回归模型输出的数值;
根据所述逻辑回归模型输出的数值,判断所述任一CU是否划分为下一级的CU,确定出所述每个CTU的预测编码,其中,若所述逻辑回归模型输出的数值大于设定阈值时,所述任一CU划分为下一级的CU;若所述逻辑回归模型输出的数值小于或的等于所述设定阈值时,所述任一CU不划分。
结合第二方面,在第三种可能的实现方式中,所述量化模块具体用于:
根据所述每个CTU的显著值,将所述变换编码后的所述每个CTU划分至不同的显著值区域;
对每个显著值区域中的所述变换编码后的所述每个CTU按照相应的量化步长系数进行量化编码,其中,所述量化步长系数与所述每个CTU所在的显著值区域相关。
结合第二方面,在第四种可能的实现方式中,该装置还包括:
处理模块,用于将量化编码后的所述每个CTU进行环路后处理和熵编码,确定出压缩图像文件。
第三方面,本发明实施例提出一种图像编码系统,包括处理器、以及与该处理器连接的存储器,其中:
存储器,用于存储预设的计算机程序,存储器中存储了确定模块程序5101、划分模块程序、预测模块程序、变换模块程序以及量化模块程序;
处理器,用于读取存储器中存储的确定模块程序,执行下列过程:
确定出目标图像的显著图;
处理器,用于读取存储器中存储的划分模块程序,执行下列过程:
将所述显著图划分为多个编码树单元CTU,确定出每个CTU的显著值,其中,所述每个CTU的显著值为所述每个CTU中包含的大于或等于设定比例的像素点的显著值的均值;
处理器,用于读取存储器中存储的预测模块程序,执行下列过程:
根据所述每个CTU的显著值、以及率损失代价,确定所述每个CTU的预测编码;
处理器,用于读取存储器中存储的变换模块程序,执行下列过程:
对所述每个CTU进行变换编码;
处理器,用于读取存储器中存储的量化模块程序,执行下列过程:
对变换编码后的每个CTU按照相应的量化步长系数进行量化编码。
结合第三方面,在第一种可能的实现方式中,所述处理器具体执行下列过程:
根据所述每个CTU划分出的子编码单元CU的显著值、以及率损失代价,确定出所述每个CTU的预测编码。
结合第三方面和第三方面的第一种可能的实现方式,在第二种可能的实现方式中,所述处理器具体执行下列过程:
将所述每个CTU划分出的CU中任一CU的显著值、以及率损失代价,输入至预先训练好的逻辑回归模型,确定出所述逻辑回归模型输出的数值;
根据所述逻辑回归模型输出的数值,判断所述任一CU是否划分为下一级的CU,确定出所述每个CTU的预测编码,其中,若所述逻辑回归模型输出的数值大于设定阈值时,所述任一CU划分为下一级的CU;若所述逻辑回归模型输出的数值小于或的等于所述设定阈值时,所述任一CU不划分。
结合第三方面,在第三种可能的实现方式中,所述处理器具体执行下列过程:
根据所述每个CTU的显著值,将所述变换编码后的所述每个CTU划分至不同的显著值区域;
对每个显著值区域中的所述变换编码后的所述每个CTU按照相应的量化步长系数进行量化编码,其中,所述量化步长系数与所述每个CTU所在的显著值区域相关。
结合第三方面,在第四种可能的实现方式中,所述处理器还执行下列过程:
将量化编码后的所述每个CTU进行环路后处理和熵编码,确定出压缩图像文件。
附图说明
图1为本发明实施例提供的一种图像编码方法的流程示意图;
图2为本发明实施例提供的一种目标图像生成显著图的示意图;
图3为本发明实施例提供的一种CTU预测编码的示意图;
图4为本发明实施例提供的一种图像编码装置的结构示意图;
图5为本发明实施例提供的一种图像编码系统的硬件结构示意图。
具体实施方式
下面结合说明书附图对本发明实施例作进一步详细描述。应当理解,此处所描述的实施例仅用于说明和解释本发明,并不用于限定本发明。
通过网络进行图像传输时,可以先对网络传输环境进行判段,再确定使用的编码方式;当网络传输环境处于低比特率范围时,采用本发明提出的图像编码方式对目标图像进行编码,当网络传输环境处于中比特率范围、或高比特率范围时,可以选择客观保真度优先的编码模式,若用户需要选择节约流量但主观质量不变的图像编码模式,也可以采用本发明提出的图像编码方式对目标图像进行编码。
本发明实施例提供了一种图像编码的方法,如图1所示,该方法包括以下过程:
S11、图像处理器将获取到的目标图像采用显著性目标检测的显著性方法进行处理,确定出目标图像的显著图,具体实现如图2所示。
其中,所述显著图由灰度图表示,灰度值即显著值,灰度值越高的像素点组成区域的显著程度越高,显著值越大。
具体的,所述显著性目标检测的显著性方法采用超像素技术或基于图论的图像分割方法确定出显著图,本发明对确定出显著图的其它方法不做限定。
S12、图像处理器将所述显著图等分为多个大小相等且互不重叠的CTU,其中,每个CTU的大小可以为64*64,即每个CTU的长为第1个像素点至第64个像素点之间的距离,宽为第1个像素点至第64个像素点之间的距离。然后通过每个CTU中包含的大于或等于设定比例的像素点的显著值的均值,确定出每个CTU的显著值。
本发明实施例中,通过每个CTU中包含的大于或等于设定比例的像素点的显著值的均值,确定出每个CTU的显著值时,包含以下两种方式:
方式一、将所述每个CTU中包含的全部像素点的显著值的均值作为该CTU的显著值。
方式二、将所述每个CTU中包含的大于或等于设定比例的像素点的显著值的均值作为该CTU的显著值。
举例说明:假设所述设定比例为百分之八十,所述每个CTU的显著值为所述每个CTU中包含的大于或等于百分之八十的像素点的显著值的均值,本发明实施例中,所述设定比例的取值根据经验或需要确定,本发明对其不做限定。
S13、图像处理器根据步骤S12中确定出的每个CTU的显著值、以及CTU的率损失代价,确定出每个CTU的预测编码,其中,所述CTU的率损失代价是在35中预测模式下计算出的率损失代价中最小值。
将所述每个CTU的显著值、以及率损失代价,输入至预先训练好的逻辑回归模型,确定出所述逻辑回归模型输出的数值;根据所述逻辑回归模型输出的数值,判断所述CTU是否划分为下一级的CU,确定出所述每个CTU的预测编码,其中,若所述逻辑回归模型输出的数值大于设定阈值时,所述CTU划分为下一级的CU;若所述逻辑回归模型输出的数值小于或的等于所述设定阈值时,所述CTU不划分。其中,所述设定阈值可以设置为0.5,也可以设置为其它数值,本发明实施例中对其不做限定。
本发明实施例中,还可以根据所述每个CTU划分出的子编码单元CU的显著值、以及率损失代价,确定出所述每个CTU的预测编码,其中,所述CU的率损失代价是在35中预测模式下计算出的率损失代价中最小值。
将所述每个CTU划分出的CU中任一CU的显著值、以及率损失代价,输入至预先训练好的逻辑回归模型,确定出所述逻辑回归模型输出的数值;根据所述逻辑回归模型输出的数值,判断所述任一CU是否划分为下一级的CU,确定出所述每个CTU的预测编码,其中,若所述逻辑回归模型输出的数值大于设定阈值时,所述任一CU划分为下一级的CU;若所述逻辑回归模型输出的数值小于或的等于所述设定阈值时,所述任一CU不划分。其中,所述设定阈值可以设置为0.5,也可以设置为其它数值,本发明实施例中对其不做限定。
所述逻辑回归模型是根据采集到的一定数目需要继续划分的CU的显著值、率损失代价、和一定数目不需要继续划分CU的显著值、率损失代价训练得到的。
举例说明:将第一层中一个CTU(也可以用CU1表示)的显著值、率损失代价输入到逻辑回归模型,所述逻辑回归模型输出的数值大于设定阈值,确定出所述CTU需要进行四叉树划分,划分为CU2,1、CU2,2、CU2,3和CU2,4,为第二层CU;将所述CU2,1、CU2,2、CU2,3和CU2,4,的显著值、率损失代价分别输入到逻辑回归模型中,输入CU2,1和CU2,4,的显著值、率损失代价时,逻辑回归模型输出的数值大于设定阈值,所述CU2,1和CU2,4进行四叉树划分,CU2,1划分为CU3,1,1、CU3,1,2、CU3,1,3和CU3,1,4;CU2,4划分为CU3,4,1、CU3,4,2、CU3,4,3和CU3,4,4;所述CU3,1,1、CU3,1,2、CU3,1,3、CU3,1,4、CU3,4,1、CU3,4,2、CU3,4,3和CU3,4,4作为第三层CU,输入CU2,2和CU2,3的显著值、率损失代价时,逻辑回归模型输出的数值小于或等于设定阈值,不进行划分;将所述CU3,1,1、CU3,1,2、CU3,1,3、CU3,1,4、CU3,4,1、CU3,4,2、CU3,4,3和CU3,4,4的显著值、率损失代价分别输入到逻辑回归模型中,输入CU3,1,1和CU3,4,1的显著值、率损失代价时,逻辑回归模型输出的数值大于设定阈值,所述CU3,1,1和CU3,4,1进行四叉树划分,CU3,1,1划分为CU4,1,1,1、CU4,1,1,2、CU4,1,1,3和CU4,1,1,4;CU3,4,1划分为CU4,4,1,1、CU4,4,1,2、CU4,4,1,3和CU4,1,1,4;所述CU4,1,1,1、CU4,1,1,2、CU4,1,1,3和CU4,1,1,4、CU4,4,1,1、CU4,4,1,2、CU4,4,1,3和CU4,1,1,4作为第四层CU;输入CU3,1,2、CU3,1,3、CU3,1,4、CU3,4,2、CU3,4,3和CU3,4,4的显著值、率损失代价时,逻辑回归模型输出的数值小于或等于设定阈值,不进行划分,所述CTU的预测编码如图3所示。
S14、图像编码服务器将预测编码后的每个CTU采用离散余弦变换进行变换编码,确定出在每个CTU变换后在变换域中不同数值。
本发明实施例中,还可以采用离散正弦变化对预测编码后的CTU进行变换编码。
S15、图像编码服务器将变换编码得到的变换域中的数值按照相应的量化步长系数进行量化编码,得到量化编码确定出的离散幅值。
本发明实施例中,根据所述每个CTU的显著值,将所述变换编码后的所述每个CTU划分至不同的显著值区域;
对每个显著值区域中的所述变换编码后的所述每个CTU按照相应的量化步长系数进行量化编码,其中,所述量化步长系数与所述每个CTU所在的显著值区域相关。
本发明实施例中由于每个CTU的显著值不同,因此对变换编码后的每个CTU采用的量化步长系数也不同,目标图像中不同区域的压缩比是线性缓慢变化的,提高了压缩后的图像主观质量。
举例说明:假设存在低显著值区域、中显著值区域和高显著值区域,将所述变换编码后的所述每个CTU根据显著值,划分至不同的显著值区域后,首先,确定出属于高显著值区域的N个CTU,所述高显著值区域中包含的N个CTU的显著性均值为
其中,表示高显著值区域中第i个CTU的显著值,N为大于等于1的正整数。
然后,对每个显著值区域中的所述变换编码后的所述每个CTU按照相应的量化步长系数进行量化编码,具体包含以下三种情况:
情况一、对高显著值区域包含的高显著值的CTU,采用量化步长Qstep进行量化:
Z=floor(c/Qstep+f)
其中,c表示离散余弦变换(Discrete Cosine Transform,DCT)系数,Qstep表示量化步长,floor(.)为向下取整函数,f变数控制舍入关系,Z表示量化后的值。
情况二、对中显著值区域中包含的中显著值的CTU,根据中显著值的CTU的显著值对量化步长进行轻度拉伸的量化:
其中,表示中显著值区域中第i个CTU的显著值。
情况三、对低显著值区域中包含的低显著值的CTU,根据低显著值的CTU的显著值对量化步长进行较大拉伸的量化:
其中,表示低显著值区域中第i个CTU的显著值,b为一较小的常数,为防止分母为0,a为比例控制系数,取值介于0~1之间,为防止当的比值过大,造成量化步长拉伸过度,导致图像质量损失过大,主观视觉受到影响。
本发明实施例中,在步骤S15之后,还包括:
图像处理器将量化编码后的所述每个CTU进行环路后处理和熵编码,将量化编码后得到的离散幅值转化为二进制数值,即确定出压缩图像文件。
基于同一发明构思,本发明实施例提供的一种图像编码的装置,如图4所示,该装置包括:
确定模块41,用于确定出目标图像的显著图;
划分模块42,用于将所述显著图划分为多个编码树单元CTU,确定出每个CTU的显著值,其中,所述每个CTU的显著值为所述每个CTU中包含的大于或等于设定比例的像素点的显著值的均值;
预测模块43,用于根据所述每个CTU的显著值、以及率损失代价,确定所述每个CTU的预测编码;
变换模块44,用于对所述每个CTU进行变换编码;
量化模块45,用于对变换编码后的每个CTU按照相应的量化步长系数进行量化编码。
可选的,所述预测模块具体用于:
根据所述每个CTU划分出的子编码单元CU的显著值、以及率损失代价,确定出所述每个CTU的预测编码。
可选的,所述预测模块具体用于:
将所述每个CTU划分出的CU中任一CU的显著值、以及率损失代价,输入至预先训练好的逻辑回归模型,确定出所述逻辑回归模型输出的数值;
根据所述逻辑回归模型输出的数值,判断所述任一CU是否划分为下一级的CU,确定出所述每个CTU的预测编码,其中,若所述逻辑回归模型输出的数值大于设定阈值时,所述任一CU划分为下一级的CU;若所述逻辑回归模型输出的数值小于或的等于所述设定阈值时,所述任一CU不划分。
可选的,所述量化模块具体用于:
根据所述每个CTU的显著值,将所述变换编码后的所述每个CTU划分至不同的显著值区域;
对每个显著值区域中的所述变换编码后的所述每个CTU按照相应的量化步长系数进行量化编码,其中,所述量化步长系数与所述每个CTU所在的显著值区域相关。
可选的,该装置还包括:
处理模块,用于将量化编码后的所述每个CTU进行环路后处理和熵编码,确定出压缩图像文件。
下面结合优选的硬件结构,对本发明实施例提供的装置的结构、处理方式进行说明。
本发明实施例提出一种图像编码系统,如图5所示,包括处理器500、以及与该处理器连接的存储器510,其中:
存储器510,用于存储预设的计算机程序,存储器510中存储了确定模块程序5101、划分模块程序5102、预测模块程序5103、变换模块程序5104以及量化模块程序5105;
处理器500,用于读取存储器510中存储的确定模块程序5101,执行下列过程:
确定出目标图像的显著图;
处理器500,用于读取存储器510中存储的划分模块程序5102,执行下列过程:
将所述显著图划分为多个编码树单元CTU,确定出每个CTU的显著值,其中,所述每个CTU的显著值为所述每个CTU中包含的大于或等于设定比例的像素点的显著值的均值;
处理器500,用于读取存储器510中存储的预测模块程序5103,执行下列过程:
根据所述每个CTU的显著值、以及率损失代价,确定所述每个CTU的预测编码;
处理器500,用于读取存储器510中存储的变换模块程序5104,执行下列过程:
对所述每个CTU进行变换编码;
处理器500,用于读取存储器510中存储的量化模块程序5105,执行下列过程:
对变换编码后的每个CTU按照相应的量化步长系数进行量化编码。
可选的,所述处理器500具体执行下列过程:
根据所述每个CTU划分出的子编码单元CU的显著值、以及率损失代价,确定出所述每个CTU的预测编码。
可选的,所述处理器500具体执行下列过程:
将所述每个CTU划分出的CU中任一CU的显著值、以及率损失代价,输入至预先训练好的逻辑回归模型,确定出所述逻辑回归模型输出的数值;
根据所述逻辑回归模型输出的数值,判断所述任一CU是否划分为下一级的CU,确定出所述每个CTU的预测编码,其中,若所述逻辑回归模型输出的数值大于设定阈值时,所述任一CU划分为下一级的CU;若所述逻辑回归模型输出的数值小于或的等于所述设定阈值时,所述任一CU不划分。
可选的,所述处理器500具体执行下列过程:
根据所述每个CTU的显著值,将所述变换编码后的所述每个CTU划分至不同的显著值区域;
对每个显著值区域中的所述变换编码后的所述每个CTU按照相应的量化步长系数进行量化编码,其中,所述量化步长系数与所述每个CTU所在的显著值区域相关。
可选的,所述处理器500还执行下列过程:
将量化编码后的所述每个CTU进行环路后处理和熵编码,确定出压缩图像文件。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种图像编码的方法,其特征在于,该方法包括:
确定出目标图像的显著图;
将所述显著图划分为多个编码树单元CTU,确定出每个CTU的显著值,其中,所述每个CTU的显著值为所述每个CTU中包含的大于或等于设定比例的像素点的显著值的均值;
根据所述每个CTU的显著值、以及率损失代价,确定所述每个CTU的预测编码;
对所述每个CTU进行变换编码;
对变换编码后的每个CTU按照相应的量化步长系数进行量化编码。
2.如权利要求1所述的方法,其特征在于,根据所述每个CTU的显著值、以及率损失代价,确定所述每个CTU的预测编码,包括:
根据所述每个CTU划分出的子编码单元CU的显著值、以及率损失代价,确定出所述每个CTU的预测编码。
3.如权利要求2所述的方法,其特征在于,根据所述每个CTU划分出的子编码单元CU的显著值、以及率损失代价,确定出所述每个CTU的预测编码,包括:
将所述每个CTU划分出的CU中任一CU的显著值、以及率损失代价,输入至预先训练好的逻辑回归模型,确定出所述逻辑回归模型输出的数值;
根据所述逻辑回归模型输出的数值,判断所述任一CU是否划分为下一级的CU,确定出所述每个CTU的预测编码,其中,若所述逻辑回归模型输出的数值大于设定阈值时,所述任一CU划分为下一级的CU;若所述逻辑回归模型输出的数值小于或的等于所述设定阈值时,所述任一CU不划分。
4.如权利要求1所述的方法,其特征在于,对变换编码后的每个CTU按照相应的量化步长系数进行量化编码,包括:
根据所述每个CTU的显著值,将所述变换编码后的所述每个CTU划分至不同的显著值区域;
对每个显著值区域中的所述变换编码后的所述每个CTU按照相应的量化步长系数进行量化编码,其中,所述量化步长系数与所述每个CTU所在的显著值区域相关。
5.如权利要求1所述的方法,其特征在于,对变换编码后的每个CTU按照相应的量化步长系数进行量化编码之后,还包括:
将量化编码后的所述每个CTU进行环路后处理和熵编码,确定出压缩图像文件。
6.一种图像编码的装置,其特征在于,该装置包括:
确定模块,用于确定出目标图像的显著图;
划分模块,用于将所述显著图划分为多个编码树单元CTU,确定出每个CTU的显著值,其中,所述每个CTU的显著值为所述每个CTU中包含的大于或等于设定比例的像素点的显著值的均值;
预测模块,用于根据所述每个CTU的显著值、以及率损失代价,确定所述每个CTU的预测编码;
变换模块,用于对所述每个CTU进行变换编码;
量化模块,用于对变换编码后的每个CTU按照相应的量化步长系数进行量化编码。
7.如权利要求6所述的装置,其特征在于,所述预测模块具体用于:
根据所述每个CTU划分出的子编码单元CU的显著值、以及率损失代价,确定出所述每个CTU的预测编码。
8.如权利要求7所述的装置,其特征在于,所述预测模块具体用于:
将所述每个CTU划分出的CU中任一CU的显著值、以及率损失代价,输入至预先训练好的逻辑回归模型,确定出所述逻辑回归模型输出的数值;
根据所述逻辑回归模型输出的数值,判断所述任一CU是否划分为下一级的CU,确定出所述每个CTU的预测编码,其中,若所述逻辑回归模型输出的数值大于设定阈值时,所述任一CU划分为下一级的CU;若所述逻辑回归模型输出的数值小于或的等于所述设定阈值时,所述任一CU不划分。
9.如权利要求6所述的装置,其特征在于,所述量化模块具体用于:
根据所述每个CTU的显著值,将所述变换编码后的所述每个CTU划分至不同的显著值区域;
对每个显著值区域中的所述变换编码后的所述每个CTU按照相应的量化步长系数进行量化编码,其中,所述量化步长系数与所述每个CTU所在的显著值区域相关。
10.如权利要求6所述的装置,其特征在于,该装置还包括:
处理模块,用于将量化编码后的所述每个CTU进行环路后处理和熵编码,确定出压缩图像文件。
CN201610671497.9A 2016-08-15 2016-08-15 一种图像编码的方法及装置 Active CN107770525B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610671497.9A CN107770525B (zh) 2016-08-15 2016-08-15 一种图像编码的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610671497.9A CN107770525B (zh) 2016-08-15 2016-08-15 一种图像编码的方法及装置

Publications (2)

Publication Number Publication Date
CN107770525A true CN107770525A (zh) 2018-03-06
CN107770525B CN107770525B (zh) 2020-07-24

Family

ID=61260892

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610671497.9A Active CN107770525B (zh) 2016-08-15 2016-08-15 一种图像编码的方法及装置

Country Status (1)

Country Link
CN (1) CN107770525B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108769685A (zh) * 2018-06-05 2018-11-06 腾讯科技(深圳)有限公司 检测图像压缩编码效率的方法、装置及存储介质
CN109474824A (zh) * 2018-12-04 2019-03-15 深圳市华星光电半导体显示技术有限公司 图像压缩方法
WO2020048361A1 (zh) * 2018-09-05 2020-03-12 华为技术有限公司 视频解码方法及视频解码器
WO2021093060A1 (zh) * 2019-11-15 2021-05-20 网宿科技股份有限公司 一种视频编码方法、系统及设备
WO2021098030A1 (zh) * 2019-11-22 2021-05-27 网宿科技股份有限公司 一种视频编码的方法和装置
CN113473137A (zh) * 2021-06-29 2021-10-01 Oppo广东移动通信有限公司 编码方法、终端及存储介质
US11431997B2 (en) 2018-09-05 2022-08-30 Huawei Technologies Co., Ltd. Video decoding method and video decoder

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103379326A (zh) * 2012-04-19 2013-10-30 中兴通讯股份有限公司 基于roi和jnd的视频编码方法及装置
US20150016504A1 (en) * 2013-07-15 2015-01-15 Sony Corporation Extensions of motion-constrained tile sets sei message for interactivity
CN104363449A (zh) * 2014-10-31 2015-02-18 华为技术有限公司 图像预测方法及相关装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103379326A (zh) * 2012-04-19 2013-10-30 中兴通讯股份有限公司 基于roi和jnd的视频编码方法及装置
US20150016504A1 (en) * 2013-07-15 2015-01-15 Sony Corporation Extensions of motion-constrained tile sets sei message for interactivity
CN104363449A (zh) * 2014-10-31 2015-02-18 华为技术有限公司 图像预测方法及相关装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108769685A (zh) * 2018-06-05 2018-11-06 腾讯科技(深圳)有限公司 检测图像压缩编码效率的方法、装置及存储介质
WO2020048361A1 (zh) * 2018-09-05 2020-03-12 华为技术有限公司 视频解码方法及视频解码器
US11431997B2 (en) 2018-09-05 2022-08-30 Huawei Technologies Co., Ltd. Video decoding method and video decoder
CN109474824A (zh) * 2018-12-04 2019-03-15 深圳市华星光电半导体显示技术有限公司 图像压缩方法
CN109474824B (zh) * 2018-12-04 2020-04-10 深圳市华星光电半导体显示技术有限公司 图像压缩方法
WO2020113827A1 (zh) * 2018-12-04 2020-06-11 深圳市华星光电半导体显示技术有限公司 图像压缩方法
WO2021093060A1 (zh) * 2019-11-15 2021-05-20 网宿科技股份有限公司 一种视频编码方法、系统及设备
WO2021098030A1 (zh) * 2019-11-22 2021-05-27 网宿科技股份有限公司 一种视频编码的方法和装置
CN113473137A (zh) * 2021-06-29 2021-10-01 Oppo广东移动通信有限公司 编码方法、终端及存储介质

Also Published As

Publication number Publication date
CN107770525B (zh) 2020-07-24

Similar Documents

Publication Publication Date Title
CN107770525A (zh) 一种图像编码的方法及装置
US11049286B2 (en) Deep neural network color space optimization
CN103886623B (zh) 一种图像压缩方法、设备及系统
CN110689599B (zh) 基于非局部增强的生成对抗网络的3d视觉显著性预测方法
CN103188493B (zh) 图像编码装置及图像编码方法
CN110062234B (zh) 一种基于区域恰可察觉失真的感知视频编码方法
CN110189291A (zh) 一种基于多任务卷积神经网络的通用无参考图像质量评价方法
CN111432207A (zh) 基于显著目标检测和显著性指导的感知高清视频编码方法
CN108495135A (zh) 一种屏幕内容视频编码的快速编码方法
CN103313047B (zh) 一种视频编码方法及装置
CN108921910A (zh) 基于可伸缩卷积神经网络的jpeg编码压缩图像复原的方法
US20220156987A1 (en) Adaptive convolutions in neural networks
CN107454413A (zh) 一种保留特征的视频编码方法
CN105898296A (zh) 视频编码帧选择方法及装置
CN116600119B (zh) 视频编码、解码方法、装置、计算机设备和存储介质
CN110225339A (zh) 一种hevc视频序列编解码加速方法
CN103281532B (zh) 一种基于运动强度检测的量化调整方法及系统
CN113949880B (zh) 一种极低码率人机协同图像编码训练方法及编解码方法
CN116155873A (zh) 一种云边协同的图像处理方法、系统、设备及介质
CN109089115A (zh) 360度视频编码的自适应qp补偿和cu快速决策
CN114615505A (zh) 基于深度熵编码的点云属性压缩方法、装置和存储介质
CN106101731A (zh) 图像无损压缩方法及装置
CN109547781B (zh) 基于图像预测的压缩方法及设备
Kim et al. Implementation of DWT-based adaptive mode selection for LCD overdrive
WO2023276128A1 (ja) 画像処理装置、画像処理方法及び画像処理プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant