CN117939130A - 一种视频图像编码方法、装置和介质 - Google Patents

一种视频图像编码方法、装置和介质 Download PDF

Info

Publication number
CN117939130A
CN117939130A CN202410158916.3A CN202410158916A CN117939130A CN 117939130 A CN117939130 A CN 117939130A CN 202410158916 A CN202410158916 A CN 202410158916A CN 117939130 A CN117939130 A CN 117939130A
Authority
CN
China
Prior art keywords
pixel
quantization
unit image
image block
data transmission
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410158916.3A
Other languages
English (en)
Inventor
且若辰
李庆庄
李琳
朱延武
许斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bestechnic Shanghai Co Ltd
Original Assignee
Bestechnic Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bestechnic Shanghai Co Ltd filed Critical Bestechnic Shanghai Co Ltd
Priority to CN202410158916.3A priority Critical patent/CN117939130A/zh
Publication of CN117939130A publication Critical patent/CN117939130A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本申请涉及一种视频图像编码方法、装置和介质,视频图像编码方法包括:将待编码的各个图像划分得到多个小于或等于8*8像素尺寸的第一单元图像块;确定各个第一单元图像块熵编码的第一理论压缩率;对第一理论压缩率下熵编码的数据传输情况符合码率要求的第一单元图像块进行熵编码;对所述第一理论压缩率下熵编码的数据传输情况不符合码率要求的第一单元图像块进行信息量的压缩量化,使得第二理论压缩率下熵编码的数据传输情况符合码率要求;以及对各个量化结果进行熵编码,因此,既能够使视频图像的符合传输码率要求,降低带宽资源和功耗的需求,在编码后还能够使图像部分区域微损,而整体视觉无损,保证图像的整体质量。

Description

一种视频图像编码方法、装置和介质
技术领域
本申请涉及图像处理技术领域,更具体地,涉及一种视频图像编码方法、装置和介质。
背景技术
对于当前热门的可穿戴设备(如手表、VR(Virtual Reality Device)设备、AR(Augmented Reality)设备)来说,存在大量对非自然图像和自然图像的显示需求。其中,出于人为设计的原因,非自然图像往往具有较大的图像尺寸和极高的图像质量,以手表产品为例,更加细腻的表盘常常会得到消费者的青睐。另外对于VR/AR产品的近眼显示场景,例如游戏、桌面和虚拟场景等,这些高质量图像对于SOC处理时的带宽提出了更高的要求,通常还需要在GPU(图形处理器)或DPU(数据处理单元)上对即将显示的数据进行超分辨处理。
现有的基于熵编码的数据无损压缩算法包括Huffman编码、算术编码、动态字典编码等。而在图像领域,存在各种针对不同应用场景和图像格式而设计的压缩算法,其中无损压缩方法就包括PNG(Portable Network Graphics)系列压缩方法、GIF(GraphicsInterchange Format)系列压缩方法、TIFF(Tag Image File Format)系列压缩方法等,以JPEG(Joint Photographic Experts Group)系列中的JPEG-LS(Joint PhotographicExperts Group-Lossless)为例,它是一种图像无损或者近无损的压缩标准(ISO-14495-1/ITU-T.87),主要由预测器、上下文建模和编码模块三个部分构成,采用逐像素压缩的方式进行编码和压缩。
对于有损压缩而言,应用最广泛的JPEG编解码其思路在于通过损失图像中的一些细节信息来减少整体文件的大小,此外可以通过调整其内的量化步长来控制图像的压缩效果和整体压缩率。但是由于有损压缩方法使用图像的频域信息,在小尺寸的图像块难以进行有效压缩,且码率不可控。
纹理压缩是计算机图形领域里一种为纹理贴图设计的图像压缩技术,与传统的图像压缩算法不同,其对随机访问进行了优化来减少运行时的内存占用,常见的纹理压缩系统包括S3TC(S3 Texture Compress)、ETC(Electronic Toll Collection)、ASTC(Associate Specialist Training Committee)等。基于纹理压缩的方法适用于移动设备和嵌入式系统,高质量的纹理压缩方法能够实现对压缩率的控制,但其设计决定了它不能在无损和有损压缩之间切换,属于通用的固定格式的压缩方法。
发明内容
提供了本申请以解决现有技术中存在的上述缺陷。需要一种视频图像编码方法、装置和介质,既能够使视频图像符合数据传输的码率要求,降低带宽资源和功耗的需求,在编码后还能够使图像部分只是区域微损,整体上视觉无损,保证图像的整体视觉质量。
根据本申请的第一方案,提供了一种视频图像编码方法,所述视频图像编码方法包括如下步骤。将待编码的各个图像划分得到多个小于或等于8*8像素尺寸的第一单元图像块。确定各个所述第一单元图像块熵编码的第一理论压缩率。对所述第一理论压缩率下熵编码的数据传输情况符合码率要求的第一单元图像块进行熵编码。对所述第一理论压缩率下熵编码的数据传输情况不符合码率要求的第一单元图像块进行信息量的压缩量化,确定量化结果进行熵编码的第二理论压缩率,使得所述第二理论压缩率下熵编码的数据传输情况符合码率要求。以及对各个量化结果进行熵编码。
根据本申请的第二方案,提供了一种视频图像编码装置,所述视频图像编码装置包括接口和处理器。接口,其配置为获取视频图像。处理器,其配置为执行本申请任一实施例所述的视频图像编码方法。
根据本申请的第三方案,提供了一种非暂时性计算机可读介质,其上存储有指令,当由处理器执行时,所述指令执行如本申请任一实施例所述的视频图像编码方法的步骤。
本申请各个实施例提供的视频图像编码方法、装置和介质,通过将视频的各个图像分别划分得到第一单元图像块,然后分别对各个数据传输情况符合码率要求的第一单元图像块进行熵编码,对数据传输情况不符合码率要求的第一单元图像块进行压缩量化,使得数据传输情况不符合码率要求的第一单元图像块所对应的区域的信息微损,而数据传输情况符合码率要求的第一单元图像块直接进行熵编码压缩,所以数据传输情况符合码率要求的第一单元图像块所对应的区域质量无损,所以能够达到图像的整体视觉上质量无损的效果,由于各个第一单元图像块均能够满足数据传输码率的要求,所以视频的各个图像均能够达到传输码率的要求,有利于满足降低带宽资源、降低功耗和图像随机访问的需求。
附图说明
在不一定按比例绘制的附图中,相同的附图标记可以在不同的视图中描述相似的部件。具有字母后缀或不同字母后缀的相同附图标记可以表示相似部件的不同实例。附图大体上通过举例而不是限制的方式示出各种实施例,并且与说明书以及权利要求书一起用于对所申请的实施例进行说明。在适当的时候,在所有附图中使用相同的附图标记指代同一或相似的部分。这样的实施例是例证性的,而并非旨在作为本装置或方法的穷尽或排他实施例。
图1示出根据本申请实施例的视频图像编码方法的流程图;
图2示出根据本申请实施例的第一量化模式的流程图;
图3示出根据本申请实施例的视频图像编码过程的示意图;
图4示出根据本申请实施例的第三量化模式的流程图;
图5示出根据本申请实施例的压缩记录位置示意图;
图6示出根据本申请实施例的预测方向的示意图;
图7示出根据本申请第一实施例的编码压缩并经过解压缩后的图像;
图8示出根据本申请第二实施例的编码压缩并经过解压缩后的图像;以及
图9示出根据本申请实施例的视频图像编码装置的结构图。
具体实施方式
为使本领域技术人员更好的理解本申请的技术方案,下面结合附图和具体实施方式对本申请作详细说明。下面结合附图和具体实施例对本申请的实施例作进一步详细描述,但不作为对本申请的限定。
本申请中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分。“包括”或者“包含”等类似的词语意指在该词前的要素涵盖在该词后列举的要素,并不排除也涵盖其他要素的可能。
图1示出根据本申请实施例的视频图像编码方法的流程图。所述视频图像编码方法包括如下步骤。在步骤101,将待编码的各个图像划分得到多个小于或等于8*8像素尺寸的第一单元图像块。例如,可以将各个图像划分为8*8或4*4像素尺寸的第一单元图像块。对于三通道RGB(红、绿和蓝三个通道的颜色)表示的第一单元图像块,可以先进行类RGB转YUV(亮度、色度)的操作,得到YUV格式的第一单元图像块。通过划分第一单元图像块,能够尽量将图像的低频区域和高频区域分开。
在步骤102,确定各个所述第一单元图像块熵编码的第一理论压缩率。熵编码方法包括Huffman编码、算术编码、动态字典编码等。可以利用第一单元图像块熵编码后所占的比特数除以存储该第一单元图像块的原始比特数得到第一理论压缩率。
在步骤103,对所述第一理论压缩率下熵编码的数据传输情况符合码率要求的第一单元图像块进行熵编码。对于图像中图像的强度变化平缓的低频区域的第一单元图像块直接无损压缩,以提高图像的质量。
在步骤104,对所述第一理论压缩率下熵编码的数据传输情况不符合码率要求的第一单元图像块进行信息量的压缩量化,确定量化结果进行熵编码的第二理论压缩率,使得所述第二理论压缩率下熵编码的数据传输情况符合码率要求。对图像中的强度变化剧烈的高频区域进行量化,高频区域的第一单元图像块微损,以使得高频区域的各个第一单元图像块的量化结果均能够满足压缩率和数据传输码率的要求。
在步骤105,对各个量化结果进行熵编码。数据传输情况不符合码率要求的第一单元图像块的量化结果进行熵编码后能够满足数据传输的码率要求。
因此,本申请的视频图像编码方法能够对低频区域和高频区域进行不同的处理,使得低频区域质量无损、而高频区域质量微损,保证图像的整体图像质量满足图像的整体视觉无损的效果。通过分别对各个第一单元图像块进行处理使得整体图像在视觉上具有连续性,还能够满足图像随机访问的需求。通过对第一单元图像块的压缩量化处理,使得图像所对应的各个第一单元图像块均能够满足数据传输码率的需求,以降低数据传输所需的功耗。
在一些实施例中,对所述第一理论压缩率下熵编码的数据传输情况不符合码率要求的第一单元图像块进行信息量的压缩量化具体包括,进入第一量化模式。图2示出根据本申请实施例的第一量化模式的流程图。在步骤201,将所述第一单元图像块划分得到多个第二单元图像块。例如将4*4像素尺寸的第一单元图像块划分为2*2像素尺寸的第二单元图像块。
在步骤202,获取各个所述第二单元图像块的像素值,得到其中的最大像素值和最小像素值。以2*2像素尺寸的第二单元图像块为例,可以比较其中的各个位置的像素值,以选择出最大像素值和最小像素值。
在步骤203,在所述最大像素值和最小像素值的差值与1的和等同于2的整数次幂的情况下,将所述最大像素值所对应的第二单元图像块的像素值校正为最大像素值与1的差值。以2*2像素尺寸的第二单元图像块为例,如果其中的最大像素值为128,128为2的7次幂,最大像素值和最小像素值的差值与1的和=64,64为2的6次幂,这时可以将最大像素值所对应的位置的像素校正为127,这样能够降低所对应的像素位所占的比特数。
在步骤204,对各个校正后和未校正的第二单元图像块的每个子像素进行压缩量化,得到以第一量化模式进行压缩量化后的量化结果。在步骤203的基础上,通过步骤204对每个子像素进行量化,进一步使第一单元图像块整体的信息量被压缩量化。
第一量化模式适合于强度变化不是很剧烈的图像块进行压缩量化,例如各个位置的图像的亮度或灰度变化比较小的图像块。第一量化模式能够使这种图像块达到压缩率要求,且达到图像质量微损的效果。
在一些实施例中,对各个校正后和未校正的第二单元图像块的每个子像素进行压缩量化具体包括:对各个校正后和未校正的第二单元图像块的各个子像素的像素值与1的和进行右移一位的移位量化操作,并将移位操作得到的像素值赋值给对应的子像素。例如一个子像素的像素值为254,移位量化操作的过程可以表示为(254+1)>>1,即254与1的和然后右移一位。这样能够对每个子像素的像素值进行压缩量化,使第一单元图像块整体的信息量被压缩量化。
图3示出根据本申请实施例的视频图像编码过程的示意图。如图3所示,基于各个第一单元图像块,分别执行步骤301,步骤301包括:判断第一单元图像块在第一理论压缩率下熵编码的数据传输情况是否符合码率要求。如果步骤301的判断结果为是,说明存在第一理论压缩率下熵编码的数据传输情况符合码率要求的第一单元图像块,那么进入步骤302,对第一理论压缩率下熵编码的数据传输情况符合码率要求的第一单元图像块进行熵编码。
如图3所示,图像编码方法还包括如下步骤。在步骤301的判断结果为否的情况下,说明存在第一理论压缩率下熵编码的数据传输情况不符合码率要求的第一单元图像块,则执行步骤303,步骤303包括:赋予第一量化模式中压缩量化的量化步长的初始值为0。通过步骤303的设置,使得第一量化模式先以最小的步长进行压缩量化,以尽量减小图像块的信息量的损失程度。
基于初始值的量化步长,在步骤304,对第一理论压缩率下熵编码的数据传输情况不符合码率要求的第一单元图像块利用第一量化模式进行压缩量化。即利用步骤201至步骤204的第一量化方式进行量化。在步骤305,确定量化结果进行熵编码的第二理论压缩率。在步骤306,判断第一单元图像块的量化结果在第二理论压缩率下熵编码的数据传输情况是否符合码率要求。如果步骤306的判断结果为是,则对这样的第一单元图像块执行步骤307,步骤307包括:对量化结果进行熵编码。如果步骤306的判断结果为否,说明存在量化结果在第二理论压缩率下熵编码的数据传输情况不符合码率要求的第一单元图像块,那么执行步骤308,步骤308包括:判断量化步长是否大于或等于3。如果步骤308的判断结果为否,则进行步骤309,量化步长的数值增加1,并赋值给量化步长。
基于赋值后的量化步长,进行步骤310,对第二理论压缩率下熵编码的数据传输情况不符合码率要求的第一单元图像块重复利用第一量化模式进行压缩量化。然后循环进行步骤305、步骤306、步骤308、步骤309和步骤310的过程,通过逐步增加量化步长的方式,对数据传输情况不符合码率要求的第一单元图像块进行量化处理,减少图像块所占的比特数,而数据传输情况符合码率要求的第一单元图像块就进入步骤307。直至量化步长大于或等于3,退出第一量化模式。这样能够对不同高频程度的图像块分别进行处理,以尽量减小图像块的信息量的损失程度,达到图像整体上视觉无损的效果,还能够降低对传输带宽的需求。
所述图像编码方法进一步包括:在第一量化模式中的量化步长大于或等于3,且存在数据传输情况不符合码率要求的第一单元图像块的情况下,对数据传输情况不符合码率要求的第一单元图像块利用第二量化模式进行压缩量化。第二量化模式具体包括如下步骤。对所述第一单元图像块进行预测,得到预测后的第一单元图像块。其中预测方法可以为Jpegloseless预测编码方法、dpcm(Differential Pulse code modulation)差分脉冲编码方法或LPC(Linear predictive coding)线性预测编码方法。基于预测前的第一单元图像块的各个像素位的像素值和预测后的第一单元图像块的各个像素位的像素值,得到第一单元图像块的各个像素位所对应的像素差值。基于所述像素差值对各个第一单元图像块的每个子像素进行压缩量化,得到压缩量化后的量化结果。
在图像中存在强度变化比较剧烈的图像块的情况下,对于利用第一量化模式而无法进行量化的该部分第一单元图像块,利用第二量化模式进一步压缩量化。以使这部分图像块能够满足数据传输带宽的需求。
在一些实施例中,基于所述像素差值对各个第一单元图像块的每个子像素进行压缩量化具体包括:以所述量化步长为移位的位数,对所述第一单元图像块的各个像素位所对应的所述像素差值进行移位,得到各个像素位所对应的移位后的像素差值;将所述移位后的像素差值对应赋值给第一单元图像块的各个像素位的像素值,得到压缩量化后的第一单元图像块。例如第一图像块的像素位所对应的原始像素差值为val,该像素位预测后的像素值为predict_val,像素差值为val-predict_val,以quan_step表示量化步长,右移相对应的步长,则移位后的像素差值为val-predict_val>>quan_step,并对应赋值给该像素位。以对各个像素位分别进行信息量的压缩,以满足压缩率的要求。
在步骤308的判断结果为是的情况下,说明经过第一量化模式,且步长达到2的情况下,还存在第二理论压缩率下熵编码的数据传输情况不符合码率要求的第一单元图像块,则执行第二量化模式,步骤311包括:赋予量化步长的初始值为0。以最小的步长进行压缩量化,先以尽量减小图像块的信息量的损失程度。
基于初始值的量化步长,在步骤312,对第二理论压缩率下熵编码的数据传输情况不符合码率要求的第一单元图像块利用第二量化模式进行压缩量化。在步骤313,确定量化结果进行熵编码的第二理论压缩率。在步骤314,判断第一单元图像块的量化结果在第二理论压缩率下熵编码的数据传输情况是否符合码率要求。如果步骤314的判断结果为是,则对这样的第一单元图像块执行步骤307,步骤307包括:对量化结果进行熵编码。如果步骤314的判断结果为否,说明经过第二量化模式,存在量化结果在第二理论压缩率下熵编码的数据传输情况不符合码率要求的第一单元图像块,那么执行步骤315,步骤315包括:判断量化步长是否大于或等于3。如果步骤315的判断结果为否,则进行步骤316,量化步长的数值增加1,并赋值给量化步长。
基于赋值后的量化步长,重复进行步骤312。然后循环进行步骤313、步骤314、步骤315、步骤316和步骤312的过程,通过逐步增加量化步长的方式,对数据传输情况不符合码率要求的第一单元图像块进行量化处理,减少图像块所占的比特数,而符合码率要求的第一单元图像块就进入步骤307。直至量化步长大于或等于3,退出第二量化模式,这样能够对不同高频程度的图像块分别进行处理,以尽量减小图像块的信息量的损失程度,达到图像整体上视觉无损的效果,还能够降低带宽的需求。在步骤315的判断结果为是的情况下,进入第三量化模式,进行步骤317,对第二理论压缩率下熵编码的数据传输情况不符合码率要求的第一单元图像块利用第三量化模式进行压缩缩减量化。
在一些实施例中,所述图像编码方法进一步包括:在第二量化模式中的量化步长大于或等于3,且存在数据传输情况不符合码率要求的第一单元图像块的情况下,对数据传输情况不符合码率要求的第一单元图像块利用第三量化模式进行压缩量化。图4示出根据本申请实施例的第三量化模式的流程图。在步骤401,选取所述第一单元图像块的至少两个像素位为像素固定位,其余像素位为非像素固定位。以4*4像素尺寸为例,像素固定位可以是任选的,如图5所示的压缩记录位置,8个像素固定位包括{0,2,5,7,8,10,13,15},像素固定位还可以是4*4图像块内的其他位置,例如{0,1,5,7,9,10,12,15}等。
在步骤402,将各个所述像素固定位的8比特像素值的至少高5位的像素值赋值给对应的像素固定位。例如取像素固定位的8比特像素值的高6位的像素值进行赋值,以压缩像素固定位的像素值,这样8个像素固定位所占的比特数为8乘以6比特,即48比特,相比于8乘以8比特的64比特,能够减少16比特。可以根据不同的压缩率来选择对应位的像素值进行赋值。
在步骤403,分别计算各个像素固定位与至少两个不同的非像素固定位之间的像素差,得到与各个所述非像素固定位相对应的像素差最小的像素固定位。可以比较像素固定位的两个、三个或四个等数量的不同的非像素固定位之间的像素差,各个像素固定位可以选择正对方向或者是斜对方向上相邻或间隔的非像素固定位进行比较。
例如第一单元图像块为:
A1 A2 A3 A4
A5 A6 A7 A8
A9 A10 A11 A12
A13 A14 A15 A16。
像素固定位为A2、A4、A6、A8、A10、A12、A14和A16。如图6所示的方向比较示意图,A2可以与非像素固定位A1、A3、A6和A8进行比较,A13可以与非像素固定位A9、A14、A6和A11进行比较。与像素固定位进行比较的相邻的非像素固定位是可变的,来得到与各个非像素固定位相对应的像素差最小的像素固定位。
例如,比较后的结果为:与A1(像素值为100)对应的像素差最小的像素固定位为A2(像素值为100),像素差为0;与A3(像素值为80)对应的像素差最小的像素固定位为A4(像素值为77),像素差为3;与A5对应的像素差最小的像素固定位为A6;与A7对应的像素差最小的像素固定位为A8;与A9对应的像素差最小的像素固定位为A10;与A11对应的像素差最小的像素固定位为A12;与A13对应的像素差最小的像素固定位为A14;与A15对应的像素差最小的像素固定位为A16。
在步骤404,删除非像素固定位的像素值。如步骤403的举例,相应删除A1、A3、A5、A7、A9、A11、A13和A15的像素值。
在步骤405,记录各个像素固定位的预测方向,所述预测方向为像素固定位与对应的像素差最小的非像素固定位之间的位置关系。通过记录预测方向,在解压缩之后还能够根据预测方向恢复非像素固定位的像素值,而且不必利用较大的比特数来存储对应的非像素固定位的像素值,能够较大地减小图像块的比特数。
在步骤406,基于像素固定位的像素值和各个像素固定位的预测方向得到压缩量化后的量化结果。例如利用2比特来记录预测方向,如果8个像素固定位,就需要16比特,如果取8个像素固定位的高6位,则8个像素固定位所占的比特数为8乘以6比特等于48比特,这样图像块的像素值从128比特能够压缩到64比特,可以满足压缩率为2的需求,以便利用较低的带宽来传输视频流。
通过第三量化方式能够对强度变化剧烈的高频区域,且强度变化剧烈的像素位较多,通过第一量化模式和第二量化模式也无法量化到要求的压缩率的第一单元图像块进行量化,以使视频的各个图像所包括的各个第一单元图像块均能够满足压缩率和码率的要求。
通过本申请的视频图像编码方法能够将4*4像素尺寸的第一单元图像块达到2-5.5的压缩率,峰值信噪比(PSNR)能够达到37-45,且局部像素误差的最大值为7-18。例如图7和图8所示的编码压缩后在进行解压缩后的图像,能够看到图7和图8的整个图像清晰度较高,图7峰值信噪比达到41.35,局部像素误差的最大值为8-18,压缩率达到2.38;图8峰值信噪比达到42.86,局部像素误差的最大值为8-18,压缩率达到5.26。
图9示出根据本申请实施例的视频图像编码装置的结构图。所述视频图像编码装置900包括接口901和处理器902。接口901配置为获取视频图像。处理器902配置为执行如本申请任一实施例所述的视频图像编码方法。通过视频图像编码装置900,能够对低频区域和高频区域进行不同的处理,使得低频区域质量无损、而高频区域质量微损,保证图像的整体图像质量满足图像的整体视觉无损的效果。通过分别对各个第一单元图像块进行处理使得整体图像在视觉上具有连续性,还能够满足图像随机访问的需求。通过对第一单元图像块的压缩量化处理,使得图像所对应的各个第一单元图像块均能够满足数据传输码率的需求,以降低数据传输所需的功耗。
处理器902可以是包括一个以上通用处理设备的处理设备,诸如微处理器、中央处理单元(CPU)、图形处理单元(GPU)等。更具体地,该处理器可以是复杂指令集计算(CISC)微处理器、精简指令集计算(RISC)微处理器、超长指令字(VLIW)微处理器、运行其他指令集的处理器或运行指令集的组合的处理器。该处理器还可以是一个以上专用处理设备,诸如专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP)、片上系统(SoC)等。
依据本申请的实施例还提供一种非暂时性计算机可读介质,其上存储有指令,当由处理器执行时,所述指令执行如本申请任一实施例所述的视频图像编码方法的步骤。所述视频图像编码方法的运行,能够对低频区域和高频区域进行不同的处理,使得低频区域质量无损、而高频区域质量微损,保证图像的整体图像质量满足图像的整体视觉无损的效果。通过分别对各个第一单元图像块进行处理使得整体图像在视觉上具有连续性,还能够满足图像随机访问的需求。通过对第一单元图像块的压缩量化处理,使得图像所对应的各个第一单元图像块均能够满足数据传输码率的需求,以降低数据传输所需的功耗。
此外,尽管已经在本文中描述了示例性实施例,其范围包括任何和所有基于本申请的具有等同元件、修改、省略、组合(例如,各种实施例交叉的方案)、改编或改变的实施例。权利要求书中的元件将被基于权利要求中采用的语言宽泛地解释,并不限于在本说明书中或本申请的实施期间所描述的示例,其示例将被解释为非排他性的。因此,本说明书和示例旨在仅被认为是示例,真正的范围和精神由以下权利要求以及其等同物的全部范围所指示。
以上描述旨在是说明性的而不是限制性的。例如,上述示例(或其一个或更多方案)可以彼此组合使用。例如本领域普通技术人员在阅读上述描述时可以使用其它实施例。另外,在上述具体实施方式中,各种特征可以被分组在一起以简单化本申请。这不应解释为一种不要求保护的申请的特征对于任一权利要求是必要的意图。相反,本申请的主题可以少于特定的申请的实施例的全部特征。从而,以下权利要求书作为示例或实施例在此并入具体实施方式中,其中每个权利要求独立地作为单独的实施例,并且考虑这些实施例可以以各种组合或排列彼此组合。本发明的范围应参照所附权利要求以及这些权利要求赋权的等同形式的全部范围来确定。
以上实施例仅为本申请的示例性实施例,不用于限制本发明,本发明的保护范围由权利要求书限定。本领域技术人员可以在本申请的实质和保护范围内,对本发明做出各种修改或等同替换,这种修改或等同替换也应视为落在本发明的保护范围内。

Claims (10)

1.一种视频图像编码方法,其特征在于,所述视频图像编码方法包括:
将待编码的各个图像划分得到多个小于或等于8*8像素尺寸的第一单元图像块;
确定各个所述第一单元图像块熵编码的第一理论压缩率;
对所述第一理论压缩率下熵编码的数据传输情况符合码率要求的第一单元图像块进行熵编码;
对所述第一理论压缩率下熵编码的数据传输情况不符合码率要求的第一单元图像块进行信息量的压缩量化,确定量化结果进行熵编码的第二理论压缩率,使得所述第二理论压缩率下熵编码的数据传输情况符合码率要求;以及
对各个量化结果进行熵编码。
2.根据权利要求1所述的视频图像编码方法,其特征在于,对所述第一理论压缩率下熵编码的数据传输情况不符合码率要求的第一单元图像块进行信息量的压缩量化具体包括,进入第一量化模式:
将所述第一单元图像块划分得到多个第二单元图像块;
获取各个所述第二单元图像块的像素值,得到其中的最大像素值和最小像素值;
在所述最大像素值和最小像素值的差值与1的和等同于2的整数次幂的情况下,将所述最大像素值所对应的第二单元图像块的像素值校正为最大像素值与1的差值;
对各个校正后和未校正的第二单元图像块的每个子像素进行压缩量化,得到以第一量化模式进行压缩量化后的量化结果。
3.根据权利要求2所述的视频图像编码方法,其特征在于,对各个校正后和未校正的第二单元图像块的每个子像素进行压缩量化具体包括:对各个校正后和未校正的第二单元图像块的各个子像素的像素值与1的和进行右移一位的移位量化操作,并将移位操作得到的像素值赋值给对应的子像素。
4.根据权利要求2所述的视频图像编码方法,其特征在于,图像编码方法还包括:
赋予第一量化模式中压缩量化的量化步长的初始值为0;
以初始值的量化步长对所述第一单元图像块利用第一量化模式进行压缩量化后,确定量化结果进行熵编码的第二理论压缩率,存在第二理论压缩率下熵编码的数据传输情况不符合码率要求的第一单元图像块的情况下,量化步长的数值增加1,并赋值给量化步长;
以赋值后的量化步长对第二理论压缩率下熵编码的数据传输情况不符合码率要求的第一单元图像块重复利用第一量化模式进行压缩量化;
直至量化步长大于或等于3,退出第一量化模式。
5.根据权利要求4所述的视频图像编码方法,其特征在于,所述图像编码方法进一步包括:在第一量化模式中的量化步长大于或等于3,且存在数据传输情况不符合码率要求的第一单元图像块的情况下,对数据传输情况不符合码率要求的第一单元图像块利用第二量化模式进行压缩量化包括:
对所述第一单元图像块进行预测,得到预测后的第一单元图像块;
基于预测前的第一单元图像块的各个像素位的像素值和预测后的第一单元图像块的各个像素位的像素值,得到第一单元图像块的各个像素位所对应的像素差值;
基于所述像素差值对各个第一单元图像块的每个子像素进行压缩量化,得到压缩量化后的量化结果。
6.根据权利要求5中所述的视频图像编码方法,其特征在于,基于所述像素差值对各个第一单元图像块的每个子像素进行压缩量化具体包括:以所述量化步长为移位的位数,对所述第一单元图像块的各个像素位所对应的所述像素差值进行移位,得到各个像素位所对应的移位后的像素差值;将所述移位后的像素差值对应赋值给第一单元图像块的各个像素位的像素值,得到压缩量化后的第一单元图像块。
7.根据权利要求5中所述的视频图像编码方法,其特征在于,所述图像编码方法进一步包括:
赋予量化步长的初始值为0;
以初始值的量化步长对所述第一单元图像块利用第二量化模式进行量化后,确定量化结果进行熵编码的第二理论压缩率,存在第二理论压缩率下熵编码的数据传输情况不符合码率要求的第一单元图像块的情况下,量化步长的数值增加1,并赋值给量化步长;
以赋值后的量化步长对第二理论压缩率下熵编码的数据传输情况不符合码率要求的第一单元图像块重复利用第二量化模式进行量化;
直至量化步长大于或等于3,退出第二量化模式。
8.根据权利要求7中所述的视频图像编码方法,其特征在于,所述图像编码方法进一步包括:在第二量化模式中的量化步长大于或等于3,且存在数据传输情况不符合码率要求的第一单元图像块的情况下,对数据传输情况不符合码率要求的第一单元图像块利用第三量化模式进行压缩量化包括:
选取所述第一单元图像块的至少两个像素位为像素固定位,其余像素位为非像素固定位;
将各个所述像素固定位的8比特像素值的至少高5位的像素值赋值给对应的像素固定位;
分别计算各个像素固定位与至少两个不同的非像素固定位之间的像素差,得到与各个所述非像素固定位相对应的像素差最小的像素固定位;
删除非像素固定位的像素值;
记录各个像素固定位的预测方向,所述预测方向为像素固定位与对应的像素差最小的非像素固定位之间的位置关系;
基于像素固定位的像素值和各个像素固定位的预测方向得到压缩量化后的量化结果。
9.一种视频图像编码装置,其特征在于,所述视频图像编码装置包括:
接口,其配置为获取视频图像;
处理器,其配置为执行权利要求1-8任一项所述的视频图像编码方法。
10.一种非暂时性计算机可读介质,其上存储有指令,当由处理器执行时,所述指令执行如权利要求1-8中任一项所述的视频图像编码方法的步骤。
CN202410158916.3A 2024-02-04 2024-02-04 一种视频图像编码方法、装置和介质 Pending CN117939130A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410158916.3A CN117939130A (zh) 2024-02-04 2024-02-04 一种视频图像编码方法、装置和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410158916.3A CN117939130A (zh) 2024-02-04 2024-02-04 一种视频图像编码方法、装置和介质

Publications (1)

Publication Number Publication Date
CN117939130A true CN117939130A (zh) 2024-04-26

Family

ID=90757369

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410158916.3A Pending CN117939130A (zh) 2024-02-04 2024-02-04 一种视频图像编码方法、装置和介质

Country Status (1)

Country Link
CN (1) CN117939130A (zh)

Similar Documents

Publication Publication Date Title
EP2128822B1 (en) Index-based pixel block processing
US6697521B2 (en) Method and system for achieving coding gains in wavelet-based image codecs
US9774875B2 (en) Lossless and near-lossless image compression
CN101142821A (zh) 新压缩格式和用其在帧存储器中暂存图像数据的设备
WO2009093947A1 (en) Pixel block processing
EP2232876A1 (en) Pixel block processing
US20140010445A1 (en) System And Method For Image Compression
US8224103B2 (en) Image encoding method and device, image decoding method and device, and imaging device
CN113452993A (zh) 图像数据解压缩
JP2010098352A (ja) 画像情報符号化装置
EP3896656A1 (en) Image data compression
US20190215519A1 (en) Method and apparatus for compressing video data
CN101406034B (zh) 使用限定符水印的压缩方案及使用该压缩方案在帧存储器中临时存储图像数据的装置
CN117939130A (zh) 一种视频图像编码方法、装置和介质
US20090238481A1 (en) Method and apparatus for generating coded block pattern for highpass coefficients
CN114693818A (zh) 适用于数字正射影像数据的压缩方法
EP1579389B1 (en) Run length encoding of a quantized digital image
JP2018525901A (ja) ディスプレイストリーム圧縮における変換モード用ブロックサイズの変更
JPH118848A (ja) 画像符号化方法および画像符号化装置
Bruna et al. Predictive differential modulation for CFA compression
WO2007104522A1 (en) Method and apparatus for linewise image compression
KR20070111111A (ko) 영상 압축방법과 신장방법 및 그 장치
CN110300303B (zh) 编码装置、显示装置、编码装置的控制方法、及计算机能够读取的记录介质
US20110243437A1 (en) System and method for image compression
US20240323407A1 (en) Image processing device and operating method thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination