CN116828183A - 一种视频编码方法、装置、设备及可读存储介质 - Google Patents

一种视频编码方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN116828183A
CN116828183A CN202310800486.6A CN202310800486A CN116828183A CN 116828183 A CN116828183 A CN 116828183A CN 202310800486 A CN202310800486 A CN 202310800486A CN 116828183 A CN116828183 A CN 116828183A
Authority
CN
China
Prior art keywords
region
coding
determining
coding unit
quantization parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310800486.6A
Other languages
English (en)
Inventor
王峰
王晓丽
林晓青
张平
汪幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
MIGU Video Technology Co Ltd
MIGU Culture Technology Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
MIGU Video Technology Co Ltd
MIGU Culture Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, MIGU Video Technology Co Ltd, MIGU Culture Technology Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202310800486.6A priority Critical patent/CN116828183A/zh
Publication of CN116828183A publication Critical patent/CN116828183A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明提供一种视频编码方法、装置、设备及可读存储介质,方法包括:对待处理的当前视频帧进行帧级码率控制,得到第一控制结果;其中,当前视频帧包括多个编码树单元,编码树单元包括多种尺度的编码单元;对编码树单元进行编码树单元级码率控制,得到第二控制结果;基于第一控制结果,确定每个编码单元的区域类型;其中,区域类型为平坦区域或纹理区域;根据区域类型、第一控制结果以及第二控制结果,确定编码单元的量化参数;根据量化参数,对编码单元进行编码。由此,避免了相关技术中,将各个编码单元的量化参数均设置为相同,易产生块效应,或造成码率浪费的技术问题,使得块效应明显减少,且节省了码率,进一步提升了视频的主观质量。

Description

一种视频编码方法、装置、设备及可读存储介质
技术领域
本发明实施例涉及视频编码技术领域,尤其涉及一种视频编码方法、装置、设备及可读存储介质。
背景技术
随着网络通信和视频处理技术的快速发展,4K、8K和HDR(High Dynamic Range,高动态光照渲染)等技术逐步成为人们对视觉体验的新需求。4K/8K视频的数据量大,对编码压缩性能要求比较高,目前国内外针对4K/8K视频采用的编码压缩标准主要有H.265、H.266、AVS2、AVS3,它们都采用四叉树的块划分方法,大大提升了编码压缩效率。以AVS2编码器为例,AVS2将每帧图像分割为若干个CTU(Coding Tree Unit,编码树单元),并采用四叉树形式对CTU进行递归划分,划分成64x64、32x32、16x16和8x8这4种层次的CU(CodingUnit,编码单元)。在码率控制阶段,通常采用的方法为:帧级码率控制和CTU级码率控制。但是,帧级码率控制和CTU级码率控制中,将各个编码单元的量化参数(QuantizationParameter,QP)均设置为相同。并未考虑到针对于不同编码单元,对应设置不同的码率控制方式,易产生块效应,或造成码率浪费。
发明内容
本发明实施例提供一种视频编码方法、装置、设备及可读存储介质,以解决相关技术中,并未针对于不同的编码单元,对应设置不同的码率控制方式,导致在编码时易产生块效应,或造成码率浪费的技术问题。
为了解决上述技术问题,本发明是这样实现的:
第一方面,本发明实施例提供了一种视频编码方法,所述方法包括:
对待处理的当前视频帧进行帧级码率控制,得到第一控制结果;其中,所述当前视频帧包括多个编码树单元,所述编码树单元包括多种尺度的编码单元;
对所述编码树单元进行编码树单元级码率控制,得到第二控制结果;
基于所述第一控制结果,确定每个所述编码单元的区域类型;其中,所述区域类型为平坦区域或纹理区域;
根据所述区域类型、所述第一控制结果以及所述第二控制结果,确定所述编码单元的量化参数;
根据所述量化参数,对所述编码单元进行编码。
可选的,所述第一控制结果包括:在对所述当前视频帧进行所述帧级码率控制时,所获取的所述当前视频帧所包含的所有像素块的亮度值方差的第一平均值;
基于所述第一控制结果,确定每个所述编码单元的区域类型包括:
确定所述编码单元所包含的所有像素块的亮度值方差的第二平均值;
判断所述第二平均值是否小于所述第一平均值;
如果是,则确定所述编码单元的区域类型为平坦区域;
如果否,则确定所述编码单元的区域类型为纹理区域。
可选的,所述平坦区域包括以下至少一项:运动连续平坦区域和运动不连续平坦区域;
当所述区域类型为所述平坦区域时,所述确定每个所述编码单元的区域类型之后,所述方法还包括:
判断所述编码单元的运动矢量和与所述编码单元指定相邻边的编码单元的运动矢量是否相同,如果是,则确定所述区域类型为所述运动连续平坦区域;如果否,则确定所述区域类型为所述运动不连续平坦区域。
可选的,所述第一控制结果包括:帧级量化参数;所述第二控制结果包括:编码树级量化参数;
根据所述区域类型、所述第一控制结果以及所述第二控制结果,确定所述编码单元的量化参数包括:
在所述区域类型为所述运动连续平坦区域的情况下,确定所述编码单元的量化参数为所述帧级量化参数与第一预设阈值之和;
在所述区域类型为所述运动不连续平坦区域的情况下,确定所述编码单元的量化参数为所述编码树级量化参数与第一预设阈值之差;
其中,所述帧级量化参数为在对所述当前视频帧进行所述帧级码率控制时,所获取的量化参数;所述编码树级量化参数为在对所述编码树单元进行所述编码树单元级码率控制时,所获取的量化参数;所述第一预设阈值为非负数。
可选的,所述纹理区域包括以下至少一项:运动连续纹理区域和运动不连续纹理区域;
当所述区域类型为所述纹理区域时,所述确定每个所述编码单元的区域类型之后,所述方法还包括:
判断所述编码单元的运动矢量和与所述编码单元指定相邻边的编码单元的运动矢量是否相同,如果是,则确定所述区域类型为所述运动连续纹理区域;如果否,则确定所述区域类型为所述运动不连续纹理区域。
可选的,所述第一控制结果包括:帧级量化参数;所述第二控制结果包括:编码树级量化参数;
根据所述区域类型、所述第一控制结果以及所述第二控制结果,确定所述编码单元的量化参数包括:
在所述区域类型为所述运动连续纹理区域的情况下,确定所述编码单元的量化参数为所述帧级量化参数与第二预设阈值之和;
在所述区域类型为所述运动不连续纹理区域的情况下,确定所述编码单元的量化参数为所述编码树级量化参数与第二预设阈值之差;
其中,所述帧级量化参数为在对所述当前视频帧进行所述帧级码率控制时,所获取的量化参数;所述编码树级量化参数为在对所述编码树单元进行所述编码树单元级码率控制时,所获取的量化参数;所述第二预设阈值均为非负数。
可选的,在根据所述量化参数,对所述编码单元进行编码之后,所述方法还包括:
判断是否已对所述编码树单元中的每个编码单元均进行了编码;
如果是,则结束对所述编码树单元的所述编码树单元级码率控制。
第二方面,本发明实施例提供一种一种视频编码装置,所述装置包括:
第一控制模块,用于对待处理的当前视频帧进行帧级码率控制,得到第一控制结果;其中,所述当前视频帧包括多个编码树单元,所述编码树单元包括多种尺度的编码单元;
第二控制模块,用于对所述编码树单元进行编码树单元级码率控制,得到第二控制结果;
第一确定模块,用于基于所述第一控制结果,确定每个所述编码单元的区域类型;其中,所述区域类型为平坦区域或纹理区域;
第二确定模块,用于根据所述区域类型、所述第一控制结果以及所述第二控制结果,确定所述编码单元的量化参数;
编码模块,用于根据所述量化参数,对所述编码单元进行编码。
可选的,所述第一控制结果包括:在对所述当前视频帧进行所述帧级码率控制时,所获取的所述当前视频帧所包含的所有像素块的亮度值方差的第一平均值;所述第一确定模块,用于确定所述编码单元所包含的所有像素块的亮度值方差的第二平均值;
判断所述第二平均值是否小于所述第一平均值;
如果是,则确定所述编码单元的区域类型为平坦区域;
如果否,则确定所述编码单元的区域类型为纹理区域。
可选的,所述平坦区域包括以下至少一项:运动连续平坦区域和运动不连续平坦区域;
所述装置还包括:第一判断模块,用于当所述区域类型为所述平坦区域时,所述确定每个所述编码单元的区域类型之后,判断所述编码单元的运动矢量和与所述编码单元指定相邻边的编码单元的运动矢量是否相同,如果是,则确定所述区域类型为所述运动连续平坦区域;如果否,则确定所述区域类型为所述运动不连续平坦区域。
可选的,所述第一控制结果包括:帧级量化参数;所述第二控制结果包括:编码树级量化参数;
所述第二确定模块,用于在所述区域类型为所述运动连续平坦区域的情况下,确定所述编码单元的量化参数为所述帧级量化参数与第一预设阈值之和;
在所述区域类型为所述运动不连续平坦区域的情况下,确定所述编码单元的量化参数为所述编码树级量化参数与第一预设阈值之差;
其中,所述帧级量化参数为在对所述当前视频帧进行所述帧级码率控制时,所获取的量化参数;所述编码树级量化参数为在对所述编码树单元进行所述编码树单元级码率控制时,所获取的量化参数;所述第一预设阈值为非负数。
可选的,所述纹理区域包括以下至少一项:运动连续纹理区域和运动不连续纹理区域;
所述装置还包括:第二判断模块,用于当所述区域类型为所述纹理区域时,所述确定每个所述编码单元的区域类型之后,判断所述编码单元的运动矢量和与所述编码单元指定相邻边的编码单元的运动矢量是否相同,如果是,则确定所述区域类型为所述运动连续纹理区域;如果否,则确定所述区域类型为所述运动不连续纹理区域。
可选的,所述第一控制结果包括:帧级量化参数;所述第二控制结果包括:编码树级量化参数;
所述第二确定模块,还用于在所述区域类型为所述运动连续纹理区域的情况下,确定所述编码单元的量化参数为所述帧级量化参数与第二预设阈值之和;
在所述区域类型为所述运动不连续纹理区域的情况下,确定所述编码单元的量化参数为所述编码树级量化参数与第二预设阈值之差;
其中,所述帧级量化参数为在对所述当前视频帧进行所述帧级码率控制时,所获取的量化参数;所述编码树级量化参数为在对所述编码树单元进行所述编码树单元级码率控制时,所获取的量化参数;所述第二预设阈值均为非负数。
可选的,所述装置还包括:第三判断模块,用于在根据所述量化参数,对所述编码单元进行编码之后,判断是否已对所述编码树单元中的每个编码单元均进行了编码;如果是,则结束对所述编码树单元的所述编码树单元级码率控制。
第三方面,本发明实施例提供了一种电子设备,所述电子设备包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如第一方面所述的视频编码方法的步骤。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的视频编码方法的步骤。
在本发明实施例中,面对于不同的编码单元,可针对性的根据其区域类型确定量化参数,由此,避免了相关技术中,将各个编码单元的量化参数均设置为相同,易产生块效应,或造成码率浪费的技术问题,使得块效应明显减少,且节省了码率,进一步提升了视频的主观质量。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本发明实施例提供的一种视频编码方法的流程图;
图2为本发明实施例提供的一种编码树单元的四叉树形式分割的示意图;
图3为本发明实施例提供的一种编码单元的划分方式的示意图;
图4为本发明实施例提供的一种视频编码方法的流程图;
图5为本发明实施例提供的一种视频编码方法的流程图;
图6为本发明实施例提供的一种视频编码方法的流程图;
图7为本发明实施例提供的一种在编码单元级码率控制中获取量化参数的流程图。
图8为本发明实施例提供的一种视频编码装置的结构框图;
图9为本发明实施例提供的一种电子设备的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1示出了根据本发明实施例所示的一种视频编码方法,如图1所示,方法包括:
步骤S101、对待处理的当前视频帧进行帧级码率控制,得到第一控制结果;
步骤S102、对编码树单元进行编码树单元级码率控制,得到第二控制结果;
步骤S103、基于第一控制结果,确定每个编码单元的区域类型;
其中,区域类型为平坦区域或纹理区域;
步骤S104、根据区域类型、第一控制结果以及第二控制结果,确定编码单元的量化参数;
步骤S105、根据量化参数,对编码单元进行编码。
本发明实施例所示的视频帧的编码方法可应用于H.265编码器,还可应用于H.266编码器、AVS2编码器和AVS3编码器。
在步骤S101中,帧级码率控制(Frame-Level Rate Control)是一种视频编码算法,可简要概括为:将一个目标码率划分到各个帧,并根据各个帧的复杂度、各帧的权重因子、缓冲区饱和度计算各帧的量化参数QP。首先对待处理的当前视频帧进行帧级码率控制,并在进行帧级码率控制的过程中,得到第一控制结果。
需要说明的是,当前视频帧包括多个编码树单元,编码树单元包括多种尺度的编码单元。以H.265编码器为例,在对当前视频帧进行处理时,可将图像划分为“编码树单元(coding tree units,CTU)”,而不是像H.264那样的16×16的宏块。根据不同的编码设置,编码树单元的尺寸可以被设置为64×64或有限的32×32或16×16。很多研究都显示出:更大的编码树单元可以提供更高的压缩效率(同样也需要更高的编码速度)。编码树单元又可向下分成编码单元(Coding Unit,CU)。
以AVS2编码器为例,AVS2将待处理视频流的每帧图像分割为若干个CTU,并采用四叉树形式对CTU进行递归划分,划分成64×64、32×32、16×16和8×8这4种层次的CU,如图2所示。四叉树是一种递回结构,四叉树上的数字可以表示这个节点是否继续做分割,若此节点会继续分割,则为1,若不继续分割则为0,参照图2,当节点上的数字为0时,此节点代表编码单元。也就是说,编码单元可理解为编码树结构上的一个叶子节点。编码树单元可以包含有一个编码单元,或是切割成多个较小的编码单元。
CU是以像素块作为输入,对其进行变换和量化处理后,得到压缩数据。CU的大小可以由编码器根据视频帧的内容自适应调节,目的是使每个CU中的像素块具有更为一致的特性,从而更好地被压缩编码。在进行CU的划分过程中,当某个CU内各部分的运动或纹理非常相似时,通常不需要再将其划分成更小的CU,而如果某个CU内各部分运动或纹理的区别很大时,通常需要将其划分成更小的CU,以图3为示例,当某个CU内各部分的运动或纹理非常相似时,即该CU为平坦区域时,可选择大尺寸的CU(如图3左上角的较大尺寸的正方形所示),如果某个CU内各部分运动或纹理的区别很大时,即该CU为纹理复杂区域,通常会选择较小尺寸的CU(如图3中被分割成较小尺寸的正方形所示)。
在步骤S102中,编码树单元(CTU)级码率控制(CU-tree level rate control)是一种视频编码算法,可简要概括为:根据每个CTU的重要程度,在帧级QP的基础上根据各个CTU在帧间编码时被参考的次数,计算各CTU的QP,也就是说,对编码树单元进行编码树单元级码率控制,得到第二控制结果。
在步骤S103中,可基于第一控制结果,确定每个编码单元的区域类型,其中,区域类型为平坦区域或纹理区域。
在一种可能的实现方式中,第一控制结果包括:在对当前视频帧进行帧级码率控制时,所获取的当前视频帧所包含的所有像素块的亮度值方差的第一平均值;如图4所示,步骤S103、基于第一控制结果,确定每个编码单元的区域类型包括:
步骤S1021、确定编码单元所包含的所有像素块的亮度值方差的第二平均值;
步骤S1022、判断第二平均值是否小于第一平均值;
如果是,则执行步骤S1023;如果否,则执行步骤S1024;
步骤S1023、确定编码单元的区域类型为平坦区域;
步骤S1024、确定编码单元的区域类型为纹理区域;
需要说明的是,在视频编码中,平坦区域和纹理区域是指图像中不同的区域类型。平坦区域指的是像素之间颜色非常接近、没有明显变化的区域,平坦区域通常可以采用简单的编码方式进行处理,这种区域不需要很高的精度,可以通过更少的比特数来表示。纹理区域则是指包含有细节和纹理信息的区域,纹理区域中,像素之间颜色变化较为明显,纹理区域需要使用更复杂的编码方式进行处理,例如使用更详细的预测模型、更复杂的变换算法等,在保留图像细节的同时尽可能减小数据量。
需要说明的是,本申请中,将码率控制分为3级:帧级(层)码率控制,CTU级(层)码率控制和CU级码率控制。而CU级码率控制以帧级码率控制和CTU级码率控制为基础,需要应用到帧级码率控制和CTU级码率控制中的参数。首先,可根据图4所示的可能的实现方式,初步确定每个编码单元的区域类型。在初步确定每个编码单元的区域类型之后,可根据运动矢量这一参数,进一步细化每个编码单元的区域类型。即当区域类型为平坦区域时,执行图5所示的可能的实现方式,或者,当区域类型为纹理区域时,执行图6所示的可能的实现方式。
图5所示的方法包括:
步骤S1023、确定编码单元的区域类型为平坦区域;
步骤S301、判断编码单元的运动矢量和与编码单元指定相邻边的编码单元的运动矢量是否相同;
如果是,则执行步骤S3011;如果否,则执行步骤S3022;
步骤S3011、确定区域类型为运动连续平坦区域;
步骤S3012、确定区域类型为运动不连续平坦区域。
需要说明的是,在视频编码中,运动连续性用于衡量视频帧中像素位置变化是否平滑,在本发明实施例中,若编码单元的运动矢量和与编码单元指定相邻边的编码单元的运动矢量均相同,可认为该编码单元具备运动连续性。因此,可将该编码单元的区域类型在平坦区域的基础上,进一步确定为运动连续平坦区域,否则,则认为该编码单元不具备运动连续性,可将其区域类型进一步确定为运动不连续平坦区域。
图6所示的方法包括:
步骤S1024、确定编码单元的区域类型为纹理区域;
步骤S401、判断编码单元的运动矢量和与编码单元指定相邻边的编码单元的运动矢量是否相同;
如果是,则执行步骤S4011;如果否,则执行步骤S4012;
S4011、确定区域类型为运动连续纹理区域;
S4012、确定区域类型为运动不连续纹理区域。
需要说明的是,在视频编码中,运动连续性用于衡量视频帧中像素位置变化是否平滑,在本发明实施例中,若编码单元的运动矢量和与编码单元指定相邻边的编码单元的运动矢量相同,可认为该编码单元具备运动连续性。因此,可将该编码单元的区域类型在纹理区域的基础上,进一步确定为运动连续纹理区域,否则,则认为该编码单元不具备运动连续性,可将其区域类型进一步确定为运动不连续纹理区域。
需要说明的是,本发明实施例考虑到相邻CU之间的运动和纹理区别较大,在纹理区域内,如果某CU和与其指定相邻边的CU的运动矢量不同,则容易产生块效应。且针对于待处理的视频帧,进行CU级码率控制的顺序为从左上角起始至右下角,因此,在一种可能的实现方式中,与编码单元指定相邻边的编码单元为与该编码单元相邻的左边编码单元,以及与该编码单元相邻的上边编码单元。也就是说,可将某CU和与其相邻CU(左边CU、上边CU,也可理解为历史CU)的运动矢量进行比较,如果均相同,则不易产生块效应,如果至少一个不同,则容易产生块效应。
同理,在平坦区域内,如果某CU和与其指定相邻边的CU的运动矢量不同,则容易产生块效应,如果均相同,则该CU和与其指定相邻边的CU的像素值偏差较小,不易产生块效应。基于此,本发明实施例将CU的区域类型进一步细化为:运动连续纹理区域、运动不连续纹理区域、运动连续平坦区域和运动不连续平坦区域,由此,可针对性的确定不同的区域类型所对应的不同量化参数,区域类型的划分更为精细,可使得量化参数的确定更为准确,进而根据量化参数对编码单元进行编码,可提高视频的主观质量。
在一种可能的实现方式中,第一控制结果包括:帧级量化参数;第二控制结果包括:编码树级量化参数;其中,帧级量化参数为在对当前视频帧进行帧级码率控制时,所获取的量化参数;编码树级量化参数为在对编码树单元进行编码树单元级码率控制时,所获取的量化参数;
步骤104、根据区域类型、第一控制结果以及第二控制结果,确定编码单元的量化参数包括:
在区域类型为运动连续平坦区域的情况下,确定编码单元的量化参数为在对当前视频帧进行帧级码率控制时,所获取的帧级量化参数与第一预设阈值之和;
在区域类型为运动不连续平坦区域的情况下,确定编码单元的量化参数为在对编码树单元进行编码树单元级码率控制时,所获取的编码树级量化参数与第一预设阈值之差;
在区域类型为运动连续纹理区域的情况下,确定编码单元的量化参数为在对当前视频帧进行帧级码率控制时,所获取的帧级量化参数与第二预设阈值之和;
在区域类型为运动不连续纹理区域的情况下,确定编码单元的量化参数为在对编码树单元进行编码树单元级码率控制时,所获取的编码树级量化参数与第二预设阈值之差;
第一预设阈值、第二预设阈值均为非负数。可选的,第一预设阈值的取值范围为[0,5],第一预设阈值如果太大则容易导致CU之间的像素差值太大,而引起块效应,第一预设阈值如果太小则很难达到节省码率的目的,第一预设阈值的典型值为3。可选的,第二预设阈值b的取值范围为[2,6],第二预设阈值如果太大则容易导致CU之间的像素差值太大,而引起块效应,第二预设阈值如果太小则很难达到节省码率的目的,第二预设阈值的典型值为4。
需要说明的是,本发明实施例考虑到相邻CU之间的运动和纹理区别较大,在纹理区域内,如果某CU的区域类型为运动连续平坦区域,则当前CU和相邻CU的像素值偏差较小,不易产生块效应,此时QP可适当增大以节省码率;如果某CU的区域类型为运动不连续平坦区域,则容易产生块效应,此时,QP应相对减小从而减少失真。同理,如果某CU的区域类型为运动连续纹理区域,则当前CU和相邻CU的像素值偏差较小,不易产生块效应,此时QP可适当增大以节省码率;如果某CU的区域类型为运动不连续纹理区域,则容易产生块效应,此时,QP应相对减小从而减少失真。
由此,本发明实施例所示的方法,对运动不连续平坦区域减小QP以减少平坦区域的块效应,对运动连续平坦区域增大QP以节省码率,对运动不连续纹理区域减小QP以减少纹理区域的块效应,对运动连续纹理区域增大QP以节省码率,进而在总码率保持不变的情况下,可使得视频质量有较大的提升。
现以待处理视频帧中,像素块的尺寸均为8×8(一个像素块中有64个像素点)为例,并结合公式对上述实施例进行进一步说明,则CU级码率控制的具体流程如下:
步骤1:在帧级码率控制时,求取第i帧(第i帧为待处理的当前视频帧)的帧级QP,并获取第i帧中所有8×8像素块的亮度值方差var8×8的平均值varm(i)
其中,M表示第i帧中,8×8像素块的个数;
步骤2:在CTU级码率控制时,根据每个CTU的重要程度,以及在帧级QP的基础上根据各个CTU在帧间编码时被参考的次数,计算出第i帧第j个CTU的QP,并标记为QPctu(i,j);
步骤3,在CU级码率控制时,求取第i帧第j个CTU第k个CU所包含的8×8像素块亮度值方差的平均值,记为var(i,j,k),
其中,T表示该第k个CU中包含8×8像素块的个数,如果var(i,j,k)小于varm(i),则判定该第k个CU为平坦区域,并执行步骤4,否则,判定该第k个CU为纹理区域,并执行步骤5;
步骤4,判断该第k个CU和与其相邻的上边CU、左边CU的运动矢量是否相同(也就是说,该第k个CU、所述上边CU、所述左边CU三者的运动矢量均相同);如果是,则执行步骤4.1;如果否,则执行步骤4.2;
步骤4.1:若均相同,则判定该第k个CU为运动连续平坦区域,则该第k个CU的量化参数QPcu(i,j,k)=QPctu(i,j)+a;后执行步骤6;
步骤4.2:若不相同,则判定该第k个CU为运动不连续平坦区域,则该第k个CU的量化参数QPcu(i,j,k)=QPctu(i,j)-a;后执行步骤6;
可理解的是,不相同可分为三种情况,第k个CU和所述上边CU的运动矢量不同,但第k个CU与所述左边CU的运动矢量相同;第k个CU和所述上边CU的运动矢量相同,但第k个CU与所述左边CU的运动矢量不同;第k个CU和所述上边CU的运动矢量不同,且第k个CU与所述左边CU的运动矢量也不同,以上三种情况,均判定该第k个CU为运动不连续平坦区域;
且需要说明的是,a为非负数,可选的,a的取值范围为[0,5],a的值如果太大则容易导致CU之间的像素差值太大,而引起块效应,a的值如果太小则很难达到节省码率的目的,a的典型值为3;
其中,块效应主要是由视频图像采用基于块的编码方式和量化造成相邻块之间存在明显差异的现象,在视频编码中人眼察觉到的小块边界处的不连续;
步骤5:判断该第k个CU和与其相邻的上边CU、左边CU的运动矢量是否相同(也就是说,该第k个CU、所述上边CU、所述左边CU三者的运动矢量均相同);如果是,则执行步骤5.1;如果否,则执行步骤5.2;
步骤5.1:若均相同,则判定该第k个CU为运动连续纹理区域,则该第k个CU的量化参数QPcu(i,j,k)=QPctu(i,j)+b;后执行步骤6;
步骤5.2:若不相同,则判定该第k个CU为运动不连续纹理区域,则该第k个CU的量化参数QPcu(i,j,k)=QPctu(i,j)-b;后执行步骤6;
同理,不相同也可分为3种情况,如步骤4.2中所示,在此不再赘述;
且需要说明的是,b为非负数,b的取值范围为[2,6],b的值如果太大则容易导致CU之间的像素差值太大,而引起块效应,b的值如果太小则很难达到节省码率的目的,b的典型值为4;
步骤6:根据步骤4.1/4.2/4.3/4.4中计算出的量化参数QPcu(i,j,k)对该第k个CU进行编码;
且步骤4.1/4.2/4.3/4.4中,CU的区域类型与具体计算量化参数QP的对应关系,可参照图7所示的流程图;
步骤7:判断该第k个CU是否为第j个CTU中的最后一个CU,若是则结束第j个CTU的CTU级码率控制,并执行步骤8,若否,则令k=k+1,并返回执行步骤3;
步骤8:判断第j个CTU是否为第i帧中的最后一个CTU,若是,则结束第i帧的帧级码率控制,若否,则令j=j+1,并执行步骤2;
需要说明的是,步骤7和步骤8表明,在对当前视频帧进行CU级的码率控制时,需保障对当前视频帧中的每一个CTU的每一个CU均进行了CU级的码率控制;
由此,在CU级码率控制时,将CU的区域类型分为:平坦区域或纹理区域,进一步将平坦区域分为:运动连续平坦区域和运动不连续平坦区域,将纹理区域分为运动连续纹理区域和运动不连续纹理区域,并调节各自的量化参数,相较于现有技术中的H.265、H.266、AVS2、AVS3编码器来说,可达到对运动连续平坦区域节省码率,对运动不连续纹理区域减少块效应的技术效果。
图8示出了根据本发明实施例所示的一种视频编码装置80,包括:
第一控制模块801,用于对待处理的当前视频帧进行帧级码率控制,得到第一控制结果;
其中,当前视频帧包括多个编码树单元,编码树单元包括多种尺度的编码单元;
第二控制模块802,用于对编码树单元进行编码树单元级码率控制,得到第二控制结果;
第一确定模块803,用于基于第一控制结果,确定每个编码单元的区域类型,其中,区域类型为平坦区域或纹理区域;
第二确定模块804,用于根据区域类型、第一控制结果以及第二控制结果,确定编码单元的量化参数;
编码模块805,用于根据量化参数,对编码单元进行编码。
在一种可能的实现方式中,第一控制结果包括:在对当前视频帧进行帧级码率控制时,所获取的当前视频帧所包含的所有像素块的亮度值方差的第一平均值;第一确定模块803,用于确定编码单元所包含的所有像素块的亮度值方差的第二平均值;
判断第二平均值是否小于第一平均值;
如果是,则确定编码单元的区域类型为平坦区域;
如果否,则确定编码单元的区域类型为纹理区域。
在一种可能的实现方式中,平坦区域包括以下至少一项:运动连续平坦区域和运动不连续平坦区域;
装置80还包括:第一判断模块,用于当区域类型为平坦区域时,确定每个编码单元的区域类型之后,判断编码单元的运动矢量和与编码单元指定相邻边的编码单元的运动矢量是否相同,如果是,则确定区域类型为运动连续平坦区域;如果否,则确定区域类型为运动不连续平坦区域。
在一种可能的实现方式中,第一控制结果包括:帧级量化参数;第二控制结果包括:编码树级量化参数;
第二确定模块804,用于在区域类型为运动连续平坦区域的情况下,确定编码单元的量化参数为帧级量化参数与第一预设阈值之和;
在区域类型为运动不连续平坦区域的情况下,确定编码单元的量化参数为编码树级量化参数与第一预设阈值之差;
其中,帧级量化参数为在对当前视频帧进行帧级码率控制时,所获取的量化参数;编码树级量化参数为在对编码树单元进行编码树单元级码率控制时,所获取的量化参数;第一预设阈值为非负数。
在一种可能的实现方式中,纹理区域包括以下至少一项:运动连续纹理区域和运动不连续纹理区域;
装置80还包括:第二判断模块,用于当区域类型为纹理区域时,确定每个编码单元的区域类型之后,判断编码单元的运动矢量和与编码单元指定相邻边的编码单元的运动矢量是否相同,如果是,则确定区域类型为运动连续纹理区域;如果否,则确定区域类型为运动不连续纹理区域。
在一种可能的实现方式中,第一控制结果包括:帧级量化参数;第二控制结果包括:编码树级量化参数;
第二确定模块804,还用于在区域类型为运动连续纹理区域的情况下,确定编码单元的量化参数为帧级量化参数与第二预设阈值之和;
在区域类型为运动不连续纹理区域的情况下,确定编码单元的量化参数为编码树级量化参数与第二预设阈值之差;
其中,帧级量化参数为在对当前视频帧进行帧级码率控制时,所获取的量化参数;编码树级量化参数为在对编码树单元进行编码树单元级码率控制时,所获取的量化参数;第二预设阈值均为非负数。
在一种可能的实现方式中,装置80还包括:第三判断模块,用于在根据量化参数,对编码单元进行编码之后,判断是否已对编码树单元中的每个编码单元均进行了编码;如果是,则结束对编码树单元的编码树单元级码率控制。
由此,对运动不连续平坦区域减小QP以减少平坦区域的块效应,对运动连续平坦区域增大QP以节省码率,对运动不连续纹理区域减小QP以减少纹理区域的块效应(例如:针对于H.265视频编码器在低码率下的复杂区域中的块效应明显减少),对运动连续纹理区域增大QP以节省码率,进而在总码率保持不变的情况下,可使得视频主观质量有较大的提升。
图9示出了根据本发明实施例的一种电子设备,电子设备90包括:处理器901、存储器902及存储在存储器902上并可在处理器901上运行的程序,所述程序被处理器901执行时实现上述实施例所示的视频编码方法的步骤。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现上述实施例所示的视频编码方法的步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。

Claims (10)

1.一种视频编码方法,其特征在于,所述方法包括:
对待处理的当前视频帧进行帧级码率控制,得到第一控制结果;其中,所述当前视频帧包括多个编码树单元,所述编码树单元包括多种尺度的编码单元;
对所述编码树单元进行编码树单元级码率控制,得到第二控制结果;
基于所述第一控制结果,确定每个所述编码单元的区域类型;其中,所述区域类型为平坦区域或纹理区域;
根据所述区域类型、所述第一控制结果以及所述第二控制结果,确定所述编码单元的量化参数;
根据所述量化参数,对所述编码单元进行编码。
2.根据权利要求1所述的方法,其特征在于,所述第一控制结果包括:在对所述当前视频帧进行所述帧级码率控制时,所获取的所述当前视频帧所包含的所有像素块的亮度值方差的第一平均值;
基于所述第一控制结果,确定每个所述编码单元的区域类型包括:
确定所述编码单元所包含的所有像素块的亮度值方差的第二平均值;
判断所述第二平均值是否小于所述第一平均值;
如果是,则确定所述编码单元的区域类型为平坦区域;
如果否,则确定所述编码单元的区域类型为纹理区域。
3.根据权利要求1所述的方法,其特征在于,所述平坦区域包括以下至少一项:运动连续平坦区域和运动不连续平坦区域;
当所述区域类型为所述平坦区域时,所述确定每个所述编码单元的区域类型之后,所述方法还包括:
判断所述编码单元的运动矢量和与所述编码单元指定相邻边的编码单元的运动矢量是否相同,如果是,则确定所述区域类型为所述运动连续平坦区域;如果否,则确定所述区域类型为所述运动不连续平坦区域。
4.根据权利要求3所述的方法,其特征在于,所述第一控制结果包括:帧级量化参数;所述第二控制结果包括:编码树级量化参数;
根据所述区域类型、所述第一控制结果以及所述第二控制结果,确定所述编码单元的量化参数包括:
在所述区域类型为所述运动连续平坦区域的情况下,确定所述编码单元的量化参数为所述帧级量化参数与第一预设阈值之和;
在所述区域类型为所述运动不连续平坦区域的情况下,确定所述编码单元的量化参数为所述编码树级量化参数与第一预设阈值之差;
其中,所述帧级量化参数为在对所述当前视频帧进行所述帧级码率控制时,所获取的量化参数;所述编码树级量化参数为在对所述编码树单元进行所述编码树单元级码率控制时,所获取的量化参数;所述第一预设阈值为非负数。
5.根据权利要求1所述的方法,其特征在于,所述纹理区域包括以下至少一项:运动连续纹理区域和运动不连续纹理区域;
当所述区域类型为所述纹理区域时,所述确定每个所述编码单元的区域类型之后,所述方法还包括:
判断所述编码单元的运动矢量和与所述编码单元指定相邻边的编码单元的运动矢量是否相同,如果是,则确定所述区域类型为所述运动连续纹理区域;如果否,则确定所述区域类型为所述运动不连续纹理区域。
6.根据权利要求5所述的方法,其特征在于,所述第一控制结果包括:帧级量化参数;所述第二控制结果包括:编码树级量化参数;
根据所述区域类型、所述第一控制结果以及所述第二控制结果,确定所述编码单元的量化参数包括:
在所述区域类型为所述运动连续纹理区域的情况下,确定所述编码单元的量化参数为所述帧级量化参数与第二预设阈值之和;
在所述区域类型为所述运动不连续纹理区域的情况下,确定所述编码单元的量化参数为所述编码树级量化参数与第二预设阈值之差;
其中,所述帧级量化参数为在对所述当前视频帧进行所述帧级码率控制时,所获取的量化参数;所述编码树级量化参数为在对所述编码树单元进行所述编码树单元级码率控制时,所获取的量化参数;所述第二预设阈值均为非负数。
7.根据权利要求1所述的方法,其特征在于,在根据所述量化参数,对所述编码单元进行编码之后,所述方法还包括:
判断是否已对所述编码树单元中的每个编码单元均进行了编码;
如果是,则结束对所述编码树单元的所述编码树单元级码率控制。
8.一种视频编码装置,其特征在于,所述装置包括:
第一控制模块,用于对待处理的当前视频帧进行帧级码率控制,得到第一控制结果;其中,所述当前视频帧包括多个编码树单元,所述编码树单元包括多种尺度的编码单元;
第二控制模块,用于对所述编码树单元进行编码树单元级码率控制,得到第二控制结果;
第一确定模块,用于基于所述第一控制结果,确定每个所述编码单元的区域类型;其中,所述区域类型为平坦区域或纹理区域;
第二确定模块,用于根据所述区域类型、所述第一控制结果以及所述第二控制结果,确定所述编码单元的量化参数;
编码模块,用于根据所述量化参数,对所述编码单元进行编码。
9.一种电子设备,其特征在于,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如权利要求1至7中任一项所述的视频编码方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的视频编码方法的步骤。
CN202310800486.6A 2023-06-30 2023-06-30 一种视频编码方法、装置、设备及可读存储介质 Pending CN116828183A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310800486.6A CN116828183A (zh) 2023-06-30 2023-06-30 一种视频编码方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310800486.6A CN116828183A (zh) 2023-06-30 2023-06-30 一种视频编码方法、装置、设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN116828183A true CN116828183A (zh) 2023-09-29

Family

ID=88121732

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310800486.6A Pending CN116828183A (zh) 2023-06-30 2023-06-30 一种视频编码方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN116828183A (zh)

Similar Documents

Publication Publication Date Title
RU2696552C1 (ru) Способ и устройство для видеокодирования
US5974197A (en) Loop filter and loop filtering method
EP2278815B1 (en) Method and apparatus for controlling loop filtering or post filtering in block based motion compensated video coding
CN110036637B (zh) 去噪声化已重构图像的方法及装置
CN110024405B (zh) 图像处理方法及其装置
CN109379594B (zh) 视频编码压缩方法、装置、设备和介质
KR20140093247A (ko) 영상의 재구성된 샘플 세트에 대한 보상 오프셋들의 인코딩/디코딩을 최적화하는 방법 및 장치
EP2664149A1 (en) Deblocking filtering
KR20190122615A (ko) 영상 부호화 방법 및 장치
CN111711825B (zh) 视频编解码中的去块效应滤波方法、装置、设备及介质
CN111586405B (zh) 一种多功能视频编码中基于alf滤波的预测模式快速选择方法
WO2020248715A1 (zh) 基于高效率视频编码的编码管理方法及装置
WO2020183849A1 (ja) 情報処理装置、情報処理方法及びプログラム
US20150120954A1 (en) Method and apparatus for encoding a video stream
KR20180017159A (ko) 디블로킹 필터링 방법 및 디블로킹 필터
CN116828183A (zh) 一种视频编码方法、装置、设备及可读存储介质
US8369423B2 (en) Method and device for coding
Amer et al. Fully connected network for HEVC CU split decision equipped with Laplacian transparent composite model
Zhao et al. Fast CU partition decision strategy based on human visual system perceptual quality
US20120044991A1 (en) Moving image coding apparatus and moving image coding method
US20230108722A1 (en) Allocating bit rate between video streams using machine learning
Lim et al. Adaptive Loop Filter with a CNN-based classification
CN111713105B (zh) 一种视频图像处理方法、设备及存储介质
CN110933410B (zh) Hevc视频帧间预测方法和装置
CN113747177B (zh) 基于历史信息的帧内编码速度优化方法、装置及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination