CN114424525A - 视频处理中的量化参数标识 - Google Patents

视频处理中的量化参数标识 Download PDF

Info

Publication number
CN114424525A
CN114424525A CN202080065346.3A CN202080065346A CN114424525A CN 114424525 A CN114424525 A CN 114424525A CN 202080065346 A CN202080065346 A CN 202080065346A CN 114424525 A CN114424525 A CN 114424525A
Authority
CN
China
Prior art keywords
slice
determining
value
quantization parameter
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080065346.3A
Other languages
English (en)
Inventor
陈杰
廖如伶
罗健聪
叶琰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of CN114424525A publication Critical patent/CN114424525A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本公开提供了处理视频内容的方法。示例性的方法包括:接收包含编码视频数据的比特流;确定编码块的第一参数;根据所述第一参数,确定与增量量化参数(QP)值或色度量化参数偏移值相关联的一个或多个第二参数;以及,根据所述一个或多个第二参数,确定所述增量量化参数值或所述色度量化参数偏移值中的至少一个。

Description

视频处理中的量化参数标识
对相关申请的交叉引用
本披露要求2019年9月20日提交的第62/903,251号美国临时申请的优先权,其全部内容通过引用并入本文。
技术领域
本公开部分主要涉及视频处理,更具体地说,涉及用量化参数处理视频内容的方法和系统。
背景技术
视频是一组捕捉视觉信息的静态图片(或“帧”)。为了减少存储内存和传输带宽,可以将视频压缩后再存储或传输,解压后再显示。压缩过程通常被称为编码,解压过程通常被称为解码。目前有多种采用标准化视频编码技术的视频编码格式,最常见的是基于预测、变换、量化、熵编码和环内滤波的视频编码格式。所述视频编码标准,如HEVC/H.265(HighEfficiency video coding)标准、VVC/H.266(Versatile video coding)标准、AVS(AVSstandards)标准,由标准化组织制定具体的视频编码格式。随着所述视频标准中越来越多先进的视频编码技术的应用,新的视频编码标准的编码效率也越来越高。
发明内容
本公开的实施例提供了一种用于处理视频内容的计算机实现的方法,包括:接收包含编码视频数据的比特流;确定编码块的第一参数;根据所述第一参数,确定与增量量化参数(QP)值或色度量化参数偏移值相关联的一个或多个第二参数;以及,根据所述一个或多个第二参数,确定所述增量量化参数值或所述色度量化参数偏移值中的至少一个。
本公开的实施例还提供用于处理视频内容的系统,包括:存储一组指令集的存储器;以及配置为执行所述指令集的至少一个处理器,使所述系统执行:接收包含编码视频数据的比特流;确定编码块的第一参数;根据所述第一参数,确定与增量量化参数(QP)值或色度量化参数偏移值相关联的一个或多个第二参数;以及,根据所述一个或多个第二参数,确定所述增量量化参数值或所述色度量化参数偏移值中的至少一个。
本公开的实施例还提供了一种非易失性计算机可读介质,存储有指令集,所述指令集由计算机系统的至少一个处理器执行,其中,所述指令集的执行使该计算机系统执行一种方法,包括:接收包含编码视频数据的比特流;确定编码块的第一参数;根据所述第一参数,确定与增量量化参数(QP)值或色度量化参数偏移值相关联的一个或多个第二参数;以及根据所述一个或多个第二参数,确定所述增量量化参数值或所述色度量化参数偏移值中的至少一个。
附图说明
本公开的实施例和各方面在以下详细描述和附图中加以说明。图中所示的各种特征并不是按比例画的。
图1示出与本发明公开的实施例一致的示例性视频序列的结构。
图2A示出与本公开实施例一致的混合视频编码系统的示例性编码过程的原理图。
图2B示出与本公开实施例一致的混合视频编码系统的另一个示例性编码过程的原理图。
图3A示出与本发明实施例一致的混合视频编码系统的示例性解码过程的原理图。
图3B示出与本公开实施例一致的混合视频编码系统的另一个示例性解码过程的原理图。
图4是与本公开的实施例一致的用于编码或解码视频的示例性装置的框图。
图5示出了与本发明实施例一致的、用于编码单元(CU)增量量化参数(QP)的图片参数集(PPS)语法的示例。
图6示出了与本发明的实施例一致的、用于编码单元增量量化参数的编码树级语法的示例。
图7示出了与本公开的实施例一致的、用于编码单元增量量化参数的变换单元级语法的示例。
图8示出了与本公开的实施例一致的片头语法的示例。
图9示出了与本公开的实施例一致的片头语法的另一个示例。
图10示出了与本公开的实施例一致的片头语法的另一个示例。
图11示出了与本公开的实施例一致的帧头语法的另一个示例。
图12示出了与本公开的实施例一致的用于cu_qp_delta_subdiv和cu_chroma_qp_offset_subdiv的PPS语法的示例。
图13示出了与本公开的实施例一致的用于cu_qp_delta_subdiv和cu_chroma_qp_offset_subdiv的片头语法的示例。
图14示出了与本公开的实施例一致的sps_max_mtt_depth_luma的语法的示例。
图15示出了与本公开的实施例一致的用于pps_max_mtt_depth_luma的语法的示例。
图16显示了与本公开的实施例一致的用于cu_qp_delta_subdiv和cu_chroma_qp_offset_subdiv的SPS语法的示例。
图17示出了与本公开的实施例一致的用于cu_qp_delta_subdiv和cu_chroma_qp_offset_subdiv的片头语法的示例。
图18示出了与本公开的实施例一致的用于sps_max_mtt_depth_luma的语法的示例。
图19示出了与本公开的实施例一致的用于sps_max_mtt_depth_luma的语法的另一个示例。
图20示出了与本公开的实施例一致的用于pps_max_mtt_depth_luma的语法的示例。
图21是与本公开的实施例一致的、用于处理视频内容的示例性计算机实现方法的流程图。
具体实施方式
视频编码系统通常用于压缩数字视频信号,例如减少与这些信号相关的存储空间或传输带宽的消耗。随着高清视频(如1920×1080像素分辨率)在视频压缩的各种应用中——如在线视频流、视频会议、视频监控等——越来越受欢迎,开发能够提高视频数据压缩效率的视频编码工具是一个持续性的需求。
例如,视频监控应用在安全、交通、环境监控等许多应用场景中得到了越来越广泛的应用,监控设备的数量和分辨率也在快速增长。许多视频监控应用场景更倾向于为用户提供高清视频,以获取更多的信息,而高清视频每帧有更多的像素来捕获这些信息。然而,高清视频比特流可能有较高的比特率,需要高带宽传输和大的存储空间。例如,一个平均1920×1080分辨率的监控视频流可能需要高达4Mbps的带宽来进行实时传输。此外,视频监控通常会进行7×24的持续监控,如果要存储视频数据,这对存储系统来说是一个很大的挑战。高清视频对高带宽和大容量存储的需求成为其大规模部署在视频监控中的主要限制。
视频是一组按时间顺序排列的静态图片(或“帧”),用来存储视觉信息。视频采集设备(如相机)可以用来在一个时间序列中捕获和储存这些图片,视频播放设备(如电视、电脑、智能手机、平板电脑、视频播放器,或任何具有显示功能的末端用户终端)可以用于在时间序列中显示这些图片。此外,在一些应用程序中,视频获取设备可以实时地将获取的视频传输到视频播放设备(例如,带监控器的计算机),例如用于监控、会议或直播。
为了减少此类应用所需的存储空间和传输带宽,可以将所述视频在存储和传输前压缩,在显示前解压缩。压缩和解压缩可以由处理器(例如,通用计算机的处理器)或专用硬件执行的软件来实现。用于压缩的模块通常被称为“编码器”,用于解压的模块通常被称为“解码器”。编码器和解码器可以统称为“编解码器”。编码器和解码器可以以各种合适的硬件、软件中,或它们的组合的任何一种来实现。例如,编码器和解码器的硬件实现可以包括电路,例如一个或多个微处理器、数字信号处理器(DSP)、特定应用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑或它们的任何组合。编码器和解码器的软件实现可以包括程序代码、计算机可执行指令、固件或固定在计算机可读介质中的任何合适的计算机实现的算法或过程。视频压缩解压缩可以采用多种算法或标准实现,如MPEG-1、MPEG-2、MPEG-4、H.26x系列等。在某些应用程序中,编解码器可以从第一编码标准解压缩视频,然后使用第二编码标准重新压缩解压缩后的视频,在这种情况下,编解码器可以称为“转码器”。
视频编码过程可以识别并保留有用的信息,这些信息可用于重建图像,而在重建图像时可以忽略不重要的信息。如果被忽略的、不重要的信息不能被完全重构,这样的编码过程可以称为“有损的”。否则,它可以被称为“无损的”。大多数编码过程都是有损耗的,这是为了减少所需的存储空间和传输带宽的一种折衷。
一幅正在被编码的图片帧(称为“当前帧”)的有用信息包括相对于参考帧(例如,一幅先前经过编码和重新构建的图片帧)的变化。这些变化可以包括像素的位置变化、亮度变化或颜色变化,其中最受关注的是位置变化。代表一个目标体的一组像素的位置变化可以反映出所述目标体在参考帧和当前帧之间的运动。
某个没有引用其他帧的帧(即,它是它自己的参考帧)被称为“I-帧”。使用某个先前帧作为参考帧来编码的帧称为“P-帧”。使用某个先前帧和某个未来帧作为参考帧来编码的图片帧(即,参考是“双向的”)被称为“B-帧”。
如前所述,使用高清视频的视频监控面临着需要高带宽和大存储的挑战。为了解决这一问题,可以降低视频编码的比特率。在I-、P-和B-帧中,I帧的比特率最高。由于大多数监控视频的背景几乎是静态的,降低编码视频的总体比特率的一种方法是使用更少的I-帧进行视频编码。
然而,使用较少的I-帧的改进可能是微不足道的,因为I-帧在编码视频中通常不是主要的。例如,在一个典型的视频比特流中,I-、B-和P-帧的比例可以是1∶20∶9,其中I-帧占总比特率的比例不足10%。换句话说,在上面这个例子中,即使去掉了所有的I-帧,降低的比特率也不会能超过10%。
本公开提供了使用自适应分辨率变化(ARC)处理视频内容的方法、设备和系统。与相位舍入引起的不准确相位不同,本公开的实施例提供了基于固定相位插值的像素细化进程,以在保持精度的同时降低算法和硬件的复杂性。
图1示出与本公开的实施例一致的示例性视频序列100的结构。视频序列100可以是实时视频,也可以是已经获取并存档的视频。视频100可以是真实生活中的视频,电脑生成的视频(如电脑游戏视频),或两者的组合(如带有增强现实效果的真实生活视频)。视频序列100可以从视频获取设备(如摄像机)、包含先前获取的视频的视频档案(如存储在存储设备中的视频文件)或从视频内容提供商接收视频的视频馈送接口(如视频广播收发器)输入。
如图1所示,视频序列100可以包括一系列沿时间轴排列的帧,包括帧102、104、106、108。帧102-106是连续的,在帧106和帧108之间有更多的帧。在图1中,帧102是一幅I-帧,它的参考帧是帧102本身。帧104为P-帧,其参考帧为帧102,如图中箭头所示。图106为B-帧,其参考帧为帧104和108,如图箭头所示。在某些实施例中,某个帧(例如,帧104)的参考帧可以不是直接在帧的前面或后面。例如,帧104的参考帧可以是帧102前面的帧。应当注意的是,帧102-106的参考帧只是示例,本公开的参考帧的实施例并不限于如图1所示的示例。
通常,由于此类任务的计算复杂性,视频编解码器不会一次对整个帧进行编码或解码。相反,它们可以将帧分割成基本的片段,并对图像一个片段一个片段地进行编码或解码。这种基本片段在本公开中被称为基本处理单元(BPUs)。例如,图1中的结构110显示了视频序列100的帧的示例结构(例如,帧102-108中的任何一个)。在结构110中,一个帧被划分为4×4基本处理单元,其边界以虚线表示。在一些实施例中,基本处理单元在一些视频编码标准(例如,MPEG族,H.261,H.263,或H.264/AVC)中可以被称为“宏块”,或者,在一些其他视频编码标准(例如,H.265/HEVC或H.266/VVC)中被称为“编码树单元”(“CTUs”)。图中的基本处理单元大小可以是一个图像帧中的可变的尺寸,例如128×128、64×64、32×32、16×16、4×8、16×32,或者是任意形状和大小的像素。根据编码效率和要保留在基本处理单元中的细节的程度的平衡,可以为帧选择基本处理单元的大小和形状。
基本处理单元可以是逻辑单元,逻辑单元包括一组存储在计算机存储器(如视频帧缓存器)中的不同类型的视频数据。例如,一个彩色图片帧的基本处理单元可以包含一个亮度分量(Y)代表无色的亮度信息,一个或多个色度分量(例如,Cb和Cr)代表颜色信息和相关的语法元素,亮度和色度分量可以有相同的基本处理单元的大小。在一些视频编码标准(例如H.265/HEVC或H.266/VVC)中,亮度和色度分量可以称为“编码树块”(CTBs)。对基本处理单元执行的任何操作都可以重复地对其亮度和色度分量执行。
视频编码有多个操作阶段,具体示例详见图2A-2B和图3A-3B。对于每个阶段,基本处理单元的大小仍然可能太大而无法处理,因此可以进一步划分为在本公开中称为“基本处理子单元”的片段。在一些实施例中,基本处理子单元可以在一些视频编码标准(例如,MPEG族,H.261,H.263,或H.264/AVC)中称为“块”,或在一些其他视频编码标准(例如,H.265/HEVC或H.266/VVC)中称为“编码单元”(“CUs”)。基本处理子单元可以具有与基本处理单元相同或更小的大小。与基本处理单元类似,基本处理子单元也是逻辑单元,它可以包括一组不同类型的视频数据(例如Y、Cb、Cr,以及相关的语法元素),这些数据存储在计算机内存(例如视频帧缓存区)中。对基本处理子单元执行的任何操作都可以重复地对其亮度和色度分量执行。应该注意的是,这种划分可以根据处理需要进一步执行到更进一步的层级。还应该注意的是,不同的阶段可以使用不同的方案来划分基本的处理单元。
例如,在模式决策阶段(详见图2B所示),所述编码器可以为一个基本处理单元确定所使用的预测模式(例如,帧内预测或帧间预测),但可能由于该单元太大,无法做出这样的决策。编码器可以将基本处理单元拆分为多个基本处理子单元(例如,在H.265/HEVC或H.266/VVC中的CUs),并为每个基本处理子单元确定一个预测类型。
再举一个例子,在预测阶段(如图2A所示),编码器可以在基本处理子单元(如CUs)级别上进行预测操作。但是,在某些情况下,基本的处理子单元可能仍然太大而无法处理。编码器可以进一步将基本处理子单元分割成更小的片段(例如,在H.265/HEVC或H.266/VVC中指“预测块”或“PBs”),在这个级别上可以执行预测操作。
再举一个例子,在变换阶段(详见图2A),编码器可以对残差基本处理子单元(如CUs)进行变换操作。但是,在某些情况下,基本的处理子单元可能仍然太大而无法处理。编码器可以进一步将基本处理子单元分割成更小的片段(例如,在H.265/HEVC或H.266/VVC中称为“变换块”或“TBs”),在这个级别上可以执行变换操作。需要注意的是,同一基本处理子单元在预测阶段和变换阶段的划分方案可能不同。例如,在H.265/HEVC或H.266/VVC中,同一CU的预测块和变换块可以有不同的大小和数量。
在图1的结构110中,将基本处理单元112进一步划分为3×3基本处理子单元,子单元的边界以虚线表示。在不同的方案中,同一图片帧的不同基本处理单元可以划分为不同的基本处理子单元。
在一些实施方式中,为了对视频编码和解码提供并行处理和容错的能力,图片帧可被划分为多个区域进行处理,这样,对所述图片帧的某个区域,编码或解码过程可以不依赖该帧其他任何区域的信息。换句话说,帧中的每个区域都可以独立处理。通过这样处理,编解码器可以并行处理图像的不同区域,从而提高编码效率。此外,当一个区域的数据在处理过程中被破坏或在网络传输中丢失时,编解码器可以正确地对同一图片帧的其他区域进行编码或解码,而不依赖于被破坏或丢失的数据,从而提供了容错能力。在一些视频编码标准中,可以将一个图片帧划分为不同类型的区域。例如,H.265/HEVC和H.266/VVC提供了两种类型的区域:“条行片(slices)”和“矩形片(tiles)”。还需要注意的是,对于将某个图片帧划分为多个区域,视频序列100中的不同图片帧可以有不同的划分方案。
例如,在图1中,将结构110划分为114、116、118三个区域,区域的边界以结构110内部的实线表示。区域114包括四个基本处理单元。区域116和区域118各包括六个基本处理单元。应该指出的是,图1中结构110的基本处理单元、基本处理子单元和区域只是示例,而且本公开并不限制其具体实施方式。
图2A示出与本发明实施例一致的示例性编码进程200A的示意图。按照进程200A,编码器可以将视频序列202编码成视频比特流228。与图1中的视频序列100相似,视频序列202可以包括一组按时间顺序排列的图片帧(称为“初始帧”)。与图1中的结构110相似,视频序列202的每个初始帧都可以被编码器划分为基本处理单元、基本处理子单元或用于处理的区域。在一些实施例中,所述编码器能够在基本处理单元级别上对视频序列202的每个原始帧执行进程200A。例如,编码器可以以迭代的方式执行进程200A,其中编码器可以在进程200A的一次迭代中编码一个基本处理单元。在一些实施例中,编码器可以对视频序列202的每个初始帧的区域(例如,区域114-118)并行执行进程200A。
在图2A中,编码器可以将视频序列202的初始帧的基本处理单元(称为“初始BPU”)输入到预测阶段204,生成预测数据206和预测BPU 208。所述编码器可以从初始BPU中减去预测BPU 208,得到残差BPU 210。该编码器可将残差BPU 210提供给变换阶段212和量化阶段214,生成量化变换系数216。该编码器可以将预测数据206和量化变换系数216输入到二进制编码阶段226以生成视频比特流228。组件202、204、206、208、210、212、214、216、226和228可以被称为“前向路径”。在进程200A中,经过量化阶段214后,编码器可以将量化后的变换系数216提供给反向量化阶段218和反向变换阶段220,生成重构残差BPU222。编码器可以将重构残差BPU 222加入到预测BPU 208中,生成预测参考224,用于进程200A的下一次迭代的预测阶段204。进程200A的组件218、220、222和224可以称为“重构路径”。可以使用重构路径来确保编码器和解码器都使用相同的参考数据进行预测。
编码器可迭代执行进程200A,以对初始帧的每个初始BPU进行编码(在前向路径中),并生成预测参考224,用于对初始帧的下一个初始BPU进行编码(在重构路径中)。在对初始帧的所有初始BPU进行编码后,所述编码器可以继续对视频序列202中的下一图片帧进行编码。
参考进程200A,所述编码器可以接收由视频获取设备(如摄像机)产生的视频序列202。这里所使用的“接收”一词可以指接收、输入、获得、检索、获取、读取、访问或以任何方式输入数据的任何动作。
在预测阶段204,在当前迭代中,所述编码器可以接收初始BPU和预测参考224,并执行预测操作以生成预测数据206和预测BPU 208。预测参考224可以从进程200A的前一次迭代的重构路径获得。预测阶段204的目的是通过提取预测数据206来减少信息冗余,所述预测数据206可用于从预测数据206和预测参考224中重构所述初始BPU为预测BPU208。
理想情况下,预测BPU 208可以与初始BPU完全相同。但是,由于非理想的预测和重构操作,预测BPU208通常与初始BPU208略有不同。为了记录这些差异,在生成预测BPU 208后,所述编码器可以将其从初始BPU中减去,生成残差BPU 210。例如,所述编码器可以从初始BPU的像素值中减去预测BPU 208的相应像素值(如灰度值或RGB值)。残差BPU210的每个像素都可以有一个残差值,该残差值是初始BPU与预测BPU208的对应像素相减的结果。与初始BPU相比,预测数据206和残差BPU 210的比特数可以更少,但可用于初始BPU的重构,且质量没有明显下降。因此,所述初始BPU被压缩。
为了进一步压缩残差BPU 210,在变换阶段212,编码器可以通过将残差BPU 210分解成一组二维“基本图案”来减少其空间冗余,每个基本图案都与一个“变换系数”相关。所述基本图案可以具有相同的大小(例如,残差BPU 210的大小)。每个基本图案可以代表残差BPU210的一个变化频率(如亮度变化频率)分量。任何基本图案都不能从任何其他基本图案的任何组合(例如,线性组合)中复制出来。换句话说,所述分解可以将残差BPU210的变化分解到一个频域。这种分解类似于函数的离散傅里叶变换,其中的基本图案类似于离散傅里叶变换的基函数(例如,三角函数),而变换系数类似于与基函数相关的系数。
不同的变换算法可以使用不同的基本图案。在变换阶段212中可以使用各种变换算法,例如,离散余弦变换、离散正弦变换或类似的变换。变换阶段212的变换是可逆的。也就是说,所述编码器可以通过变换的反运算(称为“反向变换”)恢复残差BPU210。例如,要恢复残差BPU210的某个像素,可以将基本图案对应像素的值乘以各自的相关系数,然后将所述乘积相加,得到一个加权和。对于某一个视频编码标准,所述编码器和所述解码器都可以使用相同的变换算法(因此,相同的基本图案)。因此,所述编码器可以只记录变换系数,所述解码器可以在无需接收编码器的基本图案的情况下重构残差BPU210。与残差BPU210相比,变换系数可以有更少的比特,但它们可以用来重建残差BPU210而不会有明显的质量劣化。由此,残差BPU210被进一步压缩。
所述编码器可以在量化阶段214进一步压缩变换系数。在所述变换过程中,不同的基本图案可以表示不同的变化频率(如,亮度变化频率)。由于人眼通常更善于识别低频变化,编码器可以忽略高频变化的信息,而不会造成解码质量的显著下降。例如,在量化阶段214,编码器可以通过将每个变换系数除以一个整数值(称为“量化参数”)并将商舍入到其最接近的整数来生成量化变换系数216。经过这样的运算,可以将高频基本图案的某些变换系数转换为零,将低频基本图案的变换系数转换为更小的整数。编码器可以忽略零值的量化变换系数216,从而进一步压缩变换系数。量化过程也是可逆的,其中量化变换系数216可以通过量化的逆运算(简称“逆量化”)重构为所述变换系数。
由于所述编码器在舍入操作中忽略了这些除法的余数,量化阶段214可能是有损的。通常,在进程200A中,量化阶段214会造成最多的信息损失。信息损失越大,量化变换系数216所需的比特就越少。为了获得不同程度的信息损失,所述编码器可以使用不同的量化参数值或量化过程中的任何其他参数值。
在二进制编码阶段226,所述编码器可以使用二进制编码技术对预测数据206和量化变换系数216进行编码,例如熵编码、变长编码、算术编码、霍夫曼编码、背景自适应二进制算术编码,或任何其他无损或有损压缩算法。在某些实施例中,除预测数据206和量化变换系数216外,所述编码器还可以在二进制编码阶段226对其他信息进行编码,例如,在预测阶段204中使用的预测模式、预测操作的参数、在变换阶段212中的变化类型、量化过程的参数(例如,量化参数)、编码器控制参数(例如,比特率控制参数),或类似的参数。编码器可以利用二进制编码阶段226的输出数据生成视频比特流228。在一些实施例中,视频比特流228可以被进一步打包以用于网络传输。
参考进程200A的重构路径,在反向量化阶段218,所述编码器可以对量化变换系数216进行反向量化,生成重构变换系数。在反向变换阶段220,所述编码器可以根据重构变换系数生成重构残差BPU222。所述编码器可以将重构残差BPU222加入到预测BPU208中,生成预测参考224,在进程200A的下次迭代中使用。
需要注意的是,进程200A的其他变体也可以用来对视频序列202进行编码。在一些实施例中,进程200A的各个阶段可以由编码器按不同的顺序执行。在一些实施例中,进程200A的一个或多个阶段可以合并成单个阶段。在一些实施例中,进程200A的单个阶段可以分为多个阶段。例如,变换阶段212和量化阶段214可以合并成一个单独的阶段。在一些实施例中,进程200A可以包括额外的阶段。在一些实施例中,进程200A可以省略图2A中的一个或多个阶段。
图2B示出与本公开的实施例一致的另一个示例性编码进程200B的示意图。进程200B可以从进程200A修改而来。例如,进程200B可用于符合混合视频编码标准(如H.26x系列)的编码器。与进程200A相比,进程200B的前向路径增加了模式决策阶段230,并将预测阶段204分为空间预测阶段2042和时间预测阶段2044。所述进程200B的重构路径还包括环路滤波器阶段232和缓存区234。
一般而言,预测技术可分为两类:空间预测和时间预测。空间预测(例如,帧内预测或“内预测”)可以使用来自同一帧中一个或多个已编码的相邻BPU的像素来预测所述当前BPU。也就是说,空间预测中的预测参考224可以包含所述相邻BPUs。所述空间预测可以减少所述图片帧的固有的空间冗余。时间预测(例如,帧间预测或“间预测”)可以使用来自已编码帧中的一个或多个区域来预测所述当前BPU。即,时间预测中的预测参考224可以包含所述已编码帧。所述时间预测可以减少所述帧的固有的时间冗余。
参考进程200B,在前向路径中,所述编码器分别在空间预测阶段2042和时间预测阶段2044进行预测操作。例如,在空间预测阶段2042,所述编码器可以执行所述内预测。对于正在编码的图片帧的初始BPU,预测参考224可以在同一图片帧中包含一个或多个已编码(在前向路径中)和已重构(在重构路径中)的相邻BPU。所述编码器可以通过所述相邻BPU推算,来生成预测BPU208。所述推算技术可以包括,例如,线性外推或内插,多项式外推或内插,或类似的。在某些实施例中,所述编码器可以在像素级执行所述推算,例如,为预测BPU208的每个像素推算相应像素的值。用于推算的所述相邻BPUs可以相对于初始BPU位于不同的方向,如在垂直方向上(例如,在所述初始BPU上部),水平方向(例如,在所述初始BPU左侧),对角线方向(例如,所述初始BPU的下左侧,下右侧、上左侧,或上右侧),或者,所使用的视频编码标准中定义的任何方向。对于所述内预测,预测数据206可以包括,例如,已使用的相邻BPU的位置(如坐标),已使用的相邻BPU的大小,所述推测的参数,所使用的相邻BPU相对于所述初始BPU的方向,等等。
再例如,在时间预测阶段2044,所述编码器可以进行间预测。对于某个当前帧的初始BPU,预测参考224可以包含一个或多个经过编码(在前向路径中)和重构(在重构路径中)的图片帧(称为“参考帧”)。在某些实施例中,可以通过BPU逐个对一个参考帧进行编码和重构。例如,所述编码器可以将重构残差BPU222添加到预测BPU208上,生成一个重构BPU。当同一图片帧的所有重构BPU都生成后,所述编码器就可以生成一个重构图片帧作为参考帧。所述编码器可以执行“运动估计”的操作,在参考帧的作用域(称为“搜索窗口”)中搜索匹配区域。参考帧中搜索窗口的位置可以根据当前帧中初始BPU的位置来确定。例如,所述搜索窗口可以位于参考帧中具有与当前帧的初始BPU具有相同坐标的位置的中间,并且可以向外扩展到预定的距离。当所述编码器在搜索窗口中识别出(例如,通过使用递归算法、块匹配算法或类似的方法)一个与初始BPU相似的区域时,编码器可以确定该区域为匹配区域。匹配的区域可以与所述初始BPU具有不同的尺寸(例如小于、等于、大于或形状不同)。由于所述参考帧和当前帧在时间轴上是时间分离的(如图1所示),可以认为所述匹配区域随着时间的推移“移动”到初始BPU的位置。编码器可以将这种运动的方向和距离记录为“运动矢量”。当使用多个参考帧时(如图1中的帧106),所述编码器可以为每个参考帧搜索匹配区域并确定其相关的运动矢量。在某些实施例中,所述编码器可以为分别匹配的参考帧的匹配区域的像素值分配权重。
运动估计可以用来识别各种各样的运动,例如,平移、旋转、缩放等等。对于间预测,预测数据206可以包括,例如,匹配区域的位置(如坐标),与所述匹配区域相关联的运动向量,参考帧的数量,与参考帧相关联的权重,等等。
为了生成预测BPU208,所述编码器可以执行“运动补偿”操作。所述运动补偿可以基于预测数据206(如运动向量)和预测参考224重构预测BPU208。例如,所述编码器可以根据运动向量量移动参考帧的所述匹配区域,通过所述运动矢量编码器可以预测当前帧的初始BPU。当使用多个参考帧时(如图1中的帧106),所述编码器可以根据对应的运动向量和匹配区域的平均像素值对参考帧的匹配区域进行移动。在某些实施例中,如果所述编码器已对各自的匹配参考帧的匹配区域的像素值分配权重,则编码器可以对所述移动匹配区域的像素值加权求和。
在一些实施例中,所述间预测可以是单向的或双向的。单向间预测可以使用相对于当前帧在同一时间方向上的一个或多个参考帧。例如,图1中的图104是一个单向间预测帧,其中参考图(即帧102)在图104之前。双向预测可以在相对于当前帧的两个时间方向上使用一个或多个参考帧。例如,图1中的帧106是一个双向间预测帧,其中所述参考帧(即帧104和帧108)相对于帧104在两个时间方向上。
请继续参考进程200B的前向路径,在空间预测阶段2042和时间预测阶段2044之后,在模式决策阶段230,所述编码器可以为进程200B的当前迭代选择一种预测模式(如,所述内预测或间预测中的一种)。例如,所述编码器可以执行率失真优化技术,通过该技术,依据所述候选预测模式的比特率以及所述候选预测模式下的重建参考帧的失真,所述编码器可以选择一种预测模式来最小化代价函数的值。根据所选的预测模式,所述编码器可以生成相应的预测BPU 208和预测数据206。
在进程200B的重构路径中,如果在前向路径中选择了内预测模式,在生成预测参考224(如,所述当前BPU已经在当前帧中被编码和被重构)后,所述编码器可以直接将预测参考224输入到空间预测阶段2042,以供以后使用(例如,对当前帧的下一个BPU进行推算)。如果在前向路径中选择了所述间预测模式,在生成预测参考224(例如,其中所有BPUs都已经被编码和被重构的当前帧)后,编码器可以将预测参考224提供给给环路滤波器阶段232,其中,所述编码器可以对预测参考224应用环路滤波器以减少或消除由所述间预测引入的失真(例如,块效应)。所述编码器可以在环路滤波器阶段232中应用各种环路滤波器技术,例如,去块、采样自适应偏移、自适应环路滤波器或类似的技术。所述经过环路滤波的参考帧可以存储在缓存区234(或“已解码帧缓存区”)中供以后使用(例如,作为视频序列202的某个未来帧的间预测参考帧)。该编码器可以在缓存区234中存储一个或多个参考帧,以便在时间预测阶段2044使用。在某些实施例中,所述编码器可以在二进制编码阶段226编码环路滤波器的参数(例如,环路滤波器强度),以及量化变换系数216、预测数据206和其他信息。
图3A示出与本发明实施例一致的示例性解码进程300A的示意图。进程程300A可以是与图2A中的压缩进程200A相对应的解压过程。在某些实施例中,进程300A可以类似于进程200A的重构路径。解码器可以根据进程300A将视频比特流228解码为视频流304。视频流304可以非常类似于视频序列202。但是,由于压缩和解压缩过程中的信息丢失(例如,图2A-AB中的量化阶段214),通常,视频流304与视频流202不完全相同。类似图2A-2B中的进程200A和进程200B,所述解码器可以在基本处理单元(BPU)级别对视频比特流228中已编码的每一帧执行进程300A。例如,解码器可以以迭代的方式执行进程300A,其中所述解码器可以在进程300A的一次迭代中解码一个基本处理单元。在某些实施例中,所述解码器能够对视频比特流228的每个已编码帧的区域(例如,区域114-118)并行执行进程300A。
在图3A中,所述解码器可以将与已编码帧的基本处理单元(称为“已编码BPU”)相关的视频比特流228的一部分提供给二进制解码阶段302。在二进制解码阶段302,所述解码器可以将该部分解码为预测数据206和量化变换系数216。该解码器可将量化变换系数216提供给反向量化阶段218和反向变换阶段220,以生成重构残差BPU 222。该解码器可将预测数据206提供给预测阶段204,以生成预测BPU208。该解码器可以将重构残差BPU222加入预测BPU208中,生成预测参考224。在一些实施例中,预测参考224可以存储在缓存器中(例如,计算机存储器中的解码帧缓存器)。所述解码器可以将预测参考224提供给预测阶段204,以便在进程300A的下一次迭代中执行预测操作。
所述解码器可对进程300A进行迭代处理,以便对已编码帧的每个已编码BPU进行解码,并生成预测参考224,用于对所述已编码帧的下一个编码BPU进行编码。解码所述已编码帧的所有编码BPU后,所述解码器可以将该图像帧输出到视频流304中显示,并开始对视频比特流228中的下一编码帧进行解码。
在二进制解码阶段302,所述解码器可以对编码器使用的二进制编码技术(如熵编码、变长编码、算术编码、霍夫曼编码、背景自适应二进制算术编码或任何其他无损压缩算法)进行逆运算。在某些实施例中,除预测数据206和量化变换系数216外,所述解码器还可以在二进制解码阶段302解码其他信息,例如,预测模式、预测操作的参数、变换类型、所述量化进程的参数(例如量化参数)、编码器控制参数(例如,比特率控制参数),或类似的参数。在某些实施例中,如果视频比特流228以包的形式通过网络传输,所述解码器可以在将视频比特流228送入二进制解码阶段302之前对其进行解包处理。
图3B示出与本发明实施例一致的另一个示例性解码进程300B的示意图。进程300B可以从300A改进获得。例如,进程300B可由符合混合视频编码标准(如,H.26x系列)的解码器使用。与进程300A相比,进程300B额外的将预测阶段204划分为空间预测阶段2042和时间预测阶段2044,并增设环路滤波器阶段232和缓存区234。
在进程300B中,对于正在解码的已编码帧(称为“当前帧”)的已编码基本处理单元(称为“当前BPU”),由解码器从二进制解码阶段302解码的预测数据206可以包括各种类型的数据,这取决于编码器使用何种预测模式对所述当前BPU进行编码。例如,如果所述编码器使用内预测来编码所述当前BPU,预测数据206可以包括表明内预测的预测模式标识(例如,某个标志位值),所述内预测操作的参数,或类似的东西。内预测操作的参数可以包括,例如,用作参考的一个或多个相邻BPU的位置(例如坐标),相邻BPU的大小,推算参数,相邻BPU相对于初始BPU的方向,等等。再举一个例子,如果所述编码器使用间预测来编码所述当前BPU,则预测数据206可以包含一个表明所述间预测的预测模式标识(例如,某个标志位的值),所述间预测操作的参数,或者类似的东西。间预测操作的参数可以包括,例如,与当前BPU相关联的参考帧的数量、与各个参考帧相关联的权重、各参考帧中一个或多个匹配区域的位置(如坐标)、分别与匹配区域相关联的一个或多个运动向量,或类似的东西。
根据所述预测模式标识,所述解码器可以在空间预测阶段2042进行空间预测(如,内预测),还是在时间预测阶段2044进行时间预测(如,间预测)。执行这种空间预测或时间预测的细节已经在图2B中描述,下面不再重复。在进行这种空间预测或时间预测后,所述解码器可以生成预测BPU208。如图3A所示,所述解码器可将预测BPUu208和重构残差BPU222相加,生成预测参考224。
在进程300B中,所述解码器可以将预测参考224提供给空间预测阶段2042或时间预测阶段2044,以便在进程300B的下一次迭代中进行预测操作。例如,如果所述当前BPU解码使用空间预测阶段2042的内预测解码,在生成预测参考224(例如,所述已解码当前BPU)后,所述解码器可以直接将预测参考224提供给空间预测阶段2042,以便后续使用(例如,用于当前帧的下一个BPU的推算)。如果在时间预测阶段2044使用间预测解码当前BPU,在生成预测参考224(例如,所有BPUs已经被解码的参考帧)后,编码器可以将预测参考224提供给环路滤波器232以减少或消除失真(如,块效应)。所述解码器可以按照图2B所述的方式将环路滤波器应用于预测参考224。所述环路滤波后的参考帧可以存储在缓存区234(例如,计算机存储器中的已解码帧缓存区)中供以后使用(例如,用作视频比特流228中的未来编码帧的间预测参考帧)。该解码器可以在缓存区234中存储一个或多个参考帧,以便在时间预测阶段2044使用。在某些实施例中,当预测数据206的预测模式标识表明使用间预测对当前BPU进行编码时,预测数据可以进一步包括环路滤波器的参数(例如环路滤波器强度)。
图4是与本发明的实施例一致的用于视频编码或解码的示例性装置400的框图。如图4所示,装置400可以包括处理器402。当处理器402执行本文描述的指令集时,装置400可以成为视频编码或解码的专用机器。处理器402可以是适于操作或处理信息的任何类型的电路。例如,处理器402可以包含任意数量的任意组合的中央处理单元(CPU)、图形处理单元(GPU)、神经处理单元(“NPU”)、微控制器单元(MCU)、光学处理器、可编程逻辑控制器、单片机、微处理器、数字信号处理器、IP核、可编程逻辑阵列(PLA)、可编程阵列逻辑(PAL)、通用阵列逻辑(GAL)、复杂可编程逻辑器件(CPLD)、现场可编程门阵列(FPGA)、片上系统(SoC)、专用集成电路(ASIC)等。在某些实施例中,处理器402还可以是一组分组为单个逻辑组件的处理器。例如,如图4所示,处理器402可以包含多个处理器,包括处理器402a、处理器402b和处理器402n。
装置400还可以包括配置用来存储数据(例如,一组指令集、计算机代码、中间数据等)的内存404。例如,如图4所示,所存储的数据可以包括程序指令(例如,用于实现进程200A、200B、300A或300B中的各个阶段的程序指令)和用于处理的数据(例如,视频序列202、视频比特流228或视频流304)。处理器402可以访问程序指令和数据以进行处理(例如,通过总线410),以及执行所述程序指令以对当前处理数据执行操作或控制。内存404可以包含高速随机访问存储设备或非易失性存储设备。在一些实施例中,内存404可以包括任意组合的任意数量的随机存取存储器(RAM)、只读存储器(ROM)、光盘、磁盘、硬盘、固态硬盘闪存驱动器、安全数字(SD)卡、记忆棒,紧凑型闪存(CF)卡,或类似的。内存404也可以是作为单个逻辑组件的一组内存(图4中没有显示)。
总线410可以是在装置400内部组件之间传输数据的通信设备,例如内部总线(例如中央处理器-内存总线)、外部总线(例如,通用串行总线端口、外围组件互连快速端口),或类似设备。
为了便于解释而不引起歧义,处理器402和其他数据处理电路在本公开中统称为“数据处理电路”。数据处理电路可以完全以硬件实现,也可以以软件、硬件或固件的组合实现。此外,数据处理电路可以是一个独立的模块,也可以全部或部分地组合进设备400的其他元件。
装置400还可以包括网络接口406,以提供与网络(例如,因特网、内部网、局域网、移动通信网等)的有线或无线通信。在一些实施例中,网络接口406可以包括网络接口控制器(NIC)、射频(RF)模块、应答器、收发器、调制解调器、路由器、网关、有线网卡、无线网卡、蓝牙网卡、红外网卡、近场通信(NFC)适配器、蜂窝网络芯片,或类似的装置。
在一些实施例中,可选地,装置400还可以包括外围接口408,以提供到一个或多个外围设备的连接。如图4所示,外围设备可以包括,但不限于,游标控制装置(如鼠标,触摸板或触摸屏),键盘,显示器(例如,阴极射线管显示器,液晶显示器,或发光二极管显示),视频输入设备(例如,摄像头或与视频档案连接的输入接口),或类似的东西。
需要注意的是,视频编解码器(例如,编解码器执行进程200A、200B、300A或300B)可以通过装置400中的任何软件或硬件模块的任意组合来实现。例如,进程200A、200B、300A或300B的部分或所有阶段可以作为装置400的一个或多个软件模块来实现,例如,可加载到内存404中的程序指令。另一个例子是,进程200A、200B、300A或300B的某些或所有阶段可以采用装置400的一个或多个硬件模块来实现,例如,专门的数据处理电路(例如,FPGA、ASIC、NPU等)。
在VVC中,一个图片帧被分成一个或多个块行(tile rows)和一个或多个块列(tile columns)。块(tile)是一组CTU序列,它覆盖了图片的一个矩形区域。在一个块中,CTU按照在该块中的光栅扫描顺序被扫描。一个片(slice)由整数个完整块或图片帧中某个块中的整数个连续的完整CTU行组成。因此,每个纵向片边界也是一个纵向块边界。一个片的水平边界可能不是一个块的边界,而是由一个块内的水平CTU边界组成。当一个块被分割成多个矩形片时,就会出现这种情况,每个矩形片由在所述块中的整数个连续的完整CTU行组成。
在VVC中,编码视频比特流——一种网络抽象层(NAL)单元形式或字节流形式的比特序列,形成一个或多个编码视频序列(CVS),而每个CVS又由一个或多个编码层视频序列(CLVS)组成。一个CLVS是一个帧单元(PUs)序列,每个帧单元正好包含一个编码帧。
一个PU由0个或1个帧头(PH)NAL单元(包含作为有效载荷的帧头语法结构)、1个编码帧(包含1个或多个视频编码层(VCL)NAL单元)和0个或多个其他非VCL的NAL单元组成。一个VCL NAL单元包含一个编码片,它由片头和片数据组成
在VVC中,量化参数(QP)的范围可以从0到63,并且初始QP标识可以根据情况改变。当片头中编码了slice_qp_delta的非零值时,则SliceQpY的初始值在片级别被修改。具体来说,init_qp_minus26的值被修改为(-26+QpBdOffsetY)~+37。当一个变换块的大小不是4的幂次时,变换系数的处理伴随着对QP或QP levelScale表的修改,而不是通过乘以181/256(或181/128),以补偿变换过程中的隐式缩放。对于变换忽略块,允许的最小QP定义为4,因为当QP=4时量化步长变为1。
此外,QP值可以从一个CU更改为另一个CU,也可以从一个量化组更改为另一个量化组。亮度和色度分量的增量量化参数值可以分别单独标识。
对于每个亮度编码块,首先,变量qPY_PREV以如下方式导出:
-如果以下一个或多个条件为真,qPY_PREV被设置为等于SliceQpY:
-当前的量化组是某个条形片中的第一量化组。
-当前的量化组是某个块形片中的第一量化组。
-否则,将qPY_PREV设置为等于按解码顺序的前一个量化组中最后一个亮度编码单元的亮度量化参数QpY()。
第二,变量qPY_A的以如下方式导出:
-如果以下一个或多个条件为真,qPY_A设置为等于qPY_PREV
—当前量化组的左邻块不可用。
-当前量化组和当前编码块的左邻块在不同的编码树块(CTB)中
-否则,将qPY_A设置为等于当前量化组上方编码单元的亮度量化参数。
第三,变量qPY_B的以如下方式导出导:
-如果以下一个或多个条件为真,qPY_B被设置为等于qPY_PREV
—当前量化组的上相邻块不可用。
—当前量化组与当前编码块的上相邻块在不同的编码树块(CTB)中
—否则,qPY_B设置为等于当前量化组左侧编码单元的亮度量化参数。
第四,如果所述当前量化组是块内编码树块(CTB)行中的第一个量化组,且当前量化组的上相邻块是可用的,
qPY_PRED被设置为qPY_B
否则
qPY_PRED=(qPY_A+qPY_B+1)>>1
推导出qPY_PRED后,可由以下式1推导出当前亮度编码块Qp′Y的量化参数:
Qp′Y=((qPY_PRED+CuQpDeltaVal+64+2*QpBdOffsetY)%(64+QpBdOffsetY))(公式1)
其中QpBdOffsetY等于6*sps_bitdepth_minus8,所述变量CuQpDeltaVal指定亮度编码块的量化参数与其预测值之间的差值。
在VVC中,CuQpDeltaVal被指定为cu_qp_delta_abs*(1-2*cu_qp_delta_sign_flag),其中cu_qp_delta_abs和cu_qp_delta_sign_flag是在CU级别的比特流中标记的语法元素。当cu_qp_delta_abs和cu_qp_delta_sign_flag在比特流中未出现时,CuQpDeltaVal可以被推断为0。
色度编码块的量化参数可能与QpY不同。色度量化参数(QpCb,QpCr,QpCbCr)和亮度量化参数之间的偏移量可以在比特流中标识。在VVC中,色度量化参数Qp′Cb和Qp′Cr,以及联合Cb-Cr编码Qp′CbCr的QP可由如下公式2-公式4导出:
Qp′Cb=Clip3(-QpBdOffsetC,63,qPCb+pps_cb_qp_offset+slice_cb_qp_offset+CuQpOffsetCb)+QpBdOffsetc (公式2)
Qp′Cr=Clip3(-QpBdOffsetC,63,qPCr+pps_cr_qp_offset+slice-cr-qp_offset+CuQpOffsetCr)+QpBdOffsetc (公式3)
Qp′CbCr=Clip3(-QpBdOffsetC,63,qPCbCr+pps_cbcr_qp_offset+slice_cbcr_qp_offset+CuQpOffsetCbCr)+QpBdOffsetc (公式4)
其中,qPCb、qPCr和qPCbCr可使用公式5-公式8由记载有QpY的修剪值的输入的查询表推导,公式5-8为:
qPichroma=Clip3(-QpBdOffset.63,QpY-QpBdOffset) (公式5)
qPCb=ChromaQpTable[0][qPchroma] (公式.6)
qPCrChromaQpTable[1][qPChroma] (公式7)
qPCbCr=ChromaQpTable[2][qPChroma] (公式.8)
当cu_chroma_qp_offset_flag标志位等于0,CuQpOffsetCb、CuQpOffsetCr和CuQpOffsetCbCr设置为0,当cu_chroma_qp_offset_flag标志位等于1,则可使用公式9-公式11推导:
CuQpOffsetCb=cb_qp_offset_list[cu_chroma_qp_offset_idx] (公式9)
CuQpOffsetCr=cr_qp_offset_list[cu_chroma_qp_offset_idx] (公式10)
CuQpOffsetCbCr=joint_cbcr_qp_offset_list[cu_chroma-qp_offset_idx](公式.11)
其中,cu_chroma_qp_offset_flag标志位和cu_chroma_qp_offset_idx标志位是在比特流中标记的语法元素。
如上所述,cu_qp_delta_abs和cu_qp_delta_sign_flag被标识以用来导出CuQpDeltaVal,CuQpDeltaVal可以用于QP的导出。cu_chroma_qp_offset_flag,cu_chroma_qp_offset_idx,cb_qp_offset_list[i],cr_qp_offset_list[i],以及joint_cbcr_qp_offset_list[i]被标识以用于生成CuQpOffsetCb,CuQpOffsetCr和CuQpOffsetCbCr,这些可用于色度量化参数的推导。
下面介绍相关的语法信号处理过程。首先,cu_qp_delta_enabled_flag、cu_qp_delta_subdiv、cu_chroma_qp_offset_enabled_flag和cu_chroma_qp_offset_subdiv可以在图5所示的图片参数集(PPS)中被标识,该示例说明了示例性的用于CU增量量化参数的PPS语法。
在此之后,可以在图6所示的编码树层面推导出变量IsCuQpDeltaCoded和IsCuChromaQpOffsetCoded,量化参数组的位置,以及变量qgOnY和qgOnC,图6示出了用于CU增量量化参数的编码树语法示例。
此外,取决于在所述编码单元级别生成的IsCuQpDeltaCoded和IsCuChromaQpOffsetCoded,cu_qp_delta_abs/cu_qp_delta_sign_flag和cu_chroma_qp_offset_flag/cu_chroma_qp_offset_idx在变换单元被标识,,如图7所示,该图示出示例性的用于CU增量量化参数的变换单元级别语法。
在图5所示的例子中,cu_qp_delta_subdiv指定传送cu_qp_delta_abs和cu_qp_delta_sign_flag的编码单元的最大cbSubdiv值,而cu_chroma_qp_offset_subdiv指定传送cu_chroma_qp_offset_flag的编码单元的最大cbSubdiv值。cbSubdiv是一个变量,其值与编码单元的大小相关。编码单元越小,cbSubdiv的值越大。当将一个编码单元划分为多个子编码单元时,cbSudiv的值增大。cu_qp_delta_subdiv和cu_chroma_qp_offset_subdiv的值的范围取决于一个称为MaxMttDepthY的变量,该变量是根据片级别和片类型生成的。
MaxMttDepthY=slice_max_mtt_hierarchy_depth_luma (公式.12)
其中slice_max_mtt_hierarchy_depth_luma在片头中标识,如图8所示,该图示出了示例性的片头语法。
如上所述,为了确定可以传递cu_qp_delta_abs/cu_qp_delta_sign_flag和cu_chroma_qp_offset_flag的编码单元的最大深度,两个语法元素cu_qp_delta_subdiv和cu_chroma_qp_offset_subdiv在PPS级别被标识。但是,cu_qp_delta_subdiv和cu_chroma_qp_offset_subdiv的值的范围取决于变量MaxMttDepthY,该变量是根据片级别和片类型生成的。因此,PPS级语法元素依赖于片级语法。
在比特流语法结构中,PPS的级别高于所述片级别,且所述PPS语法在片语法之前获得。对于解码器,在解析较低级语法时,可以引用高级别语法的值。但是,在解析高级别语法时,不能引用低级别语法的值。因此,在当前的VVC技术中,依赖于片头语法的cu_qp_delta_subdiv和cu_chroma_qp_offset_subdiv就产生了一个需要解决的逻辑问题。
为了解决上述问题,本披露的各种实施例中提供了解决方案。在某些实施例中,cu_qp_delta_subdiv和cu_chroma_qp_offset_subdiv可以在slice_max_mtt_hierarchy_depth_luma信号被标识后移动到片头。这样,cu_qp_delta_subdiv和cu_chroma_qp_offset_subdiv就不再是PPS级语法元素了。片头语法的一个例子如图9所示(例如,元素901)。
在图9所示的例子中,cu_qp_delta_enabled_flag标志位和cu_chroma_qp_offset_enabled_flag标志位在PPS中被标识。在某些实施例中,cu_qp_delta_enabled_flag和cu_chroma_qp_offset_enabled_nag可以在片头中标识,如图10所示(例如,元素1001)。
在图10所示的例子中,cu_qp_delta_subdiv和cu_chroma_qp_offseu_subdiv的范围可以按照如下方式确定。例如,cu_qp_delta_subdiv的取值范围可以如下方式确定。如果slice_type=I,cu_qp_delta_subdiv的取值范围为0~2*(CtbLog2SizeY-MinQtLog2SizeIntraY+MaxMttDepthY)(包含端值)。若(slice_type不等于I),cu_qp_delta_subdiv的取值范围为0~2*(CtbLog2SizeY-MinQtLog2SizeInterY+MaxMttDepthY)(包含端值)。如果未示出,cu_qp_delta_subdiv的值可以被推断为等于0。
cu_chroma_qp_offset_subdiv的取值范围如下所示。如果slice_type=I,cu_chroma_qp_offset_subdiv的取值范围为0~2*(CtbLog2SizeY-MinQtLog2SizeIntraY+MaxMttDepthY)(包含端值)。若(slice_type不等于I),cu_chroma_qp_offset_subdiv的取值范围为0~2*(CtbLog2SizeY-MinQtLog2SizeInterY+MaxMttDepthY)(包含端值)。如果未示出,cu_chroma_qp_offset_subdiv的值可以被推断为等于0。
在一些实施例中,cu_qp_delta_subdiv和cu_chroma_qp_offset_subdiv被移动到帧头,同时用于推导MaxMttDepthY的语法元素也移动到帧头,这样,cu_qp_delta_subdiv和cu_chroma_qp_offset_subdiv就不依赖于片级别语法。
因为一个帧可以包含多个不同类型的片,片类型有间类型和内类型。因此,在本实施例中,将cu_qp_delta_subdiv拆分为两个语法元素,即ph_cu_qp_delta_subdiv_intra_slice和ph_cu_qp_delta_subdiv_inter_slice。cu_chroma_qp_offset_subdiv被拆分为两个语法元素,即ph_cu_chroma_qp_offset_subdiv_intra_slice和ph_cu_chroma_qp_offset_subdiv_inter_slice。
ph_cu_qp_delta_subdiv_intra_slice和ph_cu_chroma_qp_offset_subdiv_intra_slice用于当前帧的内类型片,ph_cu_qp_delta_subdiv_inter_slice和ph_cu_chroma_qp_offset_subdiv_inter_slice用于当前帧的间类型片。类似地,有两个语法元素用于内类型片和间类型片的MaxMttDepthY,即ph_max_mtt_hierarchy_depth_intra_slice_luma和ph_max_mtt_hierarchy_depth_inter_slice。
图11的表11给出了帧头语法的一个实例。如表11所示,
ph_cu_qp_delta_subdiv_intra_slice(例如,元素1101)、
ph_cu_chroma_qp_offset_subdiv_intra_slice(例如,元素1102)、
ph_cu_qp_delta_subdiv_inter_slice(例如,元素1103)和
ph_cu_chroma_qp_offset_subdiv_inter_slice(例如,元素1104)以斜体和灰色显示。
对于内类型片,ph_cu_qp_delta_subdiv_intra_slice指定传递cu_qp_delta_abs和cu_qp_delta_sign_flag的内类型片中编码单元的最大cbSubdiv值。
ph_cu_qp_delta_subdiv_intra_slice取值范围为0~2*(CtbLog2SizeY-MinQtLog2SizeIntraY+ph_max_mtt_hierarchy_depth_intra_slice_luma)(包含端值)。当未示出时,可以推断ph_cu_qp_delta_subdiv_intra_slice的值为0。
ph_cu_chroma_qp_offset_subdiv_intra_slice指定传送cu_chroma_qp_offset_flag标志位的内类型编码单元的最大cbSubdiv值。ph_cu_chroma_qp_offset_subdiv_intra_slice取值范围为0~2*(CtbLog2SizeY-MinQtLog2SizeIntraY+ph_max_mtt_hierarchy_depth_intra_slice_luma)(包括端值)。当未示出时,ph_cu_chroma_qp_offset_subdiv_intra_slice的值可以推断为0。
在所公开的实施例中,ph_max_mtt_hierarchy_depth_intra_slice_luma在帧头中被标识,并为sh_slice_type等于“I”(即内预测片)的片中由四叉树叶子的多类型树分割产生的编码单元指定了最大层次深度。CtbLog2SizeY和MinQtLog2SizeIntraY使用以下公式13-公式15导出,其中,CtbLog2SizeY表示slice_type等于“I”(即内预测片)的片内编码树单元的亮度编码树块的大小,MinQtLog2SizeIntraY表示slice_type等于“I”的片内编码树单元的四叉树分裂产生的亮度叶块的亮度样本中的最小大小。
CtbLog2SizeY=sps_log2_ctu_size_minus5+5 (公式13)
MinQtLog2SizeIntraY=sps_log2_diff_min_qt_min_cb_intra_slice_luma+MinCbLog2SizeY (公式.14)
MinCbLog2SizeY=sps_log2_min_luma_coding_block_size_minus2+2(公式15)
sps_log2_ctu_size_minus5,sps_log2_diff_min_qt_min_cb_intra_slice_luma和sps_log2_min_luma_coding_block_size_minus2是在SPS中标识的语法元素。
所述变量CuQpDeltaSubdiv被生成作为传送cu_qp_delta_abs和cu_qp_delta_sign_flag标志位的编码单元的最大cbSubdiv值,变量CuChromaQpOffsetSubdiv被生成作为传递cu_chroma_qp_offset_flag的编码单元的最大cbSubdiv值。这两个变量分别由公式16和公式17导出。
CuQpDeltaSubdiv=ph_cu_qp_delta_subdiv_intra_slice (公式16)
CuChromaQpOffsetSubdiv=ph_cu_chroma_qp_offset_subdiv_intra_slice(公式17)
对于间类型片,ph_cu_qp_delta_subdiv_inter_slice指定在间类型片传送cu_qp_delta_abs和cu_qp_delta_sign_flag标志位的编码单元的最大cbSubdiv值。
ph_cu_qp_delta_subdiv_inter_slice取值范围为0~2*(CtbLog2SizeY-MinQtLog2SizeInterY+ph_max_mtt_hierarchy_depth_inter_slice)(包含端值)。当未示出时,所述ph_cu_qp_delta_subdiv_inter_slice的值可以推断为0。
ph_cu_chroma_qp_offset_subdiv_inter_slice指定传送cu_chroma_qp_offset_flag标志位的间类型片的编码单元的最大cbSubdiv值。ph_cu_chroma_qp_offset_subdiv_inter_slice取值范围为0~2*(CtbLog2SizeY-MinQtLog2SizeInterY+ph_max_mtt_hierarchy_depth_inter_slice)(包含端值)。当未示出时,ph_cu_chroma_qp_offset_subdiv_inter_slice的值可以被推断为0。
ph_max_mtt_hierarchy_depth_inter_slice可以被标识在帧头,并指定在sh_slice_type不等于“I”的片中的四叉树叶的多类型树拆分所产生的编码单元的最大层次深度(例如,slice_type等于“P”或“B”的间预测片)。CtbLog2SizY和MinQtLog2SizeInterY由以下公式18-公式20推导而来,其中,CtbLog2SizY表示slice_type不等于“I”(即,slice_type为“P”或“B”的间预测片)的片中的编码树单元的亮度编码树块的大小,MinQtLog2SizeInterY表示slice_type不等于“I”的片中的编码树单元的四叉树分割所产生的亮度叶块的亮度样本的最小大小。
CtbLog2SizeY=sps_log2_ctu_size_minus5+5 (公式18)
MinQtLog2SizeInterY=sps_log2_diff_min_qt_min_cb_inter_slice_luma+MinCbLog2SizeY (公式19)
MinCbLog2SizeY=sps_log2min_luma_coding_block_size_minus2+2(公式20)
sps_log2_ctu_size_minus5,sps_log2_diff_min_qt_min_cb_inter_slice_luma和sps_bg2min_luma_coding_block_size_minus2是在SPS中标记的语法元素。
变量CuQpDeltaSubdiv被导出作为传送cu_qp_delta_abs和cu_qp_delta_sign_flag标志位的编码单元的最大cbSubdiv值,变量CuChromaQpOffsetSubdi被导出作为传送cu_chroma_qp_offset_flag标志位的编码单元的最大cbSubdiv值。这两个变量分别从公式21和公式22导出。
CuQpDeltaSubdiv=ph_cu_qp_delta_subdiv_inter_slice (公式21)
CuChromaQpOffsetSubdiv=ph_cu_chroma_qp_offset_subdiv_inter_slice(公式22)
在一些实施例中,cu_qp_delta_subdiv和cu_chroma_qp_offset_subdiv可以在PPS级别和片头中被标识。例如,在PPS语法中,pps_cu_qp_delta_subdiv和pps_cu_chroma_qp_offset_subdiv被标识,如图12所示(例如,元素1201和元素1202)。在片头中,slice_cu_qp_delta_subdiv和slice_cu_chroma_qp_offset_subdiv也被标识,如图13所示(例如,元素1301)。
在一些实施例中,pps_cu_qp_delta_subdiv和pps_cu_chroma_qp_offset_subdiv的范围取决于序列参数集(SPS)的语法,如下例所示。在本例中,pps_cu_qp_delta_subdiv的取值范围被确定为:pps_cu_qp_delta_subdiv的取值范围为0~2*(CtbLog2SizeY-MinQtLog2SizeY+SpsMaxMttDepthY)(包含端值)。当未示出时,可以推断pps_cu_qp_delta_subdiv的值等于0。pps_cu_chroma_qp_offset_subdiv取值范围如下:pps_cu_chroma_qp_offset_subdiv取值范围为0~2*(CtbLog2SizeY-MinQtLog2SizeY+SpsMaxMttDepthY)(包含端值)。当未示出时,可以推断pps_cu_chroma_qp_offset_subdiv的值等于0。
在定义了ctbLog2SizeY的情况下,MinQtLog2SizeY和SpsMaxMttDepthY可以通过如下方式导出。
在一种方式下,MinQtLog2SizeY可以被导出为:
min(MinQtLog2SizeIntraY,MinQtLog2SizeInterY)
或,max(MinQtLog2SizeIntraY,MinQtLog2SizeInterY)
值得注意的是,MinQtLog2SizeIntraY和MinQtLog2SizeIntraY可以通过各种方法导出,例如VVC草案6中定义的方法。
另一种替代方法,MinQtLog2SizeY的值可由以下公式23导出:
MinQtLog2SizeY=sps_log2_diff_min_qt_min_cb_luma+MinCbLog2SizeY(公式.23)
其中,sps_log2_diff_min_qt_min_cb_luma在图14所示的SPS中标识(例如,元素1401)。值得注意的是,MinCbLog2SizeY可以使用各种方法导出,例如,在VVC草案6中定义的那些方法。
对于SpsMaxMttDepth,SpsMaxMttDepthy有一种方法可以导出为:
min(sps_max_mtt_hierarchy_depth_intra_slice_luma,sps_max_mtt_hierarchy_depth_inter_slice)
或,max(sps_max_mtt_hierarchy_depth_intra_slice_luma,sps_max_mtt_hierarchy_depth_inter_slice)
其中sps_max_mtt_hierarchy_depth_intra_slice_luma和sps_max_mtt_hierarchy_depth_inter_slice可以在SPS中被标识。
另一种替代方法,SpsMaxMttDepthY的值可以导出为:
SpsMaxMttDepthY=sps_max_mtt_depth_luma (公式24)
其中,sps_max_mtt_depth_luma可以在SPS中被标识,如图14所示(例如,元素1402)。
在上面的例子中,PPS语法元素pps_cu_qp_delta_subdiv和pps_cu_chroma_qp_offset_subdiv依赖于SPS语法。PPS和SPS之间的这种解析依赖关系可能并不满足需要。为了解决这个依赖关系问题,在一些实施例中,pps_cu_qp_delta_subdiv的取值范围可以指定如下。
pps_cu_qp_delta_subdiv的值在0到2*(CtbLog2SizeY)-MinQtLog2SizeY+ppsMaxMttDepthY)的范围内(包括端值)。当未示出时,可以推断pps_cu_qp_delta_subdiv的值等于0。
pps_cu_chroma_qp_offset_subdiv的取值范围可指定如下。
pps_cu_chroma_qp_offset_subdiv的值在0到2*(CtbLog2SizeY-MinQtLog2SizeY+ppsMaxMttDepthY)(包括端值)。当未示出时,可以推断pps_cu_chroma_qp_offset_subdiv的值等于0。
CtbLog2SizeY、MinQtLog2SizeY,以及ppsMaxMttDepthY可以采用如下公式导出:
CtbLog2SizeY=pps_log2_ctb_size (公式.25)
MinQtLog2SizcY=pps_log2_min_qt (公式.26)
ppsMaxMttDepthY=pps_max_mtt_depth_luma (公式27)
pps_log2_ctb_size,pps_log2_min_qt和pps_max_mtt_depth_luma可以在PPS中被标识,如图15所示(例如,元素1501)。
在上面的例子中,slice_cu_qp_delta_subdiv和slice_cu_chroma_qp_offset_subdiv的范围取决于所述片头的语法。例如,slice_cu_qp_delta_subdiv的取值范围可以以如下所示方式确定。如果slice_type等于I,则slice_cu_qp_delta_subdiv的取值范围为0~2*(CtbLog2SizeY-MinQtLog2SizeIntraY+SliceMaxMttDepthY)(包含端值)。否则(slice_type不等于I),则slice_cu_qp_delta_subdiv的取值范围为0~2*(CtbLog2SizeY-MinQtLog2SizeInterY+SliceMaxMttDepthY)(包含端值)。当未标识时,slice_cu_qp_delta_subdiv的值可以被推断为等于0或pps_cu_qp_delta_subdiv。
slice_cu_chroma_qp_offset_subdiv的取值范围可以以如下方式确定。如果slice_type等于I,则slice_cu_ehroma_qp_offset_subdiv的取值范围为0~2*(CtbLog2SizeY-MinQtLog2SizeIntraY+SliceMaxMttDepthY)(包含端值)。否则(slice_type不等于I),则slice_cu_chroma_qp_offset_subdiv的取值范围为0~2*(CtbLog2SizeY-MinQtLog2SizeInterY+SliceMaxMttDepthY)(包含端值)。当未示出时,slice_cu_chroma_qp_offset_subdiv的值可以被推断为等于0或pps_cu_chroma_qp_offset_subdiv。
在定义了CtbLog2SizeY,MinQtLog2SizeIntraY和MinQtLog2SizeInterY的情况下,SliceMaxMttDepthY可以以如下方式导出:
SliceMaxMttDepthY=slice_max_mtt_hierarchy_depth_luma (公式28)
slice_max_mtt_hierarchy_depth_luma可以在片头中标识。
在上面的例子中,cu_qp_delta_subdiv可以被推断为slice_cu_qp_delta_subdiv。或者,可以先将cu_qp_delta_subdiv推断为pps_cu_qp_delta_subdiv;然后,如果slice_cu_qp_delta_subdiv存在,则slice_cu_qp_delta_subdiv覆盖,将cu_qp_delta_subdiv推断为slice_cu_qp_delta_subdiv。cu_qp_delta_subdiv的值可以用于导出QpY。
此外,cu_chroma_qp_offset_subdiv可以被导出为slice_cu_chroma_qp_offset_subdiv。或者,cu_chroma_qp_offset_subdiv可以首先被推断为pps_cu_chroma_qp_offset_subdiv;然后,如果slice_cu_chroma_qp_offset_subdiv存在,则slice_cu_chroma_qp_offset_subdiv覆盖,cu_chroma_qp_offset_subdiv可以被推断为slice_cu_chroma_qp_offset_subdiv。cu_chroma_qp_offset_subdiv的值可用于导出QpCb、QpCr、QPCbCr
在一些实施例中,cu_qp_delta_subdiv和cu_chroma_qp_offset_subdiv可以在SPS级别和所述片头中被标识。在SPS中,sps_cu_qp_delta_subdiv和sps_cu_chroma_qp_offset_subdiv可以如图16所示标识(例如,元素1601);在片头中,slice_cu_qp_delta_subdiv和slice_cu_chroma_qp_offset_subdiv如图17所示标识(例如,元素1701)。
在一些实施例中,sps_cu_qp_delta_subdiv和sps_cu_chroma_qp_offset_subdiv的范围依赖于SP5的语法。例如,sps_cu_qp_delta_subdiv的取值范围可以以如下方式确定。sps_cu_qp_delta_subdiv的取值范围是0~2*(CtbLog2SizeY-MinQtLog2SizeY+SpsMaxMttDepthY)(包含端数值)。若未示出,则sps_cu_qp_delta_subdiv的值可以推断为0。sps_cu_chroma_qp_offset_subdiv的取值范围可以以如下方式确定。
sps_cu_chroma_qp_offseLsubdiv的取值范围是0~2*(CtbLog2SizeY-MinQtLog2SizeY+SpsMaxMttDepthY)(包含端值)。当未示出时,所述sps_cu_chroma_qp_offset_subdiv的值可以推断为0。
在定义了ctbLog2SizeY的情况下,MinQtLog2SizeY和SpsMaxMttDepthY可以以如下方式导出:
在其中一个方式中,MinQtLog2SizeY可以以如下方式导出:
min(MinQtLog2SizeIntraY,MinQtLog2SizeInterY)
或者,
max(MinQtLog2SizeIntraY,MinQtLog2SizeInterY)
其中,MinQtLog2SizeIntraY和MmQtLog2SizeInterY可以使用各种方式获得,例如VVC草案6中定义的那些方式。
在另一种方法中,MinQtLog2SizeY的值可以通过下面的公式29导出。
MinQtLog2SizeY=sps_log2_diff_min_qt_min_cb_luma+MinCbLog2SizeY(公式29)
sps_log2_diff_min_qt_min_cb_luma可以在图18所示的SPS中被标识(如,元素1801)。值得注意的是,MinCbLog2SizeY可以使用各种方法来导出,例如VVC草案6中定义的那些方法。
对于SpsMaxMttDepthY,在一种方法中,SpsMaxMttDepthY可以采用如下方式推导:
min(sps_max_mtt_hierarchy_depth_intra_slice_luma,sps_max_mtt_hierarchy_depth_intep_slice)
max(sps_max_mtt_hierarchy_depth_intra_slice_luma,sps_max_mtt_hierarchy_depth_inter_slice)
sps_max_mtt_hierarchy_depth_intra_slice_luma和sps_max_mtt_hierarchy_depth_inter_slice可以在SPS中标识。
在另一种方法中,SpsMaxMttDepthY可以以如下方式导出:
SpsMaxMttDepthY=sps_max_mtt_depth_luma (公式.30)
sps_max_mtt_depth_luma可以在SPS中标识,如图18所示(如,元素1802)。
此外,在上面的例子中,slice_cu_qp_delta_subdiv和slice_cu_chroma_qp_offset_subdiv的范围取决于片头的语法。例如,slice_cu_qp_delta_subdiv的取值范围可以如下所示。如果slice_type等于I,则slice_cu_qp_delta_subdiv的取值范围为0~2*(CtbLog2SizeY-MinQtLog2SizeIntraY+SliceMaxMttDepthY)(含端值)。否则(slice_type不等于I),则slice_cu_qp_delta_subdiv的取值范围为0~2*(CtbLog2SizeY-MinQtLog2SizeInterY+SliceMaxMttDepthY)(含端值)。当未示出时,slice_cu_qp_delta_subdiv的值可以被推断为等于0或sps_cu_qp_delta_subdiv。
slice_cu_chroma_qp_offset_subdiv的取值范围可以按如下方式确定。如果slice_type=I,则slice_cu_chroma_qp_offset_subdiv的取值范围为0~2*(CtbLog2SizeY-MinQtLog2SizeIntraY+SliceMaxMttDepthY)(含端值)。否则(slice_type不等于I),则slice_cu_chroma_qp_offset_subdiv的取值范围为0~2*(CtbLog2SizeY-MinQtLog2SizeInterY+SliceMaxMttDepthY)(含端值)。当未示出时,slice_cu_chroma_qp_offset_subdiv的值可以被推断为等于0或sps_cu_chroma_qp_offset_subdiv。
在定义了CtbLog2SizeY,MinQtLog2SizeIntraY和MinQtLog2SizeInterY的情况下,SliceMaxMttDepthY可以导出为:
SliceMaxMttDepthY=slice_max_mtt_hierarchy_depth_luma (公式31)
在上面的例子中,cu_qp_delta_subdiv可以被推断为slice_cu_qp_delta_subdiv。或者,可以先将cu_qp_delta_subdiv推断为sps_cu_qp_delta_subdiv;然后,如果存在slice_cu_qp_delta_subdiv,则slice_cu_qp_delta_subdiv会覆盖,将cu_qp_delta_subdiv推断为slice_cu_qp_delta_subdiv。可以使用Cu_qp_delta_subdiv导出QpY。
此外,在上面的例子中,可以推断cu_chroma_qp_offset_subdiv为slice_cu_chroma_qp_offset_subdiv。另一个方法中,可以首先推断cu_chroma_qp_offset_subdiv为sps_cu_chroma_qp_offset_subdiv;然后,如果slice_cu_chroma_qp_offset_subdiv出现,则slice_cu_chroma_qp_offset_subdiv覆盖之,并且可以推断cu_chroma_qp_offset_subdiv为slice_cu_chroma_qp_offset_subdiv。Cu_chroma_qp_offset_subdiv可用于导出QpCb、QpCr、QPCbCr
在一些实施例中,cu_qp_delta_subdiv和cu_chroma_qp_offset_subdiv的语法可以在PPS级别标识。但是,可以修改cu_qp_delta_subdiv和cu_chroma_qp_offset_subdiv的范围限制,使它们不依赖于片语法。
例如,cu_qp_delta_subdiv和cu_chroma_qp_offset_subdiv可以在PPS中标识,如图5所示。cu_qp_delta_subdiv的取值范围可以按如下方式确定。cu_qp_delta_subdiv的取值范围是0~2*(CtbLog2SizeY-MinQtLog2SizeY+MaxMttDepthY)(包含端值)。如果未示出,cu_qp_delta_subdiv的值可以被推断为等于0。cu_chroma_qp_offset_subdiv的取值范围可以按如下方式确定。cu_chroma_qp_offset_subdiv的取值范围是0~2*(CtbLog2SizeY-MinQtLog2SizeY+MaxMttDepthY)(包含端值)。如果未示出,cu_chroma_qp_offset_subdiv的值可以被推断为等于0。
在定义了ctbLog2SizeY的情况下,MinQtLog2SizeY和MaxMttDepthY可以在SPS级别上推定。例如,MaxMttDepthY可以以如下方式导出:
min(sps_max_mtt_hierarchy_depth_intra_slice_luma,sps_max_mtt_hierarchy_depth_inter_slice)
或者,
max(sps_max_mt_hierarchy_depth_intra_slice_luma,sps_max_mtt_hierarchy_depth_inter_slice)
sps_max_mtt_hierarchy_depth_intra_slice_luma和sps_max_mtt_hierarchy_depth_inter_slice可以在SPS中被标识。
在一个替代方案中,MaxMttDepthY可以以如下方式导出:
MaxMttDepthY=sps_max_mtt_depth_luma
sps_max_mtt_depth_luma可以在SPS中标识,如图19所示(例如元素1901)。
在一种方式下,MinQtLog2SizeY可以以如下方式推导:
min(MinQtLog2SizeIntraY,MinQtLog2SizeInterY)
max(MinQtLog2SizeIntraY,MinQtLog2SizeInterY)
值得注意的是,MinQtLog2SizeIntraY和MinQtLog2SizeIntraY可以通过各种方法得到,诸如VVC草案6中定义的那些方法。
在另一种方法中,MinQtLog2SizeY的值可由公式32导出:
MinQtLog2SizeY=sps_log2_diff_min_qt_min_cb_luma+MinCbLog2SizeY(公式.32)
sps_log2_diff_min_qt_min_cb_luma在SPS中被标识,如图13所示(例如,元素1301)。值得注意的是,MinCbLog2SizeY可以使用各种方法来推导,例如在VVC草案6中定义的那些方法。
基于上面的例子,cu_qp_delta_subdiv和cu_chroma_qp_offset_subdiv的范围在片头级别没有被覆盖。
在一些实施例中,cu_qp_delta_subdiv和cu_chroma_qp_offset_subdiv可以在PPS级别标识。但是,应当固定cu_qp_delta_subdiv和cu_chroma_qp_offset_subdiv的范围限制,以使它们不依赖于片语法。
例如,cu_qp_delta_subdiv和cu_chroma_qp_offset_subdiv可以在PPS中标识,如图5所示。cu_qp_delta_subdiv的取值范围可以按如下方式确定。cu_qp_delta_subdiv的取值范围是0~2*(CtbLog2SizeY-MinQtLog2SizeY+MaxMttDepthY)(包含端值)。如果未示出,cu_qp_delta_subdiv的值可以被推断为等于0。cu_chroma_qp_offset_subdiv的取值范围以如下方式确定。cu_chroma_qp_offset_subdiv的取值范围是0~2*(CtbLog2SizeY-MinQtLog2SizeY+MaxMttDepthY)(包含端值)。如果未示出,cu_chroma_qp_offset_subdiv的值可以被推断为等于0。
其中,CtbLog2SizeY,MinQtLog2SizeY和MaxMttDepthY可以通过以下方式导出:CtbLog2SizeY/MinQtLog2SizeY/MaxMttDepthY可以通过配置文件指定;或者,CtbLog2SizeY/MinQtLog2SizeY/MaxMttDepthY为固定值。
基于上面的例子,cu_qp_delta_subdiv和cu_chroma_qp_offset_subdiv的范围在所述片头级别没有被覆盖。
在一些实施例中,cu_qp_delta_subdiv和cu_chroma_qp_offset_subdiv可以在PPS中标识,如图5所示。cu_qp_delta_subdiv的取值范围可以按如下方式确定。cu_qp_delta_subdiv的取值范围是0~2*(CtbLog2SizeY-MinQtLog2SizeY+MaxMttDepthY)(包含端值)。如果未示出,cu_qp_delta_subdiv的值可以被推断为等于0。cu_chroma_qp_offset_subdiv的取值范围为0~2*(CtbLog2SizeY-MinQtLog2SizeY+MaxMttDepthY)(包含端值)。如果未示出,cu_chroma_qp_offset_subdiv的值可以被推断为等于0。
CtbLog2SizeY,MinQtLog2SizeY和MaxMttDepthY可以在PPS级别被推断。例如,
CtbLog2SizeY=pps_log2_ctb_size (公式33)
MinQtLog2SizeY=pps_log2_min_qt (公式34)
MaxMttDepthY=pps_max_mtt_depth_luma (公式35)
pps_log2_ctb_size,pps_log2_min_qt和pps_max_mtt_depth_luma在PPS中被标识,如图20所示(例如,元素2001)。
基于上面的例子,cu_qp_delta_subdiv和cu_chroma_qp_offset_subdiv的范围在片头级别没有被覆盖。
图21是与本发明实施例一致的用于处理视频内容的计算机实现的方法2100的流程图。
在步骤2102,可以接收到与编码块深度相关的深度参数。深度参数可以是一个变量,例如“MaxMttDepthY”,其源自亮度块的多类型树层次结构的最大深度(例如,“slice_max_mtt_hierarchy_depth_luma”)。在某些实施例中,“slice_max_mtt_hierarchy_depth_luma”可以在与所述编码块关联的片头中标识。
编码块可以与一个片相关联。所述片可以与内预测或间预测相关联。为了响应与内预测相关联的片,可以确定与内预测相关联的片的增量量化参数值或色度量化参数偏移值。否则,在响应与间预测相关联的片时,可以确定与间预测相关联的片的增量量化参数值或色度量化偏移值。例如,当“slice_type”等于“I”,表示该片与内预测关联时,“cu_qp_delta_subdiv”的取值范围为0~2*(CtbLog2SizeY-MinQtLog2SizeIntraY+MaxMttDepthY)(包含端值)。否则,当“slice_type”不等于“I”,表示该片与间预测关联,“cu_qp_delta_subdiv”的取值范围为0~2*(CtbLog2SizeY-MinQtLog2SizeInterY+MaxMttDepthY)(包含端值)。再例如,当“slice_type”等于“I”时,“cu_chroma_qp_offset_subdiv”的取值范围为0~2*(CtbLog2SizeY-MinQtLog2SizeIntraY+MaxMttDepthY)(包含端值)。否则,当“slice_type”不等于“I”时,“cu_chroma_qp_offset_subdiv”的取值范围为0~2*(CtbLog2SizeY-MinQtLog2SizeInterY+MaxMttDepthY)(包含端值)。
在一些实施例中,深度参数可以在帧头中标识。值得注意的是,一帧可以包括多个片。对于与内预测相关的片,可以确定与内预测相关的片对应的增量量化参数值或色度量化参数偏移值。对于与间预测相关联的片,可以确定与间预测相关联的片对应的增量量化参数值或色度量化参数偏移值。例如,参照图11中提供的表11讨论,ph_cu_qp_delta_subdiv_intra_slice和ph_cu_chroma_qp_offset_subdiv_intra_slice被标识在所述帧头中,以导出与内预测关联的片的增量量化参数值和色度量化参数偏移值。ph_cu_qp_delta_subdiv_inter_slice和ph_cu_chroma_qp_offset_subdiv_inter_slice被标记在帧头中,用于导出与内部预测相关的片的增量量化参数值和色度量化参数偏移值。
在步骤2104,可以根据所述编码块的深度确定至少一个增量量化参数(QP)值或色度量化参数偏移值。正如上面所讨论的,所述增量量化参数值可以基于“cu_qp_delta_subdiv”确定,所述色度量化参数值可以基于“cu_chroma_qp_offset_subdiv”确定,“cu_qp_delta_subdiv”和“cu_chroma_qp_offset_subdiv”可以基于变量“MaxMttDepthY”确定。
在步骤2106,可以根据确定的增量量化参数值导出亮度量化参数值,根据确定的色度量化参数偏移值导出色度量化参数值。
在步骤2108,可以根据导出的亮度量化参数值和导出的色度量化参数值对所述编码块进行处理。
在一些实施例中,还提供了包括指令集的非易失性计算机可读存储介质,并且所述指令集可以由用于执行上述方法的设备(如所述编码器和解码器)执行。常见形式的非易失性介质包括,例如,软盘、柔性磁盘、硬盘、固态驱动器、磁带、或任何其他磁数据存储介质、CD-ROM,任何其他光学数据存储介质,任何打孔的物理介质模式,RAM,PROM,和EPROM,闪存式EPROM或者其他闪存,NVRAM,高速缓存、寄存器、任何其他存储芯片或磁带,以及同类的网络版本。所述设备可以包括一个或多个处理器(CPU)、输入/输出接口、网络接口和/或内存。
所述实施例可使用下列条款进一步予以描述:
1、一种计算机实现的方法,包括:
接收包含编码视频数据的比特流;
确定编码块的第一参数;
根据所述第一参数,确定与增量量化参数值或色度量化参数偏移值相关联的一个或多个第二参数;以及
根据所述一个或多个第二参数,确定所述增量量化参数值或所述色度量化参数偏移值的至少一个。
2.根据第1条所述的方法,其中,确定所述编码块的所述第一参数包括:
确定所述编码块是否与某个内预测片或某个间预测片相关联;和
在响应与该内预测片相关联的所述编码块时,确定所述第一参数为与所述内预测片相关联的参数,或
在响应与所述间预测片相关联的所述编码块时,确定所述第一参数为与所述间预测片相关联的参数。
3.根据第1条所述的方法,其中,所述第一参数在与编码块相关联的片头中被标识。
4.根据第1条所述的方法,其中,所述第一参数在与编码块相关联的帧头中被标识。
5.根据第1条所述的方法,进一步包括:
根据所述增量量化参数值,确定亮度量化参数值;
根据所述色度量化参数偏移值,确定所述色度量化参数值;以及
根据亮度量化参数值和色度量化参数值,对所述编码块进行处理。
6.一种处理视频内容的系统,包括:
存储一组指令集的存储器;以及
至少一个处理器,被配置为执行一组指令集以使所述系统执行:
接收包含编码视频数据的比特流;
确定编码块的第一参数;
根据所述第一参数,确定与增量量化参数值或色度量化参数偏移值相关联的一个或多个第二参数;以及
根据所述一个或多个第二参数,确定所述增量量化参数值或所述色度量化参数偏移值中的至少一个。
7.根据第6条所述的系统,其中,至少有一个处理器被配置为执行一组指令集以使所述系统进一步执行::
确定所述编码块是否与某个内预测片或间预测片相关联;和
在响应与所述内预测片相关联的所述编码块时,确定所述第一参数为与所述内预测片相关联的参数,或
在响应与所述间预测片相关联的所述编码块时,确定所述第一参数为与所述间预测片相关联的参数。
8.根据第6条所述的系统,其中,所述第一参数在与所述编码块相关联的片头中被标识。
9.根据第6条所述的系统,其中,所述第一参数在与编码块相关联的帧头中被标识。
10.根据第6条所述的系统,其中至少有一个处理器被配置为执行一组指令集以使系统进一步执行:
基于所述增量来量化参数值,确定亮度量化参数值;
根据所述色度量化参数偏移值,确定所述色度量化参数值;以及
根据亮度量化参数值和色度量化参数值对编码块进行处理。
11.一种非易失性的计算机可读介质,存储由计算机系统的至少一个处理器执行的指令集,其中,所述指令集的执行使所述计算机系统执行一种方法,该方法包括:
接收包含编码视频数据的比特流;
确定编码块的第一参数;
根据所述第一参数,确定与增量量化参数值或色度量化参数偏移值相关联的一个或多个第二参数;以及
根据所述一个或多个第二参数,确定所述增量量化参数值或所述色度量化参数偏移值中的至少一个。
12.根据第11条所述的非易失性计算机可读介质,其中,该方法还包括:
确定编码块是否与某个内预测片或某个间预测片相关联;和
在响应与所述内预测片相关联的编码块时,确定所述第一个参数为与所述内预测片相关联的参数,或
在响应与所述间预测片相关联的编码块时,确定所述第一参数为与所述间预测片相关联的参数。
13.根据第11条的非易失性计算机可读介质,其中,所述第一参数在与编码块相关联的片头中被标识。
14.根据第11条的非易失性计算机可读介质,其中,所述第一参数在与编码块相关联的帧头中被标识。
15.根据第11条所述的非易失性计算机可读介质,其中,该方法还包括:
基于所述增量量化参数值,确定亮度量化参数值;
根据所述色度量化参数偏移值,确定所述色度量化参数值;以及
根据亮度量化参数值和色度量化参数值,对所述编码块进行处理。
需要注意的是,本文中的“第一”、“第二”等关系术语仅用于区分一个实体或操作与另一个实体或操作,并不要求或暗示这些实体或操作之间存在任何实际的关系或顺序。此外,“包括”、“有”,“包含”和“包括”和其他类似形式的词语在含义上是相同的,并且,在上述任何一个词语之后的任何一个或者多个项目的结尾是开放式的,上述任何一个名词均不表示所述一个或多个项目已经列举穷尽,或者仅限于这些已列举的一个或者多个项目。
在此处使用时,除非另有明确说明,术语“或”包括所有可能的组合,但不可行的除外。例如,如果表达为一个数据库可能包括A或B,则除非另有特别规定或不可行,可能包括数据库A,或B,或者A和B。第二个例子,如果表达为某个数据库可能包括A、B或C,则除非另有特别规定或不可行,所述数据库可以包括数据库A、或B、或C、或者A和B、或者A和C、或者B和C、或者A和B和C。
值得注意的是,上述实施例可以通过硬件或软件(程序代码),或硬件和软件的组合来实现。如果由软件实现,则可将其存储在上述计算机可读介质中。该软件在由处理器执行时,可以执行上述已披露的方法。本公开中描述的计算单元和其他功能单元可以由硬件或软件,或硬件和软件的组合来实现。本领域普通技术人员,也会理解上述多个模块/单元可以组合成一个模块/单元,而上述每个模块/单元可以进一步划分为多个子模块/子单元。
在上述详细说明中,实施例已参照许多具体细节进行了描述,这些细节可能因实施而异。可以对所述实施例进行某些适配和修改。对于本领域的技术人员,可以从本发明公开的具体实施方式中,显而易见的获得其它一些实施方式。本说明书和示例仅出于示例性的目的,本发明的真实范围和本质由权利要求说明。示图所示的步骤顺序也仅出于解释说明的目的,并不意味着限定于任何特定的步骤、顺序。因此,那些精通本领域的技术人员会意识到,在实施相同的方法时,这些步骤可以以不同的顺序执行。
在本申请的示图和详细说明中,公开了示例性的实施例。但是,可以对这些实施例进行许多变化和修改。相应的,尽管使用了具体的术语,但这些术语只是一般和描述性的,而不是出于限定的目的。

Claims (18)

1.一种计算机实现的方法,包括:
接收包含编码视频数据的比特流;
确定编码块的第一参数;
根据所述第一参数,确定与增量量化参数QP值或色度量化参数偏移值相关联的一个或多个第二参数;以及
根据所述一个或多个第二参数,确定所述增量量化参数值或所述色度QP偏移值中的至少一个。
2.根据权利要求1的方法,其中,确定编码块的第一参数包括:
确定所述编码块是否与某个内预测片或某个间预测片相关联;和
在响应与所述内预测片相关联的所述编码块时,确定所述第一参数为与所述内预测片相关联的参数,或
在响应与所述间预测片相关联的所述编码块时,确定所述第一参数为与所述间预测片相关联的参数。
3.根据权利要求1的方法,其中,所述第一参数在与所述编码块相关联的片头或图片头的至少一个中被标识。
4.根据权利要求3所述的方法,其中,所述编码块与内预测片相关联,所述方法还包括:
根据与所述内预测片相关的编码树单元的亮度编码树块的尺寸、所述编码树单元的四叉树分裂产生的亮度叶块中的亮度样本的最小尺寸、以及所述内预测片中四叉树树叶的多类型树分裂产生的编码单元的最大层次深度,确定所述第一参数的最大值。
5.根据权利要求3所述的方法,其中,所述编码块与某个间预测片相关联,该方法还包括:
根据与所述间预测片相关的编码树单元的亮度编码树块的尺寸、所述编码树单元的四叉树分裂产生的亮度叶块中的亮度样本的最小尺寸、以及所述间预测片中四叉树树叶的多类型树分裂产生的编码单元的最大层次深度,确定所述第一参数的最大值。
6.根据权利要求1所述的方法,进一步包括:
基于所述增量量化参数值,确定亮度量化参数值;
根据所述色度量化参数偏移值,确定所述色度量化参数值;以及
根据亮度量化参数值和色度量化参数值,对所述编码块进行处理。
7.一种处理视频内容的系统,包括:
存储一组指令集的存储器;以及
至少一个处理器,被配置为执行所述一组指令集以使所述系统执行:
接收包含编码视频数据的比特流;
确定编码块的第一参数;
根据所述第一参数,确定与增量量化参数QP值或色度QP偏移值相关联的一个或多个第二参数;以及
根据所述一个或多个第二参数,确定所述增量量化参数QP值或所述色度量化参数偏移值中的至少一个。
8.根据权利要求7所述的系统,其中,在确定所述编码块的第一参数时,所述至少一个处理器被配置为执行所述指令集,以使系统进一步执行:
确定所述编码块是否与某个内预测片或某个间预测片相关联;和
在响应与所述内预测片相关联的所述编码块时,确定所述第一参数为与所述内预测片相关联的参数,或
在响应与所述间预测片相关联的所述编码块时,确定所述第一参数为与所述间预测片相关联的参数。
9.根据权利要求7所述的系统,其中,第一参数在与所述编码块相关联的片头或帧头的至少一个中被标识。
10.根据权利要求9所述的系统,其中,所述编码块与某个内预测片相关联,并且所述至少一个处理器被配置为执行所述指令集以使系统进一步执行:
根据与所述内预测片相关的编码树单元的亮度编码树块的尺寸、所述编码树单元的四叉树分裂产生的亮度叶块中的亮度样本的最小尺寸、以及所述内预测片中四叉树树叶的多类型树分裂产生的编码单元的最大层次深度,确定所述第一参数的最大值。
11.根据权利要求9所述的系统,其中,所述编码块与某个间预测片相关联,并且所述至少一个处理器被配置为执行所述指令集,以使系统进一步执行:
根据与所述间预测片相关的编码树单元的亮度编码树块的尺寸、所述编码树单元的四叉树分裂产生的亮度叶块中的亮度样本的最小尺寸、以及所述间预测片中四叉树树叶的多类型树分裂产生的编码单元的最大层次深度,确定所述第一参数的最大值。
12.根据权利要求7所述的系统,其中,所述至少一个处理器被配置为执行所述指令集以使系统进一步执行:
基于所述增量参数值,确定亮度量化参数值;
根据所述色度量化参数偏移值,确定所述色度量化参数值;以及
根据亮度量化参数值和色度量化参数值,对所述编码块进行处理。
13.一种非易失性计算机可读介质,存储有指令集,所述指令集由计算机系统的至少一个处理器执行,其中,所述指令集的执行使计算机系统执行一种方法,该方法包括:
接收包含编码视频数据的比特流;
确定编码块的第一参数;
根据所述第一参数,确定与增量量化参数QP值或色度量化参数偏移值相关联的一个或多个第二参数;以及
根据所述一个或多个第二参数,确定所述增量量化参数值或所述色度量化参数偏移值中的至少一个。
14.根据权利要求13所述的非易失性计算机可读介质,其中,确定所述编码块的第一参数包括:
确定所述编码块是否与某个内预测片或某个间预测片相关联;和
在响应与所述内预测片相关联的所述编码块时,确定所述第一参数为与所述内预测片相关联的参数,或
在响应与所述间预测片相关联的所述编码块时,确定所述第一参数为与所述间预测片相关联的参数。
15.根据权利要求13所述的非易失性计算机可读介质,其中,所述第一参数在与所述编码块相关联的片头或图片头的至少一个中被标识。
16.根据权利要求15所述的非易失性计算机可读介质,其中,所述编码块与内预测片相关联,所述方法还包括:
根据与所述内预测片相关的编码树单元的亮度编码树块的尺寸、所述编码树单元的四叉树分裂产生的亮度叶块中的亮度样本的最小尺寸、以及所述内预测片中四叉树树叶的多类型树分裂产生的编码单元的最大层次深度,确定所述第一参数的最大值。
17.根据权利要求15所述的非易失性计算机可读介质,其中,所述编码块与间预测片相关联,所述方法还包括:
根据与所述间预测片相关的编码树单元的亮度编码树块的尺寸、所述编码树单元的四叉树分裂产生的亮度叶块中的亮度样本的最小尺寸、以及所述间预测片中四叉树树叶的多类型树分裂产生的编码单元的最大层次深度,确定所述第一参数的最大值。
18.根据权利要求13所述的非易失性计算机可读介质介质,其中,该方法还包括:
基于所述增量量化参数值,确定亮度量化参数值;
根据所述色度量化参数偏移值,确定所述色度量化参数值;以及
根据亮度量化参数值和色度量化参数值,对所述编码块进行处理。
CN202080065346.3A 2019-09-20 2020-08-21 视频处理中的量化参数标识 Pending CN114424525A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962903251P 2019-09-20 2019-09-20
US62/903,251 2019-09-20
PCT/US2020/047411 WO2021055138A1 (en) 2019-09-20 2020-08-21 Quantization parameter signaling in video processing

Publications (1)

Publication Number Publication Date
CN114424525A true CN114424525A (zh) 2022-04-29

Family

ID=74880207

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080065346.3A Pending CN114424525A (zh) 2019-09-20 2020-08-21 视频处理中的量化参数标识

Country Status (6)

Country Link
US (3) US11146829B2 (zh)
EP (1) EP4032259A4 (zh)
JP (1) JP2022548825A (zh)
KR (1) KR20220062085A (zh)
CN (1) CN114424525A (zh)
WO (1) WO2021055138A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7346731B2 (ja) 2019-11-05 2023-09-19 エルジー エレクトロニクス インコーポレイティド 映像/ビデオコーディングのための映像情報処理方法及び装置
JP7443513B2 (ja) 2019-11-05 2024-03-05 エルジー エレクトロニクス インコーポレイティド 映像/ビデオコーディング方法及び装置
MX2022005366A (es) * 2019-11-05 2022-06-23 Lg Electronics Inc Metodo y aparato de codificacion de imagenes/video con base en tipo de segmento.
JP7277354B2 (ja) * 2019-12-26 2023-05-18 Kddi株式会社 画像復号装置、画像復号方法及びプログラム
US11303897B2 (en) * 2020-02-25 2022-04-12 Tencent America LLC Method and apparatus for signaling of chroma quantization parameters
EP4104438A4 (en) * 2020-03-11 2023-08-16 Beijing Bytedance Network Technology Co., Ltd. ADAPTIVE LOOP FILTERING
US11381820B2 (en) * 2020-04-13 2022-07-05 Tencent America LLC Method and apparatus for video coding
US11652996B2 (en) * 2021-05-25 2023-05-16 Tencent America LLC Method and apparatus for video coding

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9510020B2 (en) * 2011-10-20 2016-11-29 Qualcomm Incorporated Intra pulse code modulation (IPCM) and lossless coding mode deblocking for video coding
KR20130058524A (ko) * 2011-11-25 2013-06-04 오수미 색차 인트라 예측 블록 생성 방법
US9591302B2 (en) * 2012-07-02 2017-03-07 Microsoft Technology Licensing, Llc Use of chroma quantization parameter offsets in deblocking
US9948933B2 (en) * 2014-03-14 2018-04-17 Qualcomm Incorporated Block adaptive color-space conversion coding
US11233998B2 (en) * 2015-05-29 2022-01-25 Qualcomm Incorporated Coding data using an enhanced context-adaptive binary arithmetic coding (CABAC) design
EP3304912A4 (en) * 2015-06-07 2018-06-06 Sharp Kabushiki Kaisha Systems and methods for optimizing video coding based on a luminance transfer function or video color component values
WO2017219342A1 (en) * 2016-06-24 2017-12-28 Mediatek Inc. Methods of signaling quantization parameter for quad-tree plus binary tree structure
EP3328083A1 (en) * 2016-11-23 2018-05-30 Thomson Licensing Method and apparatus for encoding a video applying adaptive quantisation
US11019339B2 (en) * 2017-07-12 2021-05-25 Futurewei Technologies, Inc. Fractional quantization parameter offset in video compression
KR20230119739A (ko) * 2018-03-29 2023-08-16 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 병렬 코딩 기능들 향상을 위한 컨셉
GB2590634A (en) * 2019-12-20 2021-07-07 Canon Kk High Level syntax for video coding and decoding
GB2595280A (en) * 2020-05-20 2021-11-24 Canon Kk High level syntax for video coding and decoding

Also Published As

Publication number Publication date
US11736737B2 (en) 2023-08-22
US20210092460A1 (en) 2021-03-25
WO2021055138A1 (en) 2021-03-25
EP4032259A1 (en) 2022-07-27
US20230353793A1 (en) 2023-11-02
US20220094990A1 (en) 2022-03-24
EP4032259A4 (en) 2022-11-23
KR20220062085A (ko) 2022-05-13
US11146829B2 (en) 2021-10-12
JP2022548825A (ja) 2022-11-22

Similar Documents

Publication Publication Date Title
CN114424525A (zh) 视频处理中的量化参数标识
US20240129498A1 (en) Methods for processing chroma signals
US20210092388A1 (en) Lossless coding of video data
CN117897952A (zh) 用于执行组合帧间和帧内预测的方法和系统
CN114868393A (zh) 执行环绕运动补偿的方法
CN114830669A (zh) 用于在图像边界划分块的方法和装置
US20220038722A1 (en) Methods and systems for prediction from multiple cross-components
CN116418983B (zh) 用于在调色板模式下对视频数据进行编码的方法和装置
CN114902670B (zh) 用信号通知子图像划分信息的方法和装置
JP2023519216A (ja) ループフィルタの高レベルシンタックス制御
CN115349228A (zh) 视频记录的符号数据隐藏
CN114762332A (zh) 构建合并候选列表的方法
CN115699744B (zh) 双向预测校正系统和方法
CN115516857A (zh) 用于处理视频内容的方法和装置
CN115552900A (zh) 用信号通知最大变换大小和残差编码的方法
CN114402547A (zh) 一种标识子块变换信息的方法和装置
CN113545064B (zh) 用于处理视频内容的方法和装置及计算机可读存储介质
US20210306653A1 (en) Methods for signaling residual coding method of transform skip blocks
US20210385491A1 (en) Method for processing adaptive color transform and low-frequency non-separable transform in video coding

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination