CN114598875B - 用于进行量化/反量化的装置和方法及编码/解码装置 - Google Patents
用于进行量化/反量化的装置和方法及编码/解码装置 Download PDFInfo
- Publication number
- CN114598875B CN114598875B CN202210118438.4A CN202210118438A CN114598875B CN 114598875 B CN114598875 B CN 114598875B CN 202210118438 A CN202210118438 A CN 202210118438A CN 114598875 B CN114598875 B CN 114598875B
- Authority
- CN
- China
- Prior art keywords
- chroma
- block
- value
- component
- values
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 239
- 238000013139 quantization Methods 0.000 title claims abstract description 130
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 claims description 165
- 241000023320 Luma <angiosperm> Species 0.000 claims description 145
- 238000005192 partition Methods 0.000 claims description 42
- 238000009795 derivation Methods 0.000 claims description 38
- 230000011218 segmentation Effects 0.000 claims description 31
- 238000000605 extraction Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 description 80
- 230000015654 memory Effects 0.000 description 49
- 230000008569 process Effects 0.000 description 37
- 238000004891 communication Methods 0.000 description 36
- 230000006870 function Effects 0.000 description 28
- 238000010586 diagram Methods 0.000 description 26
- 238000000638 solvent extraction Methods 0.000 description 23
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 17
- 230000009977 dual effect Effects 0.000 description 14
- 238000013507 mapping Methods 0.000 description 14
- 230000006835 compression Effects 0.000 description 12
- 238000007906 compression Methods 0.000 description 12
- 238000001914 filtration Methods 0.000 description 12
- 230000007246 mechanism Effects 0.000 description 10
- 238000003491 array Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 9
- 239000013598 vector Substances 0.000 description 9
- 238000013459 approach Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 8
- 238000007781 pre-processing Methods 0.000 description 8
- 230000003044 adaptive effect Effects 0.000 description 7
- 238000004590 computer program Methods 0.000 description 7
- 238000013500 data storage Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 5
- 239000011449 brick Substances 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 101150114515 CTBS gene Proteins 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 3
- 238000012805 post-processing Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 230000002146 bilateral effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 241000985610 Forpus Species 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 206010044625 Trichorrhexis Diseases 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明提供了一种用于对图像的当前块进行反量化的方法。所述方法由解码器执行,所述图像包括亮度分量和色度分量,将所述亮度分量和/或所述色度分量分割成多个块。所述方法包括:从所接收到的码流中获取一个或多个现有量化参数(quantization parameter,QP)值,其中所述一个或多个现有QP值与所述色度分量中的当前块相关;根据所述一个或多个现有QP值确定所述色度分量中的所述当前块的QP值;通过所述确定的QP值对所述色度分量中的所述当前块进行反量化。
Description
本申请是分案申请,原申请的申请号是201980060158.9,原申请日是2019年09月21日,原申请的全部内容通过引用结合在本申请中。
技术领域
本发明涉及图像和/或视频解码技术领域,尤其涉及用于进行反量化的装置和方法。
背景技术
数字视频通信和存储应用通过多种数字设备实现,例如数字照相机、蜂窝无线电话、膝上型计算机、广播系统、视频会议系统等。这些应用中最重要和最具挑战性的任务之一是视频压缩。视频压缩复杂,而且受压缩效率和计算复杂度两个相互矛盾的参数约束。ITU-TH.264/AVC或ITU-T H.265/HEVC等视频译码标准为这些参数之间提供了很好的权衡。因此,要求几乎所有的视频压缩应用都要支持视频译码标准。
已证明帧间预测、帧内预测和环路滤波器等视频压缩技术是有效的,因此应用于H.264/AVC和H.265/HEVC等各种视频译码标准中。
视频压缩的基本处理单元通常称为宏块,它是图像的一部分,其大小为16个像素×16个像素或64个像素×64个像素等。在最新的视频译码标准H.265/HEVC中,译码树单元(coding tree unit,CTU)用作基本处理单元。CTU也称为最大译码单元(largest codingunit,LCU)。在H.265/HEVC中,CTU由一个亮度CTB和两个色度CTB组成,对应地表示亮度和色度视频信号部分,例如Y、Cb、Cr分量。CTU是按扫描顺序从图像左上顶点到右下顶点逐个处理的。可以通过四叉树分割在更小的译码单元(coding unit,CU)上对每个CTU进行进一步分割。每个CU可以进一步分割成更小的CU或预测单元(prediction unit,PU)。PU可以根据用于PU像素的处理类型进行帧内预测或帧间预测。在帧间预测的情况下,PU表示像素区域,该像素区域是使用为PU指定的运动矢量进行运动补偿而处理的。对于帧内预测,使用相邻块的相邻像素作为参考像素点来预测当前块。PU为该PU中包含的所有变换单元(transformunit,TU)指定了从帧内预测模式集合中选择的预测模式。TU可以具有不同的大小(例如,4个像素×4个像素、8个像素×8个像素素、16个像素×16个像素和32个像素×32个像素),并且可以通过不同的方式进行处理。对TU进行变换译码,即使用离散余弦变换或离散正弦变换(在HEVC/H.265标准中用于帧内译码块)对预测误差进行变换并对其进行量化。因此,重建像素包含量化噪声(例如,单元之间的块效应、振铃伪影以及锐边等会变得很明显),DBF、SAO和ALF等环内滤波器会抑制这些量化噪声。使用复杂的预测译码(例如运动补偿和帧内预测)和分割技术(如HEVC/H.265标准中CU和PU的QT以及TU的RQT,以及BMS-1.0和VTM-1.0版本以上的VVC参考软件的多树(multiple tree,MT))可以大大减少PU的冗余。QT和MT分割机制的根本区别在于,后者还允许使用基于二叉树和三叉树的分割来分割矩形块,以及使用四叉树方法来分割正方形块。随着视频的创建和使用越来越普遍,视频流量成为通信网络的最大负担,需要提高数据存储能力。因此,与前代标准相比,大多数视频译码标准的目标之一是在保证图像质量的情况下,降低译码复杂度。
发明内容
本申请实施例提供根据独立权利要求的用于编码和解码的装置和方法。
上述和其它目的通过独立权利要求请求保护的主题实现。其它实现方式从从属权利要求、说明书和附图中是显而易见的。
在所附独立权利要求中概述了特定实施例,在从属权利要求中概述了其它实施例。
本发明公开了用于边界分割的装置和方法。装置和方法使用特定的边界分割处理来降低译码复杂度。边界分割处理也称为图像(picture或image)边界处理。
本发明的第一方面提供了一种用于对图像的当前块进行反量化的方法。图像包括亮度分量和色度分量,通过不同的分割树将亮度分量和色度分量分割成多个块(例如,译码单元(coding unit,CU))。该方法包括:解码器从(例如所接收到的)码流中获取一个或多个现有量化参数(quantization parameter,QP)值,其中一个或多个现有QP值与色度分量中的当前块(即正在处理的块)相关;根据一个或多个现有QP值确定色度分量中的当前块的QP值;通过所述确定的QP值对色度分量中的当前块进行反量化。
视频图像可以分为亮度(luminance或luma)分量和色度(chrominance或chroma)分量。亮度分量表示图像的亮度(图像的“黑白”或消色部分),色度分量表示图像的颜色信息。例如,在[Y、Cb和Cr]的颜色空间中表示图像时,Y分量为亮度分量,Cb和Cr分量为色度分量。
通过不同的分割树将亮度分量和色度分量分割成多个块。换句话说,亮度分量和色度分量是分别分割的。已知存在不同的分割树,例如四叉树(quad-tree,QT)、二叉树(binary tree,BT)、三叉树(ternary tree,TT)以及上述分割树的任何组合,例如:四叉树加二叉树(Quad-tree plus binary tree,QTBT)或四叉树加二叉树或三叉树(Quad-treeplus binary tree or ternary tree,QT-BT/TT)等。
“与色度分量中的当前块相关的一个或多个现有QP值”这一表达对应与色度分量中的当前块相关的现有QP值。例如,现有QP值包括:亮度分量中的并置块的QP值;亮度分量中的并置块的一个或多个相邻块;色度分量中的当前块的一个或多个相邻块。
码流可以是接收到的码流,本文是指解码器接收到的用于进行处理的码流。此处的接收涉及任何种类的接收,例如来自存储器或来自网络等。
对于图像的色度分量中的块,色度分量中的块的量化参数可以由从所接收到的码流中获得的一个或多个现有量化参数(quantization parameter,QP)值确定。这提供了一种确定色度分量中的块的量化参数的有效方法,并减轻了解码器确定色度分量中的每个块的量化参数的处理负载。
根据本发明的第一方面的一个示例,一个或多个现有QP值包括以下中的至少一个:亮度分量中的并置块的QP值;亮度分量中的并置块的一个或多个相邻块的现有QP值;色度分量中的当前块的一个或多个相邻块的现有QP值。
这定义了现有QP值,并为确定图像的色度分量中的块的QP值提供了有效的方法。
根据本发明的第一方面的另一示例,该方法还包括:根据亮度分量中的并置块的QP值确定色度分量中的当前块的QP值。
术语“亮度分量中的并置块(collocated block)”是与色度分量中的块并置的亮度分量中的块,此处的术语“并置(collocated)”是指图像的亮度分量与色度分量之间的映射关系。
本示例提供了一种确定色度分量中块的QP值的简单方法。由于图像的亮度分量和色度分量之间存在关系,因此将亮度分量中的并置的块的QP值作为色度分量中的块的QP值是一种简单直接的方式。
根据亮度分量中的并置块的QP值确定色度分量中的当前块的QP值的步骤包括根据前述示例中的任一个和第一方面进行以下操作:确定与当前色度块中特定位置的像素点并置的亮度块;取得所述确定的亮度块的QP值(例如QpY_basic);根据所述取得的亮度块的QP值(例如,QpY_basic)确定色度分量中的当前块的QP值。
即使是在用不同的分割方式对亮度块和色度块进行分割的情况下,根据特定像素点确定并置块也能够使得实现方式可靠、明确和简单。
在一个示例中,特定位置的像素点是当前色度块的右下四分之一部分的左上角像素点。
这种特定位置大致对应于块的中心,因此提供了对并置块的QP的适当估计。
或者或另外,根据以下公式或者根据以下公式推导出的新公式确定色度分量中的当前块的QP值:Qp′Cb=QpCb+QpBdOffsetC+delta_qp_c,Qp′Cr=QpCr+QpBdOffsetC+delta_qp_c,其中,QpCb和QpCr是通过qPiCb参数和qPiCr参数获得的,qPiCb参数和qPiCr参数是通过应用色度QP映射函数根据所述确定的亮度块的QP值获得的。具体地,在一些具体的示例中,qPiCb和qPiCr是色度映射函数(表)中的索引,根据QpY_basic计算。QpY_basic对应所述确定的亮度块的QP值。
根据一种示例性实现方式,该方法通过两个基于图像参数集(picture parameterset,PPS)的控制标志分别用于亮度和色度平面;如果第一控制标志为真,则该方法用于亮度QP推导;如果第一控制标志为假,则该方法不用于亮度QP推导;和/或,如果第二控制标志为真,则该方法用于色度QP推导;如果第二控制标志为假,则该方法不用于色度QP推导。
这有助于为码流提供高效且可扩展的语法。
根据本发明的第一方面的一个示例,该方法还包括:根据一个或多个现有QP值和以下至少一个,确定色度分量中当前块的QP值:在所接收到的码流中指示的色度增量QP值,或在所接收到的码流中指示的色度QP偏移值。
根据本发明的第一方面的一个示例,该方法还包括:获取当前块的分割深度值;如果分割深度值小于阈值,则根据一个或多个现有QP值和在所接收到的码流中指示的色度增量QP值,确定色度分量中的当前块的QP值。
这样不需要将这种方法用于深度值大于阈值的块,从而降低了计算的复杂度。
根据本发明的第一方面的一个示例,根据预定义的数字或参数集中所指示的数字确定该阈值。
例如,该数字可以由程序员预先定义,或者可以在参数集合中指示,例如,图像参数集合(picture parameter set,PPS)或序列参数集合(sequence parameter set,SPS)。
根据本发明的第一方面的一个示例,通过不同的分割树将亮度分量和色度分量分割成多个块(例如,译码单元(coding unit,CU))。
需要说明的是,提供了一种用于反量化的协调方法,该方法不仅适用于单分割(single partition,ST)模式(即通过单个分割树分割亮度和色度分量),而且还适用于双分割(dual partition,DT))模式(即通过不同的分割树独立地分割亮度和色度分量)。
根据本发明的一个实施例,提供了一种解码装置,该解码装置包括处理电路,用于执行第一方面和第一方面的任一示例的方法。
第二方面,提供了一种用于图像的当前块的量化方法,该方法由编码器执行,图像包括亮度分量和色度分量,将亮度分量和/或色度分量分割成多个块,该方法包括:通过确定的QP值对色度分量中的当前块进行量化;获取一个或多个现有量化参数(quantizationparameter,QP)值,并将一个或多个现有QP值包括到码流中,其中一个或多个现有QP值与色度分量中的当前块相关;根据一个或多个现有QP值和所述确定的QP值确定色度分量中的当前块的QP参数;将QP参数包括到码流中。
根据本发明的第二方面的一个示例,一个或多个现有QP值包括以下中的至少一个:亮度分量中的并置块的QP值;亮度分量中的并置块的一个或多个相邻块的现有QP值;色度分量中的当前块的一个或多个相邻块的现有QP值。
根据本发明的第一方面的另一个示例,确定QP参数包括根据亮度分量中的并置块的QP值确定色度分量中的当前块的QP参数。
根据亮度分量中的并置块的QP值确定色度分量中的当前块的QP参数的步骤包括根据前述示例中的任一个和第一方面进行以下操作:取得与当前色度块中特定位置的像素点并置的亮度块的QP值;根据所述确定的亮度块的QP值确定色度分量中的当前块的QP值。作为该实现方式的一个示例,根据亮度分量中的并置块的QP值确定色度分量中的当前块的QP参数的步骤包括:确定与当前色度块中特定位置的像素点并置的亮度块;取得所述确定的亮度块的QP值(例如,QpY_basic);根据所述确定的亮度块的QP值(例如,QpY_basic)确定色度分量中的当前块的QP值。
在一个示例中,特定位置的像素点是当前色度块的右下四分之一部分的左上角像素点。
或者或另外,根据以下公式或者根据以下公式推导出的新公式确定色度分量中的当前块的QP值:Qp′Cb=QpCb+QpBdOffsetC+delta_qp_c,Qp′Cr=QpCr+QpBdOffsetC+delta_qp_c,其中,QpCb和QpCr是通过qPiCb参数和qPiCr参数获得的,qPiCb参数和qPiCr参数是通过应用色度QP映射函数根据所述确定的亮度块的QP值获得的。
根据一种示例性实现方式,该方法通过两个基于图像参数集(picture parameterset,PPS)的控制标志分别用于亮度和色度平面;如果第一控制标志为真,则该方法用于亮度QP推导;如果第一控制标志为假,则该方法不用于亮度QP推导;和/或,如果第二控制标志为真,则该方法用于色度QP推导;如果第二控制标志为假,则该方法不用于色度QP推导,该方法还包括将第一标志和/或第二标志包括在码流中的步骤。
根据本发明的第一方面的一个示例,该方法还包括:根据一个或多个现有QP值和以下至少一个,确定色度分量中当前块的QP参数:在所接收到的码流中指示的色度增量QP值,或在所接收到的码流中指示的色度QP偏移值。该方法还可以包括将增量QP或QP偏移量插入码流中。
根据本发明的第一方面的一个示例,该方法还包括:确定当前块的分割深度值(并且可能将其包括在码流中);如果分割深度值小于阈值,则根据一个或多个现有QP值和码流中包括的色度增量QP值确定色度分量中的当前块的QP参数。
根据本发明的第一方面的一个示例,根据预定义的数字或参数集中所指示的数字确定该阈值。
例如,该数字可以由程序员预先定义,或者可以在参数集合中指示,例如,图像参数集合(picture parameter set,PPS)或序列参数集合(sequence parameter set,SPS)。
根据本发明的第一方面的一个示例,通过不同的分割树将亮度分量和色度分量分割成多个块(例如,译码单元(coding unit,CU))。
本发明的第三方面提供了一种计算机程序产品,该计算机程序产品包括程序代码,当计算机程序在计算设备上运行时,用于执行第一方面和第一方面的任一示例的方法。该计算机程序可以存储在非瞬时性介质中。
本发明的第四方面提供一种用于图像的当前块的边界分割的解码装置。该解码装置包括:一个或多个处理器;非瞬时性计算机可读存储介质,该非瞬时性计算机可读存储介质耦合到处理器并存储由处理器执行的程序,当所述处理器执行该程序时,使解码器执行第一方面或第一方面的任一示例的方法。
第五方面提供了一种用于图像的当前块的边界分割的编码装置,该编码装置包括:一个或多个处理器;非瞬时性计算机可读存储介质,该非瞬时性计算机可读存储介质耦合到处理器并存储由处理器执行的程序,当所述处理器执行该程序时,使编码器执行第二方面或第二方面的任一示例的方法。
第六方面提供了一种用于对图像的当前块进行反量化的装置,图像包括亮度分量和色度分量,将亮度分量和/或色度分量分割成多个块,该装置包括:码流解析器(1110),用于从码流中获取一个或多个现有量化参数(quantization parameter,QP)值,其中一个或多个现有QP值与色度分量中的当前块相关;QP确定单元(1120),用于根据一个或多个现有QP值确定色度分量中的当前块的QP值;反量化器(1130),用于通过所述确定的QP值对色度分量中的当前块进行反量化。
第七方面提供了一种用于对图像的当前块进行量化的装置,图像包括亮度分量和色度分量,将亮度分量和/或色度分量分割成多个块,该装置包括:量化器(1210),用于通过确定的QP值对色度分量中的当前块进行量化;提取单元(1220),用于获取一个或多个现有量化参数(quantization parameter,QP)值,并将一个或多个现有QP值包括到码流中,其中一个或多个现有QP值与色度分量中的当前块相关;QP确定单元(1230),用于根据一个或多个现有QP值和所述确定的QP值确定色度分量中的当前块的QP参数;码流生成单元(1240),用于将QP参数包括在码流中。
根据第八方面,提供一种集成电路,实现上述装置中的任一个。
第二、第三和第四方面的实现方式对应第一方面的各自的实现方式。因此,该方法的实现方式包括解码装置的对应实现方式的特征,反之亦然。解码装置可以实现为用于对经编码的视频码流进行解码的芯片组。
第一方面的方法的优点与第二方面和第四方面的解码装置的相应实现方式的优点相同。
附图说明
下文参考附图更详细地描述示例性实施例。
图1A为用于实现本发明实施例的视频译码系统的示例的框图。
图1B为用于实现本发明实施例的视频译码系统的另一示例的框图。
图2为用于实现本发明实施例的视频编码器的示例的框图。
图3为用于实现本发明实施例的视频解码器的示例结构的框图。
图4为编码装置或解码装置的一个示例的框图。
图5为编码装置或解码装置的另一个示例的框图。
图6A为本发明的一个实施例提供的四叉树(quad-tree,QT)分割的示意图。
图6B为本发明的一个实施例提供的在垂直方向上的二叉树(binary tree,BT)分割的示意图。
图6C为本发明的一个实施例提供的在水平方向上的二叉树(binary tree,BT)分割的示意图。
图6D为本发明的一个实施例提供的在垂直方向上的三叉树(ternary tree,TT)分割的示意图。
图6E为本发明的一个实施例提供的在水平方向上的三叉树(ternary tree,TT)分割的示意图。
图7A为图像中4:2:0亮度和色度像素点的标称垂直位置和水平位置的示意图。
图7B为图像中4:2:2亮度和色度像素点的标称垂直位置和水平位置的示意图。
图7C为图像中4:4:4亮度和色度像素点的标称垂直位置和水平位置的示意图。
图8为从色度分割到亮度分割的映射点的示意图。
图9为用于确定色度分量中的块的QP值(或色度块QP值)过程的示例性流程图。
图10为用于确定待插入当前块的码流中的QP参数过程的示例性流程图。
图11为示例性反量化装置的框图,该装置可以作为解码器的一部分。
图12为示例性量化装置的框图,该装置可以作为编码器的一部分。
图13为实现内容分发服务的内容供应系统的示例结构的框图。
图14为终端设备的示例的结构的框图。
下文中,如果未明确地另外指定,否则相同的附图标记指代相同或至少功能等同的特征。
具体实施方式
在以下描述中,参考构成本发明的一部分的附图,这些附图通过说明的方式示出本发明的实施例的特定方面或可以使用本发明的实施例的具体方面。应理解,本发明的实施例可以用于其它方面,并且包括在附图中未描绘的结构上或逻辑上的变化。因此,以下详细描述不作为限制意义,并且本发明的范围由所附权利要求限定。
例如,应理解,参考所描述的方法公开的内容对于用于执行该方法的对应的设备或系统也可以成立,反之亦然。例如,如果描述了一个或多个特定的方法步骤,则对应的设备可以包括一个或多个单元,例如用于执行所描述的一个或多个方法步骤的功能单元(例如,执行一个或多个步骤的一个单元;或者多个单元,每个单元执行多个步骤中的一个或多个),即使一个或多个单元在附图中未明确描述或示出时也是如此。此外,例如,如果根据一个或多个单元(例如功能单元)来描述特定装置,则对应的方法可以包括用于执行一个或多个单元的功能的一个步骤(例如执行一个或多个单元的功能的一个步骤,或多个步骤,每个步骤执行多个单元中的一个或多个单元的功能),即使一个或多个步骤在附图中未明确描述或示出时也是如此。此外,应理解,除非特别指出,否则本文描述的各种示例性实施例和/或方面的特征可以彼此组合。
视频译码通常是指对构成视频或视频序列的图像序列进行处理。在视频译码领域中,术语“帧(frame)”可以代替术语“图像(picture或image)”。本申请(或本发明)中使用的视频译码表示视频编码或视频解码。视频编码在源端执行,并且通常包括处理(例如,通过压缩)原始视频图像,以减少表示视频图像所需的数据量(以获得更高效的存储和/或传输)。视频解码在目的端执行,并且通常包括相对于编码器的逆处理以重建视频图像。提及视频图像(或通常称为图像,如下文所解释的那样)的译码的实施例应理解为涉及视频序列的编码或解码。编码部分和解码部分的组合也称为编解码器(编码和解码,CODEC)。
在无损视频译码的情况下,可以对原始视频图像进行重建,即,重建的视频图像与原始视频图像具有相同的质量(假设在存储或传输期间没有传输损失或其它数据损失)。在有损视频译码的情况下,通过量化等方式进行进一步压缩,以减少表示视频图像所需的数据量,在解码器侧无法完全重建视频图像,即,重建的视频图像的质量比原始视频图像的质量低或差。
从H.261开始的若干视频译码标准属于“有损混合视频编解码”组(即,将像素点域中的空间和时间预测与2D变换译码相结合,以在变换域中进行量化)。视频序列的每个图像通常分割成一组不重叠的块,并且通常在块级别上进行译码。换句话说,在编码器侧,通常在块(视频块)级别上对视频进行处理(即,编码),例如,通过使用空间(帧内图像)预测和时间(帧间图像)预测来生成预测块,从当前块(当前处理/待处理块)中减去预测块以获得残差块,变换残差块并在变换域中量化残差块以减少待发送(压缩)的数据量,而在解码器侧,相对于编码器的逆处理部分地用于经编码的或经压缩的块,以重建当前块用于表示。此外,编码器按照解码器处理循环来处理,使得两者生成相同的预测(例如,帧内和帧间预测)和/或重建,用于进行处理,即,对后续块进行译码。
如本文所使用的那样,术语“块”可以是图像或帧的一部分。为便于描述,参考由ITU-T视频译码专家组(Video Coding Experts Group,VCEG)和ISO/IEC运动图像专家组(Motion Picture Experts Group,MPEG)的视频译码联合工作组(Joint CollaborationTeam on Video Coding,JCT-VC)开发的高效视频译码(High-Efficiency Video Coding,HEVC)或通用视频译码(Versatile video coding,VVC)参考软件描述本发明实施例。本领域普通技术人员应理解本发明的实施例不限于HEVC或VVC。可以指CU、PU和TU。在HEVC中,使用表示为译码树的四叉树结构将CTU分割为CU。在CU级别上决定是通过帧间(时间)预测或通过帧内(空间)预测对图像区域进行译码。每个CU还可以根据PU分割类型分割成1个、2个或4个PU。在一个PU内,进行相同的预测过程,并且以PU为单位将相关信息发送到解码器。在通过进行预测过程而获得残差块后,根据PU分割类型,可以根据与用于CU的译码树类似的其它四叉树结构将CU分割成变换单元(transform units,TU)。在视频压缩技术的最新发展中,使用四叉树和二叉树(quad-tree and binary tree,QTBT)分割帧对译码块进行分割。在QTBT块结构中,CU可以具有正方形或矩形形状。例如,首先通过四叉树结构分割译码树单元(coding tree unit,CTU)。进一步通过二叉树结构分割四叉树叶节点。二叉树叶节点称为译码单元(coding unit,CU),该分段用于预测和变换处理,无需进一步分割。这意味着CU、PU和TU在QTBT译码块结构中具有相同的块大小。同时,还提出将三叉树分割等多重分割与QTBT块结构结合使用。
在以下编码器20的实施例中,根据图1至图3描述解码器30和译码系统10。
图1A为示例性译码系统10的概念性或示意性框图,例如可以使用本申请(本发明)的技术的视频译码系统10。视频译码系统10的编码器20(例如视频编码器20)和解码器30(例如视频解码器30)表示可以用于根据本申请中描述的各种示例执行技术的设备的示例。如图1A所示,译码系统10包括源设备12,源设备12用于提供经编码的数据13,例如,经编码的图像13,以例如向目的设备14提供经编码的数据13,以对经编码的数据13进行解码。
源设备12包括编码器20,并且可以另外地(即可选地)包括图像源16、预处理单元18(例如图像预处理单元18)和通信接口或通信单元22。
图像源16可以包括或是:例如用于捕获真实世界图像的任何类型的图像捕获设备;和/或任何类型的图像或评论(对于屏幕内容编码,屏幕上的部分文本也被认为是待编码的图像的一部分)生成设备,例如用于生成计算机动画图像的计算机图形处理器;或用于获取和/或提供真实世界图像、计算机动画图像(例如屏幕内容、虚拟现实(virtualreality,VR)图像)和/或其任何组合(例如增强现实(augmented reality,AR)图像)的任何类型的设备。
(数字)图像是或可以看作具有强度值的二维像素点阵列或矩阵。阵列中的像素点也可以称为像素(pixel/pel)(图像元素的简称)。阵列或图像的水平和垂直方向(或轴线)上的像素点的数量定义图像的大小和/或分辨率。通常使用三个颜色分量来表示颜色,即,可以通过三个像素点阵列来表示图像或图像可以包括三个像素点阵列。在RBG格式或色彩空间中,图像包括对应的红、绿、蓝像素点阵列。但是,在视频译码中,每个像素通常以亮度/色度格式或颜色空间表示,例如YCbCr,其包括Y表示的亮度分量(有时也用L代替)以及Cb和Cr表示的两个色度分量。亮度分量Y表示亮度或灰度强度(例如在灰度级图像中),而两个色度分量Cb和Cr表示色度或颜色信息分量。对应地,YCbCr格式的图像包括亮度像素点值的亮度像素点阵列(Y)和色度值的两个色度像素点阵列(Cb和Cr)。RGB格式的图像可以转换或变换为YCbCr格式,反之亦然,该过程也称为颜色变换或转换。如果图像是单色的,则该图像可以只包括亮度像素点阵列。
在单色采样中,只有一个采样阵列,通常认为是亮度阵列。
在4:2:0采样时,如图7A所示,两个色度阵列中的每个色度阵列的高度和宽度均为亮度阵列的一半。
在4:2:2采样时,如图7B所示,两个色度阵列中的每个色度阵列的高度与亮度阵列相同,宽度为亮度阵列的一半。
在4:4:4采样时,如图7C所示,根据separate_colour_plane_flag的值,以下情况适用:
-如果separate_colour_plane_flag等于0,则两个色度阵列的高度和宽度均与亮度阵列相同;
-否则(separate_colour_plane_flag等于1),三个颜色平面分别作为单色采样图像处理。
图像源16(例如视频源16)可以是例如用于捕获图像的照相机、存储器(例如图像存储器)(其包括或存储之前捕获的或生成的图像),和/或任何类型的接口(内部的或外部的)以获取或接收图像。例如,照相机可以是本地照相机或集成在源设备中的集成的照相机,例如,存储器可以是本地的存储器或集成在源设备中的集成的存储器。例如,接口可以是外部接口,用于接收来自外部视频源的图像,外部视频源例如:照相机等外部图像捕获设备、外部存储器、外部图像生成设备(例如,外部计算机图形处理器)、计算机或服务器。接口可以是任何类型的接口,例如,根据任何私有或标准化的接口协议的有线或无线接口或光接口。获取图像数据17的接口可以是与通信接口22相同的接口,也可以是通信接口22的一部分。
与预处理单元18和由预处理单元18执行的处理不同,图像或图像数据17(例如视频数据16)也可以称为原始图像或原始图像数据17。
预处理单元18用于接收(原始)图像数据17,并对图像数据17进行预处理,以获得预处理图像19或预处理图像数据19。预处理单元18执行的预处理可以包括修剪、颜色格式转换(例如从RGB到YCbCr)、颜色校正或去噪等。可以理解的是,预处理单元18可以是可选的组件。
编码器20(例如视频编码器20)用于接收预处理图像数据19并提供经编码的图像数据21(例如,下文根据图2或图4进一步详细描述)。
源设备12的通信接口22可以用于:接收经编码的图像数据21并且将其发送到另一设备(例如目的设备14或任何其它设备)以用于存储或直接重建;或者在存储经编码的数据13和/或将经编码的数据13发送到另一设备(例如目的设备14或任何其它设备)之前分别处理经编码的图像数据21以用于解码或存储。
目的设备14包括解码器30(例如视频解码器30),并且可以另外(即可选地)包括通信接口或通信单元28、后处理单元32和显示设备34。
目的设备14的通信接口28用于例如直接从源设备12,或从任何其它源(例如存储设备,例如经编码的图像数据存储设备)接收经编码的图像数据21或经编码的数据13。
通信接口22和通信接口28可以用于通过源设备12与目的设备14之间的直接通信链路(例如直接有线或无线连接),或者通过任何类型的网络(例如有线网络、无线网络、有线网络和无线网络的任何组合、任何类型的私网和公网、任何类型的私网和公网的组合),发送或接收经编码的图像数据21或经编码的数据13。
例如,通信接口22可以用于将经编码的图像数据21打包成合适的格式(例如包),以便通过通信链路或通信网络发送。
例如,构成通信接口22的对应部分的通信接口28可以用于对经编码的数据13进行解包以获得经编码的图像数据21。
通信接口22和通信接口28均可配置为如图1A中从源设备12指向目的设备14的经编码的图像数据13的箭头所指示的单向通信接口,或配置为双向通信接口,并且可用于发送和接收消息,建立连接,确认并交换与通信链路和/或数据传输(例如编码图像数据传输)相关的任何其它信息等。
解码器30用于接收经编码的图像数据21并提供经解码的图像数据31或经解码的图像31(例如,下文根据图3或图5进一步详细描述)。
目的设备14的后处理器32用于对经解码的图像数据31(也称为重建图像数据),例如经解码的图像31,进行后处理,以获得经后处理的图像数据33,例如经后处理的图像33。由后处理单元32执行的后处理可以包括颜色格式转换(例如从YCbCr到RGB)、颜色校正、修剪或重新采样或任何其它处理,以例如准备经解码的图像数据31,用于通过显示设备34等进行显示。
目的设备14的显示设备34用于接收经后处理的图像数据33,以例如向用户或观看者显示图像。显示设备34可以是或包括用于呈现重建图像的任何类型的显示器,例如集成的或外部的显示器或监控器。例如,显示器可以包括液晶显示器(liquid crystaldisplay,LCD)、有机发光二极管(organic light emitting diode,OLED)显示器、等离子显示器、投影仪、微LED显示器,硅上液晶(liquid crystal on silicon,LCOS)、数字光处理器(digital light processor,DLP)或任何类型的其它显示器。
尽管图1A将源设备12和目的设备14描绘为单独的设备,但是设备的实施例也可以包括这两种设备或这两种设备的功能,即包括源设备12或对应的功能与目的设备14或对应的功能。在此类实施例中,源设备12或对应的功能与目的设备14或对应的功能可以通过相同的硬件和/或软件、通过单独的硬件和/或软件或其任何组合来实现。
根据以上描述,对于本领域技术人员来说显而易见的是,图1A中所示的源设备12和/或目的设备14的不同单元或功能的存在和(精确)功能划分可以根据实际设备和应用而变化。
编码器20(例如,视频编码器20)和解码器30(例如,视频解码器30)可以各自实现为各种合适的电路中的任一种,例如,一个或多个微处理器、数字信号处理器(digitalsignal processor,DSP)、专用集成电路(application-specific integrated circuit,ASIC)、现场可编程门阵列(field-programmable gate array,FPGA)、离散逻辑、硬件,或其任何组合。如果这些技术部分地在软件中实现,则设备可以将软件指令存储在合适的非瞬时性计算机可读存储介质中,并且可以通过一个或多个处理器在硬件中执行这些指令,以执行本发明的技术。上述任一种(包括硬件、软件、硬件和软件的组合等)可以看作一个或多个处理器。视频编码器20和视频解码器30中的每一个可以包括在一个或多个编码器或解码器中,其中任何一个编码器或解码器可以集成为相应设备中的组合编码器/解码器(编解码器)的一部分。
源设备12可以称为视频编码设备或视频编码装置。目的设备14可以称为视频解码设备或视频解码装置。源设备12和目的设备14可以是视频译码设备或视频译码装置的示例。
源设备12和目的设备14可以包括多种设备中的任一种,包括任何类型的手持设备或固定设备,例如,笔记本电脑或膝上型电脑、手机、智能手机、平板或平板电脑、照相机、台式计算机、机顶盒、电视机、显示设备、数字媒体播放器、视频游戏控制台、视频流设备(如内容业务服务器或内容分发服务器)、广播接收器设备、广播发送器设备等,并且可以使用或不使用任何类型的操作系统。
在一些情况下,源设备12和目的设备14可以用于无线通信。因此,源设备12和目的设备14可以是无线通信设备。
在一些情况下,图1A所示的视频译码系统10仅是示例,本申请的技术可以应用于视频译码设置(例如,视频编码或视频解码),不一定包括编码设备与解码设备之间的任何数据通信。在其它示例中,数据可以从本地存储器取得、通过网络流式传输等。视频编码设备可以对数据进行编码并将数据存储到存储器,和/或视频解码设备可以从存储器取得和解码数据。在一些示例中,编码和解码由不彼此通信但简单地将数据编码到存储器和/或从存储器取得和解码数据的设备执行。
应理解,对于结合视频编码器20所描述的上述示例中的每个示例,视频解码器30可用于执行逆过程。关于指示(signaling)语法元素,视频解码器30可以用于接收和解析此类语法元素,并相应地解码相关视频数据。在一些示例中,视频编码器20可以将一个或多个语法元素熵编码到编码视频码流中。在此类示例中,解码器30可以解析此类语法元素并相应地解码相关的视频数据。
图1B为一个示例性实施例提供的包括图2的编码器20和/或图3的解码器30的另一示例视频译码系统40的说明性图。系统40可以实现根据本申请中描述的各种示例的技术。在所示出的实现方式中,视频译码系统40可以包括成像设备41、视频编码器20、视频解码器30(和/或处理单元46的逻辑电路47实现的视频译码器)、天线42、一个或多个处理器43、一个或多个存储器44,和/或显示设备45。
如图所示,成像设备41、天线42、处理单元46、逻辑电路47、视频编码器20、视频解码器30、处理器43、存储器44、和/或显示设备45可以彼此通信。如所讨论的那样,尽管视频编码器20和视频解码器30两者都示出,但在各种示例中,视频译码系统40可以仅包括视频编码器20或仅包括视频解码器30。
如图所示,在一些示例中,视频译码系统40可以包括天线42。例如,天线42可以用于发送或接收视频数据的编码码流。此外,在一些示例中,视频译码系统40可以包括显示设备45。显示设备45可以用于呈现视频数据。如图所示,在一些示例中,逻辑电路47可以通过处理单元46实现。处理单元46可以包括专用集成电路(application-specific integratedcircuit,ASIC)逻辑、图形处理器、通用处理器等。视频译码系统40还可包括可选处理器43,可选处理器43可以类似地包括专用集成电路(application-specific integratedcircuit,ASIC)逻辑、图形处理器、通用处理器等。在一些示例中,逻辑电路47可以通过硬件、视频译码专用硬件等实现,并且处理器43可以实现通用软件、操作系统等。另外,存储器44可以是任何类型的存储器,例如易失性存储器(例如,静态随机存取存储器(staticrandom access memory,SRAM)、动态随机存取存储器(dynamic random access memory,DRAM)等)或非易失性存储器(例如,闪存等)等。在非限制性示例中,存储器44可以通过高速缓存存储器实现。在一些示例中,逻辑电路47可以访问存储器44(例如用于实现图像缓冲器)。在其它示例中,逻辑电路47和/或处理单元46可以包括用于实现图像缓冲器等的存储器(例如,高速缓存等)。
在一些示例中,通过逻辑电路实现的视频编码器20可以包括图像缓冲器(例如通过处理单元46或存储器44实现)和图形处理单元(例如通过处理单元46实现)。图形处理单元可以通信地耦合到图像缓冲器。图形处理单元可以包括通过逻辑电路47实现的视频编码器20,以实现结合图2所讨论的各种模块和/或本文所描述的任何其它编码器系统或子系统。逻辑电路可以用于执行本文所描述的各种操作。
视频解码器30可以以与通过逻辑电路47实现的类似方式实现,以实现结合图3的解码器30所讨论的各种模块和/或本文所描述的任何其它解码器系统或子系统。在一些示例中,可以通过逻辑电路实现的视频解码器30可以包括图像缓冲器(例如通过处理单元420或存储器44实现)和图形处理单元(例如通过处理单元46实现)。图形处理单元可以通信地耦合到图像缓冲器。图形处理单元可以包括通过逻辑电路47实现的视频解码器30,以实现结合图3所讨论的各种模块和/或本文所描述的任何其它解码器系统或子系统。
在一些示例中,视频译码系统40的天线42可以用于接收视频数据的编码码流。如所讨论的那样,编码码流可以包括与本文所讨论的视频帧编码相关的数据、指示符、索引值、模式选择数据等,例如与译码分割相关的数据(例如,变换系数或量化变换系数,可选的指示符(如所讨论的)和/或定义译码分割的数据。视频译码系统40还可以包括耦合到天线42的视频解码器30,视频解码器30用于对编码码流进行解码。显示设备45用于呈现视频帧。
编码器和编码方法
图2为用于实现本申请的技术的示例性视频编码器20的示意性/概念性框图。在图2的示例中,视频编码器20包括残差计算单元204、变换处理单元206、量化单元208、反量化单元210、逆变换处理单元212、重建单元214、缓冲器216、环路滤波单元220、解码图像缓冲器(decoded picture buffer,DPB)230、预测处理单元260和熵编码单元270。预测处理单元260可包括帧间预测单元244、帧内预测单元254和模式选择单元262。帧间预测单元244可以包括运动估计单元和运动补偿单元(图中未示出)。根据混合视频编解码器,图2所示的视频编码器20也可以称为混合视频编码器或视频编码器。
例如,残差计算单元204、变换处理单元206、量化单元208、预测处理单元260和熵编码单元270构成编码器20的前向信号路径,而例如反量化单元210、逆变换处理单元212、重建单元214、缓冲器216、环路滤波器220、解码器缓冲器(decoded picture buffer,DPB)230和预测处理单元260构成编码器的反向信号路径,其中编码器的反向信号路径对应解码器(参见图3的解码器30)的信号路径。
例如,编码器20用于通过输入端202接收图像201或图像201的块203,图像201是例如是构成视频或视频序列的图像序列的图像。图像块203还可以称为当前图像块或待译码图像块,图像201称为当前图像或待译码图像(特别是在视频译码中,将当前图像与其它图像区分开来,其它图像例如是同一视频序列(即,也包括当前图像的视频序列)中之前编码和/或解码的图像)。
分割
编码器20的实施例可以包括分割单元(图2中未示出),分割单元用于将图像201分割成多个块(例如块203之类的块),通常分割成多个非重叠块。分割单元可以用于对视频序列中的所有图像和定义块大小的对应的栅格使用相同的块大小,或者改变图像或子集或图像组之间的块大小,并将每个图像分割成对应的块。
在一个示例中,视频编码器20的预测处理单元260可以用于执行上述分割技术的任何组合。
尽管块203的尺寸小于图像201,但是与图像201一样,块203也是或也可以被认为是具有强度值(像素点值)的像素点的二维阵列或矩阵。换句话说,图像块203例如可以包括一个像素点阵列(例如,在黑白图像201的情况下,亮度阵列)、三个像素点阵列(例如,在彩色图像201的情况下,一个亮度阵列和两个色度阵列),或任何其它数量和/或类型的阵列,这取决于应用的颜色格式。块203在水平和垂直方向(或轴线)上的像素点的数量定义了块203的大小。
如图2所示的编码器20用于对图像201逐块地进行编码,例如对每个块203执行编码和预测。
分割单元可以用于将视频序列中的图像分割成译码树单元(coding tree unit,CTU)序列,分割单元可以将译码树单元(coding tree unit,CTU)分割(partition/split)成更小的部分,例如较小的正方形或矩形块。对于具有三个像素点阵列的图像,CTU由一个N×N的亮度像素点块和两个对应的色度像素点块组成。在开发中的通用视频译码(versatile video coding,VVC)中,CTU中的亮度块的最大允许大小指定为128×128,但是将来可以指定为不同于128×128的值,例如256×256。可以将图像的CTU聚类/分组为条带(slice)/分块组(tile group)、分块(tile)或砖(brick)。分块覆盖图像的矩形区域,可以将分块分割为一个或多个砖。砖由分块中的多个CTU行组成。没有分割成多个砖的分块可以称为砖。但是,砖是分块的真子集,不称为分块。VVC支持两种分块组模式,即栅格扫描条带/分块组模式和矩形条带模式。在光栅扫描分块组模式中,条带/分块组包含图像的分块光栅扫描中的分块的序列。在矩形条带模式中,条带包含图像的多个砖,这些砖共同构成图像的矩形区域。矩形条带内的砖是按照条带的砖光栅扫描顺序排列的。这些较小的块(也可以称为子块)可以进一步分割成更小的部分。这也称为树分割或分层树分割,其中,在根树层级0(层级0、深度0)等的根块可以递归地分割成两个或多个下一较低树层级的块,例如树层级1(层级1、深度1)的节点,这些块又可以分割成两个或多个下一较低层级的块,例如树层级2(层级2、深度2)等,直到由于满足结束标准(例如达到最大树深度或最小块大小)而结束分割。未进一步分割的块也称为树的叶块或叶节点。分成两个部分的树称为二叉树(binary-tree,BT),分成三个部分的树称为三叉树(ternary-tree,TT),分成四个部分的树称为四叉树(quad-tree,QT))。
例如,译码树单元(coding tree unit,CTU)可以是或包括:亮度像素点的CTB、具有三个像素点阵列的图像的色度像素点的两个对应的CTB、单色图像或使用三个单独的颜色平面和用于对像素点进行译码的语法结构译码的图像的像素点的CTB。相应地,译码树块(coding tree block,CTB)可以是N×N的像素点块,其中N可以设为某个值以将分量分割成CTB,这是一种分割。译码单元(coding unit,CU)可以是或包括:亮度像素点的译码块、具有三个像素点阵列的图像的色度像素点的两个对应的译码块、单色图像或使用三个单独的颜色平面和用于对像素点进行译码的语法结构译码的图像的像素点的译码块。相应地,译码块(coding block,CB)可以是M×N的像素点块,其中M和N可以设为某些值以将CTB分割成译码块,这是一种分割。
在实施例中,例如,根据HEVC,可以通过表示为译码树的四叉树结构将译码树单元(coding tree unit,CTU)分割成CU。在叶CU级别上决定是通过帧间(时间)预测或通过帧内(空间)预测对图像区域进行译码。每个叶CU还可以根据PU分割类型分割成1个、2个或4个PU。在一个PU内,进行相同的预测过程,并且以PU为单位将相关信息发送到解码器。在通过进行预测过程而获得残差块后,根据PU分割类型,可以根据与用于CU的译码树类似的其它四叉树结构将叶CU分割成变换单元(transform unit,TU)。
例如,在实施例中,根据当前正在开发的最新视频译码标准(称为通用视频译码(versatile video coding,VVC)),使用嵌套多类型树(例如二叉树和三叉树)的组合四叉树来分割例如用于分割译码树单元的分段结构。在译码树单元内的译码树结构中,CU可以是正方形或矩形。例如,首先通过四叉树分割译码树单元(coding tree unit,CTU)。然后,可以通过多类型树结构进一步分割四叉树叶节点。多类型树结构中,有4种分割类型:垂直二元分割(SPLIT_BT_VER)、水平二元分割(SPLIT_BT_HOR)、垂直三元分割(SPLIT_TT_VER)和水平三元分割(SPLIT_TT_HOR)。多类型树叶节点称为译码单元(coding unit,CU),该分段用于预测和变换处理,无需进一步分割,只有CU对于最大变换长度太大时才需要进一步分割。这意味着,在大多数情况下,CU、PU和TU在具有嵌套多类型树译码块结构的四叉树中具有相同的块大小。当最大支持变换长度小于CU的颜色分量的宽度或高度时,就会发生异常。VVC在具有嵌套多类型树译码数的四叉树中制定了一种分割信息的唯一指示机制。在该指示机制中,译码树单元(coding tree unit,CTU)作为四叉树的根,并且首先通过四叉树结构分割。然后,通过多类型树结构对每个四叉树叶节点(当太大而需要分割时)进行进一步分割。在多类型树结构中,指示第一标志(mtt_split_cu_flag)以表示是否对节点进行进一步分割;当需要对节点进行进一步分割时,指示第二标志(mtt_split_cu_vertical_flag)以表示分割方向,然后指示第三标志(mtt_split_cu_binary_flag)以表示该分割是二元分割或三元分割。根据mtt_split_cu_vertical_flag和mtt_split_cu_binary_flag的值,CU的多类型树分割模式(MttSplitMode)可以由解码器根据预定义的规则或表格推导。需要说明的是,对于某种设计,例如VVC硬件解码器中的64×64亮度块和32×32色度流水线设计,当亮度译码块的宽度或高度大于64时,都禁止TT分割。当色度译码块的宽度或高度大于32时,也禁止TT分割。流水线设计将图像分割成虚拟流水线数据单元(virtual pipelinedata unit,VPDU),这些虚拟流水线数据单元定义为图像中的非重叠单元。在硬件解码器中,连续的VPDU由多个流水线阶段同时处理。在大多数流水线阶段,VPDU大小与缓冲器大小大致成正比,因此保持VPDU大小较小是很重要的。在大多数硬件解码器中,VPDU大小可以设置为最大变换快(transform block,TB)大小。但是,在VVC中,三叉树(ternary tree,TT)和(binary tree,BT)分割会导致VPDU大小变大。
另外,需要说明的是,当树节点块的一部分超出图像底边界或右边界时,强制对树节点块进行分割,直到每个经译码的CU的所有像素点都位于图像边界内。
例如,根据块大小,帧内子分割(intra sub-partition,ISP)工具可以将亮度帧内预测块垂直或水平地分割成2或4个子部分。
残差计算
残差计算单元204用于根据图像块203和预测块265(后面会详细描述预测块265)计算残差块205,例如,逐像素点(逐像素)从图像块203的像素点值中减去预测块265的像素点值来,以获得像素点域中的残差块205。
变换
变换处理单元206用于对残差块205的像素点值进行变换,例如离散余弦变换(discrete cosine transform,DCT)或离散正弦变换(discrete sine transform,DST),以获得变换域中的变换系数207。变换系数207也可以称为变换残差系数,并且表示变换域中的残差块205。
变换处理单元206可以用于应用DCT/DST的整数近似,例如针对HEVC/H.265指定的变换。与正交DCT变换相比,此类整数近似通常通过某个因子进行缩放。使用其它缩放因子作为变换过程的一部分,以维持经过前向变换和反向变换处理的残差块的范数。通常根据某些约束来选择缩放因子,例如缩放因子为移位运算的2的幂、变换系数的位深度、精度和实施成本之间的权衡等。例如,在解码器30侧通过逆变换处理单元312等指定用于逆变换的特定缩放因子,(以及在编码器20侧通过逆变换处理单元212等为相应的逆变换指定缩放因子),在编码器20侧可以相应地通过变换处理单元206等指定用于正向变换的对应的缩放因子。
量化
量化单元208用于对变换系数207进行量化(例如进行标量量化或矢量量化),以获得量化变换系数209。量化变换系数209也可以称为量化残差系数209。量化过程可以减小与部分或全部变换系数207相关的位深。例如,在量化期间,可以将n位变换系数向下取整为m位变换系数,其中n大于m。可以通过调整量化参数来修改量化程度(quantizationparameter,QP)。例如,对于标量量化,可以进行不同的缩放来实现更精细或更粗略的量化。量化步长大小越小,量化越精细;量化步长大小越大,量化越粗略。合适的量化步长大小可以通过量化参数(quantization parameter,QP)来指示。例如,量化参数可以是适用于预定义的一组合适的量化步长大小的索引。例如,小的量化参数可以对应精细的量化(小量化步长大小),而大的量化参数可以对应粗略的量化(大量化步长大小),反之亦然。量化操作可以包括除以量化步长,而反量化单元210等执行的对应的解量化或反解量化操作可以包括乘以量化步长。根据一些标准(例如HEVC),实施例中可以使用量化参数来确定量化步长大小。通常,可以通过包含除法的方程的定点近似、根据量化参数计算量化步长大小。可以将其它缩放因子引入量化和解量化,用于恢复残差块的范数,因为量化步长大小和量化参数的方程的定点近似中使用缩放,所以可以修改该范数。在一种示例性实现方式中,可以合并逆变换和解量化中的缩放。或者,可以使用自定义量化表,并在码流等中将该自定义量化表从编码器指示到解码器。量化为有损操作,损耗随量化步长大小的增加而增加。
反量化单元210用于对量化系数执行量化单元208所执行的量化的反量化,以获得解量化系数211,例如,根据或使用与量化单元208相同的量化步长执行与量化单元208所执行的量化方案的反量化方案。解量化系数211也可以称为解量化残差系数211,尽管由于量化造成的损耗通常与变换系数不同,但对应变换系数207。
逆变换处理单元212用于对变换处理单元206所进行的变换进行逆变换,例如逆离散余弦变换(discrete cosine transform,DCT)或逆离散正弦变换(discrete sinetransform,DST),以在像素点域中获得逆变换块213。逆变换块213也可以称为逆变换解量化块213或逆变换残差块213。
重建单元214(例如,求和器214)用于将逆变换块213(即,重建残差块213)添加到预测块265,以获得像素点域中的重建块215,例如,通过将重建残差块213的像素点值添加到预测块265的像素点值。
可选地,例如行缓冲器216的缓冲单元(或简称为缓冲器216)用于缓冲或存储重建块215和相应的像素点值,以例如用于帧内预测。在其它实施例中,编码器可以使用未滤波的重建块和/或存储在缓冲单元216中的相应的像素点值用于任何类型的估计和/或预测,例如帧内预测。
编码器20的实施例可以使缓存单元216不仅用于存储用于帧内预测254的重建块215,而且也用于环路滤波器单元220(图2中未示出),和/或使例如缓冲单元216和解码图像缓冲单元230构成一个缓冲器。其它实施例可以使用解码图像缓冲器230的滤波块221和/或块或像素点(块或像素点在图2中未示出)作为帧内预测254的输入或基础。
环路滤波器单元220(或简称为环路滤波器220)用于对重建块215进行滤波,以获得滤波块221,以例如平滑像素过渡或提高视频质量。环路滤波器单元220表示一个或多个环路滤波器,例如去块滤波器、采样自适应偏移(sample-adaptive offset,SAO)滤波器和其它滤波器,例如双边滤波器,自适应环路滤波器(adaptive loop filter,ALF)、锐化或平滑滤波器或协作滤波器。尽管在图2中环路滤波器单元220示出为环内滤波器,但在其它配置中,环路滤波器单元220可以实现为后环路滤波器。滤波块221也可以称为滤波重建块221。解码图像缓冲器230可以在环路滤波单元220对重建译码块进行滤波操作之后存储重建译码块。
例如,编码器20(相应地,环路滤波器单元220)的实施例可以直接输出环路滤波器参数(例如采样自适应偏移信息),或通过熵编码单元270或任何其它熵译码单元熵编码后输出环路滤波器参数,使得例如解码器30可以接收相同的环路滤波器参数并将相同的环路滤波器参数应用于解码。
解码图像缓冲器(decoded picture buffer,DPB)230可以是参考图像存储器,其存储参考图像数据,该参考图像数据由视频编码器20用来对视频数据进行编码。DPB 230可以由各种存储器设备中的任一种形成,例如动态随机存取存储器(dynamic random accessmemory,DRAM)(包括同步DRAM(synchronous DRAM,SDRAM))、磁阻RAM(magneto resistiveRAM,MRAM)、电阻RAM(resistive RAM,RRAM)或其它类型的存储器设备。DPB 230和缓冲器216可以由同一存储器设备提供,也可以由不同的存储器设备提供。在一些示例中,解码图像缓冲器(decoded picture buffer,DPB)230用于存储滤波块221。解码图像缓冲器230还可以用于存储相同的当前图像或不同图像(例如之前重建的图像)的其它之前滤波的块(例如之前重建的和滤波的块221),并且可以提供完整的之前重建的(即解码的)图像(以及对应的参考块和像素点)和/或部分重建的当前图像(以及对应的参考块和像素点),以例如用于帧间预测。在一些示例中,如果重建了重建块215,但没有进行环内滤波,则解码图像缓冲器(decoded picture buffer,DPB)230用于存储重建块215。
预测处理单元260也称为块预测处理单元260,用于:接收或获取块203(例如,当前图像201的当前块203)和重建图像数据,例如,来自缓冲器216的相同(或当前)图像的参考像素点和/或来自解码图像缓冲器230的一个或多个之前解码的图像的参考图像数据231;并且用于处理此类数据以进行预测,即,提供预测块265,预测块265可以是帧间预测块245或帧内预测块255。
模式选择单元262可以用于选择预测模式(例如,帧内或帧间预测模式)和/或选择对应的预测块245或255作为预测块265,以用于残差块205的计算和重建块215的重建。
模式选择单元262的实施例可以用于(例如从预测处理单元260支持的那些预测模式中)选择预测模式,该预测模式提供最佳匹配,或者换句话说,提供最小残差(最小残差更有利于压缩,以便传输或存储),或者提供最小指示开销(最小的指示开销更有利于压缩,以便传输或存储),或者考虑或平衡两者。模式选择单元262可以用于根据率失真优化(ratedistortion optimization,RDO)确定预测模式,即确定这样一种预测模式:该预测模式提供最小率失真优化,或相关的率失真至少满足预测模式选择标准。
下文中更详细地解释由示例编码器20执行的预测处理(例如通过预测处理单元260)和模式选择(例如通过模式选择单元262)。
如上所述,编码器20用于从一组(预定的)预测模式中确定或选择最佳或最优预测模式。该组预测模式可以包括例如帧内预测模式和/或帧间预测模式。
该组帧内预测模式可以包括35种不同的帧内预测模式,例如DC(或均值)模式和平面模式等非定向模式,或H.265中定义的定向模式等,或者可以包括67种不同的帧内预测模式,例如DC(或均值)模式和平面模式等非定向模式,或正在开发的H.266中定义的定向模式等。
该组(或可能的)帧间预测模式取决于可用的参考图像(即,例如存储在DBP 230中的之前至少部分解码的图像)和其它帧间预测参数,例如是整个参考图像或仅参考图像的一部分(例如,当前块的区域周围的搜索窗口区域)用于搜索最佳匹配的参考块,和/或例如是否使用像素插值,例如半像素和/或四分之一像素插值,或不使用像素插值。
除了上述预测模式之外,还可以使用跳过模式和/或直接模式。
预测处理单元260还可以用于例如,通过迭代地使用四叉树分割(quad-tree-partitioning,QT)、二叉树分割(binary partitioning,BT)或三叉树分割(triple-tree-partitioning,TT)或其任何组合,将块203分割成较小的块部分或子块,以及用于例如对块部分或子块中的每一个执行预测,其中模式选择包括选择分割的块203的树结构以及应用于每个块部分或子块的预测模式。
帧间预测单元244可以包括运动估计(motion estimation,ME)单元(图2中未示出)和运动补偿(motion compensation,MC)单元(图2中未示出)。运动估计单元用于接收或获取图像块203(当前图像201的当前图像块203)和解码图像231,或者至少一个或多个之前重建的块(例如一个或多个其它/不同的之前解码的图像231的重建块),以用于运动估计。例如,视频序列可以包括当前图像和之前解码的图像231,或者,换句话说,当前图像和之前解码的图像231可以是构成视频序列的图像序列的一部分或可以构成该序列。
例如,编码器20可以用于从多个其它图像的相同或不同图像的多个参考块中选择参考块并提供参考图像(或参考图像索引……)和/或参考块的位置(x坐标、y坐标)与当前块的位置之间的偏移量(空间偏移),作为运动估计单元(图2中未示出)的帧间预测参数。这个偏移量也称为运动矢量(motion vector,MV)。
运动补偿单元用于获取(例如,接收)帧间预测参数,并根据或通过帧间预测参数进行帧间预测,以获得帧间预测块245。运动补偿单元(图2中未示出)所执行的运动补偿可以包括根据通过运动估计确定的运动/块矢量提取或生成预测块(可能执行插值以提高子像素精度)。插值滤波可以通过已知像素点生成其它像素点,从而潜在地增加可以用于译码图像块的候选预测块的数量。在接收到当前图像块的PU的运动矢量时,运动补偿单元246可以定位运动矢量在一个参考图像列表中指向的预测块。运动补偿单元246还可生成与块和视频条带相关的语法元素该语法元素由视频解码器30用来解码视频条带的图像块。
帧内预测单元254用于获取(例如接收)图像块203(当前图像块)和同一图像的一个或多个之前重建的块(例如重建相邻块),以用于进行帧内估计。例如,编码器20可以用于从多个(预定的)帧内预测模式中选择帧内预测模式。
在实施例中,编码器20可以用于根据优化准则,例如根据最小残差(例如,提供与当前图像块203最相似的预测块255的帧内预测模式)或最小率失真来选择帧内预测模式。
帧内预测单元254还用于根据帧内预测参数(例如,选择的帧内预测模式)确定帧内预测块255。在任何情况下,在为块选择帧内预测模式之后,帧内预测单元254还用于向熵编码单元270提供帧内预测参数,即指示为块选择的帧内预测模式的信息。在一个示例中,帧内预测单元254可以用于执行下文描述的帧内预测技术的任何组合。
熵编码单元270用于单独地或联合地(或根本不)对量化残差系数209、帧间预测参数、帧内预测参数和/或环路滤波器参数应用熵编码算法或方案(例如,可变长度译码(variable length coding,VLC)方案,上下文自适应VLC(context adaptive VLC,CAVLC)方案、算术译码方案、上下文自适应二进制算术译码(context adaptive binaryarithmetic coding,CABAC)方案、基于语法的上下文自适应二进制算术译码(syntax-based context-adaptive binary arithmetic coding,SBAC)方案、概率区间分割熵(probability interval partitioning entropy,PIPE)译码,或者其它熵编码方法或技术),以获得可由输出端272输出的经编码的图像数据21,例如以编码码流21的形式输出。编码码流21可以发送到视频解码器30,或者进行存档,以便随后由视频解码器30发送或取得。熵编码单元270还可以用于对正在译码的当前视频条带的其它语法元素进行熵编码。
视频编码器20的其它结构变化可以用于编码视频流。例如,对于某些块或帧,基于非变换的编码器20可以在没有变换处理单元206的情况下直接量化残差信号。在另一种实现方式中,编码器20可以将量化单元208和反量化单元210组合成单个单元。
图3为用于实现本申请的技术的示例性视频解码器30。视频解码器30用于接收例如由编码器100编码的经编码的图像数据(例如,编码码流)21,以获得经解码的图像331。在解码过程期间,视频解码器30从视频编码器20接收视频数据,例如表示编码视频条带的图像块和相关的语法元素的编码视频码流。
在图3的示例中,解码器30包括熵解码单元304、反量化单元310、逆变换处理单元312、重建单元314(例如,累加器314)、缓冲器316、环路滤波器320、解码图像缓冲器330和预测处理单元360。预测处理单元360可包括帧间预测单元344、帧内预测单元354和模式选择单元362。在一些示例中,视频解码器30可以执行与图2中关于视频编码器20描述的编码通道大体上互逆的解码通道。
熵解码单元304用于对经编码的图像数据21执行熵解码以例如获得量化系数309和/或经解码的译码参数(图3中未示出),例如(经解码的)帧间预测参数、帧内预测参数、环路滤波器参数和/或其它语法元素中的任何或全部。熵解码单元304还用于将帧间预测参数、帧内预测参数和/或其它语法元素转发至预测处理单元360。视频解码器30可以在视频条带级和/或视频块级接收语法元素。
反量化单元310可以与反量化单元210具有相同的功能,逆变换处理单元312可以与逆变换处理单元212具有相同的功能,重建单元314可以与重建单元214具有相同的功能,缓冲器316可以与缓冲器216具有相同的功能,环路滤波器320可以与环路滤波器220具有相同的功能,解码图像缓冲器330可以与解码图像缓冲器230具有相同的功能。
预测处理单元360可以包括帧间预测单元344和帧内预测单元354,其中帧间预测单元344在功能上类似于帧间预测单元214,帧内预测单元354在功能上类似于帧内预测单元254。预测处理单元360通常用于进行块预测和/或从编码数据21中获取预测块365,以及例如从熵解码单元304接收或获取(显式地或隐式地)预测相关参数和/或所选择的预测模式的信息。
当视频条带译码为帧内译码(I)条带时,预测处理单元360的帧内预测单元354用于:根据所指示的帧内预测模式和来自当前帧或图像的之前解码的块的数据来为当前视频条带的图像块生成预测块365。当视频帧译码为帧间译码(即,B或P)条带时,预测处理单元360的帧间预测单元344(例如,运动补偿单元)用于根据从熵解码单元304接收的运动矢量和其它语法元素生成当前视频条带的视频块的预测块365。对于帧间预测,预测块可以从一个参考图像列表中的一个参考图像中生成。视频解码器30可以根据DPB 330中存储的参考图像通过默认构建技术构建参考帧列表,列表0和列表1。
预测处理单元360用于通过解析运动矢量和其它语法元素确定当前视频条带的视频块的预测信息,并使用预测信息来生成正在解码的当前视频块的预测块。例如,预测处理单元360使用接收到的一些语法元素来确定用于对视频条带的视频块进行编码的预测模式(例如,帧内或帧间预测)、帧间预测条带类型(例如,B条带,P条带或GPB条带)、条带的参考图像列表中的一个或多个的构建信息、条带的每个帧间编码视频块的运动矢量、条带的每个帧间译码视频块的帧间预测状态,以及其它信息,以对当前视频条带中的视频块进行解码。
反量化单元310可以用于对码流中提供的并由熵解码单元304解码的量化变换系数进行反量化(即,解量化(de-quantize))。反量化过程可以包括:使用视频编码器20计算的视频条带中的每个视频块的量化参数,以确定应应用的量化程度以及反量化程度。
逆变换处理单元312用于对变换系数应用逆变换,例如,逆DCT、逆整数变换或概念上类似的逆变换过程,以便在像素域中生成残差块。
重建单元314(例如,求和器314)用于将逆变换块313(即,重建残差块313)添加到预测块365,以获得像素点域中的重建块315,例如,通过将重建残差块313的像素点值添加到预测块365的像素点值。
环路滤波单元320(在译码环路中或译码环路之后)用于对重建块315进行滤波,以获得滤波块321,以例如平滑像素过渡或提高视频质量。在一个示例中,环路滤波单元320可以用于执行以下描述的滤波技术的任何组合。环路滤波器单元320表示一个或多个环路滤波器,例如去块滤波器、采样自适应偏移(sample-adaptive offset,SAO)滤波器和其它滤波器,例如双边滤波器,自适应环路滤波器(adaptive loop filter,ALF)、锐化或平滑滤波器或协作滤波器。尽管在图3中环路滤波器单元320示出为环内滤波器,但在其它配置中,环路滤波器单元320可以实现为后环路滤波器。
然后,给定帧或图像中的解码视频块321存储在解码图像缓冲器330中,解码图像缓冲器330存储用于后续运动补偿的参考图像。
解码器30用于例如通过输出端312输出解码图像311,以呈现给用户或由用户观看。
视频解码器30的其它变型可以用于解码压缩码流。例如,解码器30可以在没有环路滤波单元320的情况下生成输出视频流。例如,对于某些块或帧,基于非变换的解码器30可以在没有逆变换处理单元312的情况下直接量化残差信号。在另一种实现方式中,视频解码器30可以将反量化单元310和逆变换处理单元312组合成单个单元。
图4为本发明的一个实施例提供的视频译码设备400的示意图。如本文所述,视频译码设备400适合于实现所公开的实施例。在一个实施例中,视频译码设备400可以是解码器(例如,图1A中的视频解码器30)或编码器(例如,图1A中的视频编码器20)。在一个实施例中,视频译码设备400可以是如上所述的图1A中的视频解码器30或图1A中的视频编码器20的一个或多个组件。
视频译码设备400包括:用于接收数据的入端口410和接收单元(Rx)420;用于处理数据的处理器、逻辑单元或中央处理器(central processing unit,CPU)430;用于发送数据的发送器单元(Tx)440和出端口450;以及用于存储数据的存储器460。视频译码设备400还可以包括耦合到入端口410、接收器单元420、发送器单元440和出端口450的光电(optical-to-electrical,OE)组件和电光(electrical-to-optical,EO)组件,以用于光或电信号的出或入。
处理器430由硬件和软件实现。处理器430可以实现为一个或多个CPU芯片、核(例如,多核处理器)、FPGA、ASIC和DSP。处理器430与入端口410、接收单元420、发送器单元440、出端口450和存储器460通信。处理器430包括译码模块470。译码模块470实现上述公开的实施例。例如,译码模块470实现、处理、准备或提供各种译码操作。因此,包括译码模块470大大提高了视频译码设备400的功能,并影响视频译码设备400到不同状态的转换。或者,译码模块470实现为存储在存储器460中并由处理器430执行的指令。
存储器460包括一个或多个磁盘、磁带机和固态硬盘,并且可以用作溢出数据存储设备,以在选择此类程序用于执行时存储程序,以及存储在程序执行期间读取的指令和数据。存储器460可以是易失性和/或非易失性的,并且可以是只读存储器(read-onlymemory,ROM)、随机存取存储器(random access memory,RAM)、三元内容寻址存储器(ternary content-addressable memory,TCAM)和/或静态随机存取存储器(staticrandom-access memory,SRAM)。
图5为一个示例性实施例通过的装置500的简化框图,该装置500可以用作图1A中的源设备12和目的设备14中的一者或两者。装置500可以实现上述本申请的技术。装置500可以是包括多个计算设备的计算系统的形式,也可以是单个计算设备的形式,例如手机、平板电脑、膝上型电脑、笔记本电脑、台式电脑等。
装置500中的处理器502可以是中央处理器。或者,处理器502可以是能够操纵或处理现在存在或以后开发的信息的任何其它类型的设备或多个设备。尽管所公开的实现方式可以通过单个处理器(例如处理器502)实施,但是可以通过一个以上的处理器来提高速度和效率。
装置500中的存储器504在一种实现方式中可以是只读存储器(read onlymemory,ROM)设备或随机存取存储器(random access memory,RAM)设备。可以使用任何其它合适类型的存储设备作为存储器504。存储器504可以包括由处理器502通过总线512访问的代码和数据506。存储器504还可以包括操作系统508和应用程序510,应用程序510包括使处理器502执行本文描述的方法的至少一个程序。例如,应用程序510可以包括应用程序1至N,其还包括执行本文所描述的方法的视频译码应用程序。装置500还可以包括辅助存储器514形式的其它存储器,例如,辅助存储器514可以是与移动计算设备一起使用的存储卡。由于视频通信会话可能包含大量信息,因此它们可以全部或部分地存储在辅助存储器514中,并且根据需要加载到存储器504中用于进行处理。
装置500还可以包括一个或多个输出设备,例如显示器518。在一个示例中,显示器518可以是触摸敏感显示器,触摸敏感显示器将显示器与可操作以感测触摸输入的触摸敏感元件相结合。显示器518可以通过总线512耦合到处理器502。除了显示器518之外或作为显示器518的替代方案,还可以提供允许用户对装置500进行编程或以其它方式使用装置500的其它输出设备。当输出设备是或包括显示器时,显示器可以通过各种方式实现,包括通过液晶显示器(liquid crystal display,LCD)、阴极射线管(cathode-ray tube,CRT)显示器、等离子显示器或发光二极管(light emitting diode,LED)显示器,例如有机LED(organic LED,OLED)显示器。
装置500还可以包括图像感测设备520或与图像感测设备520通信,图像感测设备520例如为照相机或任何现有的或以后开发的、能够感测例如操作装置500的用户的图像等图像的其它图像感测设备520。可以将图像感测设备520定位成朝向操作装置500的用户。在一个示例中,图像感测设备520的位置和光轴可以使视野包括直接邻近显示器518的区域,从该区域可以看见显示器518。
装置500还可以包括声音感测设备522或与声音感测设备522通信,声音感测设备522例如为麦克风或任何现有的或以后开发的、能够感测装置500附近声音的其它声音感测设备。可以将声音感测设备522定位成朝向操作装置500的用户,并且可以用于接收用户在操作装置500时发出的声音,例如语音或其它话语。
尽管图5将装置500的处理器502和存储器504描绘成集成到单个单元中,但可以使用其它配置。处理器502的操作可以分布在多个机器(每个机器具有一个或多个处理器)上,这些机器可以直接耦合或通过局域网或其它网络耦合。存储器504可以分布在多个机器上,例如基于网络的存储器或执行装置500的操作的多个机器中的存储器。尽管在这里描述为单个总线,但装置500的总线512可以由多个总线组成。此外,辅助存储器514可以直接耦合到装置500的其它组件,或者可以通过网络访问,并且可以包括单个集成单元(例如存储卡)或多个单元(例如多个存储卡)。因此,可以以多种配置实现装置500。
视频编码器20可以在编码前将输入视频帧分割成块。本发明中的术语“块”用于任何类型块或任何深度块,例如,术语“块”包括但不限于根块、块、子块、叶节点等。待译码的块不一定具有相同的大小。一个图像可以包含不同大小的块,视频序列的不同图像的块栅格也可以不同。图6A至6E示出了VVC中的译码树单元(coding tree unit,CTU)/译码单元(coding unit,CU)分割模式。
图6A示出了使用四叉树(quad-tree,QT)分割的块分割结构。QT是一种用于块分割的树结构,其中大小为4M×4N的节点可以分割成四个大小为2M×2N的子节点。
图6B示出了使用垂直方向的二叉树(binary tree,BT)分割的块分割结构。
图6C示出了使用水平方向的二叉树(binary tree,BT)分割的块分割结构。BT是一种用于块分割的树结构,其中大小为4M×4N的节点可以水平分割成大小为4M×2N的两个子节点,或者垂直分割成大小为2M×4N的两个子节点。
图6D示出了使用垂直方向的三叉树(ternary tree,TT)分割的块分割结构。
图6E示出了使用水平方向的三叉树(ternary tree,TT)分割的块分割结构。TT是一种用于块分割的树结构,其中大小为4M×4N的节点可以水平分割成大小分别为4M×N、4M×2N和4M×N的三个子节点;或者垂直分割成大小分别为M×4N、2M×4N和M×4N的三个子节点。在图6D或图6E所示的三个子节点中,最大的节点位于中心。
四叉树加二叉树(quad-tree plus binary tree,QTBT)是一种四叉树加二叉树结构,其中先用四叉树分割来分割块,再用二叉树分割来分割每个四叉树子节点。四叉树加二叉树或三叉树(quad-tree plus binary tree or ternary tree,QT-BT/TT)是一种四叉树加二叉树或三叉树结构,首先通过四叉树分割来分割块,然后可以通过二叉树或三叉树分割来进一步分割每个四叉树子节点。
对于与特定分割深度相关的块,编码器20确定使用哪种分割类型(包括不进一步分割),并且显式或隐式地将所述确定的分割类型(例如,分割类型可以根据预定规则推导出来)指示给解码器30。例如,编码器20可以根据检查使用不同分割类型的块的率失真成本来确定待使用的分割类型。
本发明中的术语“块”是一个广义术语,包括但不限于根块、块、子块、叶节点等。
除了HEVC/H.265标准中使用的单树(single tree,ST)译码之外,视频译码标准还引入了双树(dual tree,DT)译码。ST或DT是根据条带或帧类型(如帧内或帧间、条带内或条带间)进行选择的。在单树译码模式下,亮度和色度分量共用一个分割树。在双树译码模式下,亮度和色度分量是分别进行分割的,即亮度和色度分量使用独立的分割方案。
图像压缩级别由量化参数(quantization parameter,QP)控制,量化参数可以针对整个图像固定(例如,通过相同的量化参数值),或者可以针对图像的不同区域具有不同的量化参数值。
确定量化参数的一种方法是译码单元(coding unit,CU)级别的量化参数(quantization parameter,QP)指示。这种方法可以灵活地改变图像不同区域的QP值,尤其是在一些CU深度(即,定义分割层的分割深度)。为了给图像的某个区域指示QP信号,使用增量QP指示(delta QP signaling)方法。在该方法中,预测QP((QPc_pred)与当前区域的实际QP之间的差值(即增量QP)通过码流进行指示。增量QP值及其粒度(例如,分割块的大小)由图像参数集(picture parameter set,PPS)中的开-关控制标志和最大深度(例如,增量QP语法元素)定义。对于具有较大分割深度的所有CU,不指示增量QP值,但可以和顶级CU使用相同的值。在HEVC标准中,亮度译码块(coding block,CB)的QP值是根据预测QP(qPY_PRED)推导出来的,而预测QP又取决于帧/条带/分块中的CB位置。然后根据公式1推导QpY变量:
QpY=((qPY_PRED+CuQpDeltaVal+52+2*QpBdOffsetY)%(52+QpBdOffsetY))-QpBdOffsetY (公式1)
其中,CuQpDeltaVal是为译码单元(coding unit,CU)指示或推导的增量QP值;QpBdOffsetY是取决于亮度位深的恒定偏移量(在HEVC标准中,该术语对应亮度阵列的像素点的位深)。最后,亮度分量的量化参数Qp′Y可以通过以下公式2计算:
Qp′Y=QpY+QpBdOffsetY (公式2)
变量qPCb和qPCr分别根据等于qPiCb或qPiCr的索引qPi设置为等于量化表(例如表1)中指定的值QpC,并且qPiCb和qPiCr通过公式3推导如下:
qPiCb=Clip3(-QpBdOffsetC,57,QpY+pps_cb_qp_offset+slice_cb_qp_offset)
qPiCr=Clip3(-QpBdOffsetC,57,QpY+pps_cr_qp_offset+slice_cr_qp_offset)
(公式3)
其中,QpBdOffsetC是取决于色度位深的恒定偏移量(在HEVC标准中,该术语对应色度阵列的像素点的位深);pps_cb_qp_offset或pps_cr_qp_offset是由图像参数集(pictureparameter set,PPS)指示的Cb分量或Cr分量的固定偏移,slice_cb_qp_offset或slice_cr_qp_offset是Cb分量或Cr分量的固定偏移量,在条带头中指示。
表1-以HEVC中QpC作为qPi的函数的规范为例
qPi | <30 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | >43 |
QpC | =qPi | 29 | 30 | 31 | 32 | 33 | 33 | 34 | 34 | 35 | 35 | 36 | 36 | 37 | 37 | =qPi-6 |
Cb和Cr分量的色度量化参数(Qp′Cb和Qp′Cr)根据公式5推导如下:
Qp′Cb=qPCb+QpBdOffsetC
Qp′Cr=qPCr+QpBdOffsetC
(公式5)
应注意,上述增量QP机制仅用于单树(single tree,ST),并且可能不适用于双树(dual tree,DT),因为亮度和色度分量可以使用不同的分割树。
通常,本发明实施例涉及视频译码领域。具体地,本发明实施例涉及一种增量QP指示,它是视频解码设备中的解量化装置的一部分。本发明实施例提出了应用于双树(dualtree,DT)的增量QP机制的不同方式。
与上述仅用于单树(single tree,ST)的增量QP机制类似,这种机制无论树的类型(ST或DT),Cb和Cr分量的色度量化参数都根据qPi值、根据公式6进行推导:
Qp′Cb=qPCb+QpBdOffsetC
Qp′Cr=qPCr+QpBdOffsetC
(公式6)
其中qPCb和qPCr是根据量化表或映射表(如表1)进行推导的,并且取决于qPi值。与用于单树的增量QP指示相反,本发明实施例无论树的类型(例如,单树或双树),都根据以下公式7计算色度分量的qPi值:
qPiCb=Clip3(-QpBdOffsetC,69,QpCbasic+pps_cb_qp_offset+slice_cb_qp_offset)
qPiCr=Clip3(-QpBdOffsetC,69,QpCbasic+pps_cr_qp_offset+slice_cr_qp_offset)
(公式7)
其中QpCbasic是基本色度块QP值,其取决于QPc_pred值,并且可以通过以下描述的不同方法中的一种方法计算。
应注意,计算qPiCb和qPiCr的公式7中的常数69是根据量化表(如表1)选择的,并假设允许的最大QP值为63,因此该常数计算为qPi与QpC之间的最大差值加上最大QP值。通常情况下,该常数可以是预定义的,或者根据一些值指示。
双树(dual tree,DT)译码方法假设亮度和色度分量具有不同的分割树,并且每个分量都有自己的分割树。这会导致一个色度块(即色度分量中的块)对应一个以上的亮度块(即亮度分量中的块),或者反之亦然。图8为4:2:0色度子采样的示例,其中整个色度块对应多个分割的亮度块。图中的数字表示亮度分量(或平面)与色度分量(或平面)之间的并置点(像素)。
图9为对图像的当前块执行反量化过程的示例性流程图。该过程可以由解码器执行。图像包括亮度分量和色度分量,亮度分量和色度分量通过不同的分割树分割成多个块。
步骤902:从接收到的码流中获取一个或多个现有量化参数(quantizationparameter,QP)值,其中一个或多个现有QP值与色度分量中的当前块相关。
在该步骤中,现有QP值与当前块(例如待执行反量化的块)相关。例如,此类现有QP值可以包括以下中的至少一个:亮度分量中的并置块QP值、色度分量中的当前块的一个或多个相邻块的QP值、亮度分量中的并置块的一个或多个相邻块的QP值。
亮度分量中的并置块是指与色度分量中的当前块具有映射关系的块。
步骤904:根据一个或多个现有QP值确定色度分量中的当前块的QP值。
有多种不同方法集确定色度分量中的块的QP值(或色度块QP值,即,QPc_pred)。总之,第一方法集侧重于根据现有相关QP值确定色度块QP值(例如,视为预测)。第二方法集是根据现有相关QP值确定色度块QP值(例如,视为预测)和在所接收的码流中指示的色度分量QP值(例如,视为增量)。第三方法集是根据现有相关QP值确定色度块QP值(例如,视为预测)和在所接收的码流中指示的色度QP偏移值(例如,视为调整偏移量)。
步骤906:通过所述确定的QP值对色度分量中的当前块进行反量化。
在本步骤中,在确定色度分量中的当前块的QP值(或色度块QP值)后,对色度分量中的块进行反量化。
图10为对图像的当前块执行量化过程的示例性流程图。该过程可以由编码器执行。
步骤1010:在本步骤中,通过所述确定的QP对色度分量中的当前块进行量化。例如,QP可以通过用户设置和/或率失真优化等确定。
步骤1020:获取一个或多个现有量化参数(quantization parameter,QP)值。该/这些现有QP值也包括在码流中。一个或多个现有QP值与色度分量中的当前块相关。
步骤1030:根据一个或多个现有QP值和所述确定的QP值确定/表示色度分量中的当前块的QP参数。具体地,为了发送色度分量中的当前块的QP值(所述确定的QP),将参数包括在码流中,其中,该参数是通过一个或多个现有QP值确定的。可以通过从所述确定的QP中减去一个或多个现有QP值来确定,或者以其它方式,例如通过还包括其它参数的公式确定。
步骤1040:将QP参数包括在码流中。到码流中还可以包括熵译码,例如整数译码、算术译码或任何其它可变长度译码。熵译码可以是上下文自适应的。但是,这些仅仅是示例,并且本发明可以采用任何类型的译码,包括固定长度译码。
根据一实施例,提供了用于量化和反量化的装置,该装置可用于相应的编码器侧和解码器侧。它们具有对应于上述编解码方法的特征。
具体地,提供了一种用于对图像的当前块进行反量化的装置,图像包括亮度分量和色度分量,将亮度分量和/或色度分量分割成多个块。该装置在图11中示出为装置1100。该装置还包括以下功能单元(电路):
码流解析器(也称为码流解析单元(或电路))1110,用于从码流获得一个或多个现有量化参数(quantization parameter,QP)值。一个或多个现有QP值与色度分量中的当前块相关。色度分量可以是色度分量中的任何一种或多种。
QP确定单元(或电路)1120,用于根据一个或多个现有QP值确定色度分量中的当前块的QP值。
反量化器(也称为反量化单元(或电路))1130,用于通过所述确定的QP值对色度分量中的当前块进行反量化。
还提供了图12中所示出的装置1200,用于量化图像的当前块。图像包括亮度分量和色度分量,将亮度分量和/或色度分量分割成多个块。该装置包括:
量化器(也称为量化单元(或电路))1210,用于通过所述确定的QP值对色度分量中的当前块进行量化。
提取单元(或电路)1220,用于获取一个或多个现有量化参数(quantizationparameter,QP)值,并将一个或多个现有QP值包括到码流中,其中一个或多个现有QP值与色度分量中的当前块相关。
QP确定单元(或电路)1230,用于根据一个或多个现有QP值和所述确定的QP值确定色度分量中的当前块的QP参数。
码流生成单元(或电路,也称为码流生成器)1240,用于将QP参数包括在码流中。
下面是用于确定色度块QP值的实施例。
1.根据一个或多个相关的现有QP值确定色度块QP值
在第一方法集中,提供了三组方法。
A.第一组方法:在该方法组中,色度块QP值QPc_pred是根据表示为QPc_pred_luma的并置亮度QP值计算的。
(1)第一方法是,根据亮度分量中并置块的QP值确定色度分量中当前块的QP值(即色度块QP值)。选择色度平面(或分量)中的一个点(表示为映射点,例如点C5),QPc_pred_luma确定为与亮度平面中的当前映射点(例如点L5)并置的块的QP值。例如,如果选择图8中的点C5作为映射点,则QPc_pred_luma等于亮度译码块(例如,点L5所在的块)中对应的L5点的亮度QP值。应理解,可以选择色度点中的任一个作为映射点,包括但不限于上述图8中的示例。
更具体地,公式7可以通过以下方式重新定义:
qPiCb=Clip3(-QpBdOffsetC,69,QpY_basic+pps_cb_qp_offset+slice_cb_qp_offset)
qPiCr=Clip3(-QpBdOffsetC,69,QpY_basic+pps_cr_qp_offset+slice_cr_qp_offset)
(公式7.1)
其中,QpY_basic根据如下分割树类型确定:
-如果treeType为SINGLE_TREE,则QpY_basic设置为等于QpY。
-否则,将QpY_basic设置为等于并置亮度CU的QpY值,该亮度CU包括坐标为(xCb+cbWidth/2,yCb+cbHeight/2)的亮度像素点。
(xCb,yCb)表示与当前色度译码块并置的亮度译码块的左上像素点相对于当前图像的左上亮度像素点。
此外,QpY值可以根据以下公式计算:
QpY=((qPY_PRED+CuQpDeltaVal+64+2*QpBdOffsetY)%(64+QpBdOffsetY))–QpBdOffsetY
其中,qPY_PRED、CuQpDeltaVal、QpBdOffsetY以用于并置的亮度CU的常规的方式计算。将常数修改为64。
换句话说,在一种示例性实现方式中,色度分量中的当前块的QP是根据并置块的(现有)参数确定的。并置块可以是与当前块并置的亮度分量块。注意,通常,亮度块的分割(译码树)可以不同于色度块的分割(译码树)。因此,可以存在覆盖与相同色度块相同的图像区域的更多(或更少或相同数量的)亮度块。因此,在本示例中,将并置块确定为亮度块,其覆盖包括当前色度块的特定预定义像素点的区域。例如,该特定像素点可以是当前色度块右下四分之一部分的左上角像素点。该示例性像素点位置位于中心或当前块的附近(或当前块中)。但是,本发明不限于此特定像素点位置。可以采用任何其它位置,例如左上等。
附录A给出了量化参数推导过程的详细示例。
(2)第二方法是,根据亮度分量中并置块的一个或多个相邻块的现有QP值的加权和确定色度分量中当前块的QP值(即色度块QP值)。在该方法中,QPc_pred_luma是根据若干个相同权重的点的亮度QP值的并置值计算的。例如,QPc_pred_luma可以根据点(它们是并置的角色度点C1、C2、C3、C4)的亮度QP值通过以下公式计算:
其中,LumaQP1……LumaQP4是图8中L1、L2、L3、L4位置上的亮度CU的QP值。
(3)第三方法是,QPc_pred_luma是根据色度译码块(CU)值与并置的亮度CU的交集,通过以下方式中的一种计算的:
备选方案1:如果色度CU完全由一个亮度CU覆盖,则从亮度CU中提取QPc_pred_luma。
备选方案2:如果色度CU由一个以上的亮度CU覆盖,并且如果所有这样的亮度CU具有相同的QP值,则从亮度CU中提取QPc_pred_luma。
备选方案3:如果色度CU由一个以上的亮度CU覆盖,如果不是所有这些亮度CU都具有相同的QP值,则根据亮度CU的QP值的加权函数从亮度CU中提取QPc_pred_luma,其中每个亮度CU增量QP的权重由当前色度CU与亮度CU的空间对应关系确定。
B.第二组方法:在该方法组中,色度CU QP预测是根据相邻色度CU QP值(即色度分量中块的一个或多个相邻块的QP值)计算的,并表示为QPc_pred_chroma。也就是说,根据色度分量中当前块的相邻块的现有QP值的加权和来确定色度分量中当前块的QP值(即色度CU QP值)。该组中的方法可以与解码端已经可用的任何相邻色度CU一起操作。在这种情况下,QPc_pred_chroma可以通过公式9计算:
其中,N为编号为N的相邻CU的集合,QPn为集合中第n个相邻CU对应的QP值。
C.第三组方法:在该方法组中,根据QPc_pred_luma和QPc_pred_chroma计算色度CU QP值(或预测),可以通过上述方法中的任一种方法计算,色度CU QP预测表示为QPc_pred_mixed。在该方法中,根据色度分量中当前块的相邻块的现有QP值的加权和和亮度分量中的并置块的QP值来确定色度分量中当前块的QP值(即色度CU QP值)。或者,根据色度分量中的当前块的相邻块的现有QP值的加权和和亮度分量中的并置块的相邻块的现有QP值的加权和,确定色度分量中的当前块的QP值(即色度CU QP值)。例如,QPc_pred_mixed可以计算为QPc_pred_luma和QPc_pred_chroma的加权和。在一个示例中,可以通过以下公式10计算:
2.确定色度块QP值的第二方法集
在该方法集中,根据一个或多个现有QP值和所接收到的码流中指示的色度增量QP值,确定色度分量中当前块的QP值(或色度块QP值),一个或多个现有QP值与色度分量中的当前块相关。
本节描述在双树情况下确定QpCbasic推导(或增量)的不同方法。
(1)第一方法:在该方法中,QpCbasic值直接取自QPc_pred_luma、QPc_pred_chroma或QPc_pred_mixed值中的一个,这些值通过上述第一方法集中的相应方法计算。在该方法中,如果使用双树,则亮度CU包括用于增量亮度QP表示的语法元素,而色度CU不包括用于增量色度QP表示的任何语法元素。
表2-第一方法的增量QP指示的示例
表3-第一方法的增量QP指示的另一个示例
表2和表3给出了该方法如何实现指示机制的两个示例。
在该方法中,QpCbasic等于QPc_pred,其反过来可以等于QPc_pred_luma、QPc_pred_chroma或QPc_pred_mixed值中的一个值。在这种情况下,Cb和Cr分量的qPi值可以通过以下公式11计算:
qPiCb=Clip3(-QpBdOffsetC,69,QpCbasic+pps_cb_qp_offset+slice_cb_qp_offset)
qPiCr=Clip3(-QpBdOffsetC,69,QpCbasic+pps_cr_qp_offset+slice_cr_qp_offset)
(公式11)
其中,QpCbasic∈{QPc_pred_luma,QPc_pred_chroma,QPc_pred_mixed},以及QPc_pred_luma、QPc_pred_chroma、QPc_pred_mixed中的每一个是通过上述方法中的一个推导的。更具体地,将当前方法与上述QpCbasic推导方法1相结合,公式11可以重新定义如下:
qPiCb=Clip3(-QpBdOffsetC,69,QpY_basic+pps_cb_qp_offset+slice_cb_qp_offset)
qPiCr=Clip3(-QpBdOffsetC,69,QpY_basic+pps_cr_qp_offset+slice_cr_qp_offset)
(公式11.1)
其中,QpY_basic根据如下分割树类型确定:
如果treeType为SINGLE_TREE,则QpY_basic设置为等于QpY。
否则,将QpY_basic设置为等于并置亮度CU的QpY值,该亮度CU包括坐标为(xCb+cbWidth/2,yCb+cbHeight/2)的亮度像素点。
(xCb,yCb)指定与当前色度译码块并置的亮度译码块的左上像素点相对于当前图像的左上亮度像素点。
QpY值可以根据以下公式计算:
QpY=((qPY_PRED+CuQpDeltaVal+64+2*QpBdOffsetY)%(64+QpBdOffsetY))–QpBdOffsetY
(公式11.1a)
其中,qPY_PRED、CuQpDeltaVal、QpBdOffsetY以用于并置的亮度CU的常规的方式计算。
公式11和11.1中的常数69表示最大可能QP值增加6;公式11.1a中的常数64表示最大可能QP值增加1。附录A给出了量化参数推导过程的详细示例。
在该方法中,例如,delta_qp指示函数可以通过如下方式实现。
表4-方法集中的第一方法的delta_qp()函数指示的示例
在表4中,语法元素cu_qp_delta_enabled_flag表示高电平标志,表示当前条带/图像/序列是否允许增量QP;标志IsCuLumaQpDeltaCoded表示是否在当前深度上发送增量QP;对于更大深度或等深度的CU块,delta_qp和最近指示的一个值相同。用于IsCuQpDeltaCoded标志推导的语法元素cu_qp_delta_enabled_flag和diff_cu_qp_delta_depth可以在图像参数集(picture parameter set,PPS)中指示。
表5-方法集中的第一方法的PPS扩展示例
更具体地,cu_qp_delta_enabled_flag等于1表示diff_cu_qp_delta_depth语法元素存在于PPS中,并且cu_qp_delta_abs和cu_qp_delta_sign_flag可以存在于变换单元语法中。cu_qp_delta_enabled_flag等于0表示diff_cu_qp_delta_depth语法元素不存在于PPS中,并且cu_qp_delta_abs和cu_qp_delta_sign_flag不存在于变换单元语法中。
cu_qp_delta_abs表示当前译码单元的亮度量化参数与其预测值的差值CuQpDeltaVal的绝对值。
cu_qp_delta_sign_flag表示CuQpDeltaVal的符号,如下:
-如果cu_qp_delta_sign_flag等于0时,对应的CuQpDeltaVal为正值。
-否则(cu_qp_delta_sign_flag等于1),对应的CuQpDeltaVal为负值。
当cu_qp_delta_sign_flag不存在时,推断它等于0。
当cu_qp_delta_abs存在时,变量IsCuQpDeltaCoded和CuQpDeltaVal推导如下:
IsCuQpDeltaCoded=1
CuQpDeltaVal=(-1)cu_qp_delta_sign_flag*cu_qp_delta_abs
CuQpDeltaVal的值应在-(32+QpBdOffsetY/2)至+(31+QpBdOffsetY/2)之间(包括-(32+QpBdOffsetY/2)和+(31+QpBdOffsetY/2))。
应注意,该方法可以用于Cb和Cr分量的qPi参数推导,用于任何色度CU深度或仅用于小于一些预定义值的深度,位于较大深度或相等深度的CU块和最近处理的一个值相同。
或者,第一种方法也可以指示色度分量的单独的增量QP语法。
表6-第一方法中单独的增量QP指示的示例
表7-第一方法中单独的增量QP指示的另一个示例
表6和表7给出了色度分量的单独的增量QP语法指示的两个示例,仅针对双树情况下的色度CU,或者同时针对双树情况下的色度CU和单树情况下的单CU。表6和表7中的delta_qp_y()和delta_qp_c()过程通过与表4中所示的delta_qp_c()类似的过程实现。应注意,在单独指示针对双树情况下的色度CU和/或针对单CU中的色度平面的增量QP语法的情况下,表4中的PPS级控制标志cu_qp_delta_enabled_flag可以针对亮度和色度分量实现一次(联合实现),也可以分别实现为两个控制标志:cu_qp_delta_enabled_flag_luma和cu_qp_delta_enabled_flag_chroma。
假设当该方法与上述QpCbasic推导方法1结合时的特殊情况,针对双树情况下的色度CU或同时针对双树情况下的色度CU和单树情况下的单CU(如果应用了两者),公式11可以重新定义下:
qPiCb=Clip3(-QpBdOffsetC,69,QpY_basic+pps_cb_qp_offset+slice_cb_qp_offset+delta_qp_c)
qPiCr=Clip3(-QpBdOffsetC,69,QpY_basic+pps_cr_qp_offset+slice_cr_qp_offset+delta_qp_c)
(公式11.2)
其中,QpY_basic根据如下分割树类型确定:
-如果treeType为SINGLE_TREE,则QpY_basic设置为等于QpY。
-否则,将QpY_basic设置为等于并置亮度CU的QpY值,该亮度CU包括坐标为(xCb+cbWidth/2,yCb+cbHeight/2)的亮度像素点。
(xCb,yCb)指定与当前色度译码块并置的亮度译码块的左上像素点相对于当前图像的左上亮度像素点。
QpY值可以根据以下公式计算:
QpY=((qPY_PRED+CuQpDeltaVal+64+2*QpBdOffsetY)%(64+QpBdOffsetY))–QpBdOffsetY
(公式11.3)
其中,qPY_PRED、CuQpDeltaVal、QpBdOffsetY以用于并置的亮度CU的常规的方式计算。
公式11.1中的常数69表示最大可能QP值增加6;公式11.3中的常数64表示最大可能QP值增加1。
或者,可以将delta_qp_c值添加到Qp′Cb和Qp′Cb的最终等式中:
Qp′Cb=QpCb+QpBdOffsetC+delta_qp_c
Qp′Cr=QpCr+QpBdOffsetC+delta_qp_c
在这种情况下,使用公式11.1进行计算qPiCb和qPiCr值,然后通过色度QP映射函数,根据qPiCb和qPiCr按照常规方法计算QpCb和QpCr值。常规的色度QP映射函数如表15所示。
(2)第二方法:在该方法中,QpCbasic值推导为QPc_pred_luma、QPc_pred_chroma或QPc_pred_mixed值中的一个,这些值是通过上述对应的预测方法中的任一种计算的,CuQpChromaDeltaVal值可以在色度CU中指示。在该方法中,在双树的情况下,亮度CU包括用于增量亮度CU表示的语法元素,而色度CU包括用于增量色度CU差异表示的语法元素。
表6-第二方法的增量QP指示的示例
在该方法中,QpCbasic可以通过以下公式12计算:
QpCbasic=QPc_pred+CuQpChromaDeltaVal (公式12)
其中,QPc_pred∈{QPc_pred_luma,QPc_pred_chroma,QPc_pred_mixed},以及QPc_pred_luma,QPc_pred_chroma,QPc_pred_mixed中的每一个是通过上述方法中的一个推导的;CuQpChromaDeltaVal是色度块的增量QP值,其可以通过以下公式13推导。
CuQpChromaDeltaVal
=cu_chroma_qp_delta_abs*(1-2*cu_chroma_qp_delta_sign_flag)
(公式13)
在这种情况下,Cb和Cr分量的qPi值可以通过以下公式14计算:
qPiCb=Clip3(-QpBdOffsetC,69,QpCbasic+pps_cb_qp_offset+slice_cb_qp_offset)
qPiCr=Clip3(-QpBdOffsetC,69,QpCbasic+pps_cr_qp_offset+slice_cr_qp_offset)
(公式14)
在该方法中,delta_qp_luma和delta_qp_chroma指示功能可以如下方式实现。
表7-第2方法的delta_qp_luma指示的示例
在表7中,语法元素cu_luma_qp_delta_enabled_flag表示高电平标志,表示当前条带/图像/序列是否允许增量亮度QP;标志IsCuLumaQpDeltaCoded表示是否在当前深度上发送增量QP;对于较大深度或相等深度的亮度CU块,delta_luma_qp()元素和最近指示的一个值相同。用于IsLumaCuQpDeltaCoded标志推导的语法元素cu_luma_qp_delta_enabled_flag和diff_cu_luma_qp_delta_depth可以在PPS中指示。
表8-第2方法的delta_qp_chroma指示的示例
在表8中,语法元素cu_chroma_qp_delta_enabled_flag表示高电平标志,表示当前条带/图像/序列是否允许增量色度CU;标志IsCuChromaQpDeltaCoded表示是否在当前深度上发送增量QP;对于较大或相等深度的色度CU块,delta_chroma_qp()元素和最近指示的一个值相同。用于IsChromaCuQpDeltaCoded标志推导的语法元素cu_chroma_qp_delta_enabled_flag和diff_cu_chroma_qp_delta_depth可以在PPS中指示。
表9-第2方法的PPS扩展的示例
(3)第三方法:在该方法中,QpCbasic值推导为QPc_pred_luma、QPc_pred_chroma或QPc_pred_mixed值中的一个,这些值是通过上述对应的预测方法种的任一种计算的,CuQpChromaDeltaVal值可以在色度CU中指示,且仅在一些预定义的深度处的色度CU深度上。所有深度大于预定义深度的色度CU,QpCbasic值和最近处理的一个值相同。在该方法中,在双树的情况下,亮度CU包括用于增量亮度QP表示的语法元素,并且色度CU包括用于增量色度QP表示的语法元素(仅针对深度小于或等于预定义深度的色度CU)。
在该方法中,可以根据表5和表6指示增量QP值,delta_qp_chroma()函数可以通过如下方式实现:
表10-第2方法的delta_qp_chroma指示的示例
表10中的IsChromaCuQpDeltaCoded标志仅对于深度小于或等于预定义的深度的色度CU才等于0。
(4)第四方法:在该方法中,特殊的语法元素可以指定使用哪种类型的预测计算。高级元素cu_qp_chroma_der_type可以在编解码参数集(例如PPS)中的一个编解码参数集中指示,并指定使用任何上述预测值计算方法中的哪一种。
表11-第4方法的PPS扩展的示例
在该方法中,cu_qp_chroma_der_type可以指定预测类型中的任一组,然后可以在该组内使用上述任何预定义的预测。
应注意,在上述第一至第三方法中的一种方法中,cu_qp_chroma_der_type表示集合P中的索引,然后根据QPc_pred推导Cb和Cr分量的QpCbasic值。
(5)第五方法:在该方法中,cu_qp_chroma_der_type可以指定所有组中的一个特定预测类型。例如,假设一组可能的预测
P
={ChromaQpPredictionLuma1,…,ChromaQpPredictionChroma1,ChromaQpPredictionMixel
应注意,在上述第一至第三方法中的一种方法中,cu_qp_chroma_der_type表示集合P中的索引,然后根据QPc_pred推导Cb和Cr分量的QpCbasic值,其中QPc_pred=P[cu_qp__chroma_qp_der_type]。
3.确定色度块QP值的第三方法集
根据一个或多个现有QP值和在所接收的码流中指示的色度QP偏移值(或增量QP偏移量),确定色度分量中当前块的QP值,现有一个或多个QP值与色度分量中的当前块相关。
本节公开了在单树(separate tree,ST)情况下色度QP偏移机制的使用。
第一方法,根据qPiCb和qPiCr计算Cb和Cr的QP值Qp′Cb和Qp′Cr,其中qPiCb和qPiCr通过以下公式15计算:
qPiCb=Clip3(-QpBdOffsetC,69,QpCbasic+pps_cb_qp_offset
+slice_cb_qp_offset+CuQpOffsetCb)
qPiCr=Clip3(-QpBdOffsetC,69,QpCbasic+pps_cr_qp_offset
+slice_cr_qp_offset+CuQpOffsetCr)
(公式15)
其中,QpCbasic值直接取自QPc_pred_luma、QPc_pred_chroma或QPc_pred_mixed值中的一个,这些值是根据上述对应预测方法中的任一种计算的;CuQpOffsetCb/CuQpOffsetCr变量是根据cb_qp_offset_list和cu_chroma_qp_offset_idx语法元素通过以下公式16推导的:
CuQpOffsetCb=cb_qp_offset_list[cu_chroma_qp_offset_idx]
CuQpOffsetCr=cr_qp_offset_list,cu_chroma_qp_offset_idx]
(公式16)
语法元素cb_qp_offset_list和cr_qp_offset_list是偏移表,可以在参数集中(例如PPS中)以如下方式指示。
表12-PPS中的色度QP偏移指示的示例
在表12中,chroma_qp_offset_list_enabled_flag表示是否使用色度QP列表机制;chroma_qp_offset_list_len_minus1表示Cb和Cr分量的偏移列表长度;cb_qp_offset_list和cr_qp_offset_list表示Cb和Cr分量的可能偏移。
cu_chroma_qp_offset_idx表示cb_qp_offset_list和cr_qp_offset_list中的某个元素,可以用于CuQpOffsetCb和CuQpOffsetCr计算。表13表示cu_chroma_qp_offset_idx指示的示例。
表13-色度QP偏移指示的示例
增量QP偏移(在单树情况下)的语法可以如下表14所示。
表14-在单树的情况下,增量QP偏移使用示例
根据本发明的另一个实施例,量化参数推导过程的方法描述如下:附录A量化参数的推导过程
在此过程中,推导了亮度量化参数Qp′Y和色度量化参数Qp′Cb和Qp′Cr。
该过程的输入是亮度位置(xCb,yCb),在treeType等于SINGLE_TREE或DUAL_TREE_LUMA的情况下,表示当前亮度译码块的左上像素点相对于当前图像的左上亮度像素点;在treeType等于DUAL_TREE_CHROMA的情况下,(xCb,yCb)表示与当前色度译码块并置的亮度译码块的左上像素点相对于当前图像的左上亮度像素点。
在此过程中,推导了变量QpY、亮度量化参数Qp′Y、色度量化参数Qp′Cb和Qp′Cr。
亮度位置(xQg,yQg),表示当前量化组的左上亮度像素点相对于当前图像的左上亮度像素点。水平和垂直位置xQg和yQg分别设置为等于xCb-(xCb&((1<<Log2MinCuQpDeltaSize)-1))和yCb-(yCb&((1<<Log2MinCuQpDeltaSize)-1))。量化组的亮度大小Log2MinCuQpDeltaSize决定了共享相同qPY_PRED的译码树块内最小区域的亮度大小。
预测亮度量化参数qPY_PRED通过以下顺序步骤推导:
1.变量qPY_PREV推导如下:
-如果以下条件中的一个或多个为真,则将qPY_PREV设置为SliceQpY:
-当前量化组为条带中的第一量化组。
-当前量化组为分块中的第一量化组。
-当前量化组为译码树块行的第一量化组,entropy_coding_sync_enabled_flag等于1。
-否则,qPY_PREV按照解码顺序设置为等于前一个量化组中最后一个译码单元的亮度量化参数QpY。
2.调用第XXX条中指定的z-扫描顺序中的块的可用性推导过程,将位置(xCurr,yCurr)设置为等于(xCb,yCb),相邻位置(xNbY,yNbY)设置为等于(xQg-1,yQg)作为输入,并将输出赋值给availableA。变量QpY_A推导如下:
-如果以下条件中的一个或多个为真,则将QpY_A设置为qPY_PREV:
-availableA为假。
-包含覆盖亮度位置(xQg-1,yQg)的亮度译码块的译码树块的译码树块地址ctbAddrA不等于CtbAddrInTs,其中ctbAddrA推导如下:
xTmp=(xQg-1)>>Log2MinTrafoSize
yTmp=yQg>>Log2MinTrafoSize
minTbAddrA=MinTbAddrZs[xTmp][yTmp]
ctbAddrA=minTbAddrA>>(2*(CtbLog2SizeY-Log2MinTrafoSize))
-否则,将QpY_A设置为等于包含覆盖(xQg-1,yQg)的亮度译码块的译码单元的亮度量化参数QpY。
3.调用第XXX条中指定的z-扫描顺序中的块的可用性推导过程,将位置(xCurr,yCurr)设置为等于(xCb,yCb),相邻位置(xNbY,yNbY)设置为等于(xQg,yQg-1)作为输入,并将输出赋值给availableB。变量QpY_B推导如下:
-如果以下条件中的一个或多个为真,则将QpY_B设置为等于qPY_PREV:
-availableB为假。
-包含覆盖亮度位置(xQg,yQg-1)的亮度译码块的译码树块的译码树块地址ctbAddrB不等于CtbAddrInTs,其中ctbAddrB推导如下:
xTmp=xQg>>Log2MinTrafoSize
yTmp=(yQg-1)>>Log2MinTrafoSize
minTbAddrB=MinTbAddrZs[xTmp][yTmp]
ctbAddrB=minTbAddrB>>(2*(CtbLog2SizeY-Log2MinTrafoSize))
-否则,将QpY_B设置为等于包含覆盖(xQg,yQg-1)的亮度译码块的译码单元的亮度量化参数QpY。
4.预测亮度量化参数qPY_PRED推导如下:
qPY_PRED=(QpY_A+QpY_B+1)>>1
变量QpY推导如下:
QpY=((qPY_PRED+CuQpDeltaVal+64+2*QpBdOffsetY)%(64+QpBdOffsetY))-QpBdOffsetY
亮度量化参数Qp′Y推导如下:
Qp′Y=QpY+QpBdOffsetY
根据qPi分别等于qPiCb和qPiCr的索引,将变量QpCb和QpCr设置为等于表15中指定的QpC的值,qPiCb和qPiCr推导如下:
qPiCb=Clip3(-QpBdOffsetC,69,QpY_basic+pps_cb_qp_offset+slice_cb_qp_offset)
qPiCr=Clip3(-QpBdOffsetC,69,QpY_basic+pps_cr_qp_offset+slice_cr_qp_offset)
其中,QpY_basic根据如下分割树类型确定:
-如果treeType为SINGLE_TREE,则QpY_basic设置为等于QpY。
-否则,将QpY_basic设置为等于并置亮度CU的QpY值,该亮度CU包括坐标为(xCb+cbWidth/2,yCb+cbHeight/2)的亮度像素点。
Cb和Cr分量的色度量化参数Qp′Cb和Qp′Cr推导如下:
Qp′Cb=QpCb+QpBdOffsetC
Qp′Cr=QpCr+QpBdOffsetC
表15-QpC作为qPi的函数的规范(色度QP映射函数)
qPi | <30 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | >43 |
QpC | =qPi | 29 | 30 | 31 | 32 | 33 | 33 | 34 | 34 | 35 | 35 | 36 | 36 | 37 | 37 | =qPi-6 |
根据本发明的第一方面的一个示例,该方法还包括:根据亮度分量中的并置块的一个或多个相邻块的现有QP值的加权和确定色度分量中的当前块的QP值。
例如,亮度分量中的并置块有四个相邻块,因此色度分量中的当前块的QP值是亮度分量中的并置块的四个相邻块的QP值的平均和。
这里需要提及的是,在一些情况下,并置块的相邻块可以不存在。在这种情况下,建议使用其它现有QP值来确定色度分量中的块的QP值。
根据本发明的第一方面的一个示例,该方法还包括:根据色度分量中的当前块的相邻块的现有QP值的加权和确定色度分量中的当前块的QP值。
根据本发明的第一方面的一个示例,该方法还包括:根据色度分量中的当前块的相邻块的现有QP值的加权和和亮度分量中的并置块的QP值,确定色度分量中的当前块的QP值。
根据本发明的第一方面的一个示例,该方法还包括:根据色度分量中的当前块的相邻块的现有QP值的加权和和亮度分量中的并置块的相邻块的现有QP值的加权和,确定色度分量中的当前块的QP值。
下文对上述实施例中所示的编码方法和解码方法的应用以及使用这些方法的系统进行说明。
图13为用于实现内容分发服务的内容供应系统3100的框图。该内容供应系统3100包括捕获设备3102、终端设备3106,并且可选地包括显示器3126。捕获设备3102与终端设备3106通过通信链路3104进行通信。该通信链路可以包括上述通信信道13。通信链路3104包括但不限于WIFI、以太网、电缆、无线(3G/4G/5G)、USB或者其任何组合等。
捕获设备3102生成数据,并且可以通过如上述实施例所示的编码方法对数据进行编码。或者,捕获设备3102可以将数据分发给流服务器(图中未示出),服务器对数据进行编码并将经编码的数据发送给终端设备3106。捕获设备3102包括但不限于照相机、智能手机或平板电脑、计算机或笔记本电脑、视频会议系统、PDA、车载设备,或它们的任何组合等。例如,捕获设备3102可以包括如上所述的源设备12。当数据包括视频时,捕获设备3102中包括的视频编码器20实际上可以执行视频编码处理。当数据包括音频(即,语音)时,捕获设备3102中包括的音频编码器实际上可以执行音频编码处理。对于一些实际场景,捕获设备3102通过将经编码的视频和音频数据复用在一起来进行分发。对于其它实用场景,例如在视频会议系统中,不复用经编码的音频数据和经编码的视频数据。捕获设备3102将编码音频数据和编码视频数据分别分发给终端设备3106。
在内容提供系统3100中,终端设备3106接收并再现编码数据。终端设备3106可以是具有数据接收和恢复能力的设备,例如智能手机或平板电脑3108、计算机或笔记本电脑3110、网络录像机(network video recorder,NVR)/数字录像机(digital videorecorder,DVR)3112、TV 3114、机顶盒(set top box,STB)3116、视频会议系统3118、视频监控系统3120、个人数字助理(personal digital assistant,PDA)3122、车载设备3124或其任何组合,或者能够解码上述编码数据的设备。例如,终端设备3106可以包括如上所述的目的设备14。当经编码的数据包括视频时,终端设备中包括的视频解码器30优先进行视频解码。当经编码的数据包括音频时,终端设备中包括的音频解码器优先进行音频解码处理。
对于带有显示器的终端设备,例如智能手机或平板电脑3108、计算机或笔记本电脑3110、网络录像机(network video recorder,NVR)/数字录像机(digital videorecorder,DVR)3112、TV 3114、个人数字助理(personal digital assistant,PDA)3122或车载设备3124,终端设备可以将经解码的数据馈送到该终端设备的显示器。对于没有显示器的终端设备(例如STB 3116、视频会议系统3118或视频监控系统3120),连接外部显示器3126以接收并显示解码数据。
该系统中的每个设备在进行编码或解码时,可以使用如上述实施例中所示的图像编码设备或图像解码设备。
图14为终端设备3106的一个示例的结构的图。在终端设备3106从捕获设备3102接收流之后,协议处理单元(protocol proceeding unit)3202分析流的传输协议。协议包括但不限于实时流协议(Real Time Streaming Protocol,RTSP)、超文本传输协议(HyperText Transfer Protocol,HTTP)、HTTP直播协议(HTTP Live streaming protocol,HLS)、MPEG-DASH、实时传输协议(Real-time Transport protocol,RTP)、实时消息协议(RealTime Messaging Protocol,RTMP)或其任何组合等。
协议处理单元3202对流进行处理后,生成流文件。将文件输出到解复用单元3204。解复用单元3204可以将复用数据分为经编码的音频数据和经编码的视频数据。如上所述,对于一些实际场景,例如在视频会议系统中,不复用经编码的音频数据和经编码的视频数据。在这种情况下,将经编码的数据发送到视频解码器3206和音频解码器3208,无需经过解复用单元3204。
通过解复用处理,生成视频基本流(elementary stream,ES)、音频ES和可选的字幕。视频解码器3206包括如上述实施例中所说明的视频解码器30,通过如上述实施例中所示的解码方法对视频ES进行解码以生成视频帧,并将该数据馈送到同步单元3212。音频解码器3208,解码音频ES以生成音频帧,并将该数据馈送到同步单元3212。或者,在将视频帧馈送到同步单元3212之前,可以将该视频帧存储在缓冲器(图14中未示出)中。类似地,在将音频帧馈送到同步单元3212之前,可以将该音频帧存储在缓冲器(图14中未示出)中。
同步单元3212同步视频帧和音频帧,并将视频/音频提供给视频/音频显示器3214。例如,同步单元3212同步视频和音频信息的呈现。可以使用关于经译码的音频和视频数据的表示的时间戳和关于数据流本身的传递的时间戳在语法中对信息进行译码。
如果流中包括字幕,则字幕解码器3210解码字幕,并使字幕与视频帧和音频帧同步,并将视频/音频/字幕提供给视频/音频/字幕显示器3216。
本发明并不限于上述系统,上述实施例中的图像编码设备或图像解码设备都可以结合到其它系统,例如汽车系统。
在第一示例中,提供了一种用于对图像的当前块进行反量化的方法,其中,该方法由解码器执行,图像包括亮度分量和色度分量,将亮度分量和/或色度分量分割成多个块,该方法包括:从所接收到的码流中获取一个或多个现有量化参数(quantizationparameter,QP)值,其中一个或多个现有QP值与色度分量中的当前块相关;根据一个或多个现有QP值确定色度分量中的当前块的QP值;通过所述确定的QP值对色度分量中的当前块进行反量化。
例如,现有的一个或多个QP值包括以下至少一种:亮度分量中的并置块的QP值;亮度分量中的并置块的一个或多个相邻块;色度分量中的当前块的一个或多个相邻块。
在一种示例性实现方式中,该方法还包括:根据亮度分量中的并置块的QP值确定色度分量中的当前块的QP值。
或者或另外,根据亮度分量中的并置块的QP值确定色度分量中的当前块的QP值的步骤包括:确定与当前色度块的右下四分之一部分的左上角像素点并置的亮度块;取得所述确定的亮度块的QP值(QpY_basic);通过以下公式或根据以下公式推导出的新公式确定当前色度块的qPiCb参数和qPiCr参数:qPiCb=Clip3(-QpBdOffsetC,69,QpY_basic+pps_cb_qp_offset+slice_cb_qp_offset)和/或qPiCr=Clip3(-QpBdOffsetC,69,QpY_basic+pps_cr_qp_offset+slice_cr_qp_offset);根据qPiCb参数和qPiCr参数或值确定色度分量中的当前块的QP值。
在一种示例性实现方式中,根据以下公式或者根据以下公式推导出的新公式确定色度分量中的当前块的QP值:Qp′Cb=QpCb+QpBdOffsetC+delta_qp_c和/或Qp′Cr=QpCr+QpBdOffsetC+delta_qp_c;其中,QpCb和QpCr通过应用色度QP映射函数从qPiCb参数和qPiCr参数中获得的。
例如,根据亮度分量中的并置块的QP值确定色度分量中的当前块的QP值的步骤包括:确定与当前色度块的右下四分之一部分的左上角像素点并置的亮度块;取得所述确定的亮度块的QP值(QpY_basic);通过以下公式或根据以下公式推导出的新公式确定当前色度块的qPiCb参数和qPiCr参数:qPiCb=Clip3(-QpBdOffsetC,69,QpY_basic+pps_cb_qp_offset+slice_cb_qp_offset+
delta_qp_c)和/或qPiCr=Clip3(-QpBdOffsetC,69,QpY_basic+pps_cr_qp_offset+slice_cr_qp_offset+delta_qp_c);根据qPiCb参数和qPiCr参数或值确定色度分量中的当前块的QP值。
在一些示例性实现方式中,该方法用于单个CU,并且亮度分量中的并置块等于当前块。
例如,该方法通过一个PPS指示的控制标志(例如cu_qp_delta_enabled_flag)联合用于亮度和色度平面;如果控制标志(例如cu_qp_delta_enabled_flag)为真,则该方法同时用于亮度和色度QP推导;或者,如果控制标志(例如cu_qp_delta_enabled_flag)为假,则该方法不用于亮度和色度QP推导。
在一些示例性实现方式中,该方法通过两个基于PPS的控制标志(例如cu_qp_delta_enabled_flag_luma和cu_qp_delta_enabled_flag_chroma)分别用于亮度和色度平面;如果第一控制标志(例如cu_qp_delta_enabled_flag_luma)为真,则该方法用于亮度QP推导;如果第一控制标志(例如cu_qp_delta_enabled_flag_luma)为假,则该方法不用于亮度QP推导;和/或,如果第二控制标志(例如cu_qp_delta_enabled_flag_chroma)为真,则该方法用于色度QP推导;如果第二控制标志(例如cu_qp_delta_enabled_flag_chroma)为假,则该方法不用于色度QP推导。
例如,该方法还包括:根据色度分量中的当前块的一个或多个相邻块的现有QP值的加权和,确定亮度分量中的并置块的QP值。
或者或另外,该方法还包括:根据色度分量中的当前块的一个或多个相邻块的现有QP值的加权和,确定色度分量中的当前块的QP值。
或者或另外,该方法还包括:根据色度分量中的当前块的一个或多个相邻块的现有QP值的加权和和亮度分量中的并置块的QP值,确定色度分量中的当前块的QP值。
或者或另外,根据色度分量中的当前块的相邻块的现有QP值的加权和和亮度分量中的并置块的相邻块的现有QP值的加权和,确定色度分量中的当前块的QP值。
在一些示例性实现方式中,该方法还包括:根据一个或多个现有QP值和以下至少一个,确定色度分量中当前块的QP值:在所接收到的码流中指示的色度增量QP值,或在所接收到的码流中指示的色度QP偏移值。
在一些示例性实现方式中,该方法还包括:获取当前块的分割深度值;如果分割深度值小于阈值,则根据一个或多个现有QP值和在所接收到的码流中指示的色度增量QP值,确定色度分量中的当前块的QP值。
例如,根据预定义的数字或参数集中指示的数字确定阈值。
例如,亮度分量和色度分量通过一个分割树分割成多个分块,或者亮度分量和色度分量通过不同的分割树独立分割。
在一些示例性实现方式中,根据下表,在码流中指示增量QP语法元素(例如,表示色度增量QP值的增量QP语法元素,即delta_qp_c):
在一些示例性实施例中,根据下表,在码流中指示增量QP语法元素(例如,表示色度增量QP值的增量QP语法元素,即delta_qp_c):
在一些示例性实现方式中,根据下表,在码流中指示增量QP语法元素(例如,表示色度增量QP值的增量QP语法元素,即delta_qp_c):
在一些实施例中,提供了一种解码装置,该解码装置包括用于执行前述方法中的任一种的处理电路。
在一些实施例中,提供了一种计算机程序产品,该计算机程序产品包括程序代码,当计算机程序在计算设备上运行时,该计算机程序产品用于执行根据前述方法中的任一种方法。
在一种示例性实现方式中,提供了一种用于图像的当前块的边界分割的解码装置,该解码装置包括一个或多个处理器和非瞬时性计算机可读存储介质,该非瞬时性计算机可读存储介质耦合到处理器并存储由处理器执行的程序,其中,该程序在由处理器执行时,使解码器执行前述方法中的任一种方法。
在一个实施例中,提供了一种计算机可读存储介质,记录用于使计算机执行前述方法中的任一种方法的程序。
在一个或多个示例中,所描述的功能可以在硬件、软件、固件或其任何组合中实现。如果以软件实现功能,则功能可以作为计算机可读介质上的一个或多个指令或代码存储或发送,并由基于硬件的处理单元执行。计算机可读介质可以包括计算机可读存储介质,对应数据存储介质等有形介质,或包括便于例如根据通信协议将计算机程序从一个地方传输到另一个地方的任何介质的通信介质。在这种方式中,计算机可读介质通常可以对应(1)非瞬时性的有形计算机可读存储介质或(2)通信介质,例如信号或载波。数据存储介质可以是任何可用介质,可由一个或多个计算机或一个或多个处理器访问以取得用于实现本发明所描述的技术的指令、代码和/或数据结构。计算机程序产品可以包括计算机可读介质。
作为示例而非限制,此类计算机可读存储介质可以包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储器、磁盘存储器或其它磁性存储设备、闪存,或可以用于存储指令或数据结构形式的所需程序代码并且可由计算机访问的任何其它介质。此外,任何连接都可以称为计算机可读介质。例如,如果指令是从网站、服务器或其它远程源通过同轴电缆、光纤电缆、双绞线、数字用户线(digital subscriber line,DSL)或无线技术(例如红外、无线电、微波等)发送的,则介质的定义包括同轴电缆、光纤电缆、双绞线、DSL或无线技术(例如红外、无线电和微波等)。但是,应理解,计算机可读存储介质和数据存储介质不包括连接、载波、信号或其它瞬时介质,而是指非瞬时有形存储介质。本文使用的磁盘和光盘包括压缩光盘(compact disc,CD)、激光光盘、光盘、数字通用光盘(digital versatile disc,DVD)、软盘和蓝光光盘,盘通常磁性地再现数据,而光盘则用激光光学地再现数据。上述的组合也应包括在计算机可读介质的范围内。
指令可以由一个或多个处理器执行,例如一个或多个数字信号处理器(digitalsignal processor,DSP)、通用微处理器、专用集成电路(application-specificintegrated circuit,ASIC)、现场可编程逻辑阵列(field programmable gate array,FPGA)或其它等效的集成或分立逻辑电路。因此,本文使用的术语“处理器”可以指任何上述结构或任何适合于实现本文所描述的技术的任何其它结构。另外,在一些方面中,本文所描述的功能可以在用于编码和解码的专用硬件和/或软件模块中提供,或者结合在组合编解码器中。另外,这些技术可以在一个或多个电路或逻辑元件中完全实现。
本发明的技术可以在多种设备或装置中实现,包括无线手持电话、集成电路(integrated circuit,IC)或一组IC(例如芯片组)。本发明描述各种组件、模块或单元以强调用于执行所公开技术的设备的功能方面,但这些组件、模块或单元不一定要求通过不同的硬件单元实现。相反,如上所述,各种单元可以组合在编解码器硬件单元中,或者由包括如上所述的一个或多个处理器的互操作硬件单元的集合结合合适的软件和/或固件来提供。
逻辑运算符
以下逻辑运算符定义如下:
x&&y x和y的布尔逻辑“与”
x||y x和y的布尔逻辑“或”
! 布尔逻辑“非”
x?y: z如果x为真或不等于0,则等于y的值;否则,等于z的值。
关系运算符
以下关系运算符定义如下:
> 大于
>= 大于等于
< 小于
<= 小于等于
== 等于
!= 不等于
当关系运算符用于一个已赋值为“na”(不适用)的语法元素或变量时,则将值“na”视为该语法元素或变量的唯一值。值“na”不等于任何其它值。
按位运算符
以下按位运算符的定义如下:
& 按位“与”。对整数参数进行运算时,对整数值的二进制补码表示进行运算。当对二进制参数进行运算时,如果它包含的位比另一个参数少,则通过添加等于0的更多有效位来扩展较短的参数。
|按位“或”。对整数参数进行运算时,对整数值的二进制补码表示进行运算。当对二进制参数进行运算时,如果它包含的位比另一个参数少,则通过添加等于0的更多有效位来扩展较短的参数。
^按位“异或”。对整数参数进行运算时,对整数值的二进制补码表示进行运算。当对二进制参数进行运算时,如果它包含的位比另一个参数少,则通过添加等于0的更多有效位来扩展较短的参数。
x>>y将x的二进制补码整数表示算法右移y个二进制数字。该函数仅针对y的非负整数值定义。右移的结果是移到最高有效位(most significant bit,MSB)的位的值等于移位操作前的x的MSB。
x<<y将x的二进制补码整数表示算法左移y个二进制数字。该函数仅针对y的非负整数值定义。左移的结果是移到最低有效位(least significant bit,LSB)的位的值等于0。
赋值运算符
以下算术运算符定义如下:
= 赋值运算符
++ 递增,即,x++等价于x=x+1;当用于数组索引时,等于递增操作之前变量的值。
-- 递减,即,x--等价于x=x-1;当用于数组索引时,等于递减操作之前变量的值。
+= 按指定数量递增,即,x+=3等价于x=x+3,x+=(-3)等价于x=x+(-3)。-=按指定数量递减,即,x-=3等价于x=x-3,x-=(-3)等价于x=x-(-3)。
范围表示法
以下表示法用于指定值的范围:
x=y..z x取从y到z的整数值(包括y和z),其中x、y和z是整数,并且z大于y。
Claims (11)
1.一种用于对图像的当前块进行反量化的方法,其特征在于,所述方法由解码器执行,所述图像包括亮度分量和色度分量,所述亮度分量和所述色度分量通过不同的分割树独立地被分割成多个块,所述方法包括:
从码流中获取一个或多个现有量化参数QP值,其中所述一个或多个现有QP值与所述色度分量中的当前块相关;
根据所述一个或多个现有QP值和在所述码流中指示的色度QP偏移值确定所述色度分量中的所述当前块的QP值;
通过所述确定的QP值对所述色度分量中的所述当前块进行反量化;
所述一个或多个现有QP值包括:
亮度分量中的并置块的QP值;
根据所述一个或多个现有QP值和在所述码流中指示的色度QP偏移值确定所述色度分量中的所述当前块的QP值的步骤包括:
根据所述亮度分量中的所述并置块的QP值和所述色度QP偏移值确定所述色度分量中的所述当前块的QP值;
根据所述亮度分量中的所述并置块的QP值和所述色度QP偏移值确定所述色度分量中的所述当前块的QP值的步骤包括:
取得与当前色度块中特定位置的像素点并置的亮度块的QP值;
根据所述取得的亮度块的QP值和所述色度QP偏移值确定所述色度分量中的所述当前块的QP值;
所述特定位置的所述像素点是所述当前色度块的右下四分之一部分的左上角像素点。
2.根据权利要求1所述的方法,其特征在于,所述方法用于单个译码单元CU,并且所述亮度分量中的并置块等于所述当前块。
3.根据权利要求1所述的方法,其特征在于,所述方法通过一个图像参数集PPS指示的控制标志联合用于亮度Luma平面和色度Chroma平面;
如果所述控制标志为真,则所述方法同时用于亮度QP推导和色度QP推导;或者,
如果所述控制标志为假,则所述方法不用于亮度QP推导和色度QP推导。
4.根据权利要求1所述的方法,其特征在于,所述方法通过两个基于图像参数集PPS的控制标志分别用于亮度平面和色度平面;
如果第一控制标志为真,则所述方法用于亮度QP推导;如果所述第一控制标志为假,则所述方法不用于亮度QP推导;和/或,
如果第二控制标志为真,则所述方法用于色度QP推导;如果所述第二控制标志为假,则所述方法不用于色度QP推导。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述亮度分量中所述并置块的一个或多个相邻块的现有QP值的加权和,确定所述色度分量中的所述当前块的QP值。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述色度分量中的所述当前块的一个或多个相邻块的现有QP值的加权和,确定所述色度分量中的所述当前块的QP值;或者
根据所述色度分量中的所述当前块的一个或多个相邻块的现有QP值的加权和和所述亮度分量中的并置块的QP值,确定所述色度分量中的所述当前块的QP值;或者
根据所述色度分量中的所述当前块的相邻块的现有QP值的加权和和所述亮度分量中的所述并置块的相邻块的现有QP值的加权和,确定所述色度分量中的所述当前块的QP值。
7.一种用于对图像的当前块进行量化的方法,其特征在于,所述方法由编码器执行,所述图像包括亮度分量和色度分量,通过不同的分割树独立地将所述亮度分量和所述色度分量分割成多个块,所述方法包括:
通过确定的QP值对所述色度分量中的所述当前块进行量化;
获取一个或多个现有量化参数QP值,并将所述一个或多个现有QP值包括到码流中,
其中所述一个或多个现有QP值与所述色度分量中的所述当前块相关;所述一个或多个现有QP值包括:亮度分量中的并置块的QP值;
根据所述一个或多个现有QP值和所述确定的QP值确定所述色度分量中的所述当前块的QP参数;
将所述QP参数包括到所述码流中;
获取色度QP偏移值,并将所述色度QP偏移值包括到所述码流中;
所述亮度分量中的所述并置块的QP值和所述色度QP偏移值被用于按照如下方式确定所述色度分量中的所述当前块的QP值:
取得与当前色度块中特定位置的像素点并置的亮度块的QP值,所述特定位置的所述像素点是所述当前色度块的右下四分之一部分的左上角像素点;
根据所述取得的亮度块的QP值和所述色度QP偏移值确定所述色度分量中的所述当前块的QP值。
8.一种解码装置,其特征在于,所述解码装置用于图像的当前块的边界分割,所述解码装置包括:
一个或多个处理器;
非瞬时性计算机可读存储介质,所述非瞬时性计算机可读存储介质耦合到所述处理器并存储由所述处理器执行的程序,当所述处理器执行所述程序时,使所述解码器执行根据权利要求1至6中任一项所述的方法。
9.一种编码装置,其特征在于,所述编码装置用于图像的当前块的边界分割,所述编码装置包括:
一个或多个处理器;
非瞬时性计算机可读存储介质,所述非瞬时性计算机可读存储介质耦合到所述处理器并存储由所述处理器执行的程序,当所述处理器执行所述程序时,使所述编码器执行根据权利要求7所述的方法。
10.一种用于对图像的当前块进行反量化的装置,其特征在于,所述图像包括亮度分量和色度分量,所述亮度分量和所述色度分量通过不同的分割树独立地被分割成多个块,
所述装置包括:
码流解析器,用于从码流中获取一个或多个现有量化参数(quantization parameter,QP)值,其中所述一个或多个现有QP值与所述色度分量中的当前块相关;
QP确定单元,用于根据所述一个或多个现有QP值和在所述码流中指示的色度QP偏移值确定所述色度分量中的所述当前块的QP值;
反量化器,用于通过所述确定的QP值对所述色度分量中的所述当前块进行反量化;
所述一个或多个现有QP值包括:
亮度分量中的并置块的QP值;
所述QP确定单元还用于:
根据所述亮度分量中的所述并置块的QP值和所述色度QP偏移值确定所述色度分量中的所述当前块的QP值;
所述QP确定单元还用于:
取得与当前色度块中特定位置的像素点并置的亮度块的QP值;
根据所述取得的亮度块的QP值和所述色度QP偏移值确定所述色度分量中的所述当前块的QP值;
所述特定位置的所述像素点是所述当前色度块的右下四分之一部分的左上角像素点。
11.一种用于对图像的当前块进行量化的装置,其特征在于,所述图像包括亮度分量和色度分量,通过不同的分割树独立地将所述亮度分量和/或所述色度分量分割成多个块,
所述装置包括:
量化器,用于通过确定的QP值对所述色度分量中的所述当前块进行量化;
提取单元,用于获取一个或多个现有量化参数(quantization parameter,QP)值,其中所述一个或多个现有QP值与所述色度分量中的当前块相关;所述一个或多个现有QP值包括:亮度分量中的并置块的QP值;
QP确定单元,用于根据所述一个或多个现有QP值和所述确定的QP值确定所述色度分量中的所述当前块的QP参数;
用于获取色度QP偏移值的单元;
码流生成单元,用于将所述一个或多个现有QP值,所述色度QP偏移值和所述QP参数包括在所述码流中;
所述亮度分量中的所述并置块的QP值和所述色度QP偏移值被用于按照如下方式确定所述色度分量中的所述当前块的QP值:
取得与当前色度块中特定位置的像素点并置的亮度块的QP值,所述特定位置的所述像素点是所述当前色度块的右下四分之一部分的左上角像素点;
根据所述取得的亮度块的QP值和所述色度QP偏移值确定所述色度分量中的所述当前块的QP值。
Applications Claiming Priority (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862734982P | 2018-09-21 | 2018-09-21 | |
US62/734,982 | 2018-09-21 | ||
US201862744125P | 2018-10-10 | 2018-10-10 | |
US62/744,125 | 2018-10-10 | ||
US201862745983P | 2018-10-15 | 2018-10-15 | |
US62/745,983 | 2018-10-15 | ||
PCT/CN2019/107134 WO2020057662A1 (en) | 2018-09-21 | 2019-09-21 | Apparatus and method for inverse quantization |
CN201980060158.9A CN112690000B (zh) | 2018-09-21 | 2019-09-21 | 用于进行反量化的装置和方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980060158.9A Division CN112690000B (zh) | 2018-09-21 | 2019-09-21 | 用于进行反量化的装置和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114598875A CN114598875A (zh) | 2022-06-07 |
CN114598875B true CN114598875B (zh) | 2023-03-24 |
Family
ID=69888333
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210118438.4A Active CN114598875B (zh) | 2018-09-21 | 2019-09-21 | 用于进行量化/反量化的装置和方法及编码/解码装置 |
CN202210119577.9A Pending CN115052144A (zh) | 2018-09-21 | 2019-09-21 | 用于进行反量化的装置和方法 |
CN201980060158.9A Active CN112690000B (zh) | 2018-09-21 | 2019-09-21 | 用于进行反量化的装置和方法 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210119577.9A Pending CN115052144A (zh) | 2018-09-21 | 2019-09-21 | 用于进行反量化的装置和方法 |
CN201980060158.9A Active CN112690000B (zh) | 2018-09-21 | 2019-09-21 | 用于进行反量化的装置和方法 |
Country Status (11)
Country | Link |
---|---|
US (2) | US11689723B2 (zh) |
EP (1) | EP3841748A4 (zh) |
JP (2) | JP7343573B2 (zh) |
KR (2) | KR20230135159A (zh) |
CN (3) | CN114598875B (zh) |
AU (2) | AU2019342803B2 (zh) |
BR (1) | BR112021004984A2 (zh) |
CA (1) | CA3111118A1 (zh) |
MX (1) | MX2021003166A (zh) |
SG (1) | SG11202101799WA (zh) |
WO (1) | WO2020057662A1 (zh) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3700205A1 (en) * | 2019-02-19 | 2020-08-26 | Nokia Technologies Oy | Quantization parameter derivation for cross-channel residual encoding and decoding |
KR102655346B1 (ko) * | 2019-08-22 | 2024-04-05 | 엘지전자 주식회사 | 크로마 양자화 파라미터를 사용하는 영상 디코딩 방법 및 그 장치 |
KR102655352B1 (ko) * | 2019-08-22 | 2024-04-04 | 엘지전자 주식회사 | 영상 디코딩 방법 및 그 장치 |
WO2021037258A1 (en) * | 2019-08-30 | 2021-03-04 | Beijing Bytedance Network Technology Co., Ltd. | Sub-partitioning in intra coding |
US11395014B2 (en) * | 2019-09-18 | 2022-07-19 | Qualcomm Incorporated | Transform unit design for video coding |
WO2021091214A1 (ko) * | 2019-11-05 | 2021-05-14 | 엘지전자 주식회사 | 크로마 양자화 파라미터 오프셋 관련 정보를 코딩하는 영상 디코딩 방법 및 그 장치 |
WO2021170058A1 (en) | 2020-02-27 | 2021-09-02 | Beijing Bytedance Network Technology Co., Ltd. | Transform skip residual coding |
WO2021197447A1 (en) * | 2020-04-01 | 2021-10-07 | Beijing Bytedance Network Technology Co., Ltd. | Controlling quantization parameter delta signaling |
WO2021204137A1 (en) | 2020-04-07 | 2021-10-14 | Beijing Bytedance Network Technology Co., Ltd. | Clipping operation for reference picture wrap around |
CN115428457A (zh) | 2020-04-09 | 2022-12-02 | 抖音视界有限公司 | 基于颜色格式的自适应参数集的约束 |
CN115486064A (zh) | 2020-04-10 | 2022-12-16 | 抖音视界有限公司 | 标头语法元素和自适应参数集的使用 |
US11381820B2 (en) * | 2020-04-13 | 2022-07-05 | Tencent America LLC | Method and apparatus for video coding |
WO2021209061A1 (en) | 2020-04-17 | 2021-10-21 | Beijing Bytedance Network Technology Co., Ltd. | Presence of adaptation parameter set units |
WO2021222036A1 (en) | 2020-04-26 | 2021-11-04 | Bytedance Inc. | Conditional signaling of video coding syntax elements |
WO2021242862A1 (en) * | 2020-05-27 | 2021-12-02 | Bytedance Inc. | Using subpictures and tiles in video coding |
JP2023030585A (ja) * | 2021-08-23 | 2023-03-08 | キヤノン株式会社 | 画像符号化装置及び方法及びプログラム |
CN116095335A (zh) * | 2022-01-21 | 2023-05-09 | 杭州海康威视数字技术股份有限公司 | 一种视频解码方法、装置及存储介质 |
WO2023237119A1 (en) * | 2022-06-10 | 2023-12-14 | Beijing Bytedance Network Technology Co., Ltd. | Method, apparatus, and medium for video processing |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104205836A (zh) * | 2012-04-03 | 2014-12-10 | 高通股份有限公司 | 色度切片层级量化参数偏移及解块 |
CN104427339A (zh) * | 2013-09-09 | 2015-03-18 | 苹果公司 | 视频编码中的色度量化 |
CN104584559A (zh) * | 2012-07-02 | 2015-04-29 | 微软公司 | 用于色度qp值的扩展的范围 |
CN105359521A (zh) * | 2013-06-28 | 2016-02-24 | 黑莓有限公司 | 用于对高保真编码器中的低保真编码进行仿真的方法和设备 |
WO2017219342A1 (en) * | 2016-06-24 | 2017-12-28 | Mediatek Inc. | Methods of signaling quantization parameter for quad-tree plus binary tree structure |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4617644B2 (ja) * | 2003-07-18 | 2011-01-26 | ソニー株式会社 | 符号化装置及び方法 |
GB2512826B (en) * | 2013-04-05 | 2017-05-10 | Canon Kk | Method and device for determining the value of a quantization parameter |
US10142642B2 (en) | 2014-06-04 | 2018-11-27 | Qualcomm Incorporated | Block adaptive color-space conversion coding |
CN105338352B (zh) * | 2014-07-24 | 2019-04-19 | 华为技术有限公司 | 一种视频编码中自适应反量化方法及装置 |
US10057578B2 (en) * | 2014-10-07 | 2018-08-21 | Qualcomm Incorporated | QP derivation and offset for adaptive color transform in video coding |
KR101981725B1 (ko) * | 2014-12-19 | 2019-05-23 | 에이치에프아이 이노베이션 인크. | 비디오 및 이미지 코딩에서의 비-444 색채 포맷을 위한 팔레트 기반 예측의 방법 |
WO2016120209A1 (en) * | 2015-01-30 | 2016-08-04 | Thomson Licensing | A method and apparatus of encoding and decoding a color picture |
EP4404572A3 (en) * | 2015-07-08 | 2024-10-16 | InterDigital Madison Patent Holdings, SAS | Enhanced chroma coding using cross plane filtering |
WO2017093189A1 (en) * | 2015-11-30 | 2017-06-08 | Telefonaktiebolaget Lm Ericsson (Publ) | Encoding of pictures in a video |
US10448056B2 (en) * | 2016-07-15 | 2019-10-15 | Qualcomm Incorporated | Signaling of quantization information in non-quadtree-only partitioned video coding |
KR102321394B1 (ko) * | 2016-08-01 | 2021-11-03 | 한국전자통신연구원 | 영상 부호화/복호화 방법 |
CN118660159A (zh) * | 2016-10-04 | 2024-09-17 | Lx 半导体科技有限公司 | 图像编码/解码方法和图像数据的发送方法 |
-
2019
- 2019-09-21 KR KR1020237030714A patent/KR20230135159A/ko not_active Application Discontinuation
- 2019-09-21 CA CA3111118A patent/CA3111118A1/en active Pending
- 2019-09-21 EP EP19861798.7A patent/EP3841748A4/en active Pending
- 2019-09-21 CN CN202210118438.4A patent/CN114598875B/zh active Active
- 2019-09-21 MX MX2021003166A patent/MX2021003166A/es unknown
- 2019-09-21 WO PCT/CN2019/107134 patent/WO2020057662A1/en unknown
- 2019-09-21 KR KR1020217007947A patent/KR102578075B1/ko active IP Right Grant
- 2019-09-21 AU AU2019342803A patent/AU2019342803B2/en active Active
- 2019-09-21 JP JP2021515469A patent/JP7343573B2/ja active Active
- 2019-09-21 BR BR112021004984-3A patent/BR112021004984A2/pt unknown
- 2019-09-21 SG SG11202101799WA patent/SG11202101799WA/en unknown
- 2019-09-21 CN CN202210119577.9A patent/CN115052144A/zh active Pending
- 2019-09-21 CN CN201980060158.9A patent/CN112690000B/zh active Active
-
2021
- 2021-03-19 US US17/249,946 patent/US11689723B2/en active Active
-
2023
- 2023-05-09 US US18/195,007 patent/US20230291902A1/en active Pending
- 2023-08-31 JP JP2023140910A patent/JP2023164490A/ja active Pending
- 2023-10-11 AU AU2023248107A patent/AU2023248107A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104205836A (zh) * | 2012-04-03 | 2014-12-10 | 高通股份有限公司 | 色度切片层级量化参数偏移及解块 |
CN104584559A (zh) * | 2012-07-02 | 2015-04-29 | 微软公司 | 用于色度qp值的扩展的范围 |
CN105359521A (zh) * | 2013-06-28 | 2016-02-24 | 黑莓有限公司 | 用于对高保真编码器中的低保真编码进行仿真的方法和设备 |
CN104427339A (zh) * | 2013-09-09 | 2015-03-18 | 苹果公司 | 视频编码中的色度量化 |
WO2017219342A1 (en) * | 2016-06-24 | 2017-12-28 | Mediatek Inc. | Methods of signaling quantization parameter for quad-tree plus binary tree structure |
Also Published As
Publication number | Publication date |
---|---|
AU2023248107A1 (en) | 2023-11-09 |
WO2020057662A1 (en) | 2020-03-26 |
US20210218968A1 (en) | 2021-07-15 |
MX2021003166A (es) | 2021-05-14 |
CN115052144A (zh) | 2022-09-13 |
SG11202101799WA (en) | 2021-03-30 |
CA3111118A1 (en) | 2020-03-26 |
KR20230135159A (ko) | 2023-09-22 |
EP3841748A1 (en) | 2021-06-30 |
AU2019342803A1 (en) | 2021-03-18 |
AU2019342803B2 (en) | 2023-07-13 |
EP3841748A4 (en) | 2021-10-27 |
CN112690000A (zh) | 2021-04-20 |
US11689723B2 (en) | 2023-06-27 |
BR112021004984A2 (pt) | 2021-06-08 |
JP2022500943A (ja) | 2022-01-04 |
US20230291902A1 (en) | 2023-09-14 |
JP2023164490A (ja) | 2023-11-10 |
CN114598875A (zh) | 2022-06-07 |
JP7343573B2 (ja) | 2023-09-12 |
CN112690000B (zh) | 2022-02-18 |
KR102578075B1 (ko) | 2023-09-12 |
KR20210045458A (ko) | 2021-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114598875B (zh) | 用于进行量化/反量化的装置和方法及编码/解码装置 | |
CN114071165B (zh) | 视频编码器、视频解码器及对应方法 | |
CN113748677A (zh) | 编码器、解码器及对应的帧内预测方法 | |
CN112673626B (zh) | 各分割约束元素之间的关系 | |
CN113597761A (zh) | 帧内预测方法和装置 | |
CN114450958B (zh) | 用于减小增强插值滤波器的内存带宽的仿射运动模型限制 | |
CN113796078A (zh) | 帧内预测模式相关的编码器、解码器及对应方法 | |
JP7553007B2 (ja) | ビデオコーディングにおけるクロマイントラ予測のための方法及び装置 | |
CN113660489B (zh) | 用于帧内子划分的解码方法、装置、解码器和存储介质 | |
CN114679583B (zh) | 视频编码器、视频解码器及对应方法 | |
KR20220065880A (ko) | 아핀 모션 보상에서 dct 기반 보간 필터 및 향상된 쌍선형 보간 필터의 사용 | |
JP7509902B2 (ja) | スライス用のピクチャパーティション情報をシグナリングするためのデコーダ及び対応する方法 | |
CN113574870B (zh) | 编码器、解码器及其实现的对当前块进行预测译码的方法 | |
CN113692740A (zh) | 用于无除法帧内预测的方法和装置 | |
JP2024147569A (ja) | スライス用のピクチャパーティション情報をシグナリングするためのデコーダ及び対応する方法 | |
CN114830654A (zh) | 译码块分割限制推导的编码器、解码器和对应方法 | |
CN113891084A (zh) | 帧内预测模式相关的编码器、解码器及对应方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |