CN112189341A - 用于视频编码和解码的量化参数预测 - Google Patents

用于视频编码和解码的量化参数预测 Download PDF

Info

Publication number
CN112189341A
CN112189341A CN201980034614.2A CN201980034614A CN112189341A CN 112189341 A CN112189341 A CN 112189341A CN 201980034614 A CN201980034614 A CN 201980034614A CN 112189341 A CN112189341 A CN 112189341A
Authority
CN
China
Prior art keywords
quantization parameter
video data
prediction
values
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980034614.2A
Other languages
English (en)
Inventor
F.莱林内克
F.拉卡普
E.弗朗索瓦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
InterDigital VC Holdings Inc
Original Assignee
InterDigital VC Holdings Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP18306161.3A external-priority patent/EP3618440A1/en
Application filed by InterDigital VC Holdings Inc filed Critical InterDigital VC Holdings Inc
Publication of CN112189341A publication Critical patent/CN112189341A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

提出了具有改进的量化参数预测的用于编码和解码视频数据的设备和方法,并且所述设备和方法可以包括使用从多种量化参数预测方法中的相应方法获得的量化参数预测值的组合,来编码或解码视频数据。

Description

用于视频编码和解码的量化参数预测
技术领域
本公开涉及视频编码和解码。
背景技术
为了达到高压缩效率,图像和视频编码方案通常采用预测和变换以利用(leverage)视频内容中的空间和时间冗余。通常,使用帧内或帧间预测来开发帧内或帧间相关性,然后对原始图像块和预测图像块之间的差异(通常表示为预测误差或预测残差)进行变换、量化和熵编码。为了重构视频,通过对应于预测、变换、量化和熵编码的逆处理,来解码所压缩的数据。
在至少一些传统的编解码器中,量化参数(QP)可以随块(也称为编码单元(CU))而变化。然后针对流中的每个块编码QP。应用预测处理来降低此参数的编码成本。例如在HEVC中,可以从当前CU周围的顶部和左边CU的QP来预测QP值。此外,可以对全局QP偏移值(QPo,取决于信号的比特深度)和局部增量QP(dQP)值进行编码。通常,实施例为编码器和/或解码器提供对这些量化参数等的改进的编码和解码。
发明内容
通常,一个方面涉及一种用于编码视频数据的设备,该设备至少包括存储器和一个或多个处理器,其中所述一个或多个处理器被配置为:标识用于编码视频数据的多种量化参数预测方法中的至少一种;以及基于该至少一种量化参数预测方法来对视频数据进行编码以产生经编码的视频数据,其中经编码的视频数据包括指示用于产生经编码的视频数据的至少一种量化参数预测方法的数据。
通常,另一方面涉及一种用于编码视频数据的方法,包括:标识用于编码视频数据的多种量化参数预测方法中的至少一种;以及基于该至少一种量化参数预测方法来对视频数据进行编码,其中经编码的视频数据包括指示用于编码视频数据的至少一种量化参数预测方法的数据。
通常,另一方面涉及一种用于解码视频数据的设备,该设备至少包括存储器和一个或多个处理器,其中所述一个或多个处理器被配置为:访问视频数据;标识视频数据中指示的用于解码视频数据的多种量化参数预测方法中的至少一种;以及基于视频数据中指示的至少一种量化参数预测方法,来对视频数据进行解码以获得经解码的视频数据。
通常,另一方面涉及一种用于解码视频数据的方法,包括:访问视频数据;标识视频数据中指示的用于解码视频数据的多种量化参数预测方法中的至少一种;以及基于视频数据中指示的至少一种量化参数预测方法,来对编码的视频数据进行解码以获得经解码的视频数据。
通常,另一方面涉及被格式化为包括经编码的视频数据的比特流,其中该经编码的视频数据通过以下方式编码:标识用于编码视频数据的多种量化参数预测方法中的至少一种;以及基于该至少一种量化参数预测方法来对视频数据进行编码以产生经编码的视频数据,其中经编码的视频数据包括指示用于产生经编码的视频数据的至少一种量化参数预测方法的数据。
通常,一个方面涉及一种用于编码视频数据的设备,该设备至少包括存储器和一个或多个处理器,其中所述一个或多个处理器被配置为:获得多个量化参数预测值,每个量化参数预测值对应于多种量化参数预测方法中的相应一种;基于多个量化参数预测值的组合获得量化参数的预测值;以及基于量化参数的预测值来对视频数据进行编码以产生经编码的视频数据,其中经编码的视频数据包括指示多个量化参数预测值的组合的数据。
通常,另一方面涉及一种用于编码视频数据的方法,包括:获得多个量化参数预测值,每个量化参数预测值对应于多种量化参数预测方法中的相应一种;基于多个量化参数预测值的组合获得量化参数的预测值;以及基于量化参数的预测值来对视频数据进行编码以产生经编码的视频数据,其中经编码的视频数据包括指示多个量化参数预测值的组合的数据。
通常,另一方面涉及一种用于解码视频数据的设备,该设备至少包括存储器和一个或多个处理器,其中所述一个或多个处理器被配置为:访问视频数据;标识视频数据中指示的多种量化参数预测方法;获得多个量化参数预测值,每个量化参数预测值对应于多种量化参数预测方法中的相应一种;基于多个量化参数预测值的组合获得量化参数的预测值;以及基于量化参数的预测值来对视频数据进行解码以产生编码的视频数据。
通常,另一方面涉及一种用于解码视频数据的方法,包括:访问视频数据;标识视频数据中指示的多种量化参数预测方法;获得多个量化参数预测值,每个量化参数预测值对应于多种量化参数预测方法中的相应一种;基于多个量化参数预测值的组合获得量化参数的预测值;以及基于量化参数的预测值来对视频数据进行解码,以产生编码的视频数据。
通常,另一方面涉及被格式化为包括经编码的视频数据的比特流,其中经编码的视频数据通过以下方式编码:获得多个量化参数预测值,每个量化参数预测值对应于多种量化参数预测方法中的相应一种;基于多个量化参数预测值的组合获得量化参数的预测值;以及基于量化参数的预测值来对视频数据进行编码以产生经编码的视频数据,其中经编码的视频数据包括指示多个量化参数预测值的组合的数据。
当前实施例中的一个或多个实施例还提供了一种计算机可读储存介质,其上存储有用于根据这里描述的方法或设备来编码或解码视频数据的指令。当前实施例还提供了一种计算机可读储存介质,其上存储有根据这里描述的方法或设备生成的比特流。当前实施例还提供了用于传送或接收根据这里描述的方法或设备生成的比特流的方法和设备。
附图说明
通过结合附图考虑下面的详细描述,可以更好地理解本公开,其中:
图1图示了视频编码器的实施例的示例的框图;
图2图示了用于HDR信号的高级QP预测方法的实施例的示例的QP表和曲线图;
图3图示了视频解码器的实施例的示例的框图;
图4图示了根据实施例的方法的示例;
图5图示了根据实施例的方法的另一示例;
图6图示了其中可以实现根据本公开的各个方面和特征的设备的实施例的示例的框图;
图7图示了视频编码器的实施例的示例的框图;
图8图示了视频解码器的实施例的示例的框图;
图9图示了根据实施例的流程图的示例;
图10图示了根据实施例的流程图的示例;以及
图11图示了根据实施例的流程图的示例。
在各个附图中,相同的附图标记指代相同或相似的特征。
具体实施方式
通常,本公开涉及量化参数(QP)预测,因为其涉及视频编码和解码。例如,如上所述,可以应用预测处理来降低与QP相关联的编码成本。编码器中对视频数据的编码可以基于各种QP预测方法。可以基于各种参数(例如,一个参数可以是诸如动态范围的视频信号的类型的指示)中的一个或多个,来确定或标识要使用的QP预测方法。例如,可以在标准动态范围(SDR)信号的编码期间应用一种类型的QP预测,并对于高动态范围(HDR)信号应用另一类型的QP预测。解码器可以标识使用的QP预测方法,并基于所标识的方法对编码的视频数据进行解码。
现在转到附图,图1图示了诸如HEVC编码器的视频编码器100的示例。HEVC是由视频编码联合协作小组(JCT-VC)开发的压缩标准(参见,例如,“ITU-TH.265TELECOMMUNICATION STANDARDIZATION SECTOR OF ITU(10/2014),SERIES H:AUDIOVISUAL AND MULTIMEDIA SYSTEMS,Infrastructure of audiovisual services–Coding of moving video,High efficiency video coding,Recommendation ITU-TH.265”)。图1还可以图示其中对HEVC标准进行改进的编码器、或采用类似于HEVC的技术的编码器,诸如基于或改进于由JVET开发的JEM(联合探索模型)的编码器。
在本申请中,术语“重构”和“解码”可以互换使用,术语“像素”和“样本”可以互换使用,并且术语“画面”和“帧”可以互换使用。通常,但不是必须地,将术语“重构”用于编码器侧,而将“解码”用于解码器侧。
HEVC规范在“块”与“单元”之间进行区分,其中“块”寻址样本阵列中的特定区域(例如,亮度、Y),而“单元”包括所有经编码的颜色分量(Y、Cb、Cr、或单色)、语法元素、和与块相关联的预测数据(例如,运动向量)的并置块。
对于编码,将画面分区为具有可配置大小的正方形形状的编码树块(CTB),并且将编码树块的连续集合分组为切片。编码树单元(CTU)包含经编码的颜色分量的CTB。CTB是分区为编码块(CB)的四叉树的根,并且编码块可以被分区为一个或多个预测块(PB),并形成分区为变换块(TB)的四叉树的根。对应于编码块、预测块和变换块,编码单元(CU)包括预测单元(PU)、和树状结构的变换单元(TU)的集合,PU包括所有颜色分量的预测信息,并且TU包括每个颜色分量的残差编码语法结构。亮度分量的CB、PB和TB的大小适用于对应的CU、PU和TU。在本申请中,术语“块”可以用于指代CTU、CU、PU、TU、CB、PB和TB中的任一个。此外,“块”还可以用于指代H.264/AVC或其他视频编码标准中规定的宏块和分区,并且更一般地,用于指代各种大小的数据的阵列。
在图1中的编码器100中,由编码器元件对画面进行编码,如下所述。以CU为单位对要编码的画面进行处理。使用帧内或者帧间模式对每个CU进行编码。当以帧内模式对CU进行编码时,其执行帧内预测(160)。在帧间模式中,执行运动估计(175)和补偿(170)。编码器判断(105)使用帧内模式或帧间模式中的哪一个用于对CU进行编码,并通过预测模式标志来指示该帧内/帧间判断。通过从原始图像块中减去(110)预测块,来计算预测残差。
然后对预测残差进行变换(125)和量化(130)。对经量化的变换系数、以及运动向量和其他语法元素进行熵编码(145)以输出比特流。编码器也可以跳过变换,并以4×4的TU为基础对未变换的残差信号直接应用量化。编码器也可以绕过变换和量化两者,即,直接对残差进行编码,而不应用变换或量化处理。在直接PCM编码中,不应用预测,并且将编码单位样本直接编码为比特流。
编码器对已编码的块进行解码,以为进一步的预测提供参考。对量化的变换系数进行反量化(140)和逆变换(150)以解码预测残差。通过组合(155)已解码的预测残差和已预测块,来重构图像块。环内滤波器(165)被应用于重构的画面,以例如执行解块/SAO(样本自适应偏移)滤波以减少编码伪像。将经滤波的图像存储在参考画面缓冲器(180)中。
图3图示了诸如HEVC解码器的视频解码器300的示例的框图。在示例解码器300中,由解码器元件对信号或比特流进行解码,如下所述。视频解码器300通常执行与图1中描述的编码遍历相反(reciprocal)的解码遍历,其执行视频解码作为编码视频数据的一部分。图3还可以图示其中对HEVC标准进行改进的解码器、或采用类似于HEVC的技术的解码器,诸如基于或改进于JEM的解码器。
具体地,解码器的输入包括视频信号或比特流,其可以由视频编码器100生成。首先对该信号或比特流进行熵解码(330)以获得变换系数、运动向量、和其他编码信息。对变换系数进行反量化(340)和逆变换(350)以解码预测残差。通过组合(355)经解码的预测残差和预测块,来重构图像块。可以从帧内预测(360)或运动补偿预测(即,帧间预测)(375)中获得(370)预测块。可以使用高级运动向量预测(AMVP)和合并模式技术来导出用于运动补偿的运动向量,运动补偿可使用内插滤波器来计算用于参考块的子整数样本的内插值。对经重构的图像应用环内滤波器(365)。将经滤波的图像存储在参考画面缓冲器(380)中。
在至少一个实施例中,诸如图1的编码器100的编码器中的量化处理可以包括除以量化步长(Qstep)和随后的舍入。相反地,在诸如图3的解码器300的解码器中的逆或反量化处理的至少一个实施例中,可以包括乘以量化步长。在H.264/AVC和H.265/HEVC中,使用量化参数(QP)来确定量化步长。
如已经提到的,量化参数(QP)可以随块(在编解码器的一些示例中也称为编码单元(CU))而变化。然后针对流中的每个块或块组来编码QP。应用预测处理来降低此参数的编码成本。例如在HEVC中,可以从当前CU周围的相邻的顶部和左边CU或CU组的QP中预测QP值。将预测值记为QPpred。此外,可以对全局QP偏移值(QPo,取决于信号的比特深度)和局部增量QP(dQP)值进行编码。解码器处的实际QP可以计算为:
QPy=((QPpred+dQP+52+2*QPo)%(52+QPo))
在至少一个实施例中,可以基于已经编码的信号来自动地导出量化参数预测(QPpred)。这种实施例可以基于考虑因子、参数或数据(诸如当前块中的预测样本、或画面中的空间位置)的处理。以下信息描述了高级QP预测的实施例的各种示例。
在至少一个实施例中,高级QP预测方法可以包括基于亮度样本的值来应用局部QP自适应。例如,在编码器处给定块的量化之前,可以(使用原始信号或预测信号)计算给定块的平均亮度值。然后,可以应用QP自适应,其可以包括将取决于平均亮度值的增量QP值(dQP)添加至为切片指定的QP。在至少一个实施例中,按照每个亮度值范围设计dQP表。在图2中绘制并示出了10位信号的表的示例。通常,此处理在编码器和解码器两者处都可以是有用的,例如通过计算所考虑的块的预测信号的平均亮度值,并通过在编码器和解码器处从dQP表中导出对应的dQP值。在至少一个实施例中,取决于平均亮度的QP自适应可以应用于高动态范围(HDR)信号。
在至少一个实施例中,高级QP预测方法可以包括基于块或要编码的块所属的区域的活动性(例如亮度活动性),来计算编码器处的dQP。例如:
dQP=-3log2wk
其中wk是取决于位于位置k处的块Bk的亮度样本的加权值,如下所述。
令s(x,y)(0≤x<W,0≤y<H)代表宽度为W且高度为H的画面的原始或预测亮度样本。亮度分量的高通滤波的版本推导如下:
h(x,y)=4·s(x,y)-s(x-1,y)-s(x+1,y)-s(x,y-1)-s(x,y+1)
对于每个块Bk,根据下式计算局部活动性ak
Figure BDA0002792719750000071
其中
Figure BDA0002792719750000072
代表在没有边界样本(=0,y=0,x=W-1,或y=H-1)的情况下的所考虑的块Bk
Figure BDA0002792719750000073
项指定了块
Figure BDA0002792719750000074
中的样本的数目。
最后,根据下式计算索引k处的每个块Bk的wk
Figure BDA0002792719750000075
其中apic是归一化因子,例如可以设置为2.2B,其中B是信号的比特深度,并且β可以例如设置为2/3。
通常,此处理在编码器和解码器两者处都可以是有用的,例如,通过在编码器和解码器处基于预测信号计算块的活动性值,并通过从对应的权重中导出对应的dQP值。此外,通常,取决于亮度活动性的QP自适应对于诸如感知编码的编码可以是有用的。
在至少一个实施例中,内容的编码可以基于空间自适应的量化。例如,QP计算可以基于CU的地点,并且可以在解码器侧导出。可以基于在计算加权球面PSNR中使用的权重,来计算每个CU的QP值:
Figure BDA0002792719750000076
其中y是样本的垂直坐标,并且h是等矩形画面的垂直大小。
可以计算CU的所有样本地点的平均权重:
Figure BDA0002792719750000081
其中y0对应于CU的顶部样本的垂直坐标,并且sy表示CU的垂直大小。
例如,可以如下计算CU的每行的QP:
QP(y0)=min(QPbase-3*log2(wcu(y0)),QPmax)
其中QPmax=51,并且QPbase对应于当前切片的QP。
通常,此处理在编码器和解码器处都可以是有用的,例如在编码器和解码器处应用空间自适应的量化。此外,作为示例,取决于位置的QP自适应对于VR360 ERP信号(虚拟现实360°等矩形投影)可以是有用的。
描述了用于导出或预测QP或dQP值的实施例的各种示例。通常,可以将这种示例和其他示例设想为可以包括在编码器和解码器中。实施例的至少一个示例包括在例如编码器处将信令包括在信号或比特流中、以及在解码器处基于该信令来执行高级QP处理的判断处理。
注意,诸如所描述的涉及信令的示例和/或本文所描述的实施例的其他示例中的一个或多个的方案不阻止对每个块或每组块的实际dQP值进行编码,代替QP或dQP预测处理或在其之上,以例如改进编码的信号的感知质量。
如本文所述,实施例的各种示例被称为高级QP预测,其提供比可认为是传统的QP预测(例如,仅基于局部邻近QP值的HEVC)更详细的方法。
如本文所述,实施例的一个或多个示例可应用于编码器和解码器两者,例如高级QP预测方法的上述三个示例,其基于以下:1)给定的块的亮度样本的值(例如,平均亮度值)(本文别处称为“方法1”),或2)块或块所属的区域的活动性(例如,亮度活动性)(本文别处称为“方法2”),或3)空间自适应的量化,例如,基于CU的地点和在计算加权球面PSNR中使用的权重(本文别处称为“方法3”)。
在编解码器中可以考虑几种高级QP预测方法,例如取决于视频格式,诸如视频的性质(例如,SDR、HDR、VR360)或视频的内容(例如,平滑的画面、高度纹理化的内容)。如上所述,可以使用不同的高级QP预测方法用于编码SDR信号、HDR信号、或VR360信号。可以使用又一方法来改进SDR或HDR信号的感知质量。
各种实施例还在经编码的信号或比特流中指示要在解码器处使用的实际的高级QP预测方法,并在解码器处指定选择此方法的方式。这是将在下面讨论的实施例或实现方式的至少一个示例中提出的内容。
至少一个实施例可以实现各种优点中的一个或多个。增量QP被经典地显式地在流中编码。如所指示的,一些实施例使用推断方法来预测其值。至少一个附加实施例提供了对不同的推断方法的使用。对于每个实施例,高级QP预测方法可以特定于该实施例的上下文,例如,SDR信号、HDR信号、VR360信号。
在至少一个实施例中,解码器中应用的dQP/QP预测处理可以被修改为包括例如:
·在解码器中启用几种高级QP预测方法;
·在信令中插入使解码器能够标识要使用的高级QP预测方法的语法元素;
·基于这些语法元素,选择要在解码器处应用的高级QP预测方法;和/或
·在解码器处应用该高级QP预测方法用于导出QP。
因此,可以使用这里描述的各种实施例来例如修改与诸如分别如图1和图3中所示的JVET或HEVC编码器100和解码器300的量化和逆量化(130,140,340)相关的组件。此外,本实施例不限于JVET或HEVC,并且可以应用于其他标准、建议、及其扩展。此外,在实现各种实施例时,也可以对其他组件进行修改。此外,这里描述的各个方面和/或实施例可以单独使用或组合使用。
图4图示了由至少一个实施例实现的处理400的示例,尽管包括图4的变型的其他处理可以在其他实施例中使用。示例处理400可以在解码器或编码器处应用。其可以应用于CU、CTU、或CU级别的组。该处理可以分离地应用于例如亮度和色度分量。
因此,图4的处理400的输入是在解析比特流之后获得的经解码的QP语法元素和经解码的局部dQP值。经解码的局部dQP值可以是经解码的QP语法元素的部分,或者是未包括在经解码的QP语法元素中的附加元素。在步骤401中,基于经解码的(多个)QP语法元素的(多个)值,在可用的QP预测方法的集合或多个可用的QP预测方法之中选择QP预测方法。在步骤402中,应用所选的QP预测方法,以例如导出QP预测值(在此表示为QPpred)。在步骤403中,基于QPpred值并从经解码的局部dQP值中导出CU的实际QP值。输出是QP值(表示为QPout)以应用于CU,用于残差信号的逆量化。
通常,实施例的至少一个示例可以包括诸如下面所述的语法的示例。可以在例如HEVC的SPS语法中插入诸如下面描述并示出的示例的信令语法特征。下表1说明了语法的实施例的示例。表1中以灰色突出显示了关于实施例的至少一个示例所关注的语法部分。下面所示的示例仅仅是说明性的,并且可以由本领域技术人员相应地修改以实现相同或相似的信令功能。还可以将这种语法引入其他级别或部分中,例如PPS或切片报头。
以下是为下表1所指定的语法元素的示例:
·quant_pred_enabled_flag:此标志指示高级QP预测是否应用。
·quant_pred_method_idx:此参数指示要应用的高级QP预测方法。仅当启用高级QP预测时,即当quant_pred_enabled_flag等于1时,才会对该参数进行编码。
表1
Figure BDA0002792719750000111
下表2说明了quant_pred_method_parameters()中添加的语法,该语法启用在特定高级预测quant_pred_method_idx中使用的所需参数的信令。在表中所示的示例实施例中,可以启用三种方法(例如,方法0、方法1、方法2)。然而,可以设想其中可以启用其他数目的方法(例如,多于或少于三种方法)的其他实施例。对于每种方法i,发信号通知参数(quant_pred_methodi_paramj),j=0至Ni-1,Ni是量化方法i所需的参数的数目。
表2
Figure BDA0002792719750000121
下表3示出了实施例的示例,该实施例包括切片级别的语法元素slice_quant_pred_enabled_flag,用于当其在更高级别(例如,在SPS级别)启用时,启用对该切片的高级QP预测的激活或停止。这还可以通过在PPS中发信号通知类似的语法元素,来应用于画面级别。
表3
Figure BDA0002792719750000131
注意,其他实施例可以使用如上所示的语法元素和结构的所述示例的变型。例如,可以不需要发送标志,并且取而代之的是quant_pred_method_idx可以保留要用作标志的或要启用的值。更一般地,还可以构想任何显式信令方法。
在至少一个实施例中,高级预测方法之一可以是前面描述的方法1(即,用于HDR信号的取决于平均亮度的QP自适应)。对于这种情况,可以发信号通知一个参数quant_pred_methodi_param0来指示该方法对其应用以导出块的QPpred值的最小块大小。当给定的块小于授权的大小时,使用针对该给定块所属的、最小授权尺寸的较大块计算的QPpred值。
在至少一个实施例中,高级预测方法之一可以是前面描述的方法2(即,用于感知编码的取决于亮度活动性的QP自适应)。对于这种情况,可以发信号通知一个参数quant_pred_methodi_param0来指示参数β的值。可以发信号通知另一参数quant_pred_methodi_param1来指示参数a_pic的值。可以发信号通知附加参数quant_pred_methodi_param1来指示该方法对其应用以导出块的QPpred值的最小块大小,如前面方法1的情况。
在至少一个实施例中,高级预测方法之一可以是前面描述的方法3(即,取决于位置的QP自适应,例如,用于诸如VR360信号的信号)。对于这种情况,可以发信号通知一个参数quant_pred_methodi_param0来控制画面行之间的权重变化wfact,如下所示:
Figure BDA0002792719750000141
可以发信号通知附加参数quant_pred_methodi_param1,来指示该方法对其应用以导出块的QPpred值的最小块大小,如同前面的方法。
图5图示了用于至少一个实施例的对应决策树500的实施例的示例。可以使用决策树500用于判断高级QP预测是否对切片应用。
在步骤501中,检查标志quant_pred_enabled_flag和slice_quant_pred_enabled_flag。如果两者都为真,则在步骤401中选择高级QP预测方法,并且在步骤402中应用高级QP预测方法(与图5的步骤401和402相同)。另一方面,如果在步骤501中,quant_pred_enabled_flag或slice_quant_pred_enabled_flag为假,则如步骤502中所指定的,不对切片应用高级QP预测。
在实施例的另一示例中,当启用高级QP预测时,实际上可以从信号的格式中推断语法元素quant_pred_method_idx,在这种情况下,不需要发信号通知该语法元素。例如,当在比特流中指示信号的格式或特性时,可以从信号的特性的格式中推断高级QP预测方法。可以在VUI中指示信号的当前格式或特性。可以在诸如SPS的其他地点中指示它们。具体地,在语法元素transfer_characteristics中发信号通知传递函数。例如:
-transfer_characteristics等于16指示HDR PQ信号;
-transfer_characteristics等于18指示HDR HLG信号;
-否则,预期SDR信号。
在例如SEI消息中或SPS中发信号通知的另一语法元素(这里称为vr_signal)可以指示信号是否是VR信号。
在实施例的另一示例中,可以如下标识或选择高级QP预测方法:
-如果语法元素vr_signal为真,则选择高级QP预测方法3(quant_pred_method_idx=2)
-否则,如果transfer_characteristics等于16,则选择高级QP预测方法1(quant_pred_method_idx=0)
-否则,如果transfer_characteristics不等于16,则选择高级QP预测方法2(quant_pred_method_idx=1)
下表4说明了使用HEVC规范中的transfer_characteristics语法元素的传递特性解释的一些示例。
Figure BDA0002792719750000161
Figure BDA0002792719750000171
Figure BDA0002792719750000181
表4-使用HEVC规范中的transfer_characteristics语法元素的传递特性解释
在至少一个实施例中,可以组合或级联多个QP预测处理。图9中图示了基于组合的编码的实施例的示例。在图9中,在910处获得多个QP预测值。如前所述,可以使用语法元素显式地发信号通知QP预测方法。例如,在至少一个实施例中,可以启用或对于组合或级联可用的QP预测处理的各种示例可以包括三种方法(指定为方法0、方法1和方法2),其可以例如在至少一个实施例中对应于上述三种QP预测方法:方法1(基于亮度样本的值的QP自适应)、方法2(基于诸如亮度活动性的活动性的QP自适应)、和方法3(基于空间自适应的量化的QP自适应)。语法元素quant_pred_method_idx可以解释如下:
-如果quant_pred_method_idx等于0,则应用方法0;
-否则如果quant_pred_method_idx等于1,则应用方法1;
-否则如果quant_pred_method_idx等于2,则应用方法2;
-否则如果quant_pred_method_idx等于3,则组合方法0和方法1;
-否则如果quant_pred_method_idx等于4,则组合方法0和方法2;
-否则如果quant_pred_method_idx等于5,则组合方法1和方法2。
在组合(k+1)种高级QP预测方法的示例中,导出对应的QPpred值QPpred_0…QPpred_k,并且通过组合这些不同的值(如图9中920处所示)来获得实际的最终QPpred(或在图9中简称为QP),例如,计算为这些不同的值的和:
QPpred=QPpred_0+QPpred_1+…+QPpred_k
可以通过例如使用多种QP预测处理方法中的每种的连续处理,并对由每个预测处理产生的QPpred值连续求和,来连续地获得多个QPpred值。这可以称为多种QP预测方案的级联。然后,在图9中的930处,可以基于通过在920处组合各种预测值而产生的QP值,来编码视频数据。
图10图示了可以以与关于图9对于编码所描述的方式类似的方式进行的解码的实施例的示例。
还可以基于信号特性来判断组合或级联。下面举例说明。
基于语法元素vr_signal导出第一值QPpred0:
-如果语法元素vr_signal为真,则从高级QP预测方法3导出QPpred0,
-否则将QPpred0设置为0。
基于语法元素transfer_characteristics导出第二值QPpred1,如下所示:
-如果transfer_characteristics等于16,则从高级QP预测方法1导出QPpred1,
-否则如果transfer_characteristics不等于16,则从高级QP预测方法2导出QPpred1。
导出最终QPpred作为QPpred0和QPpred1之和。
将参照图11更详细地解释涉及QP预测处理的组合或级联的至少一个实施例的示例。在图11中的1210处,通过从输入数据中标识第一或初始QP预测处理,例如基于当前块的特性、比特流中的内容和/或语法,块或当前CU的QP处理开始。第一QP预测方案可以是诸如上文第[31]段中所述涉及从当前CU周围的相邻的顶部和左边CU或CU组的QP值来预测QP值的处理。在1220处使用此初始预测方法来确定第一或初始QP预测值(指定为QP0)。接下来,在1230处,系统确定是否改善(refine)初始QP预测值。此确定可以基于例如比特流中的语法、诸如包括HDR内容的内容的内容的特性而发生。如果1230处的确定为“否”,则初始QP0值作为QP预测值输出(步骤1235)。如果1230处的确定为“是”,则在1240处开始初始QP0值的改善,其中将索引“n”设置为1。在1250处,通过例如比特流中的语法来标识另一或第n种QP预测方法。在1260处,第n种QP预测方法产生另一QP预测值(指定为QPn),可使用该预测值来提供初始QP0值的改善。第n种QP预测处理可以是例如上文(例如,在第[33]或[34]或[35]段中)所述的高级QP预测方法。在实施例中,QPn预测值可以包括微分或增量QP值,其可以与第一或初始QP预测值QP0组合,以产生包括针对初始QP0值的改善的组合QP预测值。在实施例中,产生组合QP预测值可以涉及对初始QP0值和一个或多个QPn值求和,如图11的1270。在1260处产生的第一改善值可以表示为QP1,在这种情况下,产生QP预测值的QP0和QP1的组合可以是:
QP=QP0+QP1
在实施例中,可能期望附加的改善,其中每个改善可以基于相应的QP预测方法。在1280处发生对进一步的或附加的改善的检查,例如检查语法、内容类型等。如果未指示进一步的改善(1280处为“否”),则将1270处所产生的当前QP预测值作为QP预测值输出。如果要提供进一步的改善(1280处为“是”),则在1290处索引“n”递增,并且重复1250至1280以产生QPn+1。在多个改善(1250至1290的多次迭代)的情况下,可以使用多种QP预测方法中的相应一种来产生每个改善值。每个改善值可以是如上所述的微分值。对于多个改善值,1270处所获得的组合可以涉及对所有改善值QP1至QPn求和,并将该和与初始QP0值相加以产生QP预测值。例如,对于基于两种QP预测方法的两个改善,产生总体QP预测值的组合可以是:
QP=QP0+QP1+QP2
添加诸如QP1和QP2的增量QP值实现了QP预测方案的组合或级联,其提供了对初始QP预测值QP0的调整、修改或改善,以改进QP预测结果。所描述的使用一个或多个附加QP预测方法(例如,高级QP预测方法)来改善例如由常规QP预测方法所产生的初始QP预测值的QP预测处理的组合或级联,具有调节初始QP预测值的效果。
QP预测处理的组合或级联的所述示例的至少一个实施例可以涉及以下内容。首先,可以确定初始QP预测值,其可以是例如作为整个画面的“全局”值的QP0值。可以在流中发信号通知此初始的全局QP0值。然后,所描述的QP0的改善可以基于流中包括的画面部分或视频内容的一个或多个参数或特性而发生。例如,QP0的改善可以基于内容的类型,例如,比特流中发信号通知的或者从比特流中包括的语法元素推断的内容的类型。作为更具体的示例,考虑可以是HDR和/或VR360内容的内容。对于HDR内容,可以为每个块确定增量QP值(dQP1),例如,从亮度预测块的平均值来推断。此外,例如,如果HDR内容也是VR360,则可以确定第二增量QP值(dQP2),例如,从画面中的块的位置来推断。然后,应用于该块的最终QP值可以是:
οQP=QP0+dQP1+dQP2
图6图示了其中实现了各个方面和实施例的系统的示例的框图。图6中所示的系统可以被实施为包括下述各种组件的装置,并且被配置为执行本文档中描述的各方面中的一个或多个。这种装置的示例包括但不限于各种电子装置,诸如个人计算机、膝上型计算机、智能电话、平板计算机、数字多媒体机顶盒、数字电视接收机、个人视频记录系统、连接的家用电器、和服务器。在图6中所示的系统的实施例的示例中,将某些特征或元件一起分组在以虚线绘制的框1000内进行图示。形成框1000的元件的分组仅仅是为了便于描述和说明实施例的示例。在图6所示的示例实施例中或者在其他实施例中,可以设想图6中所示的元件的各种其他分组。在图6中,框1000可以与诸如显示器1100、音频扬声器1110和其他外围装置1120的各种外围装置对接或交互,这将在下文更详细地描述。图6中所示的组1000内的特征可以被单独地或组合地实施在单个集成电路(IC)、多个IC、和/或分立组件中。例如,在至少一个实施例中,组1000的处理和编码器/解码器元件跨多个IC和/或分立元件分布。在各种实施例中,组1000中包括的特征可以经由例如诸如通信信道1060的通信总线或通过专用输入和/或输出端口,通信地耦合至其他类似的系统或其他电子装置。在各种实施例中,图6的系统可以被配置为实现本文档中描述的各方面中的一个或多个。
组1000的特征可以包括至少一个处理器,诸如配置为执行加载在其中的用于实现例如本文档中描述的各个方面的指令的处理器1010。处理器1010可以包括嵌入式存储器、输入输出接口、和本领域已知的各种其他电路。虽然处理器1010被示为单个框1010,但是可以使用多个处理器来实现处理器1010的功能。框1000的特征可以包括至少一个存储器1020(例如,易失性存储器件、和/或非易失性存储器件)和/或其他存储器件,诸如储存装置1040,其可以包括非易失性存储器和/或易失性存储器,包括但不限于EEPROM、ROM、PROM、RAM、DRAM、SRAM、闪存、磁盘驱动器、和/或光盘驱动器。作为非限制性示例,储存装置1040可以包括内部储存装置、附加储存装置、和/或网络可访问储存装置。
框1000的特征可以包括编码器/解码器模块1030,其被配置为例如处理数据以提供经编码的视频或经解码的视频,并且编码器/解码器模块1030可以包括其自己的处理器和存储器。编码器/解码器模块1030代表可以包括在装置中以执行编码和/或解码功能的(多个)模块。如已知的,装置可以包括编码和解码模块中的一种或两种。此外,编码器/解码器模块1030可以被实现为图6中所示系统的单独元件而不是被包括在框1000中,或者可以作为本领域技术人员已知的硬件和软件的组合并入处理器1010内。
要加载到处理器1010或编码器/解码器1030上以执行本文档中描述的各个方面的程序代码可以存储在储存装置1040中,并随后加载到存储器1020上用于由处理器1010执行。根据各种实施例,处理器1010、存储器1020、储存装置1040、和编码器/解码器模块1030中的一个或多个可以在执行本文档中描述的处理期间存储各个项目中的一项或多项。这种存储的项目可以包括但不限于输入视频、解码视频或部分解码视频、比特流、矩阵、变量、以及来自方程式、公式、运算、和运算逻辑的处理的中间或最终结果。
在几个实施例中,处理器1010和/或编码器/解码器模块1030内部的存储器用于存储指令,并为编码或解码期间使用的处理提供工作存储器。然而,在其他实施例中,可以使用处理装置(例如,处理装置可以是处理器1010或编码器/解码器模块1030)外部的存储器用于这些功能中的一个或多个。外部存储器可以是存储器1020和/或储存装置1040,例如动态易失性存储器和/或非易失性闪存。在几个实施例中,使用外部非易失性闪存来存储电视机的操作系统。在至少一个实施例中,诸如RAM的快速外部动态易失性存储器被用作用于视频编码和解码操作的工作存储器,诸如用于MPEG-2、HEVC、或VVC(通用视频编码)。
如框1130中所示,可以通过各种输入装置提供到图6中所示系统的元件的一个或多个输入。这种输入装置包括但不限于:(i)接收例如由广播设备通过空中传送的RF信号的RF部分,(ii)复合输入端子,(iii)USB输入端子,和/或(iv)HDMI输入端子。
在各种实施例中,框1130的输入装置具有相关联的本领域已知的相应的输入处理元件。例如,RF部分可以与元件相关联用于(i)选择期望的频率(也称为选择信号,或者将信号频带限制到频带),(ii)下变频所选择的信号,(iii)再次频带限制到较窄的频带,以选择(例如)信号频带(在某些实施例中可以称为信道),(iv)解调经下变频和频带限制的信号,(v)执行纠错,以及(vi)解多路复用以选择期望的数据分组的流。各种实施例的RF部分包括执行这些功能的一个或多个元件,例如频率选择器、信号选择器、频带限制器、信道选择器、滤波器、下变频器、解调器、误差校正器、和解多路复用器。RF部分可以包括执行这些功能中的各种的调谐器,这些功能包括例如将接收信号下变频至较低频率(例如,中频或近基带频率)或基带。在一个机顶盒实施例中,RF部分及其相关联的输入处理元件接收通过有线(例如,线缆)介质传送的RF信号,并通过滤波、下变频和再次滤波至期望的频带,来执行频率选择。各种实施例重新排列上述(和其他)元件的顺序,移除这些元件中的一些,和/或添加执行类似或不同的功能的其他元件。添加元件可以包括在现有元件之间插入元件,例如,插入放大器和模数转换器。在各种实施例中,RF部分包括天线。
此外,USB和/或HDMI端子可以包括相应的接口处理器,用于通过USB和/或HDMI连接将图6的系统连接至其他电子装置。应当理解,可以根据需要在例如单独的输入处理IC内或处理器1010内实现输入处理的各个方面,例如里德-所罗门纠错。类似地,可以在单独的接口IC内或处理器1010内实现USB或HDMI接口处理的各方面。将经解调、纠错和解多路复用的流提供至各种处理元件,包括例如处理器1010、和编码器/解码器1030,其与存储器和储存元件组合操作以处理数据流用于在输出装置上呈现。
可以将图6的系统的各种元件提供在集成外壳内。在集成外壳内,各种元件可以使用合适的连接布置1140(例如,本领域已知的内部总线,包括I2C总线、布线、和印刷电路板)互连并在其间传送数据。
图6的系统可以包括使能经由通信信道1060与其他装置进行通信的通信接口1050。通信接口1050可以包括但不限于被配置为通过通信信道1060传送和接收数据的收发器。通信接口1050可以包括但不限于调制解调器或网卡,并且通信信道1060可以在例如有线和/或无线介质内实现。
在各种实施例中,可以使用诸如IEEE 802.11的Wi-Fi网络,将数据提供(例如,流式传输)至图6的系统。这些实施例的Wi-Fi信号是通过适应于Wi-Fi通信的通信信道1060和通信接口1050来接收的。这些实施例的通信信道1060可以连接至提供对包括互联网的外部网络的接入的接入点或路由器,用于允许流式传输应用和其他云上通信(over-the-topcommunication)。其他实施例可以使用通过输入框1130的HDMI连接传递数据的机顶盒,向图6的系统提供流式传输的数据。还有其他实施例使用输入框1130的RF连接向系统1000提供流式传输的数据。
框1000可以向包括显示器1100、扬声器1110、和/或其他外围装置1120的各种输出装置提供输出信号。在实施例的各种示例中,其他外围装置1120包括独立的DVR、盘播放器、立体声系统、照明系统、和基于系统的输出提供功能的其他装置中的一个或多个。在各种实施例中,使用诸如AV.链路、CEC、或在有或没有用户干预的情况下使能装置到装置的控制的其他通信协议的信令,来在框1000和显示器1100、扬声器1110、或其他外围装置1120之间传送控制信号。输出装置可以通过相应的接口1070、1080和1090经由专用的连接通信地耦合至框1000。可替代地,输出装置可以使用通信信道1060经由通信接口1050连接至框1000。在电子装置(例如,电视机)中,显示器1100和扬声器1110可以与图6中所示系统的其他组件集成在单一单元中。在各种实施例中,显示接口1070包括显示驱动器,例如,时序控制器(TCon)芯片。
显示器1100和扬声器1110可以可替代地与其他组件中的一个或多个分离,例如如果输入1130的RF部分是单独机顶盒的部分。在显示器1100和扬声器1110是外部组件的各种实施例中,可以经由包括例如HDMI端口、USB端口、或COMP输出的专用输出连接,来提供输出信号。
一个或多个实施例可以由处理器1010实现的计算机软件、或硬件、或硬件和软件的组合来执行。作为非限制性示例,实施例可以由一个或多个集成电路实现。作为非限制性示例,存储器1020可以是适合技术环境的任何类型,并且可以使用任何适当的数据储存技术来实现,例如,光存储装置、磁存储装置、基于半导体的存储装置、固定存储器、和可移除存储器。作为非限制性示例,处理器1010可以是适合于技术环境的任何类型,并且可以包括基于多核架构的微处理器、通用计算机、专用计算机、和处理器中的一个或多个。
图7中示出了实施例的另一示例,该示例是在例如编码器中提供QP预测的方法。在图7中,在710处处理诸如数字视频信号或比特流中包括的数据的视频数据,以标识QP预测方法(例如,多个可用方法中的一个)。710处的方法的标识可以基于各种方案中的任一个而发生,各种方案诸如上述例如基于信号类型(诸如SDR、HDR等)、比特流中的语法信息等的方案中的一种或多种。将710处标识的方法传递至720,其中对视频数据进行编码。也就是说,在720处处理视频数据以对视频数据进行编码,例如,如上文关于诸如图1或图6所示的实施例所述,其中编码可以基于在710处标识的QP预测方法。经编码的视频数据从720输出,并且可以包括指示用于编码诸如上述QP预测指示的示例(例如,语法、信号特性或类型)的QP预测方法的数据或信息。
图8示出了用于解码视频数据的方法的实施例的示例。在810处处理编码的视频数据(例如,数字数据信号或比特流)以标识在编码视频数据期间使用的QP预测方法。该标识可以以诸如上述例如基于信号的类型、信号特性和/或语法的方式中的一种发生。将所标识的方法传递至820,其中发生视频数据的解码。在820处对编码的视频数据的处理,例如,如上文关于诸如图3或图6所示的实施例所述,基于在810处标识的QP预测方法来对编码的视频数据进行解码。从820处输出经解码的视频数据。
本文档描述了各个方面,包括工具、特征、实施例、模型、方案等。对这些方面中的许多方面进行了具体的描述,并且至少为了示出个体特性,常常以听起来可能是限制性的方式进行描述。然而,这是出于描述清楚的目的,并不限制那些方面的应用或范围。事实上,所有不同的方面都可以组合和互换以提供进一步的方面。此外,各方面也可以与更早的文件(filings)中描述的各方面进行组合和互换。
本文档中描述和构想的实施例可以以许多不同的形式实现。例如,这里描述的图1、图3和图6提供了硬件相关的实施例的一些示例,但是构想了其他实施例,并且对这些和其他附图的讨论不限制实现方式的广度。各方面中的至少一个方面通常涉及视频编码和解码,并且至少一个其他方面通常涉及传送所生成的或经编码的比特流。这些方面和其他方面可以实现为方法、设备、其上存储有用于根据所述方法中的任何方法来编码或解码视频数据的指令的计算机可读储存介质、和/或其上存储有根据所述方法中的任何方法而生成的比特流的计算机可读储存介质。
这里还描述了各种方法,并且各种方法中的每种包括用于实现所述方法的一个或多个步骤或动作。除非该方法的正确操作要求步骤或动作的特定顺序,否则可以对特定步骤和/或动作的顺序和/或使用进行修改或组合。
本申请中使用了各种数值,例如,用于开启/关闭混合帧内预测的模式差阈值、以及权重计算方程式中使用的常数。应当注意,特定的值仅为示例,并且本实施例不限于这些特定的值。
本文描述的实现方式可以例如以方法或处理、设备、软件程序、数据流、或信号来实现。即使仅在单一形式的实现方式的上下文中进行讨论(例如,仅作为方法讨论),所讨论的特征的实现方式也可以其他形式(例如,设备或程序)来实现。设备可以例如以适当的硬件、软件和固件来实现。所述方法可以在例如诸如处理器之类的设备中实现,该处理器一般指代处理装置,包括例如计算机、微处理器、IC、或可编程逻辑器件。处理器还包括通信装置,例如计算机、手机、便携式/个人数字助理(“PDA”)、和有助于最终用户之间的信息通信的其他装置。
对“一个实施例”或“实施例”或“一种实现方式”或“实现方式”、及其其他变型的指代意味着结合实施例所描述的特定特征、结构、特性等等被包括在至少一个实施例中。因此,在整个说明书的各个地方出现的短语“在一个实施例中”或“在实施例中”或“在一种实现方式中”或“在实现方式中”、以及任何其他变型的出现并不一定全都指代相同的实施例。
此外,本申请或其权利要求可指代“确定”各条信息。确定信息可以包括例如估计信息、计算信息、预测信息、或从存储器中检索信息中的一个或多个。
此外,本申请或其权利要求可指代“访问”各条信息。访问信息可以包括例如接收信息、(例如,从存储器中)检索信息、存储信息、处理信息、发送信息、移动信息、复制信息、擦除信息、计算信息、确定信息、预测信息、或估计信息中的一个或多个。
此外,本申请或其权利要求可指代“接收”各条信息。与“访问”一样,接收意欲为广义的术语。接收信息可以包括例如访问信息、或(例如,从存储器中)检索信息中的一个或多个。此外,可以在诸如存储信息、处理信息、传送信息、移动信息、复制信息、擦除信息、计算信息、确定信息、预测信息、或估计信息的操作期间,以一种方式或另一方式涉及“接收”。
对于本领域技术人员来说将显而易见的是,各实现方式可以产生各种信号,这些信号被格式化以携带可被例如存储或传送的信息。该信息可以包括,例如用于执行方法的指令、或由所述实现方式中的一种所产生的数据。例如,信号可以被格式化以携带所述实施例的比特流。这种信号可以被格式化为,例如电磁波(例如,使用谱的射频部分)或基带信号。格式化可以包括,例如对数据流进行编码并用经编码的数据流来调制载波。信号携带的信息可以是,例如模拟或数字信息。如已知的,可以通过各种不同的有线或无线链路来传送信号。可将信号存储在处理器可读介质上。
实施例可以包括跨越各种不同的权利要求类别和类型、单独地或以任何组合的以下特征或实体中的任一个:
·修改解码器和/或编码器中应用的dQP/QP预测处理。
·在解码器和/或编码器中启用几种高级QP预测方法。
·在信令中插入使解码器能够标识要使用的QP预测方法的语法元素。
·基于这些语法元素,选择应用于解码器处的QP预测方法。
·在解码器处应用QP预测方法用于导出QP。
·包括所述语法元素或其变型中的一个或多个的比特流或信号。
·创建和/或传送和/或接收和/或解码包括所述语法元素或其变型中的一个或多个的比特流或信号。
贯穿本公开,还支持和构想了各种其他的概括的以及具体的实施例。例如,在实施例中,提出了一种用于编码视频数据的设备,至少包括存储器和一个或多个处理器,其中所述一个或多个处理器被配置为:标识或获得用于编码视频数据的多种量化参数预测方法中的至少一种;以及基于所述至少一种量化参数预测方法来对视频数据进行编码以产生经编码的视频数据,其中经编码的视频数据包括指示用于产生经编码的视频数据的至少一种量化参数预测方法的数据。
根据另一实施例,提出了一种用于编码视频数据的方法,包括:标识或获得用于编码视频数据的多种量化参数预测方法中的至少一种;以及基于所述至少一种量化参数预测方法来对视频数据进行编码,其中经编码的视频数据包括指示用于编码视频数据的至少一种量化参数预测方法的数据。
根据另一实施例,提出了一种用于解码视频数据的设备,至少包括存储器和一个或多个处理器,其中所述一个或多个处理器被配置为:访问视频数据;标识或获得视频数据中指示的用于解码视频数据的多种量化参数预测方法中的至少一种;以及基于视频数据中指示的至少一种量化参数预测方法,来对视频数据进行解码以获得经解码的视频数据。
根据另一实施例,提出了一种用于解码视频数据的方法,包括:访问视频数据;标识或获得视频数据中指示的用于解码视频数据的多种量化参数预测方法中的至少一种;以及基于视频数据中指示的至少一种量化参数预测方法,来对编码的视频数据进行解码以获得经解码的视频数据。
根据另一实施例,提出了一种用于编码视频数据的设备,至少包括存储器和一个或多个处理器,其中所述一个或多个处理器被配置为:获得多个量化参数预测值,每个量化参数预测值对应于多种量化参数预测方法中的相应一种;基于多个量化参数预测值的组合获得量化参数的预测值,并基于量化参数的预测值来对视频数据进行编码以产生经编码的视频数据,其中经编码的视频数据包括指示多个量化参数预测值的组合的数据。
根据另一实施例,提出了一种用于编码视频数据的方法,包括:获得多个量化参数预测值,每个量化参数预测值对应于多种量化参数预测方法中的相应一种;基于多个量化参数预测值的组合获得量化参数的预测值,并基于量化参数的预测值来对视频数据进行编码以产生经编码的视频数据,其中经编码的视频数据包括指示多个量化参数预测值的组合的数据。
根据另一实施例,提出了一种用于解码视频数据的设备,至少包括存储器和一个或多个处理器,其中所述一个或多个处理器被配置为:访问视频数据;标识视频数据中指示的多种量化参数预测方法;获得多个量化参数预测值,每个量化参数预测值对应于多种量化参数预测方法中的相应的一种;基于多个量化参数预测值的组合获得量化参数的预测值,并基于量化参数的预测值来对视频数据进行解码以产生编码的视频数据。
根据另一实施例,提出了一种用于解码视频数据的方法,包括:访问视频数据;标识视频数据中指示的多种量化参数预测方法;获得多个量化参数预测值,每个量化参数预测值对应于多种量化参数预测方法中的相应一种;基于多个量化参数预测值的组合获得量化参数的预测值,并基于量化参数的预测值来对视频数据进行解码以产生编码的视频数据。
根据另一实施例,提出了一种被格式化为包括经编码的视频数据的比特流,其中经编码的视频数据通过以下方式编码:获得多个量化参数预测值,每个量化参数预测值对应于多种量化参数预测方法中的相应一种;基于多个量化参数预测值的组合获得量化参数的预测值,并基于量化参数的预测值来对视频数据进行编码以产生经编码的视频数据,其中经编码的视频数据包括指示多个量化参数预测值的组合的数据。
根据另一实施例,多种量化参数预测方法至少包括:取决于平均亮度的量化参数自适应方法、取决于亮度活动性的量化参数自适应方法、或取决于位置的量化参数自适应方法。
根据另一实施例,多种量化参数预测方法包括基于两种或多种量化参数自适应方法的组合的方法。
根据另一实施例,该组合通过以下方式形成:执行两种或多种量化参数自适应方法,以产生两个或多个相应的量化参数预测值;以及组合所述两个或多个相应的量化参数预测值,以产生最终的量化参数预测值。
根据另一实施例,通过连续地执行两种或多种量化参数自适应方法以产生最终的量化参数预测值,而形成该组合。
根据另一实施例,所述至少一个量化参数预测方法至少基于视频数据中包括的语法元素和视频的格式。
根据另一实施例,视频的格式包括标准动态范围(SDR)、高动态范围(HDR)、和虚拟现实360°等矩形投影(VR360 ERP)中的一种或多种视频格式。
根据另一实施例,基于指示正在编码或解码的视频是否是虚拟现实信号的语法元素、和指示正在编码或解码的视频的传递函数的语法元素,来选择至少一种量化参数预测方法。
根据另一实施例,比特流被格式化以包括经编码的视频数据,其中该经编码的视频数据通过以下方式编码:标识或获得用于编码视频数据的多种量化参数预测方法中的至少一种;以及基于所述至少一种量化参数预测方法来对视频数据进行编码以产生经编码的视频数据,其中经编码的视频数据包括指示用于产生经编码的视频数据的至少一种量化参数预测方法的数据。
通常,用于编码或解码视频数据的设备或方法的至少一个实施例可以包括基于亮度样本的值来应用局部QP自适应,其中局部QP自适应可以包括使用原始信号或预测信号获得块的平均亮度值;以及将取决于平均亮度值的增量QP值添加至为切片指定的QP。在至少一个实施例中,可以从每个亮度值范围的增量QP值的表中获得增量QP值。
通常,用于编码或解码视频数据的设备或方法的至少一个实施例可以包括基于权重值获得增量QP值,其中该权重值基于块或该块所属区域的亮度活动性。
通常,用于编码或解码视频数据的设备或方法的至少一个实施例可以包括空间自适应的量化。在至少一个实施例中,空间自适应的量化可以应用于内容的类别,其中内容的类别包括虚拟现实等矩形投影内容;并且基于CU的地点获得QP值;并且基于用于计算加权球形峰值信噪比的权重,来获得每个CU的QP值。
本实施例中的一个或多个还提供了一种计算机可读储存介质,其上存储有用于根据这里描述的方法或设备来编码或解码视频数据的指令。本实施例还提供了一种计算机可读储存介质,其上存储有根据这里描述的方法或设备生成的比特流。本实施例还提供了用于传送或接收根据这里描述的方法或设备生成的比特流的方法和设备。

Claims (15)

1.一种用于编码视频数据的设备,包括:
一个或多个处理器(100),其中所述一个或多个处理器被配置为
获得多个量化参数预测值,每个量化参数预测值对应于多种量化参数预测方法中的相应一种;
基于所述多个量化参数预测值的组合,获得量化参数的预测值;以及
基于所述量化参数的预测值来对所述视频数据进行编码,以产生编码的视频数据,其中所述编码的视频数据包括指示所述多个量化参数预测值的所述组合的数据。
2.一种用于编码视频数据的方法,包括:
获得多个量化参数预测值,每个量化参数预测值对应于多种量化参数预测方法中的相应一种;
基于所述多个量化参数预测值的组合,获得量化参数的预测值;以及
基于所述量化参数的预测值来对所述视频数据进行编码,以产生编码的视频数据,其中所述编码的视频数据包括指示所述多个量化参数预测值的所述组合的数据。
3.一种用于解码视频数据的设备,包括:
一个或多个处理器(300),其中所述一个或多个处理器被配置为
访问所述视频数据;
标识所述视频数据中指示的多种量化参数预测方法;
获得多个量化参数预测值,每个量化参数预测值对应于所述多种量化参数预测方法中的相应一种;
基于所述多个量化参数预测值的组合,获得量化参数的预测值;以及
基于所述量化参数的预测值来对所述视频数据进行解码,以产生编码的视频数据。
4.一种用于解码视频数据的方法,包括:
访问(810;820)所述视频数据;
标识所述视频数据中指示的多种量化参数预测方法;
获得多个量化参数预测值,每个量化参数预测值对应于所述多种量化参数预测方法中的相应一种;
基于所述多个量化参数预测值的组合,获得量化参数的预测值;以及
基于所述量化参数的预测值来对所述视频数据进行解码,以产生编码的视频数据。
5.根据权利要求1或3所述的设备或者权利要求2或4所述的方法,其中所述多种量化参数预测方法至少包括:
取决于平均亮度的量化参数自适应方法,
取决于亮度活动性的量化参数自适应方法,或
取决于位置的量化参数自适应方法。
6.根据权利要求5所述的设备或方法,其中通过将第一量化参数预测值与由所述量化参数自适应方法中的相应方法所产生的一个或多个量化参数预测改善值进行组合,而获得所述多个量化参数预测值的所述组合。
7.根据权利要求6所述的设备或方法,其中通过以下方式形成所述组合:
执行所述量化参数自适应方法中的一种或多种,以产生一个或多个相应的量化参数预测改善值;以及
对所述第一量化参数预测值和所述一个或多个量化参数预测改善值求和,以产生最终的量化参数预测值。
8.根据权利要求6所述的设备或方法,其中所述一个或多个量化参数预测改善值中的每一个包括微分值。
9.根据权利要求1、3和5至8中任一项所述的设备或根据权利要求2和4至8中任一项所述的方法,其中所述至少一种量化参数预测方法至少基于所述视频数据中包括的语法元素和视频的格式。
10.根据权利要求9所述的设备或方法,其中所述视频的格式包括标准动态范围、高动态范围、和虚拟现实360°等矩形投影中的一种或多种视频格式。
11.根据权利要求1和3所述的设备或权利要求2和4所述的方法,其中基于指示正在编码或解码的视频是否是虚拟现实信号的语法元素、和指示正在编码或解码的所述视频的传递函数的语法元素,来选择所述至少一种量化参数预测方法。
12.一种非暂时性计算机可读介质,包含根据权利要求1、3和5-11中任一项所述的设备或者通过权利要求2、4和5-11中任一项所述的方法而生成的数据内容,用于使用处理器进行回放。
13.一种计算机程序产品,包括当由一个或多个处理器运行时、用于执行权利要求2、4和5-12中任一项所述的方法的计算指令。
14.一种比特流,被格式化以包括编码的视频数据,其中所述编码的视频数据通过以下方式编码:
获得多个量化参数预测值,每个量化参数预测值对应于多种量化参数预测方法中的相应一种;
基于所述多个量化参数预测值的组合,获得量化参数的预测值;以及
基于所述量化参数的预测值来对所述视频数据进行编码,以产生编码的视频数据,其中所述编码的视频数据包括指示所述多个量化参数预测值的所述组合的数据。
15.一种装置,包括:
根据权利要求1、3和5-11中任一项所述的设备;以及
以下至少一个:(i)天线,被配置为接收信号,所述信号包括表示所述视频数据的数据,(ii)频带限制器,被配置为将所接收的信号限制到包括表示所述视频数据的所述数据的频带,以及(iii)显示器,被配置为显示来自所述视频数据的图像。
CN201980034614.2A 2018-04-16 2019-04-09 用于视频编码和解码的量化参数预测 Pending CN112189341A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP18305469 2018-04-16
EP18305469.1 2018-04-16
EP18306161.3A EP3618440A1 (en) 2018-09-03 2018-09-03 Quantization parameter prediction for video encoding and decoding
EP18306161.3 2018-09-03
PCT/US2019/026537 WO2019204083A1 (en) 2018-04-16 2019-04-09 Quantization parameter prediction for video encoding and decoding

Publications (1)

Publication Number Publication Date
CN112189341A true CN112189341A (zh) 2021-01-05

Family

ID=66182688

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980034614.2A Pending CN112189341A (zh) 2018-04-16 2019-04-09 用于视频编码和解码的量化参数预测

Country Status (4)

Country Link
US (2) US11558615B2 (zh)
EP (1) EP3782365A1 (zh)
CN (1) CN112189341A (zh)
WO (1) WO2019204083A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114173116A (zh) * 2021-11-26 2022-03-11 中山大学 一种基于拉普拉斯滤波器的自适应量化方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019199025A1 (ko) * 2018-04-09 2019-10-17 에스케이텔레콤 주식회사 영상을 부호화/복호화하는 방법 및 그 장치
CN112292855B (zh) * 2018-04-09 2024-06-04 Sk电信有限公司 用于对图像进行编码/解码的方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103416060A (zh) * 2011-03-11 2013-11-27 索尼公司 图像处理装置和方法
CN104094600A (zh) * 2012-01-30 2014-10-08 三星电子株式会社 用于包括量化参数预测的基于分层数据单元的视频编码和解码的方法和设备
US20150146776A1 (en) * 2013-11-25 2015-05-28 Fujitsu Limited Video image encoding device, video image encoding method
EP3026910A1 (en) * 2014-11-25 2016-06-01 BlackBerry Limited Perceptual image and video coding
WO2017138761A1 (ko) * 2016-02-11 2017-08-17 삼성전자 주식회사 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
CN107465924A (zh) * 2010-06-10 2017-12-12 汤姆森特许公司 从多个相邻量化参数中确定量化参数预测值的方法和装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI575933B (zh) * 2011-11-04 2017-03-21 杜比實驗室特許公司 階層式視覺動態範圍編碼中之層分解技術
KR102154966B1 (ko) * 2012-02-29 2020-09-10 소니 주식회사 화상 처리 장치 및 방법, 및 기록 매체
US10448056B2 (en) * 2016-07-15 2019-10-15 Qualcomm Incorporated Signaling of quantization information in non-quadtree-only partitioned video coding
GB2552223B (en) * 2016-07-15 2020-01-01 Gurulogic Microsystems Oy Encoders, decoders and methods employing quantization
WO2018175638A1 (en) * 2017-03-21 2018-09-27 Dolby Laboratories Licensing Corporation Quantization parameter prediction using luminance information
US10659760B2 (en) * 2017-07-10 2020-05-19 Qualcomm Incorporated Enhanced high-level signaling for fisheye virtual reality video
US20200322606A1 (en) * 2017-10-24 2020-10-08 Sharp Kabushiki Kaisha Systems and methods for determining quantization parameter predictive values

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107465924A (zh) * 2010-06-10 2017-12-12 汤姆森特许公司 从多个相邻量化参数中确定量化参数预测值的方法和装置
EP3267684A1 (en) * 2010-06-10 2018-01-10 Thomson Licensing Methods and apparatus for determining quantization parameter predictors from a plurality of neighboring quantization parameters
CN103416060A (zh) * 2011-03-11 2013-11-27 索尼公司 图像处理装置和方法
CN104094600A (zh) * 2012-01-30 2014-10-08 三星电子株式会社 用于包括量化参数预测的基于分层数据单元的视频编码和解码的方法和设备
US20150146776A1 (en) * 2013-11-25 2015-05-28 Fujitsu Limited Video image encoding device, video image encoding method
EP3026910A1 (en) * 2014-11-25 2016-06-01 BlackBerry Limited Perceptual image and video coding
WO2017138761A1 (ko) * 2016-02-11 2017-08-17 삼성전자 주식회사 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JIE ZHAO ET AL: "De-quantization and scaling for next generation containers" *
KEI KAWAMURA: "Luma/Chroma QP Adaptation for Hybrid Log-Gamma Sequences Encoding" *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114173116A (zh) * 2021-11-26 2022-03-11 中山大学 一种基于拉普拉斯滤波器的自适应量化方法

Also Published As

Publication number Publication date
US20230156193A1 (en) 2023-05-18
US20210021830A1 (en) 2021-01-21
US11558615B2 (en) 2023-01-17
WO2019204083A1 (en) 2019-10-24
EP3782365A1 (en) 2021-02-24

Similar Documents

Publication Publication Date Title
CN112352427B (zh) 基于图像块的非对称二元分区的视频编码和解码的方法和装置
US20230156193A1 (en) Quantization parameter prediction for video encoding and decoding
CN112771874A (zh) 用于画面编码和解码的方法和设备
US20210051326A1 (en) Chroma quantization parameter adjustment in video encoding and decoding
EP3687172A1 (en) Multiple transforms selection signalling
KR20210058846A (ko) 인트라 변환 코딩 및 광각 인트라 예측의 조화
CN112335240A (zh) 使用可变权重的多参考帧内预测
JP2023516940A (ja) ローカルクロマ量子化パラメータ制御のための高レベルの制約フラグ
EP3618440A1 (en) Quantization parameter prediction for video encoding and decoding
US20220038704A1 (en) Method and apparatus for determining chroma quantization parameters when using separate coding trees for luma and chroma
EP3706423A1 (en) Local illumination compensation for video encoding or decoding
CN114600450A (zh) 使用位置相关帧内预测组合进行画面编码和解码的方法和设备
US20220360781A1 (en) Video encoding and decoding using block area based quantization matrices
US20230232045A1 (en) Scaling process for joint chroma coded blocks
US20210266582A1 (en) Illumination compensation in video coding
EP3591971A1 (en) Chroma quantization parameter adjustment in video encoding and decoding
EP3706419A1 (en) Multi-model local illumination compensation for video encoding or decoding
CN114270829A (zh) 局部照明补偿标志继承
KR20220057630A (ko) 코딩 툴들과의 변환 크기 상호작용들
EP3994883A1 (en) Chroma format dependent quantization matrices for video encoding and decoding
WO2020260310A1 (en) Quantization matrices selection for separate color plane mode
CN118140481A (zh) 利用isp模式对基于模版的帧内模式推导(timd)进行扩展
CN112806013A (zh) 仿射模式下基于块大小的运动矢量编码
CN117501692A (zh) 用于视频编码和解码的模板匹配预测

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination