CN114026858A - 用于在视频编码中导出视频块的量化参数的系统和方法 - Google Patents

用于在视频编码中导出视频块的量化参数的系统和方法 Download PDF

Info

Publication number
CN114026858A
CN114026858A CN202080045134.9A CN202080045134A CN114026858A CN 114026858 A CN114026858 A CN 114026858A CN 202080045134 A CN202080045134 A CN 202080045134A CN 114026858 A CN114026858 A CN 114026858A
Authority
CN
China
Prior art keywords
quantization parameter
syntax element
value
video
equal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080045134.9A
Other languages
English (en)
Inventor
法兰克·博森
克里斯托弗·安德鲁·塞格尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of CN114026858A publication Critical patent/CN114026858A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本公开涉及视频编码,并且更具体地涉及用于导出量化参数的技术。在一个示例中,一种对视频数据进行解码的方法包括:解码指定用于描述参数集中的量化参数映射表的点数的语法元素;解码该参数集中的量化参数映射表语法元素;以及解码该参数集中的增量量化参数减一语法元素和增量量化参数语法元素,其中:第一枢轴被设置为该量化参数映射表语法元素加26的值,第二枢轴被设置为该第一枢轴的值与该增量量化参数减一语法元素加一的值的总和,并且通过使用该第二枢轴、指定用于描述该量化参数映射表的点数的该语法元素和该增量量化参数语法元素来导出该量化参数映射表。

Description

用于在视频编码中导出视频块的量化参数的系统和方法
技术领域
本公开涉及视频编码,并且更具体地涉及用于导出量化参数的技术。
背景技术
数字视频功能可以结合到各种设备中,包括数字电视、笔记本电脑或台式电脑、平板电脑、数字录音设备、数字媒体播放器、视频游戏设备、蜂窝电话(包括所谓的智能电话)、医学成像设备等。可以根据视频编码标准对数字视频进行编码。视频编码标准定义了封装编码视频数据的兼容比特流的格式。兼容比特流是可以由视频解码设备接收和解码以生成重构视频数据的数据结构。视频编码标准可以结合视频压缩技术。视频编码标准的示例包括ISO/IEC MPEG-4Visual和ITU-T H.264(也被称为ISO/IEC MPEG-4AVC)和高效视频编码(HEVC)。HEVC在2016年12月的ITU-T H.265建议书的高效视频编码(HEVC)中有所描述,该文献以引用方式并入本文,并且在本文中被称为ITU-T H.265。目前正在考虑对ITU-T H.265进行扩展和改进以开发下一代视频编码标准。例如,ITU-T视频编码专家组(VCEG)和ISO/IEC活动图像专家组(MPEG)(被统称为联合视频研究组(JVET))正在致力于标准化压缩能力显著超过当前HEVC标准的视频编码技术。以引用方式并入本文的联合探索模型7(JEM 7)、联合探索测试模型7(JEM 7)的算法描述、ISO/IEC JTC1/SC29/WG11文档:JVET-G1001(2017年7月,意大利,都灵)描述了由JVET在联合测试模型研究下的编码特征,该技术是超越ITU-T H.265功能的潜在增强视频编码技术。应当指出的是,JEM 7的编码特征在JEM参考软件中实现。如本文所用,术语JEM可统称包括在JEM 7中的算法以及JEM参考软件的具体实施。此外,响应于由VCEG和MPEG联合发布的“Joint Call for Proposals on Video Compressionwith Capabilities beyond HEVC”,在2018年4月16日至20日于加利福尼亚州圣地亚哥(San Diego,CA)举行的ISO/IEC JTC1/SC29/WG11第10次会议上,各个小组提出了对视频编码工具的多种描述。根据对视频编码工具的多种描述,视频编码规范的最终初始草案文本在2018年4月16日至20日于加利福尼亚州圣地亚哥举行的ISO/IEC JTC1/SC29/WG11第10次会议中的“Versatile Video Coding(Draft 1)”即文档JVET-J1001-v2中有所描述,该文档以引用方式并入本文并且被称为JVET-J1001。VCEG和MPEG的下一代视频编码标准的当前开发被称为通用视频编码(VVC)项目。2019年3月19日至27日在瑞士日内瓦(Geneva,CH)举行的ISO/IEC JTC1/SC29/WG11第14次会议中的“Versatile Video Coding(Draft 5)”(文档JVET-N1001-v8,其以引用方式并入本文,并且称为JVET-N1001)表示对应于VVC项目的视频编码规范的草稿文本的当前迭代。
视频压缩技术能够减少存储和传输视频数据的数据需求。视频压缩技术可以通过利用视频序列中固有的冗余来减少数据需求。视频压缩技术可将视频序列再分成连续较小的部分(即,视频序列内的一组图片、一组图片内的图片、图片内的区域、区域内的子区域等)。可以使用帧内预测编码技术(例如,图片内的空间预测技术)和帧间预测技术(即图片间的技术(时间))来生成待编码的单位视频数据与视频数据的参考单元之间的差值。该差值可以被称为残差数据。残差数据可以被编码为量化变换系数。语法元素可以涉及残差数据和参考编码单元(例如,帧内预测模式索引和运动信息)。可以对残差数据和语法元素进行熵编码。熵编码的残差数据和语法元素可以包括在形成兼容比特流的数据结构中。
发明内容
在一个示例中,一种对视频数据进行解码的方法,该方法包括:解码指定用于描述参数集中的量化参数映射表的点数的语法元素;解码该参数集中的量化参数映射表语法元素;以及解码该参数集中的增量量化参数减一语法元素和增量量化参数语法元素,其中:第一枢轴被设置为该量化参数映射表语法元素加26的值,第二枢轴被设置为该第一枢轴的值与该增量量化参数减一语法元素加一的值的总和,并且通过使用该第二枢轴、指定用于描述该量化参数映射表的点数的该语法元素和该增量量化参数语法元素来导出该量化参数映射表。
在一个示例中,一种对视频数据进行编码的方法,该方法包括:编码指定用于描述参数集中的量化参数映射表的点数的语法元素;编码该参数集中的量化参数映射表语法元素;以及编码该参数集中的增量量化参数减一语法元素和增量量化参数语法元素,其中:第一枢轴被设置为该量化参数映射表语法元素加26的值,第二枢轴被设置为该第一枢轴的值与该增量量化参数减一语法元素加一的值的总和,并且通过使用该第二枢轴、指定用于描述该量化参数映射表的点数的该语法元素和该增量量化参数语法元素来导出该量化参数映射表。
在一个示例中,一种用于对编码数据进行解码的设备,该设备包括:处理器,和与该处理器相关联的存储器;其中该处理器被配置为执行以下步骤:解码指定用于描述参数集中的量化参数映射表的点数的语法元素;解码该参数集中的量化参数映射表语法元素;以及解码该参数集中的增量量化参数减一语法元素和增量量化参数语法元素,其中:第一枢轴被设置为该量化参数映射表语法元素加26的值,第二枢轴被设置为该第一枢轴的值与该增量量化参数减一语法元素加一的值的总和,并且通过使用该第二枢轴、指定用于描述该量化参数映射表的点数的该语法元素和该增量量化参数语法元素来导出该量化参数映射表。
在一个示例中,一种用于对视频数据进行编码的设备,该设备包括:处理器,和与该处理器相关联的存储器;其中该处理器被配置为执行以下步骤:编码指定用于描述参数集中的量化参数映射表的点数的语法元素;编码该参数集中的量化参数映射表语法元素;以及编码该参数集中的增量量化参数减一语法元素和增量量化参数语法元素,其中:第一枢轴被设置为该量化参数映射表语法元素加26的值,第二枢轴被设置为该第一枢轴的值与该增量量化参数减一语法元素加一的值的总和,并且通过使用该第二枢轴、指定用于描述该量化参数映射表的点数的该语法元素和该增量量化参数语法元素来导出该量化参数映射表。
附图说明
[图1]图1是示出根据本公开的一种或多种技术的根据四叉树多叉树划分进行编码的一组图片的示例的概念图。
[图2A]图2A是示出根据本公开的一种或多种技术的对视频数据块进行编码的示例的概念图。
[图2B]图2B是示出根据本公开的一种或多种技术的对视频数据块进行编码的示例的概念图。
[图3]图3是示出根据本公开的一种或多种技术的可使用的视频分量采样格式的示例的概念图。
[图4]图4是示出根据本公开的一种或多种技术封装编码视频数据和对应元数据的数据结构的概念图。
[图5]图5是示出根据本公开的一种或多种技术的可被配置为对视频数据进行编码和解码的系统的示例的框图。
[图6]图6是示出根据本公开的一种或多种技术的可被配置为对视频数据进行编码的视频编码器的示例的框图。
[图7]图7是示出根据本公开的一种或多种技术的可被配置为对视频数据进行解码的视频解码器的示例的框图。
具体实施方式
一般来讲,本公开描述了用于对视频数据进行编码的各种技术。具体地讲,本公开描述了用于导出量化参数的技术。应当指出的是,尽管本公开的技术是关于ITU-T H.264、ITU-T H.265、JEM和JVET-N1001描述的,但本公开的技术可普遍应用于视频编码。例如,除了包括在ITU-TH.265、JEM和JVET-N1001中的那些技术,本文所述的编码技术可并入视频编码系统(包括基于未来视频编码标准的视频编码系统),包括视频块结构、帧内预测技术、帧间预测技术、变换技术、滤波技术和/或其他熵编码技术。因此,对ITU-T H.264、ITU-TH.265、JEM和/或JVET-N1001的参考是出于描述性目的,并且不应被解释为限制本文所述技术的范围。此外,应当指出的是,将文献以引用方式并入本文是出于描述性目的,并且不应被解释为限制或产生关于本文所用术语的歧义。例如,在某个并入的参考文献中提供的对某个术语的定义不同于另一个并入的参考文献和/或如本文所用的该术语的情况下,则该术语应以广泛地包括每个相应定义的方式和/或以包括替代方案中每个特定定义的方式来解释。
在一个示例中,对视频数据进行编码的方法包括:至少部分地基于分段线性函数来确定当前视频块的色度分量的量化参数,以及基于所确定的量化参数来执行量化。
在一个示例中,用于对视频数据进行编码的设备包括一个或多个处理器,该一个或多个处理器被配置为:至少部分地基于分段线性函数来确定当前视频块的色度分量的量化参数,并且基于所确定的量化参数来执行量化。
在一个示例中,非暂态计算机可读存储介质包括存储在其上的指令,这些指令在被执行时使得设备的一个或多个处理器:至少部分地基于分段线性函数来确定当前视频块的色度分量的量化参数,并且基于所确定的量化参数来执行量化。
在一个示例中,装置包括:用于至少部分地基于分段线性函数来确定当前视频块的色度分量的量化参数的装置,以及用于基于所确定的量化参数来执行量化的装置。
在以下附图和描述中阐述了一个或多个示例的细节。根据描述和附图以及权利要求书,其他特征、对象和优点将显而易见。
视频内容包括由一系列帧(或图片)组成的视频序列。一系列帧也可以被称为一组图片(GOP)。每个视频帧或图片可被分成一个或多个区域。可根据基础单元(例如,视频块)和限定区域的规则集来限定区域。例如,限定区域的规则可以是区域必须是布置成矩形的整数个视频块。此外,区域中的视频块可以根据扫描模式(例如,光栅扫描)来排序。如本文所用,术语“视频块”通常可以指图片的区域,或者可以更具体地指可以被预测性地编码的样本值的最大阵列、其子分区和/或对应结构。此外,术语“当前视频块”可以指图片的正被编码或解码的区域。视频块可被定义为样本值的阵列。应当指出的是,在一些情况下,像素值可被描述为包括视频数据的相应分量的样本值,其也可被称为颜色分量(例如,亮度(Y)和色度(Cb和Cr)分量或红色、绿色和蓝色分量)。应当指出的是,在一些情况下,术语“像素值”和“样本值”可互换使用。此外,在一些情况下,像素或样本可被称为pel。视频采样格式(也可以被称为色度格式)可以相对于视频块中包括的亮度样本的数量来定义视频块中包括的色度样本的数量。例如,对于4:2:0采样格式,亮度分量的采样率是水平和垂直两个方向的色度分量的采样率的两倍。
视频编码器可对视频块和其子分区执行预测编码。视频块和其子分区可以被称为节点。ITU-T H.264指定包括16×16亮度样本的宏块。也就是说,在ITU-T H.264中,图片被分段成宏块。ITU-T H.265指定了类似的编码树单元(CTU)结构(其可被称为最大编码单元(LCU))。在ITU-T H.265中,图片被分段成CTU。在ITU-T H.265中,对于图片,CTU大小可被设置为包括16×16、32×32或64×64亮度样本。在ITU-T H.265中,CTU由视频数据的每个分量(例如,亮度(Y)和色度(Cb和Cr))的相应编码树块(CTB)构成。应当指出的是,具有一个亮度分量和两个对应色度分量的视频可被描述为具有两个通道,即,亮度通道和色度通道。此外,在ITU-T H.265中,可根据四叉树(QT)划分结构来划分CTU,这使得CTU的CTB被划分为编码块(CB)。也就是说,在ITU-T H.265中,CTU可被划分为四叉树叶节点。根据ITU-T H.265,一个亮度CB连同两个对应的色度CB和相关联语法元素被称为编码单元(CU)。在ITU-TH.265中,可以发送信号通知CB的最小允许大小。在ITU-T H.265中,亮度CB的最小允许最小大小是8×8亮度样本。在ITU-T H.265中,使用帧内预测或帧间预测对图片区域进行编码的决定在CU位阶处进行。
在ITU-T H.265中,CU与在CU处具有其根的预测单元(PU)结构相关联。在ITU-TH.265中,PU结构允许分割亮度CB和色度CB以生成对应的参考样本。也就是说,在ITU-TH.265中,可将亮度CB和色度CB分割成相应的亮度预测块和色度预测块(PB),其中PB包括对其应用相同预测的样本值的块。在ITU-T H.265中,可将CB划分为1个、2个或4个PB。ITU-TH.265支持从64×64样本向下至4×4样本的PB大小。在ITU-T H.265中,正方形PB被支持用于帧内预测,其中CB可以形成PB或者CB可以被分割成四个正方形PB。在ITU-T H.265中,除了正方形PB之外,还支持矩形PB来进行帧间预测,其中CB可垂直地或水平地减半以形成PB。此外,应当指出的是,在ITU-T H.265中,对于帧间预测,支持四个非对称PB划分,其中CB在CB的高度(顶部或底部)或宽度(左侧或右侧)的四分之一处被划分为两个PB。对应于PB的帧内预测数据(例如,帧内预测模式语法元素)或帧间预测数据(例如,运动数据语法元素)用于生成PB的参考和/或预测样本值。
JEM指定具有最大大小的256×256亮度样本的CTU。JEM指定四叉树加二叉树(QTBT)块结构。在JEM中,QTBT结构允许由二叉树(BT)结构进一步划分四叉树叶节点。也就是说,在JEM中,二叉树结构允许将四叉树叶节点垂直或水平递归划分。在JVET-N1001中,根据四叉树加多类型树(QTMT或QT+MTT)结构来划分CTU。JVET-N1001中的QTMT类似于JEM中的QTBT。然而,在JVET-N1001中,除了指示二进制分割之外,多类型树还可以指示所谓的三元(或三叉树(TT))分割。三元分割将一个块垂直地或水平地分成三个块。在垂直TT分割的情况下,块从左边缘起在其宽度的四分之一处以及从右边缘起在其宽度的四分之一处分割,并且在水平TT分割的情况下,块从顶部边缘起在其高度的四分之一处以及从底部边缘起在其高度的四分之一处分割。再次参考图1,图1示出了CTU被划分为四叉树叶节点并且四叉树叶节点根据BT分割或TT分割被进一步划分的示例。也就是说,在图1中,虚线指示四叉树中的附加二元和三元分割。
如上所述,每个视频帧或图片可被分成一个或多个区域。例如,根据ITU-T H.265,每个视频帧或图片可被划分为包括一个或多个切片,并且进一步被划分为包括一个或多个图块,其中每个切片包括CTU序列(例如,以光栅扫描顺序排列),并且其中图块是对应于图片的矩形区域的CTU序列。应当指出的是,在ITU-T H.265中,切片是从独立切片片段开始并且包含在下一个独立切片片段(如果有的话)之前的所有后续从属切片片段(如果有的话)的一个或多个切片片段的序列。切片片段(如切片)是CTU序列。因此,在一些情况下,术语“切片”和“切片片段”可互换使用以指示以光栅扫描顺序排列布置的CTU序列。此外,应当指出的是,在ITU-T H.265中,图块可由包含在多于一个切片中的CTU组成,并且切片可由包含在多于一个图块中的CTU组成。然而,ITU-T H.265规定了应满足以下一个或两个条件:(1)切片中的所有CTU属于同一个图块;以及(2)图块中的所有CTU属于同一个切片。
关于JVET-N1001,切片需要由整数个砖块组成,而不是仅需要由整数个CTU组成。在JVET-N1001中,砖块是图片中特定图块内的矩形CTU行区域。此外,在JVET-N1001中,图块可被划分成多个砖块,每个砖块由图块内的一个或多个CTU行组成。未被划分成多个砖块的图块也被称为砖块。然而,作为图块的真子集的砖块不被称为图块。因此,在一些视频编码技术中,可支持或可不支持包括不形成图片的矩形区域的一组CTU的切片。此外,应当指出的是,在一些情况下,切片可能需要由整数个完整图块组成,并且在这种情况下,切片被称为图块组。本文所述的技术可适用于砖块、切片、图块和/或图块组。图1是示出包括切片的图片组的示例的概念图。在图1所示的示例中,Pic3被示出为包括两个切片(即,切片0和切片1)。在图1所示的示例中,切片0包括一个砖块,即砖块0,并且切片1包括两个砖块,即砖块1和砖块2。应当指出的是,在一些情况下,切片0和切片1可满足图块和/或图块组的要求并被分类为图块和/或图块组。
视频采样格式(也可以被称为色度格式)可以相对于CU中包括的亮度样本的数量来定义CU中包括的色度样本的数量。例如,对于4:2:0采样格式,亮度分量的采样率是水平和垂直两个方向的色度分量的采样率的两倍。因此,对于根据4:2:0格式格式化的CU,用于亮度分量的样本阵列的宽度和高度是用于色度分量的每个样本阵列的宽度和高度的两倍。图3是示出根据4:2:0样本格式格式化的编码单元的示例的概念图。图3示出了色度样本相对于CU内的亮度样本的相对位置。如上所述,通常根据水平和垂直亮度样本的数量来定义CU。因此,如图3所示,根据4:2:0样本格式格式化的16×16CU包括亮度分量的16×16样本和用于每个色度分量的8×8样本。此外,在图3所示的示例中,示出了16×16CU的相邻视频块的色度样本相对于亮度样本的相对位置。对于根据4:2:2格式格式化的CU,亮度分量的样本阵列的宽度是每个色度分量的样本阵列的宽度的两倍,但是亮度分量的样本阵列的高度等于每个色度分量的样本阵列的高度。此外,对于根据4:4:4格式格式化的CU,亮度分量的样本阵列具有与每个色度分量的样本阵列相同的宽度和高度。
对于帧内预测编码,帧内预测模式可指定图片内的参考样本的位置。在ITU-TH.265中,已定义的可能的帧内预测模式包括平面(即,表面拟合)预测模式、DC(即平坦的整体平均)预测模式,以及33个角度预测模式(predMode:2-34)。在JEM中,已定义的可能的帧内预测模式包括平面预测模式、DC预测模式,以及65个角度预测模式。应当指出的是,平面预测模式和DC预测模式可以被称为无方向预测模式,并且角度预测模式可以被称为方向预测模式。应当指出的是,无论已定义的可能预测模式的数量如何,本文描述的技术可以是普遍适用的。
对于帧间预测编码,确定参考图片,并且运动矢量(MV)识别该参考图片中用于生成对当前视频块的预测的样本。例如,可使用位于一个或多个先前编码的图片中的参考样本值来预测当前视频块,并且运动矢量用于指示参考块相对于当前视频块的位置。运动矢量可描述例如运动矢量的水平位移分量(即MVx)、运动矢量的垂直位移分量(即MVy)和运动矢量的分辨率(例如,四分之一像素精度、二分之一像素精度、一像素精度、二像素精度、四像素精度)。先前解码的图片(其可包括在当前图片之前或之后输出的图片)可被组织成一个或多个参考图片列表,并且使用参考图片索引值来标识。此外,在帧间预测编码中,单预测是指使用来自单个参考图片的样本值生成预测,双预测是指使用来自两个参考图片的相应样本值生成预测。也就是说,在单预测中,单个参考图片和对应的运动矢量用于生成对当前视频块的预测,而在双预测中,第一参考图片和对应的第一运动矢量以及第二参考图片和对应的第二运动矢量用于生成对当前视频块的预测。在双预测中,将相应的样本值组合(例如,相加、舍入和裁剪,或根据权重进行平均)以生成预测。图片及其区域可基于哪些类型的预测模式可用于对其视频块进行编码而被分类。也就是说,对于具有B类型的区域(例如,B切片),可利用双预测、单预测和帧内预测模式,对于具有P类型的区域(例如,P切片),可利用单预测和帧内预测模式,对于具有I类型的区域(例如,I切片),只能利用帧内预测模式。如上所述,通过参考索引来识别参考图片。例如,对于P切片,可以存在单个参考图片列表RefPicList0,并且对于B切片,除了RefPicList0之外,可以存在第二独立参考图片列表RefPicList1。应当指出的是,对于B切片中的单预测,可使用RefPicList0或RefPicList1中的一者来生成预测。此外,应当指出的是,在解码过程期间,在开始对图片进行解码时,从存储在解码图片缓冲器(DPB)中的先前解码的图片生成参考图片列表。
此外,编码标准可支持各种运动矢量预测模式。运动矢量预测使能够基于另一运动矢量来导出用于当前视频块的运动矢量的值。例如,可以从当前视频块的空间相邻块和时间相邻块导出具有相关联的运动信息的一组候选块。此外,所生成的(或默认的)运动信息可用于运动矢量预测。运动矢量预测的示例包括高级运动矢量预测(AMVP)、时间运动矢量预测(TMVP)、所谓的“合并”模式,以及“跳过”和“直接”运动推理。此外,运动矢量预测的其他示例包括高级时间运动矢量预测(ATMVP)和空间-时间运动矢量预测(STMVP)。对于运动矢量预测,视频编码器和视频解码器两者执行相同的过程以导出一组候选。因此,对于当前视频块,在编码和解码期间生成相同的一组候选。
如上所述,对于帧间预测编码,先前编码的图片中的参考样本用于对当前图片中的视频块进行编码。在对当前图片进行编码时可用作参考的先前编码的图片被称为参考图片。应当指出的是,解码顺序不一定对应于图片输出顺序,即视频序列中图片的时间顺序。在ITU-T H.265中,当图片被解码时,其被存储到解码图片缓冲器(DPB)(其可被称为帧缓冲器、参考缓冲器、参考图片缓冲器等)。在ITU-T H.265中,存储到DPB的图片在被输出时从DPB中移除,并且不再需要用于编码后续图片。在ITU-T H.265中,在对切片标头进行解码之后,即,在对图片进行解码开始时,每个图片调用一次是否应从DPB中移除图片的确定。例如,参考图1,Pic3被示出为参考Pic2。类似地,Pic4被示出为参考Pic1。关于图1,假设图片数量对应于解码顺序,DPB将填充如下:在解码Pic1之后,DPB将包括{Pic1};在解码Pic2开始时,DPB将包括{Pic1};在解码Pic2之后,DPB将包括{Pic1,Pic2};在解码Pic3开始时,DPB将包括{Pic1,Pic2}。然后,将参考Pic2解码Pic3,并且在解码Pic3之后,DPB将包括{Pic1,Pic2,Pic3}。在解码Pic4开始时,图片Pic2和Pic3将被标记以从DPB中移除,因为它们不是解码Pic4(或任何后续图片,未示出)所需的,并且假设Pic2和Pic3已被输出,则DPB将被更新以包括{Pic1}。然后将使用参考Pic1对Pic4进行解码。标记图片以将其从DPB中移除的过程可以称为参考图片集(RPS)管理。
如上所述,帧内预测数据或帧间预测数据用于产生样本值的块的参考样本值。包括在当前PB或另一类型的图片区域结构和相关联的参考样本(例如,使用预测生成的那些)中的样本值之间的差可以被称为残差数据。残差数据可以包括对应于视频数据的每个分量的相应差值阵列。残差数据可能在像素域中。可对差值阵列应用变换诸如离散余弦变换(DCT)、离散正弦变换(DST)、整数变换、小波变换或概念上类似的变换,以生成变换系数。应当指出的是,在ITU-T H.265和JVET-N1001中,CU与在CU位阶处具有其根的变换单元(TU)结构相关联。也就是说,为了生成变换系数,可以对差值的阵列进行划分(例如,可以将四个8×8变换应用于16×16残差值阵列)。对于视频数据的每个分量,差值的此类再分可被称为变换块(TB)。应当指出的是,在一些情况下,可以(在视频编码器中)应用核心变换和后续二次变换来生成变换系数。对于视频解码器,变换的顺序是相反的。
可以直接对变换系数或残差样本值执行量化过程(例如,就调色板编码量化而言)。量化通过限制为一组指定值的振幅来近似变换系数。量化实质上对变换系数进行缩放以便改变表示一组变换系数所需的数据量。量化可以包括将变换系数(或将偏移值添加到变换系数得到的值)除以量化缩放因子和任何相关联的取整函数(例如,取整为最接近的整数)。量化的变换系数可以被称为系数位阶值。逆量化(或“去量化”)可以包括将系数位阶值与量化缩放因子相乘,以及任何倒数取整或偏移加法运算。应当指出的是,如本文所用,术语量化过程在一些情况下可指除以缩放因子以生成位阶值,并且在一些情况下可指乘以缩放因子以恢复变换系数。也就是说,量化过程在一些情况下可以指量化,而在一些情况下可以指逆量化。此外,应当指出的是,虽然在下面的示例中的一些示例中关于与十进制记数法相关的算术运算描述了量化过程,但是这样的描述是为了说明的目的,并且不应该被解释为进行限制。例如,本文描述的技术可以在使用二进制运算等的设备中实现。例如,本文描述的乘法和除法运算可以使用移位运算等来实现。
可根据熵编码技术对量化的变换系数和语法元素(例如,指示视频块的编码结构的语法元素)进行熵编码。熵编码过程包括使用无损数据压缩算法对语法元素值进行编码。熵编码技术的示例包括内容自适应可变长度编码(CAVLC)、上下文自适应二进制算术编码(CABAC)、概率区间划分熵编码(PIPE)等。熵编码的量化变换系数和对应的熵编码的语法元素可形成可用于在视频解码器处再现视频数据的兼容比特流。熵编码过程,例如CABAC,可以包括对语法元素进行二值化。二值化是指将语法元素的值转换为一个或多个位的序列的过程。这些位可以被称为“bin”。二值化可以包括以下编码技术中的一种或组合:固定长度编码、一元编码、截断一元编码、截断Rice编码、Golomb编码、k阶指数Golomb编码和Golomb-Rice编码。例如,二值化可以包括使用8位固定长度二值化技术将语法元素的整数值5表示为00000101,或者使用一元编码二值化技术将整数值5表示为11110。如本文所用,术语固定长度编码、一元编码、截断一元编码、截断Rice编码、Golomb编码、k阶指数Golomb编码和Golomb-Rice编码中的每一个可以指这些技术的一般实现和/或这些编码技术的更具体实现。例如,可以根据视频编码标准具体地定义Golomb-Rice编码实现。在CABAC的示例中,对于特定bin,上下文提供bin的最大概率状态(MPS)值(即,bin的MPS为0或1中的一者),以及bin是MPS或最小概率状态(LPS)的概率值。例如,上下文可以指示bin的MPS为0,并且bin为1的概率为0.3。应当指出的是,可以基于包括当前语法元素和先前编码的语法元素中的bin的先前编码的bin的值来确定上下文。例如,与相邻视频块相关联的语法元素的值可以用于确定当前bin的上下文。
关于本文所用的公式,可以使用以下算术运算符:
+ 加法
- 减法
* 乘法,包括矩阵乘法
xy 求幂。将x指定为y的幂。在其他上下文中,此类符号用于上标而非旨在用于解释为求幂。
/ 将结果向着零截断的整数除法。例如,将7/4和-7/-4截断为1,将-7/4和7/-4截断为-1。
÷ 在不旨在进行截断或舍入情况下用于表示数学公式中的除法。
Figure BDA0003420623800000121
在不旨在进行截断或舍入情况下用于表示数学公式中的除法。
x%y 模量。x除以y的余数,仅针对x>=0且y>0的整数x和y定义。
此外,可以使用以下逻辑运算符:
x&&y x和y的布尔逻辑“和”
x||y x和y的布尔逻辑“或”
!布尔逻辑“否”
X?y:z如果x为TRUE或不等于0,则求值为y;否则,求值为z。
此外,可应用以下关系运算符:
>大于
>=大于或等于
<小于
<=小于或等于
==等于
!=不等于
此外,可以使用以下逐位运算符:
& 逐位“与”。当对整型变量进行运算时,对整数值的二进制补码表示进行运算。当对包含比另一变量更少位的二进制变量进行运算时,通过添加等于0的更多有效位来扩展较短变量。
| 逐位“或”。当对整型变量进行运算时,对整数值的二进制补码表示进行运算。当对包含比另一变量更少位的二进制变量进行运算时,通过添加等于0的更多有效位来扩展较短变量。
^ 逐位“异或”。当对整型变量进行运算时,对整数值的二进制补码表示进行运算。当对包含比另一变量更少位的二进制变量进行运算时,通过添加等于0的更多有效位来扩展较短变量。
x>>y x乘y二进制数字的二进制补码整数表示的算术右移。该函数仅针对y的非负整数值来定义。由于右移而移位到最高有效位(MSB)中的位具有等于移位操作之前的x的MSB的值。
x<<y x乘y二进制数字的二进制补码整数表示的算术左移。该函数仅针对y的非负整数值来定义。由于左移而移位到最低有效位(LSB)中的位具有等于0的值。
此外,可以使用以下赋值运算符:
=赋值运算符
++递增,即,x++等同于x=x+1;当在阵列索引中使用时,在递增操作之前评估变量的值。
--递减,即,x-等同于x=x-1;当在阵列索引中使用时,在递减操作之前评估变量的值。
+=按指定量递增,即x+=3等同于x=x+3,并且x+=(-3)等同于x=x+(-3)。
-=按指定量递减,即x-=3等同于x=x-3,并且x-=(-3)等同于x=x-(-3)。
此外,可使用以下定义的数学函数:
Figure BDA0003420623800000141
Ceil(x)大于或等于x的最小整数。
Floor(x),小于或等于x的最大整数。
Log2(x)x的以2为底的对数。
Figure BDA0003420623800000142
Figure BDA0003420623800000143
此外,应当指出的是,在本文所用的语法描述符中,可以应用以下描述符:
-b(8):具有任何位串模式的字节(8位)。该描述符的解析过程由函数read_bit(8)的返回值指定。
-f(n):从最左位起使用n位(从左到右)写入的固定模式位串。该描述符的解析过程由函数read_bit(n)的返回值指定。
-se(v):有符号整数0阶Exp-Golomb编码的语法元素,从最左位起。
-tb(v):使用至多maxVal位的截断二元码,其中maxVal在语法元素的语义中定义。
-tu(v):使用至多maxVal位的截断一元码,其中maxVal在语法元素的语义中定义。
-u(n):使用n位的无符号整数。当语法表中n是“v”时,位数以取决于其他语法元素的值的方式变化。该描述符的解析过程由函数read_bits(n)的返回值指定,该返回值被解释为首先写入最高有效位的无符号整数的二进制表示。
-ue(v):无符号整数0阶Exp-Golomb编码的语法元素,从最左位起。
read_bits(n)从比特流中读取后续n位,并使比特流指针前进n位的位置。当n等于0时,read_bits(n)被指定为返回等于0的值,且不使比特流指针前进。
图2A至图2B是示出对视频数据块进行编码的示例的概念图。如图2A所示,通过从当前视频数据块中减去一组预测值生成残差、对残差执行变换并且将变换系数量化来生成位阶值,对视频数据的当前块(例如,对应于视频分量的CB)进行编码。位阶值被编码成比特流。如图2B中所示,通过对位阶值执行逆量化,执行逆变换,并且将一组预测值加上所得残差来对当前视频数据块进行解码。应当指出的是,在图2A至图2B的示例中,重构块的样本值不同于被编码的当前视频块的样本值。这样,编码可被认为是有损的。然而,样本值的差值可被认为是重构视频的观看者可接受的或不可察觉的。
另外,如图2A至图2B所示,使用缩放因子阵列生成系数位阶值。在ITU-T H.265中,通过选择缩放矩阵并将缩放矩阵中的每个条目乘以量化缩放因子来生成缩放因子阵列。在ITU-T H.265中,部分地基于预测模式和颜色分量来选择缩放矩阵,其中定义了以下大小的缩放矩阵:4×4、8×8、16×16和32×32。应当指出的是,在一些示例中,缩放矩阵可以为每个条目提供相同的值(即,根据单个值缩放所有系数)。可以由量化参数QP确定量化缩放因子的值。在ITU-T H.265中,对于8位的位深度,QP可以取0至51的52个值,QP变化1通常对应于量化缩放因子的值变化约12%。应当指出的是,更一般地,在ITU-T H.265中,源极位深度的QP值的有效范围是:-6*(位深度-8)至+51(包括端值)。因此,例如,在位深度为10位的情况下,QP可以取从-12至51的64个值,这些值可以在去量化期间被映射到值0至63。
此外,在ITU-T H.265中,可以使用预测量化参数值(可以被称为预测QP值或QP预测值)和可选地发送信号通知的量化参数增量值(可以被称为QP增量值或增量QP值)来导出一组变换系数的QP值。在ITU-T H.265中,可以针对每个CU更新量化参数,并且可以针对亮度和色度通道中的每一个导出相应量化参数。在ITU-T H.265中,对于当前CU,为CU继承预测QP值(即,在切片位阶处发送信号通知的QP或来自先前CU的QP),并且可以针对CU内的每个TU可选地发送信号通知增量QP值。对于亮度通道,每个亮度TB的QP是预测QP值和任何发送信号通知的增量QP值之和。此外,在ITU-T H.265中,对于当前CU的色度通道,色度QP是针对亮度通道确定的QP和在切片标头中发送信号通知的色度QP偏移和/或发送信号通知图片参数集(PPS)的色度QP偏移的函数。
如上所述,在ITU-T H.265中,对于CU内的每个TU,可任选地发送信号通知增量QP值。具体地讲,在ITU-T H.265中,量化组尺寸用于确定是否可以针对特定TU发送信号通知增量QP。例如,视频编码器可以选择64×64的CTU尺寸和32×32的量化组尺寸。在这种情况下,如果将CTU划分为具有相应的32×32TU的四个32×32CU,则可以针对每个TU发送信号通知增量QP。但是,如果将四个32×32CU进一步划分为更小的TU(例如,8×8、16×16),则仅针对每个32×32CU区域中的第一个8×8TU发送增量QP。需注意,在ITU-T H.265中,针对每个亮度和色度通道,TU结构对准TB。也就是说,在ITU-T H.265中,用于分量(例如,色度分量)的TB直接对应于另一分量的TB。在ITU-T H.265中,在PPS(即,语法元素diff_cu_qp_delta_depth)中发送信号通知差值,以指示亮度CTB尺寸和量化组尺寸之间的差异。例如,如果CTB尺寸是64×64并且量化组尺寸是16×16,则发送信号通知差值(以对数表示法)以指示量化组尺寸。需注意,在ITU-T H.265中,量化组总是方形的。
在ITU-T H.265中,针对x×y阵列中的每个条目定义的去量化过程可以总结如下:
d[x][y]=((TransCoeffLevelfx][y]*m[x][y]*levelScale[qP%6]<<(qP/6))+(1<<(bdShift-1)))>>bdShift
其中
d[x][y]为所得变换系数;
TransCoeffLevel[x][y]为系数位阶值;
m[x][y]为缩放矩阵;
levelScale[k]={40,45,51,57,64,72},其中k=0…5;
qP为量化参数;
bdShift=BitDepth+Log2(nTbS)+10;
BitDepth为对应分量的位深度;并且
nTbS指定对应变换块的大小。
应当指出的是,在一些情况下(例如,对于DCT),d[0][0]处的变换系数可以被称为DC变换系数,并且阵列中的其他变换系数可以被称为AC变换系数。
如上所述,在ITU-T H.265中,对于亮度分量,每个亮度TB的QP是预测QP值和任何发送信号通知的增量QP值之和。具体地讲,对于当前CU,视频解码器可基于从相邻CU的QP值导出的预测来导出亮度QP的值。也就是说,在ITU-T H.265中,亮度QP,Qp'Y,如下导出:
Qp'Y=QPY+QpBdOffsetY
其中
QpY=((qPY_PRED+CuQpDeltaVal+52+2*QpBdOffsetY)%(52+QpBdOffsetY))-QpBdOffsetY
其中
qPY_PRED=(qPY_A+qPY_B+1)>>1;
其中
在大多数情况下,qPY_A被设置为等于当前CU左侧的编码单元的QpY
在大多数情况下,qPY_B被设置为等于当前CU上方的编码单元的QpY
其中
CuQpDeltaVal=cu_qp_delta_abs*(1-2*cu_qp_delta_sign_flag);
其中
cu_qp_delta_abs是有条件地包括在比特流中变换单元位阶处的语法元素,其指定当前编码单元的亮度量化参数和其预测之间的差值CuQpDeltaVal的绝对值。
cu_qp_delta_sign_flag是有条件地包括在比特流中变换单元位阶处的语法元素,其如下指定CuQpDeltaVal的符号:
-如果cu_qp_delta_sign_flag等于0,则对应的CuQpDeltaVal具有正值。
-否则(cu_qp_delta_sign_flag等于1),则对应的CuQpDeltaVal具有负值。
其中
QpBdOffsetY=6*bit_depth_luma_minus8;
其中
bit_depth_luma_minus8是包括在比特流中序列位阶处的语法元素,其指定亮度量化参数范围偏移QpBdOffsetY的值并且应在0至8的范围内(包括端值)。
应当指出的是,在一些情况下,例如,当相邻块不可用时,qPY_A和qPY_B可被设置为等于变量qPY_PREV。在ITU-T H.265中,qPY_PREV是被设置为等于解码顺序中前一个量化组中的最后一个编码单元的QpY,或者被设置为等于基于在比特流中发送信号通知的切片标头处的语法元素slice_qp_delta来确定的SliceQpY,其中
slice_qp_delta指定要用于切片中的编码块的QpY的初始值,直到由编码单元层中的CuQpDeltaVal的值修改。切片的QpY量化参数的初始值SliceQpY如下导出:
SliceQpY=26+init_qp_minus26+slice_qp_delta
SliceQpY的值应在-QpBdOffsetY至+51的范围内(包括端值)。
在JVET-N1001中,量化过程基于在ITU-T H.265中提供的量化过程。也就是说,可以由量化参数QP确定量化缩放因子的值。具体地讲,JVET-N1001提供了量化参数的以下导出过程:
该过程的输入为:
-亮度位置(xCb,yCb),其相对于当前图片的左上亮度样本指定当前编码块的左上亮度样本,
-变量cbWidth,其指定亮度样本中当前编码块的宽度,
-变量cbHeight,其指定亮度样本中当前编码块的高度,
-变量treeType,其指定是使用一元树(SINGLE_TREE)还是二元树来划分CTU,并且当使用二元树时,其指定当前是处理亮度(DUAL_TREE_LUMA)还是色度分量(DUAL_TREE_CHROMA)。
在该过程中,导出亮度量化参数Qp’Y以及色度量化参数Qp'cb和Qp'cr
亮度位置(xQg,yQg)相对于当前图片的左上亮度样本指定当前量化组的左上亮度样本。水平位置xQg和垂直位置yQg分别被设置为等于CuQgTopLeftX和CuQgTopLeftY。
注意:当前量化组是在共享相同qPY_PRED的编码树块内的矩形区域。其宽度和高度等于左上亮度样本位置被分配给变量CuQgTopLeftX和CuQgTopLeftY的编码树节点的宽度和高度。
当treeType等于SINGLE_TREE或DUAL_TREE_LUMA时,通过以下有序步骤导出预测亮度量化参数qPY_PRED
1.变量qPY_PREV如下导出:
-如果以下条件中的一者或多者为真,则将qPY_PREV设置为等于SliceQpY
-当前量化组是切片中的第一量化组。
-当前量化组是砖块中的第一量化组。
-否则,qPY_PREV设置为等于解码顺序中前一个量化组中的最后一个亮度编码单元的亮度量化参数QpY
2.当将位置(xCurr,yCurr)设置为等于(xCb,yCb)并且将相邻位置(xNbY,yNbY)设置为等于(xQg-1,yQg)作为输入时,调用块的可用性导出过程,并且输出分配给可用A。变量qPY_A如下导出:
-如果以下条件中的一者或多者为真,则将qPy_a设置为等于qPY_PREV
-可用A等于假。
-包含覆盖亮度位置(xQg-1,yQg)的亮度编码块的CTB的CTB地址ctbAddrA不等于CtbAddrInBs,其中ctbAddrA如下导出:
xTmp=(xQg-1)>>MinTbLog2SizeY
yTmp=yQg>>MinTbLog2SizeY
minTbAddrA=MinTbAddrZs[xTmp][yTmp]
ctbAddrA=minTbAddrA>>(2*(CtbLog2SizeY-MinTbLog2SizeY))
-否则,qPY_a被设置为等于包含覆盖(xQg-1,yQg)的亮度编码块的编码单元的亮度量化参数Qpy。
3.当将位置(xCurr,yCurr)设置为等于(xCb,yCb)并且将相邻位置(xNbY,yNbY)设置为等于(xQg,yQg-1)作为输入时,调用所指定的块的可用性导出过程,并且输出分配给可用B。变量qPY_B如下导出:
-如果以下条件中的一者或多者为真,则将qPY_b设置为等于qPY_PREV
-可用B等于假。
-包含覆盖亮度位置(xQg,yQg-1)的亮度编码块的CTB的CTB地址ctbAddrB不等于CtbAddrInBs,其中ctbAddrB如下导出:
xTmp=xQg>>MinTbLog2SizeY
yTmp=(yQg-1)>>MinTbLog2SizeY
minTbAddrB-MinTbAddrZs[xTmp][yTmp]
ctbAddrB=minTbAddrB>>(2*(CtbLog2SizeY-MinTbLog2SizeY))
-否则,qPY_b被设置为等于包含覆盖(xQg,yQg-1)的亮度编码块的编码单元的亮度量化参数QpY
4.预测亮度量化参数qPY_PRED如下导出:
-如果以下所有条件都为真,则qPY_PRED被设置为等于包含覆盖(xQg,yQg-1)的亮度编码块的编码单元的亮度量化参数QpY
-可用B等于真。
-当前量化组是图块内的CTB行中的第一量化组
-否则,qPY_PRED如下导出:
qPY_PRED=(qPY_A+qPY_B+1)>>1
变量QpY如下导出:
Qpy=
((qPY_PRED+CuQpDeltaVal+64+2*QpBdOffsetY)%(64+QpBdOffsetY))–QpBdOffsetY
亮度量化参数QpV如下导出:
Qp’Y=QpY+QpBdOffsetY
当ChromaArrayType不等于0并且treeType等于SINGLE_TREE或DUAL_TREE_CHROMA时,以下适用:
-当treeType等于DUAL_TREE_CHROMA时,变量QpY被设置为等于覆盖亮度位置(xCb+cbWidth/2,yCb+cbHeight/12)的亮度编码单元的亮度量化参数Qpy。
-变量qPCb、qPCr和qPCbCr如下导出:
Qp’Cb=Clip3(-QpBdOffsetC,69,QpY+pps_cb_qp_offset+slice_cb_qp_offset)
Qp’CR=Clip3(-QpBdOffsetC,69,QpY+pps_cr_qp_offset+slice_cr_qp_offset)
Qp’CBCR=Clip3(-QpBdOffsetC,69,QpY+pps_joint_cbcr_qp_offset+sliceJoint_cbcr_qp_offset)
-如果ChromaArrayType等于1,则基于索引qPi分别等于qPcb、qP&和qPeber,将变量qPcb、qPcr和qPcbCr设置为等于表1中指定的Qpc的值。
-否则,基于索引qPi分别等于qPCb、qPCr和qPCbCr,将变量qPCb、qPCr和qPCbCr设置为等于Min(qPi,63)。
-Cb和Cr分量的色度量化参数Qp'Cb和Qp'Cr,以及Cb-Cr联合编码Qp'CbCr如下导出:
Qp’Cb=qPCb+QpBdOffsetC
Qp’Cr=qPCr+QpBdOffsetC
Qp’CbCr=qPCbCr+QpBdOffsetC
qPi <30 30 31 32 33 34 35 36 37 38 39 40 41 42 43 >43
Qp<sub>C</sub> =qPi 29 30 31 32 33 33 34 34 35 35 36 36 37 37 =qPi-6
表1
其中,变量SliceQpY、QpBdOffsetY和QpBdOffsetC基于JVET-N1001中提供的以下语义来确定:
init_qp_minus26加26指定引用PPS的每个切片的SliceQpY的初始值。当slice_qp_delta被解码为非零值时,在切片层修改SliceQpY的初始值。init_qp_minus26的值应在-(26+QpBdOffsetY)至+37的范围内(包括端值)。
bit_depth_luma_minus8如下指定亮度阵列BitDepthy的样本的位深度和亮度量化参数范围偏移QpBdOffsetY的值:
BitDepthY=8+bit_depth_luma_minus8
QpBdOffsetY=6*bit_depth_luma_minus8
bit_depth_luma_minus8应在0至8的范围内(包括端值)。
bit_depth_chroma_minus8如下指定色度阵列BitDepthC的样本的位深度和色度量化参数范围偏移QpBdOffsetC的值:
BitDepthC=8+bit_depth_chroma_minus8
QpBdOffsetC=6*bit_depth_chroma_minus8
bit_depth_chroma_minus8应在0至8的范围内(包括端值)。
其中,变量CuQpDeltaVal基于JVET-N1001中提供的以下语义来确定:
cu_qp_delta_enabled_flag等于1指定PPS中存在cu_qp_delta_subdiv语法元素并且变换单元语法中可存在cu_qp_delta_abs。cu_qp_delta_enabled_flag等于0指定PPS中不存在cu_qp_delta_subdiv语法元素并且变换单元语法中不存在cu_qp_delta_abs。
cu_qp_delta_subdiv指定传送cu_qp_delta_abs和cu_qp_delta_sign_flag的编码单元的最大cbSubdiv值。cu_qp_delta_subdiv的值范围如下指定:
-如果slice_type等于I,则cu_qp_delta_subdiv的值应当在0至2*(log2_ctu_size_minus2-log2_min_qt_size_intra_slice_minus2+MaxMttDepthY)的范围内(包括端值)。
-否则(slice_type不等于I),则cu_qp_delta_subdiv的值应当在0至
2*(log2_ctu_size_minus2-log2_min_qt_size_inter_slice_minus2+MaxMttDepthY)的范围内(包括端值)。
当不存在时,推断cu_qp_delta_subdiv的值等于0。
cu_qp_delta_abs指定当前编码单元的量化参数和其预测之间的差值CuQpDeltaVal的绝对值。
cu_qp_delta_sign_flag如下指定CuQpDeltaVal的符号:
-如果cu_qp_delta_sign_flag等于0,则对应的CuQpDeltaVal具有正值。
-否则(cu_qp_delta_sign_flag等于1),则对应的CuQpDeltaVal具有负值。
当cu_qp_delta_sign_flag不存在时,推断其等于0。
当cu_qp_delta_abs存在时,变量IsCuQpDeltaCoded和CuQpDeltaVal如下导出:
IsCuQpDeltaCoded=1
CuQpDeltaVal=cu_qp_delta_abs*(1-2*cu_qp_delta_sign_flag)
CuQpDeltaVal的值应在-(32+QpBdOffsetY/2)至+(31+QpBdOffsetY/2)的范围内(包括端值)。
此外,JVET-N1001提供了指定量化参数信息的以下语法元素:
在图片参数集语法中:
pps_cb_qp_offset和ppscrqpoffset分别指定用于导出Qp'Cb和Qp'Cr的亮度量化参数Qp’Y的偏移。pps_cb_qp_offset和pps_cr_qp_offset的值应在-12至+12的范围内(包括端值)。当ChromaArrayType等于0时,在解码过程中不使用pps_cb_qp_offset和pps_cr_qp_offset,并且解码器应忽略其值。
pps_joint_cbcr_qp_offset指定用于导出Qp'CbCr-的亮度量化参数Qp’Y的偏移。pps_joint_cbcr_qp_offset的值应当在-12至+12的范围内(包括端值)。当ChromaArrayType等于0时,在解码过程中不使用pps_joint_cbcr_qp_offsct,并且解码器应忽略其值。
pps_slice_chroma_qp_offsets_present_flag等于1指示在相关联的切片标头中存在slice_cb_qp_offset和slice_cr_qp_offset语法元素,pps_slice_chroma_qpoffsets_present_flag等于0指示在相关联的切片标头中不存在这些语法元素。当ChromaArrayType等于0时,pps_slice_chroma_qp_offsets_present_flag应等于0。
在切片标头语法中:
slice_qp_delta指定要用于切片中的编码块的QPY的初始值,直到由编码单元层中的CuQpDeltaVal的值修改。切片的QpY量化参数的初始值SliceQpY如下导出:
SliceQpY=26+init_qp_mmus26+slice_qp_delta
SliceQpY的值应在-QpBdOffsetY至+63的范围内(包括端值)。
当确定Qp'Cr量化参数的值时,slice_cb_qp_offset指定要添加到pps_cb_qp_offset的值的差值。slice_cb_qp_offset的值应在-12至+12(包括端值)的范围内。当不存在slice_cb_qp_offset时,推断其等于0。pps_cb_qp_offset+slice_cb_qp_offset的值应在-12至+12(包括端值)的范围内。
当确定Qp'Cr量化参数的值时,slice_cr_qp_offset指定要添加到pps crqpoffsct的值的差值。slice_cr_qp_offset的值应在-12至+12(包括端值)的范围内。当不存在slice_cr_qp_offset时,推断其等于0。pps_cr_qp_offset+slice_cr_qp_offset的值应在-12至+12的范围内(包括端值)。
当确定Qp'CbCr的值时,slice_joint_cbcr_qp_offset指定要添加到ppsjoint_cbcr_qp_offset的值的差值。slice_joint_cbcr_qp_offset的值应在-12至+12的范围内(包括端值)。当slice_joint_cbcr_qp_offset不存在时,推断其等于0。pps_joint_cbcr_qp_offset+slice_joint_cbcr_qp_offset的值应在-12至+12的范围内(包括端值)。
如上所述,在JVET-N1001中,二元分割和三元分割可产生非正方形的矩形CU,并且在一些情况下可以根据共享QTMT来划分亮度通道和色度通道,并且在一些情况下可以根据单独QTMT来划分亮度通道和色度通道。需注意,JVET-N1001的上述量化参数导出过程解决了这些考虑因素,这些考虑因素不适用于ITU-T H.265。然而,应当指出的是,在JVET-N1001的上述量化参数导出过程中,使用表1导出QpC值可能不太理想。根据本公开,描述了用于增加导出量化参数的灵活性的技术。
参考图1中所示的示例,Pic3中包括的每个视频数据切片(即,切片0切片1)被示出为封装在NAL单元中。在JVET-N1001中,视频序列、GOP、图片、切片和CTU中的每一者可以与描述视频编码属性的元数据相关联。JVET-N1001定义了可用于描述视频数据和/或视频编码属性的参数集。具体地讲,JVET-N1001包括以下五种类型的参数集:解码参数集(DPS)、视频参数集(VPS)、序列参数集(SPS)、图片参数集(PPS)和自适应参数集(APS)。在JVET-N1001中,参数集可以被封装为特殊类型的NAL单元,或者可以作为消息发送信号通知。包括编码视频数据(例如,切片)的NAL单元可以被称为VCL(视频编码层)NAL单元,并且包括元数据(例如,参数集)的NAL单元可以被称为非VCL NAL单元。此外,JVET-N1001使得补充增强信息(SEI)消息能够被发送信号通知。在JVET-N1001中,SEI消息协助与解码、显示或其他目的有关的过程,然而,可能不需要SEI消息来通过解码过程构建亮度或色度样本。在JVET-N1001中,可以使用非VCL NAL单元在比特流中发送信号通知SEI消息。此外,SEI消息可以通过某种方式传送,而不是通过存在于比特流中(即,在带外发送信号通知)。图4示出了包括多个CVS的比特流的示例,其中CVS由包括在相应的访问单元中的NAL单元表示。在图4所示的示例中,非VCL NAL单元包括相应的参数集NAL单元(即,序列参数集(SPS)和图像参数集(PPS)NAL单元)、SEI消息NAL单元和访问单元界定符NAL单元。应当指出的是,在图4中,HEADER是NAL单元标头。
如上所述,JVET-N1001提供参数集中指定量化参数信息的语法元素pps_cb_qp_offset、pps_cr_qp_offset、pps_joint_cbcr_qp_offset和pps_slice_chroma_qp_offsets_present_flag。表2示出了JVET-N1001中提供的图片参数集语法
Figure BDA0003420623800000261
Figure BDA0003420623800000271
Figure BDA0003420623800000281
Figure BDA0003420623800000282
表2
关于表2,JVET-N1001提供了以下语义:
pps_pic_parameter_set_id标识PPS以供其他语法元素引用。pps_pic_parameter_set_id的值应在0至63的范围内(包括端值)。
pps_seq_parameter_set_id指定活动SPS的sps_seq_parameter_set_id的值。pps_seq_parameter_set_id的值应在0至15的范围内(包括端值)。
output_flag_present_flag等于1指示在引用PPS的切片标头中存在pic_output_flag语法元素。output_flag_present_flag等于0在引用PPS的切片标头中不存在pic_output_flag语法元素。
single_tile_in_pic_flag等于1指定在引用PPS的每个图片中存在仅一个图块。single_tile_in_pic_flag等于0指定在引用PPS的每个图片中存在多于一个图块。
注意—在图块内不存在进一步的砖块分割的情况下,整个图块被称为砖块。当图片包含仅单个图块而没有进一步的砖块分割时,图片被称为单个砖块。
比特流符合性要求,对于CVS内激活的所有PPS,single_tile_in_pic_flag的值应相同。
uniform_filespacing_flag等于1指定在整个图片上均匀地分布图块列边界和同样的图块行边界,并且使用语法元素tile_cols_width_minus1和tile_row s_height_minus1发送信号通知图块列边界和图块行边界。uniformtile_spacing_flag等于0指定可以在整个图片上均匀地分布或不均匀地分布图块列边界和同样的图块行边界,并且使用语法元素num_tile_columnsminus1和num_tile_rows_minus1以及语法元素对tile_columnwidthminus1[i]和tile row_height_minus1[i]的列表发送信号通知图块列边界和图块行边界。当不存在时,推断uniform_tile_spacing_flag的值等于1。
tile_cols_width_minus1加1指定当uniform_tile_spacing_flag等于1时,除了图片的最右侧图块列之外的图块列的宽度,单位为CTB。tile_cols_width_minus1的值应在0至PicWidthInCtbsY-1的范围内(包括端值)。当不存在时,推断tile_cols_width_minus1的值等于PicWidthInCtbsY-1。
tile_rows_height_minus1加1指定当uniform_tile_spacing_flag等于1时,除了图片的底部图块行之外的图块行的高度,单位为CTB。tile_rows_height_minus1的值应在0至PicHeightInCtbsY-1的范围内(包括端值)。当不存在时,推断tilerowsheight_minus1的值等于PicHeightInCtbsY-1。
num_tile_columns_minus1加1指定当uniform_tile_spacing_flag等于0时,划分图片的图块列的数量。numfile_columnsminus1的值应在0至PicWidthInCtbsY-1的范围内(包括端值)。当single_tile_in_pic_flag等于1时,推断num_tile_columns_minus1的值等于0。否则,当uniform_tile_spacing_flag等于1时,如指定的那样推断num_tile_columns_minus1的值。
num_tile_rows_minus1加1指定当uniform_tile_spacing_flag等于0时,划分图片的图块行的数量。num_tile_rows_minus1的值应在0至PicHeightInCtbsY-1的范围内(包括端值)。当single_tile_in_pic_flag等于1时,推断num_tile_rows_minus1的值等于0。否则,当uniform_tile_spacing_flag等于1时,如指定的那样推断num_tile_rowsminus1的值。
变量NumTilesInPic被设置为等于(num_tile_columns_minus1+1)*(num_tile_rows_minus1+1)。
当single_tile_in_pic_flag等于0时,NumTilesInPic应大于1。
tile_column_width_minus1[i]加1指定第i个图块列的宽度,单位为CTB。
tile_row_height_minus1[i]加1指定第i个图块行的高度,单位为CTB。
brick_spating_present_flag等于1指定引用PPS的图片的一个或多个图块可以被分成两个或更多个砖块。brick_splitting_present_flag等于0指定没有引用PPS的图片的图块被分成两个或更多个砖块。
brick_split_flag[i]等于1指定第i个图块被分成两个或更多个砖块。brick_split_flag[i]等于0指定第i个图块不被分成两个或更多个砖块。当不存在时,推断brick_split_flag[i]的值等于0。
uniform_brick_spacing_flag[i]等于1指定水平砖块边界在第i个砖块上均匀地分布并且使用语法元素brick_height_minus1[i]发送信号通知水平砖块边界。uniform_brick_spacing_flag[i]等于0指定水平砖块边界可以在第i个图块上均匀地分布或可以不均匀地分布,并且使用语法元素num_brick_rows_minus1[i]和语法元素brick_row_height_minus1[i][j]的列表发送信号通知水平砖块边界。当不存在时,推断uniform_brick_spacing_flag[i]的值等于1。
brick_height_minus1[i]加1指定当uniform_brick_spacing_flag[i]等于1时,第i个图块中除了底部砖块之外的砖块行的高度,单位为CTB。当存在时,brick_height_minus1的值应在0至RowHeight[i]-2的范围内(包括端值)。当不存在时,推断brick_height_minus1[i]的值等于RowHeight[i]-1。
num_brick_rows_minus1[i]加1指定当uniform_brick_spacing_flag[i]等于0时划分第i个图块的砖块的数量。当存在时,num_brick_rows_minus1[i]的值应在1至RowHeight[i]-1的范围内(包括端值)。如果brick split_flag[i]等于0,则推断num_brick_rows_minus1[i]的值等于0。否则,当uniform_brick_spacing_flag[i]等于1时,根据指定推断num_brick_rows_minus1[i]的值。
brick_row_height_minus1[i][j]加1指定当uniform_tile_spacing_flag等于0时,第i个图块中第j个砖块的高度,单位为CTB。
导出以下变量,并且当uniform_tile_spacing_flag等于1时,推断num_tile_columns_minus1和num_tile_rows_minus1的值,并且对于范围从0至NumTilesInPic-1(包括端值)的每个i,当uniform_brick_spacing_flag[i]等于1时,通过调用指定的CTB光栅和砖块扫描转换过程来推断num_brick_rows_minus1[i]的值:
-列表RowHeight[j],其中j在0至numtile_rowsminus1的范围内(包括端值),其指定第j个图块行的高度,单位为CTB,
-列表CtbAddrRsToBs[ctbAddrRs],其中ctbAddrRs在0至PicSizeInCtbsY-1的范围内(包括端值),其指定从图片的CTB光栅扫描中的CTB地址到砖块扫描中的CTB地址的转换,
-列表CtbAddrBsToRs[ctbAddrBs],其中ctbAddrBs在0至PicSizeInCtbsY-1的范围内(包括端值),其指定从砖块扫描中的CTB地址到图片的CTB光栅扫描中的CTB地址的转换,
-列表BrickId[ctbAddrBs],其中ctbAddrBs在0至PicSizeInCtbsY-1的范围内(包括端值),其指定从砖块扫描中的CTB地址到砖块ID的转换,
-列表NumCtusInBrick[brickIdx],其中brickIdx在0至NumBricksInPic-1的范围内(包括端值),其指定从砖块索引到砖块中CTU的数量的转换;列表FirstCtbAddrBs[brickIdx],其中brickIdx在0至NumBricksInPic-1的范围内(包括端值),其指定从砖块ID到在砖块中第一CTB的砖块扫描中的CTB地址的转换。
single_brickper_slice_flag等于1指定引用该PPS的每个切片包括一个砖块。single_brick_per_slice_flag等于0指定引用该PPS的切片可包括多于一个砖块。当不存在时,推断single_brickper_slice_flag的值等于1。
rect_slice_flag等于0指定每个切片内的砖块处于光栅扫描顺序中并且在PPS中不发送信号通知切片信息。rect_slice_flag等于1指定每个切片内的砖块覆盖图片的矩形区域并且在PPS中发送信号通知切片信息。当不存在时,推断rect_slice_flag等于1。
num_slices_in_pic_minus1加1指定每个图片中引用PPS的切片的数量。num_slices_in_pic_minus1的值应在0至NumBricksInPic-1的范围内(包括端值)。当不存在并且single_briek_per_slice_flag等于1时,推断num_slicesin_pic_minus1的值等于NumBricksInPic-1。
top_left_brick_idx[i]指定位于第i个切片的左上角处的砖块的砖块索引。对于不等于j的任何i,top_left_brick_idx[i]的值应不等于top_left_brick_idx[j]的值。当不存在时,推断top_left_brick_idx[i]的值等于i。top_left_brick_idx[i]语法元素的长度为Ceil(Log2(NumBricksInPic)位。
bottom_right_brickidx_delta[i]指定位于第i个切片的右下角处的砖块的砖块索引与top_left_brick_idx[i]之间的差值。当single_brick_per_slice_flag等于1时,推断bottom_right_brick_idx_delta[i]的值等于0。bottomright_brick_idx_delta[i]语法元素的长度为Ceil(Log2(NumBricksInPic-top_left_brick idx[i))位。
比特流符合性要求,切片应包括多个完整图块或仅包括一个图块的顺序连续的完整砖块。
变量NumBricksInSlice[i]和BricksToSliceMap[j]分别指定第i个切片中的砖块的数量和砖块到切片的映射,这些变量如下导出:
Figure BDA0003420623800000331
loop_filter_across_bricks_enabled_flag等于1指定可跨参考PPS的图片中的砖块边界执行循环中滤波操作。loop_filter_across_bricks_enabled_flag等于0指定不跨参考PPS的图片中的砖块边界执行循环中滤波操作。循环中滤波操作包括解块滤波器、样本自适应偏移滤波器和自适应回路滤波器操作。当不存在时,推断loop_filter_across_bricks_enabled_flag的值等于1。
loop_filter_across_slices_enabled_flag等于1指定可跨参考PPS的图片中的切片边界执行循环中滤波操作。loop_filter_across_slice_enabled_flag等于0指定不跨参考PPS的图片中的切片边界执行循环中滤波操作。循环中滤波操作包括解块滤波器、样本自适应偏移滤波器和自适应回路滤波器操作。当不存在时,推断loop_filter_across_slices_enabled_flag的值等于0。
signalled_slice_id_flag等于1指定发送信号传输每个切片的切片ID。signalled_slice_id_flag等于0指定不发送信号传输切片ID。当rect_slice_flag等于0时,推断signalled_sliceid_flag的值等于0。
signalled_slice_id_length_minus1加1指定用于表示语法元素切片id[i](当存在时)以及切片标头中的语法元素slice_address的位数。signalled_slice_idiength_minus1的值应在0至15的范围内(包括端值)。当不存在时,推断signalled_slieeid_lengthminus1的值等于Ceil(Log2(+1))-1。
slice_id[i]指定第i个切片的切片ID。slice_id[i]语法元素的长度为signalled_sliceid_length_minus1+1位。当不存在时,对于在0至num_slices_in_pic_minus1范围内(包括端值)的每个i,推断slice_id[i]的值等于i。
entropy_coding_sync_enabled_flag等于1指定在对包括引用PPS的每个图片中的每个砖块中的CTB行中的第一CTB的CTU进行解码之前调用上下文变量的特定同步过程,并且在对包括引用PPS的每个图片中的每个砖块中的CTB行中的第一CTB的CTU进行解码之后调用上下文变量的特定存储过程。entropy coding sync_enabled_flag等于0指定在对包括引用PPS的每个图片中的每个砖块中的CTB行中的第一CTB的CTU进行解码之前不需要调用上下文变量的特定同步过程,并且在对包括引用PPS的每个图片中的每个砖块中的CTB行中的第一CTB的CTU进行解码之后不需要调用上下文变量的特定存储过程。
比特流符合性要求,对于CVS内激活的所有PPS,entropy_coding_sync_enabled_flag的值应相同。
cabac_init_present_flag等于1指定引用PPS的切片标头中存在cabac_init_flag。cabac_init_present_flag等于0指定引用PPS的切片标头中不存在cabac_initi_flag。
num_ref_idx_default_active_minus1[i]加1,当i等于0时,指定针对P切片或B切片的变量NurnRefidxActive[0]的推断值,其中num_ref_idx_active_override_flag等于0,并且当i等于1时,指定针对B切片的NumRefIdxActive[1]的推断值,其中num_ref_idx_active_override_flag等于0。num_ref idx_default_active_minus1[i]的值应在0至14的范围内(包括端值)。
rpl1_idx_present_flag等于0指定切片标头中不存在ref_pic_list_sps_flag[1]和ref_pic_list_idx[1]。rpl1_idx_present_flag等于1指定切片标头中可能存在ref_pic_list_sps_flag[1]和ref_pic_list_idx[1]。
init_qp_minus26加26指定引用PPS的每个切片的SliceQpY的初始值。当slice_qp_delta被解码为非零值时,在切片层修改SliceQpY的初始值。init_qp_minus26的值应在-(26+QpBdOffsetY)至+37的范围内(包括端值)。
Transform_skip_enabled_flag等于1指定变换单元语法中可存在transform_skip_flag。transform_skip_enabled_flag等于0指定变换单元语法中不存在transform_skip_flag。
log2_transform_skip_max_size_minus2指定用于变换跳过的最大块尺寸,并且应在0至3的范围内。
当不存在时,推断log2_transform_skip_max_size_minus2的值等于0。
将变量MaxTsSize设置为等于1<<(log2 transformskip_max_size minus2+2)。
eu_qp_delta_enabled_flag等于1指定PPS中存在cu_qp_delta_subdiv语法元素并且变换单元语法中可存在cu_qp_delta_abs。cu_qp_delta_enabled_flag等于0指定PPS中不存在cu_qp_delta_subdiv语法元素并且变换单元语法中不存在cu_qp_delta_abs。
cu_qp_delta_subdiv指定传送cu_qp_delta_abs和cu_qp_delta_sign_flag的编码单元的最大cbSubdiv值。cu_qp_delta_subdiv的值范围如下指定:
-如果slice_type等于I,则cu_qp_delta_subdiv的值应当在0至2*(log2_ctu_size_minus2-log2_min_qt_size_intra_slice_minus2+MaxMttDepthY)的范围内(包括端值)。
-否则(slice_type不等于I),则cu_qp_delta_subdiv的值应当在0至
2*(log2_ctu_size_minus2-log2_min_qt_size_inter_slice_minus2+MaxMttDepthY)的范围内(包括端值)。
当不存在时,推断cu_qp_delta_subdiv的值等于0。
pps_cb_qp_offset和pps_cr_qp_offset分别指定用于导出Qp'Cb和Qp'Cr的亮度量化参数Qp'Y的偏移。pps_cb_qp_offset和pps_cr_qp_offset的值应在-12至+12的范围内(包括端值)。当ChromaArrayType等于0时,在解码过程中不使用pps_cb_qp_offset和pps_cr_qp_offset,并且解码器应忽略其值。
pps_slice_chroma_qp_offsets_present_flag等于1指示在相关联的切片标头中存在slice_cb_qp_offset和slice_cr_qp_offset语法元素。pps_slice_chromaqp_offsetspresent_flag等于0指示在相关联的切片标头中不存在这些语法元素。当ChromaArrayType等于0时,pps_slice_chromaqp_offsets_present_flag应等于0。
weighted_pred_flag等于0指定不将加权预测应用于P切片。weighted_pred_flag等于1的将加权预测应用于P切片。
weighted_bipred_flag等于0指定将默认加权预测应用于B切层。weighted_bipred_flag等于1指定将加权预测应用于B切片。
deblocking_filter_control_present_flag等于1指定PPS中存在解块滤波器控制语法元素。deblocking_filter_control_present_flag等于0指定PPS中不存在解块滤波器控制语法元素。
deblocking_filter_override_enabled_flag等于1指定引用PPS的图片的切片标头中存在deblocking_filter_overrideflag。deblocking_filter_override_enabled_flag等于0指定引用PPS的图片的切片标头中不存在deblocking_filter_override_flag。当不存在时,推断deblockingfilter_override_enabled_flag的值等于0。
pps_deblocking_filter_disabled_flag等于1指定解块滤波器的操作不应用于引用其中不存在slice_deblocking_filter_disabled_flag的PPS的切片。pps_deblocking_filter_disabled_flag等于0指定解块滤波器的操作应用于引用其中不存在slice_deblocking_filter_disabled_flag的PPS的切片。当不存在时,推断pps_deblocking_filter_disabled_flag的值等于0。
pps_beta_offset_div2和pps_tc_offset_div2指定应用于参考PPS的切片的β和tC的默认解块参数偏移(除以2),除非默认解块参数偏移被参考PPS的切片的切片标头中存在的解块参数偏移覆盖。pps_beta_offset_div2和pps_tc_offset_div2的值应均在-6至6的范围内(包括端值)。当不存在时,推断pps_beta_offset_div2和pps_tc_offset_div2的值等于0。
pps_loop_filter_aeross_virtual_boundaries_disabled_flag等于1指定在引用PPS的图片中的虚拟边界上禁用循环中滤波操作。pps_loopfilter_across_virtual_boundaries_disabled_flag等于0指定在引用PPS的图片中不适用循环中滤波操作的此类禁用。循环中滤波操作包括解块滤波器、样本自适应偏移滤波器和自适应回路滤波器操作。当不存在时,推断pps_loop_filter_across_virtual_boundaries_disabled_flag的值等于0。
pps_num_ver_virtual_boundaries指定PPS中存在的pps_virtualboundariespos_x[i]语法元素的数量。当pps_virtualboundariespos_x[i]不存在时,推断其等于0。
pps_virtual_boundaries_pos_x[i]用于计算PpsVirtualBoundariesPosX[i]的值,其指定第i个垂直虚拟边界的位置,单位为亮度样本。用于表示pps_virtual_boundaries_pos_x[i]的位数为Ceil(Log2(pic_width_in_luma_samples)-3)。pps_virtual_boundaries_pos_x[i]应在1至Ceil(pic_width_in_luma_samples÷8)-1的范围内(包括端值)。
垂直虚拟边界的位置PpsVirtualBoundariesPosX[i]如下导出:
PpsVirtualBoundariesPosX[i]=pps_virtual_boundaries_pos_x[i]*8
任何两个垂直虚拟边界之间的距离应大于或等于CtbSizeY个亮度样本。
pps_num_hor_virtual_boundaries指定PPS中存在的pps_virtual_boundaries_pos_y[i]语法元素的数量。当pps_num_hor_virtual_boundaries不存在时,推断其等于0。
pps_virtual_boundaries_pos_y[i]用于计算PpsVirtualBoundariesPosY[i]的值,其指定第i个水平虚拟边界的位置,单位为亮度样本。用于表示pps_virtual_boundaries_pos_y[i]的位数为Ceil(Log2(pic_height_in_luma_samples)-3)。ppsvirtual_boundaries_pos_y[i]应在1至Ceil(pic_height_in_luma_samples÷8)-1的范围内(包括端值)。
水平虚拟边界的位置PpsVirtualBoundariesPosY[i]如下导出:
PpsVirtualBoundariesPosY[i=pps_virtual_boundaries_pos_y[i]*8
任何两个水平虚拟边界之间的距离应大于或等于CtbSizeY个亮度样本。
pps_extension_flag等于0指定在PPS RBSP语法结构中不存在pps_extension_data_flag语法元素。sps_extension_flag等于1指定在PPS RBSP语法结构中存在pps_extension_data_flag语法元素。
pps_extension_data_flag可具有任何值。其存在和值不影响解码器符合本说明书的此版本中指定的配置文件。符合本说明书的此版本的解码器应忽略所有pps_extension_data_flag语法元素。
图5是示出根据本公开的一种或多种技术的可以被配置为对视频数据进行编码(例如,编码和/或解码)的系统的示例的框图。系统100表示可以根据本公开的一种或多种技术使用所述划分技术执行视频编码的系统的示例。如图5所示,系统100包括源设备102、通信介质110和目标设备120。在图5所示的示例中,源设备102可以包括被配置为对视频数据进行编码并将编码的视频数据传输到通信介质110的任何设备。目标设备120可以包括被配置为经由通信介质110接收编码视频数据并且对编码视频数据进行解码的任何设备。源设备102和/或目标设备120可以包括配备用于进行有线和/或无线通信的计算设备,并且可以包括机顶盒、数字视频录像机、电视机、台式电脑、膝上型电脑或平板电脑、游戏控制台、移动设备包括例如“智能”电话、蜂窝电话、个人游戏设备和医学成像设备。
通信介质110可以包括无线和有线通信介质和/或存储设备的任意组合。通信介质110可以包括同轴电缆、光纤电缆、双绞线电缆、无线发射器和接收器、路由器、交换机、中继器、基站或可用于促进各种设备和站点之间的通信的任何其他设备。通信介质110可以包括一个或多个网络。例如,通信介质110可以包括被配置为允许访问万维网例如互联网的网络。网络可以根据一个或多个电信协议的组合操作。电信协议可以包括专有方面并且/或者可以包括标准化电信协议。标准化电信协议的示例包括数字视频广播(DVB)标准、高级电视系统委员会(ATSC)标准、综合服务数字广播(ISDB)标准、有线数据业务接口规范(DOCSIS)标准、全球移动通信系统(GSM)标准、码分多址(CDMA)标准、第3代合作伙伴计划(3GPP)标准、欧洲电信标准协会(ETSI)标准、互联网协议(IP)标准、无线应用协议(WAP)标准以及电气与电子工程师协会(IEEE)标准。
存储设备可以包括能够存储数据的任何类型的设备或存储介质。存储介质可以包括有形或非暂态计算机可读介质。计算机可读介质可以包括光盘、闪存存储器、磁存储器或任何其他合适的数字存储介质。在一些示例中,存储器设备或其部分可以被描述为非易失性存储器,并且在其他示例中,存储器设备的部分可以被描述为易失性存储器。易失性存储器的示例可以包括随机存取存储器(RAM)、动态随机存取存储器(DRAM)和静态随机存取存储器(SRAM)。非易失性存储器的示例可以包括磁性硬盘、光盘、软盘、闪存或电可编程存储器(EPROM)或电可擦除和可编程(EEPROM)存储器的形式。存储设备可以包括存储卡(例如,安全数字(SD)存储卡)、内部/外部硬盘驱动器和/或内部/外部固态驱动器。数据可以根据定义的文件格式存储在存储设备上。
再次参考图5,源设备102包括视频源104、视频编码器106和接口108。视频源104可以包括被配置为捕获和/或存储视频数据的任何设备。例如,视频源104可以包括摄像机和可操作地与其耦接的存储设备。视频编码器106可以包括被配置为接收视频数据并生成表示视频数据的兼容比特流的任何设备。兼容比特流可以指视频解码器可以从其接收和再现视频数据的比特流。兼容比特流的各方面可根据视频编码标准来定义。当生成兼容比特流时,视频编码器106可以压缩视频数据。压缩可能是有损的(可觉察的或不可觉察的)或无损的。接口108可以包括被配置为接收兼容视频比特流并且将该兼容视频比特流传输和/或存储到通信介质的任何设备。接口108可以包括网络接口卡诸如以太网卡,并且可以包括光收发器、射频收发器或者可以发送和/或接收信息的任何其他类型的设备。此外,接口108可以包括计算机系统接口,该计算机系统接口可以允许兼容视频比特流存储在存储设备上。例如,接口108可以包括支持外围部件互连(PCI)和高速外围部件互连(PCIe)总线协议、专用总线协议、通用串行总线(USB)协议、I2C的芯片组、或可用于互连对等设备的任何其他逻辑和物理结构。
再次参考图5,目标设备120包括接口122、视频解码器124和显示器126。接口122可以包括被配置为从通信介质接收兼容视频比特流的任何设备。接口108可以包括网络接口卡诸如以太网卡,并且可以包括光收发器、射频收发器或者可以接收和/或发送信息的任何其他类型的设备。此外,接口122可以包括允许从存储设备检索兼容视频比特流的计算机系统接口。例如,接口122可以包括支持PCI和PCIe总线协议、专用总线协议、USB协议、I2C的芯片组,或者可用于互连对等设备的任何其他逻辑和物理结构。视频解码器124可以包括被配置为接收兼容比特流和/或其可接受变体,并且从其再现视频数据的任何设备。显示器126可以包括被配置为显示视频数据的任何设备。显示器126可以包括各种显示设备诸如液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另外的类型的显示器中的一种。显示器126可以包括高清显示器或超高清显示器。应当指出的是,尽管在图3所示的示例中,视频解码器124被描述为将数据输出到显示器126,但视频解码器124可以被配置为将视频数据输出到各种类型的设备和/或其子部件。例如,视频解码器124可被配置为将视频数据输出到任何通信介质,如本文所述。
图6是示出可实现本文所述的用于对视频数据进行编码的技术的视频编码器200的示例的框图。应当指出的是,尽管示例性视频编码器200被示出为具有不同的功能块,但此类图示旨在用于描述目的,并且不将视频编码器200和/或其子部件限制为特定的硬件或软件架构。可使用硬件、固件和/或软件具体实施的任何组合来实现视频编码器200的功能。在一个示例中,视频编码器200可被配置为根据本文描述的技术对视频数据进行编码。视频编码器200可执行图片区域的帧内预测编码和帧间预测编码,并且因此可被称为混合视频编码器。在图6所示的示例中,视频编码器200接收源视频块。在一些示例中,源视频块可以包括已经根据编码结构划分的图片区域。例如,源视频数据可以包括宏块、CTU、CB、其子分区和/或另外的等效编码单元。在一些示例中,视频编码器200可被配置为执行源视频块的附加细分。应当指出的是,无论在编码之前和/或期间如何划分源视频数据,本文所述的一些技术都可普遍适用于视频编码。在图6所示的示例中,视频编码器200包括求和器202、变换系数生成器204、系数量化单元206、逆量化/变换处理单元208、求和器210、帧内预测处理单元212、帧间预测处理单元214、滤波器单元216和熵编码单元218。
如图6所示,视频编码器200接收源视频块并输出比特流。视频编码器200可通过从源视频块中减去预测视频块来生成残差数据。求和器202表示被配置为执行该减法运算的部件。在一个示例中,视频块的减法发生在像素域中。变换系数生成器204将变换,诸如离散余弦变换(Discrete Cosine Transform,DCT)、离散正弦变换(Discrete Sine Transform,DST)或概念上类似的变换,应用到其残差块或子分区(例如,可以将四个8×8变换应用于16×16残差值阵列)以生成一组残差变换系数。变换系数生成器204可被配置为执行离散三角变换系列中包括的变换的任意和全部组合。如上所述,在ITU-T H.265中,TB被限制为以下大小4×4、8×8、16×16和32×32。在一个示例中,变换系数生成器204可被配置为根据大小为4×4、8×8、16×16和32×32的阵列执行变换。在一个示例中,变换系数生成器204可进一步被配置为根据其他尺寸的阵列执行变换。具体地,在一些情况下,对不同值组成的矩形阵列执行变换可能是有用的。在一个示例中,变换系数生成器204可被配置为根据以下阵列大小来执行变换:2×2、2×4N、4M×2和/或4M×4N。在一个示例中,二维(2D)M×N逆变换可实现为一维(1D)M点逆变换后再进行1D N点逆变换。在一个示例中,2D逆变换可实现为1D N点垂直变换后再进行1D N点水平变换。在一个示例中,2D逆变换可实现为1D N点水平变换后再进行1D N点垂直变换。变换系数生成器204可将变换系数输出到系数量化单元206。
系数量化单元206可被配置为执行变换系数的量化。如上所述,可以通过调整量化参数来修改量化程度。系数量化单元206可以进一步被配置为确定量化参数并且输出QP数据(例如,用于确定量化组大小和/或增量QP值的数据),视频解码器可以使用该QP数据来重构量化参数以在视频解码期间执行逆量化。应当指出的是,在其他示例中,可以使用一个或多个附加或另选的参数来确定量化位阶(例如,缩放因子)。本文所述的技术通常可应用于基于对应于视频数据的某一分量的变换系数的量化位阶,确定对应于视频数据的另一分量的变换系数的量化位阶。
如上所述,使用表1导出如上相对于JVET-N1001所述的QpC值可能不太理想。在一个示例中,根据本文的技术,系数量化单元206可被配置为根据分段线性函数导出量化参数,该分段线性函数可在比特流中编码以用于在视频解码器处导出量化参数。在一个示例中,参数集例如PPS中包括的语法元素可指定亮度到色度QP值的映射表。应当指出的是,如上所述,NET-N1001包括以下五种类型的参数集:解码参数集(DPS)、视频参数集(VPS)、序列参数集(SPS)、图片参数集(PPS)和自适应参数集(APS)。因此,根据本文的技术,指定亮度到色度QP值的映射表(或任何分量到分量QP值的映射表)的语法元素可被包括在解码参数集(DPS)、视频参数集(VPS)、序列参数集(SPS)、图片参数集(PPS)和自适应参数集(APS)中的一者或多者中。在一个示例中,根据本文的技术,图片参数集语法结构可以包括表3中的语法。例如,可以将表3中包括的语法添加到上面表2中提供的图片参数集语法结构。例如,可以将表3中包括的语法添加到上面表2中提供的紧接在语法元素pps_slice_chroma_qp_offsets_present_flag之后的图片参数集语法结构。
Figure BDA0003420623800000421
表3
在一个示例中,语法元素qp_luma_to_chroma_map_present_flag、qp_luma_to_chroma_joint_map_flag、qp_map_num_points_minus1[i]、qp_map_pivot_delta_minus26[i]、qp_map_pivot_delta_minus1[i][j]、qp_map_delta[i][j]和qp_map_offset[i]的语义可基于以下内容:
qp_luma_to_chroma_map_present_flag指定是否存在亮度到色度量化参数映射表。
qp_luma_to_chroma_joint_map_flag指定是否将公共亮度到色度量化参数映射表用于Cb、Cr和CbCr。
qp_map_num_points_minus1[i]、qp_map_pivot_delta_minus26[i]、qp_map_pivot_delta_minus1[i][j]、qp_map_delta[i][j]和qp_map_offset[i]定义用于将亮度QP值映射到色度QP值的分段线性函数。映射表qp_map[i][j]的值由此如下导出:
Figure BDA0003420623800000431
当qp_luma_to_chroma_map_present_flag为假并且分段函数的参数不存在时,qp_map[i][qp]=qp,其中i=0…2并且qp=-24…69。
在一个示例中,qp_map_delta[i][j]的值也可被差分地编码以用于减少位消耗,其中对delta_qp_map_delta[i][j]语法元素而不是qp_map_delta[i][j]进行编码。在一个示例中,在这种情况下,根据本文的技术,图片参数集语法结构可以包括表4中的语法。例如,可以将表4中包括的语法添加到上面表2中提供的图片参数集语法结构。例如,可以将表4中包括的语法添加到上面表2中提供的紧接在语法元素pps_slice_chroma_qp_offsets_present_flag之后的图片参数集语法结构。
Figure BDA0003420623800000441
表4
关于表4,在一个示例中,语法元素qp_luma_to_chroma_map_present_flag、qp_luma_to_chroma_joint_map_flag、qp_map_num_points_minus1[i]、qp_map_pivot_delta_minus26[i]、qp_map_pivot_delta_minus1[i][j]、delta_qp_map_delta[i][j]和qp_map_offset[i]的语义可基于以下内容:
qp_luma_to_chroma_map_present_flag指定是否存在亮度到色度量化参数映射表。
qp_luma_to_chroma_jointmap_flag指定是否将公共亮度到色度量化参数映射表用于Cb、Cr和CbCr。
qp_map_nump oints_minus1[i]、qp_map_pivot_delta_minus26[i]、qp_map_pivot_delta_minus1[i][j]、delta_qp_map_delta[i][j]和qp_map_offset[i]定义用于将亮度QP值映射到色度QP值的分段线性函数。
映射表qp_map[i][j]的值由此如下导出:
Figure BDA0003420623800000451
Figure BDA0003420623800000461
当qp_luma_to_Chroma_map_present_flag为假并且分段函数的参数不存在时,qp_map[i][qp]=qp,其中i=0…2并且qp=-24…69。
在一些示例中,可使用可提高编码效率的uek(v)位表示对一些语法元素进行编码,其中uek(v)从最左位起的无符号整数k阶Exp-Golomb编码的语法元素。在一个示例中,该描述符的解析过程可以如下,其中阶数k在语法元素的语义中限定:
当语法表中语法元素的描述符等于ue(v)、uek(v)或se(v)时,调用该过程。
该过程的输入是来自RBSP的位。
该过程的输出是语法元素值。
编码为ue(v)或se(v)的语法元素是具有等于0的阶数k的Exp-Golomb编码的语法元素,并且编码为uek(v)的语法元素是具有阶数k的Exp-Golomb编码的语法元素。这些语法元素的解析过程开始于读取从比特流中的当前位置开始的位直到并包括第一非零位,并且计数等于0的前导位的数量。该过程如下指定:
leadingZeroBits=-1
for(b=0;!b;leadingZeroBits++)
b=read_bits(1)
然后变量codeNum如下指定:
codeNum=(2leadingZeroBits-1)*2k+read_bits(leadingZeroBits+k)
其中从read_bits(leadingZeroBits)返回的值被解释为首先写入最高有效位的无符号整数的二进制表示。
表5通过将位串分成“前缀”和“后缀”位示出了0阶Exp-Golomb码的结构。“前缀”位是如上文针对leadingZeroBits的计算所指定的那样进行解析的那些位,并且在表5的位串列中被示出为0或1。“后缀”位是在codeNum的计算中进行解析并且在表5中被示出为xi的那些位,其中i在0至leadingZeroBits-1的范围内(包括端值)。每个xi等于0或1。
位串形式 codeNum的范围
1 0
01x<sub>0</sub> 1..2
001x<sub>1</sub>x<sub>o</sub> 3..6
0001x<sub>2</sub>x<sub>1</sub>x<sub>o</sub> 7..14
00001x<sub>3</sub>x<sub>2</sub>x<sub>1</sub>x<sub>0</sub> 15..30
00000x<sub>4</sub> x<sub>3</sub>x<sub>2</sub>x<sub>1</sub>x<sub>0</sub> 31..62
...
表5
表6明确地示出了位串到codeNum值的分配。
Figure BDA0003420623800000471
Figure BDA0003420623800000481
表6
根据描述符,语法元素的值如下导出:
-如果语法元素被编码为ue(v),则语法元素的值等于codeNum。
-否则(语法元素被编码为se(v)),通过调用如所指定以codeNum作为输入的有符号Exp-Golomb码的映射过程来导出语法元素的值。
有符号Exp-Golomb码的映射过程
该过程的输入是所指定的codeNum。
该过程的输出是编码为se(v)的语法元素的值。
通过以递增顺序按语法元素的绝对值对其进行排序,并利用较低codeNum来表示给定绝对值中的正值,从而将语法元素分配给codeNum。
表7提供了分配规则。
codeNum 语法元素值
0 0
1 1
2 -1
3 2
4 -2
5 3
6 -3
k (-1)<sup>k+1</sup>Ceil(k÷2)
表7
在一个示例中,根据本文的技术,图片参数集语法结构可以包括表8中的语法。例如,可以将表4中包括的语法添加到上面表8中提供的图片参数集语法结构。例如,可以将表4中包括的语法添加到上面表8中提供的紧接在语法元素pps_slice_chroma_qp_offsetspresent_flag之后的图片参数集语法结构。应当指出的是,在表8中,修改delta_qp_map_delta的位表示以考虑映射表通常将给定亮度QP值映射到较小色度QP值的事实。
Figure BDA0003420623800000491
表8
关于表8,在一个示例中,语法元素qp_luma_to_chroma_map_present_flag、qp_luma_to_chroma_joint_map_flag、qp_map_num_points_minus1[i]、qp_map_pivot_delta_minus26[i]、qp_map_delta[i]、qp_map_pivot_delta_minus1[i][j]、delta_qp_map_delta[i][j]和qp_map_offset[i]的语义可基于以下内容:
qp_luma_to_chroma_map_present_flag指定是否存在亮度到色度量化参数映射表。
qp_luma_to_ehroma_joint_map_flag指定是否将公共亮度到色度量化参数映射表用于Cb、Cr和CbCr。
qp_map_num_points_minus 1[i]、qp_map_pivot_delta_minus26[i]、qp_map_pivot_delta_minus1[i][j]、qp_map_delta[i]、delta_qp_map_delta[i][j]和qp_map_offset[i]定义用于将亮度QP值映射到色度QP值的分段线性函数。对于qp_map_num_points_minus1且对于qp_map_pivot_delta_minus1[i][j],exp-Golomb二值化uek(v)的阶数k为2,并且对于delta_qp_map_delta[i][j],阶数k为1。
映射表qp_map[i][j]的值由此如下导出:
Figure BDA0003420623800000501
Figure BDA0003420623800000511
当qp_luma_to_chroma_map_present_flag为假并且分段函数的参数不存在时,qp_map[i][qp]=qp,其中i=0…2并且qp=-24…69。
应当指出的是,语法元素qp_map_num_points_minus1加1指定用于描述色度QP映射表的点数。因此,根据本文的技术,指定用于描述色度QP映射表的点数的语法元素可使用uek(v)位表示来编码,其中在一个示例中,exp-Golomb二值化uek(v)的阶数k为2。应当指出的是,qp_map_pivot_delta_minus1[i][j]加1指定用于导出第i个色度QP映射表的第j个枢转点的输入坐标的增量值。因此,根据本文的技术,指定用于导出色度QP映射表的枢转点的输入坐标的增量值的语法元素可使用uek(v)位表示来编码,其中在一个示例中,exp-Golomb二值化uek(v)的阶数k为2。此外,应当指出的是,在一个示例中,对于qp_map_pivot_delta_minus1[i][j],其中j0,exp-Golomb二值化uek(v)的阶数k可为3,否则为2。应当指出的是,delta_qp_map_delta[i][j]指定用于导出第i个色度QP映射表的第j个枢转点的输出坐标的增量值。因此,根据本文的技术,指定用于导出色度QP映射表的枢转点的输出坐标的增量值的语法元素可使用uek(v)位表示来编码,其中在一个示例中,exp-Golomb二值化uek(v)的阶数k为1。
应当指出的是,语法元素qp_map_pivot_delta_minus26[i]加26指定第i个色度QP映射表的第一枢转点的输入坐标。因此,根据本文的技术,指定色度QP映射表的第一枢转点的输入坐标的语法元素可使用se(v)编码来编码。应当指出的是,语法元素qp_map_delta指定用于导出第i个色度QP映射表的第一枢转点的输出坐标的增量值。因此,根据本文的技术,指定用于导出色度QP映射表的第一枢转点的输出坐标的增量值的语法元素可使用se(v)编码来编码。
在一个示例中,根据本文的技术,图片参数集语法结构可以包括表9中的语法。
Figure BDA0003420623800000521
表9
关于表9,在一个示例中,语法元素qp_luma_to_chroma_map_present_flag、qp_luma_to_chroma_joint_map_flag、qp_map_num_points_minus1[i]、qp_map_pivot_delta_minus26[i]、qp_map_delta[i]、qp_map_pivot_delta_minus1[i][j]、delta_qp_map_delta[i][j]和qp_map_offset[i]的语义可基于以下内容:
qp_luma_to_chroma_map_present_flag指定是否存在亮度到色度量化参数映射表。
qp_luma_to_chroma_joint_map_flag指定是否将公共亮度到色度量化参数映射表用于Cb、Cr和CbCr。
qp_map_nump oints_minus 1[i]、qp_map_pivot_delta_minus26[i]、qp_map_pivot_delta_minus1[i][j]、qp_map_delta[i]、delta_qp_map_delta[i][j]和qp_map_offset[i]定义用于将亮度QP值映射到色度QP值的分段线性函数。对于qp_map_num_points_minus1且对于qp_map_pivot_delta_minus 1[i][j],exp-Golomb二值化uek(v)的阶数k为2,并且对于delta_qp_map_delta[i][j],阶数k为1。
映射表qp_map[i][j]的值由此如下导出:
Figure BDA0003420623800000531
Figure BDA0003420623800000541
当qp_luma_to_chroma_map_present_flag为假并且分段函数的参数不存在时,qpmap[i][qp]=qp,其中i=0…2并且qp=-24…69。
另选地,qp_map_delta[j]也可如下导出:
qp_map_delta[j]=qp_map_delta[j-1]+(dy^(dx-1))-dx
其中^是逐位异或运算符。从复杂性的角度来看,这可能是有利的,因为需要更少的操作。
在一个示例中,根据本文的技术,系数量化单元206可被配置为根据以下过程导出量化参数:
该过程的输入为:
-亮度位置(xCb,yCb),其相对于当前图片的左上亮度样本指定当前编码块的左上亮度样本,
-变量cbWidth,其指定亮度样本中当前编码块的宽度,
-变量cbHeight,其指定亮度样本中当前编码块的高度,
-变量treeType,其指定是使用一元树(SINGLE TREE)还是二元树来划分CTU,并且当使用二元树时,其指定当前是处理亮度(DUAL_TREE_LUMA)还是色度分量(DUAL_TREE_CHROMA)。
在该过程中,导出亮度量化参数Qp'Y以及色度量化参数Qp'cl和Qp'cr
亮度位置(xQg,yQg)相对于当前图片的左上亮度样本指定当前量化组的左上亮度样本。水平位置xQg和垂直位置yQg分别被设置为等于CuQgTopLeftX和CuQgTopLeftY。
注意:当前量化组是共享相同qPY_PRED的编码树块内的矩形区域。其宽度和高度等于左上亮度样本位置被分配给变量CuQgTopLeftX和CuQgTopLeftY的编码树节点的宽度和高度。
当treeType等于SINGLE_TREE或DUAL_TREE_LUMA时,通过以下有序步骤导出预测亮度量化参数qPY_PRED
1.变量qPY_PREV如下导出:
-如果以下条件中的一者或多者为真,则将qPY_PREV设置为等于SliceQpY
-当前量化组是切片中的第一量化组。
-当前量化组是砖块中的第一量化组。
-否则,qPy_PREV被设置为等于解码顺序中前一个量化组中的最后一个亮度编码单元的亮度量化参数QpY
2.当将位置(xCurr,yCurr)设置为等于(xCb,yCb)并且将相邻位置(xNbY,yNbY)设置为等于(xQg-1,yQg)作为输入时,调用块的可用性导出过程,并且输出分配给可用A。变量qPY_A如下导出:
-如果以下条件中的一者或多者为真,则将qPyA设置为等于qPY_PREV
-可用A等于假。
-包含覆盖亮度位置(xQg-1,yQg)的亮度编码块的CTB的CTB地址ctbAddrA不等于CtbAddrinBs,其中ctbAddrA如下导出:
xTmp=(xQg-1)>>MinTbLog2SizeY
yTmp=yQg>>MinTbLog2SizeY
minTbAddrA=MinTbAddrZs[xTmp][yTmp
ctbAddrA=minTbAddrA>>(2*(CtbLog2SizeY-MinTbLog2SizeY))
-否则,qPY_A被设置为等于包含覆盖(xQg-1,yQg)的亮度编码块的编码单元的亮度量化参数QpY
3.当将位置(xCurr,yCurr)设置为等于(xCb,yCb)并且将相邻位置(xNbY,yNbY)设置为等于(xQg,yQg-1)作为输入时,调用所指定的块的可用性导出过程,并且输出分配给可用B。变量qPY_B
下导出:
-如果以下条件中的一者或多者为真,则将qPY_B设置为等于qPY_PREV
-可用B等于假。
-包含覆盖亮度位置(xQg,yQg-1)的亮度编码块的CTB的CTB地址ctbAddrB不等于CtbAddrInBs,其中ctbAddrB如下导出:
xTmp=xQg>>MinTbLog2SizeY
yTmp=(yQg-1)>>MinTbLog2SizeY
minTbAddrB=MinTbAddrZs[xTmp][yTmp]
ctbAddrB=minTbAddrB>>(2*(CtbLog2SizeY-MinTbLog2SizeY))
-否则,qPY_B被设置为等于包含覆盖(xQg,yQg-1)的亮度编码块的编码单元的亮度量化参数QpY
4.预测亮度量化参数qPY_PRED如下导出:
-如果以下所有条件都为真,则qPY_PRED被设置为等于包含覆盖(xQg,yQg-1)的亮度编码块的编码单元的亮度量化参数QpY
-可用B等于真。
-当前量化组是图块内的CTB行中的第一量化组
-否则,qPY_PRED如下导出:
qPY_PRED=(qPY_A+qPY_B+1)>>1
变量QpY如下导出:
QpY
((qPY_PRED+CuQpDeltaVal+64+2*QpBdOffsetY)%(64+
QpBdOffsetY))-QpBdOffsetY
亮度量化参数Qp'Y如下导出:
Qp'Y=QpY+QpBdOffsetY
当ChromaArrayType不等于0并且treeType等于SINGLE_TREE或DUAL_TREE_CHROMA时,以下适用:
-当treeType等于DUAL_TREE_CHROMA时,变量QpY被设置为等于覆盖亮度位置(xCb+cbWidth/2,yCb+cbHeight/2)的亮度编码单元的亮度量化参数QpY
-变量qPCb、qPCr和qPCbCr如下导出:
qPiCb=Clip3(-24,69,QpY+pps_cb_qp_offset+slice_cb_qp_offset)
qPiCr,=Clip3(-24,69,QpY+pps_cr_qp_offset+slice_cr_qp_offset)
qPiCbCr,=Clip3(-24,69,QpY+pps_joint_cbcr_qp_offset+slice_joint_cbcr_qp_offset)
qPcb=Clip3(-QpBdOffsetC,63,qp_map[0][qPicb])ecr=Clip3(-QpBdOffsetc,63,qp_map[1][qPicr)
qPCbCr=Clip3(-QpBdOffsetC,63,qp_map[2][qPiCbCr)
-Cb和Cr分量的色度量化参数Qp'Cb和QP'Cr以及Cb-Cr联合编码Qp’CbCr如下导出:
Qp'Cb=qPCb+QpBdOffsetC
Qp'Cr=qPcr+QpBdOffsetC
QP'CbCr=qPCbCr+QpBdOffsetC
应当指出的是,分段线性函数可产生分数色度QP值,然后将其四舍五入成最接近的整数以变成实际色度QP值。在一个示例中,视频编码器200可被配置为考虑分段线性函数的全精度值以导出色度的λ参数。在一些情况下,此类考虑可产生更平滑的RD曲线,其中相对于比特率和亮度QP绘制Cb PSNR。
这样,视频编码器200表示设备的示例,该设备被配置为:至少部分地基于分段线性函数来确定当前视频块的色度分量的量化参数,并且基于所确定的量化参数来执行量化。
再次参见图6,量化的变换系数被输出到逆量化/变换处理单元208。逆量化/变换处理单元208可被配置为应用逆量化和逆变换来生成重构残差数据。如图6所示,在求和器210处,重构残差数据可以被添加到预测视频块。这样,可以重构编码的视频块,并且可以使用所得重构视频块来评估给定的预测、变换和/或量化的编码质量。视频编码器200可被配置为执行多个编码回合(例如,在改变预测、变换参数和量化参数中的一者或多者的同时执行编码)。比特流的率失真或其他系统参数可以基于重构的视频块的评估来优化。此外,重构视频块可被存储并用作预测后续块的参考。
如上所述,可以使用帧内预测来编码视频块。帧内预测处理单元212可被配置为针对待编码视频块选择帧内预测模式。帧内预测处理单元212可被配置为评估帧和/或其区域并且确定用以对当前块进行编码的帧内预测模式。如图6所示,帧内预测处理单元212将帧内预测数据(例如,语法元素)输出到熵编码单元218和变换系数生成器204。如上所述,对残差数据执行的变换可以取决于模式。如上所述,可能的帧内预测模式可以包括平面预测模式、DC预测模式和角度预测模式。此外,在一些示例中,可以从用于亮度预测模式的帧内预测推断出对色度分量的预测。帧间预测处理单元214可被配置为针对当前视频块执行帧间预测编码。帧间预测处理单元214可被配置为接收源视频块并且计算视频块的PU的运动矢量。运动矢量可以指示当前视频帧内的视频块的PU(或类似的编码结构)相对于参考帧内的预测块的位移。帧间预测编码可以使用一个或多个参考图片。此外,运动预测可以是单向预测(使用一个运动向量)或双向预测(使用两个运动向量)。帧间预测处理单元214可被配置为通过计算由例如绝对差之和(SAD)、平方差之和(SSD)或其他差值度量确定的像素差来选择预测块。如上所述,可以根据运动矢量预测来确定和指定运动矢量。如上所述,帧间预测处理单元214可被配置为执行运动矢量预测。帧间预测处理单元214可被配置为使用运动预测数据生成预测块。例如,帧间预测处理单元214可定位帧缓冲器内的预测视频块(图6中未示出)。应当指出的是,帧间预测处理单元214可以进一步被配置为将一个或多个内插滤波器应用于重构残差块,以计算用于运动估计的子整数像素值。帧间预测处理单元214可将所计算的运动矢量的运动预测数据输出到熵编码单元218。如图6所示,帧间预测处理单元214可经由滤波器单元216接收重构的视频块。
如图6所示,滤波器单元216接收重构的视频块和编码参数,并且输出已修改的重构视频数据。滤波器单元216可被配置为执行解块、样本自适应偏移(SAO)滤波、自适应环路滤波(ALF)等。SAO滤波是一种可用于通过向重构视频数据添加偏移以改善重构的非线性振幅映射。应当指出的是,如图5所示,帧内预测处理单元212和帧间预测处理单元214可以经由滤波器单元216接收修改的重构视频块。熵编码单元218接收量化的变换系数和预测语法数据(即,帧内预测数据和运动预测数据)。熵编码单元218可以被配置为根据本文所述的技术中的一种或多种技术执行熵编码。
图7是示出根据本公开的一种或多种技术的可被配置为对视频数据进行解码的视频解码器的示例的框图。在一个示例中,视频解码器300可被配置为基于上文所述的技术中的一种或多种技术来重构视频数据。也就是说,视频解码器300可以与上述视频编码器200互逆的方式操作。视频解码器300可被配置为执行帧内预测解码和帧间预测解码,并且因此可被称为混合解码器。在图7所示的示例中,视频解码器300包括熵解码单元302、逆量化单元304、逆变换处理单元306、帧内预测处理单元308、帧间预测处理单元310、求和器312、滤波器单元314和参考缓冲器316。视频解码器300可被配置为以与视频编码系统一致的方式对视频数据进行解码,该视频编码系统可以实现视频编码标准的一个或多个方面。应当指出的是,尽管示出的示例性视频解码器300具有不同的功能块,但此类图示旨在用于描述目的,并且不将视频解码器300和/或其子部件限制为特定的硬件或软件架构。可使用硬件、固件和/或软件具体实施的任何组合来实现视频解码器300的功能。
如图7所示,熵解码单元302接收熵编码的比特流。熵解码单元302可被配置为根据与熵编码过程互逆的过程对来自比特流的量化语法元素和量化系数进行解码。熵解码单元302可被配置为根据上文所述的任何熵编码技术来执行熵解码。熵解码单元302可以与视频编码标准一致的方式解析编码的比特流。视频解码器300可被配置为解析编码的比特流,其中该编码的比特流基于上述技术生成。
再次参考图7,逆量化单元304从熵解码单元302接收量化变换系数(即,位阶值)和量化参数数据。量化参数数据可以包括上述增量QP值和/或量化组大小值等的任意组合和全部组合。视频解码器300和/或逆量化单元304可被配置为基于由视频编码器发送信号通知的值和/或通过视频属性和/或编码参数来确定用于逆量化的QP值。也就是说,逆量化单元304可以与上述系数量化单元206互逆的方式操作。例如,逆量化单元304可被配置为根据上述技术推断预先确定的值)、允许的量化组大小、导出量化参数等。逆量化单元304可被配置为应用逆量化。逆变换处理单元306可被配置为执行逆变换以生成重构残差数据。由逆量化单元304和逆变换处理单元306分别执行的技术可类似于由上述逆量化/变换处理单元208执行的技术。逆变换处理单元306可被配置为应用逆DCT、逆DST、逆整数变换、不可分二次变换(NSST)或概念上类似的逆变换过程来变换系数,以便产生像素域中的残差块。此外,如上所述,是否执行特定变换(或特定变换的类型)可以取决于帧内预测模式。如图7所示,可将重构残差数据提供给求和器312。求和器312可以将重构残差数据添加到预测视频块并且生成重构视频数据。可根据预测视频技术(即帧内预测和帧间预测)确定预测视频块。
帧内预测处理单元308可被配置为接收帧内预测语法元素并且从参考缓冲器316检索预测视频块。参考缓冲器316可以包括被配置为存储一个或多个视频数据帧的存储器设备。帧内预测语法元素可识别帧内预测模式,诸如上述的帧内预测模式。在一个示例中,帧内预测处理单元308可以使用根据本文所述的帧内预测编码技术中的一种或多种技术来重构视频块。帧间预测处理单元310可接收帧间预测语法元素并生成运动矢量,以识别存储在参考缓冲器316中的一个或多个参考帧中的预测块。帧间预测处理单元310可以生成运动补偿块,可能基于内插滤波器执行内插。用于具有子像素精度的运动估计的内插滤波器的标识符可以包括在语法元素中。帧间预测处理单元310可以使用内插滤波器来计算参考块的子整数像素的内插值。滤波器单元314可被配置为对重构的视频数据执行滤波。例如,滤波器单元314可被配置为执行解块和/或SAO滤波,如上面关于滤波器单元216所描述的。此外,应当指出的是,在一些示例中,滤波器单元314可被配置为执行专用的任意滤波(例如,视觉增强)。如图7所示,视频解码器300可以输出重构的视频块。这样,视频解码器300表示设备的示例,该设备被配置为:至少部分地基于分段线性函数来确定当前视频块的色度分量的量化参数,并且基于所确定的量化参数来执行量化。
在一个或多个示例中,所述功能可以通过硬件、软件、固件或它们的任何组合来实现。如果以软件实现,则可将功能作为一个或多个指令或代码存储在计算机可读介质上或经由计算机可读介质上传输,并且由基于硬件的处理单元执行。计算机可读介质可以包括对应于有形介质诸如数据存储介质的计算机可读存储介质,或者包括例如根据通信协议促进计算机程序从一个地方传输到另一个地方的任何介质的传播介质。这样,计算机可读介质通常可以对应于:(1)非暂态的有形计算机可读存储介质,或者(2)通信介质诸如信号或载波。数据存储介质可以是可以由一个或多个计算机或一个或多个处理器访问以检索用于实现本公开中所述的技术的指令、代码和/或数据结构的任何可用介质。计算机程序产品可以包括计算机可读介质。
以举例而非限制的方式,此类计算机可读存储介质可以包括RAM、ROM、EEPROM、CD-ROM或其他光盘存储设备、磁盘存储设备或其他磁存储设备、闪存存储器、或者可用于存储指令或数据结构形式的所需程序代码并且可由计算机访问的任何其他介质。而且,任何连接都被适当地称为计算机可读介质。例如,如果使用同轴电缆、光纤电缆、双绞线、数字用户线路(DSL)或无线技术诸如红外线、无线电和微波从网站、服务器或其他远程源传输指令,则同轴电缆、光纤电缆、双绞线、DSL或无线技术诸如红外线、无线电和微波都包含在介质的定义中。然而,应当理解,计算机可读存储介质和数据存储介质不包括连接、载波、信号或其他暂态介质,而是针对非暂态有形存储介质。如本文所用,磁盘和光盘包括压缩光盘(CD)、激光盘、光学光盘、数字通用光盘(DVD)、软磁盘及Blu-ray光盘,其中磁盘通常以磁性方式复制数据,而光盘则利用激光以光学方式复制数据。上述的组合也应该被包括在计算机可读介质的范围内。
可以由一个或多个处理器诸如一个或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其他等效集成或离散逻辑电路执行指令。因此,如本文所用的术语“处理器”可以指任何前述结构或适用于实现本文所描述的技术的任何其他结构。此外,在一些方面中,可以在被配置用于编码和解码的专用硬件和/或软件模块内提供本文所述的功能,或者将其结合到组合编解码器中。而且,这些技术可以完全在一个或多个电路或逻辑元件中实现。
本公开的技术可以在各种设备或装置包括无线手机、集成电路(IC)或IC集(例如,芯片集)中实现。在本公开中描述了各种部件、模块或单元,以强调被配置为执行所公开的技术的设备的功能方面,但是不一定需要通过不同的硬件单元来实现。相反,如上所述,可以将各种单元组合在编解码器硬件单元中,或者通过互操作硬件单元包括如上所述的一个或多个处理器的集合,结合合适的软件和/或固件来提供各种单元。
此外,每个上述实施方案中所使用的基站设备和终端设备的每个功能块或各种特征可通过电路(通常为一个集成电路或多个集成电路)实现或执行。被设计为执行本说明书中所述的功能的电路可以包括通用处理器、数字信号处理器(DSP)、专用或通用集成电路(ASIC)、现场可编程门阵列(FPGA)或其他可编程逻辑设备、分立栅极或晶体管逻辑器或分立硬件部件或它们的组合。通用处理器可以是微处理器,或另选地,该处理器可以是常规处理器、控制器、微控制器或状态机。通用处理器或上述每种电路可由数字电路进行配置,或可由模拟电路进行配置。此外,当由于半导体技术的进步而出现制成取代当前集成电路的集成电路的技术时,也能够使用通过该技术生产的集成电路。
已经描述了各种示例。这些示例和其他示例在以下权利要求的范围内。
<发明内容>
在一个示例中,一种对视频数据进行编码的方法,该方法包括:至少部分地基于分段线性函数来确定当前视频块的色度分量的量化参数;以及基于所确定的量化参数来执行量化。
在一个示例中,该方法还包括发送信号通知参数集中的分段线性函数。
在一个示例中,根据该方法,其中至少部分地基于分段线性函数来确定当前视频块的色度分量的量化参数包括解析来自参数集的定义分段线性函数的语法元素。
在一个示例中,一种用于对视频数据进行编码的设备,该设备包括被配置为执行这些步骤的任意和全部组合的一个或多个处理器。
在一个示例中,提供了一种设备,其中该设备包括视频编码器。
在一个示例中,提供了一种设备,其中该设备包括视频解码器。
在一个示例中,一种系统,该系统包括:设备,该设备包括视频编码器;并且该设备包括视频解码器。
在一个示例中,一种用于对视频数据进行编码的装置,该装置包括用于执行步骤的任意和全部组合的装置。
在一个示例中,一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质包括存储在其上的指令,当这些指令被执行时,使得用于编码视频数据的设备的一个或多个处理器执行步骤的任意和全部组合。
在一个示例中,一种对视频数据进行解码的方法,该方法包括:解码指定用于描述参数集中的量化参数映射表的点数的语法元素;解码该参数集中的量化参数映射表语法元素;以及解码该参数集中的增量量化参数减一语法元素和增量量化参数语法元素,其中:第一枢轴被设置为该量化参数映射表语法元素加26的值,第二枢轴被设置为该第一枢轴的值与该增量量化参数减一语法元素加一的值的总和,并且通过使用该第二枢轴、指定用于描述该量化参数映射表的点数的该语法元素和该增量量化参数语法元素来导出该量化参数映射表。
在一个示例中,该方法还包括:通过使用量化参数来导出色度量化参数;以及通过使用由该色度量化参数限定的该量化参数映射表来导出蓝色色度量化参数。
在一个示例中,一种对视频数据进行编码的方法,该方法包括:编码指定用于描述参数集中的量化参数映射表的点数的语法元素;编码该参数集中的量化参数映射表语法元素;以及编码该参数集中的增量量化参数减一语法元素和增量量化参数语法元素,其中:第一枢轴被设置为该量化参数映射表语法元素加26的值,第二枢轴被设置为该第一枢轴的值与该增量量化参数减一语法元素加一的值的总和,并且通过使用该第二枢轴、指定用于描述该量化参数映射表的点数的该语法元素和该增量量化参数语法元素来导出该量化参数映射表。
在一个示例中,一种用于对编码数据进行解码的设备,该设备包括:处理器,和与该处理器相关联的存储器;其中该处理器被配置为执行以下步骤:解码指定用于描述参数集中的量化参数映射表的点数的语法元素;解码该参数集中的量化参数映射表语法元素;以及解码该参数集中的增量量化参数减一语法元素和增量量化参数语法元素,其中:第一枢轴被设置为该量化参数映射表语法元素加26的值,第二枢轴被设置为该第一枢轴的值与该增量量化参数减一语法元素加一的值的总和,并且通过使用该第二枢轴、指定用于描述该量化参数映射表的点数的该语法元素和该增量量化参数语法元素来导出该量化参数映射表。
在一个示例中,一种用于对视频数据进行编码的设备,该设备包括:处理器,和与该处理器相关联的存储器;其中该处理器被配置为执行以下步骤:编码指定用于描述参数集中的量化参数映射表的点数的语法元素;编码该参数集中的量化参数映射表语法元素;以及编码该参数集中的增量量化参数减一语法元素和增量量化参数语法元素,其中:第一枢轴被设置为该量化参数映射表语法元素加26的值,第二枢轴被设置为该第一枢轴的值与该增量量化参数减一语法元素加一的值的总和,并且通过使用该第二枢轴、指定用于描述该量化参数映射表的点数的该语法元素和该增量量化参数语法元素来导出该量化参数映射表。
<交叉引用>
本非临时专利申请根据《美国法典》第35卷第119节(35U.S.C.§119)要求于2019年6月23日提交的临时申请62/865,275、2019年6月25日提交的临时申请62/866,588、2019年7月8日提交的临时申请62/871,535、2019年9月23日提交的临时申请62/904,392的优先权,其全部内容据此以引用方式并入。

Claims (5)

1.一种对视频数据进行解码的方法,所述方法包括:
解码指定用于描述参数集中的量化参数映射表的点数的语法元素;
解码所述参数集中的量化参数映射表语法元素;以及
解码所述参数集中的增量量化参数减一语法元素和增量量化参数语法元素,
其中:
第一枢轴被设置为所述量化参数映射表语法元素加26的值,
第二枢轴被设置为所述第一枢轴的值与所述增量量化参数减一语法元素加一的值的总和,并且
通过使用所述第二枢轴、指定用于描述所述量化参数映射表的点数的所述语法元素和所述增量量化参数语法元素来导出所述量化参数映射表。
2.根据权利要求1所述的方法,还包括:
通过使用量化参数来导出色度量化参数;以及
通过使用由所述色度量化参数限定的所述量化参数映射表来导出蓝色色度量化参数。
3.一种对视频数据进行编码的方法,所述方法包括:
编码指定用于描述参数集中的量化参数映射表的点数的语法元素;
编码所述参数集中的量化参数映射表语法元素;以及
编码所述参数集中的增量量化参数减一语法元素和增量量化参数语法元素,
其中:
第一枢轴被设置为所述量化参数映射表语法元素加26的值,
第二枢轴被设置为所述第一枢轴的值与所述增量量化参数减一语法元素加一的值的总和,并且
通过使用所述第二枢轴、指定用于描述所述量化参数映射表的点数的所述语法元素和所述增量量化参数语法元素来导出所述量化参数映射表。
4.一种用于对编码数据进行解码的设备,所述设备包括:
处理器;和
与所述处理器相关联的存储器;其中所述处理器被配置为执行以下步骤:
解码指定用于描述参数集中的量化参数映射表的点数的语法元素;
解码所述参数集中的量化参数映射表语法元素;以及
解码所述参数集中的增量量化参数减一语法元素和增量量化参数语法元素,
其中:
第一枢轴被设置为所述量化参数映射表语法元素加26的值,
第二枢轴被设置为所述第一枢轴的值与所述增量量化参数减一语法元素加一的值的总和,并且
通过使用所述第二枢轴、指定用于描述所述量化参数映射表的点数的所述语法元素和所述增量量化参数语法元素来导出所述量化参数映射表。
5.一种用于对视频数据进行编码的设备,所述设备包括:
处理器;和
与所述处理器相关联的存储器;其中所述处理器被配置为执行以下步骤:
编码指定用于描述参数集中的量化参数映射表的点数的语法元素;
编码所述参数集中的量化参数映射表语法元素;以及
编码所述参数集中的增量量化参数减一语法元素和增量量化参数语法元素,
其中:
第一枢轴被设置为所述量化参数映射表语法元素加26的值,
第二枢轴被设置为所述第一枢轴的值与所述增量量化参数减一语法元素加一的值的总和,并且
通过使用所述第二枢轴、指定用于描述所述量化参数映射表的点数的所述语法元素和所述增量量化参数语法元素来导出所述量化参数映射表。
CN202080045134.9A 2019-06-23 2020-06-17 用于在视频编码中导出视频块的量化参数的系统和方法 Pending CN114026858A (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201962865275P 2019-06-23 2019-06-23
US62/865275 2019-06-23
US201962866588P 2019-06-25 2019-06-25
US62/866588 2019-06-25
US201962871535P 2019-07-08 2019-07-08
US62/871535 2019-07-08
US201962904392P 2019-09-23 2019-09-23
US62/904392 2019-09-23
PCT/JP2020/023854 WO2020262176A1 (en) 2019-06-23 2020-06-17 Systems and methods for deriving quantization parameters for video blocks in video coding

Publications (1)

Publication Number Publication Date
CN114026858A true CN114026858A (zh) 2022-02-08

Family

ID=74060930

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080045134.9A Pending CN114026858A (zh) 2019-06-23 2020-06-17 用于在视频编码中导出视频块的量化参数的系统和方法

Country Status (4)

Country Link
US (1) US20220377338A1 (zh)
EP (1) EP3987810A4 (zh)
CN (1) CN114026858A (zh)
WO (1) WO2020262176A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024104382A1 (zh) * 2022-11-18 2024-05-23 杭州海康威视数字技术股份有限公司 图像编解码方法、装置及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140003497A1 (en) * 2012-07-02 2014-01-02 Microsoft Corporation Control and use of chroma quantization parameter values
WO2016185651A1 (ja) * 2015-05-20 2016-11-24 日本電気株式会社 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラム
CN106664425A (zh) * 2014-06-20 2017-05-10 高通股份有限公司 视频译码中的跨分量预测
CN107852512A (zh) * 2015-06-07 2018-03-27 夏普株式会社 基于亮度转换函数或视频色彩分量值的优化视频编码的系统及方法
WO2018175638A1 (en) * 2017-03-21 2018-09-27 Dolby Laboratories Licensing Corporation Quantization parameter prediction using luminance information
CN109479140A (zh) * 2016-07-15 2019-03-15 高通股份有限公司 在非仅四叉树分割的视频译码中量化信息的发信号

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140003497A1 (en) * 2012-07-02 2014-01-02 Microsoft Corporation Control and use of chroma quantization parameter values
CN106664425A (zh) * 2014-06-20 2017-05-10 高通股份有限公司 视频译码中的跨分量预测
WO2016185651A1 (ja) * 2015-05-20 2016-11-24 日本電気株式会社 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラム
CN107852512A (zh) * 2015-06-07 2018-03-27 夏普株式会社 基于亮度转换函数或视频色彩分量值的优化视频编码的系统及方法
CN109479140A (zh) * 2016-07-15 2019-03-15 高通股份有限公司 在非仅四叉树分割的视频译码中量化信息的发信号
WO2018175638A1 (en) * 2017-03-21 2018-09-27 Dolby Laboratories Licensing Corporation Quantization parameter prediction using luminance information

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024104382A1 (zh) * 2022-11-18 2024-05-23 杭州海康威视数字技术股份有限公司 图像编解码方法、装置及存储介质

Also Published As

Publication number Publication date
US20220377338A1 (en) 2022-11-24
EP3987810A4 (en) 2023-04-19
EP3987810A1 (en) 2022-04-27
WO2020262176A1 (en) 2020-12-30

Similar Documents

Publication Publication Date Title
US20220248007A1 (en) Systems and methods for reducing a reconstruction error in video coding based on a cross-component correlation
US11350083B2 (en) Intra block copy merging data syntax for video coding
CN110313179B (zh) 用于按比例缩放变换系数水平值的系统和方法
US11825120B2 (en) Subblock coding by generalized intra prediction in video coding
CN114600462A (zh) 用于在视频编码中发送信号通知图片信息的系统和方法
CN114097222A (zh) 用于在视频编码中执行自适应分辨率变化的系统和方法
US20200404324A1 (en) Signaling for intra coding of video data
CN112204967A (zh) 用于划分视频数据的帧间预测片段中的视频块的系统和方法
CN111919446B (zh) 解码视频图片中的当前视频块的方法
CN114009026A (zh) 视频译码中的色度量化参数偏移的块级信令
CN114391255B (zh) 用于基于交叉分量相关性来减小视频编码中的重构误差的系统和方法
US20220167009A1 (en) Systems and methods for performing intra prediction coding in video coding
CN112997501B (zh) 导出用于对视频数据进行解码的预测亮度样本值的方法
CN113632489A (zh) 在视频编码中用于发送信号通知图块组信息的系统和方法
CN113170188A (zh) 在视频编码中用于执行帧间预测的系统和方法
US11979566B2 (en) Systems and methods for reducing a reconstruction error in video coding based on a cross-component correlation
CN116325734A (zh) 具有虚拟边界的跨分量样点自适应偏移中的色度编解码增强
CN114424537A (zh) 在视频编码中用于执行帧间预测编码的系统和方法
CN115428447A (zh) 在视频编码中用于执行帧内预测的系统和方法
US11722672B2 (en) Adaptively deriving rice parameter values for high bit-depth video coding
US20220377338A1 (en) Systems and methods for deriving quantization parameters for video blocks in video coding
US12010301B2 (en) Systems and methods for performing intra prediction coding in video coding
US20220360774A1 (en) Systems and methods for performing intra prediction coding in video coding
WO2020095984A1 (en) Systems and methods for performing binary arithmetic coding in video coding
CN113366840A (zh) 用于在视频编码中导出视频块的量化参数的系统和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination