CN115362678A - 动态范围调整参数信令和使能可变位深度支持 - Google Patents

动态范围调整参数信令和使能可变位深度支持 Download PDF

Info

Publication number
CN115362678A
CN115362678A CN202180023921.8A CN202180023921A CN115362678A CN 115362678 A CN115362678 A CN 115362678A CN 202180023921 A CN202180023921 A CN 202180023921A CN 115362678 A CN115362678 A CN 115362678A
Authority
CN
China
Prior art keywords
dra
parsing
parameter set
video
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180023921.8A
Other languages
English (en)
Inventor
D.拉萨诺夫斯基
A.K.拉马苏布拉马尼安
Y.张
M.卡尔切维茨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN115362678A publication Critical patent/CN115362678A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/188Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一种用于处理视频数据的示例设备包括:被配置为存储视频数据的存储器和在电路中实现并被耦接至该存储器的一个或多个处理器。一个或多个处理器被配置为解析第一参数集,第一参数集是针对每个一组已编码图片的序列在比特流数据中被信令通知一次。一个或多个处理器被配置为对第二参数集中的一个或多个动态范围调整(DRA)语法元素进行解析,第二参数集在比特流中被信令通知并与该组已编码图片中的至少一个图片相关,其中对一个或多个DRA语法元素的解析不依赖于第一参数集的任何语法元素;并且基于第一参数集和第二参数集来处理该至少一个图片。

Description

动态范围调整参数信令和使能可变位深度支持
本申请要求于2021年4月8日提交的美国申请第17/225,801号和2020年4月10日提交的美国临时专利申请第63/008,533号的优先权,其全部内容通过引用合并于此。2021年4月8日提交的美国申请第17/225,801号要求于2020年4月10日提交的美国临时专利申请第63/008,533号的权益。
技术领域
本公开涉及视频编码和视频解码。
背景技术
数字视频功能可以被集成到各种各样的设备中,包括数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或台式计算机、平板计算机、电子书阅读器、数码相机、数字记录设备、数字媒体播放器、视频游戏设备、视频游戏控制台、蜂窝或卫星无线电话、所谓的“智能电话”、视频电话会议设备、视频流设备等等。数字视频设备实现视频译码技术,例如那些在由下述定义的标准中描述的技术:MPEG-2、MPEG-4、ITU-T H.263、ITU-TH.264/MPEG-4第10部分、高级视频译码(AVC)、ITU-T H.265/高效视频译码(HEVC)、以及上述各标准的扩展。通过实现这些视频译码技术,上述视频设备可以更有效地对数字视频信息进行发送、接收、编码、解码和/或存储。
视频译码技术包括空间(图片内)预测和/或时间(图片间)预测,以减少或去除视频序列中固有的冗余。对于基于块的视频译码,可以将视频切片(slice)(例如,视频图片或视频图片的一部分)划分为视频块,这些视频块也可以被称为译码树单元(CTU)、译码单元(CU)和/或译码节点。图片的帧内译码的(I)切片中的视频块,使用相对于同一图片中相邻块中参考样点的空间预测进行编码。图片的帧间译码的(P或B)切片中的视频块,可以使用相对于同一图片中相邻块中参考样点的空间预测或者相对于其他参考图片中的参考样点的时间预测。图片可以被称为帧,并且参考图片可以被称为参考帧。
发明内容
总体而言,本公开描述了用于下述信令和操作的技术,这些信令和操作被应用于视频数据以实现一些类型的视频数据(例如高动态范围(HDR)和广色域(WCG)视频数据)的更高效压缩。更具体地,本公开描述了用于实施动态范围调整译码工具和去除解析依赖性并使能对具有不同位深度的视频数据的支持的技术。通过去除解析依赖性,本公开的技术可以实现对不同参数集的独立解析,从而改善解码延迟。
在一个示例中,一种方法包括:对第一参数集进行解析,第一参数集针对每个一组已编码图片的序列在已编码视频数据的比特流中被信令通知一次;对第二参数集中的一个或多个动态范围调整(DRA)语法元素进行解析,第二参数集在已编码视频数据的比特流中被信令通知并且与该组的已编码图片中的至少一个图片相关,其中对一个或多个DRA语法元素的解析不依赖于第一参数集的任何语法元素;以及基于第一参数集和第二参数集来处理该至少一个图片。
在另一示例中,一种用于处理视频数据的设备包括:被配置为存储视频数据的存储器;以及在电路中实现并耦接至存储器的一个或多个处理器。一个或多个处理器被配置为:对第一参数集进行解析,第一参数集针对每个一组已编码图片的序列在已编码视频数据的比特流中被信令通知一次;对第二参数集中的一个或多个动态范围调整(DRA)语法元素进行解析,第二参数集在已编码视频数据的比特流中被信令通知并且与该组的已编码图片中的至少一个图片相关,其中对一个或多个DRA语法元素的解析不依赖于第一参数集的任何语法元素;以及基于第一参数集和第二参数集来处理该至少一个图片。
在另一示例中,一种非暂存性计算机可读存储介质被以指令编码。上述指令在被执行时,使得一个或多个处理器:对第一参数集进行解析,第一参数集针对每个一组已编码图片的序列在已编码视频数据的比特流中被信令通知一次;对第二参数集中的一个或多个动态范围调整(DRA)语法元素进行解析,第二参数集在已编码视频数据的比特流中被信令通知并且与该组的已编码图片中的至少一个图片相关,其中对一个或多个DRA语法元素的解析不依赖于第一参数集的任何语法元素;以及基于第一参数集和第二参数集来处理该至少一个图片。
在另一示例中,一种用于处理视频数据的设备包括:对第一参数集进行解析的部件,第一参数集针对每个一组已编码图片的序列在已编码视频数据的比特流中被信令通知一次;对第二参数集中的一个或多个动态范围调整(DRA)语法元素进行解析的部件,第二参数集在已编码视频数据的比特流中被信令通知并且与该组的已编码图片中的至少一个图片相关,其中对一个或多个DRA语法元素的解析不依赖于第一参数集的任何语法元素;以及基于第一参数集和第二参数集来处理该至少一个图片的部件。
在以下附图和描述中阐明了一个或多个示例的细节。根据说明书、附图和权利要求书,其他特征、目的和优势将是显而易见的。
附图说明
图1是示出可以执行本公开的技术的一种示例视频编码和解码系统的框图。
图2是示出可以执行本公开的技术的一种示例视频编码器的框图。
图3是示出可以执行本公开的技术的一种示例视频解码器的框图。
图4时示出人类视觉和显示能力的概念图。
图5是示出色域的概念图。
图6是示出HDR/WCG表示转换的示例的框图。
图7是示出逆HDR/WCG转换的示例的框图。
图8是示出一种传递函数的示例的概念图。
图9是示出另一种示例传递函数的可视化的概念图。
图10是示出一种亮度驱动的色度缩放(LCS)函数的示例的概念图。
图11是示出一种将Qpc指定为qPi的函数的示例表的概念图。
图12是示出一种HDR缓存器模型的示例的概念图。
图13是一种包括DRA单元的视频编码器和视频解码器系统的框图。
图14是示出根据本公开的动态范围调整参数解析技术的流程图。
图15是示出视频编码的示例的流程图。
图16是示出视频解码的示例的流程图。
具体实施方式
在一些草案视频编码标准中,在一个参数集和另一参数集之间可以存在解析依赖性。例如,对图片参数集(PPS)或自适应参数集(APS)中的语法元素的解析可以依赖于序列参数集(SPS)中的语法元素。这种依赖关系是不合需要的,因为参数集通常位于不同的网络抽象层(NAL)单元中并且可以在不同时间到达视频解码器。由于这种依赖关系,如果适用于视频数据的特定块的PPS或APS在适用于该特定块的SPS之前到达视频解码器,则视频解码器必须等到该SPS到达并在解析该PPS或该APS之前解析该SPS。这会导致视频解码器等待SPS到达的情况下的解码延迟。
根据本公开的技术,可以从PPS的DRA语法元素和/或APS的DRA语法元素,与SPS之间去除依赖性。视频解码器可以在接收SPS之前接收PPS和/或APS,并且可以在不等待SPS的情况下解析PPS和/或APS,因为PPS的DRA语法元素和/或APS的DRA语法元素不会依赖于SPS内的任何语法元素。以这种方式,与一个参数集依赖于另一参数集中的语法元素的情况相比,解码延迟被减少。
图1是示出可以执行本公开的技术的一种示例视频编码和解码系统100的框图。本公开的技术通常针对译码(编码和/或解码)视频数据。通常,视频数据包括用于处理视频的任何数据。因而,视频数据可以包括原始的、未编码的视频,已编码视频,已解码(例如,重建的)视频以及视频元数据,例如信令数据。
如图1所示,在本示例中,系统100包括源设备102,源设备102提供将要由目标设备116解码和显示的已编码视频数据。具体地,源设备102经由计算机可读介质110向目标设备116提供视频数据。源设备102和目标设备116可以包括多种设备中的任何设备,包括台式计算机、笔记本(即,膝上型)电脑、平板电脑、机顶盒、例如智能电话的电话手机、电视、相机、显示设备、数字媒体播放器、视频游戏控制台、视频流设备等。在某些情况下,源设备102和目标设备116被配置用于无线通信,并且因此被称为无线通信设备。
在图1的示例中,源设备102包括视频源104、存储器106、视频编码器200和输出接口108。目标设备116包括输入接口122、视频解码器300、存储器120和显示设备118。根据本公开,源设备102的视频编码器200和目标设备116的视频解码器300可以被配置为应用用于实现动态范围调整译码工具和去除解析依赖性并使能具有不同位深度的视频数据的支持的技术。因而,源设备102表示视频编码设备的示例,而目标设备116表示视频解码设备的示例。在其他示例中,源设备和目标设备可以包括其他组件或布置。例如,源设备102可以从诸如外部相机的外部视频源接收视频数据。同样地,目标设备116可以与外部显示设备连接,而不是包括集成显示设备。
图1中所示的系统100仅仅是一个示例。总的来说,任何数字视频编码和/或解码设备都可以执行用于实现动态范围调整译码工具和去除解析依赖性并使能具有不同位深度的视频数据的支持的技术。源设备102和目标设备116仅仅是这些译码设备的示例,其中,源设备102生成经编码的视频数据以传输到目标设备116。本公开将“译码”设备称为进行数据的译码(编码和/或解码)的设备。因此,视频编码器200和视频解码器300表示译码设备的示例,具体分别表示视频编码器的示例和视频解码器的示例。在某些示例中,源设备102和目标设备116可以以基本对称的方式运行,使得源设备102和目标设备116中的每一个都包括视频编码组件和视频解码组件。因此,系统100可以支持视频源设备102和目标设备116之间的单向或双向视频传输,例如,用于视频流式传输、视频回放、视频广播或视频电话。
通常,视频源104表示视频数据(即,原始的、未编码的视频数据)的源,并将视频数据的连续系列的图片(也称为“帧”)提供给视频编码器200。视频编码器200为这些图片编码数据。源设备102的视频源104可以包括例如摄像机的视频捕获设备,包含先前捕获的原始视频的视频档案,和/或用于从视频内容提供者接收视频的视频馈送接口。作为另一可替换方案,视频源104可以生成基于计算机图形的数据作为源视频,或者实时视频、存档视频和计算机生成的视频的组合。在每种情况下,视频编码器200都对捕获到的视频数据、预捕获到的视频数据或计算机生成的视频数据进行编码。视频编码器200可以将图片从接收顺序(有时称为“显示顺序”)重新排列为用于译码的译码顺序。视频编码器200可以生成包括已编码视频数据的比特流。之后,源设备102可以经由输出接口108将已编码视频数据输出到计算机可读介质110上,以用于通过例如目标设备116的输入接口122的接收和/或检索。
源设备102的存储器106和目标设备116的存储器120表示通用存储器。在某些示例中,存储器106和存储器120可以存储原始视频数据,例如,来自视频源104的原始视频和来自视频解码器300的原始的、已解码的视频数据。另外或可替换地,存储器106和存储器120可以存储可分别由例如视频编码器200和视频解码器300执行的软件指令。尽管在本示例中存储器106和存储器120被与视频编码器200和视频解码器300分离地被示出,但应该理解的是,视频编码器200和视频解码器300还可以包括内部存储器,以实现功能上相似或等效的目的。此外,存储器106和存储器120可以存储例如从视频编码器200输出并输入到视频解码器300的已编码视频数据。在某些示例中,存储器106和存储器120的部分可以被分配为一个或多个视频缓存器,例如,以存储原始视频数据、已解码视频数据和/或已编码视频数据。
计算机可读介质110可以表示能够将已编码视频数据从源设备102传输到目标设备116的任何类型的介质或设备。在一个示例中,计算机可读介质110表示使得源设备102,例如经由射频网络或基于计算机的网络,实时地将已编码视频数据直接发送到目标设备116的通信介质。根据诸如无线通信协议的通信标准,输出接口108可以对包括已编码视频数据的传输信号进行解调,并且输入接口122可以对接收到的传输信号进行解调。通信介质可以包括任何无线或有线通信介质,例如射频(RF)频谱或一条或更多条物理传输线。通信介质可以形成基于分组的网络的部分,诸如局域网、广域网或诸如互联网的全球网络。通信介质可以包括路由器、交换机、基站或任何其他有助于从源设备102到目标设备116的通信的装备。
在某些示例中,源设备102可以将已编码数据从输出接口108输出到存储设备112。类似地,目标设备116可以经由输入接口122访问来自存储设备112的已编码数据。存储设备112可以包括多种分布式的或本地访问的数据的存储媒介中的任何一种,例如硬盘驱动器、Blu-ray光盘、DVD、CD-ROM、闪存、易失性或非易失性存储器、或用于存储已编码视频数据的任何其他合适的数字存储媒介。
在某些示例中,源设备102可以将已编码视频数据输出到文件服务器114或可以存储由源设备102生成的已编码视频数据的另一中间存储设备。目标设备116可以以流式或下载的方式来访问文件服务器114所存储的视频数据。文件服务器114可以是能够存储已编码视频数据并能将所述已编码视频数据发送至目标设备116的任何类型的服务器设备。文件服务器114可以表示web服务器(例如,用于网站)、文件传输协议(FTP)服务器、内容分发网络设备或网络连接式存储(NAS)设备。目标设备116可以通过包括互联网连接的任何标准数据连接来访问文件服务器114的已编码视频数据。这可以包括无线信道(例如Wi-Fi连接)、有线连接(例如数字用户线缆(DSL)、电缆调制解调器等)、或者二者的组合,该组合适合于访问存储在文件服务器114上的已编码视频数据。文件服务器114和输入接口122可以被配置为根据流传输协议、加载传输协议(、或以上各项的组合来运行。
输出接口108和输入接口122可以表示无线发送器/接收器、调制解调器、有线网络组件(例如以太网卡)、根据多种IEEE 802.11标准中的任一种运行的无线通信组件、或其他物理组件。在输出接口108和输入接口122包括无线组件的示例中,输出接口108和输入接口122可以被配置为根据蜂窝通信标准来传送例如已编码视频数据的数据,蜂窝通信标准包括例如4G、4G-LTE(长期演进)、LTE Advanced、5G等等。在输出接口108包括无线发送器的某些示例中,输出接口108和输入接口122可以被配置为根据其他无线标准来传送例如已编码视频数据的数据,其他无线标准包括IEEE 802.11规范、IEEE 802.15规范(例如ZigBeeTM)、BluetoothTM标准等等。在某些示例中,源设备102和/或目标设备116可以包括相应的片上系统(SoC)设备。例如,源设备102可以包括执行分发给视频编码器200和/或输出接口108的功能的SoC设备,而目标设备116可以包括执行分发给视频解码器300和/或输入接口122的功能的SoC设备。
可以将本公开的技术应用于支持多种多媒体应用中任一种视频译码,多媒体应用包括例如空中电视广播、有线电视传输、卫星电视传输、互联网流视频传输,例如基于HTTP的动态自适应流(DASH)、编码至数据存储介质上的数字视频、存储于数据存储介质上的数字视频的解码、或其他应用。
目标设备116的输入接口122接收来自计算机可读介质110(例如,通信介质、存储设备112、文件服务器114等)的已编码视频比特流。已编码视频比特流可以包括由视频编码器200定义的信令信息,该信令信息也被视频解码器300使用,例如具有描述视频块或其他已译码单元(例如,切片、图片、图片组、序列等)的特征和/或处理的值的语法元素。显示设备118向用户显示已解码视频数据的已解码图片。显示设备118可以表示多种显示设备中的任何一种,多种显示设备例如液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一种类显示设备。
虽然图1中未示出,在某些示例中,视频编码器200和视频解码器300分别可以与音频编码器和/或音频解码器集成在一起,并且可以包括适当的MUX-DEMUX单元或其他硬件和/或软件,以处理包括普通数据流中的音频和视频两者的复用流。如果适用,则MUX-DEMUX单元可以遵循ITU H.223多路复用器协议或例如用户数据报协议(UDP)的其他协议。
视频编码器200和视频解码器300均可以实现为多种合适的编码器和/或解码器电路中的任何一种,上述多种合适的编码器和/或解码器电路例如包括:一个或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或以上各种电路的任意组合。在使用软件部分地实现上述技术的情况下,设备可以将用于软件的指令存储在合适的非暂时性计算机可读介质中,并在使用一个或多个处理器的硬件中执行这些指令,以进行本公开的技术。视频编码器200和视频解码器300中的每一个可以被包括在一个或多个编码器或解码器中,视频编码器200和视频解码器300中的任一个可以被集成为相应设备中的组合编码器/解码器(CODEC)的一部分。包括视频编码器200和/或视频解码器300的设备可以包括集成电路、微处理器和/或无线通信设备,例如蜂窝电话。
视频编码器200和视频解码器300可以根据诸如ITU-T H.265(也称为高效视频译码(HEVC))或其扩展(例如多视图和/或可缩放视频译码扩展)的视频译码标准来运行。可替换地,视频编码器200和视频解码器300可以根据诸如ITU-T H.266(也称为通用视频编码(VVC))的其他专有或工业标准运行。2020年1月7日至17日在比利时(BE)的布鲁塞尔(Brussels)举办的ITU-T SG 16WP 3和ISO/IEC JTC 1/SC 29/WG 11的联合视频专家组(JVET)第17次会议提案的JVET-Q2001-vE章节中的Bross等人的“Versatile Video Coding(草案8)”描述了VVC标准的最新草案(以下简称“VVC草案8”)。可替换地,视频编码器200可以根据MPEG-5增强视频译码(EVC)运行。然而,本公开的技术不限于任何特定的译码标准。
通常,视频编码器200和视频解码器300可以执行基于块的图片译码。术语“块”通常是指包括待处理的(例如,已编码的、已解码的、或者在编码和/或解码过程中使用的)数据的结构。例如,块可以包括亮度和/或色度数据的样点的二维矩阵。通常,视频编码器200和视频解码器300可以对以YUV(例如,Y,Cb,Cr)格式表示的视频数据进行译码。也就是说,视频编码器200和视频解码器300不是对图片的样点的红、绿和蓝(RGB)数据进行译码,而是可以对亮度和色度分量进行译码,其中色度分量可以包括红色色度分量和蓝色色度分量两者。在某些示例中,视频编码器200在编码之前将接收到的RGB格式的数据转换成YUV表示,而视频解码器300将YUV表示转换成RGB格式。可替换地,预处理单元和后处理单元(未示出)可以执行这些转换。
本公开通常可以指图片的译码(例如,编码和解码),以包括对该图片的数据进行编码或解码的过程。类似地,本公开可以指对图片的块的译码,以包括对块的数据进行编码或解码的过程,例如,预测和/或残差译码。已编码视频比特流通常包括用于语法元素(syntax elements)的一系列值,这些语法元素表示译码决策(例如,译码模式)和图片到块的划分方式。因此,通常应该将对图片或块进行译码的描述理解为用于形成该图片或块的语法元素的译码值。
HEVC定义了各种块,包括译码单元(CU)、预测单元(PU)、和变换单元(TU)。根据HEVC,视频译码器(例如,视频编码器200)根据四叉树结构将译码树单元(CTU)划分为CU。也就是说,该视频译码器将CTU和CU划分为四个相等的且不重叠的正方形,并且该四叉树的每个节点具有零个或四个子节点。没有子节点的节点可以被称为“叶节点”,并且这种叶节点的CU可以包括一个或多个PU和/或一个或多个TU。视频译码器可以对PU和TU进行进一步划分。例如,在HEVC中,残差四叉树(RQT)表示TU的划分。在HEVC中,PU表示帧间预测数据,而TU表示残差数据。帧内预测所得的CU包括帧内预测信息,例如帧内模式指示。
作为另一示例,视频编码器200和视频解码器300可以被配置为根据VVC运行。根据VVC,视频译码器(例如,视频编码器200)将图片划分为多个译码树单元(CTU)。视频编码器200可以根据树结构对CTU进行划分,该树结构包括诸如四叉树-二叉树(QTBT)结构或多类型树(MTT)结构。QTBT结构取消了多种划分类型的概念,例如HEVC的CU、PU和TU之间的区别。QTBT结构包括两个级别:根据四叉树划分进行划分所获得的第一级,以及根据二叉树划分进行划分所获得的第二级。该QTBT结构的根节点对应于CTU。二叉树的叶节点对应于译码单元(CU)。
在MTT划分结构中,可以利用四叉树(QT)划分、二叉树(BT)划分以及一种或更多种三叉树(TT)(也称为三分树(TT))划分对各块进行划分。在三叉或三分树划分中,将块分割为三个子块。在某些示例中,三叉或三分树划分以不通过中心对原始块进行划分的方式将块划分为三个子块。MTT中的划分类型(例如QT、BT和TT)可以是对称的,也可以是不对称的。
在某些示例中,视频编码器200和视频解码器300可以使用单个QTBT或MTT结构来表示亮度分量和色度分量中的每一个。而在其他示例中,视频编码器200和视频解码器300可以使用两个或更多个QTBT或MTT结构,例如一个QTBT/MTT结构用于亮度分量而另一个QTBT/MTT结构用于两个色度分量(或者两个QTBT/MTT结构用于相应的色度分量)。
视频编码器200和视频解码器300可以被配置为使用基于HEVC的四叉树划分、QTBT划分、MTT划分、或其他划分结构。为了说明的目的,基于QTBT划分对本公开的技术进行了描述。然而,应该理解的是,本公开的技术还可以应用于配置为使用四叉树划分或其它类型的划分的视频译码器。
在某些示例中,CTU包括亮度样点的译码树块(CTB)、具有三个样点阵列的图片的色度样点的两个对应的CTB、或者单色图片的或通过使用三个独立的颜色平面和用于对样点进行译码的语法结构被译码的图片的样点的CTB。对于N的某个值,CTB可以是N×N的样点块,以使得分量到CTB的划分是一种划分。分量是阵列、或者是组成颜色格式为4:2:0、4:2:2或4:4:4的图片的三个阵列(亮度和两个色度)中的一个阵列的单个样点,或者是组成单色格式的图片的阵列或阵列中的单个样点。在某些示例中,对于M和N的某些值,译码块是M×N的样点块,以使得CTB到译码块的划分是一种划分。
可以以多种方式对图片中的各个块(例如,CTU或CU)进行分组。作为一个示例,砖块(brick)指图片中特定图块(tile)内的CTU行的矩形区域。图块是图片中的特定图块列和特定图块行内的CTU组成的矩形区域。图块列是指CTU组成的矩形区域,该矩形区域的高度等于图片的高度,其宽度(例如,诸如在图片参数集中)由语法元素指定。图块行是指CTU组成的矩形区域,该矩形区域的高度(例如,诸如在图片参数集中)由语法元素指定,其宽度等于图片的宽度。
在某些示例中,可以将图块划分为多个砖块,每个砖块包括该图块内的一个或多个CTU行。没有被划分为多个砖块的图块也可以称为砖块。但是,作为图块的真子集的砖块不能称为图块。
图片中的砖块也可以排列于切片中。切片可以是图片的可以排他包含在单个网络抽象层(NAL)单元中的整数个砖块。在某些示例中,切片包括多个完整的图块或仅包括一个图块的连续序列的完整砖块。
本公开可以互换地使用“N×N”和“N乘N”来指代块(例如CU或其他视频块)在垂直维度和水平维度上的样点维度,例如16×16样点或16乘16样点。通常,16×16的CU在垂直方向上会有16个样点(y=16),并且在水平方向上会有16个样点(x=16)。同样地,N×N的CU通常在垂直方向上具有N个样点并且在水平方向上也具有N个样点,其中N表示非负的整数值。CU中的样点可以以行和列的方式排列。此外,CU在水平方向上的样点数量不必与垂直方向上的样点数量相同。举例来说,CU可以包括N×M个样点,其中M不必要等于N。
视频编码器200对表示预测和/或残差信息以及其他信息的CU的视频数据进行编码。预测信息指示将如何对该CU进行预测以便形成针对该CU的预测块。残差信息通常表示预测块与编码之前的CU样点之间的逐样点差值。
为了预测CU,视频编码器200通常可以通过帧间预测或帧内预测来形成用于CU的预测块。帧间预测通常指根据先前已译码的图片的数据来预测CU,而帧内预测通常指根据同一图片的先前已译码的数据来预测CU。为了执行帧间预测,视频编码器200可使用一个或多个运动向量来生成预测块。视频编码器200通常可以进行运动搜索,例如,根据CU与参考块之间的差,来识别与CU紧密匹配的参考块。视频编码器200可以使用绝对差值和(SAD)、平方差值和(SSD)、平均绝对差(MAD)、均方差(MSD)或其他此类差值计算来计算差值度量,以确定参考块是否紧密匹配当前CU。在某些示例中,视频编码器200可以使用单向预测或双向预测来预测该当前CU。
VVC和EVC的某些示例还提供可以被认为是帧间预测模式的仿射运动补偿模式。在仿射运动补偿模式中,视频编码器200可以确定表示非平移运动的两个或更多个运动向量,该非平移运动例如为放大或缩小、旋转、透视运动或其他不规则运动类型。
为了进行帧内预测,视频编码器200可以选择帧内预测模式来生成预测块。VVC的某些示例提供了67种帧内预测模式,包括各种方向模式以及平面模式和DC模式。EVC的示例可以提供其他帧内预测模式以及平面模式和DC模式。通常,视频编码器200选择描述根据其预测当前块的样点的当前块(例如,CU的块)的相邻样点的帧内预测模式。假设视频编码器200以光栅扫描顺序(从左到右,从上到下)对CTU和CU进行译码,则相邻样点通常位于同一图片中当前块的上方、左上方、或左侧。
视频编码器200对表示当前块的预测模式的数据进行编码。举例来说,对于帧间预测模式,视频编码器200可以对表示使用多种可用帧间预测模式中的哪一种的数据以及用于对应模式的运动信息进行编码。对于单向或双向帧间预测,例如,视频编码器200可以使用高级运动向量预测(AMVP)或合并模式来对运动向量进行编码。对于仿射运动补偿模式,视频编码器200可以使用类似的模式来对运动向量进行编码。
在诸如块的帧内预测或帧间预测的预测之后,视频编码器200可以计算针对该块的残差数据。残差数据,例如残差块,表示该块与使用对应的预测模式形成的该块的预测块之间的逐样点差值。视频编码器200可以对残差块应用一种或更多种变换,以在变换域而非样点域中生成经变换的数据。举例来说,视频编码器200可以将离散余弦变换(DCT)、整数变换、小波变换或概念上类似的变换应用于残差视频数据。另外,视频编码器200可以在一次变换之后应用二次变换,例如,模式依赖的不可分的二次变换(MDNSST)、信号依赖的变换、Karhunen-Loeve变换(KLT)等。视频编码器200在应用一种或更多种变换之后产生变换系数。
如上所述,在进行任何生成变换系数的变换之后,视频编码器200可以对这些变换系数进行量化。量化通常是指对变换系数进行量化以使得可能减少用于表示该变换系数的数据量,从而提供进一步的压缩。通过进行量化过程,视频编码器200可以减小与变换系数中某些或全部相关联的位深度。例如,视频编码器200可以在量化期间将n位值舍入为m位值,其中n大于m。在某些示例中,为了进行量化,视频编码器200可以对待量化的值进行按位右移。
在量化之后,视频编码器200可以对变换系数进行扫描,从而根据包括已量化变换系数的二维矩阵来生成一维向量。该扫描可以被设计为将较高能量(因此频率较低)的变换系数放在向量的前部,而将较低能量(因此频率较高)的变换系数放在向量的后部。在某些示例中,视频编码器200可以利用预定义的扫描顺序来扫描已量化变换系数以生成串行化的向量,并且然后对该向量的已量化变换系数进行熵编码。在其他示例中,视频编码器200可以进行自适应扫描。在对已量化变换系数进行扫描而形成一维向量之后,视频编码器200可以例如根据上下文自适应二进制算术译码(CABAC)对该一维向量进行熵编码。视频编码器200还可以对描述元数据的语法元素的值进行熵编码,该元数据与视频解码器300在解码视频数据中使用的已编码视频数据相关联。
为了进行CABAC,视频编码器200可以将上下文模型内的上下文分配给要发送的符号。该上下文可以涉及例如该符号的相邻值是否为零值。概率确定可以基于分配给该符号的上下文。
视频编码器200还可以进一步例如在图片标头、块标头、切片标头中生成给视频解码器300的诸如基于块的语法数据、基于图片的语法数据和基于序列的语法数据或生成诸如序列参数集(SPS)、图片参数集(PPS)、视频参数集(VPS)或自适应参数集(APS)的其它语法数据。视频解码器300可以同样解码此类语法数据以确定如何解码对应视频数据。
以这种方式,视频编码器200可以生成比特流。该比特流包括已编码视频数据,例如,描述将图片划分为块(例如,CU)的语法元素以及针对上述块的预测和/或残差信息。最终,视频解码器300可以接收该比特流并对上述已编码视频数据进行解码。
通常,视频解码器300进行与视频编码器200相反的过程,来对比特流的已编码视频数据进行解码。比如,尽管与视频编码器200的CABAC编码过程相反,但视频解码器300可以以大体上相似的方式来使用CABAC以对比特流的语法元素的值进行解码。语法元素可以定义将图片划分为CTU的划分信息、以及根据对应的划分结构(诸如QTBT结构)的每个CTU的划分,从而定义该CTU的CU。语法元素还可以对视频数据的块(例如,CU)的预测和残差信息进行定义。
残差信息可以由例如已量化变换系数表示。视频解码器300可以对块的已量化变换系数进行逆量化和逆变换以重现该块的残差块。视频解码器300使用已信令通知的预测模式(帧内或帧间预测)和相关的预测信息(例如,用于帧间预测的运动信息)来形成该块的预测块。视频解码器300然后可以将该预测块和上述残差块(在逐样点的基础上)进行组合以重现原始块。视频解码器300可以进行附加处理,例如进行解块过程以减少沿着块的边界的视觉伪像。
如将在下文详述的,本发明描述了用于解析语法元素的技术。在某些示例中,本公开描述了用于解析与DRA有关的语法元素的技术,其中不同参数集中的语法元素之间的特定依赖性被去除。在一个示例中,方法包括:解析适用于视频数据的块的SPS;解析适用于该块的第二参数集中的一个或多个DRA语法元素,其中对一个或多个DRA语法元素的解析不依赖于SPS的任何语法元素;以及基于SPS和第二参数集来处理该块。
根据本公开的技术,方法包括:对第一参数集进行解析,第一参数集针对每个一组已编码图片的序列在已编码视频数据的比特流中被信令通知一次;对第二参数集中的一个或多个动态范围调整(DRA)语法元素进行解析,第二参数集在已编码视频数据的比特流中被信令通知并且与该组的已编码图片中的至少一个图片相关,其中对一个或多个DRA语法元素的解析不依赖于第一参数集的任何语法元素;以及基于第一参数集和第二参数集来处理该至少一个图片。
根据本公开的技术,设备包括:被配置为存储视频数据的存储器;以及在电路中实现并耦接至存储器的一个或多个处理器。一个或多个处理器被配置为:对第一参数集进行解析,第一参数集针对每个一组已编码图片的序列在已编码视频数据的比特流中被信令通知一次;对第二参数集中的一个或多个动态范围调整(DRA)语法元素进行解析,第二参数集在已编码视频数据的比特流中被信令通知并且与该组的已编码图片中的至少一个图片相关,其中对一个或多个DRA语法元素的解析不依赖于第一参数集的任何语法元素;以及基于第一参数集和第二参数集来处理该至少一个图片。
根据本公开的技术,设备包括:对第一参数集进行解析的部件,第一参数集针对每个一组已编码图片的序列在已编码视频数据的比特流中被信令通知一次;对第二参数集中的一个或多个动态范围调整(DRA)语法元素进行解析的部件,第二参数集在已编码视频数据的比特流中被信令通知并且与该组的已编码图片中的至少一个图片相关,其中对一个或多个DRA语法元素的解析不依赖于第一参数集的任何语法元素;以及基于第一参数集和第二参数集来处理该至少一个图片的部件。
根据本公开的技术,一种非暂存性计算机可读存储介质被以指令编码。上述指令在被执行时,使得一个或多个处理器:对第一参数集进行解析,第一参数集针对每个一组已编码图片的序列在已编码视频数据的比特流中被信令通知一次;对第二参数集中的一个或多个动态范围调整(DRA)语法元素进行解析,第二参数集在已编码视频数据的比特流中被信令通知并且与该组的已编码图片中的至少一个图片相关,其中对一个或多个DRA语法元素的解析不依赖于第一参数集的任何语法元素;以及基于第一参数集和第二参数集来处理该至少一个图片。
本公开通常可以指“信令通知(signaling)”某些信息,例如语法元素。术语“信令通知(signaling)”通常可以指语法元素的值和/或用于对已编码视频数据进行解码的其他数据的通信。即,视频编码器200可以信令通知比特流中的语法元素的值。通常,信令是指在比特流中生成值。如上所述,源设备102可以基本上实时地将比特流传送到目标设备116,也可以不是实时的,诸如在将语法元素存储到存储设备112以用于稍后目标设备116的检索时可能发生的情况。
图2是示出可以进行本公开的技术的一种示例视频编码器200的框图。出于阐述的目的提供图2,而不应该将其视为限制本公开中广泛例示和描述的技术。为了说明的目的,本公开根据VVC(开发中的ITU-T H.266)、HEVC(ITU-T H.265)和EVC的技术描述了视频编码器200。然而,本公开的技术可以由被配置到其他视频译码标准的视频编码设备执行。
在图2的示例中,视频编码器200包括视频数据存储器230、模式选择单元202、残差生成单元204、变换处理单元206、量化单元208、逆量化单元210、逆变换处理单元212、重建单元214、滤波器单元216、已解码图片缓存器(DPB)218和熵编码单元220。视频数据存储器230、模式选择单元202、残差生成单元204、变换处理单元206、量化单元208、逆量化单元210、逆变换处理单元212、重建单元214、滤波器单元216、DPB 218和熵编码单元220中的任一个或全部可以在一个或多个处理器中或在处理电路中实现。例如,视频编码器200的单元可以被实现为一个或多个电路或逻辑元件,作为硬件电路的一部分、或作为FPGA的,处理器、ASIC的一部分。此外,视频编码器200可以包括另外的或可替换的处理器或处理电路以实现这些或其他功能。在某些示例中,视频编码器200还可以包括可以执行本公开的DRA信令技术并且会在本文中稍后相对于图13被描述的正向DRA单元。
视频数据存储器230可以存储待由视频编码器200的组件进行编码的视频数据。视频编码器200可以接收存储于视频数据存储器230中的视频数据(例如,来自视频源104(图1)的视频数据)。DPB 218可以充当参考图片存储器,该参考图片存储器存储在视频编码器200预测后续视频数据中使用的参考视频数据。视频数据存储器230和DPB 218可以由多种存储设备中的任一种形成,例如动态随机访问存储器(DRAM),包括同步DRAM(SDRAM)、磁阻RAM(MRAM)、电阻性RAM(RRAM)或其他类型的存储设备。视频数据存储器230和DPB 218可以被提供为相同的存储设备或分离的存储设备。在多个示例中,视频数据存储器230可以与视频编码器200的其他组件一起在芯片上(on-chip),如上所示,或者相对于那些组件在芯片外(off-chip)。
在本公开中,对视频数据存储器230的描述不应该被解释为受限于视频编码器200内部的存储器,除非如此具体地描述,或者受限于视频编码器200外部的存储器,除非如此具体地描述。准确的说,对视频数据存储器230的描述应该被理解为参考存储器,参考存储器存储视频编码器200接收的、用于编码的视频数据(例如,用于待被编码的当前块的视频数据)。图1的存储器106还可以为来自视频编码器200的各个单元的输出提供临时存储。
对图2的各个单元进行说明,以帮助理解由视频编码器200进行的操作。这些单元可以实现为固定功能电路、可编程电路或两者的组合。固定功能电路是指提供特定功能并为可以进行的操作进行预设的电路。可编程电路是指可以被编程以进行各种任务并且在可以进行的操作中提供灵活功能的电路。例如,可编程电路可以执行软件或固件,以使得可编程电路以软件或固件的指令所定义的方式来运行。固定功能电路可以执行软件指令(例如,对参数进行接收或输出),但是固定功能电路执行的操作的类型通常是不可变的。在某些示例中,上述单元中的一个或多个可以是不同的电路块(固定功能或可编程),而在某些示例中,上述单元中的一个或多个可以是集成电路。
视频编码器200可以包括算术逻辑单元(ALU)、基本功能单元(EFU)、数字电路、模拟电路和/或由可编程电路形成的可编程核。在使用由可编程电路执行的软件来进行视频编码器200的操作的示例中,存储器106(图1)可以对视频编码器200接收并执行的软件的指令(例如,目标代码)进行存储,或者在视频编码器200中的另一存储器(未示出)对这些指令进行存储。
视频数据存储器230被配置为存储接收到的视频数据。视频编码器200可以从视频数据存储器230中检索视频数据的图片,并将上述视频数据提供给残差生成单元204和模式选择单元202。视频数据存储器230中的视频数据可以是待被编码的原始视频数据。
模式选择单元202包括运动估计单元222、运动补偿单元224和帧内预测单元226。模式选择单元202可以包括根据其他预测模式进行视频预测的另外的功能单元。作为示例,模式选择单元202可以包括调色板单元、块内复制单元(可以是运动估计单元222和/或运动补偿单元224中的一部分)、仿射单元、线性模型(LM)单元等。
模式选择单元202通常协调多个编码通路,以测试编码参数的组合和所得到的该组合的速率失真值。这些编码参数可以包括从CTU到CU的划分、用于CU的预测模式、用于CU的残差数据的变换类型、用于CU的残差数据的量化参数等。模式选择单元202可以最终选择具有比其他经测试的组合更好的速率失真值的编码参数的组合。
视频编码器200可以将从视频数据存储器230检索到的图片划分为一系列CTU,并将一个或多个CTU封装在切片内。模式选择单元202可以根据树结构,例如上述的QTBT结构或HEVC的四叉树结构,来对图片的CTU进行划分。如上所述,视频编码器200可以根据树结构通过划分CTU来形成一个或多个CU。这种CU通常还可以被称为“视频块”或“块”。
通常,模式选择单元202还控制其组件(例如,运动估计单元222、运动补偿单元224和帧内预测单元226)以生成针对当前块(例如,当前CU,或HEVC中PU和TU的重叠部分)的预测块。对于当前块的帧间预测,运动估计单元222可以进行运动搜索以识别一个或多个参考图片(例如,存储在DPB 218中的一个或多个预先已译码图片)中的一个或多个紧密匹配的参考块。具体地,运动估计单元222可以例如根据绝对差值和(SAD)、平方差值和(SSD)、平均绝对差(MAD)、均方差(MSD)等来计算表示潜在参考块与该当前块有多相似的值。运动估计单元222通常可以使用当前块与所考虑的参考块之间的逐样点差值来进行这些计算。运动估计单元222可以识别出具有这些计算所得的最小值的参考块,来指示与当前块最紧密匹配的参考块。
运动估计单元222可以形成一个或多个运动向量(MV),运动向量(MV)定义参考块在参考图片中的位置相对于当前块在当前图片中的位置。之后,运动估计单元222可以将运动向量提供给运动补偿单元224。例如,对于单向帧间预测,运动估计单元222可以提供单个运动向量,而对于双向帧间预测,运动估计单元222可以提供两个运动向量。运动补偿单元224之后可以使用运动向量来生成预测块。例如,运动补偿单元224可以使用运动向量来检索参考块的数据。作为另一示例,如果运动向量具有分数样点精度,则运动补偿单元224可以根据一个或多个内插滤波器来插入用于预测块的值。此外,对于双向帧间预测,运动补偿单元224可以检索针对相应的运动向量所标识的两个参考块的数据并且例如通过逐样点平均或加权平均来对检索到的数据进行组合。
作为另一个示例,对于帧内预测或帧内预测译码,帧内预测单元226可以根据与当前块相邻的样点来生成预测块。例如,对于方向模式,帧内预测单元226通常可以对相邻样点的值进行数学组合,并在定义的方向上跨越当前块填充这些计算出的值以产生预测块。作为另一示例,对于DC模式,帧内预测单元226可以计算当前块的相邻样点的平均值并且生成预测块,以针对该预测块的每个样点包括所得到的平均值。
模式选择单元202将预测块提供给残差生成单元204。残差生成单元204从视频数据存储器230接收当前块的原始的未编码的版本,并从模式选择单元202接收预测块。残差生成单元204计算当前块和预测块之间的逐样点差值。所得逐样点差值定义了针对该当前块的残差块。在某些示例中,残差生成单元204还可以确定残差块中的样点值之间的差值以使用残差差分脉冲代码调制(RDPCM)来生成残差块。在某些示例中,可以使用进行二进制减法的一个或多个减法器电路来形成残差生成单元204。
在某些示例中,模式选择单元202将CU划分为PU,每个PU可以与亮度预测单元和对应的色度预测单元相关联。视频编码器200和视频解码器300可以支持具有多种尺寸的PU。如上所示,CU的尺寸指CU的亮度译码块的尺寸,PU的尺寸指PU的亮度预测单元的尺寸。假设特定CU的尺寸为2N×2N,则视频编码器200可以支持用于帧内预测的PU尺寸为2N×2N或N×N,以及用于帧间预测的对称PU的尺寸为2N×2N、2N×N、N×2N、N×N或类似的尺寸。视频编码器200和视频解码器300还可以支持用于帧间预测的不对称划分的PU的尺寸为2N×nU、2N×nD、nL×2N以及nR×2N。
在某些示例中,模式选择单元202不再将CU划分为PU,每个CU可以与亮度译码块和对应的色度译码块相关联。如上所述,CU的尺寸是指CU的亮度译码块的尺寸。视频编码器200和视频解码器300可以支持CU的尺寸为2N×2N、2N×N或N×2N。
对于其他视频译码技术(诸如,块内复制模式译码、仿射模式译码以及线性模型(LM)模式译码),作为某些示例,模式选择单元202经由与译码技术相关联的相应单元生成针对正在被编码的当前块的预测块。在某些示例中,例如调色板模式译码,模式选择单元202不会生成预测块,并且而是生成指示基于选择的调色板重建块的方式的语法元素。在该模式中,模式选择单元202可以将这些语法元素提供给熵编码单元220以进行编码。
如上所述,残差生成单元204接收当前块的视频数据和对应的预测块的视频数据。残差生成单元204之后生成当前块的残差块。残差生成单元204计算预测块和当前块之间的逐样点差值以生成残差块。
变换处理单元206对残差块应用一种或更多种变换以生成变换系数的块(在本文中称为“变换系数块”)。变换处理单元206可以对残差块应用多种变换以形成变换系数块。例如,变换处理单元206可以对残差块应用离散余弦变换(DCT)、方向变换、Karhunen-Loeve变换(KLT)或概念上类似的变换。在某些示例中,变换处理单元206对残差块进行多种变换,例如初级变换和次级变换,诸如旋转变换。在某些示例中,变换处理单元206不对残差块进行变换。
量化单元208可以对变换系数块中的变换系数进行量化,以生成已量化变换系数块。量化单元208可以根据与当前块相关联的量化参数(QP)值来对变换系数块的变换系数进行量化。视频编码器200(例如,经由模式选择单元202)可以通过调整与CU相关联的QP值来调整应用于与当前块相关联的变换系数块的量化程度。量化会引起信息丢失,因此,已量化变换系数的精度会比变换处理单元206生成的原始变换系数的精度低。
逆量化单元210和逆变换处理单元212可以分别对已量化变换系数块进行逆量化和逆变换,以基于变换系数块重建残差块。重建单元214基于重建残差块和由模式选择单元202生成的预测块来生成与当前块相对应的重建块(尽管可能具有某种程度的失真)。例如,重建单元214可以将重建残差块的样点加到模式选择单元202所生成的预测块的对应样点来生成重建块。
滤波器单元216可以对重建块进行一种或更多种滤波器操作。例如,滤波器单元216可以进行解块操作以减少沿着CU的边界的块状伪影。在某些示例中,可以跳过滤波器单元216的操作。
视频编码器200将重建块存储于DPB 218中。例如,在不需要滤波器单元216的操作的示例中,重建单元214可以将重建块存储到DPB 218中。在需要滤波器单元216的操作的示例中,滤波器单元216可以将经滤波的重建块存储到DPB 218中。运动估计单元222和运动补偿单元224可以从DPB 218中检索由重建(且可能经滤波的)块形成的参考图片,以对后续已编码图像的块进行帧间预测。另外,帧内预测单元226可以使用当前图片在DPB 218中的重建块来对该当前图片中的其他块进行帧内预测。
通常,熵编码单元220可以对从视频编码器200的其他功能组件接收到的语法元素进行熵编码。例如,熵编码单元220可以对来自量化单元208的已量化变换系数块进行熵编码。作为另一示例,熵编码单元220可以对来自模式选择单元202的预测语法元素(例如,用于帧间预测的运动信息或用于帧内预测的模式内信息)进行熵编码。熵编码单元220可以对作为视频数据的另一个示例的语法元素进行一种或更多种熵编码操作以生成经熵编码的数据。例如,熵编码单元220可以进行上下文自适应可变长度译码(CAVLC)操作、CABAC操作、可变至可变(V2V)长度译码操作、基于语法的上下文自适应二进制算术译码(SBAC)操作、概率区间分割熵(PIPE)译码操作、指数-Golomb编码操作或对数据进行的另一种熵编码操作。在某些示例中,熵编码单元220可以在语法元素未被熵编码的旁路模式下运行。在某些示例中,熵编码单元220可以对SPS、PPS、和/或APS进行编码,其中各参数集彼此独立,以使得视频解码器不需要在解析PPS和/或APS之前对SPS的任何语法元素进行解析。
视频编码器200可以输出包括重建切片或图片的块所需的经熵编码的语法元素的比特流。具体地,熵编码单元220可以输出比特流。
上述的操作是相对于块来描述的。这种描述应当被理解为用于亮度译码块和/或色度译码块的操作。如上所述,在某些示例中,亮度译码块和色度译码块分别是CU的亮度分量和色度分量。在某些示例中,亮度译码块和色度译码块是PU的亮度分量和色度分量。
在某些示例中,不必对色度译码块重复进行对亮度译码块进行过的操作。作为一个示例,不需要将用于识别亮度译码块的运动向量(MV)和参考图片的操作重复用于识别色度块的MV和参考图片。准确地说,可以对亮度译码块的MV进行缩放来确定色度块的MV,并且参考图片可以是相同的。作为另一示例,对于亮度译码块和色度译码块,帧内预测过程可以是相同的。
视频编码器200表示被配置为对视频数据进行编码的设备的示例。该设备包括被配置为存储视频数据的存储器和在电路中实现的一个或多个处理器,该一个或多个处理器被配置为:针对每个一组已编码图片的序列信令通知一次已编码视频数据的比特流中可用的第一参数集;确定适用于该组已编码图片中的至少一个图片的第二参数集中的一个或多个DRA语法元素;以及在已编码视频的比特流中信令通知第二参数集,其中视频解码器对一个或多个DRA语法元素的解析不依赖于SPS的任何语法元素。
图3是示出可以进行本公开的技术的一种示例视频解码器300的框图。出于阐述的目的提供图3,而不应该将其视为限制本公开中广泛例示和描述的技术。为了说明的目的,本公开基于VVC(开发中的ITU-T H.266)、HEVC(ITU-T H.265)和EVC的技术描述了视频解码器300。然而,本公开的技术可以由配置为其他视频译码标准的视频译码设备来执行。
在图3的示例中,视频解码器300包括已译码图片缓存器(CPB)存储器320、熵解码单元302、预测处理单元304、逆量化单元306、逆变换处理单元308、重建单元310、滤波器单元312以及已解码图片缓存器(DPB)314。CPB存储器320、熵解码单元302、预测处理单元304、逆量化单元306、逆变换处理单元308、重建单元310、滤波器单元312和DPB 314中的任一个或全部可以在一个或多个处理器中或处理电路中实现。例如,视频解码器300的单元可以被实现为一个或多个电路或逻辑元件,作为硬件电路的一部分或作为FPGA的,处理器、ASIC的一部分。此外,视频解码器300可以包括另外的或可替换的处理器或处理电路以执行这些或其他功能。在某些示例中,视频解码器300还可以包括可以执行本公开的DRA解析技术并且在本文稍后相对于图13被描述的输出DRA单元。
预测处理单元304包括运动补偿单元316和帧内预测单元318。预测处理单元304可以包括另外的单元以根据其他预测模式进行预测。作为示例,预测处理单元304可以包括调色板单元、块内复制单元(可以形成运动补偿单元316的一部分)、仿射单元、线性模型(LM)单元等。在其他示例中,视频解码器300可以包括更多、更少或不同的功能组件。
CPB存储器320可以存储待由视频解码器300的组件进行解码的视频数据,例如已编码视频比特流。存储在CPB存储器320中的视频数据可以例如从计算机可读介质110(图1)获得。CPB存储器320可以包括对基于已编码视频比特流的已编码视频数据(例如,语法元素)进行存储的CPB。而且,CPB存储器320可以存储除了已译码图片的语法元素之外的视频数据,例如表示来自视频解码器300的多个单元的输出的临时数据。DPB 314通常存储已解码图片。视频解码器300在对已编码视频比特流的后续数据和图片进行解码时,可以输出和/或使用上述已解码图片以作为参考视频数据。CPB存储器320和DPB 314可以由多种存储器设备中的任一种形成,诸如DRAM。上述多种存储器设备包括SDRAM、MRAM、RRAM或其他类型的存储器设备。CPB存储器320和DPB 314可以由相同的存储器设备或分离的存储器设备提供。在多个示例中,CPB存储器320可以与视频解码器300的其他组件在芯片上,或者相对于那些组件在芯片外。
另外地或可替换地,在某些示例中,视频解码器300可以从存储器120(图1)中检索已译码视频数据。也就是说,存储器120可以如上文所述与CPB存储器320一起存储数据。同样地,当视频解码器300的某些或全部功能由待由视频解码器300的处理电路执行的软件实现时,存储器120可以存储待由视频解码器300执行的指令。
对图3中所示的多个单元进行说明以帮助理解由视频解码器300执行的操作。这些单元可以实现为固定功能电路、可编程电路或两者的组合。与图2相似的是,固定功能电路是指提供特定功能并为可以执行的操作进行预设的电路。可编程电路是指可以被编程以执行多种任务并且在可以执行的操作中提供灵活功能的电路。举例来说,可编程电路可以执行软件或固件,以使得可编程电路以软件或固件的指令所定义的方式来运行。固定功能电路可以执行软件指令(例如,接收参数或输出参数),但是固定功能电路执行的操作类型通常是不可变的。在某些示例中,上述单元中的一个或多个可以是不同的电路块(固定功能或可编程的),而在某些示例中,上述单元中的一个或多个可以是集成电路。
视频解码器300可以包括ALU、EFU、数字电路、模拟电路和/或由可编程电路形成的可编程核。在视频解码器300的操作由在可编程电路上执行的软件执行的示例中,片上或片外存储器可以存储视频解码器300接收并执行的软件的指令(例如,目标代码)。
熵解码单元302可以从CPB接收已编码视频数据,并对该视频数据进行熵解码以重现语法元素。预测处理单元304、逆量化单元306、逆变换处理单元308、重建单元310以及滤波器单元312可以基于从比特流中提取的语法元素来生成已解码视频数据。
通常,视频解码器300在逐块的基础上重建图片。视频解码器300可以单独地对每个块执行重建操作(其中当前正在被重建(即,被解码)的块可以被称为“当前块”)。
熵解码单元302可以对定义已量化变换系数块的已量化变换系数的语法元素和变换信息进行熵解码,变换信息例如是量化参数(QP)和/或(多个)变换模式指示。在某些示例中,熵解码单元302可以解码SPS、PPS和/或APS,其中各参数集彼此独立,以使得视频解码器300不需要在解析PPS和/或APS之前对SPS的任何语法元素进行解析。例如,视频解码器300可以解析适用于视频数据的块的SPS。视频解码器300可以对适用于该块的第二参数集(例如,PPS或APS)进行独立地解析,其中第二参数集的解析不依赖于SPS的任何语法元素。视频解码器300可以基于SPS和第二参数集来处理该块。对语法元素或参数集的解析可以意味着对位或位串进行分析以确定该位或位串的值。
逆量化单元306可以使用与已量化变换系数块相关联的QP来确定量化的程度,并且同样地,确定逆量化的程度以供逆量化单元306应用。逆量化单元306可以例如进行按位左移的运算来对已量化变换系数进行逆量化。逆量化单元306从而可以形成包括变换系数的变换系数块。
在逆量化单元306形成变换系数块之后,逆变换处理单元308可以将一种或更多种逆变换应用于变换系数块以生成与当前块相关联的残差块。例如,逆变换处理单元308可以对变换系数块应用逆DCT、逆整数变换、逆Karhunen-Loeve变换(KLT)、逆旋转变换、逆方向变换或另一种逆变换。
此外,预测处理单元304根据由熵解码单元302进行熵解码所得到的预测信息语法元素来生成预测块。例如,如果预测信息语法元素指示当前块是帧间预测的,则运动补偿单元316可以生成预测块。在这种情况下,预测信息语法元素可以指示DPB 314中的从其检索参考块的参考图片以及标识参考图片中的参考块相对于当前图片中的当前块的位置的运动向量。运动补偿单元316通常可以以针对运动补偿单元224(图2)所描述的方式基本相似的方式来进行帧间预测过程。
作为另一示例,如果预测信息语法元素指示当前块是帧内预测的,则帧内预测单元318可以根据预测信息语法元素指示的帧内预测模式来生成预测块。同样地,帧内预测单元318通常可以以与针对帧内预测单元226(图2)所描述的方式基本相似的方式来执行帧内预测过程。帧内预测单元318可以从DPB 314检索当前块的相邻样点的数据。
重建单元310可以使用预测块和残差块来重建当前块。例如,重建单元310可以将残差块的样点加到预测块的对应样点上以重建当前块。
滤波器单元312可以对重建块进行一种或更多种滤波器操作。例如,滤波器单元312可以进行解块操作以减少沿着重建块的边缘的块状伪像。滤波器单元312的操作不必要在所有示例中都执行。
视频解码器300可以将重建块存储在DPB 314中。例如,在其中滤波器单元312的操作不被执行的示例中,重建单元310可以将重建块存储至DPB 314。在其中滤波器单元312的操作被执行的示例中,滤波器312可以将经滤波的重建块存储至DPB 314。如上所述,DPB314可以向预测处理单元304提供参考信息,例如用于帧内预测的当前图片的样点以及用于后续运动补偿的预先解码的图片。同时,视频解码器300可以输出来自DPB 314的已解码图片(例如,已解码视频),以用于后续在例如图1的显示设备118的显示设备上呈现。
以这种方式,视频解码器300表示视频解码设备的示例,该设备包括被配置为存储视频数据的存储器,以及在电路中实现并耦接至存储器的一个或多个处理器。一个或多个处理器被配置为:对第一参数集进行解析,第一参数集针对每个一组已编码图片的序列在已编码视频数据的比特流中被信令通知一次;对第二参数集中的一个或多个动态范围调整(DRA)语法元素进行解析,第二参数集在已编码视频数据的比特流中被信令通知并且与该组的已编码图片中的至少一个图片相关,其中对一个或多个DRA语法元素的解析不依赖于第一参数集的任何语法元素;以及基于第一参数集和第二参数集来处理该至少一个图片。
下一代视频应用可以使用表示捕获到的具有高动态范围(HDR)和广色域(WCG)的场景的视频数据来运行。使用的动态范围和色域的参数是视频内容的两个独立属性,它们的用于数字电视和多媒体服务的规范由多个国际标准定义。例如,ITU-R Rec.709定义了高清电视(HDTV)的参数,例如标准动态范围(SDR)和标准色域(SCG),而ITU-R Rec.2020指定了诸如HDR和WCG的超高清电视(UHDTV)参数。在其他系统中还有指定这些属性的其他标准开发组织(SDO)文件,例如,在电影与电视工程师协会(Society of Motion Picture andTelevision Engineers,SMPTE)文件SMPTE-231-2中定义了P3色域,在SMPTE ST-2084中定义了HDR的一些参数。下面对视频数据的动态范围和色域进行简单介绍。
动态范围通常被定义为视频信号的最小亮度和最大亮度之间的比率。动态范围也用“f-stop”来测量,其中一个f-stop对应于信号的动态范围的两倍。在MPEG的定义中,HDR内容是以超过16f-stop来表征亮度变化的内容。在某些定义中,10f-stop到16f-stop之间的级别被视为中间动态范围,但在其他定义中被视为HDR。同时,人类视觉系统(HVS)能够感知更大的动态范围,而HVS包括一种缩小所谓的同步范围的适应机制。
视频应用和服务可以由Rec.709调节,并且提供SDR,通常支持亮度(或亮度)的范围为每m2约0.1到100坎德拉(cd)(通常称为“尼特”),从而小于10f-stop。下一代视频服务有望提供高达16f-stop的动态范围。SMPTE-2084和Rec.2020中指定了一些初始参数。
图4是示出HDTV中的SDR的示例动态范围、UHDTV中的预期HDR和HVS动态范围的概念图。例如,图表400在对数标度上以尼特的方式示出星光、月光、室内和太阳光的亮度。图表402相对于图表400示出人类视觉范围和HVS同时动态范围(也称为稳态动态范围)。图表404相对于图表400和图表402描绘了HDTV中用于显示的SDR。例如,用于显示器的SDR可以重叠于月光到室内的一部分亮度范围,并且可以重叠于一部分HVS同步范围。图表406相对于图表400至图表404描绘了UHDTV中用于显示器的预期HDR。可以看出,该HDR比图表404的SDR大得多,并且比图表404的SDR包含更大部分的HVS同步范围。
现在对色域进行描述。图5是示出一种示例色域图的概念图。除了HDR之外更逼真的视频体验的方面是颜色维度,其通常由色域定义。在图5的示例中,SDR色域的视觉表示(基于BT.709红色、绿色、蓝色的基色的三角形500),以及用于UHDTV的更宽色域(基于BT.2020的红色、绿色、蓝色的基色的三角形502)。图5还描绘了所谓的光谱轨迹(由舌形区域504界定),表示自然颜色的界限。如图5所示,从BT.709(三角形500)基色到BT.2020(三角形502)基色旨在为UHDTV服务提供大约70%以上的颜色。D65指定给定规范的白色。
以下表1示出了色域规范的一些示例。
表1-针对选定颜色空间的比色参数
Figure BDA0003860680360000261
现在讨论HDR视频数据的压缩。通常以4:4:4色度格式和非常宽的颜色空间(例如,XYZ)针对每个分量以非常高的精度来获取和存储(甚至可以以浮点精度存储)HDR/WCG。该表示以高精度为目标,并且(几乎)在数学上是无损的。然而,这种格式表征许多冗余,并且对于压缩目的不是最佳的。具有基于HVS的假定的较低精度格式通常被用于最先进的视频应用。
图6是示出一种示例格式转换技术的框图。视频编码器200可以执行格式转换技术将线性RGB 510变换为HDR’数据518。这些技术可以包括如图6所描绘的3个主要元素。这3个元素包括:1)用于动态范围紧缩的非线性传递函数(TF)512;2)到更紧凑或更鲁棒的颜色空间的颜色转换514;3)浮点到整数表示转换(量化516)。
图7是示出一种示例逆格式转换技术的框图。视频解码器300或另一处理器可以执行图7的逆转换技术,包括逆量化522、逆颜色转换524和逆TF 526以将HDR’数据520逆变换成线性RGB 528。
现在描述一种示例传递函数(TF)。TF被应用于数据以紧缩其动态范围,并使得可能用有限的位数表示该数据。该函数通常是一维(1D)非线性函数,该函数反映Rec.709中针对SDR指定的终端用户显示器的电光传递函数(EOTF)的逆,或者将HVS感知近似为如用于SMPTE-2084中针对HDR指定的PQ TF的亮度变化。OETF的逆过程是将译码级别映射回亮度的EOTF(electro-optical transfer function,电光传递函数)。图8是示出EOTF的示例的概念图。图8的图表530用y轴上的线性亮度和x轴上的译码级别描绘了EOTF。图8的一个示例EOTF是ST2084的HDR EOTF。
规范SMPTE ST-2084将EOTF应用定义如下。TF被应用于归一化的线性R、G、B值,得到非线性表示R’G’B’。SMPTE ST-2084通过NORM=10000来定义归一化,其与10000尼特(cd/m2)的峰值亮度相关联。
Figure BDA0003860680360000271
其中
Figure BDA0003860680360000272
其中L是归一化线性R值、G值、或B值,
Figure BDA0003860680360000273
Figure BDA0003860680360000274
Figure BDA0003860680360000275
Figure BDA0003860680360000276
Figure BDA0003860680360000277
图9是示出PQ TF(SMPTE ST-2084EOTF)的可视化的概念图。图9的图表540中所示的PQ TF描绘了归一化到范围0…1的输入值(线性颜色值)和归一化的输出值(非线性颜色值)。从曲线可以看出,输入信号的动态范围的百分之一(低照明)被转换为输出信号的动态范围的50%。
通常,EOTF被定义为具有浮点精度的函数,因此如果逆TF(所谓的OETF)被应用,则不会向具有这种非线性关系的信号引入误差。SMPTE ST-2084中指定的逆TF(OETF)被定义为inversePQ函数:
Figure BDA0003860680360000278
其中
Figure BDA0003860680360000281
其中N是R’值、G’值or B’值,
Figure BDA0003860680360000282
Figure BDA0003860680360000283
Figure BDA0003860680360000284
Figure BDA0003860680360000285
Figure BDA0003860680360000286
利用浮点精度,EOTF和OETF的连续应用提供没有误差的完美重建。然而,这种表示对于流式或广播服务并不是最佳的。以下段落中描述了具有固定位精度的非线性R’G’B’数据的更紧凑的表示。
应该注意的是,EOTF和OETF是非常有效的研究主题,并且在一些HDR视频译码系统中使用的TF可以与SMPTE ST-2084不同。
现在对颜色变换进行讨论。因为RGB数据是由图像捕捉传感器产生的,所以RGB数据通常被用作输入。然而,这种颜色空间在分量之间具有很高的冗余度,并且对于紧凑的表示并不是最佳的。为了实现更紧凑和更鲁棒的表示,RGB分量通常被转换为更加不相关的更适合压缩的颜色空间,例如,YCbCr。该颜色空间以不同的不相关分量中的亮度(Y)和颜色信息(Cb和Cr)的形式对亮度进行分离。
对于现代视频译码系统,通常使用的颜色空间是YCbCr,如ITU-R BT.709或ITU-RBT.709中所指定的。广播服务(电视)BT.709标准中的YCbCr颜色空间指定从R’G’B’到Y’CbCr(非恒定亮度表示)的以下转换过程:
Figure BDA0003860680360000287
以上内容还可以使用避免Cb分量和Cr分量的划分的以下近似转换来实现:
Figure BDA0003860680360000288
Figure BDA0003860680360000291
ITU-R BT.2020标准指定了从R’G’B’到Y’CbCr(非恒定亮度表示)的以下转换过程:
Figure BDA0003860680360000292
以上内容还可以使用避免Cb分量和Cr分量的划分的以下近似转换来实现:
Figure BDA0003860680360000293
应该注意的是,两个颜色空间都保持归一化,因此,对于在范围0...1中归一化的输入值,结果值会被映射到范围0...1。通常,以浮点精度实现的颜色变换提供完美的重建,因此该过程是无损的。
现在对量化/固定点转换进行讨论。上述处理阶段可以用浮点精度表示来实现,从而其可以被认为是无损的。然而,对于大多数消费者电子应用来说,这种类型的精度可以被认为是冗余且昂贵的。在某些示例中,目标颜色空间中的输入数据被转换为目标位深度固定点精度。特定研究表明,结合PQ TF的10-12位精度足以提供16f-stop的HDR数据,其中失真低于最小可觉差(Just-Noticeable Difference)。最小可觉差是为了使差异在至少一半的时间是可觉察的或可检测的而必须对某事务进行更改的量。可以使用大多数最先进的视频译码解决方案对以10位精度表示的数据进行进一步译码。该转换过程包括信号量化,是有损译码的元素,并且是引入到经转换数据的不精确的来源。
下面示出了被应用于目标颜色空间(例如,YCbCr)的码字的这种量化的示例。以浮点精度表示的输入值YCbCr被转换为具有针对Y值的固定位深度BitDepthY和针对色度值(Cb,Cr)的BitDepthC的信号,其中DY'表示经转换的亮度信号,DCb和DCr表示经转换的色度信号
Figure BDA0003860680360000294
Figure BDA0003860680360000301
其中x表示给定亮度或色度分量内等式7中的舍入运算公式,
Round(x)=Sign(x)*Floor(Abs(x)+0.5),
Sign(x)=-1 if x<0,0 if x=0,1 if x>0
Floor(x)小于或等于x的最大整数
Abs(x)=x if x>=0,-x if x<0
Clip1Y(x)=Clip3(0,(1<<BitDepthY)-1,x)
Clip1C(x)=Clip3(0,(1<<BitDepthC)-1,x)
Clip3(x,y,z)=x if z<x,y if z>y,z其他
现在动态范围调整(DRA)进行讨论。DRA最初是在为了以向后兼容能力使能高动态范围视频译码的动态范围调整SEI(D.Rusanovskyy,A.K.Ramasubramonian,D.Bugdayci,S.Lee,J.Sole,M.Karczewicz,VCEG文件COM16-C 1027-E,2015年9月)中被提出的。
作者建议将DRA实现为分段线性函数f(x),该函数是为输入值x的一组非重叠动态范围分区(范围){Ri}而定义的,其中i是具有范围0至N-1(包括端点)的范围的索引,其中N是用于定义DRA函数的范围{Ri}的总数。例如,DRA的范围由属于范围Ri的最小和最大x值定义,例如,[xi,xi+1-1],其中xi和xi+1分别表示范围Ri和Ri+1的最小值。应用于视频的Y颜色分量(luma),DRA函数Sy是通过一个比例Sy,i和一个偏置Oy,i定义的,其被应用于每个x∈[xi,xi+1-1],因此Sy={Sy,i,Oy,i}。
以这种方式,对于任何Ri,以及每个x∈[xi,xi+1-1],输出值X计算如下:
X=Sy,i*(x-Oy,i) (8)
对于在解码器(例如,视频解码器300)或另一处理器处实施的亮度分量Y的逆DRA映射过程,DRA函数Sy由比例Sy,i的倒数和偏置Oy,i值来定义,其被应用于每个X∈[Xi,Xi+1-1]。
以这种方式,对于任何Ri,以及每个X∈[Xi,Xi+1-1],重建值x计算如下:
x=X/Sy,i+Oy,i (9)
色度分量Cb和Cr的正向DRA映射过程被定义如下。给出一个示例,其中术语“u”表示属于范围Ri的Cb颜色分量的样本,u∈[ui,ui+1-1],因此Su={Su,i,Ou,i}:
U=Su,i*(u-Oy,i)+Offset (10)
其中Offset等于2(bitdepth-1)并表示双极Cb、Cr信号偏置。
在解码器处针对色度分量Cb和Cr实施的逆DRA映射过程被定义如下。给出了一个示例,其中U项表示属于范围Ri的重新映射的Cb颜色分量的样本,U∈[Ui,Ui+1-1]:
u=(U-Offset)/Su,i+Oy,i (11)
其中Offset等于2(bitdepth-1)并表示双极Cb、Cr信号偏置。
现在对亮度驱动的色度缩放(LCS)进行讨论。在JCTVC-W0101,HDRCE2:关于CE2.a-1LCS的报告(A.K.Ramasubramonian、J.Sole、D.Rusanovskyy、D.Bugdayci、M.Karczewicz)中,公开了通过利用与经处理的色度样本相关联的亮度信息来调整色度信息(例如Cb和Cr)的技术。类似地,为了以向后兼容能力使能高动态范围视频译码的动态范围调整SEI(D.Rusanovskyy,A.K.Ramasubramonian,D.Bugdayci,S.Lee,J.Sole,M.Karczewicz,VCEG文件COM16-C 1027-E,2015年9月)的DRA方法提出对色度样本应用Cb的缩放因子Su和Cr的Sv,i。然而,不是将DRA函数定义为如等式(3)和等式(4)中用于可由色度值u或v取值的一组范围{Ri}的分段线性函数Su={Su,i,Ou,i},LCS方法提出利用亮度值Y来导出用于色度样本的缩放因子。以这种方式,色度样本u(或v)的正向LCS映射被实施如下:
U=Su,i(Y)*(u-Offset)+Offset (12)
在解码器侧实施的逆LCS过程被定义如下:
u=(U-Offset)/Su,i(Y)+Offset (13)
更详细地说,对于位于(x,y)处的给定像素,使用从由像素的亮度值Y’(x,y)取值的像素的LCS函数SCb(或SCr,)导出的因子对色度样本Cb(x,y)或Cr(x,y)进行缩放,。
在色度样本的正向LCS(例如,视频编码器200)处,Cb(或Cr)值及其相关联的亮度值Y’被当作色度缩放函数SCb(或SCr)的输入,并且如等式(14)所示,Cb或Cr被转换为Cb’和Cr’。在解码器侧(例如,视频解码器300),逆LCS被应用,重建的Cb’或Cr’被转换为Cb或Cr,如等式(15)所示。
Cb'(x,y)=Scb(Y'(x,y))*Cb(x,y),
Cr'(x,y)=Scr(Y'(x,y))*Cr(x,y) (14)
Figure BDA0003860680360000321
Figure BDA0003860680360000322
图10是示出LCS函数的示例的概念图。使用LCS函数550,亮度值较小的像素的色度分量乘以较小的缩放因子。
现在对DRA样本缩放和视频译码器的QP之间的关系进行讨论。为了调整视频编码器的压缩比,基于块变换的视频译码方案(例如HEVC)利用被应用于块变换系数的标量量化器。
Xq=X/scalerQP
其中Xq是通过应用从QP参数导出的缩放器scalerQP产生的变换系数X的经量化码值。在大多数译码器中,经量化的码值会近似为整数值(例如,通过舍入)。在某些译码器(例如,视频编码器200或视频解码器300)中,量化可以是不仅取决于QP还取决于译码器的其他参数的不同的函数。
缩放器值scalerQP由量化参数(QP)来控制,其中QP和标量量化器之间的关系定义如下,其中k是已知常数:
scalerQP=k*2^(QP/6) (16)
逆函数对被应用于变换系数的标量量化器和HEVC的QP之间的关系定义如下:
QP=ln(scalerQP/k)*6/ln(2); (17)
相应地,QP值的加性变化,例如deltaQP,会得到应用于变换系数的scalerQP值的乘法变化。
DRA有效地将scaleDRA值应用于像素样本值,并且考虑到变换属性,可以与scalerQP值组合如下:
Xq=T(scaleDRA*x)/scaleQP
其中Xq是以应用于变换域的scaleQP对经缩放的x样本值的变换T进行缩放而产生的经量化变换系数。因此,在像素域中应用乘法器scaleDRA产生缩放器量化器scaleQP的有效变化,其被应用于变换域中。这反过来可以解释为应用于当前处理的数据块的QP参数的加性变化:
dQP=log2(scaleDRA)*6; (18)
其中dQP是HEVC通过在输入数据上部署DRA引入的近似QP偏置。
现在讨论色度QP对亮度QP值的依赖性。一些最先进的视频译码设计,例如HEVC和更新的设计,可以利用被有效应用于处理当前译码的块Cb的亮度和色度QP值之间的预定义的依赖性。这种依赖性可以被用于实现亮度和色度分量之间的最佳比特率分配。
这种依赖性的示例由HEVC规范的表8至10表示,其中应用于解码色度样本的QP值是从用于解码亮度样本的QP值导出的。其中色度QP值基于对应的亮度样本的QP值(被应用于块/TU的QP值,对应亮度样本所属的)导出的相关部分,色度QP偏置和HEVC规范的表8至10重现如下:
当ChromaArrayType不等于0时,以下情况适用:
–变量qPCb和qPCr被导出如下:
–如果tu_residual_act_flag[xTbY][yTbY]等于0,则以下情况适用:
qPiCb=Clip3(-QpBdOffsetC,57,QpY+pps_cb_qp_offset+slice_cb_qp_offset+CuQpOffsetCb) (8-287)
qPiCr=Clip3(-QpBdOffsetC,57,QpY+pps_cr_qp_offset+slice_cr_qp_offset+CuQpOffsetCr) (8-288)
–否则(tu_residual_act_flag[xTbY][yTbY]等于1),则以下情况适用:
qPiCb=Clip3(-QpBdOffsetC,57,QpY+PpsActQpOffsetCb+slice_act_cb_qp_offset+CuQpOffsetCb) (8-289)
qPiCr=Clip3(-QpBdOffsetC,57,QpY+PpsActQpOffsetCr+slice_act_cr_qp_offset+CuQpOffsetCr) (8-290)
–如果ChromaArrayType等于1,则变量qPCb和qPCr基于索引qPi分别等于qPiCb和qPiCr被设置为等于如表8至10中所指定的Qpc的值。
–否则,基于索引qPi分别等于qPiCb和qPiCr,变量qPCb和qPCr被设置为等于Min(qPi,51)。
–用于Cb分量和Cr分量的色度量化参数,Qp’Cb和Qp’Cr,被导出如下:
Qp′Cb=qPCb+QpBdOffsetC (8-291)
Qp′Cr=qPCr+QpBdOffsetC (8-292)
图11是示出将Qpc指定为qPi的函数的示例表的概念图。在某些示例中,图11的表是HEVC规范的表8至10。表8至10(560)详细说明了在ChromaArrayType等于1的情况下Qpc被指定为qPi的函数。
现在对DRA的色度缩放的推导进行讨论。在采用变换域和以DRA进行缩放的像素域中的均匀标量量化的视频译码系统(例如视频编码器200或视频解码器300)中,应用于色度样本(Sx)的比例DRA值的推导可以取决于以下内容:
-SY:相关联的亮度样本的亮度比例值。
-SCX:由内容的色域导出的比例,其中CX根据需要代替Cb或Cr。
-Scorr:校正比例项,用于解决变换译码和DRA缩放中的不匹配,例如,补偿HEVC的表8至10引入的依赖性。
SX=fun(SY,SCX,Scorr)。
一个示例是定义如下的可分离函数:SX=f1(SY)*f2(SCX)*f3(SCX),其中f1是可分离函数的第一部分,f2是可分离函数的第二部分,f2是可分离函数的第三部分。
现在对碰撞(bumping)过程进行描述。已解码图片缓存器(decoded picturebuffer,DPB)(例如DPB 218或DPB 314)维护可以在译码器(例如,视频编码器200或视频解码器300)的译码循环中被用作帧间预测的参考的一组图片/帧。取决于译码状态,可以输出一个或多个图片以供外部应用使用或由外部应用读取。取决于译码顺序、DPB大小或其他条件,不再被用于译码循环中且不再被外部应用使用的图片可以被从DPB 314(图3)中去除或者被新的参考图片替换。输出DPB 314的图片以及DPB(图3)中的图片的潜在去除的过程被称为碰撞过程(bumping process)。针对HEVC定义的碰撞过程的示例如下所示:
C.5.2.4“碰撞”过程
“碰撞”过程包括以下有序的步骤:
1.选择DPB中的全部图片中PicOrderCntVal值最小的图片作为最先输出的图片,标记为“需要输出”。
2.使用有效SPS中针对该图片指定的一致性剪裁窗口对图片进行剪裁,输出剪裁后的图片,并将该图片标记为“不需要输出”。
3.当包括被剪裁且输出的图片的图片存储缓存器包含被标记为“不用于参考”的图片时,图片存储缓存器被清空。
注意–对于属于同一个CVS[译码视频序列]并由“碰撞过程”输出的任何两张图片(picA和picB),当picA早于picB被输出时,picA的PicOrderCntVal的值小于picB的PicOrderCntVal的值。
现在对使用DRA的碰撞过程进行讨论。DRA规范性后处理以经修改的碰撞过程的形式被采用于EVC规范的草案文本。在标记<CHANGE>和</CHANGE>之间示出了包含带有变化的碰撞过程的EVC规范文本的节选。
附录C假定参考解码器
HRD[假定参考解码器]包含已译码图片缓存器(CPB)、瞬时解码过程、已解码图片缓存器(DPB)、输出DRA[其是关于某些视频译码器的附加过程]和剪裁,如图C-2[本公开中复制为图12]。图12是示出一种HDR缓存器模型的示例的概念图。
子条款C.3中指定了DPB的操作。子条款C.3.3和C.5.2.4中指定了输出DRA过程和剪裁。
C.3.3图片解码与输出
图片n被解码并且其DPB输出时间to,dpb(n)由下式导出
to,dpb(n)=tr(n)+tc*dpb_output_delay(n) (C-12)
当前图片的输出被指定如下。
–如果to,dpb(n)=tr(n),则当前图片被输出。
–否则(to,dpb(n)>tr(n)),当前图片稍后被输出并且会被存储在DPB中(如子条款C.2.4中所指定的),并在时间to,dpb(n)被输出直到通过在时间to,dpb(n)之前的时间解码或推断no_output_of_prior_pics_flag等于1才指示不被输出。
<CHANGE>输出图片应该通过调用子条款8.9.2中指定的DRA过程被导出,并通过使用SPS中针对序列指定的剪裁矩形被剪裁。</CHANGE>
当图片n是被输出的图片且不是被输出的比特流的最后一张图片时,to,dpb(n)的值被定义为:
Δto,dpb(n)=to,dpb(nn)-to,dpb(n) (C-13)
其中nn指示按输出顺序在图片n之后的图片。
经解码的图片被存储在DPB中。
C.5.2.4“碰撞”过程
在以下情况下“碰撞”过程被调用。
-如子条款C.5.2.2中所指定的,当前图片是IDR图片,并且no_output_of_prior_pics_flag不等于1。
-如在子条款中指定的,没有空的图片存储缓存器(即,DPB充满度等于DPB大小),并且需要空的图片存储缓存器来存储已解码的图片。
“碰撞”过程包括以下有序步骤:
<CHANGE>
4、选择DPB中的全部图片中PicOrderCntVal值最小的图片作为最先输出的图片,标记为“需要输出”。
所选择的图片包括亮度样本currPicL的pic_width_in_luma_samples乘pic_height_in_luma_samples阵列和色度样本currPicCb和currPicCr的两个PicWidthInSamplesC乘PicHeightInSamplesC阵列。样本阵列currPicL、currPicCb和currPicCr对应于已解码样本阵列SL、SCb和SCr
5.当dra_table_present_flag等于1时,条款8.9中指定的DRA推导过程被调用,以所选择的图片作为输入并以输出图片作为输出;否则,输出图片的样本阵列由所选择的图片的样本阵列进行初始化。</CHANGE>
6.使用有效SPS中针对图片指定的一致性剪裁窗口对输出图片进行剪裁,输出剪裁后的图片,并将该图片标记为“不需要输出”。
7.当包括被<CHANGE>映射、</CHANGE>剪裁并被输出的图片的图片存储缓存器包含被标记为“不用于参考”的图片时,图片存储缓存器被清空。
现在对DRA数据的APS信令进行讨论。EVC规范定义了DRA参数在自适应参数集(APS)中被信令通知。下面提供了DRA参数的语法和语义:
Figure BDA0003860680360000361
Figure BDA0003860680360000371
Figure BDA0003860680360000372
DRA数据语法
Figure BDA0003860680360000381
sps_dra_flag等于1指定使用了映射到输出样本上的动态范围调整。sps_dra_flag等于0指定未使用映射到输出样本上的动态范围调整。
pic_dra_enabled_present_flag等于1指定pic_dra_enabled_flag存在于PPS中。pic_dra_enabled_present_flag等于0指示pic_dra_enabled_flag不存在于PPS中。当pic_dra_enabled_flag不存在时,其被推断为等于0。
pic_dra_enabled_flag等于1指定针对参考PPS的全部已解码图片使能DRA。pic_dra_enabled_flag等于0指定针对参考PPS的全部已解码图片都不使能DRA。当pic_dra_enabled_flag不存在时,其被推断为等于0。
pic_dra_aps_id指定针对参考PPS的已解码图片被使能的DRA APS的adaptation_parameter_set_id。
adaptation_parameter_set_id为APS提供标识符以供其他语法元素参考。
aps_params_type指定如在表6中指定的APS中携带的APS参数的类型[本公开中如表2所示]。
Figure BDA0003860680360000391
表2—APS参数类型代码和APS参数的类型
dra_descriptorl应在0到15的范围(包括端点值)内。在当前版本的规范中,语法元素dra_descriptor1的值被限制为4,其他值被保留以备将来使用。
dra_descriptor2指定DRA缩放参数信令和重建过程的小数部分的精度。dra_descriptor2的值应该在0到15的范围(包括端点值)内。在当前版本的规范中,语法元素dra_descriptor2的值被限制为9,其他值被保留以备将来使用。
变量numBitsDraScale导出如下:
numBitsDraScale=dra_descriptor1+dra_descriptor2
dra_number_ranges_minus1加1指定被信令通知以描述DRA表的范围的数量。dra_number_ranges_minus1的值应该在0到31的范围(包括端点值)内。
dra_equal_ranges_flag等于1指定使用大小相等的范围导出DRA表,其中大小由语法元素dra_delta_range[0]指定。dra_equal_ranges_flag等于0指定使用dra_number_ranges导出DRA表,其中这些范围中的每一个的大小由语法元素dra_delta_range[j]指定。
dra_global_offset指定用于导出DRA表的起始码字位置,并对变量inDraRange[0]初始化如下:
inDraRange[0]=dra_global_offset
用于信令通知dra_global_offset的位的数量是BitDepthY位。
dra_delta_range[j]指定码字中用于导出DRA表的第j个范围的大小。dra_delta_range[j]的值应该在1到(1<<BitDepthY)-1的范围(包括端点值)。
对于在1到dra_number_ranges_minus1的范围(包括端点值)内,的j,变量inDraRange[j]被导出如下:
inDraRange[j]=inDraRange[j–1]+(dra_equal_ranges_flag==1)?
dra_delta_range[0]:dra_delta_range[j]
比特流一致性要求inDraRange[j]应该在0到(1<<BitDepthY)-1的范围中。
dra_scale_value[j]指定与DRA表的第j个范围相关联的DRA缩放值。用于信令通知dra_scale_value[j]的位的数量等于numBitsDraScale。
dra_cb_scale_value指定用于导出DRA表的Cb分量的色度样本的比例值。用于信令通知dra_cb_scale_value的位的数量等于numBitsDraScale。在当前版本的规范中,语法元素dra_cb_scale_value的值应该小于4<<dra_descriptor2,其他值被保留以供将来使用。
dra_cr_scale_value指定用于导出DRA表的Cr分量的色度样本的比例值。用于信令通知dra_cr_scale_value的位的数量等于numBitsDraScale位。在当前版本的规范中,语法元素dra_cb_scale_value的值应该小于4<<dra_descriptor2,其他值被保留以供将来使用。
dra_scale_value[j]、dra_cb_scale_value和dra_cr_scale_value的值不应等于0。
dra_table_idx指定用于导出色度比例值的ChromaQpTable的访问条目。dra_table_idx的值应该在0到57的范围(包括端点值)内。
在MPEG EVC规范的一些示例中,DRA参数的信令基于SPS中用信令通知的特定语法元素表征针对PPS(图片标头)和APS(自适应参数集)中的特定语法元素的解析依赖性。这些依赖性是不合需要的,因为视频解码器300在解析PPS和/或APS之前不得不等待SPS,这会引入解码延迟。例如,对语法元素pic_dra_enabled_present_flag、pic_dra_enabled_flag和pic_dra_aps_id的解析可以依赖于SPS中的语法元素sps_dra_flag的值。例如,对语法元素dra_global_offset和dra_delta_range[j]的解析可以依赖于SPS中的语法元素bit_depth_luma_minus8的值,因为bit_depth_luma_minus8可以被用于确定dra_global_offset和dra_delta_range[j]的位深度。
PPS中存在的解析依赖性的第一示例在下面的语法表中示出,其中对SPS中的语法元素的依赖性被标记在标记<MARK>和</MARK>之间。
Figure BDA0003860680360000401
Figure BDA0003860680360000411
对存在于APS DRA中的解析依赖性的第二示例在DRA APS的语法表和语义中示出:
Figure BDA0003860680360000412
dra_global_offset指定用于导出DRA表的起始码字位置,并对变量InDraRange[0]初始化如下:
InDraRange[0]=dra_global_offset (7-70)
dra_delta_range[j]指定码字中用于导出DRA表的第j个范围的大小。dra_delta_range[j]的值应该在1到(1<<BitDepthY)-1的范围(包括端点值)。
对于在1到dra_number_ranges_minus1+1的范围(包括端点值)内的j,变量InDraRange[j]被导出如下:
InDraRange[j]=
InDraRange[j–1]+(dra_equal_ranges_flag==1)?dra_delta_range[0]:dra_delta_range[j-1] (7-71)
比特流一致性要求InDraRange[j]应该在0到(1<<BitDepthY)–1的范围(包括端点值)内。
用于信令通知dra_global_offset和dra_delta_range[j]的位的数量是<MARK>BitDepthY</MARK>位。
其中变量BitDepthY从SPS语法元素中导出如下:
bit_depth_luma_minus8指定亮度阵列BitDepthY的样本的位深度和亮度量化参数范围偏置QpBdOffsetY的值如下:
BitDepthY=8+bit_depth_luma_minus8 (7-3)
在(APS)的后一种情况下,可以理解的是,位深度依赖性有利于适用于多种位深度(例如,12位或16位数据)的DRA设计。然而,如上所述,具有这种依赖性是不合需要的。
这种问题的一种可能的解决方案是引入可以识别用于信令通知全局DRA偏置(例如,dra_global_offset)和指示亮度的位深度(例如,bit_depth_luma_minus8)的语法元素的位的数量的附加语法元素。然而,由于事实上这种设计通过引入附加语法元素而增加了视频编码器200和视频解码器300的比特率和复杂度,因此该设计也是不合需要的。
根据本公开的技术,为了解决上述问题,公开了对EVC中的设计的以下改变。在某些示例中,这些技术也可以适用于其他视频译码器设计。例如,视频编码器200和视频解码器300可以被配置为根据以下改变来运行。
根据本公开的技术,PPS和/或APS中的DRA语法元素对SPS的依赖性可以被去除。以这种方式,视频解码器300可以:解析适用于视频数据的块的SPS;解析适用于该块的第二参数集中的一个或多个动态范围调整(DRA)语法元素,其中对一个或多个DRA语法元素的解析不依赖于SPS的任何语法元素;以及基于SPS和第二参数集来处理块。在某些示例中,SPS和第二参数集在不同的NAL单元中。
1)去除PPS中的依赖性:
在某些示例中,第二参数集是PPS。第二参数集的一个或多个DRA语法元素可以包括指示第二DRA语法元素(其本身指示DRA是否被使能)是否存在于PPS中的第一DRA语法元素(例如,pic_dra_enabled_present_flag)、第二DRA语法元素(例如,pic_dra_enabled_flag)、或指示DRA自适应参数集的标识符的第三DRA语法元素(例如,pic_dra_aps_id)。在某些示例中,视频解码器300可以在对SPS中指示映射到块的输出样本上的DRA是否被使用的语法元素进行解析之前对PPS进行解析。通过使PPS中的DRA语法元素不依赖于SPS中的语法元素,即使视频解码器300尚未接收到SPS或者未对SPS进行解析,视频解码器300也可以对PPS进行解析。
为了在EVC中去除PPS中的SPS语法元素依赖性,可以去除以下所示的在标记<DELETE>和</DELETE>之间的条件。另外,可以通过去除以下所示的位于标记<DELETE>和</DELETE>之间的pic_dra_enabled_present_flag来减少控制语法元素的数量。例如,视频编码器200可以不信令通知pic_dra_enabled_present_flag并且视频解码器300可以不确定以下删除的条件。
Figure BDA0003860680360000431
2)去除APS中的解析依赖:
在某些示例中,第二参数集是自适应参数集。在某些示例中,一个或多个DRA语法元素包括其值指示用于导出DRA表的起始码字位置的语法元素或其值指示码字中被用于导出DRA表的范围的语法元素中的至少一个。在某些示例中,视频解码器300可以在对SPS中指示亮度位深度的语法元素进行解析之前解析第二参数集。在某些示例中,一个或多个DRA语法元素的第一DRA语法元素具有预定的固定位深度(例如,10位)。在某些示例中,第一DRA语法元素是其值指示用于导出DRA表的起始码字位置的语法元素。在某些示例中,第一DRA语法元素是其值指示码字中用于导出DRA表的范围的语法元素。通过使DRA APS中的DRA语法元素具有固定位深度而不是使DRA语法元素的位深度基于SPS中的语法元素的值,即使视频解码器300尚未接收到SPS或未对SPS进行解析,视频解码器300仍然可以对DRA APS进行解析。
为了去除DRA APS中的解析依赖性,用于信令通知语法元素的位数可以是固定的,例如,使用10位,并且视频解码器300可以取决于在DRA重建过程期间被确定的信令通知的位深度来确定语法元素的实际值。由于语法元素解释过程是在解析之后实施的,因此没有引入解析依赖。举例来说,视频编码器200可以使用固定数量的位来信令通知语法元素,例如以下标记的那些。以下将更改标记在标记<CHANGE>和</CHANGE>之间。
dra_global_offset指定用于导出DRA表的起始码字位置,即,定义变量InDraRange[0]的值。<CHANGE>用于信令通知dra_global_offset的位数为10位。</CHANGE>
dra_delta_range[j]指定码字中用于导出DRA表的第j个范围的大小,其中j在1到dra_number_ranges_minus1+1的范围内。<CHANGE>用于信令通知dra_delta_range[j]的位数是10位。</CHANGE>dra_delta_range[j]的值应该在1到Min(1023,(1<<BitDepthY)-1)的范围(包括端点值)内。
变量InDraRange[0]被初始化如下:
<CHANGE>InDraRange[0]=dra_global_offset<<Max(0,BitDepthY–10)</CHANGE> (7-70)
针对在1到dra_number_ranges_minus1+1的范围(包括端点值)内的j,变量InDraRange[j]被导出如下:
deltaRange=(dra_equal_ranges_flag==1)?dra_delta_range[0]:dra_delta_range[j–1]
InDraRange[j]=InDraRange[j–1]+<CHANGE>(deltaRange<<Max(0,BitDepthY–10))</CHANGE> (7-71)
比特流一致性要求InDraRange[j]应该在0到(1<<BitDepthY)–1的范围(包括端点值)内。
图13是包括DRA单元的视频编码器和视频解码器系统的框图。诸如视频编码器200的视频编码器可以包括正向DRA单元240和译码核242。在某些示例中,译码核242可以包括图2中描绘的单元并且可以如以上参考图2所述的运行。视频编码器200还可以确定可以包括来自正向DRA单元240的信息的多个APS 244和多个PPS 246。
根据本公开的技术,视频编码器200可以信令通知适用于视频数据的块的SPS。正向DRA单元240可以确定适用于该块的第二参数集中的一个或多个DRA语法元素,其中视频解码器对一个或多个DRA语法元素的解析不依赖于SPS的任何语法元素。视频编码器200可以对第二参数集进行信令通知。
诸如视频解码器300的视频解码器可以包括译码核340和输出DRA单元342。在某些示例中,译码核340可以包括图3中描绘的单元并且可以如以上参考图3所述的运行。视频解码器300还可以确定可以包括要由输出DRA单元342使用的信息的多个APS 344和多个PPS346。
根据本公开的技术,视频解码器300可以解析适用于视频数据的块的序列参数集(SPS)。输出DRA单元342可以解析适用于该块的第二参数集中的一个或多个动态范围调整(DRA)语法元素,其中对DRA语法元素的一个或多个解析不依赖于SPS的任何语法元素。输出DRA单元342可以基于SPS和第二参数集来处理该块。
图14是示出根据本公开的动态范围调整参数解析技术的流程图。视频解码器300可以对第一参数集进行解析,该第一参数集针对每个一组已编码图片的序列在已编码视频数据的比特流中被信令通知一次(580)。例如,视频解码器300可以在比特流中接收SPS并且可以对SPS进行解析以确定包括在SPS内的语法元素的值。SPS可以适用于图片序列,因为在解码图片的序列时可以使用SPS内的语法元素的值。换言之,SPS可以适用于包括多个图片的视频数据的序列。
视频解码器300可以解析第二参数集中的一个或多个动态范围调整(DRA)语法元素。第二参数集在已编码视频数据的比特流中用信令通知。第二参数集与该组已编码图片中的图片中至少一个图片相关,其中对一个或多个DRA语法元素的解析不依赖于第一参数集的任何语法元素(582)。以这种方式,对第二参数集的解析独立于适用的第一参数集。例如,视频解码器300可以独立于第一参数集来解析第二参数集,并且在解析第二参数集时可以不依赖或不依靠于第一参数集中的任何语法元素。
视频解码器300可以基于第一参数集和第二参数集来处理该至少一个图片(584)。例如,视频解码器300可以在处理该至少一个图片时利用第一参数集和第二参数集内的语法元素的值。
在某些示例中,第一参数集和第二参数集在不同的网络抽象层(NAL)单元中。在某些示例中,作为独立解析第二参数集的一部分,视频解码器300可以在解析第一参数集之前对第二参数集进行解析。在某些示例中,第一参数集是序列参数集(SPS)而第二参数集是图片参数集(PPS)。在某些示例中,一个或多个DRA语法元素包括以下各项中的一个或多个:i)指示第二DRA语法元素是否存在于PPS中的第一DRA语法元素,ii)第二DRA语法元素,第二DRA语法元素指示DRA是否被使能,或iii)指示描述DRA参数的第三参数集的标识符的第三DRA语法元素。
在某些示例中,作为解析一个或多个DRA语法元素的一部分,视频解码器300可以在解析SPS中指示映射到块的输出样本上的动态范围调整是否被使用的语法元素之前解析PPS。例如,视频解码器300可以在解析sps_dra_flag之前解析PPS。
在某些示例中,第一参数集是序列参数集(SPS)而第二参数集是自适应参数集(APS)。在某些示例中,一个或多个DRA语法元素包括其值指示用于导出DRA表的起始码字位置的第一语法元素或其值指示码字中用于导出DRA表的范围的第二语法元素中的至少一个。在一些示例中,作为解析一个或多个DRA语法元素的一部分,视频解码器300可以在解析SPS中指示亮度位深度的语法元素之前解析APS。在某些示例中,APS中的DRA语法元素具有预定的固定位深度。在某些示例中,DRA语法元素包括其值指示用于导出DRA表的起始码字位置的语法元素。例如,DRA语法元素可以包括dra_global_offset。在某些示例中,DRA语法元素包括其值指示码字中用于导出DRA表的范围的语法元素。例如,DRA语法元素可以包括dra_delta_range[j]。在某些示例中,预定的固定位深度是10位。
图15是示出用于对当前块进行编码的一种示例方法的流程图。当前块可以包括当前CU。尽管参考视频编码器200(图1和图2)进行了描述,但是应当理解的是,其他设备可以被配置为执行与图15的方法类似的方法。
在本示例中,视频编码器200最初对当前块进行预测(350)。例如,视频编码器200可以形成针对当前块的预测块。接着,视频编码器200可以计算针对当前块的残差块(352)。为了计算残差块,视频编码器200可以计算原始的未编码的块与针对当前块的预测块之间的差。之后,视频编码器200可以对该残差块进行变换并对该残差块的变换系数进行量化(354)。接下来,视频编码器200可以对残差块的已量化的变换系数进行扫描(356)。在扫描期间或在扫描之后,视频编码器200可以对变换系数进行熵编码(358)。例如,视频编码器200可以使用CAVLC或CABAC来对变换系数进行编码。然后,视频编码器200可以输出块的经熵编码数据(360)。
图16是示出用于对视频数据的当前块进行解码的一种示例方法的流程图。当前块可以包括当前CU。尽管参考视频解码器300(图1和图3)进行了描述,但是应当理解的是,其他设备可以被配置为执行与图16类似的方法。
视频解码器300可以接收用于当前块的经熵编码的数据,例如经熵编码的预测信息和针对对应于当前块的残差块的变换系数的经熵编码数据(370)。视频解码器300可以对经熵编码的数据进行熵解码,以确定针对当前块的预测信息并且重现残差块的变换系数(372)。视频解码器300可以例如,使用由针对当前块的预测信息所指示的帧内或帧间预测模式来预测当前块(374),以计算针对当前块的预测块。然后,视频解码器300可以对重现的变换系数进行逆扫描(376),以创建已量化变换系数的块。接着,视频解码器300可以对变换系数进行逆量化并将逆变换应用于变换系数以产生残差块(378)。视频解码器300最终可以通过将预测块和残差块进行组合来对当前块进行解码(380)。
通过去除第二参数集(例如,PPS或APS)对SPS的语法元素的依赖性,本公开的技术利于视频解码器300解析第二参数集而无需等待接收比特流中的SPS。因此,本公开的技术可以减少解码延迟。
本公开包含以下条款。
条款1A.一种处理视频数据的方法,该方法包括:抑制确定图片参数集中的pic_dra_enabled_present_flag;以及根据图片参数集处理视频数据。
条款2A.一种处理视频数据的方法,该方法包括:将动态范围调整自适应参数集中的语法元素的位数固定为预定的位数;以预定的位数来信令通知语法元素;以及基于该语法元素处理视频数据。
条款3A.根据条款2A所述的方法,其中语法元素是dra_global_offset或dra_delta_range[j]。
条款4A.根据条款2A或条款3A所述的方法,其中预定的位数是10。
条款5A.根据条款1A所述的方法,其中处理包括解码。
条款6A.根据条款1A-5A中任一项所述的方法,其中处理包括编码。
条款7A.一种用于处理视频数据的设备,该设备包括用于执行条款1A-6A中任一项所述的方法的一个或多个部件。
条款8A.根据条款7A所述的设备,其中所述一个或多个部件包括在电路中实现的一个或多个处理器。
条款9A.根据条款7A和8A中任一项所述的设备,还包括存储视频数据的存储器。
条款10A.根据条款7A-9A中任一项所述的设备,还包括被配置为显示已解码视频数据的显示器。
条款11A.根据条款7A-10A中任一项所述的设备,其中该设备包括相机、计算机、移动设备、广播接收器设备或机顶盒中的一个或多个。
条款12A.根据条款7A-11A中任一项所述的设备,其中该设备包括视频解码器。
条款13A.根据条款7A-12A中任一项所述的设备,其中该设备包括视频编码器。
条款14A.一种其上存储有指令的计算机可读存储介质,该指令在被执行时,使得一个或多个处理器执行条款1A-6A中任一项所述的方法。
条款15A.一种用于对视频数据进行编码的设备,该设备包括:用于抑制确定图片参数集中的pic_dra_enabled_present_flag的部件;以及用于基于图片参数集来处理视频数据的部件。
条款16A.一种用于对视频数据进行编码的设备,该设备包括:用于将动态范围调整自适应参数集中的语法元素的位数固定为预定的位数的部件;用于以预定的位数来信令通知语法元素的部件;以及用于基于语法元素来处理视频数据的部件。
条款1B.一种处理视频数据的方法,该方法包括:对第一参数集进行解析,第一参数集针对每个一组已编码图片的序列在已编码视频数据的比特流中被信令通知一次;对第二参数集中的一个或多个动态范围调整(DRA)语法元素进行解析,第二参数集在已编码视频数据的比特流中被信令通知并且与该组的已编码图片中的至少一个图片相关,其中对一个或多个DRA语法元素的解析不依赖于第一参数集的任何语法元素;以及基于第一参数集和第二参数集来处理该至少一个图片。
条款2B.根据条款1B所述的方法,其中第一参数集和第二参数集在不同的网络抽象层单元中。
条款3B.根据条款1B或2B所述的方法,其中对一个或多个DRA语法元素进行解析包括在解析第一参数集之前解析第二参数集。
条款4B.根据条款1B-3B的任一组合所述的方法,其中第一参数集是序列参数集(SPS),而第二参数集是图片参数集(PPS)。
条款5B.根据条款4B所述的方法,其中一个或多个DRA语法元素包括下述语法元素中的一个或多个:i)第一DRA语法元素,指示第二DRA语法元素是否存在于PPS中,ii)第二DRA语法元素,所述第二DRA语法元素指示DRA是否被使能,或iii)第三DRA语法元素,指示描述DRA参数的第三参数集的标识符。
条款6B.根据条款4B所述的方法,其中解析一个或多个DRA语法元素包括在解析SPS中指示映射到该至少一个图片的输出样本上的DRA是否被使用的语法元素之前解析所述PPS。
条款7B.根据条款1B-3B的任一组合所述的方法,其中第一参数集是序列参数集(SPS),而第二参数集是自适应参数集(APS)。
条款8B.根据条款7B所述的方法,其中一个或多个DRA语法元素包括其值指示用于导出DRA表的起始码字位置的第一语法元素或其值指示码字中用于导出DRA表的范围的第二语法元素中至少之一。
条款9B.根据条款7B或条款8B所述的方法,其中解析一个或多个DRA语法元素包括在解析SPS中指示亮度位深度的语法元素之前解析APS。
条款10B.根据条款7B-9B的任一组合所述的方法,其中一个或多个DRA语法元素的第一DRA语法元素具有预定的固定位深度。
条款11B.根据条款10B所述的方法,其中第一DRA语法元素包括其值指示用于导出DRA表的起始码字位置的语法元素。
条款12B.根据条款10B所述的方法,其中第一DRA语法元素包括其值指示码字中用于导出DRA表的范围的语法元素。
条款13B.根据条款10B-12B的任一组合所述的方法,其中预定的固定位深度是10位。
条款14B.一种用于处理视频数据的设备,该设备包括:存储器,被配置为存储视频数据;以及在电路中实现并耦接至存储器的一个或多个处理器,一个或多个处理器被配置为:对第一参数集进行解析,第一参数集针对每个一组已编码图片的序列在已编码视频数据的比特流中被信令通知一次;对第二参数集中的一个或多个动态范围调整(DRA)语法元素进行解析,第二参数集在已编码视频数据的比特流中被信令通知并且与该组的已编码图片中的至少一个图片相关,其中对一个或多个DRA语法元素的解析不依赖于第一参数集的任何语法元素;以及基于第一参数集和第二参数集来处理该至少一个图片。
条款15B.根据条款14B所述的设备,其中第一参数集和第二参数集在不同的网络抽象层单元中。
条款16B.根据条款14B或条款15B所述的设备,其中作为解析一个或多个DRA语法元素的一部分,一个或多个处理器被配置为:在解析第一参数集之前解析第二参数集。
条款17B.根据条款14B-16B的任一组合所述的设备,其中第一参数集是序列参数集(SPS),而第二参数集是图片参数集(PPS)。
条款18B.根据条款17所述的设备,其中一个或多个DRA语法元素包括下述语法元素中的一个或多个:i)第一DRA语法元素,指示第二DRA语法元素是否存在于PPS中,ii)第二DRA语法元素,该第二DRA语法元素指示DRA是否被使能,或iii)第三DRA语法元素,指示描述DRA参数的第三参数集的标识符。
条款19B.根据条款17B所述的设备,其中作为解析一个或多个DRA语法元素的一部分,一个或多个处理器被配置为:在解析SPS中指示映射到该至少一个图片的输出样本上的动态范围调整是否被使用的语法元素之前解析PPS。
条款20B.根据条款14B-16B的任一组合所述的设备,其中第一参数集是序列参数集(SPS),而第二参数集是自适应参数集(APS)。
条款21B.根据条款20B所述的设备,其中一个或多个DRA语法元素包括其值指示用于导出DRA表的起始码字位置的第一语法元素或其值指示码字中用于导出DRA表的范围的第二语法元素中至少之一。
条款22B.根据条款20B或条款21B所述的设备,其中作为解析一个或多个DRA语法元素的一部分,一个或多个处理器被配置为:在解析SPS中指示亮度位深度的语法元素之前解析APS。
条款23B.根据条款20B-22B的任一组合所述的设备,其中一个或多个DRA语法元素的第一DRA语法元素具有预定的固定位深度。
条款24B.根据条款23B所述的设备,其中第一DRA语法元素包括其值指示用于导出DRA表的起始码字位置的语法元素。
条款25B.根据条款23B所述的设备,其中第一DRA语法元素包括其值指示码字中用于导出DRA表的范围的语法元素。
条款26B.根据条款23B-25B的任一组合所述的设备,其中预定的固定位深度是10位。
条款27B.一种存储指令的非暂存性计算机可读存储介质,上述指令在被执行时,使得一个或多个处理器:对第一参数集进行解析,第一参数集针对每个一组已编码图片的序列在已编码视频数据的比特流中被信令通知一次;对第二参数集中的一个或多个动态范围调整(DRA)语法元素进行解析,第二参数集在已编码视频数据的比特流中被信令通知并且与该组的已编码图片中的至少一个图片相关,其中对一个或多个DRA语法元素的解析不依赖于第一参数集的任何语法元素;以及基于第一参数集和第二参数集来处理该至少一个图片。
条款28B.一种用于处理视频数据的设备,该设备包括:对第一参数集进行解析的部件,第一参数集针对每个一组已编码图片的序列在已编码视频数据的比特流中被信令通知一次;对第二参数集中的一个或多个动态范围调整(DRA)语法元素进行解析的部件,第二参数集在已编码视频数据的比特流中被信令通知并且与该组的已编码图片中的至少一个图片相关,其中对一个或多个DRA语法元素的解析不依赖于第一参数集的任何语法元素;以及基于第一参数集和第二参数集来处理该至少一个图片的部件。
应该认识到,根据示例,可以以不同的顺序执行,也可以添加、合并或完全省略(例如,并非所有描述的动作或事件是实践这些技术所必要的)本文描述的技术中的任一种的某些动作或事件。此外,在某些示例中,可以例如通过多线程处理、中断处理或多个处理器并发地执行动作或事件,而不是顺序地执行动作或事件。
在一个或多个示例中,可以以硬件、软件、固件或其任意组合来实现所述功能。如果以软件实现,则所述功能可以作为一个或多个指令或代码存储在计算机可读介质上或通过计算机可读介质进行传输,并由基于硬件的处理单元执行。计算机可读介质可以包括计算机可读存储介质或者通信介质。计算机可读存储介质对应于诸如数据存储介质的有形介质。通信介质包括有助于,例如根据通信协议,将计算机程序从一处传送到另一处的任何介质。以这种方式,计算机可读介质通常可以对应于(1)非暂时性的有形计算机可读存储介质,或者(2)诸如信号或载波的通信介质。数据存储介质可以是可以由一台或更多台计算机或一个或多个处理器访问以检索指令、代码和/或数据结构,从而实现本公开中描述的技术的任何可用介质。计算机程序产品可以包括计算机可读介质。
作为示例而非限制,上述计算机可读存储介质可以包括:RAM、ROM、EEPROM、CD-ROM或其他光盘存储、磁盘存储、或其他磁性存储设备、闪存存储器或任何其他可以用于以指令或数据结构形式存储所需程序代码且可由计算机访问的介质。而且,任何连接都适当地称为计算机可读介质。例如,如果使用同轴电缆、光纤电缆、双绞线、数字用户线(DSL)或诸如红外,无线电和微波的无线技术从网站、服务器或其他远程源发送指令,则上述同轴电缆、光纤电缆、双绞线、DSL或诸如红外、无线电和微波的无线技术都包含于介质的定义。然而,应当理解,计算机可读存储介质和数据存储介质并不包括连接、载波、信号或其他瞬时介质,而是指非瞬时的有形存储介质。本文使用的磁盘和光盘包括压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软盘和Blu-ray光盘,其中磁盘通常以磁性方式复制数据,而光盘则通过激光光学方式复制数据。上述的组合也应包括在计算机可读介质的范围内。
可以由一个或多个处理器来执行指令,该一个或多个处理器例如一个或多个信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其他等效的集成或离散逻辑电路。因此,如本文所使用的术语“处理器”和“处理电路”可以指任何前述结构或适合于实现本文所述的技术的任何其他结构。另外,在某些方面,本文所述的功能可以在被配置用于进行编码和解码的专用硬件和/或软件模块内提供,或结合在组合译码器中。同样,所述技术可以在一个或多个电路或逻辑元件中充分实现。
本公开的技术可以在各种各样的设备或装置中实现,包括无线手机、集成电路(IC)或一组IC(例如,芯片组)。在本公开中描述了多个组件、模块或单元以强调被配置为执行所公开的技术的设备的功能方面,但不一定需要由不同硬件单元来实现。准确地说,如上所述,结合适当的软件和/或固件,多个单元可以组合在译码器硬件单元中,或者由互操作硬件单元集来提供,包括如上所述的一个或多个处理器。
已经对多种示例进行了描述。这些和其他示例均在所附权利要求的范围内。

Claims (27)

1.一种处理视频数据的方法,所述方法包括:
对第一参数集进行解析,所述第一参数集针对每个一组已编码图片的序列在已编码视频数据的比特流中被信令通知一次;
对第二参数集中的一个或多个动态范围调整(DRA)语法元素进行解析,所述第二参数集在所述已编码视频数据的比特流中被信令通知并且与所述一组已编码图片中的至少一个图片相关,其中对所述一个或多个DRA语法元素的所述解析不依赖于所述第一参数集的任何语法元素;以及
基于所述第一参数集和所述第二参数集来处理所述至少一个图片。
2.根据权利要求1所述的方法,其中所述第一参数集和所述第二参数集在分离的网络抽象层单元中。
3.根据权利要求1所述的方法,其中对所述一个或多个DRA语法元素进行解析包括在解析所述第一参数集之前解析所述第二参数集。
4.根据权利要求1所述的方法,其中所述第一参数集是序列参数集(SPS),并且所述第二参数集是图片参数集(PPS)。
5.根据权利要求4所述的方法,其中所述一个或多个DRA语法元素包括以下中的一个或多个:i)第一DRA语法元素,指示第二DRA语法元素是否存在于所述PPS中,ii)所述第二DRA语法元素,所述第二DRA语法元素指示DRA是否被使能,或iii)第三DRA语法元素,指示描述DRA参数的第三参数集的标识符。
6.根据权利要求4所述的方法,其中解析所述一个或多个DRA语法元素包括在解析所述SPS中指示映射到所述至少一个图片的输出样本上的DRA是否被使用的语法元素之前解析所述PPS。
7.根据权利要求1所述的方法,其中所述第一参数集是序列参数集(SPS),并且所述第二参数集是自适应参数集(APS)。
8.根据权利要求7所述的方法,其中所述一个或多个DRA语法元素包括其值指示用于导出DRA表的起始码字位置的第一语法元素或其值指示码字中用于导出所述DRA表的范围的第二语法元素中至少之一。
9.根据权利要求7所述的方法,其中解析所述一个或多个DRA语法元素包括在解析所述SPS中指示亮度位深度的语法元素之前解析所述APS。
10.根据权利要求7所述的方法,其中一个或多个DRA语法元素的第一DRA语法元素具有预定的固定位深度。
11.根据权利要求10所述的方法,其中所述第一DRA语法元素包括其值指示用于导出DRA表的起始码字位置的语法元素。
12.根据权利要求10所述的方法,其中所述第一DRA语法元素包括其值指示码字中用于导出DRA表的范围的语法元素。
13.根据权利要求10所述的方法,其中所述预定的固定位深度是10位。
14.一种用于处理视频数据的设备,所述设备包括:
存储器,被配置为存储所述视频数据;以及
在电路中实现并耦接至所述存储器的一个或多个处理器,所述一个或多个处理器被配置为:
对第一参数集进行解析,所述第一参数集针对每个一组已编码图片的序列在已编码视频数据的比特流中被信令通知一次;
对第二参数集中的一个或多个动态范围调整(DRA)语法元素进行解析,所述第二参数集在所述已编码视频数据的比特流中被信令通知并且与所述一组已编码图片中的至少一个图片相关,其中对所述一个或多个DRA语法元素的所述解析不依赖于所述第一参数集的任何语法元素;并且
基于所述第一参数集和所述第二参数集来处理所述至少一个图片。
15.根据权利要求14所述的设备,其中所述第一参数集和所述第二参数集在分离的网络抽象层单元中。
16.根据权利要求14所述的设备,其中作为解析所述一个或多个DRA语法元素的一部分,所述一个或多个处理器被配置为:
在解析所述第一参数集之前解析所述第二参数集。
17.根据权利要求14所述的设备,其中所述第一参数集是序列参数集(SPS),并且所述第二参数集是图片参数集(PPS)。
18.根据权利要求17所述的设备,其中所述一个或多个DRA语法元素包括以下中的一个或多个:i)第一DRA语法元素,指示第二DRA语法元素是否存在于所述PPS中,ii)所述第二DRA语法元素,所述第二DRA语法元素指示DRA是否被使能,或iii)第三DRA语法元素,指示描述DRA参数的第三参数集的标识符。
19.根据权利要求17所述的设备,其中作为解析所述一个或多个DRA语法元素的一部分,所述一个或多个处理器被配置为:
在解析所述SPS中指示映射到所述块的输出样本上的DRA是否被使用的语法元素之前解析所述PPS。
20.根据权利要求14所述的设备,其中所述第一参数集是序列参数集(SPS),并且所述第二参数集是自适应参数集(APS)。
21.根据权利要求20所述的设备,其中所述一个或多个DRA语法元素包括其值指示用于导出DRA表的起始码字位置的第一语法元素或其值指示码字中用于导出所述DRA表的范围的第二语法元素中至少之一。
22.根据权利要求20所述的设备,其中作为解析所述一个或多个DRA语法元素的一部分,所述一个或多个处理器被配置为:
在解析所述SPS中指示亮度位深度的语法元素之前解析所述APS。
23.根据权利要求20所述的设备,其中所述一个或多个DRA语法元素的第一DRA语法元素具有预定的固定位深度。
24.根据权利要求23所述的设备,其中所述第一DRA语法元素包括其值指示用于导出DRA表的起始码字位置的语法元素。
25.根据权利要求23所述的设备,其中所述第一DRA语法元素包括其值指示码字中用于导出DRA表的范围的语法元素。
26.根据权利要求23所述的设备,其中所述预定的固定位深度是10位。
27.一种存储指令的非暂时性计算机可读介质,所述指令在被执行时,使得一个或多个处理器:
对第一参数集进行解析,所述第一参数集针对每个一组已编码图片的序列在已编码视频数据的比特流中被信令通知一次;
对第二参数集中的一个或多个动态范围调整(DRA)语法元素进行解析,所述第二参数集在所述已编码视频数据的比特流中被信令通知并且与所述一组已编码图片中的至少一个图片相关,其中对所述一个或多个DRA语法元素的所述解析不依赖于所述第一参数集的任何语法元素;并且
基于所述第一参数集和所述第二参数集来处理所述至少一个图片。
CN202180023921.8A 2020-04-10 2021-04-09 动态范围调整参数信令和使能可变位深度支持 Pending CN115362678A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063008533P 2020-04-10 2020-04-10
US63/008,533 2020-04-10
US17/225,801 2021-04-08
US17/225,801 US11533512B2 (en) 2020-04-10 2021-04-08 Dynamic range adjustment parameter signaling and enablement of variable bit depth support
PCT/US2021/026561 WO2021207589A1 (en) 2020-04-10 2021-04-09 Dynamic range adjustment parameter signaling and enablement of variable bit depth support

Publications (1)

Publication Number Publication Date
CN115362678A true CN115362678A (zh) 2022-11-18

Family

ID=75747116

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180023921.8A Pending CN115362678A (zh) 2020-04-10 2021-04-09 动态范围调整参数信令和使能可变位深度支持

Country Status (7)

Country Link
US (1) US11533512B2 (zh)
EP (1) EP4133727A1 (zh)
KR (1) KR20230002329A (zh)
CN (1) CN115362678A (zh)
BR (1) BR112022020002A2 (zh)
TW (1) TW202145790A (zh)
WO (1) WO2021207589A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102293193B1 (ko) * 2014-01-24 2021-08-25 소니그룹주식회사 송신 장치, 송신 방법, 수신 장치 및 수신 방법

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005341184A (ja) * 2004-05-27 2005-12-08 Matsushita Electric Ind Co Ltd profile_idcフラグの有効性を通知し復号する方法
US20130114694A1 (en) * 2011-11-08 2013-05-09 Qualcomm Incorporated Parameter set groups for coded video data
JP6094688B2 (ja) 2013-12-27 2017-03-15 ソニー株式会社 画像処理装置及び画像処理方法
EP4020995A1 (en) 2015-07-16 2022-06-29 Dolby Laboratories Licensing Corporation Signal reshaping and coding for hdr and wide color gamut signals
US10129558B2 (en) * 2015-09-21 2018-11-13 Qualcomm Incorporated Supplement enhancement information (SEI) messages for high dynamic range and wide color gamut video coding
US10244249B2 (en) * 2015-09-21 2019-03-26 Qualcomm Incorporated Fixed point implementation of range adjustment of components in video coding
US11716474B2 (en) * 2020-01-02 2023-08-01 Samsung Electronics Co., Ltd. Storage of EVC decoder configuration information

Also Published As

Publication number Publication date
BR112022020002A2 (pt) 2022-11-22
WO2021207589A1 (en) 2021-10-14
KR20230002329A (ko) 2023-01-05
US11533512B2 (en) 2022-12-20
EP4133727A1 (en) 2023-02-15
TW202145790A (zh) 2021-12-01
US20210329304A1 (en) 2021-10-21

Similar Documents

Publication Publication Date Title
TWI807008B (zh) 在視訊寫碼中之基於變換之量化及動態範圍調整尺度推導之協調
CN112042202B (zh) 解码图片缓冲区管理及动态范围调整
US11146823B2 (en) Signalling chroma quantization parameter (QP) mapping tables
US11533512B2 (en) Dynamic range adjustment parameter signaling and enablement of variable bit depth support
US11558616B2 (en) Methods for quantization parameter control for video coding with joined pixel/transform based quantization
US11671600B2 (en) Signaling intensity dependent deblocking filtering for video coding
US11463737B2 (en) Signaling of dynamic range adjustment parameters for decoded picture buffer management and dynamic range
US20240098293A1 (en) Encoding high dynamic range video data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination