CN109644277A - 用于回路内样本处理的视频译码工具 - Google Patents

用于回路内样本处理的视频译码工具 Download PDF

Info

Publication number
CN109644277A
CN109644277A CN201780048583.7A CN201780048583A CN109644277A CN 109644277 A CN109644277 A CN 109644277A CN 201780048583 A CN201780048583 A CN 201780048583A CN 109644277 A CN109644277 A CN 109644277A
Authority
CN
China
Prior art keywords
current block
value
video
block
parameter value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780048583.7A
Other languages
English (en)
Inventor
德米特罗·鲁萨诺夫斯基
德内·布达伊哲·桑斯利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN109644277A publication Critical patent/CN109644277A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/94Vector quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及一种装置,其包含经配置以存储包含当前块的视频数据的存储器装置,和与所述存储器通信的处理电路。所述处理电路经配置以获得参数值,所述参数值是基于与存储到所述存储器装置的所述视频数据的一或多个相邻块相关联的一或多个对应的参数值,所述一或多个相邻块定位于所述当前块的时空邻域内,所述时空邻域包含定位成邻近于所述当前块的一或多个空间相邻块和由与所述当前块相关联的视差向量DV指向的时间相邻块。所述处理电路还经配置以译码存储到所述存储器装置的所述视频数据的所述当前块。

Description

用于回路内样本处理的视频译码工具
本申请案主张2016年8月11日申请的美国临时申请案第62/373,884号的权益,所述申请案的全部内容特此以引用的方式并入。
技术领域
本发明涉及视频编码和视频解码。
背景技术
数字视频能力可并入到广泛范围的装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或台式计算机、平板计算机、电子书阅读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话(所谓的“智能型电话”)、视频电话会议装置、视频流式传输装置等。数字视频装置实施视频译码技术,例如由ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-T H.262或ISO/IEC MPEG-2 Visual、MPEG-2、MPEG-4、MPEG-4 Visual、ITU-T H.263、ITU-T H.264/MPEG-4第10部分先进视频译码(AVC)、ISO/IEC MPEG-4AVC ITU-T H.265、高效率视频译码(HEVC)定义的标准和这些标准中的任一个的扩展(例如可调式视频译码(SVC)和/或多视图视频译码(MVC)扩展)中所描述的那些技术。视频装置可通过实施此类视频译码技术来更有效地发射、接收、编码、解码和/或存储数字视频信息。
视频译码技术包含空间(图片内)预测和/或时间(图片间)预测以减少或去除视频序列中固有的冗余。对于基于块的视频译码,可将视频图块(例如,视频帧或视频帧的一部分)分割成视频块(其也可被称作树型块)、译码单元(CU)和/或译码节点。图片的经帧内译码(I)图块中的视频块是使用关于同一图片中的相邻块中的参考样本的空间预测来编码。图片的经帧间译码(P或B)图块中的视频块可使用关于同一图片中的相邻块中的参考样本的空间预测或关于其它参考图片中的参考样本的时间预测。图片可被称作帧,且参考图片可被称作参考帧。
空间或时间预测产生用于待译码块的预测性块。残余数据表示待译码的原始块和预测性块之间的像素差。根据指向形成预测性块的参考样本的块的运动向量和指示经译码块与预测性块之间的差异的残余数据来编码经帧间译码块。根据帧内译码模式和残余数据来编码经帧内译码块。为进行进一步压缩,可将残余数据从像素域变换到变换域,从而产生残余变换系数,可接着量化所述残余变换系数。可扫描最初布置成二维阵列的经量化变换系数以便产生变换系数的一维向量,且可应用熵译码以达成甚至更多压缩。
发明内容
大体来说,本发明描述关于视频数据的译码(例如解码或编码)的技术。在一些实例中,本发明的技术涉及具有高动态范围(HDR)和广色域(WCG)表示的视频信号的译码。所描述技术可用于先进视频编解码器的上下文中,例如HEVC的扩展或下一代视频译码标准。
在一个实例中,一种用于译码视频数据的装置包含存储器和与存储器通信的处理电路。存储器经配置以存储包含当前块的视频数据。处理电路经配置以获得参数值,所述参数值是是基于与存储到存储器的视频数据的一或多个相邻块相关联的一或多个对应的参数值。所述一或多个相邻块定位于当前块的时空邻域内。时空邻域包含定位成邻近于当前块的一或多个空间相邻块和由与当前块相关联的视差向量(DV)指向的时间相邻块。所获得的参数值用于在译码过程中修改与当前块相关联的残余数据。处理电路经进一步配置以译码存储到存储器的视频数据的当前块。
在另一实例中,一种译码视频数据的当前块的方法包含获得参数值,所述参数值是基于与定位于当前块的时空邻域内的视频数据的一或多个相邻块相关联的一或多个对应的参数值。时空邻域包含定位成邻近于当前块的一或多个空间相邻块和由与当前块相关联的视差向量(DV)指向的时间相邻块。所获得的参数值用于在译码过程中修改与当前块相关联的残余数据。方法进一步包含基于所获得的参数值来译码视频数据的当前块。
在另一实例中,一种用于译码视频的设备包含用于获得参数值的装置,所述参数值是基于与定位于视频数据的当前块的时空邻域内的视频数据的一或多个相邻块相关联的一或多个对应的参数值,其中时空邻域包含定位成邻近于当前块的一或多个空间相邻块和由与当前块相关联的视差向量(DV)指向的时间相邻块,且其中所获得的参数值用于在译码过程中修改与当前块相关联的残余数据。设备进一步包含用于基于所获得的参数值来译码视频数据的当前块的装置。
在另一实例中,一种经指令编码的非暂时性计算机可读存储媒体,所述指令在经执行时使得视频译码装置的处理电路获得参数值,所述参数值是基于与定位于视频数据的当前块的时空邻域内的视频数据的一或多个相邻块相关联的一或多个对应的参数值,时空邻域包含定位成邻近于当前块的一或多个空间相邻块和由与当前块相关联的视差向量(DV)指向的时间相邻块,其中所获得的参数值用于在译码过程中修改与当前块相关联的残余数据,且基于所获得的参数值来译码视频数据的当前块。
在附图和以下描述中阐述一或多个实例的细节。其它特征、目标和优势将从描述和图式以及权利要求书显而易见。
附图说明
图1为说明经配置以实施本发明的技术的实例视频编码和解码系统的框图。
图2为说明高动态范围数据的概念的概念图。
图3为说明实例色域的概念图。
图4为说明高动态范围(HDR)/广色域(WCG)表示转换的实例的流程图。
图5为展示实例HDR/WCG反转换的流程图。
图6为说明实例转移函数的概念图。
图7为说明非恒定明度的实例的框图。
图8为说明用于从当前经译码的块的时空邻域导出量化参数或缩放参数的本发明的技术的框图。
图9为说明视频编码器的实例的框图。
图10为说明视频解码器的实例的框图。
图11为说明视频解码器可藉以实施本发明的技术的实例过程的流程图。
图12为说明视频解码器可藉以实施本发明的技术的实例过程的流程图。
图13为说明视频编码器可藉以实施本发明的技术的实例过程的流程图。
图14为说明视频编码器可藉以实施本发明的技术的实例过程的流程图。
具体实施方式
本发明涉及具有高动态范围(HDR)和广色域(WCG)表示的视频信号的译码。更特定来说,本发明的技术包含应用于某些色彩空间中的视频数据以实现HDR和WCG视频数据的更高效压缩的信令和操作。所提出的技术可改善用于译码HDR和WCG视频数据的基于混合的视频译码系统(例如基于HEVC的视频译码器)的压缩效率。在附图和以下描述中阐述本发明的一或多个实例的细节。其它特征、目标和优势将从描述、图式和权利要求书而显而易见。
图1为说明可利用本发明的技术的实例视频编码和解码系统10的框图。如图1中所展示,系统10包含源装置12,所述源装置提供稍后时间将由目的地装置14解码的经编码视频数据。明确地说,源装置12经由计算机可读媒体16将视频数据提供到目的地装置14。源装置12和目的地装置14可包括广泛范围的装置中的任一个,包含台式计算机、笔记型(即,膝上型)计算机、平板计算机、机顶盒、例如所谓的“智能型”电话的电话手持机、所谓的“智能型”平板、电视、摄影机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置等。在一些情况下,可装备源装置12和目的地装置14以用于无线通信。
在图1的实例中,源装置12包含视频源18、包含视频预处理器单元19和视频编码器20的视频编码单元21,以及输出接口22。目的地装置14包含输入接口28、包含视频解码器30和视频后处理器单元31的视频解码单元29,以及显示装置32。根据本发明的一些实例,视频预处理器单元19和视频后处理器单元31可经配置以执行本发明中所描述的具体技术的全部或部分。举例来说,视频预处理器单元19和视频后处理器单元31可包含经配置以应用静态转移函数的静态转移函数单元,但具有可调适信号特性的预处理和后处理单元。
在其它实例中,源装置和目的地装置可包含其它组件或布置。举例来说,源装置12可从例如外部摄影机的外部视频源18接收视频数据。同样地,目的地装置14可与外部显示装置接口连接,而非包含集成式显示装置。
图1的所说明系统10仅为一个实例。用于处理视频数据的技术可由任何数字视频编码和/或解码装置执行。尽管本发明的技术通常由视频编码装置执行,但所述技术也可由视频编码器/解码器(通常被称作“编解码器”)执行。为了易于描述,关于在源装置12和目的地装置14中的相应一者中执行本发明中所描述的实例技术的视频预处理器单元19和视频后处理器单元31来描述本发明。源装置12和目的地装置14仅为源装置12产生经译码视频数据以供传输到目的地装置14的此类译码装置的实例。在一些实例中,装置12、14可以大体上对称的方式操作,使得装置12、14中的每一个包含视频编码和解码组件。因此,系统10可支持视频装置12、14之间的单向或双向视频传输,例如用于视频流式传输、视频播放、视频广播或视频电话。
源装置12的视频源18可包含视频捕捉装置,例如摄像机、含有先前捕捉的视频的视频存档和/或用以从视频内容提供者接收视频数据的视频馈入接口。作为另一替代例,视频源18可产生基于计算机图形的数据作为源视频,或实况视频、存档视频和计算机产生的视频的组合。在一些情况下,如果视频源18为摄像机,那么源装置12和目的地装置14可形成所谓的摄影机电话或视频电话。源装置12可包括经配置以存储视频数据的一或多个数据存储媒体。然而,如上文所提及,本发明中所描述的技术通常可适用于视频译码,且可应用于无线和/或有线应用。在每一情况下,经捕捉、经预捕捉或计算机产生的视频可由视频编码单元21编码。经编码视频信息可接着由输出接口22输出到计算机可读媒体16上。
目的地装置14可经由计算机可读媒体16接收待解码的经编码视频数据。计算机可读媒体16可包括能够将经编码视频数据从源装置12移动到目的地装置14的任何类型的媒体或装置。在一个实例中,计算机可读媒体16可包括使得源装置12能够实时将经编码视频数据直接传输到目的地装置14的通信媒体。可根据例如无线通信协议的通信标准来调制经编码视频数据,且将经编码视频数据传输到目的地装置14。通信媒体可包括任何无线或有线通信媒体,例如射频(RF)频谱或一或多个物理传输线。通信媒体可形成基于封包的网络(例如,局域网、广域网或例如因特网的全域网络)的部分。通信媒体可包含路由器、交换器、基站或可用于促进从源装置12到目的地装置14的通信的任何其它装备。目的地装置14可包括经配置以存储经编码视频数据和经解码视频数据的一或多个数据存储媒体。
在一些实例中,经编码数据可从输出接口22输出到存储装置。类似地,可由输入接口从存储装置存取经编码数据。存储装置可包含各种分布式或本地存取的数据存储媒体中的任一个,例如硬盘机、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器或用于存储经编码视频数据的任何其它合适的数字存储媒体。在另一实例中,存储装置可对应于文件服务器或可存储由源装置12产生的经编码视频的另一中间存储装置。目的地装置14可经由流式传输或下载从存储装置存取所存储的视频数据。文件服务器可为能够存储经编码视频数据且将彼经编码视频数据传输到目的地装置14的任何类型的服务器。实例文件服务器包含网页服务器(例如,用于网站)、FTP服务器、网络附接存储(NAS)装置或本地磁盘机。目的地装置14可通过任何标准数据连接(包含因特网连接)来存取经编码视频数据。此连接可包含适合于存取存储于文件服务器上的经编码视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、电缆调制解调器等)或两者的组合。从存储装置的经编码视频数据的传输可为流式传输、下载传输或其组合。
本发明的技术不必限于无线应用或设定。所述技术可应用于视频译码以支持各种多媒体应用中的任一个的视频译码,所述应用例如空中电视广播、有线电视传输、卫星电视传输、例如HTTP动态自适应流式传输(DASH)的因特网流式传输视频传输、经编码到数据存储媒体上的数字视频、存储于数据存储媒体上的数字视频的解码,或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频传输从而支持例如视频流式传输、视频播放、视频广播和/或视频电话的应用。
计算机可读媒体16可包含暂态媒体,例如无线广播或有线网络传输,或存储媒体(即,非暂时性存储媒体),例如硬盘、快闪驱动器、压缩光盘、数字视频光盘、蓝光光盘或其它计算机可读媒体。在一些实例中,网络服务器(未图示)可从源装置12接收经编码视频数据且将经编码视频数据提供到目的地装置14,例如经由网络传输。类似地,例如光盘冲压设施的媒体生产设施的计算装置可从源装置12接收经编码视频数据且生产含有经编码视频数据的光盘。因此,在各种实例中,计算机可读媒体16可理解为包含各种形式的一或多个计算机可读媒体。
目的地装置14的输入接口28从计算机可读媒体16接收信息。计算机可读媒体16的信息可包含由视频编码单元21的视频编码器20定义的语法信息,所述语法信息也由视频解码单元29的视频解码器30使用,所述语法信息包含描述块和其它经译码单元(例如,图片群组(GOP))的特性和/或处理的语法元素。显示装置32向用户显示经解码视频数据,且可包括各种显示装置中的任一个,例如阴极射线管(CRT)、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
如所说明,视频预处理器单元19从视频源18接收视频数据。视频预处理器单元19可经配置以处理视频数据从而将视频数据转换成适合于使用视频编码器20编码的形式。举例来说,视频预处理器单元19可执行动态范围压紧(例如使用非线性转移函数)、到更紧密或稳固色彩空间的色彩转换和/或浮点到整数表示转换。视频编码器20可对由视频预处理器单元19输出的视频数据执行视频编码。视频解码器30可执行视频编码器20的反向以解码视频数据,且视频后处理器单元31可执行由视频预处理器单元19执行的操作的反向以将视频数据转换成适合于显示的形式。举例来说,视频后处理器单元31可执行整数到浮点转换、从紧密或稳固色彩空间的色彩转换和/或动态范围压紧的反向来产生适合于显示的视频数据。
视频编码单元21和视频解码单元29各自可实施为各种适合的处理电路中的任一个,包含固定功能处理电路和/或可编程处理电路,例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件,或其任何组合。当所述技术部分以软件实施时,装置可将用于软件的指令存储于合适的非暂时性计算机可读媒体中,且使用一或多个处理器在硬件中执行所述指令,以执行本发明的技术。视频编码单元21和视频解码单元29中的每一个可包含于一或多个编码器或解码器中,编码器或解码器中的任一个可集成为相应装置中的组合式编码器/解码器(编解码器)的部分。
尽管视频预处理器单元19和视频编码器20经说明为视频编码单元21内的单独单元,且视频后处理器单元31和视频解码器30经说明为视频解码单元29内的单独单元,但本发明中所描述的技术并不限于此。视频预处理器单元19和视频编码器20可形成为共同装置(例如,集成电路或容纳在同一芯片内)。类似地,视频后处理器单元31和视频解码器30可形成为共同装置(例如,集成电路或容纳在同一芯片内)。
在一些实例中,视频编码器20和视频解码器30可根据由ITU-T视频译码专家群组(VCEG)和ISO/IEC运动图片专家群组(MPEG)的视频译码联合合作小组(JCT-VC))开发的高效率视频译码(HEVC)标准而操作。被称作“HEVC草案规范”的HEVC标准草案描述于布罗斯(Bross)等人的“高效视频译码(HEVC)缺陷报告3(High Efficiency Video Coding(HEVC)Defect Report 3)”(ITU-T SG16WP3和ISO/IEC JTC1/SC29/WG11的视频译码联合合作小组(JCT-VC),第16次会议,美国圣何塞,2014年1月,文献号JCTVC-P1003_v1)中。HEVC草案规范可从http://phenix.it-sudparis.eu/jct/doc_end_user/documents/16_San%20Jose/wg11/JCTVC-P1003-v1.zip获得。HEVC规范也可于http://www.itu.int/rec/T-REC-H.265-201504-I/en存取。
此外,正不断努力产生HEVC的可调式视频译码扩展。HEVC的可调式视频译码扩展可被称作SHEVC或SHVC。另外,VCEG和MPEG的3D视频译码联合合作小组(JCT-3C)正在开发基于HEVC的3DV标准。针对基于HEVC的3DV标准的标准化努力的部分包含基于HEVC的多视图视频编解码器的标准化(即,MV-HEVC)。
在HEVC和其它视频译码规范中,视频序列通常包含一系列图片。图片也可被称作“帧”。图片可包含三个样本阵列,标示为SL、SCb和SCr。SL为明度样本的二维阵列(即,块)。SCb为Cb色度(chrominance)样本的二维阵列。SCr为Cr色度样本的二维阵列。色度样本也可在本文中被称作“色度(chroma)”样本。在其它情况下,图片可为单色的且可仅包含明度样本阵列。
为产生图片的经编码表示,视频编码器20可产生译码树型单元(CTU)的集合。CTU中的每一个可包括明度样本的译码树型块、色度样本的两个对应的译码树型块,和用以译码所述译码树型块的样本的语法结构。在单色图片或具有三个单独色彩平面的图片中,CTU可包括单一译码树型块和用以译码所述译码树型块的样本的语法结构。译码树型块可为样本的N×N块。CTU也可被称作“树型块”或“最大译码单元”(LCU)。HEVC的CTU可广泛地类似于例如H.264/AVC的其它标准的宏块。然而,CTU未必限于特定大小,且可包含一或多个译码单元(CU)。图块可包含按光栅扫描次序连续地定序的整数数目个CTU。
本发明可使用术语“视频单元”或“视频块”或“块”来指代一或多个样本块和用以译码样本的一或多个块的样本的语法结构。视频单元的实例类型可包含CTU、CU、PU、变换单元(TU)、宏块、宏块分区,等等。在一些上下文中,PU的论述可与宏块或宏块分区的论述互换。
为产生经译码的CTU,视频编码器20可对CTU的译码树型块递回地执行四分树分割,以将译码树型块划分成译码块,因此命名为“译码树型单元”。译码块可为样本的N×N块。CU可包括具有明度样本阵列、Cb样本阵列和Cr样本阵列的图片的明度样本的译码块,和色度样本的两个对应译码块,和用以译码所述译码块的样本的语法结构。在单色图片或具有三个单独色彩平面的图片中,CU可包括单一译码块和用以译码所述译码块的样本的语法结构。
视频编码器20可将CU的译码块分割成一或多个预测块。预测块为被施加有相同预测的样本的矩形(即,正方形或非正方形)块。CU的预测单元(PU)可包括明度样本的预测块、色度样本的两个对应的预测块和用以预测所述预测块的语法结构。在单色图片或具有三个单独色彩平面的图片中,PU可包括单一预测块和用以预测所述预测块的语法结构。视频编码器20可针对CU的每一PU的预测块(例如明度、Cb和Cr预测块)产生预测性块(例如明度、Cb和Cr预测性块)。
视频编码器20可使用帧内预测或帧间预测来产生PU的预测性块。如果视频编码器20使用帧内预测来产生PU的预测性块,那么视频编码器20可基于包含PU的图片的经解码样本来产生PU的预测性块。
在视频编码器20产生CU的一或多个PU的预测性块(例如明度、Cb和Cr预测性块)之后,视频编码器20可产生CU的一或多个残余块。举例来说,视频编码器20可产生CU的明度残余块。CU的明度残余块中的每一样本指示CU的预测性明度块中的一个中的明度样本与CU的原始明度译码块中的对应样本之间的差异。另外,视频编码器20可产生CU的Cb残余块。CU的Cb残余块中的每一样本可指示CU的预测性Cb块中的一个中的Cb样本与CU的原始Cb译码块中的对应样本之间的差异。视频编码器20也可产生CU的Cr残余块。CU的Cr残余块中的每一样本可指示CU的预测性Cr块中的一个中的Cr样本与CU的原始Cr译码块中的对应样本之间的差异。
此外,视频编码器20可使用四分树分割来将CU的残余块(例如明度、Cb和Cr残余块)分解成一或多个变换块(例如明度、Cb和Cr变换块)。变换块为被施加有相同变换的样本的矩形((例如正方形或非正方形)块。CU的变换单元(TU)可包括明度样本的变换块、色度样本的两个对应的变换块和用以变换所述变换块样本的语法结构。因此,CU的每一TU可具有明度变换块、Cb变换块以及Cr变换块。TU的明度变换块可为CU的明度残余块的子块。Cb变换块可为CU的Cb残余块的子块。Cr变换块可为CU的Cr残余块的子块。在单色图片或具有三个单独色彩平面的图片中,TU可包括单一变换块和用以使变换所述变换块的样本的语法结构。
视频编码器20可将一或多个变换应用于TU的变换块以产生TU的系数块。举例来说,视频编码器20可将一或多个变换应用于TU的明度变换块以产生TU的明度系数块。系数块可为变换系数的二维阵列。变换系数可为纯量。视频编码器20可将一或多个变换应用于TU的Cb变换块以产生TU的Cb系数块。视频编码器20可将一或多个变换应用于TU的Cr变换块以产生TU的Cr系数块。
在产生系数块(例如,明度系数块、Cb系数块或Cr系数块)之后,视频编码器20可量化系数块。量化通常指变换系数经量化以可能减少用以表示变换系数的数据的量从而提供进一步压缩的过程。在视频编码器20量化系数块之后,视频编码器20可熵编码指示经量化变换系数的语法元素。举例来说,视频编码器20可对指示经量化变换系数的语法元素执行上下文自适应性二进制算术译码(CABAC)。
视频编码器20可输出包含形成经译码图片和相关联数据的表示的位序列的位流。因此,位流包括视频数据的经编码表示。位流可包括网络抽象层(NAL)单元的序列。NAL单元为含有NAL单元中的数据类型的指示的语法结构和含有呈视需要穿插有模拟阻止位的原始字节序列有效负载(RBSP)形式的那种数据的字节。NAL单元中的每一个可包含NAL单元标头且囊封RBSP。NAL单元标头可包含指示NAL单元类型码的语法元素。由NAL单元的NAL单元标头指定的NAL单元类型码指示NAL单元的类型。RBSP可为含有囊封于NAL单元内的整数数目个字节的语法结构。在一些情况下,RBSP包含零个位。
视频解码器30可接收由视频编码器20产生的位流。另外,视频解码器30可剖析位流以从位流获得语法元素。视频解码器30可至少部分地基于从位流获得的语法元素重构建视频数据的图片。重构建视频数据的过程可大体上与由视频编码器20执行的过程互逆。举例来说,视频解码器30可使用PU的运动向量来确定当前CU的PU的预测性块。另外,视频解码器30可反量化当前CU的TU的系数块。视频解码器30可对系数块执行反变换以重构建当前CU的TU的变换块。视频解码器30可通过将当前CU的PU的预测性块的样本添加到当前CU的TU的变换块的对应样本来重构建当前CU的译码块。通过重构建图片的每一CU的译码块,视频解码器30可重构建所述图片。
现将论述HDR/WCG的方面。预期下一代视频应用以表示具有HDR和WCG的经捕捉景物的视频数据来操作。所利用的动态范围和色域的参数为视频内容的两个独立属性,且出于数字电视和多媒体服务的目的,其规范由若干国际标准定义。举例来说,标准ITU-RBT.709-5,“用于针对制作和国际节目交换的HDTV标准的参数值(Parameter values forthe HDTV standards for production and international programme exchange)”(2002)(以下称作“ITU-R BT.Rec.709”)定义高清晰度电视(high definitiontelevision,HDTV)的参数,例如标准动态范围(SDR)和标准色域。另一方面,ITU-RRec.2020指定超高清晰度电视(ultra-high definition television,UHDTV)参数,例如HDR和WCG。也存在指定其它系统中的动态范围和色域属性的其它标准开发组织(SDO)文献。举例来说,P3色域定义于SMPTE-231-2(电影和电视工程师协会)中,且HDR的一些参数定义于SMPTE ST 2084中。在下文提供视频数据的动态范围和色域的简要描述。
现将论述动态范围的方面。动态范围通常经定义为视频信号的最小亮度与最大亮度之间的比率。动态范围也可根据一或多个“f光圈刻度(f-stops)”来测量,其中一个f光圈刻度对应于信号动态范围的倍增。在MPEG的定义中,HDR内容为以多于16个f光圈刻度的亮度变化为特征的此类内容。在一些术语中,10个f光圈刻度与16个f光圈刻度之间的等级被视为中间动态范围,但在其它定义中被视为HDR。同时,人类视觉系统(HVS)能够感知较大(例如“较宽”或“较广”)动态范围。然而,HVS包含用以窄化所谓的“同时范围”的调适机制。
图2为说明由HDTV的SDR、UHDTV的预期HDR和HVS动态范围提供的动态范围的可视化的概念图。举例来说,图2说明由ITU-R BT.709调节且提供SDR的当前视频应用和服务。当前视频应用和服务通常支持每平方米(m^2)(cd/m^2的单位通常被称作“尼特(nit)”)约0.1到100坎德拉(cd)的亮度(或明度)的范围,从而导致少于或低于10个f光圈刻度。预期下一代视频服务提供高达16个f光圈刻度的动态范围,且尽管详细规范当前在开发中,但一些初始参数已在SMPTE ST 2084和ITU-R BT.2020中指定。
现将论述色域。除HDR以外更真实的视频体验的另一方面为色彩维度,其常规地由色域定义。图3为展示SDR色域(基于ITU-R BT.709红色、绿色和蓝色原色的三角形)以及UHDTV的较广色域(基于ITU-R BT.2020红色、绿色和蓝色原色的三角形)的概念图。图3也描绘所谓的光谱轨迹(由舌形区域定界),从而表示天然色的界限。如图3所说明,从ITU-RBT.709移动到ITU-R BT.2020色彩原色旨在向UHDTV服务提供约多于70%的色彩或更多色彩。D65为给定规范指定白色。
色域规范的少许实例展示于下文表1中。
表1.色域参数
现将论述HDR视频数据的表示的方面。HDR/WCG通常以每分量极高精度(甚至浮点)经获取和存储,具有4:4:4色度格式和极宽色彩空间(例如XYZ)。由国际照明委员会阐述的CIE 1931是XYZ色彩空间的实例。此表示以高精度为目标且在数学上(几乎)无损。然而,此格式特征可包含许多冗余且对于压缩目的来说并非最佳的。具有基于HVS的假定的较低精确度格式通常用于目前先进技术的视频应用。
出于压缩的目的的视频数据格式转换过程的一个实例包含三个主过程,如由图4的转换过程109所展示。图4的技术可由源装置12执行。线性RGB数据110可为HDR/WCG视频数据且可存储于浮点表示中。可使用用于动态范围压紧的非线性转移函数(TF)112来压紧线性RGB数据110。转移函数112可使用任何数目的非线性转移函数(例如,如SMPTE-2084中所定义的PQ TF)来压紧线性RGB数据110。在一些实例中,色彩转换过程114将经压紧的数据转换成较适合于由混合型视频编码器压缩的更紧密或稳固的色彩空间(例如,YUV或YCrCb色彩空间)。接着使用浮点到整数表示量化单元116来量化此数据以产生经转换HDR的数据118。在此实例中,HDR的数据118呈整数表示。现今HDR的数据呈较适合于由混合型视频编码器(例如应用HEVC技术的视频编码器20)压缩的格式。图4中所描绘的过程的次序是作为实例给出,且在其它应用中可变化。举例来说,色彩转换可先于TF过程。另外,例如空间子采样的额外处理可应用于色彩分量。
借助于过程129,图5中描绘在解码器侧处的实例反转换。目的地装置14的视频后处理器单元31可执行图5的技术。经转换HDR的数据120可在目的地装置14处通过使用混合型视频解码器(例如,应用HEVC技术的视频解码器30)解码视频数据而获得。接着可由反量化单元122来反量化HDR的数据120。接着可将反色彩转换过程124应用于经反量化HDR的数据。反色彩转换过程124可为色彩转换过程114的反向。举例来说,反色彩转换过程124可将HDR的数据从YCrCb格式转换回到RGB格式。接下来,可将反转移函数126应用于数据以加回由转移函数112压紧的动态范围,从而重建线性RGB数据128。使用经利用的非线性转移函数(TF)压紧呈线性的输入RGB数据和浮点表示的高动态范围。举例来说,如SMPTE ST 2084中所定义的感知量化器(PQ)TF,其随后转换成较适合于压缩的目标色彩空间,例如Y'CbCr,且随后经量化以获得整数表示。这些元素的次序作为实例给出,且可在真实世界应用中变化,例如,色彩转换可先于TF模块以及额外处理,例如空间子采样可应用于色彩分量。在下文更详细地描述这些三个分量。
现将较详细地论述图4中所描绘的某些方面,例如转移函数(TF)。将呈现于图像容器中的数字值映射到光能且从光能映射所述数字值可能需要了解TF。将TF应用于数据以压紧数据的动态范围且使得可能表示具有有限数目个位的数据。此函数通常为一维(1D)非线性函数,其反映终端用户显示器的电光转移函数(EOTF)的反向,如ITU-R BT.1886和Rec.709中针对SDR所指定;或估计对亮度改变的HVS感知,如SMPTE ST 2084中针对HDR所指定的PQ TF。OETF的反向过程为EOTF(电光转移函数),其将代码等级映射回到明度。图6展示TF的若干实例。这些映射也可分别应用于每一R、G和B分量。将这些映射应用于R、G和B分量可将这些相应地转换成R'、G'和B'。
ITU-R标准BT.1886中所指定的参考EOTF由以下方程式指定:
L=a(max[(V+b),0])γ
其中:
L:以cd/m^2为单位的屏幕明度
LW:白色的屏幕明度
LB:黑色的屏幕明度
V:输入视频信号电平(将在V=0处的黑色正规化到在V=1处的白色)。针对根据标准ITU-R BT.709所掌握的内容,10位数字代码值“D”根据以下方程式映射到V值中:V=(D-64)/876
γ:功率函数的幂数,γ=2.404
a:用户增益的变量(传统“对比”控制)
a=(LW 1/γ-LB 1/γ)γ
b:用户黑色等级上升的变量(传统“亮度”控制)
上述变量a和b通过求解以下方程式而导出,以使V=1得出
L=LW,且V=0得出L=LB
LB=a·bγ
LW=a·(1+b)γ
为了更有效率地支持较高动态范围数据,SMPTE最近已标准化被称作SMPTE ST-2084的新转移函数。ST2084的规范按如下描述来定义EOTF应用。将TF应用于正规化线性R、G、B值,此产生R'、G'、B'的非线性表示。ST2084通过NORM=10000定义正规化,其与10000尼特(cd/m^2)的峰值亮度相关联。
○R'=PQ_TF(max(0,min(R/NORM,1)))
○G'=PQ_TF(max(0,min(G/NORM,1)))
(1)
○B'=PQ_TF(max(0,min(B/NORM,1)))
其中
通常,EOTF经定义为具备浮点准确度的函数。因此,如果应用反TF(所谓的OETF),那么无误差被引入到具有此非线性的信号。如下使用反PQ函数来定义ST2084中所指定的反TF(OETF):
其中反
EOTF和OETF为活跃研究的对象,且一些视频译码系统中所利用的TF可不同于如ST2084中所指定的TF。
现将论述色彩变换。RGB数据通常用作输入,这是因为RGB数据常常由图像捕捉传感器产生。然而,此色彩空间在其分量当中具有高冗余且对于紧密表示来说并非最佳的。为达成更紧密且更稳固的表示,RGB分量通常转换(例如,执行色彩变换)成更适合于压缩的更不相关色彩空间,例如,YCbCr。此色彩空间将呈明度形式的亮度和呈不同的不相关分量的色彩信息隔开。
对于现代视频译码系统,通常使用或典型地使用的色彩空间为YCbCr,如ITU-RBT.709中所指定。BT.709标准中的YCbCr色彩空间指定从R'G'B'到Y'CbCr的以下转换过程(非恒定明度表示):
以上过程也可使用避免分裂Cb和Cr分量的以下近似转换来实施:
ITU-R BT.2020标准指定从RGB到Y'CbCr的两个不同转换过程:恒定明度(CL)和非恒定明度(NCL),标准ITU-R BT.2020,“用于针对制作和国际节目交换的超高清电视系统的参数值(Parameter values for ultra-high definition television systems forproduction and international programme exchange)”(2012)。RGB数据可处于线性光中且Y'CbCr数据为非线性的。图7为说明非恒定明度的实例的框图。明确地说,图7借助于过程131展示NCL方法的实例。图7的NCL方法在OETF(134)之后应用从R'G'B'到Y'CbCr的转换(136)。ITU-R BT.2020标准指定从R'G'B'到Y'CbCr的以下转换过程(非恒定明度表示):
以上过程也可使用避免分裂Cb和Cr分量的以下近似转换来实施,如以下方程式中所描述:
现将论述量化/固定点转换。在色彩变换之后,将仍以高位深度(例如浮点准确度)表示的目标色彩空间中的输入数据转换成目标位深度。某些研究展示,结合PQ TF的十到十二(10到12)位准确度足以提供具有低于恰可辨差异(JND)的失真的16f光圈刻度的HDR数据。以10位准确度表示的数据可进一步通过目前先进技术的视频译码解决方案中的大多数来译码。此量化(138)为有损译码的元素且可为引入到经转换数据的不准确度的源。
在各种实例中,这些量化可应用于目标色彩空间中的码字。下文展示应用YCbCr的一实例。将以浮点准确度表示的输入值YCbCr转换成明度(Y)值的固定位深度BitDepthY和色度值(Cb、Cr)的固定位深度BitDepthC的信号。
其中
Round(x)=Sign(x)*Floor(Abs(x)+0.5)
Sign(x)=-1,如果x<0;0,如果x=0;1,如果x>0
Floor(x)小于或等于x的最大整数
Abs(x)=x,如果x>=0;-x,如果x<0
Clip1Y(x)=Clip3(0,(1<<BitDepthY)-1,x)
Clip1C(x)=Clip3(0,(1<<BitDepthC)-1,x)
Clip3(x,y,z)=x,如果z<x;y,如果z>y;z,其它
转移函数和色彩变换中的一些可在信号表示的动态范围内产生以恰可辨差异(JND)阈值的显著变化为特征的视频数据表示。针对这些表示,在明度值的动态范围内为均匀的量化方案将在信号片段(其表示动态范围的分区)内引入具有感知的不同优点的量化误差。对信号的此类影响可解释为具有在经处理数据范围内产生不相等信号噪声比的非均匀量化的处理系统。图7的过程131也包含从4:4:4到4:2:0的转换(140)和HEVC4:2:0 10b编码(142)。
此类表示的实例为非恒定明度(NCL)YCbCr色彩空间中所表示的视频信号,其中色彩原色定义于ITU-R Rec.BT.2020中,且具有ST 2084转移函数。如下文表2中所说明,此表示(例如NCL YCbCr色彩空间中所表示的视频信号)针对信号的较低强度值分配显著较大量的码字。举例来说,码字的30%表示低于十尼特(<10尼特)的线性光样本。相比来说,用明显地更少量的码字来表示高强度样本(高亮度)。举例来说,对于1000到10,000尼特范围内的线性光分配码字的25%。其结果是,以对所有范围的数据均匀量化为特征的视频译码系统,例如H.265/HEVC视频译码系统,将引入更多严重译码伪影到高强度样本(信号的亮区),而引入到较低强度样本(相同信号的暗区)的失真将远低于可辨差异。
有效地,上文所描述的因素可意味着视频译码系统设计,或编码算法,可需要针对每一经选择视频数据表示(即针对每一经选择转移函数和色彩空间)而被调节。由于码字差异,SDR译码装置对于HDR内容可能并非优化的。又,已在SDR动态范围和SCG色彩(由Rec.709提供)中捕捉大量视频内容。相比于HDR和WCG,SDR-SCG视频捕捉法提供较窄范围。因此,相对于HDR-WCG视频数据,SDR-SCG所捕捉视频数据可占据码字方案的相对较小占据面积。为了说明,Rec.709的SCG覆盖35.9%的CIE 1931色彩空间,而Rec.2020的WCG覆盖75.8%。
线性光强度(cd/m<sup>2</sup>) 全范围 SDI范围 较窄范围
~0.01 21 25 83
~0.1 64 67 119
~1 153 156 195
~10 307 308 327
~100 520 520 509
~1,000 769 767 723
~4,000 923 920 855
~10,000 1023 1019 940
表2.线性光强度与SMPTE ST 2084中的代码值(位深度=10)之间的关系
如上文表2中所展示,码字的高集中度(“全范围”行中所展示)集中于较低亮度范围。即,总计307个码字(其构成约码字的30%)群集于线性光强度的0到10尼特范围内在较低亮度情况下。色彩信息可能并不易于感知,且可在视觉灵敏度的较低层级下可见。由于码字的经集中群集定位于较低亮度范围中,视频编码装置可以高质量或极高质量来在较低亮度范围中编码大量的。此外,位流可消耗较大量的带宽以便输送经编码噪声。当重构建位流时,归因于经编码噪声包含于位流中,视频解码装置可产生较大数目的伪影。
下文论述用以改善非最佳感知质量码字分布的现有提议。一个此类提议为“实现具有反向兼容能力的高动态范围视频译码的动态范围调整SEI(Dynamic RangeAdjustment SEI to enable High Dynamic Range video coding with Backward-Compatible Capability)”,由D.鲁萨诺夫斯基(Rusanovskyy)、A.K.拉马苏布拉莫尼恩(Ramasubramonian)、D.巴格代茨(Bugdayci)、S.李(Lee)、J.索尔(Sole)、M.卡策威茨(Karczewicz)提出,VCEG文献COM16-C 1027-E,2015年9月(以下称作“Rusanovskyy I”)。Rusanovskyy I包含在视频译码之前将码字再分布应用于视频数据的提议。根据此提议,ST2084/BT.2020表示中的视频数据在视频压缩之前经受码字再分布。引入再分布的此提议通过动态范围调节在数据的动态范围内引入感知失真(信号噪声比)的线性化。此再分布是为了在位速率约束下改善视觉质量。为了补偿再分布且将数据转换成原始ST 2084/BT.2020表示,在视频解码之后将反向过程应用于数据。另外在美国专利申请案第15/099,256号(主张临时专利申请案#62/149,446的优先权)和美国专利申请案第15/176,034号(主张临时专利申请案#62/184,216的优先权)中进一步描述由Rusanovskyy I提出的所述技术,所述申请案中的每一个的全部内容全文并入本文中。
然而,根据Rusanovskyy I中所描述的所述技术,预处理和后处理的过程通常在基于块的基础上自由目前先进技术编码器所采用的率失真优化处理来去耦合。因此,所描述的技术是根据预处理和后处理的视角,其超出视频编解码器的译码回路的范围(或在视频编解码器的译码回路外部)。
另一此类提议为“高动态范围及宽色域视频译码技术的性能研究(Performanceinvestigation of high dynamic range and wide color gamut video codingtechniques)”,由J.赵(Zhao)、S.-H.金(Kim)、A.塞加尔(Segall)、K.密斯拉(Misra)提出,VCEG文献COM16-C1030-E,2015年9月(以下称作“Zhao I”)。赵提出强度相关性空间变化(基于块的)量化方案,以对准应用于Y2020(ST2084/BT2020)与Y709(BT1886/BT 2020)表示的视频译码之间的位速率分配和视觉感知失真。观察到为了维持相同等级的量化明度,在Y2020和Y709中的信号的量化必须相差取决于明度的值,以使得:
QP_Y2020=QP_Y709-f(Y2020)
函数f(Y2020)被认为对于在Y2020中的视频的强度值(亮度等级)为线性,且所述函数可近似为:
f(Y2020)=max(0.03*Y2020-3,0)
Zhao I提出在编码阶段引入的空间变化量化方案被认为能够针对ST 2084/BT.2020表示中的经译码视频信号改善视觉感知的信号到量化噪声比。
Zhao I所提出的所述技术的潜在缺点为QP调适的基于块的粒度。通常,经选择在编码器侧用于压缩的所利用的块大小是通过率失真优化过程导出,且可不表示视频信号的动态范围性质。因此,经选择QP设定对于块内部的信号可为次佳的。此潜在问题可能对于倾向于采用较大维度的预测和变换块大小的下一代视频译码系统变得甚至愈加重要。此设计的另一方面需要信令QP调适参数。将QP调适参数信令到解码器以用于反解量化。另外,在编码器侧的量化参数的空间调适可增加编码优化的复杂度且可干扰速率控制算法。
另一此类提议为“具有在HEVC中的应用的强度相关空间量化(Intensitydependent spatial quantization with application in HEVC)”,由马特奥·纳察里(Matteo Naccari)和马塔·莫拉克(Marta Mrak)在IEEE ICME 2013的会刊中提出,2013年7月(以下称作“Naccari”)。Naccari提出强度相关性空间量化(IDSQ)感知机制,其利用人类视觉系统的强度遮蔽且在感知上调节块层级处的信号的量化。此论文提出采用回路内像素域缩放。根据此提议,用于当前经处理块的回路内缩放的参数是从经预测块中的明度分量的平均值导出。在解码器侧,执行反向缩放,且解码器从在解码器侧可用的经预测块导出缩放的参数。
类似于上文所论述的Zhao I中的研究,由于应用于经处理块的所有样本的缩放参数的次佳性,此方法的基于块的粒度限制此方法的性能。此论文的所提出的解决方案的另一方面在于缩放值是从经预测块导出且并不反映可发生在当前编解码器块与经预测块之间的信号波动。
另一此类提议为“针对下一代容器的去量化和缩放(De-quantization andscaling for next generation containers)”,由J.赵、A.塞加尔、S.-H.金、K.密斯拉提出,JVET文献B0054,2016年1月(以下称作“Zhao II”)。为改善ST 2084/BT2020表示中的非均匀感知失真,此论文提出采用基于回路内强度相关性块的变换域缩放。根据此提议,用于当前经处理块的经选择变换系数(AC系数)的回路内缩放的参数经导出作为经预测块中的明度分量的平均值的函数,且DC值经导出以用于当前块。在解码器侧,执行反向缩放,且解码器从在解码器侧可用的经预测块且从经信令到解码器的经量化DC值导出AC系数缩放的参数。
类似于上文所论述的Zhao I和Naccari中的研究,由于应用于经处理块的所有样本的缩放参数的次佳性,此方法的基于块的粒度限制此方法的性能。此论文的所提出方案的另一方面为缩放值仅应用于AC变换系数,对此信号噪声比改善并不影响DC值,其减少方案的性能。除了上文所论述的方面以外,在一些视频译码系统设计中,在AC值缩放时,经量化DC值可能并非可用的,例如在其中量化过程遵循一系列变换操作的情况下。此提议的另一限制为当编码器选择当前块的变换跳过或变换/量化旁路模式时,并不应用缩放(因此,在解码器处,缩放并不经定义用于变换跳过和变换/量化旁路模式),所述缩放归因于排除此两种模式的潜在译码增益为次佳的。
在德米特罗·鲁萨诺夫斯基(Dmytro Rusanovskyy)等人的美国专利申请案第15/595,793号(主张临时专利申请案第62/337,303号的优先权)(以下称作“Rusanovskyy II”)中,用于具有非均匀分布恰可辨差异(JND)的视频信号的回路内样本处理。根据Rusanovskyy II的技术,用于具有非均匀分布恰可辨差异的信号的更高效译码的若干回路内译码方法。Rusanovskyy II描述表示在像素、残余或变换域中的信号样本的缩放和偏移的应用。已提出用于导出缩放和偏移的若干算法。Rusanovskyy II的内容以全文引用的方式并入本文中。
本发明论述可应用于视频译码系统的回路中的若干装置、组件、设备和处理方法。本发明的技术可包含在像素域中或在变换域中量化和/或缩放视频信号以改善经处理数据的信号到量化噪声比的过程。举例来说,本发明的系统和技术可减少在转换成HDR-WCG格式时通过转换以SDR-SCG格式捕捉的视频数据所产生的伪影。本文所描述的技术可使用明度和/或色度数据中的一个或两个来满足精确度。所揭示的系统和技术也并入有或包含用于从信号的时空邻域导出量化或缩放参数的若干算法。即,本发明的实例系统和技术涉及获得用以在译码过程中修改与当前块相关联的残余数据的一或多个参数值。如本文中所使用,用以修改残余数据的参数值可包含量化参数(用以在编码过程或解码过程中分别通过量化或解量化残余数据来修改残余数据),或缩放参数(用以在编码过程或解码过程中分别通过缩放或反向缩放残余数据来修改残余数据)。
图8为说明当前经译码块152的时空邻域的方面的概念图。根据本发明的一或多种技术,视频编码器20可使用信息从当前经译码块152的时空邻域导出量化参数(用于量化当前经译码块152的样本)。举例来说,视频编码器20可使用用于相邻块154、156和158中的一或多个的QP值来导出与当前经译码块152一起使用的参考QP或默认QP。举例来说,视频编码器20可使用相邻块154到158中的一或多个的QP值作为相对于当前经译码块152的差异QP导出过程中的指标或运算数。以此方式,视频编码器20可实施本发明的一或多种技术以考虑左相邻块156的样本、上相邻块158的样本和由视差向量“DV”指向的时间相邻块154的样本。
因此,如果视频编码器20确定时空相邻块的样本良好匹配于当前经译码块152的样本,那么视频编码器20可实施本发明的技术以将当前经译码块152的差异QP导出过程扩展到差异QP导出过程至少部分地基于时空邻域的各种相邻块。在参考样本的块与块分区的多个CU重叠且因此可具有不同QP的情况下,视频编码器20可从众多可用QP导出QP。举例来说,视频编码器20可相对于多个QP值实施取平均值的过程,以导出当前经译码块152的样本的QP值。在各种实例中,视频编码器20可实施上文所描述的导出技术以导出QP值和/或差异QP参数中的一个或两个。
在各种用例情况下,视频编码器20也可使用信息从当前经译码块152的时空邻域导出当前经译码块152的样本的缩放参数。举例来说,根据其中缩放操作取代均匀量化的设计,视频编码器20可应用上文所描述的基于时空邻域的导出过程来导出当前经译码块152的参考缩放参数或默认缩放参数。
根据一些现有HEVC/JEM技术,视频译码装置可将缩放操作应用于当前经处理块的所有变换系数。举例来说,在一些HEVC/JEM设计中,在将残余变换系数用于导出缩放参数时,视频译码装置可将一或多个缩放参数应用于变换系数的子集。举例来说,根据JVETB0054,视频译码装置可将用于当前经处理块的经选择变换系数(即AC系数)的回路内缩放参数导出作为经预测块中的明度分量的平均值的函数,且可导出当前块的DC值。
根据本发明的一或多种技术,视频编码器20可针对当前经译码块152将一或多个DC变换系数包含于缩放过程中。在一些实例中,视频编码器20可将当前经译码块152的缩放参数导出作为DC值和从经预测样本导出的参数的函数。视频编码器20可实施包含用于AC缩放的查找表(LUT)以及用于DC值的独立LUT的缩放参数导出过程。DC和AC变换系数的正向缩放导致经缩放值被标示为DC'和AC'。视频编码器20可实施如下文所描述的缩放操作以获得经缩放值DC'和AC':
AC'=scale(fun1(DC,avgPred))*AC;和
DC'=scale(fun2(DC,avgPred))*DC
根据本发明的基于缩放参数的技术,视频解码器30可实施与上文关于视频编码器20所描述的操作大体上互逆的操作。举例来说,视频解码器30可实施将经缩放值DC'和AC'用作运算数的反向缩放过程。在下以方程式中,反向缩放过程的结果被标示为DC"和AC"。视频解码器30可如以下方程式中所说明来实施反向缩放操作:
DC"=DC'/scale(fun1(DC',avgPred));和
AC"=AC'/scale(fun2(DC",avgPred))
相对于缩放和反向缩放操作两者,术语‘fun1’和‘fun2’定义使用参考样本的平均值和基于DC的值作为引数的缩放导出函数/过程。如关于由视频编码器20和视频解码器30实施的缩放和反向缩放技术两者所说明,本发明的技术能够在导出经缩放和经反向缩放DC和AC变换系数值两者时使用DC变换系数值。以此方式,如果缩放/反向缩放操作替代变换系数的量化和解量化执行,那么本发明的技术使视频编码器20和视频解码器30能够在缩放和反向缩放操作中利用DC变换系数值。
本发明也提供在视频编码器20并不信令任何非零变换系数的情况下用于导出量化参数或缩放参数的技术。HEVC的当前规范、JVET开发的初步测试模型和JVET B0054中所描述的设计指定作为存在的经编码非零变换系数的函数的QP值(或缩放参数,视具体情况而定)的导出。根据HEVC的当前规范、JVET的初步测试模型和JVET B0054的设计,在所有变换系数经量化为零的情况下不信令QP调节或本地应用的缩放。实情为,解码装置对变换系数应用全域(例如图块层级)QP/缩放参数或从空间相邻CU导出的QP。
本发明的技术利用导致非零变换系数不存在的预测(不论帧内或帧间)的相对准确度。举例来说,视频解码器30可实施本发明的技术以使用来自经预测样本的参数导出QP值或缩放参数。之后,视频解码器30可利用经导出的QP值或缩放参数来解量化当前块的样本或反向缩放当前块的变换系数。以此方式,视频解码器30可实施本发明的技术来在视频解码器30未接收到块的非零变换系数的情况下利用预测准确度,由此取代一或多个基于默认的解量化和HEVC/JEM实践的反向缩放方面。
下文描述所揭示的技术的各种实例实施方案。应理解,下文描述的实施方案为非限制性实例,且根据本发明的方面的所揭示的技术的其它实施方案也是可能的。
根据一些实施方案,视频编码器20可从附接的(上方和左方)块(CU)导出参考QP值。关于图8描述,视频编码器20可从与上相邻块158和左相邻块156相关联的数据导出当前经译码块152的参考QP。通过以下伪码描述此实例实施方案的实例:
在上述伪码中,附接块表示为符号“cUAbove”和“cULeft”。
根据本发明的技术的一些实施方案,视频编码器20可在QP导出过程中考虑参考样本的一或多个QP值。通过以下伪码描述此实施方案的实例:
在上述伪码中,符号“cURefer”表示包含参考样本的块。
根据所描述的技术的一些实施方案,视频编码器20和/或视频解码器30可存储应用于参考块的样本上的QP和/或用作参考图片的所有图片的全域QP(例如图块层级QP)。根据一些实施方案,视频编码器20和/或视频解码器30可存储应用于参考块的样本上的缩放参数和/或用作参考图片的所有图片的全域缩放(例如图块层级缩放)参数。如果参考样本的块与经分割块的多个CU重叠(且因此引入不同QP跨所述分区的可能性),那么视频编码器20可从众多可用QP导出QP。作为实例,视频编码器20可对来自多个CU的多个QP实施取平均值过程。通过以下伪码描述此实施方案的实例:
根据上述伪码,视频编码器20通过跨块分区计算QP的平均值来执行取平均值过程。平均QP计算展示于上述伪码中的最后一个操作中。即,视频编码器20划分集合(表示为整数“总和”的最终值),所述集合由分区的数目(表示为运算数“numMinPart”)划分。
在本文中所描述的技术的又一实施方案中,视频编码器20可导出QP作为明度分量平均亮度的函数。举例来说,视频编码器20可从查表(LUT)获得明度分量的平均亮度。通过以下伪码描述此实施方案,其中符号“avgPred”表示参考样本的平均亮度值:
QP=PQ_LUT[avgPred];
在一些实施方案中,视频编码器20可从一或多个全域QP值导出当前块的参考QP值。视频编码器20可使用的全域QP值的实例为在图块层级中指定的QP。即,视频编码器20可使用针对包含当前块的图块的整体指定的QP值来导出当前块的QP值。通过以下伪码描述此实施方案:
qp=(((Int)pcCU->getSlice()->getSliceQp()+iDQp+52+2*qpBdOffsetY)%(52+qpBdOffsetY))-qpBdOffsetY;
在上述伪码中,视频编码器20使用由getSliceQp()函数传回的值在操作中作为运算数以获得当前块的QP(标示为“qp”)。
在本文所描述的技术的一些实施方案中,视频编码器20可将一或多个参考样本值用于导出QP。通过以下伪码描述此实施方案:
QP=PQ_LUT[avgPred];
在上述伪码中,“PQ_LUT”为视频编码器20可利用以将经预测块的平均亮度值(表示为“avgPred”)映射到相关联感知量化器(PQ)值的查找表。视频编码器20可计算avgPred的值作为参考样本的函数,例如参考样本的平均值。可根据本发明的计算使用的平均值的实例包含平均值、中位值和模式值中的一或多个。
在一些实施方案中,视频编码器20可缩放当前块的参数而非QP。在一些实施方案中,视频编码器20可执行从经导出QP到缩放参数的转换过程,或反之亦然。在一些实施方案中,视频编码器20可利用分析型表式来自参考样本导出QP。视频编码器20可使用于QP导出的分析型表式的一个实例为参数导出模型。
无论视频编码器20使用上述技术中的哪一种导出当前块的QP,视频编码器20可基于经导出QP来将数据信令到视频解码器30。举例来说,视频编码器20可信令从QP值导出的视频编码器20用以量化样本当前块的差异QP值。之后,视频解码器30可使用在经编码视频位流中接收的差异QP值来获得块的QP值,且可使用所述QP值解量化块的样本。
在视频编码器20获得代替当前块的QP值或除当前块的QP值的外的缩放参数的实例中,视频编码器20可将缩放参数(或从其导出的数据)信令到视频解码器30。之后,视频解码器30可直接从经编码视频位流或通过从经信令数据导出参数来重构建缩放参数。视频解码器30可执行经缩放变换系数的反向缩放。举例来说,根据本发明的方面,视频解码器30可执行DC和AC变换系数两者的经缩放版本的反向缩放。
上文已描述各种实例(例如实施方案)。可分别地或以与其它实例中的一或多个的各种组合来使用本发明的实例。
图9为说明可实施本发明的技术的视频编码器20的实例的框图。视频编码器20可执行视频图块内的视频块的帧内译码和帧间译码。帧内译码依赖于空间预测以减少或去除给定视频帧或图片内的视频的空间冗余。帧间译码依赖于时间预测以减少或去除视频序列的相邻帧或图片内的视频的时间冗余。帧内模式(I模式)可指若干基于空间的译码模式中的任一个。例如单向预测(P模式)或双向预测(B模式)的帧间模式可指若干基于时间的译码模式中的任一个。
如图9中所展示,视频编码器20接收待编码的视频帧内的当前视频块。在图9的实例中,视频编码器20包含模式选择单元40、视频数据存储器41、经解码图片缓冲器64、求和器50、变换处理单元52、量化单元54和熵编码单元56。模式选择单元40又包含运动补偿单元44、运动估计单元42、帧内预测处理单元46和分割单元48。对于视频块重构建,视频编码器20也包含反量化单元58、反变换处理单元60和求和器62。也可包含解块滤波器(图9中未展示)以对块边界进行滤波,从而从经重构建视频去除块效应伪影。如果需要,解块滤波器通常将对求和器62的输出进行滤波。除解块滤波器以外也可使用额外滤波器(例如,回路内或回路后)。为简洁起见未展示这些滤波器,但如果需要,这些滤波器可对求和器50的输出进行滤波(作为回路内滤波器)。
视频数据存储器41可存储待由视频编码器20的组件编码的视频数据。可例如从视频源18获得存储于视频数据存储器41中的视频数据。经解码图片缓冲器64可为存储供视频编码器20用于例如在帧内译码模式或帧间译码模式中编码视频数据的参考视频数据的参考图片存储器。视频数据存储器41和经解码图片缓冲器64可由各种存储器装置中的任一个形成,例如动态随机存取存储器(DRAM)(包含同步DRAM(SDRAM))、磁阻式RAM(MRAM)、电阻式RAM(RRAM)或其它类型的存储器装置。可由相同存储器装置或单独存储器装置提供视频数据存储器41和经解码图片缓冲器64。在各种实例中,视频数据存储器41可与视频编码器20的其它组件一起在芯片上,或相对于那些组件在芯片外。
在编码过程期间,视频编码器20接收待译码的视频帧或图块。可将所述帧或图块划分成多个视频块。运动估计单元42和运动补偿单元44执行所接收的视频块相对于一或多个参考帧中的一或多个块的帧间预测性译码以提供时间预测。帧内预测处理单元46可替代地执行所接收视频块相对于在与待译码的块相同的帧或图块中的一或多个相邻块的帧内预测性译码,以提供空间预测。视频编码器20可执行多个译码遍次,例如用以选择用于每一视频数据块的适当译码模式。
此外,分割单元48可基于对先前译码遍次中的先前分割方案的评估而将视频数据的块分割成子块。举例来说,分割单元48可首先将帧或图块分割成LCU,且基于率-失真分析(例如,率-失真优化)来将所述LCU中的每一个分割成子CU。模式选择单元40可进一步产生指示将LCU分割成子CU的四分树数据结构。四分树的叶节点CU可包含一或多个PU和一或多个TU。
模式选择单元40可(例如,基于误差结果)选择帧内或帧间译码模式中的一个,且可将所得帧内或帧间译码块提供到求和器50以产生残余块数据且提供到求和器62以重构建用作参考帧的经编码块。模式选择单元40也将例如运动向量、帧内模式指示符、分区信息和其它此类语法信息的语法元素提供到熵编码单元56。
运动估计单元42和运动补偿单元44可高度集成,但出于概念目的而单独说明。由运动估计单元42执行的运动估计为产生运动向量的过程,所述运动向量估计视频块的运动。举例来说,运动向量可指示当前视频帧或图片内的视频块的PU相对于与当前图片(或其它经译码单元)内正经译码的当前块有关的参考图片(或其它经译码单元)内的预测性块的位移。预测性块为就像素差来说被发现紧密地匹配待译码块的块,所述像素差可通过绝对差总和(SAD)、平方差总和(SSD)或其它差度量确定。在一些实例中,视频编码器20可计算存储于经解码图片缓冲器64中的参考图片的子整数像素位置的值。举例来说,视频编码器20可内插所述参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此,运动估计单元42可执行关于全像素位置和分数像素位置的运动搜索并输出具有分数像素精确度的运动向量。
运动估计单元42通过比较PU的位置与参考图片的预测性块的位置而计算经帧间译码图块中的视频块的PU的运动向量。所述参考图片可选自第一参考图片列表(列表0)或第二参考图片列表(列表1),所述参考图片列表中的每一个识别存储于经解码图片缓冲器64中的一或多个参考图片。运动估计单元42将所计算的运动向量发送到熵编码单元56和运动补偿单元44。
由运动补偿单元44执行的运动补偿可涉及基于由运动估计单元42确定的运动向量来提取或产生预测性块。再者,在一些实例中,运动估计单元42和运动补偿单元44可在功能上集成。在接收到当前视频块的PU的运动向量之后,运动补偿单元44可在参考图片列表中的一个中定位运动向量所指向的预测性块。求和器50通过从正经译码的当前视频块的像素值减去预测性块的像素值来形成残余视频块,从而形成像素差值,如下文所论述。大体来说,运动估计单元42相对于明度分量执行运动估计,且运动补偿单元44将基于所述明度分量计算的运动向量用于色度分量与明度分量两者。模式选择单元40也可产生与视频块和视频图块相关联的语法元素以供视频解码器30在解码视频图块的视频块时使用。
如上文所描述,作为由运动估计单元42和运动补偿单元44所执行的帧间预测的替代,帧内预测处理单元46可对当前块进行帧内预测。明确地说,帧内预测处理单元46可确定帧内预测模式以用于编码当前块。在一些实例中,帧内预测处理单元46可例如在单独编码遍次期间使用各种帧内预测模式来编码当前块,且帧内预测处理单元46(或在一些实例中模式选择单元40)可从所测试模式选择适当帧内预测模式以供使用。
举例来说,帧内预测处理单元46可使用针对各种所测试帧内预测模式的率-失真分析来计算率-失真值,且在所测试模式间选择具有最佳率-失真特性的帧内预测模式。率-失真分析大体上确定经编码块与原始未经编码块(其经编码以产生经编码块)之间的失真(或误差)量,以及用以产生经编码块的位速率(即,位的数目)。帧内预测处理单元46可从各种经编码块的失真和速率计算比率以确定哪一帧内预测模式展现所述块的最佳率-失真值。
在选择块的帧内预测模式之后,帧内预测处理单元46可将指示块的所选择帧内预测模式的信息提供到熵编码单元56。熵编码单元56可编码指示所选择帧内预测模式的信息。视频编码器20可将以下各者包含在所传输的位流中:配置数据,其可包含多个帧内预测模式索引表和多个经修改的帧内预测模式索引表(也被称作码字映射表);各种块的编码上下文的定义;和待用于所述上下文中的每一个的最可能的帧内预测模式、帧内预测模式索引表和经修改的帧内预测模式索引表的指示。
视频编码器20通过从经译码的原始视频块减去来自模式选择单元40的预测数据而形成残余视频块。求和器50表示执行此减法运算的一或多个组件。变换处理单元52将变换(例如离散余弦变换(DCT)或概念上类似的变换)应用于残余块,从而产生包括残余变换系数值的视频块。变换处理单元52可执行概念上类似于DCT的其它变换。也可使用小波变换、整数变换、子频带变换或其它类型的变换。在任何情况下,变换处理单元52将变换应用于残余块,从而产生残余变换系数块。变换可将残余信息从像素值域转换为变换域,例如频域。变换处理单元52可将所得变换系数发送到量化单元54。
量化单元54量化变换系数以进一步减小位速率。量化过程可减小与系数中的一些或所有相关联的位深度。量化程度可通过调整量化参数来修改。在一些实例中,量化单元54可接着执行对包含经量化变换系数的矩阵的扫描。替代地,熵编码单元56可执行扫描。
在量化之后,熵编码单元56熵译码经量化的变换系数。举例来说,熵编码单元56可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵译码技术。在基于上下文的熵译码的情况下,上下文可基于相邻块。在通过熵编码单元56进行熵译码之后,可将经编码位流传输到另一装置(例如视频解码器30)或加以存档以供稍后传输或检索。
反量化单元58和反变换处理单元60分别地应用反量化和反变换以在像素域中重构建残余块,例如以供稍后用作参考块。运动补偿单元44可通过将残余块添加到经解码图片缓冲器64的帧中的一者的预测性块而计算参考块。运动补偿单元44也可将一或多个内插滤波器应用于经重构建残余块,以计算子整数像素值以用于运动估计。求和器62将经重构建的残余块添加到由运动补偿单元44产生的运动补偿预测块,以产生用于存储于经解码图片缓冲器64中的经重构建视频块。所述经重构建的视频块可由运动估计单元42和运动补偿单元44用作参考块以对后续视频帧中的块进行帧间译码。
视频编码器20可实施本发明的各种技术以从块的时空相邻块导出当前经编码块的量化参数(QP)值,和/或将缩放操作应用于当前经编码块的所有(例如DC和AC)变换系数。
在以下描述中也参考图8。在一些实施方案中,视频编码器20可从时空邻域的附接块(CU)导出当前经译码块152的参考QP值。即,视频编码器20可使用上相邻块158和左相邻块156导出当前经译码块152的QP值。通过以下伪码描述此实施方案的实例,其中视频编码器20使用上相邻块158和左相邻块156导出当前经译码块152的QP值:
在一些实施方案中,视频编码器20可通过考虑参考样本的一或多个QP值来导出当前经译码块152的QP值。通过以下伪码描述此实施方案的实例,其中视频编码器20使用参考样本的QP值来导出当前经译码块152的QP值:
根据本文中所描述的技术的一些实施方案,视频编码器20可存储应用于参考块的样本的QP和/或用作参考图片的所有图片的全域QP(例如图块层级QP)。根据本文中所描述的技术的一些实施方案,视频编码器20可存储应用于参考块的样本的缩放参数和/或用作参考图片的所有图片的全域缩放(例如图块层级缩放)参数。如果参考样本的块与块分区的多个CU重叠(因此可能具有跨所述分区的不同QP),那么视频编码器20可从众多可用QP导出QP。举例来说,视频编码器20可通过对多个可用QP实施取平均值的过程来导出当前经译码块152的QP。通过以下伪码描述实施方案的一实例,根据所述实施方案,视频编码器20可通过对来自参考样本的多个可用的QP取平均值来导出当前经译码块152的QP值:
在本文中所描述的QP导出技术的又一实施方案中,视频编码器20可(例如从查找表(LUT))导出QP作为明度分量的平均亮度的函数。通过以下伪码描述此实施方案,其中‘avgPred’为参考样本的平均亮度:
QP=PQ_LUT[avgPred];
根据本文中所描述的QP导出技术的一些实施方案,视频编码器20可从一或多个全域QP值导出参考QP值。全域QP值的实例为图块层级中所指定的QP值。通过以下伪码描述此实施方案:
qp=(((Int)pcCU->getSlice()->getSliceQp()+iDQp+52+2*qpBdOffsetY)%(52+qpBdOffsetY))-qpBdOffsetY;
根据本文中所描述的QP导出技术的一些实施方案,视频编码器20可通过利用一或多个参考样本值导出QP值。通过以下伪码描述此实施方案:
QP=PQ_LUT[avgPred];
在上述伪码中,“PQ_LUT”表示视频编码器20可用以将经预测块的平均亮度值(“avgPred”)映射到相关联PQ值的查找表。视频编码器20可计算avgPred的值作为参考样本的函数,例如通过计算参考样本的平均值。视频编码器20可根据本发明的计算使用的平均值的实例包含平均值、中位值和模式值中的一或多个。
在一些实施方案中,视频编码器20可导出缩放参数而非QP值。在其它实施方案中,视频编码器20可使用将经导出QP值转换成缩放参数的转换过程,或反之亦然。在一些实施方案中,视频编码器20可利用分析型表式从一或多个参考样本导出QP值。举例来说,为了利用分析型表式,视频编码器20可使用参数导出模型。
图10为说明可实施本发明的技术的视频解码器30的实例的框图。在图10的实例中,视频解码器30包含熵解码单元70、视频数据存储器71、运动补偿单元72、帧内预测处理单元74、反量化单元76、反变换处理单元78、经解码图片缓冲器82和求和器80。在一些实例中,视频解码器30可执行与关于视频编码器20(图9)描述的编码遍次大体上互逆的解码遍次。运动补偿单元72可基于从熵解码单元70接收的运动向量产生预测数据,而帧内预测处理单元74可基于从熵解码单元70接收的帧内预测模式指示符产生预测数据。
视频数据存储器71可存储待由视频解码器30的组件解码的视频数据,例如经编码视频位流。举例来说,存储于视频数据存储器71中的视频数据可经由视频数据的有线或无线网络通信或通过存取物理数据存储媒体而从计算机可读媒体16(例如从例如摄影机的本地视频源)获得。视频数据存储器71可形成存储来自经编码视频位流的经编码视频数据的经译码图片缓冲器(CPB)。经解码图片缓冲器82可为存储供视频解码器30用于例如在帧内译码模式或帧间译码模式中解码视频数据的参考视频数据的参考图片存储器。视频数据存储器71和经解码图片缓冲器82可由各种存储器装置中的任一个形成,例如动态随机存取存储器(DRAM)(包含同步DRAM(SDRAM))、磁阻式RAM(MRAM)、电阻式RAM(RRAM)或其它类型的存储器装置。可由同一存储器装置或单独存储器装置提供视频数据存储器71和经解码图片缓冲器82。在各种实例中,视频数据存储器71可与视频解码器30的其它组件一起在芯片上,或相对于那些组件在芯片外。
在解码过程期间,视频解码器30从视频编码器20接收表示经编码视频图块的视频块和相关联语法元素的经编码视频位流。视频解码器30的熵解码单元70熵解码位流以产生经量化系数、运动向量或帧内预测模式指示符和其它语法元素。熵解码单元70将运动向量和其它语法元素转递到运动补偿单元72。视频解码器30可接收视频图块层级和/或视频块层级下的语法元素。
当视频图块经译码为经帧内译码(I)图块时,帧内预测处理单元74可基于经信令帧内预测模式和来自当前帧或图片的先前经解码块的数据而产生当前视频图块的视频块的预测数据。当视频帧经译码为经帧间译码(即B或P)图块时,运动补偿单元72基于运动向量和从熵解码单元70接收的其它语法元素而产生当前视频图块的视频块的预测性块。可由参考图片列表中的一个内的参考图片中的一个产生预测性块。视频解码器30可基于存储于经解码图片缓冲器82中的参考图片使用默认构建技术来构建参考图片列表(列表0和列表1)。运动补偿单元72通过剖析运动向量和其它语法元素来确定用于当前视频图块的视频块的预测信息,且使用所述预测信息来产生经解码的当前视频块的预测性块。举例来说,运动补偿单元72使用所接收语法元素中的一些来确定用于译码视频图块的视频块的预测模式(例如,帧内或帧间预测)、帧间预测图块类型(例如,B图块或P图块)、所述图块的参考图片列表中的一或多个的构建信息、所述图块的每一经帧间编码视频块的运动向量、所述图块的每一经帧间译码视频块的帧间预测状态和用以解码当前视频图块中的视频块的其它信息。
运动补偿单元72也可基于内插滤波器执行内插。运动补偿单元72可使用如由视频编码器20在视频块的编码期间使用的内插滤波器,以计算参考块的子整数像素的内插值。在此情况下,运动补偿单元72可从所接收的语法元素确定由视频编码器20使用的内插滤波器且使用所述内插滤波器产生预测性块。
反量化单元76反量化(即,解量化)位流中所提供且由熵解码单元70解码的经量化变换系数。反量化过程可包含使用视频解码器30针对视频图块中的每一视频块计算的量化参数QPY来确定应应用的量化程度和同样地反量化程度。反变换处理单元78将例如反DCT、反整数变换或概念上类似的反变换过程的反变换应用于变换系数,以便在像素域中产生残余块。
在运动补偿单元72基于运动向量和其它语法元素产生用于当前视频块的预测性块之后,视频解码器30通过将来自反变换处理单元78的残余块与运动补偿单元72所产生的对应预测性块求和而形成经解码视频块。求和器80表示执行此求和运算的一或多个组件。如果需要,也可应用解块滤波器来对经解码块进行滤波以便去除块效应伪影。其它回路滤波器(在译码回路内或在译码回路之后)也可用于使像素转变平滑,或另外改善视频质量。接着将给定帧或图片中的经解码视频块存储于经解码图片缓冲器82中,所述经解码图片缓冲器存储用于后续运动补偿的参考图片。经解码图片缓冲器82也存储供稍后在显示装置(例如,图1的显示装置32)上呈现的经解码视频。
视频解码器30可根据上文所描述的技术中的一或多个在经编码视频位流中接收自由视频编码器20获得的QP值导出的差异QP值。使用差异QP值,视频解码器30可获得关于当前经解码块(例如图8中所说明的当前经译码块152)的QP值。之后,视频解码器30可使用QP值解量化当前经译码块152。
在视频解码器30接收当前经译码块152的缩放参数的情况下,视频解码器30可使用缩放参数来实施与使用经缩放值DC'和AC'作为运算数的各种过程大体上互逆的反向缩放过程。即,视频解码器30可应用缩放参数以反向缩放经缩放DC变换系数DC'和经缩放AC变换系数AC',从而获得如由以下方程式表达的经反向缩放DC系数DC"和经反向缩放AC变换系数AC"。视频解码器30可如以下方程式中所说明来实施反向缩放操作:
DC"=DC'/scale(fun1(DC',avgPred));和
AC"=AC'/scale(fun2(DC",avgPred))
术语‘fun1’和‘fun2’定义使用参考样本的平均值和基于DC的值作为引数的缩放导出函数/过程。如关于由视频解码器30实施的反向缩放技术所说明,本发明的技术能够在导出DC和AC变换系数值两者时使用DC变换系数值。以此方式,不论反向缩放操作是替代变换系数的量化和反解量化执行还是与变换系数的量化和解量化组合执行,本发明的技术使视频解码器30能够在反向缩放操作中利用DC变换系数值。
图11为说明根据本发明的各种方面的视频解码器30可执行的实例过程170的流程图。过程170可在视频解码器30接收包含当前块152的经编码表示的经编码视频位流时开始(172)。视频解码器30可重构建基于当前块152的时空相邻QP信息的QP值(174)。举例来说,视频解码器30可从在经编码视频位流中信令的差异QP值重构建QP。经重构建QP值可基于来自图8中所说明的块154到158中的一或多个的QP信息。如上文所论述,为重构建QP值,视频解码器30可对时空相邻块154到158中的两个或更多个的QP值取平均值以产生参考QP值,接着将差异QP值与参考QP值相加以最终产生当前块的经重构建QP值。之后,视频解码器30(且更明确地说,反量化单元76)可使用基于时空相邻QP信息的经重构建QP值来解量化(即,反量化)当前块152的经CABAC解码的变换系数(176)。在一些实例中,视频解码器30可基于时空邻域的样本获得当前块152的样本的参考QP值,且可将差异QP值与参考QP值相加以导出用于解量化当前块152的样本的QP值。
图12为说明根据本发明的各种方面的视频解码器30可执行的实例过程190的流程图。过程190可在视频解码器30接收包含当前块152的经编码表示的经编码视频位流时开始(192)。视频解码器30可重构建基于当前块152的时空相邻缩放信息的缩放参数(194)。举例来说,经重构建缩放参数可基于来自图8中所说明的块154到158中的一或多个的缩放信息。之后,视频解码器30可使用基于时空相邻QP信息的经重构建缩放参数来反向缩放当前块152(196)。在一些实例中,视频解码器30可将第一反向缩放导出过程应用于当前块152的变换系数的多个DC变换系数以获得多个经反向缩放DC变换系数,且可将第二反向缩放导出过程应用于当前块152的变换系数的多个反向经缩放DC变换系数以获得多个经反向缩放AC变换系数。
图13为说明根据本发明的各种方面的视频编码器20可执行的实例过程210的流程图。过程210可在视频编码器20从当前块152的时空相邻QP信息导出当前块152的QP值时开始(212)。视频编码器20可使用从时空相邻QP信息导出的QP值来量化当前块152(214)。之后,视频编码器20可在经编码视频位流中信令从基于时空相邻QP信息的QP导出的差异QP值(216)。在一些实例中,视频编码器20可选择与空间相邻块154和/或156和/或时间相邻块158中的两个或更多个的样本相关联的相邻QP值。在一些实例中,视频编码器20可对所选择的相邻QP值取平均值以获得平均QP值,且可从平均值导出当前块的QP值。在一些实例中,视频编码器20可基于时空邻域的样本获得当前块152的样本的参考QP值。在这些实例中,视频编码器20可从QP值减去参考QP值以导出当前块152的样本的差异量化参数(QP)值,且可在经编码视频位流中信令差异QP值。
图14为说明根据本发明的各种方面的视频编码器20可执行的实例过程240的流程图。过程240可在视频编码器20从当前块152的时空相邻缩放信息导出当前块152的缩放参数时开始(242)。视频编码器20可使用从时空相邻缩放信息导出的缩放参数来缩放当前块152(244)。之后,视频编码器20可在经编码视频位流中信令基于时空相邻缩放信息的缩放参数(246)。
如上文所描述,所揭示的系统和技术还并入有或包含用于从信号的时空邻域导出量化或缩放参数的若干算法。即,本发明的实例系统和技术涉及获得用以在译码过程中修改与当前块相关联的残余数据的一或多个参数值。如本文中所使用,用以修改残余数据的参数值可包含量化参数(用以在编码过程或解码过程中分别通过量化或解量化残余数据来修改残余数据),或缩放参数(用以在编码过程或解码过程中分别通过缩放或反向缩放残余数据来修改残余数据)。
出于说明的目的,本发明的某些方面已经关于HEVC标准的扩展而描述。然而,本发明中所描述的技术可用于其它视频译码过程,包含尚未开发的其它标准或专有视频译码过程。
如本发明中所描述的视频译码器可指视频编码器或视频解码器。类似地,视频译码单元可指视频编码器或视频解码器。同样地,如适用,视频译码可指视频编码或视频解码。
应认识到,取决于实例,本文中所描述的技术中的任一个的某些动作或事件可以不同序列执行、可添加、合并或完全省略所述动作或事件(例如,并非所有所描述动作或事件对于所述技术的实践是必要的)。此外,在某些实例中,可例如通过多线程处理、中断处理或多个处理器同时地而非顺序地执行动作或事件。
在一或多个实例中,所描述功能可以硬件、软件、固件或其任何组合来实施。如果以软件实施,那么所述功能可作为一或多个指令或代码而存储于计算机可读媒体上或经由计算机可读媒体传输,且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体(其对应于例如数据存储媒体的有形媒体)或通信媒体,所述通信媒体包含例如根据通信协议来促进计算机程序从一处传送到另一处的任何媒体。以此方式,计算机可读媒体通常可对应于(1)非暂时性的有形计算机可读存储媒体,或(2)例如信号或载波的通信媒体。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索指令、代码和/或数据结构以用于实施本发明中所描述的技术的任何可用媒体。计算机程序产品可包含计算机可读媒体。
借助于实例而非限制,此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或可用以存储呈指令或数据结构形式的所需程序代码且可由计算机存取的任何其它媒体。并且,任何连接被适当地称为计算机可读媒体。举例来说,如果使用同轴缆线、光缆、双绞线、数字用户线(DSL)或无线技术(例如红外线、无线电和微波)从网站、服务器或其它远程源传输指令,那么同轴缆线、光缆、双绞线、DSL或无线技术(例如红外线、无线电和微波)包含于媒体的定义中。然而,应理解,计算机可读存储媒体和数据存储媒体不包含连接、载波、信号或其它暂时性媒体,而实际上是针对非暂时性有形存储媒体。如本文所使用,磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软碟和蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘用激光以光学方式再现数据。以上各者的组合也应包含于计算机可读媒体的范围内。
可由例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路的一或多个处理器来执行指令。因此,如本文中所使用的术语“处理器”可指前述结构或适于实施本文中所描述的技术的任何其它结构中的任一个。另外,在一些方面中,本文中所描述的功能性可提供于经配置用于编码和解码的专用硬件和/或软件模块内,或并入于组合式编解码器中。并且,所述技术可完全实施于一或多个电路或逻辑元件中。
本发明的技术可实施于广泛各种装置或设备中,包含无线手持机、集成电路(IC)或IC集合(例如芯片组)。在本发明中描述各种组件、模块或单元以强调经配置以执行所揭示技术的装置的功能方面,但未必需要由不同硬件单元来实现。确切地说,如上文所描述,可将各种单元组合于编解码器硬件单元中,或通过互操作性硬件单元(包含如上文所描述的一或多个处理器)的集合结合适合的软件和/或固件来提供所述单元。
各种实例已予以描述。这些和其它实例在所附权利要求书的范围内。

Claims (22)

1.一种译码视频数据的当前块的方法,所述方法包括:
获得参数值,其基于与定位于所述当前块的时空邻域内的所述视频数据的一或多个相邻块相关联的一或多个对应的参数值,其中所述时空邻域包含定位成邻近于所述当前块的一或多个空间相邻块和由与所述当前块相关联的视差向量DV指向的时间相邻块,且其中所述所获得的参数值用于在译码过程中修改与所述当前块相关联的残余数据;以及
基于所述所获得的参数值来译码所述视频数据的所述当前块。
2.根据权利要求1所述的方法,其中所述所获得的参数值包括量化参数QP值,且其中基于所述所获得的参数值来译码所述当前块包括至少部分地通过使用所述QP值解量化所述当前块的样本来解码所述当前块。
3.根据权利要求2所述的方法,其中获得所述QP值包括:
在经编码视频位流中接收差异量化参数QP值;
基于所述时空邻域的样本来获得所述当前块的样本的参考QP值;以及
将所述差异QP值与所述参考QP值相加以导出用于解量化所述当前块的所述样本的所述QP值。
4.根据权利要求1所述的方法,其中所述所获得的参数值包括缩放参数值,且其中基于所述所获得的参数值来译码所述当前块包括至少部分地通过使用所述缩放参数值反向缩放所述当前块的变换系数来解码所述当前块。
5.根据权利要求4所述的方法,其中反向缩放所述当前块的所述变换系数包括:
将第一反向缩放导出过程应用于所述当前块的所述变换系数的多个DC变换系数以获得多个经反向缩放DC变换系数;以及
将第二反向缩放导出过程应用于所述当前块的所述变换系数的所述多个经反向缩放DC变换系数以获得多个经反向缩放AC变换系数。
6.根据权利要求1所述的方法,其中获得所述参数值包括获得量化参数QP值,所述方法包括:
选择与所述空间相邻块或所述时间相邻块中的两个或更多个的样本相关联的相邻QP值;
对所述经选择相邻QP值取平均值以获得平均QP值;以及
从所述平均QP值导出所述当前块的所述QP值,
其中基于所述所获得的参数值来译码所述当前块包括至少部分地通过使用所述QP值量化所述当前块来编码所述当前块。
7.根据权利要求6所述的方法,其进一步包括:
基于所述时空邻域的样本来获得所述当前块的样本的参考QP值;
从所述QP值减去所述参考QP值以导出所述当前块的所述样本的差异量化参数QP值;以及
在经编码视频位流中信令所述差异QP值。
8.根据权利要求1所述的方法,其中所述所获得的参数值包括缩放参数值,且其中基于所述所获得的参数值来译码所述当前块包括至少部分地通过使用所述缩放参数值缩放所述当前块的变换系数来编码所述当前块。
9.根据权利要求8所述的方法,其中缩放所述当前块的所述变换系数包括:
将第一缩放导出过程应用于所述当前块的所述变换系数的多个DC变换系数;以及
将第二缩放导出过程应用于所述当前块的所述变换系数的多个DC变换系数。
10.根据权利要求1所述的方法,其中所述所获得的参数值包括全域参数值,所述全域参数值适用于包含所述当前块的图块的所有块。
11.一种用于译码视频数据的装置,所述装置包括:
存储器,其经配置以存储包含当前块的视频数据;以及
与所述存储器通信的处理电路,所述处理电路经配置以:
获得参数值,所述参数值是基于与存储到所述存储器的所述视频数据的一或多个相邻块相关联的一或多个对应的参数值,所述一或多个相邻块定位于所述当前块的时空邻域内,其中所述时空邻域包含定位成邻近于所述当前块的一或多个空间相邻块和由与所述当前块相关联的视差向量DV指向的时间相邻块,且其中所述所获得的参数值用于在译码过程中修改与所述当前块相关联的残余数据;以及
译码存储到所述存储器的所述视频数据的所述当前块。
12.根据权利要求11所述的装置,其中所述所获得的参数值包括量化参数QP值,且其中为基于所述所获得的参数值来译码所述当前块,所述处理电路经配置以至少部分地通过使用所述QP值解量化所述当前块的样本来解码所述当前块。
13.根据权利要求12所述的装置,其中为获得所述QP值,所述处理电路经配置以:
在经编码视频位流中接收差异量化参数QP值;
基于所述时空邻域的样本来获得所述当前块的样本的参考QP值;以及
将所述差异QP值与所述参考QP值相加以导出用于解量化所述当前块的所述样本的所述QP值。
14.根据权利要求11所述的装置,其中所述所获得的参数值包括缩放参数值,且其中为基于所述所获得的参数值来译码所述当前块,所述处理电路经配置以至少部分地通过使用所述缩放参数值反向缩放所述当前块的变换系数来解码所述当前块。
15.根据权利要求14所述的装置,其中为反向缩放所述当前块的所述变换系数,所述处理电路经配置以:
将第一反向缩放导出过程应用于所述当前块的所述变换系数的多个DC变换系数以获得多个经反向缩放DC变换系数;且
将第二反向缩放导出过程应用于所述当前块的所述变换系数的所述多个经反向缩放DC变换系数以获得多个经反向缩放AC变换系数。
16.根据权利要求11所述的装置,
其中所述参数值包括量化参数QP值,
其中为获得所述QP值,所述处理电路经配置以:
选择与所述空间相邻块或所述时间相邻块中的两个或更多个的样本相关联的相邻QP值;
对所述经选择相邻QP值取平均值以获得平均QP值;以及
从所述平均QP值导出所述当前块的所述QP值,且
其中为基于所述所获得的参数值来译码所述当前块,所述处理电路经配置以至少部分地通过使用所述QP值量化所述当前块来编码所述当前块。
17.根据权利要求16所述的装置,其中所述处理电路经进一步配置以:
基于所述时空邻域的样本来获得所述当前块的样本的参考QP值;
从所述QP值减去所述参考QP值以导出所述当前块的所述样本的差异量化参数QP值;以及
在经编码视频位流中信令所述差异QP值。
18.根据权利要求11所述的装置,其中所述所获得的参数值包括缩放参数值,且其中为基于所述所获得的参数值来译码所述当前块,所述处理电路经配置以至少部分地通过使用所述缩放参数值缩放所述当前块的变换系数来编码所述当前块。
19.根据权利要求18所述的装置,其中为了缩放所述当前块的所述变换系数,所述处理电路经配置以:
将第一缩放导出过程应用于所述当前块的所述变换系数的多个DC变换系数;以及
将第二缩放导出过程应用于所述当前块的所述变换系数的多个DC变换系数。
20.根据权利要求11所述的装置,其中所述所获得的参数值包括全域参数值,所述全域参数值适用于包含所述当前块的图块的所有块。
21.一种用于译码视频数据的设备,所述设备包括:
用于获得参数值的装置,所述参数值是基于与定位于所述视频数据的当前块的时空邻域内的所述视频数据的一或多个相邻块相关联的一或多个对应的参数值,其中所述时空邻域包含定位成邻近于所述当前块的一或多个空间相邻块和由与所述当前块相关联的视差向量DV指向的时间相邻块,且其中所述所获得的参数值用于在译码过程中修改与所述当前块相关联的残余数据;以及
用于基于所述所获得的参数值来译码所述视频数据的所述当前块的装置。
22.一种经指令编码的非暂时性计算机可读存储媒体,所述指令在经执行时使得视频译码装置的处理电路进行以下操作:
获得参数值,所述参数值是基于与定位于所述视频数据的当前块的时空邻域内的所述视频数据的一或多个相邻块相关联的一或多个对应的参数值,其中所述时空邻域包含定位成邻近于所述当前块的一或多个空间相邻块和由与所述当前块相关联的视差向量DV指向的时间相邻块,且其中所述所获得的参数值用于在译码过程中修改与所述当前块相关联的残余数据;以及
基于所述所获得的参数值来译码所述视频数据的所述当前块。
CN201780048583.7A 2016-08-11 2017-08-11 用于回路内样本处理的视频译码工具 Pending CN109644277A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662373884P 2016-08-11 2016-08-11
US62/373,884 2016-08-11
US15/674,035 US20180048907A1 (en) 2016-08-11 2017-08-10 Video coding tools for in-loop sample processing
US15/674,035 2017-08-10
PCT/US2017/046527 WO2018031899A1 (en) 2016-08-11 2017-08-11 Video coding tools for in-loop sample processing

Publications (1)

Publication Number Publication Date
CN109644277A true CN109644277A (zh) 2019-04-16

Family

ID=61159577

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780048583.7A Pending CN109644277A (zh) 2016-08-11 2017-08-11 用于回路内样本处理的视频译码工具

Country Status (9)

Country Link
US (1) US20180048907A1 (zh)
EP (1) EP3497931A1 (zh)
JP (1) JP2019528017A (zh)
KR (1) KR20190033558A (zh)
CN (1) CN109644277A (zh)
BR (1) BR112019002202A2 (zh)
SG (1) SG11201900106TA (zh)
TW (1) TWI765903B (zh)
WO (1) WO2018031899A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10999576B2 (en) * 2017-05-03 2021-05-04 Novatek Microelectronics Corp. Video processing method
EP3649782A4 (en) * 2017-07-05 2021-04-14 Telefonaktiebolaget LM Ericsson (PUBL) DECODING A BLOCK OF VIDEO SAMPLE
US10628165B2 (en) * 2017-08-17 2020-04-21 Agora Lab, Inc. Gain control for multiple description coding
CN114503594B (zh) * 2019-09-22 2024-04-05 北京字节跳动网络技术有限公司 自适应环路滤波中样点填充的选择性应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101946516A (zh) * 2008-02-22 2011-01-12 高通股份有限公司 快速宏块增量量化参数的决定
CN103444180A (zh) * 2011-03-09 2013-12-11 日本电气株式会社 视频编码设备、视频解码设备、视频编码方法以及视频解码方法
CN103621082A (zh) * 2011-06-25 2014-03-05 高通股份有限公司 视频译码中的量化
CN105009586A (zh) * 2013-03-08 2015-10-28 高通股份有限公司 多视图或3维视频译码中的视图间残余预测

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101946516A (zh) * 2008-02-22 2011-01-12 高通股份有限公司 快速宏块增量量化参数的决定
CN103444180A (zh) * 2011-03-09 2013-12-11 日本电气株式会社 视频编码设备、视频解码设备、视频编码方法以及视频解码方法
CN103621082A (zh) * 2011-06-25 2014-03-05 高通股份有限公司 视频译码中的量化
CN105009586A (zh) * 2013-03-08 2015-10-28 高通股份有限公司 多视图或3维视频译码中的视图间残余预测

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
D. B. SANSLI等: "On Coefficient Scaling", 《JOINT VIDEO EXPLORATION TEAM (JVET)》 *
JIE ZHAO等: "De-quantization and scaling for next generation containers", 《JOINT VIDEO EXPLORATION TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11》 *

Also Published As

Publication number Publication date
TWI765903B (zh) 2022-06-01
KR20190033558A (ko) 2019-03-29
JP2019528017A (ja) 2019-10-03
EP3497931A1 (en) 2019-06-19
TW201811028A (zh) 2018-03-16
BR112019002202A2 (pt) 2019-05-14
US20180048907A1 (en) 2018-02-15
SG11201900106TA (en) 2019-02-27
WO2018031899A1 (en) 2018-02-15

Similar Documents

Publication Publication Date Title
CN107690803B (zh) 用于高动态范围及广色域视频译码的自适应常量照度方法
CN109155848B (zh) 用于高动态范围及宽色域视频译码的环路内样本处理
CN105723707B (zh) 用于视频译码的色彩残差预测
CN107211124B (zh) 用于译码视频数据的方法、装置和计算机可读存储媒体
JP6840740B2 (ja) 高ダイナミックレンジおよび広色域ビデオコーディングのための補足エンハンスメント情報(sei)メッセージ
JP6800896B2 (ja) ビデオコーディングのためにハイダイナミックレンジおよび広色域ビデオデータを処理すること
CN106797465B (zh) 一种解码视频数据的方法及装置
CN107439013A (zh) 用于高动态范围和宽色域视频译码的动态范围调整
CN106105201B (zh) 使用像素距离的解块滤波
CN108028936A (zh) 视频译码中成分的范围调整的固定点实施
TWI705697B (zh) 在視訊寫碼中調色板區塊大小之限制
CN109643531A (zh) 具有反馈信道的色域自适应
JP7369124B2 (ja) 結合されたピクセル/変換ベースの量子化を用いたビデオコーディングのための量子化パラメータ制御
CN105814893B (zh) 在多层视频译码中信息用于色域可扩展性的3d查找表的发信分区
CN107690808B (zh) 可缩放视频译码中色域缩放性参数及表的推导
CN110100436A (zh) 使用导出色度模式译码视频数据
CN110024406A (zh) 具有用于视频译码的样本存取的线性模型预测模式
CN109716774A (zh) 用于视频译码的可变数目的帧内模式
CN109479133A (zh) 使用自适应分量缩放对视频数据进行编码的系统和方法
CN109964482A (zh) 视频译码中的双边滤波器使用的指示
CN105814892B (zh) 视频编解码的方法、装置以及相应的计算机可读存储媒体
CN109076228A (zh) 滤波信息的发信号
CN107736024A (zh) 到高动态范围和/或广色域视频数据的固定转移函数的内容自适应应用
US20200288126A1 (en) Reshaping filter average calculation for video coding
CN106233728B (zh) 视频数据的解码方法、编码方法、解码装置、编码装置及计算机可读存储媒体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40000964

Country of ref document: HK

WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190416