CN114830649A - 推断bdpcm经译码的块中的帧内译码模式 - Google Patents

推断bdpcm经译码的块中的帧内译码模式 Download PDF

Info

Publication number
CN114830649A
CN114830649A CN202080085203.9A CN202080085203A CN114830649A CN 114830649 A CN114830649 A CN 114830649A CN 202080085203 A CN202080085203 A CN 202080085203A CN 114830649 A CN114830649 A CN 114830649A
Authority
CN
China
Prior art keywords
block
video data
mode
intra
bdpcm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080085203.9A
Other languages
English (en)
Inventor
A·纳尔奇
L·彭万
M·卡切夫维茨
G·范德奥维拉
M·Z·科班
H·E·埃伊尔梅茨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN114830649A publication Critical patent/CN114830649A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

视频编码器和视频解码器可以使用帧内预测和基于块的增量脉冲译码调制(BDPCM)模式来对视频数据进行译码。BDPCM模式可以包括垂直的模式和水平的模式。视频编码器和视频解码器可以被配置为针对亮度块和色度块两者来将帧内预测模式的方向与BDPCM模式的方向对准。

Description

推断BDPCM经译码的块中的帧内译码模式
本申请要求于2020年12月18日递交的、编号为17/126,585的美国申请的优先权,该美国申请要求于2019年12月27日递交的、编号为62/954,149的美国临时申请的利益,其全部内容以引用方式并入本文中。
技术领域
本公开内容涉及视频编码和视频解码。
背景技术
数字视频能力可以并入范围广泛的设备中,包括数字电视、数字直接广播系统、无线广播系统、个人数字助理(PDA)、笔记本电脑或台式电脑、平板电脑、电子书阅读器、数码照相机、数字录音设备、数字媒体播放器、视频游戏设备、视频游戏主控台、蜂窝电话或卫星无线电话、所谓的“智能手机”、视频电话会议设备、视频串流设备等。数字视频设备实现视频译码技术,比如在通过MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4、部分10、改进的视频译码(AVC)、ITU-T H.265/高效视频译码(HEVC)定义的标准中所描述的视频译码技术,以及对这样的标准的扩展。视频设备可以通过实现这样的视频译码技术来更有效地发送、接收、编码、解码和/或存储数字视频信息。
视频译码技术包括空间(图片内)预测和/或时间(图片间)预测,以减少或移除视频序列中的固有的冗余。针对基于块的视频译码,视频切片(例如,视频图片或视频图片的一部分)可以划分为视频块,其还可以称为译码树单元(CTU)、译码单元(CU)和/或译码节点。图片的帧内译码(I)的切片中的视频块是使用相对于同一图片中的邻近的块中的参考样本的空间预测来编码的。图片的帧间译码(P或B)切片中的视频块可以使用相对于同一图片中邻近的块中的参考样本的空间预测,或者相对于其它参考图片中的参考样本的时间预测。图片可以称为帧,以及参考图片可以称为参考帧。
发明内容
一般而言,本公开内容描述针对基于块的增量脉冲译码调制(BDPCM)的技术。在一个示例中,本公开内容描述用于与BDPCM模式协力使用的帧内预测模式的推导方法的示例。例如,视频编码器和视频解码器可以被配置为基于视频数据的块的BDPCM模式来确定针对视频数据的块的帧内预测模式。视频编码器和视频解码器可以将本公开内容的技术应用于亮度块和色度块两者。通过基于BDPCM模式来确定帧内预测模式,可以提高译码效率。本公开内容的技术可以是与使用BDPCM模式的视频编码技术(包括多功能视频译码(VVC))协力使用的。
在一个示例中,本公开内容描述对视频数据进行解码的方法。所述方法可以包括确定针对视频数据的块的BDPCM模式,以及基于针对视频数据的块的BDPCM模式来确定帧内预测模式。所述方法可以进一步包括根据BDPCM模式和帧内预测模式来对视频数据的块进行解码。
在另一示例中,本公开内容描述被配置为对视频数据进行解码的装置,所述装置包括被配置为存储视频数据的块的存储器,以及与存储器相通信的一个或多个处理器。所述一个或多个处理器可以被配置为确定针对视频数据的块的BDPCM模式,以及基于针对视频数据的块的BDPCM模式来确定帧内预测模式。所述一个或多个处理器可以被配置为被配置为根据BDPCM模式和帧内预测模式来对视频数据的块进行解码。
在另一示例中,本公开内容描述被配置为对视频数据进行解码的装置。所述装置可以包括用于确定针对视频数据的块的BDPCM模式的单元,以及用于基于针对视频数据的块的BDPCM模式来确定帧内预测模式的单元。所述装置可以进一步包括用于根据BDPCM模式和帧内预测模式来对视频数据的块进行解码的单元。
在另一示例中,本公开内容描述存储指令的非暂时性计算机可读存储介质,所述指令当执行时,使得设备的一个或多个处理器被配置为对视频数据进行解码以确定针对视频数据的块的BDPCM模式,基于针对视频数据的块的BDPCM模式来确定帧内预测模式,以及根据BDPCM模式和帧内预测模式来对视频数据的块进行解码。
在另一示例中,本公开内容描述被配置为对视频数据进行编码的装置,所述装置包括被配置为存储视频数据的块的存储器和与所述存储器相通信的一个或多个处理器。所述一个或多个处理器可以被配置为确定针对视频数据的块的基于块的增量脉冲译码调制(BDPCM)模式,基于针对视频数据的块的BDPCM模式来确定帧内预测模式,以及根据BDPCM模式和帧内预测模式来对视频数据的块进行编码。
一个或多个示例的细节将在下文的附图和说明书中进行阐述。其它特征、对象和优势将从说明书、附图和权利要求书中变得显而易见。
附图说明
图1是示出可以执行本公开内容的技术的示例视频编码和解码系统的方框图。
图2A和图2B是示出示例四叉树二叉树(QTBT)结构以及相应的译码树单元(CTU)的概念性示意图。
图3是示出可以执行本公开内容的技术的示例视频编码器的方框图。
图4是示出可以执行本公开内容的技术的示例视频解码器的方框图。
图5是示出示例视频编码方法的流程图。
图6是示出示例视频解码方法的流程图。
图7是示出另一示例视频编码方法的流程图。
图8是示出另一示例视频解码方法的流程图。
具体实施方式
本公开内容与针对基于块的增量脉冲译码调制(BDPCM)的技术相关。在BDPCM模式中,视频译码器(例如,视频编码器和/或视频解码器)可以被配置为对使用帧内预测创建的预测残差的块进行译码。视频译码器可以在水平方向上或者在垂直方向上应用BDPCM技术。本公开内容描述帧内预测模式与BDPCM模式对准的技术。也就是说,如果使用水平的BDPCM,则设置帧内预测模式是水平的帧内预测模式。同样地,如果使用垂直的BDPCM,则设置帧内预测模式是垂直的帧内预测模式。上文所描述的对BDPCM模式与帧内预测模式的对准可以应用于亮度块和色度块两者。通过将BDPCM模式与帧内预测模式对准,可以提高译码效率。
图1是示出可以执行本公开内容的技术的示例视频编码和解码系统100的方框图。本公开内容的技术通常针对于对视频数据进行译码(编码和/或解码)。一般而言,视频数据包括用于处理视频的任何数据。因此,视频数据可以包括原始的、未经编码的视频、经编码的视频、经解码的(例如,重构的)视频和视频元数据,比如信令数据。
如图1所示,在该示例中,系统100包括源设备102,所述源设备102提供经编码的要由目标设备116来解码和显示的视频数据。特别地,源设备102经由计算机可读介质110向目标设备116提供视频数据。源设备102和目标设备116可以包括范围广泛的设备中的任何设备,所述设备包括台式电脑、笔记本电脑(即,膝上型计算机)、移动设备、平板电脑、机顶盒、电话手机(比如智能手机)、电视、照相机、显示设备、数字媒体播放器、视频游戏主控台、视频串流设备、广播接收机设备等。在一些情况下,源设备102和目标设备116可以配备用于无线通信,因此可以称为无线通信设备。
在图1的示例中,源设备102包括视频源104、存储器106、视频编码器200和输出接口108。目标设备116包括输入接口122、视频解码器300、存储器120和显示设备118。根据本公开内容,源设备102的视频编码器200和目标设备116的视频解码器300可以被配置为应用用于BDPCM译码的技术。因此,源设备102表示视频编码设备的示例,而目标设备116表示视频解码设备的示例。在其它示例中,源设备和目标设备可以包括其它组件或排列。例如,源设备102可以从外部视频源(比如外部照相机)接收视频数据。同样地,目标设备116可以与外部显示设备相连接,而不是包括整合的显示设备。
如图1所示的系统100仅仅是一个示例。一般而言,任何数字视频编码和/或解码设备可以执行用于BDPCM译码的技术。源设备102和目标设备116仅仅是如下这样的译码设备的示例:源设备102在其中生成用于到目标设备116的传输的经译码的视频数据的译码设备。本公开内容将“译码”设备称为执行对数据的译码(编码和/或解码)的设备。因此,视频编码器200和视频解码器300分别表示译码设备的示例,特别是视频编码器和视频解码器。在一些示例中,源设备102和目标设备116可以以基本上对称的方式来操作,使得源设备102和目标设备116中的各者包括视频编码组件和视频解码组件。因此,系统100可以支持在源设备102与目标设备116之间的单向视频传输或双向视频传输,例如,用于视频串流、视频回放、视频广播或视频电话。
一般而言,视频源104表示视频数据的源(即,原始的、未经编码的视频数据)以及向视频编码器200提供视频数据的一顺序系列的图片(还称为“帧”),所述视频编码器200对针对图片的数据进行编码。源设备102的视频源104可以包括视频捕捉设备(比如摄像机、包含先前捕捉的原始视频的视频存档和/或视频馈送接口)以从视频内容提供者接收视频。作为进一步的替代方案,视频源104可以生成基于计算机图形的数据作为源视频,或者直播视频、存档的视频和计算机生成的视频的组合。在每种情况下,视频编码器200对捕捉的、预捕捉的或计算机生成的视频数据进行编码。视频编码器200可以将图片从接收的顺序(有时称为“显示顺序”)重新排列为用于译码的译码顺序。视频编码器200可以生成包括经编码的视频数据的比特流。源设备102可以接着经由输出接口108将经编码的视频数据输出到计算机可读介质110上,用于由例如目标设备116的输入接口122进行的接收和/或取回。
源设备102的存储器106和目标设备116的存储器120表示通用的存储器。在一些示例中,存储器106、存储器120可以存储原始的视频数据,例如,来自视频源104的原始的视频和来自视频解码器300的原始的、经解码的视频数据。另外地或替代地,存储器106、存储器120可以存储分别能由例如视频编码器200和视频解码器300执行的软件指令。虽然在该示例中存储器106和存储器120是与视频编码器200和视频解码器300分别地示出的,但是应当理解的是,视频编码器200和视频解码器300还可以包括用于功能类似的或等效的目的的内部存储器。此外,存储器106、存储器120可以存储经编码的视频数据,例如,来自视频编码器200的输出和去往视频解码器300的输入。在一些示例中,存储器106、存储器120的一部分可以分配为一个或多个视频缓冲区,例如,以存储原始的、经解码的和/或经编码的视频数据。
计算机可读介质110可以表示能够将经编码的视频数据从源设备102传送给目标设备116的任何类型的介质或设备。在一个示例中,计算机可读介质110表示通信介质以使得源设备102能够实时地将经编码的视频数据直接地发送给目标设备116,例如,经由射频网络或基于计算机的网络。输出接口108可以调制包括经编码的视频数据的发送信号,以及输入接口122可以根据通信标准(比如无线通信协议)对接收的发送信号进行解调。通信介质可以包括任何无线的通信介质或有线的通信介质,比如射频(RF)频谱或一个或多个物理传输线。通信介质可以形成基于分组的网络的一部分,比如局域网、广域网或全球网络(比如互联网)。通信介质可以包括路由器、交换机、基站或可以用于促进从源设备102到目标设备116的通信的其它装备。
在一些示例中,源设备102可以将经编码的数据从输出接口108输出到存储设备112。类似地,目标设备116可以经由输入接口122从存储设备112存取经编码的数据。存储设备112可以包括各种分布式地或本地存取的数据存储介质中的任何一者,比如硬盘驱动器、蓝光光盘、DVD、CD-ROM、闪速存储器、易失性存储器或非易失性存储器,或用于存储经编码的视频数据的任何其它合适的数字存储介质。
在一些示例中,源设备102可以将经编码的视频数据输出到文件服务器114或可以存储由源设备102生成的经编码的视频数据的另一中间存储设备。目标设备116可以经由串流或下载从文件服务器114存取存储的视频数据。
文件服务器114可以是能够存储经编码的视频数据和将该经编码的视频数据发送给目标设备116的任何类型的服务器设备。文件服务器114可以表示网络服务器(例如,针对网站)、被配置为提供文件传送协议服务(比如文件传送协议(FTP)或通过单向传送的文件递送(FLUET)协议)的服务器、内容递送网络(CDN)设备、超文本传送协议(HTTP)服务器,多媒体广播多播服务(MBMS)或增强型MBMS(eMBMS)服务器和/或网络附属存储(NAS)设备。文件服务器114可以另外地或替代地实现一个或多个HTTP串流协议,比如通过HTTP的动态自适应串流(DASH)、HTTP直播串流(HLS)、实时串流协议(RTSP)、HTTP动态串流等。
目标设备116可以通过任何标准数据连接(包括互联网连接)从文件服务器114存取经编码的视频数据。这可以包括适合用于对存储在文件服务器114上的经编码的视频数据进行存取的无线信道(例如,Wi-Fi连接)、有线连接(例如,数字用户线路(DSL)、电缆调制解调器等)或两者的组合。输入接口122可以被配置为根据上文所讨论的各种协议中的任何一个或多个协议来操作用于从文件服务器114取回或接收媒体数据,或根据其它这样的协议来操作用于取回媒体数据。
输出接口108和输入接口122可以表示无线发射机/接收机、调制解调器、有线连网组件(例如,以太网卡)、根据各种IEEE 802.11标准中的任何标准进行操作的无线通信组件或其它物理组件。在输出接口108和输入接口122包括无线组件的示例中,输出接口108和输入接口122可以被配置为根据蜂窝通信标准(比如4G、4G-LTE(长期演进)、改进的LTE、5G等)来传送数据(比如经编码的视频数据)。在输出接口108包括无线发射机的一些示例中,输出接口108和输入接口122可以被配置为根据其它无线标准(比如IEEE 802.11规范、IEEE802.15规范(例如,紫蜂)、蓝牙TM标准等)来传送数据(比如经编码的视频数据)。在一些示例中,源设备102和/或目标设备116可以包括各自的片上系统(SoC)设备。例如,源设备102可以包括SoC设备以执行归因于视频编码器200和/或输出接口108的功能,以及目标设备116可以包括SoC设备以执行归因于视频解码器300和/或输入接口122的功能。
本公开内容的技术可以应用于支持各种多媒体应用中的任何多媒体应用的视频译码,比如空中电视广播、电缆电视传输、卫星电视传输、互联网串流视频传输,比如通过HTTP的动态自适应串流(DASH)、编码到数据存储介质上的数字视频、对存储在数据存储介质上的数字视频的解码或其它应用。
目标设备116的输入接口122从计算机可读介质110(例如,通信介质、存储设备112、文件服务器114等)接收经编码的视频比特流。经编码的视频比特流可以包括由视频编码器200定义的信令信息,其还由视频解码器300使用,比如具有描述视频块或其它经译码的单元(例如,切片、图片、图片组、序列等)的特性和/或对视频块或其它经编码的单元的处理的值的语法元素。显示装置118向用户显示经解码的视频数据的经解码的图片。显示装置118可以表示各种显示设备中的任何显示设备,比如液晶显示器(LCD)、等离子体显示器、有机发光二极管(OLED)显示器或另一类型的显示设备。
虽然未在图1中示出,但是在一些示例中,视频编码器200和视频解码器300可以是各自与音频编码器和/或音频解码器整合的,以及可以包括适当的MUX-DEMUX单元或其它硬件和/或软件,以处理包括在共同的数据流中的音频和视频两者的复用流。如果适用的话,MUX-DEMUX单元可以符合ITU H.223复用器协议,或比如用户数据报协议(UDP)的其它协议。
视频编码器200和视频解码器300可以各自实现为各种合适的编码器和/或解码器电路中的任何一者,比如一个或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、分立逻辑、软件、硬件、固件或其任意组合。当技术在软件中部分地实现时,设备可以存储针对在合适的、非暂时性的计算机可读介质中的软件的指令,以及在使用一个或多个处理器的硬件中执行指令以执行本公开内容的技术。视频编码器200和视频解码器300中的各者可以是包括在一个或多个编码器或解码器中的,所述编码器或解码器中的两者之一可以整合为各自的设备中的组合的编码器/解码器(CODEC)中的一部分。包括视频编码器200和/或视频解码器300的设备可以包括集成电路、微处理器和/或无线通信设备,比如蜂窝电话。
视频编码器200和视频解码器300可以根据视频译码标准(比如ITU-T H.265,还称为高效率视频译码(HEVC)或其扩展(比如多视点和/或可缩放视频译码扩展))来进行操作。或者,视频编码器200和视频解码器300可以根据其它专有或行业标准(比如联合勘探测试模型(JEM)或ITU-T H.266,还称为多功能视频译码(VVC))进行操作。VVC标准的最新草案是在Bross等人的“Versatile Video Coding(Draft 7)”(“多功能视频译码(草案7)”)中进行描述的,ITU-T SG 16WP 3和ISO/IEC JTC 1/SC 29/WG 11的联合视频专家组(JVET),第16次会议:日内瓦,瑞士,2019年10月1日至11日,JVET-P2001-v14(以下简称“VVC草案7”)。然而,本公开内容的技术不受限于任何特定的译码标准。
一般而言,视频编码器200和视频解码器300可以执行对图片的基于块的译码。术语“块”通常指的是包括要处理的(例如,经编码的、经解码的或在编码和/或解码过程中以其它方式使用的)数据的结构。例如,块可以包括亮度和/或色度数据的样本的二维矩阵。一般而言,视频编码器200和视频解码器300可以对以YUV(例如Y、Cb、Cr)格式表示的视频数据进行译码。也就是说,视频编码器200和视频解码器300可以对亮度分量和色度分量进行译码,而不是针对图片的样本的红、绿和蓝(RGB)数据进行译码,其中色度分量可以包括红色色调色度分量和蓝色色调色度分量两者。在一些示例中,视频编码器200在编码之前将接收的RGB格式的数据转换为YUV表示,以及视频解码器300将YUV表示转换为RGB格式。或者,预处理单元和后处理单元(未示出)可以执行这些转换。
本公开内容可以通常指的是对图片的译码(例如,编码和解码)以包括对图片的数据进行编码或解码的过程。类似地,本公开内容可以指的是对图片的块的译码以包括对针对块的数据的编码或解码的过程,例如,预测和/或残差译码。经编码的视频比特流通常包括针对表示译码决定(例如,译码模式)和将图片划分为块的语法元素的一系列值。因此,对图片或块进行译码的参考通常应当理解为针对形成图片或块的语法元素的译码值。
HEVC定义各种块,包括译码单元(CU)、预测单元(PU)和变换单元(TU)。根据HEVC,视频译码器(比如视频编码器200)根据四叉树结构将译码树单元(CTU)划分为CU。也就是说,视频译码器将CTU和CU划分为四个相等的、非重叠的正方形,以及四叉树的每个节点均具有零个子节点或四个子节点。没有子节点的节点可以称为“叶节点”,以及这样的叶节点的CU可以包括一个或多个PU和/或一个或多个TU。视频译码器可以进一步划分PU和TU。例如,在HEVC中,残差四叉树(RQT)表示对TU的划分。在HEVC中,PU表示帧间预测数据,而TU表示残差数据。帧内预测的CU包括帧内预测信息,比如帧内模式指示。
作为另一示例,视频编码器200和视频解码器300可以被配置为根据VVC进行操作。根据VVC,视频译码器(比如视频编码器200)将图片划分为多个译码树单元(CTU)。视频编码器200可以根据树结构来划分CTU,比如四叉树-二叉树(QTBT)结构或多类型树(MTT)结构。QTBT结构去除多个划分类型的概念,比如对HEVC的CU、PU与TU之间的分开。QTBT结构包括两个级别:根据四叉树划分进行划分的第一级别,以及根据二叉树划分进行划分的第二级别。QTBT结构的根节点对应于CTU。二叉树的叶节点对应于译码单元(CU)。
在MTT划分结构中,块可以是使用四叉树(QT)划分、二叉树(BT)划分和一种或多种类型的三叉树(TT)(还称为三元树(TT))划分来划分的。三叉树划分或三元树划分是将块拆分为三个子块的划分。在一些示例中,三叉树或三元树划分在不通过中心分割初始块的情况下将块分成三个子块。MTT中的划分类型(例如,QT、BT和TT)可以是对称的或非对称的。
在一些示例中,视频编码器200和视频解码器300可以使用单个QTBT或MTT结构来表示亮度分量和色度分量中的各者,而在其它示例中,视频编码器200和视频解码器300可以使用两个或更多个QTBT或MTT结构,比如用于亮度分量的一个QTBT/MTT结构和用于两个色度分量的另一QTBT/MTT结构(或用于各自的色度分量的两个QTBT/MTT结构)。
视频编码器200和视频解码器300可以被配置为使用每HEVC的四叉树划分、QTBT划分、MTT划分或其它划分结构。出于解释的目的,对本公开内容的技术的描述是相对于QTBT划分给出的。然而,应当理解的是,本公开内容的技术还可以应用于被配置为使用四叉树划分或此外使用其它类型的划分的视频译码器。
在一些示例中,CTU包括亮度样本的译码树块(CTB)、具有三个样本阵列的图片的色度样本的两个相应的CTB、或单色图片或使用三个单独的颜色平面和用于译码样本的语法结构来进行译码的图片的样本的CTB。CTB可以是针对N的一些值的样本的NxN块,使得对分量到CTB的分割是划分。分量是来自三个阵列(亮度和两个色度)中的一个阵列的阵列或单个样本,所述三个阵列以4:2:0、4:2:2或4:4:4颜色格式或阵列或以单色格式组成图片的阵列的单个样本来组成图片。在一些示例中,译码块是针对M和N的一些值的样本的MxN块,使得对CTB到译码块的分割是划分。
块(例如,CTU或CU)可以在图片中以各种方式分组。举例而言,砖块(brick)可以指的是图片中的特定的图块(tile)内的CTU行的矩形区域。图块可以是图片中的特定图块列和特定图块行内的CTU的矩形区域。图块列指的是CTU的矩形区域,其具有与图片的高度相等的高度以及通过(例如,比如在图片参数的集合中的)语法元素指定的宽度。图块行指的是CTU的矩形区域,其具有通过(例如,比如在图片参数的集合中的)语法元素指定的高度以及与图片的宽度相等的宽度。
在一些示例中,图块可以划分为多个砖块,所述砖块中的每个砖块可以包括图块内的一个或多个CTU行。未划分为多个砖块的图块也可以称为砖块。然而,是图块的真正的子集的砖块可能不会称为图块。
在图片中的砖块还可以是以切片来排列的。切片可以是图片的整数数量的砖块,其可以是独占地包含在单个网络抽象层(NAL)单元中的。在一些示例中,切片包括多个完整的图块或一个图块的仅一连续的序列的完整砖块。
本公开内容可以可交换地使用“NxN”和“N乘N”来指按照垂直维度和水平维度的块(比如CU或其它视频块)的样本维度,例如16x16样本或16乘16样本。一般而言,16x16 CU将在垂直方向上具有16个样本(y=16),以及将在水平方向上具有16个样本(x=16)。同样地,NxN CU通常在垂直方向上具有N个样本,以及在水平方向上具有N个样本,其中N表示非负整数值。CU中的样本可以是以行和列来排列的。此外,CU不需要必然地在水平方向上具有与在垂直方向上相同数量的样本。例如,CU可以包括NxM个样本,其中M不必然地等于N。
视频编码器200对针对CU的表示预测和/或残差信息以及其它信息的视频数据进行编码。预测信息指示要如何预测CU以便形成针对CU的预测块。残差信息通常表示在编码之前的CU的样本与预测块之间的逐样本差异。
为了预测CU,视频编码器200通常可以通过帧间预测或帧内预测来形成针对CU的预测块。帧间预测通常指的是从先前经译码的图片的数据预测CU,而帧内预测通常指的是从同一图片的先前经译码的数据预测CU。为了执行帧间预测,视频编码器200可以使用一个或多个运动矢量来生成预测块。视频编码器200通常可以执行运动搜索以识别与CU紧密地匹配的参考块,例如,按照在CU与参考块之间的差异。视频编码器200可以使用绝对差之和(SAD)、误差平方和(SSD)、平均绝对差(MAD)、均方误差(MSD)或其它这样的差分计算来对差分度量进行计算,以确定参考块是否与当前的CU紧密地匹配。在一些示例中,视频编码器200可以使用单向预测或双向预测来预测当前的CU。
VVC的一些示例还提供仿射运动补偿模式,其可以被认为是帧间预测模式。在仿射运动补偿模式中,视频编码器200可以确定表示非平移运动的两个或更多个运动矢量,比如放大或缩小、旋转、透视运动或其它不规则的运动类型。
为了执行帧内预测,视频编码器200可以选择帧内预测模式以生成预测块。VVC的一些示例提供六十七种帧内预测模式,包括各种方向的模式以及平面模式和DC模式。一般而言,视频编码器200选择帧内预测模式,所述帧内预测模式描述对于当前块(例如,CU的块)而言的从其预测当前块的样本的邻近的样本。假设视频编码器200以光栅扫描顺序(左到右、上到下)来对CTU和CU进行译码,则这样的样本通常可以在与当前块相同的图片中的当前块的上方、上方并且左边、或左边。
视频编码器200对表示针对当前块的预测的模式的数据进行编码。例如,针对帧间预测模式,视频编码器200可以对表示使用各种可用的帧间预测模式中的那个帧间预测模式以及针对相应的模式的运动信息的数据进行编码。针对单向帧间预测或双向帧间预测,例如,视频编码器200可以使用改进的运动矢量预测(AMVP)或合并模式来对运动矢量进行编码。视频编码器200可以使用类似的模式来对用于仿射运动补偿模式的运动矢量进行编码。
在预测(比如对块的帧内预测或帧间预测)之后,视频编码器200可以计算针对块的残差数据。残差数据(比如残差块)表示在块与针对块的使用相应的预测模式形成的预测块之间的逐个样本差。视频编码器200可以对残差块应用一个或多个变换,以在变换域而不是样本域中产生经变换的数据。例如,视频编码器200可以对残差视频数据应用离散余弦变换(DCT)、整数变换、小波变换或概念上类似的变换。另外地,视频编码器200可以在第一变换之后应用二次变换,比如取决于模式的不可分的二次变换(MDNSST)、取决于信号的变换、卡洛南-洛伊(Karhunen-Loeve)变换(KLT)等。视频编码器200在对一个或多个变换的应用之后产生变换系数。
如上文所述,在任何变换以产生变换系数之后,视频编码器200可以执行对变换系数的量化。量化通常指的是在其中对变换系数进行量化以可能地减少用于表示变换系数的数据的量,提供进一步的压缩的过程。通过执行量化过程,视频编码器200可以减少与变换系数中的一些变换系数或全部变换系数相关联的比特深度。例如,视频编码器200可以在量化期间将n比特值向下四舍五入到m比特值,其中n大于m。在一些示例中,为了执行量化,视频编码器200可以执行对要量化的值的逐位右移。
在量化之后,视频编码器200可以扫描变换系数,从包括经量化的变换系数的二维矩阵产生一维矢量。扫描可以被设计为在矢量的前面放置较高的能量(因此较低的频率)变换系数,以及在矢量的后面放置较低的能量(因此较高的频率)变换系数。在一些示例中,视频编码器200可以利用预先定义的扫描顺序来扫描经量化的变换系数以产生序列化的矢量,以及接着对矢量的经量化的变换系数进行熵编码。在其它示例中,视频编码器200可以执行自适应扫描。在扫描经量化的变换系数以形成一维矢量之后,视频编码器200可以例如根据上下文自适应的二进制算术译码(CABAC)对一维矢量进行熵编码。视频编码器200还可以对针对描述与经编码的视频数据相关联的元数据的语法元素的值进行熵编码,用于由视频解码器300在解码视频数据中使用。
为了执行CABAC,视频编码器200可以将在上下文模型内的上下文分配给要发送的符号。上下文可以涉及例如符号的邻近的值是否是零值。概率确定可以是基于分配给符号的上下文。
视频编码器200可以进一步例如在图片报头、块报头、切片报头或其它语法数据(比如序列参数集(SPS)、图片参数集(PPS),或视频参数集(VPS))中向视频解码器300生成语法数据(比如基于块的语法数据、基于图片的语法数据和基于序列的语法数据)。视频解码器300同样地可以对这样的语法数据进行解码以确定如何对相应的视频数据进行解码。
以这种方式,视频编码器200可以生成包括经编码的视频数据的比特流,例如描述对图片到块(例如,CU)的划分的语法元素和针对块的预测和/或残差信息。最终,视频解码器300可以接收比特流以及对经编码的视频数据进行解码。
一般而言,视频解码器300执行与由视频编码器200执行的互易的过程,以对比特流的经编码的视频数据进行解码。例如,视频解码器300可以使用CABAC以基本上类似于(尽管是互易的)视频编码器200的CABAC编码过程的方式来对针对比特流的语法元素的值进行解码。语法元素可以定义用于对图片到CTU的划分以及根据相应的划分结构(比如QTBT结构)来对每个CTU的划分的划分信息,以定义CTU的CU。语法元素可以进一步定义针对视频数据的块(例如,CU)的预测信息和残差信息。
残差信息可以是通过例如经量化的变换系数来表示的。视频解码器300可以对块的经量化的变换系数进行逆量化和逆变换,以再现针对该块的残差块。视频解码器300使用以信号发送的预测模式(帧内预测或帧间预测)和相关的预测信息(例如,用于帧间预测的运动信息)以形成针对该块的预测块。视频解码器300可以接着组合预测块和残差块(在逐个样本的基础上)以再现初始块。视频解码器300可以执行另外的处理,比如执行解块过程以减少沿着块的边界的视觉伪像。
本公开内容通常可以指的是“以信号发送”某些信息(比如语法元素)。术语“以信号发送”通常可以指的是针对语法元素和/或用于对经编码的视频数据进行解码的其它数据的值的通信。也就是说,视频编码器200可以以信号发送针对比特流中的语法元素的值。一般而言,以信号发送指的是生成比特流中的值。如上文所述,源设备102可以基本上实时地或非实时地将比特流传输到目标设备116,比如可能当将语法元素存储到存储设备112用于由目标设备116进行的稍后的取回时发生。
根据本公开内容的技术,如将在下文更详细地描述的,视频编码器200和视频解码器300可以被配置为确定针对视频数据的块的基于块的增量脉冲译码调制(BDPCM)模式,基于针对视频数据的块的BDPCM模式来确定帧内预测模式,以及根据所述BDPCM模式和所述帧内预测模式来对(例如,分别编码或解码)视频数据的块进行译码。
图2A和图2B是示出示例四叉树二叉树(QTBT)结构130和相应的译码树单元(CTU)132的概念性示意图。实线表示四叉树拆分,以及虚线指示二叉树拆分。在二叉树的每个拆分(即,非叶)节点中,一个标记是以信号发送为指示使用哪种拆分类型(即,水平的或垂直的)的,其中在该示例中0指示水平的拆分,以及1指示垂直的拆分。针对四叉树拆分,不需要指示拆分的类型,这是因为四叉树节点将块水平地和垂直地拆分为具有相等的大小的4个子块。因此,视频编码器200可以对针对QTBT结构130的区域树级别(即,实线)的语法元素(比如拆分信息)和针对QTBT结构130的预测树级别(即,虚线)的语法元素(比如拆分信息)进行编码,以及视频解码器300可以对针对QTBT结构130的区域树级别(即,实线)的语法元素(比如拆分信息)和针对QTBT结构130的预测树级别(即,虚线)的语法元素(比如拆分信息)进行解码。视频编码器200可以对针对通过QTBT结构130的终端叶节点表示的CU的视频数据(比如预测数据和变换数据)进行编码,以及视频解码器300可以对针对通过QTBT结构130的终端叶节点表示的CU的视频数据(比如预测数据和变换数据)进行解码。
一般而言,图2B的CTU 132可以与定义与QTBT结构130在第一级别处和在第二级别处的节点相对应的块的大小的参数相关联。这些参数可以包括CTU大小(表示样本中的CTU132的大小)、最小四叉树大小(MinQTSize,表示最小的允许的四叉树叶节点大小)、最大二叉树大小(MaxBTSize,表示最大的允许的二叉树根节点大小)、最大二叉树深度(MaxBTDepth,表示最大的允许的二叉树深度)和最小二叉树大小(MinBTSize,表示最小的允许的二叉树叶节点大小)。
与CTU相对应的QTBT结构的根节点可以在QTBT结构的第一级别处具有四个子节点,所述四个子节点中的每个子节点可以是根据四叉树划分进行划分的。也就是说,第一级别的节点是叶节点(没有子节点)或者具有四个子节点。QTBT结构130的示例表示如包括父节点和具有用于分支的实线的子节点的这样的节点。如果第一级别的节点不大于最大的允许的二叉树根节点大小(MaxBTSize),那么节点可以是通过各自的二叉树进行进一步地划分的。可以迭代对一个节点的二叉树拆分,直到来源于拆分的节点达到最小的允许的二叉树叶节点大小(MinBTSize)或最大的允许的二叉树深度(MaxBTDepth)为止。QTBT结构130的示例表示如具有用于分支的虚线的这样的节点。二叉树叶节点称为译码单元(CU),其在不进行任何进一步的划分的情况下用于预测(例如,图片内预测或图片间预测)和变换。如上文所讨论的,CU还可以称为“视频块”或“块”。
在QTBT划分结构的一个示例中,CTU大小设置为128x128(亮度样本和两个相应的64x64色度样本),MinQTSize设置为16x16,MaxBTSize设置为64x64,MinBTSize(针对宽度和高度两者)设置为4,以及MaxBTDepth设置为4。四叉树划分首先应用于CTU以生成四叉树叶节点。四叉树叶节点可以具有从16x16(即,MinQTSize)到128x128(即,CTU大小)的大小。如果四叉树叶节点是128x128,则叶四叉树节点将不会通过二叉树进行进一步地拆分,这是因为大小超过MaxBTSize(即,在该示例中为64x64)。否则,四叉树叶节点将通过二叉树来进一步地划分。因此,四叉树叶节点还是针对二叉树的根节点,以及具有为0的二叉树深度。当二叉树深度达到MaxBTDepth(在该示例中为4)时,进一步地拆分是不允许的。具有等于MinBTSize(在该示例中为4)的宽度的二叉树节点暗示针对该二叉树节点的进一步的垂直的拆分(也就是说,对宽度的分割)是不允许的。类似地,具有等于MinBTSize的高度的二叉树节点暗示针对该二叉树节点的进一步的水平的拆分(也就是说,对高度的分割)是不允许的。如上文所述,二叉树的叶节点称为CU,以及是在无进一步的划分的情况下根据预测和变换来进一步地处理的。
图3是示出可以执行本公开内容的技术的示例视频编码器200的方框图。图3是出于解释的目的提供的,以及不应当被认为是对本公开内容中所广泛地例证的和所描述的技术的限制。出于解释的目的,本公开内容描述根据VVC(ITU-T H.266)和HEVC(ITU-T H.265)的技术的视频编码器200。然而,本公开内容的技术可以是由被配置为其它视频译码标准的视频编码设备来执行的。
在图3的示例中,视频编码器200包括视频数据存储器230、模式选择单元202、残差生成单元204、变换处理单元206、量化单元208、逆量化单元210、逆变换处理单元212、重构单元214、滤波器单元216、经解码的图片缓冲区(DPB)218、BDPCM单元207和熵编码单元220。视频数据存储器230、模式选择单元202、残差生成单元204、变换处理单元206、量化单元208、逆量化单元210、逆变换处理单元212、逆BDPCM单元211、重构单元214、滤波器单元216、DPB 218和熵编码单元220中的任何一者或全部可以是在一个或多个处理器中或在处理电路中实现的。例如,视频编码器200的单元可以实现为一个或多个电路或逻辑元件作为硬件电路的一部分,或者作为FPGA的处理器、ASIC的一部分。此外,视频编码器200可以包括另外的或替代的处理器或处理电路以执行这些功能和其它功能。
视频数据存储器230可以存储要由视频编码器200的组件进行编码的视频数据。视频编码器200可以接收从例如视频源104(图1)接收存储在视频数据存储器230中的视频数据。DPB 218可以充当参考图片存储器,所述参考图片存储器存储参考视频数据用于由视频编码器200进行的对随后的视频数据的预测。视频数据存储器230和DPB 218可以是通过各种存储器设备中的任何存储器设备形成的,比如动态随机存取存储器(DRAM),其包括同步DRAM(SDRAM)、磁阻RAM(MRAM)、电阻RAM(RRAM)或其它类型的存储器设备。视频数据存储器230和DPB 218可以是通过相同的存储器设备或单独的存储器设备来提供的。在各种示例中,如所示出的,视频数据存储器230可以是与视频编码器200中的其它组件一起在芯片上的,或者是相对于这些组件在芯片外的。
在本公开内容中,对视频数据存储器230的引用不应当解释为受限于视频编码器200内部的存储器(除非明确地描述为此)或视频编码器200外部的存储器(除非明确地描述为此)。而是,对视频数据存储器230的引用应当理解为存储视频编码器200接收用于编码的视频数据(例如,针对要进行编码的当前块的视频数据)的参考存储器。图1的存储器106还可以提供来自视频编码器200的各个单元的输出的临时的存储。
示出图3的各个单元以辅助理解由视频编码器200执行的操作。所述单元可以实现为固定功能的电路、可编程的电路或其组合。固定功能的电路指的是提供特定的功能的,以及是对可以执行的操作来预设置的电路。可编程的电路指的是可以编程以执行各种任务,以及提供在可以执行的操作中的灵活的功能的电路。例如,可编程的电路可以执行使得可编程的电路以通过软件或固件的指令定义的方式来操作的软件或固件。固定功能的电路可以执行软件指令(例如,以接收参数或输出参数),但是固定功能的电路执行的操作的类型通常是不变的。在一些示例中,单元中的一个或多个单元可以是有区别的电路块(固定功能的或可编程的),以及在一些示例中,单元中的一个或多个单元可以是集成电路。
视频编码器200可以包括从可编程的电路形成的算术逻辑单元(ALU)、基本功能单元(EFU)、数字电路、模拟电路和/或可编程内核。在使用由可编程的电路执行的软件来执行对视频编码器200的操作的示例中,存储器106(图1)可以存储视频编码器200接收和执行的软件的指令(例如,目标代码),或者视频编码器200内的另一存储器(未示出)可以存储这样的指令。
视频数据存储器230被配置为存储接收的视频数据。视频编码器200可以从视频数据存储器230取回视频数据的图片,以及向残差生成单元204和模式选择单元202提供视频数据。视频数据存储器230中的视频数据可以是要编码的原始视频数据。
模式选择单元202包括运动估计单元222、运动补偿单元224和帧内预测单元226。模式选择单元202可以包括另外的功能单元以根据其它预测模式来执行视频预测。举例而言,模式选择单元202可以包括调色板单元、块内复制单元(其可以是运动估计单元222和/或运动补偿单元224的一部分)、仿射单元、线性模型(LM)单元等。
模式选择单元202通常协调多个编码阶段以测试编码参数的组合以及针对这样的组合的作为结果的速率失真值。编码参数可以包括对CTU到CU的划分、针对CU的预测模式、针对CU的残差数据的变换类型、针对CU的残差数据的量化参数等。模式选择单元202可以最终选择具有比另一些测试的组合更好的速率失真值的编码参数的组合。
视频编码器200可以将从视频数据存储器230取回的图片划分为一系列的CTU,以及将一个或多个CTU封装在切片中。模式选择单元202可以根据树结构(比如上文所描述的HEVC的QTBT结构或四叉树结构)来划分图片的CTU。如上文所描述的,视频编码器200可以根据树结构从划分CTU来形成一个或多个CU。这样的CU通常还可以称为“视频块”或“块”。
一般而言,模式选择单元202还控制其组件(例如,运动估计单元222、运动补偿单元224和帧内预测单元226),以生成针对当前块(例如,当前的CU,或在HEVC中,PU和TU的重叠部分)的预测块。针对对当前块的帧间预测,运动估计单元222可以执行运动搜索以识别一个或多个参考图片(例如,DPB 218中存储的一个或多个先前经译码的图片)中的一个或多个紧密地匹配的参考块。特别是,运动估计单元222可以例如根据绝对差之和(SAD)、误差平方和(SSD)、平均绝对差(MAD)、均方误差(MSD)等来计算表示潜在的参考块与当前块的相似程度的值。运动估计单元222通常可以使用在当前块与正在考虑的参考块之间的逐个样本差来执行这些计算。运动估计单元222可以识别具有来源于这些计算的最低值的参考块,其指示与当前块最紧密地匹配的参考块。
运动估计单元222可以形成一个或多个运动矢量(MV),所述MV定义参考图片中的参考块相对于当前图片中的当前块的位置的位置。运动估计单元222可以接着向运动补偿单元224提供运动矢量。例如,针对单向帧间预测,运动估计单元222可以提供单个运动矢量,而针对双向帧间预测,运动估计单元222可以提供两个运动矢量。运动补偿单元224可以接着使用运动矢量来生成预测块。例如,运动补偿单元224可以使用运动矢量来取回参考块的数据。举另一示例,如果运动矢量具有分数样本精度,则运动补偿单元224可以根据一个或多个内插滤波器来内插针对预测块的值。此外,针对双向帧间预测,运动补偿单元224可以取回针对通过各自的运动矢量标识的两个参考块的数据,以及例如通过逐个样本平均或加权平均来对所取回的数据进行组合。
举另一示例,针对帧内预测或帧内预测译码,帧内预测单元226可以从与当前块邻近的样本生成预测块。例如,针对方向模式,帧内预测单元226通常可以在数学上对邻近的样本的值进行组合,以及在跨越当前块定义的方向上填充这些计算的值以产生预测块。举另一示例,针对DC模式,帧内预测单元226可以计算邻近的样本到当前块的平均,以及生成预测块以包括针对预测块的每个样本的作为结果的平均。如下文将更详细地描述的,在一些示例中,帧内预测单元226可以基于BDPCM模式的方向来确定帧内预测模式(例如,帧内预测方向)。
模式选择单元202向残差生成单元204提供预测块。残差生成单元204从视频数据存储器230接收当前块的原始的、未经编码的版本,以及从模式选择单元202接收预测块。残差生成单元204计算在当前块与预测块之间的逐个样本差。作为结果的逐个样本差定义针对当前块的残差块。在一些示例中,残差生成单元204还可以确定在残差块中的样本值之间的差,以使用残差差分脉冲译码调制(RDPCM)生成残差块。在一些示例中,残差生成单元204可以是使用执行二进制减法的一个或多个减法器电路来形成的。
在模式选择单元202将CU划分为PU的示例中,每个PU可以是与亮度预测单元和相应的色度预测单元相关联的。视频编码器200和视频解码器300可以支持具有各种大小的PU。如上文所指示的,CU的大小可以指的是CU的亮度译码块的大小,以及PU的大小可以指的是PU的亮度预测单元的大小。假定特定的CU的大小是2Nx2N,视频编码器200可以支持2Nx2N或NxN的PU大小用于帧内预测,以及支持2Nx2N、2NxN、Nx2N、NxN或类似的对称的PU大小用于帧间预测。视频编码器200和视频解码器300还可以支持针对2NxnU、2NxnD、nLx2N和nRx2N的PU大小的非对称的划分用于帧间预测。
在模式选择单元202不将CU进一步地划分为PU的示例中,每个CU可以是与亮度译码块和相应的色度译码块相关联的。如上文,CU的大小可以指的是CU的色度译码块的大小。视频编码器200和视频解码器300可以支持2Nx2N、2NxN或Nx2N的CU大小。
针对其它视频译码技术(比如块内复制模式译码、仿射模式译码和线性模型(LM)模式译码),作为少数示例,模式选择单元202经由与译码技术相关联的各自的单元,生成针对正在进行编码的当前块的预测块。在一些示例中,比如调色板模式译码,模式选择单元202可以不生成预测块,而是生成指示在其中基于选择的调色板来重构的块的方式的语法元素。在这样的模式中,模式选择单元202可以将这些语法元素提供给要进行编码的熵编码单元220。
如上文所描述的,残差生成单元204接收针对当前块和相应的预测块的视频数据。残差生成单元204接着生成针对当前块的残差块。为了生成残差块,残差生成单元204计算在预测块与当前块之间的逐个样本差。
变换处理单元206将一个或多个变换应用于残差块以生成变换系数的块(本文称为“变换系数块”)。变换处理单元206可以将各种变换应用于残差块以形成变换系数块。例如,变换处理单元206可以将离散余弦变换(DCT)、方向变换、卡洛南-洛伊变换(KLT)或概念上类似的变换应用于残差块。在一些示例中,变换处理单元206可以执行对残差块的多个变换,例如,主变换和辅变换,比如旋转变换。在一些示例中,变换处理单元206不将变换应用于残差块。
量化单元208可以对变换系数块中的变换系数进行量化,以产生经量化的变换系数块。量化单元208可以根据与当前块相关联的量化参数(QP)值来对变换系数块的变换系数进行量化。视频编码器200(例如,经由模式选择单元202)可以通过调整与CU相关联的QP值来调整应用于与当前块相关联的变换系数块的量化的程度。量化可能引入信息的损耗,因此经量化的变换系数可能具有比由变换处理单元206产生的初始变换系数要低的精度。
在一些示例中,视频编码器200可以根据BDPCM模式进行操作,以及BDPCM单元207可以执行BDPCM处理。针对BDPCM模式的数据路径是在图3中利用虚线示出的。BDPCM模式是应用于由帧内预测单元226创建的残差样本的,尽管BDPCM模式可以与任何类型的残差样本一起使用。在图3的示例中,BDPCM模式与变换跳过(TS)残差译码一起使用。也就是说,视频编码器200当应用BDPCM模式时将绕过变换处理单元206。照此,在一些示例中,BDPCM单元207对空间域(例如,与频域相反)中的残差样本应用BDPCM处理。
如图3所示,在一些示例中,量化单元208可以在由BDPCM单元207进行的BDPCM处理之前对残差样本进行量化。BDPCM单元207可以使用水平的预测方向(例如,水平的预测模式)或者垂直的预测方向(例如,垂直的预测模式)来对经量化的残差块进行编码。针对垂直预测,帧内预测单元226使用顶部邻近块的底部行的像素来执行对块的具有未滤波的预测器样本的第一水平行的垂直帧内预测。同样地,针对水平预测,帧内预测单元226使用左邻近块的最右边列的像素来执行对块的具有未滤波的预测器样本的第一垂直列的水平帧内预测。
BDPCM单元207在各自的BDPCM方向上执行经量化的系数级别(例如,由帧内预测单元226产生的残差)上的经量化的级别域预测。视频编码器200可以以信号发送具有指示在CU级别处的BDPCM模式的方向(例如,水平的/垂直的)的值的语法元素。视频编码器200可以将BDPCM和TS残差译码应用于亮度块和色度块两者。逆BDPCM单元211可以在视频编码器200的重构环路中应用BDCPM单元207的逆过程(例如,参见图3中的虚线)。
在其它示例中,代替应用BDPCM,BDPCM单元207可以被配置为应用经量化的残差域BDPCM(还命名为RDPCM)。所使用的信令和预测方向可以与BPCM完全相同。帧内预测单元226可以通过在预测方向(水平的预测或垂直的预测)上的样本复制来执行在整个块上的帧内预测以创建残差。量化单元208对残差进行量化,以及BDPCM单元207对在经量化的残差与其预测器(水平的或垂直的)经量化的值之间的增量进行编码。
根据本公开内容的技术,视频编码器200可以被配置为确定针对视频数据的块的基于块的增量脉冲译码调制(BDPCM)模式。帧内预测单元226可以基于针对视频数据的块的BDPCM模式来确定帧内预测模式。视频编码器200可以接着根据BDPCM模式和帧内预测模式来对视频数据的块进行编码。在一个示例中,BDPCM模式是水平的BDPCM模式。在该示例中,视频编码器200可以确定帧内预测模式是水平的帧内预测模式。在另一示例中,BDPCM模式是垂直的BDPCM模式。在该示例中,视频编码器200可以被配置为确定帧内预测模式是垂直的帧内预测模式。上文的技术可以是针对色度块和亮度块两者来应用的。
逆量化单元210和逆变换处理单元212可以分别地将逆量化和逆变换应用于经量化的变换系数块,以从变换系数块重构残差块。重构单元214可以基于重构的残差块和由模式选择单元202生成的预测块来产生与当前块相对应的重构的块(尽管潜在地具有某种程度的失真)。例如,重构单元214可以将重构的残差块的样本增加到来自由模式选择单元202生成的预测块的相应的样本中,以产生重构的块。
滤波器单元216可以对重构的块执行一个或多个滤波器操作。例如,滤波器单元216可以执行解块操作以减少沿着CU的边缘的块效应伪像。在一些示例中,可以跳过对滤波器单元216的操作。例如,帧内预测单元226可以使用未滤波的块作为参考样本。
视频编码器200在DPB 218中存储重构的块。例如,在不需要对滤波器单元216的操作的示例中,重构单元214可以将重构的块存储到DPB 218。在需要对滤波器单元216的操作的示例中,滤波器单元216可以将经滤波的重构的块存储到DPB 218。运动估计单元222和运动补偿单元224可以从DPB 218取回从重构的(和潜在地滤波的)块形成的参考图片,以对随后地经编码的图片的块进行帧间预测。此外,帧内预测单元226可以使用当前图片的DPB218中的重构的块以对当前的图片中的其它块进行帧内预测。
一般而言,熵编码单元220可以对从视频编码器200的其它功能组件接收的语法元素进行熵编码。例如,熵编码单元220可以对来自量化单元208的经量化的变换系数块进行熵编码。举另一示例,熵编码单元220可以对来自模式选择单元202的预测语法元素(例如,用于帧间预测的运动信息或用于帧内预测的帧内模式信息)进行熵编码。熵编码单元220可以对语法元素执行一个或多个熵编码操作(其是视频数据的另一示例)以生成经熵编码的数据。例如,熵编码单元220可以对数据执行上下文自适应可变长度译码(CAVLC)操作、CABAC操作、变量到变量(V2V)长度译码操作、基于语法的上下文自适应二进制算术译码(SBAC)操作、概率间隔划分熵(PIPE)译码操作,指数哥伦布码编码操作,或另一类型的熵编码操作。在一些示例中,熵编码单元220可以在语法元素未经熵编码的旁路模式中操作。
如下文将更详细地解释的,熵编码单元220可以对指示BDPCM模式(例如,垂直的或水平的)的第一语法元素进行编码。根据本公开内容的一个示例,熵编码单元220可以基于视频数据的块的颜色分量(例如,亮度或色度),来确定针对指示针对视频数据的块的BDPCM模式的语法元素的上下文,以及基于所确定的上下文来对指示BDPCM模式的语法元素进行熵编码。在一个示例中,上下文是针对不同的颜色分量而不同的。
视频编码器200可以输出比特流,所述比特流包括对切片或图片的块进行重构所需要的经熵编码的语法元素。特别是,熵编码单元220可以输出比特流。
上文所描述的操作是相对于块来描述的。这样的描述应当理解为是针对亮度译码块和/或色度译码块的操作。如上文所描述的,在一些示例中,亮度译码块和色度译码块是CU的亮度分量和色度分量。在一些示例中,亮度译码块和色度译码块是PU的亮度分量和色度分量。
在一些示例中,相对于亮度译码块执行的操作不需要针对色度译码块来重复。举例而言,用于识别针对色度译码块的运动矢量(MV)和参考图片的操作,不需要针对识别针对色度块的MV和参考图片来重复。而是,可以缩放针对亮度译码块的MV以确定针对色度块的MV,以及参考图片可以是相同的。举另一示例,帧内预测过程可以是针对亮度译码块和色度译码块而相同的。
视频编码器200表示被配置为对视频数据进行编码的设备的示例,所述设备包括被配置为存储视频数据的存储器以及一个或多个处理单元,所述一个或多个处理单元是在电路中实现的并且被配置为确定针对视频数据的块的基于块的增量脉冲译码调制(BDPCM)模式,基于针对视频数据的块的BDPCM模式来确定帧内预测模式,以及根据BDPCM模式和帧内预测模式来对视频数据的块进行编码。
图4是示出可以执行本公开内容的技术的示例视频解码器300的方框图。图4是出于解释的目的而提供的,以及不受限于本公开内容所广泛地例证的和所描述的技术。出于解释的目的,本公开内容根据VVC(ITU-T H.266)和HEVC(ITU-T H.265)的技术来描述视频解码器300。然而,本公开内容的技术可以是由被配置为其它视频译码标准的视频译码设备来执行的。
在图4的示例中,视频解码器300包括经译码的图片缓冲区(CPB)存储器320、熵解码单元302、预测处理单元304、逆量化单元306、逆BDPCM单元307、逆变换处理单元308、重构单元310、滤波器单元312和经解码的图片缓冲区(DPB)314。CPB存储器320、熵解码单元302、预测处理单元304、逆量化单元306、逆变换处理单元308、重构单元310、滤波器单元312和DPB 314中的任何一者或全部可以是在一个或多个处理器中或是在处理电路中实现的。例如,视频解码器300的单元可以实现为一个或多个电路或逻辑元件作为硬件电路的一部分,或者作为FPGA的处理器、ASIC的一部分。此外,视频解码器300可以包括另外的或替代的处理器或处理电路,以执行这些功能和其它功能。
预测处理单元304包括运动补偿单元316和帧内预测单元318。预测处理单元304可以包括另外的单元以根据其它预测模式来执行预测。举例而言,预测处理单元304可以包括调色板单元、块内复制单元(其可以形成运动补偿单元316的一部分)、仿射单元、线性模型(LM)单元等。在其它示例中,视频解码器300可以包括更多的、更少的或不同的功能组件。
CPB存储器320可以存储要由视频解码器300的组件进行解码的视频数据(比如经编码的视频比特流)。存储在CPB存储器320中的视频数据可以是例如从计算机可读介质110(图1)获得的。CPB存储器320可以包括存储来自经编码的视频比特流的经编码的视频数据(例如,语法元素)的CPB。此外,CPB存储器320可以存储除了经译码的图片的语法元素之外的视频数据,比如表示从视频解码器300的各个单元输出的临时数据。DPB 314通常存储经解码的图片,视频解码器300可以当对经编码的视频比特流的随后的数据或图片进行解码时输出所述经解码的图片和/或将所述经解码的图片用作参考视频数据。CPB存储器320和DPB 314可以是通过各种存储器设备中的任何存储器设备(比如DRAM,包括SDRAM、MRAM、RRAM或其它类型的存储器设备)来形成的。CPB存储器320和DPB 314可以是通过相同的存储器设备或单独的存储器设备来提供的。在各种示例中,CPB存储器320可以是与视频解码器300的其它组件一起在芯片上的,或者是相对于这些组件在芯片外的。
另外地或替代地,在一些示例中,视频解码器300可以从存储器120(图1)取回经译码的视频数据。也就是说,存储器120可以如上文所讨论的与CPB存储器320一起存储数据。同样地,当视频解码器300的一些功能或全部功能是在要由视频解码器300的处理电路执行的软件中实现时,存储器120可以存储要由视频解码器300执行的指令。
示出图4所示的各种单元以辅助理解由视频解码器300执行的操作。所述单元可以实现为固定功能的电路、可编程的电路或其组合。与图3类似,固定功能的电路指的是提供特定的功能的、以及是对可以执行的操作来预设置的电路。可编程的电路指的是可以编程以执行各种任务、以及提供在可以执行的操作中的灵活的功能的电路。例如,可编程的电路可以执行使得可编程的电路以通过软件或固件的指令定义的方式来操作的软件或固件。固定功能的电路可以执行软件指令(例如,以接收参数或输出参数),但是固定功能的电路执行的操作的类型通常是不变的。在一些示例中,单元中的一个或多个单元可以是有区别的电路块(固定功能的或可编程的),以及在一些示例中,单元中的一个或多个单元可以是集成电路。
视频解码器300可以包括ALU、EFU、数字电路、模拟电路和/或从可编程的电路形成的可编程的内核。在对视频解码器300的操作是由可编程的电路上的软件执行的示例中,片上存储器或片外存储器可以存储视频解码器300接收和执行的软件的指令(例如,目标代码)。
熵解码单元302可以从CPB接收经编码的视频数据,以及对视频数据进行熵解码以再现语法元素。预测处理单元304、逆量化单元306、逆变换处理单元308、重构单元310和滤波器单元312可以基于从比特流提取的语法元素来生成经解码的视频数据。
一般而言,视频解码器300以逐块为基础来重构图片。视频解码器300可以个别地对每个块执行重构操作(其中当前正在重构的(即,经解码的)块可以称为“当前块”)。
熵解码单元302可以对定义经量化的变换系数块的经量化的变换系数的语法元素以及变换信息(比如量化参数(QP)和/或变换模式指示)进行熵解码。在一些示例中,视频解码器300可以根据BDPCM模式来进行操作,以及逆BDPCM单元307可以执行BDPCM处理。针对BDPCM模式的数据路径在图4中是利用虚线示出的。BDPCM模式应用于从熵解码单元302输出的系数。在图4的示例中,BDPCM模式是与变换跳过(TS)残差译码一起使用的。也就是说,视频解码器300当应用BDPCM模式时将绕过逆变换处理单元308。照此,在一些示例中,逆BDPCM单元307对空间域(例如,与频域相反)中的系数应用BDPCM处理。逆BDPCM单元307应用上文针对图3所描述的BDPCM过程的逆过程。
逆BDPCM单元307对在各自的BDPCM方向上的经量化的系数级别(例如,由熵解码单元302产生的系数)执行经量化的级别域预测。视频编码器200可以以信号发送具有指示在CU级别处的BDPCM模式的方向(例如,水平的/垂直的)的值的语法元素。视频解码器可以根据通过语法元素指示的模式来对亮度块和色度块两者应用BDPCM和TS残差译码。在一些示例中,代替应用BDPCM,逆BDPCM单元307可以被配置为应用经量化的残差域BDPCM(还命名为RDPCM),如上文参考图3所描述的。
根据本公开内容的技术,视频解码器300可以被配置为确定针对视频数据的块的基于块的增量脉冲译码调制(BDPCM)模式。帧内预测单元318可以基于针对视频数据的块的BDPCM模式来确定帧内预测模式。视频解码器300可以接着根据BDPCM模式和帧内预测模式来对视频数据的块进行解码。在一个示例中,BDPCM模式是水平的BDPCM模式。在该示例中,视频解码器300可以确定帧内预测模式是水平的帧内预测模式。在另一示例中,BDPCM模式是垂直的BDPCM模式。在该示例中,视频解码器300可以被配置为确定帧内预测模式是垂直的帧内预测模式。上文的技术可以是针对色度块和亮度块两者来应用的。
如下文将更详细地解释的,熵解码单元302可以对指示BDPCM模式(例如,垂直的或水平的)的第一语法元素进行解码。根据本公开内容的一个示例,熵解码单元302可以基于视频数据的块的颜色分量(例如,亮度或色度)来确定指示针对视频数据的块的BDPCM模式的语法元素的上下文,以及基于所确定的上下文来对指示BDPCM模式的语法元素进行熵解码。在一个示例中,上下文是针对不同的颜色分量而不同的。
逆量化单元306可以使用与经量化的变换系数块相关联的QP来确定量化的程度以及同样地针对逆量化单元306要应用的逆量化的程度。逆量化单元306可以例如执行逐比特左移操作以对经量化的变换系数进行逆量化。逆量化单元306可以从而形成包括变换系数的变换系数块。
在逆量化单元306形成变换系数块之后,逆变换处理单元308可以将一个或多个逆变换应用于变换系数块,以生成与当前块相关联的残差块。例如,逆变换处理单元308可以将逆DCT、逆整数变换、逆卡洛南-洛伊变换(KLT)、逆旋转变换、逆方向变换或另一逆变换应用于变换系数块。
此外,预测处理单元304根据由熵解码单元302进行熵解码的预测信息语法元素来生成预测块。例如,如果预测信息语法元素指示当前块是帧间预测的,则运动补偿单元316可以生成预测块。在这种情况下,预测信息语法元素可以指示要从其中取回参考块的DPB314中的参考图片,以及标识参考图片中的参考块相对于当前的图片中的当前块的位置的位置的运动矢量。运动补偿单元316通常可以以基本上类似于相对于运动补偿单元224(图3)所描述的方式来执行帧间预测过程。
举另一示例,如果预测信息语法元素指示当前块是帧内预测的,则帧内预测单元318可以根据通过预测信息语法元素指示的帧内预测模式来生成预测块。再一次地,帧内预测单元318通常可以以基本类似于相对于帧内预测单元226(图3)所描述的方式来执行帧内预测过程。帧内预测单元318可以从DPB 314取回到当前块的邻近的样本的数据。
重构单元310可以使用预测块和残差块来重构当前块。例如,重构单元310可以将残差块的样本增加到预测块的相应的样本中,以重构当前块。
滤波器单元312可以对重构的块执行一个或多个滤波器操作。例如,滤波器单元312可以执行解块操作以减少沿着重构的块的边缘的块效应伪像。滤波器单元312的操作不一定是在所有示例中执行的。例如,帧内预测单元318可以使用未滤波的块作为参考样本。
视频解码器300可以在DPB 314中存储重构的块。例如,在未执行对滤波器单元312的操作的示例中,重构单元310可以将重构的块存储到DPB 314。在执行对滤波器单元312的操作的示例中,滤波器单元312可以将经滤波的重构的块存储到DPB 314。如上文所讨论的,DPB 314可以向预测处理单元304提供参考信息,比如用于帧内预测的当前的图片和用于随后的运动补偿的先前地经解码的图片的样本。此外,视频解码器300可以从DPB 314输出经解码的图片(例如,经解码的视频)用于在显示设备(比如图1的显示设备118)上的随后的展示。
以这种方式,视频解码器300表示视频解码设备的示例,其包括被配置为存储视频数据的存储器以及一个或多个处理单元,所述一个或多个处理单元是在电路中实现的并且被配置为确定针对视频数据的块的基于块的增量脉冲译码调制(BDPCM)模式,基于针对视频数据的块的BDPCM模式来确定帧内预测模式,以及根据BDPCM模式和帧内预测模式来对视频数据的块进行解码。
如上文所描述的,本公开内容的技术与针对VVC的BDPCM译码有关。相应的熵编码过程(其是熵解码的反向过程)也是本公开内容的一部分(例如,视频解码器300可以执行本公开内容相对于视频编码器200所描述的的操作的互易的过程)。本公开内容的技术可以应用于类似于现在的视频编解码器中的任何视频编解码器的视频编解码器操作,比如对高效率视频译码(HEVC)的扩展、用于多功能视频译码(VVC)的编码工具和/或其它未来的视频译码标准。
在VVC草案6中提出将BDPCM模式用于VVC开发。BDPCM模式利用与DPCM译码组合的帧内样本的水平的预测或垂直的预测。在一些示例中,BDPCM译码可以是与变换跳过(TS)残差译码一起使用的。也就是说,变换处理是针对BDPCM经译码的块跳过的。在一个示例中,参照图3,BDPCM模式应用于由帧内预测单元226创建的残差样本,尽管BDPCM模式可以是与任何类型的残差样本一起使用的。照此,在一些示例中,BDPCM单元207对空间域(例如,与频域相反)中的残差样本应用BDPCM处理。
在一些示例中,量化单元208可以在由BDPCM单元207进行的BDPCM处理之前对残差样本进行量化。BDPCM单元207可以使用水平的预测方向(例如,水平的预测模式)或者垂直的预测方向(例如,垂直的预测模式)来对经量化的残差块进行编码。针对垂直的预测,帧内预测单元226使用顶部邻近的块的底部行的像素来执行对块的具有未滤波的预测器样本的第一水平行的垂直的帧内预测。同样地,针对水平的预测,帧内预测单元226使用左邻近的块的像素的最右边的列来执行对块的具有未滤波的预测器样本的第一垂直列的水平的帧内预测。
BDPCM单元207对在各自的BDPCM方向上的经量化的系数级别(例如,由帧内预测单元226产生的残差)执行经量化的级别域预测。视频编码器200可以以信号发送具有指示在CU级别处的BDPCM模式的方向(例如,水平的/垂直的)的值的语法元素。视频编码器200可以将BDPCM和TS残差译码应用于亮度块和色度块两者。逆BDPCM单元211可以在视频编码器200的重构环路中应用BDCPM单元207的逆过程(例如,参见图3中的虚线)。
在其它示例中,代替应用BDPCM,BDPCM单元207可以被配置为应用经量化的残差域BDPCM(还命名为RDPCM)。所使用的信令和预测方向可以与BPCM完全相同。帧内预测单元226可以通过在预测方向(水平的预测或垂直的预测)上的样本复制来对整个块执行帧内预测以创建残差。量化单元208对残差进行量化,以及BDPCM单元207对在经量化的残差与其预测器(水平的或垂直的)经量化的值之间的增量进行编码。
在VVC草案7中,BDPCM模式具有两种模式:垂直的和水平的。VVC的一些示例中的帧内预测模式是与BDPCM模式分开的,以及可以是66种不同的模式(例如,平面的、DC、水平的、垂直的或角度的模式)中的一种模式。本公开内容提出针对视频数据的亮度块和色度块两者来将帧内预测模式与相应的BDPCM模式对准。将帧内预测模式对准BDPCM模式可以改善针对视频数据的一些图片的译码效率。
在本公开内容的第一示例中,水平的BDPCM模式是与针对亮度块和色度块两者的水平的帧内预测方向(例如,帧内角度18)对准的。同样地,垂直的BDPCM模式是与针对亮度块和色度块两者的垂直的帧内预测方向(例如,帧内角度50)对准的。视频编码器200和视频解码器300可以被配置为将针对BDPCM经译码的块的对准的帧内预测模式增加到最可能模式(MPM)列表中。在其它示例中,视频编码器200和视频解码器300可以使用具有BDCPM经译码的块的平面模式或DC模式。视频编码器200和视频解码器300可以接着使用MPM列表中的帧内预测模式,来导出针对随后地经译码的块的帧内预测模式。这些模式可以用于导出针对未来的经译码的块的最可能模式(MPM)列表。
在本公开内容的上下文中,对准模式意指:如果BDPCM模式是水平的模式,则视频编码器200和视频解码器300可以被配置为将针对块的帧内预测模式设置为水平的帧内预测模式。同样地,如果BDPCM模式是垂直的模式,则视频编码器200和视频解码器300可以被配置为将针对块的帧内预测模式设置为垂直的帧内预测模式。这样的对准可以提供另外的译码增益。在BDPCM模式与帧内预测模式之间的这种对准修改MPM列表,使得未来的BDPCM经译码的块使用针对帧内预测模式的水平的模式或者垂直的模式。视频解码器300可以基于以信号发送的BDPCM索引(例如,指示BDPCM模式的方向的语法元素)来确定帧内预测模式。
在本公开内容的第二示例中,用于针对BDPCM的上下文自适应的二进制算术译码(CABAC)引擎(例如,图3的熵编码单元220或图4的熵解码单元302)的上下文推导过程是相对于VVC草案7来改变的。根据本公开内容的一个示例,视频编码器200和视频解码器300基于块级别信息来对指示BDPCM模式(例如,水平的模式或垂直的模式)的语法元素进行译码。
在一个示例中,视频编码器200和视频解码器300可以被配置为使用针对指示针对亮度颜色分量和色度颜色分量的BDPCM模式的语法元素的单独的上下文。例如,如果当前块是亮度块,那么视频编码器200和视频解码器300可以使用第一上下文集合(例如,上下文索引1和上下文索引2)用于对分别地指示垂直的BDPCM模式和水平的BDPCM模式的语法元素进行译码。如果当前块是色度块,那么视频编码器200和视频解码器300可以使用第二上下文集合(例如,上下文索引3和上下文索引4)用于对分别地指示垂直的BDPCM模式和水平的BDPCM模式的语法元素进行译码。第一上下文集合可以与第二上下文集合不同。
在本公开内容的第三示例中,上文所描述的模式对准和上下文技术可以是与常规的残差译码(还称为变换残差译码)一起使用的。也就是说,视频编码器200和视频解码器300可以使用变换和量化两者,而不是跳过变换过程(例如,在TS译码中)。在一些示例中,VVC中的BDPCM仅使用变换跳过(TS)残差译码,但是本公开内容的技术可以是与其它非TS残差译码方法一起使用的。
在本公开内容的第四示例中,上文所描述的示例技术的任何组合可以是针对无损译码使用的。在一个示例中,无损译码绕过变换和量化两者。在一个示例中,BDPCM可以与变换量化绕过(TQB)模式标记(例如,绕过变换和量化两者)一起使用(如在HEVC中),使得上文所描述的帧内预测推导、上下文推导和替代的残差译码方法可以当使用TQB模式时用于无损译码。
在另一示例中,高级别标记(例如,SPS、PPS、切片)或低级别标志(比如在变换单元(TU)级别或译码单元(CU)级别处)可以在有损译码和无损译码两者中使用,以在TS残差译码方法与非TS残差译码方法之间转变。本文所描述的先前的技术可以与这种类型的信令一起使用。
以下是本公开内容的示例技术。下文的技术可以是在任何组合中一起使用的。
视频编码器200和视频解码器300可以被配置为确定针对视频数据的块的基于块的增量脉冲译码调制(BDPCM)模式,基于针对视频数据的块的BDPCM模式来确定帧内预测模式,以及根据BDPCM模式和帧内预测模式来对视频数据的块进行译码。
在一个示例中,BDPCM模式是水平的BDPCM模式,以及为了确定帧内预测模式,视频编码器200和视频解码器300被配置为确定帧内预测模式是水平的帧内预测模式。
在另一示例中,BDPCM模式是垂直的BDPCM模式,以及为了确定帧内预测模式,视频编码器200和视频解码器300被配置为确定帧内预测模式是垂直的帧内预测模式。
在另一示例中,为了确定帧内预测模式,视频编码器200和视频解码器300被配置为确定帧内预测模式是平面模式或DC模式中的一者。
在另一示例中,视频编码器200和视频解码器300被配置为基于所确定的帧内预测模式来确定针对视频数据的第二块的最可能模式列表。
在另一示例中,视频编码器200和视频解码器300被配置为基于视频数据的块的颜色分量来确定针对基于块的增量脉冲译码调制(BDPCM)模式索引的上下文,以及基于所确定的上下文来对BDPCM模式索引进行熵译码。
在另一示例中,视频编码器200和视频解码器300被配置为使用变换跳过残差译码来对视频数据的块进行译码。
在另一示例中,视频编码器200和视频解码器300被配置为使用常规的残差译码来对视频数据的块进行译码。
在另一示例中,视频编码器200和视频解码器300被配置为使用无损译码模式来对视频数据的块进行译码。在一个示例中,无损译码模式是变换量化绕过模式。
在另一示例中,视频编码器200和视频解码器300被配置为对标记进行译码以及根据所述标记来对视频数据的块进行译码,所述标记指示变换跳过残差译码或常规的残差译码是否是在序列参数集、图片参数集、切片报头、译码单元或变换单元中的一者或多者中使用的。
图5是示出用于对当前块进行编码的示例方法的流程图。当前块可以包括当前的CU。虽然相对于视频编码器200进行了描述(图1和图3),但是应该理解的是,其它设备可以被配置为执行与图5的方法类似的方法。
在该示例中,视频编码器200最初预测当前块(350)。例如,视频编码器200可以形成针对当前块的预测块。视频编码器200可以接着计算针对当前块的残差块(352)。为了计算残差块,视频编码器200可以计算在初始的、未经编码的块与针对当前块的预测块之间的差。视频编码器200可以接着对残差块进行变换以及对残差块的变换系数进行量化(354)。紧接着,视频编码器200可以扫描残差块的经量化的变换系数(356)。在扫描期间或跟随在扫描之后,视频编码器200可以对变换系数进行熵编码(358)。例如,视频编码器200可以使用CAVLC或CABAC对变换系数进行编码。视频编码器200可以接着输出块的经熵编码的数据(360)。
图6是示出用于对视频数据的当前块进行解码的示例方法的流程图。当前块可以包括当前的CU。虽然相对于视频解码器300进行了描述(图1和图4),但是应该理解的是,其它设备可以被配置为执行与图6的方法类似的方法。
视频解码器300可以接收针对当前块的经熵编码的数据,比如经熵编码的预测信息和针对与当前块相对应的残差块的系数的经熵编码的数据(370)。视频解码器300可以对经熵编码的数据进行熵解码,以确定针对当前块的预测信息以及以再现残差块的系数(372)。视频解码器300可以例如使用如通过针对当前块的预测信息指示的帧内预测模式或帧间预测模式来预测当前块(374),以计算针对当前块的预测块。视频解码器300可以接着逆扫描所再现的系数(376),以创建经量化的变换系数的块。视频解码器300可以接着对变换系数进行逆量化和逆变换以产生残差块(378)。视频解码器300可以通过对预测块和残差块进行组合来最终地对当前块进行解码(380)。
图7是示出另一示例视频编码方法的流程图。图7的技术可以由视频编码器200的一个或多个结构性的组件来执行。
在本公开内容的一个示例中,视频编码器200可以被配置为确定针对视频数据的块的基于块的增量脉冲译码调制(BDPCM)模式(400),基于针对视频数据的块的BDPCM模式来确定帧内预测模式(402),以及根据BDPCM模式和帧内预测模式来对视频数据的块进行编码(404)。
在一个示例中,BDPCM模式是水平的BDPCM模式,以及为了确定帧内预测模式,视频编码器200被配置为确定帧内预测模式是水平的帧内预测模式。在另一示例中,BDPCM模式是垂直的BDPCM模式,以及为了确定帧内预测模式,视频编码器200被配置为确定帧内预测模式是垂直的帧内预测模式。在一个示例中,视频数据的块是视频数据的色度块。在另一示例中,视频数据的块是视频数据的亮度块。
在本公开内容的另一示例中,视频编码器200被配置为基于视频数据的块的颜色分量来确定针对指示针对视频数据的块的BDPCM模式的语法元素的上下文,以及对基于所确定的上下文来对指示BDPCM模式的语法元素进行熵编码。在一个示例中,上下文是针对不同的颜色分量而不同的。
在本公开内容的一个示例中,视频编码器200被配置为使用变换跳过残差编码来对视频数据的块进行编码。在另一示例中,视频编码器200被配置为使用常规的残差编码来对视频数据的块进行编码。在另一示例中,视频编码器200被配置为使用无损编码来对视频数据的块进行编码。
在本公开内容的另一示例中,帧内预测模式是第一帧内预测模式,以及视频编码器200被配置为基于第一帧内预测模式来确定针对视频数据的第二块的最可能模式列表,以及从最可能模式列表确定针对视频数据的第二块的第二帧内预测模式。
图8是示出另一示例视频解码方法的流程图。图8的技术可以由视频解码器300的一个或多个结构性的组件来执行。
在本公开内容的一个示例中,视频解码器300可以被配置为确定针对视频数据的块的基于块的增量脉冲译码调制(BDPCM)模式(450),基于针对视频数据的块的BDPCM模式来确定帧内预测模式(452),以及根据BDPCM模式和帧内预测模式来对视频数据的块进行解码(454)。
在一个示例中,BDPCM模式是水平的BDPCM模式,以及为了确定帧内预测模式,视频解码器300被配置为确定帧内预测模式是水平的帧内预测模式。在另一示例中,BDPCM模式是垂直的BDPCM模式,并且其中为了确定帧内预测模式,视频解码器300被配置为确定帧内预测模式是垂直的帧内预测模式。在一个示例中,视频数据的块是视频数据的色度块。在另一示例中,视频数据的块是视频数据的亮度块。
在本公开内容的另一示例中,视频解码器300被配置为基于视频数据的块的颜色分量来确定指示针对视频数据的块的BDPCM模式的语法元素的上下文,以及对基于所确定的上下文来对指示BDPCM模式的语法元素进行熵解码。在一个示例中,上下文是针对不同的颜色分量而不同的。
在本公开内容的一个示例中,视频解码器300被配置为使用变换跳过残差编码来对视频数据的块进行解码。在另一示例中,视频解码器300被配置为使用常规的残差编码来对视频数据的块进行解码。在另一示例中,视频解码器300被配置为使用无损编码来对视频数据的块进行解码。
在本公开内容的另一示例中,帧内预测模式是第一帧内预测模式,以及视频解码器300被配置为基于第一帧内预测模式来确定针对视频数据的第二块的最可能模式列表,以及从最可能模式列表确定针对视频数据的第二块的第二帧内预测模式。
条款1-一种对视频数据进行译码的方法,所述方法包括:确定针对视频数据的块的基于块的增量脉冲译码调制(BDPCM)模式;基于针对视频数据的块的BDPCM模式来确定帧内预测模式;以及根据BDPCM模式和帧内预测模式来对视频数据的块进行译码。
条款2-根据条款1所述的方法,其中,所述BDPCM模式是水平的BDPCM模式,并且其中,确定帧内预测模式包括:确定帧内预测模式是水平的帧内预测模式。
条款3-根据条款1所述的方法,其中,所述BDPCM模式是垂直的BDPCM模式,并且其中,确定帧内预测模式包括:确定帧内预测模式是垂直的帧内预测模式。
条款4-根据条款1所述的方法,其中,确定帧内预测模式包括:确定帧内预测模式是平面模式或DC模式中的一者。
条款5-根据条款1所述的方法,还包括:基于所确定的帧内预测模式来确定针对视频数据的第二块的最可能模式列表。
条款6-一种对视频数据进行译码的方法,所述方法包括:基于视频数据的块的颜色分量来确定针对基于块的增量脉冲译码调制(BDPCM)模式索引的上下文;以及基于所确定的上下文来对BDPCM模式索引进行熵译码。
条款7-根据条款1-条款6所述的任何组合的方法。
条款8-根据条款1-条款7所述的任何组合的方法,还包括:使用变换跳过残差译码来对视频数据的块进行译码。
条款9-根据条款1-条款7所述的任何组合的方法,还包括:使用常规的残差译码来对视频数据的块进行译码。
条款10-根据条款1-条款7所述的任何组合的方法,还包括:使用无损译码模式来对视频数据的块进行译码。
条款11-根据条款10所述的方法,其中,无损译码模式是变换量化绕过模式。
条款12-根据条款1-条款11所述的任何组合的方法,还包括:对标记进行译码,所述标记指示变换跳过残差译码或常规的残差译码是否是在序列参数集、图片参数集、切片报头、译码单元或变换单元中的一者或多者中使用的;以及根据所述标记来对视频数据的块进行译码。
条款13-根据条款1-条款12所述的方法,其中,译码包括解码。
条款14-根据条款1-条款13所述的方法,其中,译码包括编码。
条款15-一种对视频数据进行译码的设备,所述设备包括用于执行条款1-条款14中的任何条款的方法的一个或多个单元。
条款16-根据条款15所述的设备,其中,所述一个或多个单元包括在电路中实现的一个或多个处理器。
条款17-根据条款15和条款16中的任何条款所述的设备,还包括存储器以存储视频数据。
条款18-根据条款15-条款17中的任何条款所述的设备,还包括显示器,所述显示器被配置为显示经解码的视频数据。
条款19-根据条款15-条款18中的任何条款所述的设备,其中,所述设备包括照相机、计算机、移动设备、广播接收机设备或机顶盒中的一者或多者。
条款20-根据条款15-条款19中的任何条款所述的设备,其中,所述设备包括视频解码器。
条款21-根据条款15-条款20中的任何条款所述的设备,其中,所述设备包括视频编码器。
条款22-一种计算机可读存储介质,其已经在其上存储的指令,所述指令当执行时,使得一个或多个处理器执行条款1-条款14中的任何条款的方法。
要认识的是,取决于示例,本文所描述的技术中的任何技术的某些行为或事件可以是以不同的序列来执行的,可以是一起添加的、合并的或忽视的(例如,不是全部所描述的行为或事件是用于对技术的实践所必要的)。此外,在某些示例中,动作或事件可以是同时地执行的,例如,通过多线程处理、中断处理或多个处理器,而不是顺序地执行。
在一个或多个示例中,所描述的功能可以在硬件、软件、固件或其任意组合中实现。如果在软件中实现,则所述功能可以作为一个或多个指令或代码存储在计算机可读介质中或者通过计算机可读介质进行发送,以及由基于硬件的处理单元来执行。计算机可读介质可以包括计算机可读存储介质,所述计算机可读存储介质对应于有形的介质(比如数据存储介质)、或包括例如根据通信协议促进对从一个地方到另一地方的计算机程序的传送的任何介质的通信介质。以所述方式,计算机可读介质通常可以对应于(1)非暂时性的有形的计算机可读存储介质或(2)比如信号或载波的通信介质。数据存储介质可以是可以由一个或多个计算机或者一个或多个处理器存取的任何可用的介质,以取回用于对本公开内容所描述的技术的实现方式的指令、代码和/或数据结构。计算机程序产品可以包括计算机可读介质。
通过举例而非限制性的方式,这样的计算机可读存储介质可以包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁存储设备、闪存存储器或者可以用于以指令或数据结构的形式存储合意的程序代码以及可以由计算机来存取的任何其它的介质。此外,任何连接适当地称为计算机可读介质。例如,如果使用同轴电缆、光纤光缆、双绞线、数字用户线(DSL)或无线技术(比如红外线、无线电和微波)从网站、服务器或其它远程源来发送指令,那么同轴电缆、光纤光缆、双绞线、DSL或无线技术(比如红外线、无线电和微波)是包括在对介质的定义中的。然而,应当理解的是,计算机可读存储介质和数据存储介质不包括连接、载波、信号或其它暂时性的介质,但是反而针对非暂时性的、有形的存储介质。如本文所使用的,磁盘和光盘包括压缩光盘(CD)、激光光盘、光盘、数字多功能光盘(DVD)、软盘和蓝光光盘,其中磁盘通常磁性地再现数据,而光盘则通常利用激光来光学地再现数据。上述的组合还应当是包括在计算机可读介质的范围内的。
指令可以由一个或多个处理器来执行,比如一个或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、或其它等效的集成的逻辑电路或分立的逻辑电路。因此,如本文所使用的术语“处理器”和“处理电路”可以指的是前述的结构中的任何结构或者适合用于本文所描述的技术的实现方式的任何其它结构。此外,在一些方面中,本文所描述的功能可以在被配置用于编码和解码的专用硬件模块和/或软件模块内提供,或者合并到组合的视频编解码器中。此外,所述技术可以是在一个或多个电路或逻辑元件中充分地实现的。
本公开内容的技术可以是在各种各样设备或装置中实现的,所述设备或装置包括无线手机、集成电路(IC)或IC的集合(例如,芯片集)。各种组件、模块或单元是在本公开内容中描述的,以强调被配置为执行所公开的技术的设备的功能性方面,但是不一定要求由不同的硬件单元来实现。而是,如上文所描述的,各种单元可以是在视频编解码器硬件单元中组合的,或者通过与合适的软件和/或固件协力的一批互操作的硬件单元(包括如上文所描述的一个或多个处理器)来提供的。
已经描述各种示例。这些示例和其它示例在以下权利要求书的范围内。

Claims (38)

1.一种对视频数据进行解码的方法,所述方法包括:
确定针对视频数据的块的基于块的增量脉冲译码调制(BDPCM)模式;
基于针对所述视频数据的块的所述BDPCM模式来确定帧内预测模式;以及
根据所述BDPCM模式和所述帧内预测模式来对所述视频数据的块进行解码。
2.根据权利要求1所述的方法,其中,所述BDPCM模式是水平的BDPCM模式,并且其中,确定所述帧内预测模式包括:
确定所述帧内预测模式是水平的帧内预测模式。
3.根据权利要求1所述的方法,其中,所述BDPCM模式是垂直的BDPCM模式,并且其中,确定所述帧内预测模式包括:
确定所述帧内预测模式是垂直的帧内预测模式。
4.根据权利要求1所述的方法,其中,所述视频数据的块是视频数据的色度块。
5.根据权利要求1所述的方法,其中,所述视频数据的块是视频数据的亮度块。
6.根据权利要求1所述的方法,还包括:
基于所述视频数据的块的颜色分量,来确定针对指示针对所述视频数据的块的所述BDPCM模式的语法元素的上下文;以及
基于所确定的上下文来对指示所述BDPCM模式的所述语法元素进行熵解码。
7.根据权利要求6所述的方法,其中,所述上下文是针对不同的颜色分量而不同的。
8.根据权利要求1所述的方法,还包括:
使用变换跳过残差解码来对所述视频数据的块进行解码。
9.根据权利要求1所述的方法,还包括:
使用常规的残差解码来对所述视频数据的块进行解码。
10.根据权利要求1所述的方法,还包括:
使用无损解码来对所述视频数据的块进行解码。
11.根据权利要求1所述的方法,其中,所述帧内预测模式是第一帧内预测模式,所述方法还包括:
基于所述第一帧内预测模式来确定针对视频数据的第二块的最可能模式列表;以及
从所述最可能模式列表确定针对所述视频数据的第二块的第二帧内预测模式。
12.根据权利要求1的方法,还包括:
显示包括所解码的视频数据的块的图片。
13.一种被配置为对视频数据进行解码的装置,所述装置包括:
存储器,其被配置为存储视频数据的块;以及
一个或多个处理器,其与所述存储器相通信,所述一个或多个处理器被配置为进行以下操作:
确定针对所述视频数据的块的基于块的增量脉冲译码调制(BDPCM)模式;
基于针对所述视频数据的块的所述BDPCM模式来确定帧内预测模式;以及
根据所述BDPCM模式和所述帧内预测模式来对所述视频数据的块进行解码。
14.根据权利要求13所述的装置,其中,所述BDPCM模式是水平的BDPCM模式,并且其中,为了确定所述帧内预测模式,所述一个或多个处理器还被配置为:
确定所述帧内预测模式是水平的帧内预测模式。
15.根据权利要求13所述的装置,其中,所述BDPCM模式是垂直的BDPCM模式,并且其中,为了确定所述帧内预测模式,所述一个或多个处理器还被配置为:
确定所述帧内预测模式是垂直的帧内预测模式。
16.根据权利要求13所述的装置,其中,所述视频数据的块是视频数据的色度块。
17.根据权利要求13所述的装置,其中,所述视频数据的块是视频数据的亮度块。
18.根据权利要求13所述的装置,其中,所述一个或多个处理器还被配置为:
基于所述视频数据的块的颜色分量,来确定针对指示针对所述视频数据的块的所述BDPCM模式的语法元素的上下文;以及
基于所确定的上下文来对指示所述BDPCM模式的所述语法元素进行熵解码。
19.根据权利要求18所述的装置,其中,所述上下文是针对不同的颜色分量而不同的。
20.根据权利要求13所述的装置,其中,所述一个或多个处理器还被配置为:
使用变换跳过残差解码来对所述视频数据的块进行解码。
21.根据权利要求13所述的装置,其中,所述一个或多个处理器还被配置为:
使用常规的残差解码来对所述视频数据的块进行解码。
22.根据权利要求13所述的装置,其中,所述一个或多个处理器还被配置为:
使用无损解码来对所述视频数据的块进行解码。
23.根据权利要求13所述的装置,其中,所述帧内预测模式是第一帧内预测模式,并且其中,所述一个或多个处理器还被配置为进行以下操作:
基于所述第一帧内预测模式来确定针对视频数据的第二块的最可能模式列表;以及
从所述最可能模式列表确定针对所述视频数据的第二块的第二帧内预测模式。
24.根据权利要求13所述的装置,还包括:
显示器,其被配置为显示包括所解码的视频数据的块的图片。
25.一种被配置为对视频数据进行解码的装置,所述装置包括:
用于确定针对视频数据的块的基于块的增量脉冲译码调制(BDPCM)模式的单元;
用于基于针对所述视频数据的块的所述BDPCM模式来确定帧内预测模式的单元;以及
用于根据所述BDPCM模式和所述帧内预测模式来对所述视频数据的块进行解码的单元。
26.一种存储指令的非暂时性计算机可读存储介质,所述指令当执行时,使得被配置为对视频数据进行解码的设备的一个或多个处理器进行以下操作:
确定针对视频数据的块的基于块的增量脉冲译码调制(BDPCM)模式;
基于针对所述视频数据的块的所述BDPCM模式来确定帧内预测模式;以及
根据所述BDPCM模式和所述帧内预测模式来对所述视频数据的块进行解码。
27.一种被配置为对视频数据进行编码的装置,所述装置包括:
存储器,其被配置为存储视频数据的块;以及
一个或多个处理器,其与所述存储器相通信,所述一个或多个处理器被配置为进行以下操作:
确定针对所述视频数据的块的基于块的增量脉冲译码调制(BDPCM)模式;
基于针对所述视频数据的块的所述BDPCM模式来确定帧内预测模式;以及
根据所述BDPCM模式和所述帧内预测模式来对所述视频数据的块进行编码。
28.根据权利要求27所述的装置,其中,所述BDPCM模式是水平的BDPCM模式,并且其中,为了确定所述帧内预测模式,所述一个或多个处理器还被配置为:
确定所述帧内预测模式是水平的帧内预测模式。
29.根据权利要求27所述的装置,其中,所述BDPCM模式是垂直的BDPCM模式,并且其中,为了确定所述帧内预测模式,所述一个或多个处理器还被配置为:
确定所述帧内预测模式是垂直的帧内预测模式。
30.根据权利要求27所述的装置,其中,所述视频数据的块是视频数据的色度块。
31.根据权利要求27所述的装置,其中,所述视频数据的块是视频数据的亮度块。
32.根据权利要求27所述的装置,其中,所述一个或多个处理器还被配置为:
基于所述视频数据的块的颜色分量,来确定针对指示针对所述视频数据的块的所述BDPCM模式的语法元素的上下文;以及
基于所确定的上下文来对指示所述BDPCM模式的所述语法元素进行熵编码。
33.根据权利要求32所述的装置,其中,所述上下文是针对不同的颜色分量而不同的。
34.根据权利要求27所述的装置,其中,所述一个或多个处理器还被配置为:
使用变换跳过残差编码来对所述视频数据的块进行编码。
35.根据权利要求27所述的装置,其中,所述一个或多个处理器还被配置为:
使用常规的残差编码来对所述视频数据的块进行编码。
36.根据权利要求27所述的装置,其中,所述一个或多个处理器还被配置为:
使用无损编码来对所述视频数据的块进行编码。
37.根据权利要求27所述的装置,其中,所述帧内预测模式是第一帧内预测模式,并且其中,所述一个或多个处理器还被配置为:
基于所述第一帧内预测模式来确定针对视频数据的第二块的最可能模式列表;以及
从所述最可能模式列表确定针对所述视频数据的第二块的第二帧内预测模式。
38.根据权利要求27所述的装置,还包括:
照相机,其被配置为捕捉包括所述视频数据的块的图片。
CN202080085203.9A 2019-12-27 2020-12-21 推断bdpcm经译码的块中的帧内译码模式 Pending CN114830649A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962954149P 2019-12-27 2019-12-27
US62/954,149 2019-12-27
US17/126,585 US11368715B2 (en) 2019-12-27 2020-12-18 Block-based delta pulse code modulation for video coding
US17/126,585 2020-12-18
PCT/US2020/066419 WO2021133731A1 (en) 2019-12-27 2020-12-21 Inferring intra coding mode in bdpcm coded block

Publications (1)

Publication Number Publication Date
CN114830649A true CN114830649A (zh) 2022-07-29

Family

ID=76546761

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080085203.9A Pending CN114830649A (zh) 2019-12-27 2020-12-21 推断bdpcm经译码的块中的帧内译码模式

Country Status (5)

Country Link
US (1) US11368715B2 (zh)
EP (1) EP4082191A1 (zh)
CN (1) CN114830649A (zh)
TW (1) TW202133612A (zh)
WO (1) WO2021133731A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114097231A (zh) * 2019-05-22 2022-02-25 Lg电子株式会社 图像编码系统中使用bdpcm来解码图像的方法及装置
JP7469480B2 (ja) * 2020-01-10 2024-04-16 エルジー エレクトロニクス インコーポレイティド ルマ成分及びクロマ成分に対するbdpcmに基づく画像デコード方法及びその装置
US11770535B2 (en) * 2021-02-19 2023-09-26 Samsung Display Co., Ltd. Systems and methods for joint color channel entropy encoding with positive reconstruction error
WO2023090932A1 (ko) * 2021-11-18 2023-05-25 엘지전자 주식회사 영상 인코딩/디코딩 방법 및 장치, 그리고 비트스트림을 저장한 기록 매체

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107071420B (zh) 2012-04-13 2021-07-16 佳能株式会社 视频数据的变换单位的子集的编解码的方法、设备和系统
EP2860973B1 (en) 2012-06-08 2020-03-04 Sun Patent Trust Image encoding method, image decoding method, image encoding device, image decoding device, and image encoding and decoding device
US10003793B2 (en) * 2012-10-01 2018-06-19 Google Technology Holdings LLC Processing of pulse code modulation (PCM) parameters

Also Published As

Publication number Publication date
EP4082191A1 (en) 2022-11-02
WO2021133731A1 (en) 2021-07-01
US11368715B2 (en) 2022-06-21
TW202133612A (zh) 2021-09-01
US20210203985A1 (en) 2021-07-01

Similar Documents

Publication Publication Date Title
CN114731417B (zh) 交叉分量自适应环路滤波器
CN113853784B (zh) 用于视频译码的多个自适应环路滤波器集合的方法和装置
CN113940069A (zh) 用于视频译码中的低频不可分离变换的变换和最后有效系数位置信令
CN114009026A (zh) 视频译码中的色度量化参数偏移的块级信令
CN113812148A (zh) 用于视频译码的参考图片重采样和帧间译码工具
CN114080802A (zh) 用于视频译码中的变换跳过模式和调色板模式的最小允许量化参数
CN114258675A (zh) 用于视频编码的跨分量自适应环路滤波
EP4052466A1 (en) Merge estimation region for multi-type-tree block structure
CN113557734A (zh) 视频译码中的系数域块差分脉冲译码调制
US11368715B2 (en) Block-based delta pulse code modulation for video coding
CN113924776A (zh) 使用不同的色度格式的具有未经滤波的参考样本的视频译码
CN114868387B (zh) 在进行视频译码时对块的色度变换跳过和联合色度译码启用
CN114424566A (zh) 视频译码中用于联合色度残差模式的量化参数信令
CN113632466A (zh) 视频数据的帧间-帧内预测模式
EP3935840A2 (en) Simplification of sub-block transforms in video coding
CN114846796A (zh) 用于视频译码中的参考图片重采样的环绕偏移
CN116158080A (zh) 多个自适应环路滤波器集合
CN113940063A (zh) 解码图片缓冲器索引
CN114846801A (zh) 基于色度变换跳过的用于色度的lfnst信令
CN114175643A (zh) 调色板和预测模式信令
EP4186235A1 (en) Deblocking filter parameter signaling
KR20220115974A (ko) 비디오 코딩을 위한 다중 변환 세트 시그널링
WO2021061731A1 (en) Mode dependent block partition for lossless and mixed lossless and lossy video coding
KR20220073755A (ko) 비디오 코딩을 위한 변환 스킵에서 잔차 값들을 위한 코딩 스킴 시그널링
CN113994675A (zh) 用于bdpcm模式的最大允许块大小

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination