CN117426092A - 用于在视频编码的帧内预测模式下确定色度样本的系统和方法 - Google Patents

用于在视频编码的帧内预测模式下确定色度样本的系统和方法 Download PDF

Info

Publication number
CN117426092A
CN117426092A CN202380011059.8A CN202380011059A CN117426092A CN 117426092 A CN117426092 A CN 117426092A CN 202380011059 A CN202380011059 A CN 202380011059A CN 117426092 A CN117426092 A CN 117426092A
Authority
CN
China
Prior art keywords
sample
luminance
samples
luma
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202380011059.8A
Other languages
English (en)
Inventor
夜静
赵欣
赵亮
刘杉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent America LLC
Original Assignee
Tencent America LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent America LLC filed Critical Tencent America LLC
Publication of CN117426092A publication Critical patent/CN117426092A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本文描述的各种实现方式包括用于对视频进行译码(例如,对视频数据进行解码)的方法和系统。在一个方面,该方法包括在当前帧中识别当前编码块和一个或更多个相邻编码块。当前编码块具有第一亮度样本。该方法还包括针对第一亮度样本识别一个或更多个相邻编码块内的多个候选亮度样本。一个或更多个相邻编码块以4:2:0色度色彩格式被编码。该方法还包括在多个候选亮度样本中识别包括2×2亮度块的目标亮度样本,并且基于与一个或更多个相邻编码块中的目标亮度样本共位置的目标色度样本来确定与第一亮度样本共位置的第一色度样本。

Description

用于在视频编码的帧内预测模式下确定色度样本的系统和 方法
相关申请
本申请要求于2022年5月17日提交的题为“Chroma from Luma IntraPredictionMode Complexity Reduction”的美国临时专利申请第63/343,024号的优先权,并且本申请是于2023年5月2日提交的题为“Systems and Methods for DeterminingChroma Samples in an Intra Prediction Mode of Video Coding”的美国专利申请第18/142,414号的延续并且要求该美国专利申请的优先权,上述申请的全部内容通过引用并入本文。
技术领域
所公开的实施方式总体上涉及视频编码,包括但不限于用于在视频数据的帧内预测中基于一个或更多个相邻编码块的色度样本来确定编码块中的色度样本的系统和方法。
背景技术
数字视频由各种电子设备支持,所述电子设备例如数字电视、膝上型计算机或台式计算机、平板计算机、数码摄像机、数字记录设备、数字媒体播放器、视频游戏控制台、智能手机、视频电话会议设备、视频流式传输设备等。电子设备通过通信网络发送和接收或以其他方式传送数字视频数据,以及/或者将数字视频数据存储在存储设备上。由于通信网络的有限带宽容量和存储设备的有限存储器资源,可以使用视频编码以在传送或存储视频数据之前根据一个或更多个视频编码标准来压缩视频数据。
已经开发了多种视频编解码器标准。例如,视频编码标准包括AOMedia Video 1(AOMedia Video 1,AV1)、通用视频编码(Versatile Video Coding,VVC)、联合探索测试模型(Joint Explorationtest Model,JEM)、高效视频编码(High-Efficiency VideoCoding,HEVC/H.265)、高级视频编码(Advanced Video Coding,AVC/H.264)和运动图片专家组(Moving Picture Expert Group,MPEG)编码。视频编码通常使用利用视频数据中固有的冗余的预测方法(例如,帧间预测、帧内预测等)。视频编码旨在将视频数据压缩成使用较低比特率的形式,同时避免或最小化视频质量的降级。
HEVC(也称为H.265)是被设计为MPEG-H项目的一部分的视频压缩标准。ITU-T和ISO/IEC在2013年(第1版)、2014年(第2版)、2015年(第3版)、2016年(第4版)发布了HEVC/H.265标准。通用视频编码(VVC)(也称为H.266)是旨在作为HEVC的继任者的视频压缩标准。ITU-T和ISO/IEC在2020年(第1版)和2022年(第2版)发布了VVC/H.266标准。AV1是被设计为HEVC的替选的开放式视频编码格式。在2019年1月8日,发布了该规范的具有勘误表1的验证版本1.0.0。
发明内容
如上面所提及的,编码(压缩)降低了带宽和/或存储空间要求。如后面详细描述的,可以采用无损压缩和有损压缩。无损压缩是指可以从经压缩的原始信号中经由解码过程重建原始信号的精确副本的技术。有损压缩是指原始视频信息在编码期间没有完全保留并且在解码期间也不能完全恢复的编码/解码过程。当使用有损压缩时,重建信号可能与原始信号不相同,但是原始信号与重建信号之间的失真足够小,以使得重建信号对于预期应用有用。容许的失真量取决于应用。例如,某些消费者视频流式传输应用的用户可以比电影或电视广播应用的用户容忍更高的失真。可以选择或调整特定编码算法可实现的压缩比以反映各种失真容限:较高的可容忍的失真通常允许产生较高的损失和较高的压缩比的编码算法。
本公开内容描述了在视频编码的帧内预测模式下基于一个或更多个相邻编码块的色度样本来确定当前编码块中的色度样本。在与从亮度预测色度(chroma from luma,CfL)模式相关联的一些实施方式中,当前编码块的色度样本例如基于线性关系根据共位置的亮度样本来预测,而共位置的亮度样本的相邻样本不用于确定当前编码块的色度样本。换句话说,CfL通常是指如下编码工具,该编码工具通过对亮度像素实施线性模型,基于亮度平面中的先前编码信息来预测色度平面中的信息。另外,在本申请的一些实施方式中,针对当前编码块中的亮度样本在一个或更多个相邻编码块中识别目标亮度样本,并且应用与一个或更多个相邻编码块中的目标亮度样本共位置的目标色度样本来确定与当前编码块中的色度样本共位置的色度样本。通过这些手段,基于相邻编码块的目标色度样本来确定当前编码块的色度样本,而不依赖于当前编码块的亮度样本与色度样本之间的线性关系,从而有助于在视频编码期间节省计算和存储资源。
根据一些实施方式,提供了一种视频译码(例如,视频编码)的方法。该方法包括在当前帧中识别当前编码块和一个或更多个相邻编码块。当前编码块具有第一亮度样本。该方法还包括针对第一亮度样本识别一个或更多个相邻编码块内的多个候选亮度样本。一个或更多个相邻编码块以4:2:0色度色彩格式被编码。该方法还包括:在多个候选亮度样本中识别一个目标亮度样本,并且基于与一个或更多个相邻编码块中的目标亮度样本共位置的目标色度样本来确定与第一亮度样本共位置的第一色度样本。目标亮度样本包括2×2亮度块。
根据一些实施方式,提供了一种计算系统,例如流式传输系统、服务器系统、个人计算机系统或其他电子设备。该计算系统包括控制电路系统和存储一个或更多个指令集的存储器。一个或更多个指令集包括用于执行本文描述的方法中的任何方法的指令。在一些实施方式中,计算系统包括编码器部件和/或解码器部件。
根据一些实施方式,提供了一种非暂态计算机可读存储介质。非暂态计算机可读存储介质存储由计算系统执行的一个或更多个指令集。一个或更多个指令集包括用于执行本文描述的方法中的任何方法的指令。
因此,公开了利用用于对视频进行译码的方法的设备和系统。这样的方法、设备和系统可以补充或替代用于对视频进行译码的常规方法、设备和系统。
说明书中描述的特征和优点并不一定全部包括在内,并且特别地,鉴于本公开内容中提供的附图、说明书和权利要求书,一些附加的特征和优点对于本领域普通技术人员而言将是明显的。此外,应当注意,本说明书中使用的语言主要是出于可读性和指导目的而选择的,而并非是为了描绘或限制本文描述的主题而选择的。
附图说明
为了可以更详细地理解本公开内容,可以通过参考各种实施方式的特征来进行更具体的描述,其中在附图中示出了各种实施方式的特征中的一些。然而,附图仅示出了本公开内容的相关特征,并且因此并非被认为是限制性的,因为本领域技术人员在阅读本公开内容后将会理解,描述可以允许其他有效特征。
图1是根据一些实施方式的示例通信系统的框图。
图2A是示出根据一些实施方式的编码器部件的示例元件的框图。
图2B是示出根据一些实施方式的解码器部件的示例元件的框图。
图3是根据一些实施方式的示例服务器系统的框图。
图4A是根据一些实施方式的包括与位于一个或更多个相邻编码块中的候选亮度样本相关联的多个亮度样本的示例当前编码块,以及图4B是根据一些实施方式的与当前编码块400中的多个亮度样本共位置的多个色度样本。
图5至图7是根据一些实施方式的各自与根据一些实施方式的不同的预定义样本选择策略相对应的三个示例当前编码块。
图8A是根据一些实施方式的与位于一个或更多个相邻编码块中的基于位置的候选亮度样本404相对应的示例当前编码块,以及图8B是根据一些实施方式的图8A中的当前编码块中的多个色度样本。
图9A是根据一些实施方式的与位于一个或更多个相邻编码块中的基于位置的候选亮度样本相对应的另一示例当前编码块,以及图9B是根据一些实施方式的图9A中的当前编码块中的多个色度样本。
图10是根据一些实施方式的其中示例当前编码块与相邻编码块的相邻样本紧邻的块环境。
图11示出了根据一些实施方式的应用于当前帧的当前编码块400和一个或更多个相邻编码块的子采样亮度样本的色度子采样方案。
图12是根据一些实施方式的对视频进行编码的方法的流程图。
根据惯例,附图中所示的各种特征不一定按比例绘制,并且在整个说明书和附图中,相同的附图标记可以用于表示相同的特征。
具体实施方式
本公开内容描述了在视频编码的帧内预测模式下基于一个或更多个相邻编码块的色度样本来确定当前编码块中的色度样本。针对当前编码块的亮度样本在一个或更多个相邻编码块中识别目标亮度样本,并且应用与一个或更多个相邻编码块中的目标亮度样本共位置的目标色度样本来确定与当前编码块中的色度样本共位置的色度样本。这样,基于相邻编码块的目标色度样本来确定当前编码块的色度样本,而不在当前编码块的亮度样本和色度样本上实现线性关系,这有助于在视频编码期间节省计算和存储资源。
图1是示出根据一些实施方式的通信系统100的框图。通信系统100包括经由一个或更多个网络彼此通信耦接的源设备102和多个电子设备120(例如,电子设备120-1至电子设备120-m)。在一些实施方式中,通信系统100是流式传输系统,例如用于与启用视频的应用(例如视频会议应用、数字电视应用和媒体存储和/或分发应用)一起使用。
源设备102包括视频源104(例如,摄像机部件或媒体存储装置)和编码器部件106。在一些实施方式中,视频源104是数码摄像机(例如,被配置成创建未经压缩的视频样本流)。编码器部件106从视频流生成一个或更多个编码视频比特流。与编码器部件106生成的编码视频比特流108相比,来自视频源104的视频流可能是高数据量的。因为与来自视频源的视频流相比,编码视频比特流108具有较低的数据量(较少的数据),所以与来自视频源104的视频流相比,编码视频比特流108需要较少的带宽来传输,并且需要较少的存储空间来存储。在一些实施方式中,源设备102不包括编码器部件106(例如,被配置成向网络110传输未经压缩的视频数据)。
一个或更多个网络110表示在源设备102、服务器系统112和/或电子设备120之间传送信息的任意数量的网络,包括例如有线(连线的)和/或无线通信网络。一个或更多个网络110可以在电路交换信道和/或分组交换信道中交换数据。代表性的网络包括电信网络、局域网、广域网和/或因特网。
一个或更多个网络110包括服务器系统112(例如,分布式/云计算系统)。在一些实施方式中,服务器系统112是流式传输服务器(例如,其被配置成存储和/或分发视频内容,例如来自源设备102的编码视频流)或者包括流式传输服务器。服务器系统112包括译码器部件114(例如,其被配置成对视频数据进行编码和/或解码)。在一些实施方式中,译码器部件114包括编码器部件和/或解码器部件。在各种实施方式中,译码器部件114被实例化为硬件、软件或其组合。在一些实施方式中,译码器部件114被配置成对编码视频比特流108进行解码,并使用不同的编码标准和/或方法对视频数据进行重新编码,以生成编码视频数据116。在一些实施方式中,服务器系统112被配置成从编码视频比特流108生成多种视频格式和/或编码。
在一些实施方式中,服务器系统112用作媒体感知网络元件(Media-AwareNetwork Element,MANE)。例如,服务器系统112可以被配置成修剪编码视频比特流108,以为电子设备120中的一个或更多个定制可能不同的比特流。在一些实施方式中,MANE与服务器系统112分开提供。
电子设备120-1包括解码器部件122和显示器124。在一些实施方式中,解码器部件122被配置成对编码视频数据116进行解码以生成可以在显示器或其他类型的呈现设备上呈现的传出视频流。在一些实施方式中,电子设备120中的一个或更多个不包括显示部件(例如,通信地耦接至外部显示设备以及/或者包括媒体存储装置)。在一些实施方式中,电子设备120是流式传输客户端。在一些实施方式中,电子设备120被配置成访问服务器系统112以获得编码视频数据116。
源设备和/或多个电子设备120有时被称为“终端设备”或“用户设备”。在一些实施方式中,源设备102和/或电子设备120中的一个或更多个是服务器系统、个人计算机、便携式设备(例如,智能手机、平板电脑或膝上型电脑)、可穿戴设备、视频会议设备和/或其他类型的电子设备的实例。
在通信系统100的示例操作中,源设备102将编码视频比特流108传输至服务器系统112。例如,源设备102可以对由源设备捕获的图片流进行编码。服务器系统112接收编码视频比特流108,并且可以使用译码器部件114对编码视频比特流108进行解码和/或编码。例如,服务器系统112可以对视频数据应用对于网络传输和/或存储而言更优化的编码。服务器系统112可以将编码视频数据116(例如,一个或更多个编码视频比特流)传输至电子设备120中的一个或更多个。每个电子设备120可以对编码视频数据116进行解码,以恢复视频图片并可选地显示视频图片。
在一些实施方式中,上面讨论的传输是单向数据传输。单向数据传输有时用于媒体服务应用等。在一些实施方式中,上面讨论的传输是双向数据传输。双向数据传输有时用于视频会议应用等。在一些实施方式中,根据本文描述的任何视频编码/压缩标准(例如HEVC、VVC和/或AV1)对编码视频比特流108和/或编码视频数据116进行编码和/或解码。
图2A是示出根据一些实施方式的编码器部件106的示例元件的框图。编码器部件106从视频源104接收源视频序列。在一些实施方式中,编码器部件包括被配置成接收源视频序列的接收器(例如,收发器)部件。在一些实施方式中,编码器部件106从远程视频源(例如,作为与编码器部件106不同的设备的部件的视频源)接收视频序列。视频源104可以提供呈数字视频样本流形式的源视频序列,该数字视频样本流可以具有任何合适的比特深度(例如,8比特、10比特或12比特)、任何色彩空间(例如,BT.601Y CrCb或RGB)以及任何合适的采样结构(例如,Y CrCb 4:2:0或Y CrCb 4:4:4)。在一些实施方式中,视频源104是存储先前捕获/准备的视频的存储设备。在一些实施方式中,视频源104是捕获本地图像信息作为视频序列的摄像机。可以将视频数据提供为在按次序观看时被赋予运动的多个单独的图片。图片自身可以被组织为像素的空间阵列,其中取决于所使用的采样结构、色彩空间等,每个像素可以包括一个或更多个样本。本领域技术人员可以容易理解像素与样本之间的关系。以下描述集中在样本上。
编码器部件106被配置成实时地或在应用所需的其他时间约束下,将源视频序列的图片编码和/或压缩为编码视频序列216。施行适当的编码速度是控制器204的一个功能。在一些实施方式中,控制器204控制如下所述的其他功能单元并且在功能上耦接至其他功能单元。由控制器204设置的参数可以包括速率控制相关参数(图片跳过、量化器和/或率失真优化技术的λ值等)、图片大小、图片群组(Group of Pictures,GOP)布局、最大运动矢量搜索范围等。本领域普通技术人员可以容易地识别控制器204的其他功能,因为这些功能可能涉及针对特定系统设计被优化的编码器部件106。
在一些实施方式中,编码器部件106被配置成以编码环路操作。在简化的示例中,编码环路包括源编码器202(例如,负责基于要编码的输入图片和参考图片来创建符号,例如符号流)和(本地)解码器210。解码器210以与(远程)解码器类似的方式重建符号以创建样本数据(在符号与编码视频比特流之间的压缩是无损的情况下)。将重建的样本流(样本数据)输入到参考图片存储器208。由于符号流的解码产生与解码器位置(本地或远程)无关的比特精确结果,因此参考图片存储器208中的内容在本地编码器与远程编码器之间也是比特精确的。以这种方式,编码器的预测部分将与解码器在解码期间使用预测时解释的样本值相同的样本值解释为参考图片样本。本领域技术人员已知参考图片同步性的这一基本原理(以及在例如由于信道误差而无法维持同步性的情况下产生的漂移)。
解码器210的操作可以与远程解码器例如解码器部件122的操作相同,下文将结合图2B对其进行详细描述。然而,简要参照图2B,当符号是可用的并且熵编码器214将符号编码成编码视频序列以及解析器254对符号进行解码可以是无损的时,解码器部件122的包括缓冲存储器252和解析器254的熵解码部分可以不完全在本地解码器210中实现。
此时可以观察到,除了存在于解码器中的解析/熵解码之外的任何解码器技术也必定需要以基本上相同的功能形式存在于对应的编码器中。由于这个原因,所公开的主题集中在解码器操作上。由于编码器技术与全面描述的解码器技术相反,因此可以简化对编码器技术的描述。仅在某些区域中需要更详细的描述,并且在下文提供。
作为其操作的一部分,源编码器202可以执行运动补偿的预测性编码,该运动补偿的预测性编码参考来自视频序列中被指定为参考帧的一个或更多个先前编码的帧对输入帧进行预测性编码。以这种方式,编码引擎212对输入帧的像素块与参考帧的像素块之间的差异进行编码,所述参考帧可以被选作所述输入帧的预测参考。控制器204可以管理源编码器202的编码操作,包括例如用于对视频数据进行编码的参数和子组参数的设置。
解码器210可以基于由源编码器202创建的符号对可以被指定为参考帧的帧的编码视频数据进行解码。编码引擎212的操作可以有利地是有损过程。当编码视频数据在视频解码器(图2A中未示出)处被解码时,重建的视频序列可以是带有一些错误的源视频序列的副本。解码器210复制可以由远程视频解码器对参考帧执行的解码过程,并且可以使重建的参考帧存储在参考图片存储器208中。以此方式,编码器部件106可以在本地存储重建的参考帧的副本,这些副本与将由远程视频解码器获得的经重建的参考帧具有共同内容(不存在传输误差)。
预测器206可以针对编码引擎212执行预测搜索。也就是说,对于要编码的新帧,预测器206可以在参考图片存储器208中搜索可以用作用于新图片的适当预测参考的样本数据(作为候选参考像素块)或某些元数据例如参考图片运动矢量、块形状等。预测器206可以基于样本块逐像素块来进行操作以找到适当的预测参考。在一些情况下,如通过预测器206获得的搜索结果所确定的,输入图片可以具有从参考图片存储器208中存储的多个参考图片提取的预测参考。
所有以上提及的功能单元的输出可以在熵编码器214中经受熵编码。熵编码器214通过根据本领域普通技术人员已知的技术(例如,霍夫曼编码、可变长度编码和/或算术编码)对各种功能单元生成的符号进行无损压缩来将这些符号转换成编码视频序列。
在一些实施方式中,熵编码器214的输出连接至发送器。发送器可以被配置成缓冲如由熵编码器214创建的编码视频序列,以为经由通信信道218进行传输做准备,通信信道218可以是到将存储编码视频数据的存储设备的硬件/软件链路。发送器可以被配置成将来自源编码器202的编码视频数据与要发送的其他数据例如编码音频数据和/或辅助数据流(未示出源)合并。在一些实施方式中,发送器可以将附加数据与编码视频一起发送。源编码器202可以包括这样的数据作为编码视频序列的一部分。附加数据可以包括时间/空间/SNR增强层、其他形式的冗余数据例如冗余图片和切片、补充增强信息(SupplementaryEnhancement Information,SEI)消息、视觉可用性信息(Visual Usability Information,VUI)参数集片段等。
控制器204可以管理编码器部件106的操作。在编码期间,控制器204可以为每个编码图片分配特定的编码图片类型,这可能影响应用于相应图片的编码技术。例如,图片可以被分配为帧内图片(I图片)、预测性图片(P图片)或双向预测性图片(B图片)。可以在不使用序列中的任何其他帧作为预测源的情况下对帧内图片进行编码和解码。一些视频编解码器允许不同类型的帧内图像,包括例如独立解码器刷新(Independent Decoder Refresh,IDR)图片。本领域普通技术人员了解I图片的那些变型及其相应的应用和特征,并且因此在此不再重复。可以使用帧内预测或帧间预测来对预测性图片进行编码和解码,所述帧间预测使用至多一个运动矢量和参考索引来预测每个块的样本值。可以使用帧内预测或帧间预测来对双向预测性图片进行编码和解码,所述帧间预测使用至多两个运动矢量和参考索引来预测每个块的样本值。类似地,多预测性图片可以使用两个以上的参考图片和相关联的元数据来重建单个块。
源图片通常可以在空间上细分成多个样本块(例如,各自具有4×4、8×8、4×8或16×16个样本的块)并且在逐块的基础上进行编码。可以参考通过应用于块的相应的图片的编码指定(coding assignment)确定的其他(已经编码的)块对这些块进行预测性地编码。例如,可以对I图片的块进行非预测性地编码,或者可以参考相同图片的已编码块对I图片的块进行预测性地编码(空间预测或帧内预测)。可以经由空间预测或经由参考一个先前编码的参考图片的时间预测对P图片的像素块进行非预测性地编码。可以经由空间预测或经由参考一个或两个先前编码的参考图片的时间预测对B图片的块进行非预测性地编码。
视频可以按时间序列被捕获为多个源图片(视频图片)。帧内图片预测(通常简化为帧内预测)利用给定图片中的空间相关性,而帧间图片预测利用图片之间的(时间或其他)相关性。在示例中,可以将被称为当前图片的正在被编码/解码的特定图片分割成块。在当前图片中的块与视频中先前编码且仍被缓冲的参考图片中的参考块类似时,可以通过被称作运动矢量的矢量对当前图片中的块进行编码。运动矢量指向参考图片中的参考块,并且在使用多个参考图片的情况下,该运动矢量可以具有标识参考图片的第三维度。
编码器部件106可以根据预定的视频编码技术或标准(例如本文所述的任何视频编码技术或标准)来执行编码操作。在其操作中,编码器部件106可以执行各种压缩操作,包括利用输入视频序列中的时间冗余和空间冗余的预测性编码操作。因此,编码视频数据可以符合由所使用的视频编码技术或标准指定的语法。
图2B是示出根据一些实施方式的解码器部件122的示例元件的框图。图2B中的解码器部件122耦接至信道218和显示器124。在一些实施方式中,解码器部件122包括耦接至环路滤波器256并被配置成(例如,经由有线或无线连接)向显示器124发送数据的发送器。
在一些实施方式中,解码器部件122包括接收器,该接收器耦接至信道218并被配置成(例如,经由有线或无线连接)从信道218接收数据。接收器可以被配置成接收将由解码器部件122进行解码的一个或更多个编码视频序列。在一些实施方式中,每个编码视频序列的解码独立于其他编码视频序列。可以从信道218接收每个编码视频序列,信道218可以是到存储编码视频数据的存储设备的硬件/软件链路。接收器可以接收编码视频数据与其他数据例如编码音频数据和/或辅助数据流,这些数据可以被转发到其相应的使用实体(未描绘出)。接收器可以将编码视频序列与其他数据分开。在一些实施方式中,接收器接收附加(冗余)数据与编码视频。附加数据可以作为编码视频序列的一部分被包括。解码器部件122可以使用附加数据来对数据进行解码以及/或者更准确地重建原始视频数据。附加数据可以是例如时间、空间或SNR增强层、冗余切片、冗余图片、前向纠错码等形式。
根据一些实施方式,解码器部件122包括缓冲存储器252、解析器254(有时也称为熵解码器)、缩放器/逆变换单元258、帧内图片预测单元262、运动补偿预测单元260、聚合器268、环路滤波器单元256、参考图片存储器266和当前图片存储器264。在一些实施方式中,解码器部件122被实现为集成电路、一系列集成电路和/或其他电子电路系统。在一些实施方式中,解码器部件122至少部分以软件实现。
缓冲存储器252耦接在信道218与解析器254之间(例如,以防止网络抖动)。在一些实施方式中,缓冲存储器252与解码器部件122分离。在一些实施方式中,在信道218的输出与解码器部件122之间提供单独的缓冲存储器。在一些实施方式中,除了解码器部件122内部的缓冲存储器252(例如,其被配置成处理播出定时)之外,在解码器部件122外部提供单独的缓冲存储器(例如,以防止网络抖动)。当从具有足够带宽和可控性的存储/转发设备或者从同步网络接收数据时,可以不需要缓冲存储器252,或者其可以较小。为了在诸如因特网的尽力型(best effort)分组网络上使用,可能需要缓冲存储器252,缓冲存储器252可以相对较大,并且可以有利地具有自适应大小,并且可以至少部分地在解码器部件122外部的操作系统或类似元件(未描绘出)中实现。
解析器254被配置成从编码视频序列中重建符号270。符号可以包括例如用于管理解码器部件122的操作的信息,和/或用于控制诸如显示器124的呈现设备的信息。用于呈现设备的控制信息可以是例如补充增强信息(SEI)消息或视频可用性信息(VUI)参数集片段(未描绘出)的形式。解析器254对编码视频序列进行解析(熵解码)。编码视频序列的编码可以根据视频编码技术或标准进行,并且可以遵循本领域技术人员公知的原理,包括:可变长度编码、霍夫曼编码、具有或不具有上下文灵敏度的算术编码等。解析器254可以基于与群组对应的至少一个参数来在视频解码器中从编码视频序列中提取针对像素的子群组中的至少一个子群组的子群组参数集。子群组可以包括图片群组(GOP)、图片、图块、切片、宏块、编码单元(Coding Unit,CU)、块、变换单元(Transform Unit,TU)、预测单元(PredictionUnit,PU)等。解析器254还可以从编码视频序列中提取信息,例如变换系数、量化器参数值、运动矢量等。
根据编码视频图片或其一部分的类型(例如:帧间图片和帧内图片、帧间块和帧内块)以及其他因素,符号270的重建可以涉及多个不同的单元。涉及哪些单元以及如何涉及这些单元可以通过由解析器254从编码视频序列解析的子群组控制信息来控制。出于简洁起见,未描绘解析器254与下面的多个单元之间的这样的子群组控制信息的流。
除了已经提及的功能块之外,解码器部件122可以在概念上细分成如下面描述的多个功能单元。在商业限制下的实际实现操作中,这些单元中的许多单元彼此紧密地相互作用并且可以至少部分地彼此集成。然而,出于描述所公开的主题的目的,保持在概念上细分为以下功能单元。
缩放器/逆变换单元258从解析器254接收作为符号270的量化变换系数以及控制信息(例如使用哪种变换、块大小、量化因子和/或量化缩放矩阵)。缩放器/逆变换单元258可以输出可以输入到聚合器268中的包括样本值的块。
在一些情况下,缩放器/逆变换单元258的输出样本属于帧内编码块;即:不使用来自先前重建的图片的预测性信息但可以使用来自当前图片的先前重建部分的预测性信息的块。这样的预测性信息可以由帧内图片预测单元262提供。帧内图片预测单元262可以使用从来自当前图片存储器264的当前(部分重建的)图片获取的周围已重建的信息来生成与重建中的块具有相同大小和形状的块。聚合器268可以以每个样本为基础将帧内图片预测单元262已经生成的预测信息添加至由缩放器/逆变换单元258提供的输出样本信息。
在其他情况下,缩放器/逆变换单元258的输出样本属于帧间编码的并且可能经运动补偿的块。在这样的情况下,运动补偿预测单元260可以访问参考图片存储器266以获取用于预测的样本。在根据属于块的符号270对获取的样本进行运动补偿之后,这些样本可以由聚合器268添加至缩放器/逆变换单元258的输出(在这种情况下被称为残差样本或残差信号),以生成输出样本信息。运动补偿预测单元260从其中获取预测样本的参考图片存储器266内的地址可以由运动矢量控制。运动矢量可以以可以具有例如X、Y和参考图片分量的符号270的形式对运动补偿预测单元260可用。运动补偿还可以包括在使用子样本精确运动矢量时从参考图片存储器266获取的样本值的内插、运动矢量预测机制等等。
聚合器268的输出样本可以在环路滤波器单元256中经受各种环路滤波技术。视频压缩技术可以包括环路内滤波技术,所述环路内滤波技术由被包括在编码视频比特流中并且作为来自解析器254的符号270可用于环路滤波器单元256的参数来控制,但是视频压缩技术还可以响应于在对编码图片或编码视频序列的先前(按解码顺序)部分进行解码期间获得的元信息,以及响应于先前重建且经环路滤波的样本值。
环路滤波器单元256的输出可以是样本流,该样本流可以输出至诸如显示器124的呈现设备,以及存储在参考图片存储器266中以供在将来的帧间图片预测中使用。
一旦完全重建,某些编码图片就可以用作参考图片以用于将来预测。一旦编码图片被完全重建并且编码图片已经(例如,通过解析器254)被识别为参考图片,当前参考图片就可以成为参考图片存储器266的一部分,并且可以在开始重建后面的编码图片之前重新分配新的当前图片存储器。
解码器部件122可以根据预定的视频压缩技术执行解码操作,所述预定的视频压缩技术可以记录在标准例如本文所述的标准中的任何标准中。在编码视频序列遵循视频压缩技术或标准的语法(如在视频压缩技术文档或标准中且明确地在其中的简档文档中指定的语法)的意义上,编码视频序列可以符合由正使用的视频压缩技术或标准指定的语法。此外,为了符合一些视频压缩技术或标准,编码视频序列的复杂度可以在如由视频压缩技术或标准的层级所限定的范围内。在一些情况下,层级限制最大图片大小、最大帧率、最大重建采样率(以例如每秒兆个样本为单位进行测量)、最大参考图片大小等。在一些情况下,由层级设置的限制可以通过假想参考解码器(Hypothetical Reference Decoder,HRD)规范以及在编码视频序列中用信号通知的HRD缓冲器管理的元数据来进一步限定。
图3是示出根据一些实施方式的服务器系统112的框图。服务器系统112包括控制电路系统302、一个或更多个网络接口304、存储器314、用户接口306以及用于互连这些部件的一条或更多条通信总线312。在一些实施方式中,控制电路系统302包括一个或更多个处理器(例如,CPU、GPU和/或DPU)。在一些实施方式中,控制电路系统包括一个或更多个现场可编程门阵列(field-programmable gate array,FPGA)、硬件加速器和/或一个或更多个集成电路(例如,专用集成电路)。
网络接口304可以被配置成与一个或更多个通信网络(例如,无线网络、有线网络和/或光网络)对接。通信网络可以是局域网、广域网、城域网、车载网络和工业网络、实时网络、延迟容忍网络等等。通信网络的示例包括:局域网,例如以太网、无线LAN;蜂窝网络,包括GSM、3G、4G、5G、LTE等;电视有线或无线广域数字网络,包括有线电视、卫星电视和地面广播电视;车载和工业网络,包括CANBus等。这样的通信可以是单向的、仅接收的(例如,广播电视)、单向仅发送的(例如,到某些CANbus设备的CANbus)或双向的(例如,到使用局域或广域数字网络的其他计算机系统)。这样的通信可以包括到一个或更多个云计算网络的通信。
用户接口306包括一个或更多个输出设备308和/或一个或更多个输入设备310。输入设备310可以包括以下中的一个或更多个:键盘、鼠标、轨迹板、触摸屏、数据手套、操纵杆、麦克风、扫描仪、摄像机等。输出设备308可以包括以下中的一个或更多个:音频输出设备(例如,扬声器)、视觉输出设备(例如,显示器)等。
存储器314可以包括高速随机存取存储器(例如DRAM、SRAM、DDR RAM和/或其他随机存取固态存储设备)和/或非易失性存储器(例如一个或更多个磁盘存储设备、光盘存储设备、闪存设备和/或其他非易失性固态存储设备)。存储器314可选地包括一个或更多个远离控制电路系统302定位的存储设备。存储器314或者可替选地存储器314内的非易失性固态存储设备包括非暂态计算机可读存储介质。在一些实施方式中,存储器314或者存储器314的非暂态计算机可读存储介质存储以下程序、模块、指令和数据结构或者其子集或超集:
·操作系统316,其包括用于处理各种基本系统服务和用于执行硬件相关任务的程序;
·网络通信模块318,其用于经由一个或更多个网络接口304(例如,经由有线和/或无线连接)将服务器系统112连接至其他计算设备;
·译码模块320,其用于执行关于对诸如视频数据的数据进行编码和/或解码的各种功能。在一些实施方式中,译码模块320是译码器部件114的实例。译码模块320包括但不限于以下中的一个或更多个:
ο解码模块322,其用于执行关于对编码数据进行解码的各种功能,例如先前关于解码器部件122描述的那些功能;和
ο编码模块340,其用于执行关于对数据进行编码的各种功能,例如先前关于编码器部件106描述的那些功能;和
·图片存储器352,其用于存储图片和图片数据,例如用于与译码模块320一起使用的图片和图片数据。在一些实施方式中,图片存储器352包括以下中的一个或更多个:参考图片存储器208、缓冲存储器252、当前图片存储器264和参考图片存储器266。
在一些实施方式中,解码模块322包括解析模块324(例如,被配置成执行先前针对解析器254描述的各种功能)、变换模块326(例如,被配置成执行先前针对缩放器/逆变换单元258描述的各种功能)、预测模块328(例如,被配置成执行先前针对运动补偿预测单元260和/或帧内图片预测单元262描述的各种功能)和滤波器模块330(例如,被配置成执行先前关于环路滤波器256描述的各种功能)。
在一些实施方式中,编码模块340包括码模块342(例如,被配置成执行先前针对源编码器202和/或编码引擎212描述的各种功能)和预测模块344(例如,被配置成执行先前针对预测器206描述的各种功能)。在一些实施方式中,解码模块322和/或编码模块340包括图3所示模块的子集。例如,解码模块322和编码模块340都使用共享的预测模块。
存储在存储器314中的上述模块中的每一个对应于用于执行本文所述功能的指令集。上述模块(例如,指令集)不需要被实现为单独的软件程序、过程或模块,并且因此这些模块的各种子集可以在各种实施方式中被组合或以其他方式重新布置。例如,译码模块320可选地不包括单独的解码和编码模块,而是使用同一模块集合来执行两个功能集合。在一些实施方式中,存储器314存储上述数据结构和模块的子集。在一些实施方式中,存储器314存储以上未描述的附加模块和数据结构,例如音频处理模块。
在一些实施方式中,服务器系统112包括:web或超文本传输协议(HypertextTransfer Protocol,HTTP)服务器,文件传输协议(File Transfer Protocol,FTP)服务器,以及使用公共网关接口(Common Gateway Interface,CGI)脚本、PHP超文本预处理器(PHPHyper-text Preprocessor,PHP)、活动服务器页面(Active Server Pages,ASP)、超文本标记语言(Hyper Text Markup Language,HTML)、可扩展标记语言(Extensible MarkupLanguage,XML)、Java、JavaScript、异步JavaScript和XML(Asynchronous JavaScript andXML,AJAX)、XHP、Javelin、无线通用资源文件(Wireless Universal Resource File,WURFL)等实现的网页和应用。
尽管图3示出了根据一些实施方式的服务器系统112,但图3更多地旨在作为对一个或更多个服务器系统中可能存在的各种特征的功能描述,而不是本文所述实施方式的结构示意图。实际上,如本领域普通技术人员所认识到的,单独示出的项目可以被组合,并且一些项目可以被分离。例如,图3中单独示出的一些项目可以在单个服务器上实现,并且单个项目可以由一个或更多个服务器实现。用于实现服务器系统112的服务器的实际数量以及如何在它们之间分配特征将因实现方式的不同而不同,并且可选地,部分取决于服务器系统在高峰使用时间段期间以及在平均使用时间段期间处理的数据流量。
图4A是根据一些实施方式的包括与位于一个或更多个相邻编码块406中的候选亮度样本404相关联的多个亮度样本402的示例当前编码块400,以及图4B是根据一些实施方式的与当前编码块400中的多个亮度样本402共位置的多个色度样本412。GOP包括图像帧的序列。多个图像帧包括当前图像帧,当前图像帧还包括当前编码块400。包括当前编码块400的当前图像帧在帧内预测模式下被编码。根据帧内预测模式,根据属于围绕当前编码块400的一个或更多个相邻编码块406的像素来预测当前编码块400的像素。当前编码块400与一个或更多个相邻编码块406中的每一个紧邻,并与其共享相应的边界。在一些实施方式中,一个或更多个相邻编码块406包括顶部编码块406T,顶部编码块406T紧邻在当前编码块400的顶部上并共享当前编码块400的顶部边界。在一些实施方式中,一个或更多个相邻编码块406包括左侧编码块406L,左侧编码块406L紧邻在当前编码块400的左侧并共享当前编码块400的左侧边界。
参照图4A,当前编码块400包括多个亮度样本,多个亮度样本还包括位于样本位置(i,j)例如(0,0)处的第一亮度样本402。基于预定义的样本选择策略,针对第一亮度样本402在一个或更多个相邻编码块406内识别多个候选亮度样本404。例如,多个候选亮度样本404包括顶部相邻编码块406T的底部行亮度样本405T、顶部相邻编码块406T的最右列亮度样本405L中的所有亮度样本或两者。多个候选亮度样本404中的每一个都与当前编码块400的相应顶部边界或左侧边界紧邻。在多个候选亮度样本404中识别目标亮度样本408。在一些实施方式中,一个或更多个相邻编码块406以4:2:0色度色彩格式被编码,并且目标亮度样本408包括2×2亮度块。在一些实施方式中,根据目标亮度样本408在量值上比多个候选亮度样本404中的任何剩余亮度样本都更接近第一亮度样本402的确定来识别目标亮度样本408。例如,第一亮度样本402具有111的亮度值,并且目标亮度样本408具有112的亮度值,其在图4A中的多个候选亮度样本404中最接近111。
参照图4B,当前编码块400还包括多个色度样本,多个色度样本中的每一个色度样本与多个亮度样本中的相应一个亮度样本共位置。多个色度样本包括与第一亮度样本402共位置的第一色度样本412。一个或更多个相邻编码块406还包括目标色度样本418,目标色度样本418与从图4A中的多个候选亮度样本404中识别的目标亮度样本408共位置。基于与一个或更多个相邻编码块406中的目标亮度样本408共位置的目标色度样本418来确定第一色度样本412。换句话说,在识别目标亮度样本408之后,对应的目标色度样本418被复制到与第一亮度样本402共位置的第一色度样本412。
在一些实施方式中,根据候选亮度样本的子集410与第一亮度样本在量值上具有相同差异并且在量值上比多个候选亮度样本404中的任何剩余亮度样本都更接近第一亮度样本的确定,从多个候选亮度样本404中识别候选亮度样本的子集410(例如,410A和410B)。基于目标亮度样本408与第一亮度样本402的距离,从候选亮度样本的子集中选择目标亮度样本408。具体地,在一些实施方式中,对于候选亮度样本的子集410中的每一个,确定第一亮度样本402与相应候选亮度样本410之间的相应距离。根据候选亮度样本的子集410之一的距离在候选亮度样本的子集的相应距离中最小的确定,选择候选亮度样本的子集之一(例如,410B)作为目标亮度样本408。参照图4A,在示例中,亮度样本410A和410B都具有相同的亮度值112。在另一示例中,亮度样本410A和410B分别具有110和112的亮度值。亮度样本410A和410B与第一亮度样本402(例如,具有111的亮度值)在量值上具有相同的差异,并且在多个候选亮度样本404中在量值上最接近第一亮度样本402。根据候选亮度样本410B在距离上比候选亮度样本410A更接近第一亮度样本402的确定,选择候选亮度样本410B作为目标亮度样本408。
在编码期间,编码器106识别当前编码块400的编码块模式。根据编码块模式是色度复制模式的确定,编码器106(具体地,图2A中的编码引擎212)基于与当前编码块400的一个或更多个相邻编码块406中的目标亮度样本408共位置的目标色度样本418来确定第一色度样本412。在解码期间,解码器122接收视频数据的数据流,并且识别当前编码块400的编码块模式。根据编码块模式是色度复制模式的确定,解码器122(具体地,图2B中的帧内预测单元262)基于与当前编码块400的一个或更多个相邻编码块406中的目标亮度样本408共位置的目标色度样本418来确定第一色度样本412。通过这些方式,在一些比较操作之后,从一个或更多个相邻编码块406的现有目标色度样本418复制第一色度样本412,并且不涉及加法或乘法的算术运算,从而在视频译码期间节省计算和存储资源。
根据一些实施方式,图5至图7是根据一些实施方式的各自对应于不同的预定义样本选择策略的三个示例当前编码块400A、400B和400C。对于每个当前编码块400A、400B或400C,应用不同的预定义样本选择策略来识别当前编码块400A、400B或400C的一个或更多个相邻编码块406中的多个候选亮度样本404。参照图5,在一些实施方式中,顶部相邻编码块406T的底部行亮度样本405T和左侧相邻编码块406L的最右列亮度样本405L中的每两个候选亮度样本中的一者被用作候选亮度样本404,以针对当前编码块400A的每个亮度样本来确定目标亮度样本408。在一些情况下,第一亮度样本402位于当前编码块400的偶数列或偶数行。顶部相邻编码块406T的底部行的偶数编号的亮度样本和左侧相邻编码块406L的最右列的偶数编号的亮度样本被用作候选亮度样本404,从候选亮度样本404中针对当前编码块400A中的第一亮度样本402选择目标亮度样本408。相反,在一些情况下,第一亮度样本402位于当前编码块400的奇数列和奇数行的交叉点处。顶部相邻编码块406T的底部行的奇数编号的相邻亮度样本和左侧相邻编码块406L的最右列的奇数编号的相邻亮度样本被用作候选亮度样本404,从候选亮度样本404中针对当前编码块400A中的第一亮度样本402选择目标亮度样本408。
在一些实施方式中,多个候选亮度样本404包括顶部相邻编码块406T的底部行亮度样本405T或左侧相邻编码块406L的最右列亮度样本405L中的每N个亮度样本中的第M个亮度样本,其中N为大于1的整数,以及M为小于或等于N的正整数。例如,在图5中,M和N分别等于1和2。候选亮度样本404包括底部行亮度样本405T和最右列亮度样本405L中的每两个亮度样本的第一个样本。在一些实施方式中,N等于2的整数次幂(例如,2、4、8、16等)并且小于顶部相邻编码块406T的底部行亮度样本405T中的亮度样本的总数。例如,底部行亮度样本405T和最右列亮度样本405L中的每4个亮度样本中的第三个亮度样本被选择作为候选亮度样本404。
参照图6,在一些实施方式中,独立于第一亮度样本402的位置(i,j),多个候选亮度样本404包括顶部相邻编码块406T的底部行亮度样本405T的中间的K个亮度样本的集合,或左侧相邻编码块406T的最右列亮度样本405L的中间的L个亮度样本的集合,其中K和L为正整数。例如,K和L都等于4。对于第一亮度样本402,对应的目标亮度样本408选自顶部相邻编码块406T的K个亮度样本的集合和左侧相邻编码块406L的L个亮度样本的集合,例如,图6中的总共8个候选亮度样本404。
参照图7,在一些实施方式中,独立于第一亮度样本402的位置(i,j),多个候选亮度样本404包括位于顶部相邻编码块406T的底部行亮度样本405T的两端的P个亮度样本的两个集合702A和702B,或位于左侧相邻编码块406L的最右列亮度样本405L的两端的Q个亮度样本的两个集合704A和704B,其中P和Q为正整数。P和Q可选地彼此相同或不同。例如,在图7中,P和Q都等于1。针对第一亮度样本402,从四个候选亮度样本702A、702B、704A和704B中选择对应的目标亮度样本408。
图8A是根据一些实施方式的与位于一个或更多个相邻编码块406中的基于位置的候选亮度样本404相对应的示例当前编码块400,以及图8B是根据一些实施方式的图8A中的当前编码块400中的多个色度样本412。图9A是根据一些实施方式的与位于一个或更多个相邻编码块406中的基于位置的候选亮度样本404相对应的另一示例当前编码块400,以及图9B是根据一些实施方式的图9B中的当前编码块400中的多个色度样本412。在一些实施方式中,应用于识别多个候选亮度样本404的预定义样本选择策略基于当前编码块400中的第一亮度样本402的位置,并且至少部分地基于第一亮度样本402的位置来识别多个候选亮度样本404。在一些实施方式中,根据预定义的样本选择策略,一个或更多个相邻编码块406包括顶部相邻编码块406T或左侧相邻编码块406L。多个候选亮度样本404包括顶部相邻编码块406T的底部行亮度样本405T中的包括第一中央亮度样本804的奇数X个亮度样本(例如,3个亮度样本802)。多个候选亮度样本404还包括左侧相邻编码块406L的最右列亮度样本405L中的包括第二中央亮度样本808的奇数Y个亮度样本(例如,3个亮度样本806)。第一中央亮度样本804沿列方向与第一亮度样本402对准,以及第二中央亮度样本808沿行方向与第一亮度样本402对准。
在一些未示出的实施方式中,奇数X和Y彼此不同,例如分别等于3和5。可替选地,参照图8A,在一些实施方式中,奇数X和Y彼此相等,例如等于3。例如,根据目标亮度样本408(例如,具有113的亮度值)在量值上比多个候选亮度样本404中的任何剩余亮度样本(例如,具有10、55、23、105和25的亮度值)都更接近第一亮度样本402(例如,具有111的亮度值)的确定,在6个候选亮度样本802和806中确定目标亮度样本408。目标色度样本418与左侧相邻编码块406L中的目标亮度样本408共位置。参照图8,第一色度样本412与第一亮度样本402共位置并且基于目标色度样本418来确定。
在示例中,参照图9A,奇数X和Y均等于1,并且多个候选亮度样本404包括第一中央亮度样本804和第二中央亮度样本808。例如,根据目标亮度样本408(例如,具有105的亮度值)在量值上比多个候选亮度样本404中的第二中央亮度样本808(例如,具有10的亮度值)更接近第一亮度样本402(例如,具有111的亮度值)的确定,在2个候选亮度样本804和808中确定目标亮度样本408。目标色度样本418与顶部相邻编码块406T中的目标亮度样本408共位置。参照图9B,第一色度样本412与第一亮度样本402共位置并且基于目标色度样本418来确定。
图10是根据一些实施方式的其中示例当前编码块400与相邻编码块406的相邻样本1002(例如,1002TL、1002T、1002TR、1002L和1002LB)紧邻的块环境1000。目标色度样本418(图4B)与相邻编码块406中的目标亮度样本408(图4A)共位置并且如下基于该目标亮度样本408来确定:
CT=α×LT,AC+CDC (1)
其中,CT是目标色度样本418,LT是目标亮度样本408,α是线性模型参数,LT,AC是目标亮度样本408的AC分量,以及CDC是目标色度样本408的DC分量。在一些实施方式中,应用相邻样本1002的子集来根据目标亮度样本408确定相邻编码块406中的目标色度样本418,例如通过确定目标亮度样本408的AC分量(LT,AC)和/或目标色度样本418的DC分量(CDC)来确定。相邻样本1002对应于以下中的一个或更多个:分别位于左侧相邻编码块406L、顶部相邻编码块406T、右侧相邻编码块406R、底部相邻编码块406B、左上相邻编码块406LT、左下相邻编码块406LB、右上相邻编码块406RT和右下相邻编码块406RB中的相邻样本1002L、1002T、1002R、1002B、1002LT、1002LB、1002RT和1002RB。应用相邻样本1002来基于式(1)确定CfL预测中的目标色度样本418,并且可选地在左侧相邻编码块406L、顶部相邻编码块406T、右侧相邻编码块406R、底部相邻编码块406B、左上相邻编码块406LT、左下相邻编码块406LB、右上相邻编码块406RT和右下相邻编码块406RB的子集中识别目标色度样本418。根据目标色度样本418进一步确定第一色度样本402。在示例中,仅应用位于编码块406L、402T和402LT中的相邻样本1002L、1002T和1002LT来确定目标色度样本418和第一色度样本402。
在一些实施方式中,CfL预测中使用的相邻样本1002的选择基于编码信息(例如定义共位置的亮度块、块形状、块大小和/或块纵横比的帧内预测模式)用信号明确表示或以隐含方式得出。在一些实施方式中,当仅顶部相邻样本1002T可用时,在CfL预测中使用上方相邻样本1002T,以确定目标色度样本418和第一色度样本402。在一些实施方式中,左侧相邻样本1002L、左上相邻样本1002LT和顶部相邻样本1002T尚不可用,但是需要在CfL预测中使用。例如,在帧内角度预测模式下,在编码块406中用相邻样本填充左侧相邻样本1002L、左上相邻样本1002LT和顶部相邻样本1002T。在一些实施方式中,在一些实施方式中,仅左侧相邻样本1002L可用,并且在CfL预测中使用以确定目标色度样本418和第一色度样本402。在一些实施方式中,当前编码块400位于超级块边界处。对于顶部相邻编码块406T中的样本,仅最接近的上方参考线中的样本被下采样并在CFL预测中使用以确定目标色度样本418和第一色度样本402。如果顶部相邻编码块406T处于超级块边界处,则最接近的上方参考线被包括在顶部相邻编码块406T中。在一些实施方式中,在CfL预测中使用最接近的相邻参考线中的相邻样本1002来确定目标色度样本418和第一色度样本402。在一些实施方式中,在CfL预测中仅使用共位置的亮度块的相邻样本的最接近的相邻线来确定目标色度样本418和第一色度样本402。当参考样本被下采样时,使用两条线。最接近的相邻参考线是指更靠近当前编码块400的线。
在一些实施方式中,根据色度色彩格式(例如,4:2:0、4:2:2、4:4:4)对当前编码块400中的亮度样本进行下采样。在一些实施方式中,根据色度色彩格式(例如,4:2:0、4:2:2、4:4:4)对相邻编码块400中的亮度样本进行下采样。在一些实施方式中,一个或更多个相邻编码块406中的亮度样本用于进行CfL预测,并且确定目标色度样本418和第一色度样本402。
在一些实施方式中,当前编码块400或相邻编码块406的多个亮度样本未被下采样并应用于确定目标色度样本418和第一色度样本412。第一亮度样本402和目标亮度样本408未被下采样。从未被下采样的多个候选亮度样本404中识别目标亮度样本408。每个色度样本与亮度样本集合(例如,2×2个样本)共位置。可替选地,在一些实施方式中,当前编码块400或相邻编码块406的多个亮度样本被下采样并应用于确定目标色度样本418和第一色度样本412。针对被下采样的第一亮度样本402,从多个被下采样的候选亮度样本404中识别被下采样的目标亮度样本408。第一色度样本或目标色度样本与相应的被下采样的亮度样本(例如,对应于未被下采样的2×2样本)共位置。根据目标色度样本418确定第一色度样本412。
图11示出了根据一些实施方式的应用于当前帧的当前编码块400和一个或更多个相邻编码块406(例如,406T和406L)的子采样亮度样本的色度子采样方案1100。在一些实施方式中,当前编码块400包括多个亮度样本,多个亮度样本还包括与顶部边界紧邻的顶部边界行亮度样本以及与左侧边界紧邻的左侧边界列亮度样本。在一些实施方式中,使用当前编码块400的顶部边界行亮度样本和左侧边界列亮度样本来确定一个或更多个相邻编码块406中的目标亮度样本408和共位置的目标色度样本418。
在一些实施方式中,色度色彩格式为4:2:0,并且每个编码块400或406的多个亮度样本被分组为多个亮度像素组(也称为亮度块)。每个亮度像素组1102(即,每个亮度块1102)包括2×2个亮度样本402-1、402-2、402-3和402-4的阵列。对于多个亮度像素组1102中的每一个,从2×2个亮度样本的阵列中选择单个亮度样本或基于2×2个亮度样本的阵列来确定单个亮度样本,以表示相应的亮度像素组1102。具体地,每个编码块400或406具有多个色度样本,其具有与多个亮度像素组1102相同的分辨率。每个色度样本与相应的亮度像素组1102共位置,并且基于与一个或更多个相邻编码块406中的目标亮度样本408(例如,对应于目标亮度像素组)共位置的目标色度样本418来确定。在示例中,一个或更多个相邻编码块406的亮度样本被下采样为针对每2×2个亮度样本的一个亮度样本。可选地,所得亮度样本对应于相邻编码块406的亮度样本402-1、402-2、402-3或402-4。可选地,所得亮度样本是相邻编码块406的亮度样本402-1、402-2、402-3或402-4的组合(例如,平均值、加权平均值)。在另一示例中,当前编码块400的亮度样本也被下采样为针对每2×2个亮度样本的一个亮度样本。可选地,所得亮度样本对应于当前编码块400的亮度样本402-1、402-2、402-3或402-4。可选地,所得亮度样本是当前编码块400的亮度样本402-1、402-2、402-3或402-4的组合(例如,平均值、加权平均值)。在一些实施方式中,编码块400和406的所得下采样亮度样本被用作亮度样本402、405和408,以确定目标色度样本418和第一色度样本412。在一些实施方式中,这种下采样方案广泛应用于CfL模式,该CfL模式可选地应用亮度样本来预测色度样本,或者涉及包括CfL的交叉分量预测。
图12是根据一些实施方式的对视频进行编码的方法1200的流程图。方法1200可以在具有控制电路系统和存储由控制电路系统执行的指令的存储器的计算系统(例如,服务器系统112、源设备102或电子设备120)处执行。在一些实施方式中,方法1200通过执行存储在计算系统的存储器(例如,存储器314的译码模块320)中的指令来执行。在一些实施方式中,计算系统根据共位置的亮度编码块400中的亮度样本和共位置的亮度编码块406的相邻样本404来确定色度预测块。例如,亮度重建样本402(PLij)(也称为第一亮度样本)位于(1202)当前编码块400的样本位置(i,j)处,当前编码块400具有与当前编码块400紧邻的一个或更多个相邻编码块406。多个候选亮度样本404被包括(1204)在一个或更多个相邻编码块406中,一个或更多个相邻编码块406还包括(1214)左侧相邻编码块406L、顶部相邻编码块406T或两者。计算系统在多个候选亮度样本404中识别(1206)目标亮度样本408(PLk)。在候选亮度样本404中,目标亮度样本408(PLk)在量值上与亮度重建样本402(PLij)具有(1212)最小的差异。在一些情况下,多于一个的候选亮度样本404与亮度重建样本402(PLij)具有相同的最小差异,选择与样本402(PLij)具有最小样本距离的目标亮度样本408(PLk)。使用与目标亮度样本408(PLk)共位置的目标色度样本418(PCk)来预测(1208)与亮度重建样本402(PLij)共位置的色度重建样本412(PCij)。在示例中,亮度重建样本402(PLij)的亮度值为111,并且位置k处的目标亮度样本408的值为113,与左侧相邻编码块406L和顶部相邻编码块406T中的其他候选亮度样本404相比,其与亮度重建样本402(PLij)具有最小差异。使用与目标亮度样本408(PLk)共位置的目标色度样本418(PCk)来定义与亮度重建样本402(PLij)共位置的色度重建样本412(PCij)。在一些实施方式中,CfL模式被应用于当前编码块400。色度重建样本412(PCij)是根据共位置的亮度重建样本402(PLij)来确定的。可选地,不发信号通知信号α来确定色度重建样本412(PCij)。可选地,信号α的值总是被设置为零。目标色度样本418(PCk)被设置为位置(i,j)处的色度样本的最终预测值。在一些实施方式中,一个或更多个相邻编码块406以4:2:0色度色彩格式被编码,并且目标亮度样本408包括2×2亮度块。
在一些实施方式中,亮度重建样本402(PLij)与多个候选亮度样本404中的每一个之间的差异基于绝对差之和(a sum of absolute difference,SAD)或误差平方和(a sumof squared error,SSE)来确定。可替选地,在一些实施方式中,基于亮度重建样本402(PLij)与候选亮度样本之间的第一SAD或SSE以及亮度重建样本402(PLij)与候选亮度样本404的相邻亮度样本之间的至少一个第二SAD或SSE的加权和来确定亮度重建样本402(PLij)与每个候选亮度样本404之间的差异。
在一些实施方式中,应用相邻样本1002(图10)来计算CfL预测的DC或AC分量,其可以被进一步简化。此外,在一些实施方式中,应用与当前编码块400紧邻的相邻样本1002的子集(并非全部)来确定目标亮度样本408和目标色度样本418。
在一些实施方式中,顶部相邻编码块406T的底部行和左侧相邻编码块406L的最右列中的每两个相邻亮度样本中的一个被用作候选亮度样本,以针对当前编码块400的每个亮度样本确定目标亮度样本408。具体地,在一些实施方式中(图5),第一亮度样本402位于当前编码块400的偶数列或偶数行。顶部相邻编码块406T的底部行的偶数编号的相邻亮度样本和左侧相邻编码块406L的最右列的偶数编号的相邻亮度样本被用作候选亮度样本404,针对当前编码块400中的第一亮度样本402从候选亮度样本404中选择目标亮度样本408。相反,在一些实施方式中,第一亮度样本402位于当前编码块400的奇数列和奇数行的交叉点处。顶部相邻编码块406T的底部行的奇数编号的相邻亮度样本和左侧相邻编码块406L的最右列的奇数编号的相邻亮度样本被用作候选亮度样本404,针对当前编码块400中的第一亮度样本402从候选亮度样本404中选择目标亮度样本408。此外,接着基于与一个或更多个相邻编码块406(例如,顶部相邻编码块406T、左侧相邻编码块406L)中的目标亮度样本408共位置的目标色度样本418来确定与第一亮度样本402共位置的第一色度样本412。
在一些实施方式中,顶部相邻编码块406T的底部行和左侧相邻编码块的最右列中的每N个亮度样本中的第M个亮度样本被用作(1216)候选亮度样本,从候选亮度样本中选择目标亮度样本,并使用该目标亮度样本来确定与当前编码块400中的第一亮度样本402共位置的第一色度样本。在示例中,M是等于2、3、4、……或N的整数,其中N等于或小于当前编码块400的每行或每列中的亮度样本的总数。在另一示例中,N等于2的整数幂,并且小于顶部相邻编码块406T的底部行或左侧相邻编码块的最右列中的亮度样本的总数。
在一些实施方式中(图6),相邻样本的子集位于顶部相邻编码块406T的底部行的中央部分和左侧相邻编码块406L的最右列的中央部分,并用作从中选择目标亮度样本的候选亮度样本。候选亮度样本包括顶部相邻编码块406T的底部行的中央K个中央亮度样本和左侧相邻编码块406L的最右列的L个中央亮度样本,其中K是大于1的整数。在一些实施方式中,K在编码器106和解码器122中被硬译码。可替选地,在一些实施方式中,在编码器106与解码器122之间传送的比特流中用信号表示K。
在一些实施方式中(图7),从中选择目标亮度样本的候选亮度样本包括位于顶部相邻编码块406T的底部行两端的P个亮度样本的两个集合以及位于左侧相邻编码块406L的最右列两端的Q个亮度样本的两个集合。在示例中,P和Q都等于1。候选亮度样本包括四个亮度样本,四个亮度样本中的每一个位于顶部相邻编码块406T的底部行和左侧相邻编码块406L的最右列的不同端部。
在一些实施方式中,针对第一亮度样本402从中选择目标亮度样本的候选亮度样本基于第一亮度样本402在当前编码块400中的位置而变化(1218)。参照图9A,在一些实施方式中,第一亮度样本402仅具有与当前编码块400相邻的两个候选亮度样本。第一候选亮度样本位于顶部相邻编码块406T的底部行中,并且与同一列中的第一亮度样本402对准。第二候选亮度样本位于左侧相邻编码块406L的最右列中,并且与同一行中的第一亮度样本402对准。参照图8A,在一些实施方式中,第一亮度样本402仅具有与当前编码块400相邻的两个候选亮度样本集合。第一X个候选亮度样本集合位于顶部相邻编码块406T的底部行中,并且具有与同一列中的第一亮度样本402对准的第一中央亮度样本。第二Y个候选亮度样本集合位于左侧相邻编码块406L的最右列中,并且具有与同一行中的第一亮度样本402对准的第二中央亮度样本。X和Y是大于1的正奇数。
在一些实施方式中,目标色度样本418与目标亮度样本408共位置,并在CfL模式下使用式(1)基于目标亮度样本408来确定(1220)。目标色度样本418具有基于目标色度样本408的一个或更多个相邻色度样本确定的DC分量。至少通过平均运算和移位运算来对目标色度样本的一个或更多个相邻色度样本进行处理,而不使用任何除法运算。在一些实施方式中,如下对目标亮度样本的左侧相邻样本应用平均运算:
AverageL=(sum+(heigheight_log2(2)
其中,Sum是左侧相邻样本的和,以及height_log2是块高度的log2值。此外,在一些实施方式中,忽略舍入值height>>1。式(2)简化如下:
AverageL=(sum)>>height_log2 (3)
在一些实施方式中,在确定顶部样本平均值AverageT的过程期间,计算系统如下应用移位运算而不是除法运算:
AverageT=(sum+(width>>1>>width_log2 (4)
其中width_log2是块宽度的log2值。此外,在一些实施方式中,忽略舍入值width>>1。式(4)简化如下:
AverageT=(sum)>>width_log2 (4)
此外,在一些实施方式中,顶部样本平均值AverageL和左侧样本平均值和AverageT如下被求和平均并移位1:
Average=(AverageL+AverageT+((width+height)>>1))>>1 (5)
此外,在一些实施方式中,忽略舍入值(width+height)>>1,使得平均值Average表示如下:
Average=(AverageL+AverageT)>>1 (5)
此外,在一些实施方式中,AverageL与AverageL之和增加了舍入偏移量,并且该舍入偏移量可选地为1、2、……、NR,其中NR为正整数。
在一些实施方式中,针对当前编码块400,块宽度width大于块高度height。使用顶部相邻样本来确定顶部样本平均值AverageT,其近似表示在CfL模式下确定目标色度样本418的DC分量的平均值Average。相反,在一些实施方式中,针对当前编码块400,块高度height大于块宽度width。使用左侧相邻样本来确定左侧样本平均值AverageL,其近似表示在CfL模式下确定目标色度样本418的DC分量的平均值Average。
尽管图12以特定顺序示出了多个逻辑阶段,但不依赖顺序的阶段可以重新排序,并且其他阶段可以组合或拆分。未具体提及的一些重新排序或其他分组对于本领域普通技术人员来说是明显的,因此本文给出的排序和分组并不详尽。此外,应当认识到,这些阶段可以以硬件、固件、软件或其任何组合来实现。
现在转向一些示例实施方式。
(A1)在一个方面,一些实施方式包括视频译码(例如,视频解码)的方法(例如,方法1200)。该方法包括在当前帧中识别(1202)当前编码块和一个或更多个相邻编码块,当前编码块具有第一亮度样本。该方法还包括针对第一亮度样本来识别(1204)一个或更多个相邻编码块内的多个候选亮度样本。一个或更多个相邻编码块以4:2:0色度色彩格式被编码。该方法还包括:在多个候选亮度样本中识别(1206)一个目标亮度样本,并且基于与一个或更多个相邻编码块中的目标亮度样本共位置的目标色度样本来确定(1208)与第一亮度样本共位置的第一色度样本。目标亮度样本包括2×2亮度块。
(A2)在A1的一些实施方式中,每个候选亮度样本(例如,紧紧地)与将当前编码块和相应相邻编码块分隔的相应边界相邻定位(1210)。
(A3)在A1或A2的一些实施方式中,识别目标亮度样本还包括:根据目标亮度样本在量值上比多个候选亮度样本中的任何剩余亮度样本更接近第一亮度样本的确定来识别(1212)目标亮度样本。
(A4)在A1至A3中任一项的一些实施方式中,根据预定义的样本选择策略,一个或更多个相邻编码块包括(1214)顶部相邻编码块和左侧相邻编码块中的至少一个。
(A5)在A4的一些实施方式中,多个候选亮度样本包括顶部相邻编码块的底部行亮度样本或左侧相邻编码块的最右列亮度样本中的所有亮度样本。
(A6)在A4或A5的一些实施方式中,多个候选亮度样本包括(1216)顶部相邻编码块的底部行亮度样本或左侧相邻编码块的最右列亮度样本中的每N个亮度样本中的第M个亮度样本,其中N是大于1的整数,以及M是小于或等于N的正整数。(A7)在A6的一些实施方式中,N等于2的整数幂,并且小于顶部相邻编码块的底部行亮度样本中的亮度样本的总数。
(A8)在A4至A7中任一项的一些实施方式中,多个候选亮度样本包括顶部相邻编码块的底部行亮度样本中间的K个亮度样本的集合或左侧相邻编码块的最右列亮度样本中间的L个亮度样本的集合,其中K和L是正整数。
(A9)在A4至A8中任一项的一些实施方式中,多个候选亮度样本包括位于顶部相邻编码块的底部行亮度样本两端的P个亮度样本的两个集合或位于左侧相邻编码块的最右列亮度样本两端的Q个亮度样本的两个集合,其中P和Q是正整数。
(A10)在A1至A9中任一项的一些实施方式中,预定义样本选择策略(1218)基于当前编码块中的第一亮度样本的位置。根据预定义样本选择策略,至少部分地基于第一亮度样本的位置来识别多个候选亮度样本。(A11)在A10的一些实施方式中,根据预定义样本选择策略,一个或更多个相邻编码块包括顶部相邻编码块或左侧相邻编码块。识别多个候选亮度样本还包括实施以下中至少之一:识别顶部相邻编码块的底部行亮度样本中的包括第一中央亮度样本的奇数X个亮度样本;以及识别左侧相邻编码块的最右列亮度样本中的包括第二中央亮度样本的奇数Y个亮度样本。第一中央亮度样本沿列方向与第一亮度样本对准,以及第二中央亮度样本沿行方向与第一亮度样本对准。
(A12)在A1至A11中任一项的一些实施方式中,方法1200还包括根据下式基于当前编码块的一个或更多个相邻编码块中的目标亮度样本来确定(1220)目标色度样本:
CT=α×LT,AC+CDC (1)
其中,CT是目标色度样本,LT是目标亮度样本,α是线性模型参数,LT,AC是目标亮度样本的AC分量,以及CDC是目标色度样本的DC分量。
(A13)在A1至A12中任一项的一些实施方式中,方法1200还包括基于4:2:0色度色彩格式对当前帧的当前编码块和一个或更多个相邻编码块的多个亮度样本进行子采样。(A14)在A13的一些实施方式中,对多个亮度样本进行子采样还包括:将多个亮度样本分组为多个亮度像素组,多个亮度像素组中的每个亮度像素组包括2×2亮度样本的阵列;并且针对多个亮度像素组中的每一个,从2×2亮度样本的阵列中选择单个亮度样本来表示相应的亮度像素组。
(A15)在A1至A14中任一项的一些实施方式中,方法1200还包括识别当前编码块的编码块模式。根据编码块模式是色度复制模式的确定,基于与当前编码块的一个或更多个相邻编码块中的目标亮度样本共位置的目标色度样本来确定第一色度样本。
(A16)在A1至A15中任一项的一些实施方式中,识别目标亮度样本还包括:根据候选亮度样本的子集与第一亮度样本在量值上具有相同差异并且在量值上比多个候选亮度样本中的任何剩余亮度样本更接近第一亮度样本的确定,从多个候选亮度样本中识别候选亮度样本的子集。识别目标亮度样本还包括基于目标亮度样本与第一亮度样本的距离从候选亮度样本的子集中选择目标亮度样本。(A17)在A16的一些实施方式中,选择目标亮度样本还包括:针对候选亮度样本的子集中的每一个候选亮度样本,确定第一亮度样本与相应候选亮度样本之间的相应距离,并且根据候选亮度样本的子集中的一个候选亮度样本的距离在候选亮度样本的子集的相应距离中最小的确定,选择候选亮度样本的子集中的所述一个候选亮度样本作为目标亮度样本。
(A18)在A1至A17中任一项的一些实施方式中,确定与第一亮度样本共位置的第一色度样本还包括将与目标亮度样本共位置的目标色度样本复制到与第一亮度样本共位置的第一色度样本。
在另一方面,一些实施方式包括计算系统(例如,服务器系统112),计算系统包括控制电路系统(例如,控制电路系统302)和耦接至控制电路系统的存储器(例如,存储器314),存储器存储被配置成由控制电路系统执行的一个或更多个指令集合,一个或更多个指令集合包括用于执行本文所述方法(例如,上文的A1至A18)中的任何方法的指令。
在又一方面,一些实施方式包括存储一个或更多个指令集合的非暂态计算机可读存储介质,所述一个或更多个指令集合由计算系统的控制电路系统执行,所述一个或更多个指令集合包括用于执行本文所述方法(例如,上文的A1至A18)中的任何方法的指令。
应理解,尽管术语“第一”、“第二”等可以在本文中用来描述各种元件,但是这些元件不应该受到这些术语的限制。这些术语只是用来区分一个元件和另一个元件。
本文中使用的术语仅用于描述特定实施方式的目的,并且不旨在限制权利要求。如在实施方式和所附权利要求书的描述中所使用的,单数形式“一(a)”、“一个(an)”和“该”也旨在包括复数形式,除非上下文另外清楚地指示。还将理解,如本文中使用的术语“和/或”是指并涵盖一个或更多个相关联的所列项目的任何和所有可能的组合。还将理解,当在本说明书中使用术语“包括”和/或“包含”时,其指定了所述特征、整数、步骤、操作、元件和/或部件的存在,但并不排除存在或添加一个或更多个其他特征、整数、步骤、操作、元件、部件和/或它们的组。
如本文所使用的,术语“如果”可以根据上下文解释为意指“在……时”或“在……之后”或“响应于确定……”或“根据确定……”或“响应于检测到”所述先决条件为真。类似地,短语“如果确定[所述先决条件为真]”或“如果[所述先决条件为真]”或“在[所述先决条件为真]时”可以根据上下文解释为意指“在确定所述先决条件为真之后”或“响应于确定所述先决条件为真”或“根据确定所述先决条件为真”“在检测到所述先决条件为真之后”或者“响应于检测到所述先决条件为真”。
出于说明的目的,已经参考特定实施方式描述了前述描述。然而,上面的说明性讨论并非旨在穷举或将权利要求限制为所公开的精确形式。鉴于上述教导,许多修改和变型是可能的。选择和描述实施方式是为了最好地说明操作和实际应用的原理,从而使本领域的其他技术人员能够实施。

Claims (20)

1.一种用于对视频数据进行解码的方法,包括:
在当前帧中识别当前编码块和一个或更多个相邻编码块,所述当前编码块具有第一亮度样本;
针对所述第一亮度样本识别所述一个或更多个相邻编码块内的多个候选亮度样本,其中,所述一个或更多个相邻编码块以4:2:0色度色彩格式进行编码;
在所述多个候选亮度样本中识别一个目标亮度样本,所述目标亮度样本包括2×2亮度块;以及
基于与所述一个或更多个相邻编码块中的所述目标亮度样本共位置的目标色度样本来确定与所述第一亮度样本共位置的第一色度样本。
2.根据权利要求1所述的方法,其中,每个候选亮度样本位于与将所述当前编码块和相应相邻编码块分隔的相应边界相邻的位置。
3.根据权利要求1所述的方法,识别所述目标亮度样本还包括:
根据所述目标亮度样本在量值上比所述多个候选亮度样本中的任何剩余亮度样本更接近所述第一亮度样本的确定来识别所述目标亮度样本。
4.根据权利要求1所述的方法,其中,根据预定义的样本选择策略,所述一个或更多个相邻编码块包括顶部相邻编码块和左侧相邻编码块中的至少一个。
5.根据权利要求4所述的方法,其中,所述多个候选亮度样本包括所述顶部相邻编码块的底部行的亮度样本或所述左侧相邻编码块的最右列的亮度样本的所有亮度样本。
6.根据权利要求4所述的方法,其中,所述多个候选亮度样本包括所述顶部相邻编码块的底部行的亮度样本或所述左侧相邻编码块的最右列的亮度样本中的每N个亮度样本中的第M个亮度样本,其中,N是大于1的整数,以及M是小于或等于N的正整数。
7.根据权利要求6所述的方法,其中,N等于2的整数幂,并且小于所述顶部相邻编码块的所述底部行的亮度样本中的亮度样本的总数。
8.根据权利要求4所述的方法,其中,所述多个候选亮度样本包括所述顶部相邻编码块的底部行的亮度样本中间的K个亮度样本的集合或所述左侧相邻编码块的最右列的亮度样本中间的L个亮度样本的集合,其中,K和L是正整数。
9.根据权利要求4所述的方法,其中,所述多个候选亮度样本包括位于所述顶部相邻编码块的底部行的亮度样本两端的P个亮度样本的两个集合或者位于所述左侧相邻编码块的最右列的亮度样本两端的Q个亮度样本的两个集合,其中,P和Q是正整数。
10.根据权利要求1所述的方法,其中,预定义样本选择策略基于所述当前编码块中的所述第一亮度样本的位置,并且根据所述预定义样本选择策略,至少部分地基于所述第一亮度样本的位置来识别所述多个候选亮度样本。
11.根据权利要求10所述的方法,其中,根据所述预定义样本选择策略,所述一个或更多个相邻编码块包括顶部相邻编码块或左侧相邻编码块,识别所述多个候选亮度样本还包括实施以下中至少之一:
识别所述顶部相邻编码块的底部行的亮度样本中的包括第一中央亮度样本的奇数X个亮度样本;以及
识别所述左侧相邻编码块的最右列的亮度样本中的包括第二中央亮度样本的奇数Y个亮度样本;
其中,所述第一中央亮度样本沿列方向与所述第一亮度样本对准,并且所述第二中央亮度样本沿行方向与所述第一亮度样本对准。
12.一种计算系统,包括:
控制电路系统;和
存储器,其存储被配置成由所述控制电路系统执行的一个或更多个程序,所述一个或更多个程序还包括用于执行以下操作的指令:
在当前帧中识别当前编码块和一个或更多个相邻编码块,所述当前编码块具有第一亮度样本;
针对所述第一亮度样本识别所述一个或更多个相邻编码块内的多个候选亮度样本,其中,所述一个或更多个相邻编码块以4:2:0色度色彩格式进行编码;
在所述多个候选亮度样本中识别一个目标亮度样本,所述目标亮度样本包括2×2亮度块;以及
基于与所述一个或更多个相邻编码块中的所述目标亮度样本共位置的目标色度样本来确定与所述第一亮度样本共位置的第一色度样本。
13.根据权利要求12所述的计算系统,所述一个或更多个程序还包括用于执行以下操作的指令:
根据下式基于所述当前编码块的所述一个或更多个相邻编码块中的所述目标亮度样本来确定所述目标色度样本:
CT=α×LT,AC+CDC
其中,CT是所述目标色度样本,LT是所述目标亮度样本,α是线性模型参数,LT,AC是所述目标亮度样本的AC分量,以及CDC是所述目标色度样本的DC分量。
14.根据权利要求12所述的计算系统,所述一个或更多个程序还包括用于执行以下操作的指令:
基于所述4:2:0色度色彩格式对所述当前帧的所述当前编码块和所述一个或更多个相邻编码块的多个亮度样本进行子采样。
15.根据权利要求14所述的计算系统,其中,对所述多个亮度样本进行子采样还包括:
将所述多个亮度样本分组为多个亮度像素组,所述多个亮度像素组中的每个亮度像素组包括2×2亮度样本的阵列;以及
针对所述多个亮度像素组中的每一个,从所述2×2亮度样本的阵列中选择单个亮度样本来表示相应的亮度像素组。
16.一种非暂态计算机可读存储介质,其存储由计算系统的控制电路系统执行的一个或更多个程序,所述一个或更多个程序包括用于执行以下操作的指令:
在当前帧中识别当前编码块和一个或更多个相邻编码块,所述当前编码块具有第一亮度样本;
针对所述第一亮度样本识别所述一个或更多个相邻编码块内的多个候选亮度样本,其中,所述一个或更多个相邻编码块以4:2:0色度色彩格式进行编码;
在所述多个候选亮度样本中识别一个目标亮度样本,所述目标亮度样本包括2×2亮度块;以及
基于与所述一个或更多个相邻编码块中的所述目标亮度样本共位置的目标色度样本来确定与所述第一亮度样本共位置的第一色度样本。
17.根据权利要求16所述的非暂态计算机可读存储介质,所述一个或更多个程序还包括用于执行以下操作的指令:
识别所述当前编码块的编码块模式;
其中,根据所述编码块模式是色度复制模式的确定,基于与所述当前编码块的所述一个或更多个相邻编码块中的所述目标亮度样本共位置的所述目标色度样本来确定所述第一色度样本。
18.根据权利要求16所述的非暂态计算机可读存储介质,识别所述目标亮度样本还包括:
根据候选亮度样本的子集与所述第一亮度样本在量值上具有相同差异并且在量值上比所述多个候选亮度样本中的任何剩余亮度样本更接近所述第一亮度样本的确定,从所述多个候选亮度样本中识别所述候选亮度样本的子集;以及
基于所述目标亮度样本与所述第一亮度样本的距离,从所述候选亮度样本的子集中选择所述目标亮度样本。
19.根据权利要求18所述的非暂态计算机可读存储介质,选择所述目标亮度样本还包括:
针对所述候选亮度样本的子集中的每一个候选亮度样本,确定所述第一亮度样本与相应候选亮度样本之间的相应距离;
根据所述候选亮度样本的子集中的一个候选亮度样本的距离在所述候选亮度样本的子集的相应距离中最小的确定,选择所述候选亮度样本的子集中的所述一个候选亮度样本作为所述目标亮度样本。
20.根据权利要求16所述的非暂态计算机可读存储介质,其中,确定与所述第一亮度样本共位置的所述第一色度样本还包括:
将与所述目标亮度样本共位置的所述目标色度样本复制到与所述第一亮度样本共位置的所述第一色度样本。
CN202380011059.8A 2022-05-17 2023-05-03 用于在视频编码的帧内预测模式下确定色度样本的系统和方法 Pending CN117426092A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202263343024P 2022-05-17 2022-05-17
US63/343,024 2022-05-17
US18/142,414 2023-05-02
US18/142,414 US20230379479A1 (en) 2022-05-17 2023-05-02 Systems and methods for determining chroma samples in an intra prediction mode of video coding
PCT/US2023/020896 WO2023224810A1 (en) 2022-05-17 2023-05-03 Systems and methods for determining chroma samples in an intra prediction mode of video coding

Publications (1)

Publication Number Publication Date
CN117426092A true CN117426092A (zh) 2024-01-19

Family

ID=88791189

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202380011059.8A Pending CN117426092A (zh) 2022-05-17 2023-05-03 用于在视频编码的帧内预测模式下确定色度样本的系统和方法

Country Status (3)

Country Link
US (1) US20230379479A1 (zh)
CN (1) CN117426092A (zh)
WO (1) WO2023224810A1 (zh)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7342118B2 (ja) * 2018-10-12 2023-09-11 ウィルス インスティテュート オブ スタンダーズ アンド テクノロジー インコーポレイティド 多重仮定予測を用いるビデオ信号処理方法及び装置
US20220086428A1 (en) * 2018-12-31 2022-03-17 Electronics And Telecommunications Research Institute Image encoding/decoding method and apparatus, and recording medium storing bitstream

Also Published As

Publication number Publication date
US20230379479A1 (en) 2023-11-23
WO2023224810A1 (en) 2023-11-23

Similar Documents

Publication Publication Date Title
CN111869212B (zh) 视频解码方法、装置和可读介质
CN113614736A (zh) 视频编解码的方法和装置
CN111989918A (zh) 用于视频压缩中多线帧内预测的方法及装置
CN112042188A (zh) 用于视频压缩中非正方形块的帧内预测的方法和装置
CN113678441A (zh) 跨分量滤波的方法和装置
CN110708558B (zh) 变换类型的表示方法和设备
CN113615187A (zh) 用于改进的隐式变换选择的方法和装置
CN111988619A (zh) 视频编解码方法、装置、计算机设备和存储介质
CN110944185A (zh) 视频解码的方法和装置、计算机设备及存储介质
CN113597763A (zh) 视频编解码的方法及装置
CN113557527A (zh) 通用视频编解码中色彩变换的方法和装置
CN114270836A (zh) 视频编解码的颜色转换
CN113994676A (zh) 视频编解码方法和装置
CN111901609A (zh) 视频解码的方法和装置、计算机设备和存储介质
CN111953996A (zh) 视频解码的方法和装置
CN111726627A (zh) 视频解码方法、装置、计算机设备和存储介质
KR20220085836A (ko) 비디오 코딩 방법 및 장치
CN117378202A (zh) 用于自适应mvd分辨率的双边匹配的系统和方法
CN115428024A (zh) 解耦变换分割技术
US20230379479A1 (en) Systems and methods for determining chroma samples in an intra prediction mode of video coding
CN111757122A (zh) 视频解码方法和装置、计算机设备和存储介质
US20230388535A1 (en) Systems and methods for combining subblock motion compensation and overlapped block motion compensation
US11856225B2 (en) Methods for efficient application of LGT
US20240129461A1 (en) Systems and methods for cross-component sample offset filter information signaling
US20240179304A1 (en) Systems and methods for signaling of downsampling filters for chroma from luma intra prediction mode

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication