CN117581533A - 用于视频处理的方法、设备和介质 - Google Patents

用于视频处理的方法、设备和介质 Download PDF

Info

Publication number
CN117581533A
CN117581533A CN202280037957.6A CN202280037957A CN117581533A CN 117581533 A CN117581533 A CN 117581533A CN 202280037957 A CN202280037957 A CN 202280037957A CN 117581533 A CN117581533 A CN 117581533A
Authority
CN
China
Prior art keywords
block
intra
mode
video
cost
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280037957.6A
Other languages
English (en)
Inventor
王洋
张凯
张莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Douyin Vision Co Ltd
ByteDance Inc
Original Assignee
Douyin Vision Co Ltd
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Douyin Vision Co Ltd, ByteDance Inc filed Critical Douyin Vision Co Ltd
Publication of CN117581533A publication Critical patent/CN117581533A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution

Abstract

本公开的实施例提供了一种用于处理视频数据的解决方案。提出了一种用于处理视频数据的方法,该方法包括:在视频的当前块和视频的比特流之间的转换期间,基于至少一个第一参数来执行用于所述当前块的帧内预测,至少一个第一参数不同于用于常规角度模式的帧内预测的至少一个第二参数,至少一个扩展角度模式被用于所述当前块;以及基于所述帧内预测的模式执行所述转换。与传统的解决方案相比,所提出的方法可以有利地提高编码效率。

Description

用于视频处理的方法、设备和介质
技术领域
本公开的实施例总体上涉及视频编码技术,并且更具体地,涉及帧内预测模式导出。
背景技术
当今,数字视频能力正在应用于人们生活的各个方面。多种类型的视频压缩技术,如运动图片专家组(MPEG)-2、MPEG-4、ITU-TH.263、国际电信联盟-电信标准化部门(ITU-T)H.264/MPEG-4Part 10高级视频编码(AVC)、ITU-T H.265高效视频编码(HEVC)标准、通用视频编码(VVC)标准,已被提出用于视频编码/解码。然而,传统视频编码技术的编码效率普遍很低,这是不可取的。
发明内容
本公开的实施例提供用于帧内预测模式导出的解决方案。
在第一方面,提出了一种处理视频数据的方法。该方法包括:在视频的当前块和所述视频的比特流之间的转换期间,基于至少一个第一参数来执行用于所述当前块的帧内预测,所述至少一个第一参数不同于用于常规角度模式的帧内预测的至少一个第二参数,至少一个扩展角度模式被用于所述当前块;以及基于所述帧内预测的模式执行所述转换。根据本公开的第一方面所述的方法使得可以导出扩展角度模式并被用于当前块。这样,提高了当前块使用的帧内预测模式的精度,并且由此提高了编码效率。
在第二方面,提出了另一种处理视频数据的方法。该方法包括:在视频的当前块和视频的比特流之间的转换期间,确定扩展角度模式是否被用于所述当前块。该方法还包括:基于所述确定,在帧内预测过程期间应用编码工具,在所述帧内预测过程期间用于所述当前块的帧内预测模式被确定。该方法还包括:基于所述帧内预测模式执行所述转换。根据本公开的第二方面所述的方法,基于确定扩展角度模式是否被用于当前块的确定来应用编码工具,这使得编码工具的应用更加合理,并且由此提高了编码效率。
在第三方面中,提出了另一种处理视频数据的方法。该方法包括:基于当前块的模板对视频的所述当前块执行过程,所述过程是以下之一:细化过程、对参考样本滤波的过程或确定被定位在分数位置的样本的过程。该方法还包括:在所述当前块和所述视频的比特流之间执行转换。根据本公开的第三方面所述的方法基于当前块的模板执行细化过程,这使得细化过程是按需执行的。
在第四方面,提出了另一种处理视频数据的方法。该方法包括:确定用于视频的第一块的第一帧内预测模式。该方法还包括:基于所述第一帧内预测模式,确定用于所述视频的第二块的第二帧内预测模式,包括以下之一:如果所述第一块和所述第二块在同一视频中,则在确定用于所述第二块的所述第二帧内预测模式期间排除所述第一帧内预测模式;或者如果所述第一块和所述第二块处于不同的视频中,则在确定用于所述第二块的所述第二帧内预测模式期间,包括所述第一帧内预测模式。该方法还包括:基于所述第一帧内预测模式和所述第二帧内预测模式执行所述视频的所述第一块和所述第二块和比特流之间的转换。根据本公开的第四方面所述的方法利用针对第一块的导出帧内预测模式来导出针对第二块的另一帧内预测模式,使得另一帧内预测模式的确定更加合理,并且因此提高了编码效率。
在第五方面中,提出了一种用于处理视频数据的装置。该装置包括处理器和其上具有指令的非暂时性存储器,其中,所述指令在由所述处理器执行时使所述处理器执行根据本公开的第一方面、第二方面、第三方面或第四方面所述的方法。
在第六方面,提出了一种非暂时性计算机可读记录介质。该非暂时性计算机可读存储介质存储使处理器执行根据本公开的第一方面、第二方面、第三方面或第四方面所述的方法的指令。
在第七方面中,提出了一种非暂时性计算机可读记录介质。该非暂时性计算机可读记录介质存储由视频处理设备通过执行方法生成的视频的比特流,其中该方法包括:基于至少一个第一参数来执行用于视频的当前块的帧内预测,所述至少一个第一参数不同于被用于常规角度模式的帧内预测的至少一个第二参数,所述当前块以至少一个扩展角度模式而被使用;以及基于所述执行生成所述视频的比特流。
在第八方面中,提出了一种非暂时性计算机可读记录介质。该非暂时性计算机可读记录介质存储由视频处理设备通过执行方法生成的视频的比特流,其中,该方法包括:确定扩展角度模式是否被用于所述视频的当前块;基于所述确定,在帧内预测过程期间应用编码工具,在所述帧内预测过程期间,用于所述当前块的帧内预测模式被确定;以及基于所述确定和所述应用生成所述比特流。
在第九方面中,提出了一种非暂时性计算机可读记录介质。该非暂时性计算机可读记录介质存储由视频处理设备通过执行的方法生成的视频的比特流,其中该方法包括:基于当前块的模板对所述视频的所述当前块执行过程,所述过程是以下之一:细化过程、对参考样本滤波的过程或确定定位在分数位置的样本的过程;以及基于所述执行来生成所述比特流。
在第十方面,提出了一种非暂时性计算机可读记录介质。该非暂时性计算机可读记录介质存储由视频处理设备通过执行方法生成的视频的比特流,其中,该方法包括:确定用于所述视频的第一块的第一帧内预测模式;基于所述第一帧内预测模式,确定用于所述视频的第二块的第二帧内预测模式,包括以下之一:如果所述第一块和所述第二块在同一视频中,则在确定用于所述第二块的所述第二帧内预测模式期间排除所述第一帧内预测模式;或者如果所述第一块和所述第二块处于不同的视频中,则在确定用于所述第二块的所述第二帧内预测模式期间,包括所述第一帧内预测模式;以及基于所述确定生成所述比特流。
在第十一方面中,提出了一种用于存储视频的比特流的方法,该方法包括:基于至少一个第一参数来执行用于视频的当前块的帧内预测,所述至少一个第一参数不同于被用于常规角度模式的帧内预测的至少一个第二参数,所述当前块以至少一个扩展角度模式而被使用;基于所述执行生成所述视频的比特流;以及将所述比特流存储在非暂时性计算机可读记录介质中。
在第十二方面,提出了一种用于存储视频的比特流的方法,该方法包括:确定扩展角度模式是否被用于所述视频的当前块;基于所述确定,在帧内预测过程期间应用编码工具,在所述帧内预测过程期间,用于所述当前块的帧内预测模式被确定;基于所述确定和所述应用生成所述比特流;以及将所述比特流存储在非暂时性计算机可读记录介质中。
在第十三方面,提出了一种用于存储视频的比特流的方法,该方法包括:基于当前块的模板对所述视频的所述当前块执行过程,所述过程是以下之一:细化过程、对参考样本滤波的过程或确定定位在分数位置的样本的过程;基于所述执行生成所述比特流;以及将所述比特流存储在非暂时性计算机可读记录介质中。
在第十四方面中,提出了另一种用于存储视频的比特流的方法。该方法包括:确定用于所述视频的第一块的第一帧内预测模式;基于所述第一帧内预测模式,确定用于所述视频的第二块的第二帧内预测模式,包括以下之一:如果所述第一块和所述第二块在同一视频中,则在确定用于所述第二块的所述第二帧内预测模式期间排除所述第一帧内预测模式;或者如果所述第一块和所述第二块处于不同的视频中,则在确定用于所述第二块的所述第二帧内预测模式期间,包括所述第一帧内预测模式;基于所述确定生成所述比特流以及将所述比特流存储在非暂时性计算机可读记录介质中。
本发明内容旨在以简化的形式介绍下面在具体实施方式中进一步描述的一些概念。本发明内容不旨在标识所要求保护的主题的关键特征或基本特征,也不旨在用于限制所要求保护的主题的范围。
附图说明
通过参考附图的以下详细描述,本公开的示例实施例的上述和其它目标、特征和优点将变得更加清楚,在本公开的示例实施例中,相同的附图标记通常指代相同的部件。
图1示出了根据本公开的一些实施例的示例视频编码系统的框图;
图2示出了根据本公开的一些实施例的示例视频编码器的框图;
图3示出了根据本公开的一些实施例的示例视频解码器的框图;
图4示出帧内预测模式的示意图;
图5示出了用于宽角度帧内预测的参考样本的示意图;
图6示出了宽角度帧内预测的示意图;
图7示出了样本的位置的示意图;
图8A示出了应用于对角线和相邻角度帧内模式(对角线右上模式)的由PDPC使用的样本定义的示意图;
图8B示出了应用于对角线和相邻角度帧内模式(对角线左下模式)由PDPC使用的样本定义的示意图;
图8C示出了应用于对角线和相邻角度帧内模式(相邻对角线右上模式)的由PDPC使用的样本定义的示意图;
图8D示出了应用于对角线和相邻角度帧内模式(相邻对角线左下模式)的由PDPC使用的样本定义的示意图;
图9示出了与预测块邻近的四个参考行的示例的示意图;
图10A示出了取决于块大小的子划分过程的示意图;
图10B示出了取决于块大小的子划分过程的示意图;
图11示出了矩阵加权帧内预测过程的示意图;
图12示出了目标样本、模板样本和模板的参考样本的示意图;
图13示出了在其上执行梯度分析的一组选定像素的示意图;
图14示出了3x3 Sobel梯度滤波器与模板的卷积的示意图;
图15示出了帧内预测方向(信息性)的示意图;
图16示出了传统角度IPM和扩展角度IPM的示意图;
图17示出了根据本公开的一些实施例的用于视频处理的方法的流程图;
图18示出了根据本公开的一些实施例的用于视频处理的另一方法的流程图;
图19示出了根据本公开的一些实施例的用于视频处理的另一方法的流程图;
图20示出了根据本公开的一些实施例的用于视频处理的另一方法的流程图;
图21示出了其中可以实现本公开的各种实施例的计算设备的框图。
在整个图纸中,相同或相似的参考数字通常指相同或相似的元素。
具体实施方式
现在将参考一些实施例来描述本公开的原理。应当理解的是,描述这些实施例仅出于说明并且帮助本领域技术人员理解和实施本公开的目的,而不暗示对本公开的范围的任何限制。除了下文所述的方式之外,本文所描述的公开内容还可以以各种方式实施。
在以下描述和权利要求中,除非另有定义,否则在本文中使用的所有科学术语和技术术语具有与本公开所属领域的普通技术人员通常理解的含义相同的含义。
本公开中提及的“一个实施例”、“实施例”、“示例实施例”等指示所描述的实施例可以包括特定的特征、结构或特性,但是并非每个实施例都必须包括该特定的特征、结构或特性。此外,这些短语不一定指同一实施例。此外,当结合示例实施例描述特定的特征、结构或特性时,无论是否明确描述,认为影响与其他实施例相关的这种特征、结构或特性在本领域技术人员的知识范围内。
应当理解的是,尽管术语“第一”和“第二”等可以用于描述各种元素,但这些元素不应受限于这些术语。这些术语仅用于区分一个元素与另一个元素。例如,第一元素可以被称为第二元素,类似地,第二元素可以被称为第一元素,而不脱离示例实施例的范围。如本文中所使用的,术语“和/或”包括一个或多个所列术语的任何和所有组合。
本文中所使用的术语仅用于描述特定实施例的目的,并不旨在限制示例实施例。如本文中所用的,单数形式“一”、“一个”和“该”也旨在包括复数形式,除非上下文另有明确指示。还应理解,术语“包括”、“包含”和/或“具有”在本文中使用时表示存在所述特征、元素和/或组件等,但不排除一个或多个其他特征、元素、组件和/或其组合的存在或添加。
示例环境
图1是图示可以利用本公开的技术的示例视频编解码系统100的框图。如所示出的,视频编解码系统100可以包括源设备110和目的设备120。源设备110也可以称为视频编码设备,并且目的设备120也可以称为视频解码设备。在操作中,源设备110可以被配置为生成经编码的视频数据,并且目的设备120可以被配置为对由源设备110生成的经编码的视频数据进行解码。源设备110可以包括视频源112、视频编码器114和输入/输出(I/O)接口116。
视频源112可以包括诸如视频捕获设备之类的源。视频捕获设备的示例包括但不限于从视频内容提供商接收视频数据的接口、用于生成视频数据的计算机图形系统和/或其组合。
视频数据可以包括一个或多个图片。视频编码器114对来自视频源112的视频数据进行编码,以生成码流。码流可以包括形成视频数据的编码表示的位序列。码流可以包括编码图片和相关联的数据。编码图片是图片的编码表示。相关联的数据可以包括序列参数集、图片参数集和其他语法结构。I/O接口116可以包括调制器/解调器和/或发送器。经编码的视频数据可以通过网络130A经由I/O接口116直接传输至目的设备120。经编码的视频数据也可以存储在存储介质/服务器130B上,以供目的设备120访问。
目的设备120可以包括I/O接口126、视频解码器124和显示设备122。I/O接口126可以包括接收器和/或调制解调器。I/O接口126可以从源设备110或存储介质/服务器130B获取经编码的视频数据。视频解码器124可以对经编码的视频数据进行解码。显示设备122可以向用户显示经解码的视频数据。显示设备122可以与目的设备120集成,或者可以在目的设备120的外部,该目的设备120被配置为与外部显示设备接口连接。
视频编码器114和视频解码器124可以根据视频压缩标准操作,诸如高效视频编解码(HEVC)标准、通用视频编解码(VVC)标准和其他现有和/或将来的标准。
图2是示出根据本公开的一些实施例的视频编码器200的示例的方框图,视频编码器200可以是图1所示的系统100中的视频编码器114的示例。
视频编码器200可以被配置为实现本公开的任何或所有技术。在图2的示例中,视频编码器200包括多个功能组件。本公开中描述的技术可以在视频编码器200的各个组件之间共享。在一些示例中,处理器可以被配置为执行本公开中描述的任何或所有技术。
在一些实施例中,视频编码器200可以包括划分单元201、预测单元202、残差生成单元207、变换单元208、量化单元209、反量化单元210、反变换单元211、重建单元212、缓冲213和熵编解码单元214,该预测单元202可以包括模式选择单元203、运动估计单元204、运动补偿单元205和帧内预测单元206。
在其他示例中,视频编码器200可以包括更多、更少或不同的功能组件。在一个示例中,预测单元202可以包括块内复制(IBC)单元。IBC单元可以在IBC模式中执行预测,其中至少一个参考图片是当前视频块所位于的图片。
此外,尽管一些组件(诸如运动估计单元204和运动补偿单元205)可以被集成,但是为了解释的目的,这些组件在图2的示例中被分离地示出。
划分单元201可以将图片划分成一个或多个视频块。视频编码器200和视频解码器300(其将在以下详细讨论)可以支持各种视频块大小。
模式选择单元203可以例如基于误差结果来选择多种编码模式(帧内编码或帧间编码)中的一种编码模式,并且将所产生的帧内编解码块或帧间编解码块提供给残差生成单元207以生成残差块数据,并且提供给重建单元212以重建编解码块以用作参考图片。在一些示例中,模式选择单元203可以选择帧内和帧间预测(CIIP)模式的组合,其中预测基于帧间预测信号和帧内预测信号。在帧间预测的情况下,模式选择单元203还可以为块选择针对运动矢量的分辨率(例如,亚像素精度或整数像素精度)。
为了对当前视频块执行帧间预测,运动估计单元204可以通过将来自缓冲213的一个或多个参考帧与当前视频块进行比较来生成针对当前视频块的运动信息。运动补偿单元205可以基于运动信息和来自缓冲213的除了与当前视频块相关联的图片之外的图片的经解码样本,来确定针对当前视频块的预测视频块。
运动估计单元204和运动补偿单元205可以对当前视频块执行不同的操作,例如,取决于当前视频块是在I条带、P条带还是B条带中。如本文中使用的,“I条带”可以是指由宏块构成的图片的一部分,所有宏块均基于同一图片内的宏块。此外,如本文中使用的,在一些方面中,“P条带”和“B条带”可以是指由独立于同一图片中的宏块的宏块构成的图片的部分。
在一些示例中,运动估计单元204可以对当前视频块执行单向预测,并且运动估计单元204可以搜索列表0或列表1的参考图片,以寻找针对当前视频块的参考视频块。运动估计单元204然后可以生成参考索引和运动矢量,该参考索引指示列表0或列表1中的包含参考视频块的参考图片,并且该运动矢量指示当前视频块与参考视频块之间的空间位移。运动估计单元204可以输出参考索引、预测方向指示符和运动矢量作为当前视频块的运动信息。运动补偿单元205可以基于由当前视频块的运动信息指示的参考视频块来生成当前视频块的预测视频块。
备选地,在其他示例中,运动估计单元204可以对当前视频块执行双向预测。运动估计单元204可以搜索列表0中的参考图片以寻找针对当前视频块的参考视频块,并且还可以搜索列表1中的参考图片以寻找针对当前视频块的另一参考视频块。运动估计单元204然后可以生成多个参考索引和多个运动矢量,该多个参考索引指示列表0和列表1中的包含多个参考视频块的多个参考图片,并且该多个运动矢量指示在多个参考视频块与当前视频块之间的多个空间位移。运动估计单元204可以输出当前视频块的多个参考索引和多个运动矢量以作为当前视频块的运动信息。运动补偿单元205可以基于由当前视频块的运动信息指示的多个参考视频块来生成针对当前视频块的预测视频块。
在一些示例中,运动估计单元204可以输出完整的运动信息集,以用于解码器的解码处理。备选地,在一些实施例中,运动估计单元204可以参考另一视频块的运动信息来通过信号传输当前视频块的运动信息。例如,运动估计单元204可以确定当前视频块的运动信息与邻近视频块的运动信息足够相似。
在一个示例中,运动估计单元204可以在与当前视频块相关联的语法结构中向视频解码器300指示一值,该值指示当前视频块具有与另一视频块相同的运动信息。
在另一示例中,运动估计单元204可以在与当前视频块相关联的语法结构中标识另一视频块和运动矢量差(MVD)。运动矢量差指示在当前视频块的运动矢量与所指示的视频块的运动矢量之间的差异。视频解码器300可以使用所指示的视频块的运动矢量以及运动矢量差来确定当前视频块的运动矢量。
如上所讨论的,视频编码器200可以以预测性的方式通过信号传输运动矢量。可以由视频编码器200实现的预测信令技术的两个示例包括高级运动矢量预测(AMVP)和合并模式信令。
帧内预测单元206可以对当前视频块执行帧内预测。当对当前视频块执行帧内预测时,帧内预测单元206可以基于同一图片中其他视频块的经解码样本来生成针对当前视频块的预测数据。针对当前视频块的预测数据可以包括预测视频块和各个语法元素。
残差生成单元207可以通过从当前视频块中减去(例如,由减号指示)当前视频块的(多个)预测视频块来生成针对当前视频块的残差数据。当前视频块的残差数据可以包括对应于当前视频块中样本的不同样本部分的残差视频块。
在其他示例中,例如在跳过模式中,针对当前视频块可以不存在针对当前视频块的残差数据,并且残差生成单元207可以不执行减去操作。
变换单元208可以通过将一个或多个变换应用于与当前视频块相关联的残差视频块,来生成针对当前视频块的一个或多个变换系数视频块。
在变换单元208生成与当前视频块相关联的变换系数视频块之后,量化单元209可以基于与当前视频块相关联的一个或多个量化参数(QP)值来量化与当前视频块相关联的变换系数视频块。
反量化单元210和反变换单元211可以分别对变换系数视频块应用反量化和反变换,以从变换系数视频块重建残差视频块。重建单元212可以将经重建的残差视频块添加到来自由预测单元202生成的一个或多个预测视频块的对应样本,以产生与当前视频块相关联的重建视频块,以供存储在缓冲213中。
在重建单元212重建视频块之后,可以执行环路滤波操作以减少视频块中的视频块效应伪像。
熵编解码单元214可以从视频编码器200的其他功能组件接收数据。当数据被接收时,熵编解码单元214可以执行一个或多个熵编码操作,以生成熵编码数据并且输出包括该熵编码数据的码流。
图3是示出根据本公开的一些实施例的视频解码器300的示例的方框图,视频解码器300可以是图1所示的系统100中的视频解码器124的示例。
视频解码器300可以被配置为执行本公开的任何或所有技术。在图3的示例中,视频解码器300包括多个功能组件。本公开中描述的技术可以在视频解码器300的各个组件之间共享。在一些示例中,处理器可以被配置为执行本公开中描述的任何或所有技术。
在图3的示例中,视频解码器300包括熵解码单元301、运动补偿单元302、帧内预测单元303、反量化单元304、反变换单元305、以及重建单元306和缓冲307。在一些示例中,视频解码器300可以执行通常与关于视频编码器200所描述的编码过程相对的解码过程。
熵解码单元301可以取回经编码的码流。经编码的码流可以包括经熵编码的视频数据(例如,经编码的视频数据块)。熵解码单元301可以对经熵编码的视频数据进行解码,并且运动补偿单元302可以从经熵解码的视频数据中确定运动信息,该运动信息包括运动矢量、运动矢量精度、参考图片列表索引和其他运动信息。运动补偿单元302可以例如通过执行AMVP和合并模式来确定该信息。AMVP被使用,包括基于邻近PB的数据和参考图片得出数个最可能的候选项。运动信息通常包括水平和竖直运动矢量位移值、一个或两个参考图片索引,并且在B条带中的预测区域的情况下,还包括哪个参考图片列表与每个索引相关联的标识。如本文所使用的,在一些方面中,“合并模式”可以是指从空间或时间上邻近的块中导出运动信息。
运动补偿单元302可以产生运动补偿块,可能地基于插值滤波器来执行内插。针对以亚像素精度被使用的插值滤波器的标识符可以被包括在语法元素中。
运动补偿单元302可以使用由视频编码器200在视频块的编码期间使用的插值滤波器来计算用于参考块的亚整数像素的内插值。运动补偿单元302可以根据接收到的语法信息来确定由视频编码器200使用的插值滤波器,并且运动补偿单元302可以使用插值滤波器来产生预测块。
运动补偿单元302可以使用至少部分语法信息来确定用于编码经编码视频序列的(多个)帧和/或(多个)条带的块的大小、描述经编码视频序列的图片的每个宏块如何被划分的划分信息、指示每个划分如何被编码的模式、针对每个帧间编解码块的一个或多个参考帧(和参考帧列表)、以及对经编码视频序列进行解码的其他信息。如本文中所使用的,在一些方面,“条带”可以是指在熵编码、信号预测和残差信号重建方面可以独立于同一图片的其他条带而被解码的数据结构。条带可以是整个图片,或者也可以是图片的区域。
帧内预测单元303可以使用例如在码流中接收的帧内预测模式,以从空间邻近块形成预测块。反量化单元304反量化(即,去量化)在码流中提供的、并且由熵解码单元301解码的量化视频块系数。反变换单元305应用反变换。
重建单元306可以例如通过将残差块与由运动补偿单元302或帧内预测单元303生成的相应预测块相加来获得经解码的块。如果需要的话,还可以应用去块效应滤波器以对经解码的块进行滤波,以便去除块效应伪像。经解码的视频块随后被存储在缓冲307中,缓冲307为后续运动补偿/帧内预测提供参考块,并且缓冲307还产生经解码的视频以供在显示设备上呈现。
下文将详细描述本公开的一些示例性实施例。应当注意,在本文件中使用章节标题是为了便于理解,而不是将章节中公开的实施例仅限于该章节。此外,尽管参考通用视频编解码或其他特定视频编解码器描述了一些实施例,但是所公开的技术也适用于其他视频编解码技术。此外,尽管一些实施例详细描述了视频编码步骤,但是应当理解的是取消编码的相应解码步骤将由解码器实现。此外,术语视频处理包括视频编码或压缩、视频解码或解压缩以及视频转码,在该视频转码中视频像素被从一种压缩格式表示为另一种压缩格式或以不同的压缩码率表示。
1.概述
本发明涉及视频编解码技术。具体地,本发明与方向更密集的角度预测模式有关,并且涉及使用先前解码的块来导出帧内预测模式的编解码工具和其他编解码工具。它可以应用于现有的视频编解码标准,如HEVC或或者最近最终确定的标准(通用视频编码VVC)。它也可以适用于未来的视频编解码标准或视频编解码器。
2.背景
视频编解码标准主要是通过众所周知的ITU-T和ISO/IEC标准的发展而发展起来。ITU-T制作了H.261和H.263,ISO/IEC制作了MPEG-1和MPEG-4视觉(Visual),这两个组织联合制作了H.264/MPEG-2视频和H.264/MMPEG-4高级视频编解码(AVC)以及H.264/HEVC标准。自从H.262,视频编解码标准基于混合视频编解码结构,其中利用了时间预测加变换编解码。为了探索HEVC之外的未来视频编解码技术,VCEG和MPEG于2015年联合成立了联合视频探索团队(JVET)。此后,JVET采用了许多新方法,并将其放入名为联合探索模型(JEM)的参考软件中。2018年4月,VCEG(Q6/16)和ISO/IEC JTC1 SC29/WG11(MPEG)之间的联合视频专家组(JVET)被创建,以致力于VVC标准,其目标是与HEVC相比降低50%比特率。
2.1典型视频编解码器的编码流程
VVC编码器框图的一个例子包含三个环内(in-loop)滤波块:去块滤波器(DF)、样本自适应偏移(SAO)和ALF。与使用预定义滤波器的DF不同,SAO和ALF利用当前图片的原始样本,分别通过添加偏移量和通过应用有限冲激响应(FIR)滤波器来减少原始样本和重建样本之间的均方误差,其中编码侧信息通过信号发送偏移和滤波器系数。ALF位于每个图片的最后处理阶段,并且可以被视为一种尝试获取和修复先前阶段所产生的伪影的工具。
2.2具有67个帧内预测模式的帧内模式编解码
为了捕捉自然视频中呈现的任意边缘方向,定向帧内模式的数量从HEVC中使用的33个扩展到65个,如图4所示,平面模式和DC模式保持不变。这些密集的定向帧内预测模式适用于所有块大小并且适用于亮度帧内预测和色度帧内预测二者。
在HEVC中,每个帧内编解码块都具有正方形形状,并且其每条边的长度是2的幂。因此,不需要除法运算来使用DC模式生成帧内预测器。在VVC中,块可以具有矩形形状,这在一般情况下需要使用每个块的除法运算。为了避免针对DC预测的除法运算,仅使用较长边来计算非正方形块的平均值。
2.2.1宽角度帧内预测
尽管在VVC中定义了67个模式,但是用于给定帧内预测模式索引的精确预测方向进一步取决于块形状。传统的角度帧内预测方向定义为沿顺时针方向从45度到-135度。在VVC中,几种传统的角度帧内预测模式被自适应地替换为非正方形块的宽角度帧内预测模式。使用原始模式索引来通知被替换的模式,原始模式索引在解析后被重新映射到宽角度模式的索引。帧内预测模式的总数不变,即67,并且帧内模式编解码方法不变。
为了支持这些预测方向,定义了长度为2W+1的顶部参考和长度为2H+1的左侧参考,如图5所示。
宽角度方向模式中被替换的模式的数目取决于块的纵横比。被替代的帧内预测模式如表2-1所示。
表2-1被宽角度模式替代的帧内预测模式
如图6所示,在宽角度帧内预测的情况下,两个垂直的邻近预测样本可以使用两个不邻近的参考样本(这示出了在方向上超过45的情况下的不连续性问题)。因此,将低通参考样本滤波器和侧平滑应用于宽角度预测,以减少所增加的间隙Δpα带来的负面影响。如果宽角度模式代表非分数偏移。宽角度模式中有8种模式满足这一条件,它们是[-14,-12,-10,-6,72,76,78,80]。当通过这些模式预测块时,直接复制参考缓冲区中的样本,而不应用任何插值。通过这种修改,需要进行平滑处理的样本数量减少了。此外,它将对齐传统预测模式和宽角度模式中的非分数模式的设计。
在VVC中,支持4:2:2和4:4:4色度格式以及4:2:0色度格式。4:2:2色度格式的色度导出模式(DM)导出表最初从HEVC移植,将条目的数量从35扩展到67,以与帧内预测模式的扩展对齐。由于HEVC规范不支持低于-135度和超过45度的预测角度,因此范围从2到5的亮度帧内预测模式被映射到2。因此,通过替换映射表的条目的一些值来更新4:2:2:色度格式的色度DM导出表,以更精确地转换色度块的预测角度。
2.3帧间预测
对于每个帧间预测CU,运动参数包括运动矢量、参考图片索引和参考图片列表使用索引、以及将被用于帧间预测样本生成的VVC的新编码特征所需的附加信息。可以以显式或隐式的方式用信号发送运动参数。在以跳跃模式对CU进行编码时,该CU与一个PU相关联,并且不具有显著的残差系数,不具有编码的运动矢量差异(delta)或参考图片索引。指定一种合并(merge)模式,其中从邻近CU获得当前CU的运动参数,包括空间候选和时间候选,以及VVC中引入的附加调度。合并模式可以被应用于任何帧间预测CU,而不仅仅适用于跳过模式。合并模式的替代方案是运动参数的显式传输,其中运动矢量、每个参考图片列表的对应参考图片索引和参考图片列表使用标志以及其他所需信息按每个CU显式地以信号发送。
2.4块内复制(IBC)
块内复制(IBC)是SCC上HEVC扩展中采用的一种工具。众所周知,它显著提高了屏幕内容材料的编码效率。由于IBC模式被实现为块级编码模式,因此在编码器处执行块匹配(BM),以找到每个CU的最佳块矢量(或运动矢量)。这里,块矢量用于指示从当前块到参考块的位移,该参考块已经在当前图片内重建。IBC编码的CU的亮度块矢量具有整数精度。色度块矢量也舍入到整数精度。当与AMVR结合使用时,IBC模式可以在1像素和4像素运动矢量精度之间切换。IBC编码的CU被视为除了帧内或帧间预测模式之外的第三预测模式。IBC模式适用于宽度和高度均小于或等于64个亮度样本的CU。
在编码器侧,对IBC执行基于哈希的运动估计。编码器对宽度或高度不大于16个亮度样本的块执行RD检查。对于非合并模式,首先使用基于哈希的搜索来执行块矢量搜索。如果哈希搜索没有返回有效的候选,则将执行基于块匹配的本地搜索。
在基于哈希的搜索中,当前块和参考块之间的哈希键匹配(32位CRC)被扩展到所有允许的块大小。当前图片中每个位置的哈希键计算基于4×4个子块。对于大小较大的当前块,在所有4×4个子块的所有哈希键与对应参考位置中的哈希键匹配时,确定哈希键与参考块的哈希键相匹配。如果发现多个参考块的哈希键与当前块的哈希密钥匹配,则计算每个匹配的参考的块向量成本,并选择具有最小成本的一个。
在块匹配搜索中,搜索范围被设置为覆盖先前CTU和当前CTU。
在CU级别,IBC模式通过一个标志发信号,它可以被以信号发送为IBC AMVP模式或IBC跳过/合并模式,如下所示:
–IBC跳过/合并模式:合并候选索引用于指示来自邻近候选IBC编解码块的列表中的哪个块矢量被用于预测当前块。合并列表包括空间候选、HMVP候选和成对候选。
–IBC AMVP模式:块矢量差以与运动矢量差相同的方式进行编解码。块矢量预测方法使用两个候选作为预测器,一个来自左邻近,一个从上邻近(如果是IBC编码)。当任一邻近不可用时,将使用默认块向量作为预测器。以信号发送一个标志,以指示块向量预测器索引。
2.5跨分量线性模型预测
为了降低跨分量冗余性,在VVC中使用跨分量线性模型(CCLM)预测模式,对于该CCLM预测模式,通过使用如下线性模型来基于相同CU的重建亮度样本来预测色度样本:
predC(i,j)=α·recL′(i,j)+β (2-1)
其中predC(i,j)表示CU中的预测色度样本,并且recL′(i,j)表示相同CU的下采样重建亮度样本。
CCLM参数(α和β)是用最多四个邻近色度样本及其对应的下采样亮度样本导出的。假设当前色度块尺寸为W×H,则W’和H’被设置为
-当应用LM模式时,W'=W,H'=H;
-当采用LM-T模式时,W’=W+H;
-当应用LM-L模式时,H’=H+W。
上方邻近位置被表示为S[0,-1]…S[W'-1,-1],并且左侧邻近位置被表示为S[-1,0]…S[-1,H'-1]。然后,四个样本被选择为:
-在应用LM模式并且上方邻近样本和左侧邻近样本都可用时,S[W’/4,-1],S[3*W’/4,-1],S[-1,H’/4],S[-1,3*H’/4];
-在应用LM-T模式或者只有上方邻近样本可用时,S[W’/8,-1],S[3*W’/8,-1],S[5*W’/8,-1],S[7*W’/8,-1];
-在应用LM-L模式或者只有左侧邻近样本可用时,S[-1,H’/8],S[-1,3*H’/8],S[-1,5*H’/8],S[-1,7*H’/8]。
对所选位置处的四个邻近亮度样本进行下采样并比较四次,以找到两个较大的值:x0 A和x1 A,以及两个较小的值:x0 B和x1 B。它们对应的色度样本值表示为y0A、y1A、y0B和y1B。则xA、xB、yA和yB导出为:
Xa=(x0 A+x1 A+1)>>1;Xb=(x0 B+x1 B+1)>>1;Ya=(y0 A+y1 A+1)>>1;Yb=(y0 B+y1 B+1)>>1(2-2)
最后,根据下式获得线性模型的参数α和β。
B=Yb-α·Xb (2-4)
图7示出了左侧样本和上方样本的位置示例以及CCLM模式中涉及的当前块的样本,并示出了用于导出α和β的样本的位置。
利用查找表来实现除法运算以计算参数。为了减少用于存储表所需的存储器,diff值(最大值和最小值之间的差)和参数α以指数表示。例如,diff是以4位有效部分和指数来近似的。因此,用于1/diff的表被缩减为针对有效位的16个值的16个元素,如下所示:
DivTable[]={0,7,6,5,5,4,4,3,3,2,2,1,1,0} (2-5)
这将有利于降低计算的复杂度以及用于存储所需表所需的存储器大小。
这将有利于降低计算的复杂度以及用于存储所需表所需的存储器大小。
除了上方模板和左侧模板可以一起用于计算线性模型系数之外,它们也可以交替地用于其他两种LM模式,称为LM_T和LM_L模式。
在LM_T模式中,仅使用上方模板来计算线性模型系数。为了获得更多的样本,上方模板被扩展到(W+H)个样本。在LM_L模式下,只使用左侧模板来计算线性模型系数。为了获得更多样本,将左侧模板扩展到(H+W)个样本。
在LM模式中,左侧模板和上方模板用于计算线性模型系数。
为了匹配用于4:2:0视频序列的色度采样位置,将两种类型的下采样滤波器应用于亮度样本,以在水平和垂直方向上实现2比1的下采样率。下采样滤波器的选择由SPS级别标志指定。两个下采样滤波器如下,分别对应“类型0(type-0)”和“类型2(type-2)”内容。
注意,当上部的参考行处于CTU边界时,仅使用一个亮度行线(帧内预测中的通用行缓冲)来进行下采样的亮度采样。
此参数计算是作为解码过程的一部分执行的,而不仅仅是作为编码器搜索操作。因此,不使用语法来将α和β值传递给解码器。
对于色度帧内模式编码,总共允许8个帧内模式用于色度帧内方式编码。这些模式包括五种传统的帧内模式和三种跨分量线性模型模式(LM、LM_T和LM_L)。色度模式信令和导出过程如表2-2所示。色度模式编码直接取决于对应亮度块的帧内预测模式。由于在I条带中启用了用于亮度和色度分量的单独块划分结构,因此一个色度块可以对应于多个亮度块。因此,对于色度DM模式,直接继承覆盖当前色度块的中心位置的对应亮度块的帧内预测模式。
表2-2在CCLM启用时从亮度模式导出色度预测模式
不管sps_cclm_enabled_flag的值如何,都使用单个二值化表,如表2-3所示。
表2-3用于色度预测模式的统一二值化表
intra_chrom+pred_mode的值 二进制值字符串
4 00
0 0100
1 0101
2 0110
3 0111
5 10
6 110
7 111
在表2-3中,第一个二进制值指示它是常规模式(0)还是LM模式(1)。如果是LM模式,则下一个二进制值指示它是否是LM_CHROMA(0)。如果它不是LM_CHROMA,则下一个1二进制值指示它是LM_L(0)还是LM_T(1)。对于这种情况,当sps_cclm_enabled_flag为0时,可以在熵编解码之前丢弃对应的intra_chroma_pred_mode的二值化表的第一个二进制值。或者,换言之,第一二进制值被推断为0,因此不被编解码。该单个二值化表用于sps_cclm_enabled_flag等于0和1的两种情况。表2-3中的前两个二进制值用自己的上下文模型进行上下文编解码,其余二进制值进行旁路编解码。
此外,为了减少双树中的亮度-色度延迟,当64×64亮度编码树节点用Not Split(并且ISP不用于64×64CU)或QT进行划分时,32×32/32×16色度编码树节点中的色度CU被允许以以下方式使用CCLM:如果32×32色度节点未拆分或分割QT拆分,则32×32节点中的所有色度CU都可以使用CCLM
如果32×32色度节点是用水平BT分割的,而32×16子节点不分割或使用垂直BT分割,则32×16色度节点中的所有色度CU都可以使用CCLM。
在所有其他亮度和色度编码树分割条件下,对于色度CU不允许CCLM。
2.6位置相关帧内预测组合
在VVC中,通过位置相关帧内预测组合(PDPC)方法进一步修改DC、平面和几个角模式的帧内预测结果。PDPC是一种帧内预测方法,它调用边界参考样本和具有滤波边界参考样本的HEVC式的帧内预测的组合。PDPC应用于以下帧内模式,无需发出信号:平面、DC、小于或等于水平的帧内角,以及大于或等于垂直且小于或等于80的帧内角。如果当前块是BDPCM模式或MRL索引大于0,则不应用PDPC。
根据如下等式2-8,预测样本pred(x’,y’)是使用帧内预测模式(DC,平面,角)和参考样本的线性组合来预测的:
pred(x’,y’)=Clip(0,(1<<BitDepth)-1,(wL×R-1y′+wT×Rx’,-1+(64-wL-wT)×pred(x’,y’)+32)>>6) (2-8)
其Rx,-1,R-1,y分别表示位于当前样本(x,y)顶部和左侧边界的参考样本。
如果PDPC应用于DC、平面、水平和垂直帧内模式,则不需要额外的边界滤波,如HEVC DC模式边界滤波或水平/垂直模式边缘滤波的情况所需。DC模式和平面模式的PDPC过程是相同的。对于角模式,如果当前角模式为HOR_IDX或VER_IDX,则分别不使用左侧或顶部参考采样。PDPC权重和比例因子取决于预测模式和块大小。PDPC应用于宽度和高度均大于或等于4的块。
图8A至8D示出了在各种预测模式下应用的PDPC的参考样本(Rx,-1和R-1,y)的定义。预测样本pred(x’,y’)位于预测块内的(x’,y’)处。例如,参考样本Rx,-1的坐标x由:x=x’+y’+1给出,参考样本R-1,y,y的坐标y类似地由:y=x’+y’+1给出。对于其他角模式,参考样本Rx,-1和R-1,y可以位于分数样本位置。在这种情况下,将使用最近整数采样位置的采样值。
2.7多参考行(MRL)帧内预测
多参考行(MRL)帧内预测使用更多的参考行用于帧内预测。在图9中,描绘了4条参考行的示例,其中段A和段F的样本不是从重建的邻近样本中提取的,而是分别用来自段B和段E的最接近的样本填充的。HEVC帧内图片预测使用最附近的参考行(即参考行0)。在MRL中,使用了2条附加行(参考行1和参考行3)。
所选参考行的索引(mrl_idx)被用信号发送并用于生成帧内预测。对于大于0的参考行索引,仅在MPM列表中包括额外的参考行模式,并且仅信号MPM索引而不包括剩余模式。在帧内预测模式之前用信号发送参考行索引,如果参考行索引非零,则帧内预测模式不包括平面模式。
对CTU内的块的第一行禁用MRL,以防止在当前CTU行外使用扩展的参考样本。此外,当使用附加行时,PDPC将被禁用。对于MRL模式,非零参考行索引的DC帧内预测模式中的DC值的导出与参考行索引0的导出对齐。MRL需要存储具有CTU的3条邻近亮度参考行来生成预测。跨分量线性模型(CCLM)工具的下采样滤波还需要3个邻近的亮度参考行。使用相同3行的MRL的定义与CCLM一致,以减少解码器的存储要求。
2.8帧内子划分(ISP)
帧内子划分(ISP)根据块大小将亮度帧内预测块垂直或水平划分为2或4个子划分。例如,ISP的最小块大小为4×8(或8×4)。如果块大小大于4×8,则对应块将被划分为四个子划分。我们注意到,M×128(M≤64)和128×N(N≤64)ISP块可能会对64×64VDPU生成潜在问题。例如,单树情况下的M×128CU有一个M×128亮度TB和两个相应的色度TB。如果CU使用ISP,那么亮度TB将被分成4个M×32TB(只能水平分割),每个TB都小于一个64×64块。然而,在目前的ISP设计中,色度块是不可分割的。因此,两个色度分量的大小都将大于一个32×32块。类似地,使用ISP的128×NCU也可以创建类似的情况。因此,这两种情况是64×64解码器流水线的问题。因此,可以使用ISP的CU大小被限制为最大值64×64。图15A和15B显示了两种可能性的示例(其中图10A示出了根据块大小的子划分过程的示意图(4×8和8×4CU的子划分示例),图10B示出了根据块大小进行子划分的过程的示意图(4×8,8×4和4×4以外的CU的子划分示例)。所有子划分都满足具有至少16个样本的条件。
在ISP中,1×N/2×N子块预测允许依赖于编解码块的先前解码的1×N/2×N子块的重建值,使得子块的最小预测宽度变为四个样本。例如,一个8×N(N>4)的编解码块,在使用ISP垂直分割编解码时,会被分割成两个预测区域,每个预测区域的大小为4×N,四个变换的大小为2×N。同样,使用垂直分割ISP编解码的4×N编解码块,使用完整的4×N块进行预测;使用四个变换,每个变换的大小为1×N。尽管允许1×N和2×N的变换大小,但可以断言,这些块在4×N区域内的变换可以并行执行。例如,当4×N预测区域包含四个1×N变换时,在水平方向上没有变换;垂直方向上的变换可以作为垂直方向上单个4×N变换来执行。类似地,当4×N预测区域包含两个2×N变换块时,可以并行地进行两个2×N块在每个方向(水平和垂直)上的变换操作。因此,与处理4×4常规编解码的帧内块相比,在处理这些较小的块时不增加延迟。
表2-4熵编解码系数组大小
块大小 系数组大小
1×N,N≥16 1×16
N×1,N≥16 16×1
2×N,N≥8 2×8
N×2,N≥8 8×2
所有其他可能的M×N情况 4×4
对于每个子划分,通过将残差信号与预测信号相加来获得重建样本。这里,通过诸如熵解码、逆量化和逆变换的处来生成残差信号。因此,每个子划分的重建样本值可用于生成下一个子划分的预测,并且每个子划分被重复处理。此外,要处理的第一个子划分是包含CU的左上样本,然后向下(水平分割)或向右(垂直分割)继续的子划分。因此,用于生成子划分预测信号的参考样本仅位于线的左侧和上方。所有子划分共享相同的帧内模式。以下是ISP与其他编解码工具的交互摘要。
-多参考行(MRL):如果块的MRL索引不是0,则ISP编解码模式将被推断为0,因此ISP模式信息将不会发送到解码器。
-熵编解码系数组大小:如表2-4所示,熵编解码子块的大小已被修改,以便在所有可能的情况下都有16个样本。值得注意,新的大小仅影响ISP的其中一个尺寸小于4个样本的块。在所有其他情况下,系数组保持维度。
-CBF编解码:假设至少有一个子划分具有非零CBF。因此,如果n是子划分的数目,并且第一n-1子划分已经产生零CBF,则第n子划分的CBF被推断为1。
-变换大小限制:所有长度大于16点的ISP变换都使用DCT-II。
-MTS标志:如果CU使用ISP编解码模式,MTS CU标志将设置为0,并且不会发送到解码器。因此,编码器不会对每个结果子划分的不同可用变换执行RD测试。ISP模式的变换选择将改为固定的,并根据所使用的帧内模式、处理顺序和块大小进行选择。因此,不需要用信号发出。例如,设tH和tV和为分别为w×h子划分选择的水平变换和垂直变换,其中w为宽度,h为高度。然后根据以下规则选择变换:
–如果w=1或h=1,则分别不存在水平变换或垂直变换。
–如果w≥4且w≤16,tH=DST-VI,否则tH=DCT-II
–如果h≥4且h≤16,tV=DST-VII,否则tV=DCT-II
在ISP模式中,允许所有67个帧内预测模式。如果相应的宽度和高度至少为4个样本长,则也应用PDPC。此外,参考样本滤波过程(参考平滑)和帧内插值滤波选择的条件不再存在,并且在ISP模式下,三次(DCT-IF)滤波总是用于分数位置插值。
2.9矩阵加权帧内预测(MIP)
矩阵加权帧内预测(MIP)方法是VVC中新加入的一种帧内预测技术。为了预测宽度和高度的矩形块的样本,矩阵加权帧内预测(MIP)取块左侧的一行H重建的相邻边界样本和块上方的一行重建的相邻边缘样本作为输入。如果重建的样本不可用,则像在传统帧内预测中那样生成它们。预测信号的生成基于以下三个步骤,即平均、矩阵矢量乘法和线性插值,如图11所示。
2.9.1平均邻近样本
在边界样本中,通过基于块大小和形状进行平均来选择四个样本或八个样本。具体地,输入边界bdrytop和bdryleft会根据取决于块的大小的预定义的规则,通过对邻近边界样本进行平均,缩小为更小的和/>边界。然后,将两个缩小的边界和/>连接到缩小的边界矢量bdryred,因此,对于形状的块,缩小的边界矢量的大小为4×4,而对于所有其他形状的块来说,缩小的边缘矢量的大小是8。如果是指MIP模式,则此级联定义如下:/>
2.9.2矩阵乘法将平均样本作为输入,执行矩阵矢量乘法,然后添加偏移。结果是原始块中的样本的子采样集上生成缩减预测信号。从缩减的输入矢量bdryred中生成缩减的预测信号predred,,该缩减的预测是宽度Wred和高度Hred的下采样块上的信号。此处,Wred和Hred定义为:
通过计算矩阵矢量乘积并添加偏移来计算缩减的预测信号predred
predred=A·bdryred+b (2-12)
这里,A是一个矩阵,如果W=H=4z则它有Wred·Hred行和4列,在所有其他情况下有8列。b是Wred·Hred大小的矢量。矩阵A和偏移矢量b取自S0,S1,S2.其中一个集合。索引idx=idx(W,H)定义如下:
这里,矩阵A的每个系数以8比特的精度表示。集合S0由16个矩阵组成,每个矩阵具有16行4列,以及16个偏移矢量/>每个偏移矢量的大小为16。该集合的矩阵和偏移矢量用于大小为4×4的块。集合S1由8个矩阵/>组成,每个矩阵具有行和8列,以及8个偏移矢量/>每个偏移矢量大小为16。集合S2由6个矩阵/>组成,每个矩阵具有64行和8列,以及6个偏移矢量/>每个偏移矢量大小为64。
2.9.3插值
其余位置处的预测信号是通过线性插值从子采样集上的预测信号生成的,该线性插值是在每个方向上的单步线性插值。插值首先在水平方向上执行,然后在垂直方向上执行,与块的形状或块的大小无关。
2.9.4MIP模式的信令和与其他编解码工具的协调对于帧内模式中的每个编解码单元(CU),发送标志是否要应用MIP模式的标志。如果要应用MIP模式,则用信号发送MIP模式(predModeIntra)。对于MIP模式,转置标志(isTransposed)用于确定模式是否转置,MIP模式标识(modeId)用于确定给定MIP模式使用的矩阵,其导出过程如下:
isTransposed=predModeIntra&1
modeId=predModeIntra>>1 (2-14)
通过考虑以下方面,MIP编解码模式与其他编解码工具相协调:
–大块上的MIP启用LFNST。这里使用平面模式的LFNST变换
–MIP的参考样本导出与传统帧内预测模式完全相同
–对于MIP预测中使用的上采样步骤,使用原始参考样本而不是下采样样本
–在上采样之前执行剪裁,而不是在上采样之后执行剪裁
–无论最大变换大小如何,MIP都允许达到64×64
MIP模式的数目对于sizeId=0为32,对于sizeId=1为16,对于sizeId=2为12。
2.10解码器侧帧内模式导出
在一个具体示例实施例中,解码器侧帧内模式导出的解决方案在JVET-C0061中描述。
在JEM-2.0中,帧内模式从HEVC中的35种模式扩展到67种,并且它们在编码器处导出并明确地用信号发送到解码器。在JEM-2.0中,在帧内模式编解码上花费了大量开销。例如,在所有帧内编解码配置中,帧内模式信令开销可以高达总码率的5~10%。该贡献提出了解码器侧的帧内模式导出方法,以在保持预测精度的同时减少帧内模式编解码开销。
为了减少帧内模式信令的开销,本文提出了解码器侧帧内模式导出(DIMD)方法。在所提出的方法中,编码器和解码器不是显式地用信号发送帧内模式,而是从当前块的邻近重建样本导出信息。DIMD导出的帧内模式有两种使用方式:
1)对于2N×2N CU,当对应的CU级别DIMD标志开启时,DIMD模式被用作帧内预测的帧内模式;
2)对于N×N CU,DIMD模式用于替换现有MPM列表的一个候选模式,以提高帧内模式编解码的效率。
2.10.1基于模板的帧内模式导出
如图12所示,目标表示要估计其帧内预测模式的当前块(块大小为N)。模板(由图12中的图案区域表示)指定了一组已经重建的样本,这些样本用于导出帧内模式。模板大小表示为模板内延伸到目标块的上方和左侧的样本数目,即L。在当前实现中,4×4和8×8块的模板大小为2(即L=2),16×16及更大的块的模板大小为4(即L=4))。根据JEM-2.0的定义,模板参考(由图12中的虚线区域表示)指的是模板上方和左侧的一组邻近样本。与总是来自重建区域的模板样本不同,在对目标块进行编码/解码时,模板的参考样本可能尚未重建。在这种情况下,利用JEM-2.0的现有参考样本替换算法来用可用参考样本替换不可用的参考样本。
对于每个帧内预测模式,DIMD计算重建的模板样本与其从模板的参考样本获得的预测样本之间的绝对差(SAD)。选择生产最小SAD的帧内预测模式作为目标块的最终帧内预测模型。
2.10.2 2N×2N CU帧内的DIMD
对于帧内2N×2N个CU,DIMD被用作一个附加帧内模式,通过将DIMD帧内模式与最佳正常帧内模式进行比较(即,被明确地发信号发送)而自适应地选择。每个帧内2N×2N CU都有一个标志来指示DIMD的使用情况。如果标志为1,则使用由DIMD导出的帧内模式来预测CU;否则,不应用DIMD,并且使用在码流中明确发信号发送的帧内模式来预测CU。当启用DIMD时,色度分量总是重复使用与为亮度分量导出的相同的帧内模式,即DM模式。
此外,对于每个DIMD编解码的CU,CU中的块可以自适应地选择以在PU级别或TU级别导出它们的帧内模式。具体而言,当DIMD标志为1时,另一个CU级别DIMD控制标志用信号表示执行DIMD的级别。如果该标志为0,则意味着在PU级别执行DIMD,并且PU中的所有TU使用相同的导出帧内模式进行帧内预测;否则(即,DIMD控制标志为1),则表示在TU级别执行DIMD,并且PU中的每个TU导出其自己的帧内模式。
此外,当启用DIMD时,角方向的数目增加到129,并且DC模式和平面模式仍然保持不变。为了适应角帧内模式的粒度增加,DIMD编解码CU的帧插值值滤波的精度从1/32像素增加到1/64像素。此外,为了使用DIMD编解码CU的导出帧内模式作为邻近帧内块的MPM候选模式,在将DIMD编解码的CU的129个方向用作MPM之前,将其转换为“正常”帧内模式(即,65个角帧内方向)。
2.10.3帧内N×N CU的DIMD
在所提出的方法中,总是用信号发送N×N内CU的帧内模式。然而,为了提高帧内模式编解码的效率,从DIMD导出的帧内模式被用作预测CU中四个PU的帧内模式的MPM候选。为了不增加MPM索引信令的开销,DIMD候选总是被放在MPM列表的第一位,并删除最后一个现有的MPM候选模式。此外,执行修剪操作,使得如果DIMD候选是冗余的,则不会将其添加到MPM列表中。
2.10.4DIMD的帧内模式搜索算法
为了降低编码/解码的复杂度,DIMD使用一种简单的快速帧内模式搜索算法被用于DIMD。首先,执行一个初始估计过程来为帧内模式搜索提供良好的起点。具体地,通过从允许的帧内模式中选择N个固定模式来创建初始候选列表。然后,针对所有候选帧内模式计算SAD,并且选择使SAD最小化的帧内模式作为开始帧内模式。为了实现良好的复杂性/性能权衡,初始候选列表由11个帧内模式组成,包括DC、平面和HEVC中定义的33个角帧内方向中的每4个模式,即帧内模式0、1、2、6、10…30、34。
如果起始帧内模式是DC模式或平面模式,则将其用作DIMD模式。否则,基于起始帧内模式,然后应用一个细化过程,其中通过一次迭代搜索来识别最佳帧内模式。它通过在每次迭代时比较由给定搜索间隔分隔的三个帧内模式的SAD值来工作,并保持最小化SAD的帧内模式。然后将搜索间隔减少到一半,并且从上一次迭代中选择的帧内模式将用作当前迭代的中心帧内模式。对于具有129个角帧内方向的当前DIMD实现,在细化过程中最多使用4次迭代来找到最佳DIMD帧内模式。
2.11CE3相关:解码器侧帧内模式导出
在一个具体示例实施例中,解码器侧帧内模式导出的解决方案在JVET-L0164中描述。
本文提出了一种避免在码流中传输亮度帧内预测模式的方法。这是通过在编码器和解码器处以相同的方式使用先前编码/解码的像素来导出亮度帧内模式来实现的。该过程定义了一种称为DIMD的新编解码模式,其选择在使用简单标志的帧内编解码块的码流中用信号发送。DIMD在编码器上与其他编解码模式竞争,包括经典的Intra编解码模式(对帧内预测模式进行编解码)。请注意,在本文中DIMD仅适用于亮度。对于色度,适用经典的帧内编解码模式。正如对其他编解码模式(经典的帧内、帧间、合并等)所做的那样,为DIMD模式计算率失真成本,然后将其与其他模式的编解码成本进行比较,以决定是否将其选择为当前块的最终编解码模式。
在解码器侧,首先解析DIMD标志。如果DIMD标志为真,则在重建过程中使用相同的先前编码的邻近像素来导出帧内预测模式。否则,帧内预测模式将与经典帧内编解码模式一样从码流中解析出来。2.11.1帧内预测模式导出
2.11.1.1梯度分析
为了导出块的帧内预测模式,首先选择对其执行梯度分析的一组邻近像素。出于规范性的目的,这些像素应该在解码/重建的像素池中。如图13所示,当前块周围的模板由左边的T个像素和上面的T个像素选择。在建议书中设定了T=2。
接下来,对模板的像素执行梯度分析。这可以确定模板的主要角方向,假设模板的主要角方向(这是我们方法的核心前提)很有可能与当前块的角方向相同。因此,使用一个简单的3×3Sobel梯度滤波,该滤波由将与模板卷积的以下矩阵定义:
和/>
对于模板的每个像素,这两个矩阵中的每一个都是以当前像素为中心的3×3个窗口,逐点相乘,并由其8个直接邻近组成,结果相加。因此,在水平方向和垂直方向上分别获得与当前像素处的梯度相对应的两个值Gx(来自与Mx的乘积)和Gy(来自与My的乘积)。图14显示了卷积过程(图中说明了3×3Sobel梯度滤波与模板的卷积)。蓝色像素是当前像素。红色像素(包括蓝色)是可以进行梯度分析的像素。灰色像素是由于缺乏一些邻近而无法进行梯度分析的像素。紫色像素是所考虑的模板之外的可用(重建)像素,用于红色像素的梯度分析。如果紫色像素不可用(例如,由于块离图片边界太近),则不执行使用该紫色像素的所有红色像素的梯度分析。
2.11.1.2梯度直方图和模式导出
对于每个红色像素,使用Gx和Gy的梯度的强度(G)和方向(O)如下核算:
值得注意,提出了atan功能的快速实现。然后将梯度的方向转换为帧内角预测模式,用于对直方图进行索引(首先初始化为零)。该帧内角模式下的直方图值增加G。一旦处理了模板中的所有红色像素,直方图将包含每个帧内角方式的梯度强度的累积值。显示直方图中最高峰值的模式被选择为当前块的帧内预测模式。如果直方图中的最大值是0(意味着不能进行梯度分析,或者组成模板的区域是平的),则DC模式被选择为当前块的帧内预测模式。
对于位于CTU顶部的块,不对位于模板顶部的像素的梯度执行分析。DIMD标志使用三种可能的上下文进行编解码,具体取决于左侧和上方邻近块,类似于Skip标志编解码。上下文0对应于左邻近块和上邻近块中均未用DIMD模式编解码的情况,上下文1对应于只有一个邻近块用DIMD编解码的情况,以及上下文2对应于两个邻近块都用DIMD进行编解码的情况。每个上下文的初始符号概率被设置为0.5。
2.11.2 130种帧内模式的预测
与经典帧内模式编解码相比,DIMD提供的一个优点是,导出的帧内模式可以具有更高的精度,允许更精确的预测,而不需要额外的成本,因为它不在码流中传输。导出的帧内模式交叉涵盖129个角模式,因此包括DC在内共有总共有130个模式(在我们的贡献中,导出的帧内模式永远不可能是平面的)。经典的帧内编解码模式是不变的,即预测和模式编解码仍然使用67种模式。
对宽角度帧内预测和简化的PDPC进行了所需的改变,以适应使用129种模式的预测。注意,只有预测过程使用扩展的帧内模式,这意味着对于任何其他目的(例如,决定是否对参考样本进行滤波),模式被转换回67模式精度。
2.11.3其他规范性变更
在DIMD模式中,亮度帧内模式是在块重建之前的重建过程中导出的。这样做是为了避免在解析期间对重建像素的依赖性。然而,通过这样做,对于块的色度分量和邻近块的亮度分量,块的亮度帧内模式将是未定义的。这会导致一个问题,因为:
·对于色度,定义了固定模式候选列表。通常,如果亮度模式等于色度候选之一,则候选模式将被垂直对角线(VDIA_IDX)帧内模式取代。由于在DIMD中,亮度模式不可用,因此不会修改初始色度模式候选列表。
在要从码流解析亮度帧内预测模式的经典帧内模式中,使用邻近块的亮度帧内模式来构建MPM列表,如果使用DIMD对这些块进行编解码,则MPM列表可能不可用。在这种情况下,在我们的贡献中,DIMD编解码块在MPM列表构建过程中被视为帧间块,这意味着它们实际上被认为是不可用的。
2.12用于角度帧内预测模式的帧内预测规范
在一个具体示例实施例中,用于角度帧内预测模式的帧内预测的解决方案在VVC规范JVET-T2001-v2中描述。
8.4.5.2.14INTRA_ANGULAR2规范INTRA_ANGULAR66帧内预测模式
这个过程的输入是:
-帧内预测模式predModeIntra,
-指定帧内预测参考行索引的变量refIdx,
-指定变换块宽度的变量nTbW,
-指定变换块高度的变量nTbH,
-指定参考样本宽度的变量refW,
-指定参考样本高度的变量refH,
-指定编码块宽度的变量nCbW,
-指定编码块高度的变量nCbH,
-指定参考过滤器标志的值的变量refFilterFlag,
-指定当前块的颜色分量的变量cIdx,
-邻近样本p[x][y],其中x=-1-refIdx,y=--1-refIdx..refH-1并且x=-refIdx..refW-1,y=--1-refIdx。
该过程的输出是预测样本predSamples[x][y],其中x=0..nTbw-1,y=0..nTbH-1.
变量nTbS被设置为等于(Log2(nTbw)+Log2(nTbH))>>1。
变量filterFlag被导出如下:
-如果以下条件中的一个或多个条件为真,则filterFlag被设置为等于0:
-refFilterFlag等于1;
-refIdx不等于0;
-IntraSubPartitionsSplitType不等于ISP_NO_SPLIT。
-否则,适用以下项:
-变量intraHorVerDistThres[nTbS]在表23中指定。
-变量filterFlag被导出如下:
-如果minDestVerHor大于intraHorVerDistThres[nTbS],则filterFlag被设置为等于1。
-否则,filterFlag被设置等于0。
表23各种变换块大小nTbS的intraHorVerDistThres[nTbS]规范
nTbS=2 nTbS=3 nTbS=4 nTbS=5 nTbS=6
intraHorVerDistThres[nTbS] 24 14 2 0 0
图15示出了93个预测方向,其中虚线方向与仅应用于非正方形块的宽角度模式相关联。
表24指定了predModeIntra和角度参数intraPredAngle之间的映射表。
表24-intraPredAngle规范
predModeIntra -14 -13 -12 -11 -10 -9 -8 -7 -6 -5 -4 -3 -2 -1 2 3 4
intraPredAngle 512 341 256 171 128 102 86 73 64 57 51 45 39 35 32 29 26
predModeIntra 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
intraPredAngle 23 20 18 16 14 12 10 8 6 4 3 2 1 0 -1 -2 -3
predModeIntra 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38
intraPredAngle -4 -6 -8 -10 -12 -14 -16 -18 -20 -23 -26 -29 -32 -29 -26 -23 -20
predModeIntra 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55
intraPredAngle -18 -16 -14 -12 -10 -8 -6 -4 -3 -2 -1 0 1 2 3 4 6
predModeIntra 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72
intraPredAngle 8 10 12 14 16 18 20 23 26 29 32 35 39 45 51 57 64
predModeIntra 73 74 75 76 77 78 79 80
intraPredAngle 73 86 102 128 171 256 341 512
当intraPredAngle不等于0时,基于intraPredAngle导出反向角参数invAngle,如下所示:
插值滤波器系数fC[相位][j]和fG[相位][j]在表25中指定,其中相位=0…31并且j=0…3。
表25-插值滤波器系数fC和fG的规范
预测样本predSamples[x][y]的值导出如下,其中x=0…nTbW-1,
y=0…nTbH-1:
-如果predModeIntra大于或等于34,则应用以下有序步骤:
1.参考样本数组ref[x]指定如下:
-以下适用:
ref[x]=p[-1-refIdx+x][-1-refIdx],其中x=0…nTbW+refIdx+1 (329)
-如果intraPredAngle小于0,则主参考样本数组扩展如下:
ref[x]=p[-1-refIdx][-1-refIdx+Min((x*invAngle+256)>>9,nTbH)],
其中x=-nTbH…-1 (330)
否则,以下适用:
ref[x]=p[-1-refIdx+x][-1-refIdx],其中x=nTbW+2+refIdx…refW+refIdx(331)
-附加样本ref[refW+refIdx+x]被导出如下,其中
x=1..(Max(1,nTbW/nTbH)*refIdx+1):
ref[refW+refIdx+x]=p[-1+refW][-1-refIdx] (332)
2.预测样本predSamples[x][y]的值导出如下,其中x=0…nTbW-1,
y=0…nTbH-1:
-索引变量iIdx和乘法因子iFact的推导如下:
iIdx=(((y+1+refIdx)*intraPredAngle)>>5)+refIdx (333)
iFact=((y+1+refIdx)*intraPredAngle)&31 (334)
-如果cIdx等于0,则适用以下:
-插值滤波器系数fT[j]导出如下,其中j=0…3:
fT[j]=filterFlag?fG[iFact][j]:fC[iFact][j] (335)
-预测样本predSamples[x][y]的值导出如下:
-否则(cIdx不等于0),根据iFact的值,以下适用:
-如果iFact不等于0,则预测样本predSamples[x][y]的值导出如下:
predSamples[x][y]=
((32-iFact)*ref[x+iIdx+1]+iFact*ref[x+iIdx+2]+16)>>5 (337)
-否则,预测样本predSamples[x][y]的值导出如下:
predSamples[x][y]=ref[x+iIdx+1] (338)
-否则(predModeIntra小于34),应用以下有序步骤:
1.参考样本数组ref[x]指定如下:
-以下适用:
ref[x]=p[-1-refIdx][-1-refIdx+x],其中x=0…nTbH+refIdx+1(339)
-如果interPredAngle小于0,则主参考样本数组扩展如下:
ref[x]=p[-1-refIdx+Mi((x*invAngle+256)>>9,nTbW)][-1-refIdx],
其中x=-nTbW…-1 (340)
-否则,以下适用:
Ref[x]=p[-1-refIdx][-1-refIdx+x],
其中x=nTbH+2+refIdx..refH+refIdx(341)
-附加样本ref[refH+refIdx+x]导出如下,其中
x=1..(Max(1,nTbH/NtbW)*refIdx+1):
ref[refH+refIdx+x]=p[-1-refIdx][-1+refH] (342)
2.预测样本predSamples[x][y]的值导出如下,其中x=0…nTbW-1,y=0…nTbH-1:
-索引变量iIdx和乘法因子iFact的导出如下:
iIdx=(((x+1+refIdx)*intraPredAngle)>>5)+refIdx (343)
iFact=((x+1+refIdx)*intraPredAngle)&31 (344)
-如果cIdx等于0,则以下适用:
-插值滤波器系数fT[j]导出如下,其中j=0…3:
fT[j]=filterFlag?fG[iFact][j]:fC[iFact][j] (345)
-预测样本predSamples[x][y]的值导出如下:
-否则(cIdx不等于0),根据iFact的值,适用以下:
-如果iFact不等于0,则预测样本predSamples[x][y]的值导出如下:
predSamples[x][y]=
((32-iFact)*ref[y+iIdx+1]+iFact*ref[y+iIdx+2]+16)>>5 (347)
-否则,预测样本predSamples[x][y]的值导出如下:
predSamples[x][y]=ref[y+iIdx+1] (348)
3.问题
1.在目前的帧内预测设计中,帧内预测中使用角度帧内预测模式来探索当前块的方向信息。当使用更密集的角度帧内预测模式时,可以实现编码增益。然而,更密集的角度模式(例如帧内预测角度和/或插值滤波器)的使用需要进一步研究。
2.在当前设计中,当使用某些帧内预测模式时,PDPC和梯度PDPC总是应用于当前块,当PDPC或梯度PDPC对某些块不有效时,这可能会导致一些编码损失。
3.帧内预测模式可以在解码器处导出,并且如何使用导出的帧内预测模式需要进一步研究。
4.发明
下面的详细发明应被视为解释一般概念的示例。这些发明不应被狭隘地解释。此外,这些发明可以以任何方式组合。
在本公开中,更密集/扩展角度模式可以表示指示更密集方向信息的那些附加帧内预测模式(在图4-1中用红色虚线表示),其可以定位在两个相邻的现有帧内预测模式之间(例如在H.266中定义的帧内预测模式,并且在图4-1中用黑线表示),或者超出现有帧内预测模式的角度范围。
在本公开中,术语DIMD表示使用先前解码的块导出帧内预测模式的编码工具。
在本公开中,“水平模式”是指图2-2中模式号等于18的帧内预测模式。“垂直模式”是指图2-2中模式号等于50的帧内预测模式。“对角线右上模式”是指图2-2中模式号等于65的帧内预测模式。“对角线左下模式”是指图2-2中模式号等于2的帧内预测模式。“对角线左上模式”是指图16中模式号等于34的帧内预测模式。这些帧内预测模式也可以是指HEVC中具有相同方向的帧内预测模式。在本公开中,“模板”指的是当前块周围的区域(例如,左侧和/或左侧下方,和/或左侧上方,和/或上方,和/或上方右侧区域等)。
关于用于更密集/扩展角度模式的帧内预测角度和插值滤波器
1.当使用一个或多个更密集/扩展角度模式时,建议使用更细化的角度和/或更高精度的反向角参数来进行块的帧内预测。
a.在一个示例中,更密集/扩展的角度模式可以使用邻近样本/像素导出和/或在比特流中用信号发送。
b.在一个示例中,可以使用DIMD模式、和/或使用正常帧内预测模式、和/或使用具有子划分模式的帧内预测、和/或使用具有多参考行模式的帧内预测编码块。
c.在一个示例中,更密集/扩展帧内预测模式的第一集合可被允许被用于块。示例在实施例5.1中示出。
i.在一个示例中,来自第一集合的一个或多个更密集/扩展帧内预测模式可被导出和/或发信号发送,并被用于块的帧内预测。
ii.在一个示例中,更密集/扩展帧内预测模式的帧内预测角可以使用其相邻或非相邻的现有角度模式导出,和/或依赖于现有角度模式导出。将两个相邻的现有角度模式表示为M1和M2,并且帧内预测角等于A1和A2。将更密集/扩展帧内预测模式表示为M3,并且帧内预测角等于A3。
1)在一个示例中,A3大于A1且小于A2。
2)在一个例子中,A3的精度可以高于A1和A2。如对于A3,使用1/T1的精度,并且对于A1和A2,使用1/T2的精度,其中T1大于T2。
a)在一个示例中,T2等于32,T1等于64或128。
iii.在一个示例中,当块是非正方形时,具有宽角度的多个帧内预测模式可以被用于块。
1)示例在实施例5.1中示出。
2)在一个示例中,宽角度模式的帧内预测角可以具有比现有角度模式更高的精度。
d.在一个示例中,可以使用更高的精度来导出使用帧内预测角度(例如,intraPredAngle)的反向角参数(例如,invAngle)。
i.在一个示例中,invAngle=f(T1*T2/intorPredAngle),其中T1*T2大于512*32。
1)在一个示例中,T1=512,T2=64;或T1=1024,T2=32。
2)在一个示例中,f可以是舍入函数或向上取整函数。
2.用于更密集/扩展角模式和其它现有模式的帧内预测过程可以不同。
a.在一个示例中,是否要应用平滑滤波器和/或如何应用平滑滤波器可以取决于IPM是否是更密集/扩展的一个。
b.在一个示例中,是否要应用PDPC滤波器和/或梯度PDPC滤波器和/或如何应用PDPC滤波器和/或梯度PDPC滤波器可以取决于IPM是否是更密集/扩展的一个。
c.在一个示例中,是否要根据插值滤波器生成预测器和/或如何根据插值滤波器生成预测器可以取决于IPM是否是更密集/扩展的一个。
3.第一块的更密集/扩展角度模式可被使用以预测第二块的角度模式。
a.第一块和第二块可以是相同的图片/子图片或条带或图块。
b.第一块可以与第二块相邻或非相邻。
c.第一块的更密集/扩展角度模式可以被直接视为用于第二块的最可能模式。
d.在其被视为用于第二块的最可能模式之前,第一块的更密集/扩展角度模式可以被映射到普通角度模式(现有角度模式)。例如,它可以被映射到最接近更密集/扩展角度模式的普通角度模式。
e.替代地,第一块的更密集/扩展角度模式可以不用于预测第二块的角度模式。
4.提出了使用具有不同于在当前视频编码标准(例如,VVC)中使用的第一精度的插值滤波器来生成帧内预测中分数位置处的样本。
a.在一个示例中,第一精度高于在当前视频编码标准(例如,VVC)中使用的精度。
b.在一个示例中,是否要使用具有第一精度的插值滤波器和/
或如何使用具有第一精度的插值滤波器可以取决于颜色分量。其中具有更高精度的插值滤波器被用于第一颜色分量,并且具有不变精度的插值滤波器被用于第二颜色分量。
i.在一个示例中,第一颜色分量可以是YCbCr格式中的Y,或RGB格式中的G。
ii.在一个示例中,第一颜色分量可以是YCbCr格式中的Cb,或RGB格式中的B。
iii.在一个示例中,第一颜色分量可以是YCbCr格式中的Cr,或者是RGB格式中的R。
iv.在一个示例中,第二颜色分量可以是YCbCr格式中的Y,或RGB格式中的G。
v.在一个示例中,第二颜色分量可以是YCbCr格式中的Cb,或RGB格式中的B。
vi.在一个示例中,第二颜色分量可以是YCbCr格式中的Cr,或RGB格式中的R。
c.在一个示例中,是否要使用具有第一精度的插值滤波器和/
或如何使用具有第一精度的插值滤波器可以取决于是否使用更密集/扩展的角度模式。
i.在一个示例中,当使用更密集/扩展角度模式时,可以使用具有更高精度的插值滤波器。
ii.在一个示例中,当使用更密集/扩展角度模式时,可以允许使用具有更高精度的多于一个的插值滤波器。
1)在一个示例中,具有更高精度的插值滤波器之一可以在解码器处导出,和/或在比特流中用信号发送。
2)在一个示例中,可以为每个更密集/扩展角度模式定义具有更高精度的不同插值滤波器。
d.在一个示例中,插值滤波器的精度可以等于1/T。例如,T=2K,例如T=256或T=512。
i.在一个示例中,滤波器可以被定义为:f(x)=[a[0]x,a[1]x,a[2]x,…a[N-1]x],其中x表示1-D维度中的分数位置,并且a[i]x表示第i个滤波器系数,并且滤波器是使用N个样本来插值分数位置处的样本的N抽头滤波器,并且a[0]x+a[1]x+a[2]x+…+a[N-1]x=T。
1)在一个示例中,x可以取决于帧内预测角的精度
(例如,P)。
a)在一个示例中,x可以在0到P-1的范围内(包括端值)。
b)在一个示例中,P=32,或P=64,或P=128。
c)在一个例子中,P是2的幂的数字。
2)在一个示例中,对于任何x<y,a[i]x>=a[i]y
3)在一个示例中,对于任何x<y,a[i]x<=a[i]y
4)在一个示例中,对于任何x<y并且x、y<=P/2,
a[i]x>=a[i]y;对于任何x<y并且x、y>P/2,a[i]x<=a[i]y
5)在一个示例中,对于任何x<y并且x、y<=P/2,
a[i]x<=a[i]y;对于任何x<y并且x、y>P/2,a[i]x>=a[i]y
使用模板的编码工具的确定
5.是否要在块上应用细化过程(例如滤波过程)和/或如何在块上应用细化过程(例如滤波过程)可以取决于模板,其中通过将细化过程应用于模板来导出第一成本,并且通过不将细化过程应用于模板来导出第二成本。
a.在一个示例中,细化过程可以应用于块的预测样本和/或重建样本。
b.在一个示例中,块可以是帧内编码和/或帧间编码,和/或使用帧内和帧间(例如,CIIP)的组合模式进行编码。
c.在一个示例中,细化过程可以指位置相关帧内预测组合(例如,PDPC)方法,和/或梯度位置相关帧内预测组合(例如,梯度PDPC)方法,和/或其它滤波方法,其修改/细化预测样本和/或重建样本。
d.在一个示例中,当第一成本小于第二成本时,可以将细化过程应用于块;否则,滤波过程可以不应用于块。
i.替代地,是否应用细化过程可以取决于第一成本和第二成本的函数(例如,将第一成本和第二成本的差异与阈值进行比较)。
6.是否要在块的帧内预测中对参考样本滤波和/或如何在块的帧内预测中对参考样本滤波可取决于模板,其中第一成本(C1)通过在模板的帧内预测期间对参考样本滤波而导出,并且第二成本(C2)通过在模板的帧内预测期间不对参考样本滤波而导出。
a.在一个示例中,可以使用帧内模式对块进行编码,和/或使用帧内和帧间(例如,CIIP)的组合模式对块进行编码。
b.在一个示例中,当第一成本小于第二成本(例如,C1<C2)时,可以在块的帧内预测期间对参考样本滤波;否则,可以在块的帧内预测期间不对参考样本滤波。
i.替代地,是否对参考样本滤波可以取决于第一成本和第二成本的函数(例如,将第一成本和第二成本的差异与阈值进行比较)。
c.在一个示例中,块可以指亮度块和/或色度块。
d.在一个示例中,在模板的帧内预测期间通过使用第一滤波方法对参考样本进行滤波来导出第三成本(C3),并且在模板的帧内预测期间通过使用第二滤波方法对参考样本进行滤波来导出第四成本(C4)。当第三成本小于第四成本(例如,C3<C4)时,在块的帧内预测期间可以使用第一滤波方法对参考样本进行滤波;否则,在块的帧内预测期间可以使用第二滤波方法对参考样本进行滤波。
7.在块的帧内预测期间是否要导出定位在分数位置的样本(例如,插值滤波器)和/或如何导出定位在分数位置的样本(例如,插值滤波器)可以取决于模板,其中第一成本是在模板的帧内预测期间通过使用第一插值滤波器来导出定位在分数位置的样本来导出的,并且第二成本是通过使用第二插值滤波器来导出的。
a.在一个示例中,可以使用帧内模式对块进行编码,和/或使用帧内和帧间(例如,CIIP)的组合模式对块进行编码。
b.在一个示例中,当第一成本小于第二成本时,可以在块的帧内预测期间使用第一插值滤波器;否则,可以在块的帧内预测期间使用第二插值滤波器。
i.替代地,使用哪个插值滤波器的确定可以取决于第一成本和第二成本的函数(例如,将第一成本和第二成本的差异与阈值进行比较)。
关于一个或多个导出帧内预测模式的使用
8.提出了当前块的导出帧内预测模式仅用于当前块的重建过程。
a.替代地,其不允许在相同视频单元(例如,图片/条带/子图片/图块)中的另一块的编码/解码过程中被利用。
b.替代地,其可以用于当前块的重建过程和滤波过程(例如,去块滤波器)。
c.替代地,其也可以在不同视频单元(例如,图片)中的块的编码/解码过程中使用。
9.当邻近块用导出模式被编码时,可以在处理块的编码/解码过程中将默认模式分配给邻近块。
a.在一个示例中,默认模式可以被设置为现有帧内预测模式之一,例如,平面模式、DC模式、水平模式、垂直模式。
b.替代地,邻近块被视为非帧内编码块或在处理块的编码/解码过程中不可用。
10.代替在帧内最可能模式(MPM)的主列表中包括所有导出帧内预测模式,提出在MPM列表中不包括一个或多个导出帧内预测模式。
a.在一个示例中,一个或多个导出帧内预测模式可以使用当前块的邻近重建样本来导出。
i.在一个示例中,导出帧内预测模式可以直接从预定义的IPM集合导出(诸如,使用诸如JVET-O0449和/或JVET-
U0100中的相同方法)。
b.在一个示例中,MPM列表可以指主要MPM列表和/或次要
MPM列表。
c.替代地,提出在次要MPM列表中包括一个或多个导出帧内预测模式。
d.替代地,提出在主要MPM列表和/或次要MPM列表中包括导出帧内预测模式的部分。
通用权利要求
11.是否应用和/或如何应用上述公开的方法可以在序列级别/图片级别/条带级别/图块组级别用信号发送,例如在序列头/图片头/SPS/VPS/DPS/DCI/PPS/APS/条带头/图块组头。
12.是否应用和/或如何应用上述公开的方法可以在PU/TU/CU/VPDU/CTU/CTU行/条带/图块/子图片处用信号发送。
13.是否应用和/或如何应用上述公开的方法可以取决于编解码信息,例如块大小、色彩格式、单/双树划分、色彩分量、条带/图片类型。
5.实施例
下面是针对以上第4节中概述的本发明的一些方面的一些示例实施例。
5.1实施例1
intraPredAngle规范
predModeIntra -31 -30 -29 -28 -27 -26 -25 -24 -23 -22 -21 -20 -19 -18 -17 -16 -15
intraPredAngle 3072 2048 1536 1024 853 682 597 512 427 342 299 256 230 204 188 172 159
predModeIntra -14 -13 -12 -11 -10 -9 -8 -7 -6 -5 -4 -3 -2 -1 2 3 4
intraPredAngle 146 137 128 121 114 108 102 96 90 84 78 74 70 67 64 61 58
predModeIntra 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
intraPredAngle 55 52 49 46 43 40 38 36 34 32 30 28 26 24 22 20 18
predModeIntra 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38
intraPredAngle 16 14 12 10 8 7 6 5 4 3 2 1 0 -1 -2 -3 -4
predModeIntra 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55
intraPredAngle -5 -6 -7 -8 -10 -12 -14 -16 -18 -20 -22 -24 -26 -28 -30 -32 -34
predModeIntra 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72
intraPredAngle -36 -38 -40 -43 -46 -49 -52 -55 -58 -61 -64 -61 -58 -55 -52 -49 -46
predModeIntra 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89
intraPredAngle -43 -40 -38 -36 -34 -32 -30 -28 -26 -24 -22 -20 -18 -16 -14 -12 -10
predModeIntra 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106
intraPredAngle -8 -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8
predModeIntra 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123
intraPredAngle 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 43
predModeIntra 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140
intraPredAngle 46 49 52 55 58 61 64 67 70 74 78 84 90 96 102 108 114
predModeIntra 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157
intraPredAngle 121 128 137 146 159 172 188 204 230 256 299 342 427 512 597 682 853
predModeIntra 158 159 160 161
intraPredAngle 1024 1536 2048 3072
5.2实施例2
当intraPredAngle不等于0时,基于intraPredAngle导出反向角参数invAngle,如下所示:
5.3实施例2
{
{0,256,0,0},///<0Integer-Pel{-1,254,4,-1},///<1
{-3,252,8,-1},///<2
{-4,250,12,-2},///<3
{-5,247,17,-3},///<4
{-6,244,21,-3},///<5
{-7,242,25,-4},///<6
{-8,239,29,-4},///<7
{-9,236,34,-5},///<8
{-9,233,38,-6},///<9
{-10,230,43,-7},///<10
{-11,227,47,-7},///<11
{-12,224,52,-8},///<12
{-12,220,56,-8},///<13
{-13,217,61,-9},///<14
{-14,214,65,-9},///<15
{-14,210,70,-10},///<16{-14,206,75,-11},///<17{-15,203,79,-11},///<18{-15,199,84,-12},///<19{-16,195,89,-12},///<20{-16,191,93,-12},///<21{-16,187,98,-13},///<22{-16,183,102,-13},///<23{-16,179,107,-14},///<24
{-16,174,112,-14},///<25
{-16,170,116,-14},///<26
{-16,166,121,-15},///<27
{-17,162,126,-15},///<28
{-16,157,130,-15},///<29
{-16,153,135,-16},///<30
{-16,148,140,-16},///<31
{-16,144,144,-16},///<32 Half-Pel{-16,140,148,-16},
{-16,135,153,-16},
{-15,130,157,-16},
{-15,126,162,-17},
{-15,121,166,-16},
{-14,116,170,-16},
{-14,112,174,-16},
{-14,107,179,-16},
{-13,102,183,-16},
{-13,98,187,-16},
{-12,93,191,-16},
{-12,89,195,-16},
{-12,84,199,-15},
{-11,79,203,-15},
{-11,75,206,-14},
{-10,70,210,-14},
{-9,65,214,-14},
{-9,61,217,-13},
{-8,56,220,-12},
{-8,52,224,-12},
{-7,47,227,-11},
{-7,43,230,-10},
{-6,38,233,-9},
{-5,34,236,-9},
{-4,29,239,-8},
{-4,25,242,-7},
{-3,21,244,-6},
{-3,17,247,-5},
{-2,12,250,-4},
{-1,8,252,-3},
{-1,4,254,-1},
};
5.4实施例4
{
{47,161,47,1},///<0Integer-Pel{45,161,49,1},///<1
{43,161,51,1},///<2
{42,160,52,2},///<3
{40,160,54,2},///<4
{38,160,56,2},///<5
{37,159,58,2},///<6
{35,158,61,2},///<7
{34,158,62,2},///<8
{32,157,65,2},///<9
{31,156,67,2},///<10
{29,155,69,3},///<11
{28,154,71,3},///<12
{27,153,73,3},///<13
{26,151,76,3},///<14
{25,150,78,3},///<15
{23,149,80,4},///<16
{22,147,83,4},///<17
{21,146,85,4},///<18
{20,144,87,5},///<19
{19,142,90,5},///<20
{18,141,92,5},///<21
{17,139,94,6},///<22
{16,137,97,6},///<23
{16,135,99,6},///<24
{15,133,101,7},///<25
{14,131,104,7},///<26
{13,129,106,8},///<27
{13,127,108,8},///<28
{12,125,111,8},///<29
{11,123,113,9},///<30
{11,120,116,9},///<31
{10,118,118,10},///<32 Half-Pel{9,116,120,11},
{9,113,123,11},
{8,111,125,12},
{8,108,127,13},
{8,106,129,13},
{7,104,131,14},
{7,101,133,15},
{6,99,135,16},
{6,97,137,16},
{6,94,139,17},
{5,92,141,18},
{5,90,142,19},
{5,87,144,20},
{4,85,146,21},
{4,83,147,22},
{4,80,149,23},
{3,78,150,25},
{3,76,151,26},
{3,73,153,27},
{3,71,154,28},
{3,69,155,29},
{2,67,156,31},
{2,65,157,32},
{2,62,158,34},
{2,61,158,35},
{2,58,159,37},
{2,56,160,38},
{2,54,160,40},
{2,52,160,42},
{1,51,161,43},
{1,49,161,45},
};
本公开主要涉及帧内预测过程。特别地,一些实施例涉及更密集/扩展角模式被引入用于当前块的场景。
本文使用的术语“语法元素”可以指标志、索引或用于信令信息的任何其它合适的元素。
图17示出了根据本公开的一些实施例的处理视频数据的方法1700的流程图。如图17所示,方法1700开始于1710,其中在视频的当前块和视频的比特流之间的转换期间,基于至少一个第一参数来执行用于当前块的帧内预测,至少一个第一参数不同于用于常规角度模式的帧内预测的至少一个第二参数。当前块与至少一种扩展角度模式一起使用。在1720,基于帧内预测模式来执行转换。
方法1700使得扩展角度模式可以被导出并被用于当前块。这样,提高了当前块使用的帧内预测模式的精度,并且由此提高了编码效率。
本公开的实施方式可以根据以下条款进行描述,其特征可以以任何合理的方式组合。
在一些实施例中,至少一个扩展角度模式由邻近样本确定。可替换地或附加地,至少一个扩展角度模式由邻近像素确定。这样,提高了用于确定扩展角度模式的参数的预测。
在一些实施例中,当前块可以以任何合适的模式被编码。一个示例模式是解码器侧帧内模式导出模式。另一个示例模式是帧内预测模式。另一个示例模式是具有子划分模式的帧内预测模式。另外一个模式是具有多个参考行模式的帧内预测模式。应当理解,上述示例模式仅用于说明目的,而不建议任何限制。
在一些实施例中,至少一个扩展角度模式是从预定义集合确定的。这样,减少了计算消耗。
在一些实施例中,被包含在预定义集合中的至少一个扩展角度模式在比特流中被指示或在编码器或解码器处导出。
在一些实施例中,预定义集合的扩展角度模式从两个预定义角度模式被导出,两个预定义角度模式被包含在针对帧内预测而被预定义的帧内预测模式集中,两个预定义角度模式彼此相邻或非相邻。
在一些实施例中,扩展角度模式的角度值介于两个预定义角度模式的角度值之间。
在一些实施例中,扩展角度模式的角度精度高于两个预定义角度模式的角度精度中的至少一个角度精度。
在一些实施例中,扩展角度模式的角度精度为1/64。替代地,扩展角度模式的角度精度为1/128。
在一些实施例中,如果当前块是非正方形的,则预定义集合包括具有宽角度的至少一个帧内预测模式,并且被用于预定义集合的具有宽角度的帧内预测模式的数目大于预设值。
在一些实施例中,具有宽角度的至少一个帧内预测模式的角度精度高于预定义的角度精度。
在一些实施例中,至少一个第一参数使用帧内预测角度而被确定。
在一些实施例中,至少一个第一参数使用第一值和第二值而被进一步确定,第一值和第二值的乘积大于或等于512*32。应当理解,本文所示的数字仅仅是为了仅用于说明的目的而不暗示任何限制。
在一些实施例中,第一值是512,并且第二值是64。替代地,第一值是1024,并且第二值是32。
在一些实施例中,至少一个第一参数是反向角参数并且由以下方式导出:
反向角参数=函数(第一值*第二值/帧内预测角),其中函数是舍入函数。替代地,函数是向上取整函数。
在一些实施例中,方法1700还可以包括:基于扩展角度模式确定用于另一块的另一帧内预测模式。
在一些实施例中,当前块和另外的块都在视频的相同的编码单元中,例如,图片、子图片或条带或图块。
在一些实施例中,另一块与当前块相邻或非相邻。
在一些实施例中,确定1710另一帧内预测模式包括:基于扩展角度模式构建用于视频的另一块的最可能模式列表;以及基于最可能模式列表确定另一帧内预测模式。
在一些实施例中,基于扩展角度模式构建最可能模式列表包括:将扩展角度模式包含到最可能模式列表中。替代地,基于扩展角度模式构建最可能模式列表包括:从最可能模式列表中排除扩展角度模式。
在一些实施例中,基于扩展角度模式构建最可能模式列表包括:将扩展角度模式映射到预定义角度模式;以及将所映射的预定义角度模式包含到最可能模式列表中。
在一些实施例中,预定义角度模式是最接近扩展角度模式的常规角度模式。
在一些实施例中,至少一个第一参数在比特流中以任何合适的级别指示。作为示例,至少一个第一参数以序列级别指示。替代地,至少一个第一参数也可以以图片组级别指示。替代地,至少一个第一参数也可以以图片级别指示。替代地,至少一个第一参数也可以以条带级别指示。替代地,至少一个第一参数也可以以图块组级别指示。
在一些实施例中,至少一个第一参数被表示为语法元素。本文中使用的术语“语法元素”可以指标志、索引或用于信令信号的任何其他合适的元素。语法元素可以以各种形式发出信号。作为示例,语法元素被包括在VPS中。替代地,语法元素被包括在SPS中。替代地,语法元素被包括在PPS中。替代地,语法元素被包括在DPS中。替代地,语法元素被包括在DCI中。替代地,语法元素包括在APS中。替代地,语法元素被包括在序列头中。替代地,语法元素被包括在图片头中。替代地,语法元素被包括在子图片头中。替代地,语法元素包含在条带头中。替代地,语法元素包含在图块头中。
在一些实施例中,至少一个参数在任何合适的区域处被指示。作为示例,至少一个参数在PB处被指示。替代地,至少一个参数在TB处被指示。替代地,至少一个参数在CB处被指示。替代地,至少一个参数在PU处被指示。替代地,至少一个参数在TU处被指示。替代地,至少一个参数在CU处被指示。替代地,至少一个参数在VPDU处被指示。替代地,至少一个参数在CTU处被指示。替代地,至少一个参数在CTU行处被指示。替代地,至少一个参数在条带处被指示。替代地,至少一个参数在图块处被指示。替代地,至少一个参数在子图片处被指示。
在一些实施例中,转换基于编码信息而被执行。
在一些实施例中,编码信息可以包括任何合适的信息。在一个例子中,编码信息是块大小。替代地,在另一个例子中,编码信息是颜色格式。在另一个例子中,编码信息是单/双树划分。替代地,信息可以是其他合适的,例如,颜色分量、条带类型或图片类型。
在一些实施例中,执行1720转换包括:基于帧内预测模式将当前块编码成比特流。
在一些实施例中,执行1720转换包括:基于帧内预测模式从比特流解码当前块。
图18示出了根据本公开的一些实施例的处理视频数据的方法1800的流程图。如图18所示,方法1800开始于1810,其中在视频的当前块和视频的比特流之间的转换期间,确定扩展角度模式是否被用于当前块。在1820,基于确定,在帧内预测过程期间应用编码工具,在帧内预测过程期间用于当前块的帧内预测模式被确定。在1830,基于帧内预测模式执行转换。
方法1800基于对当前块是否使用扩展角度模式的确定来应用编码工具,这使得编码工具的应用更加合理,并且由此提高了编码效率。
本公开的实施方式可以根据以下条款进行描述,其特征可以以任何合理的方式组合。
在一些实施例中,编码工具是平滑滤波器。替代地或附加地,编码工具是位置相关帧内预测组合(PDPC)滤波器。替代地或附加地,编码工具是梯度PDPC滤波器。替代地或附加地,编码工具是插值滤波器。
在一些实施例中,应用1820编码工具包括:应用具有不同于第二精度的第一精度的至少一个插值滤波器以在分数位置处生成样本,第二精度被用于其中常规角度模式被用于当前块的情况。
在一些实施例中,第一精度高于第二精度。
在一些实施例中,应用1820编码工具包括:基于颜色分量应用具有第一精度的至少一个插值滤波器。
在一些实施例中,应用1820编码工具包括:将具有第一精度的至少一个插值滤波器应用于第一颜色分量;以及将具有第二精度的至少一个插值滤波器应用于第二颜色分量。
在一些实施例中,第一颜色分量或第二颜色分量是YCbCr格式的颜色分量Y、Cb或Cr。替代地,第一颜色分量或第二颜色分量是RGB格式的颜色分量R、G和B。
在一些实施例中,应用1820具有第一精度的至少一个插值滤波器包括:如果扩展角度模式被用于当前块,则应用具有第一精度的至少一个插值滤波器。
在一些实施例中,至少一个插值滤波器属于具有第一精度的插值滤波器集,插值滤波器集允许被用于其中扩展角度模式被用于当前块的情况。
在一些实施例中,具有第一精度的至少一个插值滤波器在解码器处导出。替代地,具有第一精度的插值滤波器被包含在比特流中。
在一些实施例中,被包含在插值滤波器集中的不同插值滤波器被定义用于不同的扩展角模式。
在一些实施例中,插值滤波器的精度等于1/T,其中T是等于T=2K的整数,其中K是大于6的整数。
在一些实施例中,至少一个插值滤波器的插值滤波器是使用N个样本来在分数位置处插值样本的N抽头滤波器,其中N是插值滤波器的抽头的数目;并且插值滤波器由以下定义:f(x)=[a[0]x,a[1]x,a[2]x,...a[N–1]x],其中,x表示分数位置,a[i]x表示用于分数位置x的第i个滤波器系数,以及a[0]x+a[1]x+a[2]x+…+a[N–1]x=T。
在一些实施例中,分数位置x的最大值取决于帧内预测角度的精度。
在一些实施例中,分数位置x的值大于0并且精度小于帧内预测角度的精度。
在一些实施例中,帧内预测角度的精度是2的幂的数。
在一些实施例中,帧内预测角度的精度是32、64或128中的一个,应当理解,本文所示的数字仅仅是为了仅用于说明的目的,而不暗示任何限制。
在一些实施例中,插值滤波器的滤波器系数的值按照分数位置x的值的降序排列。
在一些实施例中,插值滤波器的滤波器系数的值根据分数位置x的值呈升序。
在一些实施例中,如果分数位置x小于或等于帧内预测角度的精度的一半的值,则插值滤波器的滤波器系数的值呈升序;如果分数位置x大于帧内预测角度的精度的一半的值,则插值滤波器的滤波器系数的值呈降序。
在一些实施例中,如果分数位置x小于或等于帧内预测角度的精度的一半的值,则插值滤波器的滤波器系数的值呈降序;如果分数位置x大于帧内预测角度的精度的一半的值,则插值滤波器的滤波器系数的值呈升序。
在一些实施例中,用于应用编码工具的信息以任何合适的级别指示。作为示例,至少一个第一参数以序列级别指示。替代地,至少一个第一参数也可以以图片组级别指示。替代地,至少一个第一参数也可以以图片级别指示。替代地,至少一个第一参数也可以以条带级别指示。替代地,至少一个第一参数也可以以图块组级别指示。
在一些实施例中,信息被表示为语法元素。本文使用的术语“语法元素”可以指标志、索引或用于信令信息的任何其他合适的元素。语法元素可以以各种形式发出信号。作为示例,语法元素被包含在VPS中。替代地,语法元素包括被包含在SPS中。替代地,语法元素被包含在PPS中。替代地,语法元素被包含在DPS中。替代地,语法元素被包含在DCI中。替代地,语法元素被包含在APS中。替代地,语法元素被包含在序列头中。替代地,语法元素被包含在图片头中。替代地,语法元素被包含在子图片头中。替代地,语法元素被包含在条带头中。替代地,语法元素被包含在图块头中。
在一些实施例中,信息在任何合适的区域处被指示。作为示例,信息在PB处被指示。替代地,信息在TB处被指示。替代地,信息在CB处被指示。替代地,信息在PU处被指示。替代地,信息在TU处被指示。替代地,信息在CU处被指示。替代地,信息在VPDU处被指示。替代地,信息在CTU处被指示。替代地,信息在CTU行处被指示。替代地,信息在条带处被指示。替代地,信息在图块处被指示。替代地,信息在子图片处被指示。
在一些实施例中,转换基于编码信息而被执行。
在一些实施例中,编码信息可以包括任何合适的信息。在一个例子中,编码信息是块大小。替代地,在另一个例子中,编码信息是颜色格式。在另一个例子中,编码信息是单/双树划分。替代地,信息可以是其他合适的,例如,颜色分量、条带类型或图片类型。
在一些实施例中,执行1830转换包括:基于帧内预测模式将当前块编码成比特流。
在一些实施例中,执行1830转换包括:基于帧内预测模式从比特流解码当前块。
图19示出了根据本公开的一些实施例的处理视频数据的方法1900的流程图。如图19所示,方法1900开始于1910,其中基于当前块的模板对视频的当前块执行过程。在一个示例中,该过程是细化过程。在另一个示例中,该过程是对参考样本滤波的过程。在进一步示例中,该过程是确定定位在分数位置的样本的过程。在1920,在当前块和视频的比特流之间执行转换。
方法1900基于当前块的模板执行细化过程,这使得细化过程按需执行。
本公开的实施方式可以根据以下条款进行描述,其特征可以以任何合理的方式组合。
在一些实施例中,用帧内编码模式对当前块进行编码。替代地,用帧间编码模式对当前块进行编码。替代地,用组合帧间和帧内预测模式对当前块进行编码。
在一些实施例中,该过程是细化过程并且执行1910该过程包括:针对当前块确定以下项:第一成本,通过将细化过程应用于模板来确定,以及第二成本,通过不将细化过程应用于模板来确定;以及基于第一和第二成本将细化过程应用于当前块。
在一些实施例中,基于第一成本和第二成本将细化过程应用于当前块包括:如果第一成本小于第二成本,则将细化过程应用于当前块。替代地,基于第一成本和第二成本将细化过程应用于当前块包括:如果第二成本和第一成本之间的差异大于阈值,则将细化过程应用于当前块。
在一些实施例中,应用细化过程包括:将细化过程应用于当前块的预测样本。替代地或附加地,应用细化过程包括:将细化过程应用于当前块的重建样本。
在一些实施例中,细化过程是:用于细化当前块的预测样本和当前块的重建样本中的至少一个的滤波过程。
在一些实施例中,细化过程是位置相关帧内预测组合(PDPC)过程。替代地,细化过程是梯度PDPC过程。
在一些实施例中,该过程是对参考样本滤波的过程并且执行1910该过程包括:针对当前块确定以下内容:第三成本,通过在模板的帧内预测期间对当前块的参考样本滤波来确定,以及第四成本,通过在模板的帧内预测期间不对当前块的参考样本滤波来确定;以及基于第三和第四成本对参考样本滤波。
在一些实施例中,基于第三成本和第四成本对参考样本滤波包括:如果第三成本小于第四成本,则在帧内预测期间基于第三成本对参考样本滤波。替代地,基于第三成本和第四成本对参考样本滤波包括:如果第四成本和第三之间的差异大于阈值,则在帧内预测期间基于第三来对参考样本过滤。
在一些实施例中,该过程是用于对参考样本滤波的过程并且执行1910过程包括:针对当前块确定以下内容:第五成本,通过在模板的帧内预测期间使用第一滤波方法对参考样本滤波而被确定,以及第六成本,通过在模板的帧内预测期间使用第二滤波方法对参考样本滤波而被确定;以及基于第五成本和第六成本对参考样本滤波。
在一些实施例中,基于第五成本和第六成本对参考样本滤波包括:如果第五成本小于或等于第六成本,则在模板的帧内预测期间使用第一滤波方法对参考样本滤波。替代地,基于第五成本和第六成本对参考样本滤波包括:如果第五成本大于或等于第六成本,则在模板的帧内预测期间使用第二滤波方法对参考样本滤波。
在一些实施例中,基于第五成本和第六成本对参考样本滤波包括:如果第六成本和第五成本之间的差异大于或等于阈值,则在帧内预测期间通过使用第一滤波方法对参考样本滤波。替代地,基于第五成本和第六成本对参考样本滤波包括:如果第六成本和第五成本之间的差异小于或等于阈值,则在帧内预测期间通过使用第二滤波方法对参考样本滤波。
在一些实施例中,当前块是亮度块。替代地,当前块是色度块。
在一些实施例中,过程是确定定位在分数位置处的样本的过程并且执行1910该过程包括:针对当前块确定以下项:第七成本,通过使用第一插值滤波器确定在模板的帧内预测期间定位在分数位置处的样本而被确定,以及第八成本,通过使用第二插值滤波器确定在模板的帧内预测期间定位在分数位置处的样本而被确定;以及基于第七成本和第八成本确定定位在分数位置处的样本。
在一些实施例中,基于第七成本和第八成本确定被定位在分数位置处的样本包括:如果第七成本小于或等于第八成本,则使用第一插值滤波器确定被定位在分数位置处的样本。替代地,基于第七成本和第八成本确定被定位在分数位置的样本包括:如果第七成本大于或等于第八成本,则使用第二插值滤波器确定被定位在分数位置处的样本。
在一些实施例中,基于第七成本和第八成本确定被定位在分数位置处的样本包括:如果第八成本和第七成本之间的差异大于或等于阈值,则使用插值滤波器确定被定位在分数位置处的样本。替代地,基于第七成本和第八成本确定被定位在分数位置处的样本包括:如果第八成本和第七成本之间的差小于或等于阈值,则使用插值滤波器确定被定位在分数位置处的样本。
在一些实施例中,用于执行过程的信息以任何合适的级别指示。作为示例,至少一个第一参数以序列级别指示。替代地,至少一个第一参数也可以以图片组级别指示。替代地,至少一个第一参数也可以以图片级别指示。替代地,至少一个第一参数也可以以条带级别指示。替代地,至少一个第一参数也可以以图块组级别指示。
在一些实施例中,信息被表示为语法元素。本文使用的术语“语法元素”可以指标志、索引或用于信令信息的任何其他合适的元素。语法元素可以以各种形式发出信号。作为示例,语法元素被包含在VPS中。替代地,语法元素包括被包含在SPS中。替代地,语法元素被包含在PPS中。替代地,语法元素被包含在DPS中。替代地,语法元素被包含在DCI中。替代地,语法元素被包含在APS中。替代地,语法元素被包含在序列头中。替代地,语法元素被包含在图片头中。替代地,语法元素被包含在子图片头中。替代地,语法元素被包含在条带头中。替代地,语法元素被包含在图块头中。
在一些实施例中,信息在任何合适的区域处被指示。作为示例,信息在PB处被指示。替代地,信息在TB处被指示。替代地,信息在CB处被指示。替代地,信息在PU处被指示。替代地,信息在TU处被指示。替代地,信息在CU处被指示。替代地,信息在VPDU处被指示。替代地,信息在CTU处被指示。替代地,信息在CTU行处被指示。替代地,信息在条带处被指示。替代地,信息在图块处被指示。替代地,信息在子图片处被指示。
在一些实施例中,转换基于编码信息而被执行。
在一些实施例中,编码信息可以包括任何合适的信息。在一个例子中,编码信息是块大小。替代地,在另一个例子中,编码信息是颜色格式。在另一个例子中,编码信息是单/双树划分。替代地,信息可以是其他合适的,例如,颜色分量、条带类型或图片类型。
在一些实施例中,执行1920转换包括:将当前块编码成比特流。
在一些实施例中,执行1920转换包括:从比特流解码当前块。
图20示出了根据本公开的一些实施例的处理视频数据的方法2000的流程图。如图20所示,该方法2000开始于2010,其中确定用于视频的第一块的第一帧内预测模式。在2020,基于第一帧内预测模式确定用于视频的第二块的第二帧内预测模式,如果第一块和第二块在同一视频中,则在确定用于第二块的第二帧内预测模式期间排除第一帧内预测模式。替代地,如果第一块和第二块处于不同的视频中,通过在确定用于第二块的第二帧内预测模式期间包括第一帧内预测模式,来基于第一帧内预测模式确定视频的第二块的第二帧内预测模式。在2030,基于第一帧内预测模式和第二帧内预测模式执行视频的第一块和第二块和比特流之间的转换。
该方法2000利用用于第一块的导出帧内预测模式导出用于第二块的另一帧内预测模式,这使得另一帧内预测模式的确定更加合理,并且由此提高了编码效率。
本公开的实施方式可以根据以下条款进行描述,其特征可以以任何合理的方式组合。
在一些实施例中,方法2000还包括在用于第一块的重建过程和滤波过程中的至少一个期间应用第一帧内预测模式。
在一些实施例中,第二块是第一块的邻近块并且确定用于第二块的第二帧内预测模式包括:当第一帧内预测模式是默认模式时,确定用于第二块的第二帧内预测模式。替代地,第二块是第一块的邻近块并且确定用于第二块的第二帧内预测模式包括:当第一块是非帧内编码块时,确定用于第二块的第二帧内预测模式。
在一些实施例中,默认模式是以下之一:平面模式、DC模式、水平模式、垂直模式。
在一些实施例中,方法2000还包括确定用于第一块的第三帧内预测模式,其中确定2020用于第二块的第二帧内预测模式包括:基于第一预测模式和第三预测模式构建用于第二块的最可能模式列表;以及基于最可能模式列表确定用于第二块的第二帧内预测模式。
在一些实施例中,构建最可能模式包括:通过至少部分地排除第一帧内预测模式和第三帧内预测模式来构建最可能模式。
在一些实施例中,第一帧内预测模式和第三帧内预测模式是从第一块的邻近重建样本导出的。
在一些实施例中,最可能模式列表是主要最可能模式列表。替代地,最可能模式列表是次要最可能模式列表。替代地,最可能模式列表是主要最可能模式列表和次要最可能模式列表。
在一些实施例中,构建最可能模式包括:通过包括第一帧内预测模式和第三帧内预测模式来构建次要最可能模式。替代地,构建最可能模式包括:通过部分地包括第一帧内预测模式和第三帧内预测模式来构建次要最可能模式。替代地,构建最可能模式包括:通过部分地包括第一帧内预测模式和第三帧内预测模式来构建主要最可能模式。
在一些实施例中,用于执行过程的信息以任何合适的级别指示。作为示例,至少一个第一参数以序列级别指示。替代地,至少一个第一参数也可以以图片组级别指示。替代地,至少一个第一参数也可以以图片级别指示。替代地,至少一个第一参数也可以以条带级别指示。替代地,至少一个第一参数也可以以图块组级别指示。
在一些实施例中,信息被表示为语法元素。本文使用的术语“语法元素”可以指标志、索引或用于信令信息的任何其他合适的元素。语法元素可以以各种形式发出信号。作为示例,语法元素被包含在VPS中。替代地,语法元素包括被包含在SPS中。替代地,语法元素被包含在PPS中。替代地,语法元素被包含在DPS中。替代地,语法元素被包含在DCI中。替代地,语法元素被包含在APS中。替代地,语法元素被包含在序列头中。替代地,语法元素被包含在图片头中。替代地,语法元素被包含在子图片头中。替代地,语法元素被包含在条带头中。替代地,语法元素被包含在图块头中。
在一些实施例中,信息在任何合适的区域处被指示。作为示例,信息在PB处被指示。替代地,信息在TB处被指示。替代地,信息在CB处被指示。替代地,信息在PU处被指示。替代地,信息在TU处被指示。替代地,信息在CU处被指示。替代地,信息在VPDU处被指示。替代地,信息在CTU处被指示。替代地,信息在CTU行处被指示。替代地,信息在条带处被指示。替代地,信息在图块处被指示。替代地,信息在子图片处被指示。
在一些实施例中,转换基于编码信息而被执行。
在一些实施例中,编码信息可以包括任何合适的信息。在一个例子中,编码信息是块大小。替代地,在另一个例子中,编码信息是颜色格式。在另一个例子中,编码信息是单/双树划分。替代地,信息可以是其他合适的,例如,颜色分量、条带类型或图片类型。
在一些实施例中,执行2030转换包括:基于第一帧内预测模式和第二帧内预测模式将第一块和第二块编码成比特流。
在一些实施例中,执行2030转换包括:基于第一内预测模式和第二帧内预测模式从比特流解码第一快和第二块。
条款1.一种处理视频数据的方法,包括:在视频的当前块和所述视频的比特流之间的转换期间,基于至少一个第一参数来执行用于所述当前块的帧内预测,所述至少一个第一参数不同于用于常规角度模式的帧内预测的至少一个第二参数,至少一个扩展角度模式被用于所述当前块;以及基于所述帧内预测的模式执行所述转换。
条款2.根据条款1所述的方法,其中所述至少一个扩展角度模式由以下至少一项确定:邻近样本,或邻近像素。
条款3.根据条款1所述的方法,其中所述当前块使用以下之一进行编码:解码器侧帧内模式导出模式,帧内预测模式,具有子划分模式的帧内预测,或具有多参考行模式的帧内预测。
条款4.根据条款1所述的方法,其中至少一个扩展角度模式是从预定义集合确定的。
条款5.根据条款4所述的方法,其中被包含在所述预定义集合中的所述至少一个扩展角度模式在所述比特流中被指示或在编码器或解码器处导出。
条款6.根据条款4所述的方法,其中所述预定义集合的扩展角度模式从两个预定义角度模式被导出,所述两个预定义角度模式被包含在针对帧内预测而被预定义的帧内预测模式集中,所述两个预定义角度模式彼此相邻或非相邻。
条款7.根据条款6所述的方法,其中所述扩展角度模式的角度值介于所述两个预定义角度模式的角度值之间。
条款8.根据条款6所述的方法,其中所述扩展角度模式的角度精度高于所述两个预定义角度模式的角度精度中的至少一个角度精度。
条款9.根据条款6所述的方法,其中所述扩展角度模式的所述角度精度为1/64或1/128。
条款10.根据条款4所述的方法,其中如果所述当前块是非正方形的,则所述预定义集合包括具有宽角度的至少一个帧内预测模式,并且被用于所述预定义集合的具有宽角度的帧内预测模式的数目大于预设值。
条款11.根据条款10所述的方法,其中具有宽角度的所述至少一个帧内预测模式的角度精度高于预定义的角度精度。
条款12.根据条款1所述的方法,其中所述至少一个第一参数使用帧内预测角度而被确定。
条款13.根据条款12所述的方法,其中所述至少一个第一参数使用第一值和第二值而被进一步确定,所述第一值和所述第二值的乘积大于或等于512*32。
条款14.根据条款13所述的方法,其中所述第一值是512,并且所述第二值是64,或者所述第一值是1024,并且所述第二值是32。
条款15.根据条款13所述的方法,其中所述至少一个第一参数是反向角参数并且由以下方式导出:反向角参数=函数(第一值*第二值/帧内预测角),其中所述函数是舍入函数或向上取整函数。
条款16.根据条款1所述的方法,还包括:基于所述扩展角度模式确定用于另一块的另一帧内预测模式。
条款17.根据条款16所述的方法,其中所述当前块和所述另一块在所述视频的相同图片、子图片或条带或图块中。
条款18.根据条款16所述的方法,其中所述另一块与所述当前块相邻或非相邻。
条款19.根据条款16所述的方法,其中确定所述另一帧内预测模式包括:基于所述扩展角度模式构建用于所述视频的所述另一块的最可能模式列表;以及基于所述最可能模式列表确定所述另一帧内预测模式。
条款20.根据条款19所述的方法,其中基于所述扩展角度模式构建所述最可能模式列表包括以下之一:将所述扩展角度模式包含到所述最可能模式列表中;或从所述最可能模式列表中排除所述扩展角度模式。
条款21.根据条款19所述的方法,其中基于所述扩展角度模式构建所述最可能模式列表包括:将所述扩展角度模式映射到预定义角度模式;以及将所映射的所述预定义角度模式包含到所述最可能模式列表中。
条款22.根据条款21所述的方法,其中所述预定义角度模式是最接近扩展角度模式的常规角度模式。
条款23.根据条款1所述的方法,其中所述至少一个第一参数以以下之一被指示:序列级别、图片组级别、图片级别、条带级别或者图块组级别。
条款24.根据条款1所述的方法,其中所述至少一个第一参数被表示为被包含在以下之一中的语法元素:视频参数集(VPS),序列参数集(SPS),图片参数集(PPS),依赖参数集(DPS),解码能力信息(DCI),自适应参数集(APS),序列头,图片头,子图片头,条带头,或者图块头。
条款25.根据条款1所述的方法,其中所述至少一个参数在以下之一处被指示:预测块(PB),变换块(TB),编码块(CB),预测单元(PU),变换单元(TU),编码单元(CU),虚拟管道数据单元(VPDU),编码树单元(CTU),CTU行,条带,图块,或者子图片。
条款26.根据条款1所述的方法,其中所述转换基于编码信息而被执行。
条款27.根据条款25所述的方法,其中所述编码信息包括以下至少一项:块大小,颜色格式,单/双树划分,颜色分量,条带类型,或图片类型。
条款28.根据条款1所述的方法,其中执行所述转换包括:基于所述帧内预测模式将所述当前块编码成所述比特流。
条款29.根据条款1所述的方法,其中执行所述转换包括:基于所述帧内预测模式从所述比特流解码所述当前块。
条款30.一种处理视频数据的方法,包括:在视频的当前块和视频的比特流之间的转换期间,确定扩展角度模式是否被用于所述当前块;基于所述确定,在帧内预测过程期间应用编码工具,在所述帧内预测过程期间用于所述当前块的帧内预测模式被确定;以及基于所述帧内预测模式执行所述转换。
条款31.根据条款30所述的方法,其中编码工具是以下之一:平滑滤波器,位置相关帧内预测组合(PDPC)滤波器,梯度PDPC滤波器,或插值滤波器。
条款32.根据条款30所述的方法,其中应用所述编码工具包括:应用具有不同于第二精度的第一精度的至少一个插值滤波器来在分数位置处生成样本,所述第二精度被用于如下情况:被用于其中常规角度模式被用于所述当前块。
条款33.根据条款32所述的方法,其中所述第一精度高于所述第二精度。
条款34.根据条款32所述的方法,其中应用所述编码工具包括:基于颜色分量应用具有所述第一精度的所述至少一个插值滤波器。
条款35.根据条款32所述的方法,其中应用所述编码工具包括:将具有所述第一精度的所述至少一个插值滤波器应用于第一颜色分量;以及将具有所述第二精度的至少一个插值滤波器应用于第二颜色分量。
条款36.根据条款35所述的方法,其中所述第一颜色分量或第二颜色分量是以下之一:YCbCr格式的颜色分量Y、Cb或Cr,或RGB格式的颜色分量R、G和B。
条款37.根据条款32所述的方法,其中应用具有所述第一精度的所述至少一个插值滤波器包括:如果扩展角度模式被用于所述当前块,则应用具有所述第一精度的所述至少一个插值滤波器。
条款38.根据条款32所述的方法,其中具有所述第一精度的所述至少一个插值滤波器属于插值滤波器集,针对如下情况所述插值滤波器集被允许使用:扩展角度模式被用于所述当前块。
条款39.根据条款32所述的方法,其中具有所述第一精度的所述至少一个插值滤波器在解码器处被导出或被包含在所述比特流中。
条款40.根据条款38所述的方法,其中被包含在所述插值滤波器集中的不同插值滤波器被定义用于不同的扩展角模式。
条款41.根据条款31所述的方法,其中所述插值滤波器的精度等于1/T,其中T是等于T=2K的整数,其中K是大于6的整数。
条款42.根据条款31所述的方法,其中所述至少一个插值滤波器中的插值滤波器是使用N个样本在分数位置插值样本的N抽头滤波器,其中N是所述插值滤波器的抽头的数目;并且其中所述插值滤波器被定义为:f(x)=[a[0]x,a[1]x,a[2]x,...a[N–1]x],其中,x表示分数位置,a[i]x表示所述分数位置x的第i个滤波器系数,并且a[0]x+a[1]x+a[2]x+…+a[N–1]x=T。
条款43.根据条款42所述的方法,其中所述分数位置x的最大值取决于帧内预测角度的精度。
条款44.根据条款43所述的方法,其中所述分数位置x的值大于0并且小于帧内预测角的所述精度。
条款45.根据条款43所述的方法,其中帧内预测角度的所述精度是2的幂的数。
条款46.根据条款43所述的方法,其中帧内预测角度的所述精度是32、64或128中的一个。
条款47.根据条款42所述的方法,其中所述插值滤波器的滤波器系数的值根据所述分数位置x的值按照降序排列。
条款48.根据条款42所述的方法,其中所述插值滤波器的滤波器系数的值根据所述分数位置x的值按照升序排列。
条款49.根据条款42所述的方法,其中如果所述分数位置x小于或等于帧内预测角度的所述精度的一半的值,则所述插值滤波器的滤波器系数的值按照升序排列;并且如果所述分数位置x大于帧内预测角度的所述精度的一半的值,则所述插值滤波器的滤波器系数的值按照降序排列。
条款50.根据条款42所述的方法,其中如果所述分数位置x小于或等于帧内预测角度的所述精度的一半的值,则所述插值滤波器的滤波器系数的值按照降序排列;并且如果所述分数位置x大于帧内预测角度的所述精度的一半的值,则所述插值滤波器的滤波器系数值按照升序排列。
条款51.根据条款30所述的方法,其中用于应用所述编码工具的信息以以下之一被指示:序列级别,图片组级别,图片级别,条带级别,或者图块组级别。
条款52.根据条款51所述的方法,其中所述信息被表示为被包含在以下之一中的语法元素:视频参数集(VPS),序列参数集(SPS),图片参数集(PPS),依赖参数集(DPS),解码能力信息(DCI),自适应参数集(APS)序列头,图片头,子图片头,条带头,或者图块头。
条款53.根据条款51所述的方法,其中所述信息以以下之一被指示:预测块(PB),变换块(TB),编码块(CB),预测单元(PU),变换单元(TU),编码单元(CU),虚拟管道数据单元(VPDU),编码树单元(CTU),CTU行,条带,图块,或者子图片。
条款54.根据条款30所述的方法,其中所述转换基于编码信息而被执行。
条款55.根据条款54所述的方法,其中编码信息包括以下至少一项:块大小,颜色格式,单/双树划分,颜色分量,条带类型,或图片类型。
条款56.根据条款30所述的方法,其中执行所述转换包括:基于所述帧内预测模式将所述当前块编码成所述比特流。
条款57.根据条款30所述的方法,其中执行所述转换包括:基于所述帧内预测模式从所述比特流解码所述当前块。
条款58.一种处理视频数据的方法,包括:基于当前块的模板对视频的所述当前块执行过程,所述过程是以下之一:细化过程,对参考样本滤波的过程,或确定被定位在分数位置处的样本的过程;以及在所述当前块和所述视频的比特流之间执行转换。
条款59.根据条款58所述的方法,其中所述当前块用以下之一编码:帧内编码模式,帧间编码模式,或组合帧间和帧内预测模式。
条款60.根据条款58所述的方法,其中所述过程是所述细化过程,并且执行所述过程包括:针对所述当前块确定以下项:第一成本,所述第一成本通过将所述细化过程应用于所述模板而被确定,以及第二成本,所述第二成本通过不将所述细化过程应用于所述模板而被确定;以及基于所述第一成本和所述第二成本将所述细化过程应用于所述当前块。
条款61.根据条款60所述的方法,其中基于所述第一成本和所述第二成本将所述细化过程应用于所述当前块包括:如果存在以下情况,则将所述细化过程应用于所述当前块:所述第一成本小于所述第二成本;或所述第二成本和所述第一成本之间的差异大于阈值。
条款62.根据条款60所述的方法,其中应用所述细化过程包括:将所述细化过程应用于以下至少一项:所述当前块的预测样本,或所述当前块的重建样本。
条款63.根据条款60所述的方法,其中所述细化过程为:用于细化所述当前块的预测样本和所述当前块的重建样本中的至少一个的过滤过程。
条款64.根据条款60所述的方法,其中细化过程是以下之一:位置相关帧内预测组合(PDPC)过程,或梯度PDPC过程。
条款65.根据条款58所述的方法,其中所述过程是对参考样本滤波的过程,并且执行所述过程包括:针对所述当前块确定以下项:第三成本,所述第三成本通过在所述模板的帧内预测期间对所述当前块的参考样本滤波而被确定,以及第四成本,所述第四样本通过在所述模板的所述帧内预测期间不对所述当前块的所述参考样本滤波而被确定;以及基于所述第三成本和所述第四成本对所述参考样本滤波。
条款66.根据条款65所述的方法,其中基于所述第三成本和所述第四成本对所述参考样本滤波包括:如果存在以下情况,则在所述帧内预测期间基于第三对所述参考样本滤波:所述第三成本小于所述第四成本,或所述第四成本和所述第三成本之间的差异大于阈值。
条款67.根据条款58所述的方法,其中所述过程是对参考样本滤波的过程,并且执行所述过程包括:针对所述当前块确定以下项:第五成本,所述第五成本通过在所述模板的帧内预测期间使用第一滤波方法来对参考样本滤波而被确定,以及第六成本,所述第六成本通过在所述模板的所述帧内预测期间使用第二滤波方法来对所述参考样本滤波而被确定;以及基于所述第五成本和所述第六成本对所述参考样本滤波。
条款68.根据条款67所述的方法,其中基于所述第五成本和所述第六成本对所述参考样本滤波包括以下之一:如果所述第五成本小于或等于所述第六成本,则在所述模板的所述帧内预测期间通过使用第一滤波方法对所述参考样本滤波;或者如果所述第五成本大于或等于所述第六成本,则在所述模板的所述帧内预测期间通过使用所述第二滤波方法来对所述参考样本滤波。
条款69.根据条款67所述的方法,其中基于所述第五成本和所述第六成本对所述参考样本滤波包括以下之一:如果所述第六成本和所述第五成本之间的差异大于或等于阈值,则在所述帧内预测期间通过使用所述第一滤波方法对所述参考样本滤波;或者如果所述第六成本和所述第五成本之间的差异小于或等于所述阈值,则在所述帧内预测期间通过使用所述第二滤波方法对所述参考样本滤波。
条款70.根据条款65所述的方法,其中所述当前块是亮度块或色度块。
条款71.根据条款58所述的方法,其中所述过程是确定被定位在分数位置处的样本的过程,并且执行所述过程包括:针对所述当前块确定以下项:第七成本,所述第七成本通过使用第一插值滤波器来确定在所述模板的帧内预测期间被定位在分数位置处的样本而被确定,以及第八成本,所述第八成本通过使用第二插值滤波器来确定在所述模板的所述帧内预测期间被定位在所述分数位置处的所述样本而被确定;以及基于所述第七成本和所述第八成本确定被定位在所述分数位置处的所述样本。
条款72.根据条款71所述的方法,其中基于所述第七成本和所述第八成本确定被定位在所述分数位置处的所述样本包括以下之一:如果所述第七成本小于或等于所述第八成本,则通过使用所述第一插值滤波器确定被定位在所述分数位置处的所述样本;或者如果所述第七成本大于或等于所述第八成本,则通过使用所述第二插值滤波器确被定位在所述分数位置处的所述样本。
条款73.根据条款67所述的方法,其中基于所述第七成本和所述第八成本确定被定位在所述分数位置的所述样本包括以下之一:如果所述第八成本和所述第七成本之间的差异大于或等于阈值,则通过使用所述插值滤波器确定被定位在所述分数位置的所述样本;或者如果所述第八成本和所述第七成本之间的差异小于或等于阈值,则通过使用所述插值滤波器确定被定位在所述分数位置的所述样本。
条款74.根据条款58所述的方法,其中用于执行所述过程的信息以以下之一被指示:序列级别,图片组级别,图片级别,条带级别,或者图块组级别。
条款75.根据条款74所述的方法,其中所述信息被表示为被包含在以下之一中的语法元素:视频参数集(VPS),序列参数集(SPS),图片参数集(PPS),依赖参数集(DPS),解码能力信息(DCI),自适应参数集(APS),序列头,图片头,子图片头,条带头,或者图块头。
条款76.根据条款74所述的方法,其中所述信息以以下之一处被指示:预测块(PB),变换块(TB)编码块(CB),预测单元(PU),变换单元(TU),编码单元(CU),虚拟管道数据单元(VPDU),编码树单元(CTU),CTU行,条带,图块,或者子图片。
条款77.根据条款58所述的方法,其中所述转换基于编码信息而被执行。
条款78.根据条款77所述的方法,其中编码信息包括以下至少一项:块大小,颜色格式,单/双树划分,颜色分量,条带类型,或图片类型。
条款79.根据条款58所述的方法,其中执行所述转换包括:将所述当前块编码成所述比特流。
条款80.根据条款58所述的方法,其中执行所述转换包括:从所述比特流解码所述当前块。
条款81.一种处理视频数据的方法,包括:确定用于视频的第一块的第一帧内预测模式;基于所述第一帧内预测模式,确定用于所述视频的第二块的第二帧内预测模式,包括以下之一:如果所述第一块和所述第二块在同一视频中,则在确定用于所述第二块的所述第二帧内预测模式期间排除所述第一帧内预测模式;或者如果所述第一块和所述第二块处于不同的视频中,则在确定用于所述第二块的所述第二帧内预测模式期间,包括所述第一帧内预测模式;以及基于所述第一帧内预测模式和所述第二帧内预测模式执行所述视频的所述第一块和所述第二块和比特流之间的转换。
条款82.根据条款81所述的方法,还包括:在用于所述第一块的重建过程和滤波过程中的至少一个期间应用所述第一帧内预测模式。
条款83.根据条款81所述所述的方法,其中所述第二块是所述第一块的邻近块,并且确定用于所述第二块的所述第二帧内预测模式包括:当所述第一帧内预测模式是默认模式或者所述第一块是非帧内编码块时,确定用于所述第二块的所述第二帧内预测模式。
条款84.根据条款83所述的方法,其中所述默认模式是以下之一:平面模式、DC模式、水平模式、垂直模式。
条款85.根据条款81所述的方法,还包括:确定用于第一块的第三帧内预测模式,其中确定用于所述第二块的所述第二帧内预测模式包括:基于所述第一预测模式构建和所述第三预测模式,构建用于所述第二块的最可能模式列表;以及基于所述最可能模式列表确定用于所述第二块的所述第二帧内预测模式。
条款86.根据条款85所述的方法,其中构建所述最可能模式包括:通过至少部分地排除所述第一帧内预测模式和所述第三帧内预测模式来构建所述最可能模式。
条款87.根据条款85所述的方法,其中所述第一帧内预测模式和所述第三帧内预测模式从所述第一块的邻近重建样本被导出。
条款88.根据条款85所述的方法,其中所述最可能的模式列表是以下之一:主要最可能模式列表,次要最可能模式列表,或主要最可能模式列表和次要最可能模式列表。
条款89.根据条款88所述的方法,其中构建所述最可能模式包括以下至少一项:通过包括所述第一帧内预测模式和所述第三帧内预测模式构建所述次要最可能模式,通过部分地包括所述第一帧内预测模式和所述第三帧内预测模式来构建所述次要最可能模式,或者通过部分地包括所述第一帧内预测模式和所述第三帧内预测模式来构建所述主要最可能模式。
条款90.根据条款81所述的方法,用于处理视频数据的信息以以下之一被指示:序列级别,图片组级别,图片级别,条带级别,或者图块组级别。
条款91.根据条款90所述的方法,其中所述信息被表示为被包含在以下之一中的语法元素:视频参数集(VPS),序列参数集(SPS),图片参数集(PPS),依赖参数集(DPS),解码能力信息(DCI),自适应参数集(APS),序列头,图片头,子图片头,条带头,或者图块头。
条款92.根据条款90所述的方法,其中所述信息以以下之一被指示:预测块(PB),变换块(TB)编码块(CB),预测单元(PU),变换单元(TU),编码单元(CU),虚拟管道数据单元(VPDU),编码树单元(CTU),CTU行,条带,图块,或者子图片。
条款93.根据条款81所述的方法,其中所述转换基于编码信息而被执行。
条款94.根据条款93所述的方法,其中所述编码信息包括以下至少一项:块大小,颜色格式,单/双树划分,颜色分量,条带类型,或图片类型。
条款95.根据条款81所述的方法,其中执行所述转换包括:基于所述第一帧内预测模式和所述第二帧内预测模式将所述第一块和所述第二块编码成所述比特流。
条款96.根据条款81所述的方法,其中执行所述转换包括:基于所述第一帧内预测模式和所述第二帧内预测模式从所述比特流解码所述第一块和所述第二块。
条款97.一种用于处理视频数据的装置,包括处理器和在其上具有指令的非暂时性存储器,其中所述指令在由所述处理器执行时使所述处理器执行根据条款1-29中任一项、条款30-57中任一项、条款58-80中任一项或条款81-96中任一项所述的方法。
条款98.一种非暂时性计算机可读存储介质,其存储指令,所述指令使处理器执行根据条款1-29中任一项、条款30-57中任一项、条款58-80中任一项或条款81-96中任一项所述的方法。
条款99.一种非暂时性计算机可读记录介质,其存储视频的比特流,所述视频的比特流通过由视频处理设备执行的方法生成,其中所述方法包括:基于至少一个第一参数来执行用于视频的当前块的帧内预测,所述至少一个第一参数不同于被用于常规角度模式的帧内预测的至少一个第二参数,所述当前块以至少一个扩展角度模式而被使用;以及基于所述执行生成所述视频的比特流。
条款100.一种非暂时性计算机可读记录介质,其存储由视频处理设备通过执行方法生成的视频的比特流,其中所述方法包括:确定扩展角度模式是否被用于所述视频的当前块;基于所述确定,在帧内预测过程期间应用编码工具,在所述帧内预测过程期间,用于所述当前块的帧内预测模式被确定;以及基于所述确定和所述应用生成所述比特流。
条款101.一种非暂时性计算机可读记录介质,其记录由视频处理设备通过执行方法生成的视频的比特流,其中所述方法包括:基于当前块的模板对所述视频的所述当前块执行过程,所述过程是以下之一:细化过程,对参考样本滤波的过程,或确定定位在分数位置的样本的过程;以及基于所述执行生成所述比特流。
条款102.一种非暂时性计算机可读记录介质,其存储由视频处理设备通过执行方法生成的视频的比特流,其中所述方法包括:确定用于所述视频的第一块的第一帧内预测模式;基于所述第一帧内预测模式,确定用于所述视频的第二块的第二帧内预测模式,包括以下之一:如果所述第一块和所述第二块在同一视频中,则在确定用于所述第二块的所述第二帧内预测模式期间排除所述第一帧内预测模式;或者如果所述第一块和所述第二块处于不同的视频中,则在确定用于所述第二块的所述第二帧内预测模式期间,包括所述第一帧内预测模式;以及基于所述确定生成所述比特流。
条款103.一种用于存储视频的比特流的方法,包括:基于至少一个第一参数来执行用于视频的当前块的帧内预测,所述至少一个第一参数不同于被用于常规角度模式的帧内预测的至少一个第二参数,所述当前块以至少一个扩展角度模式而被使用;基于所述执行生成所述视频的比特流;以及将所述比特流存储在非暂时性计算机可读记录介质中。
条款104.一种用于存储视频的比特流的方法,包括:确定扩展角度模式是否被用于所述视频的当前块;基于所述确定,在帧内预测过程期间应用编码工具,在所述帧内预测过程期间,用于所述当前块的帧内预测模式被确定;基于所述确定和所述应用生成所述比特流;以及将所述比特流存储在非暂时性计算机可读记录介质中。
条款105.一种用于存储视频的比特流的方法,包括:基于当前块的模板对所述视频的所述当前块执行过程,所述过程是以下之一:细化过程,对参考样本滤波的过程,或确定定位在分数位置的样本的过程;基于所述执行生成所述比特流;以及将所述比特流存储在非暂时性计算机可读记录介质中。
条款106.一种用于存储视频的比特流的方法,包括:确定用于所述视频的第一块的第一帧内预测模式;基于所述第一帧内预测模式,确定用于所述视频的第二块的第二帧内预测模式,包括以下之一:如果所述第一块和所述第二块在同一视频中,则在确定用于所述第二块的所述第二帧内预测模式期间排除所述第一帧内预测模式;或者如果所述第一块和所述第二块处于不同的视频中,则在确定用于所述第二块的所述第二帧内预测模式期间,包括所述第一帧内预测模式;基于所述确定生成所述比特流;以及将所述比特流存储在非暂时性计算机可读记录介质中。
示例设备
图21示出了可以在其中实现本公开的各种实施例的计算设备2100的框图。计算设备2100可以被实现为源设备110(或视频编码器114或200)或目的设备120(或视频解码器124或300),或者可以被包括在源设备110(或视频编码器114或200)或目的设备120(或视频解码器124或300)中。
应当理解的是,图21中示出的计算设备2100仅为了说明的目的,而不是以任何方式暗示对本公开实施例的功能和范围的任何限制
如图21所示,计算设备2100包括通用计算设备2100。计算设备2100可以至少包括一个或多个处理器或处理单元2110、存储器2120、存储单元2130、一个或多个通信单元2140、一个或多个输入设备2150以及一个或多个输出设备2160。
在一些实施例中,计算设备2100可以被实现为具有计算能力的任何用户终端或服务器终端。服务器终端可以是由服务提供商提供的服务器、大型计算设备等。用户终端例如可以是任何类型的移动终端、固定终端或便携式终端,包括移动电话、站、单元、设备、多媒体计算机、多媒体平板计算机、互联网节点、通信器、台式计算机、膝上型计算机、笔记本计算机、上网本计算机、个人通信系统(PCS)设备、个人导航设备、个人数字助理(PDA)、音频/视频播放器、数码相机/摄像机、定位设备、电视接收器、无线电广播接收器、电子书设备、游戏设备或其任何组合,并且包括这些设备的附件和外围设备或其任何组合。可以设想的是,计算设备2100可以支持到用户的任何类型的接口(诸如“可穿戴”电路装置等)。
处理单元2110可以是物理处理器或虚拟处理器,并且可以基于存储在存储器2120中的程序实现各种处理。在多处理器系统中,多个处理单元并行地执行计算机可执行指令,以便改善计算设备2100的并行处理能力。处理单元2110也可以被称为中央处理单元(CPU)、微处理器、控制器或微控制器。
计算设备2100通常包括各种计算机存储介质。这样的介质可以是由计算设备2100可访问的任何介质,包括但不限于易失性介质和非易失性介质、或可拆卸介质和不可拆卸介质。存储器2120可以是易失性存储器(例如,寄存器、高速缓存、随机存取存储器(RAM))、非易失性存储器(诸如只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)或闪存)或其任何组合。存储单元2130可以是任何可拆卸或不可拆卸的介质,并且可以包括机器可读介质,诸如存储器、闪存驱动器、磁盘或其他可以被用于存储信息和/或数据并且可以在计算设备2100中被访问的介质。
计算设备2100还可以包括附加的可拆卸/不可拆卸存储介质、易失性/非易失性存储介质。尽管在图21中未示出,但是可以提供用于从可拆卸的非易失性磁盘读取和/或写入可拆卸的非易失性磁盘的磁盘驱动器,以及用于从可拆卸的非易失性光盘读取和/或写入可拆卸的非易失性光盘的光盘驱动器。在这种情况下,每个驱动器可以经由一个或多个数据介质接口连接到总线(未示出)。
通信单元2140经由通信介质与另一计算设备通信。另外,计算设备2100中的组件的功能可以由可以经由通信连接进行通信的单个计算集群或多个计算机器来实现。因此,计算设备2100可以使用与一个或多个其他服务器、联网个人计算机(PC)或其他通用网络节点的逻辑连接来在联网环境中运行。
输入设备2150可以是各种输入设备中的一种或多种输入设备,诸如鼠标、键盘、轨迹球、语音输入设备等。输出设备2160可以是各种输出设备中的一种或多种输出设备,诸如显示器、扬声器、打印机等。借助于通信单元2140,计算设备2100还可以与一个或多个外部设备(未示出)通信,外部设备诸如是存储设备和显示设备,计算设备2100还可以与一个或多个使用户能够与计算设备2100交互的设备通信,或任何使计算设备2100能够与一个或多个其他计算设备通信的设备(例如网卡、调制解调器等)通信,如果需要的话。这种通信可以经由输入/输出(I/O)接口(未示出)进行。
在一些实施例中,计算设备2100的一些或所有组件也可以被布置在云计算架构中,而不是被集成在单个设备中。在云计算架构中,组件可以被远程提供并且共同工作,以实现本公开中描述的功能。在一些实施例中,云计算提供计算、软件、数据访问和存储服务,这将不要求最终用户知晓提供这些服务的系统或硬件的物理位置或配置。在各种实施例中,云计算使用合适的协议经由广域网(例如互联网)提供服务。例如,云计算提供商通过广域网提供应用程序,可以通过网络浏览器或任何其他计算组件访问这些应用程序。云计算架构的软件或组件以及对应的数据可以存储在远程服务器上。云计算环境中的计算资源可以被合并或分布在远程数据中心的位置。云计算基础设施可以通过共享数据中心提供服务,尽管它们表现为作为用户的单一接入点。因此,云计算架构可与被用于从远程位置的服务提供商处提供本文所述的组件和功能。备选地,它们可以由常规服务器提供,或者直接或以其他方式安装在客户端设备上。
在本公开的实施例中,计算设备2100可以被用于实现视频编码/解码。存储器2120可以包括具有一个或多个程序指令的一个或多个视频编解码模块2125。这些模块能够由处理单元2110访问和执行,以执行本文描述的各种实施例的功能。
在执行视频编码的示例实施例中,输入设备2150可以接收视频数据作为待编码的输入2170。视频数据可以由例如视频编解码模块2125处理,以生成经编码的码流。经编码的码流可以经由输出设备2160作为输出2180被提供。
在执行视频解码的示例实施例中,输入设备2150可以接收经编码的码流作为输入2170。经编码的码流可以由例如视频编解码模块2125处理,以生成经解码的视频数据。经解码的视频数据可以经由输出设备2160作为输出2180被提供。
虽然已经参考本公开的优选实施例具体示出和描述了本公开,但是本领域技术人员将理解,在不脱离由所附权利要求限定的本申请的精神和范围的情况下,可以在形式和细节上进行各种改变。这些变化旨在由本申请的范围所涵盖。因此,本申请的实施例的前述描述不旨在是限制性的。

Claims (106)

1.一种处理视频数据的方法,包括:
在视频的当前块和所述视频的比特流之间的转换期间,基于至少一个第一参数来执行用于所述当前块的帧内预测,所述至少一个第一参数不同于用于常规角度模式的帧内预测的至少一个第二参数,至少一个扩展角度模式被用于所述当前块;以及
基于所述帧内预测的模式执行所述转换。
2.根据权利要求1所述的方法,其中所述至少一个扩展角度模式由以下至少一项确定:
邻近样本,或者
邻近像素。
3.根据权利要求1所述的方法,其中所述当前块使用以下之一进行编码:
解码器侧帧内模式导出模式,
帧内预测模式,
具有子划分模式的帧内预测,或者
具有多参考行模式的帧内预测。
4.根据权利要求1所述的方法,其中所述至少一个扩展角度模式是从预定义集合确定的。
5.根据权利要求4所述的方法,其中被包含在所述预定义集合中的所述至少一个扩展角度模式在所述比特流中被指示,或者在编码器或解码器处被导出。
6.根据权利要求4所述的方法,其中所述预定义集合的扩展角度模式从两个预定义角度模式被导出,所述两个预定义角度模式被包含在针对帧内预测而被预定义的帧内预测模式集中,所述两个预定义角度模式彼此相邻或者非相邻。
7.根据权利要求6所述的方法,其中所述扩展角度模式的角度值介于所述两个预定义角度模式的角度值之间。
8.根据权利要求6所述的方法,其中所述扩展角度模式的角度精度高于所述两个预定义角度模式的角度精度中的至少一个角度精度。
9.根据权利要求6所述的方法,其中所述扩展角度模式的所述角度精度为1/64或1/128。
10.根据权利要求4所述的方法,其中如果所述当前块是非正方形的,则所述预定义集合包括具有宽角度的至少一个帧内预测模式,并且被用于所述预定义集合的具有宽角度的帧内预测模式的数目大于预设值。
11.根据权利要求10所述的方法,其中具有宽角度的所述至少一个帧内预测模式的角度精度高于预定义的角度精度。
12.根据权利要求1所述的方法,其中所述至少一个第一参数使用帧内预测角度而被确定。
13.根据权利要求12所述的方法,其中所述至少一个第一参数使用第一值和第二值而被进一步确定,所述第一值和所述第二值的乘积大于或等于512*32。
14.根据权利要求13所述的方法,其中所述第一值是512并且所述第二值是64,或者所述第一值是1024并且所述第二值是32。
15.根据权利要求13所述的方法,其中所述至少一个第一参数是反向角参数并且由以下方式被导出:
反向角参数=函数(第一值*第二值/帧内预测角),其中所述函数是舍入函数或向上取整函数。
16.根据权利要求1所述的方法,还包括:
基于所述扩展角度模式确定用于另一块的另一帧内预测模式。
17.根据权利要求16所述的方法,其中所述当前块和所述另一块在所述视频的相同图片、子图片或条带或图块中。
18.根据权利要求16所述的方法,其中所述另一块与所述当前块相邻或者非相邻。
19.根据权利要求16所述的方法,其中确定所述另一帧内预测模式包括:
基于所述扩展角度模式构建用于所述视频的所述另一块的最可能模式列表;以及
基于所述最可能模式列表确定所述另一帧内预测模式。
20.根据权利要求19所述的方法,其中基于所述扩展角度模式构建所述最可能模式列表包括以下之一:
将所述扩展角度模式包含到所述最可能模式列表中;或者
从所述最可能模式列表中排除所述扩展角度模式。
21.根据权利要求19所述的方法,其中基于所述扩展角度模式构建所述最可能模式列表包括:
将所述扩展角度模式映射到预定义角度模式;以及
将所映射的所述预定义角度模式包含到所述最可能模式列表中。
22.根据权利要求21所述的方法,其中所述预定义角度模式是最接近所述扩展角度模式的常规角度模式。
23.根据权利要求1所述的方法,其中所述至少一个第一参数以以下之一被指示:
序列级别,
图片组级别,
图片级别,
条带级别,或者
图块组级别。
24.根据权利要求1所述的方法,其中所述至少一个第一参数被表示为被包含在以下之一中的语法元素:
视频参数集(VPS),
序列参数集(SPS),
图片参数集(PPS),
依赖参数集(DPS),
解码能力信息(DCI),
自适应参数集(APS),
序列头,
图片头,
子图片头,
条带头,或者
图块头。
25.根据权利要求1所述的方法,其中所述至少一个参数在以下之一处被指示:
预测块(PB),
变换块(TB),
编码块(CB),
预测单元(PU),
变换单元(TU),
编码单元(CU),
虚拟管道数据单元(VPDU),
编码树单元(CTU),
CTU行,
条带,
图块,或者
子图片。
26.根据权利要求1所述的方法,其中所述转换基于经编码的信息而被执行。
27.根据权利要求25所述的方法,其中所述编码信息包括以下至少一项:
块大小,
颜色格式,
单/双树划分,
颜色分量,
条带类型,或者
图片类型。
28.根据权利要求1所述的方法,其中执行所述转换包括:
基于所述帧内预测模式将所述当前块编码成所述比特流。
29.根据权利要求1所述的方法,其中执行所述转换包括:
基于所述帧内预测模式从所述比特流解码所述当前块。
30.一种处理视频数据的方法,包括:
在视频的当前块和视频的比特流之间的转换期间,确定扩展角度模式是否被用于所述当前块;
基于所述确定,在帧内预测过程期间应用编码工具,在所述帧内预测过程期间用于所述当前块的帧内预测模式被确定;以及
基于所述帧内预测模式执行所述转换。
31.根据权利要求30所述的方法,其中编码工具是以下之一:
平滑滤波器,
位置相关帧内预测组合(PDPC)滤波器,
梯度PDPC滤波器,或者
插值滤波器。
32.根据权利要求30所述的方法,其中应用所述编码工具包括:
应用具有不同于第二精度的第一精度的至少一个插值滤波器来在分数位置处生成样本,所述第二精度被用于如下情况:常规角度模式被用于所述当前块。
33.根据权利要求32所述的方法,其中所述第一精度高于所述第二精度。
34.根据权利要求32所述的方法,其中应用所述编码工具包括:
基于颜色分量应用具有所述第一精度的所述至少一个插值滤波器。
35.根据权利要求32所述的方法,其中应用所述编码工具包括:
将具有所述第一精度的所述至少一个插值滤波器应用于第一颜色分量;以及
将具有所述第二精度的至少一个插值滤波器应用于第二颜色分量。
36.根据权利要求35所述的方法,其中所述第一颜色分量或第二颜色分量是以下之一:
YCbCr格式的颜色分量Y、Cb或Cr,或者
RGB格式的颜色分量R、G和B。
37.根据权利要求32所述的方法,其中应用具有所述第一精度的所述至少一个插值滤波器包括:
如果扩展角度模式被用于所述当前块,则应用具有所述第一精度的所述至少一个插值滤波器。
38.根据权利要求32所述的方法,其中具有所述第一精度的所述至少一个插值滤波器属于插值滤波器集,针对如下情况所述插值滤波器集被允许使用:扩展角度模式被用于所述当前块的情况。
39.根据权利要求32所述的方法,其中具有所述第一精度的所述至少一个插值滤波器在解码器处被导出或者被包含在所述比特流中。
40.根据权利要求38所述的方法,其中被包含在所述插值滤波器集中的不同插值滤波器被定义用于不同的扩展角模式。
41.根据权利要求31所述的方法,其中所述插值滤波器的精度等于1/T,其中T是等于T=2K的整数,其中K是大于6的整数。
42.根据权利要求31所述的方法,其中所述至少一个插值滤波器中的插值滤波器是使用N个样本在分数位置插值样本的N抽头滤波器,其中N是所述插值滤波器的抽头的数目;并且
其中所述插值滤波器被定义为:f(x)=[a[0]x,a[1]x,a[2]x,...a[N–1]x],其中,
x表示分数位置,
a[i]x表示所述分数位置x的第i个滤波器系数,并且
a[0]x+a[1]x+a[2]x+…+a[N–1]x=T。
43.根据权利要求42所述的方法,其中所述分数位置x的最大值取决于帧内预测角度的精度。
44.根据权利要求43所述的方法,其中所述分数位置x的值大于0并且小于帧内预测角的所述精度。
45.根据权利要求43所述的方法,其中帧内预测角度的所述精度是2的幂的数。
46.根据权利要求43所述的方法,其中帧内预测角度的所述精度是32、64或者128中的一个。
47.根据权利要求42所述的方法,其中所述插值滤波器的滤波器系数的值根据所述分数位置x的值按照降序排列。
48.根据权利要求42所述的方法,其中所述插值滤波器的滤波器系数的值根据所述分数位置x的值按照升序排列。
49.根据权利要求42所述的方法,其中如果所述分数位置x小于或等于帧内预测角度的所述精度的一半的值,则所述插值滤波器的滤波器系数的值按照升序排列;并且
如果所述分数位置x大于帧内预测角度的所述精度的一半的值,则所述插值滤波器的滤波器系数的值按照降序排列。
50.根据权利要求42所述的方法,其中如果所述分数位置x小于或等于帧内预测角度的所述精度的一半的值,则所述插值滤波器的滤波器系数的值按照降序排列;并且
如果所述分数位置x大于帧内预测角度的所述精度的一半的值,则所述插值滤波器的滤波器系数值按照升序排列。
51.根据权利要求30所述的方法,其中用于应用所述编码工具的信息以以下之一被指示:
序列级别,
图片组级别,
图片级别,
条带级别,或者
图块组级别。
52.根据权利要求51所述的方法,其中所述信息被表示为被包含在以下之一中的语法元素:
视频参数集(VPS),
序列参数集(SPS),
图片参数集(PPS),
依赖参数集(DPS),
解码能力信息(DCI),
自适应参数集(APS)
序列头,
图片头,
子图片头,
条带头,或者
图块头。
53.根据权利要求51所述的方法,其中所述信息以以下之一被指示:
预测块(PB),
变换块(TB),
编码块(CB),
预测单元(PU),
变换单元(TU),
编码单元(CU),
虚拟管道数据单元(VPDU),
编码树单元(CTU),
CTU行,
条带,
图块,或者
子图片。
54.根据权利要求30所述的方法,其中所述转换基于编码信息而被执行。
55.根据权利要求54所述的方法,其中编码信息包括以下至少一项:
块大小,
颜色格式,
单/双树划分,
颜色分量,
条带类型,或者
图片类型。
56.根据权利要求30所述的方法,其中执行所述转换包括:
基于所述帧内预测模式将所述当前块编码成所述比特流。
57.根据权利要求30所述的方法,其中执行所述转换包括:
基于所述帧内预测模式从所述比特流解码所述当前块。
58.一种处理视频数据的方法,包括:
基于当前块的模板对视频的所述当前块执行过程,所述过程是以下之一:
细化过程,
对参考样本滤波的过程,或者
确定被定位在分数位置处的样本的过程;以及
在所述当前块和所述视频的比特流之间执行转换。
59.根据权利要求58所述的方法,其中所述当前块使用以下之一来编码:
帧内编码模式,
帧间编码模式,或者
组合帧间和帧内预测模式。
60.根据权利要求58所述的方法,其中所述过程是所述细化过程,并且执行所述过程包括:
针对所述当前块确定以下项:
第一成本,所述第一成本通过将所述细化过程应用于所述模板而被确定,以及
第二成本,所述第二成本通过不将所述细化过程应用于所述模板而被确定;以及
基于所述第一成本和所述第二成本将所述细化过程应用于所述当前块。
61.根据权利要求60所述的方法,其中基于所述第一成本和所述第二成本将所述细化过程应用于所述当前块包括:
如果存在以下情况,则将所述细化过程应用于所述当前块:
所述第一成本小于所述第二成本;或者
所述第二成本和所述第一成本之间的差异大于阈值。
62.根据权利要求60所述的方法,其中应用所述细化过程包括:
将所述细化过程应用于以下至少一项:
所述当前块的预测样本,或者
所述当前块的重建样本。
63.根据权利要求60所述的方法,其中所述细化过程为:
用于细化所述当前块的预测样本和所述当前块的重建样本中的至少一个的过滤过程。
64.根据权利要求60所述的方法,其中细化过程是以下之一:
位置相关帧内预测组合(PDPC)过程,或者
梯度PDPC过程。
65.根据权利要求58所述的方法,其中所述过程是对参考样本滤波的过程,并且执行所述过程包括:
针对所述当前块确定以下项:
第三成本,所述第三成本通过在所述模板的帧内预测期间对所述当前块的参考样本滤波而被确定,以及
第四成本,所述第四成本通过在所述模板的所述帧内预测期间不对所述当前块的所述参考样本滤波而被确定;以及
基于所述第三成本和所述第四成本对所述参考样本滤波。
66.根据权利要求65所述的方法,其中基于所述第三成本和所述第四成本对所述参考样本滤波包括:
如果存在以下情况,则在所述帧内预测期间基于第三成本对所述参考样本滤波:
所述第三成本小于所述第四成本,或
所述第四成本和所述第三成本之间的差异大于阈值。
67.根据权利要求58所述的方法,其中所述过程是对参考样本滤波的过程,并且执行所述过程包括:
针对所述当前块确定以下项:
第五成本,所述第五成本通过在所述模板的帧内预测期间使用第一滤波方法来对参考样本滤波而被确定,以及
第六成本,所述第六成本通过在所述模板的所述帧内预测期间使用第二滤波方法来对所述参考样本滤波而被确定;以及基于所述第五成本和所述第六成本对所述参考样本滤波。
68.根据权利要求67所述的方法,其中基于所述第五成本和所述第六成本对所述参考样本滤波包括以下之一:
如果所述第五成本小于或等于所述第六成本,则在所述模板的所述帧内预测期间通过使用第一滤波方法对所述参考样本滤波;或者
如果所述第五成本大于或等于所述第六成本,则在所述模板的所述帧内预测期间通过使用所述第二滤波方法来对所述参考样本滤波。
69.根据权利要求67所述的方法,其中基于所述第五成本和所述第六成本对所述参考样本滤波包括以下之一:
如果所述第六成本和所述第五成本之间的差异大于或等于阈值,则在所述帧内预测期间通过使用所述第一滤波方法对所述参考样本滤波;或者
如果所述第六成本和所述第五成本之间的差异小于或等于所述阈值,则在所述帧内预测期间通过使用所述第二滤波方法对所述参考样本滤波。
70.根据权利要求65所述的方法,其中所述当前块是亮度块或色度块。
71.根据权利要求58所述的方法,其中所述过程是确定被定位在分数位置处的样本的过程,并且执行所述过程包括:
针对所述当前块确定以下项:
第七成本,所述第七成本通过使用第一插值滤波器来确定在所述模板的帧内预测期间被定位在分数位置处的样本而被确定,以及
第八成本,所述第八成本通过使用第二插值滤波器来确定在所述模板的所述帧内预测期间被定位在所述分数位置处的所述样本而被确定;以及
基于所述第七成本和所述第八成本确定被定位在所述分数位置处的所述样本。
72.根据权利要求71所述的方法,其中基于所述第七成本和所述第八成本确定被定位在所述分数位置处的所述样本包括以下之一:
如果所述第七成本小于或等于所述第八成本,则通过使用所述第一插值滤波器确定被定位在所述分数位置处的所述样本;或者
如果所述第七成本大于或等于所述第八成本,则通过使用所述第二插值滤波器确被定位在所述分数位置处的所述样本。
73.根据权利要求67所述的方法,其中基于所述第七成本和所述第八成本确定被定位在所述分数位置的所述样本包括以下之一:
如果所述第八成本和所述第七成本之间的差异大于或等于阈值,则通过使用所述插值滤波器确定被定位在所述分数位置的所述样本;或者
如果所述第八成本和所述第七成本之间的差异小于或等于阈值,则通过使用所述插值滤波器确定被定位在所述分数位置的所述样本。
74.根据权利要求58所述的方法,其中用于执行所述过程的信息以以下之一被指示:
序列级别,
图片组级别,
图片级别,
条带级别,或者
图块组级别。
75.根据权利要求74所述的方法,其中所述信息被表示为被包含在以下之一中的语法元素:
视频参数集(VPS),
序列参数集(SPS),
图片参数集(PPS),
依赖参数集(DPS),
解码能力信息(DCI),
自适应参数集(APS),
序列头,
图片头,
子图片头,
条带头,或者
图块头。
76.根据权利要求74所述的方法,其中所述信息以以下之一处被指示:
预测块(PB),
变换块(TB)
编码块(CB),
预测单元(PU),
变换单元(TU),
编码单元(CU),
虚拟管道数据单元(VPDU),
编码树单元(CTU),
CTU行,
条带,
图块,或者
子图片。
77.根据权利要求58所述的方法,其中所述转换基于编码信息而被执行。
78.根据权利要求77所述的方法,其中编码信息包括以下至少一项:
块大小,
颜色格式,
单/双树划分,
颜色分量,
条带类型,或者
图片类型。
79.根据权利要求58所述的方法,其中执行所述转换包括:
将所述当前块编码成所述比特流。
80.根据权利要求58所述的方法,其中执行所述转换包括:
从所述比特流解码所述当前块。
81.一种处理视频数据的方法,包括:
确定用于视频的第一块的第一帧内预测模式;
基于所述第一帧内预测模式,确定用于所述视频的第二块的第二帧内预测模式,包括以下之一:
如果所述第一块和所述第二块在同一视频中,则在确定用于所述第二块的所述第二帧内预测模式期间排除所述第一帧内预测模式;或者
如果所述第一块和所述第二块处于不同的视频中,则在确定用于所述第二块的所述第二帧内预测模式期间,包括所述第一帧内预测模式;以及
基于所述第一帧内预测模式和所述第二帧内预测模式执行所述视频的所述第一块和所述第二块和比特流之间的转换。
82.根据权利要求81所述的方法,还包括:
在用于所述第一块的重建过程和滤波过程中的至少一个期间应用所述第一帧内预测模式。
83.根据权利要求81所述所述的方法,其中所述第二块是所述第一块的邻近块,并且确定用于所述第二块的所述第二帧内预测模式包括:
当所述第一帧内预测模式是默认模式或者所述第一块是非帧内编码块时,确定用于所述第二块的所述第二帧内预测模式。
84.根据权利要求83所述的方法,其中所述默认模式是以下之一:平面模式、DC模式、水平模式、垂直模式。
85.根据权利要求81所述的方法,还包括:
确定用于第一块的第三帧内预测模式,
其中确定用于所述第二块的所述第二帧内预测模式包括:
基于所述第一预测模式所述第三预测模式,构建用于所述第二块的最可能模式列表;以及
基于所述最可能模式列表确定用于所述第二块的所述第二帧内预测模式。
86.根据权利要求85所述的方法,其中构建所述最可能模式包括:
通过至少部分地排除所述第一帧内预测模式和所述第三帧内预测模式来构建所述最可能模式。
87.根据权利要求85所述的方法,其中所述第一帧内预测模式和所述第三帧内预测模式从所述第一块的邻近重建样本被导出。
88.根据权利要求85所述的方法,其中所述最可能的模式列表是以下之一:
主要最可能模式列表,
次要最可能模式列表,或者
主要最可能模式列表和次要最可能模式列表。
89.根据权利要求88所述的方法,其中构建所述最可能模式包括以下至少一项:
通过包括所述第一帧内预测模式和所述第三帧内预测模式构建所述次要最可能模式,
通过部分地包括所述第一帧内预测模式和所述第三帧内预测模式来构建所述次要最可能模式,或者
通过部分地包括所述第一帧内预测模式和所述第三帧内预测模式来构建所述主要最可能模式。
90.根据权利要求81所述的方法,用于处理视频数据的信息以以下之一被指示:
序列级别,
图片组级别,
图片级别,
条带级别,或者
图块组级别。
91.根据权利要求90所述的方法,其中所述信息被表示为被包含在以下之一中的语法元素:
视频参数集(VPS),
序列参数集(SPS),
图片参数集(PPS),
依赖参数集(DPS),
解码能力信息(DCI),
自适应参数集(APS),
序列头,
图片头,
子图片头,
条带头,或者
图块头。
92.根据权利要求90所述的方法,其中所述信息以以下之一被指示:
预测块(PB),
变换块(TB)
编码块(CB),
预测单元(PU),
变换单元(TU),
编码单元(CU),
虚拟管道数据单元(VPDU),
编码树单元(CTU),
CTU行,
条带,
图块,或者
子图片。
93.根据权利要求81所述的方法,其中所述转换基于编码信息而被执行。
94.根据权利要求93所述的方法,其中所述编码信息包括以下至少一项:
块大小,
颜色格式,
单/双树划分,
颜色分量,
条带类型,或者
图片类型。
95.根据权利要求81所述的方法,其中执行所述转换包括:
基于所述第一帧内预测模式和所述第二帧内预测模式将所述第一块和所述第二块编码成所述比特流。
96.根据权利要求81所述的方法,其中执行所述转换包括:
基于所述第一帧内预测模式和所述第二帧内预测模式从所述比特流解码所述第一块和所述第二块。
97.一种用于处理视频数据的装置,包括处理器和在其上具有指令的非暂时性存储器,其中所述指令在由所述处理器执行时使所述处理器执行根据权利要求1-29中任一项、权利要求30-57中任一项、权利要求58-80中任一项或权利要求81-96中任一项所述的方法。
98.一种非暂时性计算机可读存储介质,其存储指令,所述指令使处理器执行根据权利要求1-29中任一项、权利要求30-57中任一项、权利要求58-80中任一项或权利要求81-96中任一项所述的方法。
99.一种非暂时性计算机可读记录介质,其存储视频的比特流,所述视频的比特流通过由视频处理设备执行的方法生成,其中所述方法包括:
基于至少一个第一参数来执行用于视频的当前块的帧内预测,所述至少一个第一参数不同于被用于常规角度模式的帧内预测的至少一个第二参数,所述当前块以至少一个扩展角度模式而被使用;以及
基于所述执行生成所述视频的比特流。
100.一种非暂时性计算机可读记录介质,其存储由视频处理设备通过执行方法生成的视频的比特流,其中所述方法包括:
确定扩展角度模式是否被用于所述视频的当前块;
基于所述确定,在帧内预测过程期间应用编码工具,在所述帧内预测过程期间,用于所述当前块的帧内预测模式被确定;以及
基于所述确定和所述应用生成所述比特流。
101.一种非暂时性计算机可读记录介质,其记录由视频处理设备通过执行方法生成的视频的比特流,其中所述方法包括:
基于当前块的模板对所述视频的所述当前块执行过程,所述过程是以下之一:
细化过程,
对参考样本滤波的过程,或者
确定定位在分数位置的样本的过程;以及
基于所述执行生成所述比特流。
102.一种非暂时性计算机可读记录介质,其存储由视频处理设备通过执行方法生成的视频的比特流,其中所述方法包括:
确定用于所述视频的第一块的第一帧内预测模式;
基于所述第一帧内预测模式,确定用于所述视频的第二块的第二帧内预测模式,包括以下之一:
如果所述第一块和所述第二块在同一视频中,则在确定用于所述第二块的所述第二帧内预测模式期间排除所述第一帧内预测模式;或者
如果所述第一块和所述第二块处于不同的视频中,则在确定用于所述第二块的所述第二帧内预测模式期间,包括所述第一帧内预测模式;以及
基于所述确定生成所述比特流。
103.一种用于存储视频的比特流的方法,包括:
基于至少一个第一参数来执行用于视频的当前块的帧内预测,所述至少一个第一参数不同于被用于常规角度模式的帧内预测的至少一个第二参数,所述当前块以至少一个扩展角度模式而被使用;
基于所述执行生成所述视频的比特流;以及
将所述比特流存储在非暂时性计算机可读记录介质中。
104.一种用于存储视频的比特流的方法,包括:
确定扩展角度模式是否被用于所述视频的当前块;
基于所述确定,在帧内预测过程期间应用编码工具,在所述帧内预测过程期间,用于所述当前块的帧内预测模式被确定;
基于所述确定和所述应用生成所述比特流;以及
将所述比特流存储在非暂时性计算机可读记录介质中。
105.一种用于存储视频的比特流的方法,包括:
基于当前块的模板对所述视频的所述当前块执行过程,所述过程是以下之一:
细化过程,
对参考样本滤波的过程,或者
确定定位在分数位置的样本的过程;
基于所述执行生成所述比特流;以及
将所述比特流存储在非暂时性计算机可读记录介质中。
106.一种用于存储视频的比特流的方法,包括:
确定用于所述视频的第一块的第一帧内预测模式;
基于所述第一帧内预测模式,确定用于所述视频的第二块的第二帧内预测模式,包括以下之一:
如果所述第一块和所述第二块在同一视频中,则在确定用于所述第二块的所述第二帧内预测模式期间排除所述第一帧内预测模式;或者
如果所述第一块和所述第二块处于不同的视频中,则在确定用于所述第二块的所述第二帧内预测模式期间,包括所述第一帧内预测模式;
基于所述确定生成所述比特流;以及
将所述比特流存储在非暂时性计算机可读记录介质中。
CN202280037957.6A 2021-05-27 2022-05-26 用于视频处理的方法、设备和介质 Pending CN117581533A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CNPCT/CN2021/096481 2021-05-27
CN2021096481 2021-05-27
PCT/CN2022/095124 WO2022247884A1 (en) 2021-05-27 2022-05-26 Method, device, and medium for video processing

Publications (1)

Publication Number Publication Date
CN117581533A true CN117581533A (zh) 2024-02-20

Family

ID=84228442

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280037957.6A Pending CN117581533A (zh) 2021-05-27 2022-05-26 用于视频处理的方法、设备和介质

Country Status (2)

Country Link
CN (1) CN117581533A (zh)
WO (1) WO2022247884A1 (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10440391B2 (en) * 2016-08-05 2019-10-08 Mediatek Inc. Method and apparatus of video coding
US10764587B2 (en) * 2017-06-30 2020-09-01 Qualcomm Incorporated Intra prediction in video coding
CN117294852A (zh) * 2018-07-15 2023-12-26 北京字节跳动网络技术有限公司 跨分量编解码顺序导出
KR102618079B1 (ko) * 2018-10-07 2023-12-27 삼성전자주식회사 복수개의 참조 라인을 위한 mpm 구성 방법을 이용한 비디오 신호 처리 방법 및 장치

Also Published As

Publication number Publication date
WO2022247884A1 (en) 2022-12-01

Similar Documents

Publication Publication Date Title
US11902537B2 (en) Usage of templates for decoder-side intra mode derivation
CN114765685A (zh) 基于多帧内预测模式的用于解码或编解码图像的技术
CN114765687A (zh) 用于解码器侧内模式导出的信令
CN114765686A (zh) 基于多个帧内预测模式的解码或编解码图像的技术
CN117597931A (zh) 用于视频处理的方法、装置和介质
CN115176475A (zh) 多参考线色度预测
JPWO2020211807A5 (zh)
WO2023016408A1 (en) Method, apparatus, and medium for video processing
CN117063471A (zh) 用于运动矢量差的联合信令方法
CN115606182A (zh) 使用增强二次变换的编解码视频处理
CN117581533A (zh) 用于视频处理的方法、设备和介质
WO2023016424A1 (en) Method, apparatus, and medium for video processing
CN117769836A (zh) 用于视频处理的方法、设备和介质
CN117356090A (zh) 用于视频处理的方法、设备和介质
WO2023016439A1 (en) Method, apparatus, and medium for video processing
CN118044182A (zh) 用于视频处理的方法、设备和介质
CN117581544A (zh) 用于视频处理所述的方法、设备和介质
WO2023201930A1 (en) Method, apparatus, and medium for video processing
WO2022242727A1 (en) Method, device, and medium for video processing
US20240137529A1 (en) Method, device, and medium for video processing
WO2024078551A1 (en) Method, apparatus, and medium for video processing
WO2023051532A1 (en) Method, device, and medium for video processing
WO2023198120A1 (en) Method, apparatus, and medium for video processing
WO2024078550A1 (en) Method, apparatus, and medium for video processing
CN117501690A (zh) 用于视频处理的方法、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication