CN113632462A - 默认的环内整形参数 - Google Patents

默认的环内整形参数 Download PDF

Info

Publication number
CN113632462A
CN113632462A CN202080023706.3A CN202080023706A CN113632462A CN 113632462 A CN113632462 A CN 113632462A CN 202080023706 A CN202080023706 A CN 202080023706A CN 113632462 A CN113632462 A CN 113632462A
Authority
CN
China
Prior art keywords
video
block
bitstream representation
mode
aps
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202080023706.3A
Other languages
English (en)
Other versions
CN113632462B (zh
Inventor
张莉
张凯
刘鸿彬
许继征
王悦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Original Assignee
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd, ByteDance Inc filed Critical Beijing ByteDance Network Technology Co Ltd
Publication of CN113632462A publication Critical patent/CN113632462A/zh
Application granted granted Critical
Publication of CN113632462B publication Critical patent/CN113632462B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

描述了用于数字视频编解码的设备、系统和方法,其包括用于视频编解码的环内整形。用于视频处理的示例性方法包括:执行包括一个或多个视频数据单元的视频和所述视频的比特流表示之间的转换,其中,所述比特流表示符合格式规则,所述格式规则指定包含指示用于编解码模式的默认参数的边信息,所述编解码模式适用于对其启用所述编解码模式的所述一个或多个视频数据单元的视频块,并且其中,所述边信息提供参数用于基于所述视频块在原始域和整形域中的表示和/或色度视频块的色度残差的取决于亮度的缩放,构造所述视频块。

Description

默认的环内整形参数
相关申请的交叉参考
根据适用的《专利法》和/或《巴黎公约》的规定,本申请及时要求于2019年3月23日提交的国际专利申请号PCT/CN2019/079393的优先权和利益。根据美国法律,将上述申请的全部公开以参考方式并入本文,作为本申请公开的一部分。
技术领域
本专利文件涉及视频编解码技术、设备和系统。
背景技术
尽管在视频压缩方面有所进步,在互联网和其他数字通信网络中,数字视频占用的带宽最大。随着能够接收和显示视频的连接用户设备数量的增加,预计数字视频使用的带宽需求将继续增长。
发明内容
描述了涉及数字视频编解码、并且具体地涉及用于视频编解码的环内整形(ILR)的设备、系统和方法。所述方法可应用于现有视频编解码标准(例如,高效视频编解码(HEVC))和未来视频编解码标准二者、或视频编解码器。
在一个典型的方面,所公开的技术可用于提供一种用于视频处理的方法。所述方法包括:执行包括一个或多个视频数据单元的视频和所述视频的比特流表示之间的转换,其中,所述比特流表示符合格式规则,所述格式规则指定包含指示用于编解码模式的默认参数的边信息,所述编解码模式适用于对其启用所述编解码模式的所述一个或多个视频数据单元的视频块,并且其中,所述边信息提供参数用于基于所述视频块在原始域和整形域中的表示和/或色度视频块的色度残差的取决于亮度的缩放,构造所述视频块。
在另一典型的方面,所公开的技术可用于提供一种用于视频处理的方法。所述方法包括:执行包括一个或多个视频数据单元的视频和所述视频的比特流表示之间的转换,其中所述比特流表示符合格式规则,所述格式规则指定包含指示用于编解码模式的默认参数的边信息,所述编解码模式适用于对其启用所述编解码模式的所述一个或多个视频数据单元的视频块,其中,在所述比特流表示中不存在显式地信令通知的参数的情况下将所述默认参数用于所述编解码模式,并且其中,所述编解码模式包括基于所述视频块在原始域和整形域中的表示和/或色度视频块的色度残差的取决于亮度的缩放,构造所述视频块。
在又一典型的方面,所公开的技术可用于提供一种用于视频处理的方法。所述方法包括:为包括一个或多个视频数据单元的视频和所述视频的比特流表示之间的转换配置所述比特流表示,所述比特流表示包括信令通知时域层信息的语法元素、以及适用于所述一个或多个视频数据单元的视频块的编解码模式的参数;以及基于所述配置执行所述转换,其中所述编解码模式包括基于原始域和整形域和/或色度视频块的色度残差的取决于亮度的缩放,构造所述视频块。
在又一典型的方面,所公开的技术可用于提供一种用于视频处理的方法。所述方法包括:为包括一个或多个视频数据单元的视频和所述视频的比特流表示之间的转换解析所述比特流表示,所述比特流表示包括信令通知时域层信息的语法元素、以及适用于所述一个或多个视频数据单元的视频块的编解码模式的参数;以及基于所述配置执行所述转换,其中所述编解码模式包括基于原始域和整形域和/或色度视频块的色度残差的取决于亮度的缩放,构造所述视频块。
在又一典型的方面,所公开的技术可用于提供一种用于视频处理的方法。所述方法包括:执行视频的第一视频数据单元和所述视频的比特流表示之间执行转换,其中编解码模式适用于所述第一视频数据单元的视频块,其中所述编解码模式包括基于与所述编解码模式相关的边信息,基于原始域和整形域和/或色度视频块的色度残差的取决于亮度的缩放,构造所述视频块,并且其中,根据基于时域层索引的规则来确定所述边信息。
在又一典型的方面,所公开的技术可用于提供一种用于视频处理的方法。所述方法包括:为包括一个或多个视频数据单元的视频和所述视频的比特流表示之间的转换配置所述比特流表示,所述比特流表示包括信令通知时域层信息的语法元素、以及适用于所述一个或多个视频数据单元的视频块的编解码模式的参数;以及基于所述配置执行所述转换,其中所述编解码模式包括基于使用自适应环路滤波器(ALF)系数的滤波处理来构造所述视频的当前块。
在又一典型的方面,所公开的技术可用于提供一种用于视频处理的方法。所述方法包括:为包括一个或多个视频数据单元的视频和所述视频的比特流表示之间的转换解析所述比特流表示,所述比特流表示包括信令通知时域层信息的语法元素、以及适用于所述一个或多个视频数据单元的视频块的编解码模式的参数;以及基于所述配置执行所述转换,其中所述编解码模式包括基于使用自适应环路滤波器(ALF)系数的滤波处理来构造所述视频的当前块。
在又一典型的方面,所公开的技术可用于提供一种用于视频处理的方法。所述方法包括:执行视频的第一视频数据单元和所述视频的比特流表示之间的转换,其中,编解码模式适用于所述第一视频数据单元的视频块,其中,所述编解码模式包括:基于与所述编解码模式相关的边信息,基于使用自适应环路滤波器(ALF)系数的滤波处理来构造所述视频的当前块,并且其中,根据基于时域层索引的规则来确定所述边信息。
在又一典型的方面,上述方法以处理器可执行代码的形式实施,并且存储在计算机可读的程序介质中。
在又一典型的方面,公开了一种设备,其被配置为或可操作以执行上述方法。该设备可以包括被编程以实现该方法的处理器。
在又一典型的方面,一种视频解码器装置,其可以实现如本文所述的方法。
在附图、说明书和权利要求书中更详细地描述了所公开技术的上述方面、以及其他方面和特征。
附图说明
图1示出了构造Merge候选列表的示例。
图2示出了空域候选的位置的示例。
图3示出了接受空域Merge候选的冗余检查的候选对的示例。
图4A和图4B示出了基于当前块的尺寸和形状的第二预测单元(PU)的位置示例。
图5示出了时域Merge候选的运动矢量缩放示例。
图6示出了时域Merge候选的候选位置示例。
图7示出了生成组合的双向预测Merge候选的示例。
图8示出了构造运动矢量预测候选的示例。
图9示出了空域运动矢量候选的运动矢量缩放示例。
图10示出了使用编解码单元(CU)的可选时域运动矢量预测(ATMVP)算法的运动预测示例。
图11示出了空时运动矢量预测(STMVP)算法使用的带有子块和临近块的编解码单元(CU)的示例。
图12示出了用于导出照明补偿(IC)参数的临近样本点的示例。
图13A和13B分别示出了简化的4参数仿射模型和简化的6参数仿射模型的示例。
图14示出了每个子块的仿射运动向量场(MVF)的示例。
图15A和15B分别示出了4参数和6参数仿射模型的示例。
图16示出了继承仿射候选的AF_INTER的运动矢量预测的示例。
图17示出了构造仿射候选的AF_INTER的运动向量预测的示例。
图18A和18B分别示出了AF_Merge模式的示例候选块和CPMV预测器推导。
图19示出仿射Merge模式的候选位置的示例。
图20示出UMVE搜索处理的示例。
图21示出UMVE搜索点的示例。
图22示出了基于双边模板匹配的解码器侧运动矢量细化(DMVR)的示例。
图23示出了使用整形的解码流的示例性流程图。
图24示出了在双边滤波器中使用的临近样本点的示例。
图25示出了覆盖在权重计算中使用的两个样本点的窗口的示例。
图26示出扫描模式的示例。
图27示出了帧间模式解码处理的示例。
图28示出了帧间模式解码处理的另一示例。
图29示出了使用重构后滤波器的帧间模式解码处理的示例。
图30示出了使用重构后滤波器的帧间模式解码处理的另一示例。
图31A至31D示出了视频处理的示例方法的流程图。
图32是用于实现本文所述的视觉媒体解码或视觉媒体编码技术的硬件平台的示例的框图。
图33是可以实现所公开的技术的示例性视频处理系统的框图。
具体实施方式
由于对高分辨率视频的需求日益增加,视频编解码方法和技术在现代技术中无处不在。视频编解码器通常包括压缩或解压缩数字视频的电子电路或软件,并且不断地被改进以提供更高的编解码效率。视频编解码器将未压缩的视频转换为压缩格式,或反之亦然。视频质量、用于表示视频的数据量(由比特率决定)、编码和解码算法的复杂度、对数据丢失和错误的敏感度、易于编辑、随机访问和端到端延迟(延迟)之间存在复杂的关系。压缩格式通常符合标准视频压缩规范,例如,高效视频编解码(HEVC)标准(也称为H.265或MPEG-H第2部分)、待定案的多功能视频编解码标准或其他当前和/或未来的视频编解码标准。
所公开技术的实施例可以应用于现有的视频编解码标准(例如,HEVC、H.265)和未来的标准,以提高压缩性能。在本文件中,使用章节标题来提高描述的可读性,并且不以任何方式将讨论或实施例(和/或实现)仅限于各自的章节。
1.HEVC/H.265中的帧间预测的示例
多年来,视频编解码标准有了显著的改进,并且现在在某种程度上提供了高编解码效率和对更高分辨率的支持。最新标准诸如HEVC和H.265等是基于混合视频编解码结构,其中采用了时域预测加变换编解码。
1.1预测模式的示例
每个帧间预测的PU(预测单元)都有一个或两个参考图片列表的运动参数。在一些实施例中,运动参数包括运动矢量和参考图片索引。在其他实施例中,两个参考图片列表之一的使用也可以使用inter_pred_idc发信令。在又一实施例中,运动矢量可显式地编码为相对于预测器的增量。
当CU采用跳过模式编解码时,PU与CU相关联,并且没有显著的残差系数,没有编解码运动矢量增量或参考图片索引。指定了一种Merge模式,通过该模式,可以从临近的PU(包括空域和时域候选)中获取当前PU的运动参数。Merge模式可以应用于任何帧间预测的PU,而不仅仅是跳过模式。Merge模式的另一种选择是运动参数的显式传输,其中为每个PU显式地信令通知运动矢量(更确切地说,与运动矢量预测器相比的运动矢量差(MVD))、每个参考图片列表的对应的参考图片索引、以及参考列表的使用。在本文中将这种类型的模式称为高级运动矢量云测(AMVP)。
当信令指示要使用两个参考图片列表中的一个时,从一个样本点块中生成PU。这被称为“单向预测”。单向预测对P条带(slice)和B条带都可用。
当信令指示要使用两个参考图片列表时,从两个样本点块中生成PU。这被称为“双向预测”。双向预测仅对B条带可用。
参考图片列表
在HEVC中,术语“帧间预测”被用于表示从除了当前解码图片之外的参考图片的数据元素(例如,样本点值或运动矢量)导出的预测。如在H.264/AVC中一样,可以从多个参考图片预测图片。用于帧间预测的参考图片被组织在一个或多个参考图片列表中。参考索引标识列表中的哪些参考图片应用于创建预测信号。
单个参考图片列表(列表0)被用于P条带,并且两个参考图片列表(列表0和列表1)被用于B条带。需要注意的是,列表0/1中包含的参考图片就捕获/显示顺序而言可以来自过去和将来的图片。
1.1.1构造Merge模式的候选的实施例
当使用Merge模式预测PU时,从比特流中解析指向Merge候选列表中条目的索引,并且使用该索引检索运动信息。此列表的构造可按以下步骤顺序进行概括:
步骤1:初始候选推导
步骤1.1:空域候选推导
步骤1.2:空域候选冗余检查
步骤1.3:时域候选推导
步骤2:附加候选插入
步骤2.1:创建双向预测候选
步骤2.2:插入零运动候选
图1示出了基于上面概括的步骤序列构造Merge候选列表的示例。对于空域Merge候选推导,在位于五个不同位置的候选中最多选择四个Merge候选。对于时域Merge候选推导,在两个候选中最多选择一个Merge候选。由于在解码器处假定每个PU的候选数为常量,因此当候选数未达到片标头中发信令的最大Merge候选数(maxNumMergeCand)时,生成附加的候选。由于候选数是恒定的,所以最佳Merge候选的索引使用截断的一元二值化(TU)进行编解码。如果CU的尺寸等于8,则当前CU的所有PU都共享一个Merge候选列表,这与2N×2N预测单元的Merge候选列表相同。
1.1.2构造空域Merge候选
在空域Merge候选的推导中,在位于图2所示位置的候选中最多选择四个Merge候选。推导顺序为A1,B1,B0,A0和B2。只有当位置A1,B1,B0,A0的任何PU不可用(例如,因为它属于另一个条带或片(tile))或是内部编解码时,才考虑位置B2。在增加A1位置的候选后,对剩余候选的增加进行冗余检查,其确保具有相同运动信息的候选被不包括在列表之外,从而提高编解码效率。
为了降低计算的复杂度,在所提到的冗余检查中并不考虑所有可能的候选对。相反,只有与图3中的箭头链接的对才会被考虑,并且只有当用于冗余检查的对应候选没有相同的运动信息时,才将候选添加到列表中。复制运动信息的另一个来源是与2Nx2N不同的分区相关的“第二PU”。例如,图4A和4B分别描述了N×2N和2N×N情况下的第二PU。当当前的PU被划分为N×2N时,对于列表构造不考虑A1位置的候选。在一些实施例中,添加此候选可能导致两个具有相同运动信息的预测单元,这对于在编解码单元中仅具有一个PU是冗余的。同样地,当当前PU被划分为2N×N时,不考虑位置B1
1.1.3构造时域Merge候选
在此步骤中,只有一个候选添加到列表中。特别地,在这个时域Merge候选的推导中,基于与给定参考图片列表中当前图片具有最小POC差异的并置PU导出了缩放运动矢量。用于推导并置PU的参考图片列表在条带标头中显式地发信令。
图5示出了时域Merge候选(如虚线所示)的缩放运动矢量的推导示例,其使用POC距离tb和td从并置PU的运动矢量进行缩放,其中tb定义为当前图片的参考图片和当前图片之间的POC差异,并且td定义为并置图片的参考图片与并置图片之间的POC差异。时域Merge候选的参考图片索引设置为零。对于B条带,得到两个运动矢量(一个是对于参考图片列表0,另一个是对于参考图片列表1)并将其组合使其成为双向预测Merge候选。
在属于参考帧的并置PU(Y)中,在候选C0和C1之间选择时域候选的位置,如图6所示。如果位置C0处的PU不可用、内部编解码或在当前CTU之外,则使用位置C1。否则,位置C0被用于时域Merge候选的推导。
1.1.4构造附加类型的Merge候选
除了空时Merge候选,还有两种附加类型的Merge候选:组合双向预测Merge候选和零Merge候选。组合双向预测Merge候选是利用空时Merge候选生成的。组合双向预测Merge候选仅用于B条带。通过将初始候选的第一参考图片列表运动参数与另一候选的第二参考图片列表运动参数相结合,生成组合双向预测候选。如果这两个元组提供不同的运动假设,它们将形成新的双向预测候选。
图7示出了此过程的一个示例,其中原始列表(710,在左侧)中具有MVL0和refIdxL0或MVL1和refIdxL1的两个候选被用于创建添加到最终列表(720,在右侧)中的组合双向预测Merge候选。关于被认为生成这些附加Merge候选的组合有很多规则。
插入零运动候选以填充Merge候选列表中的其余条目,从而达到MaxNumMergeCand的容量。这些候选具有零空域位移和从零开始并且每次将新的零运动候选添加到列表中时都会增加的参考图片索引。这些候选使用的参考帧的数目对于单向预测和双向预测分别是1帧和2帧。在一些实施例中,对这些候选不执行冗余检查。
1.2高级运动矢量预测(AMVP)的实施例
AMVP利用运动矢量与临近的PU的空时相关性,其用于运动参数的显式传输。首先通过检查左上方的时域临近的PU位置的可用性、去掉多余的候选位置并且加上零矢量以使候选列表长度恒定来构造运动矢量候选列表。然后,编解码器可以从候选列表中选择最佳的预测器,并发送指示所选候选的对应索引。与Merge索引信令类似,最佳运动矢量候选的索引使用截断的一元进行编解码。在这种情况下,要编解码的最大值为2(见图8)。在后面的章节中,提供了关于运动矢量预测候选的推导处理的细节。
1.2.1推导AMVP候选的示例
图8概括了运动矢量预测候选的推导过程,并可以对每个参考图片列表使用refidx作为输入来实现。
在运动矢量预测中,考虑了两种类型的运动矢量候选:空域运动矢量候选和时域运动矢量候选。对于空域运动矢量候选的推导,基于位于先前图2所示的五个不同位置的每个PU的运动矢量最终推导出两个运动矢量候选。
对于时域运动矢量候选的推导,从两个候选中选择一个运动矢量候选,这两个候选是基于两个不同的并置位置推导出的。在作出第一个空时候选列表后,移除列表中重复的运动矢量候选。如果潜在候选的数量大于二,则从列表中移除相关联的参考图片列表中参考图片索引大于1的运动矢量候选。如果空时运动矢量候选数小于二,则会在列表中添加附加的零运动矢量候选。
1.2.2构造空域运动矢量候选
在推导空域运动矢量候选时,在五个潜在候选中最多考虑两个候选,这五个候选来自先前图2所示位置上的PU,这些位置与运动Merge的位置相同。当前PU左侧的推导顺序定义为A0、A1、以及缩放的A0、缩放的A1。当前PU上面的推导顺序定义为B0、B1,B2、缩放的B0、缩放的B1、缩放的B2。因此,每侧有四种情况可以用作运动矢量候选,其中两种情况不需要使用空域缩放,并且两种情况使用空域缩放。四种不同的情况概括如下:
--无空域缩放
(1)相同的参考图片列表,并且相同的参考图片索引(相同的POC)
(2)不同的参考图片列表,但是相同的参考图片(相同的POC)
--空域缩放
(3)相同的参考图片列表,但是不同的参考图片(不同的POC)
(4)不同的参考图片列表,并且不同的参考图片(不同的POC)
首先检查无空域缩放的情况,然后检查允许空域缩放的情况。当POC在临近PU的参考图片与当前PU的参考图片之间不同时,都会考虑空域缩放,而不考虑参考图片列表。如果左侧候选的所有PU都不可用或是内部编解码,则允许对上述运动矢量进行缩放,以帮助左侧和上方MV候选的平行推导。否则,不允许对上述运动矢量进行空域缩放。
如图9中的示例所示,对于空域缩放情况,以与时域缩放类似的方式缩放临近PU的运动矢量。一个区别是,给出当前PU的参考图片列表和索引作为输入;实际的缩放处理与时域缩放处理相同。
1.2.3构造时域运动矢量候选
除了参考图片索引的推导外,时域Merge候选的所有推导过程与空域运动矢量候选的推导过程相同(如图6中的示例所示)。在一些实施例中,向解码器发参考图片索引的信令。
2.联合探索模型(JEM)中帧间预测方法的示例
在一些实施例中,使用名为联合探索模型(JEM)的参考软件来探索未来的视频编解码技术。在JEM中,基于子块的预测被用于多种编解码工具中,诸如仿射预测、可选时域运动矢量预测(ATMVP)、空时运动矢量预测(STMVP)、双向光流(BIO)、帧速率上转换(FRUC)、局部自适应运动矢量分辨率(LAMVR)、重叠块运动补偿(OBMC)、局部照明补偿(LIC)和解码器侧运动矢量细化(DMVR)。
2.1基于的运动矢量预测示例
在具有四叉树加二叉树(QTBT)的JEM中,每个CU对于每个预测方向最多可以具有一组运动参数。在一些实施例中,通过将大的CU分割成子CU并导出该大CU的所有子CU的运动信息,编解码器中考虑了两种子CU级的运动矢量预测方法。可选时域运动矢量预测(ATMVP)方法允许每个CU从多个小于并置参考图片中当前CU的块中获取多组运动信息。在空时运动矢量预测(STMVP)方法中,通过利用时域运动矢量预测器和空域邻接运动矢量递归地导出子CU的运动矢量。在一些实施例中,为了保持子CU运动预测的更精确的运动场,可以禁用参考帧的运动压缩。
2.1.1可选时域运动矢量预测(ATMVP)的示例
在ATMVP方法中,通过从小于当前CU的块中提取多组运动信息(包括运动矢量和参考索引),修改时域运动矢量预测(TMVP)方法。
图10示出了CU 1000的ATMVP运动预测处理的示例。ATMVP方法分两步预测CU 1000内子CU 1001的运动矢量。第一步是用时域矢量识别参考图片1050中的对应块1051。参考图片1050也被称为运动源图片。第二步是将当前的CU 1000划分为子CU 1001,并从每个子CU对应的块中获取每个子CU的运动矢量和参考索引。
在第一步中,参考图片1050和对应的块由当前CU 1000的空域临近块的运动信息确定。为了避免临近块的重复扫描处理,使用当前CU 1000的Merge候选列表中的第一个Merge候选。第一个可用的运动矢量及其相关联的参考索引被设置为时域矢量和运动源图片的索引。这样,与TMVP相比,可以更准确地识别对应的块,其中对应的块(有时称为并置块)始终位于相对于当前CU的右下角或中心位置。
在第二步中,通过将时域矢量添加到当前CU的坐标中,通过运动源图片1050中的时域矢量识别子CU 1051的对应块。对于每个子CU,使用其对应块的运动信息(例如,覆盖中心样本点的最小运动网格)来导出子CU的运动信息。在识别出对应N×N块的运动信息后,将其转换为当前子CU的运动矢量和参考索引,与HEVC的TMVP方法相同,其中应用运动缩放和其他处理。例如,解码器检查是否满足低延迟条件(例如,当前图片的所有参考图片的POC都小于当前图片的POC),并可能使用运动矢量MVx(例如,与参考图片列表X对应的运动矢量)来为每个子CU预测运动矢量MVy(例如,X等于0或1且Y等于1-X)。
2.1.2空时运动矢量预测(STMVP)示例
在STMVP方法中,子CU的运动矢量按照光栅扫描顺序递归导出。图11示出具有四个子块和临近块的一个CU的示例。考虑8×8的CU 1100,其包括四个4×4子CU A(1101)、B(1102)、C(1103)和D(1104)。当前帧中临近的4×4块标记为a(1111)、b(1112)、c(1113)和d(1114)。
子CU A的运动推导由识别其两个空域邻居开始。第一个邻居是子CU A 1101上方的N×N块(块c 1113)。如果该块c(1113)不可用或内部编解码,则检查子CU A(1101)上方的其他N×N块(从左到右,从块c 1113处开始)。第二个邻居是子CU A 1101左侧的一个块(块b1112)。如果块b(1112)不可用或是内部编解码,则检查子CU A 1101左侧的其他块(从上到下,从块b 1112处开始)。每个列表从临近块获得的运动信息被缩放到给定列表的第一个参考帧。接下来,按照HEVC中规定的与TMVP相同的程序,推导出子块A 1101的时域运动矢量预测(TMVP)。提取块D 1104处的并置块的运动信息并进行相应的缩放。最后,在检索和缩放运动信息后,对每个参考列表分别平均所有可用的运动矢量。将平均运动矢量指定为当前子CU的运动矢量。
2.1.3子CU运动预测模式信令的示例
在一些实施例中,子CU模式作为附加的Merge候选模式启用,并且不需要附加的语法元素来对该模式发信令。将另外两个Merge候选添加到每个CU的Merge候选列表中,以表示ATMVP模式和STMVP模式。在其他实施例中,如果序列参数集指示启用了ATMVP和STMVP,则最多可以使用七个Merge候选。附加Merge候选的编解码逻辑与HM中的Merge候选的编解码逻辑相同,这意味着对于P或B条带中的每个CU,可能需要对两个附加Merge候选进行两次额外的RD检查。在一些实施例中,例如JEM,Merge索引的所有二进制文件都由CABAC(基于文本的自适应二进制算术编解码)进行上下文编解码的。在其他实施例中,例如HEVC,只有第一个二进制文件是上下文编解码的,并且其余的二进制文件是上下文旁路编解码的。
2.2JEM中局部照明补偿(LIC)的示例
局部照明补偿(LIC)基于用于照明变化的线性模型,使用比例因子a和偏移量b。并且其对每个帧间模式编解码的编解码单元(CU)自适应地启用或禁用。
当LIC应用于CU时,采用最小二乘误差法,通过使用当前CU的临近样本点及其对应的参考样本点导出参数a和b。更具体地,如图12所示,使用参考图片中CU的子采样(2:1子采样)临近样本点和对应的样本点(由当前CU或子CU的运动信息识别)。
2.2.1预测块的推导
推导出IC参数并将其分别应用于每个预测方向。对于每个预测方向,用解码的运动信息生成第一预测块,然后通过应用LIC模型获得临时预测块。之后,使用两个临时预测块来导出最终预测块。
当使用Merge模式对CU进行编解码时,以类似于Merge模式下运动信息复制的方式从临近块复制LIC标志;否则,将为CU信令通知LIC标志,以指示LIC是否适用。
当为图片启用LIC时,需要附加的CU级RD检查来确定是否为CU应用LIC。当对CU启用LIC时,对于整数像素运动搜索和分数像素运动搜索,分别使用绝对差的平均去除和(MR-SAD)和绝对Hadamard变换差的平均去除和(MR-SATD),而不使用SAD和SATD。
为了降低编解码复杂度,在JEM中应用以下编解码方案:当当前图片与其参考图片之间没有明显的照度变化时,对整个图片禁用LIC。为了识别这种情况,在编解码器处计算当前图片的直方图和当前图片的每个参考图片的直方图。如果当前图片和当前图片的每个参考图片之间的直方图差小于给定阈值,则对当前图片禁用LIC;否则,对当前图片启用LIC。
2.3VVC中帧间预测的示例
存在几种新的用于帧间预测改进的编解码工具,诸如用于信令通知MVD的自适应运动矢量差分辨率(AMVR)、仿射预测模式、三角预测模式(TPM)、ATMVP、广义双向预测(GBI)、双向光流(BIO)。
2.3.1VVC中编解码块结构的示例
在VVC中,采用四叉树/二叉树/多叉树(QT/BT/TT)结构,以将图像划分成正方形或矩形块。除QT/BT/TT外,对于I帧,VVC还采用了分离树(又称为双编解码树)。使用分离树,为亮度和色度分量分别信令通知编解码块结构。
2.3.2自适应运动矢量差分辨率的示例
在一些实施例中,当在条带标头中use_integer_MV_flag等于0时,运动矢量差(MVD)(在PU的运动矢量和预测运动矢量之间)以四分之一亮度样本点为单位发信令。在JEM中,引入了局部自适应运动矢量分辨率(LAMVR)。在JEM中,MVD可以用四分之一亮度样本点、整数亮度样本点或四亮度样本点的单位进行编解码。MVD分辨率控制在编解码单元(CU)级别,并且MVD分辨率标志有条件地为每个至少有一个非零MVD分量的CU发信令。
对于具有至少一个非零MVD分量的CU,第一个标志将发信令以指示CU中是否使用四分之一亮度样本点MV精度。当第一个标志(等于1)指示不使用四分之一亮度样本点MV精度时,另一个标志发信令以指示是使用整数亮度样本点MV精度还是使用四亮度样本点MV精度。
当CU的第一个MVD分辨率标志为零或没有为CU编解码(意味着CU中的所有MVD都为零)时,CU使用四分之一亮度样本点MV分辨率。当一个CU使用整数亮度样本点MV精度或四亮度样本点MV精度时,该CU的AMVP候选列表中的MVP将取整到对应的精度。
2.3.3仿射运动补偿预测的示例
在HEVC中,仅将平移运动模型应用于运动补偿预测(MCP)。然而,相机和对象可能具有多种运动,例如放大/缩小、旋转、透视运动和/或其他不规则运动。在VVC中,采用4参数仿射模型和6参数仿射模型的简化仿射变换运动补偿预测。如图13A和13B所示,分别由两个(在使用变量a、b、e和f的4参数仿射模型中)或三个(在使用变量a、b、c、d、e和f的6参数仿射模型中)控制点运动矢量来描述块的仿射运动场。
分别用以下4参数仿射模型和6参数仿射模型的等式来描述块的运动矢量场(MVF):
Figure BDA0003275285130000141
Figure BDA0003275285130000142
其中(mvh 0,mvh 0)为左上控制点(CP)的运动矢量,并且(mvh 1,mvh 1)为右上角控制点的运动矢量,并且(mvh 2,mvh 2)为左下角控制点的运动矢量,(x,y)表示代表点相对于当前块内的左上样本点的代表点的坐标。CP运动矢量可以被信令通知(如在仿射AMVP模式中)或者是动态地导出(如在仿射Merge模式中)。w和h是当前块的宽度和高度。实际上,除法是通过带取整的右移操作来实现的。在VTM中,代表点被定义为子块的中心位置,例如,当子块的左上相对于当前块内的左上样本点的坐标为(xs,ys)时,代表点的坐标被定义为(xs+2,ys+2)。对于每个子块(例如,VTM中的4×4),代表点被用于导出整个子块的运动矢量。
图14示出了块1300的每个子块的仿射MVF的示例,其中为了进一步简化运动补偿预测,应用基于子块的仿射变换预测。为了得到每个M×N子块的运动矢量,可以根据等式(1)和(2)计算每个子块的中心样本点的运动矢量,并取整到运动矢量分数精度(例如,JEM中的1/16)。然后应用运动补偿插值滤波器,利用导出的运动矢量生成各子块的预测。通过仿射模式介绍了1/16像素的插值滤波器。在MCP之后,将每个子块的高精度运动矢量取整,并保存为与常规运动矢量相同的精度。
2.3.3.1仿射预测的信令的示例
与平移运动模型类似,仿射预测也有两种模式用于信令通知侧面信息。它们是AFFINE_INTER模式和AFFINE_MERGE模式。
2.3.3.2AF_INTER模式的示例
对于宽度和高度都大于8的CU,可以应用AF_INTER模式。在比特流中,CU级别的仿射标志被信令通知,以指示是否使用AF_INTER模式。
在此模式中,对于每个参考图片列表(列表0或列表1),按照以下顺序用三种类型的仿射运动预测器构造仿射AMVP候选列表,其中每个候选包括当前块的估计的CPMV。信令通知在编解码器侧发现的最佳CPMV的差(例如图17中的mv0mv1mv2)、以及估计的CPMV。此外,进一步信令通知从中导出估计的CPMV的仿射AMVP候选的索引。
1)继承的仿射运动预测器
检查顺序与在HEVC AMVP列表构造中空域MVP的检查顺序相似。首先,从{A1,A0}中的第一个块导出左继承的仿射运动预测器,该块是仿射编解码的,并且具有与当前块相同的参考图片。其次,从{B1,B0,B2}中的第一块导出上述继承的仿射运动预测器,该块是仿射编解码的,并且具有与当前块相同的参考图片。图16描绘了五个块A1、A0、B1、B0、B2。
一旦发现临近块是仿射编解码的,则利用覆盖临近块的编解码单元的CPMV来推导当前块的CPMV的预测器。例如,如果A1用非仿射模式编解码,并且A0用4参数仿射模式编解码,则将从A0导出左侧继承的仿射MV预测器。在这种情况下,覆盖A0的CU的CPMV(如图18B中表示为
Figure BDA0003275285130000151
的左上CPMV和表示为
Figure BDA0003275285130000152
的右上CPMV)被用于导出当前块的估计的CPMV(表示为
Figure BDA0003275285130000153
的当前块的左上(坐标为(x0,y0))、右上(坐标为(x1,y1))和右下(坐标为(x2,y2))位置)。
2)构造的仿射运动预测器
如图17所示,构造的仿射运动预测器由从具有相同参考图片的临近帧间编解码块导出的控制点运动矢量(CPMV)组成。如果当前仿射运动模型为4参数仿射,则CPMV的数量为2;否则,如果当前仿射运动模型为6参数仿射,则CPMV的数量为3。左上CPMV
Figure BDA0003275285130000161
由组{A,B,C}中的第一个块处的MV导出,该块帧间编解码的,并且具有与当前块相同的参考图片。右上CPMV
Figure BDA0003275285130000162
由组{D,E}中的第一个块处的MV导出,该块是帧间编解码的,并且具有与当前块相同的参考图片。左下CPMV
Figure BDA0003275285130000163
由组{F,G}中第一个块处的MV导出,该是帧间编解码的,并且具有与当前块相同的参考图片。
如果当前仿射运动模型是4参数仿射,则只有当
Figure BDA0003275285130000164
Figure BDA0003275285130000165
两者都被找到(也就是说,
Figure BDA0003275285130000166
Figure BDA0003275285130000167
被用作当前块的左上(坐标为(x0,y0))和右上(坐标为(x1,y1))位置的估计的CPMV)时,将构造的仿射运动预测器插入候选列表。
如果当前仿射运动模型是6参数仿射,则只有当
Figure BDA0003275285130000168
Figure BDA0003275285130000169
都被找到(也就是说,
Figure BDA00032752851300001610
Figure BDA00032752851300001611
被用作当前块的左上(坐标为(x0,y0))、右上(坐标为(x1,y1))和右下(坐标为(x2,y2))位置的估计的CPMV)时,将构造的仿射运动预测器插入候选列表。
在将构造的仿射运动预测器插入候选列表中时,不应用剪切处理。
3)常规AMVP运动预测器
以下适用,直到仿射运动预测器的数量达到最大值。
1)如果可用,通过将所有CPMV设置为等于
Figure BDA00032752851300001612
来导出仿射运动预测器。
2)如果可用,通过将所有CPMV设置为等于
Figure BDA00032752851300001613
来导出仿射运动预测器。
3)如果可用,通过将所有CPMV设置为等于
Figure BDA00032752851300001614
来导出仿射运动预测器。
4)如果可用,通过将所有CPMV设置为等于HEVC TMVP来导出仿射运动预测器。
5)通过将所有CPMV设置为等于零MV来导出仿射运动预测器。
注意,已在构造的仿射运动预测器中导出
Figure BDA0003275285130000171
在AF_INTER模式中,当使用4/6参数仿射模式时,需要2/3个控制点,并且因而需要为这些控制点编解码2/3个MVD,如图15A和15B所示。在现有实现中,可如下推导MV,例如,从mvd0预测mvd1和mvd2
Figure BDA0003275285130000172
Figure BDA0003275285130000173
Figure BDA0003275285130000174
其中,
Figure BDA0003275285130000175
mvdi和mv1分别是左上像素(i=0)、右上像素(i=1)或左下像素(i=2)的预测运动矢量、运动矢量差和运动矢量,如图15B所示。在一些实施例中,两个运动矢量的相加(例如,mvA(xA,yA)和mvB(xB,yB))分别等于两个分量的总和。例如,newMV=mvA+mvB意味着将newMV的两个分量分别设置为(xA+xB)和(yA+yB)。
2.3.3.3AF_MERGE模式的示例
当在AF_MERGE模式中应用CU时,它从有效的临近重构块中获得以仿射模式编解码的第一个块。并且候选块的选择顺序是从左、上、右上、左下到左上,如图18A所示(依次表示为A、B、C、D、E)。例如,如果临近左下块用仿射模式编解码(如图18B中A0表示的),则提取包含块A的临近CU/PU的左上、右上和左下的控制点(CP)运动矢量mv0 N,mv1 N和mv2 N。并且基于mv0 N,mv1 N和mv2 N计算当前CU/PU左上/右上/左下的运动矢量mv0 C,mv1 C和mv2 C(仅用于6参数仿射模型),需要注意的是,在VTM-2.0中,如果当前块是仿射编解码的,则位于左上角的子块(例如,VTM中的4×4块)存储mv0,位于右上角的子块存储mv1。如果当前块用6参数仿射模型编解码,则位于左下角的子块存储mv2;否则(用4参数仿射模型),LB存储mv2'。其他子块存储用于MC的MV。
在根据等式(1)和(2)中的仿射运动模型计算出当前CU的CPMV v0和v1之后,可以生成当前CU的MVF。为了识别当前CU是否以AF_MERGE模式编解码,当至少一个临近块以仿射模式编解码时,可在比特流中信令通知仿射标志。
在一些实施例中(例如,JVET-L0142和JVET-L0632),可用以下步骤来构造仿射Merge候选列表:
1)插入继承的仿射候选
继承仿射候选是指该候选是从其有效临近仿射编解码块的仿射运动模型导出的。从临近块的仿射运动模型中导出最大的两个仿射候选并插入候选列表中。对于左侧预测器,扫描顺序是{A0,A1};对于上方预测,扫描顺序是{B0,B1,B2}。
2)插入构造的仿射候选
如果仿射Merge候选列表中的候选数量小于MaxNumAffineCand(在本文中设为5),则将构造仿射候选插入候选列表中。构造仿射候选是指该候选是通过组合每个控制点的临近运动信息构造的。
a)首先从图19所示的规定的空域邻居和时域邻居导出控制点的运动信息。CPk(k=1,2,3,4)表示第k个控制点。A0,A1,A2,B0,B1,B2和B3是用于预测CPk(k=1,2,3)的空域位置;T是用于预测CP4的时域位置。
CP1、CP2、CP3和CP4的坐标分别为(0,0),(W,0),(H,0)和(W,H),其中W和H是当前块的宽度和高度。
按照以下优先顺序获得每个控制点的运动信息:
对于CP1,检查优先级为B2->B3->A2。如果B2可用,则使用B2。否则,如果B2不可用,则使用B3。如果B2和B3都不可用,则使用A2。如果三个候选都不可用,则无法获得CP1的运动信息。
对于CP2,检查优先级为B1->B0;
对于CP3,检查优先级为A1->A0;
对于CP4,使用T。
b)其次,使用控制点的组合来构造仿射Merge候选。
I.需要三个控制点的运动信息来构造6参数仿射候选。可以从以下四个组合中的一个来选择这三个控制点({CP1,CP2,CP4},{CP1,CP2,CP3},{CP2,CP3,CP4},{CP1,CP3,CP4})。组合{CP1,CP2,CP3},{CP2,CP3,CP4},{CP1,CP3,CP4}将被转换到由左上、右上和左下控制点表示的6参数运动模型。
II.需要两个控制点的运动信息来构造4参数仿射候选。可以从以下六个组合中的一个来选择这两个控制点({CP1,CP4},{CP2,CP3},{CP1,CP2},{CP2,CP4},{CP1,CP3},{CP3,CP4})。组合{CP1,CP4},{CP2,CP3},{CP2,CP4},{CP1,CP3},{CP3,CP4}将被转换到由左上和右上控制点表示的4参数运动模型。
III.按以下顺序将构造仿射候选的组合插入到候选列表中:
{CP1,CP2,CP3},{CP1,CP2,CP4},{CP1,CP3,CP4},{CP2,CP3,CP4},{CP1,CP2},{CP1,CP3},{CP2,CP3},{CP1,CP4},{CP2,CP4},{CP3,CP4}。
i.对于组合的参考列表X(X为0或1),选择控制点中使用率最高的参考索引作为列表X的参考索引,并缩放指向差参考图片的运动矢量。
在导出候选之后,执行完整修剪处理以检查是否已将相同候选插入到列表中。如果存在相同的候选,则丢弃导出的候选。
3)填充零运动矢量
如果仿射Merge候选列表中的候选数量小于5,则在候选列表中插入具有零参考索引的零运动矢量,直到列表满为止。
更具体地,对于子块Merge候选列表,4参数Merge候选的MV设置为(0,0)且预测方向设置为来自列表0的单向预测(对于P条带)和双向预测(对于B条带)。
2.3.4运动矢量差Merge(MMVD)的示例
在JVET-L0054中,提出了最终运动矢量表达(UMVE,也称为MMVD)。UMVE与提出的运动矢量表达方法被用于跳过或Merge模式。
UMVE重用与VVC中常规Merge候选列表中包含的Merge候选相同的Merge候选。在Merge候选中,可以选择基础候选,并通过所提出的运动矢量表达方法进一步扩展。
UMVE提供了一种新的运动矢量差(MVD)表示方法,其中使用起点、运动幅度和运动方向来表示MVD。
这个提出的技术按原样使用Merge候选列表。但是只有默认Merge类型(MRG_TYPE_DEFAULT_N)的候选才被考虑用于UMVE的扩展。
基础候选索引定义了起点。基础候选索引指示列表中候选的最佳候选,如下所示。
表1基础候选IDX
Figure BDA0003275285130000191
Figure BDA0003275285130000201
如果基础候选的数量等于1,则不信令通知基础候选IDX。
距离索引是运动幅度信息。距离索引指示距离起点信息的预定义的距离。预定义的距离如下所示:
表2距离IDX
Figure BDA0003275285130000202
方向索引表示MVD相对于起点的方向。方向索引可以表示如下所示的四个方向。
表3方向IDX
方向IDX 00 01 10 11
x-轴 + N/A N/A
y-轴 N/A N/A +
在一些实施例中,在发送跳过标志或Merge标志之后立即信令通知UMVE标志。如果跳过或Merge标志为真,则解析UMVE标志。如果UMVE标志等于1,则解析UMVE语法。但是,如果不是1,则解析仿射标志。如果仿射标志等于1,则是仿射模式,但是,如果不是1,则解析VTM的跳过/Merge模式的跳过/Merge索引。
由于UMVE候选而导致的附加线缓冲器是不需要的。因为软件的跳过/Merge候选被直接用作基础候选。通过使用输入UMVE索引,在运动补偿前判定MV的补充。不需要为此保留长线缓冲器。
在当前普通测试条件下,可以选择Merge候选列表中的第一个或第二个Merge候选作为基础候选。
2.3.5解码器侧运动矢量细化(DMVR)的示例
在双向预测操作中,对于一个块区域的预测,将分别使用列表0的运动矢量(MV)和列表1的MV形成的两个预测块组合以形成单个预测信号。在解码器侧运动矢量细化(DMVR)方法中,进一步细化双向预测的两个运动矢量。
在JEM设计中,通过双边模板匹配处理对运动矢量进行细化。将双边模板匹配应用在解码器中,以在双边模板和参考图片中的重构样本点之间执行基于失真的搜索,以便在不传输附加运动信息的情况下获得细化的MV。图22示出了一个示例。如图22所示,从分别来自列表0的初始MV0和列表1的MV1,将双边模板生成为两个预测块的加权组合(即平均值)。模板匹配操作包括计算生成的模板与参考图片中的样本点区域(围绕初始预测块)之间的成本度量。对于两个参考图片中的每一个,产生最小模板成本的MV被视为该列表的更新的MV以替换初始MV。在JEM中,为每个列表搜索九个MV候选。九个MV候选包括原始MV和8个周围MV,其中一个亮度样本点在水平或垂直方向上、或者在水平和垂直方向二者上偏移到原始MV。最后,将图22所示的两个新MV(即MV0’和MV1’)用于生成最终的双向预测结果。使用绝对差之和(SAD)作为成本度量。应当注意的是,当计算由一个周围MV生成的预测块的成本时,实际使用取整的MV(到整数像素)而不是真实的MV来获得预测块。
为了进一步简化DMVR的处理,JVET-M0147提出了对JEM中设计的几种修改。更具体地,VTM-4.0采用的DMVR设计(即将发布)具有以下主要特点:
·列表0和列表1之间具有(0,0)位置SAD的早期终止;
·DMVR的块尺寸W*H>=64&&H>=8;
·对于CU尺寸>16*16的DMVR,将CU划分为多个16x16子块;
·参考块尺寸(W+7)*(H+7)(对于亮度);
·基于25点SAD的整数像素搜索(即(+-)2细化搜索范围,单级);
·基于双线性插值的DMVR;
·列表0和列表1之间的MVD镜像。以允许双边匹配;
·基于“参数误差曲面方程”的子像素细化;
·具有参考块填充(如果需要)的亮度/色度MC;
·细化的MV仅用于MC和TMVP。
2.3.6组合帧内帧间预测(CIIR)的示例
在JVET-L0100中,提出了多假设预测,其中组合帧内帧间预测是产生多假设的一种方法。
当应用多假设预测来改进帧内模式时,多假设预测将一个帧内预测和一个Merge索引预测组合。在Merge CU中,当标志为真时,为Merge模式信令通知一个标志,以从帧内候选列表中选择帧内模式。对于亮度分量,从包括DC、平面、水平和垂直4种帧内预测模式中导出帧内候选列表,并且帧内候选列表的尺寸可以是3或4,具体取决于块的形状。当CU宽度大于CU高度的两倍时,帧内模式列表不包括水平模式,并且当CU高度大于CU宽度的两倍时,帧内模式列表不包括垂直模式。使用加权平均将由帧内模式索引选择的一个帧内预测模式和由Merge索引选择的一个Merge索引预测组合起来。对于色度分量,总是在没有额外信令的情况下应用DM。组合预测的权重描述如下。当选择DC或平面模式、或CB宽度或高度小于4时,应用相等的权重。对于CB宽度和高度大于或等于4的CB,当选择水平/垂直模式时,首先将一个CB垂直/水平地划分为四个相等的区域。将表示为(w_intrai,w_interi)的每个权重集应用于对应区域,其中i是从1到4,并且(w_intra1,w_inter1)=(6,2),(w_intra2,w_inter2)=(5,3),(w_intra3,w_inter3)=(3,5),并且(w_intra4,w_inter4)=(2,6)。将(w_intra1,w_inter1)用于最接近参考样本点的区域,并且(w_intra4,w_inter4)用于最远离参考样本点的区域。然后,通过将两个加权预测相加并右移3位,可以计算出组合预测。此外,预测因子的帧内假设的帧内预测模式可以被保存,以供后续临近CU参考。
2.4JVET-M0427中的环内整形(ILR)
环内整形器(ILR)的基本思想是将原始(在第一域)信号(预测/重构信号)转换到第二域(整形域)。
环内亮度整形器被实现为一对查找表(LUT),但是两个LUT中只有一个需要被信令通知,因为另一个LUT可以从信令通知的LUT中计算出来。每个LUT是一维的、10比特的、1024个条目的映射表(1D-LUT)。一个LUT是前向LUT FwdLUT,它将输入的亮度代码值Yi映射到更改的值Yr:Yr=FwdLUT[Yi]。另一个LUT是反向LUT InvLUT,它将更改的代码值Yr映射到
Figure BDA0003275285130000221
(
Figure BDA0003275285130000222
表示Yi的重构值)。
2.4.1分段线性(PWL)模型
在一些实施例中,分段线性(PWL)的实现方式如下:
设x1,x2为两个输入轴点,并且y1,y2为一段的对应输出轴点。在x1和x2之间的任何输入值x的输出值y可以通过以下等式进行插值:
y=((y2-y1)/(x2-x1))*(x-x1)+y1
在定点实现中,该等式可以重写为:
y=((m*x+2FP_PREC-1)>>FP_PREC)+c
其中m是标量,c是偏移,并且FP_PREC是用于指定精度的常量值。
注意,在CE-12软件中,PWL模型用于预计算1024个条目的FwdLUT和InvLUT映射表;但是PWL模型还允许实现在不预先计算LUT的情况下动态计算等同的映射值。
2.4.2测试CE12-2
2.4.2.1亮度整形
环内亮度整形(即,提议中的CE12-2)的测试2提供了一种较低复杂度的管道,该管道还消除了条带间重构中分块帧内预测的解码延迟。对于帧间和帧内条带,帧内预测都在整形域中执行。
不管条带类型如何,帧内预测总是在整形域中执行。通过这样的布置,帧内预测可以在先前的TU重构完成后立即开始。这种布置还可以为帧内模式提供统一的而不是取决于条带的处理。图23示出了基于模式的CE12-2解码处理的框图。
CE12-2也测试亮度和色度残差缩放的16段分段线性(PWL)模型,而不是CE12-1的32段分段PWL模型。
用CE12-2中的环内亮度整形器进行条带间重构(浅绿色阴影块指示整形域中的信号:亮度残差;帧内亮度预测的;以及帧内亮度重构的)。
2.4.2.2取决于亮度的色度残差缩放(LCRS)
取决于亮度的色度残差缩放是用定点整数运算实现的乘法处理。色度残差缩放补偿了亮度信号与色度信号的相互作用。色度残差缩放在TU级应用。更具体地,以下适用:
对于帧内,平均重构亮度。
对于帧间,平均预测亮度。
平均值被用于识别PWL模型中的索引。该索引标识缩放因子cScaleInv。色度残差乘以该数字。
应当注意的是,色度缩放因子是从前向映射的预测亮度值而不是重构亮度值计算出的。
2.4.2.3ILR边信息的信令
在片组标头(类似于ALF)中发送参数(当前)。这些需要40-100比特。下表基于JVET-L1001的版本9。添加的语法以大黑体字体示出。使用[[删除部分]]包围的加粗双方括号示出删除。
在7.3.2.1序列参数集RBSP语法中:
Figure BDA0003275285130000241
在7.3.3.1通用片组标头语法中:
Figure BDA0003275285130000242
Figure BDA0003275285130000251
添加新的语法表-片组整形模型:
Figure BDA0003275285130000252
在通用序列参数集RBSP语义中,添加以下语义:
sps_reshaper_enabled_flag等于1指定在编解码视频序列(CVS)中使用整形器。sps_reshaper_enabled_flag等于0指定在CVS中不使用整形器。
在片组标头语法中,添加以下语义:
tile_group_reshaper_model_present_flag等于1指定片组标头中存在tile_group_reshaper_model()。tile_group_reshaper_model_present_flag等于0指定片组标头中不存在tile_group_reshaper_model()。当tile_group_reshaper_model_present_flag不存在时,推断它等于0。
tile_group_reshaper_enabled_flag等于1指定为当前片组启用整形器。tile_group_reshaper_enabled_flag等于0指定不为当前片组启用整形器。当tile_group_reshaper_enable_flag不存在时,推断它等于0。
tile_group_reshaper_chroma_residual_scale_flag等于1指定为当前片组启用色度残差缩放。tile_group_reshaper_chroma_residual_scale_flag等于0指定不为当前片组启用色度残差缩放。当tile_group_reshaper_chroma_residual_scale_flag不存在时,推断它等于0。
添加tile_group_reshaper_model()语法:
reshape_model_min_bin_idx指定将在整形器重构处理中使用的最小二进制数(bin)(或段)。reshape_model_min_bin_idx的值应在0至MaxBinIdx的范围内(包括0和MaxBinIdx)。MaxBinIdx的值应当等于15。
reshape_model_delta_max_bin_idx指定将在整形器重构处理中使用的最大二进制数(bin)(或段)。将reshape_model_max_bin_idx的值设置为等于MaxBinIdx–reshape_model_delta_max_bin_idx。
reshaper_model_bin_delta_abs_cw_prec_minus1加1指定用于语法reshape_model_bin_delta_abs_CW[i]的表示的比特数。
reshape_model_bin_delta_abs_CW[i]指定第i个二进制数的绝对增量码字值。
reshaper_model_bin_delta_sign_CW_flag[i]指定reshape_model_bin_delta_abs_CW[i]的符号,如下所示:
如果reshape_model_bin_delta_sign_CW_flag[i]等于0,则对应的变量RspDeltaCW[i]为正值。
否则(reshape_model_bin_delta_sign_CW_flag[i]不等于0),则对应的变量RspDeltaCW[i]为负值。
当reshape_model_bin_delta_sign_CW_flag[i]不存在时,推断它等于0。变量RspDeltaCW[i]=(1-2*reshape_model_bin_delta_sign_CW[i])*reshape_model_bin_delta_abs_CW[i]。
按以下步骤导出变量RspCW[i]:
将变量OrgCW设置为等于(1<<BitDepthY)/(MaxBinIdx+1)。
如果reshaper_model_min_bin_idx<=i<=reshaper_model_max_bin_idx
则RspCW[i]=OrgCW+RspDeltaCW[i]。
否则,RspCW[i]=0。
如果BitDepthY的值等于10,则RspCW[i]的值应当在32至2*OrgCW-1的范围内。
变量InputPivot[i](其中i在0到MaxBinIdx+1的范围内,包括0和MaxBinIdx+1)导出为InputPivot[i]=i*OrgCW。
变量ReshapePivot[i](其中i在0到MaxBinIdx+1的范围内,包括0和MaxBinIdx+1)、变量ScaleCoef[i]和InvScaleCoeff[i](其中i在0到MaxBinIdx的范围内,包括0和MaxBinIdx)推导如下:
Figure BDA0003275285130000271
变量ChromaScaleCoef[i](其中i在0到MaxBinIdx的范围内,包括0和MaxBinIdx)可以推导如下:
ChromaResidualScaleLut[64]={16384,16384,16384,16384,16384,16384,16384,8192,8192,8192,8192,5461,5461,5461,5461,4096,4096,4096,4096,3277,3277,3277,3277,2731,2731,2731,2731,2341,2341,2341,2048,2048,2048,1820,1820,1820,1638,1638,1638,1638,1489,1489,1489,1489,1365,1365,1365,1365,1260,1260,1260,1260,1170,1170,1170,1170,1092,1092,1092,1092,1024,1024,1024,1024};
Figure BDA0003275285130000272
2.4.2.4ILR的使用
在编码器侧,首先将每个图片(或片组)都转换到整形域。并且在整形域中执行所有编码处理。对于帧内预测,临近块位于整形域中;对于帧间预测,首先将参考块(从解码图片缓冲器的原始域生成的)转换到整形域。然后生成残差并将其编码到比特流。
在整个图片(或片组)完成编码/解码后,将整形域中的样本点转换到原始域,然后应用去块滤波器和其他滤波器。
在以下情况下,对预测信号的前向整形被禁用。
当前块是帧内编解码的;
当前块被编解码为CPR(当前图片参考,也称为帧内块复制,IBC);
当前块被编解码为组合帧间帧内模式(CIIP),并且为帧内预测块禁用前向整形。
JVET-N0805
在JVET-N0805中,为了避免在片组标头中信令通知ILR的边信息,提出在APS中信令通知它们。它包括以下主要思想:
-任选地,在SPS中发送LMCS参数。
-为ALF和LMCS参数定义APS类型。每个APS只有一种类型。
-在APS中发送LMCS参数。
-如果启用了LMCS工具,则在TGH中有标志,以指示LMCS aps_id是否存在。如果未信令通知,则使用SPS参数。
*需要添加语义约束,以在启用工具时始终具有被参考的有效内容。
2.5.2.5.1JVET-M1001(VVC工作草案4)上的建议设计的实现
Figure BDA0003275285130000281
sps_lmcs_enabled_flag等于1指定在编解码视频序列(CVS)中使用亮度映射与色度缩放。sps_lmcs_enabled_flag等于0指定在CVS中不使用亮度映射与色度缩放。
sps_lmcs_default_model_present_flag等于1指定该SPS中存在默认lmcs数据。sps_lmcs_default_model_flag等于0指定该SPS中不存在默认lmcs数据。当不存在时,sps_lmcs_default_model_present_flag的值被推断为等于0。
Figure BDA0003275285130000291
aps_params_type指定APS中携带的APS参数的类型,如下表所定义:
表7-x APS参数类型代码和APS参数类型
Figure BDA0003275285130000292
Figure BDA0003275285130000301
在第3条中添加以下定义:
ALF APS:aps_params_type等于ALF_APS的APS。
LMCS APS:aps_params_type等于LMCS_APS的APS。
进行以下语义更改:
...
tile_group_alf_aps_id指定片组所参考的ALF APS的adaptation_parameter_set_id。adaptation_parameter_set_id等于tile_group_alf_aps_id的ALF APS NAL单元的TemporalId应当小于或等于编解码的片组NAL单元的TemporalId。
当具有相同的adaptation_parameter_set_id值的多个ALF APS被同一图片的两个或多个片组参考时,具有相同的adaptation_parameter_set_id值的多个ALF APS应当具有相同的内容。
...
[[tile_group_reshaper_model_present_flag等于1指定tile_group_reshaper_model()存在于片组标头中。tile_group_reshaper_model_present_flag等于0指定tile_group_reshaper_model()不存在于片组标头中。当tile_group_reshaper_model_present_flag不存在时,将其推断为等于0。]]
tile_group_lmcs_enabled_flag等于1指定为当前片组启用亮度映射与色度缩放。tile_group_lmcs_enabled_flag等于0指定不为当前片组启用亮度映射与色度缩放。当tile_group_lmcs_enable_flag不存在时,将其推断为等于0。
tile_group_lmcs_use_default_model_flag等于1指定片组的亮度映射与色度缩放操作使用默认lmcs模型。tile_group_lmcs_use_default_model_flag等于0指定片组的亮度映射与色度缩放操作使用由tile_group_lmcs_APS_id参考的LMCS APS中的lmcs模型。当tile_group_reshaper_use_default_model_flag不存在时,将其推断为等于0。
tile_group_lmcs_aps_id指定片组参考的LMCS APS的adaptation_parameter_set_id。adaptation_parameter_set_id等于tile_group_lmcs_aps_id的LMCS APS NAL单元的TemporalId应小于或等于编解码片组NAL单元的TemporalId。
当具有相同的adaptation_parameter_set_id值的多个LMCS APS被同一图片的两个或多个片组参考时,具有相同的adaptation_parameter_set_id值的多个LMCS APS应当具有相同的内容。
tile_group_chroma_residual_scale_flag等于1指定为当前片组启用色度残差缩放。tile_group_chroma_residual_scale_flag等于0指定不为当前片组启用色度残差缩放。当tile_group_chroma_residual_scale_flag不存在时,推断它等于0。
2.4.2.6JVET-N0138
本文提出了用于携带整形模型参数和ALF参数的自适应参数集(APS)的扩展应用。在上一次会议中,决定通过避免多个片组中参数的不必要的冗余信令,由APS而不是片组标头来携带ALF参数,以提高编解码效率。基于相同的原因,提出了由APS而不是片组标头来携带整形模型参数。为了识别APS中的参数类型(至少是ALF或整形模型),APS语法中需要APS类型信息和APS ID。
自适应参数集语法和语义
Figure BDA0003275285130000321
adaptation_parameter_set_type标识ASP中参数的类型。adaptation_parameter_set_type的值应在0到1的范围内(包括0和1)。如果adaptation_parameter_set_type等于0,则信令通知ALF参数。否则,将信令通知整形模型参数。
通用片组标头语法和语义
Figure BDA0003275285130000322
2.5虚拟管道数据单元(VPDU)
虚拟管道数据单元(VPDU)被定义为图片中不重叠的MxM亮度(L)/NxN色度(C)单元。在硬件解码器中,由多个管道级同时处理连续的VPDU;不同的级同时处理不同的VPDU。在大多数管道级中,VPDU尺寸大致与缓冲器尺寸成比例,因此保持VPDU的尺寸小是很重要的。在HEVC硬件解码器中,将VPDU尺寸设置为最大变换块(TB)尺寸。将最大TB尺寸从32x32-L/16x16-C(如在HEVC中)增大到64x64-L/32x32-C(如在当前VVC中)可以带来编解码增益,与HEVC相比,得到4倍的VPDU尺寸(64x64-L/32x32-C)。然而,除了四叉树(QT)编解码单元(CU)分割外,VVC还采用了三叉树(TT)和二叉树(BT)来实现额外的编解码增益,可以将TT和BT划分递归地应用于128x128-L/64x64-C编解码树块(CTU),与HEVC相比,得到16倍的VPDU尺寸(128x128-L/64x64-C)。
在VVC的当前设计中,VPDU的尺寸被定义为64x64-L/32x32-C。
2.6自适应参数集
VVC采用自适应参数集(APS)来携带ALF参数。片组标头包含启用ALF时有条件地存在的aps_id。APS包含aps_id和ALF参数。为APS(来自JVET-M0132)分配新的NUT(NAL单元类型,如在AVC和HEVC中)值。对于VTM-4.0中的常规测试条件(即将出现),提出仅使用aps_id=0并将APS与每个图片一起发送。目前,APS ID值的范围是0…31,并且可以跨图片共享APS(并且在图片中的不同片组中APS可以不同)。当存在时,ID值应为固定长度编解码的。在相同图片中,不能将ID值与不同的内容重复使用。
2.7相关工具
2.7.1扩散滤波器(DF)
在JVET-L0157中,提出了扩散滤波器,其中可以用扩散滤波器进一步修改CU的帧内/帧间预测信号。
均匀扩散滤波器。均匀扩散滤波器是通过将预测信号与固定掩模(给出为hI或hIV)卷积来实现的,定义如下。除了预测信号本身之外,块的左侧和上方的一行重构样本点被用作滤波信号的输入,其中在帧间块上可以避免使用这些重构样本点。
让pred作为通过帧内或运动补偿预测获得的给定块上的预测信号。为了处理滤波器的边界点,需要将预测信号扩展为预测信号predext。这种扩展的预测可以通过两种方式形成:作为中间步骤,向预测信号添加块左侧或上方的一行重构样本点,然后在所有方向上镜像所得的信号;可选地,在所有方向上只镜像预测信号本身。后一种扩展用于帧间块。在这种情况下,只有预测信号本身包括扩展预测信号predext的输入。
如果将要使用滤波器hI,则提出使用上述边界扩展,用hI*pred来替换预测信号pred。这里,滤波器掩模hI为:
Figure BDA0003275285130000341
如果将要使用滤波器hIV,则提出用hIV*pred来替换预测信号pred。
这里,滤波器hIV为hIV=hI*hI*hI*hI
定向扩散滤波器。不是使用信号自适应扩散滤波器、定向滤波器,而是使用水平滤波器hhor和垂直滤波器hver,它们仍然有固定的掩模。更准确地说,对应于先前章节的掩模hI的均匀扩散滤波仅限于沿垂直或沿水平方向应用。
通过将固定滤波器掩模
Figure BDA0003275285130000342
应用于预测信号来实现垂直滤波器,并且通过使用倒置的掩模
Figure BDA0003275285130000343
来实现垂直滤波器。
2.7.2双边滤波器(BF)
在JVET-L0406中提出了双边滤波器,并且通常将它应用于具有非零变换系数、并且条带量化参数大于17的亮度块。因此,无需信令通知双边滤波器的使用。如果应用双边滤波器,则在逆变换后立即对解码样本点执行。此外,从编解码信息中显式地导出滤波器参数(即权重)。
将滤波处理定义为:
Figure BDA0003275285130000344
其中,P0,0是当前样本点的强度,并且P′0,0是当前样本点的修正强度,Pk,0和Wk分别是第k个临近样本点的强度和权重参数。图24描绘了一个当前样本点及其四个临近样本点(即K=4)的示例。
更具体地,与第k个临近样本点相关联的权重Wk(x)定义如下:
Wk(x)=Distancek×Rangek(x) (2)
其中
Figure BDA0003275285130000351
并且
Figure BDA0003275285130000352
其中,σd取决于编解码模式和编解码块尺寸。当TU被进一步划分时,所描述的滤波处理被应用于帧内编解码块和帧间编解码块,以启用并行处理。
为了更好地捕获视频信号的统计特性,并提高滤波器的性能,用σd参数调整由等式(2)得到的权重函数,如表4所示,其取决于编解码模式和块分割的参数(最小尺寸)。
表4不同块尺寸和编解码模式的σd的值
最小(块宽度、块高度) 帧内模式 帧间模式
4 82 62
8 72 52
其它 52 32
为了进一步提高编解码性能,对于帧间编解码的块,当TU未划分时,用覆盖当前样本点和临近样本点的两个窗口之间的代表性强度差来代替当前样本点与其一个临近样本点之间的强度差。因此,将滤波处理的等式修正为:
Figure BDA0003275285130000353
其中,Pk,m和P0,m分别表示以Pk,0和P0,0为中心的窗口中的第m个样本点。在本提案中,将窗口尺寸设置为3×3。覆盖P2,0和P0,0的两个窗口如图25所示。
2.7.3Hadamard变换域滤波器(HF)
在JVET-K0068中,在重构后应用于CU级的1D-Hadamard变换域中的环内滤波器实现了无乘法运算。将所提出的滤波器应用于满足预定义的条件的所有CU块,并且滤波器参数是从编解码信息中导出的。
通常将所提出的滤波应用于具有非零变换系数的亮度重构块,4x4块和条带量化参数大于17的情况除外。滤波器参数是从编解码信息中显式地导出的。如果应用了所提出的滤波器,则在逆变换后立即对解码样本点执行该滤波。
对于来自重构块的每个像素,像素处理包括以下步骤:
·根据扫描模式扫描处理像素周围的4个临近像素(包括当前像素);
·读取像素的4点Hadamard变换;
·基于以下公式的频谱滤波:
Figure BDA0003275285130000361
其中(i)是Hadamard频谱中频谱分量的索引,R(i)是与索引相对应的重构像素的频谱分量,σ是使用以下等式从编解码器量化参数QP中导出的滤波参数:
σ=2(1+0.126*(QP-27))
扫描模式的示例如图26所示,其中A是当前像素,并且{B,C,D}是周围像素。
对于位于CU边界上的像素,调整扫描模式以确保所有所需像素都在当前CU内。
3.现有实现的缺陷
在现有的ILR实现中,可能存在以下缺陷:
1)在片组标头处信令通知ILR边信息不合适,因为它需要太多比特。此外,不允许在不同图片/片组之间进行预测。因此,对于每个片组,需要发送ILR的边信息,这可能导致低比特率下的编解码损失,尤其对于低分辨率。
2)ILR和DMVR(或其他新引入的编解码工具)之间的交互不清楚。例如,将ILR应用于帧间预测信号以将原始信号转换到整形域,并且解码的残差在整形域中。而DMVR也依赖于预测信号来细化一个块的运动矢量。究竟将DMVR应用于原始域还是整形域是不清楚的。
3)ILR与屏幕内容编解码工具(例如,调色板、B-DPCM、IBC、变换跳过、变换量化旁路、I-PCM模式)之间的交互不清楚。
4)ILR中使用了取决于亮度的色度残差缩放。因此,引入了额外的延迟(由于亮度和色度之间的依赖关系),这对硬件设计是不利的。
5)VPDU的目标是确保在开始处理其他64x64正方形区域之前完成一个64x64正方形区域的处理。然而,根据ILR的设计,由于色度依赖于亮度的预测信号,因此ILR的使用没有限制,这可能导致VPDU的破坏。
6)当一个CU遇到全部零系数时,预测块和重构块仍然执行前向和反向整形处理,这浪费了计算复杂度。
7)在JVET-N0138中,提出了在APS中信令通知ILR信息。该解决方案可能会导致一些新问题。例如,设计了两种APS。但是,为ILR信令通知的adaptation_parameter_set_id可能参考不包含ILR信息的APS。类似地,为自适应环路滤波(ALF)信令通知的adaptation_parameter_set_id可能参考不包含ALF信息的APS。
4.视频编解码的环内整形的示例方法
本公开技术的实施例克服了现有实现的缺陷,从而提供具有更高编解码效率的视频编解码。基于所公开的技术,在以下针对各种实现描述的示例中说明了可以增强现有和未来的视频编解码标准的环内整形的方法。下面提供的公开技术的示例解释了一般概念,并不意味着被解释为限制性的。在示例中,除非明确表示相反,否则可以组合这些示例中描述的各种特征。应当指出,一些提出的技术可以应用于现有的候选列表构造处理。
在本文中,解码器侧运动矢量推导(DMVD)包括诸如DMVR和FRUC的执行运动估计以导出或细化块/子块运动信息的方法,以及诸如BIO的执行逐样本点运动细化的方法。
1.DMVD技术中的运动信息细化处理(诸如DMVR)可取决于整形域中的信息。
a.在一个示例中,在用于运动信息细化之前,可将从原始域中的参考图片生成的预测块首先转换到整形域。
i.可选地,此外,在整形域中执行成本计算(例如,SAD、MR-SAD)/梯度计算。
ii.可选地,此外,在运动信息被细化之后,对用细化的运动信息生成的预测块禁用整形处理。
b.可选地,DMVD技术中的运动信息细化处理(诸如DMVR)可取决于原始域中的信息。
i.可以用原始域中的预测块调用DMVD处理。
ii.在一个示例中,在运动信息细化之后,可以将利用细化的运动信息获得的预测块或最终预测块(例如,两个预测块的加权平均值)进一步转换到整形域以生成最终重构块。
iii.可选地,此外,在运动信息细化之后,对用细化的运动信息生成的预测块禁用整形处理。
2.提出将当前片/片组/图片中的样本点和从使用的参考图片中导出的样本点的域进行对齐(无论都在原始区域还是整形区域)以导出局部照明补偿(LIC)参数。
a.在一个示例中,利用整形域来推导LIC参数。
i.可选地,此外,在用于导出LIC参数之前,可以首先将样本点(例如,参考图片中的参考样本点(是否通过插值)以及参考样本点的临近/非相邻样本点(是否通过插值))转换到整形域。
b.在一个示例中,利用原始域来导出LIC参数。
i.可选地,此外,在用于导出LIC参数之前,可以首先将当前块的空域临近/非相邻样本点(例如,在当前片组/图片/片中)转换到原始域。
c.提出当在一个域中导出LIC参数时,当将LIC参数应用于预测块时,应使用相同的预测块的域。
i.在一个示例中,当调用项目a时,可以将参考块转换到整形域,并且将LIC模型应用于整形的参考块。
ii.在一个示例中,当调用项目b时,将参考块保留在原始域中,并且将LIC模型应用于原始域中的参考块。
d.在一个示例中,将LIC模型应用于整形域中的预测块(例如,首先通过前向整形将预测块转换到整形域)。
e.在一个示例中,首先将LIC模型应用于原始域中的预测块,然后,可以将取决于应用LIC的预测块的最终预测块转换到整形域(例如,通过前向整形)并用于导出重构块。
f.上述方法可以扩展到依赖于参考图片中的空域临近/非相邻样本点和参考样本点的其它编解码工具。
3.对于应用于预测信号的滤波器(诸如扩散滤波器(DF)),将滤波器应用于原始域中的预测块。
a.可选地,此外,随后,对滤波后的预测信号应用整形以生成重构块。
b.图27描绘了帧间编解码的处理的示例。
c.可选地,将滤波器应用于整形域中的预测信号。
i.可选地,此外,首先将整形应用于预测块;然后,可以将滤波方法进一步应用于整形的预测块以生成重构块。
ii.图28描绘了帧间编解码的处理的示例。
d.滤波器参数可取决于是否启用ILR。
4.对于应用于重构块的滤波器(例如,双边滤波器(BF)、Hadamard变换域滤波器(HF)),将滤波器应用于原始域而不是整形域中的重构块。
a.可选地,此外,首先将整形域中的重构块转换到原始域,然后应用滤波器并利用滤波器来生成重构块。
b.图29描绘了帧间编解码的处理的示例。
c.可选地,可将滤波器应用于整形域中的重构块。
i.可选地,此外,在应用反向整形之前,可以首先应用滤波器。然后,可将滤波后的重构块转换到原始域。
ii.图30描绘了帧间编解码的处理的示例。
d.滤波器参数可取决于是否启用ILR。
5.提出应用滤波处理,可将其应用于整形域中的重构块(例如,在帧内/帧间或其它类型的预测方法之后)。
a.在一个示例中,在整形域中执行去块滤波器(DBF)处理。在这种情况下,在DBF之前不应用反向整形。
i.在这种情况下,DBF参数可能不同,这取决于是否应用了整形。
ii.在一个示例中,DBF处理可取决于是否启用了整形。
1.在一个示例中,当在原始域中调用DBF时应用此方法。
2.可选地,当在整形域中调用DBF时应用此方法。
b.在一个示例中,在整形域中执行样本点自适应偏移(SAO)滤波处理。在这种情况下,在SAO之前不应用反向整形。
c.在一个示例中,在整形域中执行自适应环路滤波器(ALF)滤波处理。在这种情况下,在ALF之前不应用反向整形。
d.可选地,此外,还可以在DBF之后对块应用反向整形。
e.可选地,此外,还可以在SAO之后对块应用反向整形。
f.可选地,此外,还可以在ALF之后对块应用反向整形。
g.可以用其他类型的滤波方法来代替上述滤波方法。
6.提出在新的参数集中(诸如ILR APS)而不是片组标头中信令通知ILR参数。
a.在一个示例中,片组标头可以包含aps_id。可选地,此外,当启用ILR时,aps_id有条件地存在。
b.在一个示例中,ILR APS包含aps_id和ILR参数。
c.在一个示例中,为ILR APS分配新的NUT(NAL单元类型,如AVC和HEVC中的)值。
d.在一个示例中,ILR APS ID值的范围将是0…M(例如,M=2K-1)。
e.在一个示例中,可以跨图片共享ILR APS(并且可以在图片中的不同片组中不同)。
f.在一个示例中,当存在时,ID值可以是固定长度编解码的。可选地,可以使用指数Golomb(EG)编解码、截断一元或其他二值化方法对其进行编解码。
g.在一个示例中,同一图片中的不同内容不能重复使用ID值。
h.在一个示例中,ILR APS和ALF参数的APS可以共享相同的NUT。
i.可选地,可以用用于ALF参数的当前APS来携带ILR参数。在这种情况下,上述提到ILR APS的方法可以被当前APS替代。
j.可选地,可以在SPS/VPS/PPS/序列标头/图片标头中携带ILR参数。
k.在一个示例中,可将ILR参数包括在整形器模型信息、ILR方法的使用、色度残差缩放因子中。
l.可选地,此外,可以在一个级别(诸如在APS中)信令通知ILR参数,和/或可以在第二个级别(诸如片组标头中)进一步信令通知ILR的使用。
m.可选地,此外,可应用预测编解码来对具有不同APS索引的ILR参数进行编解码。
7.提出了将前向/反向整形处理应用于色度块来消除亮度和色度之间的依赖关系,而不是将基于亮度的色度残差缩放(LCRS)应用于色度块。
a.在一个示例中,可将一个M段的分段线性(PWL)模型和/或前向/后向查找表用于一个色度分量。可选地,可将两个PWL模型和/或前向/后向查找表分别用于编解码两个色度分量。
b.在一个示例中,可以从亮度的PWL模型和/或前向/后向查找表导出色度的PWL模型和/或前向/后向查找表。
i.在一个示例中,不需要进一步信令通知色度的PWL模型/查找表。
c.在一个示例中,可以在SPS/VPS/APS/PPS/序列标头/图片标头/片组标头/片标头/CTU行/CTU组/区域中信令通知色度的PWL模型和/或前向/后向查找表。
8.在一个示例中,如何信令通知一个图片/片组的ILR参数可能取决于先前编解码的图片/片组的ILR参数。
a.例如,可以通过一个或多个先前编解码的图片/片组的ILR参数来预测一个图片/片组的ILR参数。
9.提出对于特定的块维度/时域层/片组类型/图片类型/编解码模式/特定类型的运动信息,禁用取决于亮度的色度残差缩放(LCRS)。
a.在一个示例中,即使将前向/反向整形处理应用于亮度块,也不能将LCRS应用于对应的色度块。
b.可选地,即使不将前向/反向整形处理应用于亮度块,也可以将LCRS应用于对应的色度块。
c.在一个示例中,当应用交叉分量线性模型(CCLM)模式时,不使用LCRS。CCLM模式包括LM、LM-A和LM-L。
d.在一个示例中,当不应用交叉分量线性模型(CCLM)模式时,不使用LCRS。CCLM模式包括LM、LM-A和LM-L。
e.在一个示例中,当编解码的亮度块超过一个VPDU(例如,64x64)时。
i.在一个示例中,当亮度块尺寸包含小于M×H个样本点时(例如16、32或64个亮度样本点),不允许LCRS。
ii.可选地,当亮度块的宽度或/和高度的最小尺寸小于或不大于X
时,不允许LCRS。在一个示例中,X被设置为8。
iii.可选地,当亮度块的宽度或/和高度的最小尺寸不小于X时,不允许LCRS。在一个示例中,X被设置为8。
iv.可选地,当块的宽度>th1或>=th1和/或亮度块的高度>th2或>=th2时,不允许LCRS。在一个示例中,th1和/或th2被设置为8。
1.在一个示例中,th1和/或th2被设置为128。
2.在一个示例中,th1和/或th2被设置为64。
v.可选地,当亮度块的宽度<th1或<=th1和/或亮度块的高度<th2或<=th2时,不允许LCRS。在一个示例中,th1和/或th2被设置为8。
10.是否禁用ILR(前向整形处理和/或反向整形处理)可取决于系数。
a.在一个示例中,当一个块是用全零系数编解码时,跳过应用于预测块的前向整形处理。
b.在一个示例中,当一个块是用全零系数编解码时,跳过应用于重构块的反向整形处理。
c.在一个示例中,当一个块是用位于特定位置的仅一个非零系数编解码时(例如,位于一个块的左上位置的DC系数,位于一个块内的左上编解码组的系数),跳过应用于预测块的前向整形处理和/或应用于重构块的反向整形处理。
d.在一个示例中,当一个块是用仅M(例如,M=1)个非零系数编解码时,跳过应用于预测块的前向整形处理和/或应用于重构块的反向整形处理。
11.提出如果编解码块超过一个VPDU,则将ILR应用区域划分为虚拟管道数据单元(VPDU)。每个应用区域(例如,最大尺寸为64x64)被视为ILR操作的单独CU。
a.在一个示例中,当块的宽度>th1或>=th1和/或块的高度>th2或>=th2时,可以将其划分为宽度小于th1或<=th1和/或高度小于th2或<=th2的子块,并且可以对每个子块执行ILR。
i.在一个示例中,子块可以具有相同的宽度或/和高度。
ii.在一个示例中,除了右边界或/和底边界处以外的子块可以具有相同的宽度或/和高度。
iii.在一个示例中,除了左边界或/和顶边界处以外的子块可以具有相同的宽度或/和高度。
b.在一个示例中,当块的尺寸(即宽度*高度)>th3或>=th3时,可以将其划分成尺寸<th3或<=th3的子块,并且可以对每个子块执行ILR。
i.在一个示例中,子块可以具有相同的尺寸。
ii.在一个示例中,除了右边界或/和底边界处以外的子块可以具有相同的尺寸。
iii.在一个示例中,除了左边界或/和上边界处以外的子块可以具有相同的尺寸。
c.可选地,ILR的使用仅限于某些块尺寸。
i.在一个示例中,当编解码块超过一个VPDU(例如,64x64)时,不允许ILR。
ii.在一个示例中,当块尺寸包含小于M×H个样本点时(例如16、32或64个亮度样本点),不允许ILR。
iii.可选地,当块宽度或/和高度的最小尺寸小于或不大于X时,不允许ILR。在一个示例中,X被设置为8。
iv.可选地,当块宽度或/和高度的最小尺寸不小于X时,不允许ILR。在一个示例中,X被设置为8。
v.可选地,当块的宽度>th1或>=th1和/或块的高度>th2或>=th2时,不允许ILR。在一个示例中,th1和/或th2被设置为8。
1.在一个示例中,th1和/或th2被设置为128。
2.在一个示例中,th1和/或th2设置为64。
vi.可选地,当块的宽度<th1或<=th1和/或块的高度<th2或<=th2时,不允许ILR。在一个示例中,th1和/或th2被设置为8。
12.以上方法(例如,是否禁用ILR和/或是否禁用LCRS和/或是否信令通知用于色度编解码的PWL/查找表)可取决于颜色格式,诸如4:4:4/4:2:0。
13.可以在存在整形器模型的指示(例如,tile_group_reshaper_model_present_flag)的条件下对启用ILR的指示(例如,tile_group_reshaper_enable_flag)进行编解码。
a.可选地,可以在tile_group_reshaper_enable_flag的条件下对tile_group_reshaper_model_present_flag进行编解码。
b.可选地,只能对两个语法元素(包括tile_group_reshaper_model_present_flag和tile_group_reshaper_enable_flag)中的一个进行编解码。将另一个的值设置为等于可能信令通知的值。
14.可将不同的剪切方法应用于预测信号和重构处理。
a.在一个示例中,可以应用自适应剪切方法,并且可以在整形域中定义要剪切的最大值和最小值。
b.在一个示例中,可将自适应剪切应用于整形域中的预测信号。
c.可选地,此外,可以将固定剪切(例如,根据比特深度)应用于重构块。
15.滤波器参数(诸如DF、BF、HF中使用的参数)可取决于是否启用ILR。
16.提出对于调色板模式下编解码的块,禁用ILR或以不同方式应用ILR。
a.在一个示例中,当块以调色板模式编解码时,跳过整形和反向整形。
b.可选地,当块以调色板模式编解码时,可以应用不同的整形和反向整形函数。
17.可选地,当应用ILR时,可以不同地编解码调色板模式。
a.在一个示例中,当应用ILR时,可以在原始域中编解码调色板模式。
b.可选地,当应用ILR时,可以在整形的域中编解码调色板模式。
c.在一个示例中,当应用ILR时,可以在原始域中信令通知调色板预测器。
d.可选地,可以在整形域中信令通知调色板预测器。
18.提出对于用IBC模式编解码的块,禁用ILR或以不同的方式应用ILR。
a.在一个示例中,当块以IBC模式编解码时,跳过整形和反向整形。
b.可选地,当块以IBC模式编解码时,应用不同的整形和反向整形。
19.可选地,当应用ILR时,可以不同地编解码IBC模式。
a.在一个示例中,当应用ILR时,可以在原始域中执行IBC。
b.可选地,当应用ILR时,可以在整形的域中执行IBC。
20.提出对于以B-DPCM模式编解码的块,禁用ILR或以不同的方式应用ILR。
a.在一个示例中,当块以B-DPCM模式编解码时,跳过整形和反向整形。
b.可选地,当块以B-DPCM模式编解码时,应用不同的整形和反向整形。
21.可选地,当应用ILR时,可以不同地编解码B-DPCM模式。
a.在一个示例中,当应用ILR时,可以在原始域中执行B-DPCM。
b.可选地,当应用ILR时,可以在整形的域中执行B-DPCM。
22.提出对于以变换跳过模式编解码的块,禁用ILR或以不同的方式应用ILR。
a.在一个示例中,当块以变换跳过模式编解码时,跳过整形和反向整形。
b.可选地,当块以变换跳过模式编解码时,可以应用不同的整形和反向整形。
23.可选地,当应用ILR时,可以不同地编解码变换跳过模式。
a.在一个示例中,当应用ILR时,可以在原始域中执行变换跳过。
b.可选地,当应用ILR时,可以在整形域中执行变换跳过。
24.提出对于以I-PCM模式编解码的块,禁用ILR或以不同的方式应用ILR。
a.在一个示例中,当块以调色板模式编解码时,跳过整形和反向整形。
b.可选地,当块以调色板模式编解码时,可以应用不同的整形和反向整形函数。
25.可选地,当应用ILR时,可以不同地编解码I-PCM模式。
a.在一个示例中,当应用ILR时,可以在原始域中编解码I-PCM模式。
b.可选地,当应用ILR时,可以在整形域中编解码I-PCM模式。
26.提出对于以变换量化旁路模式编解码的块,禁用ILR或以不同的方式应用ILR。
a.在一个示例中,当块以变换量化旁路模式编解码时,跳过整形和反向整形。
27.可选地,当块以变换量化旁路模式编解码时,应用不同的整形和反向整形函数。
28.对于上述项,当禁用ILR时,可以跳过前向整形和/或反向整形处理。
a.可选地,预测和/或重构和/或残差信号在原始域中。
b.可选地,预测和/或重构和/或残差信号在整形域中。
29.可以允许多个整形/反向整形函数(诸如多个PWL模型)来编解码一个图片/一个片组/一个VPDU/一个区域/一个CTU行/多个CU。
a.如何从多个函数中选择可取决于块维度/编解码模式/图片类型/低延迟检查标志/运动信息/参考图片/视频内容等。
b.在一个示例中,可以按照SPS/VPS/PPS/序列标头/图片标头/片组标头/片标头/区域/VPDU等信令通知多组ILR边信息(例如,整形/反向整形函数)的信号。
i.可选地,此外,可以利用ILR边信息的预测编解码。
c.在一个示例中,可以在PPS/图片标头/片组标头/片标头/区域/VPDU等中信令通知多于一个aps_idx。
30.在一个示例中,在除了VPS、SPS、PPS或APS以外的新语法集中信令通知整形信息。例如,在表示为inloop_reshaping_parameter_set()(IRPS或任何其他名称)的集合中信令通知整形信息。
a.示例性语法设计如下:
Figure BDA0003275285130000461
inloop_reshaping_parameter_set_id提供供其他语法元素参考的IRPS的标识符。
注意:可以跨图片共享IRPS,并且图片内的不同片组中的IRPS可以不同。
irps_extension_flag等于0指定IRPS RBSP语法结构中不存在irps_extension_data_flag语法元素。irps_extension_flag等于1指定IRPS RBSP语法结构中存在irps_extension_data_flag语法元素。
irps_extension_data_flag可以是任何值。其存在和值不影响解码器与本规范本版本中指定的配置文件的一致性。符合本规范本版本的解码器应忽略所有irps_extension_data_flag语法元素。
b.示例性语法设计如下:
通用片组标头语法和语义
Figure BDA0003275285130000471
tile_group_irps_id指定片组参考的IRPS的inloop_reshaping_parameter_set_id。inloop_reshaping_parameter_set_id等于tile_group_irps_id的IRPS NAL单元的TemporalId应小于或等于编解码的片组NAL单元的TemporalId。
31.在一个示例中,IRL信息与APS中的ALF信息一起被信令通知。
a.示例性语法设计如下:
自适应参数集语法和语义
Figure BDA0003275285130000472
b.在一个示例中,在片组标头中信令通知一个tile_group_aps_id,以指定片组参考的APS的adaptation_parameter_set_id。当前片组的ALF信息和ILR信息都在指定的AP中信令通知。
i.示例性语法设计如下:
Figure BDA0003275285130000481
32.在一个示例中,在不同的APS中信令通知ILR信息和ALF信息。
a.在片组标头中信令通知第一个ID(可以命名为tile_group_aps_id_alf),以指定片组参考的第一个APS的第一个adaptation_parameter_set_id。在指定的第一个APS中信令通知当前片组的ALF信息。
b.在片组标头中信令通知第二个ID(可以命名为tile_group_aps_id_irps),以指定片组参考的第二个APS的第二个adaptation_parameter_set_id。在指定的第二个APS中信令通知当前片组的ILR信息。
c.在一个示例中,第一个APS必须具有一致性比特流中的ALF信息;
d.在一个示例中,第二个APS必须具有一致性比特流的ILR信息;
e.示例性语法设计如下:
Figure BDA0003275285130000482
Figure BDA0003275285130000483
33.在一个示例中,一些具有指定的adaptation_parameter_set_id的APS必须具有ALF信息。另一个示例是,一些具有指定的adaptation_parameter_set_id的APS必须具有ILR信息。
a.例如,adaptation_parameter_set_id等于2N的APS必须具有ALF信息。N是任意整数;
b.例如,adaptation_parameter_set_id等于2N+1的APS必须具有ILR信息。N是任意整数;
c.示例性语法设计如下:
Figure BDA0003275285130000491
Figure BDA0003275285130000492
i.例如,2*tile_group_aps_id_alf指定片组参考的第一个APS的第一个adaptation_parameter_set_id。在指定的第一个APS中信令通知当前片组的ALF信息。
ii.例如,2*tile_group_aps_id_irps+1指定片组参考第二个APS的第二个adaptation_parameter_set_id。在指定的第二个APS中信令通知当前片组的ILR信息。
34.在一个示例中,片组不能参考在指定类型的网络抽象层(NAL)单元之前信令通知的APS(或IRPS),该网络抽象层(NAL)单元是在当前片组之前信令通知的。
a.在一个示例中,片组不能参考在指定类型的片组之前信令通知的APS(或IRPS),该指定类型的片组是在当前片组之前信令通知的。
b.例如,片组不能参考在SPS之前信令通知的APS(或IRPS),该SPS是在当前片组之前信令通知的。
c.例如,片组不能参考在PPS之前信令通知的APS(或IRPS),该PPS是在当前片组之前信令通知的。
d.例如,片组不能参考在访问单元分隔符NAL(AUD)之前信令通知的APS(或IRPS),该访问单元分隔符NAL(AUD)是在当前片组之前信令通知的。
e.例如,片组不能参考在比特流结束NAL(EoB)之前信令通知的APS(或IRPS),该比特流结束NAL(EoB)是在当前片组之前信令通知的。
f.例如,片组不能参考在序列结束NAL(EoS)之前信令通知的APS(或IRPS),该序列结束NAL(EoS)是在当前片组之前信令通知的。
g.例如,片组不能参考在瞬时解码刷新(IDR)NAL之前信令通知的APS(或IRPS),该瞬时解码刷新(IDR)NAL是在当前片组之前信令通知的。
h.例如,片组不能参考在干净随机访问(CRA)NAL之前信令通知的APS(或IRPS),该干净随机访问(CRA)NAL是在当前片组之前信令通知的。
i.例如,片组不能参考在帧内随机访问点(IRAP)访问单元之前信令通知的APS(或IRPS),该帧内随机访问点(IRAP)访问单元是在当前片组之前信令通知的。
j.例如,片组不能参考在I片组(或图片、或条带)之前信令通知的APS(或IRPS),该I片组(或图片、或条带)是在当前片组之前信令通知的。
k.当在APS或IRPS中携带ILR信息时,也可以应用IDF-P1903237401H和IDF-P1903234501H中公开的方法。
35.一致性比特流应满足:当为一个视频数据单元(诸如序列)启用环内整形方法时,应定义默认的ILR参数(诸如默认模型)。
a.当将sps_lmcs_enabled_flag设置为1时,应将sps_lmcs_default_model_present_flag设置为1。
b.可以在ILR启用标志的条件下而不是默认模型存在标志(诸如sps_lmcs_default_model_present_flag)的条件下信令通知默认参数。
c.对于每个片组,可以在不参考SPS默认模型使用标志的情况下信令通知默认模型使用标志(诸如tile_group_lmcs_use_default_model_flag)。
d.一致性比特流应满足:当ILR的对应APS类型中没有ILR信息、并且强制一个视频数据单元(诸如片组)使用ILR技术时,应使用默认模型。
e.可选地,一致性比特流应满足:当ILR的对应APS类型中没有ILR信息、并且强制一个视频数据单元(诸如片组)使用ILR技术时(诸如tile_group_lmcs_enable_flag等于1)时,使用默认模型的指示应为真,例如,tile_group_lmcs_use_default_model_flag应为1。
f.默认的ILR参数(诸如默认模型)必须在视频数据单元(诸如SPS)中发送。
i.可选地,此外,当指示ILR的使用的SPS标志为真时,应发送默认的ILR参数。
g.在视频数据单元(例如SPS)中必须发送至少一个ILR APS。
i.在一个示例中,至少一个ILR APS包含默认的ILR参数(诸如默认模型)。
36.可以用一个标志表示默认的ILR参数。当这个标志指示使用默认的ILR参数时,不需要进一步信令通知ILR数据。
37.可以在未信令通知时预定义默认的ILR参数。例如,默认的ILR参数可以对应于标识映射。
38.时域层信息可以与ILR参数一起被信令通知,诸如在ILR APS中。
a.在一个示例中,可以在lmcs_data()中信令通知时域层索引。
b.在一个示例中,可以在lmcs_data()中信令通知时域层索引减1。
c.可选地,此外,当编码/解码一个片组/片时,限制为参考那些与较小或相等的时域层索引相关联的ILR APS。
d.可选地,当编码/解码一个片组/片时,限制为参考那些与较小的时域层索引相关联的ILR APS。
e.可选地,当编码/解码一个片组/片时,限制为参考那些与较大的时域层索引相关联的ILR APS。
f.可选地,当编码/解码一个片组/片时,限制为参考那些与较大或相等的时域层索引相关联的ILR APS。
g.可选地,当编码/解码一个片组/片时,限制为参考那些与相等的时域层索引相关联的ILR APS。
h.在一个示例中,是否应用上述限制可取决于一条信息,该信息可被信令通知到解码器或由解码器推断。
39.时域层信息可以与ALF参数一起被信令通知,诸如在ALF APS中。
a.在一个示例中,可以在alf_data()中信令通知时域层索引。
b.在一个示例中,可以在alf_data()中信令通知时域层索引减1。
c.可选地,此外,当解码/解码一个片/片组内的一个片组/片或一个CTU时,限制为参考那些与较小或相等的时域层索引相关联的ALF APS。
d.可选地,当编码/解码一个片组/片时,限制为参考那些与较小的时域层索引相关联的ALF APS。
e.可选地,当编码/解码一个片组/片时,限制为参考那些与较大的时域层索引相关联的ALF APS。
f.可选地,当编码/解码一个片组/片时,限制为参考那些与较大或相等的时域层索引相关联的ALF APS。
g.可选地,当编码/解码一个片组/片时,限制为参考那些与相等的时域层索引相关联的ALF APS。
h.在一个示例中,是否应用上述限制可取决于一条信息,该信息可被信令通知到解码器或由解码器推断。
40.在一个示例中,原始样本点和整形样本点之间的整形映射可能不是正关系(即,不允许将一个较大的值映射到较小的值)。
a.例如,原始样本点和整形样本点之间的整形映射可以是负关系,其中对于两个值,可将原始域中的较大值映射到整形域中的较小值。
41.在一致性比特流中,只允许语法元素aps_params_type是几个预定义值,诸如0和1。
a.在另一个示例中,只允许其为0和7。
42.在一个示例中,如果可以应用ILR,则必须信令通知默认的ILR信息(例如,sps_lmcs_enabled_flag为真)。
上述示例可并入下面描述的方法(例如,方法3100)的上下文中,其可在视频解码器或视频编码器处实现。
图31A示出了用于视频处理的示例性方法的流程图。方法3110包括:在操作3112处,执行包括一个或多个视频数据单元的视频和视频的比特流表示之间的转换。
在一些实施例中,比特流表示符合格式规则,该格式规则指定包括指示用于编解码模式的默认参数的边信息,该编解码模式适用于对其启用编解码模式的一个或多个视频数据单元的视频块,并且边信息提供参数用于基于视频块在原始域和整形域中的表示构造视频块、和/或取决于亮度缩放色度视频块的色度残差。
在其他实施例中,比特流表示符合格式规则,该格式规则指定包括指示用于编解码模式的默认参数的边信息,该编解码模式适用于对其启用编解码模式的一个或多个视频数据单元的视频块,在比特流表示中不存在显式地信令通知的参数的情况下,将默认参数用于编解码模式,并且编解码模式包括基于视频块在原始域和整形域中的表示构造视频块、和/或取决于亮度缩放色度视频块的色度残差。
图31B示出了用于视频处理的示例性方法的流程图。方法3120包括:在操作3122处,为包括一个或多个视频数据单元的视频和视频的比特流表示之间的转换配置比特流表示,所述比特流表示包括信令通知时域层信息的语法元素、以及适用于一个或多个视频数据单元的视频块的编解码模式的参数。方法3120还包括:在操作3124处,基于配置执行转换。
图31C示出了用于视频处理的示例性方法的流程图。方法3130包括:在操作3132处,为包括一个或多个视频数据单元的视频和视频的比特流表示之间的转换解析比特流表示,所述比特流表示包括信令通知时域层信息的语法元素、以及适用于一个或多个视频数据单元的视频块的编解码模式的参数。方法3130还包括:在操作3134处,基于配置执行转换。
在一些实施例中,编解码模式包括基于视频块在原始域和整形域中的表示构造视频块、和/或取决于亮度缩放色度视频块的色度残差。
在其他实施例中,编解码模式包括基于使用自适应环路滤波器(ALF)系数的滤波处理来构造视频的当前块。
图31D示出了用于视频处理的示例性方法的流程图。方法3140包括:在操作3142处,执行视频的第一视频数据单元和视频的比特流表示之间的转换。
在一些实施例中,编解码模式适用于第一视频数据单元的视频块,该编解码模式包括基于原始域和整形域构造视频块、和/或基于与编解码模式相关的边信息、取决于亮度缩放色度视频块的色度残差,并且根据基于时域层索引的规则来确定边信息。
在其他实施例中,编解码模式适用于第一视频数据单元的视频块,该编解码模式包括基于与编解码模式相关的边信息,基于使用自适应环路滤波器(ALF)系数的滤波处理来构造视频的当前块,并且根据基于时域层索引的规则来确定边信息。
5.公开技术的示例实现
在一些实施例中,当启用tile_group_reshaper_model_present_flag时,tile_group_reshaper_enable_flag有条件地存在。
在7.3.3.1通用片组标头语法中:
Figure BDA0003275285130000541
Figure BDA0003275285130000551
可选地,当启用tile_group_reshaper_enable_flag时,tile_group_reshaper_model_present_flag有条件地存在。
Figure BDA0003275285130000552
可选地,可以仅信令通知两个语法元素tile_group_reshaper_model_present_flag或tile_group_reshaper_enable_flag中的一个。未信令通知的语法元素被推断为等于可信令通知的语法元素。在这种情况下,该语法元素控制ILR的使用。
可选地,一致性比特流要求tile_group_reshaper_model_present_flag应等于tile_group_reshaper_enable_flag。
可选地,可以在APS中而不是在片组标头中信令通知tile_group_reshaper_model_present_flag、和/或tile_group_reshaper_enable_flag、和/或tile_group_reshaper_model()、和/或tile_group_reshaper_chroma_residual_scale_flag。
实施例2在JVET-N0805上
Figure BDA0003275285130000561
sps_lmcs_enabled_flag等于1指定在编解码视频序列(CVS)中使用亮度映射与色度缩放。sps_lmcs_enabled_flag等于0指定在CVS中不使用亮度映射与色度缩放。
sps_lmcs_default_model_present_flag等于1指定该SPS中存在默认lmcs数据。sps_lmcs_default_model_flag等于0指定该SPS中不存在默认lmcs数据。当不存在时,sps_lmcs_default_model_present_flag的值被推断为等于0。
...
Figure BDA0003275285130000562
aps_params_type指定APS中携带的APS参数的类型,如下表所定义:
表7-x APS参数类型代码和APS参数类型
Figure BDA0003275285130000563
Figure BDA0003275285130000571
ALF APS:aps_params_type等于ALF_APS的APS。
LMCS APS:aps_params_type等于LMCS_APS的APS。
进行以下语义更改:
...
tile_group_alf_aps_id指定片组所参考的ALF APS的adaptation_parameter_set_id。adaptation_parameter_set_id等于tile_group_alf_aps_id的ALF APS NAL单元的TemporalId应当小于或等于编解码的片组NAL单元的TemporalId。
当具有相同的adaptation_parameter_set_id值的多个ALF APS被同一图片的两个或多个片组参考时,具有相同的adaptation_parameter_set_id值的多个ALF APS应当具有相同的内容。
...
tile_group_lmcs_enabled_flag等于1指定为当前片组启用亮度映射与色度缩放。tile_group_lmcs_enabled_flag等于0指定不为当前片组启用亮度映射与色度缩放。当tile_group_lmcs_enable_flag不存在时,将其推断为等于0。
tile_group_lmcs_use_default_model_flag等于1指定片组的亮度映射与色度缩放操作使用默认lmcs模型。tile_group_lmcs_use_default_model_flag等于0指定片组的亮度映射与色度缩放操作使用由tile_group_lmcs_APS_id参考的LMCS APS中的lmcs模型。当tile_group_reshaper_use_default_model_flag不存在时,将其推断为等于0。
tile_group_lmcs_aps_id指定片组参考的LMCS APS的adaptation_parameter_set_id。adaptation_parameter_set_id等于tile_group_lmcs_aps_id的LMCS APS NAL单元的TemporalId应小于或等于编解码片组NAL单元的TemporalId。
当具有相同的adaptation_parameter_set_id值的多个LMCS APS被同一图片的两个或多个片组参考时,具有相同的adaptation_parameter_set_id值的多个LMCS APS应当具有相同的内容。
tile_group_chroma_residual_scale_flag等于1指定为当前片组启用色度残差缩放。tile_group_chroma_residual_scale_flag等于0指定不为当前片组启用色度残差缩放。当tile_group_chroma_residual_scale_flag不存在时,推断它等于0。
亮度映射与色度缩放数据语法
Figure BDA0003275285130000581
图32是视频处理设备3200的框图。设备3200可用于实现本文所述的一种或多种方法。设备3200可实施于智能手机、平板电脑、计算机、物联网(IoT)接收器等中。设备3200可以包括一个或多个处理器3202、一个或多个存储器3204和视频处理硬件3206。处理器3202可以被配置成实现本文中描述的一个或多个方法(包括但不限于方法3100)。存储器3204可用于存储用于实现本文描述的方法和技术的数据和代码。视频处理硬件3206可用于在硬件电路中实现本文中描述的一些技术。
在一些实施例中,可以使用如关于图32所述的在硬件平台上实现的设备来实现视频编解码方法。
图33是示出其中可以实现本文公开的各种技术的示例性视频处理系统3300的框图。各种实现可以包括系统3300的部分或全部组件。系统3300可以包括用于接收视频内容的输入3302。视频内容可以原始或未压缩格式(例如,8或10比特多分量像素值)接收,或者可以压缩或编解码格式接收。输入3302可以表示网络接口、外围总线接口或存储接口。网络接口的示例包括诸如以太网、无源光网络(PON)等有线接口和诸如Wi-Fi或蜂窝接口的无线接口。
系统3300可以包括编解码组件3304,其可以实现本文中描述的各种编码或译码方法。编解码组件3304可以降低从输入3302到编解码组件3304的输出的视频的平均比特率,以产生视频的编解码表示。因此,编解码技术有时被称为视频压缩或视频转码技术。编解码组件3304的输出可以被存储,或者通过如组件3306表示的连接的通信来发送。组件3308可以使用在输入3302处接收的视频的存储或通信的比特流(或编解码)表示来生成发送到显示接口3310的像素值或可显示视频。从比特流表示生成用户可视视频的处理有时称为视频解压缩。此外,虽然某些视频处理操作被称为“编码”操作或工具,但是应当理解,编码工具或操作在编码器处使用,并且将由解码器执行反转编码结果的对应的解码工具或操作。
外围总线接口或显示接口的示例可以包括通用串行总线(USB)或高清晰度多媒体接口(HDMI)或显示端口等。存储接口的示例包括SATA(串行高级技术附件)、PCI、IDE接口等。本文中描述的技术可以实施在各种电子设备中,例如能够执行数字数据处理和/或视频显示的移动电话、膝上型计算机、智能手机或其他设备。
在一些实施例中,可以实现以下技术解决方案:
A1.一种视频处理方法,包括:执行包括一个或多个视频数据单元的视频和所述视频的比特流表示之间的转换,其中,所述比特流表示符合格式规则,所述格式规则指定包含指示用于编解码模式的默认参数的边信息,所述编解码模式适用于对其启用所述编解码模式的所述一个或多个视频数据单元的视频块,并且其中,所述边信息提供参数用于基于所述视频块在原始域和整形域中的表示和/或色度视频块的色度残差的取决于亮度的缩放,构造所述视频块。
A2.根据解决方案A1所述的方法,其中在确定所述比特流表示包括设置为1的所述色度残差的所述取决于亮度的缩放的指示(sps_lmcs_enabled_flag)时,所述比特流表示还包括设置为1的使用默认模型的指示(sps_lmcs_default_model_present_flag)。
A3.根据解决方案A1所述的方法,其中所述比特流表示中的自适应参数集(APS)不包括与所述编解码模式相关联的参数,并且其中,使用所述默认参数将所述编解码模式应用于所述视频块数据。
A4.根据解决方案A3所述的方法,其中所述一个或多个视频数据单元包括片组,并且其中,所述比特流表示还包括设置为1的使用所述片组的默认模型的指示(tile_group_lmcs_use_default_model_flag)。
A5.根据解决方案A1所述的方法,其中所述比特流表示还包括包含所述默认参数的序列参数集(SPS)。
A6.根据解决方案A5所述的方法,其中所述比特流表示还包括所述SPS中指示所述编解码模式被启用的标志。
A7.根据解决方案A1所述的方法,其中所述比特流表示还包括序列参数集(SPS),所述SPS包括用于所述编解码模式的至少一个自适应参数集(APS)。
A8.根据解决方案A7所述的方法,其中所述至少一个APS包括所述默认参数。
A9.根据解决方案A1所述的方法,其中使用所述比特流表示中的一个标志来信令通知为所述编解码模式启用所述默认参数的指示。
A10.根据解决方案A1所述的方法,其中,其中在确定所述比特流表示包括所述色度残差的所述取决于亮度的缩放的指示(sps_lmcs_enabled_flag)时,所述比特流表示包括所述默认参数。
A11.一种视频编解码方法,包括:执行包括一个或多个视频数据单元的视频和所述视频的比特流表示之间的转换,其中所述比特流表示符合格式规则,所述格式规则指定包含指示用于编解码模式的默认参数的边信息,所述编解码模式适用于对其启用所述编解码模式的所述一个或多个视频数据单元的视频块,其中,在所述比特流表示中不存在显式地信令通知的参数的情况下将所述默认参数用于所述编解码模式,并且其中,所述编解码模式包括基于所述视频块在原始域和整形域中的表示和/或色度视频块的色度残差的取决于亮度的缩放,构造所述视频块。
A12.根据解决方案A11所述的方法,其中所述边信息包括对所述默认参数的预定值的索引。
A13.根据解决方案A12所述的方法,其中所述默认参数的所述预定值对应于标识映射。
A14.根据解决方案A11所述的方法,其中所述边信息包括所述默认参数。
A15.根据解决方案A1至A14中任一项所述的方法,其中所述编解码模式是环内整形(ILR)模式。
A16.根据解决方案A1至A15中任一项所述的方法,其中所述转换从所述比特流表示生成所述一个或多个视频数据单元中的至少一个。
A17.根据解决方案A1至A15中任一项所述的方法,其中所述转换从所述一个或多个视频数据单元中的至少一个生成所述比特流表示。
A18.一种视频系统中的装置,其包括处理器和其上具有指令的非暂时性存储器,其中,在所述处理器执行所述指令时,所述指令使所述处理器实现解决方案A1至A17中任一项所述的方法。
A19.一种存储在非暂时性计算机可读介质上的计算机程序产品,所述计算机程序产品包括用于实现解决方案A1至A17中任一项所述的方法的程序代码。
在一些实施例中,可以实现以下技术解决方案:
B1.一种视频处理方法,包括:执行视频的第一视频数据单元和所述视频的比特流表示之间执行转换,其中编解码模式适用于所述第一视频数据单元的视频块,其中所述编解码模式包括基于与所述编解码模式相关的边信息,基于原始域和整形域和/或色度视频块的色度残差的取决于亮度的缩放,构造所述视频块,并且其中,根据基于时域层索引的规则来确定所述边信息。
B2.根据解决方案B1所述的方法,其中基于所述视频的第二视频数据单元的所述编解码模式的边信息来确定所述边信息。
B3.根据解决方案B2所述的方法,其中所述第二视频数据单元的所述时域层索引小于或等于所述第一视频数据单元的所述时域层索引。
B4.根据解决方案B2所述的方法,其中所述第二视频数据单元的所述时域层索引小于所述第一视频数据单元的所述时域层索引。
B5.根据解决方案B2所述的方法,其中所述第二视频数据单元的所述时域层索引等于所述第一视频数据单元的所述时域层索引。
B6.根据解决方案B2所述的方法,其中所述第二视频数据单元的所述时域层索引大于所述第一视频数据单元的所述时域层索引。
B7.根据解决方案B1所述的方法,其中基于所述编解码模式的一个或多个自适应参数集(APS)来确定所述边信息。
B8.根据解决方案B7所述的方法,其中所述一个或多个APS与小于或等于阈值的所述时域层索引相关联。
B9.根据解决方案B7所述的方法,其中所述一个或多个APS与大于阈值的所述时域层索引相关联。
B10.根据解决方案B7所述的方法,其中所述一个或多个APS与大于或等于阈值的所述时域层索引相关联。
B11.根据解决方案B7所述的方法,其中所述一个或多个APS与等于阈值的所述时域层索引相关联。
B12.根据解决方案B8至B11中任一项所述的方法,其中所述阈值是所述第一视频数据单元的所述时域层索引。
B13.一种视频处理方法,包括:为包括一个或多个视频数据单元的视频和所述视频的比特流表示之间的转换配置所述比特流表示,所述比特流表示包括信令通知时域层信息的语法元素、以及适用于所述一个或多个视频数据单元的视频块的编解码模式的参数;以及基于所述配置执行所述转换,其中所述编解码模式包括基于原始域和整形域和/或色度视频块的色度残差的取决于亮度的缩放,构造所述视频块。
B14.一种视频处理方法,包括:为包括一个或多个视频数据单元的视频和所述视频的比特流表示之间的转换解析所述比特流表示,所述比特流表示包括信令通知时域层信息的语法元素、以及适用于所述一个或多个视频数据单元的视频块的编解码模式的参数;以及基于所述配置执行所述转换,其中所述编解码模式包括基于原始域和整形域和/或色度视频块的色度残差的取决于亮度的缩放,构造所述视频块。
B15.根据解决方案B13或B14所述的方法,其中,所述时域层信息包括基于时域层索引信令通知的值,在与以所述取决于亮度的方式缩放的所述色度残差相关联的数据(lmcs_data())中信令通知所述时域层索引。
B16.根据解决方案B15所述的方法,其中所述信令通知的值是所述时域层索引。
B17.根据解决方案B15所述的方法,其中所述信令通知的值是所述时域层索引减1。
B18.根据解决方案B1或B13或B14所述的方法,其中执行所述转换还基于在所述比特流表示中信令通知的一条信息。
B19.根据解决方案B1或B13或B14所述的方法,其中执行所述转换还基于从在所述比特流表示中信令通知的信息中推断出的一条信息。
B20.根据解决方案B1至B19中任一项所述的方法,其中所述编解码模式是亮度映射与色度缩放(LMCS)模式,并且所述APS是LMCS APS。
B21.根据解决方案B1至B20中任一项所述的方法,其中所述转换从所述比特流表示生成所述当前块。
B22.根据解决方案B1至B20中任一项所述的方法,其中所述转换从所述当前块生成所述比特流表示。
B23.一种视频系统中的装置,其包括处理器和其上具有指令的非暂时性存储器,其中,在所述处理器执行所述指令时,所述指令使所述处理器实现解决方案B1至B22中任一项所述的方法。
B24.一种存储在非暂时性计算机可读介质上的计算机程序产品,所述计算机程序产品包括用于实现解决方案B1至B22中任一项所述的方法的程序代码。
在一些实施例中,可以实现以下技术解决方案:
C1.一种视频处理方法,包括:执行视频的第一视频数据单元和所述视频的比特流表示之间的转换,其中,编解码模式适用于所述第一视频数据单元的视频块,其中,所述编解码模式包括:基于与所述编解码模式相关的边信息,基于使用自适应环路滤波器(ALF)系数的滤波处理来构造所述视频的当前块,并且其中,根据基于时域层索引的规则来确定所述边信息。
C2.根据解决方案C1所述的方法,其中基于所述视频的所述第二视频数据单元的所述编解码模式的边信息来确定所述边信息。
C3.根据解决方案C2所述的方法,其中所述第二视频数据单元的所述时域层索引小于或等于所述第一视频数据单元的所述时域层索引。
C4.根据解决方案C2所述的方法,其中所述第二视频数据单元的所述时域层索引小于所述第一视频数据单元的所述时域层索引。
C5.根据解决方案C2所述的方法,其中所述第二视频数据单元的所述时域层索引等于所述第一视频数据单元的所述时域层索引。
C6.根据解决方案C2所述的方法,其中所述第二视频数据单元的所述时域层索引大于所述第一视频数据单元的所述时域层索引。
C7.根据解决方案C1所述的方法,其中基于所述编解码模式的一个或多个自适应参数集(APS)来确定所述边信息。
C8.根据解决方案C7所述的方法,其中所述一个或多个APS与小于或等于阈值的所述时域层索引相关联。
C9.根据解决方案C7所述的方法,其中所述一个或多个APS与大于阈值的所述时域层索引相关联。
C10.根据解决方案C7所述的方法,其中所述一个或多个APS与大于或等于阈值的所述时域层索引相关联。
C11.根据解决方案C7所述的方法,其中所述一个或多个APS与等于阈值的所述时域层索引相关联。
C12.根据解决方案C8至C11中任一项所述的方法,其中所述阈值是所述第一视频数据单元的所述时域层索引。
C13.一种视频处理方法,包括:为包括一个或多个视频数据单元的视频和所述视频的比特流表示之间的转换配置所述比特流表示,所述比特流表示包括信令通知时域层信息的语法元素、以及适用于所述一个或多个视频数据单元的视频块的编解码模式的参数;以及基于所述配置执行所述转换,其中所述编解码模式包括基于使用自适应环路滤波器(ALF)系数的滤波处理来构造所述视频的当前块。
C14.一种视频处理方法,包括:为包括一个或多个视频数据单元的视频和所述视频的比特流表示之间的转换解析所述比特流表示,所述比特流表示包括信令通知时域层信息的语法元素、以及适用于所述一个或多个视频数据单元的视频块的编解码模式的参数;以及基于所述配置执行所述转换,其中所述编解码模式包括基于使用自适应环路滤波器(ALF)系数的滤波处理来构造所述视频的当前块。
C15.根据解决方案C13或C14所述的方法,其中,所述时域层信息包括基于时域层索引信令通知的值,在与所述编解码模式相关联的数据(alf_data())中信令通知所述时域层索引。
C16.根据解决方案C15所述的方法,其中所述信令通知的值是所述时域层索引。
C17.根据解决方案C15所述的方法,其中所述信令通知的值是所述时域层索引减1。
C18.根据解决方案C1或C13或C14所述的方法,其中执行所述转换还基于在所述比特流表示中信令通知的一条信息。
C19.根据解决方案C1或C13或C14所述的方法,其中执行所述转换还基于从在所述比特流表示中信令通知的信息中推断出的一条信息。
C20.根据解决方案C1至C19中任一项所述的方法,其中所述编解码模式是自适应环路滤波(ALF)模式,并且所述APS是ALF APS。
C21.根据解决方案C1至C20中任一项所述的方法,其中所述转换从所述比特流表示生成所述当前块。
C22.根据解决方案C1至C20中任一项所述的方法,其中所述转换从所述当前块生成所述比特流表示。
C23.一种视频系统中的装置,其包括处理器和其上具有指令的非暂时性存储器,其中,在所述处理器执行所述指令时,所述指令使所述处理器实现解决方案C1至C22中任一项所述的方法。
C24.一种存储在非暂时性计算机可读介质上的计算机程序产品,所述计算机程序产品包括用于实现解决方案C1至C22中任一项所述的方法的程序代码。
所公开技术的一些实施例包括:作出启用视频处理工具或模式的决策或确定。在一个示例中,当视频处理工具或模式被启用时,编解码器将在视频块的处理中使用或实现该工具或模式,但不一定基于该工具或模式的使用来修改产生的比特流。也就是说,当基于决策或确定启用视频处理工具或模式时,从视频块到视频的比特流表示的转换将使用该视频处理工具或模式。在另一示例中,当视频处理工具或模式被启用时,解码器将在知晓已经基于视频处理工具或模式修改了比特流的情况下处理比特流。也就是说,将使用基于决策或确定而启用的视频处理工具或模式来执行从视频的比特流表示到视频块的转换。
所公开技术的一些实施例包括:作出禁用视频处理工具或模式的决策或确定。在一个示例中,当视频处理工具或模式被禁用时,编解码器将不在将视频块转换到视频的比特流表示的转换中使用该工具或模式。在另一示例中,当视频处理工具或模式被禁用时,解码器将在知晓未使用基于所述决策或确定而启用的视频处理工具或模式修改比特流的情况下来处理比特流。
在本文中,术语“视频处理”可指视频编码、视频解码、视频转码、视频压缩或视频解压缩。例如,可以在从视频的像素表示到对应的比特流表示的转换期间应用视频压缩算法,反之亦然。例如,当前视频块的比特流表示可以对应于由语法定义的比特流中的并置位置或在不同位置传播的比特。例如,可以根据经过转换和编码的误差残差来编码宏块,并且也可以使用比特流中的标头和其他字段中的比特来编码宏块。此外,在转换期间,如上述解决方案中描述的,解码器可以在知道某些字段可能存在或不存在的情况下,基于所述确定来解析比特流。类似地,编解码器可以通过在编码表示中包括或不包括语法字段来确定是否包括某些语法字段,并对应地生成编码表示(比特流表示)。
从上述来看,应当理解的是,为了便于说明,本发明公开的技术的具体实施例已经在本文中进行了描述,但是可以在不偏离本发明范围的情况下进行各种修改。因此,除了的之外,本发明公开的技术不限于权利要求的限定。
本专利文件中描述的主题的实现和功能操作可以在各种系统、数字电子电路、或计算机软件、固件或硬件中实现,包括本说明书中所公开的结构及其结构等效体,或其中一个或多个的组合。本说明说中描述的主题的实现可以实现为一个或多个计算机程序产品,即一个或多个编码在有形的且非易失的计算机可读介质上的计算机程序指令的模块,以供数据处理装置执行或控制数据处理装置的操作。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储设备、影响机器可读传播信号的物质组成或其中一个或其中多个的组合。术语“数据处理单元”或“数据处理装置”包括用于处理数据的所有装置、设备和机器,包括例如可编程处理器、计算机或多处理器或计算机组。除硬件外,该装置还可以包括为计算机程序创建执行环境的代码,例如,构成处理器固件的代码、协议栈、数据库管理系统、操作系统或其中一个或多个的组合。
计算机程序(也称为程序、软件、软件应用、脚本或代码)可以用任何形式的编程语言(包括编译语言或解释语言)编写,并且可以以任何形式部署,包括作为独立程序或作为模块、组件、子程序或其他适合在计算环境中使用的单元。计算机程序不一定与文件系统中的文件对应。程序可以存储在保存其他程序或数据的文件的部分中(例如,存储在标记语言文档中的一个或多个脚本)、专用于该程序的单个文件中、或多个协调文件(例如,存储一个或多个模块、子程序或部分代码的文件)中。计算机程序可以部署在一台或多台计算机上来执行,这些计算机位于一个站点上或分布在多个站点上,并通过通信网络互连。
本说明书中描述的处理和逻辑流可以通过一个或多个可编程处理器执行,该处理器执行一个或多个计算机程序,通过在输入数据上操作并生成输出来执行功能。处理和逻辑流也可以通过特殊用途的逻辑电路来执行,并且装置也可以实现为特殊用途的逻辑电路,例如,FPGA(现场可编程门阵列)或ASIC(专用集成电路)。
例如,适于执行计算机程序的处理器包括通用和专用微处理器,以及任何类型数字计算机的任何一个或多个。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是执行指令的处理器和存储指令和数据的一个或多个存储设备。通常,计算机还将包括一个或多个用于存储数据的大容量存储设备,例如,磁盘、磁光盘或光盘,或通过操作耦合到一个或多个大容量存储设备来从其接收数据或将数据传输到一个或多个大容量存储设备,或两者兼有。然而,计算机不一定具有这样的设备。适用于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括例如半导体存储器设备,例如EPROM、EEPROM和闪存设备。处理器和存储器可以由专用逻辑电路来补充,或合并到专用逻辑电路中。
虽然本专利文件包含许多细节,但不应将其解释为对任何发明或权利要求范围的限制,而应解释为对特定发明的特定实施例的特征的描述。本专利文件在单独实施例的上下文描述的某些特征也可以在单个实施例中组合实施。相反,在单个实施例的上下文中描述的各种功能也可以在多个实施例中单独实施,或在任何合适的子组合中实施。此外,尽管上述特征可以描述为在某些组合中起作用,甚至最初要求是这样,但在某些情况下,可以从组合中移除权利要求组合中的一个或多个特征,并且权利要求的组合可以指向子组合或子组合的变体。
同样,尽管图纸中以特定顺序描述了操作,但这不应理解为要获得想要的结果必须按照所示的特定顺序或顺序执行此类操作,或执行所有说明的操作。此外,本专利文件所述实施例中各种系统组件的分离不应理解为在所有实施例中都需要这样的分离。
仅描述了一些实现和示例,其他实现、增强和变体可以基于本专利文件中描述和说明的内容做出。

Claims (19)

1.一种视频处理方法,包括:
执行包括一个或多个视频数据单元的视频和所述视频的比特流表示之间的转换,
其中,所述比特流表示符合格式规则,所述格式规则指定包含指示用于编解码模式的默认参数的边信息,所述编解码模式适用于对其启用所述编解码模式的所述一个或多个视频数据单元的视频块,并且
其中,所述边信息提供参数,用于基于所述视频块在原始域和整形域中的表示和/或色度视频块的色度残差的取决于亮度的缩放,构造所述视频块。
2.根据权利要求1所述的方法,其中在确定所述比特流表示包括设置为1的所述色度残差的所述取决于亮度的缩放的指示(sps_lmcs_enabled_flag)时,所述比特流表示还包括设置为1的使用默认模型的指示(sps_lmcs_default_model_present_flag)。
3.根据权利要求1所述的方法,其中所述比特流表示中的自适应参数集(APS)不包括与所述编解码模式相关联的参数,并且其中,使用所述默认参数将所述编解码模式应用于所述视频块数据。
4.根据权利要求3所述的方法,其中所述一个或多个视频数据单元包括片组,并且其中,所述比特流表示还包括设置为1的使用所述片组的默认模型的指示(tile_group_lmcs_use_default_model_flag)。
5.根据权利要求1所述的方法,其中所述比特流表示还包括包含所述默认参数的序列参数集(SPS)。
6.根据权利要求5所述的方法,其中所述比特流表示还包括所述SPS中指示所述编解码模式被启用的标志。
7.根据权利要求1所述的方法,其中所述比特流表示还包括序列参数集(SPS),所述SPS包括用于所述编解码模式的至少一个自适应参数集(APS)。
8.根据权利要求7所述的方法,其中所述至少一个APS包括所述默认参数。
9.根据权利要求1所述的方法,其中使用所述比特流表示中的一个标志来信令通知为所述编解码模式启用所述默认参数的指示。
10.根据权利要求1所述的方法,其中在确定所述比特流表示包括所述色度残差的所述取决于亮度的缩放的指示(sps_lmcs_enabled_flag)时,所述比特流表示包括所述默认参数。
11.一种视频编解码方法,包括:
执行包括一个或多个视频数据单元的视频和所述视频的比特流表示之间的转换,
其中所述比特流表示符合格式规则,所述格式规则指定包含指示用于编解码模式的默认参数的边信息,所述编解码模式适用于对其启用所述编解码模式的所述一个或多个视频数据单元的视频块,
其中,在所述比特流表示中不存在显式地信令通知的参数的情况下将所述默认参数用于所述编解码模式,并且
其中,所述编解码模式包括基于所述视频块在原始域和整形域中的表示和/或色度视频块的色度残差的取决于亮度的缩放,构造所述视频块。
12.根据权利要求11所述的方法,其中所述边信息包括对所述默认参数的预定值的索引。
13.根据权利要求12所述的方法,其中所述默认参数的所述预定值对应于标识映射。
14.根据权利要求11所述的方法,其中所述边信息包括所述默认参数。
15.根据权利要求1至14中任一项所述的方法,其中所述编解码模式是环内整形(ILR)模式。
16.根据权利要求1至15中任一项所述的方法,其中所述转换从所述比特流表示生成所述一个或多个视频数据单元中的至少一个。
17.根据权利要求1至15中任一项所述的方法,其中所述转换从所述一个或多个视频数据单元中的至少一个生成所述比特流表示。
18.一种视频系统中的装置,其包括处理器和其上具有指令的非暂时性存储器,其中,在所述处理器执行所述指令时,所述指令使所述处理器实现权利要求1至17中任一项所述的方法。
19.一种存储在非暂时性计算机可读介质上的计算机程序产品,所述计算机程序产品包括用于实现权利要求1至17中任一项所述的方法的程序代码。
CN202080023706.3A 2019-03-23 2020-03-23 默认的环内整形参数 Active CN113632462B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CNPCT/CN2019/079393 2019-03-23
CN2019079393 2019-03-23
PCT/CN2020/080598 WO2020192612A1 (en) 2019-03-23 2020-03-23 Default in-loop reshaping parameters

Publications (2)

Publication Number Publication Date
CN113632462A true CN113632462A (zh) 2021-11-09
CN113632462B CN113632462B (zh) 2023-08-22

Family

ID=72610961

Family Applications (3)

Application Number Title Priority Date Filing Date
CN202080023707.8A Active CN113632469B (zh) 2019-03-23 2020-03-23 默认的环内整形参数
CN202080023784.3A Active CN113632476B (zh) 2019-03-23 2020-03-23 默认的环内整形参数
CN202080023706.3A Active CN113632462B (zh) 2019-03-23 2020-03-23 默认的环内整形参数

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CN202080023707.8A Active CN113632469B (zh) 2019-03-23 2020-03-23 默认的环内整形参数
CN202080023784.3A Active CN113632476B (zh) 2019-03-23 2020-03-23 默认的环内整形参数

Country Status (6)

Country Link
US (2) US11375188B2 (zh)
EP (1) EP3925216A4 (zh)
JP (2) JP7417624B2 (zh)
KR (1) KR20210139272A (zh)
CN (3) CN113632469B (zh)
WO (3) WO2020192614A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020117013A1 (ko) * 2018-12-06 2020-06-11 엘지전자 주식회사 인터 예측을 기반으로 비디오 신호를 처리하기 위한 방법 및 장치
MX2021008911A (es) 2019-02-01 2021-08-24 Beijing Bytedance Network Tech Co Ltd Se?alizacion de informacion de reformacion en bucle utilizando conjuntos de parametros.
CN113574889B (zh) 2019-03-14 2024-01-12 北京字节跳动网络技术有限公司 环路整形信息的信令和语法
US11638019B2 (en) * 2020-07-29 2023-04-25 Alibaba Group Holding Limited Methods and systems for prediction from multiple cross-components
WO2023113224A1 (ko) * 2021-12-17 2023-06-22 현대자동차주식회사 매핑 기반 비디오 코딩에서 인루프 필터링

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010025613A1 (zh) * 2008-09-08 2010-03-11 中兴通讯股份有限公司 一种自适应编码调制方法
WO2012142966A1 (en) * 2011-04-21 2012-10-26 Mediatek Inc. Method and apparatus for improved in-loop filtering
US20150003518A1 (en) * 2013-06-28 2015-01-01 Research In Motion Limited Methods and devices for emulating low-fidelity coding in a high-fidelity coder
CN105359521A (zh) * 2013-06-28 2016-02-24 黑莓有限公司 用于对高保真编码器中的低保真编码进行仿真的方法和设备
CN106464892A (zh) * 2014-05-28 2017-02-22 皇家飞利浦有限公司 用于对hdr图像进行编码的方法和装置以及用于使用这样的编码图像的方法和装置
WO2017053432A1 (en) * 2015-09-21 2017-03-30 Vid Scale, Inc. Inverse reshaping for high dynamic range video coding
US20170105014A1 (en) * 2015-10-08 2017-04-13 Qualcomm Incorporated Luma-driven chroma scaling for high dynamic range and wide color gamut contents

Family Cites Families (82)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5544284A (en) 1992-02-11 1996-08-06 Eastman Kodak Company Sequential product code quantization of digital color image
US20020145610A1 (en) 1999-07-16 2002-10-10 Steve Barilovits Video processing engine overlay filter scaler
US7412003B2 (en) 2003-09-17 2008-08-12 Texas Instruments Incorporated Transcoders and methods
EP2508000A1 (en) 2009-12-04 2012-10-10 Thomson Licensing Methods and apparatus for improved chroma transforms for inter frames in video encoding and decoding
WO2011126272A2 (en) 2010-04-05 2011-10-13 Samsung Electronics Co., Ltd. Method and apparatus for encoding video by using dynamic-range transformation, and method and apparatus for decoding video by using dynamic-range transformation
US9094658B2 (en) * 2010-05-10 2015-07-28 Mediatek Inc. Method and apparatus of adaptive loop filtering
US8630356B2 (en) * 2011-01-04 2014-01-14 The Chinese University Of Hong Kong High performance loop filters in video compression
US9277228B2 (en) 2011-07-18 2016-03-01 Qualcomm Incorporated Adaptation parameter sets for video coding
US9948938B2 (en) 2011-07-21 2018-04-17 Texas Instruments Incorporated Methods and systems for chroma residual data prediction
US9083983B2 (en) 2011-10-04 2015-07-14 Qualcomm Incorporated Motion vector predictor candidate clipping removal for video coding
KR20130053645A (ko) * 2011-11-15 2013-05-24 한국전자통신연구원 적응적 루프 필터를 이용한 비디오 부호화/복호화 방법 및 장치
US9451252B2 (en) * 2012-01-14 2016-09-20 Qualcomm Incorporated Coding parameter sets and NAL unit headers for video coding
JP5947405B2 (ja) 2012-02-01 2016-07-06 ノキア テクノロジーズ オーユー ビデオ符号化方法および装置
US8873872B1 (en) 2012-04-18 2014-10-28 Matrox Graphics Inc. Division of entropy coding in codecs
EP2904803A1 (en) * 2012-10-01 2015-08-12 GE Video Compression, LLC Scalable video coding using derivation of subblock subdivision for prediction from base layer
EP2918078A4 (en) * 2012-11-08 2016-10-19 Canon Kk METHOD, APPARATUS AND SYSTEM FOR ENCODING AND DECODING TRANSFORMER UNITS OF AN ENCODER UNIT
US9491460B2 (en) 2013-03-29 2016-11-08 Qualcomm Incorporated Bandwidth reduction for video coding prediction
US9894357B2 (en) * 2013-07-30 2018-02-13 Kt Corporation Image encoding and decoding method supporting plurality of layers and apparatus using same
JP2017501599A (ja) 2013-10-07 2017-01-12 ヴィド スケール インコーポレイテッド マルチレイヤビデオコーディングのコンバインドスケーラビリティ処理
WO2015060295A1 (ja) * 2013-10-22 2015-04-30 シャープ株式会社 画像復号装置、及び画像復号方法
US10397607B2 (en) 2013-11-01 2019-08-27 Qualcomm Incorporated Color residual prediction for video coding
US10148895B2 (en) 2013-12-19 2018-12-04 Flir Systems Ab Generating a combined infrared/visible light image having an enhanced transition between different types of image information
TWI536811B (zh) 2013-12-27 2016-06-01 財團法人工業技術研究院 影像處理方法與系統、解碼方法、編碼器與解碼器
WO2015100522A1 (en) 2013-12-30 2015-07-09 Mediatek Singapore Pte. Ltd. Methods for inter-component residual prediction
US9948933B2 (en) 2014-03-14 2018-04-17 Qualcomm Incorporated Block adaptive color-space conversion coding
KR102494913B1 (ko) 2014-03-14 2023-02-06 브이아이디 스케일, 인크. 스크린 콘텐츠 코딩을 위한 팔레트 코딩
US9948949B2 (en) 2014-06-20 2018-04-17 Qualcomm Incorporated Intra block copy block vector signaling for video coding
US9667829B2 (en) 2014-08-12 2017-05-30 Digimarc Corporation System and methods for encoding information for printed articles
WO2016057323A1 (en) 2014-10-06 2016-04-14 Huawei Technologies Co., Ltd. Improved palette mode in high efficiency video coding (hevc) screen content coding (scc)
GB2531005A (en) 2014-10-06 2016-04-13 Canon Kk Improved encoding process using a palette mode
CN104320671A (zh) 2014-11-13 2015-01-28 山东财经大学 一种基于h.264标准的在线视频转码方法
WO2016100424A1 (en) 2014-12-19 2016-06-23 Mediatek Inc. Methods of palette based prediction for non-444 color format in video and image coding
US20170374384A1 (en) 2015-01-14 2017-12-28 Vid Scale, Inc. Palette coding for non-4:4:4 screen content video
US9591325B2 (en) 2015-01-27 2017-03-07 Microsoft Technology Licensing, Llc Special case handling for merged chroma blocks in intra block copy prediction mode
US9998742B2 (en) * 2015-01-27 2018-06-12 Qualcomm Incorporated Adaptive cross component residual prediction
US10057574B2 (en) * 2015-02-11 2018-08-21 Qualcomm Incorporated Coding tree unit (CTU) level adaptive loop filter (ALF)
CN107439012B (zh) * 2015-04-06 2018-09-25 杜比实验室特许公司 用于环内转换的方法、装置和计算机可读存储介质
EP3298785A4 (en) 2015-06-03 2019-02-13 MediaTek Inc. METHOD AND APPARATUS FOR RESOURCE SHARING BETWEEN INTRA BLOCK COPY MODE AND INTER-PREDICTION MODE IN VIDEO CODING SYSTEMS
GB2539211A (en) 2015-06-08 2016-12-14 Canon Kk Enhanced coding and decoding using intra block copy mode
TWI764870B (zh) 2015-07-28 2022-05-21 法商內數位麥德遜專利控股有限公司 視訊訊號處理裝置及方法
KR20180058224A (ko) 2015-10-22 2018-05-31 엘지전자 주식회사 영상 코딩 시스템에서 모델링 기반 영상 디코딩 방법 및 장치
CN106937121B (zh) 2015-12-31 2021-12-10 中兴通讯股份有限公司 图像解码和编码方法、解码和编码装置、解码器及编码器
CN108605143A (zh) * 2016-02-04 2018-09-28 联发科技股份有限公司 视频编码中的非局部自适应环内滤波器的方法和装置
US11032550B2 (en) 2016-02-25 2021-06-08 Mediatek Inc. Method and apparatus of video coding
CN108885783B (zh) 2016-03-23 2022-02-15 杜比实验室特许公司 编码和解码可逆制作质量单层视频信号
US10397586B2 (en) * 2016-03-30 2019-08-27 Dolby Laboratories Licensing Corporation Chroma reshaping
US20170310969A1 (en) 2016-04-20 2017-10-26 Mediatek Inc. Image encoding method and apparatus with color space transform performed upon predictor and associated image decoding method and apparatus
EP3244616A1 (en) 2016-05-13 2017-11-15 Thomson Licensing A method for encoding an input video comprising a luma component and two chroma components, the method comprising reshaping of said input video based on reshaping functions
JP6846442B2 (ja) 2016-05-19 2021-03-24 ドルビー ラボラトリーズ ライセンシング コーポレイション ハイダイナミックレンジ画像のためのクロマ再構成
EP3459248A1 (en) 2016-05-19 2019-03-27 Dolby Laboratories Licensing Corporation Chroma reshaping for high dynamic range images
ES2935261T3 (es) 2016-05-28 2023-03-03 Hfi Innovation Inc Método y aparato de codificación de modo de paleta para datos de video de color
CN113452999B (zh) * 2016-07-22 2023-12-05 夏普株式会社 使用自适应分量缩放对视频数据进行编码的系统和方法
WO2018044803A1 (en) * 2016-08-30 2018-03-08 Dolby Laboratories Licensing Corporation Real-time reshaping of single-layer backwards-compatible codec
EP3510772B1 (en) 2016-09-09 2020-12-09 Dolby Laboratories Licensing Corporation Coding of high dynamic range video using segment-based reshaping
US10652575B2 (en) 2016-09-15 2020-05-12 Qualcomm Incorporated Linear model chroma intra prediction for video coding
JP6798015B2 (ja) 2016-09-30 2020-12-09 エルジー エレクトロニクス インコーポレイティド 画像コーディングシステムにおけるブロック分割及びイントラ予測方法並びに装置
EP3529986A1 (en) 2016-12-23 2019-08-28 Huawei Technologies Co., Ltd. Low complexity mixed domain collaborative in-loop filter for lossy video coding
US10506230B2 (en) * 2017-01-04 2019-12-10 Qualcomm Incorporated Modified adaptive loop filter temporal prediction for temporal scalability support
US11025903B2 (en) 2017-01-13 2021-06-01 Qualcomm Incorporated Coding video data using derived chroma mode
US10694181B2 (en) 2017-01-27 2020-06-23 Qualcomm Incorporated Bilateral filters in video coding with reduced complexity
US10735761B2 (en) 2017-05-19 2020-08-04 Mediatek Inc Method and apparatus of video coding
US10602180B2 (en) 2017-06-13 2020-03-24 Qualcomm Incorporated Motion vector prediction
EP4064701A1 (en) * 2017-06-29 2022-09-28 Dolby Laboratories Licensing Corporation Integrated image reshaping and video decoding
US10757442B2 (en) 2017-07-05 2020-08-25 Qualcomm Incorporated Partial reconstruction based template matching for motion vector derivation
CN107360433B (zh) 2017-07-20 2020-06-19 北京奇艺世纪科技有限公司 一种帧间预测编码方法和装置
US20200322606A1 (en) 2017-10-24 2020-10-08 Sharp Kabushiki Kaisha Systems and methods for determining quantization parameter predictive values
US10986349B2 (en) 2017-12-29 2021-04-20 Microsoft Technology Licensing, Llc Constraints on locations of reference blocks for intra block copy prediction
KR102487032B1 (ko) 2018-02-14 2023-01-11 돌비 레버러토리즈 라이쎈싱 코오포레이션 레이트 왜곡 최적화를 이용한 비디오 코딩에서의 이미지 재성형
US10757428B2 (en) 2018-10-10 2020-08-25 Apple Inc. Luma and chroma reshaping of HDR video encoding
WO2020086421A1 (en) 2018-10-25 2020-04-30 Interdigital Vc Holdings, Inc. Video encoding and decoding using block-based in-loop reshaping
CN114189694B (zh) 2018-11-07 2022-11-08 华为技术有限公司 用于视频译码的参数集
US11122264B2 (en) * 2018-12-06 2021-09-14 Qualcomm Incorporated Adaptive loop filter (ALF) coefficients in video coding
WO2020142186A1 (en) 2019-01-04 2020-07-09 Interdigital Vc Holdings, Inc. Inverse mapping simplification
MX2021008911A (es) 2019-02-01 2021-08-24 Beijing Bytedance Network Tech Co Ltd Se?alizacion de informacion de reformacion en bucle utilizando conjuntos de parametros.
WO2020156528A1 (en) 2019-02-01 2020-08-06 Beijing Bytedance Network Technology Co., Ltd. Filtering processes based on in-loop reshaping
CN113545064B (zh) 2019-03-04 2024-05-10 阿里巴巴集团控股有限公司 用于处理视频内容的方法和装置及计算机可读存储介质
US10742972B1 (en) 2019-03-08 2020-08-11 Tencent America LLC Merge list construction in triangular prediction
CN113574889B (zh) 2019-03-14 2024-01-12 北京字节跳动网络技术有限公司 环路整形信息的信令和语法
US11388406B2 (en) 2019-05-20 2022-07-12 Dolby Laboratories Licensing Corporation Piece-wise-linear mapping for in-loop reshaping in image coding
US11509938B2 (en) 2019-11-05 2022-11-22 Hfi Innovation Inc. Method and apparatus of signaling subpicture information in video coding
US20210168406A1 (en) 2019-11-29 2021-06-03 Tencent America LLC Signaling of video coding tools supporting various chroma formats
US11303914B2 (en) 2020-01-08 2022-04-12 Tencent America LLC Method and apparatus for video coding

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010025613A1 (zh) * 2008-09-08 2010-03-11 中兴通讯股份有限公司 一种自适应编码调制方法
WO2012142966A1 (en) * 2011-04-21 2012-10-26 Mediatek Inc. Method and apparatus for improved in-loop filtering
US20150003518A1 (en) * 2013-06-28 2015-01-01 Research In Motion Limited Methods and devices for emulating low-fidelity coding in a high-fidelity coder
CN105359521A (zh) * 2013-06-28 2016-02-24 黑莓有限公司 用于对高保真编码器中的低保真编码进行仿真的方法和设备
CN106464892A (zh) * 2014-05-28 2017-02-22 皇家飞利浦有限公司 用于对hdr图像进行编码的方法和装置以及用于使用这样的编码图像的方法和装置
WO2017053432A1 (en) * 2015-09-21 2017-03-30 Vid Scale, Inc. Inverse reshaping for high dynamic range video coding
US20170105014A1 (en) * 2015-10-08 2017-04-13 Qualcomm Incorporated Luma-driven chroma scaling for high dynamic range and wide color gamut contents

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
K. MISRA: "Non-CE4: On clipping of scaled motion vectors", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 13TH MEETING: MARRAKECH, MA, 9–18 JAN. 2019 *
WADE WAN: ""AHG17: Design for signallilng reshaper model"", 《JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 14TH MEETING: GENEVA, CH, 19–27 MARCH 2019,JVET-N0805》 *
WADE WAN: ""AHG17: Design for signallilng reshaper model"", 《JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 14TH MEETING: GENEVA, CH, 19–27 MARCH 2019,JVET-N0805》, 21 March 2019 (2019-03-21), pages 1 - 2 *

Also Published As

Publication number Publication date
JP7417624B2 (ja) 2024-01-18
CN113632476A (zh) 2021-11-09
EP3925216A1 (en) 2021-12-22
WO2020192614A1 (en) 2020-10-01
JP2024038245A (ja) 2024-03-19
CN113632462B (zh) 2023-08-22
US20220279178A1 (en) 2022-09-01
CN113632476B (zh) 2024-03-19
WO2020192612A1 (en) 2020-10-01
CN113632469A (zh) 2021-11-09
CN113632469B (zh) 2022-12-13
US20220103815A1 (en) 2022-03-31
JP2022525226A (ja) 2022-05-11
WO2020192613A1 (en) 2020-10-01
EP3925216A4 (en) 2022-06-15
KR20210139272A (ko) 2021-11-22
US11375188B2 (en) 2022-06-28

Similar Documents

Publication Publication Date Title
WO2020156535A1 (en) Interactions between in-loop reshaping and block differential pulse coded modulation
AU2020214946B2 (en) Interactions between in-loop reshaping and inter coding tools
AU2020235190B2 (en) Constraints on model-based reshaping in video processing
CN113574889A (zh) 环路整形信息的信令和语法
CN113632469B (zh) 默认的环内整形参数
CN113519157A (zh) 视频处理中滤波信息的两级信令
CN113366839A (zh) 视频编解码中的细化量化步骤

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant