CN114556953A - 视频编解码中非矩形分割的使用 - Google Patents

视频编解码中非矩形分割的使用 Download PDF

Info

Publication number
CN114556953A
CN114556953A CN202080071243.8A CN202080071243A CN114556953A CN 114556953 A CN114556953 A CN 114556953A CN 202080071243 A CN202080071243 A CN 202080071243A CN 114556953 A CN114556953 A CN 114556953A
Authority
CN
China
Prior art keywords
mode
block
video
prediction
codec
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080071243.8A
Other languages
English (en)
Inventor
邓智玭
张莉
刘鸿彬
张凯
许继征
王悦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Original Assignee
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd, ByteDance Inc filed Critical Beijing ByteDance Network Technology Co Ltd
Publication of CN114556953A publication Critical patent/CN114556953A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

描述了一种视频处理的方法。该方法包括根据规则执行在视频的当前视频块和视频的比特流表示之间的转换,其中,分割预测模式用于对当前视频块进行编解码,其中将当前视频的最终预测确定为当前视频块的两个或更多个预测的加权和;其中,分割预测模式是基于多个第一分割方案的第一模式或基于多个第二分割方案的第二模式;并且其中,该规则指定用于使用第一模式或第二模式编解码的编解码操作。

Description

视频编解码中非矩形分割的使用
相关申请的交叉引用
根据适用的专利法和/或依据巴黎公约的规则,本申请及时要求于2019年10月10日提交的国际专利申请第PCT/CN2019/110490号的优先权和权益。出于根据法律的所有目的,上述申请的全部公开内容通过引用并入作为本申请的公开内容的一部分。
技术领域
本专利文档涉及视频编码和解码。
背景技术
尽管视频压缩取得了进步,但是数字视频仍在互联网和其他数字通信网络上占用最大的带宽。随着能够接收和显示视频的已连接用户设备的数量增加,预期对数字视频使用的带宽需求将继续增长。
发明内容
在与数字视频编解码、特别是与视频和图像编码和解码有关的设备、系统和方法中,帧间预测与视频块的三角形或任意几何分割一起使用。
在一个示例方面,公开了一种视频处理的方法。该方法包括根据规则执行在视频的当前视频块和视频的比特流表示之间的转换,其中,分割预测模式用于对当前视频块进行编解码,其中将当前视频的最终预测确定为当前视频块的两个或更多个预测的加权和;其中,分割预测模式是基于多个第一分割方案的第一模式或基于多个第二分割方案的第二模式;并且其中,该规则指定用于使用第一模式或第二模式进行编解码的编解码操作。
在另一示例方面,公开了另一种视频处理的方法。该方法包括执行在视频的当前视频块和视频的比特流表示之间的转换,其中,在转换期间,将当前视频块的预测确定为当前视频块的两个或更多个预测的加权和,并且根据规则确定当前视频块的运动矢量存储过程,其中当前视频块使用分割预测模式,该分割预测模式是基于多个第一分割方案的第一模式,或者是基于多个第二分割方案的第二模式,并且其中该规则指定对于第一模式或第二模式的用于确定存储哪个运动矢量和多少个运动矢量的过程是相同的。
在一个示例方面,公开了一种视频处理的方法。该方法包括执行在视频的当前块和视频的比特流表示之间的转换,其中,在转换期间,使用4x4单元的运动信息来确定用于当前块的预测块,并且其中使用分割模式编解码当前块。
在一个示例方面,公开了一种视频处理的方法。该方法包括执行在视频的当前块和视频的比特流表示之间的转换,其中使用分割模式对当前块进行编解码,其中,在转换期间,根据规则通过将当前视频块的混合区域中的两个或更多个预测进行混合来确定用于当前块的预测块,并且其中该规则指定针对属于当前视频块的混合区域的子块存储L0运动矢量和L1运动矢量。
在一个示例方面,公开了一种视频处理的方法。该方法包括:对于视频的当前视频块和视频的比特流表示之间的转换,根据由于使用当前视频块的分割预测模式而产生的规则,做出用于将去块过程应用于当前视频块内的边界的确定;以及根据确定执行转换,其中,使用分割预测模式包括,将当前视频块的最终预测确定为当前视频块的两个或更多个预测的加权和。
在一个示例方面,公开了一种视频处理的方法。该方法包括:对于视频的当前视频块和视频的比特流表示之间的转换,基于当前视频块的分割预测模式的类型,确定是否和/或如何将去块过程应用于当前视频块;以及根据确定执行转换,并且其中使用分割预测模式包括,将当前视频块的最终预测确定为当前视频块的两个或更多个预测的加权和。
在一个示例方面,公开了一种视频处理的方法。该方法包括:对于视频的当前视频块和视频的比特流表示之间的转换,根据与当前视频块的最大和/或最小变换尺寸无关的规则,确定帧内子分割(ISP)模式的应用性;并基于确定执行转换。
在一个示例方面,公开了一种视频处理的方法。该方法包括:对于视频的当前视频块和视频的比特流表示之间的转换,由于当前视频块的尺寸大于适用于当前视频块的最大变换尺寸,确定应用帧内子分割(ISP)模式;并基于确定执行转换。
在一个示例方面,公开了一种视频处理的方法。所述方法包括:对于视频的当前视频块和视频的比特流表示之间的转换,由于当前视频块的尺寸大于或等于128,确定将组合帧间和帧内预测(CIIP)模式或分割模式应用于当前视频块;并基于确定执行转换。
在一个示例方面,公开了一种视频处理的方法。该方法包括执行在当前视频块和视频的比特流表示之间的转换,其中,比特流表示符合格式规则,该格式规则基于当前视频块的尺寸来指定包括在比特流表示中的信息。
在一个示例方面,公开了一种视频处理的方法。该方法包括执行在当前视频块和视频的比特流表示之间的转换,其中比特流表示符合格式规则,该格式规则指定,在当前视频块的宽度和/或高度等于或大于X,其中X是整数的情况下,从比特流表示中省略指示使用帧内块复制(IBC)预测模式的语法元素。
在一个示例方面,公开了一种视频处理的方法。该方法包括:对于包括多个色彩分量的视频与视频的比特流表示之间的转换,根据规则确定在用于每个分量的去块过程中使用的去块参数偏移;以及基于确定执行转换,其中规则指定对于视频的每个分量,在图片级别和/或条带级别的去块参数偏移是不同的。
在一个示例方面,公开了一种视频处理的方法。该方法包括:对于视频的色度视频块和视频的比特流表示之间的转换,基于根据规则确定的色度量化参数(QP)来导出色度去块参数,其中色度视频块属于编解码单元和条带;并且基于色度去块参数执行转换,并且其中规则指定色度QP是基于色度视频块的图片级别色度QP偏移和编解码单元级别色度QP偏移,但与条带级别色度QP偏移无关。
在又一代表性方面,上述方法以处理器可执行代码的形式实施并存储在计算机可读程序介质中。
在又一代表性方面,公开了一种配置为或可操作为执行上述方法的设备。该设备可以包括被编程为实现该方法的处理器。
在又一代表性方面,视频解码器装置可以实现如本文中所述的方法。
在附图、说明书和权利要求书中更详细地描述了所公开技术的上述和其他方面以及特征。
附图说明
图1示出了空域Merge候选的示例位置。
图2示出了考虑空域Merge候选的冗余检验的候选对的示例。
图3是时域Merge候选的运动矢量缩放的图示。
图4示出了时域Merge候选(C0和C1)的候选位置的示例。
图5示出了基于三角形分割的帧间预测的示例。
图6示出了三角形分割模式的单向预测MV选择的示例。
图7示出了在混合过程中使用的权重的示例。
图8示出了在8×16TPM块(WD6)的混合过程中使用的权重的示例。
图9示出了用于8×16TPM预测块的示例权重设置。
图10是可以实现所公开的技术的示例视频处理系统的框图。
图11是用于视频处理的硬件平台的示例实现方式的框图。
图12是视频处理的示例方法的流程图。
图13A示出了VTM6.0中TPM设计的示例。
图13B示出了TPM设计的提议的示例。
图14示出了GEO划分边界描述的示例。
图15A示出了几何Merge模式的角度量化的32个角度方案的示例。
图15B示出了几何Merge模式的角度量化的24个角度方案的示例。
图16是图示了示例视频编解码系统的框图。
图17是图示了根据所公开技术的一些实施例的编码器的框图。
图18是图示了根据所公开技术的一些实施例的解码器的框图。
图19示出了基于所公开技术的一些实现方式的视频处理的示例方法的流程图。
图20A和20B示出了基于所公开技术的一些实现方式的视频处理的示例方法的流程图。
图21A至图21E示出了基于所公开技术的一些实现方式的视频处理的示例方法的流程图。
具体实施方式
所公开技术的实施例可以应用于现有的视频编解码标准(例如,HEVC、H.265)和未来标准以改善压缩性能。在本文档中使用节标题来提高描述的可读性,并且不以任何方式将讨论或实施例(和/或实现方式)仅限于各个节。
1.总结
本文档与视频编解码技术相关。具体地,它关于视频编解码中的帧间预测和相关技术。它可以应用于现有的视频编解码标准(例如HEVC)或要最终确定的标准(通用视频编解码)。它也可以适用于未来的视频编解码标准或视频编解码器。
2.初步讨论
视频编解码标准主要是通过众所周知的ITU-T和ISO/IEC标准的发展而得以演进。ITU-T制作了H.261和H.263,ISO/IEC制作了MPEG-1和MPEG-4Visual,并且两个组织联合制作了H.262/MPEG-2视频标准和H.264/MPEG-4高级视频编解码(AVC)标准和H.265/HEVC标准。从H.262开始,视频编解码标准基于混合视频编解码结构,其中利用时域预测加变换编解码。为了探索超越HEVC的未来视频编解码技术,VCEG和MPEG于2015年联合地成立联合视频探索小组(JVET)。此后,JVET采纳了许多新方法且将其引入到命名为联合探索模型(JEM)的参考软件中。JVET会议每季度同时举行一次,与HEVC相比,新的编解码标准旨在将比特率降低50%。新的视频编解码标准在2018年4月的JVET会议上正式命名为多功能视频编解码(VVC),并在那时发布了第一版的VVC测试模型(VTM)。由于不断努力促进VVC标准化,因此在每次JVET会议中,VVC标准都采用了新的编解码技术。每次会议后,VVC工作草案和测试模型VTM都会更新。VVC项目现在的目标是在2020年7月的会议上完成技术(FDIS)。
2.1扩展merge预测
在VTM中,通过按顺序包括以下五种类型的候选来构造Merge候选列表:
1)来自空域邻近CU的空域MVP
2)来自共位CU的时域MVP
3)来自FIFO表的基于历史的MVP
4)成对平均MVP
5)零MV。
在条带头中信令通知merge列表的尺寸,并且在VTM中merge列表的最大允许尺寸为6。对于Merge模式下的每个CU代码,使用截断的一元二进制化(TU)对最佳Merge候选的索引进行编码。Merge索引的第一二进制码(bin)使用上下文进行编解码,而旁路编解码则用于其他二进制码。
在该会话中提供了Merge候选的每个类别的生成过程。
2.1.1空域候选的导出
VVC中的空域Merge候选的导出与HEVC中的导出相同。位于图1中所示位置的候选中最多选择四个Merge候选。导出顺序为A0、B0、B1、A1和B2。仅当位置A0、B0、B1、A1的任何CU不可用(例如,因为它属于另一个条带或片)或进行帧内编解码时,才考虑位置B2。在添加位置A1处的候选之后,对剩余候选的添加经受冗余检验,以确保将具有相同运动信息的候选从列表中排除,从而提高了编解码效率。为了降低计算复杂度,在提到的冗余检验中并未考虑所有可能的候选对。而是仅考虑在图2中用箭头链接的对,并且仅在用于冗余检验的对应候选不具有相同运动信息的情况下才将候选添加到列表中。
2.1.2时域候选的导出
在这一步骤中,仅一个候选被添加到列表中。特别地,在该时域Merge候选的导出中,基于属于共位参考图片的共位CU来导出缩放运动矢量。在条带头中明确地信令通知要用于共位CU导出的参考图片列表。如由图3中的虚线所示,获得用于时域Merge候选的缩放运动矢量,该缩放运动矢量是使用POC距离、tb和td从共位CU的运动矢量进行缩放的,其中tb定义为当前图片的参考图片与当前图片之间的POC差,并且td定义为共位图片的参考图片与共位图片之间的POC差。时域Merge候选的参考图片索引被设置等于为零。
图3是时域Merge候选的运动矢量缩放的图示。
如图4中所示,在候选C0和C1之间选择时域候选的位置。如果位置C0处的CU不可用、被帧内编解码或在CTU的当前行之外,则使用位置C1。否则,在时域Merge候选的导出中使用位置C0。
图4示出了时域Merge候选(C0和C1)的候选位置的示例。
2.1.3基于历史的Merge候选导出
在空域MVP和TMVP之后,将基于历史的MVP(HMVP)Merge候选添加到merge列表。在该方法中,先前编解码的块的运动信息被存储在表中,并且用作当前CU的MVP。在编码/解码过程期间将维护具有多个HMVP候选的表。当遇到新的CTU行时,将重置(清空)该表。每当有非子块帧间编解码的CU,相关联的运动信息就会作为新的HMVP候选添加到表的最后一个条目中。
在VTM中,将HMVP表尺寸S设置为6,这表示最多可以将6个基于历史的MVP(HMVP)候选添加到表中。当将新的运动候选插入到表中时,利用约束的先进先出(FIFO)规则,其中首先应用冗余检验以发现表中是否存在相同的HMVP。如果找到,则从表中移除相同的HMVP,然后将之后所有HMVP候选都向前移动。
HMVP候选可以在Merge候选列表构造过程中使用。按顺序检验表中的最新的几个HMVP候选,并将这几个HMVP候选插入到TMVP候选之后的候选列表中。将冗余检验应用于空域或时域Merge候选的HMVP候选上。
为了减少冗余检验操作的数量,引入以下简化:
1.将用于merge列表生成的HMVP候选的数量设置为(N<=4)?M:(8–N),其中N指示merge列表中现有候选的数量,并且M指示表中可用的HMVP候选的数量。
2.一旦可用Merge候选总数达到最大允许的Merge候选减去1,则HMVP的Merge候选列表构造过程终止。
2.1.4成对平均Merge候选导出
通过平均现有Merge候选列表中的预定义候选对来生成成对平均候选,并且将预定义对定义为{(0,1),(0,2),(1,2),(0,3),(1,3),(2,3)},其中数字表示Merge候选列表的Merge索引。对于每个参考列表分别计算平均运动矢量。如果两个运动矢量在一个列表中均可用,则即使这两个运动矢量指向不同的参考图片,也要对它们进行平均。如果只有一个运动矢量可用,则直接使用这一个;如果没有运动矢量可用,则使该列表无效。
当在添加成对平均Merge候选之后merge列表不完整时,最后插入零MVP,直到遇到最大Merge候选数量为止。
2.2用于帧间预测的三角形分割
在VTM中,支持三角形分割模式(TPM)用于帧间预测。三角形分割模式仅应用于64个样点或更大的CU,并且以跳过或Merge模式而不是以常规Merge模式、MMVD模式、CIIP模式或子块Merge模式进行编解码。CU级别标志用于指示是否应用了三角形分割模式。
当使用该模式时,使用对角线划分或反对角线划分(图5)将CU均匀地划分成两个三角形分割。CU中的每个三角形分割都使用其自身的运动进行帧间预测。每个分割仅允许单向预测,即每个分割具有一个运动矢量和一个参考索引。应用单向预测运动约束以确保与常规双向预测相同,每个CU仅需要两个运动补偿的预测。在2.1中从扩展merge预测而构造的Merge候选列表中直接导出每个分割的单向预测运动,并根据2.2.1中的过程从列表中的给定Merge候选中选择单向预测运动。
图5示出了基于三角形分割的帧间预测的示例。
如果三角形分割模式用于当前CU,则进一步信令通知指示三角形分割(对角线或反对角线)的标志以及两个Merge索引(每个分割一个)。在预测每个三角形分割之后,使用具有自适应权重的混合处理来调整沿对角线或反对角线边缘的样点值。这是整个CU的预测信令,并且如其他预测模式,变换和量化过程将应用于整个CU。最终,使用三角形分割模式预测的CU的运动场以4x4单元存储,如2.2.3中那样。
2.2.1单向预测候选列表构造
给定Merge候选索引,使用2.1中的过程从为扩展merge预测而构造的Merge候选列表中导出单向预测运动矢量,如图6所示。对于列表中的候选,候选的LX运动矢量用作三角形分割模式的单向预测运动矢量,其中X等于Merge候选索引值的奇偶性。这些运动矢量在图6中用“x”标记。在不存在对应的LX运动矢量的情况下,将扩展merge预测候选列表中的相同候选的L(1-X)运动矢量用作三角形分割模式的单向预测运动矢量。
2.2.2沿三角形分割边缘混合
在使用自身的运动来预测每个三角形分割之后,将混合应用于两个预测信令,以导出围绕对角线或反对角线边缘的样点。在混合过程中使用以下权重:
·如图7所示,亮度为{7/8,6/8,5/8,4/8,3/8,2/8,1/8},以及色度为{6/8,4/8,2/8}。
图7示出了在混合过程中使用的权重的示例。
2.2.3运动字段存储
以三角形分割模式编解码的CU的运动矢量以4x4单元存储。取决于每个4x4单元的位置,存储单向预测或双向预测运动矢量。分别将Mv1和Mv2表示为分割1和分割2的单向预测运动矢量。如果4×4单元位于图7的示例中所示的非加权区域中,则为该4×4单元存储Mv1或Mv2。否则,如果4x4单元位于加权区域中,则存储双向预测运动矢量。根据以下过程,从Mv1和Mv2导出双向预测运动矢量:
1)如果Mv1和Mv2来自不同的参考图片列表(一个来自L0,并且另一个来自L1),则简单地将Mv1和Mv2组合以形成双向预测运动矢量。
2)否则,如果Mv1和Mv2来自同一列表,并且不失一般性,则假定它们都来自L0。在这种情况下,
2.a)如果Mv2(或Mv1)的参考图片出现在L1中,则使用L1中的参考图片将该Mv2(或Mv1)转换为L1运动矢量。然后,将两个运动矢量组合以形成双向预测运动矢量。
否则,代替双向预测运动,仅存储单向预测运动Mv1。
2.3 VVC WD6中三角形分割的规范
以下去块滤波过程的规范是从最新的VVC工作草案JVET-O2001-vE中提取的。
2.3.1 Merge数据语法
Figure BDA0003589234600000101
2.3.2 Merge数据语义
ciip_flag[x0][y0]指定是否将组合帧间图片merge和帧内图片预测应用于当前编解码单元。数组索引x0、y0指定所考虑的编解码块的左上亮度样点相对于图片的左上亮度样点的位置(x0,y0)。
当不存在ciip_flag[x0][y0]时,推断如下:
–如果以下所有条件为真,则推断ciip_flag[x0][y0]等于1:
–sps_ciip_enabled_flag等于1。
–general_merge_flag[x0][y0]等于1。
–merge_subblock_flag[x0][y0]等于0。
–regular_merge_flag[x0][y0]等于0。
–cbWidth小于128。
–cbHeight小于128。
–cbWidth*cbHeight大于或等于64。
–否则,推断ciip_flag[x0][y0]等于0。
当ciip_flag[x0][y0]等于1时,将变量IntraPredModeY[x][y]设置为等于INTRA_PLANAR,其中x=x0..x0+cbWidth-1且y=y0..y0+cbHeight–1。
变量MergeTriangleFlag[x0][y0]指定是否使用基于三角形形状的运动补偿来生成当前编解码单元的预测样点,当解码B条带时,变量MergeTriangleFlag[x0][y0]的导出如下:
–如果以下所有条件为真,则将MergeTriangleFlag[x0][y0]设置为等于1:
–sps_triangle_enabled_flag等于1。
–slice_type等于B。
–general_merge_flag[x0][y0]等于1。
–MaxNumTriangleMergeCand大于或等于2。
–cbWidth*cbHeight大于或等于64。
–regular_merge_flag[x0][y0]等于0。
–merge_subblock_flag[x0][y0]等于0。
–ciip_flag[x0][y0]等于0。
–否则,将MergeTriangleFlag[x0][y0]设置为等于0。
merge_triangle_split_dir[x0][y0]指定Merge三角形模式的划分方向。数组索引x0、y0指定所考虑的编解码块的左上亮度样点相对于图片的左上亮度样点的位置(x0,y0)。
当不存在merge_triangle_split_dir[x0][y0]时,将其推断为等于0。
merge_triangle_idx0[x0][y0]指定基于三角形形状的运动补偿候选列表的第一Merge候选索引,其中x0,y0指定所考虑的编解码块的左上亮度样点相对于图片的左上亮度样点的位置(x0,y0)。
当不存在merge_triangle_idx0[x0][y0]时,将其推断为等于0。
merge_triangle_idx1[x0][y0]指定基于三角形形状的运动补偿候选列表的第二Merge候选索引,其中x0、y0指定所考虑的编解码块的左上亮度样点相对于图片的左上亮度样点的位置(x0,y0)。
当不存在merge_triangle_idx1[x0][y0]时,将其推断为等于0。
2.3.3三角形运动矢量分量和参考索引的导出过程
2.3.3.1概述
该过程的输入是:
–当前亮度编解码块的左上样点相对于当前图片的左上亮度样点的亮度位置(xCb,yCb),
–变量cbWidth,指定亮度样点中当前编解码块的宽度,
–变量cbHeight,指定亮度样点中当前编解码块的高度。
该过程的输出是:
–以1/16分数样点为准确度的亮度运动矢量mvA和mvB,
–以1/32分数样点为准确度的色度运动矢量mvCA和mvCB,
–参考索引refIdxA和refIdxB,
–预测列表标志predListFlagA和predListFlagB。
调用条款2.3.3.2中指定的三角形Merge模式的亮度运动矢量的导出过程,其中亮度位置(xCb,yCb)、变量cbWidth和cbHeight作为输入,并且输出为亮度运动矢量mvA、mvB、参考索引refIdxA、refIdxB和预测列表标志predListFlagA和predListFlagB。
调用条款2.3.3.3中的色度运动矢量的导出过程,其中mvA和refIdxA作为输入,并且输出为mvCA。
调用条款2.3.3.3中的色度运动矢量的导出过程,其中mvB和refIdxB作为输入,并且输出为mvCB。
2.3.3.2 Merge三角形模式的亮度运动矢量的导出过程
仅当MergeTriangleFlag[xCb][yCb]等于1时才调用该过程,其中(xCb,yCb)指定相对于当前图片的左上亮度样点的当前亮度编解码块的左上样点。
该过程的输入是:
–当前亮度编解码块的左上样点相对于当前图片的左上亮度样点的亮度位置(xCb,yCb),
–变量cbWidth,指定亮度样点中当前编解码块的宽度,
–变量cbHeight,指定亮度样点中当前编解码块的高度。
该过程的输出是:
–以1/16分数样点为准确度的亮度运动矢量mvA和mvB,
–参考索引refIdxA和refIdxB,
–预测列表标志predListFlagA和predListFlagB。
运动矢量mvA和mvB、参考索引refIdxA和refIdxB以及预测列表标志predListFlagA和predListFlagB通过以下有序步骤导出:
–调用如条款8.5.2.2中指定的Merge模式的亮度运动矢量的导出过程,其中亮度位置(xCb,yCb)、变量cbWidth和cbHeight作为输入,并且
输出为亮度运动矢量mvL0[0][0]、mvL1[0][0]、参考索引refIdxL0、refIdxL1、预测列表利用标志predFlagL0[0][0]和predFlagL1[0][0]、双向预测权重索引bcwIdx和Merge候选列表MergeCandList。
–变量m和n分别作为三角形分割0和1的Merge索引,使用merge_triangle_idx0[xCb][yCb]和merge_triangle_idx1[xCb][yCb]导出变量m和n,如下:
m=merge_triangle_idx0[xCb][yCb] (8-475)
n=merge_triangle_idx1[xCb][yCb]+(merge_triangle_idx1[xCb][yCb]>=m)?1:0 (8-476)
–假设refIdxL0M和refIdxL1M、predFlagL0M和predFlagL1M以及mvL0M和mvL1M是Merge候选列表MergeCandList(M=MergeCandList[m])中的位置m处的Merge候选M的参考索引、预测列表利用标志以及运动矢量。
–变量X设置为等于(m&0x01)。
–当predFlagLXM等于0时,将X设置为等于(1-X)。
–以下适用:
mvA[0]=mvLXM[0] (8-477)
mvA[1]=mvLXM[1] (8-478)
refIdxA=refIdxLXM (8-479)
predListFlagA=X (8-480)
–假设refIdxL0N和refIdxL1N、predFlagL0N和predFlagL1N以及mvL0N和mvL1N是Merge候选列表MergeCandList(N=MergeCandList[n])中的位置m处的Merge候选N的参考索引、预测列表利用标志以及运动矢量。
–变量X设置为等于(n&0x01)。
–当predFlagLXN等于0时,将X设置为等于(1-X)。
–以下适用:
mvB[0]=mvLXN[0] (8-481)
mvB[1]=mvLXN[1] (8-482)
refIdxB=refIdxLXN (8-483)
predListFlagB=X (8-484)
2.3.3.3色度运动矢量的导出过程
该过程的输入是:
–以1/16分数样点为准确度的亮度运动矢量mvLX,,
–参考索引refIdxLX。
该过程的输出是以1/32分数样点为准确度的色度运动矢量mvCLX。
从对应的亮度运动矢量导出色度运动矢量。
色度运动矢量mvCLX的导出如下:
mvCLX[0]=mvLX[0]*2/SubWidthC (8-435)
mvCLX[1]=mvLX[1]*2/SubHeightC (8-436)
2.3.4三角形帧间块的解码过程
2.3.4.1概述
当对具有等于1的MergeTriangleFlag[xCb][yCb]的编解码单元进行解码时,调用该过程。
该过程的输入是:
–指定当前编解码块的左上样点相对于当前图片的左上亮度样点的亮度位置(xCb,yCb),
–变量cbWidth,指定亮度样点中当前编解码块的宽度,
–变量cbHeight,指定亮度样点中当前编解码块的高度,
–以1/16分数样点为准确度的亮度运动矢量mvA和mvB,
–色度运动矢量mvCA和mvCB,
–参考索引refIdxA和refIdxB,
–预测列表标志predListFlagA和predListFlagB。
该过程的输出是:
–亮度预测样点的(cbWidth)x(cbHeight)数组predSamplesL
–分量Cb的色度预测样点的(cbWidth/SubWidthC)x(cbHeight/
SubHeightC)数组predSamplesCb
–分量Cr的色度预测样点的(cbWidth/SubWidthC)x(cbHeight/
SubHeightC)数组predSamplesCr
假设predSamplesLAL和predSamplesLBL为预测亮度样点值的(cbWidth)x(cbHeight)数组,并且假设predSamplesLACb、predSamplesLBCb、predSamplesLACr和predSamplesLBCr为预测色度样点值的(cbWidth/SubWidthC)x(cbHeight/SubHeightC)数组。
predSamplesL、predSamplesCb和predSamplesCr是通过以下有序步骤来导出的:
1.对于N分别为A和B,以下适用:
–由亮度样点的有序二维数组refPicLNL和色度样点的两个有序二维数组refPicLNCb和refPicLNCr构成的参考图片是通过调用VVC WD6中的条款8.5.6.2中指定的过程来导出的,其中将X设置为predListFlagN以及refIdxX设置为refIdxN作为输入。
–数组predSamplesLNL是通过调用VVC WD6中条款8.5.6.3中指定的分数样点插值过程而导出的,其中亮度位置(xCb,yCb)、设置为等于cbWidth的亮度编解码块宽度sbWidth、设置为等于cbHeight的亮度编解码块高度sbHeight、设置为等于(0,0)的运动矢量偏移mvOffset、设置为等于mvN的运动矢量mvLX和设置为等于refPicLNL的参考数组refPicLXL、设置为等于假(FALSE)的变量bdofFlag以及设置为等于0的变量cIdx作为输入。
–数组predSamplesLNCb是通过调用VVC WD6中条款8.5.6.3中指定的分数样点插值过程而导出的,其中亮度位置(xCb,yCb)、设置为等于cbWidth/SubWidthC的编解码块宽度sbWidth、设置为等于cbHeight/SubHeightC的编解码块高度sbHeight、设置为等于(0,0)的运动矢量偏移mvOffset、设置为等于mvCN的运动矢量mvLX和设置为等于refPicLNCb的参考数组refPicLXCb、设置为等于假的变量bdofFlag以及设置为等于1的变量cIdx作为输入。
–数组predSamplesLNCr是通过调用VVC WD6中条款8.5.6.3中指定的分数样点插值过程而导出的,其中亮度位置(xCb,yCb)、设置为等于cbWidth/SubWidthC的编解码块宽度sbWidth、设置为等于cbHeight/SubHeightC的编解码块高度sbHeight、设置为等于(0,0)的运动矢量偏移mvOffset、设置为等于mvCN的运动矢量mvLX和设置为等于refPicLNCr的参考数组refPicLXCr、设置为等于假的变量bdofFlag以及设置为等于2的变量cIdx作为输入。
2.将Merge三角形模式变量triangleDir的分割方向设置为等于merge_triangle_split_dir[xCb][yCb]。
3.通过将设置为等于cbWidth的编解码块宽度nCbW、设置为等于cbHeight的编解码块高度nCbH、样点数组predSamplesLAL和predSamplesLBL、以及变量triangleDir和等于0的变量cIdx作为输入调用条款2.3.4.2中指定的三角形Merge模式的加权样点预测过程来导出当前亮度编解码块内的预测样点predSamplesL[xL][yL],其中xL=0..cbWidth–1并且yL=0..cbHeight-1。
4.通过将设置为等于cbWidth/SubWidthC的编解码块宽度nCbW、设置为等于cbHeight/SubHeightC的编解码块高度nCbH、样点数组predSamplesLACb和predSamplesLBCb以及变量triangleDir和等于1的变量cIdx作为输入调用条款2.3.4.2中指定的三角形Merge模式的加权样点预测过程来导出当前色度分量Cb编解码块内的预测样点predSamplesCb[xC][yC],其中xC=0..cbWidth/SubWidthC–1并且yC=0..cbHeight/SubHeightC-1。
5.通过将设置为等于cbWidth/SubWidthC的编解码块宽度nCbW、设置为等于cbHeight/SubHeightC的编解码块高度nCbH、样点数组predSamplesLACr和predSamplesLBCr以及变量triangleDir和等于2的变量cIdx作为输入调用条款2.3.4.2中指定的三角形Merge模式的加权样点预测过程来导出当前色度分量Cr编解码块内的预测样点predSamplesCr[xC][yC],其中xC=0..cbWidth/SubWidthC–1并且yC=0..cbHeight/SubHeightC-1。
6.调用条款2.3.4.3中指定的Merge三角形模式的运动矢量存储过程,其中亮度编解码块位置(xCb,yCb)、亮度编解码块宽度cbWidth、亮度编解码块高度cbHeight、分割方向triangleDir、亮度运动矢量mvA和mvB、参考索引refIdxA和refIdxB以及预测列表标志predListFlagA和predListFlagB作为输入。
2.3.4.2三角形Merge模式的加权样点预测过程
该过程的输入是:
–两个变量nCbW和nCbH,指定当前编解码块的宽度和高度,
–两个(nCbW)x(nCbH)数组predSamplesLA和predSamplesLB,
–变量triangleDir,指定分割方向,
–变量cIdx,指定色彩分量索引。
该过程的输出是预测样点值的(nCbW)x(nCbH)数组pbSamples。
变量nCbR的导出如下:
nCbR=(nCbW>nCbH)?(nCbW/nCbH):(nCbH/nCbW) (8-841)
变量bitDepth导出如下:
–如果cIdx等于0,则将bitDepth设置为等于BitDepthY
–否则,将bitDepth设置为等于BitDepthC
变量shift1和offset1导出如下:
–将变量shift1设置为等于Max(5,17-bitDepth)。
–将变量offset1设置为等于1<<(shift1-1)。
取决于triangleDir、wS和cidx的值,预测样点pbSamples[x][y]导出如下,其中x=0..nCbW-1和y=0..nCbH-1:
–变量wIdx的导出如下:
–如果cIdx等于0且triangleDir等于0,则以下适用:
wIdx=(nCbW>nCbH)?(Clip3(0,8,(x/nCbR-y)+4)):(Clip3(0,8,(x-y/nCbR)+4)) (8-842)
–否则,如果cIdx等于0且triangleDir等于1,则以下适用:
wIdx=(nCbW>nCbH)?(Clip3(0,8,(nCbH-1-x/nCbR-y)+4)):(Clip3(0,8,(nCbW-1-x-y/nCbR)+4)) (8-843)
–否则,如果cIdx大于0且triangleDir等于0,则以下适用:
wIdx=(nCbW>nCbH)?(Clip3(0,4,(x/nCbR-y)+2)):(Clip3(0,4,(x-y/nCbR)+2)) (8-844)
–否则(如果cIdx大于0且triangleDir等于1),则以下适用:
wIdx=(nCbW>nCbH)?(Clip3(0,4,(nCbH-1-x/nCbR-y)+2)):(Clip3(0,4,(nCbW-1-x-y/nCbR)+2)) (8-845)
–使用wIdx和cIdx导出指定预测样点权重的变量wValue,如下所示:
wValue=(cIdx==0)?Clip3(0,8,wIdx):Clip3(0,8,wIdx*2) (8-846)
–预测样点值导出如下:
pbSamples[x][y]=Clip3(0,(1<<bitDepth)-1,(predSamplesLA[x][y]*wValue+predSamplesLB[x][y]*(8-wValue)+offset1)>>shift1) (8 847)
2.3.4.3三角形Merge模式的运动矢量存储过程
当解码MergeTriangleFlag[xCb][yCb]等于1的编解码单元时,调用该过程。
该过程的输入是:
–亮度位置(xCb,yCb),指定相对于当前图片的左上亮度样点的当前编解码块的左上样点,
–变量cbWidth,指定亮度样点中当前编解码块的宽度,
–变量cbHeight,指定亮度样点中当前编解码块的高度,
–变量triangleDir,指定分割方向,
–以1/16分数样点为准确度的亮度运动矢量mvA和mvB,
–参考索引refIdxA和refIdxB,
–预测列表标志predListFlagA和predListFlagB。
指定在水平和垂直方向上的当前编解码块中的4x4块的数量的变量numSbX和numSbY设置为等于numSbX=cbWidth>>2和numSbY=cbHeight>>2。
变量minSb设置为等于Min(numSbX,numSbY)-1。
变量cbRatio导出如下:
cbRatio=(cbWidth>cbHeight)?(cbWidth/cbHeight):(cbHeight/cbWidth) (8-848)
对于子块索引(xSbIdx,ySbIdx)处的每个4x4子块,其中xSbIdx=0..numSbX-1和ySbIdx=0..numSbY-1的,以下适用:
–变量xIdx和yIdx导出如下:
xIdx=(cbWidth>cbHeight)?(xSbIdx/cbRatio):xSbIdx (8-849)
yIdx=(cbWidth>cbHeight)?ySbIdx:(ySbIdx/cbRatio) (8-850)
–变量sType导出如下:
–如果triangleDir等于0,则以下适用:
sType=(xIdx==yIdx)?2:((xIdx>yIdx)?0:1) (8-851)
–否则(triangleDir等于1),以下适用:
sType=(xIdx+yIdx==minSb)?2:((xIdx+yIdx<minSb)?0:1) (8-852)
–取决于sType的值,进行以下分配:
–如果sType等于0,则以下适用:
predFlagL0=(predListFlagA==0)?1:0 (8-853)
predFlagL1=(predListFlagA==0)?0:1 (8-854)
refIdxL0=(predListFlagA==0)?refIdxA:-1 (8-855)
refIdxL1=(predListFlagA==0)?-1:refIdxA (8-856)
mvL0[0]=(predListFlagA==0)?mvA[0]:0 (8-857)
mvL0[1]=(predListFlagA==0)?mvA[1]:0 (8-858)
mvL1[0]=(predListFlagA==0)?0:mvA[0] (8-859)
mvL1[1]=(predListFlagA==0)?0:mvA[1] (8-860)
–否则,如果sType等于1或(sType等于2并且predListFlagA+predListFlagB不等于1),则以下适用:
predFlagL0=(predListFlagB==0)?1:0 (8-861)
predFlagL1=(predListFlagB==0)?0:1 (8-862)
refIdxL0=(predListFlagB==0)?refIdxB:-1 (8-863)
refIdxL1=(predListFlagB==0)?-1:refIdxB (8-864)
mvL0[0]=(predListFlagB==0)?mvB[0]:0 (8-865)
mvL0[1]=(predListFlagB==0)?mvB[1]:0 (8-866)
mvL1[0]=(predListFlagB==0)?0:mvB[0] (8-867)
mvL1[1]=(predListFlagB==0)?0:mvB[1] (8-868)
–否则(sType等于2且predListFlagA+predListFlagB等于1),则以下适用:
predFlagL0=1 (8-869)
predFlagL1=1 (8-870)
refIdxL0=(predListFlagA==0)?refIdxA:refIdxB (8-871)
refIdxL1=(predListFlagA==0)?refIdxB:refIdxA (8-872)
mvL0[0]=(predListFlagA==0)?mvA[0]:mvB[0] (8-873)
mvL0[1]=(predListFlagA==0)?mvA[1]:mvB[1] (8-874)
mvL1[0]=(predListFlagA==0)?mvB[0]:mvA[0] (8-875)
mvL1[1]=(predListFlagA==0)?mvB[1]:mvA[1] (8-876)
–为x=0..3和y=0..3进行了以下分配:
MvL0[(xSbIdx<<2)+x][(ySbIdx<<2)+y]=mvL0 (8-877)
MvL1[(xSbIdx<<2)+x][(ySbIdx<<2)+y]=mvL1 (8-878)
RefIdxL0[(xSbIdx<<2)+x][(ySbIdx<<2)+y]=refIdxL0 (8-879)
RedIdxL1[(xSbIdx<<2)+x][(ySbIdx<<2)+y]=refIdxL1 (8-880)
PredFlagL0[(xSbIdx<<2)+x][(ySbIdx<<2)+y]=predFlagL0 (8-881)
PredFlagL1[(xSbIdx<<2)+x][(ySbIdx<<2)+y]=predFlagL1 (8-882)
2.4几何Merge模式(GEO)
在JVET-P0068中,正在研究GEO Merge模式作为VVC中现有TPM的扩展。GEO使用与TPM相同的预测混合概念,但是将混合掩码扩展到具有32个角度和5个距离偏移的140个不同模式。GEO模式的混合掩码是使用三个查找表从样点位置的距离和划分边界导出的。
2.4.1概念描述
图13A和图13B示出了VTM-6.0中的TPM以及为非矩形帧间块提出的附加形状。
与TPM相似,对于不小于8×8的单向预测块,允许提出的用于帧间的GEO分割,以便在解码器侧具有与双向预测块相同的存储器带宽。用于GEO分割的运动矢量预测与TPM对准。以及在TPM中,将2个预测之间的混合应用于内部边界。
几何Merge模式的划分边界由如图14中所示的角度
Figure BDA0003589234600000211
和距离偏移ρi来描述。角度
Figure BDA0003589234600000212
表示在0和360度之间的量化角度,并且距离偏移ρi代表最大距离ρmax的量化偏移。与二叉树划分和TPM划分重叠的划分方向将被排除。
2.4.2角度和距离量化。
用固定步长在0到360度之间将角度
Figure BDA0003589234600000213
量化。
在CE4-1.1、具有108种模式的CE4-1.2a和CE4-1.14中,用步长11.25度在0到360度之间对角度
Figure BDA0003589234600000214
进行量化,如图15a中所示,总共32个角度。
在具有80个模式的CE4-1.2b中,角度
Figure BDA0003589234600000215
仍用11.25度的步长进行量化,但是由于在自然值中,目标和运动大部分是水平的,因此移除了接近垂直方向的角度(接近水平划分边界)。图15b示出了减小到24个角度的方案。
从最大可能距离ρmax用固定步长量化距离ρi。ρmax的值可以通过等式(1)进行几何导出,其中w或h等于8,并且ρmax的值用log2缩放的短边长度进行缩放。对于
Figure BDA0003589234600000216
等于0度的情况,ρmax等于w/2,并且对于
Figure BDA0003589234600000217
等于90度的情况,ρmax等于h/2。向后移位的“1.0”样点是为了避免划分边界太靠近角。
Figure BDA0003589234600000218
在CE4-1.1和CE4-1.14中,用5个步长对距离ρi进行量化,考虑到32个角度,总共有140个划分模式,不包括二叉树和TPM划分。
在具有108个模式的CE4-1.2a中,用4个步长对距离ρi进行量化,考虑到32个角度,总共有108个划分模式,不包括二叉树和TPM划分。
在具有80个模式的CE4-1.2b中,用4个步长对距离ρi进行量化,考虑到24个角度,总共有80个划分模式,不包括二叉树和TPM划分。
表1中总结了用于CE测试的角度、距离和模式的数量:
表1角度数量、距离数量、划分模式数量
Figure BDA0003589234600000219
Figure BDA0003589234600000221
2.4.3亮度块的混合操作
在几何Merge模式中,与TPM模式相同,具有3位混合掩码W0和W1的最终预测符PB,如等式(2)中所示。
PB=(W0P0+W1P1+4)>>3 (2)
使用带有等式(3)、(4)和(5)的查找表从划分边界和样点位置的距离导出几何Merge模式的混合掩码。
distFromLine=((x<<1)+1)*Dis[displacementX]+((y<<1)
+1))*Dis[displacementY]–rho (3)
distScaled=Clip3(0,26,(abs(distFromLine)+4)>>3) (4)
sampleWeightL[x][y]=distFromLine<=0?GeoFilter[distScaled]:8-GeoFilter[distScaled] (5)
其中涉及3个查找表、具有32个条目的Dis[.]、具有36个条目的StepDis[.]和具有26个条目的GeoFilter[.]。
确保从P0预测当前块的左下样点。换句话说,当左下样点的distFromLine为负时,W0等于sampleWeightL[x][y],并且W1等于8-W0。否则(左下样点的distFromLine为正),W1等于sampleWeightL[x][y],并且W0等于8-W1
由于所有剩余操作都使用查找表,所以从等式(3)导出几何混合掩码的实际计算复杂度。
在VTM软件实现方式中,等式(3)需要每个样点1个加法且每个样点行1个加法,例如,在8x8 CU中,每个样点需要1.125个加法和0.015625个乘法。
为了并行处理每个4x4单元(例如在8x8 CU中),每个样点需要1.25个加法和0.0625个乘法。
为了并行处理每条线(例如8x8 CU),每个样点需要1个加法和0.125个乘法。
为了并行处理CU中的所有样点,对于每个样本,需要2个乘法和1个加法。
表2中总结了每个样点计算复杂度的最坏情况(8x8):
表2最坏情况下的复杂度分析
Figure BDA0003589234600000231
对于关于混合操作的更多详细信息,请参考随附的草案规范修改文档“8.5.7.3几何Merge模式的加权样点预测过程”节。
2.4.4色度块的混合操作
为亮度样点计算的样点权重被子采样并用于色度混合而无需任何计算。坐标(x,y)处的色度样点权重设置为等于相对于亮度块的左上样点的坐标(2x,2y)处的亮度样点权重。
2.4.5运动矢量导出
用于TPM的相同merge列表导出过程用于导出GEO块的每个分割的运动矢量。每个分割仅通过单向预测进行预测。
2.4.6运动矢量存储
在CE4-1.1和CE4-1.2中,4x4运动存储单元的四个角处的亮度样点权重相加。然后,将总和与2个阈值进行比较,以决定是否存储两个单向预测运动信息或双向预测运动信息之一。使用与TPM相同的过程导出双向预测运动信息。
在CE4-1.14中,运动矢量存储过程被进一步简化。计算4×4运动存储单元的中心位置与划分边界之间的距离,并将该距离与固定阈值进行比较,以决定是否为该4×4运动存储单元存储单向或双向预测运动信息。距离的符号指示在单向预测存储的情况下,哪些单向预测运动信息应被存储。在CE4-1.14中,移除了混合掩码和运动存储的依赖关系。
2.4.7模式信令通知
根据所提出的方法,GEO模式与TPM模式一起被信令通知为附加Merge模式。
表3该提议引入的语法元素
Figure BDA0003589234600000232
Figure BDA0003589234600000241
使用4个CABAC上下文模型来信令通知merge_geo_flag[][],取决于上方和左侧邻近块的模式导出前3个CABAC上下文模式,取决于当前块的纵横比导出第4个CABAC上下文模式。merge_geo_flag[][]指示当前块是使用GEO模式还是使用TPM模式,这类似于“最可能的模式”标志。
geo_partition_idx[][]用作查找表的索引,该查找表存储角度
Figure BDA0003589234600000242
和距离ρi对。geo_partition_idx编解码截断二进制,并使用旁路进行二进制化。
3.通过本文中描述的技术解决方案解决的技术问题的示例
在最新的VVC工作草案WD6(JVET-O2001-v14)中存在几个问题,如下所述。
(1)在WD6中,对于两个三角形分割的混合过程,如图8中所示,色度权重与亮度权重不对准,可能引起视觉伪影。
(2)在WD6中,用于三角形预测的权重的设置未考虑多个色度格式,诸如4:2:2和4:4:4,如图8中所示。
(3)在WD6中,色度仅允许偶数权重,这与亮度不一致,因为亮度分量允许偶数和奇数整数,如图8中所示。
(4)在WD6中,TPM允许用于4xN和Nx4块,其中要求所有像素执行加权混合,这可能是不期望的。
(5)在WD6中,TPM允许用于具有纵横比大于2的块,这可能是不期望的。
(6)GEO和TPM分别应用于独立的信令通知和混合权重掩码和运动存储掩码的独立计算。
图8示出了在用于8x16 TPM块(WD6)的混合过程中使用的权重的示例。
4.实施例和技术的示例
下面列出的项目应被视为示例,以解释一般概念。这些项目不应被狭义地解释。此外,可以以任何方式组合这些项目。
术语“TPM”可以表示一种编解码方法,该方法将一个块划分为两个或更多个子区域,并且将变换应用于整个块。术语“TPM”可以指示三角形预测模式和/或几何Merge模式,这是三角形预测模式的扩展。
TPM混合过程中的加权样点
1.TPM色度预测样点的权重可以与共位的亮度预测样点的权重对准。
a)在一个示例中,可以根据共位的亮度块的权重来设置TPM编解码的色度块(例如,Cb块和/或Cr块)的权重。
b)在一个示例中,TPM编解码的色度块的权重可以是共位的亮度块的权重的子集。
c)在一个示例中,对于块内部的每个位置,可以为具有维度M×N的色度块分配与具有维度为M×N的亮度块相同的权重。
2.TPM色度预测样点的权重可以取决于共位的亮度块的宽度和高度,和/或色彩格式,包括色度子采样率。
a)在一个示例中,对于4:4:4色度格式,TPM色度预测样点的权重可以与块内每个位置的共位亮度预测样点的权重相同。
b)在一个示例中,对于4:2:0和4:2:2色度格式,可以从TPM亮度预测样点的权重中对TPM色度预测样点的权重进行子采样。
i.对于W×H TPM预测块,其中W为块宽度并且H为块高度,subWidthC和subHeightC分别表示宽度和高度方向上的色度子采样率。假设亮度预测块的权重由二维数组WeightY[x][y]表示,其中x
=0…(W-1),y=0…(H-1),则共位的色度预测块的权重WeightC[x][y]可以通过WeightY[f(x)][g(y)]来计算,其中x=0…(W/subWidthC-1),y=0…(H/subHeightC-1)。
1)在一个示例中,f(x)=x*subWidthC+offsetX,g(y)=y*subHeightC+OffsetY,例如OffsetX=OffsetY=0。
ii.假设WxH TPM亮度块中的位置(x,y)的权重由w(x,y)计算,例如w(x,y)=a*x+b*y+c,其中x=0…W-1和y=0…H-1是亮度样点的坐标,并且a、b、c是取决于W和/或H的整数在一个示例中,在共位的TPM色度块中的位置(x',y')的权重可以被计算为w(f(x'),g(y')),例如w(f(x'),g(y'))=a*(subWidthC*x')+b*(subHeightC*y')+c,其中x'=0…W/subWidthC-1和y'=0…H/subHeightC-1是色度样点的坐标。
c)在一个示例中,TPM中使用的权重可以仅取决于块的维度(宽度或/和高度),并且TPM中使用的权重对于不同的色彩分量可以相同。
i.例如,具有尺寸为W*H的色度分量可以使用与具有尺寸为W*
H的亮度分量相同的权重。
ii.在一个示例中,当未对于亮度块尺寸定义权重时,可以对于这种尺寸的色度块禁用TPM。
d)在一个示例中,在TPM中使用的权重可以取决于块的维度(宽度或/和高度)和块的色彩分量两者。
i.在一个示例中,对于不同的颜色分量的权重可以是不同的。
ii.在一个示例中,对于两个色度分量的权重可以是相同的。
1)替代地,此外,用于亮度分量和色度分量的权重可以不同。
3.TPM预测样点的权重可以等于整数X。
a)在一个示例中,可以将奇数整数或偶数整数分配为TPM色度预测样点的权重X(诸如X=0…8)。
b)TPM亮度/色度预测样点的权重可以限幅至[M,N]范围,诸如M=0,N=8。
c)在一个示例中,TPM权重可以小于零。
4.在一个示例中,TPM/GEO块的混合权重掩码可以被预定义为N个表(例如,N>0)。
5.在一个示例中,可以从计算等式中计算TPM/GEO块的混合权重掩码。
TPM的一般问题
将块宽度表示为W,并且将块高度表示为H。
6.是启用还是禁用TPM可能取决于块宽度和块高度的比率,例如max(H,W)/min(H,W)。
a)替代地,是启用还是禁用TPM可能取决于块宽度和块高度之间的差,例如Abs(Log2(cbWidth)-Log2(cbHeight)),其中Abs(x)返回x的绝对值并且Log2(x)返回数字x的对数底数2。
b)对于具有宽高比或高宽比大于X(例如X=2)的块,可能不允许TPM。
i.在一个示例中,对于W×H预测块,如果W/H>2,则可能禁用TPM。
ii.在一个示例中,对于W×H预测块,如果H/W>2,则可能禁用TPM。
7.是否允许使用TPM可能取决于最大变换尺寸。
a)在一个示例中,对于具有宽度或/和高度大于最大变换尺寸的块,可能不允许TPM。
8.是否允许使用TPM可能取决于最大CU尺寸。
a)在一个示例中,对于具有块宽度或/和块高度等于最大CU尺寸的块,可能不允许TPM。
9.对于具有块宽度大于N或/和块高度大于M的块可能不允许TPM。
a)在一个示例中,N=M=64。
10.对于具有块宽度等于N或/和块高度等于M的块,可能不允许TPM。
a)在一个示例中,N=M=4
11.对于某些色度格式,可能不允许TPM。
a)在一个示例中,对于4:0:0色度格式,可能不允许TPM。
b)在一个示例中,对于4:4:4色度格式,可能不允许TPM。
c)在一个示例中,对于4:2:2色度格式,可能不允许TPM。
12.如果TPM中使用的两个参考图片的分辨率不同,则可能不允许TPM。
a)替代地,如果在TPM中使用的一个参考图片的分辨率与当前图片的分辨率不同,则可能不允许TPM。
13.当禁用或不允许TPM时,可能不会信令通知TPM语法元素(诸如merge_triangle_split_dir、merge_triangle_idx0和merge_triangle_idx1)。
a)当未信令通知语法元素时,可以将其推断为0。
b)当禁用或不允许TPM时,可以将TPM相关的语义变量(诸如MergeTriangleFlag)推断为0。
14.以上项目符号可以应用于三角形预测模式(TPM)和/或几何Merge模式(GEO)。换句话说,TPM可以指GEO。
TPM和GEO的统一
15.TPM和GEO可以统一。
a)在一个示例中,TPM可被视为GEO的子集。
i.替代地,GEO可以被视为TPM的子集。
ii.例如,如果将编解码工具A(或等效地称为“模式A”,或简称为“A”)(诸如TPM)视为编解码工具B的子集(或等效地称为“模式B”,或简称为“B”)(诸如GEO),则可以应用下面公开的方法。
1)可以将A和B信令通知为一种模式。
a)在一个示例中,模式A和模式B可以在SPS/VPS/APS/PPS/条带/子图片/片/砖/VPDU/CTU/TU/CU/PU/图片头/条带头级别处共享(多个)相同的控制标志。
b)在一个示例中,可以将模式A信令通知为B的子集。
i.例如,将B定义为包含N个(诸如N>1)子模式的预测模式,这些N个子模式表示为{M0,M1,M2…,MN-1},并且可以将A定义为包含X个子模式(诸如X<N)的预测模式,这些X个子模式表示为{M0,Mk0,Mk1…,MkX-1},其中{M0,Mk0,Mk1…,MkX-1}是{M0,M1,M2…,MN-1}的子集。
ii.在一个示例中,信令通知第一语法元素以指示是否应用模式B。取决于是否应用模式B来信令通知指示是否应用模式A的第二语法元素。
1.在一个示例中,仅当应用模式B时才信令通知第二语法元素。
2)A和B可以共享至少一个计算逻辑以生成混合权重掩码。
a)在一个示例中,用于A和B的混合权重掩码可以从同一查找表中导出。
3)A和B可以共享至少一个计算逻辑以生成运动存储掩码。
a)在一个示例中,用于A和B的运动存储掩码可以从同一查找表中导出。
b)在一个示例中,至少一种计算逻辑可以用于计算用于TPM模式和GEO模式两者的混合权重。
i.在一示例中,用于TPM的计算逻辑可以用于GEO。
1)替代地,用于GEO的计算逻辑可以用于TPM。
c)在一个示例中,至少一个计算逻辑可以用于计算用于TPM模式和GEO模式两者的运动存储掩码。
i.在一示例中,用于TPM的计算逻辑可以用于GEO。
1)替代地,用于GEO的计算逻辑可以用于TPM。
TPM/GEO的运动存储掩码生成
16.可以以与GEO相同的方式生成TPM的运动矢量存储掩码。
a)替代地,可以以与TPM相同的方式生成GEO的运动矢量存储掩码。
b)在一个示例中,可以生成和/或存储指示针对块宽度和块高度的特定组合的帧间预测方向(诸如单向预测或双向预测)的运动矢量存储掩码。
i.在一个示例中,可以仅针对块宽度和块高度的允许组合来生成运动矢量存储掩码。
c)在一个示例中,运动矢量存储掩码的每个元素指示存储两个子分割中的哪个运动矢量,和/或针对4×4子块存储了多少运动矢量(诸如一个运动矢量或两个运动矢量)和/或帧间预测方向(诸如单向预测或双向预测)。
d)在一个示例中,TPM/GEO块的运动矢量存储掩码可以被预定义为N个表(诸如,N>0)。
e)在一个示例中,可以从计算等式中计算TPM/GEO块的运动矢量存储掩码。
17.TPM/GEO的运动矢量可以以4×4为单元存储。
a)在一个示例中,TPM/GEO的两个子分割中的每个子分割都有其自身的运动矢量以进行运动补偿,但是,为空域/时域运动矢量候选存储的运动矢量是以4x4为单元。
i.在一个实例中,TPM/GEO的每个4×4子块可以具有存储在缓冲器中的不同运动矢量。
18.L0运动矢量和L1运动矢量两者都可以被存储用于属于TPM/GEO的混合区域的子块。
a)在一个示例中,混合区域可以指示被两个子分割重叠的区域。
b)在一个示例中,对于TPM/GEO块的混合区域之外的那些4×4子块,可以存储子分割的单向预测(诸如L0或L1)运动矢量。
c)在一个示例中,对于属于TPM/GEO块的混合区域的那些4×4子块,可以存储两个子分割的双向预测运动矢量。
d)在一个示例中,对于属于TPM/GEO块的混合区域的那些4x4子块,如果两个子分割都具有来自同一方向的运动矢量,则两个运动矢量中的最小/最大/平均/加权运动矢量可以被存储。
TPM和GEO的去块
19.是否和/或如何将去块过程应用编解码块可以取决于编解码块是使用TPM还是GEO模式来编解码的。
a)在一个示例中,可以在去块滤波器阶段中对两个不同分割中的两个子块之间的边界进行滤波。
i.在一个示例中,在这种情况下,边界强度(BS)等于1。
ii.在一个示例中,在这种情况下,边界强度(BS)等于2。
20.可以针对TPM编解码/GEO编解码的块中的两个子块之间的边界来触发去块。
a)在一个示例中,如果除了TPM/GEO模式的内部TU边缘之外的两个子块之一具有非零系数,则可以触发去块,无论两个子块之间是否存在运动差。
b)在两个子块中可能没有非零系数。
i.在一个示例中,如果除了TPM/GEO模式的内部TU边缘以外的两个子块具有全零系数,但是两个子块的运动差足够大,则仍然可以触发去块。
ii.替代地,如果除了TPM/GEO模式的内部TU边缘以外的两个子块具有全零系数,但是两个子块的运动差足够大,则可以不触发去块。
c)是否针对以TPM/GEO模式编解码的两个子块的边缘触发去块可以取决于这是两个子块的TU边缘还是MV边缘。
i.如果运动差对于TPM/GEO模式的MV边缘足够大,则可以触发去块。
ii.如果在子块中除了TPM/GEO模式的TU边缘以外还存在非零系数,则可以触发去块。
iii.当滤波边缘既是TU边缘又是MV边缘时,如果满足以下任一条件,则可以触发去块。
1)如果运动差足够大。
2)在两个子块中的任何一个中存在非零系数。
d)上述“TU边缘”指示实际的变换单元边缘,并且上述“MV边缘”
指示与滤波网格对准的PU边缘或子块边缘。
e)上述“运动差”可以指示以下情况。
i.两个子块的运动矢量差大于T(诸如T=1像素或1/2像素或以1/16亮度样点为单位的8)
ii.不同的参考帧索引
iii.不同的参考POC
iv.不同数量的参考帧。
关于可配置的CTU尺寸和最大变换尺寸
21.是否应用ISP可以不取决于最大变换尺寸和/或最小变换尺寸。
a)在一个示例中,ISP标志(诸如intra_subpartitions_mode_flag)的信令通知可以“不”取决于当前块的宽度是否小于或等于最大变换尺寸,和/或可以“不”取决于当前块的高度是否小于或等于最大变换尺寸。
b)在一个示例中,ISP标志(诸如intra_subpartitions_mode_flag)的信令通知可以“不”取决于宽度乘以当前块的高度是否大于最小变换尺寸的平方。
c)在一个示例中,ISP标志(诸如intra_subpartitions_mode_flag)的信令通知可以取决于宽度乘以当前块的高度是否大于16。
d)在一个示例中,ISP标志(诸如intra_subpartitions_mode_flag)的信令通知可以取决于当前块的宽度是否小于或等于64,和/或取决于当前块的高度是否小于或等于64。
22.当编解码块的维度大于最大变换尺寸时,可以应用ISP。
a)在一个示例中,当ISP编解码块大于最大变换尺寸时,可以通过递归方式隐式划分ISP块,直到子分割的尺寸达到64。
b)在一个示例中,当ISP编解码块大于最大变换尺寸时,可以通过递归方式隐式划分ISP块,直到子分割的尺寸达到最大变换尺寸。
23.当编解码块的维度大于或等于128时,可以应用CIIP和/或TPM和/或GEO。
a)在一个示例中,最大CTU尺寸可以设置为大于128。
b)在一个示例中,CIIP可以用于具有块维度大于或等于128的块。
c)在一个示例中,TPM和/或GEO可以应用于具有块维度大于128的块。
24.当编解码块的维度大于128时,可以信令通知Merge数据。
a)在一个示例中,Merge标志(诸如regular_merge_flag、mmvd_merge_flag、mmvd_cand_flag、mmvd_distance_idx、mmvd_direction_idx、merge_idx、ciip_flag、merge_triangle_split_dir、merge_triangle_idx0、merge_triangle_idx1)可以取决于编解码块的维度是否小于最大CTU尺寸。
25.如果块宽度和/或块高度等于或大于X(诸如X=64或128),则pred_mode_ibc_flag的值可以推断为0。
a)在一个示例中,如果块宽度和块高度大于64,则pred_mode_ibc_flag的值可以推断为0。
b)在一个示例中,如果块宽度或块高度大于64,则pred_mode_ibc_flag的值可以推断为0。
26.当编解码块的维度大于128时,可以信令通知cu_skip_flag和/或pred_mode_flag。
常规去块
27.对于每个分量,β和tC的图片级别去块参数偏移可以不同。
a)在一个示例中,用于亮度、Cb和Cr的图片级别去块参数偏移可以是不同的并且由不同的语法元素指示。
b)替代地,此外,用于joint_cb_cr编解码模式的图片级别去块参数偏移可以是不同的并且由不同的语法元素指示。
28.对于每个分量,β和tC的条带级别去块参数偏移可以不同。
a)在一个示例中,用于亮度、Cb和Cr的条带级别去块参数偏移可以是不同的并且由不同的语法元素指示。
b)替代地,此外,用于joint_cb_cr编解码模式的图片级别去块参数偏移可以是不同的并且由不同的语法元素指示。
29.用于导出色度去块参数的色度QP可以基于图片级别色度QP偏移和CU级别色度QP偏移,但与条带级别色度QP偏移无关。
a)在一个示例中,用于导出色度去块参数的色度QP可以取决于pps_cb_qp_offset、pps_cr_qp_offset、pps_cbcr_qp_offset、CuQpOffsetCb、CuQpOffsetCr和CuQpOffsetCbCr,但与slice_cb_qp_offset、slice_cr_qp_offset和slice_cbcr_qp_offset无关。
5.实施例
下面是示例实施例,其可以应用于VVC规范。这些修改基于最新的VVC工作草案(JVET-O2001-v14)。新添加的部分以粗体和斜体突出显示,并且从VVC工作草案中删除的部分用双括号标记(例如[[a]]表示字符“a”的删除)。
5.1 TPM亮度和色度权重图示的实施例#1
根据块宽度、块高度和色度子采样率,将TPM色度权重与亮度权重对准。图9示出了用于8×16TPM预测块的示例权重设置。
5.2将TPM色度权重与TPM亮度权重对准的实施例#2
8.5.7三角形帧间块的解码过程
8.5.7.1概述
当对MergeTriangleFlag[xCb][yCb]等于1的编解码单元进行解码时,调用该过程。
该过程的输入是:
–亮度位置(xCb,yCb),指定相对于当前图片的左上亮度样点的当前编解码块的左上样点,
–变量cbWidth,指定亮度样点中当前编解码块的宽度,
–变量cbHeight,指定亮度样点中当前编解码块的高度,
–以1/16分数样点为准确度的亮度运动矢量mvA和mvB,
–色度运动矢量mvCA和mvCB,
–参考索引refIdxA和refIdxB,
–预测列表标志predListFlagA和predListFlagB。
该过程的输出是:
–亮度预测样点的(cbWidth)x(cbHeight)数组predSamplesL
–分量Cb的色度预测样点的(cbWidth/SubWidthC)x(cbHeight/SubHeightC)数组predSamplesCb
–分量Cr的色度预测样点的(cbWidth/SubWidthC)x(cbHeight/SubHeightC)数组predSamplesCr
假设predSamplesLAL和predSamplesLBL为预测亮度样点值的(cbWidth)x(cbHeight)数组,并且predSamplesLACb、predSamplesLBCb、predSamplesLACr和predSamplesLBCr为预测色度样点值的(cbWidth/SubWidthC)x(cbHeight/SubHeightC)数组。
predSamplesL、predSamplesCb和predSamplesCr是通过以下有序步骤来导出的:
1.对于N为A和B中的每一个,以下适用:
–由亮度样点的有序二维数组refPicLNL和色度样点的两个有序二维数组refPicLNCb和refPicLNCr构成的参考图片是通过调用VVC WD6中的条款8.5.6.2中指定的过程来导出的,其中X设置为等于predListFlagN以及refIdxX设置为等于refIdxN作为输入。
–数组predSamplesLNL是通过调用条款8.5.6.3中指定的分数样点插值过程来导出的,其中亮度位置(xCb,yCb)、设置为等于cbWidth的亮度编解码块宽度sbWidth、设置为等于cbHeight的亮度编解码块高度sbHeight、设置为等于(0,0)的运动矢量偏移mvOffset、设置为等于mvN的运动矢量mvLX和设置为等于refPicLNL的参考数组refPicLXL、设置为等于假的变量bdofFlag以及设置为等于0的变量cIdx作为输入。
–数组predSamplesLNCb是通过调用VVC WD6中条款8.5.6.3中指定的分数样点插值过程而导出的,其中亮度位置(xCb,yCb)、设置为等于cbWidth/SubWidthC的编解码块宽度sbWidth、设置为等于cbHeight/SubHeightC的编解码块高度sbHeight、设置为等于(0,0)的运动矢量偏移mvOffset、设置为等于mvCN的运动矢量mvLX和设置为等于refPicLNCb的参考数组refPicLXCb、设置为等于假的变量bdofFlag以及设置为等于1的变量cIdx作为输入。
–数组predSamplesLNCr是通过调用VVC WD6中条款8.5.6.3中指定的分数样点插值过程而导出的,其中亮度位置(xCb,yCb)、设置为等于cbWidth/SubWidthC的编解码块宽度sbWidth、设置为等于cbHeight/SubHeightC的编解码块高度sbHeight、设置为等于(0,0)的运动矢量偏移mvOffset、设置为等于mvCN的运动矢量mvLX和设置为等于refPicLNCr的参考数组refPicLXCr、设置为等于假的变量bdofFlag以及设置为等于2的变量cIdx作为输入。
2.将Merge三角形模式变量triangleDir的分割方向设置为等于merge_triangle_split_dir[xCb][yCb]。
3.通过将设置为等于cbWidth的编解码块宽度nCbW、设置为等于cbHeight的编解码块高度nCbH、样点数组predSamplesLAL和predSamplesLBL、以及变量triangleDir和等于0的变量cIdx作为输入调用条款8.5.7.2中指定的三角形Merge模式的加权样点预测过程来导出当前亮度编解码块内的预测样点predSamplesL[xL][yL],其中xL=0..cbWidth–1并且yL=0..cbHeight-1。
4.通过将设置为等于cbWidth[[/SubWidthC]]的
Figure BDA0003589234600000351
编解码块宽度nCbW、设置为等于cbHeight[[/SubHeightC]]的
Figure BDA0003589234600000352
编解码块高度nCbH、样点数组predSamplesLACb和predSamplesLBCb以及变量triangleDir和等于1的变量cIdx作为输入调用条款8.5.7.2中指定的三角形Merge模式的加权样点预测过程来导出当前色度分量Cb编解码块内的预测样点predSamplesCb[xC][yC],其中xC=0..cbWidth/SubWidthC–1并且yC=0..cbHeight/SubHeightC-1。
5.通过将设置为等于cbWidth[[/SubWidthC]]的
Figure BDA0003589234600000353
编解码块宽度nCbW、设置为等于cbHeight[[/SubHeightC]]的
Figure BDA0003589234600000354
编解码块高度nCbH、样点数组predSamplesLACr和predSamplesLBCr以及变量triangleDir和等于2的变量cIdx作为输入调用条款8.5.7.2中指定的三角形Merge模式的加权样点预测过程来导出当前色度分量Cr编解码块内的预测样点predSamplesCr[xC][yC],其中xC=0..cbWidth/SubWidthC–1并且yC=0..cbHeight/SubHeightC-1。
6.调用条款8.5.7.3中指定的Merge三角形模式的运动矢量存储过程,其中亮度编解码块位置(xCb,yCb)、亮度编解码块宽度cbWidth、亮度编解码块高度cbHeight、分割方向triangleDir、亮度运动矢量mvA和mvB、参考索引refIdxA和refIdxB以及预测列表标志predListFlagA和predListFlagB作为输入。
8.5.7.2三角形Merge模式的加权样点预测过程
该过程的输入是:
–两个变量nCbW和nCbH,指定当前亮度编解码块的宽度和高度,
–两个(nCbW/SubWidthC)x(nCbH/SubHeightC)数组predSamplesLA和predSamplesLB,
–变量triangleDir,指定分割方向,
–变量cIdx,指定色彩分量索引。
该过程的输出是预测样点值的
Figure BDA0003589234600000361
数组pbSamples。
变量nCbR导出如下:
nCbR=(nCbW>nCbH)?(nCbW/nCbH):(nCbH/nCbW)(8-841)
变量bitDepth导出如下:
–如果cIdx等于0,则bitDepth设置为等于BitDepthY
–否则,bitDepth设置为等于BitDepthC
变量shift1和offset1导出如下:
–变量shift1设置为等于Max(5,17-bitDepth)。
–变量offset1设置为等于1<<(shift1-1)。
取决于triangleDir[[、wS和cIdx]]的值,预测样点pbSamples[x][y]导出如下,其中
Figure BDA0003589234600000362
Figure BDA0003589234600000363
Figure BDA0003589234600000364
Figure BDA0003589234600000365
Figure BDA0003589234600000366
的变量
Figure BDA0003589234600000367
导出如下:
–如果[[cIdx等于0并且]]triangleDir等于0,则以下适用:
Figure BDA0003589234600000368
–否则[[,如果cIdx等于0且]](triangleDir等于1),则以下适用:
Figure BDA0003589234600000369
–[[否则,如果cIdx大于0且triangleDir等于0,则以下适用:wIdx=(nCbW>nCbH)?(Clip3(0,4,(x/nCbR-y)+2)):(Clip3(0,4,(x-y/nCbR)+2)) (8-844)
–否则(如果cIdx大于0且triangleDir等于1),则以下适用:wIdx=(nCbW>nCbH)?(Clip3(0,4,(nCbH-1-x/nCbR-y)+2)):(Clip3(0,4,(nCbW-1-x-y/nCbR)+2)) (8-845)
–使用wIdx和cIdx导出指定预测样点权重的变量wValue,如下所示:wValue=(cIdx==0)?Clip3(0,8,wIdx):Clip3(0,8,wIdx*2) (8-846)]]
–预测样点值导出如下:
pbSamples[x][y]=Clip3(0,(1<<bitDepth)-1,(predSamplesLA[x][y]*wValue+predSamplesLB[x][y]*(8-wValue)+offset1)>>shift1) (8-847)
5.3以块宽高比为条件的TPM的实施例#3
7.3.8.7 Merge数据语法
Figure BDA0003589234600000381
7.4.9.7 Merge数据语义
变量MergeTriangleFlag[x0][y0]指定当解码B条带时基于三角形形状的运动补偿是否用来生成当前编解码单元的预测样点,该变量MergeTriangleFlag[x0][y0]导出如下:
–如果以下所有条件为真,则将MergeTriangleFlag[x0][y0]设置为1:
–sps_triangle_enabled_flag等于1。
–slice_type等于B。
–general_merge_flag[x0][y0]等于1。
–MaxNumTriangleMergeCand大于或等于2。
–cbWidth*cbHeight大于或等于64。
–regular_merge_flag[x0][y0]等于0。
–merge_subblock_flag[x0][y0]等于0。
–ciip_flag[x0][y0]等于0。
Figure BDA0003589234600000391
–否则,将MergeTriangleFlag[x0][y0]设置为等于0。
5.4以块宽度<128和块高度<128为条件的TPM的实施例#4
7.3.8.7 Merge数据语法
Figure BDA0003589234600000401
7.4.9.7 Merge数据语义
变量MergeTriangleFlag[x0][y0]指定当解码B条带时基于三角形形状的运动补偿是否用来生成当前编解码单元的预测样点,变量MergeTriangleFlag[x0][y0]导出如下:
–如果以下所有条件为真,则将MergeTriangleFlag[x0][y0]设置为等于1:
–sps_triangle_enabled_flag等于1。
–slice_type等于B。
–general_merge_flag[x0][y0]等于1。
–MaxNumTriangleMergeCand大于或等于2。
–cbWidth*cbHeight大于或等于64。
–regular_merge_flag[x0][y0]等于0。
–merge_subblock_flag[x0][y0]等于0。
–ciip_flag[x0][y0]等于0。
Figure BDA0003589234600000411
Figure BDA0003589234600000412
–否则,将MergeTriangleFlag[x0][y0]设置为0。
5.5以块宽度>4和块高度>4为条件的TPM的实施例#5
7.3.8.7 Merge数据语法
Figure BDA0003589234600000421
7.4.9.7 Merge数据语义
变量MergeTriangleFlag[x0][y0]指定当解码B条带时基于三角形形状的运动补偿是否用来生成当前编解码单元的预测样点,变量MergeTriangleFlag[x0][y0]导出如下:
–如果以下所有条件为真,则将MergeTriangleFlag[x0][y0]设置为等于1:
–sps_triangle_enabled_flag等于1。
–slice_type等于B。
–general_merge_flag[x0][y0]等于1。
–MaxNumTriangleMergeCand大于或等于2。
–cbWidth*cbHeight大于或等于64。
–regular_merge_flag[x0][y0]等于0。
–merge_subblock_flag[x0][y0]等于0。
–ciip_flag[x0][y0]等于0。
Figure BDA0003589234600000431
Figure BDA0003589234600000432
–否则,将MergeTriangleFlag[x0][y0]设置为等于0。
5.6独立于最小变换尺寸和最大变换尺寸的ISP信令通知的实施例#6
7.3.8.5编解码单元语法
Figure BDA0003589234600000433
5.7适用于大于最大变换尺寸的块的ISP的实施例#7
7.3.8.6编解码单元语法
Figure BDA0003589234600000434
Figure BDA0003589234600000441
5.8适用于大于16个像素的块尺寸的ISP的实施例#8
7.3.8.7编解码单元语法
Figure BDA0003589234600000442
5.9 MV取整的示例。
工作草案的更改
JVET-O2001-v14中指定的工作草案如下进行更改。新添加的部分以粗体和斜体突出显示。移除的部分用双方括号标记。
8.5.5.3基于子块的时域Merge候选的导出过程
该过程的输入是:
-…
该过程的输出是:
-…。
Figure BDA0003589234600000451
–对于xSbIdx=0..numSbX-1和ySbIdx=0..numSbY-1,运动矢量mvLXSbCol[xSbIdx][ySbIdx]和预测列表利用标志predFlagLXSbCol[xSbIdx][ySbIdx]导出如下:
–指定相对于当前图片的左上亮度样点的当前编解码子块的左上样点的亮度位置(xSb,ySb)导出如下:
xSb=xCb+xSbIdx*sbWidth+sbWidth/2 (8-551)
ySb=yCb+ySbIdx*sbHeight+sbHeight/2 (8-552)
–ColPic内的共位子块的位置(xColSb,yColSb)导出如下。
–以下适用:
yColSb=Clip3(yCtb,Min(CurPicHeightInSamplesY-1,yCtb+(1<<CtbLog2SizeY)-1),ySb+[[(]]tempMv[1][[>>4)]]) (8-553)
–如果subpic_treated_as_pic_flag[SubPicIdx]等于1,则以下适用:
xColSb=Clip3(xCtb,Min(SubPicRightBoundaryPos,xCtb+(1<<CtbLog2SizeY)+3),xSb+[[(]]tempMv[0][[>>4)]]) (8-554)
–否则(subpic_treated_as_pic_flag[SubPicIdx]等于0),以下适用:xColSb=Clip3(xCtb,Min(CurPicWidthInSamplesY-1,xCtb+(1<<CtbLog2SizeY)+3),xSb+[[(]]tempMv[0][[>>4)]]) (8-555)
8.5.5.4基于子块的时域Merge基础运动数据的导出过程
该过程的输入是:
-…
该过程的输出是:
-…。
变量tempMv设置如下:
tempMv[0]=0 (8-558)
tempMv[1]=0 (8-559)
变量currPic指定当前图片。
当availableFlagA1等于真(TRUE)时,以下适用:
–如果以下所有条件为真,则tempMv设置为等于mvL0A1
–predFlagL0A1等于1,
–DiffPicOrderCnt(ColPic,RefPicList[0][refIdxL0A1])等于0,
–否则,如果以下所有条件为真,则将tempMv设置为等于mvL1A1
–slice_type等于B,
–predFlagL1A1等于1,
–DiffPicOrderCnt(ColPic,RefPicList[1][refIdxL1A1])等于0。
Figure BDA0003589234600000461
ColPic内的共位块的位置(xColCb,yColCb)导出如下。
–以下适用:
yColCb=Clip3(yCtb,Min(CurPicHeightInSamplesY-1,yCtb+(1<<CtbLog2SizeY)-1),yColCtrCb+[[(]]tempMv[1][[>>4)]]) (8-560)
–如果subpic_treated_as_pic_flag[SubPicIdx]等于1,则以下适用:
xColCb=Clip3(xCtb,Min(SubPicRightBoundaryPos,xCtb+(1<<CtbLog2SizeY)+3),xColCtrCb+[[(]]tempMv[0][[>>4)]]) (8-561)
–否则(subpic_treated_as_pic_flag[SubPicIdx]等于o,以下适用:
xColCb=Clip3(xCtb,Min(CurPicWidthInSamplesY-1,xCtb+(1<<CtbLog2SizeY)+3),xColCtrCb+[[(]]tempMv[0][[>>4)]]) (8-562)
5.10子TMVP的示例
8.5.5.2子块Merge模式下运动矢量和参考索引的导出过程
该过程的输入是:
–相对于当前图片的左上亮度样点的当前亮度编解码块的左上样点的亮度位置(xCb,yCb),
–两个变量cbWidth和cbHeight,指定亮度编解码块的宽度和高度。
该过程的输出是:
–水平方向numSbX和垂直方向numSbY的亮度编解码子块的数量,
–参考索引refIdxL0和refIdxL1,
–预测列表利用标志数组predFlagL0[xSbIdx][ySbIdx]和predFlagL1[xSbIdx][ySbIdx],
–以1/16分数样点为准确度的亮度子块运动矢量数组mvL0[xSbIdx][ySbIdx]和mvL1[xSbIdx][ySbIdx],其中xSbIdx=0..numSbX-1,ySbIdx=0..numSbY-1,
–以1/32分数样点为准确度的色度子块运动矢量数组mvCL0[xSbIdx][ySbIdx]和mvCL1[xSbIdx][ySbIdx],其中xSbIdx=0..numSbX-1,ySbIdx=0..numSbY-1,
–双向预测权重索引bcwIdx。
Figure BDA0003589234600000471
变量numSbX、numSbY和子块Merge候选列表subblockMergeCandList是通过以下有序步骤来导出的:
1.当sps_sbtmvp_enabled_flag等于1时,以下适用:
–对于availableFlagA1、refIdxLXA1、predFlagLXA1和mvLXA1的导出,以下适用:
–邻近亮度编解码块内的亮度位置(xNbA1,yNbA1)设置为等于(xCb-1,yCb+cbHeight-1)。
–调用如条款6.4.4中指定的邻近块可用性的导出过程,其中将当前亮度位置(xCurr,yCurr)设置为等于(xCb,yCb)、邻近亮度位置(xNbA1,yNbA1)、checkPredModeY设置为等于真以及cIdx设置为等于0作为输入,并且将输出分配给块可用性标志availableA1
–变量availableFlagA1、refIdxLXA1、predFlagLXA1和mvLXA1导出如下:
–如果availableA1等于假,则availableFlagA1设置为等于0,
mvLXA1的两个分量都设置为等于0,refIdxLXA1设置为等于-1以及predFlagLXA1设置为等于0,其中X为0或1并且bcwIdxA1设置为等于0。
–否则,availableFlagA1设置为等于1,并进行以下分配:
mvLXA1=MvLX[xNbA1][yNbA1] (8-498)
refIdxLXA1=RefIdxLX[xNbA1][yNbA1] (8-499)
predFlagLXA1=PredFlagLX[xNbA1][yNbA1] (8-500)
–调用如条款8.5.5.3中指定的基于子块的时域Merge候选的导出过程,其中亮度位置(xCb,yCb)、亮度编解码块宽度cbWidth、亮度编解码块高度cbHeight、可用性标志availableFlagA1、参考索引refIdxLXA1、预测列表利用标志predFlagLXA1和运动矢量mvLXA1作为输入,并且输出为可用性标志availableFlagSbCol、水平方向
Figure BDA0003589234600000481
和垂直方向
Figure BDA0003589234600000482
的亮度编解码子块的数量、参考索引refIdxLXSbCol、亮度运动矢量mvLXSbCol[xSbIdx][ySbIdx]和预测列表利用标志predFlagLXSbCol[xSbIdx][ySbIdx],其中
Figure BDA0003589234600000483
Figure BDA0003589234600000484
并且X为0或1。
2.当sps_affine_enabled_flag等于1时,样点位置(xNbA0,yNbA0)、(xNbA1,yNbA1)、(xNbA2,yNbA2)、(xNbB0,yNbB0)、(xNbB1,yNbB1)、(xNbB2,yNbB2)、(xNbB3,yNbB3)和变量
Figure BDA0003589234600000485
Figure BDA0003589234600000486
导出如下:
(xA0,yA0)=(xCb-1,yCb+cbHeight) (8-501)
(xA1,yA1)=(xCb-1,yCb+cbHeight-1) (8-502)
(xA2,yA2)=(xCb-1,yCb) (8-503)
(xB0,yB0)=(xCb+cbWidth,yCb-1) (8-504)
(xB1,yB1)=(xCb+cbWidth-1,yCb-1) (8-505)
(xB2,yB2)=(xCb-1,yCb-1) (8-506)
(xB3,yB3)=(xCb,yCb-1) (8-507)
[[numSbXAff=cbWidth>>2 (8-508)
numSbYAff=cbHeight>>2 (8-509)]]
3.当sps_affine_enabled_flag等于1时,将变量availableFlagA设置为等于假,并且以下适用于(xNbAk,yNbAk)从(xNbA0,yNbA0)到(xNbA1,yNbA1):
8.当numCurrMergeCand小于MaxNumSubblockMergeCand时,将重复以下操作,直到numCurrMergeCand等于MaxNumSubblockMergeCand,其中mvZero[0]和mvZero[1]两者都等于0:
–参考索引、预测列表利用标志和zeroCandm的运动矢量导出如下,其中m等于(numCurrMergeCand-numOrigMergeCand):
refIdxL0ZeroCandm=0 (8-515)
predFlagL0ZeroCandm=1 (8-516)
cpMvL0ZeroCandm[0]=mvZero (8-517)
cpMvL0ZeroCandm[1]=mvZero (8-518)
cpMvL0ZeroCandm[2]=mvZero (8-519)
refIdxL1ZeroCandm=(slice_type==B)?0:-1 (8-520)
predFlagL1ZeroCandm=(slice_type==B)?1:0 (8-521)
cpMvL1ZeroCandm[0]=mvZero (8-522)
cpMvL1ZeroCandm[1]=mvZero (8-523)
cpMvL1ZeroCandm[2]=mvZero (8-524)
motionModelIdcZeroCandm=1 (8-525)
bcwIdxZeroCandm=0 (8-526)
–在subblockMergeCandList的末尾处添加具有m等于(numCurrMergeCand-numOrigMergeCand)的候选zeroCandm,并将numCurrMergeCand增加1,如下所示:
subblockMergeCandList[numCurrMergeCand++]=zeroCandm(8-527)
变量refIdxL0、refIdxL1、predFlagL0[xSbIdx][ySbIdx]、predFlagL1[xSbIdx][ySbIdx]、mvL0[xSbIdx][ySbIdx]、mvL1[xSbIdx][ySbIdx]、mvCL0[xSbIdx][ySbIdx]以及mvCL1[xSbIdx][ySbIdx]的导出如下,其中xSbIdx=0..numSbX-1,ySbIdx=0..numSbY-1:
–如果subblockMergeCandList[merge_subblock_idx[xCb][yCb]]等于SbCol,
Figure BDA0003589234600000501
Figure BDA0003589234600000502
将双向预测权重索引bcwIdx设置为0,并且以下适用,其中X为0或1:
refIdxLX=refIdxLXSbCol (8-528)
–对于xSbIdx=0..numSbX-1,ySbIdx=0..numSbY-1,以下适用:
predFlagLX[xSbIdx][ySbIdx]=predFlagLXSbCol[xSbIdx][ySbIdx] (8-529)
mvLX[xSbIdx][ySbIdx][0]=mvLXSbCol[xSbIdx][ySbIdx][0] (8-530)
mvLX[xSbIdx][ySbIdx][1]=mvLXSbCol[xSbIdx][ySbIdx][1] (8-531)
–当predFlagLX[xSbIdx][ySbIdx]等于1时,调用条款8.5.2.13中的色度运动矢量的导出过程,其中mvLX[xSbIdx][ySbIdx]和refIdxLX作为输入并且输出为mvCLX[xSbIdx][ySbIdx]。
–对x=xCb..xCb+cbWidth–1以及y=yCb..yCb+cbHeight–1,进行以下分配:
MotionModelIdc[x][y]=0 (8-532)
–否则(subblockMergeCandList[merge_subblock_idx[xCb][yCb]]不等于SbCol),
Figure BDA0003589234600000503
Figure BDA0003589234600000504
以下适用,其中X为0或1:
–进行以下分配,其中N为子块Merge候选列表subblockMergeCandList(N=subblockMergeCandList[merge_subblock_idx[xCb][yCb]])中的位置merge_subblock_idx[xCb][yCb]处的候选:
图10是示出了可实现本文中所公开的各种技术的示例视频处理系统1000的框图。各种实现方式可以包括系统1000的一些或全部组件。系统1000可以包括用于接收视频内容的输入1002。视频内容可以以原始或未压缩的格式(例如,8或10位多分量像素值)接收,或者可以以压缩或编码的格式接收。输入1002可以代表网络接口、外围总线接口或存储接口。网络接口的示例包括有线接口(诸如以太网、无源光网络(PON)等)和无线接口(诸如Wi-Fi或蜂窝接口)。
系统1000可以包括可以实现本文档中描述的各种编解码或编码方法的编解码组件1004。该编解码组件1004可以将视频的平均比特率从编解码组件1004的输入1002降低到编解码组件1004的输出,以产生视频的编解码表示。因此,编解码技术有时称为视频压缩或视频转码技术。编解码组件1004的输出可以被存储或经由如组件1006所表示的所连接的通信来发送。在输入1002处接收到的视频的存储或通信的比特流(或编解码)表示可以由用于生成像素值或可显示视频的组件1008来使用,该像素值或可显示视频被发送到显示接口1010。从比特流表示中生成用户可见视频的过程有时称为视频解压缩。此外,尽管某些视频处理操作被称为“编解码”操作或工具,但是将理解的是,编码工具或操作在编码器处使用,并且与编码结果相反的对应解码工具或操作将由解码器执行。
外围总线接口或显示接口的示例可以包括通用串行总线(USB)或高清多媒体接口(HDMI)或显示端口等。存储接口的示例包括SATA(串行高级技术附件)、PCI、IDE接口等。本文档中描述的技术可以实施在各种电子设备中,诸如移动电话、膝上型计算机、智能电话或其他能够执行数字数据处理和/或视频显示的设备。
图11是视频处理装置1100的框图。装置1100可以用于实现本文中描述的一种或多种方法。装置1100可以实施在智能手机、平板电脑、计算机、物联网(IoT)接收器等中。装置1100可以包括一个或多个处理器1102、一个或多个存储器1104和视频处理硬件1106。(多个)处理器1102可以被配置为实现本文档中描述的一种或多种方法。存储器(多个存储器)1104可以用于存储用于实现本文中描述的方法和技术的数据和代码。视频处理硬件1106可以用于在硬件电路中实现本文档中描述的一些技术。在一些实施例中,硬件1106可以全部或部分在处理器1101中,例如作为图形处理器。
图16是图示了可以利用本公开的技术的示例视频编解码系统100的框图。
如图16中所示,视频编解码系统100可以包括源设备110和目的地设备120。源设备110生成可以被称为视频编码设备的编码视频数据。目的地设备120可以对由源设备110生成的编码视频数据进行解码,该源设备110可以被称为视频解码设备。
源设备110可以包括视频源112、视频编码器114和输入/输出(I/O)接口116。
视频源112可以包括源(诸如视频捕获设备、从视频内容提供商接收视频数据的接口、和/或用于生成视频数据的计算机图形系统、或这些源的组合)。视频数据可以包括一个或多个图片。视频编码器114对来自视频源112的视频数据进行编码以生成比特流。该比特流可以包括形成视频数据的编解码表示的比特序列。该比特流可以包括编解码图片和相关联的数据。编解码图片是图片的编解码表示。相关联的数据可以包括序列参数集、图片参数集和其他语法结构。I/O接口116可以包括调制器/解调器(调制解调器)和/或发送器。编码视频数据可以经由I/O接口116通过网络130a直接发送到目的地设备120。编码视频数据还可以储存到存储介质/服务器130b上,以供目的地设备120接入。
目的地设备120可以包括I/O接口126、视频解码器124和显示设备122。
I/O接口126可以包含接收器和/或调制解调器。I/O接口126可以从源设备110或存储介质/服务器130b获取编码的视频数据。视频解码器124可以对编码视频数据进行解码。显示设备122可以将解码的视频数据显示给用户。显示设备122可以与目的地设备120集成在一起,或者可以在目的地设备120外部,该目的地设备120被配置为与外部显示设备接口连接。
视频编码器114和视频解码器124可以根据视频压缩标准(诸如高效视频编解码(HEVC)标准、通用视频编解码(VVC)标准和其他当前和/或进一步标准)进行操作。
图17是图示了视频编码器200的示例的框图,该视频编码器可以是图16中所示的系统100中的视频编码器114。
视频编码器200可以被配置为执行本公开的任何或全部技术。在图17的示例中,视频编码器200包括多个功能组件。本公开中描述的技术可以在视频编码器200的各个组件之间共享。在一些示例中,处理器可以被配置为执行本公开中描述的任何或所有技术。
视频编码器200的功能组件可以包括分割单元201、预测单元202(其可以包含模式选择单元203的预测单元202、运动估计单元204、运动补偿单元205和帧内预测单元206)、残差生成单元207、变换单元208、量化单元209、逆量化单元210、逆变换单元211、重构单元212、缓冲器213和熵编码单元214。
在其他示例中,视频编码器200可包含更多、更少或不同的功能组件。在一个示例中,预测单元202可以包含帧内块复制(IBC)单元。该IBC单元可以在IBC模式下执行预测,在该IBC模式中至少一个参考图片是当前视频块所在的图片。
此外,诸如运动估计单元204和运动补偿单元205的一些组件可以高度集成,但是为了解释的目的在图17的示例中分别表示。
分割单元201可以将图片分割为一个或多个视频块。视频编码器200和视频解码器300可以支持各种视频块尺寸。
模式选择单元203可以例如基于错误结果来选择帧内或帧间编解码模式中的一种,并且将得到的帧内或帧间编解码块提供给残差生成单元207以生成残差块数据,并且将得到的帧内或帧间编解码块提供给重构单元212来重构编码块以用作参考图片。在一些示例中,模式选择单元203可以选择帧内预测和帧间预测的组合(CIIP)模式,在该组合模式中,该预测是基于帧间预测信令和帧内预测信令。在帧间预测的情况下,模式选择单元203还可以为该块选择运动矢量(例如,子像素或整数像素精度)的分辨率。
为了对当前视频块执行帧间预测,运动估计单元204可以通过将来自缓冲器213的一个或多个参考帧与当前视频块进行比较来生成当前视频块的运动信息。运动补偿单元205可以基于来自缓冲器213的除与当前视频块相关联的图片以外的图片的解码样点和运动信息来确定当前视频块的预测视频块。
例如,取决于当前视频块是在I条带,P条带还是B条带中,运动估计单元204和运动补偿单元205可以对当前视频块执行不同的操作。
在一些示例中,运动估计单元204可以对当前视频块执行单向预测,并且运动估计单元204可以搜索用于当前视频块的参考视频块的列表0或列表1的参考图片。然后,运动估计单元204可以生成指示包含参考视频块的列表0或列表1中的参考图片的参考索引、以及指示当前视频块和参考视频块之间的空间位移的运动矢量。运动估计单元204可以输出参考索引、预测方向指示符和运动矢量作为当前视频块的运动信息。运动补偿单元205可以基于由当前视频块的运动信息指示的参考视频块来生成当前块的预测视频块。
在其他示例中,运动估计单元204可以对当前视频块执行双向预测,运动估计单元204可以搜索用于当前视频块的参考视频块的列表0中的参考图片,并且还可以搜索用于当前视频块的另一参考视频块的列表1中的参考图片。然后运动估计单元204可以生成指示包含参考视频块的列表0和列表1中的参考图片的参考索引、和指示参考视频块与当前视频块之间的空间位移的运动矢量。运动估计单元204可以输出作为当前视频块的运动信息的当前视频块的运动矢量和参考索引。运动补偿单元205可以基于由当前视频块的运动信息指示的参考视频块来生成当前视频块的预测视频块。
在一些示例中,运动估计单元204可以输出运动信息的全集合以用于解码器的解码处理。
在一些示例中,运动估计单元204可以不输出当前视频的运动信息的全集合。而是,运动估计单元204可以参考另一视频块的运动信息来信令通知当前视频块的运动信息。例如,运动估计单元204可以确定当前视频块的运动信息与相邻视频块的运动信息充分相似。
在一个示例中,运动估计单元204可以在与当前视频块相关联的语法结构中指示一个值,该值向视频解码器300指示当前视频块具有与另一视频块相同的运动信息。
在另一示例中,运动估计单元204可以在与当前视频块相关联的语法结构中标识另一个视频块和运动矢量差(MVD)。该运动矢量差指示当前视频块的运动矢量与指示的视频块的运动矢量之间的差。视频解码器300可以使用所指示的视频块的运动矢量和运动矢量差来确定当前视频块的运动矢量。
如上所讨论的,视频编码器200可以预测性地信令通知运动矢量。可由视频编码器200实现的预测信令通知技术的两个示例包含高级运动矢量预测(AMVP)和Merge模式信令通知。
帧内预测单元206可以对当前视频块执行帧内预测。当帧内预测单元206对当前视频块执行帧内预测时,帧内预测单元206可以基于相同图片中的其他视频块的解码样点来生成当前视频块的预测数据。当前视频块的预测数据可以包括预测视频块和各种语法元素。
残差生成单元207可以通过从当前视频块中减去(例如,由负号指示)当前视频块的(多个)预测视频块来生成当前视频块的残差数据。当前视频块的残差数据可以包括对应于当前视频块中的样点的不同样点分量的残差视频块。
在其他示例中,例如在跳过模式下,对于当前视频块可以没有当前视频块的残差数据,并且残差生成单元207可以不执行减法操作。
变换处理单元208可通过将一个或多个变换应用于与当前视频块相关联的残差视频块来生成当前视频块的一个或多个变换系数视频块。
在变换处理单元208生成与当前视频块相关联的变换系数视频块之后,量化单元209可以基于与当前视频块相关联的一个或多个量化参数(QP)值来量化与当前视频块相关联的变换系数视频块。
逆量化单元210和逆变换单元211可以分别将逆量化和逆变换应用于变换系数视频块,以从变换系数视频块重构残差视频块。重构单元212可将重构的残差视频块添加到由预测单元202生成的一个或多个预测视频块的对应样点,以产生与当前块相关联的重构视频块,用于存储在缓冲器213中。
在重构单元212重构视频块之后,可以执行环路滤波操作以减少视频块中的视频成块化伪影。
熵编码单元214可以从视频编码器200的其他功能组件接收数据。当熵编码单元214接收数据时,熵编码单元214可以执行一个或多个熵编码操作以生成熵编码数据并且输出包括熵编码数据的比特流。
图18是图示了视频解码器300的示例的框图,该视频解码器300可以是图16中所示的系统100中的视频解码器114。
视频解码器300可以被配置为执行本公开的任何或所有技术。在图18的示例中,视频解码器300包括多个功能组件。本公开中描述的技术可以在视频解码器300的各个组件中进行共享。在一些示例中,处理器可以被配置为执行本公开中描述的任何或所有技术。
在图18的示例中,视频解码器300包括熵解码单元301、运动补偿单元302、帧内预测单元303、逆量化单元304、逆变换单元305以及重构单元306和缓冲器307。在一些示例中,视频解码器300可以执行通常与关于视频编码器200(例如,图17)描述的编码过程反演的解码过程。
熵解码单元301可以撷取编码比特流。该编码比特流可以包括熵编码视频数据(例如,视频数据的编码块)。熵解码单元301可以对熵编码的视频数据进行解码,并且运动补偿单元302可以从熵解码的视频数据中确定包含运动矢量、运动矢量精度、参考图片列表索引和其他运动信息的运动信息。运动补偿单元302可以例如通过执行AMVP和Merge模式来确定这样的信息。
运动补偿单元302可以产生运动补偿块,可能基于插值滤波器执行插值。语法元素中可以包含要与子像素精度一起使用的插值滤波器的标识符。
运动补偿单元302可以在视频块的编码期间使用如由视频编码器20使用的插值滤波器,以计算参考块的子整数像素的插值的值。运动补偿单元302可根据接收到的语法信息来确定由视频编码器200使用的插值滤波器,并使用插值滤波器来产生预测块。
运动补偿单元302可以使用一些语法信息来确定用于对编码视频序列的(多个)帧和/或(多个)条带进行编码的块的尺寸、描述如何分割编码的视频序列的图片的每个宏块的分割信息、指示如何编码每个分割的模式、每个帧间编码块的一个或多个参考帧(和参考帧列表)以及用于对编码视频序列进行解码的其他信息。
帧内预测单元303可以使用例如在比特流中接收的帧内预测模式,以从空间上相邻的块形成预测块。逆量化单元303对在比特流中提供的且由熵解码单元301解码的量化视频块系数进行逆量化(即,反量化)。逆变换单元303应用逆变换。
重构单元306可以将残差块与由运动补偿单元202或帧内预测单元303生成的对应预测块相加以形成解码块。如果需要的话,还可以应用去块滤波器来对解码块进行滤波,以移除块状伪影。然后将解码的视频块储存在缓冲器307中,该缓冲器为随后的运动补偿提供参考块。
所公开的技术的一些实施例包括做出决定或确定以启用视频处理工具或模式。在示例中,当启用视频处理工具或模式时,编码器将在视频的块的处理中使用或实现该工具或模式,但不一定基于该工具或模式的使用来修改得到的比特流。也就是说,当基于该决定或确定来启用视频处理工作或模式时,从视频的块到视频的比特流表示的转换将使用该视频处理工具或模式。在另一示例中,当启用视频处理工具或模式时,解码器将在知道比特流已经基于视频处理工具或模式被修改的情况下处理比特流。也就是说,将使用基于该决定或确定而启用的视频处理工具或模式来执行从视频的比特流表示到视频的块的转换。
所公开的技术的一些实施例包括作出决定或确定以禁用视频处理工具或模式。在示例中,当禁用视频处理工具或模式时,编码器将在视频的块到视频的比特流表示的转换中不使用该工具或模式。在另一示例中,当禁用视频处理工具或模式时,解码器将在知道比特流已经使用基于该决定或确定而启用的视频处理工具或模式来修改的情况下处理比特流。
在本文档中,术语“视频处理”可以指视频编码、视频解码、视频压缩或视频解压缩。例如,可以在从视频的像素表示到对应的比特流表示的转换期间应用视频压缩算法,反之亦然。如由语法所定义,当前视频块的比特流表示可以例如对应于在比特流内共位的或在不同地方散布的位。例如,可以根据变换和编解码的错误残差值并且还使用比特流中的头和其他字段中的位来对宏块进行编码。
在一些实施例中,可以实现以下第一组条款。
可以将以下条款与在上一节中列出的项目(例如,项目1)中描述的附加技术一起实现。
1.一种视频处理的方法(例如,图12中所示的方法1200),包括:对于在包括亮度块和与所述亮度块共位的色度块的视频单元与所述视频单元的编解码表示之间的转换,确定(1202)用于通过将色度权重与用于所述亮度块的转换的亮度权重对准,使用三角形分割模式(TPM)的所述色度块的转换的所述色度权重;以及基于所述确定的结果执行(1204)所述转换。
2.根据条款1所述的方法,其中,所述色度权重被确定为所述亮度权重的函数。
3.根据条款1-2中任一项所述的方法,其中,所述色度权重是所述亮度权重的子集。
4.根据条款1-3中任一项所述的方法,其中,对于与所述色度块重合的所述亮度块的相等尺寸的部分,色度权重等于亮度权重。
以下条款可以与在上一节中列出的项目(例如,项目2)中描述的附加技术一起实现。
5.一种视频处理的方法,包括:对于在包括亮度块和与所述亮度块共位的色度块的视频单元与所述视频单元的编解码表示之间的转换,基于所述亮度块的特征或所述视频单元的特征来确定用于使用三角形分割模式(TPM)的所述色度块的转换的色度权重;以及基于所述确定的结果执行所述转换。
6.根据条款5所述的方法,其中,所述亮度块的特征包括所述亮度块的高度或宽度。
7.根据条款5-6中任一项所述的方法,其中,所述视频单元的特征包括所述视频单元的色彩格式或所述视频单元的色度子采样率。
8.根据条款5-7中的任一项所述的方法,其中,所述色度权重还取决于所述色度块的色彩分量标识。
以下条款可以与在上一节中列出的项目(例如,项目3)中描述的附加技术一起实现。
9.根据条款1-8中的任一项所述的方法,其中,所述色度权重和/或所述亮度权重等于整数。
以下条款可以与在上一节中列出的项目(例如,项目4)中描述的附加技术一起实现。
10.一种视频处理的方法,包括:对于包括亮度块和与所述亮度块共位的色度块的视频的视频单元与所述视频单元的编解码表示之间的转换,基于所述视频单元的特征确定三角形分割模式(TPM)是否用于所述转换;以及基于所述确定的结果执行所述转换。
11.根据条款10所述的方法,其中,所述特征是维度比等于max(H,W)/min(H,W),其中max和min是最大函数和最小函数,并且H和W是所述视频单元的以像素为单位的高度和宽度。
12.根据条款10所述的方法,其中,所述特征是维度比等于Abs(Log2(cbWidth)-Log2(cbHeight)),其中Abs是绝对函数,cbWidth和cbHeight是所述色度块的像素宽度和像素高度。
13.根据条款10所述的方法,其中,所述确定的结果是由于所述维度比大于2而禁用了所述TPM。
以下条款可以与在上一节中列出的项目(例如,项目5)中描述的附加技术一起实现。
14.根据条款10所述的方法,其中,所述视频单元的特征包括用于所述视频的转换的最大变换尺寸。
15.根据条款14所述的方法,其中,由于所述视频单元的高度或宽度大于所述最大变换尺寸,因此所述确定禁用所述TPM的使用。
以下条款可以与在上一节中列出的项目(例如,项目6)中描述的附加技术一起实现。
16.根据条款10所述的方法,其中,所述视频单元的特征包括在所述视频的转换期间使用的最大编解码单元尺寸。
17.根据条款16所述的方法,其中,由于所述视频单元的高度或宽度等于所述最大编解码单元尺寸,因此所述确定禁用所述TMP的使用。
以下条款可以与在上一节中列出的项目(例如,项目7)中描述的附加技术一起实现。
18.根据条款10所述的方法,其中,所述视频单元的特征包括所述视频单元的高度或宽度,并且其中,由于所述高度大于N或所述宽度大于M,因此所述确定禁用TMP的使用。
以下条款可以与在上一节中列出的项目(例如,项目8)中描述的附加技术一起实现。
19.根据条款10所述的方法,其中,所述视频单元的特征包括所述视频单元的高度或宽度,并且其中,由于所述高度为N或所述宽度为M,因此所述确定禁用TMP的使用。
以下条款可以与在上一节中列出的项目(例如,项目9)中描述的附加技术一起实现。
20.根据条款10所述的方法,其中,所述视频单元的特征包括所述视频单元的色度格式,并且其中,由于所述色度格式是特定格式,因此所述确定禁用TMP的使用。
21.根据条款20所述的方法,其中,所述特定格式是4:0:0。
以下条款可以与在上一节中列出的项目(例如,项目10)中描述的附加技术一起实现。
22.根据条款1所述的方法,其中,所述视频单元的特征包括在所述视频单元的转换中使用的参考图片的分辨率,并且其中,由于所述分辨率彼此不同,因此所述确定禁用TMP的使用。
以下条款可以与在上一节中列出的项目(例如,项目11)中描述的附加技术一起实现。
23.根据以上条款中的任一项所述的方法,其中,在确定禁用所述TPM模式的情况下,所述编解码表示省略用于TMP语法元素的语法元素。
24.根据条款1至23中的任一项所述的方法,其中,所述转换包括将所述视频编码为所述编解码表示。
25.根据条款1至23中的任一项所述的方法,其中,所述转换包括对所述编解码表示进行解码以生成所述视频的像素值。
26.一种视频解码装置,包括被配置为实现条款1至25中的一项或多项所述的方法的处理器。
27.一种视频编码装置,包括被配置为实现条款1至25中的一项或多项所述的方法的处理器。
28.一种其上存储有计算机代码的计算机程序产品,所述代码在由处理器执行时使所述处理器实现条款1至25中任一项所述的方法。
29.本文档中描述的方法、装置或系统。
第二组条款描述了在上一节中公开的技术的某些特征和方面(例如,项目15)。
1.一种视频处理的方法(例如,在图19中所示的方法1900),包括:根据规则执行(1910)在视频的当前视频块和所述视频的比特流表示之间的转换,其中分割预测模式用于对所述当前视频块进行编解码,其中将所述当前视频块的最终预测确定为所述当前视频块的两个或更多个预测的加权和;其中所述分割预测模式是基于多个第一分割方案的第一模式或基于多个第二分割方案的第二模式;以及其中所述规则指定用于使用所述第一模式或所述第二模式进行编解码的编解码操作。
2.根据条款1所述的方法,其中,所述第一模式是三角形分割模式,并且所述第二模式是几何分割模式。
3.根据条款1或2所述的方法,其中,所述多个第一分割方案是所述多个第二分割方案的子集。
4.根据条款2所述的方法,其中,所述几何分割模式包括所述多个第二分割方案,并且其中,所述多个第二分割方案中的至少一个将所述当前视频块分为两个子分割,使得所述两个子分割中的至少一个是非正方形的和非矩形的。
5.根据条款2所述的方法,其中,所述几何分割模式包括三角形分割模式。
6.根据条款1所述的方法,其中,所述第一模式是三角形分割模式,并且所述第二模式是非三角形分割模式。
7.根据条款1所述的方法,其中,所述分割预测模式是几何分割模式,所述几何分割模式将作为矩形块的所述当前视频块划分为两个三角形子分割或两个非三角形子分割。
8.根据条款1所述的方法,其中,所述规则指定将所述第一模式和所述第二模式信令通知为单个模式。
9.根据条款8所述的方法,其中,所述第一模式和所述第二模式以序列参数集(SPS)、视频参数集(VPS)、活动参数集(APS)、图片参数集(PPS)、条带、子图片、片、砖、虚拟流水线数据单元(VPDU)、编解码树单元(CTU)、变换单元(TU)、编解码单元(CU)、预测单元(PU)、图片头或条带头级别来共享相同的控制标志。
10.根据条款8所述的方法,其中,将所述第一模式信令通知为所述第二模式的子集。
11.根据条款10所述的方法,其中,所述第二模式定义为包含N个子模式并表示为{M0,M1,M2,…,MN-1}的预测模式,并且所述第一模式定义为包含X个子模式并表示为{M0,Mk0,Mk1,…,MkX-1}的另一预测模式,其中{M0,Mk0,Mk1,…,MkX-1}是{M0,M1,M2,…,MN-1}的子集,其中N是大于1且大于X的整数。
12.根据条款5所述的方法,其中,信令通知第一语法元素以指示是否应用所述第二模式和/或信令通知第二语法元素以指示是否应用所述第一模式。
13.根据条款1所述的方法,其中,所述规则指定所述第一模式和所述第二模式共享用于计算用于确定所述最终预测的混合权重掩码的逻辑。
14.根据条款1所述的方法,其中,所述规则指定所述第一模式和所述第二模式共享用于计算用于存储运动的运动存储掩码的逻辑。
15.根据条款13或14所述的方法,其中,对于所述第一模式和所述第二模式,使用相同的表来导出所述混合权重掩码或所述运动存储掩码。
16.根据条款1至15中的任一项所述的方法,其中,所述转换包括将所述视频编码为所述比特流表示。
17.根据条款1至15中的任一项所述的方法,其中,所述转换包括将所述比特流表示解码以生成所述视频。
18.一种视频处理装置,包括:处理器,被配置为实现条款1至17中的任意一项或多项所述的方法。
19.一种存储程序代码的计算机可读介质,所述程序代码在被执行时使处理器实现条款1至17中的任意一项或多项所述的方法。
20.一种计算机可读介质,所述计算机可读介质存储根据上述方法中的任意方法生成的编解码表示或比特流表示。
第三组条款描述了在上一节中公开的技术的某些特征和方面(例如,项目16至项目18)。
1.一种视频处理的方法,包括:执行在视频的当前视频块和所述视频的比特流表示之间的转换,其中,在所述转换期间,将所述当前视频块的预测确定为所述当前视频块的两个或更多个预测的加权和,并且根据规则确定所述当前视频块的运动矢量存储过程,其中所述当前视频块使用分割预测模式,所述分割预测模式是基于多个第一分割方案的第一模式,或者是基于多个第二分割方案的第二模式,并且其中所述规则指定对于所述第一模式或所述第二模式的用于确定存储哪个运动矢量和多少个运动矢量的过程是相同的。
2.根据条款1所述的方法,其中,所述分割预测模式是几何分割模式,所述几何分割模式将作为矩形块的所述当前视频块划分为两个三角形子分割或两个非三角形子分割。
3.根据条款1所述的方法,其中,所述第一模式和所述第二模式包括将所述当前视频块分割为两个或更多个分割。
4.根据条款3所述的方法,其中,由所述当前视频块的分割而导致的至少一个分割具有带角度的边缘。
5.根据条款1所述的方法,其中,所述第一模式是三角形分割模式,并且所述第二模式是几何分割模式。
6.根据条款1所述的方法,其中,所述第一模式是三角形分割模式,并且所述第二模式是非三角形分割模式。
7.根据条款5所述的方法,其中,所述几何分割模式包括所述多个第二分割方案,并且其中所述多个第二分割方案中的至少一个将所述当前视频块分为两个子分割,使得所述两个子分割中的至少一个是非正方形的和非矩形的。
8.根据条款5所述的方法,其中,所述几何分割模式包括三角形分割模式。
9.根据条款1所述的方法,其中,所述规则指定对于所述当前视频块存储两个帧间预测的分割中的哪个运动矢量。
10.根据条款1所述的方法,其中,所述规则指定对于所述当前视频块是否存储L0运动矢量或L1运动矢量中的至少一者。
11.根据条款1所述的方法,其中,所述规则指定仅存储所述当前视频块的宽度和高度的可允许组合的所述运动矢量。
12.根据条款1所述的方法,其中,所述规则指定所存储的运动矢量的每个元素指示i)两个或更多个分割之一的一个或多个运动矢量,ii)多个运动矢量,和/或iii)为所述当前视频块的N×N个子块存储帧间预测方向,其中N是大于0的整数。
13.根据条款12所述的方法,其中,N等于4。
14.根据条款1所述的方法,其中,所述规则指定基于N个预定义表计算存储逻辑、规则和/或过程的所述运动矢量,其中N是大于0的整数。
15.根据条款1所述的方法,其中,所述规则指定使用计算等式来计算存储逻辑、规则和/或过程的所述运动矢量。
16.一种视频处理的方法,包括:执行在视频的当前块与所述视频的比特流表示之间的转换,其中,在所述转换期间,使用4×4单元中的运动信息来确定用于当前块的预测块,并且其中使用分割模式对所述当前块进行编解码。
17.根据条款16所述的方法,其中,通过使用所述分割模式将所述当前视频块分割为两个或更多个分割。
18.根据条款16所述的方法,其中,所述分割模式是几何分割模式,其包括多个分割方案,并且其中所述多个分割方案中的至少一个将所述当前视频块分为两个子分割,使得所述两个子分割中的至少一个是非正方形的和非矩形的。
19.根据条款18所述的方法,其中,所述几何分割模式包括三角形分割模式。
20.根据条款16所述的方法,其中,所述分割模式为几何分割模式,所述几何分割模式将作为矩形块的所述当前视频块划分为两个三角形子分割或两个非三角形子分割。
21.根据条款16所述的方法,其中,由所述分割模式得到的至少一个分割具有带角度的边缘。
22.根据条款16所述的方法,其中,所述分割模式是三角形分割模式或几何分割模式。
23.根据条款17所述的方法,其中,所述两个或更多个分割中的至少一个具有用于运动补偿的对应运动矢量。
24.根据条款16所述的方法,其中,所述4×4单元包括为空域或时域运动矢量候选而存储的所述当前视频块的运动矢量。
25.根据条款16所述的方法,其中,所述当前视频块的4x4子块中的每一个具有其自身的运动矢量,所述运动矢量存储在缓冲器中。
26.一种视频处理的方法,包括:执行在视频的当前块和所述视频的比特流表示之间的转换,其中,使用分割模式编解码所述当前块,其中,在所述转换期间,根据规则通过在所述当前视频块的混合区域中混合两个或更多个预测来确定所述当前块的预测块,并且其中所述规则指定为属于所述当前视频块的混合区域的子块来存储L0运动矢量和L1运动矢量。
27.根据条款26所述的方法,其中,通过使用所述分割模式将所述当前视频块分割为两个或更多个分割。
28.根据条款26所述的方法,其中,所述分割模式是几何分割模式,所述几何分割模式包括多个分割方案,并且其中至少一个分割方案将所述当前视频块分为两个子分割,使得所述两个子分割中的至少一个是非正方形的和非矩形的。
29.根据条款28所述的方法,其中,所述几何分割模式包括三角形分割模式。
30.根据条款26所述的方法,其中,由所述分割模式得到的至少一个分割具有带角度的边缘。
31.根据条款26所述的方法,其中,所述分割模式是三角形分割模式或几何分割模式。
32.根据条款27所述的方法,其中,所述混合区域指示被所述两个或更多个分割重叠的区域。
33.根据条款26所述的方法,其中,在被应用于生成所述混合区域内的4x4子块的最终预测作为预测样点的加权和的加权过程中,在所述混合区域内的所述4x4子块的预测样点的权重均不等于0。
34.根据条款26所述的方法,其中,所述规则指定对于所述当前视频块的混合区域之外的4x4子块,存储分割的单向预测运动矢量。
35.根据条款27所述的方法,其中,所述规则指定对于属于所述当前视频块的混合区域的4x4子块,存储所述两个或更多个分割的双向预测运动矢量。
36.根据条款35所述的方法,其中,所述规则指定在两个分割具有来自同一方向的运动矢量的情况下,为所述子块存储两个运动矢量中的最小、最大、平均或加权运动矢量之一。
37.根据条款35所述的方法,其中,所述规则指定在两个分割具有来自同一方向的运动矢量的情况下,为所述子块存储所述两个分割的预定义运动矢量。
38.根据条款1至37中的任一项所述的方法,其中,执行所述转换包括从所述当前视频块生成所述编解码表示。
39.根据条款1至37中的任一项所述的方法,其中,执行所述转换包括从所述编解码表示生成所述当前视频块。
40.一种视频处理装置,包括被配置为实现条款1至39中的任一项或多项所述的方法的处理器。
41.一种存储程序代码的计算机可读介质,所述程序代码在被执行时使处理器实现条款1至39中任意一项或多项所述的方法。
42.一种计算机可读介质,所述计算机可读介质存储根据上述方法中的任一种而生成的编解码表示或比特流表示。
第四组条款描述了在上一节中公开的技术的某些特征和方面(例如,项目19和项目20)。
1.一种视频处理的方法(例如,图20A中所示的方法2010),包括:对于视频的当前视频块与所述视频的比特流表示之间的转换,根据由于使用所述当前视频块的分割预测模式而产生的规则,作出(2012)确定以将去块过程应用于所述当前视频块内的边界;以及根据所述确定执行(2014)所述转换,其中,使用所述分割预测模式包括,将所述当前视频块的最终预测确定为所述当前视频块的两个或更多个预测的加权和。
2.根据条款1所述的方法,其中,所述当前视频块被划分两个或更多个分割。
3.根据条款1所述的方法,其中,所述分割预测模式是第一模式或第二模式,在所述第一模式中所述两个或更多个预测基于多个第一分割方案,在所述第二模式中所述两个或更多个预测基于多个第二分割方案。
4.根据条款1所述的方法,其中,所述分割预测模式是基于多个第一分割方案的第一模式或基于多个第二分割方案的第二模式。
5.根据条款1所述的方法,其中,所述第一模式是三角形分割模式,并且所述第二模式是几何分割模式。
6.根据条款5所述的方法,其中,所述几何分割模式包括多个第二分割方案,并且所述多个第二分割方案中的至少一个将所述当前视频块分为两个子分割,使得所述两个子分割中的至少一个是非正方形的和非矩形的。
7.根据条款5所述的方法,其中,所述几何分割模式包括三角形分割模式。
8.根据条款1所述的方法,其中,所述规则指定在边缘为变换单元(TU)边缘并且所述两个子块之一具有非零系数的情况下,在所述当前视频块的两个子块上的边缘上应用所述去块过程,而无论所述两个子块之间是否存在运动差。
9.根据条款8所述的方法,其中,在所述两个子块中不存在非零系数。
10.根据条款9所述的方法,其中,所述规则指定在所述两个子块具有全零系数但所述两个子块的运动差大于某个值的情况下应用所述去块过程,应用所述去块过程。
11.根据条款9所述的方法,其中,所述规则指定在所述两个子块具有全零系数但所述两个子块的运动差大于某个值的情况下应用所述去块过程,不应用所述去块过程。
12.根据条款1所述的方法,其中,所述规则指定对于以所述分割预测模式编解码的所述当前视频块的两个子块的边缘是否触发所述去块过程取决于所述边缘是否对应于所述两个子块的变换单元(TU)边缘或运动矢量(MV)边缘。
13.根据条款12所述的方法,其中,所述规则指定在所述两个子块的运动差大于所述MV边缘的某个值的情况下触发所述去块过程。
14.根据条款12所述的方法,其中,所述规则指定在位于所述TU边缘的一侧的子块中存在非零系数的情况下触发所述去块过程。
15.根据条款1所述的方法,其中,所述规则指定在以下情况下,对于所述TU边缘和所述MV边缘两者的所述边缘触发所述去块过程:1)所述当前视频块的两个子块的运动差大于所述MV边缘的某个值,或者2)子块中存在非零系数。
16.根据条款8或12所述的方法,其中,所述变换单元(TU)边缘指示实际的变换单元边缘。
17.根据条款12所述的方法,其中,所述运动矢量(MV)边缘指示与滤波网格对准的预测单元(PU)边缘或子块边缘。
18.根据条款8、10、11、13、15中任一项所述的方法,其中,所述运动差包括:i)大于T的所述两个子块的运动矢量差,和/或ii)不同参考帧索引,和/或iii)不同参考POC(图片顺序计数),和/或iv)不同数量的参考帧。
19.一种视频处理的方法(例如,图20B中所示的方法2020),包括:对于视频的当前视频块和所述视频的比特流表示之间的转换,基于所述当前视频块的分割预测模式的类型,确定(2022)是否和/或如何将去块过程应用于所述当前视频块;以及根据所述确定执行(2024)所述转换,并且其中使用所述分割预测模式包括:将所述当前视频块的最终预测确定为所述当前视频块的两个或更多个预测的加权和。
20.根据条款19所述的方法,其中,所述分割预测模式的类型包括第一模式或第二模式,在所述第一模式中所述两个或更多个预测基于第一分割方案,在所述第二模式中所述两个或更多个预测基于第二分割方案。
21.根据条款19所述的方法,其中,所述第一模式是三角形分割模式,并且所述第二模式是几何分割模式。
22.根据条款19所述的方法,其中,在所述去块过程中对所述当前视频块的两个子块之间的边界进行滤波。
23.根据条款19所述的方法,其中,在所述去块过程中对跨所述当前视频块的两个分割的垂直或水平边界进行滤波。
24.根据条款19所述的方法,其中,边界强度等于1或2。
25.根据条款1至24中的任一项所述的方法,其中,执行所述转换包括从所述当前视频块生成所述编解码表示。
26.根据条款1至24中的任一项所述的方法,其中,执行所述转换包括从所述编解码表示生成所述当前视频块。
27.一种视频处理装置,包括:被配置为实现条款1至26中的任一项或多项所述的方法的处理器。
28.一种存储程序代码的计算机可读介质,所述程序代码在被执行时使处理器实现条款1至26中任一项或多项所述的方法。
29.一种计算机可读介质,所述计算机可读介质存储根据上述方法中的任一种生成的编解码表示或比特流表示。
第五组条款描述了在上一节中公开的技术的某些特征和方面(例如,项目21至项目29)。
1.一种视频处理的方法(例如,图21A中所示的方法2110),包括:对于视频的当前视频块和所述视频的比特流表示之间的转换,根据与所述当前视频块的最大和/或最小变换尺寸无关的规则,确定(2112)帧内子分割(ISP)模式的应用性;以及基于所述确定执行(2114)所述转换。
2.根据条款1所述的方法,其中,所述ISP模式包括将所述当前视频块分割为子块。
3.根据条款1所述的方法,其中,所述规则指定ISP标志的信令通知不取决于所述当前视频块的宽度是否小于或等于所述最大变换尺寸,和/或不取决于所述当前视频块的高度是否小于或等于所述最大变换尺寸。
4.根据条款1所述的方法,其中,所述规则指定ISP标志的信令通知不取决于所述当前视频块的宽度和高度的乘积是否大于所述最小变换尺寸的平方。
5.根据条款1所述的方法,其中,所述规则指定ISP标志的信令通知取决于所述当前视频块的宽度和高度的乘积是否大于N,其中N是大于0的整数。
6.根据条款5所述的方法,其中,N是固定值。
7.根据条款6所述的方法,其中,N为16。
8.根据条款5所述的方法,其中,N取决于视频单元的最小允许变换尺寸。
9.根据条款1所述的方法,其中,所述规则指定ISP标志的信令通知取决于所述当前视频块的宽度是否小于或等于N,和/或取决于所述当前视频块的高度是否小于或等于N。
10.根据条款9所述的方法,其中,N是固定值。
11.根据条款10所述的方法,其中,N为64。
12.根据条款9所述的方法,其中,N取决于视频单元的最大允许变换尺寸。
13.一种视频处理的方法(例如,图21B中所示的方法2120),包括:对于视频的当前视频块和所述视频的比特流表示之间的转换,由于所述当前视频块的尺寸大于适用于所述当前视频块的最大变换尺寸,确定(2122)要应用帧内子分割(ISP)模式;以及基于所述确定执行(2124)所述转换。
14.根据条款13所述的方法,其中,所述ISP模式包括将所述当前视频块分割为子块。
15.根据条款13所述的方法,其中,在使用所述ISP模式编解码的所述当前视频块大于所述最大变换尺寸的情况下,通过递归方式隐式划分所述当前视频块,直到子块的尺寸为64。
16.根据条款13所述的方法,其中,在使用所述ISP模式编解码的所述当前视频块大于所述最大变换尺寸的情况下,通过递归方式隐式划分所述当前视频块,直到子块的尺寸为所述最大变换尺寸。
17.一种视频处理的方法(例如,图21C中所示的方法2130),包括:对于视频的当前视频块和所述视频的比特流表示之间的转换,由于所述当前视频块的尺寸大于或等于128,确定(2132)将组合帧间和帧内预测(CIIP)模式或分割模式应用于所述当前视频块;以及基于所述确定执行(2134)所述转换。
18.根据条款17所述的方法,其中,所述尺寸是指所述当前视频块的宽度或高度。
19.根据条款17所述的方法,其中,所述尺寸是指所述当前视频块中的像素的总数。
20.根据条款17所述的方法,其中,所述CIIP模式包括使用加权系数来组合帧内预测信令和帧间预测信令,并且其中所述分割模式包括将所述当前视频块分割为两个或更多个分割,其中至少一个分割具有带角度的边缘。
21.根据条款17所述的方法,其中,所述分割模式包括三角形分割模式或几何分割模式。
22.根据条款21所述的方法,其中,所述几何分割模式包括多个分割方案,并且所述多个分割方案中的至少一个将所述当前视频块分为两个分割,使得所述两个分割中的至少一个是非正方形的和非矩形的。
23.根据条款21所述的方法,其中,所述几何分割模式包括三角形分割模式。
24.根据条款17所述的方法,其中,最大编解码树单元(CTU)尺寸被设置为大于128。
25.一种视频处理的方法,包括:执行在当前视频块和所述视频的比特流表示之间的转换,其中,所述比特流表示符合格式规则,所述格式规则基于所述当前视频块的尺寸来指定包括在所述比特流表示中的信息。
26.根据条款25所述的方法,其中,所述格式规则指定由于所述当前视频块的尺寸大于128,所以在所述比特流表示中包括Merge数据。
27.根据条款26所述的方法,其中,指示所述Merge数据的Merge标志取决于所述当前视频块的尺寸是否小于最大编解码树单元(CTU)尺寸。
28.根据条款25所述的方法,其中,所述格式规则指定由于所述当前视频块的维度大于128,而在所述比特流表示中包括cu_skip_flag或pred_mode_ibc_flag中的至少一个。
29.一种视频处理的方法,包括:执行在当前视频块和视频的比特流表示之间的转换,其中,所述比特流表示符合格式规则,所述格式规则指定,在所述当前视频块的宽度和/或高度等于或大于X的情况下,从所述比特流表示中省略指示使用帧内块复制(IBC)预测模式的语法元素,其中X是整数。
30.根据条款29所述的方法,其中,所述格式规则指定将所述语法元素的值推断为0。
31.根据条款29所述的方法,其中,所述格式规则指定所述IBC预测模式不用于所述当前视频块。
32.根据条款29所述的方法,其中,所述语法元素对应于pred_mode_ibc_flag。
33.根据条款29所述的方法,其中,X为64或128。
34.根据条款29所述的方法,其中,所述格式规则指定,在所述当前视频块的宽度和高度大于64的情况下,将所述语法元素的值推断为0。
35.根据条款29所述的方法,其中,所述格式规则指定,在所述当前视频块的宽度或高度大于64的情况下,将所述语法元素的值推断为0。
36.一种视频处理的方法(例如,图21D中所示的方法2140),包括:对于包括多个色彩分量的视频与所述视频的比特流表示之间的转换,根据规则确定(2142)在用于每个分量的去块过程中使用的去块参数偏移;以及基于所述确定执行(2144)所述转换,其中所述规则指定对于所述视频的每个分量,在图片级别和/或条带级别处的所述去块参数偏移是不同的。
37.根据条款36所述的方法,其中,所述规则进一步指定亮度分量、Cb分量和Cr分量的所述图片级别处的所述去块参数偏移是不同的,并且由不同的语法元素指示。
38.根据条款36所述的方法,其中,所述规则进一步指定联合编解码模式的所述图片级别处的所述去块参数偏移与非联合模式的所述去块参数偏移不同,并且由不同的语法元素指示,其中所述联合编解码模式共同为Cb分量和Cr分量生成所述当前视频块的预测残差块。
39.根据条款36所述的方法,其中,所述规则进一步指定亮度分量、Cb分量和Cr分量的所述条带级别处的所述去块参数偏移是不同的,并且由不同的语法元素指示。
40.根据条款36所述的方法,其中,所述规则进一步指定联合编解码模式的所述图片级别处的所述去块参数偏移与非联合模式的所述去块参数偏移不同,并由不同的语法元素指示,其中所述联合编解码模式共同为Cb分量和Cr分量生成所述当前视频块的预测残差块。
41.一种视频处理的方法(例如,图21E中所示的方法2150),包括:对于视频的色度视频块和所述视频的比特流表示之间的转换,基于根据规则确定的色度量化参数(QP)来导出(2152)色度去块参数,其中所述色度视频块属于编解码单元和条带;以及基于所述色度去块参数执行(2154)所述转换,并且其中所述规则指定所述色度QP是基于所述色度视频块的图片级别色度QP偏移和编解码单元级别色度QP偏移,但与条带级别色度QP偏移无关。
42.根据条款41所述的方法,其中所述规则进一步指定所述色度QP取决于pps_cb_qp_offset、pps_cr_qp_offset、pps_cbcr_qp_offset、CuQpOffsetCb、CuQpOffsetCr和CuQpOffsetCbCr,但与slice_cb_qp_offset、slice_cr_qp_offset和slice_cbcr_qp_offset无关,其中pps_cb_qp_offset、pps_cr_qp_offset、pps_cbcr_qp_offset指定分别在Qp′Cb、Qp′Cr和Qp′CbCr的导出中使用的所述图片级别上的偏移,并且CuQpOffsetCb、CuQpOffsetCr和CuQpOffsetCbCr指定当确定分别用于所述色度视频块的所述Qp′Cb、Qp′Cr和Qp′CbCr量化参数的相应值时要使用的值。
43.根据条款1至42中的任一项所述的方法,其中,执行所述转换包括从所述当前视频块生成所述编解码表示。
44.根据条款1至42中的任一项所述的方法,其中,执行所述转换包括从所述编解码表示生成所述当前视频块。
45.一种视频处理装置,包括被配置为实现条款1至44中的任一项或多项所述的方法的处理器。
46.一种存储程序代码的计算机可读介质,所述程序代码在被执行时使处理器实现条款1至44中的任意一项或多项所述的方法。
47.一种计算机可读介质,所述计算机可读介质存储根据上述方法中的任意方法生成的编解码表示或比特流表示。
本文档中描述的公开和其他解决方案、示例、实施例、模块和功能操作可以在数字电子电路、或计算机软件、固件或硬件中实现,包括本文档中所公开的结构及其结构等同物,或其中一个或多个的组合。公开的和其他实施例可以实现为一个或多个计算机程序产品,即编码在计算机可读介质上的计算机程序指令的一个或多个模块,以供数据处理装置执行或控制数据处理装置的操作。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储器设备、影响机器可读传播信号的物质组成、或它们中一个或多个的组合。术语“数据处理装置”涵盖用于处理数据的所有装置、设备和机器,包括例如可编程处理器、计算机或多处理器或计算机。除硬件外,该装置还可以包括为讨论中的计算机程序创建执行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统、或它们中一个或多个的组合的代码。传播信号是人为生成的信号,例如机器生成的电信号、光学信号或电磁信号,生成这些信号以对信息进行编码,以便传输到适当的接收器装置。
计算机程序(也称为程序、软件、软件应用、脚本或代码)可以用任何形式的编程语言(包括编译语言或解释语言)编写,并且可以以任何形式部署,包括作为独立程序或作为适合在计算环境中使用的模块、组件、子例程或其他单元。计算机程序不一定与文件系统中的文件对应。程序可以存储在保存其他程序或数据的文件的部分中(例如,存储在标记语言文档中的一个或多个脚本)、专用于讨论中的程序的单个文件中、或多个协调文件(例如,存储一个或多个模块、子程序或部分代码的文件)中。计算机程序可以部署在一台或多台计算机上来执行,这些计算机位于一个站点上或分布在多个站点上,并通过通信网络互连。
本文档中描述的处理和逻辑流可以通过一个或多个可编程处理器执行,该处理器执行一个或多个计算机程序,通过在输入数据上操作并且生成输出来执行功能。处理和逻辑流还可以通过特殊用途的逻辑电路来执行,并且装置还可以实现为特殊用途的逻辑电路,例如,FPGA(现场可编程门阵列)或ASIC(专用集成电路)。
作为示例,适用于执行计算机程序的处理器包括通用和专用微处理器,以及任何类型数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是用于执行指令的处理器和用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括一个或多个用于存储数据的大容量存储设备,例如,磁盘、磁光盘或光盘,或被操作地耦合到一个或多个大容量存储设备来从其接收数据或将数据传输到一个或多个大容量存储设备,或两者。然而,计算机不一定具有这样的设备。适用于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括作为示例半导体存储器设备,例如EPROM、EEPROM和闪速存储器设备;磁盘,例如内部硬盘或可移动盘;磁光盘;以及CD ROM和DVD-ROM盘。处理器和存储器可以由专用逻辑电路来补充,或合并到专用逻辑电路中。
虽然本专利文档包含许多细节,但不应将其解释为对任何主体的范围或可以主张的范围的限制,而应解释为可特定于特定技术的特定实施例的特征的描述。本专利文档在单独实施例的上下文中描述的某些特征也可以在单个实施例中组合实施。相反,在单个实施例的上下文中描述的各种功能还可以在多个实施例中单独实现,或在任何合适的子组合中实现。此外,尽管特征可以描述为在某些组合中起作用,并且甚至最初要求是这样,但在某些情况下,可以从组合中删除主张的组合中的一个或多个特征,并且主张的组合可以指向子组合或子组合的变化。
类似地,尽管图纸中以特定顺序描述了操作,但这不应理解为要获得期望的结果需要以所示的特定次序或顺序次序执行此类操作,或执行所有说明的操作。此外,本专利文档中描述的实施例中各种系统组件的分离不应理解为在所有实施例中都需要这样的分离。
仅描述了一些实现方式和示例,并且其他实现方式、增强和变型可以基于本专利文档中描述和说明的内容做出。

Claims (20)

1.一种视频处理的方法,包括:
根据规则执行在视频的当前视频块和所述视频的比特流表示之间的转换,
其中,分割预测模式用于对当前视频块进行编解码,其中将所述当前视频块的最终预测确定为所述当前视频块的两个或更多个预测的加权和;
其中,所述分割预测模式是基于多个第一分割方案的第一模式或基于多个第二分割方案的第二模式;并且
其中,所述规则指定用于使用所述第一模式或所述第二模式编解码的编解码操作。
2.根据权利要求1所述的方法,其中,所述第一模式是三角形分割模式,并且所述第二模式是几何分割模式。
3.根据权利要求1或2所述的方法,其中,所述多个第一分割方案是所述多个第二分割方案的子集。
4.根据权利要求2所述的方法,其中,所述几何分割模式包括所述多个第二分割方案,并且其中,所述多个第二分割方案中的至少一个将所述当前视频块分为两个子分割,使得所述两个子分割中的至少一个是非正方形的和非矩形的。
5.根据权利要求2所述的方法,其中,所述几何分割模式包括三角形分割模式。
6.根据权利要求1所述的方法,其中,所述第一模式是三角形分割模式,并且所述第二模式是非三角形分割模式。
7.根据权利要求1所述的方法,其中,所述分割预测模式是几何分割模式,所述几何分割模式将作为矩形块的所述当前视频块划分为两个三角形子分割或两个非三角形子分割。
8.根据权利要求1所述的方法,其中,所述规则指定将所述第一模式和所述第二模式信令通知为单个模式。
9.根据权利要求8所述的方法,其中,所述第一模式和所述第二模式以序列参数集(SPS)、视频参数集(VPS)、活动参数集(APS)、图片参数集(PPS)、条带、子图片、片、砖、虚拟流水线数据单元(VPDU)、编解码树单元(CTU)、变换单元(TU)、编解码单元(CU)、预测单元(PU)、图片头或条带头级别来共享相同的控制标志。
10.根据权利要求8所述的方法,其中,将所述第一模式信令通知为所述第二模式的子集。
11.根据权利要求10所述的方法,其中,所述第二模式定义为包含N个子模式并表示为{M0,M1,M2,…,MN-1}的预测模式,并且所述第一模式定义为包含X个子模式并表示为{M0,Mk0,Mk1,…,MkX-1}的另一预测模式,其中{M0,Mk0,Mk1,…,MkX-1}是{M0,M1,M2,…,MN-1}的子集,其中N是大于1且大于X的整数。
12.根据权利要求5所述的方法,其中,信令通知第一语法元素以指示是否应用所述第二模式和/或信令通知第二语法元素以指示是否应用所述第一模式。
13.根据权利要求1所述的方法,其中,所述规则指定所述第一模式和所述第二模式共享用于计算用于确定所述最终预测的混合权重掩码的逻辑。
14.根据权利要求1所述的方法,其中,所述规则指定所述第一模式和所述第二模式共享用于计算用于存储运动的运动存储掩码的逻辑。
15.根据权利要求13或14所述的方法,其中,对于所述第一模式和所述第二模式,使用相同的表来导出所述混合权重掩码或所述运动存储掩码。
16.根据权利要求1至15中的任一项所述的方法,其中,所述转换包括将所述视频编码为所述比特流表示。
17.根据权利要求1至15中的任一项所述的方法,其中,所述转换包括将所述比特流表示解码以生成所述视频。
18.一种视频处理装置,包括:处理器,被配置为实现权利要求1至17中的任意一项或多项所述的方法。
19.一种存储程序代码的计算机可读介质,所述程序代码在被执行时使处理器实现权利要求1至17中的任意一项或多项所述的方法。
20.一种计算机可读介质,所述计算机可读介质存储根据上述方法中的任意方法生成的编解码表示或比特流表示。
CN202080071243.8A 2019-10-10 2020-10-10 视频编解码中非矩形分割的使用 Pending CN114556953A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN2019110490 2019-10-10
CNPCT/CN2019/110490 2019-10-10
PCT/CN2020/120112 WO2021068920A1 (en) 2019-10-10 2020-10-10 Use of non-rectangular partitions in video coding

Publications (1)

Publication Number Publication Date
CN114556953A true CN114556953A (zh) 2022-05-27

Family

ID=75437697

Family Applications (4)

Application Number Title Priority Date Filing Date
CN202080071243.8A Pending CN114556953A (zh) 2019-10-10 2020-10-10 视频编解码中非矩形分割的使用
CN202080071439.7A Pending CN114556926A (zh) 2019-10-10 2020-10-10 几何分割模式中的运动矢量处理
CN202080071393.9A Pending CN114556919A (zh) 2019-10-10 2020-10-10 去块滤波的改进
CN202080071369.5A Active CN114556915B (zh) 2019-10-10 2020-10-10 几何分割模式中被编解码的块的去块

Family Applications After (3)

Application Number Title Priority Date Filing Date
CN202080071439.7A Pending CN114556926A (zh) 2019-10-10 2020-10-10 几何分割模式中的运动矢量处理
CN202080071393.9A Pending CN114556919A (zh) 2019-10-10 2020-10-10 去块滤波的改进
CN202080071369.5A Active CN114556915B (zh) 2019-10-10 2020-10-10 几何分割模式中被编解码的块的去块

Country Status (3)

Country Link
US (1) US11758143B2 (zh)
CN (4) CN114556953A (zh)
WO (4) WO2021068920A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4008108A4 (en) 2019-09-01 2022-09-21 Beijing Bytedance Network Technology Co., Ltd. ALIGNMENT OF PREDICTION WEIGHTS IN VIDEO ENCODING
US11533498B2 (en) * 2019-11-21 2022-12-20 Tencent America LLC Geometric partitioning mode in video coding
CN117321997A (zh) * 2021-04-05 2023-12-29 抖音视界有限公司 防止重复分割
WO2023140635A1 (ko) * 2022-01-21 2023-07-27 주식회사 윌러스표준기술연구소 경계 밖 블록을 이용하는 비디오 신호 처리 방법 및 이를 위한 장치
US20230388484A1 (en) * 2022-05-24 2023-11-30 Tencent America LLC Method and apparatus for asymmetric blending of predictions of partitioned pictures

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102845062A (zh) * 2010-04-12 2012-12-26 高通股份有限公司 用于几何运动分割的定点实施方案
US20130083857A1 (en) * 2011-06-29 2013-04-04 Qualcomm Incorporated Multiple zone scanning order for video coding
CN104040900A (zh) * 2011-11-08 2014-09-10 高通股份有限公司 用于上下文自适应二进制算术译码的上下文数目缩减
WO2015106121A1 (en) * 2014-01-10 2015-07-16 Qualcomm Incorporated Block vector coding for intra block copy in video coding
US20170272759A1 (en) * 2016-03-21 2017-09-21 Qualcomm Incorporated Determining prediction parameters for non-square blocks in video coding
WO2017192898A1 (en) * 2016-05-05 2017-11-09 Vid Scale, Inc. Control-point based intra direction representation for intra coding
WO2019004364A1 (en) * 2017-06-30 2019-01-03 Sharp Kabushiki Kaisha SYSTEMS AND METHODS FOR GEOMETRICALLY ADAPTIVE PARTITIONING OF A VIDEO BLOCK IMAGE FOR VIDEO CODING
WO2019039323A1 (en) * 2017-08-22 2019-02-28 Panasonic Intellectual Property Corporation Of America IMAGE ENCODER, IMAGE DECODER, IMAGE ENCODING METHOD, AND IMAGE DECODING METHOD
WO2019078581A1 (ko) * 2017-10-16 2019-04-25 디지털인사이트주식회사 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체

Family Cites Families (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101507281B (zh) 2006-07-12 2013-06-05 诺基亚公司 媒体文件中的兴趣区域可缩放性信息的信号发送
TWI375470B (en) * 2007-08-03 2012-10-21 Via Tech Inc Method for determining boundary strength
CN106028048B (zh) * 2010-01-15 2019-04-05 三星电子株式会社 对视频进行解码的设备
JP2011151683A (ja) 2010-01-22 2011-08-04 Sony Corp 画像処理装置および方法
US20120147961A1 (en) 2010-12-09 2012-06-14 Qualcomm Incorporated Use of motion vectors in evaluating geometric partitioning modes
KR20120090740A (ko) 2011-02-07 2012-08-17 (주)휴맥스 정밀한 단위의 필터 선택을 적용한 영상 부호화/복호화 장치 및 방법
WO2012120582A1 (ja) * 2011-03-07 2012-09-13 パナソニック株式会社 動き補償装置、動画像符号化装置、動画像復号装置、動き補償方法、プログラム、及び集積回路
EP2777286B1 (en) * 2011-11-11 2017-01-04 GE Video Compression, LLC Effective wedgelet partition coding
US20130170562A1 (en) * 2011-12-28 2013-07-04 Qualcomm Incorporated Deblocking decision functions for video coding
CN102547290B (zh) 2012-01-20 2013-12-18 厦门大学 一种基于几何分割的视频图像解编码方法
KR101842551B1 (ko) * 2012-01-26 2018-03-28 한국전자통신연구원 모션 파티션 모드 판정 방법 및 부호화기
WO2014014276A1 (ko) * 2012-07-17 2014-01-23 한국전자통신연구원 인루프 필터링 방법 및 이를 이용하는 장치
US20140307780A1 (en) 2013-04-11 2014-10-16 Mitsubishi Electric Research Laboratories, Inc. Method for Video Coding Using Blocks Partitioned According to Edge Orientations
US9762927B2 (en) * 2013-09-26 2017-09-12 Qualcomm Incorporated Sub-prediction unit (PU) based temporal motion vector prediction in HEVC and sub-PU design in 3D-HEVC
CN103561276B (zh) 2013-11-07 2017-01-04 北京大学 一种图像视频编解码方法
US10110895B2 (en) * 2013-12-13 2018-10-23 Qualcomm Incorporated Signaling of simplified depth coding (SDC) for depth intra- and inter-prediction modes in 3D video coding
US9609343B1 (en) 2013-12-20 2017-03-28 Google Inc. Video coding using compound prediction
US10368097B2 (en) 2014-01-07 2019-07-30 Nokia Technologies Oy Apparatus, a method and a computer program product for coding and decoding chroma components of texture pictures for sample prediction of depth pictures
CN111064965B (zh) * 2014-03-16 2022-05-24 Vid拓展公司 用于无损视频译码的信令的方法、设备和计算机可读介质
US9918105B2 (en) * 2014-10-07 2018-03-13 Qualcomm Incorporated Intra BC and inter unification
CN106559017B (zh) * 2015-09-22 2021-11-19 英飞凌科技股份有限公司 用于确定电机静止状态下的转子初始位置的装置和方法
EP3357227A1 (en) 2015-10-02 2018-08-08 VID SCALE, Inc. Color correction with a lookup table
US10412407B2 (en) * 2015-11-05 2019-09-10 Mediatek Inc. Method and apparatus of inter prediction using average motion vector for video coding
US11405611B2 (en) 2016-02-15 2022-08-02 Qualcomm Incorporated Predicting filter coefficients from fixed filters for video coding
US11778231B2 (en) 2016-05-26 2023-10-03 Vid Scale, Inc. Geometric conversion for 360-degree video coding
JP6983862B2 (ja) 2016-07-08 2021-12-17 ヴィド スケール インコーポレイテッド ジオメトリ投影を使用する360度ビデオ符号化
US20180041778A1 (en) 2016-08-02 2018-02-08 Qualcomm Incorporated Geometry transformation-based adaptive loop filtering
WO2018045108A1 (en) 2016-09-02 2018-03-08 Vid Scale, Inc. Method and system for signaling of 360-degree video information
US10652575B2 (en) 2016-09-15 2020-05-12 Qualcomm Incorporated Linear model chroma intra prediction for video coding
WO2018141416A1 (en) * 2017-02-06 2018-08-09 Huawei Technologies Co., Ltd. Video encoder and decoder for predictive partitioning
US10708591B2 (en) * 2017-03-20 2020-07-07 Qualcomm Incorporated Enhanced deblocking filtering design in video coding
US10623746B2 (en) * 2017-12-07 2020-04-14 Tencent America LLC Method and apparatus for video coding
CN111630856B (zh) 2018-01-26 2024-05-07 交互数字Vc控股公司 基于响应于相邻样本的线性模型进行视频编码和解码的方法和设备
WO2019151279A1 (ja) * 2018-01-30 2019-08-08 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
CN111971959A (zh) * 2018-02-09 2020-11-20 弗劳恩霍夫应用研究促进协会 基于分区的帧内编码概念
KR20240024300A (ko) * 2018-03-16 2024-02-23 엘지전자 주식회사 인트라 예측 기반 영상/비디오 코딩 방법 및 그 장치
KR102657933B1 (ko) * 2018-03-30 2024-04-22 광동 오포 모바일 텔레커뮤니케이션즈 코포레이션 리미티드 인트라 예측 기반 영상/비디오 코딩 방법 및 그 장치
SG11202012940XA (en) 2018-06-26 2021-01-28 Huawei Tech Co Ltd High-level syntax designs for point cloud coding
KR102608572B1 (ko) 2018-09-14 2023-12-04 후아웨이 테크놀러지 컴퍼니 리미티드 포인트 클라우드 코딩에서의 개선된 속성 지원
TWI822863B (zh) 2018-09-27 2023-11-21 美商Vid衡器股份有限公司 360度視訊寫碼樣本導出
CN112823518B (zh) * 2018-10-08 2023-10-20 华为技术有限公司 用于译码块的几何划分块的帧间预测的装置及方法
CN111147850B (zh) 2018-11-02 2022-10-11 北京字节跳动网络技术有限公司 用于基于历史的运动矢量预测的表维护
CN111418208B (zh) 2018-11-06 2023-12-05 北京字节跳动网络技术有限公司 用于几何分割的权重推导
JP7324841B2 (ja) 2018-11-10 2023-08-10 北京字節跳動網絡技術有限公司 ビデオ・データ処理方法、装置、記憶媒体及び記憶方法
CN109327703A (zh) 2018-11-13 2019-02-12 长春理工大学 一种基于不同采样块的深度图编解码方法
WO2020103934A1 (en) 2018-11-22 2020-05-28 Beijing Bytedance Network Technology Co., Ltd. Construction method for inter prediction with geometry partition
CN113170128B (zh) 2018-12-03 2024-05-28 北京字节跳动网络技术有限公司 帧间预测的部分修剪方法
CN112532993B (zh) 2018-12-28 2022-04-26 杭州海康威视数字技术股份有限公司 一种编解码方法及其设备
WO2020180155A1 (ko) * 2019-03-07 2020-09-10 엘지전자 주식회사 비디오 신호를 처리하기 위한 방법 및 장치
US20200296359A1 (en) 2019-03-15 2020-09-17 Qualcomm Incorporated Video coding with unfiltered reference samples using different chroma formats
EP3989551A4 (en) * 2019-06-17 2023-05-31 Electronics and Telecommunications Research Institute METHOD AND APPARATUS FOR SUB-BLOCK DIVISION BASED ENCODING/DECODING OF AN PICTURE
CA3141088A1 (en) 2019-06-21 2020-12-24 Semih Esenlik Chroma sample weight derivation for geometric partition mode
CN110312127B (zh) * 2019-06-25 2022-04-19 浙江大华技术股份有限公司 最可能预测模式列表的构建、图像编码方法和处理装置
KR102655358B1 (ko) * 2019-08-22 2024-04-04 엘지전자 주식회사 크로마 양자화 파라미터 오프셋 관련 정보를 코딩하는 영상 디코딩 방법 및 그 장치
EP4008108A4 (en) 2019-09-01 2022-09-21 Beijing Bytedance Network Technology Co., Ltd. ALIGNMENT OF PREDICTION WEIGHTS IN VIDEO ENCODING
US11405619B2 (en) * 2019-09-23 2022-08-02 Qualcomm Incorporated Geometric partition mode with simplified motion field storage and motion compensation in video coding
EP4022900A4 (en) * 2019-09-23 2022-11-09 Huawei Technologies Co., Ltd. WEIGHTED PREDICTION METHOD AND APPARATUS FOR NON-RECTANGULAR PARTITIONING MODES
CN114450959A (zh) * 2019-09-28 2022-05-06 北京字节跳动网络技术有限公司 视频编解码中的几何分割模式
EP4042689A4 (en) * 2019-10-28 2023-06-07 Beijing Bytedance Network Technology Co., Ltd. SIGNALING AND SYNTAX ANALYSIS BASED ON A COLOR COMPONENT
US11212523B2 (en) * 2020-01-12 2021-12-28 Mediatek Inc. Video processing methods and apparatuses of merge number signaling in video coding systems
WO2021203039A1 (en) * 2020-04-03 2021-10-07 Beijing Dajia Internet Information Technology Co., Ltd. Methods and devices for high-level syntax in video coding

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102845062A (zh) * 2010-04-12 2012-12-26 高通股份有限公司 用于几何运动分割的定点实施方案
US20130083857A1 (en) * 2011-06-29 2013-04-04 Qualcomm Incorporated Multiple zone scanning order for video coding
CN104040900A (zh) * 2011-11-08 2014-09-10 高通股份有限公司 用于上下文自适应二进制算术译码的上下文数目缩减
WO2015106121A1 (en) * 2014-01-10 2015-07-16 Qualcomm Incorporated Block vector coding for intra block copy in video coding
US20170272759A1 (en) * 2016-03-21 2017-09-21 Qualcomm Incorporated Determining prediction parameters for non-square blocks in video coding
WO2017192898A1 (en) * 2016-05-05 2017-11-09 Vid Scale, Inc. Control-point based intra direction representation for intra coding
WO2019004364A1 (en) * 2017-06-30 2019-01-03 Sharp Kabushiki Kaisha SYSTEMS AND METHODS FOR GEOMETRICALLY ADAPTIVE PARTITIONING OF A VIDEO BLOCK IMAGE FOR VIDEO CODING
WO2019039323A1 (en) * 2017-08-22 2019-02-28 Panasonic Intellectual Property Corporation Of America IMAGE ENCODER, IMAGE DECODER, IMAGE ENCODING METHOD, AND IMAGE DECODING METHOD
WO2019078581A1 (ko) * 2017-10-16 2019-04-25 디지털인사이트주식회사 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BENJAMIN BROSS: "Versatile Video Coding (Draft 6)", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 15TH MEETING: GOTHENBURG, SE, 3–12 JULY 2019,JVET-O2001 *

Also Published As

Publication number Publication date
CN114556915B (zh) 2023-11-10
WO2021068922A1 (en) 2021-04-15
WO2021068923A1 (en) 2021-04-15
CN114556919A (zh) 2022-05-27
CN114556926A (zh) 2022-05-27
US11758143B2 (en) 2023-09-12
WO2021068920A1 (en) 2021-04-15
CN114556915A (zh) 2022-05-27
US20220256166A1 (en) 2022-08-11
WO2021068921A1 (en) 2021-04-15

Similar Documents

Publication Publication Date Title
CN113170099B (zh) 块内拷贝模式和帧间预测工具之间的交互
CN112970258B (zh) 用于子块预测块的多假设
CN113853783B (zh) 对帧内块复制编解码的块的块矢量的编解码
CN114303370B (zh) 视频编解码中预测权重的对准
CN114556915B (zh) 几何分割模式中被编解码的块的去块
CN113906738B (zh) 仿射模式的自适应运动矢量差分辨率
CN114450959A (zh) 视频编解码中的几何分割模式
CN114868395A (zh) 采用几何分割进行帧间预测的高级语法
CN114424536A (zh) 基于变换单元的组合帧间帧内预测
CN113966616A (zh) 使用临近块信息的运动候选列表构建
JP2024012506A (ja) 幾何学的分割を用いた簡易インター予測
CN113994682A (zh) 具有默认参数的基于历史的运动矢量预测
CN115176463A (zh) 具有几何分割的块的运动矢量差
CN113273208A (zh) 仿射预测模式的改进
CN114424530A (zh) 跳过模式信令通知
CN114097219A (zh) 基于历史的运动矢量预测表中的运动信息的存储

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination