CN110858905B - 基于多运动模型的跳过和直接模式编解码的视频块中的修剪方法及装置 - Google Patents

基于多运动模型的跳过和直接模式编解码的视频块中的修剪方法及装置 Download PDF

Info

Publication number
CN110858905B
CN110858905B CN201910792767.5A CN201910792767A CN110858905B CN 110858905 B CN110858905 B CN 110858905B CN 201910792767 A CN201910792767 A CN 201910792767A CN 110858905 B CN110858905 B CN 110858905B
Authority
CN
China
Prior art keywords
candidates
candidate
motion
video
motion model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910792767.5A
Other languages
English (en)
Other versions
CN110858905A (zh
Inventor
张莉
张凯
刘鸿彬
王悦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Original Assignee
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd, ByteDance Inc filed Critical Beijing ByteDance Network Technology Co Ltd
Publication of CN110858905A publication Critical patent/CN110858905A/zh
Application granted granted Critical
Publication of CN110858905B publication Critical patent/CN110858905B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/56Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Complex Calculations (AREA)

Abstract

描述了用于在基于多运动模型的跳过和直接模式编解码的视频块中应用修剪的方法、系统和装置。视频处理的示例性方法包含,对视频块的候选列表,在从解码顺序中的先前编解码块推导的第一组候选中的候选与第二组候选中的候选之间应用修剪操作,以及基于应用修剪操作之后的候选列表进行视频块与视频块的比特流表示之间的转换。

Description

基于多运动模型的跳过和直接模式编解码的视频块中的修剪 方法及装置
相关申请的交叉引用
根据适用的专利法和/或规则,本申请及时要求2018年8月26日作为国际专利申请No.PCT/CN2018/102370提交的在先中国专利申请的优先权和权益。国际专利申请No.PCT/CN2018/102370的全部公开通过引用整合为本申请公开的一部分。
技术领域
本文档涉及视频编解码技术。
背景技术
数字视频考虑互联网和其他数字通信网络上的最大带宽使用。随着连接的能够接收和显示视频的用户装置的数目增加,期望对于数字视频使用的带宽要求将继续增长。
发明内容
本公开技术可以由视频解码器或编码器实施例使用,其中将修剪应用于基于多运动模型的跳过和直接模式编解码的视频块中。
在一个示例性方面中,公开了一种视频处理的方法。该方法包含:对视频块的候选列表,应用从解码顺序中先前编解码块推导的第一组候选中的候选与第二组候选中的候选之间的修剪操作;以及基于应用所述修剪操作之后的所述候选列表,进行所述视频块与所述视频块的比特流表示之间的转换。
在另一示例性方面中,公开了一种视频处理的方法。该方法包含,对视频块的候选列表,应用包括来自空域或时域非相邻块的候选的第一组候选与包括从基于多运动模型的跳过模式或直接模式设计推导的候选的第二组候选之间的修剪操作;以及,基于应用修剪操作之后的候选列表,进行视频块与视频块的比特流表示之间的转换。
在又一示例性方面中,公开了一种视频处理的方法。该方法包含,制止将修剪操作应用于视频块的候选列表,该候选列表包括从基于多运动模型的跳过模式或直接模式设计推导的多个候选,并且所述多个候选中的每一个是基于运动模型匹配的搜索或默认运动矢量(MV)构建过程;以及基于候选列表进行视频块与视频块的比特流表示之间的转换。
在一些实施例中,该方法可以优选地包含第二组候选,第二组候选包括来自空域或时域非相邻块的候选。
在一些实施例中,所述方法可以优选地包括修剪操作,修剪操作将第一候选插入到候选列表中,并从候选列表中排除第二候选。
在一些实施例中,该方法可以优选地包括,第一候选与第二候选相同。
在一些实施例中,该方法可以优选地包含,所述第一候选与所述第二候选之间的运动矢量差小于阈值。
在一些实施例中,该方法可以优选地包含,所述第二组候选包括从基于多运动模型的跳过模式或直接模式设计推导的候选。
在一些实施例中,该方法可以优选地包含,所述第二组候选中的候选是基于运动模型匹配的搜索。
在一些实施例中,该方法可以优选地包含,第二组候选中的候选是基于默认运动向量(MV)构建过程。
在一些实施例中,该方法可以优选地包含,所述第一组候选中的候选是表中的基于历史的运动矢量预测(HMVP)候选。
在一些实施例中,该方法可以优选地包含,所述第二组候选中的候选是从运动模型匹配的搜索中的空域或时域邻近块推导的,并且其中所述第一组候选中的候选是基于历史的运动矢量预测(HMVP)候选。
在一些实施例中,该方法可以优选地包含,所述第二组候选中的候选是从运动模型匹配的搜索、人工搜索或默认运动矢量构建过程中的空域或时域邻近块推导的,并且所述第一组候选中的候选是基于历史的运动矢量预测(HMVP)候选。
在一些实施例中,该方法可以优选地包含,用修剪操作,以从空域或时域邻近块推导的运动候选和基于历史的运动矢量预测(HMVP)候选构建所述候选列表。
在一些实施例中,该方法可以优选地包含,从在所述视频块之前解码的先前解码的视频块推导所述HMVP候选。
在一些实施例中,该方法可以优选地包含,进行所述转换包括从所述视频块生成所述比特流表示。
在一些实施例中,该方法可以优选地包含,进行所述转换包括从所述比特流表示生成所述视频块。
在一些实施例中,该方法可以优选地包含,所述第一组候选中的候选与运动信息相关联,所述运动信息包括预测方向、参考图片索引、运动矢量值、强度补偿标志、仿射标志、运动矢量差精度或运动矢量差值中的至少一个。
在一些实施例中,该方法可以优选地包含基于进行所述转换更新所述第一组候选的步骤。
在一些实施例中,该方法可以优选地包含,更新所述第一组候选包括,在进行所述转换之后,基于所述视频块的运动信息更新所述第一组候选。
在一些实施例中,该方法可以优选地包含以下步骤:在更新所述第一组候选之后,基于所述第一组候选,进行视频的随后的视频块与所述视频的比特流表示之间的转换。
在一些实施例中,该方法可以优选地包含在与相同运动模型相关联的候选之间应用修剪操作。
在又一示例性方面中,上述方法可以由包括处理器的视频解码器装置实现。
在又一示例性方面中,上述方法可以由包括处理器的视频编码器装置实现。
在又一示例性方面中,这些方法可以体现为处理器可执行指令的形式,并储存在计算机可读程序介质中。
本文档中进一步描述了这些和其他的方面。
附图说明
图1是H.264/高级视频编解码(AVC)中的MB分割的图示。
图2示出了将编解码块(CB)划分为预测块(PBs)的模式的示例。
图3示出了将编解码树块(CTB)细分为CBs的示例。
图4示出了merge候选列表构建的推导过程的示例。
图5示出了空域merge候选的位置的示例。
图6示出了为空域merge候选的冗余检查考虑的候选对的示例。
图7示出了Nx2N和2NxN分割的第二预测单元(PU)的位置的示例。
图8示出了时域merge候选的运动矢量缩放的示例。
图9示出了共位(co-located)图片中的时域merge候选的候选位置的示例。
图10示出了组合的双向预测merge候选的示例。
图11示出了运动矢量预测候选的推导过程的示例。
图12示出了空域运动矢量候选的运动矢量缩放的示例。
图13A和图13B示出了可能的递归CU/PU结构的示例。
图14示出了AVS3中使用的当前块及其邻近块的示例。
图15是视频处理装置的示例的框图。
图16示出了视频编码器的示例性实现方式的框图。
图17是其中可以实现本公开技术的示例性视频处理系统的框图。
图18A-18C是视频处理方法的示例的流程图。
具体实施方式
本文档提供各种技术,其可以由视频比特流的解码器使用,以改善解压缩的或解码的数字视频的质量。此外,视频编码器还可以在处理编码期间实现这些技术,以便重构用于进一步编码的解码的帧。
本文档中使用了章节标题以便于理解,并且不将实施例和技术限制到对应的章节。因此,来自一个章节的实施例可以与来自其他章节的实施例组合。
1、概述
本专利文档涉及视频编解码技术。具体地,其涉及图像/视频编解码中的运动矢量编解码。其可以应用于现有视频编解码标准,比如HEVC,或待定的标准(多功能视频编解码)、第三代中国音频和视频编解码标准(AVS3)。其还可以应用于未来视频编解码标准或视频编解码器。
2、背景
视频编解码标准已经主要通过熟知的ITU-T和ISO/IEC标准的发展而演化。ITU-T产生H.261和H.263,ISO/IEC产生MPEG-1和MPEG-4Visual,并且两个组织联合产生了H.262/MPEG-2Video和H.264/MPEG-4Advanced Video Coding(AVC)和H.265/HEVC标准。自从H.262,视频编解码标准是基于混合视频编解码结构,其中采用时域预测加变换编解码。
分割结构
H.264/AVC中的分割树结构
之前的标准中的编解码层的核心是宏块,含有亮度样本的16×16块,并且,在4:2:0颜色取样的通常情况下,两个对应的色度样本的8×8 块。
帧内编解码块使用空域预测来利用像素之间的空域相关性。定义了两种分割:16x16和4x4。
帧间编解码块通过估计图片之间的运动使用时域预测,而非空域预测。可以对于16x16宏块或其任意子宏块分割独立地估计运动,子宏块分割为:16x8、8x16、8x8、8x4、4x8、4x4(见图2)。每个子宏块分割仅允许一个运动矢量(MV)。
图1是H.264/Advanced Video Coding(AVC)中的MB分割的图示。
2.1.2 HEVC中的分割树结构
在HEVC中,通过使用指代为编解码树的四叉树结构将CTU划分为 CU,以适应于各种局部特性。在CU级进行使用帧间图片(时域)还是帧内图片(空域)预测来编解码图片区域的决定。每个CU可以根据PU划分类型进一步划分为一个、两个或四个PU。在一个PU内,应用相同预测过程,并且在PU的基础上将相关信息传输到解码器。在通过基于PU划分类型应用预测过程获取残差块之后,CU可以根据相似于用于CU的编解码树的另一四叉树结构被分割为变换单元(TU)。HEVC结构的一个关键特征是,其具有多个分割概念,包含CU、PU,以及TU。
以下,使用HEVC的混合视频编解码中涉及的各种特征被如下强调。
1)编解码树单元和编解码树块(CTB)结构:HEVC中的类同的结构是编解码树单元(CTU),其具有由编码器选择的大小,并且可以大于传统宏块。CTU由亮度CTB和对应的色度CTB以及语法元素构成。亮度CTB 的大小L×L可以选择为L=16、32,或64样本,较大的大小典型地允许更好的压缩。然后,HEVC支持使用树结构和四叉树状信令通知将CTB分割为更小的块。
2)编解码单元(CU)和编解码块(CB):CTU的四叉树语法指定其亮度和色度CB的大小和位置。四叉树的根与CTU相关联。因此,亮度 CTB的大小是亮度CB的最大支持大小。CTU到亮度和色度CB的划分被联合地信令通知。一个亮度CB和通常两个色度CB,连同相关联的语法,形成编解码单元(CU)。CTB可以含有仅一个CU或可以被划分以形成多个 CU,并且每个CU具有到预测单元(PU)的相关联的分割和变换单元(TU) 的树。
3)预测单元和预测块(PB):在CU级进行使用帧间图片或帧内图片预测来编解码图片区域的决定。PU分割结构具有在CU级的根。根据基本预测类型决定,然后亮度和色度CB可以被进一步划分大小,并且被从亮度和色度预测块(PB)预测。HEVC支持从64×64到4×4样本的可变PB大小。图2示出了MxM CU的允许的PB的示例。
图2示出了将编解码块(CB)划分为预测块(PB)的模式的示例。将 CB划分为PB的模式,受到某些大小约束。对于帧内图片预测的CB,仅支持M x M和M/2x M/2。
4)TU和变换块:使用块变换编解码预测残差。TU树结构具有其在CU 级的根。亮度CB残差可以与亮度变换块(TB)相同,或可以被进一步划分为更小的亮度TB。相同的适用于色度TB。对正方形TB大小4×4、8×8、 16×16和32×32,定义类似于离散余弦变换(DCT)的整数基函数。对于亮度帧内图片预测残差的4×4变换,替换地指定从离散正弦变换(DST)的形式推导的整数变换。
图3示出了编解码树块(CTB)细分为CB的示例。CTB细分为CB[和变换块(TB)]。实线指示CB界线,并且点线指示TB界线。(a)具有其分割的CTB。(b)对应的四叉树。
2.1.2.1到变换块和单元的树结构分割
对于残差编解码,CB可以被递归分割为变换块(TB)。分割被残差四叉树信令通知。仅指定正方形CB和TB分割,其中块可以被递归四分划分,如图3中所示。对于大小M×M的给定亮度CB,标志信令通知其是否被划分为大小M/2×M/2的四个块。如果进一步划分是可能的,则如由SPS 中指示的残差四叉树的最大深度所信令通知的,每个四分被分配指示其是否被划分为四个四分的标志。从残差四叉树所得的叶节点块是变换块,其被变换编解码进一步处理。编码器指示其将使用的最大和最小亮度TB大小。当CB大小大于最大TB大小时,暗示划分。当划分将导致亮度TB大小小于指示的最小时,暗示不划分。色度TB大小在每个维度上是亮度TB 大小的一半,除了当亮度TB大小是4×4之外,在此情况下将单个4×4色度TB用于由四个4×4亮度TB覆盖的区域。在帧内图片预测的CU的情况下,最接近邻近TB的解码的样本(在CB内或外)被用作帧内图片预测的参考数据。
与之前的标准不同,HEVC设计允许TB跨帧间图片预测的CU的多个 PB,以最大化四叉树结构TB分割的潜在编解码效率收益。
2.1.2.2父和子节点
CTB被根据四叉树结构划分,四叉树结构的节点为编解码单元。四叉树结构中的多个节点包含叶节点和非叶节点。叶节点在树结构中不具有子节点(即,叶节点不进一步划分)。非叶节点包含树结构的根节点。根节点对应于视频数据的初始视频块(例如,CTB)。对于多个节点中的每个相应的非根节点,相应的非根节点对应于作为对应于相应的非根节点的树结构中的父节点的视频块子块的视频块。多个非叶节点中的每个相应的非叶节点具有树结构中的一个或多个子节点。
2.2 HEVC/H.265中的帧间预测
每个帧间预测PU具有一个或两个参考图片列表的运动参数。运动参数包含运动矢量和参考图片索引。两个参考图片列表之一的使用还可以被使用inter_pred_idc信令通知。运动矢量可以显式地编解码为相对于预测符的差量(delta),这样的编解码模式称为AMVP模式。
当以跳过模式编解码CU时,一个PU与CU相关联,并且不存在显著残差系数,不存在编解码运动矢量差量(delta)或参考图片索引。merge模式被指定,借此从邻近PU获取当前PU的运动参数,包含空域和时域候选。merge模式可以应用于任意帧间预测PU,不仅是跳过模式。merge模式的替代是运动参数的显式传输,其中每个PU显式地信令通知运动矢量、每个参考图片列表的对应的参考图片索引,以及参考图片列表使用。
当信令通知指示要使用两个参考图片列表之一时,从样本的一个块产生PU。这称为‘单向预测’。单向预测对于P-条带和B-条带两者都可用。
当信令通知指示两个参考图片列表都要使用时,从样本的两个块产生 PU。这称为‘双向预测’。双向预测仅对于B-条带可用。
以下文本提供现有HEVC实现方式中指定的帧间预测模式的细节。
2.2.1 merge模式
2.2.1.1 merge模式的候选的推导
当使用merge模式预测PU时,指向merge候选列表中的条目的索引被从比特流解析,并且用于取回运动信息。此列表的构建在HEVC标准中指定,并且可以根据以下步骤的序列概括:
步骤1:初始候选推导
步骤1.1:空域候选推导
步骤1.2:空域候选的冗余检查
步骤1.3:时域候选推导
步骤2:附加候选插入
步骤2.1:双向预测候选的创建
步骤2.2:零运动候选的插入
这些步骤也示意性地在图4中绘示。对于空域merge候选推导,四个 merge候选中的最大者在位于五个不同位置中的候选之中选择。对于时域 merge候选推导,一个merge候选中的最大者在两个候选之中选择。因为对于每个PU在解码器处假设不变数目的候选,当候选的数目未达到条带报头中信令通知的merge候选的最大数目(MaxNumMergeCand)时,生成附加候选。由于候选的数目是不变的,使用截断一元二值化(TU)编码最佳 merge候选的索引。如果CU的大小等于8,当前CU的全部PU共用单个 merge候选列表,其与2N×2N预测单元的merge候选列表相同。
以下,详述与前述步骤相关联的操作。
2.2.1.2空域候选推导
在空域merge候选的推导中,四个merge候选中的最大者在位于图5中绘示的位置的候选之中选择。推导的顺序是A1、B1、B0、A0和B2。仅当位置A1、B1、B0、A0的任何PU都不可用(例如,因为其属于另一条带或片) 或是帧内编解码时,考虑位置B2。在位置A1添加候选之后,添加其余的候选经受冗余检查,冗余检查确保具有相同运动信息的候选被从列表排除,从而改善编解码效率。为降低计算复杂度,不是全部可能的候选对都在提到的冗余检查中被考虑。反之,仅以图6中的箭头联接的对被考虑,并且仅如果用于冗余检查的对应的候选不具有相同的运动信息,才将候选添加到列表。重复运动信息的另一个来源是与2Nx2N不同的分割相关联的“第二 PU”。作为示例,图7绘示了分别对于N×2N和2N×N的情况的第二PU。当当前PU被分割为N×2N时,位置A1处的候选对列表构建不被考虑。实际上,通过添加此候选将导致具有相同的运动信息的两个预测单元,其对于在编解码单元中仅具有一个PU是冗余的。相似地,当当前PU 被分割为2N×N时,位置B1不被考虑。
2.2.1.3时域候选推导
在此步骤中,仅将一个候选添加到列表。特别地,在此时域merge候选的推导中,基于属于给定参考图片列表内的与当前图片具有最小POC差的图片的共位PU来推导缩放的运动矢量。在条带报头中显式地信令通知要用于推导共位PU的参考图片列表。获取用于时域merge候选的缩放运动矢量,如13中的点线所示,其使用POC距离tb和td从共位PU的运动矢量缩放,其中tb被定义为当前图片的参考图片与当前图片之间的POC差,并且 td被定义为共位图片的参考图片与共位图片之间的POC差。时域merge候选的参考图片索引被设定为等于零。在HEVC规范中描述了缩放过程的实际实现。对于B-条带,获取并组合两个运动矢量,一个用于参考图片列表 0,另一个用于参考图片列表1,以进行双向预测merge候选。
图8示出了时域merge候选的运动矢量缩放的示例。
在属于参考帧的共位PU(Y)中,时域候选的位置被选择在候选C0与 C1之间,如图9中所绘示的。如果位置C0处的PU不可用、是帧内编解码的,或在当前CTU之外,则使用位置C1。否则,在时域merge候选的推导中使用位置C0
2.2.1.4附加的候选插入
除空时(spatio-temporal)merge候选之外,存在两个附加类型的merge 候选:组合双向预测merge候选和零merge候选。组合双向预测merge候选通过利用空时merge候选而生成。组合双向预测merge候选仅用于B-条带。组合双向预测候选通过将初始候选的第一参考图片列表运动参数与另一候选的第二参考图片列表运动参数组合而生成。如果两个元组(tuple)提供不同运动假说,则它们将形成新的双向预测候选。作为示例,图10绘示了当原始列表(左侧)中的两个候选(其具有mvL0和refIdxL0,或者mvL1和 refIdxL1)被用于创建添加到最终列表(右侧)的组合双向预测merge候选时的情况。现有实现方式提供关于被考虑以生成这些附加merge候选的组合的许多规则。
插入零运动候选以填充merge候选列表中的其余条目,并且因此达到MaxNumMergeCand容量。这些候选具有零空域位移(displacement)和参考图片索引,其从零开始并且每当新的零运动候选被添加到列表时增加。这些候选使用的参考帧的数目对于单向和双向预测分别是1和2。最后,不对这些候选进行冗余检查。
2.2.1.5并行处理运动估计区域
为了加速编码过程,可以并行地进行运动估计,从而同时推导给定区域内的全部预测单元的运动矢量。从空域附近推导的merge候选可能会干扰并行处理,因为一个预测单元无法从相邻PU推导运动参数,直到其相关联的运动估计完成。为了减轻编解码效率和处理延迟之间的权衡,HEVC定义了运动估计区域(MER),使用“log2_parallel_merge_level_minus2”语法元素在图片参数集中信令通知运动估计区域(MER)的大小。当定义了 MER时,落入同一区域的merge候选被标记为不可用,并且因此在列表构建中不予考虑。
7.3.2.3图片参数集RBSP语法
7.3.2.3.1总体图片参数集RBSP语法
Figure GDA0003230009800000111
log2_parallel_merge_level_minus2加2指定变量Log2ParMrgLevel的值,其被使用在如条款8.5.3.2.2中指定的merge模式的亮度运动矢量的推导过程中和如条款8.5.3.2.3中指定的空域merge候选的推导过程中。 log2_parallel_merge_level_minus2的值应在0至CtbLog2SizeY-2的范围内,包含。
变量Log2ParMrgLevel如下推导:
Log2ParMrgLevel=log2_parallel_merge_level_minus2+2 (7-37)
注释3–Log2ParMrgLevel的值指示merge候选列表的并行推导的内置容量。例如,当Log2ParMrgLevel等于6时,64x64块中含有的全部预测单元(PU)和编解码单元(CU)的merge候选列表可以并行地推导。
2.2.2 AMVP模式中的运动矢量预测
运动矢量预测利用运动矢量与邻近PU的空时相关性,其用于运动参数的显式传输。其通过首先检查左、上时域邻近PU位置的可用性,删除冗余候选并添加零矢量以使候选列表为不变长度,从而构建运动矢量候选列表。然后,编码器可以从候选列表中选择最佳预测符,并传输指示所选择的候选的对应的索引。与merge索引信令通知相似地,最佳运动矢量候选的索引是使用截断一元编码的。在这种情况下要编码的最大值是2(见图6)。在以下的章节中,提供了关于运动矢量预测候选的推导过程的细节。
2.2.2.1运动矢量预测候选的推导
图11概括了运动矢量预测候选的推导过程。
在运动矢量预测中,考虑了两种类型的运动矢量候选:空域运动矢量候选和时域运动矢量候选。对于空域运动矢量候选推导,基于位于五个不同位置中的每个PU的运动矢量,最终推导两个运动矢量候选,如图5中所绘示的。
对于时域运动矢量候选推导,从两个候选中选择一个运动矢量候选,其被基于两个不同共位位置推导。在构成空时候选的第一列表之后,移除列表中的重复运动矢量候选。如果潜在候选的数目大于二,则相关联的参考图片列表内的参考图片索引大于1的运动矢量候选被从列表移除。如果空时运动矢量候选的数目小于二,则附加零运动矢量候选被添加到列表。
2.2.2.2空域运动矢量候选
在空域运动矢量候选的推导中,在五个潜在候选之中考虑两个候选中的最大者,其从位于如图5中所绘示的位置中的PU推导,这些位置与运动 merge的位置相同。当前PU的左侧的推导的顺序定义为A0、A1,以及缩放的A0、缩放的A1。当前PU的上侧的推导的顺序定义为B0、B1、B2、缩放的B0、缩放的B1、缩放的B2。因此对于每侧存在可以用作运动矢量候选的四种情况,两种情况不需要使用空域缩放,并且两种情况使用空域缩放。四种不同的情况概括如下。
没有空域缩放
(1)相同的参考图片列表,并且相同的参考图片索引(相同POC)
(2)不同参考图片列表,但相同的参考图片(相同POC)
空域缩放
(3)相同的参考图片列表,但不同参考图片(不同POC)
(4)不同参考图片列表,并且不同参考图片(不同POC)
首先检查非空域缩放情况,然后检查空域缩放。当POC在邻近PU的参考图片与当前PU的参考图片之间不同时,考虑空域缩放,而无论参考图片列表如何。如果左侧候选的全部PU都不可用或者是帧内编解码的,则允许对上运动矢量进行缩放,以帮助左和上MV候选的并行推导。否则,上运动矢量不允许空域缩放。
图14示出了空域运动矢量候选的运动矢量缩放的示例。
在空域缩放过程中,邻近PU的运动矢量以与时域缩放相似的方式缩放,如图12所绘示的。主要差异是,参考图片列表和当前PU的索引作为输入给定;实际缩放过程与时域缩放的过程相同。
2.2.2.3时域运动矢量候选
除参考图片索引推导之外,时域merge候选的推导的全部过程与空域运动矢量候选的推导相同(见图4)。参考图片索引被信令通知到解码器。
2.2.2.4Merge/AMVP信息的信令通知
对于AMVP模式,四部分被在比特流中信令通知,即,预测方向、参考索引、MVD和mv预测符候选索引(在以下语法表中强调)。而对于merge 模式,仅merge索引可能需要被信令通知。
语法表
7.3.6.1通常条带分段报头语法
Figure GDA0003230009800000131
7.3.8.6预测单元语法
Figure GDA0003230009800000141
7.3.8.9运动矢量差语法
Figure GDA0003230009800000151
语义
five_minus_max_num_merge_cand指定5减去条带中支持的 mergeMVP候选的最大数目。mergeing MVP候选的最大数目, MaxNumMergeCand如下推导:
MaxNumMergeCand=5-five_minus_max_num_merge_cand (7-53)
MaxNumMergeCand的值应在1至5的范围内,包含。
merge_flag[x0][y0]指定是否从邻近帧间预测的分割推断当前预测单元的帧间预测参数。阵列索引x0、y0指定所考虑的预测块的左上亮度样本相对于图片的左上亮度样本的的位置(x0,y0)。
当merge_flag[x0][y0]不存在时,其如下推断:
如果CuPredMode[x0][y0]等于MODE_SKIP,则merge_flag[x0][y0] 被推断为等于1。
否则,merge_flag[x0][y0]被推断为等于0。
merge_idx[x0][y0]指定merging候选列表的merging候选索引,其中 x0、y0指定考虑的预测块的左上亮度样本相对于图片的左上亮度样本的位置(x0,y0)。
2.3 AVS2中的编解码结构
相似于HEVC,AVS2也采用基于CU、PU和TU的编解码/预测/变换结构的概念。首先,图片被分割为最大编解码单元(LCU),其由2Nx2N样本构成。一个LCU可以为单个CU或可以被以四叉树分割结构划分为四个更小的CU;CU可以被递归划分,直到其达到最小CU大小限制,如图13A 中所示。一旦Cu层级树的划分完成,叶节点CU可以被进一步划分为PU。 PU是帧内和帧间预测的基本单元,并且允许多种不同形状以编码不规则图像样式,如图13B所示。在图13A中,示出了AVS2中的最大可能递归CU 结构,例如LCU大小=64,最大层级深度=4;图13B示出了AVS2中的跳过、帧内模式,以及帧间模式的可能的PU划分,包含对称和非对称预测 (对于帧内预测,d=1,2;并且,对于帧间预测d=0,1,2)。
2.4 AVS2/AVS3中的帧间预测
相似于HEVC,存在两个帧间编解码帧类型,P帧和B帧。P帧是使用单个参考图片前向预测帧,而B帧是由使用两个参考帧的前向、后向,双向预测和对称预测构成的双向预测帧。在B帧中,除常规前向、后向、双向和跳过/直接预测模式之外,对称预测定义为特别双向预测模式,其中仅一个前向运动矢量(MV)被编解码,并且基于图片顺序计数器(POC)距离从前向MV推导后向MV。对称模式可以高效地表示对象的线性运动模型。
2.4.1编解码单元的语法和语义
Figure GDA0003230009800000161
Figure GDA0003230009800000171
以B帧作为示例,基于CuTypeIndex和ShapeOfPartitionIndex和以下表 81推导CU类型(CuType),预测分割类型和PU预测模式(PuPredMode)。
表81.CU类型和B帧的相关信息
Figure GDA0003230009800000172
Figure GDA0003230009800000181
表82.subCU类型和B帧的相关信息
Figure GDA0003230009800000182
2.4.2基于多运动模型的SKIP/DIRECT模式
当前块的SKIP模式的运动信息被从先前解码的块推导,并且不编码残差信息。相似于SKIP模式,DIRECT模式不具有要传输的运动信息,而预测残差和模式信息被传输。
作为传统SKIP和DIRECT模式的扩展,其中仅利用来自一个时域预测块(CuSubtypeIdx等于0)的运动信息,在AVS2和AVS3中引入四个基于附加运动模型的SKIP和DIRECT模式,即双向DIRECT/SKIP模式 (CuSubtypeIdx等于1),对称DIRECT/SKIP模式(CuSubtypeIdx等于2)、后向DIRECT/SKIP模式(CuSubtypeIdx等于3)和前向DIRECT/SKIP模式 (CuSubtypeIdx等于4)。
设计基于优先级的运动信息推导方法,其考虑块的运动模型(预测方向)。将较高优先级分配给具有与当前块相同的运动模型的邻近块的运动信息。
对于基于附加运动模型的四个跳过/直接模式中的每一个,运动信息推导过程可以被划分为按顺序进行的三个步骤。
运动模型匹配搜索:如图14所示,以该顺序进行在位置F,G,C, A,B,D处找到具有与当前块相同的运动模型的邻近块的初始处理。一旦找到与当前块共用相同运动模型的第一块,则将该块的运动信息分配给当前块。
人工搜索:在不存在与当前块共享相同运动模型的邻近块的情况下 (即,没有从步骤1找到结果),进行人工构建当前块的运动信息的第二过程。此过程因运动模型而异。
对于双向DIRECT/SKIP模式,计数以前向方向编解码多少空域邻近者,用Nfw指代,以及以后向方向编解码多少空域邻近者,用Nbw表示。如果Nfw和Nbw都等于或大于1,则将第一前向和第一后向预测块的运动信息的组合分配给当前块。搜索顺序与第一步相同,即从位置F,G,C, A,B和D。
对于对称DIRECT/SKIP模式,按顺序执行以下步骤:
计算用双向编解码多少空域邻近者,用Nbi指代。
如果Nbi等于或大于2,则以F,G,C,A,B和D的扫描顺序将最后一个块的邻近双向预测块的运动信息的运动信息(其等于D,B,A,C,G 和F的扫描顺序中的第一块)分配给当前块。
否则(如果Nbi小于2)如果Nbw等于或大于1(其中Nbw指代用后向方向编解码了多少空域邻近者),则第一后向预测块的运动信息的后向运动矢量(由MvE1指代)被分配给当前块,并且前向运动矢量MvE0被设定为等于Clip3(-32768,32767,-MvE1)。搜索顺序与第一步骤相同,即从位置F,G,C,A,B和D。
否则(如果Nbi小于2且Nbw小于1),如果Nfw等于或大于1(其中 Nfw指代用前向方向编解码多少空域邻近者),则第一前向预测块的运动信息的前向运动矢量(由MvE0指代)被分配给当前块,并后向运动矢量MvE1 被设定为等于Clip3(-32768,32767,-MvE0)。搜索顺序与第一步骤相同,即从位置F,G,C,A,B和D。
对于后向DIRECT/SKIP模式,计数用双向编解码多少空域邻近者,用 Nbi指代。将最后邻近双向预测块的后向运动信息分配给当前块。搜索顺序与第一步骤相同,即从位置F,G,C,A,B和D。
对于前向DIRECT/SKIP模式,计数用双向编解码多少空域邻近者,由 Nbi指代。将最后邻近双向预测块的前向运动信息分配给当前块。搜索顺序与第一步骤相同,即从位置F,G,C,A,B和D。
默认MV构建:仅当步骤1)和步骤2)都未能找到可用运动矢量时才调用该步骤。在AVS2/AVS3中,以下适用:
对于双向/对称跳过/直接模式,对前向和后向方向两者设定零运动矢量。
对于后向DIRECT/SKIP模式,后向运动矢量被设定为零MV,即(0, 0)
对于前向DIRECT/SKIP模式,前向运动矢量被设定为零MV,即(0, 0)。
由于存在多种SKIP和DIRECT模式,因此需要在信令通知SKIP和 DIRECT模式的运动模型中携带一些辅助信息(side information)。在AVS2 参考软件RD3.0中,速率-失真优化方法用于选择模式以编码块。在计算新 SKIP和DIRECT模式的RD成本时,考虑辅助信息以产生更准确的成本值。
3.由实施例解决的问题的示例
基于AVS2/AVS3多运动模型的跳过/直接模式采用当前块与其相邻的邻近块之间的运动模型的相关性。然而,它不能利用当前块和非相邻块之间的相似性。可以使用历史中先前编解码的运动信息,以用于更好的运动矢量预测。类似的想法也可以应用于多方向跳过/直接模式,其中一些细节将被开发以适应AVS2/AVS3中的设计。
另外,对于每个运动模型,仅允许一个候选,这可能限制运动预测的编解码增益。
4.本公开技术的示例实施例
为了解决该问题,若干方法包括使用一个或多个查找表(LUT,以存储历史运动信息)来预测块的运动信息。LUT的入口是运动候选。HMVP(基于历史的运动矢量预测符)候选用于指示存储在查找表(LUT)中的一组运动信息。
以下详细的实施例示例应被视为解释总体概念的示例。不应以狭义的方式解释这些实施例。此外,这些实施例可以以任何方式组合。
1.对于给定运动模型,来自属于相同运动模型的HMVP候选或非相邻空域块或时域块的运动候选可以用作基于多运动模型的方法(例如,AVS2 中的SKIP/DIRECT模式设计)的候选。
a.在一个示例中,在进行人工搜索过程之前,HMVP候选或来自非相邻空域块或时域块的运动候选可以被按顺序检查。如果存在来自属于相同运动模型的一个HMVP候选或非相邻空域块或时域块的一个运动候选,其被标记为最终运动候选,并且搜索过程终止。
b.在一个示例中,在进行默认MV构建过程之前,HMVP候选或来自非相邻空域块或时域块的运动候选可以被按顺序检查。如果存在来自属于相同运动模型的一个HMVP候选或非相邻空域块或时域块的一个运动候选,其被标记为最终运动候选,并且搜索过程终止。
c.在一个示例中,可以在人工搜索过程中考虑HMVP候选或来自非相邻空域块或时域块的运动候选。例如,可以在位置F,G,C, A,B和D之后搜索HMVP候选。在此情况下,一个HMVP候选或来自非相邻空域块或时域块的运动候选可以被视为来自相对位置的一个候选,如来自相邻空域块的那些候选。
2.基于多运动模型的方法中定义的运动模型(例如,AVS2中的 SKIP/DIRECT模式设计)可以被进一步扩展,以覆盖HMVP的使用。也就是说,HMVP候选可以被视为新的运动模型,并且被添加到基于多运动模型的方法的候选列表中。
a.在一个示例中,储存HMVP候选的LUT的每个条目被视为新的运动模型。
b.替代地,全部HMVP候选被视为一个新的运动模型。如果运动模型的指示表示其属于HMVP类别,该指示可以首先被信令通知,之后是HMVP候选的索引。
3.基于多运动模型的方法中定义的运动模型(例如,AVS2中的 SKIP/DIRECT模式)可以被进一步扩展,以覆盖来自非相邻块的运动信息的使用。也就是说,来自非相邻块的运动信息可以被视为新的运动模型,并且被添加到基于多运动模型的方法中的候选列表中。
a.在一个示例中,非相邻块的每个运动候选被视为新的运动模型。
b.替代地,来自非相邻块的全部运动候选被视为一个新的运动模型,命名为非相邻运动类别。如果运动模型的指示表示其属于非相邻运动类别,则该指示可以首先被信令通知,之后是来自非相邻块的运动候选的索引。
4.可以在AVS2/AVS3中的现有运动模型之前/之后插入新的运动模型。
a.在一个示例中,在全部现有运动模型之后插入全部HMVP候选。
b.替代地,在AVS2/AVS3中的一些现有运动模型之前插入一些 HMVP候选,而在AVS2/AVS3中的全部现有运动模型之后插入其他HMVP候选。
c.候选的整个列表(时域、双向、对称、后向和前向、HMVP和/ 或非相邻块的运动模型)可以在每个模型找到其相关候选之后被记录。
i.在一个示例中,如双向、对称、后向和前向的全部或多个运动模型中的零运动候选可以被来自其他运动模型的运动候选替代。
5.相似于PCT/CN2018/093663和PCT/CN2018/093987中的HMVP的设计,来自先前编解码块的编解码运动信息可以被用作编解码当前块的预测符。然而,基于运动模型,编解码运动信息被分类并插入到多个查找表。
a.在一个示例中,HMVP过程中使用的运动模型的类别与基于多运动模型的方法(例如,AVS2中的SKIP/DIRECT模式)中使用的那些相同,即,双向、对称方向、后向、前向。
b.替代地,SKIP/DIRECT模式中定义的运动模型的仅一部分在 HMVP过程中使用,以降低储存运动模型的全部类型的HMPV 候选所需的存储器。
6.并非如在基于多运动模型的方法(例如,AVS2的SKIP/DIRECT模式) 中对于每个运动模型允许一个候选,对于一个运动模型允许多个候选。也就是说,对于每个运动模型可以构建候选列表。
a.在一个示例中,多个候选的索引可以被进一步信令通知。在此情况下,涉及两个语法元素(第一个指示运动模型,并且第二个指示对应于选择的运动模型的候选列表的候选索引)。
b.替代地,可以在解码器侧选择多个候选之一,而不信令通知。
c.替代地,仅构建一个候选列表,然而,可以添加具有相同运动模型的多个候选。在此情况下,可以仅信令通知一个索引。
d.在一个示例中,可从从具有相同运动模型的相邻空域邻近块推导多个候选。
e.在一个示例中,可从具有相同运动模型的非相邻空域邻近块推导多个候选。
f.在一个示例中,可从具有相同运动模型的HMVP候选推导多个候选。
g.在一个示例中,可从SKIP/DIRECT模式中使用的三个步骤(运动模型匹配的搜索、人工搜索、默认MV)任一个推导多个候选。
h.全部运动模型的允许的多个候选的大小可以是相同的。
i.替代地,不同运动模型的允许的多个候选的大小可以是不同的。
j.允许的多个候选的(多个)大小可以是预定的或在序列参数集/图片参数集/条带报头等中信令通知的。
k.允许的多个候选的(多个)大小可以进一步取决于块大小/块形状 /编解码模式(跳过或直接)/图片或条带类型/低延迟检查标志。
7.基于多运动模型的方案中的搜索顺序和/或搜索点(空域/时域邻近块) 可以取决于运动模型。
a.在一个示例中,对于不同运动模型可以使用不同搜索顺序。顺序可以是预定的。
b.在一个示例中,搜索顺序可以依块而异以适应性地改变。
c.在一个示例中,搜索顺序可以基于另一运动模型的搜索结果适应性地改变。
d.在一个示例中,基于多运动模型的方案中的搜索顺序和/或搜索点 (空域/时域邻近块)可以取决于块形状/块大小/编解码模式等。
8.可以在HMVP候选与来自非相邻空域块或时域块的候选之间应用修剪。
a.如果两个候选是相同的或运动矢量差小于(多个)阈值,可以将两者中的仅一个添加到候选列表。
9.可以在HMVP候选与从现有基于多模型运动的SKIP/DIRECT模式设计推导的候选之间应用修剪。
a.相似地,可以在来自非相邻空域块或时域块的候选与从现有 SKIP/DIRECT模式设计推导的候选之间之间应用修剪。
b.在一个示例中,从现有SKIP/DIRECT模式设计推导的候选指示在章节2.4.2中的‘运动模型匹配的搜索’过程中找到的候选。
c.在一个示例中,从现有SKIP/DIRECT模式设计推导的候选指示在章节2.4.2中的‘默认MV构建’过程之后找到的候选。
d.在一个示例中,如果从现有基于多模型运动的SKIP/DIRECT模式设计推导的候选是来自‘人工搜索过程’或‘默认MV构建过程’,则修剪过程被跳过。
10.在一个示例中,仅在相同运动模型的MV候选之间进行修剪操作。
11.在一个示例中,存在每个运动模型的单独历史MV列表。当搜索运动模型时,该模型的历史MV列表中的MV候选可以被添加到merge候选列表。
a.在一个实施例中,仅对诸如双向预测模型和对称预测模型的一些运动模型建立历史MV列表,而不对诸如前向预测模型和后向预测模型的其他一些模型建立。
b.在一个实施例中,运动模型的历史MV列表仅在用该运动模型的 MV编解码/解码帧间编解码块之后更新。
12.cu_subtype_index的编解码可以被扩展,以允许其包含除五个现有运动模型之外的多个候选。
a.在一个示例中,可以利用截断二值化方法。
b.在一个示例中,可以以上下文编解码每个bin。
c.在一个示例中,可以以上下文编解码部分bin,并且可以以旁路模式编解码其余bin。
13.允许的运动模型的总数可以是预定的。
a.替代地,允许的运动模型的总数可以在序列报头、图片报头、条带报头中信令通知。
b.在一个示例中,每个HMVP候选就允许的运动模型的信令通知而言可以被视为一个运动模型。
14.提出了当以HMVP候选(即,来自储存来自先前编解码块的运动信息的查找表)编解码块时,这样的候选不用于更新LUT。
图15是一种视频处理装置1500的框图。装置1500可用于实现本文描述的一个或多个方法。装置1500可以实现为智能手机、平板电脑、计算机、物联网(IoT)接收器等。装置1500可以包含一个或多个处理器1502、一个或多个存储器1504和视频处理硬件1506。(多个)处理器1502可以被配置为实现本文档中描述的一种或多种方法。存储器(多个存储器)1504 可以用于存储用于实现本文描述的方法和技术的数据和代码。视频处理硬件1506可用于以硬件电路实现本文档中描述的一些技术。
图16是视频编码器的示例实现方式的框图。图16示出编码器实现方式具有内置的反馈路径,其中视频编码器还进行视频解码功能(重构视频数据的压缩表示,以用于下一视频数据的编码)。
图17是示出可以实现本文公开的各种技术的示例视频处理系统1700的框图。各种实现方式可以包含系统1700的一些或所有组件。系统1700可以包含用于接收视频内容的输入1702。视频内容可以以原始或未压缩格式接收,例如8或10比特多分量像素值,或者可以是压缩或编码格式。输入 1702可以表示网络接口、外围总线接口或存储接口。网络接口的示例包含诸如以太网、无源光网络(PON)等的有线接口和诸如Wi-Fi或蜂窝接口的无线接口。
系统1700可以包含编解码组件1704,其可以实现本文档中描述的各种编解码或编码方法。编解码组件1704可以减少从输入1702到编解码组件 1704的输出的视频的平均比特率,以产生视频的编解码表示。因此,编解码技术有时被称为视频压缩或视频转码技术。编解码组件1704的输出可以被存储,或者经由连接的通信传输,如组件1706所表示的。在输入1702处接收的视频的存储或通信的比特流(或编解码)表示可以由组件1708使用,以生成发送到显示接口1710的像素值或可显示视频。从比特流表示生成用户可视视频的过程有时被称为视频解压缩。此外,虽然某些视频处理操作被称为“编解码”操作或工具,但是应当理解,编解码工具或操作在编码器处使用,并且逆转编解码结果的对应的解码工具或操作将由解码器进行。
外围总线接口或显示接口的示例可以包含通用串行总线(USB)或高清晰度多媒体接口(HDMI)或Displayport等。存储接口的示例包含SATA(串行高级技术附件)、PCI、IDE接口等。本文档中描述的技术可以体现为各种电子装置,诸如移动电话、膝上型电脑、智能电话或能够执行数字数据处理和/或视频显示的其他装置。
图18A是视频处理的示例性方法1800的流程图。方法1800包含,在步骤1802,对视频块的候选列表应用从解码顺序中的先前编解码块推导的第一组候选中的候选与第二组候选中的候选之间的修剪操作。
方法1800包含,在步骤1804,基于应用修剪操作之后的候选列表,进行视频块与视频块的比特流表示之间的转换。
图18B是视频处理的示例性方法1830的流程图。方法1830包含,在步骤1832,对视频块的候选列表应用包括来自空域或时域非相邻块的候选的第一组候选与包括从基于多运动模型的跳过模式或直接模式设计推导的候选的第二组候选之间的修剪操作。
方法1830包含,在步骤1834,基于应用修剪操作之后的候选列表,进行视频块与视频块的比特流表示之间的转换。
图18C是视频处理的示例性方法1860的流程图。方法1860包含,在步骤1862,制止对视频块的候选列表应用修剪操作,候选列表包括从基于多运动模型的跳过模式或直接模式设计推导的多个候选,并且多个候选中的每一个是基于运动模型匹配的搜索或默认运动矢量构建过程。
方法1860包含,在步骤1864,基于候选列表,进行视频块与视频块的比特流表示之间的转换。
在本文所描述的方法中,在一些实施例中,转换可以包含编码视频块和视频以生成编解码表示或比特流。在一些实施例中,转换可以包含对编解码表示或比特流进行解码以生成视频块的像素值。在一些实施例中,转换可以是转码操作,其中视频表示的比特率或格式被改变。
通过将所公开的技术的实施例整合到HEVC参考软件中而实现的改进在下面的实验结果中示出。
下表示出了所提出的方案的
Figure GDA0003230009800000274
差量(delta)比特率(或BD率) 增益和处理时间影响。遵循参考软件TAVS3-1.0上的常见的测试条件,对 RA和LDP配置进行不同组的仿真(具有不同的编码器复杂度)。例如,“RA”表示对应于被设计为在编解码视频数据中使能相对频繁的随机访问点而不太强调延迟的最小化的一组编解码条件的随机访问。相反,“LDP”表示使用P帧的低延迟条件,其被设计为使能交互式实时通信,而不太强调随机访问的易用性。在全部测试中,表大小S设定为8,并应用约束FIFO规则(删除并向候选表添加条目)。
表1.在Nrdo=3的RA之下的HMVP的性能
Figure GDA0003230009800000271
表2.在Nrdo=4的RA之下的HMVP的性能
Figure GDA0003230009800000272
表3.在Nrdo=5的RA之下的HMVP的性能
Figure GDA0003230009800000273
表4.在Nrdo=2的LDP之下的HMVP的性能
Figure GDA0003230009800000281
表5.在Nrdo=3的LDP之下的HMVP的性能
Figure GDA0003230009800000282
当存在多达8个HMVP候选时,与TAVS3-1.0参考软件模型相比,上述仿真结果表明,本文档中描述的一些实施例以3、4或5全速率失真优化 (RDO)过程分别实现了随机访问(RA)的BD率降低1.88%、2.14%、 1.94%。对于LDP情况,提出的HMVP以2或3完整RDO过程分别实现了 2.06%和2.48%的BD率降低。注意到较小的编码和解码时间影响,并且在某些情况下,与TAVS2-1.0相比,编码器运行时间甚至可以减少。
本文档中描述的所公开的和其他方案、示例、实施例、模块和功能操作可以实现为数字电子电路,或者计算机软件、固件或硬件,包含本文档中公开的结构及其结构等同,或它们中的一个或多个的组合。所公开的和其他实施例可以实现为一个或多个计算机程序产品,即,在计算机可读介质上编码的一个或多个计算机程序指令模块,用于由数据处理装置执行或控制数据处理装置的操作。计算机可读介质可以是机器可读存储器件、机器可读存储基板、存储器器件,影响机器可读传播信号的物质组合,或者它们中的一个或多个的组合。术语“数据处理装置”包含用于处理数据的全部装置、设备和机器,包含例如可编程处理器、计算机或多个处理器或计算机。除了硬件之外,装置还可以包含为所讨论的计算机程序创建执行环境的代码,例如,构成处理器固件的代码、协议栈、数据库管理系统、操作系统,或者它们的一个或多个的组合。传播信号是人工生成的信号,例如机器生成的电信号、光信号或电磁信号,其被生成以编码信息,从而传输到合适的接收器装置。
计算机程序(也称为程序、软件、软件应用、脚本或代码)可以用任何形式的编程语言编写,包含编译或解释语言,并且可以以任何形式部署,包含如独立程序或适合在计算环境中使用的模块、组件、子例程或其他单元。计算机程序不一定对应于文件系统中的文件。程序可以存储在保存其他程序或数据(例如,存储在标记语言文档中的一个或多个脚本)的文件的一部分中、存储在专用于所讨论的程序的单个文件中,或存储在多个协调文件中(例如,存储一个或多个模块、子程序或代码各部分的文件)。计算机程序可以部署为在一个计算机上或在位于一个站点上或分布在多个站点上并通过通信网络互连的多个计算机上执行。
本文档中描述的过程和逻辑流程可以由执行一个或多个计算机程序的一个或多个可编程处理器执行,以通过对输入数据进行操作并生成输出来执行功能。过程和逻辑流程也可以由专用逻辑电路执行,并且装置也可以实现为专用逻辑电路,例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)。
作为示例,适合于执行计算机程序的处理器包含通用和专用微处理器,以及任何类型的数字计算机的任意一个或多个处理器。总体上,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是用于执行指令的处理器和用于存储指令和数据的一个或多个存储器设备。总体上,计算机还将包含或可操作地耦合至存储数据的一个或多个大容量存储装置,以从之接收数据或向其传输数据,例如磁盘、磁光盘或光盘。然而,计算机不一定需要这样的装置。适用于存储计算机程序指令和数据的计算机可读介质包含所有形式的非易失性存储器、介质和存储器装置,包含例如半导体存储器装置,例如EPROM、EEPROM和闪存装置;磁盘,例如内部硬盘或可移动磁盘;磁光盘;以及CD ROM和DVD-ROM盘。处理器和存储器可以由专用逻辑电路补充或并入专用逻辑电路中。
虽然本专利文档包含许多细节,但这些细节不应被解释为对任何主题或可要求保护的范围的限制,而是作为特定技术的特定实施例特有的特征的描述。在本专利文件中单独的实施例的上下文中描述的某些特征也可以在单个实施例中组合实现。相反,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合在多个实施例中实现。此外,尽管上面的特征可以描述为以某些组合起作用并且甚至最初如此要求保护,但是在某些情况下可以从组合中去除来自所要求保护的组合的一个或多个特征,并且所要求保护的组合可以涉及子组合或子组合的变体。
类似地,尽管在附图中以特定顺序描绘了操作,但是这不应该被理解为实现期望的结果要求以所示的特定顺序或按序列顺序执行这样的操作,或者执行所有示出的操作。此外,在本专利文档中描述的实施例中的各种系统组件的分离不应被理解为在所有实施例中都需要这种分离。
仅描述了几个实现方式和示例,并且可以基于本专利文档中描述和示出的内容来进行其他实现方式、增强和变体。

Claims (44)

1.一种视频处理方法,包括:
为视频中的当前块和所述视频的比特流之间的转换,在使用基于历史的运动矢量预测HMVP运动模型推导的第一候选和使用第一运动模型推导的第二候选之间应用修剪操作,其中,所述当前块是用基于多运动模型的跳过或直接模式编解码的,所述比特流包括所述当前块的候选索引;以及
基于所述修剪操作的结果执行所述转换;
其中,所述多运动模型中的每个运动模型对应于从相同规则推导的一个或多个候选,并且所述多运动模型包括从HMVP表推导候选的至少一个HMVP运动模型以及至少一个第一运动模型,所述第一运动模型包括以下中的至少一个:从不同于当前图片的图片推导候选的运动模型,或者从块的空域相邻块推导候选的运动模型,并且
所述候选索引指示所述HMVP运动模型用于所述当前块。
2.如权利要求1所述的方法,其中,所述修剪操作的结果指示为所述转换使用所述第一候选并且排除所述第二候选。
3.如权利要求2所述的方法,其中,所述第一候选与所述第二候选相同。
4.如权利要求2所述的方法,其中,所述第一候选和所述第二候选之间的运动矢量差值等于或小于阈值。
5.如权利要求1所述的方法,其中,所述HMVP表中的一个或多个候选是从所述视频的一个或多个先前块推导的,并且根据所述先前块的编解码顺序排列在所述HMVP表中。
6.如权利要求1所述的方法,其中,使用运动模型匹配搜索、人工搜索或默认运动向量构建过程中的一种来推导所述第二候选。
7.如权利要求1所述的方法,其中,执行所述转换包括从所述当前块生成所述比特流。
8.如权利要求1所述的方法,其中,执行所述转换包括从所述比特流生成所述当前块。
9.如权利要求1所述的方法,其中,所述第一候选与运动信息相关联,所述运动信息包括预测方向、参考图片索引、运动矢量值、强度补偿标志、仿射标志、运动矢量差精度或运动矢量差值中的至少一个。
10.如权利要求1所述的方法,还包括:
在执行所述转换之后,基于所述视频块的运动信息更新所述HMVP表。
11.如权利要求10所述的方法,还包括:
在更新所述HMVP表之后,基于所述HMVP表,执行在视频的后续视频块和所述视频的比特流之间的转换。
12.如权利要求1所述的方法,还包括:
避免在所述第二候选之间应用修剪操作。
13.一种处理视频数据的装置,包括处理器和其上具有指令的非暂时性存储器,其中,所述指令在由所述处理器执行时使得所述处理器:
为视频中的当前块和所述视频的比特流之间的转换,在使用基于历史的运动矢量预测HMVP运动模型推导的第一候选和使用第一运动模型推导的第二候选之间应用修剪操作,其中,所述当前块是用基于多运动模型的跳过或直接模式编解码的,所述比特流包括所述当前块的候选索引;以及
基于所述修剪操作的结果执行所述转换;
其中,所述多运动模型中的每个运动模型对应于从相同规则推导的一个或多个候选,并且所述多运动模型包括从HMVP表推导候选的至少一个HMVP运动模型以及至少一个第一运动模型,所述第一运动模型包括以下中的至少一个:从不同于当前图片的图片推导候选的运动模型,或者从块的空域相邻块推导候选的运动模型,并且
所述候选索引指示所述HMVP运动模型用于所述当前块。
14.如权利要求13所述的装置,其中,所述修剪操作的结果指示为所述转换使用所述第一候选并且排除所述第二候选。
15.如权利要求14所述的装置,其中,所述第一候选与所述第二候选相同。
16.如权利要求14所述的装置,其中,所述第一候选和所述第二候选之间的运动矢量差值等于或小于阈值。
17.如权利要求13所述的装置,其中,所述HMVP表中的所述一个或多个候选是从所述视频的一个或多个先前块中推导的,并且根据所述先前块的编解码顺序排列在所述HMVP表中。
18.如权利要求13所述的装置,其中,使用运动模型匹配搜索、人工搜索或默认运动向量构建过程之一来推导所述第二候选。
19.一种存储指令的非暂时性计算机可读存储介质,所述指令使得处理器:
为视频中的当前块和所述视频的比特流之间的转换,在使用基于历史的运动矢量预测HMVP运动模型推导的第一候选和使用第一运动模型推导的第二候选之间应用修剪操作,其中,所述当前块是用基于多运动模型的跳过或直接模式编解码的,所述比特流包括所述当前块的候选索引;以及
基于所述修剪操作的结果执行所述转换;
其中,所述多运动模型中的每个运动模型对应于从相同规则推导的一个或多个候选,并且所述多运动模型包括从HMVP表推导候选的至少一个HMVP运动模型以及至少一个第一运动模型,所述第一运动模型包括以下中的至少一个:从不同于当前图片的图片推导候选的运动模型,或者从块的空域相邻块推导候选的运动模型,并且
所述候选索引指示所述HMVP运动模型用于所述当前块。
20.一种存储比特流的非暂时性计算机可读记录介质,所述比特流由视频处理装置执行的方法生成,其中,所述方法包括:
为视频中的当前块和所述视频的比特流之间的转换,在使用基于历史的运动矢量预测HMVP运动模型推导的第一候选和使用第一运动模型推导的第二候选之间应用修剪操作,其中,所述当前块是用基于多运动模型的跳过或直接模式编解码的,所述比特流包括所述当前块的候选索引;以及
基于所述修剪操作的结果从所述当前块生成所述比特流;
其中,所述多运动模型中的每个运动模型对应于从相同规则推导的一个或多个候选,并且所述多运动模型包括从HMVP表推导候选的至少一个HMVP运动模型以及至少一个第一运动模型,所述第一运动模型包括以下中的至少一个:从不同于当前图片的图片推导候选的运动模型,或者从块的空域相邻块推导候选的运动模型,并且
所述候选索引指示所述HMVP运动模型用于所述当前块。
21.一种存储视频的比特流的方法,包括:
为视频中的当前块和所述视频的比特流之间的转换,在使用基于历史的运动矢量预测HMVP运动模型推导的第一候选和使用第一运动模型推导的第二候选之间应用修剪操作,其中,所述当前块是用基于多运动模型的跳过或直接模式编解码的,所述比特流包括所述当前块的候选索引;以及
基于所述修剪操作的结果从所述当前块生成所述比特流;
将所述比特流存储在非暂时性计算机可读记录介质中;
其中,所述多运动模型中的每个运动模型对应于从相同规则推导的一个或多个候选,并且所述多运动模型包括从HMVP表推导候选的至少一个HMVP运动模型以及至少一个第一运动模型,所述第一运动模型包括以下中的至少一个:从不同于当前图片的图片推导候选的运动模型,或者从块的空域相邻块推导候选的运动模型,并且
所述候选索引指示所述HMVP运动模型用于所述当前块。
22.一种用于视频处理的方法,包括:
对视频块的候选列表应用从解码顺序中先前编解码块推导的第一组候选中的候选与第二组候选中的候选之间的修剪操作;以及
基于应用所述修剪操作之后的所述候选列表,进行所述视频块与所述视频块的比特流表示之间的转换,
其中所述第二组候选包括从基于多运动模型的跳过模式或直接模式设计推导的候选,并且所述多运动模型中的每个运动模型对应于从相同规则推导的一个或多个候选。
23.如权利要求22所述的方法,其中所述第二组候选包括来自空域或时域非相邻块的候选。
24.如权利要求23所述的方法,其中所述修剪操作将第一候选插入到所述候选列表,并且从所述候选列表排除第二候选。
25.如权利要求24所述的方法,其中所述第一候选与所述第二候选相同。
26.如权利要求24所述的方法,其中所述第一候选与所述第二候选之间的运动矢量差小于阈值。
27.如权利要求22所述的方法,其中所述第二组候选中的候选是基于运动模型匹配的搜索。
28.如权利要求22所述的方法,其中所述第二组候选中的候选是基于默认运动矢量MV构建过程。
29.如权利要求22至28中任一项所述的方法,其中所述第一组候选中的候选是表中的基于历史的运动矢量预测HMVP候选。
30.如权利要求22所述的方法,其中所述第二组候选中的候选是从运动模型匹配的搜索中的空域或时域邻近块推导的,并且其中所述第一组候选中的候选是基于历史的运动矢量预测HMVP候选。
31.如权利要求22所述的方法,其中所述第二组候选中的候选是从运动模型匹配的搜索、人工搜索或默认运动矢量构建过程中的空域或时域邻近块推导的,并且其中所述第一组候选中的候选是基于历史的运动矢量预测HMVP候选。
32.如权利要求22至28中任一项所述的方法,其中利用修剪操作,以从空域或时域邻近块推导的候选和基于历史的运动矢量预测HMVP候选来构建所述候选列表。
33.如权利要求32所述的方法,其中从在所述视频块之前解码的先前解码的视频块推导所述HMVP候选。
34.如权利要求22至28中任一项所述的方法,其中进行所述转换包括从所述视频块生成所述比特流表示。
35.如权利要求22至28中任一项所述的方法,其中进行所述转换包括从所述比特流表示生成所述视频块。
36.如权利要求22至28中任一项所述的方法,其中所述第一组候选中的候选与运动信息相关联,所述运动信息包括预测方向、参考图片索引、运动矢量值、强度补偿标志、仿射标志、运动矢量差精度或运动矢量差值中的至少一个。
37.如权利要求22至28中任一项所述的方法,还包括:
基于进行所述转换来更新所述第一组候选。
38.如权利要求37所述的方法,其中更新所述第一组候选包括,在进行所述转换之后,基于所述视频块的运动信息更新所述第一组候选。
39.如权利要求37所述的方法,还包括:
在更新所述第一组候选之后,基于所述第一组候选,进行视频的随后的视频块与所述视频的比特流表示之间的转换。
40.一种用于视频处理的方法,包括:
对视频块的候选列表应用第一组候选与第二组候选之间的修剪操作,第一组候选包括来自空域或时域非相邻块的候选,第二组候选包括从基于多运动模型的跳过模式或直接模式设计推导的候选;以及
基于应用所述修剪操作之后的所述候选列表,进行所述视频块与所述视频块的比特流表示之间的转换,
其中所述多运动模型中的每个运动模型对应于从相同规则推导的一个或多个候选。
41.如权利要求40所述的方法,其中所述修剪操作应用在与相同运动模型相关联的候选之间。
42.一种用于视频处理的方法,包括:
制止对视频块的候选列表应用修剪操作,其中所述候选列表包括从基于多运动模型的跳过模式或直接模式设计推导的多个候选,并且其中所述多个候选中的每一个是基于运动模型匹配的搜索或默认运动矢量(MV)构建过程;以及
基于所述候选列表,进行所述视频块与所述视频块的比特流表示之间的转换,
其中所述多运动模型中的每个运动模型对应于从相同规则推导的一个或多个候选。
43.一种视频系统中的装置,包括处理器和具有其上的指令的非瞬态存储器,其中由所述处理器执行所述指令时,使所述处理器实现权利要求22至42中任一项所述的方法。
44.一种存储指令的非暂时性计算机可读存储介质,所述指令使得处理器实现权利要求22至42中任一项所述的方法。
CN201910792767.5A 2018-08-26 2019-08-26 基于多运动模型的跳过和直接模式编解码的视频块中的修剪方法及装置 Active CN110858905B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2018102370 2018-08-26
CNPCT/CN2018/102370 2018-08-26

Publications (2)

Publication Number Publication Date
CN110858905A CN110858905A (zh) 2020-03-03
CN110858905B true CN110858905B (zh) 2023-04-07

Family

ID=68104714

Family Applications (4)

Application Number Title Priority Date Filing Date
CN202310538021.8A Pending CN116418992A (zh) 2018-08-26 2019-08-26 组合的基于历史的运动矢量预测符和多运动模型解码
CN201910792767.5A Active CN110858905B (zh) 2018-08-26 2019-08-26 基于多运动模型的跳过和直接模式编解码的视频块中的修剪方法及装置
CN201910792768.XA Active CN110858906B (zh) 2018-08-26 2019-08-26 组合的基于历史的运动矢量预测符和多运动模型解码
CN201910792030.3A Active CN110858904B (zh) 2018-08-26 2019-08-26 基于多运动模型的视频编码和解码

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202310538021.8A Pending CN116418992A (zh) 2018-08-26 2019-08-26 组合的基于历史的运动矢量预测符和多运动模型解码

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN201910792768.XA Active CN110858906B (zh) 2018-08-26 2019-08-26 组合的基于历史的运动矢量预测符和多运动模型解码
CN201910792030.3A Active CN110858904B (zh) 2018-08-26 2019-08-26 基于多运动模型的视频编码和解码

Country Status (4)

Country Link
US (2) US11805269B2 (zh)
CN (4) CN116418992A (zh)
TW (3) TWI822839B (zh)
WO (3) WO2020044196A1 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020044196A1 (en) 2018-08-26 2020-03-05 Beijing Bytedance Network Technology Co., Ltd. Combined history-based motion vector predictor and multi-motion model decoding
KR20230141934A (ko) * 2018-12-28 2023-10-10 고도 가이샤 아이피 브릿지 1 화상 복호 장치, 화상 복호 방법 및 화상 복호 프로그램
WO2020244571A1 (en) 2019-06-04 2020-12-10 Beijing Bytedance Network Technology Co., Ltd. Motion candidate list construction using neighboring block information
KR20220016075A (ko) 2019-06-04 2022-02-08 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 모션 후보 리스트 구성 프로세스의 조건부 구현
EP3967040A4 (en) 2019-06-06 2022-11-30 Beijing Bytedance Network Technology Co., Ltd. CONSTRUCTION OF MOTION CANDIDATE LISTS FOR VIDEO ENCODING
CN114128295B (zh) 2019-07-14 2024-04-12 北京字节跳动网络技术有限公司 视频编解码中几何分割模式候选列表的构建
CN117596389A (zh) 2019-09-28 2024-02-23 北京字节跳动网络技术有限公司 视频编解码中的几何分割模式
WO2021133721A1 (en) 2019-12-26 2021-07-01 Bytedance Inc. Techniques for implementing a decoding order within a coded picture
CN113453005B (zh) * 2020-03-26 2022-11-01 杭州海康威视数字技术股份有限公司 解码方法、编码方法、装置及设备
CN112868235A (zh) * 2020-04-03 2021-05-28 深圳市大疆创新科技有限公司 一种视频处理方法、视频处理设备及计算机可读存储介质
CN113766244A (zh) * 2020-06-05 2021-12-07 Oppo广东移动通信有限公司 帧间预测方法、编码器、解码器以及计算机存储介质
CN114071158A (zh) 2020-07-29 2022-02-18 腾讯科技(深圳)有限公司 视频编解码中的运动信息列表构建方法、装置及设备
CN118541977A (zh) * 2021-11-05 2024-08-23 抖音视界有限公司 用于视频处理的方法、装置和介质
WO2024074149A1 (en) * 2022-10-08 2024-04-11 Douyin Vision Co., Ltd. Method, apparatus, and medium for video processing

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012059577A1 (en) * 2010-11-04 2012-05-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Picture coding supporting block merging and skip mode
CN104205838A (zh) * 2012-03-22 2014-12-10 联发科技股份有限公司 可伸缩视频编码的方法以及装置
CN107113424A (zh) * 2014-11-18 2017-08-29 联发科技股份有限公司 基于来自单向预测的运动矢量和合并候选的双向预测视频编码方法
CN107113440A (zh) * 2014-10-31 2017-08-29 三星电子株式会社 使用高精度跳过编码的视频编码设备和视频解码设备及其方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1225128C (zh) 2003-12-31 2005-10-26 中国科学院计算技术研究所 直接编码模式下确定参考图像块的方法
KR100746022B1 (ko) * 2005-06-14 2007-08-06 삼성전자주식회사 서브픽셀 움직임 추정시 모델 스위칭을 통한 압축 효율을증가시키는 인코딩 방법 및 장치
WO2014005077A1 (en) 2012-06-29 2014-01-03 Vid Scale, Inc. Frame prioritization based on prediction information
TWI625052B (zh) 2012-08-16 2018-05-21 Vid衡器股份有限公司 多層視訊編碼以片段為基礎之跨越模式傳訊
WO2014107853A1 (en) 2013-01-09 2014-07-17 Mediatek Singapore Pte. Ltd. Methods for disparity vector derivation
US9521425B2 (en) 2013-03-19 2016-12-13 Qualcomm Incorporated Disparity vector derivation in 3D video coding for skip and direct modes
CN104104964B (zh) 2013-04-09 2019-03-12 乐金电子(中国)研究开发中心有限公司 一种深度图像帧间编码、解码方法、编码器及解码器
US10469863B2 (en) 2014-01-03 2019-11-05 Microsoft Technology Licensing, Llc Block vector prediction in video and image coding/decoding
US10368091B2 (en) 2014-03-04 2019-07-30 Microsoft Technology Licensing, Llc Block flipping and skip mode in intra block copy prediction
WO2016090568A1 (en) 2014-12-10 2016-06-16 Mediatek Singapore Pte. Ltd. Binary tree block partitioning structure
CN106416254B (zh) 2015-02-06 2019-08-02 微软技术许可有限责任公司 在媒体编码期间跳过评估阶段
CN108293131B (zh) * 2015-11-20 2021-08-31 联发科技股份有限公司 基于优先级运动矢量预测子推导的方法及装置
WO2017088093A1 (en) 2015-11-23 2017-06-01 Mediatek Singapore Pte. Ltd. On the smallest allowed block size in video coding
US10721489B2 (en) 2016-09-06 2020-07-21 Qualcomm Incorporated Geometry-based priority for the construction of candidate lists
US10812791B2 (en) * 2016-09-16 2020-10-20 Qualcomm Incorporated Offset vector identification of temporal motion vector predictor
US10602180B2 (en) 2017-06-13 2020-03-24 Qualcomm Incorporated Motion vector prediction
WO2020044196A1 (en) 2018-08-26 2020-03-05 Beijing Bytedance Network Technology Co., Ltd. Combined history-based motion vector predictor and multi-motion model decoding

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012059577A1 (en) * 2010-11-04 2012-05-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Picture coding supporting block merging and skip mode
CN104205838A (zh) * 2012-03-22 2014-12-10 联发科技股份有限公司 可伸缩视频编码的方法以及装置
CN107113440A (zh) * 2014-10-31 2017-08-29 三星电子株式会社 使用高精度跳过编码的视频编码设备和视频解码设备及其方法
CN107113424A (zh) * 2014-11-18 2017-08-29 联发科技股份有限公司 基于来自单向预测的运动矢量和合并候选的双向预测视频编码方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
《CE4.2.3: Improvement on Merge/Skip mode》;HAN Yu 等;《Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 Document: JVET-K0339》;20180718;全文 *
《CE4-related: History-based Motion Vector Prediction》;ZHANG Li 等;《Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 Document: JVET-K0104-v5》;20180718;摘要,第2部分 *
《Description of Core Experiment 4 (CE4): Inter prediction and motion vector coding》;YANG Haitao 等;《Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 Document: JVET-K1024-v4》;20180718;第4.3.9部分 *
《MULTI-DIRECTIONAL SKIP AND DIRECT MODES DESIGN IN BIPREDICTIVE SLICES FOR AVS2 STANDARD》;SHAO Zhenjiang 等;《2014 IEEE International Conference on Multimedia and Expo Workshops (ICMEW)》;20140718;第1部分 *

Also Published As

Publication number Publication date
WO2020044195A1 (en) 2020-03-05
CN110858906B (zh) 2023-05-30
TWI822839B (zh) 2023-11-21
TWI840400B (zh) 2024-05-01
CN110858904B (zh) 2023-04-18
US20210185342A1 (en) 2021-06-17
WO2020044197A1 (en) 2020-03-05
TW202017390A (zh) 2020-05-01
CN116418992A (zh) 2023-07-11
TW202011746A (zh) 2020-03-16
CN110858904A (zh) 2020-03-03
CN110858905A (zh) 2020-03-03
US20210185341A1 (en) 2021-06-17
US11871023B2 (en) 2024-01-09
TW202114422A (zh) 2021-04-01
CN110858906A (zh) 2020-03-03
TWI840401B (zh) 2024-05-01
WO2020044196A1 (en) 2020-03-05
US11805269B2 (en) 2023-10-31

Similar Documents

Publication Publication Date Title
CN110858905B (zh) 基于多运动模型的跳过和直接模式编解码的视频块中的修剪方法及装置
CN110944193B (zh) 视频编码和解码中的加权双向预测
CN113056917B (zh) 为视频处理使用具有几何分割的帧间预测
CN111064959B (zh) 要检查多少个hmvp候选
CN112970253B (zh) 用于预测的运动候选列表构建
CN110839158B (zh) 变换矩阵选择的系数相关的编解码
CN113228635B (zh) 用于帧内块复制的运动候选列表构建方法
CN113924771B (zh) 子块Merge模式中的语法信令
CN117528076A (zh) 用于具有几何分割的帧间预测的构建方法
CN113302937A (zh) 运动候选推导
CN113302917B (zh) 局部照明补偿的改进方法
CN113170166B (zh) 具有几何分割的帧间预测在视频处理中有条件的应用
CN110677678B (zh) 依赖形状的帧间编码
CN113170139B (zh) 上下文自适应二进制算数编码的简化上下文建模
CN114747218A (zh) Hmvp表的更新

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant