CN114080810A - 基于帧间预测的图像编译方法和装置 - Google Patents

基于帧间预测的图像编译方法和装置 Download PDF

Info

Publication number
CN114080810A
CN114080810A CN202080049667.4A CN202080049667A CN114080810A CN 114080810 A CN114080810 A CN 114080810A CN 202080049667 A CN202080049667 A CN 202080049667A CN 114080810 A CN114080810 A CN 114080810A
Authority
CN
China
Prior art keywords
reference picture
prediction
information
mvd
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080049667.4A
Other languages
English (en)
Inventor
朴奈利
南廷学
张炯文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN114080810A publication Critical patent/CN114080810A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

根据本文档的图像解码方法可以包括:用于从编码信息推导帧间预测模式的步骤;用于构建参考图片列表的步骤;用于基于包括在参考图片列表中的参考图片推导包括用于对称运动矢量差(SMVD)的参考图片索引的运动信息的步骤;以及基于运动信息生成预测样本的步骤。可以基于包括在参考图片列表中的短期参考图片来推导用于SMVD的参考图片索引。

Description

基于帧间预测的图像编译方法和装置
技术领域
本文档涉及一种基于帧间预测的图像编译方法和装置。
背景技术
最近,在各种领域中对诸如4K或8K超高清(UHD)图像/视频的高分辨率、高质量图像/视频的需求不断增加。随着图像/视频分辨率或质量变得更高,与传统图像/视频数据相比发送相对更多的信息或比特。因此,如果图像/视频数据经由诸如现有有线/无线宽带线路的介质发送或被存储在传统存储介质中,则传输和存储的成本容易增加。
此外,对虚拟现实(VR)和人工现实(AR)内容以及诸如全息图的沉浸式媒体的兴趣和需求日益增长;并且表现出与现实图像/视频不同的图像/视频特性的图像/视频(例如,游戏图像/视频)的广播也日益增长。
因此,需要高度高效的图像/视频压缩技术来有效地压缩并发送、存储或播放如上所述显示出各种特性的高分辨率、高质量图像/视频。
此外,图像/视频编译中的帧间预测可以包括用于对称运动矢量差(SMVD)参考索引的过程和/或用于合并运动矢量差(MMVD)的过程。考虑到参考图片标记(例如,短期或长期参考),存在将相关技术应用于SMVD参考索引的过程的讨论。
发明内容
技术方案
根据本公开的一个实施例,提供了一种用于改进图像/视频编译效率的方法和装置。
根据本公开的一个实施例,提供了一种用于在图像/视频编译系统中有效地执行帧间预测的方法和装置。
根据本公开的一个实施例,提供了一种用于在帧间预测中用信号发送关于运动矢量差的信息的方法和装置。
根据本公开的一个实施例,当对当前块应用双预测时,提供了用于用信号发送关于L0运动矢量差和L1运动矢量差的信息的方法和装置。
根据本公开的一个实施例,提供了一种用于用信号发送SMVD标志的方法和装置。
根据本公开的一个实施例,提供了一种用于基于SMVD标志推导L1运动矢量差的方法和设备。
根据本公开的一个实施例,可以基于参考图片标记来执行用于推导SMVD参考索引的过程。
根据本公开的一个实施例,可以使用短期参考图片(标记为短期参考)来执行用于推导SMVD参考索引的过程。
根据本文档的实施例,提供了由解码设备执行的视频/图像解码方法。
根据本文档的实施例,提供了用于执行视频/图像解码的解码设备。
根据本文档的实施例,提供了由编码设备执行的视频/图像编码方法。
根据本文档的实施例,提供了用于执行视频/图像编码的编码设备。
根据本文档的一个实施例,提供了一种计算机可读数字存储介质,其中存储根据本文档的至少一个实施例中公开的视频/图像编码方法生成的编码视频/图像信息。
根据本文档的实施例,提供了一种计算机可读数字存储介质,其中存储使得通过解码设备执行在本文档的至少一个实施例中公开的视频/图像解码方法的编码信息或编码视频/图像信息。
有益效果
根据本公开,可以提高整体图像/视频压缩效率。
根据本公开,可以有效地执行关于运动矢量差的信息的信令。
根据本公开,当对当前块应用双预测时,可以有效地推导L1运动矢量差。
根据本公开,可以通过有效地用信号发送用于推导L1运动矢量差的信息来减少编译系统的复杂性。
根据本公开的一个实施例,可以使用用于推导SMVD的参考图片索引的短期参考图片来执行有效的帧间预测。
通过本公开的特定实施例实现的技术效果不限于上述那些效果。例如,可以获得相关领域的普通技术人员能够理解或从本公开中推导的各种其他技术效果。因此,本公开的特定效果不限于本文档中明确公开的那些,并且可以包括可以从本公开的技术特征中理解或推导的各种其他效果。
附图说明
图1图示本文档的实施例可以应用于的视频/图像编译系统的示例。
图2是示意性地图示本文档的实施例可以应用于的视频/图像编码设备的配置的图。
图3是图示本公开的实施例可以应用于的视频/图像解码设备的配置的示意图。
图4示出基于帧间预测的视频/图像编码方法的示例。
图5示出基于帧间预测的视频/图像解码方法的示例。
图6示例性地示出帧间预测过程。
图7图示根据本公开的用于构建MVP候选列表的方法。
图8是用于描述对称运动矢量差(SMVD)的图。
图9是用于描述在帧间预测中推导运动矢量的方法的图。
图10图示根据本公开的一个实施例的MMVD的MVD推导过程。
图11图示根据本公开的另一个实施例的MMVD的MVD推导过程。
图12图示根据本公开的又一实施例的MMVD的MVD推导过程。
图13图示根据本公开的一个实施例的MMVD的MVD推导过程。
图14图示根据本公开的一个实施例的MMVD的MVD推导过程。
图15和图16图示根据本公开的实施例的视频/图像编码方法和相关组件的一个示例。
图17和图18图示根据本公开的实施例的图像/视频解码方法和相关组件的一个示例。
图19图示本公开的实施例可以应用于的内容流系统的示例。
具体实施方式
本文档可以以各种方式修改,并且其特定实施例将在附图中描述并且示出。然而,实施例并不旨限制本文档。以下描述中使用的术语仅用于描述特定实施例,而不是旨在限制本文档。单数的表达包括复数的表达,只要它不被清楚地不同地理解。诸如“包括”或“具有”这样的术语应该被理解为指示存在以下描述中使用的特性、数字、步骤、操作、元件、组件或其组合,而没有排除存在或添加一个或多个不同的特性、数字、步骤、操作、元件、组件或其组合的可能性。
同时,为了便于关于不同特征功能的描述,独立地示出本文档中描述的附图中的每个配置,并且不意味着每个配置被实现为单独的硬件或单独的软件。例如,可以组合每个组件中的两个或更多个组件以形成一个组件,或者可以将一个组件划分为多个组件。其中每个组件被集成和/或分离的实施例也包括在本文档的公开的范围内。
在下文中,将参考附图详细地描述本实施例的示例。此外,在附图中,相同的参考数字用于指示相同的元件,并且可省略了相同元件的重复描述。
图1图示可以应用本文档的实施例的视频/图像编译系统的示例。
参考图1,视频/图像编译系统可以包括第一装置(源装置)和第二装置(接收装置)。源装置可以经由数字存储介质或网络以文件或流的形式将编码后的视频/图像信息或数据传送到接收装置。
源装置可以包括视频源、编码设备和发送器。接收装置可以包括接收器、解码设备和渲染器。编码设备可以被称为视频/图像编码设备,并且解码设备可以被称为视频/图像解码设备。发送器可以被包括在编码设备中。接收器可以被包括在解码设备中。渲染器可以包括显示器,并且显示器可以被配置为单独的装置或外部组件。
视频源可以通过捕获、合成或生成视频/图像的过程来获得视频/图像。视频源可以包括视频/图像捕获装置和/或视频/图像生成装置。视频/图像捕获装置可以包括例如一个或更多个相机、包括先前捕获的视频/图像的视频/图像档案等。视频/图像生成装置可以包括例如计算机、平板计算机和智能电话,并且可以(电子地)生成视频/图像。例如,可以通过计算机等生成虚拟视频/图像。在这种情况下,视频/图像捕获过程可以被生成相关数据的过程取代。
编码设备可以对输入视频/图像进行编码。编码设备可以执行诸如预测、变换和量化这样的一系列过程用于压缩和编译效率。编码后的数据(编码后的视频/图像信息)可以以比特流的形式输出。
发送器可以通过数字存储介质或网络以文件或流的形式将以比特流的形式输出的编码后的图像/图像信息或数据发送到接收装置的接收器。数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等这样的各种存储介质。发送器可以包括用于通过预定文件格式生成媒体文件的元件,并且可以包括用于通过广播/通信网络进行传输的元件。接收器可以接收/提取比特流,并且将接收的比特流发送到解码设备。
解码设备可以通过执行与编码设备的操作对应的诸如解量化、逆变换、预测等这样的一系列过程来解码视频/图像。
渲染器可以渲染解码后的视频/图像。可以通过显示器显示渲染后的视频/图像。
本文档涉及视频/图像编译。例如,本文档中公开的方法/实施例可以应用于通用视频编译(VVC)、基本视频编译(EVC)标准、AOMedia Video1(AV1)标准、第二代音频视频编译标准(AVS2)或下一代视频/图像编译标准(例如,H.267或H.268等)中公开的方法。
本文档提出视频/图像编译的各种实施例,并且除非相反地提及,否则这些实施例可以被彼此组合地执行。
在本文档中,视频可指随时间的一系列图像。图片通常是指表示特定时间帧处的一个图像的单元,并且切片(slice)/拼块(tile)是指在编译方面构成图片的一部分的单元。切片/拼块可以包括一个或多个编译树单元(CTU)。一个图片可以由一个或多个切片/拼块组成。一个图片可以由一个或多个拼块组组成。一个拼块组可以包括一个或多个拼块。图块(brick)可以表示图片中的拼块内的CTU行的矩形区域。拼块可以被分区成多个图块,每个图块可以利用拼块内的一个或多个CTU行来构建。未被分区成多个图块的拼块也可以被称为图块。图块扫描可以表示将图片分区的CTU的特定顺序排序,其中CTU可以在图块内以CTU光栅扫描排序,并且拼块内的图块可以以拼块的图块的光栅扫描连续地排序,并且图片中的拼块可以以图片的拼块的光栅扫描连续地排序。拼块是图片内特定拼块列和特定拼块行内的CTU的矩形区域。拼块列是CTU的矩形区域,其具有等于图片的高度的高度和由图片参数集中的语法元素指定的宽度。拼块行是CTU的矩形区域,其具有由图片参数集中的语法元素指定的高度和等于图片的宽度的宽度。拼块扫描是将图片分区的CTU的特定顺序排序,其中CTU在拼块中以CTU光栅扫描连续地排序而图片中的拼块以图片的拼块的光栅扫描连续地排序。切片包括图片的整数个图块,其可以排他性地包括在单个NAL单元中。切片可以由多个完整拼块组成,或者仅由一个拼块的连续完整图块序列组成。在本文档中,可以使用拼块组和切片来代替彼此。例如,在本文档中,拼块组/拼块组报头可以称为切片/切片报头。
同时,一个图片可以划分成两个或更多个子图片。子图片可以是图片内一个或多个切片的矩形区域。
像素或像元(pel)可以意指构成一个图片(或图像)的最小单元。另外,“样本”可以用作与像素对应的术语。样本通常可以表示像素或像素的值,并且可以仅表示亮度分量的像素/像素值或仅表示色度分量的像素/像素值。
单元可以表示图像处理的基本单位。单元可以包括图片的特定区域和与该区域有关的信息中的至少一个。一个单元可以包括一个亮度块和两个色度(例如,cb、cr)块。在一些情况下,单元可以与诸如块或区域的术语互换使用。在一般情况下,M×N块可以包括M列和N行的样本(或样本阵列)或变换系数的集合(或阵列)。可选地,样本可以意指空间域中的像素值,并且当这种像素值被变换到频域时,它可以意指频域中的变换系数。
在本文档中,“A或B”可以意指“仅A”、“仅B”或“A和B这二者”。换句话说,在本文档中,“A或B”可以被解释为“A和/或B”。例如,在本文档中,“A、B或C(A、B或C)”意指“仅A”、“仅B”、“仅C”或“A、B和C的任何组合”。
本文档中使用的斜线“/”或逗号(,)可以意指“和/或”。例如,“A/B”可以意指“A和/或B”。因此,“A/B”可以意指“仅A”、“仅B”或“A和B这二者”。例如,“A、B、C”可以意指“A、B或C”。
在本文档中,“A和B中的至少一个”可以意指“仅A”、“仅B”或“A和B这二者”。此外,在本文档中,表达“A或B中的至少一个”或“A和/或B中的至少一个”可以被解释为“A和B中的至少一个”。
此外,在本文档中,“A、B和C中的至少一个”可以意指“仅A”、“仅B”、“仅C”或“A、B和C的任何组合”。此外,“A、B或C中的至少一个”或“A、B和/或C中的至少一个”可以意指“A、B和C中的至少一个”。
此外,本文档中使用的括号可以意指“例如”。具体地,当指示“预测(帧内预测)”时,可以将“帧内预测”作为“预测”的示例提出。换句话说,本文档中的“预测”不限于“帧内预测”,并且可以将“帧内预测”作为“预测”的示例提出。此外,即使在指示“预测(即,帧内预测)”时,也可以将“帧内预测”作为“预测”的示例提出。
在本文档的一个附图中单独描述的技术特征可以单独地或同时地实现。
图2示出可以应用本文档的实施例的视频/图像编码设备的结构。在下文中,所谓的视频编码设备可以包括图像编码设备。
参考图2,编码设备200包括图像分割器210、预测器220、残差处理器230和熵编码器240、加法器250、滤波器260和存储器270。预测器220可以包括帧间预测器221和帧内预测器222。残差处理器230可以包括变换器232、量化器233、解量化器234和逆变换器235。残差处理器230还可以包括减法器231。加法器250可以被称为重构器或重构块生成器。根据实施例,图像分割器210、预测器220、残差处理器230、熵编码器240、加法器250和滤波器260可以由至少一个硬件组件(例如,编码器芯片组或处理器)配置。另外,存储器270可以包括解码图片缓冲器(DPB),或者可以由数字存储介质配置。硬件组件还可以包括存储器270作为内部/外部组件。
图像分割器210可以将输入到编码设备200的输入图像(或者图片或帧)分区成一个或更多个处理器。例如,处理器可以被称为编译单元(CU)。在这种情况下,编译单元可以根据四叉树二叉树三叉树(QTBTTT)结构从编译树单元(CTU)或最大编译单元(LCU)递归地分区。例如,一个编译单元可以基于四叉树结构、二叉树结构和/或三元结构被分区成深度更深的多个编译单元。在这种情况下,例如,可以首先应用四叉树结构,稍后可以应用二叉树结构和/或三元结构。另选地,可以首先应用二叉树结构。可以基于不再分区的最终编译单元来执行根据本文档的编译过程。在这种情况下,根据图像特性基于编译效率,最大编译单元可以用作最终编译单元,或者如果需要,编译单元可以被递归地分区成深度更深的编译单元并且具有最优大小的编译单元可以用作最终编译单元。这里,编译过程可以包括预测、变换和重构的过程(将稍后描述)。作为另一示例,处理器还可以包括预测单元(PU)或变换单元(TU)。在这种情况下,预测单元和变换单元可以从上述最终编译单元分割或分区。预测单元可以是样本预测的单元,变换单元可以是用于推导变换系数的单元和/或用于从变换系数推导残差信号的单元。
在一些情况下,单元可以与诸如块或区域的术语互换使用。在一般情况下,M×N块可以表示由M列和N行组成的样本或变换系数的集合。样本通常可以表示像素或像素值,可以仅表示亮度分量的像素/像素值或者仅表示色度分量的像素/像素值。样本可以用作与像素或像元(pel)的一个图片(或图像)对应的术语。
在编码设备200中,从输入图像信号(原始块、原始样本阵列)减去从帧间预测器221或帧内预测器222输出的预测信号(预测块、预测样本阵列)以生成残差信号(残差块、残差样本阵列),并且所生成的残差信号被发送到变换器232。在这种情况下,如所示,在编码器200中从输入图像信号(原始块、原始样本阵列)减去预测信号(预测块、预测样本阵列)的单元可以被称为减法器231。预测器可以对要处理的块(以下,称为当前块)执行预测并且生成包括当前块的预测样本的预测块。预测器可以以当前块或CU为单位确定应用帧内预测还是帧间预测。如在各个预测模式的描述中稍后描述的,预测器可以生成与预测有关的各种信息(例如,预测模式信息)并将所生成的信息发送到熵编码器240。关于预测的信息可在熵编码器240中编码并以比特流的形式输出。
帧内预测器222可以参考当前图片中的样本来预测当前块。根据预测模式,所参考的样本可以位于当前块附近或者可以隔开。在帧内预测中,预测模式可以包括多个非定向模式和多个定向模式。例如,非定向模式可以包括DC模式和平面模式。例如,根据预测方向的详细程度,定向模式可以包括33个定向预测模式或65个定向预测模式。然而,这仅是示例,可以根据设置使用更多或更少的定向预测模式。帧内预测器222可以使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器221可以基于参考图片上由运动矢量指定的参考块(参考样本阵列)来推导当前块的预测块。这里,为了减少在帧间预测模式下发送的运动信息量,可以基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为单位预测运动信息。运动信息可以包括运动矢量和参考图片索引。运动信息还可以包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可以包括存在于当前图片中的空间邻近块和存在于参考图片中的时间邻近块。包括参考块的参考图片和包括时间邻近块的参考图片可相同或不同。时间邻近块可以被称为并置参考块、并置CU(colCU)等,并且包括时间邻近块的参考图片可以被称为并置图片(colPic)。例如,帧间预测器221可以基于邻近块来配置运动信息候选列表并且生成指示哪一候选用于推导当前块的运动矢量和/或参考图片索引的信息。可以基于各种预测模式执行帧间预测。例如,在跳过模式和合并模式的情况下,帧间预测器221可以使用邻近块的运动信息作为当前块的运动信息。在跳过模式下,与合并模式不同,可以不发送残差信号。在运动矢量预测(MVP)模式的情况下,邻近块的运动矢量可以用作运动矢量预测子,并且可以通过用信号发送运动矢量差来指示当前块的运动矢量。
预测器220可以基于下面描述的各种预测方法来生成预测信号。例如,预测器可不仅应用帧内预测或帧间预测来预测一个块,而且同时应用帧内预测和帧间预测二者。这可以被称为组合帧间和帧内预测(CIIP)。另外,预测器可以基于帧内块复制(IBC)预测模式或调色板模式来预测块。IBC预测模式或调色板模式可以用于游戏等的内容图像/视频编译,例如屏幕内容编译(SCC)。IBC基本上在当前图片中执行预测,但是可以与帧间预测相似地执行,使得在当前图片中推导参考块。即,IBC可以使用本文档中描述的至少一个帧间预测技术。调色板模式可以被视为帧内编译或帧内预测的示例。当应用调色板模式时,可以基于关于调色板表和调色板索引的信息用信号发送图片内的样本值。
由预测器(包括帧间预测器221和/或帧内预测器222)生成的预测信号可以用于生成重构信号或生成残差信号。变换器232可以通过对残差信号应用变换技术来生成变换系数。例如,变换技术可以包括离散余弦变换(DCT)、离散正弦变换(DST)、karhunen-loève变换(KLT)、基于图形的变换(GBT)或条件非线性变换(CNT)中的至少一个。这里,当像素之间的关系信息由图形表示时,GBT意指从图形获得的变换。CNT是指基于使用所有先前重构的像素生成的预测信号生成的变换。另外,变换处理可以应用于具有相同大小的正方形像素块或者可以应用于正方形以外的具有可变大小的块。
量化器233可以将变换系数量化并将它们发送到熵编码器240,并且熵编码器240可以对量化的信号(关于量化变换系数的信息)进行编码并输出比特流。关于量化变换系数的信息可以被称为残差信息。量化器233可以基于系数扫描顺序将块类型量化变换系数重排为一维矢量形式,并且基于一维矢量形式的量化变换系数来生成关于量化变换系数的信息。可以生成关于变换系数的信息。熵编码器240可以执行例如指数Golomb、上下文自适应可变长度编译(CAVLC)、上下文自适应二进制算术编译(CABAC)等的各种编码方法。熵编码器240可以对量化变换系数以外的视频/图像重构所需的信息(例如,语法元素的值等)一起或单独地进行编码。编码的信息(例如,编码的视频/图像信息)可以按比特流的形式以NAL(网络抽象层)为单位发送或存储。视频/图像信息还可以包括关于各种参数集的信息,例如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)。另外,视频/图像信息还可以包括一般约束信息。在本文档中,从编码设备发送/用信号发送给解码设备的信息和/或语法元素可以被包括在视频/图片信息中。视频/图像信息可以通过上述编码过程编码并被包括在比特流中。比特流可以经由网络发送或者可以被存储在数字存储介质中。网络可以包括广播网络和/或通信网络,并且数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送从熵编码器240输出的信号的发送器(未示出)和/或存储该信号的存储单元(未示出)可以被包括作为编码设备200的内部/外部元件,并且另选地,发送器可以被包括在熵编码器240中。
从量化器233输出的量化变换系数可以用于生成预测信号。例如,可以通过经由解量化器234和逆变换器235对量化变换系数应用解量化和逆变换来重构残差信号(残差块或残差样本)。加法器250将重构的残差信号与从帧间预测器221或帧内预测器222输出的预测信号相加以生成重构信号(重构图片、重构块、重构样本阵列)。如果要处理的块不存在残差(例如,应用跳过模式的情况),则预测块可以用作重构块。加法器250可以被称为重构器或重构块生成器。如下所述,所生成的重构信号可以用于当前图片中要处理的下一块的帧内预测并且可以通过滤波用于下一图片的帧间预测。
此外,可在图片编码和/或重构期间应用亮度映射与色度缩放(LMCS)。
滤波器260可以通过对重构信号应用滤波来改进主观/客观图像质量。例如,滤波器260可以通过对重构图片应用各种滤波方法来生成修改的重构图片并将修改的重构图片存储在存储器270(具体地,存储器270的DPB)中。例如,各种滤波方法可以包括去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。滤波器260可以生成与滤波有关的各种信息并且将所生成的信息发送到熵编码器240,如在各个滤波方法的描述中稍后描述的。与滤波有关的信息可以由熵编码器240编码并以比特流的形式输出。
发送到存储器270的修改的重构图片可以用作帧间预测器221中的参考图片。当通过编码设备应用帧间预测时,可以避免编码设备200与解码设备之间的预测失配并且编码效率可改进。
存储器270的DPB可以存储用作帧间预测器221中的参考图片的修改的重构图片。存储器270可以存储推导(或编码)当前图片中的运动信息的块的运动信息和/或图片中已经重构的块的运动信息。所存储的运动信息可以被发送到帧间预测器221并用作空间邻近块的运动信息或时间邻近块的运动信息。存储器270可以存储当前图片中的重构块的重构样本并且可以将重构样本传送至帧内预测器222。
图3示出可以应用本说明书的实施例的视频/图像解码设备的配置。
参考图3,解码设备300可以包括熵解码器310、残差处理器320、预测器330、加法器340、滤波器350、存储器360。预测器330可以包括帧间预测器331和帧内预测器332。残差处理器320可以包括解量化器321和逆变换器321。根据实施例,熵解码器310、残差处理器320、预测器330、加法器340和滤波器350可以由硬件组件(例如,解码器芯片组或处理器)配置。另外,存储器360可以包括解码图片缓冲器(DPB)或者可以由数字存储介质配置。硬件组件还可以包括存储器360作为内部/外部组件。
当输入包括视频/图像信息的比特流时,解码设备300可以重构与在图2的编码设备中处理视频/图像信息的处理对应的图像。例如,解码设备300可以基于从比特流获得的块分区相关信息来推导单元/块。解码设备300可以使用编码设备中应用的处理器来执行解码。因此,例如,解码的处理器可以是编译单元,并且编译单元可以根据四叉树结构、二叉树结构和/或三叉树结构从编译树单元或最大编译单元分区。可从编译单元推导一个或更多个变换单元。通过解码设备300解码和输出的重构的图像信号可以通过再现设备再现。
解码设备300可接收从图2的编码设备以比特流的形式输出的信号,并且所接收的信号可以通过熵解码器310解码。例如,熵解码器310可以解析比特流以推导图像重构(或图片重构)所需的信息(例如,视频/图像信息)。视频/图像信息还可以包括关于各种参数集的信息,例如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)。另外,视频/图像信息还可以包括一般约束信息。解码设备还可以基于关于参数集的信息和/或一般约束信息将图片解码。本文档中稍后描述的用信号发送/接收的信息和/或语法元素可以通过解码过程解码并从比特流获得。例如,熵解码器310基于诸如指数Golomb编译、CAVLC或CABAC的编译方法对比特流中的信息进行解码,并且输出图像重构所需的语法元素和残差的变换系数的量化值。更具体地,CABAC熵解码方法可接收与比特流中的各个语法元素对应的bin(二进制位),使用解码目标语法元素信息、解码目标块的解码信息或在先前阶段中解码的符号/bin的信息来确定上下文模型,并且通过根据所确定的上下文模型预测bin出现的概率对bin执行算术解码,并且生成与各个语法元素的值对应的符号。在这种情况下,CABAC熵解码方法可以在确定上下文模型之后通过将解码的符号/bin的信息用于下一符号/bin的上下文模型来更新上下文模型。熵解码器310所解码的信息当中与预测有关的信息可以被提供给预测器(帧间预测器332和帧内预测器331),并且在熵解码器310中执行了熵解码的残差值(即,量化变换系数和相关参数信息)可以被输入到残差处理器320。残差处理器320可以推导残差信号(残差块、残差样本、残差样本阵列)。另外,熵解码器310所解码的信息当中关于滤波的信息可以被提供给滤波器350。此外,用于接收从编码设备输出的信号的接收器(未示出)还可以被配置成解码设备300的内部/外部元件,或者接收器可以是熵解码器310的组件。此外,根据本文档的解码设备可以被称为视频/图像/图片解码设备,并且解码设备可以被分类为信息解码器(视频/图像/图片信息解码器)和样本解码器(视频/图像/图片样本解码器)。信息解码器可以包括熵解码器310,并且样本解码器可以包括解量化器321、逆变换器322、加法器340、滤波器350、存储器360、帧间预测器332和帧内预测器331中的至少一个。
解量化器321可以将量化变换系数解量化并输出变换系数。解量化器321可以按二维块形式重排量化变换系数。在这种情况下,可以基于在编码设备中执行的系数扫描顺序来执行重排。解量化器321可以使用量化参数(例如,量化步长信息)对量化变换系数执行解量化并且获得变换系数。
逆变换器322对变换系数逆变换以获得残差信号(残差块、残差样本阵列)。
预测器可以对当前块执行预测并生成包括当前块的预测样本的预测块。预测器可以基于从熵解码器310输出的关于预测的信息来确定对当前块应用帧内预测还是帧间预测并且可以确定特定帧内/帧间预测模式。
预测器320可以基于下述各种预测方法来生成预测信号。例如,预测器不仅可应用帧内预测或帧间预测来预测一个块,而且可以同时应用帧内预测和帧间预测。这可以被称为组合帧间和帧内预测(CIIP)。另外,预测器可以基于帧内块复制(IBC)预测模式或调色板模式来预测块。IBC预测模式或调色板模式可以用于游戏等的内容图像/视频编译,例如屏幕内容编译(SCC)。IBC基本上中当前图片中执行预测,但是可以与帧间预测相似地执行,使得在当前图片中推导参考块。即,IBC可以使用本文档中描述的至少一种帧间预测技术。调色板模式可以被视为帧内编译或帧内预测的示例。当应用调色板模式时,可以基于关于调色板表和调色板索引的信息用信号发送图片内的样本值。
帧内预测器331可以参考当前图片中的样本来预测当前块。根据预测模式,所参考的样本可以位于当前块附近或者可以隔开。在帧内预测中,预测模式可以包括多个非定向模式和多个定向模式。帧内预测器331可以使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器332可以基于参考图片上由运动矢量指定的参考块(参考样本阵列)来推导当前块的预测块。在这种情况下,为了减少在帧间预测模式下发送的运动信息量,可以基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为单位预测运动信息。运动信息可以包括运动矢量和参考图片索引。运动信息还可以包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可以包括存在于当前图片中的空间邻近块和存在于参考图片中的时间邻近块。例如,帧间预测器332可以基于邻近块来配置运动信息候选列表并且基于所接收的候选选择信息来推导当前块的运动矢量和/或参考图片索引。可以基于各种预测模式来执行帧间预测,并且关于预测的信息可以包括指示当前块的帧间预测模式的信息。
加法器340可以通过将所获得的残差信号与从预测器(包括帧间预测器332和/或帧内预测器331)输出的预测信号(预测块、预测样本阵列)相加来生成重构信号(重构图片、重构块、重构样本阵列)。如果要处理的块不存在残差,例如当应用跳过模式时,预测块可以用作重构块。
加法器340可以被称为重构器或重构块生成器。所生成的重构信号可以用于当前图片中要处理的下一块的帧内预测,可以如下所述通过滤波输出,或者可以用于下一图片的帧间预测。
此外,可以在图片解码处理中应用亮度映射与色度缩放(LMCS)。
滤波器350可以通过对重构信号应用滤波来改进主观/客观图像质量。例如,滤波器350可以通过对重构图片应用各种滤波方法来生成修改的重构图片并且将修改的重构图片存储在存储器360(具体地,存储器360的DPB)中。例如,各种滤波方法可以包括去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。
存储在存储器360的DPB中的(修改的)重构图片可以用作帧间预测器332中的参考图片。存储器360可以存储推导(或解码)当前图片中的运动信息的块的运动信息和/或图片中已经重构的块的运动信息。所存储的运动信息可以被发送到帧间预测器260以用作空间邻近块的运动信息或时间邻近块的运动信息。存储器360可以存储当前图片中的重构块的重构样本并将重构样本传送至帧内预测器331。
在本文档中,在编码设备200的滤波器260、帧间预测器221和帧内预测器222中描述的实施例可以与解码设备300的滤波器350、帧间预测器332和帧内预测器331相同或分别与之对应地应用。这也可适用于单元332和帧内预测器331。
如上所述,在执行视频编译时,执行预测以增加压缩效率。通过此,可以生成包括用于当前块(要被编译的块)的预测样本的预测块。这里,预测块包括空间域(或像素域)中的预测样本。预测块在编码装置和解码装置中相同地推导,并且编码装置解码关于原始块与预测块之间的残差的信息(残差信息),而非原始块的原始样本值本身。通过用信号发送给装置,可以增加图像编译效率。解码设备可以基于残差信息来推导包括残差样本的残差块,通过对残差块和预测块求和来生成包括重构样本的重构块,并且生成包括重构块的重构图片。
残差信息可以通过变换过程和量化过程来生成。例如,编码设备可以推导原始块与预测块之间的残差块,并且对包括在残差块中的残差样本(残差样本阵列)执行变换过程来推导变换系数,并且然后,通过执行变换系数的量化过程来推导量化变换系数,以将残差相关信息(通过比特流)用信号发送给解码设备。这里,残差信息可以包括位置信息、变换技术、变换核和量化参数、量化变换系数的值信息等。解码设备可以基于残差信息来执行解量化/逆变换过程并推导残差样本(或残差块)。解码设备可以基于预测块和残差块来生成重构图片。编码设备还可以对供后续图片的帧间预测参考的量化变换系数进行解量化/逆变换以推导残差块,并且基于其来生成重构图片。
在本文档中,可以省略量化/解量化和/或变换/逆变换中的至少一个。当省略量化/解量化时,量化变换系数可以称为变换系数。当省略变换/逆变换时,变换系数可以被称为系数或残差系数,或者为了表达的统一性仍然可以被称为变换系数。
在本文档中,量化变换系数和变换系数可以分别称为变换系数和缩放变换系数。在这种情况下,残差信息可以包括关于变换系数的信息,并且关于变换系数的信息可以通过残差编译语法用信号发送。可以基于残差信息(或关于变换系数的信息)来推导变换系数,并且可以通过对变换系数进行逆变换(缩放)来推导缩放变换系数。残差样本可以基于缩放变换系数的逆变换(变换)来推导。这也可以在本文档的其他部分中应用/表示。
帧内预测可以指基于当前块所属于的图片(在下文中,称为当前图片)中的参考样本生成用于当前块的预测样本的预测。当对当前块应用帧内预测时,可以推导要用于当前块的帧内预测的邻近参考样本。当前块的邻近参考样本可以包括与大小为nWxnH的当前块的左边界相邻的样本和与左下相邻的总共2xnH个样本、与当前块的上边界相邻的样本和与右上相邻的总共2xnW个样本、以及与当前块的左上相邻的一个样本。可替选地,当前块的邻近参考样本可以包括多个上邻近样本和多个左邻近样本。此外,当前块的邻近参考样本可以包括与大小为nWxnH的当前块的右边界相邻的总共nH个样本、与当前块的下边界相邻的总共nW个样本以及与当前块的右下相邻(与右下相邻)的一个样本。
然而,当前块的邻近参考样本中的一些尚未被解码或可能不可用。在这种情况下,解码器可以通过用可用样本替换不可用样本来配置将用于预测的邻近参考样本。可替选地,可以通过可用样本的插值来配置将用于预测的邻近参考样本。
在推导邻近参考样本时,(i)可以基于当前块的邻近参考样本的平均或插值来推导预测样本,并且(ii)可以基于当前块的周边参考样本当中的针对预测样本的特定(预测)方向上存在的参考样本来推导预测样本。(i)的情况可以被称为是非定向模式或非角度模式,并且(ii)的情况可以被称为定向模式或角度模式。
另外,也可以通过邻近参考样本当中的基于当前块的预测样本的位于当前块的帧内预测模式的预测方向的第一邻近样本和位于与预测方向相反的方向的第二邻近样本的插值来生成预测样本。上述情况可以被称为线性插值帧内预测(LIP)。此外,可以使用线性模型基于亮度样本来生成色度预测样本。这种情况可以被称为LM模式。
此外,可以基于滤波的邻近参考样本来推导当前块的临时预测样本,并且还可以通过对根据帧内预测模式在现有邻近参考样本(即,未滤波的邻近参考样本)当中推导的至少一个参考样本与临时预测样本进行加权求和来推导当前块的预测样本。前述情况可以被称作位置相关的帧内预测(PDPC)。
此外,可以通过在当前块的邻近多参考样本线当中选择具有最高预测准确度的参考样本线来通过使用位于对应线中的预测方向上的参考样本来推导预测样本,并且然后可以向解码设备指示(用信号发送)本文使用的参考样本线,由此执行帧内预测编码。上述情况可以被称为多参考线(MRL)帧内预测或基于MRL的帧内预测。
此外,可以通过将当前块划分成垂直或水平子分区而基于相同帧内预测模式执行帧内预测,并且可以以子分区为单位来推导并且使用邻近参考样本。也就是说,在此情况下,用于当前块的帧内预测模式同等地应用于子分区,并且可以通过以子分区为单位来推导并且使用邻近参考样本来在一些情况下改善帧内预测性能。这种预测方法可以被称为帧内子分区(ISP)帧内预测或基于ISP的帧内预测。
上述帧内预测方法可以被称为与帧内预测模式分开的帧内预测类型。帧内预测类型可以被称为诸如帧内预测技术或附加帧内预测模式之类的各种术语。例如,帧内预测类型(或附加帧内预测模式等)可以包括上述LIP、PDPC、MRL及ISP中的至少一个。除了诸如LIP、PDPC、MRL及ISP之类的特定帧内预测类型的一般帧内预测方法可以被称作正常帧内预测类型。当不应用特定帧内预测类型的情况下,通常可以应用正常帧内预测类型,并且可以基于上述帧内预测模式执行预测。同时,也可以对根据需要推导的预测样本执行后滤波。
具体地,帧内预测过程可以包括帧内预测模式/类型确定步骤、邻近参考样本推导步骤和基于帧内预测模式/类型的预测样本推导步骤。此外,也可以对根据需要推导的预测样本执行后滤波步骤。
当应用帧内预测时,可以使用邻近块的帧内预测模式来确定应用于当前块的帧内预测模式。例如,解码设备可以基于接收到的MPM(最可能模式)索引,在MPM列表中选择MPM候选之一,该MPM(最可能模式)列表是基于当前块的邻近块(例如,左和/或上邻近块)的帧内预测模式推导的,并且可以基于剩余的帧内预测模式信息来选择未包括在MPM候选中的剩余帧内预测模式(和平面模式)之一。MPM列表可以被配置成包括或不包括平面模式作为候选。例如,如果MPM列表包括平面模式作为候选,MPM列表可以具有6个候选。如果MPM列表不包括平面模式作为候选,MPM列表可以具有5个候选。当MPM列表不包括平面模式作为候选时,可以用信号发送指示当前块的帧内预测模式是否不是平面模式的非平面标志(例如,intra_luma_not_planar_flag)。例如,可以首先用信号发送MPM标志,并且当MPM标志的值为1时可以用信号发送MPM索引和非平面标志。此外,当非平面标志的值为1时可以用信号发送MPM索引。这里,配置MPM列表不包括平面模式作为候选的原因是由于平面模式始终被视为MPM因此通过首先用信号发送标志(非平面标志)来首先检查MPM是否是平面模式,而不是说平面模式不是MPM。
例如,可以基于MPM标志(例如,intra_luma_mpm_flag)指示应用于当前块的帧内预测模式是在MPM候选(和平面模式)之中还是在剩余模式之中。MPM标志值1可以指示用于当前块的帧内预测模式在MPM候选(和平面模式)内,而MPM标志值0可以指示用于当前块的帧内预测模式不在MPM候选(和平面模式)中。非平面标志(例如,intra_luma_not_planar_flag)值0可以指示用于当前块的帧内预测模式是平面模式,并且非平面标志值1可以指示用于当前块的帧内预测模式不是平面模式。MPM索引可以以mpm_idx或intra_luma_mpm_idx语法元素的形式被用信号发送,并且剩余的帧内预测模式信息可以以rem_intra_luma_pred_mode或intra_luma_mpm_remainder语法元素的形式被用信号发送。例如,剩余帧内预测模式信息可以按照预测模式编号的顺序来索引指示所有帧内预测模式当中未包括在MPM候选(和平面模式)中的剩余帧内预测模式,以指示它们中的一个。帧内预测模式可以是亮度分量(样本)的帧内预测模式。在下文中,帧内预测模式信息可以包括以下中的至少一个:MPM标志(例如,intra_luma_mpm_flag)、非平面标志(例如,intra_luma_not_planar_flag)、MPM索引(例如,mpm_idx或intra_luma_mpm_idx)和剩余帧内预测模式信息(rem_intra_luma_pred_mode或intra_luma_mpm_remainder)。在本文档中,MPM列表可以以诸如MPM候选列表和candModeList的多种术语来指代。当MIP应用于当前块时,可以用信号发送用于MIP的单独的mpm标志(例如,intra_mip_mpm_flag)、mpm索引(例如,intra_mip_mpm_idx)和剩余的帧内预测模式信息(例如,intra_mip_mpm_remainder),并且不用信号发送非平面标志。
换言之,通常,当对图像执行块分割时,待编译的当前块和邻近块具有相似的图像特性。因此,当前块和邻近块具有相同或相似的帧内预测模式的可能性很高。因此,编码器可以使用邻近块的帧内预测模式以对当前块的帧内预测模式进行编码。
例如,编码器/解码器可以配置用于当前块的最可能模式(MPM)的列表。MPM列表可以被称为MPM候选列表。这里,MPM可以指的是用于在帧内预测模式编译中考虑当前块和邻近块之间的相似性来改进编译效率的模式。如上所述,MPM列表可以被配置为包括平面模式,或者可以被配置为排除平面模式。例如,当MPM列表包括平面模式时,MPM列表中的候选数目可以是6个。并且,如果MPM列表不包括平面模式,则MPM列表中的候选数量可以是5个。
编码器/解码器可以配置包括5或6个MPM的MPM列表。
为了配置MPM列表,可以考虑三种模式:默认帧内模式、邻近帧内模式和推导的帧内模式。
对于邻近帧内模式,可以考虑两个邻近块,即左邻近块和上邻近块。
如上所述,如果MPM列表被配置为不包括平面模式,则平面模式被从列表中排除,并且MPM列表的候选数量可以被设置为5个。
此外,帧内预测模式当中的非定向模式(或非角度模式)可以包括基于当前块的邻近参考样本的平均的DC模式或基于插值的平面模式。
当应用帧间预测时,编码设备/解码设备的预测器可以通过以块为单位执行帧间预测来推导预测样本。帧间预测可以是以依赖于除当前图片之外的图片的数据元素(例如,样本值或运动信息)的方式推导的预测。当对当前块应用帧间预测时,可以基于由参考图片索引指示的参考图片上的由运动矢量指定的参考块(参考样本阵列)推导用于当前块的预测块(预测样本阵列)。在此,为了减少在帧间预测模式中发送的运动信息量,可以基于邻近块和当前块之间的运动信息的相关性以块、子块或样本为单位来预测当前块的运动信息。运动信息可以包括运动矢量和参考图片索引。运动信息可以进一步包括帧间预测类型(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可以包括存在于当前图片中的空间邻近块和存在于参考图片中的时间邻近块。包括参考块的参考图片和包括时间邻近块的参考图片可以彼此相同或彼此不同。时间邻近块可以被称为并置参考块、并置CU(colCU)等,并且包括时间邻近块的参考图片可以被称为并置图片(colPic)。例如,可以基于当前块的邻近块来配置运动信息候选列表,并且可以用信号发送指示选择(使用)哪个候选的标志或索引信息以便推导当前块的运动矢量和/或参考图片索引。可以基于各种预测模式来执行帧间预测。例如,在跳过模式和合并模式的情况下,当前块的运动信息可以与邻近块的运动信息相同。在跳过模式的情况下,与合并模式不同,可以不发送残差信号。在运动矢量预测(MVP)模式的情况下,所选择的邻近块的运动矢量可以用作运动矢量预测子并且可以用信号发送当前块的运动矢量。在这种情况下,可以使用运动矢量预测子和运动矢量差的和来推导当前块的运动矢量。
运动信息可以包括根据帧间预测类型(L0预测、L1预测、Bi预测等)的L0运动信息和/或L1运动信息。L0方向的运动矢量可以被称为L0运动矢量或MVL0,而L1方向的运动矢量可以被称为L1运动矢量或MVL1。基于L0运动矢量的预测可以称为L0预测,基于L1运动矢量的预测可以称为L1预测,并且基于L0运动矢量和L1运动矢量这两者的预测可以称为双预测。这里,L0运动矢量可以指示与参考图片列表L0相关联的运动矢量,并且L1运动矢量可以指示与参考图片列表L1相关联的运动矢量。参考图片列表L0可以包括按照输出顺序在当前图片之前的图片作为参考图片,并且参考图片列表L1可以包括按照输出顺序在当前图片之后的图片。先前图片可以被称为前向(参考)图片并且后续图片可以被称为反向(参考)图片。参考图片列表L0可以进一步包括按照输出顺序在当前图片之后的图片作为参考图片。在这种情况下,可以首先在参考图片列表L0中对先前图片进行索引,并且然后可以对后续图片进行索引。参考图片列表L1可以进一步包括按照输出顺序在当前图片之前的图片作为参考图片。在这种情况下,可以首先在参考图片列表L1中对后续图片进行索引,并且然后可以对先前图片进行索引。输出顺序可以对应于图片顺序计数(POC)顺序。
基于帧间预测的视频/图像编码过程可以包括例如以下内容。
图4示出基于帧间预测的视频/图像编码方法的示例。
编码设备对当前块执行帧间预测(S400)。编码设备可以推导当前块的帧间预测模式和运动信息,并且生成当前块的预测样本。这里,确定帧间预测模式、推导运动信息和生成预测样本的过程可以同时执行,或者任一个过程可以在其它过程之前执行。例如,编码设备的帧间预测器可以包括预测模式确定器、运动信息推导器和预测样本推导器,并且预测模式确定器可以确定当前块的预测模式,运动信息推导器可推导当前块的运动信息,并且预测样本推导器可推导当前块的预测样本。例如,编码设备的帧间预测器可以通过运动估计在参考图片的特定区域(搜索区域)中搜索与当前块相似的块,并且推导与当前块的差最小或者特定参考或以下的参考块。基于此,可以推导指示参考块所在的参考图片的参考图片索引,并且可以基于参考块与当前块之间的位置差来推导运动矢量。编码设备可以在各种预测模式当中确定应用于当前块的模式。编码设备可以比较各种预测模式的RD成本并且为当前块确定最优预测模式。
例如,如果对当前块应用跳过模式或合并模式,则编码设备可以配置稍后描述的合并候选列表,并且推导包括在合并候选列表中的合并候选所指示的参考块当中与当前块的差最小或者特定参考或以下的参考块。在这种情况下,可以选择与所推导的参考块相关联的合并候选,并且可以生成指示所选合并候选的合并索引信息并用信号发送给解码设备。可以使用所选合并候选的运动信息来推导当前块的运动信息。
作为另一示例,如果对当前块应用(A)MVP模式,则编码设备可配置稍后描述的(A)MVP候选列表,并且使用包括在(A)MVP候选列表中的运动矢量预测子(mvp)候选当中所选mvp候选的运动矢量作为当前块的mvp。在这种情况下,例如,指示通过上述运动估计推导的参考块的运动矢量可以用作当前块的运动矢量,并且mvp候选当中具有与当前块的运动矢量的差最小的运动矢量的mvp候选可以是所选mvp候选。可推导运动矢量差(MVD),其是通过从当前块的运动矢量减去mvp而获得的差。在这种情况下,可以将关于MVD的信息用信号发送给解码设备。另外,如果应用(A)MVP模式,则参考图片索引的值可以被配置为参考图片索引信息并单独地用信号发送给解码设备。
编码设备可以基于预测样本来推导残差样本(S410)。编码设备可以通过将当前块的原始样本与预测样本进行比较来推导残差样本。
编码设备对包括预测信息和残差信息的图像信息进行编码(S420)。编码设备可按比特流的形式输出编码图像信息。预测信息可以包括关于预测模式信息(例如,跳过标志、合并标志、模式索引等)和运动信息的信息作为与预测过程有关的信息。关于运动信息的信息可以包括作为用于推导运动矢量的信息的候选选择信息(例如,合并索引、mvp标志或mvp索引)。另外,关于运动信息的信息可以包括上述关于MVD的信息和/或参考图片索引信息。另外,关于运动信息的信息可以包括指示是否应用L0预测、L1预测或bi预测的信息。残差信息是关于残差样本的信息。残差信息可以包括关于残差样本的量化变换系数的信息。
输出比特流可以被存储在(数字)存储介质中并传送至解码设备,或者也可以经由网络传送至解码设备。
此外,如上所述,编码设备可以基于参考样本和残差样本来生成重构图片(包括重构样本和重构块)。这是为了由编码设备推导解码设备所推导的相同预测结果,因此可以增加编译效率。因此,编码设备可以将重构图片(或重构样本、重构块)存储在存储器中,并且将其用作帧间预测的参考图片。如上所述,还可以对重构图片应用环内滤波过程等。
基于帧间预测的视频/图像解码过程可以包括例如以下内容。
图5示出基于帧间预测的视频/图像解码方法的示例。
参考图5,解码设备可以执行与编码设备所执行的操作对应的操作。解码设备可以基于所接收的预测信息对当前块执行预测并推导预测样本。
具体地,解码设备可以基于所接收的预测信息来确定当前块的预测模式(S500)。解码设备可以基于预测信息中的预测模式信息来确定应用于当前块的帧间预测模式。
例如,解码设备可以基于合并标志来确定是否对当前块应用合并模式或者确定(A)MVP模式。另选地,解码设备可以基于模式索引来选择各种帧间预测模式候选之一。帧间预测模式候选可以包括跳过模式、合并模式和/或(A)MVP模式,或者可以包括稍后描述的各种帧间预测模式。
解码设备基于所确定的帧间预测模式来推导当前块的运动信息(S510)。例如,如果对当前块应用跳过模式或合并模式,则解码设备可以配置稍后描述的合并候选列表,并且在包括在合并候选列表中的合并候选当中选择一个合并候选。可以基于上述选择信息(合并索引)执行选择。可以使用所选合并候选的运动信息来推导当前块的运动信息。所选合并候选的运动信息可以用作当前块的运动信息。
作为另一示例,如果对当前块应用(A)MVP模式,则解码设备可以配置稍后描述的(A)MVP候选列表,并且使用包括在(A)MVP候选列表中的运动矢量预测子(mvp)候选当中所选mvp候选的运动矢量,作为当前块的mvp。可以基于上述选择信息(mvp标志或mvp索引)执行选择。在这种情况下,可以基于关于MVD的信息来推导当前块的MVD,并且可以基于当前块的mvp和MVD来推导当前块的运动矢量。另外,可以基于参考图片索引信息来推导当前块的参考图片索引。当前块上参考图片列表中的参考图片索引所指示的图片可以被推导为当前块的帧间预测所参考的参考图片。
此外,如稍后描述的,可以在不配置候选列表的情况下推导当前块的运动信息,并且在这种情况下,可以根据稍后描述的预测模式中公开的过程来推导当前块的运动信息。在这种情况下,可省略上述候选列表的配置。
解码设备可以基于当前块的运动信息来生成当前块的预测样本(S520)。在这种情况下,解码设备可以基于当前块的参考图片索引来推导参考图片,并且使用参考图片上当前块的运动矢量所指示的参考块的样本来推导当前块的预测样本。在这种情况下,如稍后描述的,在一些情况下还可以执行对当前块的所有或一些预测样本的预测样本滤波过程。
例如,解码设备的帧间预测器可以包括预测模式确定器、运动信息推导器和预测样本推导器,并且预测模式确定器可以基于所接收的预测模式信息来确定当前块的预测模式,运动信息推导器可以基于关于所接收的运动信息的信息来推导当前块的运动信息(例如运动矢量和/或参考图片索引),预测样本推导器可以推导当前块的预测样本。
解码设备基于所接收的残差信息来生成当前块的残差样本(S530)。解码设备可以基于预测样本和残差样本来生成当前块的重构样本,并且基于其来生成重构图片(S540)。此后,如上所述还可以对重构图片应用环内滤波过程等。
图6示例性地示出帧间预测过程。
参考图6,如上所述,帧间预测过程可以包括:确定帧间预测模式,根据所确定的预测模式来推导运动信息,并且基于所推导的运动信息来执行预测(生成预测样本)。帧间预测过程可以由如上所述的编码设备和解码设备执行。本文档中的编译设备可以包括编码设备和/或解码设备。
参考图6,编译设备为当前块确定帧间预测模式(S600)。各种帧间预测模式可以用于预测图片中的当前块。例如,可以使用诸如合并模式、跳过模式、运动矢量预测(MVP)模式、仿射模式、子块合并模式以及与MVD合并(MMVD)模式的各种模式。另外或作为附带模式代替这些模式,可以使用解码器侧运动矢量细化(DMVR)模式、自适应运动矢量分辨率(AMVR)模式、具有CU级别权重的双预测(BCW)、双向光流(BDOF)等。仿射模式可以被称为仿射运动预测模式。MVP模式可以被称为高级运动矢量预测(AMVP)模式。在本文档中,一些模式和/或通过一些模式推导的运动信息候选也可以被包括作为另一模式下的运动信息相关候选之一。例如,HMVP候选可以在合并/跳过模式下被添加作为合并候选,或者可以在MVP模式下被添加作为MVP候选。如果在合并模式或跳过模式下HMVP候选用作运动信息候选,则HMVP候选可以被称为HMVP合并候选。
指示当前块的帧间预测模式的预测模式信息可以从编码设备用信号发送到解码设备。预测模式信息可以被包括在比特流中并且由解码设备接收。预测模式信息可以包括指示多个候选模式之一的索引信息。可替选地,可以通过标志信息的分层信令来指示帧间预测模式。在这种情况下,预测模式信息可以包括一个或多个标志。例如,可以通过用信号发送跳过标志来指示是否应用跳过模式,并且如果不应用跳过模式,可以通过用信号发送合并标志来指示是否应用合并模式,以及指示应用MVP模式或者可以进一步用信号发送用于附加分类的标志。仿射模式可以作为独立模式被用信号发送或作为关于合并模式或MVP模式的从属模式被用信号发送。例如,仿射模式可以包括仿射合并模式和仿射MVP模式。
同时,指示在当前块(当前编译单元)中是否使用上述列表0(L0)预测、列表1(L1)预测或双预测的信息可以在当前块中用信号发送。该信息可以称为运动预测方向信息、帧间预测方向信息或帧间预测指示信息,并且可以以例如inter_pred_idc语法元素的形式配置/编码/用信号发送。即,inter_pred_idc语法元素可以指示前述列表0(L0)预测、列表1(L1)预测或双预测是否用于当前块(当前编译单元)。在本文档中,为了便于描述,可以将由inter_pred_idc语法元素指示的帧间预测类型(L0预测、L1预测或BI预测)指示为运动预测方向。L0预测可以表示为pred_L0,L1预测表示为pred_L1,双预测表示为pred_BI。例如,可以根据inter_pred_idc语法元素的值来指示以下预测类型。
[表1]
Figure BDA0003458301610000301
如上所述,一个图片可以包括一个或多个切片。切片可以具有包括帧内(I)切片、预测(P)切片和双预测(B)切片的切片类型中的一个。切片类型可以基于切片类型信息来指示。针对I切片中的块,帧间预测可以不用于预测,并且可以仅使用帧内预测。当然,即使在这种情况下,也可以在不进行预测的情况下对原始样本值进行编译并且用信号发送。对于P切片中的块,可以使用帧内预测或帧间预测,并且当使用帧间预测时,可以仅使用单预测。同时,对于B切片中的块,可以使用帧内预测或帧间预测,并且当使用帧间预测时,可以使用直至双预测。
L0和L1可以包括在当前图片之前先前编码/解码的参考图片。例如,L0可以包括按POC顺序在当前图片之前和/或之后的参考图片,并且L1可以包括按POC顺序在当前图片之后和/或之前的参考图片。在此情况下,L0可以被指配相对于按POC顺序的先前参考图片比当前参考图片更低的参考图片索引,并且L1可以被指配相对于按POC顺序的后续参考图片比当前参考图片更低的参考图片索引。在B切片的情况下,可以应用双预测,并且在此情况下,可以应用单向双预测,或可以应用双向双预测。双向双预测可以被称为真双预测。
编译设备推导用于当前块的运动信息(S610)。可以基于帧间预测模式来推导运动信息。
编码设备可使用当前块的运动信息来执行帧间预测。编码设备可以通过运动估计过程来推导当前块的最优运动信息。例如,编码设备可针对当前块使用原始图片中的原始块在参考图片中的预定搜索范围内以分数像素为单位搜索具有高相关性的相似参考块,从而推导运动信息。可以根据基于相位的样本值之间的差来推导块的相似度。例如,可以基于当前块(或当前块的模板)与参考块(或参考块的模板)之间的SAD来计算块的相似度。在这种情况下,可以基于在搜索区域中具有最小SAD的参考块来推导运动信息。可以基于帧间预测模式根据各种方法将所推导的运动信息用信号发送给解码设备。
编译设备基于当前块的运动信息来执行帧间预测(S620)。编译设备可以基于运动信息来推导当前块的预测样本。包括预测样本的当前块可以被称为预测块。
当应用合并模式时,不直接发送当前预测块的运动信息,并且使用邻近预测块的运动信息来推导当前预测块的运动信息。因此,可以通过发送指示使用合并模式的标记信息和指示使用哪个邻近预测块的合并索引来指示当前预测块的运动信息。合并模式可以称为常规合并模式。
编码器必须搜索用于推导当前预测块的运动信息的合并候选块以执行合并模式。例如,可以使用最多五个合并候选块,但是本文档的实施例不限于此。可以在切片报头或拼块组报头中发送合并候选块的最大数量,并且本文档的实施例不限于此。在找到合并候选块之后,编码器可以生成合并候选列表,并且选择其中成本最小的合并候选块作为最终合并候选块。
合并候选列表可以使用例如五个合并候选块。例如,可以使用四个空间合并候选和一个时间合并候选。在下文中,稍后描述的空间合并候选或空间MVP候选可以被称为SMVP,并且稍后描述的时间合并候选或时间MVP候选可以被称为TMVP。
下面,描述构建合并候选列表的方法。
编译设备(编码器/解码器)将通过搜索当前块的空间邻近块而推导的空间合并候选插入到合并候选列表中。例如,空间邻近块可以包括当前块的左下角邻近块、左邻近块、右上角邻近块、上邻近块和左上角邻近块。然而,这是示例,并且除了上述空间邻近块之外,诸如右邻近块、下邻近块和右下邻近块的附加邻近块可以进一步用作空间邻近块。编译设备可以通过基于优先级搜索空间邻近块来检测可用块,并且可以推导检测到的块的运动信息作为空间合并候选。
编译设备将通过搜索当前块的时间邻近块而推导的时间合并候选插入到合并候选列表中。时间邻近块可以位于作为与当前块位于其中的当前图片不同的图片的参考图片上。时间邻近块所在的参考图片可以称为并置图片或col图片。可以按col图片上的当前块的并置块的右下角邻近块和右下中心块的顺序搜索时间邻近块。同时,当应用运动数据压缩时,可以将特定运动信息存储为col图片中的每个预定存储单元的代表性运动信息。在这种情况下,不需要将所有块的运动信息存储在预定存储单元中,从而获得运动数据压缩效果。在这种情况下,可以例如以16x16个样本单元、8x8个样本单元等预先确定预定存储单元,或者可以从编码器向解码器用信号发送关于预定存储单元的大小信息。当应用运动数据压缩时,时间邻近块的运动信息可以用时间邻近块所在的预定存储单元的代表性运动信息替换。也就是说,在这种情况下,从实现的角度来看,基于时间邻近块的坐标(左上样本位置)将预定值算术右移,并且此后,可以基于覆盖算术左移位置的预测块的运动信息来推导时间合并候选。例如,在具有预定存储单元的样本单元是2nx2n的情况下,如果时间邻近块的坐标是(xTnb,yTnb),则位于修改位置((xTnb>>n)<<n),(yTnb>>n)<<n))处的预测块的运动信息可以被用于时间合并候选。具体地,例如,在预定存储单元是16x16样本单元的情况下,如果时间邻近块的坐标是(xTnb,yTnb),则位于修改位置((xTnb>>4)<<4),(yTnb>>4)<<4))处的预测块的运动信息可以被用于时间合并候选。或者,例如,在预定存储单元是8x8样本单元的情况下,如果时间邻近块的坐标是(xTnb,yTnb),则位于修改位置((xTnb>>3)<<3),(yTnb>>3)<<3))处的预测块的运动信息可以被用于时间合并候选。
编译设备可以确定当前合并候选的数量是否小于最大合并候选的数量。最大合并候选的数目可以被预定义或从编码器用信号发送到解码器。例如,编码器可以生成关于最大合并候选的数目的信息,对该信息进行编码,并且以比特流的形式将编码的信息发送到解码器。如果最大合并候选的数目被填满,则可以不执行后续候选添加过程。
作为检查的结果,如果当前合并候选的数量小于最大合并候选的数量,则编译设备将附加合并候选插入到合并候选列表中。
作为检查的结果,如果当前合并候选的数目不小于最大合并候选的数目,则编译设备可以终止合并候选列表的构建。在这种情况下,编码器可以基于速率失真(RD)成本在配置合并候选列表的合并候选当中选择最佳合并候选,并且向解码器用信号发送指示选择的合并候选的选择信息(例如合并索引)。解码器可以基于合并候选列表和选择信息来选择最佳合并候选。
选择的合并候选的运动信息可以用作当前块的运动信息,并且可以基于当前块的运动信息来推导当前块的预测样本。编码器可以基于预测样本来推导当前块的残差样本,并且可以将关于残差样本的残差信息用信号发送到解码器。解码器可以基于残差样本和基于残差信息推导的预测样本来生成重构样本,并且如上所述基于该重构样本来生成重构图片。
当应用跳过模式时,可以以与应用合并模式的情况相同的方式推导当前块的运动信息。然而,当应用跳过模式时,省略对应块的残差信号,因此预测样本可以用作重构样本。
当应用MVP模式时,可以使用重构空间邻近块的运动矢量和/或时间邻近块(或Col块)的运动矢量来生成运动矢量预测子(mvp)候选列表。即,可以将对应于重构空间邻近块的运动矢量和/或对应于时间邻近块的运动矢量用作运动矢量预测子候选。当应用双预测时,可以分别生成并且使用用于推导L0运动信息的mvp候选列表和用于推导L1运动信息的mvp候选列表。上述预测信息(或关于预测的信息)可以包括指示从包括在列表中的运动矢量预测子候选中选择的最佳运动矢量预测子候选的选择信息(例如,MVP标志或MVP索引)。在这种情况下,预测器可以使用选择信息从包括在运动矢量候选列表中的运动矢量预测子候选中选择当前块的运动矢量预测子。编码设备的预测器可以获得当前块的运动矢量和运动矢量预测子之间的运动矢量差(MVD),对其进行编码,并且以比特流形式输出它。即,MVD可以被获得作为通过从当前块的运动矢量减去运动矢量预测子而获得的值。在这种情况下,解码设备的预测器可以获得包括在关于预测的信息中的运动矢量差,并且通过将运动矢量差与运动矢量预测子相加来推导当前块的运动矢量。解码设备的预测器可以从关于预测的信息获得或推导指示参考图片的参考图片索引。
图7是图示构建运动矢量预测子候选列表的方法的流程图。
参考图7,实施例可以首先搜索用于运动矢量预测的空间候选块,并且将其插入到预测候选列表中(S700)。此后,实施例可以确定空间候选块的数量是否小于2(S710)。例如,在实施例中,当空间候选块的数量小于2时,可以搜索时间候选块并且将其附加地插入到预测候选列表中(S720),并且当时间候选块不可用时,可以使用零运动矢量(S730)。即,零运动矢量可以附加地插入到预测候选列表中。此后,实施例可以结束初步候选列表的构建(S740)。可替换地,根据实施例,当空间候选块的数量不小于两个时,可以终止初步候选列表的构建。这里,初步候选列表可以指示MVP候选列表(S740)。
同时,当应用MVP模式时,可以显式地用信号发送参考图片索引。在这种情况下,用于L0预测的参考图片索引refidxL0和用于L1预测的参考图片索引refidxL1可以分别用信号发送。例如,当应用MVP模式并且应用BI预测时,可以用信号发送关于refidxL0的信息和关于refidxL1的信息两者。
当应用MVP模式时,如上所述,可以向解码设备用信号发送从编码设备推导的关于MVD的信息。关于MVD的信息可以包括例如表示MVD绝对值和符号的x和y分量的信息。在这种情况下,指示MVD绝对值是否大于0以及大于1的信息和MVD剩余可以被逐步地用信号发送。例如,仅当指示MVD绝对值是否大于0的标志信息的值为1时,才可以用信号发送指示MVD绝对值是否大于1的信息。
例如,可以将关于MVD的信息配置为以下语法,在编码设备中编码,并且用信号发送给解码设备。
[表2]
Figure BDA0003458301610000351
例如,在表2中,abs_mvd_greater0_flag语法元素可以指示关于差MVD是否大于0的信息,并且abs_mvd_greater1_flag语法元素可以指示关于差MVD是否大于1的信息。此外,abs_mvd_minus2语法元素可以指示关于通过对差MVD-2获得的值的信息,并且mvd_sign_flag语法元素可以指示关于差MVD的符号的信息。此外,在表2中,每个语法元素的[0]可以指示关于L0的信息,并且[1]可以指示关于L1的信息。
例如,MVD[compIdx]可以基于abs_mvd_greater0_flag[compIdx]*(abs_mvd_minus2[compIdx]+2)*(1-2*mvd_sign_flag[compIdx])来推导。这里,compIdx(或cpIdx)表示每个分量的索引,并且可以具有值0或1。compIdx 0可以指示x分量,compIdx 1可以指示y分量。然而,这仅仅是示例,并且可以通过使用除x和y坐标系之外的坐标系来表达每个分量的值。
同时,用于L0预测的MVD(MVDL0)和用于L1预测的MVD(MVDL1)可以被单独地用信号发送,并且关于MVD的信息可以包括关于MVDL0的信息和/或关于MVDL1的信息。例如,当MVP模式应用于当前块并且应用BI预测时,可以用信号发送关于MVDL0的信息和关于MVDL1的信息两者。
图8是用于描述对称运动矢量差(SMVD)的图。
当应用BI预测时,考虑到编译效率,可以使用对称MVD。在这种情况下,可以省略一些运动信息的信令。例如,当对称MVD应用于当前块时,可以不将关于refidxL0的信息、关于refidxL1的信息和关于MVDL1的信息从编码设备用信号发送到解码设备,并且可以在内部推导。例如,当MVP模式和BI预测应用于当前块时,指示是否应用对称MVD的标志信息(例如对称MVD标志信息或sym_mvd_flag语法元素)可以被用信号发送,并且当标志信息的值为1时,解码设备可以确定对称MVD应用于当前块。
当应用对称MVD模式(即,对称MVD标志信息的值为1)时,可以显式地用信号发送关于mvp_l0_flag、mvp_l1_flag和MVDL0的信息,并且如上所述,可以省略并在内部推导关于refidxL0的信息、关于refidxL1的信息和关于MVDL1的信息的信令。例如,可以推导refidxL0作为索引,该索引指示在参考图片列表0(其可以称为列表0或L0)中按POC顺序最接近当前图片的先前参考图片。可以推导refidxL1作为索引,该索引指示在参考图片列表1(其可以称为列表1或L1)中按POC顺序中最接近当前图片的下一个参考图片。或者,例如,可以将refidxL0和refidxL1两者都推导为0。或者,例如,可以将refidxL0和refidxL1推导为与当前图片的关系上具有相同POC差的最小索引。具体地,例如,当[当前图片的POC]-[由refidxL0指示的第一参考图片的POC]为第一POC差并且[当前图片的POC]-[由refidxL1指示的第二参考图片的POC]为第二POC差时,只有当第一POC差和第二POC差相同时,才可以推导指示第一参考图片的refidxL0的值作为当前块的refidxL0的值,并且推导指示第二参考图片的refidxL1的值作为当前块的refidxL1的值。另外,例如,当存在第一POC差和第二POC差相同的多个集合时,可以将具有最小差的集合的refidxL0和refidxL1推导为当前块的refidxL0和refidxL1。
参考图8,示出了参考图片列表0、参考图片列表1以及MVDL0和MVDL1。这里,MVDL1与MVDL0对称。
MVDL1可以推导为负(-)MVDL0。例如,用于当前块的最终(改进的或修改的)运动信息(运动矢量;MV)可以基于以下等式来推导。
[等式1]
Figure BDA0003458301610000371
在等式1中,mvx0和mvy0可以表示L0运动信息或用于L0预测的运动矢量的x分量和y分量,并且mvx1和mvy1可以表示L1运动信息或用于L1预测的运动矢量的x分量和y分量。此外,mvpx0和mvpy0可以表示用于L0预测的运动矢量预测子的x分量和y分量,并且mvpx1和mvpy1可以表示用于L1预测的运动矢量预测子的x分量和y分量。此外,mvdx0和mvdy0可以表示用于L0预测的运动矢量差的x分量和y分量。
同时,MMVD模式是将运动矢量差(MVD)应用于合并模式的方法,并且可以隐式地推导直接用于生成当前块(即,当前CU)的预测样本的运动信息。例如,可以用信号发送指示是否将MMVD用于当前块(即,当前CU)的MMVD标志(即,mmvd_flag),并且可以基于该MMVD标志来执行MMVD。当MMVD应用于当前块时(即,当mmvd_flag为1时),可以用信号发送关于MMVD的附加信息。
这里,关于MMVD的附加信息包括指示合并候选列表中的第一候选或第二候选是否与MVD一起使用的合并候选标志(即,mmvd_cand_flag),以及用于指示运动幅度的距离索引(即,mmvd_distance_idx)和用于指示运动方向的方向索引(即,mmvd_direction_idx)。
在MMVD模式中,可以使用位于合并候选列表中的候选当中的第一条目和第二条目中的两个候选(即,第一候选或第二候选),并且可以使用两个候选(即,第一候选或第二候选)。其中一个可以用作基本MV。例如,可以用信号发送合并候选标志(即,mmvd_cand_flag)以指示合并候选列表中的两个候选(即,第一候选或第二候选)中的任一个。
此外,距离索引(即,mmvd_distance_idx)指定运动幅度信息并且指示距起始点的预定义偏移。偏移可以被添加到起始MV的水平分量或垂直分量。下表指定了距离索引和预定义偏移的关系。
[表3]
Figure BDA0003458301610000391
参考上面的表3,根据距离索引(即mmvd_distance_idx)的值来确定MVD的距离(即MmvdDistance),并且可以通过使用基于tile_group_fpel_mmvd_enabled_flag的值的整数样本精度或分数样本精度来推导MVD的距离(即MmvdDistance)。例如,当tile_group_fpel_mmvd_enabled_flag等于1时,它指示通过使用当前拼块组(或图片报头)中的整数样本精度来推导MVD的距离,并且当tile_group_fpel_mmvd_enabled_flag等于0时,它指示通过使用拼块组(或图片报头)中的分数样本精度来推导MVD的距离。在表1中,拼块组的信息(标志)可以用图片报头的信息替换,例如,tile_group_fpel_mmvd_enabled_flag可以用ph_fpel_mmvd_enabled_flag(或ph_mmvd_fullpel_only_flag)替换。
另外,方向索引(即,mmvd_direction_idx)指示MVD相对于起始点的方向,并且可以指示如下表4所示的四个方向。在这种情况下,MVD的方向可以指示MVD的符号。方向索引和MVD符号之间的关系可以表达为下表。
[表4]
mmvd_direction_idx[x0][y0] MmvdSign[x0][y0][0] MmvdSign[x0][y0][1]
0 +1 0
1 -1 0
2 0 +1
3 0 -1
参考表4,MVD的符号(即MmvdSign)根据方向索引(即mmvd_direction_idx)的值来确定,并且可以针对L0参考图片和L1参考图片推导MVD的符号(即MmvdSign)。
基于上述距离索引(即mmvd_distance_idx)和方向索引(即,mmvd_direction_idx),可以使用以下等式来计算MVD的偏移。
[等式2]
MmvdOffset[x0][y0][0]=(MmvdDistance[x0][y0]<<2)*MmvdSign[x0][y0][0]
[等式3]
MmvdOffset[x0][y0][1]=(MmvdDistance[x0][y0]<<2)*MmvdSign[x0][y0][1]
在等式2和3中,可以基于表3和/或表4推导MMVD距离(MmvdDistance[x0][y0])和MMVD符号(MmvdSign[x0][y0][0],MmvdSign[x0][y0][1])。总之,在MMVD模式中,从基于邻近块推导的合并候选列表中的合并候选当中选择由合并候选标志(即,mmvd_cand_flag)指示的合并候选,并且将选择的合并候选用作基本候选(即,MVP)。另外,可以通过基于基本候选将使用距离索引(即,mmvd_distance_idx)和方向索引(即,mmvd_direction_idx)推导的MVD相加来推导当前块的运动信息(即,运动矢量)。
可以基于根据预测模式推导的运动信息来推导当前块的预测块。预测块可以包括当前块的预测样本(预测样本阵列)。在当前块的运动矢量指示分数样本单元时,可以执行插值过程,通过该插值过程可以基于参考图片内的以分数样本为单位的参考样本来推导当前块的预测样本。当应用双预测时,通过基于L0预测(即,使用参考图片列表L0中的参考图片和MVL0的预测)推导的预测样本和基于L1预测(即,使用参考图片列表L1中的参考图片和MVL1的预测)推导的预测样本的加权或加权的平均(根据相位)推导的预测样本可以被用作当前块的预测样本。当应用双预测时,如果用于L0预测的参考图片和用于L1预测的参考图片相对于当前图片位于不同时间方向(即,双预测和双向预测),则可以将其称为真双预测。
如上所述,可以基于推导的预测样本生成重构样本和重构图片,然后可以执行诸如环内滤波的过程。
如上所述,根据本文档,当双预测应用于当前块时,可以基于加权平均来推导预测样本。通常,可以通过L0预测信号(L0预测样本)和L1预测信号(L1预测样本)的简单平均来推导双预测信号(即,双预测样本)。即,双预测样本被推导为基于L0参考图片和MVL0的L0预测样本和基于L1参考图片和MVL1的L1预测样本的平均。然而,根据该文档,当应用双预测时,可以如下通过L0预测信号和L1预测信号的加权平均来推导双预测信号(双预测样本)。
在上述MMVD相关实施例中,可以提出在MMVD的MVD推导过程中考虑长期参考图片的方法,从而在各种应用中维持和增加压缩效率。此外,除了在MERGE中使用的MMVD技术之外,本文档的实施例中所提出的方法可以同样地应用于SMVD,SMVD是在帧间模式(MVP模式)中使用的对称MVD技术。
图9是用于描述在帧间预测中推导运动矢量的方法的图。
在本文档的实施例中,在时间运动候选(时间运动候选、时间合并候选或时间mvp候选)的运动矢量缩放过程中使用考虑长期参考图片的MV推导方法。时间运动候选可以对应于mvCol(mvLXCol)。时间运动候选可以称为TMVP。
下表描述了长期参考图片的定义。
[表5]
Figure BDA0003458301610000421
参考上述图5,如果LongTermRefPic(aPic,aPb,refIdx,LX)等于1(真),则可以将相应参考图片标记为用于长期参考。例如,未标记为用于长期参考的参考图片可以是标记为用于短期参考的参考图片。在另一示例中,未标记为用于长期参考且未标记为不使用的参考图片可以是标记为用于短期参考的参考图片。在下文中,标记为用于长期参考的参考图片可以称为长期参考图片,标记为用于短期参考的参考图片可以称为短期参考图片。
下表描述了TMVP(mvLXCol)的推导。
[表6]
Figure BDA0003458301610000422
Figure BDA0003458301610000431
参考图9和表6,在当前图片所指向的参考图片的类型(即,指示是长期参考图片(LTRP)还是短期参考图片(STRP))不等于并置图片所指向的并置参考图片的类型时,不使用时间运动矢量mvLXCol。也就是说,当所有这些都是长期参考图片或短期参考图片时,推导colMV,否则,不推导colMV。另外,在所有这些都是长期参考图片的情况下,并且在当前图片与当前图片的参考图片之间的POC差与并置图片与并置图片的参考图片之间的POC差相同的情况下,可以按原样使用并置运动矢量而不缩放。如果是短期参考图片并且POC差不同,则在缩放后使用并置块的运动矢量。
在本文档的实施例中,在MERGE/SKIP(合并/跳过)模式中使用的MMVD用信号发送用于一个编译块的基本运动矢量索引(基本MV索引)、距离索引和方向索引作为用于推导MVD信息的信息。在单向预测的情况下,从运动信息推导MVD,并且在双向预测的情况下,使用镜像和缩放方法生成对称MVD信息。
在双向预测的情况下,对用于L0或L1的MVD信息进行缩放以生成L1或L0的MVD。然而,当参考长期参考图片时,需要在MVD推导过程中进行修改。
图10图示根据本文档的实施例的MMVD的MVD推导过程。图10所示的方法可以用于应用双向预测的块。
参考图10,当到L0参考图片的距离和到L1参考图片的距离相同时,推导的MmvdOffset可以原样用作MVD,并且当POC差(L0参考图片和当前图片之间的POC差以及L1参考图片和当前图片之间的POC差)不同时,根据POC差以及是长期还是短期参考图片,可以通过缩放或简单镜像(即,-1*MmvdOffset)来推导MVD。
在一个示例中,针对应用了双预测的块使用MMVD来推导对称MVD的方法不适合于使用长期参考图片的块。很难预期性能改善。因此,在下面的附图和实施例中,引入了其中当L0和L1的参考图片类型不同时不应用MMVD的示例。
图11图示根据本公开的另一个实施例的MMVD的MVD推导过程。如图11中所示的方法可以与应用双向预测的块有关。
参考图11,MVD推导方法可以根据由当前图片(或当前切片或当前块)参考的参考图片是长期参考图片(LTRP)还是短期参考图片(STRP)而变化。在一个示例中,当应用根据图11的实施例的方法时,符合本实施例的部分标准规范可以如下表所示进行描述。
[表7]
Figure BDA0003458301610000451
Figure BDA0003458301610000461
Figure BDA0003458301610000462
Figure BDA0003458301610000471
图12图示根据本文档的另一个实施例的MMVD的MVD推导过程。如图13中所示的方法可以用于应用双向预测的块。
参考图12,根据由当前图片(或当前切片、当前块)参考的参考图片是长期参考图片(LTRP)还是短期参考图片(STRP),用于推导MVD的方法可以是不同的。在一个示例中,当应用根据图12的实施例的方法时,可以如下表中所示描述根据本实施例的标准文档的一部分。
[表8]
Figure BDA0003458301610000472
Figure BDA0003458301610000481
Figure BDA0003458301610000491
Figure BDA0003458301610000492
Figure BDA0003458301610000501
总之,已经描述了当每个方向上的参考图片类型不同时不推导MVD的MMVD的MVD推导过程。
在根据本文档的一个实施例中,在参考长期参考图片的所有情况下可能不推导MVD。也就是说,当至少一个L0和L1参考图片是长期参考图片时,MVD被设置为0,并且仅当包括短期参考图片时才能够推导MVD。在下图和表中详细描述。
图13图示根据本文档的实施例的MMVD的MVD推导过程。在图13中示出的方法可以是应用双向预测的块。
参考图13,基于最高优先级条件(RefPicL0!=LTRP&&RefPicL1!=STRP),在当前图片(或当前切片、当前块)仅参考短期参考图片时,可以推导用于MMVD的MVD。在一个示例中,当应用根据图13的实施例的方法时,可以如下表中所示描述根据本实施例的标准文档的一部分。
[表9]
Figure BDA0003458301610000511
Figure BDA0003458301610000521
Figure BDA0003458301610000522
Figure BDA0003458301610000531
在根据本文档的实施例中,当每个方向上的参考图片类型不同时,当获得短期参考图片时推导MVD,并且当包括长期参考图片时推导MVD为0。在下图和表种详细描述。
图14示出根据本文档的实施例的MMVD的MVD推导过程。在图14中示出的方法可以是应用双向预测的块。
参考图14,当每个方向上的参考图片类型不同时,当参考接近当前图片的参考图片(短期参考图片)时应用MmvdOffset,并且当参考远离当前图片的参考图片(长期参考图片)时MVD具有值0。在这种情况下,可以将接近当前图片的图片视为具有短期参考图片,但是当接近图片是长期参考图片时,可以将mmvdOffset应用于指示短期参考图片的列表的运动矢量。
[表10]
Figure BDA0003458301610000532
例如,包括在表10中的四个段落可以顺序地替换包括在图14中的流程图的最下方的块(内容)。
在一个示例中,当应用根据图14的实施例的方法时,可以如下表中描述根据本实施例的标准文档的一部分。
[表11]
Figure BDA0003458301610000541
Figure BDA0003458301610000551
Figure BDA0003458301610000552
Figure BDA0003458301610000561
下表示出了本文档中包括的示例之间的比较表。
[表12]
Figure BDA0003458301610000562
参考表12,示出了在考虑根据图10至图14的实施例中描述的MMVD的MVD推导的参考图片类型应用偏移的方法之间的比较。在表12中,实施例A可以涉及现有MMVD,实施例B可以示出根据图10至图12的实施例,实施例C可以示出根据图13的实施例,以及实施例D可以示出根据图14的实施例。
即,在根据图10、图11和图12的实施例中,已经描述了仅当两个方向的参考图片类型相同时才推导MVD的方法,并且在根据图13的实施例中,已经描述了仅当两个方向都是短期参考图片时才推导MVD的方法。在根据图13的实施例的情况下,在用于单向预测的长期参考图片的情况下,可以将MVD设置为0。另外,在根据图14的实施例中,已经描述了当两个方向上的参考图片类型不同时仅在一个方向上推导MVD的方法。实施例之间的差异表示本文档中描述的技术的各种特征,并且本领域的普通技术人员可以理解,根据本文档的实施例将实现的效果可以基于这些特征来实现。
在根据本文档的实施例中,当参考图片类型是长期参考图片时,执行单独处理。当包括长期参考图片时,基于POC差(POCDiff)的缩放或镜像不影响性能改进,因此在具有短期参考图片的方向上将MmvdOffset值指配给MVD,并且在具有长期参考图片的方向上将值0指配给MVD。在一个示例中,当应用该实施例时,可以如下表中所示描述符合本实施例的标准文档的一部分。
[表13]
Figure BDA0003458301610000571
Figure BDA0003458301610000581
Figure BDA0003458301610000591
Figure BDA0003458301610000592
Figure BDA0003458301610000601
在另一个示例中,表13的一部分可以用下表替换。参考表14,可以基于除了POCDiff之外的参考图片类型来应用偏移。
[表14]
Figure BDA0003458301610000602
在另一个示例中,表13的一部分可以用下表替换。参考表15,可以始终将MmvdOffset设置为L0,并且将MmvdOffset设置为L1,而不考虑参考图片类型。
[表15]
Figure BDA0003458301610000611
根据本文档的实施例,可以与在上述MERGE模式中使用的MMVD类似地执行帧间模式中的SMVD。在双向预测的情况下,从编码设备向解码设备用信号发送是否推导对称MVD,并且当相关标志(例如sym_mvd_flag)为真(或值为1)时,通过第一方向MVD(例如MVDL0)的镜像来推导第二方向MVD(即MVDL1)。在这种情况下,可以不执行第一方向MVD的缩放。
下表示出了用于编译单元的解码的语法。
[表16]
Figure BDA0003458301610000621
[表17]
Figure BDA0003458301610000622
参照表16和表17,当inter_pred_idc==PRED_BI并且L0和L1的参考图片可用(即,RefIdxSymL0>-1&&RefIdxSymL1>-1)时,用信号发送sym_mvd_flag。
下表示出根据示例的MMVD参考索引的解码过程。
[表18]
Figure BDA0003458301610000631
Figure BDA0003458301610000641
参考表18,描述了用于推导L0和L1的参考图片的可用性的过程。也就是说,如果在L0参考图片当中存在沿前向的参考图片,则将最接近当前图片的参考图片的索引设置为RefIdxSymL0,并且将对应的值设置为L0的参考索引。此外,当在L1参考图片当中存在沿后向的参考图片时,将最接近当前图片的参考图片的索引设置为RefIdxSymL1,并且将对应的值设置为L1的参考索引。
下面的表19示出了根据另一示例的MMVD参考索引的解码过程。
[表19]
Figure BDA0003458301610000651
Figure BDA0003458301610000661
参考表19,如在图10、图11和图12所描述的实施例中,当L0或L1参考图片的类型不同时,即如果L0和L1的参考图片类型在用于SMVD的参考索引推导之后不同,则在使用长期参考图片和短期参考图片的情况下不使用SMVD以便阻止SMVD(参见表19的最下段)。
在本文档的实施例中,可以以类似于合并模式中使用的MMVD的帧间模式应用SMVD。当如在图13中描述的实施例中那样使用长期参考图片时,可以从用于SMVD的参考索引推导过程中排除长期参考图片,如下表所示,以便阻止SMVD。
[表20]
Figure BDA0003458301610000671
Figure BDA0003458301610000681
根据本实施例的另一示例的下表示出了当在用于SMVD的参考图片索引推导之后使用长期参考图片时不应用SMVD的处理示例。
[表21]
Figure BDA0003458301610000682
Figure BDA0003458301610000691
Figure BDA0003458301610000701
在本文档的一个实施例中,在TMVP的colMV推导过程中,在当前图片的参考图片类型和并置图片的参考图片类型不同时,将运动矢量MV设置为0,但在MMVD和SMVD的情况下的推导方法与TMVP不同,并且它们需要被统一。
即使在当前图片的参考图片类型是长期参考图片并且并置图片的参考图片类型是长期参考图片时,运动矢量也按原样使用并置运动矢量的值,但是在MMVD和SMVD中可以将MV设置为0。在这种情况下,TMVP也将MV设置为0,而没有附加诱导。
此外,即使参考图片类型不同,也可以存在与当前图片具有近距离的长期参考图片。因此,代替将MV设置为0,colMV可以用作MV而不缩放。
创建以下附图以解释本说明书的具体示例。由于在附图中描述的特定装置的名称或特定信号/消息/字段的名称通过示例的方式呈现,因此本说明书的技术特征不限于以下附图中使用的特定名称。
图15和图16示出了根据本公开的实施例的视频/图像编码方法和相关组件的一个示例。图2的编码设备可以执行图15的方法。具体地,例如,编码设备的预测器220可以执行图15的S1500至图S1550的步骤,并且编码设备的残差处理器230可以执行S1560步骤。编码设备的熵编码器240可以执行S1570步骤。图15的方法可以包括上述本公开的实施例。
参照图15,编码设备推导用于当前块的帧间预测模式S1500。这里,帧间预测模式可以包括合并模式、AMVP模式(使用运动矢量预测子候选的模式)、MMVD和SMVD。
编码设备推导用于当前块的参考图片列表。在一个示例中,参考图片列表可以包括参考图片列表0(或L0,参考图片列表L0)和参考图片列表1(或L1,参考图片列表L1)。例如,编码设备可以为当前图片中包括的每个切片配置参考图片列表。
编码设备推导被包括在参考图片列表中的参考图片中的每一个与当前图片之间的POC差S1520。在一个示例中,当前图片与当前图片的先前参考图片之间的POC差可以大于0。在另一示例中,当前图片和当前图片的下一参考图片之间的POC差可以小于0。但是,上面的描述仅是示例。
编码设备基于POC差生成包括用于SMVD的参考图片索引的运动信息S1530。编码设备可以推导用于SMVD的参考索引。用于SMVD的参考索引可以指示SMVD应用的参考图片。用于SMVD的参考索引可以包括参考索引L0(RefIdxSumL0)和参考索引L1(RefIdxSumL1)。
编码设备可以构建运动矢量预测子候选列表并基于该列表推导运动矢量预测子。编码设备可以基于对称MVD和运动矢量预测子推导运动矢量。运动信息可以包括运动矢量。
编码设备基于运动信息来生成预测样本S1540。编码设备可以基于包括在运动信息中的运动矢量和参考图片索引来生成预测样本。例如,可以基于由参考图片索引指示的参考图片内的块(或样本)当中的由运动矢量指示的块(或样本)来生成预测样本。
编码设备生成包括帧间预测模式的预测相关信息S1550。预测相关信息可以包括关于MMVD的信息和关于SMVD的信息。
编码设备基于预测样本来推导残差信息S1560。具体地,编码设备可以基于预测样本和原始样本来推导残差样本。编码设备可以基于残差样本来推导残差信息。
编码设备对包括预测相关信息和残差信息的图像/视频信息进行编码S1570。编码后的图像/视频信息可以以比特流的形式输出。比特流可以通过网络或(数字)存储介质发送到解码设备。
根据本公开的实施例,图像/视频信息可以包括各种类型的信息。例如,图像/视频信息可以包括在上述表1至表21中的至少一个中公开的信息。
在一个实施例中,可以基于包括在参考图片列表中的短期参考图片来推导用于SMVD的参考图片索引。
在一个实施例中,图像信息可以包括关于运动矢量差(MVD)的信息。运动信息可以包括运动矢量。可以基于关于MVD的信息推导用于L0预测的第一MVD。可以基于第一MVD推导用于L1预测的第二MVD。
在一个实施例中,第二MVD的大小可以与第一MVD的大小相同。第二MVD的符号可以与第一MVD的符号相反。
在一个实施例中,参考图片列表可以包括用于L0预测的参考图片列表L0和用于L1预测的参考图片列表L1。POC差可以包括在参考图片列表L0中包括的第一短期参考图片与当前图片之间的第一POC差以及在参考图片列表L1中包括的第二短期参考图片与当前图片之间的第二POC差。参考图片索引可以包括指示第一短期参考图片的第一参考图片索引和指示第二短期参考图片的第二参考图片索引。第一参考图片索引可以基于第一POC差被推导。第二参考图片索引可以基于第二POC差被推导。
在一个实施例中,第一POC差可以与第二POC差相同。
在一个实施例中,参考图片列表可以包括用于L0预测的参考图片列表L0。参考图片列表L0可以包括第三短期参考图片和第四短期参考图片。POC差可以包括在第三短期参考图片和当前图片之间的第三POC差以及在第四短期参考图片和当前图片之间的第四POC差。基于第三和第四POC差之间的比较,可以推导第三短期参考图片作为用于SMVD的参考图片索引之一。
在一个实施例中,当第三POC差小于第四POC差时,可以推导第三短期参考图片作为用于SMVD的参考图片索引之一。
图17和图18示出根据本公开的实施例的图像/视频解码方法和相关组件的一个示例。图3的解码设备可以执行图17的方法。具体地,例如,解码设备的熵解码器310可以执行图17的S1700步骤,并且解码设备的预测器330可以执行S1710至S1750步骤。图17的方法可以包括上述本公开的实施例。
参照图17,解码设备接收/获得图像/视频信息S1700。解码设备可以通过比特流接收/获得图像/视频信息。图像/视频信息可以包括预测相关信息(包括预测模式信息)和残差信息。预测相关信息可以包括关于MMVD的信息和关于SMVD的信息。此外,根据本公开的实施例,图像/视频信息可以包括各种类型的信息。例如,图像/视频信息可以包括参照上述表1至21中的至少一个中公开的信息。
解码设备基于预测相关信息来推导用于当前块的帧间预测模式S1710。这里,帧间预测模式可以包括合并模式、AMVP模式(使用运动矢量预测子候选的模式)、MMVD和SMVD。
解码设备推导用于当前块的参考图片列表S1720。在一个示例中,参考图片列表可以包括参考图片列表0(或L0、参考图片列表L0)和参考图片列表1(或L1、参考图片列表L1)。例如,解码设备可以为当前图片中包括的每个切片配置参考图片列表。
解码设备推导包括在参考图片列表中的每个参考图片与当前图片之间的POC差S1730。在一个示例中,当前图片和当前图片的先前参考图片之间的POC差可以大于0。在另一示例中,当前图片和当前图片的下一参考图片之间的POC差可以小于0。然而,以上描述仅是示例。
解码设备基于POC差推导包括用于SMVD的参考图片索引的运动信息S1740。解码设备可以推导用于SMVD的参考索引。用于SMVD的参考索引可以指示用于SMVD应用的参考图片。用于SMVD的参考索引可以包括参考索引L0(RefIdxSumL0)和参考索引L1(RefIdxSumL1)。
解码设备可以构建运动矢量预测子候选列表并基于该列表推导运动矢量预测子。解码设备可以基于对称MVD和运动矢量预测子推导运动矢量。运动信息可以包括运动矢量。
解码设备基于运动信息来生成预测样本S1750。解码设备可以基于包括在运动信息中的运动矢量和参考图片索引来生成预测样本。例如,可以基于由参考图片索引指示的参考图片内的块(或样本)当中的由运动矢量指示的块(或样本)来生成预测样本。
在一个实施例中,可以基于包括在参考图片列表中的短期参考图片来推导用于SMVD的参考图片索引。
在一个实施例中,图像信息可以包括关于MVD的信息。运动信息可以包括运动矢量。可以基于关于MVD的信息推导用于L0预测的第一MVD。可以基于第一MVD推导用于L1预测的第二MVD。可以基于第一MVD和第二MVD推导运动矢量。
在一个实施例中,第二MVD的大小可以与第一MVD的大小相同。第二MVD的符号可以与第一MVD的符号相反。
在一个实施例中,参考图片列表可以包括用于L0预测的参考图片列表L0和用于L1预测的参考图片列表L1。POC差可以包括在参考图片列表L0中包括的第一短期参考图片与当前图片之间的第一POC差以及在参考图片列表L1中包括的第二短期参考图片与当前图片之间的第二POC差。参考图片索引可以包括指示第一短期参考图片的第一参考图片索引和指示第二短期参考图片的第二参考图片索引。第一参考图片索引可以基于第一POC差推导。可以基于第二POC差来推导第二参考图片索引。
在一个实施例中,第一POC差可以与第二POC差相同。
在一个实施例中,参考图片列表可以包括用于L0预测的参考图片列表L0。参考图片列表L0可包括第三短期参考图片和第四短期参考图片。POC差可以包括第三短期参考图片和当前图片之间的第三POC差以及第四短期参考图片和当前图片之间的第四POC差。基于第三POC差和第四POC差之间的比较,可以推导第三短期参考图片作为用于SMVD的参考图片索引之一。
在一个实施例中,当第三POC差小于第四POC差时,可以推导第三短期参考图片作为用于SMVD的参考图片索引之一。
在上述实施例中,基于流程图作为一系列步骤或方框来描述方法,但是对应实施例不限于该步骤顺序,特定步骤可按照与上述顺序不同的顺序发生或者与不同于上述的步骤同时发生。另外,本领域技术人员将理解,流程图中所示的步骤不是排他性的,可以包括其它步骤或者可删除流程图中的一个或更多个步骤,而不影响本文档的实施例的范围。
根据本文档的实施例的上述方法可按软件的形式实现,并且根据本文档的编码设备和/或解码设备可以包括在用于执行例如TV、计算机、智能电话、机顶盒、显示装置等的图像处理的设备中。
当本文档中的实施例以软件实现时,上述方法可以被实现为用于执行上述功能的模块(进程、函数等)。该模块可以被存储在存储器中并由处理器执行。存储器可位于处理器内部或外部,并且可以通过各种熟知手段与处理器联接。处理器可以包括专用集成电路(ASIC)、其它芯片组、逻辑电路和/或数据处理装置。存储器可以包括只读存储器(ROM)、随机存取存储器(RAM)、闪存、存储卡、存储介质和/或其它存储装置。即,本文档中描述的实施例可在处理器、微处理器、控制器或芯片上实现和执行。例如,各个附图中所示的功能单元可在计算机、处理器、微处理器、控制器或芯片上实现和执行。在这种情况下,用于实现的信息(例如,关于指令的信息)或算法可以被存储在数字存储介质中。
另外,应用了本文档的实施例的解码设备和编码设备可以被包括在多媒体广播发送和接收装置、移动通信终端、家庭影院视频装置、数字影院视频装置、监视相机、视频聊天装置、实时通信装置(例如,视频通信)、移动流装置、存储介质、摄像机、视频点播(VoD)服务提供器、过顶(OTT)视频装置、互联网流服务提供器、3D视频装置、虚拟现实装置、增强现实(AR)装置、视频电话视频装置、运输工具终端(例如,车辆(包括自主车辆)终端、飞机终端、船舶终端等)、医疗视频装置等中,并且可以用于处理视频信号或数据信号。例如,顶置视频(OTT)装置可以包括游戏机、蓝光播放器、互联网访问TV、家庭影院系统、智能电话、平板PC、数字视频记录仪(DVR)等。
另外,应用了本文档的实施例的处理方法可按照由计算机执行的程序的形式生成,并且可以被存储在计算机可读记录介质中。具有根据本文档的实施例的数据结构的多媒体数据也可以被存储在计算机可读记录介质中。计算机可读记录介质包括存储计算机可读数据的所有类型的存储装置和分布式存储装置。例如,计算机可读记录介质可以包括蓝光盘(BD)、通用串行总线(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储装置。另外,计算机可读记录介质还包括以载波的形式实现的介质(例如,经由互联网的传输)。另外,通过该编码方法生成的比特流可以被存储在计算机可读记录介质中或通过有线和无线通信网络发送。
另外,本文档的实施例可以通过程序代码被实现为计算机程序产品,并且可以通过本文档的实施例在计算机上执行程序代码。程序代码可以被存储在可以由计算机读取的载体上。
图19示出本文档中公开的实施例可以应用于的内容流系统的示例。
参考图19,应用了本文档的实施例可以应用于的内容流系统可主要包括编码服务器、流服务器、web服务器、媒体存储装置、用户装置和多媒体输入装置。
编码服务器起到通过将从多媒体输入装置(例如,智能电话、相机或摄像机)输入的内容压缩为数字数据来生成比特流并将所生成的比特流发送到流服务器的作用。作为另一示例,如果多媒体输入装置(例如,智能电话、相机或摄像机)直接生成比特流,则可省略编码服务器。
可以通过应用了本公开的编码方法或生成比特流的方法来生成比特流,并且在发送或接收比特流的同时,流服务器可暂时存储比特流。
流服务器起到通过web服务器基于用户请求将多媒体数据发送到用户装置的作用,并且web服务器起到告知用户哪些服务可用的作用。如果用户向web服务器请求期望的服务,则web服务器将请求发送到流服务器,并且流服务器将多媒体数据发送到用户。此时,内容流系统可以包括单独的控制服务器,并且在这种情况下,控制服务器起到控制内容流系统内的装置之间的命令/响应的作用。
流服务器可从媒体存储装置和/或编码服务器接收内容。例如,如果从编码服务器接收内容,则内容可实时地接收。在这种情况下,为了提供平滑的流服务,流服务器可以将比特流存储达预定时间段。
用户装置的示例可以包括移动电话、智能电话、膝上型计算机、数字广播终端、个人数字助理(PDA)、便携式多媒体播放器(PMP)、导航终端、石板PC、平板PC、超级本、可穿戴装置(例如,智能手表或智能眼镜)、数字TV、台式计算机和数字标牌。
内容流系统内的各个单独的服务器可作为分布式服务器操作,并且在这种情况下,可按分布式方式处理由各个服务器接收的数据。
这里描述的权利要求可以以各种方式组合。例如,可以将本文档的方法权利要求的技术特征组合并实现为设备,并且可以将本文档的设备权利要求的技术特征组合并实现为方法。另外,本文档的方法权利要求的技术特征和设备权利要求的技术特征可以被组合以实现为设备,并且本文档的方法权利要求的技术特征和设备权利要求的技术特征可以被组合并实现为方法。

Claims (15)

1.一种由解码设备执行的图像解码方法,所述方法包括:
从比特流中获得包括预测相关信息的图像信息;
基于所述预测相关信息,推导用于当前块的帧间预测模式;
推导用于所述当前块的参考图片列表;
推导包括在所述参考图片列表中的每个参考图片与当前图片之间的图片顺序计数(POC)差;
基于所述POC差,推导包括用于对称运动矢量差(SMVD)的参考图片索引的运动信息;以及
基于所述运动信息,生成预测样本,
其中,基于包括在所述参考图片列表中的短期参考图片,推导用于所述SMVD的所述参考图片索引。
2.根据权利要求1所述的方法,其中,所述图像信息包括关于运动矢量差(MVD)的信息,
所述运动信息包括运动矢量,
基于所述关于MVD的信息,推导用于L0预测的第一MVD,
基于所述第一MVD,推导用于L1预测的第二MVD,并且
基于所述第一MVD和所述第二MVD,推导所述运动矢量。
3.根据权利要求2所述的方法,其中,所述第二MVD的大小与所述第一MVD的大小相同,并且
所述第二MVD的符号与所述第一MVD的符号相反。
4.根据权利要求1所述的方法,其中,所述参考图片列表包括用于L0预测的参考图片列表L0和用于L1预测的参考图片列表L1,
所述POC差包括在所述参考图片列表L0中包括的第一短期参考图片与所述当前图片之间的第一POC差,以及在所述参考图片列表L1中包括的第二短期参考图片与所述当前图片之间的第二POC差,
所述参考图片索引包括指示所述第一短期参考图片的第一参考图片索引和指示所述第二短期参考图片的第二参考图片索引,
基于所述第一POC差,推导所述第一参考图片索引,并且
基于所述第二POC差,推导所述第二参考图片索引。
5.根据权利要求4所述的方法,其中,所述第一POC差与所述第二POC差相同。
6.根据权利要求1所述的方法,其中,所述参考图片列表包括用于L0预测的参考图片列表L0,
所述参考图片列表L0包括第三短期参考图片和第四短期参考图片,
所述POC差包括所述第三短期参考图片和所述当前图片之间的第三POC差以及所述第四短期参考图片和所述当前图片之间的第四POC差,以及
基于所述第三POC差和所述第四POC差之间的比较,所述第三短期参考图片被推导为用于SMVD的所述参考图片索引之一。
7.根据权利要求6所述的方法,其中,当所述第三POC差小于所述第四POC差时,将所述第三短期参考图片推导为用于SMVD的所述参考图片索引之一。
8.一种由编码设备执行的图像编码方法,所述方法包括:
推导用于当前块的帧间预测模式;
推导包括参考图片的参考图片列表;
推导包括在所述参考图片列表中的所述参考图片与当前图片之间的图片顺序计数(POC)差;
基于所述POC差,推导包括用于对称运动矢量差(SMVD)的参考图片索引的运动信息;
基于所述运动信息,生成预测样本,
生成包括所述帧间预测模式的预测相关信息;
基于所述预测样本,推导残差信息;以及
编码包括所述预测相关信息和所述残差信息的图像信息,
其中,基于包括在所述参考图片列表中的短期参考图片,推导用于所述SMVD的所述参考图片索引。
9.根据权利要求8所述的方法,其中,所述图像信息包括关于运动矢量差(MVD)的信息,
所述运动信息包括运动矢量,
所述关于MVD的信息指示用于L0预测的第一MVD,并且
基于所述第一MVD,推导用于L1预测的第二MVD。
10.根据权利要求9所述的方法,其中,所述第二MVD的大小与所述第一MVD的大小相同,并且
所述第二MVD的符号与所述第一MVD的符号相反。
11.根据权利要求8所述的方法,其中,所述参考图片列表包括用于L0预测的参考图片列表L0和用于L1预测的参考图片列表L1,
所述POC差包括在所述参考图片列表L0中包括的第一短期参考图片与所述当前图片之间的第一POC差,以及在所述参考图片列表L1中包括的第二短期参考图片与所述当前图片之间的第二POC差,
所述参考图片索引包括指示所述第一短期参考图片的第一参考图片索引和指示所述第二短期参考图片的第二参考图片索引,
基于所述第一POC差,推导所述第一参考图片索引,并且
基于所述第二POC差,推导所述第二参考图片索引。
12.根据权利要求11所述的方法,其中,所述第一POC差与所述第二POC差相同。
13.根据权利要求8所述的方法,其中,所述参考图片列表包括用于L0预测的参考图片列表L0,
所述参考图片列表L0包括第三短期参考图片和第四短期参考图片,
所述POC差包括所述第三短期参考图片和所述当前图片之间的第三POC差以及所述第四短期参考图片和所述当前图片之间的第四POC差,以及
基于所述第三POC差和所述第四POC差之间的比较,所述第三短期参考图片被推导为用于SMVD的所述参考图片索引之一。
14.根据权利要求12所述的方法,其中,当所述第三POC差小于所述第四POC差时,将所述第三短期参考图片推导为用于SMVD的所述参考图片索引之一。
15.一种存储编码信息的计算机可读存储介质,所述编码信息使图像解码设备执行图像解码方法,其中,所述图像解码方法包括:
从比特流中获得包括预测相关信息的图像信息;
基于所述预测相关信息,推导用于当前块的帧间预测模式;
推导用于所述当前块的参考图片列表;
推导包括在所述参考图片列表中的每个参考图片与当前图片之间的图片顺序计数(POC)差;
基于所述POC差,推导包括用于对称运动矢量差(SMVD)的参考图片索引的运动信息;以及
基于所述运动信息,生成预测样本,
其中,基于包括在所述参考图片列表中的短期参考图片,推导用于所述SMVD的所述参考图片索引。
CN202080049667.4A 2019-06-14 2020-06-15 基于帧间预测的图像编译方法和装置 Pending CN114080810A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962861983P 2019-06-14 2019-06-14
US62/861,983 2019-06-14
PCT/KR2020/007717 WO2020251323A1 (ko) 2019-06-14 2020-06-15 인터 예측 기반 영상 코딩 방법 및 장치

Publications (1)

Publication Number Publication Date
CN114080810A true CN114080810A (zh) 2022-02-22

Family

ID=73781869

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080049667.4A Pending CN114080810A (zh) 2019-06-14 2020-06-15 基于帧间预测的图像编译方法和装置

Country Status (7)

Country Link
US (3) US11457208B2 (zh)
EP (1) EP3975561A4 (zh)
JP (2) JP7323649B2 (zh)
KR (2) KR20240006016A (zh)
CN (1) CN114080810A (zh)
MX (1) MX2021015530A (zh)
WO (1) WO2020251323A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240006015A (ko) * 2019-06-14 2024-01-12 엘지전자 주식회사 움직임 벡터를 이용한 영상 코딩 방법 및 장치
US11190789B2 (en) * 2019-06-30 2021-11-30 Tencent America LLC Method and apparatus for video coding using inter-prediction mode signaling to dertermine motion vectors
CN115086678B (zh) * 2022-08-22 2022-12-27 北京达佳互联信息技术有限公司 视频编码方法和装置、视频解码方法和装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112017010468B1 (pt) 2014-11-18 2024-01-02 Hfi Innovation Inc Método de decodificação de vídeo para blocos codificados no modo de interpredição e método de codificação de vídeo para blocos codificados no modo de interpredição
KR20180048736A (ko) * 2015-09-24 2018-05-10 엘지전자 주식회사 영상 코딩 시스템에서 인터 예측 방법 및 장치
CN109997363B (zh) * 2016-11-28 2023-12-05 英迪股份有限公司 图像编码/解码方法和装置以及存储有比特流的记录介质
KR102409430B1 (ko) * 2017-04-24 2022-06-15 에스케이텔레콤 주식회사 움직임 보상을 위한 옵티컬 플로우 추정 방법 및 장치
CN116915983B (zh) * 2019-02-20 2024-04-16 北京达佳互联信息技术有限公司 用于视频解码的方法、计算设备、存储介质和程序产品
JP7303330B2 (ja) 2019-04-28 2023-07-04 北京字節跳動網絡技術有限公司 対称動きベクトル差分符号化
US11109064B2 (en) * 2019-05-22 2021-08-31 Mediatek Inc. Signaling of motion vector difference derivation

Also Published As

Publication number Publication date
EP3975561A1 (en) 2022-03-30
KR20210158857A (ko) 2021-12-31
US11902511B2 (en) 2024-02-13
JP2022536379A (ja) 2022-08-15
KR20240006016A (ko) 2024-01-12
MX2021015530A (es) 2022-02-10
EP3975561A4 (en) 2023-03-22
KR102622468B1 (ko) 2024-01-09
US11457208B2 (en) 2022-09-27
WO2020251323A1 (ko) 2020-12-17
JP2023139236A (ja) 2023-10-03
US20220109828A1 (en) 2022-04-07
US20230388486A1 (en) 2023-11-30
US20220417502A1 (en) 2022-12-29
JP7323649B2 (ja) 2023-08-08

Similar Documents

Publication Publication Date Title
US11503301B2 (en) Image coding method and apparatus using motion vector differences
US11902511B2 (en) Inter prediction-based image coding method and device
CN114051726A (zh) 使用运动矢量差进行图像编译的方法和装置
CN114258676A (zh) 当最终无法选择当前块的预测模式时执行帧间预测的图像解码方法及其装置
US20240129520A1 (en) Inter prediction-based image coding method and apparatus
CN114208168A (zh) 视频或图像编码系统中的帧间预测
CN114342387A (zh) 基于运动预测的图像编译方法和装置
CN114080814A (zh) 基于运动矢量预测的图像/视频编码方法和装置
CN114097240A (zh) 基于双向预测的图像/视频编码方法和装置
CN114270824A (zh) 用于基于帧间预测编译图像的方法和装置
CN114080809A (zh) 子块单元的基于时间运动矢量预测子候选的图像或视频编译
US11917161B2 (en) Method and device for image coding using motion vector
JP7513816B2 (ja) 動きベクトル差分を利用した映像コーディング方法及び装置
JP7513814B2 (ja) 動きベクトル差分を利用した映像コーディング方法および装置
RU2784417C1 (ru) Способ и устройство для кодирования изображений с использованием разностей векторов движения
KR20210158398A (ko) 움직임 벡터를 이용한 영상 코딩 방법 및 장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination