CN114342387A - 基于运动预测的图像编译方法和装置 - Google Patents

基于运动预测的图像编译方法和装置 Download PDF

Info

Publication number
CN114342387A
CN114342387A CN202080058624.2A CN202080058624A CN114342387A CN 114342387 A CN114342387 A CN 114342387A CN 202080058624 A CN202080058624 A CN 202080058624A CN 114342387 A CN114342387 A CN 114342387A
Authority
CN
China
Prior art keywords
current block
flag
prediction
information
merge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080058624.2A
Other languages
English (en)
Inventor
张炯文
朴奈利
金昇焕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN114342387A publication Critical patent/CN114342387A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一种根据本文档的由解码设备执行的解码方法包括以下步骤:从比特流获取与当前块的预测模式相关联的信息;基于与预测模式相关联的信息来推导当前块的预测模式;基于预测模式来推导当前块的预测样本;以及基于预测样本来生成重构样本,其中比特流包括序列参数集,序列参数集包括组合的图片间合并和图片内预测(CIIP)启用标志,以及用于推导的步骤可以包括基于满足基于CIIP启用标志的条件和基于当前块的大小的条件从比特流解析常规合并标志的步骤。

Description

基于运动预测的图像编译方法和装置
技术领域
该技术涉及用于基于运动预测对图像进行编译的方法和设备。
背景技术
最近,在各种领域中对诸如4K或8K超高清(UHD)图像/视频的高分辨率、高质量图像/视频的需求不断增加。随着图像/视频分辨率或质量变得更高,与传统图像/视频数据相比发送相对更多的信息或比特。因此,如果图像/视频数据经由诸如现有有线/无线宽带线路的介质发送或被存储在传统存储介质中,则传输和存储的成本容易增加。
此外,对虚拟现实(VR)和人工现实(AR)内容以及诸如全息图这样的沉浸式媒体的兴趣和需求日益增长;并且表现出与实际图像/视频不同的图像/视频特性的图像/视频(例如,游戏图像/视频)的广播也日益增长。
因此,需要高度高效的图像/视频压缩技术来有效地压缩并发送、存储或播放如上所述显示出各种特性的高分辨率、高质量图像/视频。
发明内容
技术问题
本公开提供一种用于提高图像编译效率的方法和设备。
本公开还提供一种用于有效地执行帧间预测的方法和设备。
本公开还提供一种用于在帧间预测期间防止不必要信令的方法和设备。
技术方案
在一个方面中,一种由解码设备执行的解码方法包括:从比特流获取关于当前块的预测模式的信息;基于关于预测模式的信息来推导当前块的预测模式;基于预测模式来生成当前块的预测样本;以及基于预测样本来生成重构样本,其中比特流包括序列参数集,所述序列参数集包括组合的图片间合并和图片内预测(CIIP)启用标志,以及所述推导包括基于满足基于CIIP启用标志的条件和基于当前块的大小的条件从比特流解析常规合并标志。
在另一个方面中,一种由编码设备执行的编码方法包括:确定当前块的预测模式;基于预测模式来生成关于预测模式的信息;以及编码包括关于预测模式的信息的图像信息,其中图像信息包括序列参数集,所述序列参数集包括组合的图片间合并和图片内预测(CIIP)启用标志,以及基于满足基于CIIP启用标志的条件和基于当前块的大小的条件,图像信息包括常规合并标志。
在另一个方面中,一种计算机可读数字存储介质包括使解码设备执行解码方法的信息,其中所述解码方法包括:从比特流获取关于当前块的预测模式的信息;基于关于预测模式的信息来推导当前块的预测模式;基于预测模式来生成当前块的预测样本;以及基于预测样本来生成重构样本,其中比特流包括序列参数集,所述序列参数集包括组合的图片间合并和图片内预测(CIIP)启用标志,以及所述推导包括基于满足基于CIIP启用标志的条件和基于当前块的大小的条件从比特流解析常规合并标志。
有益效果
根据本公开的实施例,可以改善整体图像/视频压缩效率。
根据本公开的实施例,可以有效地执行帧间预测。
根据本公开的实施例,可以在帧间预测期间有效地移除不必要的语法的信令。
附图说明
图1示意性地示出可应用本公开的实施例的视频/图像编译系统的示例。
图2是示意性地图示可应用本公开的实施例的视频/图像编码设备的配置的图。
图3是示意性地图示可应用本公开的实施例的视频/图像解码设备的配置的图。
图4示出基于帧间预测的视频/图像编码方法的示例。
图5示出基于帧间预测的视频/图像解码方法的示例。
图6示例性地示出帧间预测过程。
图7是图示可用于帧间预测的空间候选的图。
图8是图示具有可以在帧间预测中使用的运动向量差的合并模式的图。
图9和图10是图示可以在帧间预测中使用的基于子块的时间运动向量预测处理的图。
图11是图示可应用于帧间预测的分割模式的图。
图12是图示可应用于帧间预测的CIIP模式的图。
图13和14示意性地示出根据本公开的实施例的包括帧间预测方法的视频/图像编码方法的示例以及相关联的组件。
图15和图16示意性地示出根据本公开的实施例的包括帧间预测方法的视频/图像解码方法的示例以及相关联的组件。
图17示出可应用本文档中所公开的实施例的内容流传输系统的示例。
具体实施方式
可以各种形式修改本公开的公开内容,并且将在附图中描述和图示其具体实施例。在本公开中使用的术语仅用于描述具体实施例,而不旨在限制本公开中的所公开的方法。单数的表达包括“至少一个”的表达,只要它被清楚地不同地解读。诸如“包括”和“具有”的术语旨在指示存在文档中使用的特征、数量、步骤、操作、元素、组件或其组合,并且因此应当理解,不排除存在或添加一个或多个不同特征、数量、步骤、操作、元素、组件或其组合的可能性。
此外,本文档中描述的附图的每个配置是用于解释作为彼此不同的特征的功能的独立图示,并且不意味着每个配置由相互不同的硬件或不同的软件实现。例如,可将两种或更多种配置组合以形成一种配置,并且还可将一种配置分成多种配置。在不脱离本公开的所公开的方法的主旨的情况下,组合和/或分离配置的实施例包括在本公开的公开内容的范围内。
在下文中,将参考附图详细描述本文档的实施例。另外,在所有附图中,相同的附图标记可用于指示相同的元件,并且将省略对相同元件的相同描述。
图1图示可应用本公开的实施例的视频/图像编译系统的示例。
参照图1,视频/图像编译系统可以包括第一装置(源装置)和第二装置(接收装置)。源装置可以通过数字存储介质或网络将编码的视频/图像信息或数据以文件或流的形式发送至接收装置。
源装置可以包括视频源、编码设备和发送器。接收装置可包括接收器、解码设备和渲染器。编码设备可被称为视频/图像编码设备,解码设备可被称为视频/图像解码设备。发送器可被包括在编码设备中。接收器可被包括在解码设备中。渲染器可包括显示器,并且显示器可被配置为单独的装置或外部部件。
视频源可通过捕获、合成或生成视频/图像的处理来获取视频/图像。视频源可包括视频/图像捕获装置,和/或视频/图像生成装置。例如,视频/图像捕获装置可包括一个或更多个相机、包括先前捕获的视频/图像的视频/图像档案等。例如,视频/图像生成装置可包括计算机、平板计算机和智能电话,并且可(以电子方式)生成视频/图像。例如,可通过计算机等生成虚拟视频/图像。在这种情况下,视频/图像捕获处理可由生成相关数据的处理代替。
编码设备可对输入视频/图像进行编码。为了压缩和编译效率,编码设备可执行诸如预测、变换和量化的一系列过程。编码的数据(编码的视频/图像信息)可按比特流的形式输出。
发送器可通过数字存储介质或网络将以比特流的形式输出的编码的图像/图像信息或数据以文件或流的形式发送至接收装置的接收器。数字存储介质可包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送器可包括用于通过预定文件格式生成媒体文件的元件,并且可包括用于通过广播/通信网络传输的元件。接收器可接收/提取比特流并且将所接收的比特流发送至解码设备。
解码设备可通过执行与编码设备的操作对应的诸如解量化、逆变换和预测的一系列过程对视频/图像进行解码。
渲染器可渲染解码的视频/图像。渲染的视频/图像可通过显示器显示。
本文档涉及视频/图像编译。例如,本文档中公开的方法/实施例可以应用于在通用视频编译(VVC)标准中公开的方法。此外,本文档中公开的方法/实施例可以应用于基本视频编译(EVC)标准、AOMedia视频1(AV1)标准、第2代音频视频编译标准(AVS2)或下一代视频/图像编译标准(例如,H.267、H.268等)中公开的方法。
在本文档呈现与视频/图像编译有关的各种实施例,并且除非另外指定,否则也可以彼此组合地执行上述实施例。
在本文档中,可以省略量化/解量化和/或变换/逆变换中的至少一个。当省略量化/解量化时,可以将量化的变换系数称为变换系数。当省略变换/逆变换时,变换系数可以称为系数或残差系数,或者仍然可以称为统一表达的变换系数。
在本文档中,量化变换系数和变换系数可分别称为变换系数和缩放变换系数。在这种情况下,残差信息可以包括关于变换系数的信息,并且关于变换系数的信息可以通过残差编码语法用信号通知。可以基于残差信息(或者关于变换系数的信息)来推导变换系数,并且可以通过关于变换系数的逆变换(缩放)来推导缩放变换系数。残差样本可以基于缩放变换系数的逆变换(变换)来推导。这也可以在本文档的其他部分中应用/表达。
在本文档中,视频可以指随着时间的一系列图像。图片通常是指表示特定时间帧处的一个图像的单元,并且切片(slice)/拼块(tile)是指在编译方面构成图片的一部分的单元。切片/拼块可以包括一个或多个编译树单元(CTU)。一个图片可以由一个或多个切片/拼块组成。一个图片可以由一个或多个拼块组组成。一个拼块组可以包括一个或多个拼块。图块(brick)可以表示图片中的拼块内的CTU行的矩形区域。拼块可以被分割成多个图块,每个图块可由拼块内的一个或多个CTU行组成。未被分割成多个图块的拼块也可以被称为图块。图块扫描可以表示分割图片的CTU的特定顺序排序,其中CTU在图块内以CTU光栅扫描连续地排序,拼块内的图块以拼块的图块的光栅扫描连续地排序,并且图片中的拼块以图片的拼块的光栅扫描连续地排序。拼块是图片中的特定拼块列和特定拼块行内的CTU的矩形区域。拼块列是CTU的矩形区域,其具有等于图片的高度的高度和由图片参数集中的语法元素指定的宽度。拼块行是CTU的矩形区域,其具有由图片参数集中的语法元素指定的高度和等于图片的宽度的宽度。拼块扫描是分割图片的CTU的特定顺序排序,其中CTU在拼块中以CTU光栅扫描连续地排序而图片中的拼块以图片的拼块的光栅扫描连续地排序。切片包括可仅包含在单个NAL单元中的图片的整数个图块。切片可以由多个完整图块组成,或者仅由一个拼块的连续完整图块序列组成。在本文档中,可以使用拼块组和切片来代替彼此。例如,在本文档中,拼块组/拼块组报头可以称为切片/切片报头。
像素或像元(pel)可意指构成一个图片(或图像)的最小单元。另外,“样本”可用作与像素对应的术语。样本通常可表示像素或像素值,并且可仅表示亮度分量的像素/像素值或仅表示色度分量的像素/像素值。
单元可表示图像处理的基本单位。单元可包括图片的特定区域和与该区域有关的信息中的至少一个。一个单元可包括一个亮度块和两个色度(例如,cb、cr)块。在一些情况下,单元可与诸如块或区域这样的术语互换使用。在一般情况下,M×N块可包括M列和N行的样本(或样本阵列)或变换系数的集合(或阵列)。另选地,样本可意指空间域中的像素值,并且当这样的像素值被变换到频域时,它可意指频域中的变换系数。
在本文档中,术语“/”和“,”应解释为指示“和/或”。例如,表达“A/B”可以意指“A和/或B”。此外,“A、B”可以意指“A和/或B”。此外,“A/B/C”可以意指“A、B和/或C中的至少一个”。此外,“A/B/C”可以意指“A、B和/或C中的至少一个”。
此外,在文档中,术语“或”应解释为指示“和/或”。例如,表达“A或B”可以包括1)仅A、2)仅B和/或3)A和B两者。换句话说,本文档中的术语“或”应解释为指示“附加地或替代地”。
图2是示意性地图示本公开的实施例可以应用于的视频/图像编码设备的配置的图。在下文中,被称为视频编码设备的设备可以包括图像编码设备。
参照图2,编码设备200包括图像分区器210、预测器220、残差处理器230和熵编码器240、加法器250、滤波器260和存储器270。预测器220可包括帧间预测器221和帧内预测器222。残差处理器230可包括变换器232、量化器233、解量化器234和逆变换器235。残差处理器230还可包括减法器231。加法器250可被称为重构器或重构块生成器。根据实施方式,图像分区器210、预测器220、残差处理器230、熵编码器240、加法器250和滤波器260可由至少一个硬件部件(例如,编码器芯片组或处理器)配置。另外,存储器270可包括解码图片缓冲器(DPB),或者可由数字存储介质配置。硬件部件还可包括存储器270作为内部/外部部件。
图像分区器210可将输入到编码设备200的输入图像(或者图片或帧)分割成一个或更多个处理单元。例如,处理单元可被称为编译单元(CU)。在这种情况下,编译单元可根据四叉树二叉树三叉树(QTBTTT)结构从编译树单元(CTU)或最大编译单元(LCU)递归地分割。例如,一个编译单元可基于四叉树结构、二叉树结构和/或三元结构被分割成深度更深的多个编译单元。在这种情况下,例如,可首先应用四叉树结构,稍后可应用二叉树结构和/或三元结构。另选地,可首先应用二叉树结构。可基于不再分割的最终编译单元来执行根据本公开的编译过程。在这种情况下,根据图像特性基于编译效率等,最大编译单元可用作最终编译单元,或者如果需要,编译单元可被递归地分割成深度更深的编译单元并且具有最优大小的编译单元可用作最终编译单元。这里,编译过程可包括预测、变换和重构的过程(将稍后描述)。作为另一示例,处理单元还可包括预测单元(PU)或变换单元(TU)。在这种情况下,预测单元和变换单元可从上述最终编译单元分割或分区。预测单元可以是样本预测的单元,变换单元可以是用于推导变换系数的单元和/或用于从变换系数推导残差信号的单元。
在一些情况下,单元可与诸如块或区域这样的术语互换使用。在一般情况下,M×N块可表示由M列和N行组成的样本或变换系数的集合。样本通常可表示像素或像素值,可仅表示亮度分量的像素/像素值或者仅表示色度分量的像素/像素值。样本可用作与像素或像元的一个图片(或图像)对应的术语。
编码设备200可以从输入图像信号(原始块、原始样本阵列)减去从帧间预测器221或帧内预测器222输出的预测信号(预测块、预测样本阵列)以生成残差信号(残差块、残差样本阵列),并且所生成的残差信号被发送到变换器232。在这种情况下,如所示,在编码器200中从输入图像信号(原始块、原始样本阵列)减去预测信号(预测块、预测样本阵列)的单元可以被称为减法器231。预测器可以对处理目标块(以下,称为当前块)执行预测并且生成包括当前块的预测样本的预测块。预测器可以确定在当前块或CU的单元中应用帧内预测还是帧间预测。如在各个预测模式的描述中稍后描述的,预测器可以生成关于预测的各种类型的信息(例如,预测模式信息)并将所生成的信息发送到熵编码器240。关于预测的信息可以由熵编码器240编码并以比特流的形式输出。
帧内预测器222可参考当前图片中的样本来预测当前块。根据预测模式,所参考的样本可位于当前块附近或者可隔开。在帧内预测中,预测模式可包括多个非定向模式和多个定向模式。例如,非定向模式可包括DC模式和平面模式。例如,根据预测方向的详细程度,定向模式可包括33个定向预测模式或65个定向预测模式。然而,这仅是示例,可根据设置使用更多或更少的定向预测模式。帧内预测器222可使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器221可基于参考图片上运动矢量所指定的参考块(参考样本阵列)来推导当前块的预测块。这里,为了减少在帧间预测模式下发送的运动信息量,可基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为单位预测运动信息。运动信息可包括运动矢量和参考图片索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可包括存在于当前图片中的空间邻近块和存在于参考图片中的时间邻近块。包括参考块的参考图片和包括时间邻近块的参考图片可相同或不同。时间邻近块可被称为并置参考块、并置CU(colCU)等,并且包括时间邻近块的参考图片可被称为并置图片(colPic)。例如,帧间预测器221可基于邻近块来配置运动信息候选列表并且生成指示哪一候选用于推导当前块的运动矢量和/或参考图片索引的信息。可基于各种预测模式执行帧间预测。例如,在跳过模式和合并模式的情况下,帧间预测器221可使用邻近块的运动信息作为当前块的运动信息。在跳过模式下,与合并模式不同,可不发送残差信号。在运动矢量预测(MVP)模式的情况下,邻近块的运动矢量可用作运动矢量预测器,并且可通过用信号通知运动矢量差来指示当前块的运动矢量。
预测器220可以基于稍后描述的各种预测方法来生成预测信号。例如,预测器220可以应用帧内预测或帧间预测来预测一个块,并且可以同时应用帧内预测和帧间预测。这可以被称为组合帧间和帧内预测(CIIP)。此外,预测器可以基于帧内块复制(IBC)预测模式或基于调色板模式以用于预测块。IBC预测模式或调色板模式可用于游戏等的内容的图像/视频编译,例如屏幕内容编译(SCC)。IBC基本上在当前图片中执行预测,但是它可以与帧间预测类似地执行在于在当前图片中推导参考块。也就是说,IBC可以使用本文档中描述的帧间预测技术中的至少一种。调色板模式可以被视为帧内编译或帧内预测的示例。当应用调色板模式时,可以基于关于调色板表和调色板索引的信息用信号通知图片中的样本值。
通过预测器(包括帧间预测器221和/或帧内预测器222)生成的预测信号可用于生成重构信号或用于生成残差信号。
变换器232可以通过将变换技术应用于残差信号来生成变换系数。例如,变换技术可以包括以下中的至少一个:离散余弦变换(DCT)、离散正弦变换(DST)、基于图形的变换(GBT)或条件非线性变换(CNT)。这里,当像素之间的关系信息被图示为图形时,GBT意指从图形获取的变换。CNT意指基于通过使用所有先前重构的像素生成的预测信号而获取的变换。另外,变换处理还可以应用于具有相同大小的正方形的像素块,或者还可以应用于不是正方形的可变大小的块。
量化器233量化变换系数并且将量化的变换系数发送到熵编码器240,并且熵编码器240编码量化的信号(关于量化的变换系数的信息)并且输出编码的信号作为比特流。关于量化的变换系数的信息可以被称为残差信息。量化器233可以基于系数扫描顺序以一维向量形式重新排列具有块形式的量化的变换系数,并且还基于一维向量形式的量化的变换系数来生成关于量化的变换系数的信息。
熵编码器240可以执行诸如例如指数Golomb、上下文自适应可变长度编译(CAVLC)、和上下文自适应二进制算术编译(CABAC)等的各种编码方法。熵编码器240还可以一起或单独地对除了量化的变换系数之外的视频/图像重构所必需的信息(例如,语法元素的值等)进行编码。编码的信息(例如,编码的视频/图像信息)可以比特流的形式以网络抽象层(NAL)为单位被发送或存储。视频/图像信息还可以包括关于各种参数集的信息,例如适配参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)。另外,视频/图像信息还可以包括一般约束信息。在该文档中,可以在视频/图像信息中包括从编码设备用信号通知/发送到解码设备的信息和/或语法元素。视频/图像信息可以通过前述编码过程来编码并且因此包括在比特流中。比特流可以通过网络被发送或者可以被存储在数字存储介质中。这里,网络可以包括广播网络和/或通信网络,并且数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。用于发送从熵编码器240输出的信号的发送单元(未示出)和/或用于存储该信号的存储单元(未示出)可以被配置为编码设备200的内部/外部元件,或者发送单元也可以被包括在熵编码器240中。
从量化器233输出的量化的变换系数可以用于生成预测信号。例如,可以通过解量化器234和逆变换单元235将解量化和逆变换应用于量化的变换系数来重构残差信号(残差块或残差样本)。加法器250可以将重构的残差信号与从帧间预测器221或帧内预测器222输出的预测信号相加,以生成重构信号(重构图片、重构块、重构样本阵列)。诸如在应用跳过模式时,当针对处理目标块不存在残差时,预测块可用作重构块。加法器250可以被称为恢复器或恢复块生成器。所生成的重构信号可以用于当前图片内的下一个处理目标块的帧内预测,并且,还可以在滤波之后用于下一图片的帧间预测,如下所述。
同时,也可以在图片编码和/或重构处理期间应用亮度映射与色度缩放(LMCS)。
滤波器260可以通过对重构信号应用滤波来改进主观/客观图像质量。例如,滤波器260可以通过对重构图片应用各种滤波方法来生成修改的重构图片并将修改的重构图片存储在存储器270(具体地,存储器270的DPB)中。例如,各种滤波方法可以包括去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。滤波器260可以生成与滤波有关的各种类型的信息并且将所生成的信息传送到熵编码器240,如在各个滤波方法的描述中稍后描述的。与滤波有关的信息可以由熵编码器240编码并以比特流的形式输出。
发送到存储器270的修改的重构图片可用作帧间预测器221中的参考图片。当通过编码设备应用帧间预测时,可避免编码设备200与解码设备之间的预测失配并且可以改善编译效率。
存储器270的DPB可以存储修正后的重构图片,以用作帧间预测器221中的参考图片。存储器270可以存储从其推导出(或编码)当前图片中的运动信息的块的运动信息和/或已经重构的图片中的块的运动信息。所存储的运动信息可以被传送到帧间预测器221,以被用作空间邻近块的运动信息或时间邻近块的运动信息。存储器270可以存储当前图片中的重构块的重构样本,并可以将重构样本传送到帧内预测器222。
图3是用于示意性地解释可应用本公开的实施例的视频/图像解码设备的配置的图。
参照图3,解码设备300可包括熵解码器310、残差处理器320、预测器330、加法器340、滤波器350和存储器360。预测器330可包括帧间预测器331和帧内预测器332。残差处理器320可包括解量化器321和逆变换器321。根据实施方式,熵解码310、残差处理器320、预测器330、加法器340和滤波器350可由硬件部件(例如,解码器芯片组或处理器)配置。另外,存储器360可包括解码图片缓冲器(DPB)或者可由数字存储介质配置。硬件部件还可包括存储器360作为内部/外部部件。
当输入包括视频/图像信息的比特流时,解码设备300可重构与在图2的编码设备中处理视频/图像信息的处理对应的图像。例如,解码设备300可基于从比特流获得的块分区相关信息来推导单元/块。解码设备300可使用编码设备中应用的处理单元来执行解码。因此,例如,解码的处理单元可以是编译单元,并且编译单元可根据四叉树结构、二叉树结构和/或三叉树结构从编译树单元或最大编译单元分割。可从编译单元推导一个或更多个变换单元。通过解码设备300解码和输出的重构图像信号可通过再现设备再现。
解码设备300可以接收以比特流的形式从图2的编码设备输出的信号,并且可以通过熵解码器310对接收的信号进行解码。例如,熵解码器310可以解析比特流来推导图像重构(或图片重构)所需的信息(例如,视频/图像信息)。视频/图像信息还可以包括关于各种参数集的信息,例如适配参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)。另外,视频/图像信息还可以包括一般约束信息。解码设备还可以基于关于参数集和/或一般约束信息的信息来解码图片。稍后将在本文档中描述的用信号通知/接收的信息和/或语法元素可以通过解码过程解码且从比特流获取。例如,熵解码器310可以基于诸如指数Golomb编译、上下文自适应可变长度编译(CAVLC)、或上下文自适应二进制算术编译(CABAC)的编译方法解码比特流内的信息,并且输出图像重构所需的语法元素和用于残差的变换系数的量化值。更具体地,CABAC熵解码方法可以接收与比特流中的每个语法元素相对应的bin,通过使用解码目标语法元素信息、解码目标块的解码信息或者在先前阶段中解码的符号/bin的信息来确定上下文模型,并且通过根据所确定的上下文模型预测出现bin的概率来对bin执行算术解码,并且生成与每个语法元素的值相对应的符号。在这种情况下,CABAC熵解码方法可以在确定上下文模型之后通过将解码的符号/bin的信息用于下一符号/bin的上下文模型来更新上下文模型。由熵解码器310所解码的信息当中与预测有关的信息可以被提供给预测器(帧间预测器332和帧内预测器331),并且在熵解码器310已经执行熵解码的残差值(即,量化的变换系数和相关参数信息)可以被输入到残差处理器320。
残差处理器320可以推导残差信号(残差块、残差样本、残差样本阵列)。另外,由熵解码器310解码的信息当中关于滤波的信息可以被提供给滤波器350。同时,用于接收从编码设备输出的信号的接收器(未示出)还可以被配置成解码设备300的内部/外部元件,或者接收器可以是熵解码器310的组件。同时,根据该文档的解码设备可以被称为视频/图像/图片解码设备,并且解码设备可以被分类为信息解码器(视频/图像/图片信息解码器)和样本解码器(视频/图像/图片样本解码器)。信息解码器可以包括熵解码器310,并且样本解码器可以包括以下中的至少一个:解量化器321、逆变换器322、加法器340、滤波器350、存储器360、帧间预测器332和帧内预测器331。
解量化器321可将量化后的变换系数解量化并输出变换系数。解量化器321可按二维块形式重排量化后的变换系数。在这种情况下,可基于在编码设备中执行的系数扫描顺序来执行重排。解量化器321可使用量化参数(例如,量化步长信息)对量化后的变换系数执行解量化并且获得变换系数。
逆变换器322对变换系数逆变换以获得残差信号(残差块、残差样本阵列)。
预测器330可以对当前块执行预测并生成包括当前块的预测样本的预测块。预测器可以基于从熵解码器310输出的关于预测的信息来确定对当前块应用帧内预测还是帧间预测并且确定特定帧内/帧间预测模式。
预测器330可以基于下述各种预测方法来生成预测信号。例如,预测器可以应用帧内预测或帧间预测以用于预测一个块,而且可以同时应用帧内预测和帧间预测。这可以被称为组合帧间和帧内预测(CIIP)。另外,预测器可以基于帧内块复制(IBC)预测模式或调色板模式来预测块。IBC预测模式或调色板模式可用于游戏等的内容的图像/视频编译,例如屏幕内容编译(SCC)。IBC可以基本上执行当前图片中的预测,但是可以与帧间预测相似地执行,使得在当前图片内推导参考块。即,IBC可以使用该文档中描述的至少一种帧间预测技术。调色板模式可以被视为帧内编译或帧内预测的示例。当应用调色板模式时,关于调色板表和调色板索引的信息可以包括在视频/图像信息中并且用信号通知。
帧内预测器331可以通过参考当前图片中的样本来预测当前块。根据预测模式,所参考的样本可位于当前块附近或者可以与当前块隔开。在帧内预测中,预测模式可以包括多个非定向模式和多个定向模式。帧内预测器331可以通过使用应用于相邻块的预测模式来确定应用于当前块的预测模式。
帧间预测器332可以基于参考图片上由运动向量指定的参考块(参考样本阵列)来推导当前块的预测块。在这种情况下,为了减少在帧间预测模式下发送的运动信息量,可以基于相邻块与当前块之间的运动信息的相关性以块、子块或样本为单位预测运动信息。运动信息可以包括运动向量和参考图片索引。运动信息还可以包括关于帧间预测方向(L0预测、L1预测、Bi预测等)的信息。在帧间预测的情况下,相邻块可以包括存在于当前图片中的空间相邻块和存在于参考图片中的时间相邻块。例如,帧间预测器332可以基于相邻块来构造运动信息候选列表并且基于所接收的候选选择信息来推导当前块的运动向量和/或参考图片索引。可以基于各种预测模式来执行帧间预测,并且关于预测的信息可以包括指示用于当前块的帧间预测模式的信息。
加法器340可以通过将所获取的残差信号与从预测器(包括帧间预测器332和/或帧内预测器331)输出的预测信号(预测块、预测样本阵列)相加来生成重构信号(重构图片、重构块、重构样本阵列)。如果针对处理目标块不存在残差,例如应用跳过模式的情况,预测块可用作重构块。
加法器340可以被称为重构器或重构块生成器。所生成的重构信号可以用于在当前图片中将处理的下一个块的帧内预测,并且如随后描述的,还可以通过滤波来输出或者还可以用于下一个图片的帧间预测。
此外,具有色度缩放的亮度映射(LMCS)还可以被应用于图片解码处理。
滤波器350可以通过向重构信号应用滤波来改善主观/客观图像质量。例如,滤波器350可以通过向重构图片应用各种滤波方法来生成修正后的重构图片,并将修正后的重构图片存储在存储器360中,具体地,存储在存储器360的DPB中。各种滤波方法可以包括例如解块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。
存储在存储器360的DPB中的(修改的)重构图片可以用作帧间预测器332中的参考图片。存储器360可以存储从其中推导(解码)当前图片内的运动信息的块的运动信息和/或已经重构的图片内的块的运动信息。存储的运动信息可以被传送到帧间预测器260,以用作空间相邻块的运动信息或时间相邻块的运动信息。存储器360可以存储当前图片内的重构块的重构样本,并且将所重构样本传送到帧内预测器331。
在本说明书中,在编码设备200的滤波器260、帧间预测器221和帧内预测器222中描述的实施例可以被同等地应用于或分别对应于滤波器350、帧间预测器332和帧内预测器331。
此外,如上所述,在执行视频编译时,执行预测以增强压缩效率。通过这样,可生成包括要被编译的当前块(即,编译目标编)的预测样本的预测块。在这种情况下,预测块包括空间域(或像素域)中的预测样本。预测块在编码设备和解码设备中相同地推导,并且编码设备可通过用信号向解码设备通知关于原始块(而非原始块的原始样本值本身)与预测块之间的残差的信息(残差信息)来增强图像编译效率。解码设备可基于残差信息来推导包括残差样本的残差块,可通过将残差块和预测块相加来生成包括重构样本的重构块,并且可生成包括重构块的重构图片。
残差信息可通过变换过程和量化过程来生成。例如,编码设备可推导原始块与预测块之间的残差块,可通过对包括在残差块中的残差样本(残差样本数组)执行变换过程来推导变换系数,可通过对变换系数执行量化过程来推导量化后的变换系数,并且可将相关残差信息(通过比特流)用信号通知给解码设备。在这种情况下,残差信息可包括量化后的变换系数、位置信息、变换方案、变换核和量化参数等的值信息。解码设备可基于残差信息来执行反量化/逆变换过程并且可推导残差样本(或残差块)。解码设备可基于预测块和残差块来生成重构图片。此外,为了后续图片的帧间预测参考,编码设备可通过对量化后的变换系数进行反量化/逆变换来推导残差块,并且可基于此来生成重构图片。
在帧间预测被应用于当前块的情况下,编码设备/解码设备的预测器能够以块为单位执行帧间预测并且推导预测样本。帧间预测可以是以依赖于除当前图片之外的图片的数据元素(例如,样本值或运动信息)的方式所推导的预测。在帧间预测应用于当前块的情况下,可以基于由参考图片索引所指示的参考图片上的运动向量所指定的参考块(参考样本阵列)来推导当前块的预测块(预测样本阵列)。此时,为了减少在帧间预测模式发送的运动信息的量,可以基于相邻块和当前块之间的运动信息的相关性以块、子块或样本为单位预测当前块的运动信息。运动信息可以包括运动向量和参考图片索引。运动信息还可以包括帧间预测类型(L0预测、L1预测、Bi预测等)信息。在应用帧间预测的情况下,相邻块可以包括存在于当前图片中的空间相邻块和存在于参考图片中的时间相邻块。包括参考块的参考图片和包括时间相邻块的参考图片可以彼此相等或不同。时间相邻块可以被称为并置参考块或并置CU(colCU),且包括时间相邻块的参考图片可以被称为并置图片(colPic)。例如,可以基于当前块的相邻块来配置运动信息候选列表,并且可以用信号通知标志或索引信息,该标志或索引信息指示选择(使用)哪个候选以便于推导当前块的运动向量和/或参考图片索引。可以基于各种预测模式来执行帧间预测,例如,在跳过模式和(正常)合并模式的情况下,当前块的运动信息可以与所选择的相邻块的运动信息相同。在跳过模式的情况下,与合并模式不同,可以不发送残差信号。在运动向量预测(MVP)模式的情况下,所选相邻块的运动向量可用作运动向量预测器,且可用信号通知运动向量差。在这种情况下,可以使用运动向量预测值与运动向量差的和来推导当前块的运动向量。
基于帧间预测的视频/图像编码过程可以示意性地包括例如以下过程。
图4示出基于帧间预测的视频/图像编码方法的示例。
编码设备对当前块执行帧间预测(S400)。编码设备可以推导当前块的帧间预测模式和运动信息,并生成当前块的预测样本。这里,确定帧间预测模式、推导运动信息和生成预测样本的过程可以同时被执行,或者一个过程接一个过程地被执行。例如,编码设备的帧间预测器221可以包括预测模式确定器、运动信息推导器和预测样本推导器,预测模式确定器可以确定用于当前块的预测模式,并且运动信息推导器可以推导当前块的运动信息,并且预测样本推导器可以推导当前块的预测样本。例如,编码设备的帧间预测器可以通过运动估计在参考图片的特定区域(搜索区域)中搜索与当前块类似的块,并且推导其与当前块的差最小或是小于或等于预定参考的参考块。基于此,可以推导指示参考块所在的参考图片的参考图片索引,并且可以基于参考块和当前块之间的位置差来推导运动向量。编码设备可以从各种预测模式当中确定应用于当前块的模式。编码设备可以比较各种预测模式的速率失真(RD)成本,并且确定用于当前块的最佳预测模式。
例如,在跳过模式或合并模式被应用于当前块的情况下,编码设备可构造稍后描述的合并候选列表,并且推导在由合并候选列表中包括的合并候选指示的参考块当中与当前块的差最小或小于或等于预定参考的参考块。在此情况下,可以选择与所推导的参考块相关联的合并候选,并且可以生成指示所选合并候选的合并索引信息并将其用信号通知给解码设备。可以使用所选合并候选的运动信息推导当前块的运动信息。
作为另一示例,在(A)MVP模式应用于当前块的情况下,编码设备可构造稍后描述的(A)MVP候选列表,并且使用从包括在(A)MVP候选列表中的运动向量预测器(MVP)候选中选择的MVP候选的运动向量作为当前块的MVP。在这种情况下,例如,指示通过上述运动估计推导的参考块的运动向量可以用作当前块的运动向量,并且在MVP候选当中具有与当前块的运动向量具有最小差值的运动向量的MVP候选可以成为所选MVP候选。可以推导运动向量差(MVD),其是通过从当前块的运动向量中减去MVP而获得的差值。在这种情况下,可将关于MVD的信息用信号通知给解码设备。此外,在应用(A)MVP模式的情况下,参考图像索引值可以被配置为参考图像索引信息,并且可以被单独地用信号通知给解码设备。
编码设备可以基于预测样本来推导残差样本(S410)。编码设备可以通过将当前块的原始样本与预测样本进行比较来推导残差样本。
编码设备对包括预测信息和残差信息的图像信息进行编码。编码设备能够以比特流的形式输出编码图像信息。预测信息可以包括关于预测模式信息(例如,跳过标志、合并标志或模式索引)和运动信息的信息作为与预测过程相关的信息。关于运动信息的信息可以包括作为用于推导运动向量的信息的候选选择信息(例如,合并索引、mvp标志或mvp索引)。此外,关于运动信息的信息可以包括上述MVD信息和/或参考图片索引信息。此外,关于运动信息的信息可以包括指示是否应用L0预测、L1预测或双预测的信息。残差信息是关于残差样本的信息。残差信息可以包括关于用于残差样本的量化的变换系数的信息。
输出比特流可以存储在(数字)存储介质中并且被发送到解码设备或者可以通过网络被发送到解码设备。
同时,如上所述,编码设备可以基于参考样本和残差样本生成重构图片(包括重构样本和重构块)。这是因为编码设备可以推导与解码设备执行的预测结果相同的预测结果,并且通过这样,可以提高编译效率。因此,编码设备可以将重构图片(或重构样本或重构块)存储在存储器中,并且使用重构图片作为用于帧间预测的参考图片。如上所述,环内滤波过程还可以应用于重构图片。
基于帧间预测的视频/图像解码过程可以示意性地包括例如以下过程。
图5示出基于帧间预测的视频/图像解码方法的示例。
参照图5,解码设备可以执行与由编码设备执行的操作相对应的操作。解码设备可以基于接收到的预测信息对当前块执行预测,并且推导预测样本。
具体地,解码设备可以基于接收到的预测信息来推导用于当前块的预测模式(S500)。解码设备可以基于预测信息中的预测模式信息来确定将哪个帧间预测模式应用于当前块。
例如,基于合并标志,可以确定合并模式是否应用于当前块或者(A)MVP模式是否被确定。可替选地,可以基于模式索引选择各种帧间预测模式候选中的一个。帧间预测模式候选可以包括跳过模式、合并模式和/或(A)MVP模式,或者可以包括稍后描述的各种帧间预测模式。
解码设备基于确定的帧间预测模式来推导当前块的运动信息(S510)。例如,在跳过模式或合并模式被应用于当前块的情况下,解码设备可以构造稍后描述的合并候选列表,并且从合并候选列表中包括的合并候选中选择一个合并候选。该选择可以基于上述选择信息(合并索引)来执行。可以使用所选合并候选的运动信息来推导当前块的运动信息。所选合并候选的运动信息可以用作当前块的运动信息。
作为另一示例,当(A)MVP模式应用于当前块时,解码设备可以构造稍后描述的(A)MVP候选列表,并且使用从包括在(A)MVP候选列表中的运动向量预测器(MVP)候选中选择的MVP候选的运动向量作为当前块的MVP。该选择可以基于上述选择信息(MVP标志或MVP索引)来执行。在这种情况下,可以基于关于MVD的信息来推导当前块的MVD,并且可以基于当前块的MVP和MVD来推导当前块的运动向量。此外,可以基于参考图像索引信息来推导当前块的参考图像索引。由当前块的参考图片列表中的参考图片索引所指示的图片可以被推导为参考图片,该参考图片被参考以用于当前块的帧间预测。
同时,如稍后所述,可以在不配置候选列表的情况下推导当前块的运动信息。在这种情况下,可以根据稍后描述的预测模式中公开的过程来推导当前块的运动信息。在这种情况下,可以省略如上所述的候选列表的配置。
解码设备可以基于当前块的运动信息来生成用于当前块的预测样本(S520)。在这种情况下,可以基于当前块的参考图像索引来推导参考图片,并且可以使用由参考图片上由当前块的运动向量指示的参考块的样本来推导当前块的预测样本。在这种情况下,如稍后描述的,可以在一些情况下对当前块的全部或部分预测样本进一步执行预测样本滤波过程。
例如,解码设备的帧间预测器可以包括预测模式确定器、运动信息推导器和预测样本推导器。预测模式确定器可以基于接收到的预测模式信息来确定用于当前块的预测模式,运动信息推导器可以基于关于接收到的运动信息的信息来推导当前块的运动信息(运动向量和/或参考图片索引等),并且预测样本推导起可以推导当前块的预测样本。
解码设备基于接收到的残差信息来生成用于当前块的残差样本(S530)。解码设备可以基于预测样本和残差样本来生成用于当前块的重构样本,并且基于此来生成重构图片(S540)。此后,如上所述,可以进一步将环内滤波过程应用到重构图片。
图6示例性地示出帧间预测过程
参照图6,如上所述,帧间预测过程可以包括确定帧间预测模式、根据所确定的预测模式来推导运动信息、以及基于所推导的运动信息执行预测(生成预测样本)。如上所述,帧间预测过程可以由编码设备和解码设备执行。在该文档中,编译设备可以包括编码设备和/或解码设备。
参照图6,编译设备确定用于当前块的帧间预测模式(S600)。各种帧间预测模式可以用于预测图片内的当前块。例如,可以使用各种模式,诸如合并模式、跳过模式、运动向量预测(MVP)模式、仿射模式、子块合并模式、与MVD合并(MMVD)模式以及历史运动向量预测(HMVP)模式等。解码器侧运动向量细化(DMVR)模式、自适应运动向量分辨率(AMVR)模式、具有CU级权重的双预测(BCW)和双向光流(BDOF)可进一步使用或替代地用作附带模式。仿射模式可以称为仿射运动预测模式。MVP模式可以称为高级运动向量预测(AMVP)模式。在该文档中,可以将一些模式和/或由一些模式推导的运动信息候选包括为与其他模式的运动信息相关的候选之一。例如,HMVP候选可以被添加为合并/跳过模式的合并候选,或者可以被添加为MVP模式的MVP候选。
可以从编码设备向解码设备发信号通知指示当前块的帧间预测模式的预测模式信息。预测模式信息可以被包括在比特流中并且在解码设备处被接收。预测模式信息可以包括指示多种候选模式中的一种的索引信息。另外,可以通过标志信息的分级信令来指示帧间预测模式。在这种情况下,预测模式信息可以包括一个或更多个标志。例如,可以通过发信号通知跳过标志来指示是否应用跳变模式;对于未应用跳过模式可以通过发信号通知合并标志来指示是否应用合并模式;并且当不应用合并模式时可以指示应用MVP模式或者还可以发信号通知用于进一步分割的标志。仿射模式可以作为独立模式被发信号通知,或者可以作为取决于合并模式、MVP模式等的模式被发信号通知。例如,仿射模式可以包括仿射合并模式和仿射MVP模式。
同时,指示上述列表0(L0)预测、列表1(L1)预测或双预测是否用于当前块(当前编译单元)的信息可用信号通知给当前块。该信息可以被称为运动预测方向信息、帧间预测方向信息或帧间预测指示信息,并且能够以例如inter_pred_idc语法元素的形式来构造/编码/用信号通知。也就是说,inter_pred_idc语法元素可以指示上述列表0(L0)预测、列表1(L1)预测或双预测是否用于当前块(当前编译单元)。在该文档中,为了便于解释,由inter_pred_idc语法元素指示的帧间预测类型(L0预测、L1预测或BI预测)可以被表示为运动预测方向。L0预测可以由pred_L0表示;L1预测可以由pred_L1表示;并且双预测可以由pred_BI表示。例如,以下预测类型可以根据inter_pred_idc语法元素的值来指示。
如上所述,一个图片可以包括一个或多个切片。切片可具有包括帧内(I)切片、预测性(P)切片及双预测性(B)切片的切片类型中的一个。可以基于切片类型信息来指示切片类型。针对I切片中的块,帧间预测不用于预测,仅可以使用帧内预测。当然,即使在这种情况下,原始样本值也可以被编译和用信号通知而不进行预测。对于P切片中的块,可以使用帧内预测或帧间预测,并且在使用帧间预测的情况下,可以仅使用单向预测。同时,对于B切片中的块,可以使用帧内预测或帧间预测,并且在使用帧间预测的情况下,可以使用直至最大双预测。
L0和L1可以包括在当前图片之前被编码/解码的参考图片。例如,L0可以包括按POC顺序在当前图片之前和/或之后的参考图片,并且L1可以包括按POC顺序在当前图片之后和/或之前的参考图片。在这种情况下,相对于按POC顺序早于当前图片的参考图片较低的参考图片索引可以被分配给L0,并且相对于按POC顺序晚于当前图片的参考图片较低的参考图片索引可以被分配给L1。在B切片的情况下,可以应用双向预测,并且在这种情况下,可以应用单向的双向预测,或者可以应用双向的双向预测。双向的双向预测可以被称为真实双向预测。
具体地,例如,关于当前块的帧间预测模式的信息能够以CU(CU语法)级等被编译和发信号通知,或者可以根据条件来隐式地确定。在这种情况下,一些模式可以被显式地发信号通知,而其他模式可以被隐式地推导。
例如,CU语法可携载关于如下表1中的(帧间)预测模式的信息等。
[表1]
Figure BDA0003510419890000251
Figure BDA0003510419890000252
Figure BDA0003510419890000253
Figure BDA0003510419890000261
Figure BDA0003510419890000262
Figure BDA0003510419890000263
Figure BDA0003510419890000271
Figure BDA0003510419890000272
Figure BDA0003510419890000273
Figure BDA0003510419890000281
Figure BDA0003510419890000282
Figure BDA0003510419890000283
Figure BDA0003510419890000291
这里,cu_skip_flag可以指示跳过模式是否应用于当前块(CU)。
pred_mode_flag等于0指定以帧间预测模式编译当前编译单元。pred_mode_flag等于1指定以帧内预测模式编译当前编译单元。
pred_mode_ibc_flag等于1指定以IBC预测模式编译当前编译单元。pred_mode_ibc_flag等于0指定不以IBC预测模式编译当前编译单元。
pcm_flag[x0][y0]等于1指定在位置(x0,y0)处包括亮度编译块的编译单元中存在pcm_sample()语法结构并且不存在transform_tree()语法结构。pcm_flag[x0][y0]等于0指定不存在pcm_sample()语法结构。也就是说,pcm_flag可以表示是否将脉冲编译调制(PCM)模式应用于当前块。如果将PCM模式应用于当前块,则可不应用预测、变换和量化等,并且可编译和用信号通知当前块中的原始样本值。
intra_mip_flag[x0][y0]等于1指定亮度样本的帧内预测类型是基于矩阵的帧内预测(MIP)。intra_mip_flag[x0][y0]等于0指定亮度样本的帧内预测类型不是基于矩阵的帧内预测。也就是说,intra_mip_flag可以表示MIP预测模式(类型)是否应用于当前块(的亮度样本)。
intra_chroma_pred_mode[x0][y0]指定当前块中的色度样本的帧内预测模式。
general_merge_flag[x0][y0]指定是否从相邻帧间预测分区推断当前编译单元的帧间预测参数。即,general_merge_flag可以表示一般合并可用,并且当general_merge_flag值为1时,常规合并模式、MMVD模式和合并子块模式(子块合并模式)可以是可用的。例如,当general_merge_flag值为1时,可以从编码视频/图像信息(或比特流)解析合并数据语法,并且合并数据语法被配置/编译为包括如以下表2中表示的信息。
[表2]
Figure BDA0003510419890000301
Figure BDA0003510419890000302
Figure BDA0003510419890000311
这里,regular_merge_flag[x0][y0]等于1指定常规合并模式用于生成当前编译单元的帧间预测参数。也就是说,regular_merge_flag表示合并模式(常规合并模式)是否被应用于当前块。
mmvd_merge_flag[x0][y0]等于1指定使用具有运动向量差的合并模式来生成当前编译单元的帧间预测参数。也就是说,mmvd_merge_flag表示MMVD是否被应用于当前块。
mmvd_cand_flag[x0][y0]指定合并候选列表中的第一(0)或第二(1)候选是否与从mmvd_distance_idx[x0][y0]和mmvd_direction_idx[x0][y0]所推导的运动向量差一起使用。
mmvd_distance_idx[x0][y0]指定用于推导MmvdDistance[x0][y0]的索引。
mmvd_direction_idx[x0][y0]指定用于推导MmvdSign[x0][y0]的索引。
merge_sub_flag[x0][y0]指定用于当前编译的基于子块的帧间预测参数。即,merge_sub_flag可以表示子块合并模式(或仿射合并模式)是否应用于当前块。
merge_subblock_idx[x0][y0]指定基于子块的合并候选列表的合并候选索引。
ciip_flag[x0][y0]指定是否对当前编译单元应用组合的图像间合并和图像内预测。
merge_triagle_idx0[x0][y0]指定基于三角形形状的运动补偿候选列表的第一合并候选索引。
merge_triagle_idx1[x0][y0]指定基于三角形形状的运动补偿候选列表的第二合并候选索引。
merge_idx[x0][y0]指定合并候选列表的合并候选索引。
同时,返回参考表1的CU语法,mvp_l0_flag[x0][y0]指定列表0的运动向量预测索引,即,在应用MVP模式时,mvp_l0_flag可以表示从MVP候选列表0中针对当前块的MVP推导所选择的候选。
ref_idx_l1[x0][y0]具有与ref_idx_l0相同的语义,其中l0和列表0可以分别被l1和列表1代替。(ref_idx_l1[x0][y0]具有与ref_idx_L0相同的语义,其中l0、L0和列表0分别被l1、L1和列表1代替)。
inter_pred_idc[x0][y0]指定列表0、列表1或双预测是否用于当前编译单元。
sym_mvd_flag[x0][y0]等于1指定语法元素ref_idx_l0[x0][y0]和ref_idx_l1[x0][y0]以及用于等于1的refList的mvd_coding(x0,y0,refList,cpdix)语法结构不存在。也就是说,sym_mvd_flag表示对称MVD是否用于mvd编译。
ref_idx_l0[x0][y0]指定用于当前编译单元的列表0参考图片索引。
ref_idx_l1[x0][y0]具有与ref_idx_l0相同的语义,其中l0、L0和列表0分别被l1、L1和列表1代替。
inter_affif_flag[x0][y0]等于1指定,对于当前编译单元,当解码P或B切片时,基于仿射模型的运动补偿被用于生成当前编译单元的预测样本。
cu_affif_type_flag[x0][y0]等于1指定,对于当前编译单元,当解码P或B切片时,基于6参数仿射模型的运动补偿用于生成当前编译单元的预测样本。cu_affif_type_flag[x0][y0]等于0指定基于4参数仿射模型的运动补偿用于生成当前编译单元的预测样本。
amvr_flag[x0][y0]指定运动向量差的分辨率。阵列索引x0、y0指定所考虑的编译块的左顶部亮度样本相对于图片的左顶部亮度样本的位置(x0,y0)。amvr_flag[x0][y0]等于0指定运动向量差的分辨率为亮度样本的1/4。amvr_flag[x0][y0]等于1指定运动向量差的分辨率进一步由amvr_precision_flag[x0][y0]指定。
如果inter_affice_flag[x0][y0]等于0,则amvr_precision_flag[x0][y0]等于0指定运动向量差的分辨率为一个整数亮度样本,否则为1/16的亮度样本。如果inter_affice_flag[x0][y0]等于0,则amvr_precision_flag[x0][y0]等于1指定运动向量差的分辨率为四个亮度样本,否则为一个整数亮度样本。阵列索引x0、y0指定所考虑的编译块的左顶部亮度样本相对于图片的左顶部亮度样本的位置(x0,y0)。
bcw_idx[x0][y0]指定具有CU权重的双预测的权重索引。
当确定用于当前块的(帧间)预测模式时,编译设备基于预测模式来推导用于当前块的运动信息(S610)。
编码设备可以使用当前块的运动信息执行帧间预测。编码设备可以通过运动估计过程来推导当前块的最佳运动信息。例如,编码设备可以通过使用关于当前块的原始图像中的原始块以分数像素为单位在参考图像中所确定的搜索范围内搜索具有高相关性的相似参考块,并且通过其推导运动信息。可以根据基于相位的样本值之间的差来推导块相似度。例如,可以基于当前块(或当前块的模板)与参考块(或参考块的模板)之间的SAD来计算块相似度。在此情况下,可以基于搜索区域中具有最小SAD的参考块来推导运动信息。可以基于帧间预测模式根据各种方法将所推导的运动信息用信号通知到解码设备。
当推导关于当前块的运动信息时,编译设备基于关于当前块的运动信息来执行帧间预测(S620)。编译设备可以基于运动信息来推导当前块的预测样本。包括预测样本的当前块可以被称为预测块。
可以基于所推导的预测样本来生成重构样本和重构图片,并且此后,可以执行环内滤波等的过程。
图7是图示可以用于帧间预测的合并模式和跳过模式的图。
在帧间预测期间应用合并模式的情况下,不直接发送当前块的运动信息,并且使用相邻预测块的运动信息来推导当前块的运动信息。因此,编码设备可以通过发送指示使用合并模式的标志信息和指示使用哪个相邻预测块的合并索引来指示当前块的运动信息。合并模式可以被称为常规合并模式。
为了执行合并模式,编译设备搜索用于推导当前块的运动信息的合并候选块。例如,可以使用直至5个合并候选块,但是本实施例不限于此。此外,可以在切片报头或拼块组报头中发送关于合并候选块的最大数目的信息,但是本实施例不限于此。在找到合并候选块之后,编译设备可以生成合并候选列表,并且可以选择合并候选块中的具有最小成本的合并候选块作为最终合并候选块。
该文档提供用于构建合并候选列表的合并候选块的各种实施例。
合并候选列表可以包括例如5个合并候选块。例如,可以使用4个空间合并候选和一个时间合并候选。作为特定实例,在空间合并候选的情况下,图7中示出的块A0、A1、B0、B1和B2可用作空间合并候选。以下,稍后将描述的空间合并候选或空间MVP候选可以被称为SMVP,并且稍后将描述的时间合并候选或时间MVP候选可以被称为TMVP
例如,可以基于以下过程来构造用于当前块的合并候选列表。
首先,编译设备(编码设备/解码设备)可以将通过搜索当前块的空间相邻块而推导的空间合并候选插入到合并候选列表中。例如,空间相邻块可以包括当前块的左下角相邻块A0、左相邻块A1、右上角相邻块B0、上相邻块B1和左上角相邻块B2。然而,这是示例,并且除了上述空间相邻块之外,诸如右相邻块、下相邻块、右下相邻块的附加相邻块可以进一步用作空间相邻块。编译设备可以通过基于优先级搜索空间相邻块来检测可用块,并且可将检测到的块的运动信息推导为空间合并候选。例如,编码设备和/或解码设备可按A1、B1、B0、A0和B2的顺序搜索图7中示出的5个块,并且顺序地对可用候选进行编索引来形成合并候选列表。
此外,编译设备可将通过搜索当前块的时间相邻块所推导的时间合并候选插入到合并候选列表中。时间相邻块可以放置在参考图片上,该参考图片是与当前块所放置的当前图片不同的图片。时间相邻块所放置的参考图片可以被称为并置图片或col图片。可以按照关于col图片上的当前块的共置块的右下角相邻块和右下中心块的顺序来搜索时间相邻块。
同时,编译设备可检查当前合并候选的数目是否小于最大合并候选的数目。最大合并候选的数目可为预定义的,或可以从编码设备用信号通知给解码设备。例如,编码设备可以生成关于最大合并候选的数量的信息,对该信息进行编码,并将编码的信息以比特流的形式发送到解码设备。当最大合并候选的数目被填满时,可以不执行后续候选添加处理。
当作为检查的结果当前合并候选的数目小于最大合并候选的数目时,编译设备可以将附加合并候选插入到合并候选列表中。例如,附加合并候选可以包括基于历史的合并候选、成对平均合并候选、ATMVP、组合的双预测合并候选(在当前切片/拼块组的切片/拼块组类型为B类型时)和/或零向量合并候选。
如果作为检查的结果,当前合并候选的数目不小于最大合并候选的数目,则编译设备可以结束合并候选列表的构造。在这种情况下,编码设备可以基于速率失真(RD)成本从构成合并候选列表的合并候选中选择最佳合并候选,并且可将指示所选合并候选的选择信息(例如,合并索引)用信号通知给解码设备。解码设备可以基于合并候选列表和选择信息来选择最佳合并候选。
如上所述,选择的合并候选的运动信息可以用作当前块的运动信息,并且当前块的预测样本可以基于当前块的运动信息来推导。编码设备可以基于预测样本来推导当前块的残差样本,并且可以将关于残差样本的残差信息用信号通知到解码设备。如上所述,解码设备可以基于根据残差信息所推导的残差样本和预测样本来生成重构样本,并且基于此来生成重构图片。
当在帧间预测期间应用跳过模式时,能够以与如上所述当应用合并模式时相同的方式来推导当前块的运动信息。然而,当应用跳过模式时,省略相应块的残差信号,因此可以将预测样本直接用作重构样本。
图8是图示具有可以在帧间预测中使用的运动向量差的合并模式的图。
除了合并模式(其中隐式推导的运动信息直接用于当前CU的预测样本生成),在VVC中引入具有运动向量差的合并模式(MMVD)。因为类似运动信息推导方法用于跳过模式和合并模式,所以MMVD可以被应用于跳过模式。MMVD标志(例如MMVD_flag)可在发送跳过标志和合并标志之后立即用信号通知,以指定MMVD模式是否用于CU。
在MMVD中,在选择合并候选之后,通过用信号通知的MVD信息来进一步细化合并候选。当MMVD被应用于当前块时(即当MMVD_flag等于1时),可以用信号通知MMVD的进一步信息。
进一步的信息包括合并候选标志(例如mmvd_merge_flag)、指定运动幅度的索引(例如mmvd_distance_idx)和用于指示运动方向的索引(例如mmvd_direction_idx),合并候选标志指示合并候选列表中的第一候选(0)或者第二候选(1)是否与运动向量差一起使用。在MMVD模式中,合并列表中前两个候选中的一个被选择用作MV基础。用信号通知合并候选标志以指定使用哪一个。
距离索引指定运动幅度信息并且指示从起始点的预定义偏移。
如图8所示,将偏移添加到起始MV的水平分量或垂直分量。距离索引和预定义偏移的关系在表3中指定。
[表3]
Figure BDA0003510419890000381
这里,slice_fpel_mmvd_enabled_flag等于1指定具有运动向量差的合并模式使用当前切片中的整数样本精度。slice_fpel_mmvd_enabled_flag等于0指定具有运动向量差的合并模式可以使用当前切片中的分数样本精度。当不存在时,slice_fpel_mmvd_enabled_flag的值推断为0。slice_fpel_mmvd_enabled_flag语法元素可以通过切片报头用信号通知(可以包括在其中)。
方向索引表示MVD相对于起始点的方向。方向索引可以表示如表4所示的四个方向。注意的是,MVD符号的意义可以根据起始MV的信息而变化。当该起始MV是其中两个列表皆指向当前图片的同一侧的非预测MV或双预测MV(即,两个参考的POC都大于当前图片的POC,或都小于当前图片的POC)时,表4中的符号指定添加至该起始MV的MV偏移的符号。当起始MV是其中两个列表指向当前图片的同一侧的非预测MV或双预测MV(即,两个参考的POC都大于当前图片的POC,或都小于当前图片的POC)时,表4中的符号指定添加到起始MV的MV偏移的符号。
[表4]
mmvd_direction_idx[x0][y0] MmvdSign[x0][y0][0] MmvdSign[x0][y0][1]
0 +1 0
1 -1 0
2 0 +1
3 0 -1
合并的两个分量加上MVD偏移MmvdOffset[x0][y0]如下推导。
[等式1]
MmvdOffset[x0][y0][0]=(MmvdDistance[x0][y0]<<2)*MmvdSign[×0][y0][0]
MmvdOffset[x0][y0][1]=(MmvdDistance[x0][y0]<<2)*MmvdSign[x0][y0][1]
图9和图10是解释可以在帧间预测期间使用的基于子块的时间运动向量预测处理的图。
基于子块的时间运动向量预测(SbTMVP)方法可以用于帧间预测。类似于时间运动向量预测(TMVP),SbTMVP使用并置图片中的运动场来改进当前图片中的CU的运动向量预测和合并模式。TMVP所使用的相同并置图像用于SbTVMP。SbTMVP与TMVP的区别在于以下两个主要方面。
1.TMVP预测CU级别的运动,但SbTMVP预测子CU级别的运动。
2.TMVP从并置图片中的并置块提取时间运动向量(并置块是相对于当前CU的右下或中心(右下中心)块),而SbTMVP在从并置图片提取时间运动信息之前应用运动移位,其中运动移位是从来自当前CU的空间相邻块中的一个的运动向量获得。
图9和图10示出SbTVMP处理。SbTMVP以两个步骤来预测当前CU内的子CU的运动向量。在第一步骤中,检查图9中的空间相邻A1。如果A1具有使用并置图片作为其参考图片的运动向量被识别,则该运动向量(可以被称为时间MV(tempVM))被选择为要应用的运动移位。如果没有识别出这样的运动,则运动移位被设置为(0,0)。
在第二步骤中,应用(即,添加到当前块的坐标上)在步骤1中识别的运动移位,以从如图10所示的并置图片获得子CU级别运动信息(运动向量和参考索引)。图10中的示例假设运动移位被设置为块A1的运动。接着,对于每个子CU,使用其在并置图片中的对应块(覆盖中心样本的最小运动栅格)的运动信息来推导用于子CU的运动信息。当子块具有均匀的长度、宽度和高度时,中心样本(右下中心样本)可以对应于子CU中的4个中心样本之中的右下样本。
在识别并置子CU的运动信息之后,以与TMVP处理类似的方式将其转换为当前子CU的运动向量和参考索引,其中可应用时间运动缩放以将时间运动向量的参考图片与当前CU的参考图片对准。
包含SbTVMP候选和仿射合并候选二者的组合的基于子块的合并列表可以用于仿射合并模式(可以被称为(基于)子块的合并模式)的信号通知。SbTVMP模式由序列参数集(SPS)标志启用/禁用。如果启用SbTMVP模式,则添加SbTMVP预测器作为子块合并候选列表的第一条目,并且其后跟随仿射合并候选。仿射合并候选列表的最大允许大小可以为5。
在SbTMVP中使用的子CU大小可以固定为8×8,并且如针对仿射合并模式所做的,SbTMVP模式可以仅应用于宽度及高度这两者均大于或等于8的CU。
附加SbTMVP合并候选的编码逻辑与其他合并候选的编码逻辑相同,也就是说,对于P或B切片中的每一CU,可以执行附加RD检查以决定是否使用SbTMVP候选。
图11是图示可以应用于帧间预测的分区模式的图。
三角形分区模式可用于帧间预测。三角形分区模式可仅应用于8x8或更大的CU。在其他合并模式包括常规合并模式、MMVD模式、CIIP模式和子块合并模式的情况下,使用CU级别标志作为一种合并模式来用信号通知三角形分区模式。
当使用此模式时,可以使用对角划分或反对角划分将CU均匀地分割成两个三角形分区,如图11中所示。CU中的每个三角形分区是使用其自身的运动来帧间预测的;对于每个分区仅允许单预测,即,每个分区具有一个运动向量和一个参考索引。应用单预测运动约束以确保与常规双预测相同,对于每个CU仅需要两个运动补偿预测。
如果三角形分区模式用于当前CU,则进一步用信号通知指示三角形分区的方向(对角或反对角)的标志和两个合并索引(每个分区一个合并索引)。最大TPM候选大小的数量在切片级别被显式地用信号通知,并且指定TMP合并索引的语法二进制化。在预测三角形分区中的每个之后,使用具有自适应权重的混合处理来调整沿着对角线或反对角边的样本值。这是整个CU的预测信号,并且变换和量化处理将被应用于整个CU,如在其他预测模式中。最后,使用三角形分区模式预测的CU的运动场以4×4单元存储。三角形分区模式不与SBT组合使用,也就是说,当用信号通知的三角形模式等于1时,在不用信号通知的情况下将cu_SBT_flag推断为0。
从如上所述构造的合并候选列表直接推导单预测候选列表(uni-predictioncandidate list)。
在使用其自身运动来预测每个三角形分区之后,将混合应用于两个预测信号以推导对角线或反对角边周围的样本。
图12是图示可应用于帧间预测的CIIP模式的图。
组合的帧间和帧内预测可以应用于当前块。可用信号通知附加标志(例如CIIP_flag)以指示是否将组合帧间/帧内预测(CIIP)模式应用于当前CU。例如,当在合并模式中编译CU时,如果CU包括至少64个亮度样本(即,CU宽度乘以CU高度等于或大于64),并且如果CU宽度和CU高度这两者小于128个亮度样本,那么用信号通知附加标志以指示组合的帧间/帧内预测(CIIP)模式是否应用于当前CU。如其名称指示,CIIP预测将帧间预测信号与帧内预测信号组合。使用应用于常规合并模式的相同帧间预测处理来推导CIIP模式P_inter中的帧间预测信号;并且帧内预测信号P_intra利用平面模式在常规帧内预测处理之后被推导。然后,使用加权平均来组合帧内和帧间预测信号,其中如下根据(图12中描绘的)顶部相邻块和左相邻块的编码模式来计算权重值。
如果顶部邻居可用且被帧内编译,则将isIntrantop设置为1,否则将isIntrantop设置为0。
如果左邻居可用且被帧内编译,则将isIntraLeft设置为1,否则将isIntraLeft设置为0。
如果(isIntraLeft+isIntraLeft)等于2,则将wt设置为3。
否则,如果(isIntraLeft+isIntraLeft)等于1,则将wt设置为2。
否则,如果(isIntraLeft+isIntraLeft)等于1,则将wt设置为2。
CIIP预测被如下形成。
[等式2]
PCIIP=((4-wt)*Pinter+wt*Pintra+2)>>2
同时,为了生成预测块,编译设备可以基于如上所述的常规合并模式、跳过模式、SbTMVP模式、MMVD模式、三角形分区模式(分区模式)和/或CIIP模式来推导运动信息。每个模式可以通过序列参数集(SPS)中包括的每个模式的开/关标志来启用/禁用。如果用于特定模式的开/关标志被禁用,则编码设备不用信号通知以CU或PU为单位用于相应预测模式的显式发送的语法。
因此,当在现有操作处理中禁用或部分禁用合并/跳过模式的所有特定模式时,就会出现开/关标志被冗余地用信号通知的问题。因此,在该文档中,为了防止在基于表2的合并数据语法选择应用于当前块的合并模式的处理中冗余地用信号通知相同信息(标志),可以使用以下方法中的任一种。
编码设备可以基于如下面的表5所示的序列参数集来用信号通知标志,以便选择可以在推导的运动信息的处理中使用的预测模式。可以基于表5的序列参数集来开启/关闭每个预测模式,并且可以根据使用表5的标志和每个模式的条件来解析或诱导表2的合并数据语法的每个语法元素。
[表5]
Figure BDA0003510419890000431
Figure BDA0003510419890000441
Figure BDA0003510419890000442
Figure BDA0003510419890000443
Figure BDA0003510419890000451
Figure BDA0003510419890000452
Figure BDA0003510419890000453
Figure BDA0003510419890000454
Figure BDA0003510419890000461
Figure BDA0003510419890000462
准备以下附图以解释该文档的具体示例。由于以示例的方式呈现了附图中描述的特定装置和信号/信息的名称,所以本公开的技术特征不限于在以下附图中使用的特定名称。
图13和图14示意性地示出根据本公开的实施例的包括帧间预测方法的视频/图像编码方法的示例和相关联的组件。
图13中公开的编码方法可以由图2中公开的编码设备200执行。具体地,例如,图13的S1300至S1310可以由编码设备200的预测器220执行,并且S1320可以由编码设备200的熵编码器240执行。图13中公开的编码方法可以包括本文档的上述实施例。
具体地,参照图13和图14,编码设备的预测器可以确定当前块的预测模式(S1300)。作为示例,在帧间预测应用于当前块的情况下,编码设备的预测器可以将常规合并模式、跳过模式、MMVD模式、子块合并模式、分区模式和CIIP模式中的任一个确定为当前块的预测模式。
这里,常规合并模式可以被定义为使用相邻块的运动信息来推导当前块的运动信息的模式。跳过模式可以被定义为预测块用作重构块的模式。MMVD模式可以应用于合并模式或跳过模式,并且可以被定义为使用运动向量差的合并(或跳过)模式。子块合并模式可以被定义为基于子块的合并模式。分区模式可以被定义为通过将当前块划分为两个分区(对角或反对角)来执行预测的模式。CIIP模式可以被定义为图片间合并和图片内预测彼此组合的模式。
同时,编码设备的预测器可以通过运动估计在参考图片的特定区域(搜索区域)内搜索类似于当前块的块,从当前块推导具有最小或等于或小于特定参考的差的参考块,并且基于此来推导指示参考块被定位在其中的参考图片的参考图片索引。此外,可以基于参考块和当前块之间的位置差来推导运动向量。
编码设备的预测器可以基于当前块的预测模式和当前块的运动向量来生成当前块的预测样本(预测块)。此外,编码设备的预测器可以基于预测模式来生成关于预测模式的信息(S1310)。这里,关于预测模式的信息可以包括帧间/帧内预测分类信息、帧间预测模式信息等,并且可以包括与其相关的各种语法元素。
编码设备的残差处理器可以基于当前块的原始样本(原始块)和当前块的预测样本(预测块)来生成残差样本。另外,可以基于残差样本来推导关于残差样本的信息。
编码设备的编码器可以对图像信息进行编码,图像信息包括关于残差样本的信息、关于预测模式的信息等(S1320)。图像信息可以包括分区相关信息、关于预测模式的信息、残差信息、环内滤波相关信息等,并且可以包括与其相关的各种语法元素。能够以比特流的形式输出由编码设备的编码器编码的信息。比特流可以通过网络或存储介质发送到解码设备。
例如,图像信息可以包括关于各种参数集的信息,诸如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)。此外,图像信息可以包括关于当前块的预测模式的信息,诸如编译单元语法和合并数据语法。这里,序列参数集可以包括组合的图片间合并和图片内预测(CIIP)启用标志、分区模式的启用标志等。编译单元语法可以包括指示是否将跳过模式应用于当前块的CU跳过标志。
根据实施例,作为示例,编码设备可以基于满足基于CIIP启用标志的条件和基于当前块的大小的条件来在图像信息中包括常规合并标志,从而不重复发送相同语法。这里,基于当前块的大小的条件可以是当前块的高度和当前块的宽度的乘积为64或更大且当前块的高度和当前块的宽度各自小于128的情况。基于CIIP启用标志的条件可以是CIIP启用标志的值为1的情况。换句话说,在当前块的高度和当前块的宽度的乘积为64或更大,当前块的高度和当前块的宽度各自小于128,并且CIIP启用标志的值为1时,编码设备可以随后用信号通知常规合并标志。
作为另一示例,编码设备可以基于满足基于CU跳过标志和当前块的大小的条件在图像信息中包括常规合并标志。这里,基于CU跳过标志的条件可以是CU跳过标志的值为0的情况。换句话说,在当前块的高度与当前块的宽度的乘积为64或更大,当前块的高度与当前块的宽度的乘积小于128,并且CU跳过标志的值为0时,编码设备可以随后用信号通知常规合并标志。
作为另一示例,除了基于CIIP启用标志的条件和基于当前块的大小的条件,基于进一步满足基于CU跳过标志的条件,编码设备可以在图像信息中包括常规合并标志。这里,基于CU跳过标志的条件可以是CU跳过标志的值为0的情况。换句话说,在当前块的高度与当前块的宽度的乘积为64或更大,当前块的高度与当前块的宽度的乘积小于128,CIIP启用标志的值为1,CU跳过标志的值为0时,编码设备可以随后用信号通知常规合并标志。
作为另一示例,编码设备可以基于满足基于关于当前块的信息和分区模式启用标志的条件在图像信息中包括常规合并标志。这里,基于关于当前块的信息的条件可以包括当前块的宽度和高度的乘积为64或更大的情况和/或包括当前块的切片类型为B切片的情况。基于分区模式启用标志的条件可以是分区模式启用标志的值为1的情况。换句话说,当满足基于当前块的高度和关于当前块的信息的条件以及基于分区模式启用标志的条件时,编码设备可以用信号通知常规合并标志。
当不满足基于CIIP启用标志的条件和基于当前块的大小的条件时,编码设备可以确定是否满足基于关于当前块的信息和分区模式启用标志的条件。可替选地,当不满足基于关于当前块的信息和分区模式启用标志的条件时,编码设备可以确定是否满足基于CIIP启用标志的条件和基于当前块的大小的条件。
同时,在当前块的宽度和高度的乘积不是32且MMVD启用标志的值是1时,或者当子块合并候选的最大数目大于0且当前块的宽度和高度等于或大于8时,编码设备可以用信号通知常规合并标志。
为此,作为示例,可以如下表6所示配置合并数据语法。
[表6]
Figure BDA0003510419890000501
Figure BDA0003510419890000502
Figure BDA0003510419890000503
在表6中,regular_merge_flag[x0][y0]等于1指定常规合并模式用于生成当前编译单元的帧间预测参数。阵列索引x0,y0指定所考虑的编译块的左顶部亮度样本相对于图片的左顶部亮度样本的位置(x0,y0)。
当regular_merge_flag[x0][y0]不存在时,推断如下。
如果所有以下条件均为真,则regular_merge_flag[x0][y0]被推断为等于1。
-regular_merge_flag[x0][y0]等于1
-sps_mmvd_enable_flag等于0或cbWidth*cbHeight==32)
-MaxNumSubblockMergeCand<=0或cbWidth<8或cbHeight<8
-sps_ciip_enabled_flag等于0或者cbWidth*cbHeight<64或者cbWidth>=128或者cu_skip_flag[x0][y0]等于1
-sps_triangle_enabled_flag等于0或MaxNumTriangleMergeCand<2或slice_type不等于B_SLICE
否则,regular_merge_flag[x0][y0]被推断为等于0。
同时,根据另一实施例,作为示例,编码设备可以基于满足基于CIIP启用标志的条件和基于当前块的大小的条件在图像信息中包括MMVD合并标志,从而不重复发送相同语法。这里,基于当前块的大小的条件可以是当前块的高度和当前块的宽度的乘积为64或更大且当前块的高度和当前块的宽度各自小于128的情况。基于CIIP启用标志的条件可以是CIIP启用标志的值为1的情况。换句话说,在当前块的高度和当前块的宽度的乘积为64或更大,当前块的高度和当前块的宽度小于128,并且CIIP启用标志的值为1时,编码设备可以用信号通知MMVD合并标志。
作为另一示例,除了基于CIIP启用标志的条件和基于当前块的大小的条件,基于进一步满足基于CU跳过标志的条件,编码设备可以在图像信息中包括MMVD合并标志。这里,基于CU跳过标志的条件可以是CU跳过标志的值为0的情况。换句话说,在当前块的高度和当前块的宽度的乘积为64或更大,当前块的高度和当前块的宽度各自小于128,CIIP启用标志的值为1,并且CU跳过标志的值为0时,编码设备随后可以用信号通知MMVD合并标志。
作为另一示例,编码设备可以基于满足基于关于当前块的信息的条件和分区模式启用标志在图像信息中包括MMVD合并标志。这里,基于关于当前块的信息的条件可以包括当前块的宽度和高度的乘积为64或更大的情况和/或包括当前块的切片类型为B切片的情况。基于分区模式启用标志的条件可以是分区模式启用标志的值为1的情况。换句话说,当满足基于当前块的高度和关于当前块的信息的条件以及基于分区模式启用标志的条件时,编码设备可以用信号通知MMVD合并标志。
当不满足基于CIIP启用标志的条件和基于当前块的大小的条件时,编码设备可以确定是否满足基于关于当前块的信息和分区模式启用标志的条件。可替选地,当不满足基于关于当前块的信息和分区模式启用标志的条件时,编码设备可以确定是否满足基于CIIP启用标志的条件和基于当前块的大小的条件。
同时,在当前块的宽度和高度的乘积不是32且MMVD启用标志的值是1时,或者当子块合并候选的最大数目大于0且当前块的宽度和高度为8或更大时,编码设备可以用信号通知MMVD合并标志。
为此,作为示例,可以如下表7所示配置合并数据语法。
[表7]
Figure BDA0003510419890000531
Figure BDA0003510419890000532
Figure BDA0003510419890000533
Figure BDA0003510419890000534
mmvd_merge_flag[x0][y0]等于1指定具有运动向量差的合并模式被用于生成当前编译单元的帧间预测参数。阵列索引x0,y0指定所考虑的编译块的左顶部亮度样本相对于图片的左顶部亮度样本的位置(x0,y0)。
当mmvd_merge_flag[x0][y0]不存在时,推断如下。
如果所有以下条件均为真,则mmvd_merge_flag[x0][y0]被推断为等于1。
-general_merge_flag[x0][y0]等于1
-regular_merge_flag[x0][y0]等于0
-sps_mmvd_enable_flag等于1
-cbWidth*cbHeight!=32
-MaxNumSubblockMergeCand<=0或cbWidth<8或cbHeight<8
-sps_ciip_enabled_flag等于0或者cbWidth>=128或者cbHeight>=128或者cu_skip_flag[x0][y0]等于1
-sps_triangle_enabled_flag等于0或MaxNumTriangleMergeCand<2或slice_type不等于B_SLICE
否则,mmvd_merge_flag[x0][y0]被推断为等于0。
同时,根据另一实施例,作为示例,编码设备可以基于满足基于CIIP启用标志的条件和基于当前块的大小的条件在图像信息中包括合并子块标志,从而不重复发送相同语法。这里,基于当前块的大小的条件可以是当前块的高度和当前块的宽度的乘积为64或更大且当前块的高度和当前块的宽度各自小于128的情况。基于CIIP启用标志的条件可以是CIIP启用标志的值为1的情况。换句话说,在当前块的高度和当前块的宽度的乘积为64或更大,当前块的高度和当前块的宽度各自小于128,并且CIIP启用标志的值为1时,编码设备可以用信号通知合并子块标志。
作为另一示例,除了基于CIIP启用标志的条件和基于当前块的大小的条件,基于进一步满足基于CU跳过标志的条件,编码设备可以在图像信息中包括合并子块标志。这里,基于CU跳过标志的条件可以是CU跳过标志的值为0的情况。换句话说,在当前块的高度和当前块的宽度的乘积为64或更大,当前块的高度和当前块的宽度小于128,CIIP启用标志的值为1,并且CU跳过标志的值为0时,编码设备随后可以用信号通知合并子块标志。
作为另一示例,编码设备可以基于满足基于关于当前块的信息的条件和分区模式启用标志在图像信息中包括合并子块标志。这里,基于关于当前块的信息的条件可以包括当前块的宽度和高度的乘积为64或更大的情况和/或包括当前块的切片类型为B切片的情况。基于分区模式启用标志的条件可以是分区模式启用标志的值为1的情况。换句话说,当满足基于当前块的高度和关于当前块的信息的条件以及基于分区模式启用标志的条件时,编码设备可以用信号通知合并子块标志。
当不满足基于CIIP启用标志的条件和基于当前块的大小的条件时,编码设备可以确定是否满足基于关于当前块的信息和分区模式启用标志的条件。可替选地,当不满足基于关于当前块的信息和分区模式启用标志的条件时,编码设备可以确定是否满足基于CIIP启用标志的条件和基于当前块的大小的条件。
同时,当子块合并候选的最大数目大于0并且当前块的宽度和高度各自为8或更大时,编码设备可以用信号通知合并子块标志。
为此,作为示例,可以如下表8所示配置合并数据语法。
[表8]
Figure BDA0003510419890000561
Figure BDA0003510419890000562
Figure BDA0003510419890000563
merge_subblock_flag[x0][y0]指定是否从相邻块推断用于当前编译单元的基于子块的帧间预测参数。阵列索引x0,y0指定所考虑的编译块的左顶部亮度样本相对于图片的左顶部亮度样本的位置(x0,y0)。
当merge_subblock_flag[x0][y0]不存在时,推断如下。
如果所有以下条件均为真,则merge_subblock_flag[x0][y0]被推断为等于1。
-general_merge_flag[x0][y0]等于1
-regular_merge_flag[x0][y0]等于0
-merge_subblock_flag[x0][y0]等于0
-mmvd_merge_flag[x0][y0]等于0
-MaxNumSubblockMergeCand>0
-cbWidth>=8and cbHeight>=8
-sps_ciip_enabled_flag等于0或者cbWidth>=128或者cbHeight>=128或者cu_skip_flag[x0][y0]等于1
-sps_triangle_enabled_flag等于0或MaxNumTriangleMergeCand<2或slice_type不等于B_SLICE
否则,merge_subblock_flag[x0][y0]被推断为等于0。
同时,根据另一实施例,作为示例,编码设备可以基于满足基于CIIP启用标志的条件和基于当前块的大小的条件来在图像信息中包括CIIP标志,从而不重复发送相同语法。这里,基于当前块的大小的条件可以是当前块的高度和当前块的宽度的乘积为64或更大并且当前块的高度和当前块的宽度各自小于128的情况。基于CIIP启用标志的条件可以是CIIP启用标志的值为1的情况。换句话说,在当前块的高度和当前块的宽度的乘积为64或更大,当前块的高度和当前块的宽度小于128,并且CIIP启用标志的值为1时,编码设备可以用信号通知CIIP标志。
作为另一示例,除了基于CIIP启用标志的条件和基于当前块的大小的条件,基于进一步满足基于CU跳过标志的条件,编码设备可以在图像信息中包括CIIP标志。这里,基于CU跳过标志的条件可以是CU跳过标志的值为0的情况。换句话说,在当前块的高度和当前块的宽度的乘积为64或更大,当前块的高度和当前块的宽度各自小于128,CIIP启用标志的值为1,并且CU跳过标志的值为0时,编码设备随后可以用信号通知CIIP标志。
作为另一示例,编码设备可以基于满足基于关于当前块的信息的条件和分区模式启用标志在图像信息中包括CIIP标志。这里,基于关于当前块的信息的条件可以包括当前块的宽度和高度的乘积为64或更大的情况和/或包括当前块的切片类型为B切片的情况。基于分区模式启用标志的条件可以是分区模式启用标志的值为1的情况。换句话说,当满足基于当前块的高度和关于当前块的信息的条件以及基于分区模式启用标志的条件时,编码设备可以用信号通知CIIP标志。
当不满足基于CIIP启用标志的条件和基于当前块的大小的条件时,编码设备可以确定是否满足基于关于当前块的信息和分区模式启用标志的条件。可替选地,当不满足基于关于当前块的信息和分区模式启用标志的条件时,编码设备可以确定是否满足基于CIIP启用标志的条件和基于当前块的大小的条件。
为此,作为示例,可以如下表9所示配置合并数据语法。
[表9]
Figure BDA0003510419890000591
Figure BDA0003510419890000592
Figure BDA0003510419890000593
ciip_flag[x0][y0]指定针对当前编译单元是否应用组合的图片间合并和图片内预测。Ciip_flag(x0)(y0)指定针对当前编译单元是否应用组合的图片间合并和图片内预测。
当ciip_flag[x0][y0]不存在时,推断如下。
如果以下所有条件均为真,则推断ciip_flag[x0][y0]等于1。
-general_merge_flag[x0][y0]等于1
-regular_merge_flag[x0][y0]等于0
-merge_subblock_flag[x0][y0]等于0
-mmvd_merge_flag[x0][y0]等于0
-sps_ciip_enabled_flag等于1
-cu_skip_flag[x0][y0]等于0
-cbWidth*cbHeight>=64且cbWidth<128和cbHeight<128
-sps_triangle_enabled_flag等于0或MaxNumTriangleMergeCand<2或slice_type不等于B_SLICE
否则,推断ciip_flag[x0][y0]等于0。
图15和图16示意性地示出根据本公开的实施例的包括帧间预测方法的视频/图像解码方法的示例和相关组件。
图15中公开的解码方法可以由图3和图16中图示的解码设备300执行。具体地,例如,可以由解码设备300的预测器330执行图15的步骤S1500至S1520,并且可以由解码设备300的加法器340执行步骤S1530。图15中公开的解码方法可以包括该文档中上面描述的实施例。
参照图15和图16,解码设备可以从比特流获取关于当前块的预测模式的信息(S1500)。具体地,解码设备的熵解码器310可以从以比特流的形式从图2的编码设备接收的信号推导残差信息和关于预测模式的信息。这里,关于预测模式的信息可以称为预测相关信息。关于预测模式的信息可以包括帧间/帧内预测分类信息、帧间预测模式信息等,并且可以包括与其相关的各种语法元素。
比特流可以包括图像信息,该图像信息包括关于各种参数集的信息,诸如自适应参数集(APS)、图像参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)。图像信息还可以包括关于当前块的预测模式的信息,诸如编译单元语法和合并数据语法。序列参数集可以包括CIIP启用标志、用于分区模式的启用标志等。编译单元语法可以包括指示跳过模式是否应用于当前块的CU跳过标志。
同时,解码设备的残差处理器320可以基于残差信息来生成残差样本。此外,解码设备的预测器330可以基于关于预测模式的信息来推导当前块的预测模式(S1510)。另外,可以基于所推导的预测模式来推导当前块的运动信息。在这种情况下,解码设备的预测器可以基于当前块的相邻块来构造运动信息候选列表,并且基于从编码设备接收的候选选择信息来推导当前块的运动向量和/或参考图像索引。当推导当前块的运动信息时,解码设备的预测器可以基于当前块的运动信息来生成当前块的预测样本(S1520)。此后,解码设备的加法器340可以基于由预测器330生成的预测样本和由残差处理器320生成的残差样本来生成重构样本(S1530)。可以基于重构样本来生成重构图片。此后,可以将诸如去块滤波、SAO和/或ALF过程的环内滤波过程应用于重构图片,以便根据需要改善主观/客观图像质量。
作为实施例,在推导当前块的预测模式时,解码设备可以基于满足基于CIIP启用标志的条件和基于当前块的大小的条件从比特流获取常规合并标志。这里,基于当前块的大小的条件可以是当前块的高度和当前块的宽度的乘积为64或更大并且当前块的高度和当前块的宽度各自小于128的情况。基于CIIP启用标志的条件可以是CIIP启用标志的值为1的情况。换句话说,在当前块的高度和当前块的宽度的乘积为64或更大,当前块的高度和当前块的宽度各自小于128,并且CIIP启用标志的值为1时,解码设备可以随后从比特流中包括的合并数据语法解析常规合并标志。
作为另一示例,可以基于满足基于CU跳过标志和当前块的大小的条件从比特流获取常规合并标志。这里,基于当前块的大小的条件可以是当前块的高度和当前块的宽度的乘积为64或更大且当前块的高度和当前块的宽度各自小于128的情况。基于CU跳过标志的条件可以是CU跳过标志的值为0的情况。换句话说,在当前块的高度和当前块的宽度的乘积为64或更大,当前块的高度和当前块的宽度各自小于128,并且CU跳过标志的值为0时,解码设备可以随后从比特流中包括的合并数据语法解析常规合并标志。
作为另一示例,除了基于CIIP启用标志的条件和基于当前块的大小的条件,基于进一步满足基于CU跳过标志的条件,解码设备可以从比特流获取常规合并标志。这里,基于CU跳过标志的条件可以是CU跳过标志的值为0的情况。换句话说,在当前块的高度和当前块的宽度的乘积为64或更大,当前块的高度和当前块的宽度小于128,CIIP启用标志的值为1,并且CU跳过标志的值为0时,解码设备可以随后从合并数据语法解析常规合并标志。
作为另一示例,解码设备可以基于满足基于关于当前块的信息和分区模式启用标志的条件从比特流获取常规合并标志。这里,基于关于当前块的信息的条件可以包括当前块的宽度和高度的乘积为64或更大的情况和/或包括当前块的切片类型为B切片的情况。基于分区模式启用标志的条件可以是分区模式启用标志的值为1的情况。换句话说,当满足基于当前块的高度的条件和关于当前块的信息以及基于分区模式启用标志的条件时,解码设备可以从合并数据语法解析常规合并标志。
当不满足基于CIIP启用标志的条件和基于当前块的大小的条件时,解码设备可以确定是否满足基于关于当前块的信息和分区模式启用标志的条件。可替选地,当不满足基于关于当前块的信息和分区模式启用标志的条件时,解码设备可以确定是否满足基于CIIP启用标志的条件和基于当前块的大小的条件。
同时,在当前块的宽度和高度的乘积不是32且MMVD启用标志的值是1时,或者当子块合并候选的最大数目大于0且当前块的宽度和高度为8或更大时,解码设备可以从比特流解析常规合并标志。为此,可以如上表6所示配置合并数据语法。
当在比特流中不存在常规合并标志时,如果一般合并标志的值为1,SPS的MMVD启用标志的值为0,当前块的宽度和高度的乘积为32,子块合并候选的最大数目为0或更小,当前块的宽度小于8,当前块的高度小于8,SPS的CIIP启用标志的值为0,当前块的宽度和高度的乘积小于64,当前块的宽度为128或更大,CU跳过标志的值为1,SPS的分区启用标志的值为0,分区合并候选的最大数目小于2,或者切片类型不是B切片,则解码设备可以推导常规合并标志的值为1。否则,可以将常规合并标志的值推导为0。
作为另一实施例,在推导当前块的预测模式时,解码设备可以基于满足基于CIIP启用标志的条件和基于当前块的大小的条件从比特流获取MMVD合并标志。这里,基于当前块的大小的条件可以是当前块的高度和当前块的宽度的乘积为64或更大且当前块的高度和当前块的宽度各自小于128的情况。基于CIIP启用标志的条件可以是CIIP启用标志的值为1的情况。换句话说,在当前块的高度和当前块的宽度的乘积为64或更大,当前块的高度和当前块的宽度各自小于128,并且CIIP启用标志的值为1时,解码设备随后可以从比特流中包括的合并数据语法解析MMVD合并标志。
作为另一示例,解码设备可以基于满足基于CU跳过标志和当前块的大小的条件从比特流获取MMVD合并标志。这里,基于当前块的大小的条件可以是当前块的高度和当前块的宽度的乘积为64或更大且当前块的高度和当前块的宽度各自小于128的情况。基于CU跳过标志的条件可以是CU跳过标志的值为0的情况。换句话说,在当前块的高度和当前块的宽度的乘积为64或更大,当前块的高度和当前块的宽度各自小于128,并且CU跳过标志的值为0时,解码设备可以随后从比特流中包括的合并数据语法解析MMVD合并标志。
作为另一示例,除了基于CIIP启用标志的条件和基于当前块的大小的条件,基于进一步满足基于CU跳过标志的条件,解码设备可以从比特流获取MMVD合并标志。这里,基于CU跳过标志的条件可以是CU跳过标志的值为0的情况。换句话说,在当前块的高度和当前块的宽度的乘积为64或更大,当前块的高度和当前块的宽度小于128,CIIP启用标志的值为1,并且CU跳过标志的值为0时,解码设备可以随后从合并数据语法解析MMVD合并标志。
作为另一示例,解码设备可以基于满足基于关于当前块的信息和分区模式启用标志的条件从比特流获取MMVD合并标志。这里,基于关于当前块的信息的条件可以包括当前块的宽度和高度的乘积为64或更大的情况和/或包括当前块的切片类型为B切片的情况。基于分区模式启用标志的条件可以是分区模式启用标志的值为1的情况。换句话说,当满足基于当前块的高度的条件和关于当前块的信息以及基于分区模式启用标志的条件时,解码设备可以从合并数据语法解析MMVD合并标志。
当不满足基于CIIP启用标志的条件和基于当前块的大小的条件时,解码设备可以确定是否满足基于关于当前块的信息和分区模式启用标志的条件。可替选地,当不满足基于关于当前块的信息和分区模式启用标志的条件时,解码设备可以确定是否满足基于CIIP启用标志的条件和基于当前块的大小的条件。
同时,在当前块的宽度和高度的乘积不是32且MMVD启用标志的值是1时,或者当子块合并候选的最大数目大于0且当前块的宽度和高度为8或更大时,解码设备可以从比特流解析MMVD合并标志。为此,可以如上表7所示配置合并数据语法。
当比特流中不存在MMVD合并标志时,如果一般合并标志的值为1,一般合并标志的值为0,SPS的MMVD启用标志的值为1,当前块的宽度和高度的乘积不为32,子块合并候选的最大数目为0或更小,当前块的宽度小于8,当前块的高度小于8,SPS的CIIP启用标志的值为0,当前块的宽度为128或更大,当前块的高度为128或更大,CU跳过标志的值为1,SPS的分区启用标志的值为0,分区合并候选的最大数目小于2,或者切片类型不是B切片,则解码设备可以推导MMVD合并标志的值为1。否则,MMVD合并标志的值可以被推导为0。
作为另一实施例,在推导当前块的预测模式时,解码设备可以基于满足基于CIIP启用标志的条件和基于当前块的大小的条件从比特流获取合并子块标志。这里,基于当前块的大小的条件可以是当前块的高度和当前块的宽度的乘积为64或更大且当前块的高度和当前块的宽度各自小于128的情况。基于CIIP启用标志的条件可以是CIIP启用标志的值为1的情况。换句话说,在当前块的高度和当前块的宽度的乘积为64或更大,当前块的高度和当前块的宽度各自小于128,并且CIIP启用标志的值是1时,解码设备可以随后从比特流中包括的合并数据语法解析合并子块标志。
作为另一示例,可以基于满足基于CU跳过标志和当前块的大小的条件从比特流获取合并子块标志。这里,基于当前块的大小的条件可以是当前块的高度和当前块的宽度的乘积为64或更大且当前块的高度和当前块的宽度各自小于128的情况。基于CU跳过标志的条件可以是CU跳过标志的值为0的情况。换句话说,在当前块的高度和当前块的宽度的乘积为64或更大,当前块的高度和当前块的宽度各自小于128,并且CU跳过标志的值为0时,解码设备可以随后从比特流中包括的合并数据语法解析合并子块标志。
作为另一示例,除了基于CIIP启用标志的条件和基于当前块的大小的条件,基于进一步满足基于CU跳过标志的条件,解码设备可以从比特流获取合并子块标志。这里,基于CU跳过标志的条件可以是CU跳过标志的值为0的情况。换句话说,在当前块的高度和当前块的宽度的乘积为64或更大,当前块的高度和当前块的宽度小于128,CIIP启用标志的值为1,并且CU跳过标志的值为0时,解码设备可以随后从合并数据语法解析合并子块标志。
作为另一示例,解码设备可以基于满足基于关于当前块的信息和分区模式启用标志的条件从比特流获取合并子块标志。这里,基于关于当前块的信息的条件可以包括当前块的宽度和高度的乘积为64或更大的情况和/或包括当前块的切片类型为B切片的情况。基于分区模式启用标志的条件可以是分区模式启用标志的值为1的情况。换句话说,当满足基于当前块的高度的条件和关于当前块的信息和基于分区模式启用标志的条件时,解码设备可以从合并数据语法解析合并子块标志。
当不满足基于CIIP启用标志的条件和基于当前块的大小的条件时,解码设备可以确定是否满足基于关于当前块的信息和分区模式启用标志的条件。可替选地,当不满足基于关于当前块的信息和分区模式启用标志的条件时,解码设备可以确定是否满足基于CIIP启用标志的条件和基于当前块的大小的条件。
同时,当子块合并候选的最大数目大于0且当前块的宽度和高度为8或更大时,解码设备可以从比特流解析合并子块标志。为此,可以如上表8所示配置合并数据语法。
当在比特流中不存在合并子块标志时,如果一般合并标志的值为1,常规合并标志的值为0,合并子块标志的值为0,MMVD合并标志的值为0,子块合并候选的最大数目大于0,当前块的宽度和高度为8或更大,SPS的CIIP启用标志的值为0,当前块的宽度为128或更大,当前块的高度为128或更大,CU跳过标志的值为1,SPS的分区启用标志的值为0,分区合并候选的最大数目小于2,或者切片类型不是B切片,则解码设备可以将合并子块标志的值推导为1。否则,合并子块标志的值可以推导为1。
作为另一实施例,在推导当前块的预测模式时,解码设备可以基于满足基于CIIP启用标志的条件和基于当前块的大小的条件从比特流获取MMVD合并标志。这里,基于当前块的大小的条件可以是当前块的高度和当前块的宽度的乘积为64或更大且当前块的高度和当前块的宽度各自小于128的情况。基于CIIP启用标志的条件可以是CIIP启用标志的值为1的情况。换句话说,在当前块的高度和当前块的宽度的乘积为64或更大,当前块的高度和当前块的宽度各自小于128,并且CIIP启用标志的值为1时,解码设备可以随后从合并数据语法解析CIIP标志。
作为另一示例,除了基于CIIP启用标志的条件和基于当前块的大小的条件,基于进一步满足基于CU跳过标志的条件,解码设备可以从比特流获取CIIP标志。这里,基于CU跳过标志的条件可以是CU跳过标志的值为0的情况。换句话说,在当前块的高度和当前块的宽度的乘积为64或更大,当前块的高度和当前块的宽度小于128,CIIP启用标志的值为1,并且CU跳过标志的值为0时,解码设备可以随后从合并数据语法解析CIIP标志。
作为另一示例,解码设备可以基于满足基于关于当前块的信息和分区模式启用标志的条件从比特流获取CIIP标志。这里,基于关于当前块的信息的条件可以包括当前块的宽度和高度的乘积为64或更大的情况和/或包括当前块的切片类型为B切片的情况。基于分区模式启用标志的条件可以是分区模式启用标志的值为1的情况。换句话说,当满足基于当前块的高度的条件和关于当前块的信息和基于分区模式启用标志的条件时,解码设备可以从合并数据语法解析CIIP标志。
当不满足基于CIIP启用标志的条件和基于当前块的大小的条件时,解码装置可以确定是否满足基于关于当前块的信息和分区模式启用标志的条件。可替选地,当不满足基于关于当前块的信息和分区模式启用标志的条件时,解码设备可以确定是否满足基于CIIP启用标志的条件和基于当前块的大小的条件。为此,可以如上表9所示配置合并数据语法。
当在比特流中不存在CIIP标志时,如果一般合并标志的值为1,常规合并标志的值为0,合并子块标志的值为0,MMVD合并标志的值为0,SPS的CIIP启用标志的值为1,CU跳过标志的值为0,当前块的宽度和高度的乘积为64或更大,当前块的宽度和高度小于128,SPS的分区启用标志的值为0,分区合并候选的最大数目小于2,或者切片类型不是B切片,则解码设备可以推导CIIP标志的值为1。否则,CIIP标志的值可以推导为0。
尽管已经基于在上述实施方式中顺序列出步骤或块的流程图描述了方法,但本公开的步骤不限于特定的顺序,并且特定步骤可以相对于上述步骤在不同的步骤中或以不同的顺序或者同时地执行。另外,本领域的普通技术人员将理解,流程图中的步骤不是排他性的,并且在没有对本公开的范围施加影响的情况下,可以在其中包括另一步骤,或者可以删除流程图中的一个或更多个步骤。
根据本公开的以上提到的方法可以是软件的形式,并且根据本公开的编码设备和/或解码设备可以被包括在用于执行图像处理的装置(例如,TV、计算机、智能电话、机顶盒、显示装置等)中。
当用软件实现本公开的实施方式时,可以用执行以上提到的功能的模块(处理或功能)实现以上提到的方法。模块可以被存储在存储器中并且由处理器执行。存储器可以安装在处理器的内部或外部,并可以经由各种公知装置连接到处理器。处理器可以包括专用集成电路(ASIC)、其他芯片集、逻辑电路和/或数据处理装置。存储器可以包括只读存储器(ROM)、随机存取存储器(RAM)、闪速存储器、存储卡、存储介质和/或其他存储装置。换句话说,根据本公开的实施方式可以在处理器、微处理器、控制器或芯片上实现和执行。例如,相应图中例示的功能单元可以在计算机、处理器、微处理器、控制器或芯片上实现和执行。在这种情况下,关于实现方式的信息(例如,关于指令的信息)或算法可以被存储在数字存储介质中。
另外,应用本公开的实施方式的解码设备和编码设备可以被包括在多媒体广播收发器、移动通信终端、家庭影院视频装置、数字影院视频装置、监视相机、视频聊天装置、诸如视频通信这样的实时通信装置、移动流传输装置、存储介质、便携式摄像机、视频点播(VoD)服务提供器、顶置(OTT)视频装置、互联网流传输服务提供器、3D视频装置、虚拟现实(VR)装置、增强现实(AR)装置、图像电话视频装置、车载终端(例如,车(包括自主车辆)载终端、飞机终端或轮船终端)和医疗视频装置中;并且可以被用于处理图像信号或数据。例如,OTT视频装置可以包括游戏控制台、Blueray(蓝光)播放器、联网TV、家庭影院系统、智能手机、平板PC和数字视频记录仪(DVR)。
另外,应用本公开的实施方式的处理方法能够以由计算机执行的程序的形式产生,并可以被存储在计算机可读记录介质中。根据本公开的实施方式的具有数据结构的多媒体数据也可以被存储在计算机可读记录介质中。计算机可读记录介质包括存储有计算机可读数据的所有种类的存储装置和分布式存储装置。计算机可读记录介质可以包括例如蓝光盘(BD)、通用串行总线(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储装置。计算机可读记录介质还包括以载波(例如,互联网上的传输)的形式实施的媒体。另外,通过编码方法生成的比特流可以被存储在计算机可读记录介质中,或者可以通过有线或无线通信网络传输。
另外,本公开的实施方式可以基于程序代码被实施为计算机程序产品,并且程序代码可以根据本文献的实施方式在计算机上执行。程序代码可以被存储在计算机可读载体上。
图17表示可以应用本公开的实施例的内容流系统的示例。
参照图17,应用了本公开的实施例的内容流系统可以基本上包括编码服务器、流服务器、web服务器、媒体仓库、用户装置和多媒体输入装置。
编码服务器用来将从诸如智能电话、照相机、便携式摄像机等这样的多媒体输入装置输入的内容压缩为数字数据,生成比特流,并且将其传送至流传输服务器。作为另一示例,在诸如智能电话、照相机、便携式摄像机等这样的多媒体输入装置直接生成码流的情况下,可省略编码服务器。
可通过本公开的实施方式应用于的编码方法或比特流生成方法来生成比特流。并且流传输服务器可在发送或接收比特流的过程中暂时存储比特流。
流传输服务器基于用户的请求通过网络服务器向用户设备传送多媒体数据,该网络服务器充当向用户通知存在什么服务的工具。当用户请求用户想要的服务时,网络服务器将请求转移至流传输服务器,并且流传输服务器将多媒体数据传送至用户。在这方面,内容流系统可包括单独的控制服务器,并且在这种情况下,控制服务器用来控制内容流系统中的各个设备之间的命令/响应。
流传输服务器可从媒体存储装置和/或编码服务器接收内容。例如,在从编码服务器接收到内容的情况下,可实时地接收内容。在这种情况下,流传输服务器可将比特流存储预定时间段以流畅地提供流传输服务。
例如,用户设备可包括移动电话、智能电话、膝上型计算机、数字广播终端、个人数字助理(PDA)、便携式多媒体播放器(PMP)、导航、板式PC、平板PC、超极本、可穿戴装置(例如,手表型终端(智能手表)、眼镜型终端(智能眼镜)、头戴式显示器(HMD))、数字TV、台式计算机、数字标牌等。
可将内容流系统中的每个服务器作为分布式服务器操作,并且在这种情况下,可以分布式方式处理由每个服务器接收的数据。

Claims (15)

1.一种由解码设备执行的解码方法,所述解码方法包括:
从比特流获取关于当前块的预测模式的信息;
基于关于所述预测模式的信息来推导所述当前块的所述预测模式;
基于所述预测模式来生成所述当前块的预测样本;以及
基于所述预测样本来生成重构样本;
其中,所述比特流包括序列参数集,
所述序列参数集包括组合的图片间合并和图片内预测(CIIP)启用标志,以及
所述推导包括基于满足基于所述CIIP启用标志的条件和基于所述当前块的大小的条件从所述比特流解析常规合并标志。
2.根据权利要求1所述的解码方法,其中,
基于所述当前块的大小的条件是所述当前块的高度与所述当前块的宽度的乘积为64或更大。
3.根据权利要求1所述的解码方法,其中,
基于所述当前块的大小的每个条件是所述当前块的高度和所述当前块的宽度小于128。
4.根据权利要求1所述的解码方法,其中,
基于所述CIIP启用标志的条件是所述CIIP启用标志的值是1。
5.根据权利要求1所述的解码方法,其中,
关于所述预测模式的信息包括指示是否跳过模式被应用于所述当前块的编译单元跳过标志,以及
所述解析包括基于还满足基于所述CU跳过标志的条件从所述比特流解析所述常规合并标志。
6.根据权利要求5所述的解码方法,其中,
基于所述CU跳过标志的条件是所述CU跳过标志的值是0。
7.根据权利要求1所述的解码方法,其中,
所述序列参数集包括通过将所述当前块划分成两个分区来执行预测的分区模式启用标志,
其中,所述推导包括:基于不满足基于所述CIIP启用标志的条件和基于所述当前块的大小的条件并且满足基于关于所述当前块的信息的条件和基于所述分区模式启用标志的条件,从所述比特流解析所述常规合并标志。
8.根据权利要求7所述的解码方法,其中,
基于关于所述当前块的信息的条件是包括所述当前块的切片的类型是B切片。
9.根据权利要求7所述的解码方法,其中,
基于所述分区模式启用标志的条件是所述分区模式启用标志的值是1。
10.一种由编码设备执行的编码方法,所述编码方法包括:
确定当前块的预测模式;
基于所述预测模式来生成关于所述预测模式的信息;以及
编码包括关于所述预测模式的信息的图像信息;
其中,所述图像信息包括序列参数集,
所述序列参数集包括组合的图片间合并和图片内预测(CIIP)启用标志,以及
基于满足基于所述CIIP启用标志的条件和基于所述当前块的大小的条件,所述图像信息包括常规合并标志。
11.根据权利要求10所述的编码方法,其中,
基于所述当前块的大小的条件是所述当前块的高度与所述当前块的宽度的乘积为64或更大,并且基于所述当前块的大小的每个条件是所述当前块的高度和所述当前块的宽度小于128。
12.根据权利要求10所述的编码方法,其中,
基于所述CIIP启用标志的条件是所述CIIP启用标志的值是1。
13.根据权利要求10所述的编码方法,其中,
所述图像信息包括指示是否跳过模式被应用于所述当前块的编译单元(CU)跳过标志,以及
基于还满足基于所述CU跳过标志的条件,所述图像信息包括所述常规合并标志。
14.根据权利要求13所述的编码方法,其中,
基于所述CU跳过标志的条件是所述CU跳过标志的值是0。
15.一种计算机可读数字存储介质,所述计算机可读数字存储介质包括使解码设备执行解码方法的信息,
其中,所述解码方法包括:
从比特流获取关于当前块的预测模式的信息;
基于关于所述预测模式的信息来推导所述当前块的所述预测模式;
基于所述预测模式来生成所述当前块的预测样本;以及
基于所述预测样本来生成重构样本,
其中,所述比特流包括序列参数集,
所述序列参数集包括组合的图片间合并和图片内预测(CIIP)启用标志,以及
所述推导包括基于满足基于所述CIIP启用标志的条件和基于所述当前块的大小的条件从所述比特流解析常规合并标志。
CN202080058624.2A 2019-06-19 2020-06-19 基于运动预测的图像编译方法和装置 Pending CN114342387A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962863795P 2019-06-19 2019-06-19
US62/863,795 2019-06-19
PCT/KR2020/008000 WO2020256487A1 (ko) 2019-06-19 2020-06-19 움직임 예측에 기반한 영상 코딩 방법 및 장치

Publications (1)

Publication Number Publication Date
CN114342387A true CN114342387A (zh) 2022-04-12

Family

ID=74040535

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080058624.2A Pending CN114342387A (zh) 2019-06-19 2020-06-19 基于运动预测的图像编译方法和装置

Country Status (6)

Country Link
US (2) US11438630B2 (zh)
EP (1) EP3979645A4 (zh)
JP (1) JP2022538026A (zh)
KR (1) KR20210148366A (zh)
CN (1) CN114342387A (zh)
WO (1) WO2020256487A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024074125A1 (en) * 2022-10-07 2024-04-11 Mediatek Inc. Method and apparatus of implicit linear model derivation using multiple reference lines for cross-component prediction

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024083197A1 (en) * 2022-10-20 2024-04-25 Douyin Vision Co., Ltd. Method, apparatus, and medium for video processing

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101478959B1 (ko) * 2010-11-25 2015-01-06 엘지전자 주식회사 영상 정보의 시그널링 방법 및 이를 이용한 영상 정보의 복호화 방법
US10819978B2 (en) * 2016-01-11 2020-10-27 Samsung Electronics Co., Ltd. Image encoding method and apparatus, and image decoding method and apparatus
US10674175B2 (en) * 2016-09-22 2020-06-02 Lg Electronics Inc. Inter-prediction method and apparatus in image coding system
CN107995489A (zh) * 2017-12-20 2018-05-04 北京大学深圳研究生院 一种用于p帧或b帧的帧内帧间组合预测方法
US11849106B2 (en) * 2019-01-18 2023-12-19 Wilus Institute Of Standards And Technology Inc. Video signal processing method and device using motion compensation

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024074125A1 (en) * 2022-10-07 2024-04-11 Mediatek Inc. Method and apparatus of implicit linear model derivation using multiple reference lines for cross-component prediction

Also Published As

Publication number Publication date
US20220345749A1 (en) 2022-10-27
KR20210148366A (ko) 2021-12-07
JP2022538026A (ja) 2022-08-31
WO2020256487A1 (ko) 2020-12-24
US11438630B2 (en) 2022-09-06
US11962810B2 (en) 2024-04-16
EP3979645A4 (en) 2022-08-10
US20220109887A1 (en) 2022-04-07
EP3979645A1 (en) 2022-04-06

Similar Documents

Publication Publication Date Title
US11877010B2 (en) Signaling method and device for merge data syntax in video/image coding system
JP7238172B2 (ja) マージデータシンタックスにおける重複シンタックスの除去方法及び装置
CN114270835A (zh) 基于默认合并模式推导预测样本的图像解码方法及其装置
CN114258676A (zh) 当最终无法选择当前块的预测模式时执行帧间预测的图像解码方法及其装置
JP2023060014A (ja) ビデオ/映像コーディングシステムにおけるシンタックスシグナリング方法及び装置
CN114208171A (zh) 用于推导用于生成预测样本的权重索引信息的图像解码方法和装置
CN114145022A (zh) 推导双向预测的权重索引信息的图像解码方法及其装置
CN114631318A (zh) 应用双向预测时推导用于加权平均的权重索引信息的图像解码方法和设备
EP3979645A1 (en) Motion prediction-based image coding method and device
JP7462094B2 (ja) ビデオ/映像コーディングシステムにおける重複シグナリング除去方法及び装置
CN115088263A (zh) 基于预测加权表的图像/视频编译方法和设备
CN114762351A (zh) 图像/视频编译方法和装置
CN114303375A (zh) 使用双向预测的视频解码方法和用于该方法的装置
CN114080814A (zh) 基于运动矢量预测的图像/视频编码方法和装置
CN114208168A (zh) 视频或图像编码系统中的帧间预测
JP2023090963A (ja) インター予測に基づく映像コーディング方法及び装置
CN114270821A (zh) 包括通过应用确定的预测模式来生成预测样本的图像解码方法及其装置
CN114788291A (zh) 用于处理图像信息以进行图像/视频编译的方法和装置
CN115104314A (zh) 基于加权预测的图像/视频编译方法及装置
CN114375573A (zh) 使用合并候选推导预测样本的图像解码方法及其装置
CN114342405A (zh) 图像解码方法和用于该图像解码方法的装置
US20220329815A1 (en) Image/video coding method and device
CN114982231A (zh) 图像解码方法及用于其的装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination