CN112956201B - 使用句法来执行编码的句法设计方法和设备 - Google Patents

使用句法来执行编码的句法设计方法和设备 Download PDF

Info

Publication number
CN112956201B
CN112956201B CN201980072498.3A CN201980072498A CN112956201B CN 112956201 B CN112956201 B CN 112956201B CN 201980072498 A CN201980072498 A CN 201980072498A CN 112956201 B CN112956201 B CN 112956201B
Authority
CN
China
Prior art keywords
flag information
block
sub
prediction
affine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201980072498.3A
Other languages
English (en)
Other versions
CN112956201A (zh
Inventor
张炯文
南廷学
林宰显
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN112956201A publication Critical patent/CN112956201A/zh
Application granted granted Critical
Publication of CN112956201B publication Critical patent/CN112956201B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Abstract

根据本公开的由解码设备执行的图像解码方法包括以下步骤:基于比特流将指示仿射预测是否适用于当前块的仿射标志和指示基于当前块的子块的时间运动向量预测器是否可用的子块TMVP标志解码;基于所解码的仿射标志和所解码的子块TMVP标志来确定是否将指示是否对当前块应用预定合并模式的预定合并模式标志解码;基于是否将预定合并模式标志解码的确定,推导当前块的预测样本;以及基于当前块的预测样本来生成当前块的重构样本。

Description

使用句法来执行编码的句法设计方法和设备
技术领域
本公开涉及图像编码技术,更具体地,涉及一种在图像编码系统中使用句法执行编码的句法设计方法和设备。
背景技术
最近,在各种领域中对诸如4K或8K超高清(UHD)图像/视频的高分辨率、高质量图像/视频的需求不断增加。随着图像/视频分辨率或质量变得更高,与传统图像/视频数据相比发送相对更多量的信息或比特。因此,如果图像/视频数据经由诸如现有有线/无线宽带线路的介质发送或被存储在传统存储介质中,则传输和存储的成本容易增加。
此外,对虚拟现实(VR)和人工现实(AR)内容以及诸如全息图的沉浸式媒体的兴趣和需求日益增长;并且表现出与实际图像/视频不同的图像/视频特性的图像/视频(例如,游戏图像/视频)的广播也日益增长。
因此,需要高度高效的图像/视频压缩技术来有效地压缩并发送、存储或播放如上所述显示出各种特性的高分辨率、高质量图像/视频。
发明内容
技术问题
本公开的一个技术目的在于提供一种用于改进图像编码效率的方法和设备。
本公开的另一技术目的在于提供一种使用句法执行编码的句法设计方法和设备。
本公开的另一技术目的在于提供一种设计高级句法和低级句法的方法以及使用句法执行编码的设备。
本公开的另一技术目的在于提供一种使用高级和/或低级句法元素来基于子块执行运动预测的方法和设备。
本公开的另一技术目的在于提供一种使用高级和/或低级句法元素来基于仿射模型执行运动预测的方法和设备。
本公开的另一技术目的在于提供一种基于仿射标志和子块TMVP标志来确定是否将指示是否对当前块应用预定合并模式的预定模式标志解码的方法和设备。
技术方案
根据本公开的一个实施方式,提供了一种由解码设备执行的图像解码方法。该方法包括以下步骤:基于比特流将指示仿射预测对当前块的适用性的仿射标志和指示基于当前块的子块的时间运动向量预测器的可用性的子块TMVP标志解码;基于所解码的仿射标志和所解码的子块TMVP标志,确定是否将指示是否对当前块应用预定合并模式的预定合并模式标志解码;基于关于是否将预定合并模式标志解码的确定,推导当前块的预测样本;以及基于当前块的预测样本来生成当前块的重构样本,其中,当仿射标志的值为1或子块TMVP标志的值为1时,确定将预定合并模式标志解码。
根据本公开的另一实施方式,提供了一种执行图像解码的解码设备。该解码设备包括:熵解码器,其基于比特流将指示仿射预测对当前块的适用性的仿射标志和指示基于当前块的子块的时间运动向量预测器的可用性的子块TMVP标志解码,并且基于所解码的仿射标志和所解码的子块TMVP标志来确定是否将指示是否对当前块应用预定合并模式的预定合并模式标志解码;预测器,其基于关于是否将预定合并模式标志解码的确定来推导当前块的预测样本;以及加法器,其基于当前块的预测样本来生成当前块的重构样本,其中,当仿射标志的值为1或子块TMVP标志的值为1时,确定将预定合并模式标志解码。
根据本公开的另一实施方式,提供了一种由编码设备执行的图像编码方法。该方法包括以下步骤:确定仿射预测对当前块的适用性和基于当前块的子块的时间运动向量预测器的可用性;基于关于仿射预测对当前块的适用性和基于当前块的子块的时间运动向量预测器的可用性的确定,确定是否对指示是否对当前块应用预定合并模式的预定合并模式标志进行编码;以及基于关于是否对预定合并模式标志进行编码的确定,对指示仿射预测对当前块的适用性的仿射标志、指示基于当前块的子块的时间运动向量预测器的可用性的子块TMVP标志和预定合并模式标志进行编码,其中,当仿射标志的值为1或子块TMVP标志的值为1时,确定对预定合并模式标志进行编码。
根据本公开的另一实施方式,提供了一种执行图像编码的编码设备。该编码设备包括:预测器,其确定仿射预测对当前块的适用性和基于当前块的子块的时间运动向量预测器的可用性,并且基于关于仿射预测对当前块的适用性和基于当前块的子块的时间运动向量预测器的可用性的确定来确定是否对指示是否对当前块应用预定合并模式的预定合并模式标志进行编码;以及熵编码器,其基于关于是否对预定合并模式标志进行编码的确定,对指示仿射预测对当前块的适用性的仿射标志、指示基于当前块的子块的时间运动向量预测器的可用性的子块TMVP标志和预定合并模式标志进行编码,其中,当仿射标志的值为1或子块TMVP标志的值为1时,确定对预定合并模式标志进行编码。
根据本公开的另一实施方式,提供了一种解码器可读存储介质,其存储关于指令的信息,所述指令使得视频解码设备执行根据部分实施方式的解码方法。
根据本公开的另一实施方式,提供了一种解码器可读存储介质,其存储关于指令的信息,所述指令使得视频解码设备执行根据实施方式之一的解码方法。根据一个实施方式的解码方法包括以下步骤:基于比特流将指示仿射预测对当前块的适用性的仿射标志和指示基于当前块的子块的时间运动向量预测器的可用性的子块TMVP标志解码;基于所解码的仿射标志和所解码的子块TMVP标志,确定是否将指示是否对当前块应用预定合并模式的预定合并模式标志解码;基于关于是否将预定合并模式标志解码的确定来推导当前块的预测样本;以及基于当前块的预测样本来生成当前块的重构样本,其中,当仿射标志的值为1或子块TMVP标志的值为1时,确定将预定合并模式标志解码。
有益效果
根据本公开,总体图像/视频压缩效率可改进。
根据本公开,可通过高级句法和低级句法设计改进图像编码效率。
根据本公开,可使用高级和/或低级句法元素基于子块执行运动预测来改进图像编码效率。
根据本公开,可使用高级和/或低级句法元素基于仿射模型执行运动预测来改进图像编码效率。
根据本公开,可通过基于仿射标志和子块TMVP标志确定是否对指示是否对当前块应用预定合并模式的预定合并模式标志进行解码来改进图像编码效率。
附图说明
图1示出本公开可应用于的视频/图像编码系统的示例。
图2示出本公开可应用于的视频/图像编码设备的配置。
图3示出本公开可应用于的视频/图像解码设备的配置。
图4是示出根据一个实施方式的编码设备的操作的流程图。
图5示出根据一个实施方式的编码设备的配置。
图6是示出根据一个实施方式的解码设备的操作的流程图。
图7示出根据一个实施方式的解码设备的配置。
图8示出本公开可应用于的内容流系统的示例。
具体实施方式
根据本公开的一个实施方式,提供了一种由解码设备执行的图像解码方法。该方法包括以下步骤:基于比特流将指示仿射预测对当前块的适用性的仿射标志和指示基于当前块的子块的时间运动向量预测器的可用性的子块TMVP标志解码;基于解码的仿射标志和解码的子块TMVP标志来确定是否将指示是否对当前块应用预定合并模式的预定合并模式标志解码;基于是否将预定合并模式标志解码的确定来推导当前块的预测样本;以及基于当前块的预测样本来生成当前块的重构样本,其中,当仿射标志的值为1或者子块TMVP标志的值为1时,确定将预定合并模式标志解码。
本发明的实施方式
本公开可按各种形式修改,将描述并且在附图中示出其特定实施方式。然而,这些实施方式并非旨在限制本公开。以下描述中使用的术语仅用于描述特定实施方式,而非旨在限制本公开。单数表达包括复数表达,只要清楚地不同阅读即可。诸如“包括”和“具有”的术语旨在指示存在以下描述中使用的特征、数量、步骤、操作、元件、组件或其组合,因此应该理解,不排除存在或添加一个或更多个不同的特征、数量、步骤、操作、元件、组件或其组合的可能性。
此外,在本公开中描述的附图中的各个组件为了方便描述不同特性功能而被独立地示出,并不意味着这些组件在单独的硬件或单独的软件中实现。例如,各个配置中的两个或更多个可被组合以形成一个配置,或者一个配置可被划分成多个配置。在不脱离本公开的精神的情况下,各个配置被集成和/或分离的实施方式也被包括在本公开的范围内。
以下,将参照附图详细描述本公开的示例性实施方式。以下,相同的标号用于附图中的相同组件,并且可省略相同组件的冗余描述。
图1示意性地示出本公开可应用于的视频/图像编码系统。
参照图1,视频/图像编码系统可包括第一设备(源装置)和第二设备(接收装置)。源装置可经由数字存储介质或网络将编码的视频/图像信息或数据以文件或流的形式传送至接收装置。
源装置可包括视频源、编码设备和发送器。接收装置可包括接收器、解码设备和渲染器。编码设备可被称为视频/图像编码设备,解码设备可被称为视频/图像解码设备。发送器可被包括在编码设备中。接收器可被包括在解码设备中。渲染器可包括显示器,并且显示器可被配置为单独的装置或外部组件。
视频源可通过捕获、合成或生成视频/图像的处理来获取视频/图像。视频源可包括视频/图像捕获装置和/或视频/图像生成装置。例如,视频/图像捕获装置可包括一个或更多个相机、包括先前捕获的视频/图像的视频/图像档案等。例如,视频/图像生成装置可包括计算机、平板计算机和智能电话,并且可(以电子方式)生成视频/图像。例如,可通过计算机等生成虚拟视频/图像。在这种情况下,视频/图像捕获处理可由生成相关数据的处理代替。
编码设备可对输入视频/图像进行编码。为了压缩和编码效率,编码设备可执行诸如预测、变换和量化的一系列过程。编码的数据(编码的视频/图像信息)可按比特流的形式输出。
发送器可通过数字存储介质或网络将以比特流的形式输出的编码的图像/图像信息或数据以文件或流的形式发送到接收装置的接收器。数字存储介质可包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送器可包括用于通过预定文件格式生成媒体文件的元件,并且可包括用于通过广播/通信网络传输的元件。接收器可接收/提取比特流并将所接收的比特流发送到解码设备。
解码设备可通过执行与编码设备的操作对应的诸如解量化、逆变换和预测的一系列过程将视频/图像解码。
渲染器可渲染解码的视频/图像。渲染的视频/图像可通过显示器显示。
本文献涉及视频/图像编码。例如,本文献中公开的方法/实施方式可应用于通用视频编码(VVC)、EVC(基本视频编码)标准、AOMedia Video 1(AV1)标准、第2代音频视频编码标准(AVS2)或下一代视频/图像编码标准(例如,H.267或H.268等)中公开的方法。
本文献提出了视频/图像编码的各种实施方式,并且除非另外提及,否则实施方式可彼此组合执行。
在本文献中,视频可指随时间的一系列图像。画面通常是指表示特定时区中的一个图像的单元,切片/拼块是在编码时构成画面的部分的单元。切片/拼块可包括一个或更多个编码树单元(CTU)。一个画面可由一个或更多个切片/拼块组成。一个画面可由一个或更多个拼块组组成。一个拼块组可包括一个或更多个拼块。图块可表示画面中的拼块内的CTU行的矩形区域。拼块可被分割成多个图块,各个图块由拼块内的一个或更多个CTU行组成。未被分割成多个图块的拼块也可被称为图块。图块扫描是分割画面的CTU的特定顺序排序,其中在图块中的CTU光栅扫描中CTU连续地排序,在拼块的图块的光栅扫描中拼块内的图块连续地排序,并且在画面的拼块的光栅扫描中画面中的拼块连续地排序。拼块是画面中的特定拼块列和特定拼块行内的CTU的矩形区域。拼块列是高度等于画面的高度并且宽度由画面参数集中的句法元素指定的CTU的矩形区域。拼块行是高度由画面参数集中的句法元素指定并且宽度等于画面的宽度的CTU的矩形区域。拼块扫描是分割画面的CTU的特定顺序排序,其中在拼块的CTU光栅扫描中CTU连续地排序,而在画面的拼块的光栅扫描中画面中的拼块连续地排序。切片包括可排他地包含在单个NAL单元中的画面的整数数量的图块。切片可由多个完整拼块或仅一个拼块的完整图块的连续序列组成。在本文献中,拼块组和切片可互换使用。例如,在本文献中,拼块组/拼块组头可被称为切片/切片头。
像素或画素可意指构成一个画面(或图像)的最小单元。另外,“样本”可用作与像素对应的术语。样本通常可表示像素或像素值,并且可仅表示亮度分量的像素/像素值或仅表示色度分量的像素/像素值。
单元可表示图像处理的基本单位。单元可包括画面的特定区域和与该区域有关的信息中的至少一个。一个单元可包括一个亮度块和两个色度(例如,cb、cr)块。在一些情况下,单元可与诸如块或区域的术语互换使用。在一般情况下,M×N块可包括M列和N行的样本(或样本阵列)或变换系数的集合(或阵列)。
在本文献中,术语“/”和“,”应该被解释为指示“和/或”。例如,表达“A/B”可意指“A和/或B”。此外,“A、B”可意指“A和/或B”。此外,“A/B/C”可意指“A、B和/或C中的至少一个”。另外,“A/B/C”可意指“A、B和/或C中的至少一个”。
此外,在本文献中,术语“或”应该被解释为指示“和/或”。例如,表达“A或B”可包括1)仅A、2)仅B和/或3)A和B二者。换言之,本文献中的术语“或”应该被解释为指示“另外地或另选地”。
图2是示出本公开的实施方式可应用于的视频/图像编码设备的配置的示意图。以下,视频编码设备可包括图像编码设备。
参照图2,编码设备200包括图像分割器210、预测器220、残差处理器230和熵编码器240、加法器250、滤波器260和存储器270。预测器220可包括帧间预测器221和帧内预测器222。残差处理器230可包括变换器232、量化器233、解量化器234和逆变换器235。残差处理器230还可包括减法器231。加法器250可被称为重构器或重构块生成器。根据实施方式,图像分割器210、预测器220、残差处理器230、熵编码器240、加法器250和滤波器260可由至少一个硬件组件(例如,编码器芯片组或处理器)配置。另外,存储器270可包括解码画面缓冲器(DPB),或者可由数字存储介质配置。硬件组件还可包括存储器270作为内部/外部组件。
图像分割器210可将输入到编码设备200的输入图像(或者画面或帧)分割成一个或更多个处理器。例如,处理器可被称为编码单元(CU)。在这种情况下,编码单元可根据四叉树二叉树三叉树(QTBTTT)结构从编码树单元(CTU)或最大编码单元(LCU)递归地分割。例如,一个编码单元可基于四叉树结构、二叉树结构和/或三元结构被分割成深度更深的多个编码单元。在这种情况下,例如,可首先应用四叉树结构,稍后可应用二叉树结构和/或三元结构。另选地,可首先应用二叉树结构。可基于不再分割的最终编码单元来执行根据本公开的编码过程。在这种情况下,根据图像特性基于编码效率,最大编码单元可用作最终编码单元,或者如果需要,编码单元可被递归地分割成深度更深的编码单元并且具有最优大小的编码单元可用作最终编码单元。这里,编码过程可包括预测、变换和重构的过程(将稍后描述)。作为另一示例,处理器还可包括预测单元(PU)或变换单元(TU)。在这种情况下,预测单元和变换单元可从上述最终编码单元拆分或分割。预测单元可以是样本预测的单元,变换单元可以是用于推导变换系数的单元和/或用于从变换系数推导残差信号的单元。
在一些情况下,单元可与诸如块或区域的术语互换使用。在一般情况下,M×N块可表示由M列和N行组成的样本或变换系数的集合。样本通常可表示像素或像素值,可仅表示亮度分量的像素/像素值或者仅表示色度分量的像素/像素值。样本可用作与像素或画素的一个画面(或图像)对应的术语。
在编码设备200中,从输入图像信号(原始块、原始样本阵列)减去从帧间预测器221或帧内预测器222输出的预测信号(预测块、预测样本阵列)以生成残差信号(残差块、残差样本阵列),并且所生成的残差信号被发送到变换器232。在这种情况下,如所示,在编码器200中从输入图像信号(原始块、原始样本阵列)减去预测信号(预测块、预测样本阵列)的单元可被称为减法器231。预测器可对要处理的块(以下,称为当前块)执行预测并且生成包括当前块的预测样本的预测块。预测器可确定基于当前块或CU应用帧内预测还是帧间预测。如在各个预测模式的描述中稍后描述的,预测器可生成与预测有关的各种类型的信息(例如,预测模式信息)并将所生成的信息发送到熵编码器240。关于预测的信息可在熵编码器240中编码并以比特流的形式输出。
帧内预测器222可参考当前画面中的样本来预测当前块。根据预测模式,所参考的样本可位于当前块附近或者可隔开。在帧内预测中,预测模式可包括多个非定向模式和多个定向模式。例如,非定向模式可包括DC模式和平面模式。例如,根据预测方向的详细程度,定向模式可包括33个定向预测模式或65个定向预测模式。然而,这仅是示例,可根据设置使用更多或更少的定向预测模式。帧内预测器222可使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器221可基于参考画面上运动向量所指定的参考块(参考样本阵列)来推导当前块的预测块。这里,为了减少在帧间预测模式下发送的运动信息量,可基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为单位预测运动信息。运动信息可包括运动向量和参考画面索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可包括存在于当前画面中的空间邻近块和存在于参考画面中的时间邻近块。包括参考块的参考画面和包括时间邻近块的参考画面可相同或不同。时间邻近块可被称为并置参考块、并置CU(colCU)等,并且包括时间邻近块的参考画面可被称为并置画面(colPic)。例如,帧间预测器221可基于邻近块来配置运动信息候选列表并且生成指示哪一候选用于推导当前块的运动向量和/或参考画面索引的信息。可基于各种预测模式执行帧间预测。例如,在跳过模式和合并模式的情况下,帧间预测器221可使用邻近块的运动信息作为当前块的运动信息。在跳过模式下,与合并模式不同,可不发送残差信号。在运动向量预测(MVP)模式的情况下,邻近块的运动向量可用作运动向量预测器,并且可通过用信号通知运动向量差来指示当前块的运动向量。
预测器220可基于下面描述的各种预测方法来生成预测信号。例如,预测器可不仅应用帧内预测或帧间预测以预测一个块,而且同时应用帧内预测和帧间预测二者。这可被称为组合帧间和帧内预测(CIIP)。另外,预测器可基于帧内块复制(IBC)预测模式或调色板模式来预测块。IBC预测模式或调色板模式可用于游戏等的内容图像/视频编码,例如屏幕内容编码(SCC)。IBC基本上在当前画面中执行预测,但是可与帧间预测相似地执行,使得在当前画面中推导参考块。即,IBC可使用本文献中描述的至少一个帧间预测技术。调色板模式可被视为帧内编码或帧内预测的示例。当应用调色板模式时,可基于关于调色板表和调色板索引的信息用信号通知画面内的样本值。
由预测器(包括帧间预测器221和/或帧内预测器222)生成的预测信号可用于生成重构信号或生成残差信号。变换器232可通过对残差信号应用变换技术来生成变换系数。例如,变换技术可包括离散余弦变换(DCT)、离散正弦变换(DST)、Karhunen–Loève变换(KLT)、基于图形的变换(GBT)或条件非线性变换(CNT)中的至少一个。这里,当像素之间的关系信息由图形表示时,GBT意指从图形获得的变换。CNT是指基于使用所有先前重构的像素生成的预测信号生成的变换。另外,变换处理可应用于具有相同大小的正方形像素块或者可应用于正方形以外的具有可变大小的块。
量化器233可将变换系数量化并将它们发送到熵编码器240,并且熵编码器240可对量化的信号(关于量化的变换系数的信息)进行编码并输出比特流。关于量化的变换系数的信息可被称为残差信息。量化器233可基于系数扫描顺序将块类型量化的变换系数重排为一维向量形式,并且基于一维向量形式的量化的变换系数来生成关于量化的变换系数的信息。可生成关于变换系数的信息。熵编码器240可执行例如指数Golomb、上下文自适应可变长度编码(CAVLC)、上下文自适应二进制算术编码(CABAC)等的各种编码方法。熵编码器240可对量化的变换系数以外的视频/图像重构所需的信息(例如,句法元素的值等)一起或单独地进行编码。编码的信息(例如,编码的视频/图像信息)可按比特流的形式以NAL(网络抽象层)为单位发送或存储。视频/图像信息还可包括关于各种参数集的信息,例如自适应参数集(APS)、画面参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)。另外,视频/图像信息还可包括一般约束信息。在本文献中,从编码设备发送/用信号通知给解码设备的信息和/或句法元素可被包括在视频/画面信息中。视频/图像信息可通过上述编码过程编码并被包括在比特流中。比特流可经由网络发送或者可被存储在数字存储介质中。网络可包括广播网络和/或通信网络,并且数字存储介质可包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送从熵编码器240输出的信号的发送器(未示出)和/或存储该信号的存储单元(未示出)可被包括作为编码设备200的内部/外部元件,并且另选地,发送器可被包括在熵编码器240中。
从量化器233输出的量化的变换系数可用于生成预测信号。例如,可通过经由解量化器234和逆变换器235对量化的变换系数应用解量化和逆变换来重构残差信号(残差块或残差样本)。加法器250将重构的残差信号与从帧间预测器221或帧内预测器222输出的预测信号相加以生成重构信号(重构画面、重构块、重构样本阵列)。如果要处理的块不存在残差(例如,应用跳过模式的情况),则预测块可用作重构块。加法器250可被称为重构器或重构块生成器。如下所述,所生成的重构信号可用于当前画面中要处理的下一块的帧内预测并且可通过滤波用于下一画面的帧间预测。
此外,可在画面编码和/或重构期间应用与色度缩放的亮度映射(LMCS)。
滤波器260可通过对重构信号应用滤波来改进主观/客观图像质量。例如,滤波器260可通过对重构画面应用各种滤波方法来生成修改的重构画面并将修改的重构画面存储在存储器270(具体地,存储器270的DPB)中。例如,各种滤波方法可包括去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。滤波器260可生成与滤波有关的各种类型的信息并且将所生成的信息发送到熵编码器240,如在各个滤波方法的描述中稍后描述的。与滤波有关的信息可由熵编码器240编码并以比特流的形式输出。
发送到存储器270的修改的重构画面可用作帧间预测器221中的参考画面。当通过编码设备应用帧间预测时,可避免编码设备200与解码设备之间的预测失配并且编码效率可改进。
存储器270DPB的DPB可存储用作帧间预测器221中的参考画面的修改的重构画面。存储器270可存储推导(或编码)当前画面中的运动信息的块的运动信息和/或画面中已经重构的块的运动信息。所存储的运动信息可被发送到帧间预测器221并用作空间邻近块的运动信息或时间邻近块的运动信息。存储器270可存储当前画面中的重构块的重构样本并且可将重构样本传送至帧内预测器222。
图3是示出本公开的实施方式可应用于的视频/图像解码设备的配置的示意图。
参照图3,解码设备300可包括熵解码器310、残差处理器320、预测器330、加法器340、滤波器350和存储器360。预测器330可包括帧内预测器331和帧间预测器332。残差处理器320可包括解量化器321和逆变换器321。根据实施方式,熵解码器310、残差处理器320、预测器330、加法器340和滤波器350可由硬件组件(例如,解码器芯片组或处理器)配置。另外,存储器360可包括解码画面缓冲器(DPB)或者可由数字存储介质配置。硬件组件还可包括存储器360作为内部/外部组件。
当输入包括视频/图像信息的比特流时,解码设备300可重构与在图2的编码设备中处理视频/图像信息的处理对应的图像。例如,解码设备300可基于从比特流获得的块分割相关信息来推导单元/块。解码设备300可使用编码设备中应用的处理器来执行解码。因此,例如,解码的处理器可以是编码单元,并且编码单元可根据四叉树结构、二叉树结构和/或三叉树结构从编码树单元或最大编码单元分割。可从编码单元推导一个或更多个变换单元。通过解码设备300解码和输出的重构图像信号可通过再现设备再现。
解码设备300可接收从图2的编码设备以比特流的形式输出的信号,并且所接收的信号可通过熵解码器310解码。例如,熵解码器310可解析比特流以推导图像重构(或画面重构)所需的信息(例如,视频/图像信息)。视频/图像信息还可包括关于各种参数集的信息,例如自适应参数集(APS)、画面参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)。另外,视频/图像信息还可包括一般约束信息。解码设备还可基于关于参数集的信息和/或一般约束信息将画面解码。本文献中稍后描述的用信号通知/接收的信息和/或句法元素可通过解码过程解码并从比特流获得。例如,熵解码器310基于诸如指数Golomb编码、CAVLC或CABAC的编码方法对比特流中的信息进行解码,并且输出图像重构所需的句法元素和残差的变换系数的量化值。更具体地,CABAC熵解码方法可接收与比特流中的各个句法元素对应的信元(bin),使用解码目标句法元素信息、解码目标块的解码信息或在先前阶段中解码的符号/信元的信息来确定上下文模型,并且通过根据所确定的上下文模型预测信元出现的概率对信元执行算术解码,并且生成与各个句法元素的值对应的符号。在这种情况下,CABAC熵解码方法可在确定上下文模型之后通过将解码的符号/信元的信息用于下一符号/信元的上下文模型来更新上下文模型。熵解码器310所解码的信息当中与预测有关的信息可被提供给预测器(帧间预测器332和帧内预测器331),并且在熵解码器310中执行了熵解码的残差值(即,量化的变换系数和相关参数信息)可被输入到残差处理器320。残差处理器320可推导残差信号(残差块、残差样本、残差样本阵列)。另外,熵解码器310所解码的信息当中关于滤波的信息可被提供给滤波器350。此外,用于接收从编码设备输出的信号的接收器(未示出)还可被配置成解码设备300的内部/外部元件,或者接收器可以是熵解码器310的组件。此外,根据本文献的解码设备可被称为视频/图像/画面解码设备,并且解码设备可被分类为信息解码器(视频/图像/画面信息解码器)和样本解码器(视频/图像/画面样本解码器)。信息解码器可包括熵解码器310,并且样本解码器可包括解量化器321、逆变换器322、加法器340、滤波器350、存储器360、帧间预测器332和帧内预测器331中的至少一个。
解量化器321可将量化的变换系数解量化并输出变换系数。解量化器321可按二维块形式重排量化的变换系数。在这种情况下,可基于在编码设备中执行的系数扫描顺序来执行重排。解量化器321可使用量化参数(例如,量化步长信息)对量化的变换系数执行解量化并且获得变换系数。
逆变换器322对变换系数逆变换以获得残差信号(残差块、残差样本阵列)。
预测器可对当前块执行预测并生成包括当前块的预测样本的预测块。预测器可基于从熵解码器310输出的关于预测的信息来确定对当前块应用帧内预测还是帧间预测并且可确定特定帧内/帧间预测模式。
预测器320可基于下述各种预测方法来生成预测信号。例如,预测器不仅可应用帧内预测或帧间预测以预测一个块,而且可同时应用帧内预测和帧间预测。这可被称为组合帧间和帧内预测(CIIP)。另外,预测器可基于帧内块复制(IBC)预测模式或调色板模式来预测块。IBC预测模式或调色板模式可用于游戏等的内容图像/视频编码,例如屏幕内容编码(SCC)。IBC基本上执行当前画面中的预测,但是可与帧间预测相似地执行,使得在当前画面中推导参考块。即,IBC可使用本文献中描述的至少一种帧间预测技术。调色板模式可被视为帧内编码或帧内预测的示例。当应用调色板模式时,可基于关于调色板表和调色板索引的信息用信号通知画面内的样本值。
帧内预测器331可参考当前画面中的样本来预测当前块。根据预测模式,所参考的样本可位于当前块附近或者可隔开。在帧内预测中,预测模式可包括多个非定向模式和多个定向模式。帧内预测器331可使用应用于邻近块的预测模式来确定应用于当前块的预测模式。帧内预测器331可参考当前画面中的样本来预测当前块。根据预测模式,所参考的样本可位于当前块附近或者可隔开。在帧内预测中,预测模式可包括多个非定向模式和多个定向模式。帧内预测器331可使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器332可基于参考画面上运动向量所指定的参考块(参考样本阵列)来推导当前块的预测块。在这种情况下,为了减少在帧间预测模式下发送的运动信息量,可基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为单位预测运动信息。运动信息可包括运动向量和参考画面索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可包括存在于当前画面中的空间邻近块和存在于参考画面中的时间邻近块。例如,帧间预测器332可基于邻近块来配置运动信息候选列表并且基于所接收的候选选择信息来推导当前块的运动向量和/或参考画面索引。可基于各种预测模式来执行帧间预测,并且关于预测的信息可包括指示当前块的帧间预测模式的信息。
加法器340可通过将所获得的残差信号与从预测器(包括帧间预测器332和/或帧内预测器331)输出的预测信号(预测块、预测样本阵列)相加来生成重构信号(重构画面、重构块、重构样本阵列)。如果要处理的块不存在残差,例如当应用跳过模式时,预测块可用作重构块。
加法器340可被称为重构器或重构块生成器。所生成的重构信号可用于当前画面中要处理的下一块的帧内预测,可如下所述通过滤波输出,或者可用于下一画面的帧间预测。
此外,可在画面解码处理中应用与色度缩放的亮度映射(LMCS)。
滤波器350可通过对重构信号应用滤波来改进主观/客观图像质量。例如,滤波器350可通过对重构画面应用各种滤波方法来生成修改的重构画面并且将修改的重构画面存储在存储器360(具体地,存储器360的DPB)中。例如,各种滤波方法可包括去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。
存储在存储器360的DPB中的(修改的)重构画面可用作帧间预测器332中的参考画面。存储器360可存储推导(或解码)当前画面中的运动信息的块的运动信息和/或画面中已经重构的块的运动信息。所存储的运动信息可被发送到帧间预测器260以用作空间邻近块的运动信息或时间邻近块的运动信息。存储器360可存储当前画面中的重构块的重构样本并将重构样本传送至帧内预测器331。
在本公开中,在编码设备200的滤波器260、帧间预测器221和帧内预测器222中描述的实施方式可与解码设备300的滤波器350、帧间预测器332和帧内预测器331相同或分别与之对应应用。这也可适用于单元332和帧内预测器331。
如上所述,在执行视频编码时,执行预测以增强压缩效率。可通过预测生成包括当前块(即,目标编码块)的预测样本的预测块。在这种情况下,预测块包括空间域(或像素域)中的预测样本。预测块在编码设备和解码设备中相同地推导。编码设备可通过用信号向解码设备通知关于原始块(而非原始块的原始样本值本身)与预测块之间的残差的信息(残差信息)来增强图像编码效率。解码设备可基于残差信息来推导包括残差样本的残差块,可通过将残差块和预测块相加来生成包括重构样本的重构块,并且可生成包括重构块的重构画面。
残差信息可通过变换过程和量化过程来生成。例如,编码设备可推导原始块与预测块之间的残差块,可通过对包括在残差块中的残差样本(残差样本阵列)执行变换过程来推导变换系数,可通过对变换系数执行量化过程来推导量化的变换系数,并且可将相关残差信息(通过比特流)用信号通知给解码设备。在这种情况下,残差信息可包括诸如量化的变换系数的值信息、位置信息、变换方案、变换核心和量化参数的信息。解码设备可基于残差信息来执行解量化/逆变换过程并且可推导残差样本(或残差块)。解码设备可基于预测块和残差块来生成重构画面。此外,编码设备可通过对供后续画面的帧间预测参考的量化的变换系数进行解量化/逆变换来推导残差块,并且可生成重构画面。
在一个实施方式中,为了控制基于子块的运动预测,可使用指示基于子块的时间运动向量预测器的可用性的子块TMVP标志。子块TMVP标志可在序列参数集(SPS)级别用信号通知,并且可控制基于子块的运动预测的开/关。如下表1所示,子块TMVP标志可被称为sps_sbtmvp_enabled_flag。
另外,为了控制仿射运动预测方法,可使用指示仿射预测对当前块的适用性的仿射标志。仿射标志可在SPS级别用信号通知,并且可控制仿射预测的开/关。如下表1所示,仿射标志可被称为sps_affine_enabled_flag。当仿射标志的值为1时,可通过另外用信号通知仿射类型标志来确定6参数仿射预测的可用性。
下表1中示出在SPS级别用信号通知的句法的一个示例。
[表1]
在一个实施方式中,根据低级编码句法,如下表2所示,如果当前块(编码单元)的merge_flag为1,则可基于当前块的条件(例如,块大小或块形状)用信号通知用于指示对当前块应用仿射合并还是正常合并的标志(例如,合并仿射标志)。例如,合并仿射标志可由merge_affine_flag表示。在一个示例中,当在SPS级别用信号通知的仿射标志的值为0并且在编码单元级别用信号通知的merge_flag的值为1时,可确定对当前块应用正常合并而无需附加句法元素的信令。
下表2中示出在编码单元级别用信号通知的句法的一个示例。
[表2]
/>
/>
此外,当应用表1的高级句法设计和表2的低级句法设计时,如果ATMVP用作仿射合并候选,则可能发生设计问题、逻辑问题和概念问题。在一个示例中,当在SPS级别用信号通知的仿射标志的值为0并且在SPS级别用信号通知的子块TMVP标志的值为1时,即使信令指示在SPS级别ATMVP可用,ATMVP候选也可根本不用作候选。除了上述设计问题和逻辑问题之外,可存在概念问题。ATMVP是基于子块(在一个示例中,SubPu)的运动预测方法;ATMVP的一个目的是通过使用运动预测候选作为执行基于子块的预测的仿射合并模式的候选以区分基于非子块的(在一个示例中,基于非SubPu的)运动预测候选与正常合并中基于子块的运动预测候选,来确定当前块的合并是子块合并还是非子块合并。然而,尽管有此目的,根据上表2的低级句法设计表明,根据是否使用仿射合并来控制子块ATMVP。
为了补充设计问题、逻辑问题和概念问题,在一个实施方式中,可基于下表3至表11中的至少一个来提供高级和/或低级句法设计。
在一个实施方式中,可在SPS级别用信号通知用于控制基于子块的运动预测的标志。用于控制基于子块的运动预测的标志可由sps_subpumvp_enabled_flag表示,并且可用于确定基于子块的运动预测的开/关。当sps_subpumvp_enabled_flag的值为1时,可如下表3所示用信号通知affine_enabled_flag和sbtmvp_enabled_flag。
[表3]
/>
当使用表3的SPS级别句法设计时,可如下表4所示确定仿射预测和ATMVP的可用性。在表4中,1指示对应方法可用,而0指示对应方法不可用。
[表4]
在一个实施方式中,可提供用于基于sps_subpumvp_enabled_flag控制仿射预测和ATMVP二者的高级句法设计。根据本实施方式,如果sps_subpumvp_enabled_flag的值为1,则可确定仿射预测和ATMVP二者可用。根据本实施方式的高级句法设计可如下表5所示。
[表5]
在一个实施方式中,根据表5,可提供一种甚至在各个切片单元中使用切片头句法中的slice_subpumvp_enabled_flag来具体地控制ATMVP的可用性以及基于包括在高级句法中的sps_subpumvp_enabled_flag来控制仿射预测和ATMVP二者的方法。根据本实施方式的切片头级别的句法可如下表6所示。
[表6]
在一个实施方式中,当不使用仿射预测方法并且sps_sbtmvp_enabled_flag为1时,可提供一种用信号通知merge_affine_flag并且仅使用ATMVP候选来配置运动候选而不包括仿射候选的方法。示出本实施方式的低级句法的示例示出于下表7中。
[表7]
在表7中,当sps_affine_enabled_flag的值为1或者sps_sbtmvp_enabled_flag的值为1时,可确定将指示是否应用合并仿射模式的merge_affine_flag解码。
在一个实施方式中,当sps_affine_enabled_flag的值为1或者sps_sbtmvp_enabled_flag的值为1时,可确定将指示是否应用合并子块模式的合并子块标志(merge_subblock_flag)解码。在合并子块模式下,可以子块为单位确定合并候选。
在表7中,当当前块的宽度(cbWidth)和高度(cbHeight)分别大于或等于8,并且sps_affine_enabled_flag的值为1,或者sps_sbtmvp_enabled_flag的值为1时,可确定将合并仿射标志(merge_affine_flag)解码。
在一个实施方式中,当当前块的子块的合并候选的最大数量大于0时,可确定将预定合并模式标志解码。
在一个实施方式中,当仿射标志的值为1或者子块TMVP标志的值为1时,当前块的子块的合并候选的最大数量可大于0。
在一个实施方式中,可基于是否满足语句if(MaxNumSubblockMergeCand>0&&cbWidth>=8&&cbHeight>=8)来确定是否将预定合并模式标志解码。MaxNumSubblockMergeCand可表示子块的合并候选的最大数量,cbWidth可表示当前块的宽度,并且cbHeight可表示当前块的高度。
在表7中,当sps_affine_enabled_flag的值为0并且sps_sbtmvp_enabled_flag的值为1时,merge_affine_idx可不用信号通知,而是可被推断为0。根据表7的实施方式,仿射预测和ATMVP的可用性可如表8所示确定。
[表8]
在一个实施方式中,当不使用仿射预测并且sps_sbtmvp_enabled_flag的值为1时,可提供一种用于控制ATMVP用作正常合并候选的方法。根据本实施方式,仿射预测和ATMVP的可用性可如下表9所示确定。
[表9]
在一个实施方式中,可提供一种用于设计仅当affine_enabled_flag的值为1时才用信号通知sps_sbtmvp_enabled_flag的高级句法的方法。此方法可旨在考虑被设计为使得ATMVP用作仿射合并候选的低级编码工具的结构,并且当sps_affine_enabled_flag的值为0时不使用ATMVP。根据本实施方式的高级句法的示例示出于下表10中。
[表10]
当使用表10的SPS级别句法设计时,仿射预测和ATMVP的可用性可如表11所示确定。
[表11]
图4是示出根据一个实施方式的编码设备的操作的流程图,图5示出根据一个实施方式的编码设备的配置。
根据图4和图5的编码设备可执行与根据图6和图7的解码设备对应的操作。因此,参照图6和图7描述的解码设备的操作可按照与根据图4和图5的编码设备相同的方式应用。
图4所示的各个步骤可由图2所示的编码设备200执行。更具体地,S400至S410步骤可由图2中公开的预测器220执行,S420步骤可由图2中公开的熵编码器240执行。此外,根据S400至S420步骤的操作基于参照图3给出的部分描述。因此,将省略或简化与参照图2和图3描述的细节重复的具体描述。
如图5所示,根据一个实施方式的编码设备可包括预测器220和熵编码器240。然而,根据情况,并非图5所示的所有构成元件均可为编码设备的必要元件,编码设备可使用比图5所示那些数量更多或更少的构成元件来实现。
在根据一个实施方式的编码设备中,预测器220和熵编码器240可由相应芯片实现,或者至少两个或更多个构成元件可使用单个芯片来实现。
根据一个实施方式的编码设备可确定仿射预测对当前块的适用性和基于当前块的子块的时间运动向量预测器的可用性S400。更具体地,编码设备的预测器220可确定仿射预测对当前块的适用性和基于当前块的子块的时间运动向量预测器的可用性。
根据一个实施方式的编码设备可基于关于仿射预测对当前块的适用性和基于当前块的子块的时间运动向量预测器的可用性的确定来确定是否对指示是否对当前块应用预定合并模式的预定合并模式标志进行编码S410。更具体地,编码设备的预测器220可基于关于仿射预测对当前块的适用性和基于当前块的子块的时间运动向量预测器的可用性的确定来确定是否对指示是否对当前块应用预定合并模式的预定合并模式标志进行编码。
在一个示例中,预定合并模式可以是合并仿射模式或合并子块模式,并且预定合并模式标志可以是合并仿射标志或合并子块标志。合并仿射标志可由merge_affine_flag表示,并且合并子块标志可由merge_subblock_flag表示。
根据一个实施方式的编码设备可基于关于是否对预定合并模式标志进行编码的确定来对指示仿射预测对当前块的适用性的仿射标志、指示基于当前块的子块的时间运动向量预测器的可用性的子块TMVP标志和预定合并模式标志进行编码S420。更具体地,编码设备的熵编码器240可基于关于是否对预定合并模式标志进行编码的确定来对指示仿射预测对当前块的适用性的仿射标志、指示基于当前块的子块的时间运动向量预测器的可用性的子块TMVP标志和预定合并模式标志进行编码。
在一个实施方式中,当仿射标志的值为1或者子块TMVP标志的值为1时,可确定对预定合并模式标志进行编码。
在一个实施方式中,当当前块的宽度和高度分别大于或等于8,满足要求仿射标志的值为1的第一条件,或者满足要求子块TMVP标志的值为1的第二条件时,可确定对预定合并模式标志进行编码。
在一个实施方式中,是否对预定合并模式标志进行编码可由下式1确定。
[式1]
if((sps_affine_enabled_flag&&cbWidth>=8&&cbHeight>=8)||sps_sbtmvp_enabled_flag)
在式1中,sps_affine_enabled_flag可表示仿射标志,cbWidth可表示当前块的宽度,cbHeight可表示当前块的高度,sps_sbtmvp_enabled_flag可表示子块TMVP标志。
在一个实施方式中,预定合并模式标志可以是指示仿射合并模式对当前块的适用性的合并仿射标志或指示合并模式以子块为单位对当前块的适用性的合并子块标志。
在一个实施方式中,当当前块的子块的合并候选的最大数量大于0时,可确定对预定合并模式标志进行编码。
在一个实施方式中,当仿射标志的值为1或者子块TMVP标志的值为1时,当前块的子块的合并候选的最大数量可大于0。
在一个实施方式中,可基于式2确定是否对预定合并模式标志进行编码。
[式2]
if(MaxNumSubblockMergeCand>0&&cbWidth>=8&&cbHeight>=8)
在式2中,MaxNumSubblockMergeCand可表示子块的合并候选的最大数量,cbWidth可表示当前块的宽度,cbHeight可表示当前块的高度。
根据图4和图5的编码设备和操作该编码设备的方法,该编码设备可确定仿射预测对当前块的适用性和基于当前块的子块的时间运动向量预测器的可用性S400;基于关于仿射预测对当前块的适用性和基于当前块的子块的时间运动向量预测器的可用性的确定来确定是否对指示是否对当前块应用预定合并模式的预定合并模式标志进行编码S410;并且基于关于是否对预定合并模式标志进行编码的确定,对指示仿射预测对当前块的适用性的仿射标志、指示基于当前块的子块的时间运动向量预测器的可用性的子块TMVP标志和预定合并模式标志进行编码S420,其中,当仿射标志的值为1或者子块TMVP标志的值为1时,确定对预定合并模式标志进行编码。换言之,可通过基于仿射标志和子块TMVP标志确定是否将指示是否对当前块应用预定合并模式的预定合并模式标志解码来改进图像编码效率。
图6是示出根据一个实施方式的解码设备的操作的流程图,图7示出根据一个实施方式的解码设备的配置。
图6所示的各个步骤可由图3所示的解码设备300执行。更具体地,S600和S610步骤可由图3中公开的熵解码器310执行,S630步骤可由图3中公开的加法器340执行。此外,根据S600至S630步骤的操作基于参照图3给出的部分描述。因此,将省略或简化与参照图3描述的细节重复的具体描述。
如图7所示,根据一个实施方式的解码设备可包括熵解码器310、预测器330和加法器340。然而,根据情况,并非图7所示的所有构成元件均可为解码设备的必要元件,解码设备可使用比图7所示那些数量更多或更少的构成元件来实现。
在根据一个实施方式的解码设备中,熵解码器310、预测器330和加法器340可由相应芯片实现,或者至少两个或更多个构成元件可使用单个芯片来实现。
根据一个实施方式的解码设备可基于比特流将指示仿射预测对当前块的适用性的仿射标志和指示基于当前块的子块的时间运动向量预测器的可用性的子块TMVP标志解码S600。更具体地,解码设备的熵解码器310可基于比特流将指示仿射预测对当前块的适用性的仿射标志和指示基于当前块的子块的时间运动向量预测器的可用性的子块TMVP标志解码。
在一个示例中,仿射标志可由sps_affine_enabled_flag表示,子块TMVP标志可由sps_sbtmvp_enabled_flag表示。子块TMVP标志可被称为子PU TMVP标志。
在一个示例中,可在SPS级别用信号通知仿射标志和子块TMVP标志。
根据一个实施方式的解码设备可基于解码的仿射标志和解码的子块TMVP标志来确定是否将指示是否对当前块应用预定合并模式的预定合并模式标志解码S610。更具体地,解码设备的熵解码器310可基于解码的仿射标志和解码的子块TMVP标志来确定是否将指示是否对当前块应用预定合并模式的预定合并模式标志解码。
在一个示例中,预定合并模式可以是合并仿射模式或合并子块模式,预定合并模式标志可以是合并仿射标志或合并子块标志。合并仿射标志可由merge_affine_flag表示,合并子块标志可由merge_subblock_flag表示。
根据一个实施方式的解码设备可基于关于是否将预定合并模式标志解码的确定来推导当前块的预测样本S620。更具体地,解码设备的预测器330可基于关于是否将预定合并模式标志解码的确定来推导当前块的预测样本。
根据一个实施方式的解码设备可基于关于是否将预定合并模式标志解码的确定来推导要应用于当前块的预测模式并且基于推导的预测模式推导当前块的预测样本。
根据一个实施方式的解码设备可基于当前块的预测样本来生成当前块的重构样本S630。更具体地,解码设备的加法器340可基于当前块的预测样本来生成当前块的重构样本。
在一个实施方式中,当仿射标志的值为1或者子块TMVP标志的值为1时,可确定将预定合并模式标志解码。
在一个示例中,当sps_affine_enabled_flag的值为1或sps_sbtmvp_enabled_flag的值为1时,可确定将预定合并模式标志解码。
在另一示例中,当sps_affine_enabled_flag的值为1或sps_sbtmvp_enabled_flag的值为1时,可确定将合并仿射标志(merge_affine_flag)解码。
在另一示例中,当sps_affine_enabled_flag的值为1或sps_sbtmvp_enabled_flag的值为1时,可确定将合并子块标志(merge_subblock_flag)解码。
在一个实施方式中,当当前块的宽度和高度分别大于或等于8,满足要求仿射标志的值为1的第一条件,或者满足要求子块TMVP标志的值为1的第二条件时,可确定将预定合并模式标志解码。
在一个实施方式中,可基于下式3确定是否将预定合并模式标志解码。
[式3]
if((sps_affine_enabled_flag&&cbWidth>=8&&cbHeight>=8)||sps_sbtmvp_enabled_flag)
在式3中,sps_affine_enabled_flag可表示仿射标志,cbWidth可表示当前块的宽度,cbHeight可表示当前块的高度,sps_sbtmvp_enabled_flag可表示子块TMVP标志。
在一个实施方式中,当当前块的子块的合并候选的最大数量大于0时,可确定将预定合并模式标志解码。
在一个实施方式中,当仿射标志的值为1或子块TMVP标志的值为1时,当前块的子块的合并候选的最大数量可大于0。
在一个实施方式中,可基于式4确定是否将预定合并模式标志解码。
[式4]
if(MaxNumSubblockMergeCand>0&&cbWidth>=8&&cbHeight>=8)
在式4中,MaxNumSubblockMergeCand可表示子块的合并候选的最大数量,cbWidth可表示当前块的宽度,cbHeight可表示当前块的高度。
根据图6和图7的解码设备和操作该解码设备的方法,该解码设备可基于比特流将指示仿射预测对当前块的适用性的仿射标志和指示基于当前块的子块的时间运动向量预测器的可用性的子块TMVP标志解码S600;基于解码的仿射标志和解码的子块TMVP标志来确定是否将指示是否对当前块应用预定合并模式的预定合并模式标志解码S610;基于关于是否将预定合并模式标志解码的确定来推导当前块的预测样本S620;以及基于当前块的预测样本来生成当前块的重构样本S630,其中,当仿射标志的值为1或子块TMVP标志的值为1时,确定将预定合并模式标志解码。换言之,可通过基于仿射标志和子块TMVP标志确定是否将指示是否对当前块应用预定合并模式的预定合并模式标志解码来改进图像编码效率。
在上述实施方式中,基于具有一系列步骤或方框的流程图来描述方法,但是本公开不限于上述步骤或方框的顺序,如上所述,一些步骤可与其它步骤同时发生或按照与其它步骤不同的顺序发生。此外,本领域技术人员将理解,上述流程图中所示的步骤不是排他性的,可包括另外的步骤,或者可删除流程图中的一个或更多个步骤,而不影响本公开的范围。
根据上述本公开的方法可在软件中实现。根据本公开的编码设备和/或解码设备可被包括在执行图像处理的装置中,例如TV、计算机、智能电话、机顶盒或显示装置。
当本公开的实施方式在软件中实现时,上述方法可通过执行上述功能的模块(进程、函数等)实现。这些模块可被存储在存储器中并由处理器执行。存储器可在处理器内部或外部,并且存储器可使用各种熟知手段联接到处理器。处理器可包括专用集成电路(ASIC)、其它芯片组、逻辑电路和/或数据处理装置。存储器可包括ROM(只读存储器)、RAM(随机存取存储器)、闪存、存储卡、存储介质和/或其它存储装置。即,本公开中描述的实施方式可在处理器、微处理器、控制器或芯片上实现和执行。例如,各个附图中所示的功能单元可在计算机、处理器、微处理器、控制器或芯片上实现和执行。在这种情况下,用于实现的信息(例如,关于指令的信息)或算法可被存储在数字存储介质中。
另外,应用了本公开的解码设备和编码设备可被应用于诸如多媒体广播发送和接收装置、移动通信终端、家庭影院视频装置、数字影院视频装置、监控相机、视频聊天装置、(3D)视频装置、视频电话视频装置和医疗视频装置等的多媒体通信装置,其可被包括在例如存储介质、摄像机、视频点播(VoD)服务提供装置、OTT视频(顶置视频)、互联网流服务提供装置、3D视频装置、虚拟现实(VR)装置、增强现实(AR)装置、视频呼叫装置、运输工具终端(例如,车辆(包括自主车辆)终端、飞机终端、船舶终端等)中,并且可用于处理视频信号或数据信号。例如,OTT视频(顶置视频)装置可包括游戏机、蓝光播放器、互联网访问TV、家庭影院系统、智能电话、平板PC、数字视频记录仪(DVR)。
此外,应用了本公开的处理方法可按照计算机执行的程序的形式生成,并且可被存储在计算机可读记录介质中。具有根据本公开的数据结构的多媒体数据也可被存储在计算机可读记录介质中。计算机可读记录介质包括存储计算机可读数据的所有类型的存储装置和分布式存储装置。例如,计算机可读记录介质可以是蓝光盘(BD)、通用串行总线(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储装置。另外,计算机可读记录介质包括以载波的形式实现的介质(例如,经由互联网的传输)。另外,通过该编码方法生成的比特流可被存储在计算机可读记录介质中或经由有线和无线通信网络发送。
此外,本公开的实施方式可通过程序代码被实现为计算机程序产品,并且可根据本公开的实施方式在计算机中执行程序代码。程序代码可被存储在可由计算机读取的载体上。
图8是示出内容流系统的结构的图。
参照图8,应用了本公开的内容流系统可主要包括编码服务器、流服务器、web服务器、媒体存储装置、用户装置和多媒体输入装置。
编码服务器用于将从多媒体输入装置(例如,智能电话、相机和摄像机)输入的内容压缩为数字数据以生成比特流,并将该比特流发送到流服务器。作为另一示例,如果多媒体输入装置(例如,智能电话、相机和摄像机)直接生成比特流,则可省略编码服务器。
可通过应用了本公开的编码方法或比特流生成方法来生成比特流,并且流服务器可在发送或接收比特流的过程中暂时存储比特流。
流服务器用于通过web服务器基于用户请求将多媒体数据发送到用户装置,并且web服务器用作告知用户哪些服务可用的介质。当用户向web服务器请求期望的服务时,web服务器将用户的请求传送至流服务器,并且流服务器将多媒体数据发送到用户。此时,内容流系统可包括单独的控制服务器,并且在这种情况下,控制服务器用于控制内容流系统内的装置之间的命令/响应。
流服务器可从媒体存储装置和/或编码服务器接收内容。例如,当从编码服务器接收到内容时,流服务器可实时地接收内容。在这种情况下,为了提供平滑的流服务,流服务器可将比特流存储预定时间。
作为用户装置的示例,可存在便携式电话、智能电话、膝上型计算机、数字广播终端、个人数字助理(PDA)、便携式多媒体播放器(PMP)、导航装置、石板PC、平板PC、超级本、可穿戴装置(例如,智能手表、智能眼镜、头戴式显示器(HMD))、数字TV、台式计算机、数字标牌等。
内容流系统内的各个服务器可由分布服务器操作,并且在这种情况下,由各个服务器接收的数据可被分布和处理。

Claims (4)

1.一种由解码设备执行的图像解码方法,该图像解码方法包括以下步骤:
接收包括仿射使能标志信息、子块时间运动向量预测使能标志信息和残差信息的图像信息;
确定是否接收与是否对当前块应用基于子块的特定合并模式有关的特定标志信息;
基于所述确定来接收所述特定标志信息;
基于所述特定标志信息、所述仿射使能标志信息和所述子块时间运动向量预测使能标志信息来检查是否接收所述基于子块的特定合并模式的特定合并索引;
基于所述确定的结果来推导所述当前块的预测模式;
通过基于所推导的预测模式对所述当前块应用帧间预测来推导所述当前块的预测样本;
基于所述残差信息来推导所述当前块的残差样本;以及
基于所述预测样本和所述残差样本来生成重构样本,
其中,确定是否接收所述特定标志信息的步骤是基于所述仿射使能标志信息和所述子块时间运动向量预测使能标志信息中的至少一个来执行的,并且
其中,基于所述特定标志信息的值等于1、所述仿射使能标志信息的值等于0并且所述子块时间运动向量预测使能标志信息的值等于1的情况,检查出所述特定合并索引不被接收。
2.一种由编码设备执行的图像编码方法,该图像编码方法包括以下步骤:
推导仿射使能标志信息和子块时间运动向量预测使能标志信息;
通过对当前块应用帧间预测来推导所述当前块的预测样本;
确定是否用信号通知与是否对所述当前块应用基于子块的特定合并模式有关的特定标志信息;
基于所述确定来推导所述特定标志信息;
基于所述特定标志信息、所述仿射使能标志信息和所述子块时间运动向量预测使能标志信息来检查是否用信号通知所述基于子块的特定合并模式的特定合并索引;
基于所述预测样本来生成残差信息;
对包括所述仿射使能标志信息、所述子块时间运动向量预测使能标志信息、所述特定标志信息或所述特定合并索引中的至少一个的图像信息进行编码,
其中,确定是否用信号通知所述特定标志信息的步骤是基于所述仿射使能标志信息和所述子块时间运动向量预测使能标志信息中的至少一个来执行的,并且
其中,基于所述特定标志信息的值等于1、所述仿射使能标志信息的值等于0并且所述子块时间运动向量预测使能标志信息的值等于1的情况,检查出所述特定合并索引不被用信号通知。
3.一种存储指令的非暂时性计算机可读存储介质,该指令在被处理器执行时实现包括以下步骤的方法:
推导仿射使能标志信息和子块时间运动向量预测使能标志信息;
通过对当前块应用帧间预测来推导所述当前块的预测样本;
确定是否用信号通知与是否对所述当前块应用基于子块的特定合并模式有关的特定标志信息;
基于所述确定来推导所述特定标志信息;
基于所述特定标志信息、所述仿射使能标志信息和所述子块时间运动向量预测使能标志信息来检查是否用信号通知所述基于子块的特定合并模式的特定合并索引;
基于所述预测样本来生成残差信息;
对包括所述仿射使能标志信息、所述子块时间运动向量预测使能标志信息、所述特定标志信息或所述特定合并索引中的至少一个的图像信息进行编码,
其中,确定是否用信号通知所述特定标志信息的步骤是基于所述仿射使能标志信息和所述子块时间运动向量预测使能标志信息中的至少一个来执行的,并且
其中,基于所述特定标志信息的值等于1、所述仿射使能标志信息的值等于0并且所述子块时间运动向量预测使能标志信息的值等于1的情况,检查出所述特定合并索引不被用信号通知。
4.一种用于图像的数据的发送方法,该发送方法包括以下步骤:
获得比特流,其中,所述比特流是基于以下操作生成的:推导仿射使能标志信息和子块时间运动向量预测使能标志信息,通过对当前块应用帧间预测来推导所述当前块的预测样本,确定是否用信号通知与是否对所述当前块应用基于子块的特定合并模式有关的特定标志信息,基于所述确定来推导所述特定标志信息,基于所述特定标志信息、所述仿射使能标志信息和所述子块时间运动向量预测使能标志信息来检查是否用信号通知所述基于子块的特定合并模式的特定合并索引,基于所述预测样本来生成残差信息,对包括所述仿射使能标志信息、所述子块时间运动向量预测使能标志信息、所述特定标志信息或所述特定合并索引中的至少一个的图像信息进行编码;以及
发送包括所述比特流的所述数据,
其中,确定是否用信号通知所述特定标志信息的步骤是基于所述仿射使能标志信息和所述子块时间运动向量预测使能标志信息中的至少一个来执行的,并且
其中,基于所述特定标志信息的值等于1、所述仿射使能标志信息的值等于0并且所述子块时间运动向量预测使能标志信息的值等于1的情况,检查出所述特定合并索引不被用信号通知。
CN201980072498.3A 2018-10-08 2019-10-08 使用句法来执行编码的句法设计方法和设备 Active CN112956201B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862742456P 2018-10-08 2018-10-08
US62/742,456 2018-10-08
PCT/KR2019/013226 WO2020076066A1 (ko) 2018-10-08 2019-10-08 신택스 디자인 방법 및 신택스를 이용하여 코딩을 수행하는 장치

Publications (2)

Publication Number Publication Date
CN112956201A CN112956201A (zh) 2021-06-11
CN112956201B true CN112956201B (zh) 2024-03-29

Family

ID=70163663

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980072498.3A Active CN112956201B (zh) 2018-10-08 2019-10-08 使用句法来执行编码的句法设计方法和设备

Country Status (8)

Country Link
US (4) US11206430B2 (zh)
EP (1) EP3849190A4 (zh)
JP (3) JP7230189B2 (zh)
KR (2) KR20240027844A (zh)
CN (1) CN112956201B (zh)
BR (4) BR122022002102B1 (zh)
MX (1) MX2021004008A (zh)
WO (1) WO2020076066A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2578151B (en) * 2018-10-18 2021-06-09 Canon Kk Video coding and decoding
WO2020233661A1 (en) * 2019-05-21 2020-11-26 Beijing Bytedance Network Technology Co., Ltd. Syntax signaling in sub-block merge mode
WO2020244659A1 (en) * 2019-06-06 2020-12-10 Beijing Bytedance Network Technology Co., Ltd. Interactions between sub-block based intra block copy and different coding tools
KR20220078600A (ko) 2019-10-18 2022-06-10 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 서브픽처들의 파라미터 세트 시그널링에서의 신택스 제약들

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130121766A (ko) * 2012-01-19 2013-11-06 한국전자통신연구원 영상 복호화 방법 및 컴퓨터로 읽을 수 있는 기록 매체
WO2018061563A1 (ja) * 2016-09-27 2018-04-05 シャープ株式会社 アフィン動きベクトル導出装置、予測画像生成装置、動画像復号装置、および動画像符号化装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8665958B2 (en) * 2008-01-29 2014-03-04 Electronics And Telecommunications Research Institute Method and apparatus for encoding and decoding video signal using motion compensation based on affine transformation
HUE063103T2 (hu) * 2010-11-04 2023-12-28 Ge Video Compression Llc Blokk összefûzést és átugrási módot támogató képkódolás
US20130188715A1 (en) * 2012-01-09 2013-07-25 Qualcomm Incorporated Device and methods for merge list reordering in video coding
US9503720B2 (en) * 2012-03-16 2016-11-22 Qualcomm Incorporated Motion vector coding and bi-prediction in HEVC and its extensions
US20140098880A1 (en) * 2012-10-05 2014-04-10 Qualcomm Incorporated Prediction mode information upsampling for scalable video coding
US9674542B2 (en) * 2013-01-02 2017-06-06 Qualcomm Incorporated Motion vector prediction for video coding
US9438910B1 (en) * 2014-03-11 2016-09-06 Google Inc. Affine motion prediction in video coding
US10560712B2 (en) 2016-05-16 2020-02-11 Qualcomm Incorporated Affine motion prediction for video coding
US10448010B2 (en) * 2016-10-05 2019-10-15 Qualcomm Incorporated Motion vector prediction for affine motion models in video coding
US20180199057A1 (en) * 2017-01-12 2018-07-12 Mediatek Inc. Method and Apparatus of Candidate Skipping for Predictor Refinement in Video Coding
US11012687B2 (en) * 2018-10-01 2021-05-18 Tencent America LLC Method and apparatus for video coding

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130121766A (ko) * 2012-01-19 2013-11-06 한국전자통신연구원 영상 복호화 방법 및 컴퓨터로 읽을 수 있는 기록 매체
WO2018061563A1 (ja) * 2016-09-27 2018-04-05 シャープ株式会社 アフィン動きベクトル導出装置、予測画像生成装置、動画像復号装置、および動画像符号化装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LEE H ET AL."CE4-related:Fixed sub-block size and restriction for ATMVP",JVET-L0468.《THE JOINT VIDEO EXPLORATION TEAM OF ISO/IEC JTC1/SC29/WG11 AND ITU-T SG.16》.2018,全文. *
Versatile Video Coding (Draft 2),JVET -K1001-v6;Benjamin Bross, et.al;《Joint Video Experts Team (JVET) of ITU - T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 11th Meeting》;第1-134页 *

Also Published As

Publication number Publication date
CN112956201A (zh) 2021-06-11
BR112021006580A2 (pt) 2021-07-27
BR122022002102A8 (pt) 2022-08-30
JP2022502969A (ja) 2022-01-11
KR20240027844A (ko) 2024-03-04
BR122022002075A2 (zh) 2021-07-27
US20220070498A1 (en) 2022-03-03
US11206430B2 (en) 2021-12-21
BR112021006580B1 (pt) 2022-11-16
BR122022002102A2 (zh) 2021-07-27
EP3849190A4 (en) 2021-11-03
EP3849190A1 (en) 2021-07-14
US20210219001A1 (en) 2021-07-15
BR122022002075A8 (pt) 2022-08-30
BR122022002102B1 (pt) 2022-11-01
JP2024050869A (ja) 2024-04-10
JP7436717B2 (ja) 2024-02-22
BR122022002096A8 (pt) 2022-08-30
KR102637604B1 (ko) 2024-02-16
US20240080486A1 (en) 2024-03-07
WO2020076066A1 (ko) 2020-04-16
US11575942B2 (en) 2023-02-07
BR122022002096B1 (pt) 2022-11-01
BR112021006580A8 (pt) 2022-08-30
BR122022002075B1 (pt) 2022-11-01
US20230131137A1 (en) 2023-04-27
BR122022002096A2 (zh) 2021-07-27
JP7230189B2 (ja) 2023-02-28
US11849151B2 (en) 2023-12-19
KR20210036413A (ko) 2021-04-02
JP2023055997A (ja) 2023-04-18
MX2021004008A (es) 2021-06-23

Similar Documents

Publication Publication Date Title
CN112585966B (zh) 以基于历史的运动向量为基础的帧间预测方法及其装置
CN112789852B (zh) 基于历史的图像编码方法及其设备
CN112956201B (zh) 使用句法来执行编码的句法设计方法和设备
US11431985B2 (en) Method and device for signaling information on chroma format
CN112913233B (zh) 基于hmvp构造预测候选的方法和设备
CN113424529A (zh) 用于执行基于mrl的帧内预测的图像编译方法和装置
CN113273192B (zh) 使用mpm列表的基于帧内预测的视频编码方法及装置
CN113574871A (zh) 基于mpm列表的帧内预测方法和装置
CN113767625A (zh) 基于mpm列表的帧内预测方法及其设备
US20220174270A1 (en) Method and device for configuring mpm list
CN111989919A (zh) 基于使用mpm列表的帧内预测的图像编码方法及设备
CN113475065A (zh) 使用统一mpm列表的基于帧内预测的图像编译方法和设备
CN113316938B (zh) 使用去块滤波的图像编译方法和装置
CN113273210B (zh) 用于编译关于合并数据的信息的方法和装置
CN114982231A (zh) 图像解码方法及用于其的装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant