CN114009047A - 视频/图像编译系统中用于合并数据语法的信令方法和装置 - Google Patents

视频/图像编译系统中用于合并数据语法的信令方法和装置 Download PDF

Info

Publication number
CN114009047A
CN114009047A CN202080045848.XA CN202080045848A CN114009047A CN 114009047 A CN114009047 A CN 114009047A CN 202080045848 A CN202080045848 A CN 202080045848A CN 114009047 A CN114009047 A CN 114009047A
Authority
CN
China
Prior art keywords
prediction
current block
mode
information
enabled
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080045848.XA
Other languages
English (en)
Inventor
张炯文
朴奈利
金昇焕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN114009047A publication Critical patent/CN114009047A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

根据本文的由解码设备执行的解码方法包括:用于基于从比特流获得的关于预测模式的信息来确定当前块的预测模式的步骤;用于基于预测模式来推导关于当前块的运动信息的步骤;用于基于运动信息来生成当前块的预测样本的步骤;以及用于基于预测样本来生成重构样本的步骤,其中用于确定预测模式的步骤可以包括用于基于指示组合的图片间合并和图片内预测(CIIP)是否可用的CIIP可用标志从比特流获得常规合并标志的步骤。

Description

视频/图像编译系统中用于合并数据语法的信令方法和装置
技术领域
本技术涉及用于在视频/图像编译系统中用信号通知合并数据语法的方法和设备。
背景技术
最近,在各种领域中对诸如4K或8K或更多超高清(UHD)图像/视频的高分辨率、高质量图像/视频的需求不断增加。随着图像/视频分辨率或质量变得更高,与传统图像/视频数据相比发送相对更多量的信息或比特。因此,如果图像/视频数据经由诸如现有有线/无线宽带线路的介质发送或被存储在传统存储介质中,则传输和存储的成本容易增加。
此外,对虚拟现实(VR)和人工现实(AR)内容以及诸如全息图的沉浸式媒体的兴趣和需求日益增长;并且表现出与实际图像/视频不同的图像/视频特性的图像/视频(例如,游戏图像/视频)的广播也日益增长。
因此,需要高度高效的图像/视频压缩技术来有效地压缩并发送、存储或播放如上所述显示出各种特性的高分辨率、高质量图像/视频。
发明内容
技术问题
本公开的一方面在于提供一种用于增强图像编译效率的方法和设备。
本公开的另一方面在于提供一种用于有效地执行帧间预测的方法和设备。
本公开的又一方面在于提供一种用于在帧间预测期间移除不必要的信令的方法和设备。
本公开的又一方面在于提供一种用于在帧间预测期间有效地用信号通知关于合并模式的信息的方法和设备。
技术方案
根据本公开的一个示例性实施例,一种由解码设备执行的解码方法,所述方法包括:基于来自比特流的关于预测模式的信息来确定当前块的预测模式;基于预测模式来推导当前块的运动信息;基于运动信息来生成当前块的预测样本;以及基于预测样本来生成重构样本,其中所述确定包括基于表示组合的图片间合并和图片内预测(CIIP)是否被启用的CIIP启用标志从比特流获得常规合并标志。
根据本公开的另一个示例性实施例,一种由编码设备执行的编码方法,所述方法包括:确定当前块的预测模式;基于预测模式来推导当前块的运动信息;基于运动信息来推导当前块的预测样本;基于预测样本来推导残差样本;以及对包括基于预测模式生成的与预测模式相关的信息和基于残差样本生成的残差信息的图像信息进行编码,其中图像信息包括基于表示组合的图片间合并和图片内预测(CIIP)是否被启用的CIIP启用标志的常规合并标志。
根据本公开的又一个示例性实施例,一种计算机可读数字存储介质,其包括使解码设备执行解码方法的信息,其中所述解码方法包括:基于来自比特流的预测模式信息来确定当前块的预测模式;基于预测模式来推导当前块的运动信息;基于运动信息来生成当前块的预测样本;以及基于预测样本来生成重构样本,其中确定预测模式包括基于表示组合的图片间合并和图片内预测(CIIP)是否被启用的CIIP启用标志从所述比特流获得常规合并标志。
有益效果
根据本公开的实施例,可以增强整体图像/视频压缩效率。
根据本公开的实施例,可以有效地执行帧间预测。
根据本公开的实施例,可以在帧间预测期间有效地移除不必要语法的信令。
根据本公开的实施例,可以在帧间预测期间有效地用信号通知关于合并模式的信息。
附图说明
图1示意性地示出本公开的实施例可应用于的视频/图像编译系统的示例。
图2是示意性地解释本公开的实施例可应用于的视频/图像编码设备的配置的图。
图3是示意性地解释本公开的实施例可应用于的视频/图像解码设备的配置的图。
图4示出基于帧间预测的视频/图像编码方法的示例。
图5示出基于帧间预测的视频/图像解码方法的示例。
图6和图7是解释可用于帧间预测的空间候选的图。
图8和图9是解释可用于帧间预测的时间候选的图。
图10是解释能够用于帧间预测的基于子块的时间运动向量预测处理的图。
图11是解释可应用于帧间预测的分区模式的图。
图12和图13示意性地示出根据本公开实施例的包括帧间预测方法和相关组件的视频/图像编码方法的示例。
图14和图15示意性地示出根据本公开实施例的包括帧间预测方法和相关组件的视频/图像解码方法的示例。
图16示出本公开中公开的实施例可应用于的内容流系统的示例。
具体实施方式
本公开能够以各种形式修改,并且将在附图中描述并且示出本公开的特定实施例。然而,并非旨在将本公开限于这些特定实施例。在以下描述中使用的术语用于仅仅描述特定实施例,并非用于限制本本公开。单数的表达式包括复数的表达式,只要它被清楚地不同地读出来。诸如“包括”和“具有”的术语旨在指示在以下描述中使用的特征、数字、步骤、操作、元件、组件或其组合存在,因此应当理解,不排除存在或添加一个或多个不同特征、数字、步骤、操作、元件、组件或其组合的可能性。
此外,为了与不同特性功能有关的描述方便,本公开中描述的附图中的每个组件被独立地示出,并且不意味着组件被实现为单独的硬件或单独的软件。例如,每个配置中的至少两个组件可以被组合以形成一个配置,或者一个配置可以被分成多个配置。每个配置被组合和/或分离的实施例也包括在本公开的范围内而不脱离本公开的精神。
以下,参照附图详细地描述本公开的示例。此外,在整个附图中使用相同的附图标记来表示相同的元件,并且将省略对相同元件的相同描述。
图1示出本公开可应用于的视频/图像编译系统的示例。
参照图1,视频/图像编译系统可以包括源装置和接收装置。源装置可以经由数字存储介质或网络将编码的视频/图像信息或数据以文件或流的形式发送到接收装置。
源装置可以包括视频源、编码设备和发送器。接收装置可以包括接收器、解码设备和渲染器。编码设备可以被称为视频/图像编码设备,并且解码设备可以被称为视频/图像解码设备。发送器可以被包括在编码设备中。接收器可以被包括在解码设备中。渲染器可以包括显示器,并且显示器可以被配置为单独的装置或外部组件。
视频源可以通过捕获、合成或生成视频/图像的处理来获取视频/图像。视频源可以包括视频/图像捕获装置和/或视频/图像生成装置。例如,视频/图像捕获装置可以包括一个或更多个相机、包括先前捕获的视频/图像的视频/图像档案等。例如,视频/图像生成装置可以包括计算机、平板计算机和智能电话,并且可(以电子方式)生成视频/图像。例如,可以通过计算机等生成虚拟视频/图像。在这种情况下,视频/图像捕获处理可以由生成相关数据的处理代替。
编码设备可以对输入视频/图像进行编码。为了压缩和编码效率,编码设备可以执行诸如预测、变换和量化的一系列过程。编码的数据(编码的视频/图像信息)可按比特流的形式输出。
发送器可以通过数字存储介质或网络将以比特流的形式输出的编码的图像/图像信息或数据以文件或流的形式发送到接收装置的接收器。数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送器可以包括用于通过预定文件格式生成媒体文件的元件,并且可以包括用于通过广播/通信网络传输的元件。接收器可以接收/提取比特流并且将所接收的比特流发送到解码设备。
解码设备可以通过执行与编码设备的操作对应的诸如解量化、逆变换和预测的一系列过程将视频/图像解码。
渲染器可以渲染解码的视频/图像。渲染的视频/图像可以通过显示器显示。
本文涉及视频/图像编译。例如,本文中公开的方法/实施例可以应用于通用视频编译(VVC)标准中公开的方法。此外,例如,本文中公开的方法/实施例可以应用于基本视频编译(EVC)标准、AOMedia Video 1(AV1)标准、第2代音频视频编译标准(AVS2)或下一代视频/图像编译标准(例如,H.267或H.268等)中公开的方法。
本文建议视频/图像编译的各种实施例,并且除非另有说明,以上实施例也可以彼此结合执行。
在本文中,可以省略量化/解量化和/或变换/逆变换中的至少一个。在省略量化/解量化的情况下,可以将量化的变换系数称为变换系数。在省略变换/逆变换的情况下,变换系数可以被称为系数或残差系数,或者为了表述统一,仍然可以被称为变换系数。
在本文中,量化变换系数和变换系数可以分别被称为变换系数和缩放变换系数。在这种情况下,残差信息可以包括关于变换系数的信息,并且可以通过残差编译语法用信号通知关于变换系数的信息。可以基于残差信息(或者关于变换系数的信息)来推导变换系数,并且可以通过变换系数的逆变换(缩放)来推导缩放变换系数。可以基于缩放变换系数的逆变换(变换)来推导残差样本。对于本文的其他部分,这能够以相同的方式被应用/表达。
在本文中,视频可以指随着时间的一系列图像。图片通常是指表示特定时间帧处的一个图像的单元,并且切片(slice)/图块(tile)是指在编译方面构成图片的一部分的单元。切片/图块可以包括一个或多个编译树单元(CTU)。一个图片可以由一个或多个切片/图块组成。一个图片可以由一个或多个图块组组成。一个图块组可以包括一个或多个图块。拼块(brick)可以表示图片中的图块内的CTU行的矩形区域(拼块可以表示图片中的图块内的CTU行的矩形区域)。图块可以被分区成多个拼块,拼块中的每个可以利用图块内的一个或多个CTU行来构建(图块可以被分区成多个拼块,拼块中的每个由图块内的一个或多个CTU行来组成)。未被分区成多个拼块的图块也可以被称为拼块。拼块扫描可以表示分区图片的CTU的特定顺序排序,其中CTU可以在拼块内以CTU光栅扫描被排序,并且图块内的拼块可以按图块的拼块的光栅扫描被连续地排序,并且图片中的图块可以按图片的图块的光栅扫描被连续地排序(拼块扫描是分区图片的CTU的特定顺序排序,其中CTU在拼块内以CTU光栅扫描被连续地排序,图块内的拼块以图块的拼块的光栅扫描被连续地排序,并且图片中的图块以图片的图块的光栅扫描被连续地排序)。图块是特定图块列和特定图块列内的CTU的矩形区域(图块是图片中的特定图块列和特定图块行内的CTU的矩形区域)。图块列是CTU的矩形区域,其具有等于图片的高度的高度和可以由图片参数集中的语法元素指定的宽度(图块列是CTU的矩形区域,其具有等于图片的高度的高度和由图片参数集中的语法元素指定的宽度)。图块行是CTU的矩形区域,其具有由图片参数集中的语法元素指定的宽度和可以等于图片的高度的高度(图块行是CTU的矩形区域,其具有由图片参数集中的语法元素指定的高度和等于图片的宽度的宽度)。图块扫描可以表示分区图片的CTU的特定顺序排序,并且CTU可以在图块中以CTU光栅扫描被连续地排序,并且图片中的图块能够以图片的图块的光栅扫描被连续地排序(图块扫描是分区图片的CTU的特定顺序排序,其中CTU在图块中以CTU光栅扫描被连续地排序,而图片中的图块以图片的图块的光栅扫描被连续地排序)。切片可以包括图片的整数个拼块,并且该整数个拼块可以被包括在单个NAL单元中(切片包括可以排他性地被包含在单个NAL单元中的图片的整数个拼块构成)。切片可以利用多个完整图块构建,或者可以是一个图块的完整拼块的连续序列(切片可以由多个完整拼块组成,或者仅由一个图块的完整拼块的连续序列组成)。在本文中,可以使用图块组和切片来代替彼此。例如,在本文中,图块组/图块组报头可以被称为切片/切片报头。
像素或像元可以意指构成一个图片(或图像)的最小单元。另外,“样本”可以用作与像素对应的术语。样本通常可以表示像素或像素值,并且可以仅表示亮度分量的像素/像素值或仅表示色度分量的像素/像素值。
单元可以表示图像处理的基本单位。单元可以包括图片的特定区域和与该区域有关的信息中的至少一个。一个单元可以包括一个亮度块和两个色度(例如,Cb、Cr)块。在一些情况下,单元可以与诸如块或区域的术语互换使用。在一般情况下,M×N块可以包括M列和N行的样本(或样本阵列)或变换系数的集合(或阵列)。
在本文中,符号“/”或“、”应解释为“和/或”。例如,表达“A/B”解释为“A和/或B”,并且表达“A、B”解释为“A和/或B”。此外,表达“A/B/C”意指“A、B和/或C中的至少一个”。此外,表达“A、B、C”也意指“A、B和/或C中的至少一个”(在本文中,术语“/”和“、”应解释为指示“和/或”。例如,表达“A/B”可以意指“A和/或B”。此外,“A、B”可以意指“A和/或B”。此外,“A/B/C”可以指“A、B和/或C中的至少一个”。此外,“A/B/C”可以意指“A、B和/或C中的至少一个”。)
此外,在本文中,术语“或”应解释为“和/或”。例如,表达“A或B”可以意指1)仅“A”,2)仅“B”,和/或3)“A和B这两者”。换句话说,本文中的术语“或”可以意指“附加的或可替选的”。(此外,在本文中,术语“或”应解释为指示“和/或”。例如,表达“A或B”可以包括1)仅A、2)仅B和/或3)A和B这两者。换句话说,本文中的术语“或”应解释为指示“附加的或可替选的”。)
图2是示意性地示出本公开可应用于的视频/图像编码设备的配置的图。在下文中,被称为视频编码设备的设备可以包括图像编码设备。
参照图2,编码设备200可以包括并配置有图像分区器210、预测器220、残差处理器230、熵编码器240、加法器250、滤波器260和存储器270。预测器220可以包括帧间预测器221和帧内预测器222。残差处理器230可以包括变换器232、量化器233、解量化器234和逆变换器235。残差处理器230还可以包括减法器231。加法器250可以被称为重构器或重构块生成器。根据实施例,以上已经描述的图像分区器210、预测器220、残差处理器230、熵编码器240、加法器250和滤波器260可以由一个或多个硬件组件(例如,编码器芯片组或处理器)来配置。另外,存储器270可以包括解码图片缓冲器(DPB),并且还可以由数字存储介质来配置。硬件组件还可以包括作为内部/外部组件的存储器270。
图像分区器210可以将输入到编码设备200的输入图像(或图片、帧)划分成一个或多个处理单元。作为示例,处理单元可以被称为编译单元(CU)。在这种情况下,可以根据四叉树二叉树三叉树(QTBTTT)结构从编译树单元(CTU)或最大编译单元(LCU)递归地划分编译单元。例如,一个编译单元可以基于四叉树结构、二叉树结构和/或三叉树结构被划分成深度更深的多个编译单元。在这种情况下,例如,首先应用四叉树结构,并且可以稍后应用二叉树结构和/或三叉树结构。或者,也可以首先应用二叉树结构。可以基于不再划分的最终编译单元来执行根据本公开的编译过程。在这种情况下,基于根据图像特性等的编译效率,最大编译单元可直接用作最终编译单元,或者,根据需要,编译单元可以被递归地划分为深度更深的编译单元,使得具有最佳大小的编译单元可以用作最终编码单元。这里,编译过程可以包括诸如稍后描述的预测、变换和重构的过程。作为另一示例,处理单元还可以包括预测单元(PU)或变换单元(TU)。在这种情况下,预测单元和变换单元中的每个可以从上述最终编码单元中被划分或分割。预测单元可以是样本预测单元,并且变换单元可以是用于诱发变换系数的单元和/或用于从变换系数诱发残差信号的单元。
在一些情况下,该单元可以与诸如块或区域的术语互换使用。通常,M×N块可以表示由M列和N行组成的样本或一组变换系数。样本通常可以表示像素或像素值,并且还可以仅表示亮度分量的像素/像素值,并且还仅表示色度分量的像素/像素值。该样本可以用作与配置一个图片(或图像)的像素或像元相对应的术语。
编码设备200可以通过从输入图像信号(原始块、原始样本阵列)减去从帧间预测器221或帧内预测器222输出的预测信号(预测块、预测样本阵列)来生成残差信号(残差块、残差样本阵列),并将生成的残差信号发送到变换器232。在这种情况下,如所示,用于在编码器200内从输入图像信号(原始块、原始样本阵列)减去预测信号(预测块、预测样本阵列)的组件可以被称为减法器231。预测器可以对要处理的块(以下,称为当前块)执行预测,并且生成包括当前块的预测样本的预测块。预测器可以确定以当前块或CU为单位应用帧内预测还是应用帧间预测。预测器可以生成关于预测的各种信息,诸如预测模式信息,以将生成的信息传送到熵编码器240,如稍后在每个预测模式的描述中所描述的。关于预测的信息可以由熵编码器240编码以比特流的形式输出。
帧内预测器222可以参考当前图片内的样本预测当前块。参考样本可与当前块相邻放置,或者也可以根据预测模式远离当前块放置。帧内预测中的预测模式可以包括多个非方向模式和多个方向模式。非方向模式可以包括例如DC模式或平面模式。根据预测方向的精细程度,方向模式可以包括例如33个方向预测模式或65个方向预测模式。然而,这是说明性的,并且可以根据设置使用多于或少于上述数量的方向预测模式。帧内预测器222还可以使用应用于相邻块的预测模式来确定应用于当前块的预测模式。
帧间预测器221可以基于由参考图片上的运动向量指定的参考块(参考样本阵列)来诱发当前块的预测块。此时,为了减少在帧间预测模式发送的运动信息的量,可以基于相邻块和当前块之间的运动信息的相关性以块、子块或样本为单位预测运动信息。运动信息可以包括运动向量和参考图片索引。运动信息还可以包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,相邻块可以包括存在于当前图片内的空间相邻块和存在于参考图片中的时间相邻块。包括参考块的参考图片和包括时间相邻块的参考图片也可以彼此相同,并且也可以彼此不同。时间相邻块可以被称为诸如并置参考块、并置CU(colCU)等的名称,并且包括时间相邻块的参考图片也可以被称为并置图片(colPic)。例如,帧间预测器221可以基于相邻块配置运动信息候选列表,并且生成指示使用什么候选来推导当前块的运动向量和/或参考图片索引的信息。可以基于各种预测模式来执行帧间预测,例如,在跳过模式和合并模式的情况下,帧间预测器221可以使用相邻块的运动信息作为当前块的运动信息。在跳过模式的情况下,与合并模式不同,可以不发送残差信号。运动向量预测(MVP)模式可以通过使用相邻块的运动向量作为运动向量预测器并且用信号通知运动向量差来指示当前块的运动向量。
预测器220可以基于稍后描述的各种预测方法来生成预测信号。例如,预测器不仅可以应用帧内预测或帧间预测来预测一个块,而且可以同时应用帧内预测和帧间预测。这可以被称为组合的帧间和帧内预测(CIIP)。此外,预测器可以基于块内复制(IBC)预测模式或调色板模式,以对块执行预测。IBC预测模式或调色板模式可以用于游戏等的内容图像/视频编译,例如屏幕内容编译(SCC)。IBC基本上在当前图片中执行预测,但是它可以与帧间预测类似地执行,因为它推导当前图片中的参考块。也就是说,IBC可以使用本文中描述的帧间预测技术中的至少一种。调色板模式可以被视为帧内编译或帧内预测的示例。当应用调色板模式时,可以基于关于调色板索引和调色表的信息用信号通知图片中的样本值。
通过预测器(包括帧间预测器221和/或帧内预测器222)生成的预测信号可以用于生成重构信号或用于生成残差信号。
变换器232可以通过将变换技术应用于残差信号来生成变换系数。例如,变换技术可以包括离散余弦变换(DCT)、离散正弦变换(DST)、卡尔文-洛夫变换(KLT)、基于图的变换(GBT)或有条件非线性变换(CNT)中的至少一个。这里,当像素之间的关系信息被示出为曲线图时,GBT表示从曲线图获得的变换。CNT表示基于通过使用所有先前重构的像素生成的预测信号而获得的变换。另外,变换处理还可以应用于具有相同大小的正方形的像素块,并且还可以应用于具有可变大小的不是正方形的块。量化器233可以量化变换系数,以将量化的变换系数发送到熵编码器240,并且熵编码器240可以将量化的信号(关于量化的变换系数的信息)编码为到比特流的编码的量化信号。关于量化的变换系数的信息可以被称为残差信息。
量化器233可以基于系数扫描顺序以一维向量形式重新排列具有块形式的量化的变换系数,并且还基于一维向量形式的量化的变换系数生成关于量化的变换系数的信息。
熵编码器240可以执行各种编码方法,例如,诸如指数哥伦布(Golomb)编译、上下文自适应可变长度编译(CAVLC)和上下文自适应二进制算术编译(CABAC)。熵编码器240还可以对一起或单独地对除了量化的变换系数之外的重构视频/图像所必需的信息(例如,语法元素的值等)进行编码。编码信息(例如,编码视频/图像信息)能够以比特流的形式在网络抽象层(NAL)单元中被发送或存储。视频/图像信息还可以包括关于诸如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)等各种参数集的信息。另外,视频/图像信息还可以包括一般约束信息。本文中稍后描述的用信号通知/发送的信息和/或语法元素可以通过前述编码过程来被编码,并且因此被包括在比特流中。比特流可以通过网络被发送,或者被存储在数字存储介质中。这里,网络可以包括广播网络和/或通信网络等,并且数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD和SSD的各种存储介质。用于发送从熵编码器240输出的信号的发送器(未示出)和/或用于存储信号的存储器(未示出)可以被配置为编码设备200的内部/外部元件,或者发送器也可以被包括在熵编码器240中。
从量化器233输出的量化变换系数可以用于生成预测信号。例如,解量化器234和逆变换器235将解量化和逆变换应用于量化变换系数,使得可以重构残差信号(残差块或残差样本)。加法器250将重构残差信号与从帧间预测器221或帧内预测器222输出的预测信号相加,从而可以生成重构信号(重构图像、重构块、重构样本阵列)。如在应用跳过模式的情况下,如果不存在用于待处理的块的残差,则预测块可以用作重构块。加法器250可以被称为重构器或重构块生成器。所生成的重构信号可以用于当前图片内的要处理的下一个块的帧内预测,并且如稍后所述,还用于通过滤波的下一图片的帧间预测。
同时,亮度映射与色度缩放(LMCS)也可以应用于图片编码和/或重构处理中。
滤波器260可以对重构信号应用滤波,从而改进主观/客观图像质量。例如,滤波器260可以将各种滤波方法应用于重构图片以生成修改的重构图片,并且将修改的重构图片存储在存储器270中,具体地,存储在存储器270的DPB中。各种滤波方法可以包括例如去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。滤波器260可以生成各种滤波相关信息,以将所生成的信息传送到熵编码器240,如稍后在每种滤波方法的描述中描述的。与滤波相关的信息可以由熵编码器240编码以比特流的形式输出。
被发送到存储器270的修改的重构图像可以用作帧间预测器221中的参考图片。如果帧间预测由帧间预测器应用,则编码设备可避免编码设备200和解码设备之间的预测失配,并且还可提高编译效率。
存储器270的DPB可以存储修改的重构图片以用作帧间预测器221中的参考图片。存储器270可以存储其中推导(或编码)当前图片内的运动信息的块的运动信息和/或先前重构图片内的块的运动信息。存储的运动信息可以被传送到帧间预测器221,以用作空间相邻块的运动信息或时间相邻块的运动信息。存储器270可以存储当前图片内的重构块的重构样本,并且将重构样本传送到帧内预测器222。
图3是用于示意性地解释本公开可应用于的视频/图像解码设备的配置的图。
参照图3,解码设备300可以包括熵解码器310、残差处理器320、预测器330、加法器340、滤波器350和存储器360,并且被配置有它们。预测器330可以包括帧间预测器331和帧内预测器332。残差处理器320可以包括解量化器321和逆变换器322。根据实施例,可以由一个或多个硬件组件(例如,解码器芯片组或处理器)来配置以上已经描述的熵解码器310、残差处理器320、预测器330、加法器340和滤波器350。此外,存储器360可以包括解码图片缓冲器(DPB),并且可以由数字存储介质来配置。硬件组件还可以包括作为内部/外部组件的存储器360。
当输入包括视频/图像信息的比特流时,解码设备300可响应于在图2所示的编码设备中处理视频/图像信息的处理来重构图像,例如,解码设备300可以基于从比特流获取的块划分相关信息来推导单元/块。解码设备300可以使用应用于编码设备的处理单元来执行解码。因此,用于解码的处理单元可以是例如编译单元,并且编译单元可以根据四叉树结构、二叉树结构和/或三叉树结构从编译树单元或最大编译单元来划分。可以从编译单元推导一个或多个变换单元。另外,通过解码设备300解码并输出的重构图像信号可以通过再现设备被再现。
解码设备300可以接收以比特流的形式从图2中示出的编码设备输出的信号,并且可以通过熵解码器310对接收的信号进行解码。例如,熵解码器310可以通过解析比特流来推导图像重构(或图片重构)所需的信息(例如,视频/图像信息)。视频/图像信息还可以包括关于各种参数集的信息,例如自适配参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)。另外,视频/图像信息还可以包括一般约束信息。解码设备还可以基于关于参数集和/或一般约束信息的信息来解码图片。稍后将在本文中描述的用信号通知/接收的信息和/或语法元素可以通过解码过程被解码且从比特流获取。例如,熵解码器310可以基于诸如指数哥伦布(Golomb)编译、CAVLC或CABAC的编译方法解码比特流内的信息,并且输出用于图像重构所需的语法元素的值和残差相关变换系数的量化值。更具体地,CABAC熵解码方法可以接收与来自比特流的每个语法元素相对应的bin,使用待解码的语法元素信息、相邻块或待解码的块的解码信息或在先前阶段中解码的符号/bin的信息来确定上下文模型,并且通过根据所确定的上下文模型预测生成bin的概率以对bin执行算术解码,来生成与每个语法元素的值相对应的符号。此时,CABAC熵解码方法可以确定上下文模型并且然后使用用于下一符号/bin的上下文模型的解码的符号/bin的信息来更新上下文模型。由熵解码器310所解码的信息之中关于预测的信息可以被提供给预测器(帧间预测器332和帧内预测器331),并且在由熵解码器310执行熵解码的残差值(即,量化变换系数和相关参数信息)可以被输入到残差处理器320。
残差处理器320可以推导残差信号(残差块、残差样本和残差样本阵列)。另外,可以将由熵解码器310所解码的信息之中的关于滤波的信息提供给滤波器350。同时,用于接收从编码设备输出的信号的接收器(未示出)可以进一步被配置为解码设备300的内部/外部元件,或者接收器也可以是熵解码器310的组件。同时,根据本文的解码设备可以被称为视频/图像/图片解码设备,并且该解码设备还可以被分类为信息解码器(视频/图像/图片信息解码器)和样本解码器(视频/图像/图片样本解码器)。信息解码器可以包括熵解码器310,并且样本解码器可以包括解量化器321、逆变换器322、加法器340、滤波器350、存储器360、帧间预测器332和帧内预测器331中的至少一个。
解量化器321可以对量化变换系数进行解量化以输出变换系数。解量化器321能够以二维块的形式重新排列量化变换系数。在这种情况下,可以基于由编码设备执行的系数扫描顺序来执行重新排列。解量化器321可以使用量化参数(例如,量化步长信息)对量化变换系数执行解量化,并且获取变换系数。
逆变换器322逆变换变换系数以获取残差信号(残差块、残差样本阵列)。
预测器330可以执行当前块的预测,并且生成包括当前块的预测样本的预测块。预测器可以基于从熵解码器310输出的关于预测的信息确定对当前块应用帧内预测还是应用帧间预测,并且确定特定帧内/帧间预测模式。
预测器可以基于稍后描述的各种预测方法来生成预测信号。例如,预测器不仅可以将帧内预测或帧间预测应用于一个块的预测,而且可以同时应用帧内预测和帧间预测。这可以被称为组合的帧间和帧内预测(CIIP)。此外,预测器可以基于帧内块复制(IBC)预测模式或调色板模式,以对块执行预测。IBC预测模式或调色板模式可以用于游戏等的内容图像/视频编译,例如屏幕内容编译(SCC)。IBC基本上在当前图片中执行预测,但是它可以与帧间预测类似地执行,因为它推导当前图片中的参考块。也就是说,IBC可以使用本文中描述的帧间预测技术中的至少一种。调色板模式可以被视为帧内编译或帧内预测的示例。当应用调色板模式时,关于调色板表的信息和调色板索引可以被包括在视频/图像信息中并且被用信号通知。
帧内预测器331可以参考当前图片内的样本来预测当前块。参考样本可以根据预测模式与当前块相邻放置,或者也可远离当前块放置。帧内预测中的预测模式可以包括多个非方向模式和多个方向模式。帧内预测器331还可以使用应用于相邻块的预测模式来确定应用于当前块的预测模式。
帧间预测器332可以基于由参考图片上的运动向量指定的参考块(参考样本阵列)来诱发当前块的预测块。此时,为了减少在帧间预测模式中发送的运动信息的量,可以基于相邻块和当前块之间的运动信息的相关性以块、子块或样本为单位预测运动信息。运动信息可以包括运动向量和参考图片索引。运动信息还可以包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,相邻块可以包括存在于当前图片内的空间相邻块和存在于参考图片中的时间相邻块。例如,帧间预测器332可以基于相邻块来配置运动信息候选列表,并基于接收到的候选选择信息来推导当前块的运动向量和/或参考图片索引。可以基于各种预测模式执行帧间预测,关于预测的信息可以包括指示当前块的帧间预测的模式的信息。
加法器340可以将获取的残差信号与从预测器(包括帧间预测器332和/或帧内预测器331)输出的预测信号(预测块、预测样本阵列)相加,以生成重构信号(重构图片、重构块、重构样本阵列)。如在应用跳过模式的情况下,如果不存在用于待处理的块的残差,则预测块可以用作重构块。
加法器340可以被称为重构器或重构块生成器。所生成的重构信号可以用于当前图片内的要处理的下一块的帧内预测,并且如稍后所述,还可以通过滤波来输出,或者还可以用于下一图片的帧间预测。
同时,亮度映射与色度缩放(LMCS)也可以应用于图片解码处理中。
滤波器350可以对重构信号应用滤波,从而改善主观/客观图像质量。例如,滤波器350可以将各种滤波方法应用于重构图片以生成修改的重构图片,并且将修改的重构图片发送到存储器360(具体地,存储器360的DPB)。各种滤波方法可以包括例如去块滤波、样本自适应偏移、自适应环路滤波器、双向滤波器等。
存储在存储器360的DPB中的(修改的)重构图像可以用作帧间预测器332中的参考图片。存储器360可以存储其中推导(解码)当前图片内的运动信息的块的运动信息和/或先前经重构图片内的块的运动信息。存储的运动信息可以被传送到帧间预测器260,以用作空间相邻块的运动信息或时间相邻块的运动信息。存储器360可以存储当前图片内的重建块的重建样本,并将所存储的重建样本传送到帧内预测器331。
在本说明书中,在编码设备200的滤波器260、帧间预测器221和帧内预测器222中描述的示例性实施例可以被同等地应用于或分别对应于解码设备300的滤波器350、帧间预测器332和帧内预测器331。
根据本公开的视频/图像编码方法可以基于以下分区结构来执行。具体地,可以基于CTU和基于分区结构所推导的CU(和/或TU和PU)来执行稍后描述的预测、残差处理((逆)变换和(解)量化)、语法元素编译和滤波的过程。块分区过程可以由上述编码设备的图像分区器210执行,并且分区相关信息可以由熵编码器240(编码)处理,并且能够以比特流的形式被传送到解码设备。解码设备的熵解码器310可以基于从比特流获得的分区相关信息来推导当前图片的块分区结构,并基于此,可以执行用于图像解码的一系列过程(例如,预测、残差处理、块/图片重构、环路内滤波等)。CU大小和TU大小可以彼此相等,或者多个TU可以存在于CU区域内。同时,CU大小通常可以表示亮度分量(样本)编译块(CB)大小。TU大小通常可以表示亮度分量(样本)变换块(TB)大小。可以根据按照图片/图像的颜色格式(色度格式,例如,4:4:4、4:2:2、4:2:0等)的分量比基于亮度分量(样本)CB或TB大小来推导色度分量(样本)CB或TB大小。可以基于maxTbSize推导TU大小。例如,如果CU大小大于maxTbSize,则可以从CU推导maxTbSize的多个TU(TB),并且能够以TU(TB)为单位执行变换/逆变换。此外,例如,在应用帧内预测的情况下,能够以CU(或CB)为单位推导帧内预测模式/类型,并且能够以TU(或TB)为单位执行相邻参考样本推导和预测样本生成过程。在这种情况下,一个或多个TU(或TB)可以存在于一个CU(或CB)区域中,并且在这种情况下,多个TU(或TB)可以共享相同的帧内预测模式/类型。
此外,在根据本公开的视频/图像编译中,图像处理单元也可以具有分层结构。可以将一个图片分区成一个或多个图块、拼块、切片和/或图块组。一个切片可以包括一个或多个拼块。拼块上可以包括图块内的一个或多个CTU行。切片可以包括图片的整数个拼块。一个图块组可以包括一个或多个图块。一个图块可以包括一个或多个CTU。CTU可以被分割成一个或多个CU。图块表示图片中的特定图块列和特定图块行内的CTU的矩形区域。根据图片中的图块光栅扫描,图块组可以包括整数个图块。切片报头可以携带可以应用于相应切片(切片中的块)的信息/参数。在编码/解码设备具有多核处理器的情况下,可以并行处理用于图块、切片、拼块和/或图块组的编码/解码处理。在本文中,切片或图块组可以可交换地使用。也就是说,图块组报头可以被称为切片报头。这里,切片可以具有包括帧内(I)切片、预测(P)切片和双预测(B)切片的切片类型中的一个。在预测I切片中的块时,可以不使用帧间预测,并且可以仅使用帧内预测。当然,即使在这种情况下,也可以通过对原始样本值进行编译而不进行预测来执行信令。关于P切片中的块,可以使用帧内预测或帧间预测,并且在使用帧间预测的情况下,可以仅使用单预测。同时,关于B切片中的块,可以使用帧内预测或帧间预测,并且在使用帧间预测的情况下,可以最大限度地使用直到双预测(bi-prediction)。
编码器可以根据视频图像的特性(例如,分辨率)考虑编译效率或并行处理来确定图块/图块组、切片以及最大和最小编译单元大小,并且用于它们的信息或能够诱发它们的信息可以被包括在比特流中。
解码器可以获得表示当前图片的图块/图块组、拼块和切片、以及在图块中的CTU是否已被分区成多个编译单元的信息。通过使这样的信息仅在特定条件下获得(发送),可以增强效率。
切片报头(切片报头语法)可以包括能够被共同应用于切片的信息/参数。APS(APS语法)或PPS(PPS语法)可以包括能够被共同应用于一个或多个图片的信息/参数。SPS(SPS语法)可以包括能够被共同应用于一个或多个序列的信息/参数。VPS(VPS语法)可以包括能够被共同应用于多个层的信息/参数。DPS(DPS语法)可以包括能够被共同应用于整个视频的信息/参数。DPS可以包括与编码视频序列(CVS)的级联相关的信息/参数。
在本文中,较高级别语法可以包括APS语法、PPS语法、SPS语法、VPS语法、DPS语法及切片报头语法中的至少一个。
此外,例如,可以通过较高级别语法由编码端来配置关于图块/图块组/拼块/切片的分割和配置的信息,并且能够以比特流的形式被传送到解码设备。
同时,如上所述,在执行视频编译时,执行预测以提高压缩效率。由此,可以生成包括用于作为要编译的块(即,编译目标块)的当前块的预测样本的预测块。这里,预测块包括空间域(或像素域)中的预测样本。在编码设备和解码设备中以相同的方式推导预测块,并且编码设备可以将关于原始块和预测块之间的残差的信息(残差信息),而不是原始块的原始样本值,用信号通知给解码设备,从而提高图像编译效率。解码设备可以基于残差信息推导包括残差样本的残差块,将残差块和预测块相加以生成包括重构样本的重构块,并且生成包括重构块的重构图片。
可以通过变换和量化过程来生成残差信息。例如,编码设备可以推导原始块和预测块之间的残差块,对残差块中包括的残差样本(残差样本阵列)执行变换过程以推导变换系数,对变换系数执行量化过程以推导量化变换系数,并且将相关残差信息(通过比特流)用信号通知给解码设备。这里,残差信息可以包括量化变换系数的值信息、位置信息、变换技术、变换核、量化参数等。解码设备可以基于残差信息执行解量化/逆变换过程,并且推导残差样本(或残差块)。解码设备可以基于预测块和残差块生成重构图像。此外,对于之后的图片的帧间预测的参考,编码设备还可以对量化变换系数进行解量化/逆变换,以推导残差块,并且基于该残差块来生成重构图片。
在帧间预测被应用于当前块的情况下,编码设备/解码设备的预测器可以通过以块为单位执行帧间预测来推导预测样本。帧间预测可以是以依赖于除当前图片之外的图片的数据元素(例如,样本值或运动信息)的方式推导的预测。在帧间预测应用于当前块的情况下,可以基于由参考图片索引所指示的参考图片上的运动向量所指定的参考块(参考样本阵列)来推导用于当前块的预测块(预测样本阵列)。在这种情况下,为了减少在帧间预测模式发送的运动信息的量,可以基于相邻块和当前块之间的运动信息的相关性以块、子块或样本为单位来预测当前块的运动信息。运动信息可以包括运动向量和参考图片索引。运动信息还可以包括帧间预测类型(L0预测、L1预测、Bi预测等)信息。在应用帧间预测的情况下,相邻块可以包括存在于当前图片中的空间相邻块和存在于参考图片中的时间相邻块。包括参考块的参考图片和包括时间相邻块的参考图片可以彼此相等或不同。时间相邻块可以被称为并置参考块或并置CU(colCU),并且包括时间相邻块的参考图片可以被称为并置图片(colPic)。例如,可以基于当前块的相邻块来配置运动信息候选列表,并且可以用信号通知指示选择(使用)哪个候选来推导当前块的运动向量和/或参考图片索引的标志或索引信息。可以基于各种预测模式来执行帧间预测,并且例如,在跳过模式和(正常)合并模式的情况下,当前块的运动信息可以等于所选择的相邻块的运动信息。在跳过模式的情况下,与合并模式不同,可以不发送残差信号。在运动向量预测(MVP)模式的情况下,选定相邻块的运动向量可以用作运动向量预测器,并且可以用信号通知运动向量差。在这种情况下,可以使用运动向量预测值与运动向量差的和来推导当前块的运动向量。
基于帧间预测的视频/图像编码过程可以示意性地包括例如以下过程。
图4示出基于帧间预测的视频/图像编码方法的示例。
编码设备对当前块执行帧间预测(S400)。编码设备可以推导用于当前块的帧间预测模式和运动信息,并且可以生成当前块的预测样本。这里,帧间预测模式确定、运动信息推导和预测样本生成的过程可以被同时执行,或者任何一个过程可以在其他过程之前被执行。例如,编码设备的帧间预测器可以包括预测模式确定单元、运动信息推导单元和预测样本推导单元。预测模式确定单元可以确定用于当前块的预测模式,运动信息推导单元可以推导当前块的运动信息,预测样本推导单元可以推导当前块的预测样本。例如,编码设备的帧间预测器可以通过运动估计在参考图片的特定区域(搜索区域)中搜索与当前块相似的块,并且可以推导与当前块具有差的参考块,所述差是最小的或等于或小于预定参考。基于此,编码设备的帧间预测器可以推导指示参考块所放置的参考图片索引,并且可以基于参考块和当前块之间的位置差来推导运动向量。编码设备可以在各种预测模式之中确定正被应用于当前块的模式。编码设备可以比较用于各种预测模式的速率失真(RD)成本,并且可以确定用于当前块的最佳预测模式。
例如,在跳过模式或合并模式被应用于当前块的情况下,编码设备可以配置稍后描述的合并候选列表,并且可以在由合并候选列表中包括的合并候选指示的参考块之中推导与当前块具有差的参考块,该差是最小的或者等于或小于预定参考。在此情况下,可以选择与所推导的参考块相关的合并候选,并且指示选定合并候选的合并索引信息可以被生成并且被用信号通知给解码设备。可以使用选定合并候选的运动信息来推导当前块的运动信息。
作为另一示例,在(A)MVP模式被应用于当前块的情况下,编码设备可以配置稍后描述的(A)MVP候选列表,并且可以使用在(A)MVP候选列表中包括的运动向量预测器(mvp)候选之中选择的mvp候选的运动向量作为当前块的mvp。在这种情况下,例如,指示通过上述运动估计推导的参考块的运动向量可以被用作当前块的运动向量,并且在mvp候选之中具有与当前块的运动向量具有最小差的运动向量的mvp候选可以成为所选择的mvp候选。可以推导运动向量差(MVD),其是通过从当前块的运动向量减去mvp而获得的差。在这种情况下,关于MVD的信息可以被用信号通知给解码设备。此外,在应用(A)MVP模式的情况下,参考图片索引值可以被配置为参考图片索引信息,并且可以被单独地用信号通知给解码设备。
编码设备可以基于预测样本来推导残差样本(S410)。编码设备可以通过将当前块的原始样本与预测样本进行比较来推导残差样本。
编码设备对包括预测信息和残差信息的图像信息进行编码(S420)。编码设备能够以比特流的形式输出编码图像信息。预测信息可以是与预测过程相关的信息,并且可以包括关于预测模式信息(例如,跳过标志、合并标志或模式索引)和运动信息的信息。关于运动信息的信息可以包括候选选择信息(例如,合并索引、mvp标志或mvp索引),其为用于推导运动向量的信息。此外,关于运动信息的信息可以包括关于上述MVD和/或参考图片索引信息的信息。此外,关于运动信息的信息可以包括指示是否应用L0预测、L1预测或双预测的信息。残差信息是与残差样本相关的信息。残差信息可以包括关于用于残差样本的量化变换系数的信息。
输出比特流可以被存储在(数字)存储介质中以被传送到解码设备或者可以通过网络被传送到解码设备。
同时,如上所述,编码设备可以基于参考样本和残差样本来生成重构图片(包括重构样本和重构块)。这是为了使编码设备推导与由解码设备执行的预测结果相同的预测结果,并且通过这样,可以增强编译效率。因此,编码设备可以将重构图片(或重构样本或重构块)存储在存储器中,并且可利用存储的重构图片作为用于帧间预测的参考图片。如上所述,环路内滤波过程可以被进一步应用于重构图像。
基于帧间预测的视频/图像解码过程可以示意性地包括例如以下过程。
图5示出基于帧间预测的视频/图像解码方法的示例。
参照图5,解码设备可以执行与由编码设备所执行的操作相对应的操作。解码设备可以基于接收到的预测信息对当前块执行预测,并可以推导预测样本。
具体地,解码设备可以基于接收到的预测信息来确定用于当前块的预测模式(S500)。解码设备可以基于预测信息中的预测模式信息来确定将哪个帧间预测模式应用于当前块。
例如,解码设备可以基于合并标志关于当前块确定是否应用合并模式或者(A)MVP模式被确定。此外,解码设备可以基于模式索引选择各种帧间预测模式候选中的一个。帧间预测模式候选可以包括跳过模式、合并模式和/或(A)MVP模式,或者可以包括稍后描述的各种帧间预测模式。
解码设备基于确定的帧间预测模式来推导当前块的运动信息(S510)。例如,在跳过模式或合并模式被应用于当前块的情况下,解码设备可以配置稍后描述的合并候选列表,并且可以选择合并候选列表中包括的合并候选中的一个。可以基于上述选择信息(合并索引)来执行这样的选择。可以使用选定合并候选的运动信息来推导当前块的运动信息。可以使用选定合并候选的运动信息作为当前块的运动信息。
作为另一示例,在(A)MVP模式被应用于当前块的情况下,解码设备可以配置稍后描述的(A)MVP候选列表,并且可以使用(A)MVP候选列表中包括的运动向量预测器(mvp)候选之中选择的mvp候选的运动向量作为当前块的mvp。可以基于上述选择信息(mvp标志或mvp索引)来执行这种选择。在这种情况下,可以基于关于MVD的信息来推导当前块的MVD,并且可以基于当前块的mvp和MVD来推导当前块的运动向量。此外,可以基于参考图片索引信息来推导当前块的参考图片索引。由用于当前块的参考图片列表中的参考图片索引所指示的图片可以被推导为参考图片,该参考图片被参考以用于当前块的帧间预测。
同时,如稍后所述,可以在不配置候选列表的情况下推导当前块的运动信息,并且在这种情况下,可以根据稍后描述的预测模式中公开的过程来推导当前块的运动信息。在这种情况下,可以省略上述候选列表配置。
解码设备可以基于当前块的运动信息来生成用于当前块的预测样本(S520)。在这种情况下,可以基于当前块的参考图片索引来推导参考图片,并且可以使用由参考图片上的当前块的运动向量所指示的参考块的样本来推导当前块的预测样本。在这种情况下,如稍后所述,在一些情况下,可以进一步执行针对当前块的预测样本的全部或部分的预测样本滤波过程。
例如,解码设备的帧间预测器可以包括预测模式确定单元、运动信息推导单元和预测样本推导单元。预测模式确定单元可以基于接收到的预测模式信息来确定用于当前块的预测模式,运动信息推导单元可以基于关于接收到的运动信息的信息来推导当前块的运动信息(运动向量和/或参考图片索引),并且预测样本推导单元可以推导当前块的预测样本。
解码设备基于接收到的残差信息来生成用于当前块的残差样本(S530)。解码设备可以基于预测样本和残差样本来生成用于当前块的重构样本,并且基于此,可以生成重构图片(S540)。此后,如上所述,可以进一步对重构图片应用环路内滤波过程。
如上所述,帧间预测过程可以包括帧间预测模式确定、根据所确定的预测模式的运动信息推导、以及基于所推导的运动信息的预测执行(预测样本生成)的步骤。如上所述,帧间预测过程可以由编码设备和解码设备执行。在本文中,编译设备可以包括编码设备和/或解码设备。
对于图片中的当前块的预测,可以使用各种帧间预测模式。例如,可以使用各种模式,例如合并模式、跳过模式、运动向量预测(MVP)模式、仿射模式、子块合并模式、与MVD合并(MMVD)模式以及历史运动向量预测(HMVP)模式。解码器侧运动向量精化(DMVR)模式、自适应运动向量分辨率(AMVR)模式、具有CU级别权重的双预测(BCW)以及双向光流(BDOF)可以被进一步使用或替代地用作附带模式。仿射模式可以被称为仿射运动预测模式。MVP模式可以被称为高级运动向量预测(AMVP)模式。在本文中,通过该特定模式所推导的运动信息候选和/或特定模式可以被包括作为另一模式的运动信息相关候选之一。例如,HMVP候选可以被添加为合并/跳过模式的合并候选,或可以被添加为MVP模式的MVP候选。
可以将指示当前块的帧间预测模式的预测模式信息从编码设备用信号通知给解码设备。预测模式信息可以被包括在比特流中,并且可以在解码设备中被接收。预测模式信息可以包括指示多个候选模式中的一个的索引信息。此外,可以通过标志信息的分层信令来指示帧间预测模式。在这种情况下,预测模式信息可以包括一个或多个标志。例如,可以通过用信号通知跳过标志来指示是否应用跳过模式,并且在不应用跳过模式的情况下,可以通过用信号通知合并标志来指示是否应用合并模式,并且在不应用合并模式的情况下,可指示应用MVP模式,或可进一步用信号通知用于额外划分的标志。仿射模式可作为独立模式用信号通知,或可作为与合并模式或MVP模式相关的模式用信号通知。例如,仿射模式可以包括仿射合并模式及仿射MVP模式。
同时,可以用信号通知表示上述列表0(L0)预测、列表1(L1)预测或双预测是否被用于当前块(当前编译单元)的信息。该信息可以被称为运动预测方向信息、帧间预测方向信息或帧间预测指示信息,并且能够以例如inter_pred_idc语法元素的形式来配置/编码/用信号通知。也就是说,inter_pred_idc语法元素可以表示上述列表0(L0)预测、列表1(L1)预测或双预测是否被用于当前块(当前编译单元)。在本文中,为了便于解释,由inter_pred_idc语法元素所指示的帧间预测类型(L0预测、L1预测或BI预测)可以被显示为运动预测方向。L0预测、L1预测和双预测可以分别表示为pred_L0、pred_L1和pred_BI。例如,可以根据inter_pred_idc语法元素值来表示以下预测类型。
如上所述,一个图片可以包括一个或多个切片。切片可以具有包括帧内(I)切片、预测性(P)切片及双预测性(B)切片的切片类型中的一个。可以基于切片类型信息来指示切片类型。在预测I切片中的块时,可以不使用帧间预测,而可以仅使用帧内预测。当然,即使在这种情况下,也可以通过对原始样本值进行编译而不进行预测来执行信令。对于P切片中的块,可以使用帧内预测或帧间预测,并且在使用帧间预测的情况下,可以仅使用单预测。同时,对于B切片中的块,可以使用帧内预测或帧间预测,并且在使用帧间预测的情况下,可以最大限度地使用多达双预测。
L0和L1可以包括在当前图片之前编码/解码的参考图片。例如,L0可以包括按POC顺序在当前图片之前和/或之后的参考图片,并且L1可以包括按POC顺序在当前图片之后和/或之前的参考图片。在此情况下,对于L0,可以将相对较低的参考图片索引分配给按POC顺序在当前图片之前的参考图片,并且对于L1,可以将相对较低的参考图片索引分配给按POC顺序在当前图片之后的参考图片。在B切片的情况下,可以应用双预测,并且甚至在此情况下,可以应用单向双预测,或可以应用双向双预测。双向双预测可以被称为真双预测。
具体地,例如,关于用于当前块的帧间预测模式的信息可以在CU(CU语法)级别处被编译并被用信号通知,或者可以根据条件被隐式地确定。在此情况下,该信息可以相对于一些模式被显式地用信号通知,并且可以相对于剩余模式被隐式地推导。
例如,CU语法可以携载关于如下表1中的(帧间)预测模式的信息。
[表1]
Figure BDA0003425903160000281
Figure BDA0003425903160000291
Figure BDA0003425903160000301
Figure BDA0003425903160000311
Figure BDA0003425903160000321
这里,cu_skip_flag可以表示跳过模式是否被应用于当前块(CU)。
pred_mode_flag等于0指定在帧间预测模式编译当前编译单元。pred_mode_flag等于1指定在帧内预测模式编译当前编译单元。
pred_mode_ibc_flag等于1指定在IBC预测模式编译当前编译单元。pred_mode_ibc_flag等于0指定不在IBC预测模式编译当前编译单元。
pcm_flag[x0][y0]等于1指定在位置(x0,y0)处包括亮度编译块的编译单元中存在pcm_sample()语法结构,并且不存在transform_tree()语法结构。pcm_flag[x0][y0]等于0指定不存在pcm_sample()语法结构。也就是说,pcm_flag可以表示是否将脉冲编译调制(PCM)模式应用于当前块。如果将PCM模式应用于当前块,则可以不应用预测、变换和量化,并且可以编译和用信号通知当前块中的原始样本值。
intra_mip_flag[x0][y0]等于1指定亮度样本的帧内预测类型是基于矩阵的帧内预测(MIP)。intra_mip_flag[x0][y0]等于0指定用于亮度样本的帧内预测类型不是基于矩阵的帧内预测。也就是说,intra_mip_flag可以表示MIP预测模式(类型)是否被应用于当前块(当前块的亮度样本)。
intra_chroma_pred_mode[x0][y0]指定当前块中的用于色度样本的帧内预测模式。
general_merge_flag[x0][y0]指定是否从相邻帧间预测分区推断用于当前编译单元的帧间预测参数。即,general_merge_flag可以表示启用常规合并,并且当general_merge_flag值为1时,启用常规合并模式、mmvd模式和合并子块模式(子块合并模式)。例如,当general_merge_flag值为1时,可以从编码视频/图像信息(或比特流)解析合并数据语法,并且合并数据语法可以被配置/编译为包括如以下表2中表示的信息。
[表2]
Figure BDA0003425903160000331
Figure BDA0003425903160000341
这里,regular_merge_flag[x0][y0]等于1指定常规合并模式被用于生成当前编译单元的帧间预测参数。也就是说,regular_merge_flag表示合并模式(常规合并模式)是否被应用于当前块。
mmvd_merge_flag[x0][y0]等于1指定使用具有运动向量差的合并模式来生成当前编译单元的帧间预测参数。也就是说,mmvd_merge_flag表示MMVD是否被应用于当前块。
mmvd_cand_flag[x0][y0]指定合并候选列表中的第一(0)或第二(1)候选是否与从mmvd_distance_idx[x0][y0]和mmvd_direction_idx[x0][y0]所推导的运动向量差一起被使用。
mmvd_distance_idx[x0][y0]指定用于推导MmvdDistance[x0][y0]的索引。
mmvd_direction_idx[x0][y0]指定用于推导MmvdSign[x0][y0]的索引。
merge_sub_flag[x0][y0]指定基于子块的帧间预测参数是否被用于当前编译。即,merge_sub_flag可以表示子块合并模式(或仿射合并模式)是否被应用于当前块。
merge_subblock_idx[x0][y0]指定基于子块的合并候选列表的合并候选索引。
ciip_flag[x0][y0]指定是否对当前编译单元应用组合的图像间合并和图像内预测。
merge_triangle_idx0[x0][y0]指定基于三角形形状的运动补偿候选列表的第一合并候选索引。
merge_triangle_idx1[x0][y0]指定基于三角形形状的运动补偿候选列表的第二合并候选索引。
merge_idx[x0][y0]指定合并候选列表的合并候选索引。
同时,再次参考表1的CU语法,mvp_l0_flag[x0][y0]指定列表0的运动向量预测索引,即,在应用MVP模式的情况下,mvp_l0_flag可以表示候选被选择用于MVP候选列表中的当前块的MVP推导。
ref_idx_L1[x0][y0]具有与ref_idx_L0相同的语义,其中l0、L0和列表0分别被l1、L1和列表1代替。
inter_pred_idc[x0][y0]指定列表0、列表1或双预测是否被用于当前编译单元。
sym_mvd_flag[x0][y0]等于1指定语法元素ref_idx_l0[x0][y0]和ref_idx_l1[x0][y0]以及用于等于1的refList的mvd_coding(x0,y0,refList,cpIdx)语法结构不存在。也就是说,sym_mvd_flag表示对称MVD是否被用于mvd编译。
ref_idx_l0[x0][y0]指定用于当前编译单元的列表0参考图片索引。
ref_idx_l1[x0][y0]具有与ref_idx_l0相同的语义,其中l0、L0和列表0分别被l1、L1和列表1代替。
inter_affif_flag[x0][y0]等于1指定:对于当前编译单元,当解码P或B切片时,基于仿射模型的运动补偿被用于生成当前编译单元的预测样本。
cu_affif_type_flag[x0][y0]等于1指定:对于当前编译单元,当解码P或B切片时,基于6参数仿射模型的运动补偿被用于生成当前编译单元的预测样本。cu_affif_type_flag[x0][y0]等于0指定基于4参数仿射模型的运动补偿被用于生成当前编译单元的预测样本。
amvr_flag[x0][y0]指定运动向量差的分辨率。阵列索引x0、y0指定所考虑的编译块的左上亮度样本相对于图片的左上亮度样本的位置(x0,y0)。amvr_flag[x0][y0]等于0指定运动向量差的分辨率为亮度样本的1/4。amvr_flag[x0][y0]等于1指定运动向量差的分辨率进一步由amvr_precision_flag[x0][y0]指定。
如果inter_affice_flag[x0][y0]等于0,则amvr_precision_flag[x0][y0]等于0指定运动向量差的分辨率为一个整数亮度样本,否则为1/16的亮度样本。如果inter_affice_flag[x0][y0]等于0,则amvr_precision_flag[x0][y0]等于1指定运动向量差的分辨率为四个亮度样本,否则为一个整数亮度样本。阵列索引x0、y0指定所考虑的编译块的左上亮度样本相对于图片的左上亮度样本的位置(x0,y0)。
bcw_idx[x0][y0]指定具有CU权重的双预测的权重索引。
编码设备可以使用当前块的运动信息执行帧间预测。编码设备可以通过运动估计过程来推导用于当前块的最佳运动信息。例如,编码设备可以使用用于当前块的原始图像中的原始块在参考图片中所确定的搜索范围内以分数像素为单位搜索具有高相关性的相似参考块,并且通过这个,编码设备可以推导运动信息。可以根据基于相位的样本值之间的差来推导块相似度。例如,可以基于当前块(或当前块的模板)与参考块(或参考块的模板)之间的SAD来计算块相似度。在此情况下,可以基于搜索区域中具有最小SAD的参考块来推导运动信息。可以基于帧间预测模式根据若干方法将所推导的运动信息用信号通知到解码设备。
解码设备可以基于运动信息来推导用于当前块的预测样本。包括预测样本的当前块可以被称为预测块。
预测块可以包括当前块的预测样本(预测样本阵列)。在当前块的运动向量指示分数样本单元的情况下,可以执行插值过程,并且通过这个,可以基于参考图片中的分数样本单元中的参考样本来推导当前块的预测样本。在仿射帧间预测被应用于当前块的情况下,编译设备能够以样本/子块为单位基于运动向量(MV)来生成预测样本。在应用双预测的情况下,通过基于L0预测(即,使用参考图片列表L0和MVL0中的参考图片的预测)所推导的预测样本和基于L1预测(即,使用参考图片列表L1和MVL1中的参考图片的预测)所推导的预测样本的加权和或者加权平均(根据相位)所推导的预测样本可以被用作当前块的预测样本。如果当应用双预测时(即,在对应于双预测和双向预测的情况下)用于L0预测的参考图片和用于L1预测的参考图片基于当前图片位于不同时间方向,则它们可以被称为真双预测。
可以基于所推导的预测样本来生成重构样本和重构图片,并且此后,可以执行环路内滤波等的过程。
图6和图7是解释可用于帧间预测的空间候选的图。
在帧间预测期间应用合并模式的情况下,不直接发送当前块的运动信息,并且使用相邻预测块的运动信息来推导当前块的运动信息。因此,编码设备可以通过发送表示使用合并模式的标志信息和表示使用哪个相邻预测块的合并索引来表示当前块的运动信息。该合并模式可以被称为常规合并模式。
编码设备搜索用于诱导当前块的运动信息的合并候选块,以便执行合并模式。例如,可以使用最多5个合并候选块,但是在本实施例中,合并候选块的数量不限于此。此外,可以在切片报头或图块组报头中发送关于合并候选块的最大数目的信息,但是本实施例不限于此。在找到合并候选块之后,编译设备可以生成合并候选列表,并且可以选择其中具有最小成本的合并候选块作为最终合并候选块。
本文提供用于构建合并候选列表的合并候选块的各种实施例。
合并候选列表可以包括(例如)5个合并候选块。例如,可以使用4个空间合并候选和一个时间合并候选。作为特定实例,在空间合并候选的情况下,图6中示出的块A0、A1、B0、B1和B2可以用作空间合并候选。以下,稍后将描述的空间合并候选或空间MVP候选可以被称为SMVP,并且稍后将描述的时间合并候选或时间MVP候选可以被称为TMVP。
例如,可以基于以下过程来配置用于当前块的合并候选列表。
首先,编译设备(编码设备/解码设备)可以将通过搜索当前块的空间相邻块所推导的空间合并候选插入到合并候选列表中。例如,空间相邻块可以包括当前块的左下角相邻块A0、左相邻块A1、左上角相邻块B0、上相邻块B1和左上角相邻块B2。然而,这是示例性的,并且除了上述空间相邻块之外,诸如右相邻块、下相邻块、右下相邻块的附加相邻块可以被进一步用作空间相邻块。编译设备可以通过基于优先级搜索空间相邻块来检测启用块,并可以将检测到的块的运动信息推导为空间合并候选。例如,编码设备和/或解码设备可以按A1、B1、B0、A0和B2的顺序搜索图6中示出的5个块,并且可以通过顺序地对启用候选进行编索引来配置合并候选列表。
此外,编译设备可以将通过搜索当前块的时间相邻块所推导的时间合并候选插入到合并候选列表中。时间相邻块可以位于参考图片上,该参考图片是与当前块所位于的当前图片不同的图片。时间相邻块所位于的参考图片可以被称为并置图片或col图片。可以按照col图片上的用于当前块的右下角相邻块和右下中心块的顺序来搜索时间相邻块。
同时,编译设备可以识别当前合并候选的数目是否小于最大合并候选的数目。最大合并候选的数目可以是预定义的,或可以从编码设备被用信号通知给解码设备。例如,编码设备可以生成关于最大合并候选的数量的信息,对该信息进行编码,并且将编码信息以比特流的形式传送到解码设备。如果最大合并候选的数目被填满,则可以不执行后续候选添加处理。
如果作为识别的结果,当前合并候选的数目小于最大合并候选的数目,则编译设备可以将附加合并候选插入到合并候选列表中。例如,附加合并候选可以包括基于历史的合并候选、成对平均合并候选、ATMVP、组合的双预测合并候选(在当前切片/图块组的切片/图块组类型为B类型的情况下)和/或零向量合并候选中的至少一个。
如果作为识别的结果,当前合并候选的数目不小于最大合并候选的数目,则编码设备可以结束合并候选列表的配置。在这种情况下,编码设备可以基于速率失真(RD)成本从构成合并候选列表的合并候选中选择最佳合并候选,并且可以将指示选定合并候选的选择信息(例如,合并索引)用信号通知给解码设备。解码设备可以基于合并候选列表和选择信息来选择最佳合并候选。
可以使用选定合并候选的运动信息作为当前块的运动信息,并且如上所述,可以基于当前块的运动信息来推导当前块的预测样本。编码设备可以基于预测样本推导当前块的残差样本,并可以将关于残差样本的残差信息用信号通知到解码设备。如上所述,解码设备可以基于根据残差信息所推导的残差样本和预测样本来生成重构样本,并且基于此,解码设备可以生成重构图片。
在帧间预测期间应用跳过模式的情况下,能够以与应用合并模式的情况相同的方式来推导当前块的运动信息。然而,在应用跳过模式的情况下,可以省略用于相应块的残差信号,因此可以将预测样本立即用作重构样本。
基于空间相邻块来执行空间合并候选的推导。例如,最多四个合并候选可以从放置图6所示位置的候选中选择。推导的顺序可以是A1、B1、B0、A0和B2。仅当位置A1、B1、B0、A0的任何CU不可用(例如,因为其属于另一切片或图块)或被帧内编译时,才考虑位置B2。在添加位置A0处的候选之后,对剩余候选的添加进行冗余校验,这确保从列表中排除具有相同运动信息的候选,从而提高编译效率。例如,为了降低计算复杂度,在所提到的冗余校验中不是所有可能的候选对都被考虑。相反,仅考虑图7中用箭头链接的对,并且如果用于冗余校验的相应候选不具有相同运动信息,则可以仅将候选添加到列表。
图8和图9是解释可用于帧间预测的时间候选的图。
这里,时间候选可以表示上述时间合并候选。此外,包括在时间候选中的运动向量可以对应于时间mvp候选。
在该步骤中,仅将一个候选添加到候选列表。特别地,在推导该时间合并候选时,基于属于并置参考图片(可以被称为col图片)的共置CU来推导缩放的运动向量。在切片报头中显式地用信号通知待用于推导共置CU的参考图片列表。如图8中的虚线所示,获得用于时间合并候选的缩放的运动向量,使用POC距离tb和td从共置CU的运动向量缩放该运动向量,其中tb被定义为当前图片的参考图片与当前图片之间的POC差,并且td被定义为共置图片的参考图片与共置图片之间的POC差。时间合并候选的参考图片索引被设置为等于零。
如图9所示,在候选C0和C1之间选择用于时间候选的位置。如果位置C0的CU不可用、被帧内编码或者在CTU的当前行之外,则使用位置C1。否则,位置C0用于推导时间合并候选。
除了合并模式之外,其中隐式推导的运动信息被直接用于当前CU的预测样本生成,在VVC中引入具有运动向量差的合并模式(MMVD)。因为类似运动信息推导方法被用于跳过模式和合并模式,所以MMVD可以被应用于跳过模式。MMVD标志(例如,MMVD_flag)可以在发送跳过标志和合并标志之后被立即用信号通知,以指定MMVD模式是否被用于CU。
在MMVD中,在选择合并候选之后,通过用信号通知的MVD信息来进一步细化合并候选。当MMVD被应用于当前块时(即,当MMVD_flag等于1时),可以用信号通知用于MMVD的进一步信息。
进一步的信息包括合并候选标志(例如,mmvd_merge_flag)、指定运动幅度的索引(例如,mmvd_distance_idx)以及用于指示运动方向的索引(例如,mmvd_direction_idx),所述合并候选标志指示是否合并候选列表中的第一候选(0)或第二候选(1)与运动向量差被一起使用。在MMVD模式中,合并列表中用于前两个候选中的一个被选择用作MV基础。用信号通知合并候选标志以指定使用哪一个。
距离索引指定运动幅度信息并且指示从起始点的预定义偏移。
将偏移添加到起始MV的水平分量或垂直分量。距离索引和预定义偏移的关系在表3中被指定。
[表3]
Figure BDA0003425903160000421
这里,slice_fpel_mmvd_enabled_flag等于1指定具有运动向量差的合并模式使用当前切片中的整数样本精度。slice_fpel_mmvd_enabled_flag等于0指定具有运动向量差的合并模式可以使用当前切片中的分数样本精度。当不存在时,slice_fpel_mmvd_enabled_flag的值推断为0。slice_fpel_mmvd_enabled_flag语法元素可以通过切片报头被用信号通知(可以被包括在其中)。
方向索引表示MVD相对于起始点的方向。方向索引可以表示如表4所示的四个方向。注意的是,MVD符号的意义可以根据起始MV的信息而变化。当该起始MV是其中两个列表指向当前图片的同一侧的非预测MV或双预测MV(即,两个参考的POC都大于当前图片的POC,或都小于当前图片的POC)时,表4中的符号指定添加至该起始MV的MV偏移的符号。当起始MV是其中两个MV指向当前图片的不同侧的双预测MV(即,一个参考的POC大于当前图片的POC,并且另一参考的POC小于当前图片的POC)时,表4中的符号指定添加到起始MV的列表0MV分量的MV偏移的符号且用于列表1MV的符号具有相反值。
[表4]
mmvd_direction_idx[x0][y0] MmvdSign[x0][y0][0] MmvdSign[x0][y0][1]
0 +1 0
1 -1 0
2 0 +1
3 0 -1
合并的两个分量加上MVD偏移MmvdOffset[x0][y0]被如下推导。
[等式1]
MmvdOffset[x0][y0][0]=(MmvdDistance[x0][y0]<<2)*MmvdSign[x0][y0][0]
MmvdOffset[x0][y0][1]=(MmvdDistance[x0][y0]<<2)*MmvdSign[x0][y0][1]
图10是解释可以在帧间预测期间使用的基于子块的时间运动向量预测处理的图。
基于子块的时间运动向量预测(SbTMVP)方法可以被用于帧间预测。类似于时间运动向量预测(TMVP),SbTMVP使用并置图片中的运动场(motion field)来改进当前图片中的用于CU的运动向量预测和合并模式。由TMVP所使用的相同并置图片被用于SbTVMP。SbTMVP与TMVP的区别在于以下两个主要方面。
1.TMVP预测CU级别的运动,但SbTMVP预测子CU级别的运动。
2.鉴于TMVP从并置图片中的并置块(该并置块是相对于当前CU的右下或中心(右下中心)块)提取时间运动向量,SbTMVP在从并置图片提取时间运动信息之前应用运动移位,其中运动移位是从来自当前CU的空间相邻块中的一个的运动向量获得。
图10示出SbTVMP处理。SbTMVP以两个步骤来预测当前CU内的子CU的运动向量。在第一步骤中,检查空间邻居A1。如果A1具有使用并置图片作为其参考图片的运动向量被识别,则该运动向量(可以被称为时间MV(tempVM))被选择为要应用的运动移位。如果没有识别出这样的运动,则运动移位被设置为(0,0)。
在第二步骤中,应用在步骤1中识别的运动移位(即,添加到当前块的坐标),以从如图10所示的并置图片获得子CU级别运动信息(运动向量和参考索引)。图10中的示例假设运动移位被设置为块A1的运动。接着,对于每个子CU,使用其在并置图片中的对应块(覆盖中心样本的最小运动栅格)的运动信息来推导用于子CU的运动信息。当子块具有均匀的长度、宽度和高度时,中心样本(右下中心样本)可以对应于子CU中的4个中心样本之中的右下样本。
在识别并置子CU的运动信息之后,以与TMVP处理类似的方式将其转换为当前子CU的运动向量和参考索引,其中可以应用时间运动缩放以将时间运动向量的参考图片与当前CU的参考图片对准。
包含SbTVMP候选和仿射合并候选这二者的组合的基于子块的合并列表可以被用于用信号通知仿射合并模式(可以被称为(基于)子块的合并模式)。SbTVMP模式由序列参数集(SPS)标志启用/禁用。如果启用SbTMVP模式,则添加SbTMVP预测器作为子块合并候选列表的第一条目,并且其后跟随仿射合并候选。仿射合并候选列表的最大允许大小可以是5。
在SbTMVP中使用的子CU大小可以被固定为8×8,并且如针对仿射合并模式所做的,SbTMVP模式可以仅应用于宽度及高度这两者均大于或等于8的CU。
附加SbTMVP合并候选的编码逻辑与其他合并候选的编码逻辑相同,也就是说,对于P或B切片中的每个CU,可以执行附加RD检查以决定是否使用SbTMVP候选。
图11是解释可应用于帧间预测的分区模式的图。
三角形分区模式可以被用于帧间预测。三角形分区模式可以仅被应用于8x8或更大的CU。与包括常规合并模式、MMVD模式、CIIP模式和子块合并模式的其他合并模式一起,三角形分区模式使用CU级别标志被用信号通知作为一种合并模式。
当使用此模式时,可以使用对角划分或反对角划分将CU均匀地分割成两个三角形分区,如图11中所示。CU中的每个三角形分区是使用其自身的运动被帧间预测的;对于每个分区仅允许单预测,即,每个分区具有一个运动向量和一个参考索引。应用单预测运动约束以确保与传统的双预测相同,每个CU仅需要两个运动补偿预测。
如果三角形分区模式被用于当前CU,则进一步用信号通知指示三角形分区的方向(对角或反对角)的标志和两个合并索引(用于每个分区的一个合并索引)。最大TPM候选大小的数量在切片级别处被显式地用信号通知,并且指定用于TMP合并索引的语法二进制化。在预测三角形分区中的每个之后,使用具有自适应权重的混合处理来调整沿着对角线或反对角边的样本值。这是用于整个CU的预测信号,并且变换和量化处理将被应用于整个CU,如在其他预测模式中那样。最后,使用三角形分区模式预测的CU的运动场以4×4单元被存储。三角形分区模式不与SBT组合使用,也就是说,当用信号通知的三角形模式等于1时,在不用信号通知的情况下将cu_SBT_flag推断为0。
从如上所述构建的合并候选列表直接推导单预测候选列表。
在使用其自身运动来预测每个三角形分区之后,将混合应用于两个预测信号以推导对角线或反对角边周围的样本。
组合的帧间和帧内预测可以应用于当前块。可以用信号通知附加标志(例如,ciip_flag)以指示是否将组合帧间/帧内预测(CIIP)模式应用于当前CU。例如,当在合并模式中编译CU时,如果CU包含至少64个亮度样本(即,CU宽度乘以CU高度等于或大于64),并且如果CU宽度和CU高度这两者均小于128个亮度样本,那么用信号通知附加标志以指示组合的帧间/帧内预测(CIIP)模式是否被应用于当前CU。如其名称指示的,CIIP预测将帧间预测信号与帧内预测信号组合。使用应用于常规合并模式的相同帧间预测处理来推导CIIP模式P_inter中的帧间预测信号;以及利用平面模式在常规帧内预测处理之后推导帧内预测信号P_intra。然后,使用加权平均来组合帧内和帧间预测信号,其中如下根据上相邻块和左相邻块的编码模式来计算权重值。
如果上邻居是可用的并且被帧内编译,则isIntratop被设置为1,否则将isIntratop设置为0。
如果左邻居是可用的并且被帧内编译,则isIntraLeft被设置为1,否则将isIntraLeft设置为0。
如果(isIntraLeft+isIntraLeft)等于2,则wt被设置为3。
否则,如果(isIntraLeft+isIntraLeft)等于1,则wt被设置为2。
否则,将wt设置为1。
CIIP预测如下形成。
[等式2]
PCIIP=((4-wt)*Pinter+wt*Pintra+2)>>2
同时,为了生成预测块,编译设备可以基于上述常规合并模式、跳过模式、SbTMVP模式、MMVD模式、三角形分区模式(分区模式)和/或CIIP模式来诱导运动信息。可以通过序列参数集(SPS)中包括的用于每个模式的开/关标志来启用/禁用每个模式。如果用于特定模式的开/关标志被禁用,则编码设备不用信号通知以CU或PU为单位被显式地发送用于相应预测模式的语法。
在本文中,为了移除冗余语法的信令,公开一种用于考虑到开/关的情况下用信号通知语法的方法以及合并/跳过模式的应用方法。
例如,在regular_merge_flag的情况下,在MMVD、子块合并、CIIP合并和三角形合并不被允许的条件下,除了常规合并模式之外不存在可能候选,并且因此不需要用信号通知标志(例如,常规合并标志)。
此外,在不允许子块合并、CIIP合并和三角形合并的条件下,不需要用信号通知mmvd相关标志(例如,mmvd_merge_flag)。
在不允许CIIP合并和三角形合并的条件下,不需要用信号通知子块相关标志(例如,merge_subblock_flag)。
在不允许三角形合并的条件下,不需要用信号通知CIIP相关标志(例如,ciip_flag)。
根据表2的合并数据语法,在用于合并/跳过模式的特定模式全部或部分被禁用的情况下,发生开/关标志的冗余信令。因此,在本文中,以下方法可以被用于在选择应用于当前块的合并模式的处理中防止相同信息(标志)的冗余信令。
准备以下附图以解释本文的具体示例。由于示例性地呈现了附图中描述的特定装置和信号/信息的名称,所以本说明书的技术特征不限于在以下附图中使用的特定名称。
图12和图13示意性地示出根据本公开的实施例的包括帧间预测方法和相关组件的视频/图像编码方法的示例。
图12中公开的编码方法可以由图2中公开的编码设备200执行。具体地,例如,图12的S1200至S1220可以由编码设备200的预测器220执行,并且S1230可以由编码设备200的残差处理器230执行,并且S1240可以由编码设备200的熵编码器240执行。图12中公开的编码方法可以包括本文的上述实施例。
具体地,参照图12和图13,编码设备的预测器可以确定当前块的预测模式(S1200)。作为示例,在帧间预测应用于当前块的情况下,编码设备的预测器可以将常规合并模式、跳过模式、MMVD模式、子块合并模式、分区模式和CIIP模式中的任一个确定为当前块的预测模式。
这里,常规合并模式可以被定义为用于使用相邻块的运动信息来诱发当前块的运动信息的模式。跳过模式可以被定义为预测块用作重构块的模式。MMVD模式可以被应用于合并模式或跳过模式,并且可以被定义为使用运动向量差的合并(或跳过)模式。子块合并模式可以基于子块而定义为合并模式。分区模式可以被定义为通过将当前块划分为两个分区(对角或反对角)来执行预测的模式。CIIP模式可以被定义为图片间合并和图片内预测彼此组合的模式。
编码设备的预测器可以基于当前块的预测模式来推导当前块的运动信息(S1210)。运动信息可以包括运动向量和参考图片索引。例如,在用于当前块的预测模式被确定为(常规)合并模式的情况下,编码设备的预测器可以基于当前块的空间相邻块和时间相邻块来配置合并候选列表(或运动信息候选列表),并且基于此,编码设备的预测器可以生成运动信息。在这种情况下,编码设备的预测器可以通过运动估计在参考图片的特定区域(搜索区域)中搜索与当前块相似的块来推导与当前块具有差的参考块,该差是最小的或者等于或小于预定参考,并且基于此,编码设备的预测器可以推导指示参考块所放置的参考图片的参考图片索引。此外,编码设备的预测器可以基于参考块和当前块之间的位置差来推导运动向量。
例如,在用于当前块的预测模式被确定为(常规)合并模式的情况下,编码设备的预测器可以基于当前块的空间相邻块和时间相邻块来配置合并候选列表(或运动信息候选列表),并且基于此,编码设备的预测器可以生成运动信息。
编码设备的预测器可以基于当前块的预测模式和当前块的运动信息来推导当前块的预测样本(预测块)(S1220)。此外,编码设备的预测器可以基于预测模式来生成关于预测模式的信息。这里,关于预测模式的信息可以包括帧间/帧内预测分类信息和帧间预测模式信息,并且可以包括与该信息相关的各种语法元素。
编码设备的残差处理器可以基于用于当前块的原始样本(原始块)和用于当前块的预测样本(预测块)来生成残差样本(S1230)。此外,编码设备的残差处理器可以基于残差样本来推导关于残差样本的信息。
编码设备的编码器可以对包括关于残差样本的信息和关于预测模式的信息的图像信息进行编码(S1240)。图像信息可以包括分区相关信息、预测模式相关信息、残差信息和环路内滤波相关信息,并且可以包括与信息相关的各种语法元素。由编码设备的编码器编码的信息能够以比特流的形式被输出。比特流可以通过网络或存储介质被发送到解码设备。
例如,图像信息可以包括关于各种参数集的信息,例如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)。此外,图像信息可以包括关于用于当前块的预测模式的信息,诸如编译单元语法和合并数据语法。这里,序列参数集可以包括组合的图像间合并和图像内预测(CIIP)启用标志(ciip启用标志)和用于分区模式的启用标志。编译单元语法可以包括表示是否将跳过模式应用于当前块的CU跳过标志。
根据实施例,作为示例,为了防止相同语法的重复传输,编码设备可以基于MMVD(MMVD模式)被允许的条件(MMVDAllowed)、合并子块(子块合并模式)被允许的条件(MergeSubBlockAllowed)、合并CIIP(CIIP模式)被允许的条件(MergeCIIPAllowed)和/或合并三角形(分区模式)被允许的条件(MergeTriangleAllowed),应用regular_merge_flag信令条件和相关语义、MMVD_merge_flag信令条件和相关语义、merge_subblock_flag信令条件和相关语义、和/或CIIP标志信令条件和相关语义中的部分或全部。
为此,作为示例,合并数据语法可以如下表5中那样配置。
[表5]
Figure BDA0003425903160000511
在表5中,general_merge_flag[x0][y0]指定是否从相邻帧间预测分区推断用于当前编码单元的帧间预测参数。阵列索引x0、y0指定所考虑的编译块的左上亮度样本相对于图片的左上亮度样本的位置(x0,y0)。
当不存在general_merge_flag[x0][y0]时,如下推断。
-如果cu_skip_flag[x0][y0]等于1,则general_merge_flag[x0][y0]被推断为等于1。
-否则,general_merge_flag[x0][y0]被推断为等于0。
在表5中,可以根据以下条件来诱导MMVD(MMVD模式)被允许的条件(MMVDAllowed)、合并子块(子块合并模式)被允许的条件(MergeSubBlockAllowed)、合并CIIP(CIIP模式)被允许的条件(MergeCIIPAllowed)和/或合并三角形(分区模式)被允许的条件(MergeTriangleAllowed)。
如果所有以下条件为真,则将变量MMVDAllowed设置为等于真。
-general_merge_flag[x0][y0]等于1
-sps_mmvd_enabled_flag等于1
-cbWidth*CbHeight大于32
如果所有以下条件都为真,则将变量MergeSubbLockAllowed设置为等于真。
-general_merge_flag[x0][y0]等于1
-MaxNumSubblockMergeCand>0
cbWidth大于或等于8,并且cbHeight大于或等于8
如果所有以下条件都为真,则变量MergeCIIPAllowed被设置为等于真。
-general_merge_flag[x0][y0]等于1
-sps_ciip_enabled_Flag等于1
-cu_skip_flag[x0][y0]等于0
-cbWidth*CbHeight大于或等于64
-cbWidth小于128并且cbHeight小于128
如果所有以下条件为真,则将MergeTriangleAllowed设置为等于真。
-general_merge_flag[x0][y0]等于1
-sps_triangle_enalbed_Flag等于1,并且slice_type等于B
-NaxNumTriangleMergeCand大于或等于2
-cbWidth*cbHeight大于或等于64
在上述条件之中,MMVDAllowed表示MMVD是可允许的条件,并且在这种情况下,在当前块不是4x8块或8x4块的情况下,基于块大小的该条件被满足。然而,在4x8块和/或8x4块中允许单预测MMVD的情况下,可以提高压缩效率,并且因此MMVDAllowed条件可以如下改变。
如果所有以下条件为真,则将变量MMVDAllowed设置为等于真。
-general_merge_flag[x0][y0]等于1
-sps_mmvd_enabled_flag等于1
同时,regular_merge_flag[x0][y0]等于1指定常规合并模式被用于生成当前编译单元的帧间预测参数。阵列索引x0、y0指定所考虑的编码块的左上亮度样本相对于图片的左上亮度样本的位置(x0,y0)。
参考表5,常规合并标志可以被包括在图像信息中,并且在基于MMVD模式的条件(MMVDAllowed)、基于子块合并模式的条件(MergeSubBlockAllowed)、基于CIIP模式的条件(MergeCIIPAllowed)和基于分区模式的条件(MergeTriangleAllowed)中的至少一个值为1的情况下能够以比特流的形式被用信号通知。
作为示例,在CIIP被启用的情况下,常规合并标志可以被包括在比特流中。可以基于一般合并标志、CIIP启用标志、当前块大小和CU跳过标志中的至少一个来确定CIIP被启用的情况。例如,在一般合并标志值是1、CIIP启用标志值是1、当前块的高度和当前块的宽度的乘积等于或大于64、当前块的高度或当前块的宽度小于128、或者跳过标志值是0的情况下,常规合并标志可以被包括在比特流中。此外,在基于一般合并标志、CIIP启用标志、当前块大小和CU跳过标志的所有条件被满足的情况下,可以在比特流中包括常规合并标志。
作为另一示例,在启用分区模式的情况下,常规合并标志可以被包括在比特流中。可以基于一般合并标志、表示是否启用分区模式的分区模式启用标志和关于当前块的信息中的至少一个来确定启用分区模式的情况。例如,在一般合并标志值是1、分区模式启用标志值是1、当前块的高度与当前块的宽度的乘积等于或大于64、当前块的切片类型是B切片、或者分区模式候选的最大数目等于或大于2的情况下,常规合并标志可以被包括在比特流中。此外,在满足所有上述条件的情况下,可以在比特流中包括常规合并标志。
当regular_merge_flag[x0][y0]不存在于合并数据语法中时,如下推断。
如果所有以下条件均为真,则regular_merge_flag[x0][y0]被推断为等于1。
-MMVDAllowed等于0
-MergeSubBlockAllowed等于0
-MergeCIIPAllowed等于0
-MergeTriangleAllowed等于0
-否则,regular_merge_flag[x0][y0]被推断为等于0。
同时,mmvd_merge_flag[x0][y0]等于1指定具有运动向量差的合并模式被用于生成当前编译单元的帧间预测参数。阵列索引x0、y0指定所考虑的编译块的左上亮度样本相对于图片的左上亮度样本的位置(x0,y0)。
参考表5,在基于MMVD模式的条件(MMVDAllowed)、基于子块合并模式的条件(MergeSubBlockAllowed)、基于CIIP模式的条件(MergeCIIPAllowed)和基于分区模式的条件(MergeTriangleAllowed)中的至少一个值为1的情况下,MMVD合并标志可以被包括在图像信息中并且能够以比特流的形式被用信号通知。
当mmvd_merge_flag[x0][y0]不存在于合并数据语法中时,如下推断。
如果所有以下条件为真,则mmvd_merge_flag[x0][y0]被推断为等于1。
-regular_merge_flag[x0][y0]等于0
-MMVDAllowed等于0
-MergeSubBlockAllowed等于0
-MergeCIIPAllowed等于0
-MergeTriangleAllowed等于0
-否则,mmvd_merge_flag[x0][y0]被推断为等于0。
mmvd_cand_flag[x0][y0]指定合并候选列表中的第一(0)或第二(1)候选是否与从mmvd_distance_idx[x0][y0]和mmvd_direction_idx[x0][y0]推导的运动向量差被一起使用。阵列索引x0、y0指定所考虑的编译块的左上亮度样本相对于图片的左上亮度样本的位置(x0,y0)。当不存在mmvd_cand_flag[x0][y0]时,其被推断为等于0。
mmvd_distance_idx[x0][y0]指定被用于推导MmvdDistance[x0][y0]的索引,如表3中所指定的。阵列索引x0、y0指定了所考虑的编译块的左上亮度样本相对于图像的左上亮度样本的位置(x0,y0)。
mmvd_direction_idx[x0][y0]指定被用于推导MmvdSign[x0][y0]的索引,如表4中所指定的。阵列索引x0、y0指定所考虑的编译块的左上亮度样本相对于图像的左上亮度样本的位置(x0,y0)。
合并的两个分量加上MVD偏移MmvdOffset[x0][y0]被推导为等式1。
merge_subblock_flag[x0][y0]指定是否从相邻块推断用于当前编译单元的基于子块的帧间预测参数。阵列索引x0、y0指定所考虑的编译块的左上亮度样本相对于图片的左上亮度样本的位置(x0,y0)。
参考表5,在基于子块合并模式的条件(MergeSubBlockAllowed)、基于CIIP模式的条件(MergeCIIPAllowed)和基于分区模式的条件(MergeTriangleAllowed)中的至少一个值为1的情况下,合并子块标志可以被包括在图像信息中并且能够以比特流的形式被用信号通知。
当merge_subblock_flag[x0][y0]不存在于合并数据语法中时,推断如下。
如果所有以下条件为真,则推断merge_subblock_flag[x0][y0]等于1。
-regular_merge_flag[x0][y0]等于0
-mmvd_merge_flag[x0][y0]等于0
-MergeSubBlockAllowed等于0
-MergeCIIPAllowed等于0
-MergeTriangleAllowed等于0
-否则,merge_subblock_flag[x0][y0]被推断为等于0。
merge_subblock_flag[x0][y0]指定基于子块的合并候选列表的合并候选索引,其中x0、y0指定所考虑的编译块的左上亮度样本相对于图片的左上亮度样本的位置(x0,y0)。
当merge_subblock_idx[x0][y0]不存在时,将其推断为等于0。
同时,ciip_flag[x0][y0]指定是否对当前编译单元应用组合的图片间合并和图片内预测。阵列索引x0、y0指定所考虑的编译块的左上亮度样本相对于图片的左上亮度样本的位置(x0,y0)。
参考表5,CIIP标志可以被包括在图像信息中,并且在基于CIIP模式的条件(MergeCIIPAllowed)和基于分区模式的条件(MergeTriangleAllowed)中的至少一个值为1的情况下能够以比特流的形式被用信号通知。
例如,在启用分区模式的情况下,CIIP标志可以被包括在比特流中。可以基于一般合并标志、表示是否启用分区模式的分区模式启用标志和关于当前块的信息中的至少一个来确定启用分区模式的情况。例如,在一般合并标志值是1、分区模式启用标志值是1、当前块的高度与当前块的宽度的乘积等于或大于64、当前块的切片类型是B切片、或者分区模式候选的最大数目等于或大于2的情况下,CIIP标志可以被包括在比特流中。此外,在所有以上条件被满足的情况下,CIIP标志可以被包括在比特流中。
当ciip_flag[x0][y0]不存在时,推断如下。
如果所有以下条件为真,则ciip_flag[x0][y0]被设置为等于1。
-MergeCIIPAllowed等于0
-MergeTriangleAllowed等于0
-否则,ciip_flag[x0][y0]被设置为等于0。
当ciip_flag[x0][y0]等于1时,变量IntraPredModeY[x][y]被设置为等于INTRA_PLANAR,其中x=xCb..xCb+cbWidth-1并且y=yCb..yCb+cbHeight-1。
变量MergeTriangleFlag[x0][y0]指定在解码B切片时是否使用基于三角形的运动补偿来生成当前编译单元的预测样本,其被推导如下。
如果所有以下条件是真,则MergeTriangleFlag[x0][y0]被设置为等于1。
-MergeTriangleAllowed等于1
-regular_merge_flag[x0][y0]等于0
-mmvd_merge_flag[x0][y0]等于0
-merge_subblock_flag[x0][y0]等于0
-ciip_flag[x0][y0]等于0
-否则,MergeTriangleFlag[x0][y0]等于0。
图14和图15示意性地示出根据本文的实施例的包括帧间预测方法和相关组件的视频/图像解码方法的示例。
图14中公开的解码方法可以由图3和图15中公开的解码设备300执行。具体地,例如,图14的S1400到S1420可以由解码设备300的预测器330执行,并且S1430可以由解码设备300的加法器340执行。在本文中,图14中公开的解码方法可以包括上述实施例。
参照图14和图15,解码设备可以从比特流获得关于用于当前块的预测模式的信息,并且基于该信息,解码设备可以确定用于当前块的预测模式(S1400)。具体地,解码设备的熵解码器310可以从以比特流形式从图2的编码设备接收到的信号推导残差信息和关于预测模式的信息。这里,关于预测模式的信息可以被称为预测相关信息。关于预测模式的信息可以包括帧间/帧内预测分类信息和帧间预测模式信息,并且可以包括与该信息相关的各种语法元素。
在比特流中,可以包括图像信息,该图像信息包括关于诸如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)等各种参数集的信息。图像信息还可以包括关于用于当前块的预测模式的信息,例如编译单元语法和合并数据语法。序列参数集可以包括CIIP启用标志和用于分区模式的启用标志。编译单元语法可以包括表示是否跳过模式被应用于当前块的CU跳过标志。
解码设备的预测器320可以基于用于当前块的预测模式来推导当前块的运动信息(S1410)。例如,解码设备的预测器320可以基于从比特流获得的关于预测模式的信息来配置用于当前块的运动信息候选列表(或合并候选列表)。此外,解码设备的预测器320可以基于从比特流获得的候选选择信息(合并索引)从运动信息候选列表选择合并候选,并且可以使用选定合并候选的运动信息来推导当前块的运动信息。
在当前块的运动信息被推导时,解码设备的预测器可以基于当前块的运动信息来生成当前块的预测样本(S1420)。
同时,解码设备的残差处理器320可以基于从比特流获得的残差信息来生成残差样本。
解码设备的加法器340可以基于由预测器330生成的预测样本和由残差处理器320生成的残差样本来生成重构样本(S1430)。可以基于重构样本来生成重构图片。此后,根据需要,为了提高主观/客观图像质量,可以对重构图像应用环路内滤波过程,诸如去块滤波、SAO和/或ALF过程。
作为实施例,在确定用于当前块的预测模式时,在基于MMVD模式的条件(MMVDAllowed)、基于子块合并模式的条件(MergeSubBlockAllowed)、基于CIIP模式的条件(MergeCIIPAllowed)和基于分区模式的条件(MergeTriangleAllowed)中的至少一个值为1的情况下,解码设备的预测器可以从比特流获得或解析常规合并标志。
作为示例,在CIIP被启用的情况下,解码设备可以从比特流解析常规合并标志。可以基于一般合并标志、CIIP启用标志、当前块大小和CU跳过标志中的至少一个来确定CIIP被启用的情况。例如,在一般合并标志值是1、CIIP启用标志值是1、当前块的高度和当前块的宽度的乘积等于或大于64、当前块的高度或当前块的宽度小于128、或者跳过标志值是0的情况下,解码设备可以确定CIIP被启用。
作为另一示例,在分区模式被启用的情况下,解码设备可以从比特流解析常规合并标志。可以基于一般合并标志、表示是否启用分区模式的分区模式启用标志和关于当前块的信息中的至少一个来确定启用分区模式的情况。例如,在一般合并标志值为1、分区模式启用标志值为1、当前块的高度与当前块的宽度的乘积等于或大于64、当前块的切片类型为B切片、或者分区模式候选的最大数目等于或大于2的情况下,解码设备可以确定分区模式被启用。进一步地,在满足上述所有条件的情况下,解码设备可以确定启用分区模式。
同时,在确定当前块的预测模式时,在基于MMVD模式的条件(MMVDAllowed)、基于子块合并模式的条件(MergeSubBlockAllowed)、基于CIIP模式的条件(MergeCIIPAllowed)和基于分区模式的条件(MergeTriangleAllowed)中的至少一个值为1的情况下,解码设备的预测器可以从比特流获得或解析MMVD合并标志。
此外,在确定用于当前块的预测模式时,在基于子块合并模式的条件(MergeSubBlockAllowed)、基于CIIP模式的条件(MergeCIIPAllowed)和基于分区模式的条件(MergeTriangleAllowed)中的至少一个值为1的情况下,解码设备的预测器可以从比特流获得或解析合并子块标志。
此外,在确定用于当前块的预测模式时,在基于CIIP模式的条件(MergeCIIPAllowed)和基于分区模式的条件(MergeTriangleAllowed)中的至少一个值为1的情况下,解码设备的预测器可以从比特流获得或解析CIIP标志。作为示例,在分区模式被启用的情况下,解码设备可以从比特流解析CIIP标志。可以基于一般合并标志、表示是否启用分区模式的分区模式启用标志和关于当前块的信息中的至少一个来确定启用分区模式的情况。例如,在一般合并标志值为1、分区模式启用标志值为1、当前块的高度与当前块的宽度的乘积等于或大于64、当前块的切片类型为B切片、或者分区模式候选的最大数目等于或大于2的情况下,解码设备可以确定分区模式被启用。此外,在满足所有以上条件的情况下,解码设备可以确定启用分区模式。
尽管已经基于顺序列出步骤或块的流程图描述了上述示例性系统,但是本公开的步骤不限于特定顺序。因此,相对于上述步骤,某个步骤能够以不同的步骤或以不同的顺序或同时执行。此外,本领域普通技术人员将理解,流程图的步骤不是排他性的。相反,在本公开的范围内,可以在其中包括另一步骤,或者可以删除一个或多个步骤。
根据本公开的上述方法可以是软件的形式,并且根据本公开的编码设备和/或解码设备可以被包括在用于执行图像处理的装置(例如TV、计算机、智能电话、机顶盒、显示装置等)中。
当在本公开中以软件实现实施例时,可以使用执行上述功能的模块(过程、函数等)来实现上述方法。该模块可以存储在存储器中并由处理器执行。存储器可以被内部地或外部地布置到处理器,并且使用各种公知的手段连接到处理器。处理器可以包括专用集成电路(ASIC)、其他芯片组、逻辑电路和/或数据处理器。存储器可以包括只读存储器(ROM)、随机存取存储器(RAM)、闪存、存储器卡、存储介质和/或其他存储设备。也就是说,本文描述的实施例可以在处理器、微处理器、控制器或芯片上实现和执行。例如,在每个附图中示出的功能单元可以在计算机、处理器、微处理器、控制器或芯片上实现和执行。在这种情况下,用于实现的信息(例如,关于指令的信息)或算法可以存储在数字存储介质中。
此外,本公开应用于的解码设备和编码设备可以包括多媒体广播收发器、移动通信终端、家庭影院视频装置、数字影院视频装置、监视相机、视频聊天装置以及诸如视频通信的实时通信装置、移动流装置、存储介质、摄像机、视频点播(VoD)服务提供商、空中(OTT)视频装置、互联网流服务提供商、3D视频装置、虚拟现实(VR)装置、增强现实(AR)装置、图像电话视频装置、车辆终端(例如,车辆(包括自主车辆)终端、飞机终端或船舶终端)和医疗视频装置等中,并且可用于处理图像信号或数据信号。例如,OTT视频装置可以包括游戏机、蓝光播放器、连接互联网的TV、家庭影院系统、智能电话、平板PC和数字录像机(DVR)。
另外,本公开应用于的处理方法能够以由计算机执行的程序的形式产生,并且可以存储在计算机可读记录介质中。具有根据本公开的数据结构的多媒体数据也可以存储在计算机可读记录介质中。计算机可读记录介质包括所有种类的存储装置和其中存储计算机可读数据的分布式存储装置。计算机可读记录介质可以是例如蓝光盘(BD)、通用串行总线(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储设备。计算机可读记录介质还包括以载波(例如,通过因特网的传输)的形式体现的介质。另外,通过编码方法生成的比特流可以被存储在计算机可读记录介质中,或者通过有线或无线通信网络被发送。
此外,本公开的实施例可以被实现为基于程序代码的计算机程序产品,并且程序代码可以由本公开文献的实施例在计算机上执行。程序代码可以存储在计算机可读的载体上。
图16示出本文中公开的实施例可应用于的内容流系统的示例。
参照图16,应用了本文的实施例的内容流系统可以主要包括编码服务器、流服务器、web服务器、媒体存储设备、用户装置和多媒体输入装置。
编码服务器将从多媒体输入装置(例如,智能电话、相机和摄像机)输入的内容压缩为数字数据来生成比特流并将该比特流发送到流服务器。作为另一示例,当多媒体输入装置(例如,智能电话、相机和摄像机等)直接生成比特流时,则可省略编码服务器。
可以通过应用了本文的实施例的编码方法或比特流生成方法来生成比特流,并且流服务器可以在发送或接收比特流的处理时时间上存储比特流。
流服务器通过web服务器基于用户请求将多媒体数据发送到用户装置,并且web服务器用作告知用户服务的介质。当用户向web服务器请求期望的服务时,web服务器将用户的请求递送至流服务器,并且流服务器将多媒体数据发送到用户。在这种情况下,内容流系统可以包括单独的控制服务器。在这种情况下,控制服务器用于控制内容流系统内的装置之间的命令/响应。
流服务器可以从媒体存储装置和/或编码服务器接收内容。例如,当从编码服务器接收到内容时,流服务器可实时地接收内容。在这种情况下,为了提供平滑的流服务,流服务器可以将比特流存储预定时间。
用户装置的示例可以包括便携式电话、智能电话、膝上型计算机、数字广播终端、个人数字助理(PDA)、便携式多媒体播放器(PMP)、导航装置、石板PC、平板PC、超级本、可穿戴装置(例如,智能手表、智能眼镜、头戴式显示器(HMD))、数字TV、台式计算机、数字标牌等。
内容流系统中的每个服务器可操作作为分布服务器,在这种情况下可以分布从每个服务器接收到的数据。

Claims (15)

1.一种由解码设备执行的解码方法,所述方法包括:
基于来自比特流的与预测模式有关的信息来确定当前块的所述预测模式;
基于所述预测模式来推导所述当前块的运动信息;
基于所述运动信息来生成所述当前块的预测样本;以及
基于所述预测样本来生成重构样本,
其中,所述确定包括基于表示组合的图片间合并和图片内预测(CIIP)是否被启用的CIIP启用标志从所述比特流获得常规合并标志。
2.根据权利要求1所述的解码方法,其中,所述获得包括:
基于所述当前块的高度与所述当前块的宽度的乘积等于或大于64,确定所述CIIP被启用;以及
基于所述CIIP被启用,从所述比特流解析所述常规合并标志。
3.根据权利要求1所述的解码方法,其中,所述获得包括:
基于所述当前块的高度和所述当前块的宽度分别小于128,确定所述CIIP被启用;以及
基于所述CIIP被启用,从所述比特流解析所述常规合并标志。
4.根据权利要求1所述的解码方法,其中,所述获得包括:
基于所述CIIP启用标志的值等于1,确定所述CIIP被启用;以及
基于所述CIIP被启用,从所述比特流解析所述常规合并标志。
5.根据权利要求1所述的解码方法,其中,与所述预测模式有关的信息还包括表示是否跳过模式被应用于所述当前块的跳过标志,以及
其中,所述获得包括:
基于所述跳过标志的值等于0,确定所述CIIP被启用;以及
基于所述CIIP被启用,从所述比特流解析所述常规合并标志。
6.根据权利要求1所述的解码方法,其中,与所述预测模式有关的信息还包括一般合并标志,以及
其中,所述获得包括:
基于所述一般合并标志的值等于1,确定所述CIIP被启用;以及
基于所述CIIP被启用,从所述比特流解析所述常规合并标志。
7.根据权利要求1所述的解码方法,其中,与所述预测模式有关的信息还包括表示用于通过将当前块划分成两个分区来执行预测的分区模式是否被启用的标志,以及
其中,所述获得包括基于所述CIIP未被启用并且所述分区模式被启用,从所述比特流获得所述常规合并标志。
8.根据权利要求7所述的解码方法,其中,基于所述分区模式被启用从所述比特流获得所述常规合并标志包括:
基于包括所述当前块的切片的类型是B切片,确定所述分区模式被启用;以及
基于所述分区模式被启用,从所述比特流解析所述常规合并标志。
9.根据权利要求7所述的解码方法,其中,基于所述分区模式被启用从所述比特流获得所述常规合并标志包括:
基于表示所述分区模式是否被启用的所述标志的值等于1,确定所述分区模式被启用;以及
基于所述分区模式被启用,从所述比特流解析所述常规合并标志。
10.一种由编码设备执行的编码方法,所述方法包括:
确定当前块的预测模式;
基于所述预测模式来推导所述当前块的运动信息;
基于所述运动信息来推导所述当前块的预测样本;
基于所述预测样本来推导残差样本;以及
对包括基于所述预测模式生成的与预测模式相关的信息和基于所述残差样本生成的残差信息的图像信息进行编码,
其中,所述图像信息包括基于表示组合的图片间合并和图片内预测(CIIP)是否被启用的CIIP启用标志的常规合并标志。
11.根据权利要求10所述的编码方法,其中,基于所述当前块的高度与所述当前块的宽度的乘积等于或大于64并且所述当前块的高度与所述当前块的宽度分别小于128,确定所述CIIP被启用,以及
其中,基于所述CIIP被启用,所述常规合并标志被包括在所述图像信息中。
12.根据权利要求10所述的编码方法,其中,基于所述CIIP启用标志的值等于1,确定所述CIIP被启用,以及
其中,基于所述CIIP被启用,所述常规合并标志被包括在所述图像信息中。
13.根据权利要求10所述的编码方法,其中,所述图像信息还包括表示是否跳过模式被应用于所述当前块的跳过标志,
其中,基于所述跳过标志的值等于0,确定所述CIIP被启用,以及
其中,基于所述CIIP被启用,所述常规合并标志被包括在所述图像信息中。
14.根据权利要求10所述的编码方法,其中,所述图像信息还包括一般合并标志,以及
其中,基于所述一般合并标志的值等于1,确定所述CIIP被启用,以及
其中,基于所述CIIP被启用,所述常规合并标志被包括在所述图像信息中。
15.一种计算机可读数字存储介质,包括使解码设备执行解码方法的信息,
其中,所述解码方法包括:
基于来自比特流的预测模式信息来确定当前块的预测模式;
基于所述预测模式来推导所述当前块的运动信息;
基于所述运动信息来生成所述当前块的预测样本;以及
基于所述预测样本来生成重构样本,
其中,确定所述预测模式包括基于表示组合的图片间合并和图片内预测(CIIP)是否被启用的CIIP启用标志从所述比特流获得常规合并标志。
CN202080045848.XA 2019-06-23 2020-06-23 视频/图像编译系统中用于合并数据语法的信令方法和装置 Pending CN114009047A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962865288P 2019-06-23 2019-06-23
US62/865,288 2019-06-23
PCT/KR2020/008155 WO2020262931A1 (ko) 2019-06-23 2020-06-23 비디오/영상 코딩 시스템에서 머지 데이터 신택스의 시그널링 방법 및 장치

Publications (1)

Publication Number Publication Date
CN114009047A true CN114009047A (zh) 2022-02-01

Family

ID=74060285

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080045848.XA Pending CN114009047A (zh) 2019-06-23 2020-06-23 视频/图像编译系统中用于合并数据语法的信令方法和装置

Country Status (6)

Country Link
US (2) US11877010B2 (zh)
EP (1) EP3989583A4 (zh)
JP (1) JP7477536B2 (zh)
KR (1) KR20210143325A (zh)
CN (1) CN114009047A (zh)
WO (1) WO2020262931A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7238173B2 (ja) * 2019-06-23 2023-03-13 エルジー エレクトロニクス インコーポレイティド ビデオ/映像コーディングシステムにおけるシンタックスシグナリング方法及び装置
WO2020262930A1 (ko) * 2019-06-23 2020-12-30 엘지전자 주식회사 머지 데이터 신택스에서 중복적인 신택스의 제거 방법 및 장치
WO2021015195A1 (ja) * 2019-07-24 2021-01-28 シャープ株式会社 画像復号装置、画像符号化装置、および画像復号方法
WO2023113209A1 (ko) * 2021-12-15 2023-06-22 현대자동차주식회사 움직임벡터 예측자들의 후보 리스트를 이용하는 비디오 코딩을 위한 방법 및 장치

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120230408A1 (en) * 2011-03-08 2012-09-13 Minhua Zhou Parsing Friendly and Error Resilient Merge Flag Coding in Video Coding
WO2012138032A1 (ko) * 2011-04-07 2012-10-11 엘지전자 주식회사 영상 정보 부호화 방법 및 복호화 방법
US20130188720A1 (en) * 2012-01-24 2013-07-25 Qualcomm Incorporated Video coding using parallel motion estimation
CN103229507A (zh) * 2010-11-25 2013-07-31 Lg电子株式会社 使用信号通知图像信息的方法和使用该方法来解码图像信息的方法
CN106471806A (zh) * 2014-06-16 2017-03-01 高通股份有限公司 3d‑hevc中的简化移位合并候选者及合并列表导出
WO2017084512A1 (en) * 2015-11-20 2017-05-26 Mediatek Inc. Method and apparatus of motion vector prediction or merge candidate derivation for video coding
CN114270833A (zh) * 2019-06-19 2022-04-01 Lg 电子株式会社 用于在视频/图像编译系统中移除重叠信令的方法和装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK3661210T3 (da) * 2010-07-20 2023-09-11 Ntt Docomo Inc Fremgangsmåde til forudsigende billedafkodning
US20130336386A1 (en) * 2012-06-18 2013-12-19 Qualcomm Incorporated Sample adaptive offset (sao) coding
US9912942B2 (en) * 2012-12-28 2018-03-06 Qualcomm Incorporated High-frequency-pass sample adaptive offset in video coding
US10778999B2 (en) * 2016-09-30 2020-09-15 Qualcomm Incorporated Frame rate up-conversion coding mode with affine motion model
EP3711299A1 (en) * 2017-11-14 2020-09-23 Qualcomm Incorporated Unified merge candidate list usage
EP3518536A1 (en) * 2018-01-26 2019-07-31 Thomson Licensing Method and apparatus for adaptive illumination compensation in video encoding and decoding
US20210281849A1 (en) * 2018-07-06 2021-09-09 Sony Corporation Image processing device, image processing method, and program
WO2020262930A1 (ko) 2019-06-23 2020-12-30 엘지전자 주식회사 머지 데이터 신택스에서 중복적인 신택스의 제거 방법 및 장치
JP7238173B2 (ja) 2019-06-23 2023-03-13 エルジー エレクトロニクス インコーポレイティド ビデオ/映像コーディングシステムにおけるシンタックスシグナリング方法及び装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103229507A (zh) * 2010-11-25 2013-07-31 Lg电子株式会社 使用信号通知图像信息的方法和使用该方法来解码图像信息的方法
US20120230408A1 (en) * 2011-03-08 2012-09-13 Minhua Zhou Parsing Friendly and Error Resilient Merge Flag Coding in Video Coding
WO2012138032A1 (ko) * 2011-04-07 2012-10-11 엘지전자 주식회사 영상 정보 부호화 방법 및 복호화 방법
US20130188720A1 (en) * 2012-01-24 2013-07-25 Qualcomm Incorporated Video coding using parallel motion estimation
CN106471806A (zh) * 2014-06-16 2017-03-01 高通股份有限公司 3d‑hevc中的简化移位合并候选者及合并列表导出
WO2017084512A1 (en) * 2015-11-20 2017-05-26 Mediatek Inc. Method and apparatus of motion vector prediction or merge candidate derivation for video coding
CN114270833A (zh) * 2019-06-19 2022-04-01 Lg 电子株式会社 用于在视频/图像编译系统中移除重叠信令的方法和装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
YI-WEN CHEN;XIANGLIN WANG: "CE4: Regular merge flag coding (CE4-1.2.a and CE4-1.2.b)", 《JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 14TH MEETING: GENEVA, CH, 19–27 MARCH 2019 JVET-N0324》, 21 March 2019 (2019-03-21) *
杨克伟: "视频压缩算法研究", 《中国优秀硕士学位论文全文数据库(电子期刊)》, 15 August 2014 (2014-08-15) *
杨静 孙煜: "高效视频编码的Merge模式候选决策研究与改进", 《计算机工程》, 29 February 2016 (2016-02-29) *

Also Published As

Publication number Publication date
US11877010B2 (en) 2024-01-16
US20240107074A1 (en) 2024-03-28
JP2022537255A (ja) 2022-08-25
WO2020262931A1 (ko) 2020-12-30
US20220109883A1 (en) 2022-04-07
EP3989583A4 (en) 2023-06-14
JP7477536B2 (ja) 2024-05-01
KR20210143325A (ko) 2021-11-26
EP3989583A1 (en) 2022-04-27

Similar Documents

Publication Publication Date Title
JP7477536B2 (ja) ビデオ/映像コーディングシステムにおけるマージデータシンタックスのシグナリング方法及び装置
JP7462094B2 (ja) ビデオ/映像コーディングシステムにおける重複シグナリング除去方法及び装置
CN113273192A (zh) 使用mpm列表的基于帧内预测的视频编码方法及装置
JP7238172B2 (ja) マージデータシンタックスにおける重複シンタックスの除去方法及び装置
JP7249441B2 (ja) 予測サンプルを生成するための加重値インデックス情報を導出する映像デコーディング方法、及びその装置
CN114080810A (zh) 基于帧间预测的图像编译方法和装置
CN113261294A (zh) 基于sbtmvp的帧间预测方法和设备
CN114270835A (zh) 基于默认合并模式推导预测样本的图像解码方法及其装置
CN114258676A (zh) 当最终无法选择当前块的预测模式时执行帧间预测的图像解码方法及其装置
CN114051726A (zh) 使用运动矢量差进行图像编译的方法和装置
CN113475065A (zh) 使用统一mpm列表的基于帧内预测的图像编译方法和设备
JP2024019432A (ja) 決定された予測モードを適用して予測サンプルを生成する映像デコーディング方法及びその装置
US20220239918A1 (en) Method and device for syntax signaling in video/image coding system
CN114342387A (zh) 基于运动预测的图像编译方法和装置
JP2023090963A (ja) インター予測に基づく映像コーディング方法及び装置
US20220150473A1 (en) Image decoding method and device therefor
CN114080809A (zh) 子块单元的基于时间运动矢量预测子候选的图像或视频编译
CN113273210B (zh) 用于编译关于合并数据的信息的方法和装置
JP2024086946A (ja) ビデオ/映像コーディングシステムにおけるマージデータシンタックスのシグナリング方法及び装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination