CN112889278A - 用于编码和解码运动信息的方法及用于编码和解码运动信息的装置 - Google Patents

用于编码和解码运动信息的方法及用于编码和解码运动信息的装置 Download PDF

Info

Publication number
CN112889278A
CN112889278A CN201980060787.1A CN201980060787A CN112889278A CN 112889278 A CN112889278 A CN 112889278A CN 201980060787 A CN201980060787 A CN 201980060787A CN 112889278 A CN112889278 A CN 112889278A
Authority
CN
China
Prior art keywords
motion vector
merge
information
mode
current block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201980060787.1A
Other languages
English (en)
Other versions
CN112889278B (zh
Inventor
郑丞洙
朴缗茱
朴慜祐
崔棋镐
朴银姬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN112889278A publication Critical patent/CN112889278A/zh
Application granted granted Critical
Publication of CN112889278B publication Critical patent/CN112889278B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/56Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

提供一种视频解码方法,包括:将当前块的预测模式确定为跳过模式和合并模式之一;当要使用从当前块的合并候选者列表确定的运动向量和合并运动向量差时,通过应用一条上下文信息对比特流执行熵编码,获得指示合并候选者列表中的一个候选者的合并候选者信息;基于合并候选者信息,确定来自从合并候选者列表确定的一个候选者的基本运动向量;和通过使用当前块的合并运动向量差的距离索引和合并运动向量差的方向索引来确定当前块的运动向量,以使用基本运动向量和合并运动向量差。

Description

用于编码和解码运动信息的方法及用于编码和解码运动信息 的装置
技术领域
本公开涉及图像编码和解码领域。特别地,本公开涉及用于编码用于编码和解码图像的运动信息的方法和装置以及用于解码该运动信息的方法和装置。
背景技术
在编码和解码图像的方法中,可以将一个图片分割成块以编码该图像,并且可以通过帧间预测或帧内预测对每个块进行预测编码。
帧间预测的代表性示例是使用通过去除图片之间的时间冗余来压缩图像的方法的运动估计编码。在运动估计编码中,通过使用至少一个参考图片来预测当前图片的块。可以通过使用特定评估函数在特定搜索范围内搜索与当前块最相似的参考块。基于参考块来预测当前块,并且通过从当前块中减去作为预测结果而生成的预测块来生成残余块,然后对其进行编码。这里,为了进一步准确地执行预测,对参考图片的搜索范围执行内插,以生成小于整像素单位(integer pel unit)的亚像素单位(sub pel unit)的像素,并且可以基于生成的亚像素单位的像素执行帧间预测。
在诸如H.264高级视频编码(AVC)和高效视频编码(HEVC)的编解码器中,使用了与预编码图片中包括的一个或多个当前块相邻的预编码块的运动向量作为当前块的预测运动向量,以预测当前块的运动向量。通过特定方法将作为当前块的运动向量与预测运动向量之间的差的差分运动向量用信号通知给解码器。
发明内容
技术问题
根据实施例的编码和解码运动信息的方法以及用于编码和解码运动信息的装置的技术问题是高效地对运动信息执行熵编码/解码。
问题的解决方案
根据本公开的实施例的一种解码运动信息的方法包括:将当前块的预测模式确定为跳过模式和合并模式之一;当要使用从当前块的合并候选者列表确定的运动向量和合并运动向量差时,通过应用一条上下文信息对比特流执行熵编码,获得指示合并候选者列表中的一个候选者的合并候选者信息;基于合并候选者信息,确定来自从合并候选者列表确定的一个候选者的基本运动向量;和通过使用当前块的合并运动向量差的距离索引和合并运动向量差的方向索引来确定当前块的运动向量,以使用基本运动向量和合并运动向量差。
在根据实施例的解码运动信息的方法中,用于在跳过模式下获得合并差模式信息的上下文信息和用于在合并模式下获得合并差模式信息的上下文信息可以相同。
本公开有利效果
根据实施例,编码和解码运动信息的方法以及用于编码和解码运动信息的装置可以使用简化的上下文信息来高效地对运动信息执行熵编码/解码。
然而,根据实施例,通过编码和解码运动信息的方法以及用于编码和解码运动信息的装置可取得的效果不限于上述效果,并且根据以下描述,本领域普通技术人员能够清楚地理解未提及的其他效果。
附图说明
提供每个附图的简要描述以更好地理解本文引用的附图。
图1是根据实施例的图像解码装置的示意性框图。
图2是根据实施例的图像解码方法的流程图。
图3示出了根据实施例的由图像解码装置执行的通过分割当前编码单元来确定至少一个编码单元的过程。
图4示出了根据实施例的由图像解码装置执行的通过分割非正方形编码单元来确定至少一个编码单元的过程。
图5示出了根据实施例的由图像解码装置执行的基于块形状信息和分割形状模式信息中的至少一个来分割编码单元的过程。
图6示出了根据实施例的由图像解码装置执行的从奇数个编码单元中确定特定编码单元的方法。
图7示出了根据实施例的当图像解码装置通过分割当前编码单元确定多个编码单元时处理该多个编码单元的顺序。
图8示出了根据实施例的由图像解码装置执行的当编码单元不能以特定顺序处理时确定当前编码单元要被分割成奇数个编码单元的过程。
图9示出了根据实施例的由图像解码装置执行的通过分割第一编码单元来确定至少一个编码单元的过程。
图10示出了根据实施例的当具有在图像解码装置分割第一编码单元时确定的非正方形形状的第二编码单元满足特定条件时第二编码单元能够被分割成的形状受到限制。
图11示出了根据实施例的由图像解码装置执行的当分割形状模式信息不能指示正方形编码单元被分割成四个正方形编码单元时分割正方形编码单元的过程。
图12示出了根据实施例的可以根据分割编码单元的过程来改变多个编码单元之间的处理顺序。
图13示出了根据实施例的当递归地分割编码单元使得确定多个编码单元时在编码单元的形状和大小改变时确定编码单元的深度的过程。
图14示出了根据实施例的基于编码单元的形状和大小可确定的深度,以及用于区分编码单元的部分索引(PID(part index))。
图15示出了根据实施例的基于图片中包括的多个特定数据单元确定多个编码单元。
图16是图像编码和解码系统的框图。
图17是根据实施例的视频解码装置的详细框图。
图18是根据实施例的视频解码方法的流程图。
图19是根据实施例的视频编码装置的框图。
图20是根据实施例的视频编码方法的流程图。
图21示出了根据实施例的运动向量候选者的位置。
图22至25示出了显示在坐标平面上的运动向量候选者。
图26示出了根据实施例的合并候选者信息、合并差分距离索引和合并差分方向索引的值和含义。
图27示出了根据实施例的用于通过使用基本运动向量和合并运动向量差来获得运动向量的等式。
图28示出了根据实施例的用于获得合并差模式信息、合并候选者信息、合并差分距离索引和合并差分方向索引的语法。
图29示出了根据另一实施例的用于获得合并差模式信息、合并候选者信息、合并差分距离索引和合并差分方向索引的语法。
图30是根据实施例的用于确定合并相关信息的上下文信息的参考表。
具体实施方式
根据本公开的实施例的解码运动信息的方法包括:将当前块的预测模式确定为跳过模式和合并模式之一;当要使用从当前块的合并候选者列表确定的运动向量和合并运动向量差时,通过应用一条上下文信息对比特流执行熵编码,获得指示合并候选者列表中的一个候选者的合并候选者信息;基于合并候选者信息,从从合并候选者列表确定的一个候选者确定基本运动向量;和通过使用当前块的合并运动向量差的距离索引和合并运动向量差的方向索引使用基本运动向量和合并运动向量差确定当前块的运动向量。
根据实施例,将当前块的预测模式确定为跳过模式和合并模式之一可以包括:当当前块的预测模式为跳过模式时,获得指示是否要使用从当前块的合并候选者列表确定的运动向量和合并运动向量差的合并差模式信息;而当当前块的预测模式为合并模式时,获得指示是否要使用从当前块的合并候选者列表确定的运动向量和合并运动向量差的合并差模信息,其中,用于在跳过模式下获得合并差模式信息的上下文信息和用于在合并模式下获得合并差模式信息的上下文信息可以相同。
根据实施例,当前块的运动向量的确定可以包括通过经由旁路模式对比特流执行熵解码来获得指示合并运动向量差的方向索引的两个bin。
根据实施例,可以通过将一条上下文信息应用于比特流的熵解码来获得作为一个比特的信息的合并候选者信息。
根据实施例,当在合并模式下执行预测时,获得指示合并候选者列表中的一个候选者的一般合并索引所需的上下文信息条的数量和获得合并候选者信息所需的上下文信息条的数量可以相同。
根据实施例,可以通过相同的语法元素确定用于确定是否要在跳过模式和合并模式下使用从当前块的合并候选者列表确定的运动向量和合并运动向量差的合并差模式信息条。
根据本公开的实施例的用于解码运动信息的装置包括:帧间预测信息获得器,其被配置为将当前块的预测模式确定为跳过模式和合并模式之一,并且当要使用从当前块的合并候选者列表确定的运动向量和合并运动向量差时,通过应用一条上下文信息对比特流执行熵编码,获得指示合并候选者列表中的一个候选者的合并候选者信息;帧间预测执行器,其被配置基于合并候选者信息,从在合并候选者列表中确定的一个候选者确定基本运动向量,和通过使用当前块的合并运动向量差的距离索引和合并运动向量差的方向索引使用基本运动向量和合并运动向量差确定当前块的运动向量;重构器,其被配置为通过使用运动向量来重构当前块。
根据实施例的帧间预测信息获得器还可以被配置为:当当前块的预测模式为跳过模式时,获得指示是否要使用从当前块的合并候选者列表确定的运动向量和合并运动向量差的合并差模式信息;而当当前块的预测模式为合并模式时,获得指示是否要使用从当前块的合并候选者列表确定的运动向量和合并运动向量差的合并差模信息,其中,用于在跳过模式下获得合并差模式信息的上下文信息和用于在合并模式下获得合并差模式信息的上下文信息可以相同。
根据实施例的帧间预测信息获得器还可以被配置为通过经由旁路模式对比特流执行熵解码来获得指示合并运动向量差的方向索引的两个bin。
根据实施例的帧间预测信息获得器还可以被配置为通过将一条上下文信息应用于比特流的熵解码来获得作为一个比特的信息的合并候选者信息。
根据实施例,在用于解码运动信息的装置中,当在合并模式下执行预测时,获得指示合并候选者列表中的一个候选者的一般合并索引所需的上下文信息条的数量和获得合并候选者信息所需的上下文信息条的数量可以相同。
根据实施例,在用于解码运动信息的装置中,可以通过相同的语法元素确定用于确定是否要在跳过模式和合并模式下使用从当前块的合并候选者列表确定的运动向量和合并运动向量差的合并差模式信息条。
根据本公开的实施例的编码运动信息的方法包括:当在跳过模式和合并模式之一下对当前块执行帧间预测时,确定是否要使用从当前块的合并候选者列表确定的基本运动向量和合并运动向量差;当要使用合并运动向量差时,通过应用一条上下文信息对比特流执行熵编码,生成指示合并候选者列表中的一个基本运动向量的合并候选者信息;和生成与基本运动向量和当前块的运动向量之间的差对应的合并运动向量差的距离索引,以及合并运动向量差的方向索引。
根据本公开的实施例的用于编码运动信息的装置包括:帧间预测执行器,其被配置为通过对当前块执行帧间预测来确定当前块的运动向量;和帧间预测信息生成器,其被配置为:当在跳过模式和合并模式之一下当前块执行帧间预测时,确定是否要使用从当前块的合并候选者列表确定的基本运动向量和合并运动向量差;当要使用合并运动向量差时,通过应用一条上下文信息对比特流执行熵编码生成指示合并候选者列表中的基本运动向量的合并候选者信息;和生成与基本运动向量和当前块的运动向量之间的差对应的合并运动向量差的距离索引,以及合并运动向量差的方向索引。
公开的实施方式
由于本公开允许各种改变和大量示例,因此将在附图中示出并且在书面描述中详细描述特定实施例。然而,这并不旨在将本公开限制为特定的实践模式,并且将理解的是,不脱离各种实施例的精神和技术范围的所有改变、等同物和替代物都被包含在本公开中。
在实施例的描述中,当认为相关技术的某些详细说明可能不必要地使本公开的本质模糊不清时,将对其省略。另外,在说明书的描述中使用的数字(例如,第一、第二等)仅是用于将一个要素与另一要素区分开的标识符代码。
此外,在本说明书中,将理解的是,当元件彼此“连接”或“联接”时,除非另有说明,元件可以直接彼此连接或联接,但是可以替代地借助其间的中间元素彼此连接或联接。
在本说明书中,关于表示为“单元”或“模块”的元件,可以将两个或更多个元件组合成一个元件,或者可以根据细分功能将一个元件分为两个或更多个元件。另外,在下文中描述的每个元件除了其自身的主要功能之外,还可以附加地执行由另一元件执行的一些或全部功能,并且每个元件的一些主要功能可以完全由另一组件执行。
另外,在本说明书中,“图像”或“图片”可以表示视频的静态图像或运动图像,即,视频本身。
另外,在本说明书中,“样本”表示分配给图像的采样位置的数据,即要被处理的数据。例如,图像在空间域中的像素值和变换区域上的变换系数可以是样本。包括至少一个这样的样本的单元可以被定义为块(block)。
此外,在本说明书中,“当前块”可以表示要被编码或解码的当前图像的最大编码单元、编码单元、预测单元或变换单元的块。
在本说明书中,列表0方向上的运动向量可以表示用于指示列表0中包括的参考图片中的块的运动向量,并且列表1方向上的运动向量可以表示用于指示列表1中包括的参考图片中的块的运动向量。此外,单向上的运动向量可以表示用于指示列表0或列表1中包括的参考图片中的块的运动向量,而双向上的运动向量可以表示包括在列表0方向上的运动向量和在列表1方向上的运动向量的运动向量。
在下文中,将参考图1至图16描述根据实施例的图像编码装置和图像解码装置以及图像编码方法和图像解码方法。将参考图3至图16描述根据实施例的确定图像的数据单元的方法,并且将参考图17至图30描述根据实施例的视频编码/解码方法,其中,通过使用概率运动表达方法来扩展帧间预测方法。
在下文中,将参考图1和图2描述根据本公开的实施例的用于基于编码单元的各种形状进行自适应选择的方法和装置。
图1是根据实施例的图像解码装置的示意性框图。
图像解码装置100可以包括接收器110和解码器120。接收器110和解码器120可以包括至少一个处理器。另外,接收器110和解码器120可以包括存储器,该存储器存储要由至少一个处理器执行的指令。
接收器110可以接收比特流。比特流包括由稍后描述的图像编码装置2200编码的图像的信息。另外,可以从图像编码装置2200发送比特流。图像编码装置2200和图像解码装置100可以通过有线或无线地连接,并且接收器110可以通过有线或无线地接收比特流。接收器110可以从诸如光学介质或硬盘的存储介质接收比特流。解码器120可以基于从接收的比特流获得的信息来重构图像。解码器120可以从比特流获得用于重构图像的语法元素。解码器120可以基于语法元素来重构图像。
将参考图2详细描述图像解码装置100的操作。
图2是根据实施例的图像解码方法的流程图。
根据本公开的实施例,接收器110接收比特流。
图像解码装置100从比特流获得与编码单元的分割形状模式对应的二进制字符串(bin string)(操作210)。图像解码装置100确定编码单元的分割规则(操作220)。此外,图像解码装置100基于与分割形状模式对应的二进制字符串和分割规则中的至少一个,将编码单元分割成多个编码单元(操作230)。图像解码装置100可以根据编码单元的宽度和高度的比率来确定编码单元的大小的可允许第一范围,以便确定分割规则。图像解码装置100可以根据编码单元的分割形状模式来确定编码单元的大小的可允许第二范围,以便确定分割规则。
在下文中,将根据本公开的实施例详细描述编码单元的分割。
首先,可以将一个图片分割成一个或多个切片(slice)或一个或多个瓦片(tile)。一个切片或一个瓦片可以是一个或多个最大编码单元(编码树单元(CTU))的序列。从概念上讲,与最大编码单元(CTU)相比,存在最大编码块(编码树块(CTB))。
最大编码单元(CTB)表示包括NxN个样本的NxN块(N位整数)。每个颜色分量可以被分割成一个或多个最大编码块。
当图片具有三个样本阵列(用于Y、Cr和Cb分量的样本阵列)时,最大编码单元(CTU)包括亮度样本的最大编码块、色度样本的两个对应的最大编码块以及用于编码亮度样本和色度样本的语法结构。当图片是单色图片时,最大编码单元包括单色样本的最大编码块和用于编码单色样本的语法结构。当图片是在根据颜色分量分离的颜色平面中编码的图片时,最大编码单元包括用于编码图片和图片的样本的语法结构。
可以将一个最大的编码块(CTB)分割成包括MxN个样本的MxN个编码块(M和N为整数)。
当图片具有用于Y、Cr和Cb分量的样本阵列时,编码单元(CU)包括亮度样本的编码块、色度样本的两个对应的编码块以及用于编码亮度样本和色度样本的语法结构。当图片是单色图片时,编码单元包括单色样本的编码块和用于编码单色样本的语法结构。当图片是在根据颜色分量分离的颜色平面中编码的图片时,编码单元包括用于编码图片和图片的样本的语法结构。
如上所述,最大编码块和最大编码单元在概念上彼此区分,并且编码块和编码单元在概念上彼此区分。也就是说,(最大)编码单元是指包括包含对应样本的(最大)编码块和与(最大)编码块对应的语法结构的数据结构。但是,由于本领域普通技术人员可以理解,(最大)编码单元或(最大)编码块是指包括特定数量的样本的具有特定大小的块,因此,除非另有描述,否则在以下说明书中不进行区分地提及最大编码块和最大编码块或者编码块和编码单元。
图像可以被分割成最大编码单元(CTU)。可以基于从比特流获得的信息来确定每个最大编码单元的大小。每个最大编码单元的形状可以是相同大小的正方形形状。然而,实施例不限于此。
例如,可以从比特流获得关于亮度编码块的最大大小的信息。例如,由关于亮度编码块的最大大小的信息指示的亮度编码块的最大大小可以为4x4、8x8、16x16、32x32、64x64、128x128和256x256之一。
例如,可以从比特流获得关于亮度编码块的亮度块大小差和可以被一分为二的亮度编码块的最大大小的信息。关于亮度块大小差的信息可以指的是亮度最大编码单元和可以被一分为二的最大亮度编码块之间的大小差。因此,当将关于可以被一分为二的亮度编码块的最大大小的信息和关于从比特流获得的亮度块大小差的信息彼此结合时,可以确定亮度最大编码单元的大小。可以通过使用亮度最大编码单元的大小来确定色度最大编码单元的大小。例如,当Y:Cb:Cr比率根据颜色格式为4:2:0时,色度块的大小可以是亮度块的大小的一半,并且色度最大编码单元的大小可以是最大亮度编码单元的大小的一半。
根据实施例,因为从比特流获得关于可二元分割的亮度编码块的最大大小的信息,所以可以可变地确定可二元分割的亮度编码块的最大大小。相比之下,可三元分割的亮度编码块的最大大小可以固定。例如,在I图片中的可三元分割的亮度编码块的最大大小可以是32x32,并且在P图片或B图片中的可三元分割的亮度编码块的最大大小可以是64x64。
此外,最大编码单元可以基于从比特流获得的分割形状模式信息被分层地分割成编码单元。可以从比特流获得指示是否执行四分割的信息、指示是否执行多分割的信息、分割方向信息和分割类型信息中的至少一个作为分割形状模式信息。
例如,指示是否执行四分割的信息可以指示当前编码单元是否被四分割(QUAD_SPLIT)。
当当前编码单元不被四分割时,指示是否执行多分割的信息可以指示当前编码单元是不再被分割(NO_SPLIT)还是被二元/三元分割。
当当前编码单元被二元分割或三元分割时,分割方向信息指示当前编码单元在水平方向和竖直方向之一上被分割。
当在水平方向或竖直方向上分割当前编码单元时,分割类型信息指示当前编码单元被二元分割或三元分割。
可以根据分割方向信息和分割类型信息确定当前编码单元的分割模式。当当前编码单元在水平方向上被二元分割时的分割模式可以被确定为是二元水平分割模式(SPLIT_BT_HOR),当当前编码单元在水平方向上被三元分割时的分割模式可以被确定为是三元水平分割模式(SPLIT_TT_HOR),当当前编码单元在竖直方向上被二元分割时的分割模式可以被确定为是二元竖直分割模式(SPLIT_BT_VER),并且当当前编码单元在竖直方向上被三元分割时的分割模式可以被确定为是三元竖直分割模式SPLIT_TT_VER。
图像解码装置100可以从比特流从一个二进制字符串获得分割形状模式信息。图像解码装置100接收的比特流的形式可以包括固定长度二进制代码、一元代码、截断一元代码、预定二进制代码等。二进制字符串是二进制数形式的信息。二进制字符串可以包括至少一个比特。图像解码装置100可以基于分割规则来获得与二进制字符串对应的分割形状模式信息。图像解码装置100可以基于一个二进制字符串确定是否四分割编码单元、是否分割编码单元、分割方向和分割类型。
编码单元可以小于或等于最大编码单元。例如,因为最大编码单元是具有最大大小的编码单元,所以最大编码单元是编码单元之一。当关于最大编码单元的分割形状模式信息指示不执行分割时,在最大编码单元中确定的编码单元具有与最大编码单元的大小相同的大小。当关于最大编码单元的分割形状代码信息指示执行分割时,最大编码单元可以被分割成编码单元。另外,当关于编码单元的分割形状模式信息指示执行分割时,可以将编码单元分割成较小的编码单元。然而,图像的分割不限于此,并且最大编码单元和编码单元可以不进行区分。将参考图3至图16详细描述编码单元的分割。
另外,可以从编码单元确定用于预测的一个或多个预测块。预测块可以与编码单元相同或小于编码单元。另外,可以从编码单元确定用于变换的一个或多个变换块。变换块可以与编码单元相同或小于编码单元。
变换块和预测块的形状和大小可以彼此不相关。
在另一实施例中,可以通过使用编码单元作为预测单元来执行预测。另外,可以通过使用编码单元作为变换块来执行变换。
将参考图3至16详细描述编码单元的分割。本公开的当前块和相邻块可以指示最大编码单元、编码单元、预测块和变换块之一。另外,当前编码单元的当前块是当前正在被解码或编码的块或当前正在被分割的块。相邻块可以是在当前块之前被重构的块。相邻块可以在空间或时间上与当前块相邻。相邻块可以位于当前块的左下、左、左上、顶部、右上、右、右下之一。
图3示出了根据实施例的由图像解码装置执行的通过分割当前编码单元来确定至少一个编码单元的过程。
块形状可以包括4Nx4N、4Nx2N、2Nx4N、4NxN、Nx4N、32NxN、Nx32N、16NxN、Nx16N、8NxN或Nx8N。在此,N可以是正整数。块形状信息是指示编码单元的形状、方向、宽度和高度的比率或大小中的至少一个的信息。
编码单元的形状可以包括正方形和非正方形。当编码单元的宽度和高度的长度相同时(即,当编码单元的块形状是4Nx4N时),图像解码装置100可以将编码单元的块形状信息确定为正方形。图像解码装置100可以将编码单元的形状确定为非正方形。
当编码单元的宽度和高度彼此不同时(即,当编码单元的块形状是4Nx2N、2Nx4N、4NxN、Nx4N、32NxN、Nx32N、16NxN、Nx16N、8NxN或Nx8N时),图像解码装置100可以将编码单元的块形状信息确定为非正方形。当编码单元的形状是非正方形时,图像解码装置100可以确定编码单元的块形状信息中的宽度和高度的比率为1:2、2:1、1:4、4:1、1:8、8:1、1:16、16:1、1:32和32:1中的一个。此外,图像解码装置100可以基于编码单元的宽度的长度和高度的长度来确定编码单元是在水平方向上还是在竖直方向上。此外,图像解码装置100可以基于编码单元的宽度的长度、高度的长度或面积中的至少一个来确定编码单元的大小。
根据实施例,图像解码装置100可以通过使用块形状信息来确定编码单元的形状,并且可以通过使用分割形状模式信息来确定编码单元的分割方法。也就是说,可以基于由图像解码装置100使用的块形状信息指示的块形状来确定由分离形状模式信息指示的编码单元分割方法。
图像解码装置100可以从比特流获得分割形状模式信息。然而,实施例不限于此,并且图像解码装置100和图像编码装置2200可以基于块形状信息来确定预先商定的分割形状模式信息。图像解码装置100可以关于最大编码单元或最小编码单元来确定预先商定的分割形状模式信息。例如,图像解码装置100可以将关于最大编码单元的分割形状模式信息确定为四分割。此外,图像解码装置100可以将关于最小编码单元的分割形状模式信息确定为“不执行分割”。特别地,图像解码装置100可以将最大编码单元的大小确定为256x256。图像解码装置100可以将预先商定的分割形状模式信息确定为四分割。四分割是将编码单元的宽度和高度均二等分的分割形状模式。图像解码装置100可以基于分割形状模式信息从256x256大小的最大编码单元获得128x128大小的编码单元。此外,图像解码装置100可以将最小编码单元的大小确定为4x4。图像解码装置100可以获得关于最小编码单元的指示“不执行分割”的分割形状模式信息。
根据实施例,图像解码装置100可以使用指示当前编码单元具有正方形形状的块形状信息。例如,图像解码装置100可以基于分割形状模式信息确定是否分割正方形编码单元、是否竖直分割正方形编码单元、是否水平分割正方形编码单元或者是否将正方形编码单元分割成四个编码单元。参考图3,当当前编码单元300的块形状信息指示正方形形状时,解码器120可以基于指示不执行分割的分割形状模式信息确定不分割具有与当前编码单元300相同大小的编码单元310a,或者可以确定基于指示特定分割方法的分割形状模式信息而被分割的编码单元310b、310c、310d、310e或310f。
参考图3,根据实施例,图像解码装置100可以确定通过基于指示在竖直方向上执行分割的分割形状模式信息在竖直方向上分割当前编码单元300而获得的两个编码单元310b。图像解码装置100可以确定通过基于指示在水平方向上执行分割的分割形状模式信息在水平方向上分割当前编码单元300而获得的两个编码单元310c。图像解码装置100可以确定通过基于指示在竖直方向和水平方向上执行分割的分割形状模式信息在竖直方向和水平方向上分割当前编码单元300而获得的四个编码单元310d。根据实施例,图像解码装置100可以确定通过基于指示在竖直方向上执行二元分割的分割形状模式信息在竖直方向上分割当前编码单元300而获得的三个编码单元310e。图像解码装置100可以确定通过基于指示在水平方向上执行三元分割的分割形状模式信息在水平方向上分割当前编码单元300而获得的三个编码单元310f。然而,正方形编码单元的分割方法不限于上述方法,并且分割形状模式信息可以指示各种方法。下面将关于各种实施例详细描述分割正方形编码单元的某些分割方法。
图4示出了根据实施例的由图像解码装置执行的通过分割非正方形编码单元来确定至少一个编码单元的过程。
根据实施例,图像解码装置100可以使用指示当前编码单元具有非正方形形状的块形状信息。图像解码装置100可以基于分割形状模式信息来确定是否分割非正方形的当前编码单元或者是否通过使用特定分割方法分割非正方形的当前编码单元。参考图4,当当前编码单元400或450的块形状信息指示非正方形形状时,图像解码装置100可以基于指示不执行分割的分割形状模式信息确定不分割具有与当前编码单元400或450相同大小的编码单元410或460,或者确定基于指示特定分割方法的分割形状模式信息而被分割的编码单元420a和420b、430a至430c、470a和470b或480a至480c。以下将关于各种实施例详细描述用于分割非正方形编码单元的某些分割方法。
根据实施例,图像解码装置100可以通过使用分割形状模式信息来确定编码单元的分割方法,并且在这种情况下,分割形状模式信息可以指示通过分割编码单元而生成的一个或多个编码单元的数量。参考图4,当分割形状模式信息指示要将当前编码单元400或450分割成两个编码单元时,图像解码装置100可以通过基于分割形状模式信息分割当前编码单元400或450确定当前编码单元400或450中包括的两个编码单元420a和420b或470a和470b。
根据实施例,当图像解码装置100基于分割形状模式信息分割非正方形的当前编码单元400或450时,图像解码装置100可以考虑非正方形的当前编码单元400或450的长边的位置来分割当前编码单元。例如,图像解码装置100可以考虑当前编码单元400或450的形状,通过分割当前编码单元400或450的长边来确定多个编码单元。
根据实施例,当分割形状模式信息指示要将编码单元分割(三元分割)成奇数个块时,图像解码装置100可以确定当前编码单元400或450中包括的奇数个编码单元。例如,当分割形状模式信息指示要将当前编码单元400或450分割成三个编码单元时,图像解码装置100可以将当前编码单元400或450分割成三个编码单元430a、430b和430c或480a、480b和480c。
根据实施例,当前编码单元400或450的宽度和高度的比率可以是4:1或1:4。当宽度和高度的比率为4:1时,块形状信息可以是水平方向,因为宽度的长度比高度的长度长。当宽度和高度的比率为1:4时,块形状信息可以是竖直方向,因为宽度的长度比高度的长度短。图像解码装置100可以基于分割形状模式信息来确定要将当前编码单元分割成奇数个块。此外,图像解码装置100可以基于当前编码单元400或450的块形状信息来确定当前编码单元400或450的分割方向。例如,当当前编码单元400在竖直方向上时,图像解码装置100可以通过在水平方向上分割当前编码单元400来确定编码单元430a至430c。另外,当当前编码单元450在水平方向上时,图像解码装置100可以通过在竖直方向上分割当前编码单元450来确定编码单元480a至480c。
根据实施例,图像解码装置100可以确定当前编码单元400或450中包括的奇数个编码单元,并且并非所有确定的编码单元会具有相同的大小。例如,确定的奇数个编码单元430a、430b和430c或480a、480b和480c中的特定编码单元430b或480b可以具有与其他编码单元430a和430c或480a和480c的大小不同的大小。也就是说,可以通过分割当前编码单元400或450来确定的编码单元可以具有多种大小,并且在某些情况下,可以所有的奇数个编码单元430a、430b和430c或480a、480b和480c可以具有不同的大小。
根据实施例,当分割形状模式信息指示要将编码单元分割成奇数个块时,图像解码装置100可以确定当前编码单元400或450中包括的奇数个编码单元,并且另外,可以对通过分割当前编码单元400或450而生成的奇数个编码单元中的至少一个编码单元施加特定限制。参考图4,图像解码装置100可以将关于在分割当前编码单元400或450时生成的三个编码单元430a、430b和430c或480a、480b和480c中位于中心处的编码单元430b或480b的解码过程设置为与其他编码单元430a和430c或480a或480c的解码过程不同。例如,与其他编码单元430a和430c或480a和480c不同,图像解码装置100可以限制中心位置处的编码单元430b或480b不再被分割或仅被分割特定次数。
图5示出了根据实施例的由图像解码装置执行的基于块形状信息和分割形状模式信息中的至少一个来分割编码单元的过程。
根据实施例,图像解码装置100可以基于块形状信息和分割形状模式信息中的至少一个来确定是否要将正方形的第一编码单元500分割成编码单元。根据实施例,当分割形状模式信息指示要在水平方向上分割第一编码单元500时,图像解码装置100可以通过在水平方向上分割第一编码单元500来确定第二编码单元510。根据实施例使用的第一编码单元、第二编码单元和第三编码单元是用于理解在分割编码单元之前和之后的关系的术语。例如,可以通过分割第一编码单元来确定第二编码单元,并且可以通过分割第二编码单元来确定第三编码单元。将理解的是,第一编码单元、第二编码单元和第三编码单元的结构遵循以上描述。
根据实施例,图像解码装置100可以基于分割形状模式信息来确定将或不将确定的第二编码单元510分割成编码单元。参考图5,图像解码装置100可以基于分割形状模式信息将或不将通过分割第一编码单元500而确定的非正方形的第二编码单元510分割成一个或多个第三编码单元520a或520b、520c和520d。图像解码装置100可以获得分割形状模式信息,并且可以通过基于获得的分割形状模式信息分割第一编码单元500来获得多个各种形状的第二编码单元(例如,510),并且可以基于分割形状模式信息通过使用第一编码单元500的分割方法来分割第二编码单元510。根据实施例,当基于第一编码单元500的分割形状模式信息将第一编码单元500分割成第二编码单元510时,第二编码单元510还可以基于第二编码单元510的分割形状模式信息被分割成第三编码单元520a或520b、520c和520d。也就是说,可以基于每个编码单元的分割形状模式信息来递归地分割编码单元。因此,可以通过分割非正方形编码单元来确定正方形编码单元,并且可以通过递归地分割正方形编码单元来确定非正方形编码单元。
参考图5,可以递归地分割通过分割非正方形的第二编码单元510而确定的奇数个第三编码单元520b、520c和520d中的特定编码单元(例如,位于中心位置的编码单元或正方形编码单元)。根据实施例,可以将奇数个第三编码单元520b、520c和520d中的正方形的第三编码单元520c在水平方向上分割成多个第四编码单元。多个第四编码单元530a、530、530c和530d中的非正方形的第四编码单元530b或530d可以再次被分割成多个编码单元。例如,可以将非正方形的第四编码单元530b或530d再次分割成奇数个编码单元。下面将关于各种实施例来描述可用于递归地分割编码单元的方法。
根据实施例,图像解码装置100可以基于分割形状模式信息将第三编码单元520a或520b、520c和520d中的每一个分割成编码单元。此外,图像解码装置100可以基于分割形状模式信息来确定不分割第二编码单元510。根据实施例,图像解码装置100可以将非正方形的第二编码单元510分割成奇数个第三编码单元520b、520c和520d。图像解码装置100可以对奇数个第三编码单元520b、520c和520d中的特定第三编码单元施加特定限制。例如,图像解码装置100可以将奇数个第三编码单元520b、520c和520d中的位于中心位置的第三编码单元520c限制为不再被分割或者被分割可设置的次数。
参考图5,图像解码装置100可以将非正方形的第二编码单元510中包括的奇数个第三编码单元520b、520c和520d中的位于中心位置的第三编码单元520c限制为不再被分割、通过特定分割方法进行分割(例如,仅分割成四个编码单元,或者通过使用第二编码单元510的分割方法进行分割)或者仅被分割特定次数(例如,仅分割n次(其中n>0))。然而,对中心位置处的第三编码单元520c的限制不限于上述示例,并且可以包括用于与其他第三编码单元520b和520d不同地解码中心位置处的第三编码单元520c的各种限制。
根据实施例,图像解码装置100可以从当前编码单元中的特定位置获得用于分割当前编码单元的分割形状模式信息。
图6示出了根据实施例的由图像解码装置执行的从奇数个编码单元中确定特定编码单元的方法。
参考图6,可以从当前编码单元600或650中包括的多个样本中的特定位置的样本(例如,中心位置的样本640或690)获得当前编码单元600或650的分割形状模式信息。但是,可以从中获得至少一条分割形状模式信息的当前编码单元600中的特定位置不限于图6中的中心位置,而是可以包括当前编码单元600中包括的各种位置(例如,顶部、底部、左、右、左上、左下、右上和右下位置)。图像解码装置100可以从特定位置获得分割形状模式信息,并且可以确定将或不将当前编码单元分割成各种形状和各种大小的编码单元。
根据实施例,当当前编码单元被分割成特定数量的编码单元时,图像解码装置100可以选择编码单元之一。如以下将关于各种实施例描述的,可以使用各种方法来选择多个编码单元之一。
根据实施例,图像解码装置100可以将当前编码单元分割成多个编码单元,并且可以确定特定位置处的编码单元。
根据实施例,图像解码装置100可以使用指示奇数个编码单元的位置的信息来从奇数个编码单元中确定中心位置处的编码单元。参考图6,图像解码装置100可以通过分割当前编码单元600或当前编码单元650来确定奇数个编码单元620a、620b和620c或奇数个编码单元660a、660b和660c。图像解码装置100可以通过使用关于奇数个编码单元620a、620b和620c或奇数个编码单元660a、660b和660c的位置的信息来确定中间编码单元620b或中间编码单元660b。例如,图像解码装置100可以通过基于指示编码单元620a、620b和620c中包括的特定样本的位置的信息确定编码单元620a、620b和620c的位置来确定中心位置的编码单元620b。具体地,图像解码装置100可以通过基于指示编码单元620a、620b和620c的左上样本630a、630b和630c的位置的信息确定编码单元620a、620b和620c的位置来确定中心位置的编码单元620b。
根据实施例,指示编码单元620a、620b和620c中分别包括的左上样本630a、630b和630c的位置的信息可以包括关于编码单元620a、620b和620c在图片中的位置或坐标的信息。根据实施例,指示编码单元620a、620b和620c中分别包括的左上样本630a、630b和630c的位置的信息可以包括指示当前编码单元600中包括的编码单元620a、620b和620c的宽度或高度的信息,并且宽度或高度可以与指示编码单元620a、620b和620c在图片中的坐标之间的差的信息对应。也就是说,图像解码装置100可以通过直接使用关于编码单元620a、620b和620c在图片中的位置或坐标的信息或者通过使用关于编码单元的与坐标之间的差值对应的宽度或高度的信息来确定在中心位置的编码单元620b。
根据实施例,指示上编码单元620a的左上样本630a的位置的信息可以包括坐标(xa,ya),指示中间编码单元620b的左上样本630b的位置的信息可以包括坐标(xb,yb),并且指示下编码单元620c的左上样本630c的位置的信息可以包括坐标(xc,yc)。图像解码装置100可以通过使用编码单元620a、620b和620c中分别包括的左上样本630a、630b和630c的坐标来确定中间编码单元620b。例如,当以升序或降序对左上样本630a、630b和630c的坐标进行排序时,可以将包括在中心位置处的样本630b的坐标(xb,yb)的编码单元620b确定为通过分割当前编码单元600而确定的编码单元620a、620b和620c中位于中心位置的编码单元。然而,指示左上样本630a、630b和630c的位置的坐标可以包括指示图片中的绝对位置的坐标,或者可以参考上编码单元620a的左上样本630a的位置使用指示中间编码单元620b的左上样本630b的相对位置的坐标(dxb,dyb)和指示下编码单元620c的左上样本630c的相对位置的坐标(dxc,dyc)。通过使用编码单元中包括的样本的坐标作为指示样本的位置的信息来确定特定位置处的编码单元的方法不限于上述方法,并且可以包括能够使用样本的坐标的各种算术方法。
根据实施例,图像解码装置100可以将当前编码单元600分割成多个编码单元620a、620b和620c,并且可以基于特定标准来选择编码单元620a、620b和620c之一。例如,图像解码装置100可以从编码单元620a、620b和620c中选择大小与其他单元的大小不同的编码单元620b。
根据实施例,图像解码装置100可以通过使用坐标(xa,ya)、坐标(xb,yb)和(xc,yc)来确定编码单元620a、620b和620c中的每一个的宽度或高度,坐标(xa,ya)是指示上编码单元620a的左上样本630a的位置的信息,坐标(xb,yb)是指示中间编码单元620b的左上样本630b的位置的信息,坐标(xc,yc)是指示下编码单元620c的左上样本630c的位置的信息。图像解码装置100可以通过使用指示编码单元620a、620b和620c的位置的坐标(xa,ya)、(xb,yb)和(xc,yc)来确定编码单元620a、620b和620c的相应大小。根据实施例,图像解码装置100可以将上编码单元620a的宽度确定为当前编码单元600的宽度。图像解码装置100可以将上编码单元620a的高度确定为yb-ya。根据实施例,图像解码装置100可以将中间编码单元620b的宽度确定为当前编码单元600的宽度。图像解码装置100可以将中间编码单元620b的高度确定为yc-yb。根据实施例,图像解码装置100可以通过使用当前编码单元600的宽度或高度或上编码单元620a和中间编码单元620b的宽度或高度来确定下编码单元620c的宽度或高度。图像解码装置100可以基于编码单元620a至620c的所确定的宽度和高度来确定大小与其他编码单元的大小不同的编码单元。参考图6,图像解码装置100可以将具有与上编码单元620a和下编码单元620c的大小不同的大小的中间编码单元620b确定为特定位置的编码单元。然而,由图像解码装置100执行的确定具有与其他编码单元的大小不同的大小的编码单元的上述方法仅与通过使用基于样本的坐标确定的编码单元的大小来确定在特定位置的编码单元的示例对应,并且因此可以使用通过比较基于特定样本的坐标确定的编码单元的大小来确定在特定位置的编码单元的各种方法。
图像解码装置100可以通过使用坐标(xd,yd)、坐标(xe,ye)和坐标(xf,yf)来确定编码单元660a、660b和660c中的每一个的宽度或高度,坐标(xd,yd)是指示左编码单元660a的左上样本670a的位置的信息,坐标(xe,ye)是指示中间编码单元660b的左上样本670b的位置的信息,坐标(xf,yf)是指示右编码单元660c的左上样本670c的位置的信息。图像解码装置100可以通过使用指示编码单元660a、660b和660c的位置的坐标(xd,yd)、(xe,ye)和(xf,yf)来确定编码单元660a、660b和660c的相应大小。
根据实施例,图像解码装置100可以将左编码单元660a的宽度确定为xe-xd。图像解码装置100可以将左编码单元660a的高度确定为当前编码单元650的高度。根据实施例,图像解码装置100可以将中间编码单元660b的宽度确定为xf-xe。图像解码装置100可以将中间编码单元660b的高度确定为当前编码单元650的高度。根据实施例,图像解码装置100可以通过使用当前编码单元650的宽度或高度或左和中间编码单元660a和660b的宽度或高度确定右编码单元660c的宽度或高度。图像解码装置100可以基于编码单元660a至660c的所确定的宽度和高度来确定具有与其他编码单元的大小不同的大小的编码单元。参考图6,图像解码装置100可以将具有与左和右编码单元660a和660c的大小不同的大小的中间编码单元660b确定为特定位置的编码单元。然而,由图像解码装置100执行的确定大小与其他编码单元的大小不同的编码单元的上述方法仅与通过使用基于样本的坐标确定的编码单元的大小来确定在特定位置的编码单元的示例对应,并且因此可以使用通过比较基于特定样本的坐标确定的编码单元的大小来确定在特定位置的编码单元的各种方法。
然而,被考虑用于确定编码单元的位置的样本的位置不限于上述左上位置,并且可以使用关于编码单元中包括的样本的任意位置的信息。
根据实施例,图像解码装置100可以从通过考虑当前编码单元的形状分割当前编码单元而确定的奇数个编码单元中选择在特定位置的编码单元。例如,当当前编码单元具有宽度大于高度的非正方形形状时,图像解码装置100可以确定在水平方向上的特定位置的编码单元。也就是说,图像解码装置100可以确定在水平方向上的不同位置的编码单元之一,并对该编码单元施加限制。当当前编码单元具有高度大于宽度的非正方形形状时,图像解码装置100可以确定在竖直方向上的特定位置的编码单元。也就是说,图像解码装置100可以确定在竖直方向上的不同位置的编码单元之一,并且可以对该编码单元施加限制。
根据实施例,图像解码装置100可以使用指示偶数个编码单元的相应位置的信息来从偶数个编码单元中确定在特定位置的编码单元。图像解码装置100可以通过分割(二元分割)当前编码单元来确定偶数个编码单元,并且可以通过使用关于偶数个编码单元的位置的信息来确定在特定位置的编码单元。与其相关的操作可以与从奇数个编码单元确定在特定位置(例如,中心位置)的编码单元的操作对应,这在上面已经关于图6进行了详细描述,因此这里不提供其详细描述。
根据实施例,当将非正方形的当前编码单元分割成多个编码单元时,可以在分割操作中使用关于在特定位置的编码单元的特定信息,以从多个编码单元确定在特定位置的编码单元。例如,图像解码装置100可以在分割操作中使用块形状信息和存储在中间编码单元中包括的样本中的分割形状模式信息中的至少一个,以从通过分割当前编码单元而确定的多个编码单元确定在中心位置的编码单元。
参考图6,图像解码装置100可以基于分割形状模式信息将当前编码单元600分割成多个编码单元620a、620b和620c,并且可以从多个编码单元620a、620b和620c确定在中心位置的编码单元620b。此外,图像解码装置100可以考虑从中获得分割形状模式信息的位置来确定在中心位置的编码单元620b。也就是说,可以从在当前编码单元600的中心位置的样本640获得当前编码单元600的分割形状模式信息,并且当当前编码单元600基于分割形状模式信息被分割成多个编码单元620a、620b和620c时,可以将包括样本640的编码单元620b确定为在中心位置的编码单元。然而,用于确定在中心位置的编码单元的信息不限于分割形状模式信息,而是可以使用各种类型的信息来确定在中心位置的编码单元。
根据实施例,可以从要被确定的编码单元中包括的特定样本获得用于识别在特定位置的编码单元的特定信息。参考图6,图像解码装置100可以使用从当前编码单元600中在特定位置的样本(例如,在当前编码单元600的中心位置的样本)获得的分割形状模式信息,以从通过分割当前编码单元600而确定的多个编码单元620a、620b和620c确定在特定位置的编码单元(例如,多个分割的编码单元中位于中心位置的编码单元)。也就是说,图像解码装置100可以通过考虑当前编码单元600的块形状来确定在特定位置的样本,从通过分割当前编码单元600而确定的多个编码单元620a、620b和620c确定包括从中获得特定信息(例如,分割形状模式信息)的样本的编码单元620b,并且可以对该编码单元620b施加特定限制。参考图6,根据实施例,图像解码装置100可以将在当前编码单元600的中心位置的样本640确定为可以从中获得特定信息的样本,并且可以在解码操作中对包括样本640的编码单元620b施加特定限制。然而,可以从中获得特定信息的样本的位置不限于上述位置,而是可以包括被确定为进行限制的编码单元620b中包括的样本的任意位置。
根据实施例,可以基于当前编码单元600的形状来确定可以从中获得特定信息的样本的位置。根据实施例,块形状信息可以指示当前编码单元具有正方形形状还是非正方形形状,并且可以基于该形状确定可以从中获得特定信息的样本的位置。例如,图像解码装置100可以通过使用关于当前编码单元的宽度的信息和关于当前编码单元的高度的信息中的至少一个,将位于用于将当前编码单元的宽度和高度中的至少一个对半分割的边界上的样本确定为可以从中获得特定信息的样本。作为另一示例,当当前编码单元的块形状信息指示非正方形形状时,图像解码装置100可以将包括用于将当前编码单元的长边对半分割的边界的样本之一确定为可以从中获得预定信息的样本。
根据实施例,当当前编码单元被分割成多个编码单元时,图像解码装置100可以使用分割形状模式信息来从多个编码单元确定在特定位置的编码单元。根据实施例,图像解码装置100可以从编码单元中在特定位置的样本获得分割形状模式信息,并且通过使用从多个编码单元中的每一个中的特定位置的样本获得的分割形状模式信息分割通过分割当前编码单元而生成的多个编码单元。也就是说,可以基于从每个编码单元中在特定位置的样本获得的分割形状模式信息来递归地分割编码单元。在上面已经关于图5描述了递归地分割编码单元的操作,因此这里将不提供其详细描述。
根据实施例,图像解码装置100可以通过分割当前编码单元来确定一个或多个编码单元,并且可以基于特定块(例如,当前编码单元)确定解码一个或多个编码单元的顺序。
图7示出了根据实施例的当图像解码装置通过分割当前编码单元确定多个编码单元时处理该多个编码单元的顺序。
根据实施例,图像解码装置100可以基于分割形状模式信息通过在竖直方向上分割第一编码单元700来确定第二编码单元710a和710b,通过在水平方向上分割第一编码单元700来确定第二编码单元730a和730b,或者通过在竖直方向和水平方向上分割第一编码单元700来确定第二编码单元750a至750d。
参考图7,图像解码装置100可以确定以水平方向顺序710c处理通过在竖直方向上分割第一编码单元700而确定的第二编码单元710a和710b。图像解码装置100可以确定以竖直方向顺序730c处理通过在水平方向上分割第一编码单元700而确定的第二编码单元730a和730b。图像解码装置100可以确定以用于处理一行中的编码单元并且然后处理下一行中的编码单元的特定顺序(例如,以光栅扫描顺序或Z扫描顺序750e)处理通过在竖直方向和水平方向上分割第一编码单元700而确定的第二编码单元750a至750d。
根据实施例,图像解码装置100可以递归地分割编码单元。参考图7,图像解码装置100可以通过分割第一编码单元700来确定多个编码单元710a和710b、730a和730b或750a至750d,并递归地分割所确定的多个编码单元710b、730a和730b或750a至750d中的每一个。多个编码单元710b、730a和730b或750a至750d的分割方法可以与第一编码单元700的分割方法对应。因此,多个编码单元710b、730a和730b或750a至750d中的每一个可以被独立地分割成多个编码单元。参考图7,图像解码装置100可以通过在竖直方向上分割第一编码单元700来确定第二编码单元710a和710b,并且可以确定独立地分割或不分割第二编码单元710a和710b中的每一个。
根据实施例,图像解码装置100可以通过在水平方向上分割左第二编码单元710a来确定第三编码单元720a和720b,并且可以不分割右第二编码单元710b。
根据实施例,可以基于分割编码单元的操作来确定编码单元的处理顺序。换句话说,可以基于紧接在被分割之前的编码单元的处理顺序来确定分割编码单元的处理顺序。图像解码装置100可以独立于右第二编码单元710b来确定通过分割左第二编码单元710a而确定的第三编码单元720a和720b的处理顺序。因为通过在水平方向上分割左第二编码单元710a来确定第三编码单元720a和720b,所以可以以竖直方向顺序720c来处理第三编码单元720a和720b。因为左和右第二编码单元710a和710b以水平方向顺序710c被处理,所以可以以竖直方向顺序720c在处理左第二编码单元710a中包括的第三编码单元720a和720b之后处理右第二编码单元710b。基于在被分割之前的编码单元来确定编码单元的处理顺序的操作不限于上述示例,而是可以使用各种方法以特定顺序来独立地处理被分割并确定为各种形状的编码单元。
图8示出了根据实施例的由图像解码装置执行的当编码单元不能以特定顺序处理时确定当前编码单元要被分割成奇数个编码单元的过程。
根据实施例,图像解码装置100可以基于获得的分割形状模式信息来确定是否将当前编码单元分割成奇数个编码单元。参考图8,正方形的第一编码单元800可以被分割成非正方形的第二编码单元810a和810b,并且第二编码单元810a和810b可以被独立地分割成第三编码单元820a和820b以及820c至820e。根据实施例,图像解码装置100可以通过在水平方向上分割左第二编码单元810a来确定多个第三编码单元820a和820b,并且可以将右第二编码单元810b分割成奇数个第三编码单元820c至820e。
根据实施例,图像解码装置100可以通过确定第三编码单元820a和820b以及820c至820e是否可以特定顺序处理来确定是否将任何编码单元分割成奇数个编码单元。参考图8,图像解码装置100可以通过递归地分割第一编码单元800来确定第三编码单元820a和820b以及820c至820e。图像解码装置100可以基于块形状信息和分割形状模式信息中的至少一个确定是否将第一编码单元800、第二编码单元810a和810b以及第三编码单元820a和820b以及820c至820e中的任一个分割成奇数个编码单元。例如,第二编码单元810a和810b中的右第二编码单元810b可以被分割成奇数个第三编码单元820c、820d和820e。第一编码单元800中包括的多个编码单元的处理顺序可以是特定顺序(例如,Z扫描顺序830),并且图像解码装置100可以确定通过将右第二编码单元810b分割成奇数个编码单元而确定的第三编码单元820c、820d和820e是否满足用于以特定顺序进行处理的条件。
根据实施例,图像解码装置100可以确定第一编码单元800中包括的第三编码单元820a和820b以及820c至820e是否满足用于以特定顺序进行处理的条件,并且该条件与第二编码单元810a和810b的宽度和高度中的至少一个是否沿着第三编码单元820a和820b以及820c到820e的边界被对半分割相关。例如,当将非正方形形状的左第二编码单元810a的高度对半分割时确定的第三编码单元820a和820b可以满足该条件。可以确定第三编码单元820c至820e不满足该条件,因为当将右第二编码单元810b分割成三个编码单元时确定的第三编码单元820c至820e的边界不能对半分割右第二编码单元810b的宽度或高度。当如上所述不满足条件时,图像解码装置100可以确定打断扫描顺序,并且可以基于确定的结果来确定将右第二编码单元810b分割成奇数个编码单元。根据实施例,当将编码单元分割成奇数个编码单元时,图像解码装置100可以对分割的编码单元中在特定位置的编码单元施加特定限制。在上面已经关于各种实施例描述了限制或特定位置,因此这里将不提供其详细描述。
图9示出了根据实施例的由图像解码装置执行的通过分割第一编码单元来确定至少一个编码单元的过程。
根据实施例,图像解码装置100可以基于通过接收器110获得的分割形状模式信息来分割第一编码单元900。正方形的第一编码单元900可以被分割成四个正方形的编码单元,或可以被分割成多个非正方形的编码单元。例如,参考图9,当分割形状模式信息指示要将第一编码单元900分割成非正方形的编码单元时,图像解码装置100可以将第一编码单元900分割成多个非正方形的编码单元。具体地,当分割形状模式信息指示要通过在水平方向或竖直方向上分割第一编码单元900来确定奇数个编码单元时,图像解码装置100可以将正方形的第一编码单元900分割成奇数个编码单元,例如,通过在竖直方向上分割正方形的第一编码单元900而确定的第二编码单元910a、910b和910c,或者通过在水平方向方向上分割正方形的第一编码单元900而确定的第二编码单元920a、920b和920c。
根据实施例,图像解码装置100可以确定第一编码单元900中包括的第二编码单元910a、910b、910c、920a、920b和920c是否满足用于以特定顺序进行处理的条件,并且该条件与第一编码单元900的宽度和高度中的至少一个是否沿着第二编码单元910a、910b、910c、920a、920b和920c的边界被对半分割相关。参考图9,因为通过在竖直方向上分割正方形的第一编码单元900而确定的第二编码单元910a、910b和910c的边界不将第一编码单元900的宽度对半分割,所以可以确定第一编码单元900不满足用于以特定顺序进行处理的条件。另外,因为通过在水平方向上分割正方形的第一编码单元900而确定的第二编码单元920a、920b和920c的边界不将第一编码单元900的宽度对半分割,所以可以确定第一编码单元900不满足用于以特定顺序进行处理的条件。当如上所述不满足条件时,图像解码装置100可以决定打断扫描顺序,并且可以基于决定的结果来确定将第一编码单元900分割成奇数个编码单元。根据实施例,当将编码单元分割成奇数个编码单元时,图像解码装置100可以对分割的编码单元中在特定位置的编码单元施加特定限制。在上面已经关于各种实施例描述了限制或特定位置,因此这里将不提供其详细描述。
根据实施例,图像解码装置100可以通过分割第一编码单元来确定各种形状的编码单元。
参考图9,图像解码装置100可以将正方形的第一编码单元900或非正方形的第一编码单元930或950分割成各种形状的编码单元。
图10示出了根据实施例的当具有在图像解码装置分割第一编码单元时确定的非正方形形状的第二编码单元满足特定条件时第二编码单元能够被分割成的形状受到限制。
根据实施例,图像解码装置100可以基于通过接收器110获得的分割形状模式信息确定要将正方形的第一编码单元1000分割成非正方形的第二编码单元1010a和1010b或1020a和1020b。第二编码单元1010a和1010b或1020a和1020b可以被独立地分割。因此,图像解码装置100可以基于每个第二编码单元1010a和1010b或1020a和1020b的分割形状模式信息,确定将或不将每个第二编码单元1010a和1010b或1020a和1020b分割成多个编码单元。根据实施例,图像解码装置100可以通过在水平方向上分割通过在竖直方向上分割第一编码单元1000而确定的非正方形的左第二编码单元1010a来确定第三编码单元1012a和1012b。然而,当左第二编码单元1010a在水平方向上被分割时,图像解码装置100可以限制右第二编码单元1010b不在左第二编码单元1010a被分割的水平方向上被分割。当通过在相同方向上分割右第二编码单元1010b来确定第三编码单元1014a和1014b时,由于左和右第二编码单元1010a和1010b在水平方向上独立地被分割,因此可以确定第三编码单元1012a和1012b或1014a和1014b。然而,这种情况同样地用作图像解码装置100基于分割形状模式信息将第一编码单元1000分割成四个正方形的第二编码单元1030a、1030b、1030c和1030d的情况,并且就图像解码来说效率低。
根据实施例,图像解码装置100可以通过在竖直方向上分割通过在水平方向上分割第一编码单元1000而确定的非正方形的第二编码单元1020a或1020b来确定第三编码单元1022a和1022b或1024a和1024b。然而,当在竖直方向上分割第二编码单元(例如,上方第二编码单元1020a)时,由于上述原因,图像解码装置100可以限制其他第二编码单元(例如,下方第二编码单元1020b)不在上方第二编码单元1020a被分割的竖直方向上被分割。
图11示出了根据实施例的由图像解码装置执行的当分割形状模式信息不能指示正方形编码单元被分割成四个正方形编码单元时分割正方形编码单元的过程。
根据实施例,图像解码装置100可以基于分割形状模式信息通过分割第一编码单元1100来确定第二编码单元1110a和1110b或1120a和1120b等。分割形状模式信息可以包括关于分割编码单元的各种方法的信息,但是,关于各种分割方法的信息可以不包括用于将编码单元分割成四个正方形编码单元的信息。根据这样的分割形状模式信息,图像解码装置100可以不将正方形的第一编码单元1100分割成四个正方形的第二编码单元1130a、1130b、1130c和1130d。图像解码装置100可以基于分割形状模式信息来确定非正方形的第二编码单元1110a和1110b或1120a和1120b等。
根据实施例,图像解码装置100可以独立地分割非正方形的第二编码单元1110a和1110b或1120a和1120b等。第二编码单元1110a和1110b或1120a和1120b等中的每一个可以以特定顺序递归地被分割,并且该分割方法可以与基于分割形状模式信息分割第一编码单元1100的方法对应。
例如,图像解码装置100可以通过在水平方向上分割左第二编码单元1110a来确定正方形的第三编码单元1112a和1112b,并且可以通过在水平方向上分割右第二编码单元1110b来确定正方形的第三编码单元1114a和1114b。此外,图像解码装置100可以通过在水平方向上分割左和右第二编码单元1110a和1110b来确定正方形的第三编码单元1116a、1116b、1116c和1116d。在这种情况下,可以确定具有与从第一编码单元1100分割的四个正方形的第二编码单元1130a、1130b、1130c和1130d相同的形状的编码单元。
作为另一示例,图像解码装置100可以通过在竖直方向上分割上方第二编码单元1120a来确定正方形的第三编码单元1122a和1122b,并且可以通过在竖直方向上分割下方第二编码单元1120b来确定正方形的第三编码单元1124a和1124b。此外,图像解码装置100可以通过在竖直方向上分割上方和下方第二编码单元1120a和1120b来确定正方形的第三编码单元1126a、1126b、1126c和1126d。在这种情况下,可以确定具有与从第一编码单元1100分割的四个正方形的第二编码单元1130a、1130b、1130c和1130d相同的形状的编码单元。
图12示出了根据实施例的可以根据分割编码单元的过程来改变多个编码单元之间的处理顺序。
根据实施例,图像解码装置100可以基于分割形状模式信息来分割第一编码单元1200。当块形状指示正方形形状并且分割形状模式信息指示要在水平方向和竖直方向中的至少一个方向上分割第一编码单元1200时,图像解码装置100可以通过分割第一编码单元1200来确定第二编码单元1210a和1210b或1220a和1220b等。参考图12,可以基于每个编码单元的分割形状模式信息独立地分割通过仅在水平方向或竖直方向上分割第一编码单元1200而确定的非正方形的第二编码单元1210a和1210b或1220a和1220b。例如,图像解码装置100可以通过在水平方向上分割通过在竖直方向上分割第一编码单元1200而生成的第二编码单元1210a和1210b来确定第三编码单元1216a、1216b、1216c和1216d,并且可以通过在竖直方向上分割通过在水平方向上分割第一编码单元1200而生成的第二编码单元1220a和1220b来确定第三编码单元1226a、1226b、1226c和1226d。在上面已经关于11描述了分割第二编码单元1210a和1210b或1220a和1220b的操作,因此这里将不提供其详细描述。
根据实施例,图像解码装置100可以以特定顺序处理编码单元。在上面已经关于图7描述了以特定顺序处理编码单元的操作,因此这里将不提供其详细描述。参考图12,图像解码装置100可以通过分割正方形的第一编码单元1200来确定四个正方形的第三编码单元1216a、1216b、1216c和1216d,以及1226a、1226b、1226c和1226d。根据实施例,图像解码装置100可以基于第一编码单元1200的分割方法来确定第三编码单元1216a、1216b、1216c和1216d以及1226a、1226b、1226c和1226d的处理顺序。
根据实施例,图像解码装置100可以通过在水平方向上分割通过在竖直方向上分割第一编码单元1200而生成的第二编码单元1210a和1210b来确定第三编码单元1216a、1216b、1216c和1216d,并且可以以处理顺序1217处理第三编码单元1216a、1216b、1216c和1216d,处理顺序1217用于首先在竖直方向上处理左第二编码单元1210a中包括的第三编码单元1216a和1216c并且然后在竖直方向上处理右第二编码单元1210b中包括的第三编码单元1216b和1216d。
根据实施例,图像解码装置100可以通过在竖直方向上分割通过在水平方向上分割第一编码单元1200而生成的第二编码单元1220a和1220b来确定第三编码单元1226a、1226b、1226c和1226d,并且可以以处理顺序1227处理第三编码单元1226a、1226b、1226c和1226d,处理顺序1227用于首先在水平方向上处理上方第二编码单元1220a中包括的第三编码单元1226a和1226b并且然后在水平方向上处理下方第二编码单元1220b中包括的第三编码单元1226c和1226d。
参考图12,可以通过分别分割第二编码单元1210a和1210b以及1220a和1920b来确定正方形的第三编码单元1216a、1216b、1216c和1216d以及1226a、1226b、1226c和1226d。尽管通过在竖直方向上分割第一编码单元1200来确定第二编码单元1210a和1210b,与通过在水平方向上分割第一编码单元1200而确定的第二编码单元1220a和1220b不同,但是从其分割的第三编码单元1216a、1216b、1216c和1216d以及1226a、1226b、1226c和1226d最终示出了从第一编码单元1200分割的相同形状的编码单元。因此,通过基于分割形状信息以不同的方式递归地分割编码单元,即使当最终确定编码单元为相同形状时,图像解码装置100也可以以不同顺序处理多个编码单元。
图13示出了根据实施例的当递归地分割编码单元使得确定多个编码单元时在编码单元的形状和大小改变时确定编码单元的深度的过程。
根据实施例,图像解码装置100可以基于特定标准来确定编码单元的深度。例如,该特定标准可以是编码单元的长边的长度。当被分割之前的编码单元的长边的长度是被分割当前编码单元的长边的长度的2n倍(n>0)时,图像解码装置100可以确定当前编码单元的深度从被分割之前的编码单元的深度增加n。在下面的描述中,具有增加的深度的编码单元被表示为更深深度的编码单元。
参考图13,根据实施例,图像解码装置100可以通过基于指示正方形形状的块形状信息(例如,块形状信息可以表达为“0:SQUARE”)分割正方形的第一编码单元1300来确定较深深度的第二编码单元1302和第三编码单元1304。假设正方形的第一编码单元1300的大小是2Nx2N,通过将第一编码单元1300的宽度和高度分割成1/2而确定的第二编码单元1302可以具有NxN的大小。此外,通过将第二编码单元1302的宽度和高度分割成1/2而确定的第三编码单元1304可以具有N/2xN/2的大小。在这种情况下,第三编码单元1304的宽度和高度是第一编码单元1300的宽度和高度的1/4。当第一编码单元1300的深度是D时,宽度和高度是第一编码单元1300的宽度和高度的1/2倍的第二编码单元1302的深度可以是D+1,并且宽度和高度是第一编码单元1300的宽度和高度的1/4倍的第三编码单元1304的深度可以是D+2。
根据实施例,图像解码装置100可以通过基于指示非正方形形状的块形状信息分割非正方形的第一编码单元1310或1320来确定更深深度的第二编码单元1312或1322和第三编码单元1314或1324(例如,块形状信息可以表达为“1:NS_VER”,指示高度大于宽度的非正方形形状,或表达为“2:NS_HOR”,指示宽度大于高度的非正方形形状)。
图像解码装置100可以通过分割具有Nx2N的大小的第一编码单元1310的宽度和高度中的至少一个来确定第二编码单元1302、1312或1322。也就是说,图像解码装置100可以通过在水平方向上分割第一编码单元1310来确定具有NxN大小的第二编码单元1302或具有NxN/2大小的第二编码单元1322,或者可以通过在水平和竖直方向上分割第一编码单元1310来确定具有N/2xN大小的第二编码单元1312。
根据实施例,图像解码装置100可以通过分割具有2NxN大小的第一编码单元1320的宽度和高度中的至少一个来确定第二编码单元1302、1312或1322。也就是说,图像解码装置100可以通过在竖直方向上分割第一编码单元1320来确定具有NxN大小的第二编码单元1302或具有N/2xN大小的第二编码单元1312,或者可以通过在水平和竖直方向上分割第一编码单元1320来确定具有NxN/2大小的第二编码单元1322。
根据实施例,图像解码装置100可以通过分割具有NxN大小的第二编码单元1302的宽度和高度中的至少一个来确定第三编码单元1304、1314或1324。也就是说,图像解码装置100可以通过在竖直方向和水平方向上分割第二编码单元1302来确定具有N/2xN/2大小的第三编码单元1304、具有N/4xN/2大小的第三编码单元1314或具有N/2xN/4大小的第三编码单元1324。
根据实施例,图像解码装置100可以通过分割具有N/2xN大小的第二编码单元1312的宽度和高度中的至少一个来确定第三编码单元1304、1314或1324。也就是说,图像解码装置100可以通过在水平方向上分割第二编码单元1312来确定具有N/2xN/2大小的第三编码单元1304或具有N/2xN/4大小的第三编码单元1324,或者可以通过在竖直方向和水平方向上分割第二编码单元1312来确定具有N/4xN/2大小的第三编码单元1314。
根据实施例,图像解码装置100可以通过分割具有NxN/2大小的第二编码单元1322的宽度和高度中的至少一个来确定第三编码单元1304、1314或1324。也就是说,图像解码装置100可以通过在竖直方向上分割第二编码单元1322来确定具有N/2xN/2大小的第三编码单元1304或具有N/4xN/2大小的第三编码单元1314,或者可以通过在竖直方向和水平方向上分割第二编码单元1322来确定具有N/2xN/4大小的第三编码单元1324。
根据实施例,图像解码装置100可以在水平或竖直方向上分割正方形编码单元1300、1302或1304。例如,图像解码装置100可以通过在竖直方向上分割具有2Nx2N大小的第一编码单元1300来确定具有Nx2N大小的第一编码单元1310,或者可以通过在水平方向上分割第一编码单元1300来确定具有2NxN大小的第一编码单元1320。根据实施例,当基于编码单元的最长边的长度来确定深度时,通过在水平或竖直方向上分割具有2Nx2N大小的第一编码单元1300而确定编码单元的深度可以与第一编码单元1300的深度相同。
根据实施例,第三编码单元1314或1324的宽度和高度可以是第一编码单元1310或1320的宽度和高度的1/4倍。当第一编码单元1310或1320的深度为D时,宽度和高度是第一编码单元1310或1320的宽度和高度的1/2倍的第二编码单元1312或1322的深度可以是D+1,并且宽度和高度是第一编码单元1310或1320的宽度和高度的1/4倍的第三编码单元1314或1324的深度可以是D+2。
图14示出了根据实施例的基于编码单元的形状和大小可确定的深度,以及用于区分编码单元的部分索引(PID)。
根据实施例,图像解码装置100可以通过分割正方形的第一编码单元1400来确定各种形状的第二编码单元。参考图14,图像解码装置100可以通过基于分割形状模式信息在竖直方向和水平方向中的至少一个方向上分割第一编码单元1400来确定第二编码单元1402a和1402b、1404a和1404b以及1406a、1406b、1406c和1406d。也就是说,图像解码装置100可以基于第一编码单元1400的分割形状模式信息来确定第二编码单元1402a和1402b、1404a和1404b以及1406a、1406b、1406c和1406d。
根据实施例,基于正方形的第一编码单元1400的分割形状模式信息而确定的第二编码单元1402a和1402b、1404a和1404b以及1406a、1406b、1406c和1406d的深度可以基于其长边的长度来确定。例如,因为正方形的第一编码单元1400的边的长度等于非正方形的第二编码单元1402a和1402b以及1404a和1404b的长边的长度,所以第一编码单元2100和非正方形的第二编码单元1402a和1402b以及1404a和1404b可以具有相同的深度,例如D。但是,当图像解码装置100基于分割形状模式信息将第一编码单元1400分割成四个正方形的第二编码单元1406a、1406b、1406c和1406d时,因为方形的第二编码单元1406a、1406b、1406c和1406d的边的长度是第一编码单元1400的边的长度的1/2倍,因此第二编码单元1406a、1406b、1406c和1406d的深度可以是D+1,比第一编码单元1400的深度D深1。
根据实施例,图像解码装置100可以通过基于分割形状模式信息在水平方向上分割高度大于宽度的第一编码单元1410来确定多个第二编码单元1412a和1412b以及1414a、1414b和1414c。根据实施例,图像解码装置100可以通过基于分割形状模式信息在竖直方向上分割宽度大于高度的第一编码单元1420来确定多个第二编码单元1422a和1422b以及1424a、1424b和1424c。
根据实施例,基于非正方形的第一编码单元1410或1420的分割形状模式信息而确定的第二编码单元1412a和1412b及1414a、1414b和1414c,或者1422a和1422b以及1424a、1424b和1424c的深度可以基于其长边的长度来确定。例如,因为正方形的第二编码单元1412a和1412b的边的长度是具有高度大于宽度的非正方形形状的第一编码单元1410的长边的长度的1/2倍,所以正方形的第二编码单元1412a和1412b的深度为D+1,比非正方形的第一编码单元1410的深度D深1。
此外,图像解码装置100可以基于分割形状模式信息将非正方形的第一编码单元1410分割成奇数个第二编码单元1414a、1414b和1414c。该奇数个第二编码单元1414a、1414b和1414c可以包括非正方形的第二编码单元1414a和1414c以及正方形的第二编码单元1414b。在这种情况下,因为非正方形的第二编码单元1414a和1414c的长边的长度以及正方形的第二编码单元1414b的边的长度是第一编码单元1410的长边的长度的1/2倍,所以第二编码单元1414a、1414b和1414c的深度可以是D+1,比非正方形的第一编码单元1410的深度D深1。图像解码装置100可以通过使用确定从第一编码单元1410分割的编码单元的深度的上述方法,确定从具有宽度比高度大的非正方形形状的第一编码单元1420分割的编码单元的深度。
根据实施例,当奇数个分割编码单元具有不相等的大小时,图像解码装置100可以基于编码单元之间的大小比率来确定用于识别分割的编码单元的PID。参考图14,奇数个分割的编码单元1414a、1414b和1414c中的中心位置的编码单元1414b可以具有等于其他编码单元1414a和1414c的宽度的宽度,以及是其他编码单元1414a和1414c的高度的两倍的高度。也就是说,在这种情况下,在中心位置的编码单元1414b可以包括两个其他编码单元1414a或1414c。因此,当基于扫描顺序在中心位置的编码单元1414b的PID为1时,位于编码单元1414b旁边的编码单元1414c的PID可以增加2并且因此可以为3。也就是说,可能出现PID值的不连续性。根据实施例,图像解码装置100可以基于在用于识别分割的编码单元的PID中是否出现不连续性来确定奇数个分割编码单元是否不具有相等的大小。
根据实施例,图像解码装置100可以基于用于识别通过分割当前编码单元而确定的多个编码单元的PID值来确定是否使用特定分割方法。参考图14,图像解码装置100可以通过分割具有高度大于宽度的矩形形状的第一编码单元1410来确定偶数个编码单元1412a和1412b或奇数个编码单元1414a、1414b和1414c。图像解码装置100可以使用PID来识别相应编码单元。根据实施例,可以从每个编码单元的特定位置的样本(例如,左上样本)获得PID。
根据实施例,图像解码装置100可以通过使用用于区分编码单元的PID,从分割的编码单元中确定在特定位置的编码单元。根据实施例,当具有高度大于宽度的矩形形状的第一编码单元1410的分割形状模式信息指示要将编码单元分割成三个编码单元时,图像解码装置100可以将第一编码单元1410分割成三个编码单元1414a、1414b和1414c。图像解码装置100可以将PID分配给三个编码单元1414a、1414b和1414c中的每一个。图像解码装置100可以比较奇数个分割编码单元的PID,以从编码单元中确定在中心位置的编码单元。图像解码装置100可以将具有与编码单元的PID中的中间值对应的PID的编码单元1414b确定通过分割第一编码单元1410而确定的编码单元中的在中心位置的编码单元。根据实施例,图像解码装置100可以在分割的编码单元不具有相等的大小时基于编码单元之间的大小比率来确定用于区分分割的编码单元的PID。参考图14,通过分割第一编码单元1410而生成的编码单元1414b可以具有等于其他编码单元1414a和1414c的宽度的宽度,以及是其他编码单元1414a和1414c的高度的两倍的高度。在这种情况下,当在中心位置的编码单元1414b的PID是1时,位于编码单元1414b旁边的编码单元1414c的PID可以增加2并且因此可以是3。当PID如上所述不均匀地增加时,图像解码装置100可以确定编码单元被分割成多个编码单元,该多个编码单元包括大小与其他编码单元的大小不同的编码单元。根据实施例,当分割形状模式信息指示要将编码单元分割成奇数个编码单元时,图像解码装置100可以以如下方式分割当前编码单元,即:奇数个编码单元中的中心位置的编码单元(例如,中心位置的编码单元)具有与其他编码单元的大小不同的大小。在这种情况下,图像解码装置100可以通过使用编码单元的PID来确定具有不同大小的中心位置的编码单元。然而,PID以及特定位置的编码单元的大小或位置不限于上述示例,而是可以使用各种PID以及编码单元的各种位置和大小。
根据实施例,图像解码装置100可以使用其中编码单元开始被递归地分割的特定数据单元。
图15示出了根据实施例的基于图片中包括的多个特定数据单元确定多个编码单元。
根据实施例,特定数据单元可以被定义为其中通过使用分割形状模式信息来开始递归地分割编码单元的数据单元。也就是说,特定数据单元可以与最上深度的编码单元对应,其用于确定从当前图片分割的多个编码单元。在下面的描述中,为了便于解释,将该特定数据单元称为参考数据单元。
根据实施例,参考数据单元可以具有特定大小和特定大小的形状。根据一个实施例,参考数据单元可以包括MxN个样本。在此,M和N可以彼此相等,并且可以是表示为2的幂的整数。也就是说,参考数据单元可以具有正方形或非正方形形状,并且可以被分割成整数个编码单元。
根据实施例,图像解码装置100可以将当前图片分割成多个参考数据单元。根据实施例,图像解码装置100可以通过使用每个参考数据单元的分割形状模式信息来分割从当前图片分割的多个参考数据单元。分割参考数据单元的操作可以与使用四叉树结构的分割操作对应。
根据实施例,图像解码装置100可以预先确定当前图片中包括的参考数据单元所允许的最小大小。因此,图像解码装置100可以确定具有等于或大于最小大小的大小的各种参考数据单元,并且可以参考所确定的参考数据单元通过使用分割形状模式信息来确定一个或多个编码单元。
参考图15,图像解码装置100可以使用正方形的参考编码单元1500或非正方形的参考编码单元1502。根据实施例,可以基于能够包括一个或多个参考编码单元(例如,序列、图片、切片、切片片段、瓦片、瓦片组、最大编码单元等)的各种数据单元来确定参考编码单元的形状和大小。
根据实施例,图像解码装置100的接收器110可以从比特流获得关于各种数据单元中的每一个的参考编码单元形状信息和参考编码单元大小信息中的至少一个。在上面已经关于图3的分割当前编码单元300的操作描述了将正方形的参考编码单元1500分割成一个或多个编码单元的操作,并且在上面已经关于图4的分割当前编码单元400或450的操作描述了将非正方形的参考编码单元1502分割成一个或多个编码单元的操作。因此,这里将不提供其详细描述。
根据实施例,图像解码装置100可以使用用于识别参考编码单元的大小和形状的PID,以根据先前基于特定条件确定的一些数据单元来确定参考编码单元的大小和形状。也就是说,接收器110可以从比特流仅获得用于识别关于各种数据单元(例如,序列、图片、切片、切片片段、瓦片、瓦片组、最大编码单元等)中作为满足特定条件的数据单元(例如,具有等于或小于切片的大小的数据单元)的每个切片、切片片段、瓦片、瓦片组或最大编码单元的参考编码单元的大小和形状的PID。图像解码装置100可以通过使用PID来确定关于满足特定条件的每个数据单元的参考数据单元的大小和形状。当根据具有相对较小的大小的每个数据单元从比特流获得并使用参考编码单元形状信息和参考编码单元大小信息时,使用比特流的效率可能不高,因此,可以仅获得和使用该PID而不是直接获得参考编码单元形状信息和参考编码单元大小信息。在这种情况下,可以预先确定与用于识别参考编码单元的大小和形状的PID对应的参考编码单元的大小和形状中的至少一个。也就是说,图像解码装置100可以通过基于PID选择参考编码单元的大小和形状中的预先确定的至少一个来确定用作获得PID的单元的数据单元中包括的参考编码单元的大小和形状中的至少一个。
根据实施例,图像解码装置100可以使用最大编码单元中包括的一个或多个参考编码单元。也就是说,从图片分割的最大编码单元可以包括一个或多个参考编码单元,并且可以通过递归地分割每个参考编码单元来确定编码单元。根据实施例,最大编码单元的宽度和高度中的至少一个可以是参考编码单元的宽度和高度中的至少一个的整数倍。根据实施例,可以通过基于四叉树结构将最大编码单元分割n次来获得参考编码单元的大小。也就是说,图像解码装置100可以通过基于四叉树结构将最大编码单元分割n次来确定参考编码单元,并且根据各种实施例可以基于块形状信息和分割形状模式信息中的至少一个来分割参考编码单元。
根据实施例,图像解码装置100可以从比特流获得指示当前编码单元的形状的块形状信息或指示当前编码单元的分割方法的分割形状模式信息,并且可以使用获得的信息。分割形状模式信息可以包括在与各种数据单元相关的比特流中。例如,图像解码装置100可以使用序列参数集、图片参数集、视频参数集、切片头(header)、切片片段头、瓦片头或瓦片组头中包括的分割形状模式信息。此外,图像解码装置100可以根据每个最大编码单元、每个参考编码单元或每个处理块,从比特流获得与块形状信息或分割形状模式信息对应的语法元素,并且可以使用获得的语法元素。
在下文中,将详细描述根据本公开的实施例的确定分割规则的方法。
图像解码装置100可以确定图像的分割规则。可以在图像解码装置100和图像编码装置2200之间预先确定分割规则。图像解码装置100可以基于从比特流获得的信息来确定图像的分割规则。图像解码装置100可以基于从序列参数集、图片参数集、视频参数集、切片头、切片片段头、瓦片头或瓦片组头中的至少一个获得的信息来确定分割规则。图像解码装置100可以根据帧、切片、瓦片、时间层、最大编码单元或编码单元不同地确定分割规则。
图像解码装置100可以基于编码单元的块形状信息来确定分割规则。块形状可以包括编码单元的大小、形状、宽度和高度的比率以及方向。图像解码装置100可以预先确定为基于编码单元的块形状信息来确定分割规则。然而,实施例不限于此。图像解码装置100可以基于从接收的比特流获得的信息来确定图像的分割规则。
编码单元的形状可以包括正方形和非正方形。当编码单元的宽度和高度的长度相同时,图像解码装置100可以将编码单元的形状确定为正方形。另外,当编码单元的宽度和高度的长度不同时,图像解码装置100可以将编码单元的形状确定为非正方形。
编码单元的大小可以包括各种大小,例如4x4、8x4、4x8、8x8、16x4、16x8和256x256。可以基于编码单元的长边的长度、短边的长度或面积来对编码单元的大小进行分类。图像解码装置100可以将相同的分割规则应用于被分类为相同组的编码单元。例如,图像解码装置100可以将具有相同的长边长度的编码单元分类为具有相同的大小。此外,图像解码装置100可以将相同的分割规则应用于具有相同的长边长度的编码单元。
编码单元的宽度和高度的比率可以包括1:2、2:1、1:4、4:1、1:8、8:1、1:16、16:1、32:1、1:32等。另外,编码单元的方向可以包括水平方向和竖直方向。水平方向可以指示编码单元的宽度的长度比其高度的长度长的情况。竖直方向可以指示编码单元的宽度的长度比其高度的长度短的情况。
图像解码装置100可以基于编码单元的大小来自适应地确定分割规则。图像解码装置100可以基于编码单元的大小来不同地确定可允许的分割形状模式。例如,图像解码装置100可以基于编码单元的大小来确定是否允许分割。图像解码装置100可以根据编码单元的大小来确定分割方向。图像解码装置100可以根据编码单元的大小来确定可允许的分割类型。
基于编码单元的大小确定的分割规则可以是在图像解码装置100中预先确定的分割规则。此外,图像解码装置100可以基于从比特流获得的信息来确定分割规则。
图像解码装置100可以基于编码单元的位置来自适应地确定分割规则。图像解码装置100可以基于编码单元在图像中的位置来自适应地确定分割规则。
此外,图像解码装置100可以将分割规则确定为使得通过不同的分割路径生成的编码单元不具有相同的块形状。然而,实施例不限于此,并且通过不同的分割路径生成的编码单元可以具有相同的块形状。通过不同的分割路径生成的编码单元可以具有不同的解码处理顺序。因为在上面已经参考图12描述了解码处理顺序,所以不再提供其细节。
图16是图像编码和解码系统的框图。
图像编码和解码系统1600的编码端1610发送图像的编码比特流,并且解码端1650通过接收和解码比特流来输出重构的图像。这里,解码端1550可以具有与图像解码装置100相似的配置。
在编码端1610,预测编码器1615通过帧间预测和帧内预测输出参考图像,并且变换器和量化器1620将参考图片和当前输入图像之间的残余数据量化为量化的变换系数,并且输出量化的变换系数。熵编码器1625通过编码量化的变换系数来变换量化的变换系数,并且将变换的量化的变换系数作为比特流输出。通过逆量化器和逆变换器1630将量化的变换系数重构为空间域的数据,并且通过去块滤波器(deblocking filter)1635和环路滤波器(loop filter)1640将空间域的数据作为重构图像输出。可以通过预测编码器1615将重构图像用作下一输入图像的参考图像。
通过熵解码器1655以及逆量化器和逆变换器1660,将由解码端1650接收的比特流中的编码的图像数据重构为空间域的残余数据。当结合参考图像和从预测解码器1675输出的残余数据时,空间域的图像数据被配置,并且去块滤波器1665和环路滤波器1670可以通过对空间域的图像数据执行滤波来输出关于当前原始图像的重构图像。重构图像可以被预测解码器1675用作下一原始图像的参考图像。
编码端1610的环路滤波器1640通过使用根据用户输入输入的滤波器信息或系统设置来执行环路滤波。环路滤波器1640使用的滤波器信息被输出到熵编码器1625,并且与编码图像数据一起被发送到解码端1650。解码端1650的环路滤波器1670可以基于从解码端1650输入的滤波器信息来执行环路滤波。
在下文中,将参考图17至图20描述根据本公开的实施例的用于通过使用概率运动表达方法扩展帧间预测方法来编码或解码视频的方法和装置。
图17是根据实施例的视频解码装置的详细框图。
参考图17,根据实施例的视频解码装置1700可以包括帧间预测信息获得器1710、帧间预测执行器1720和重构器1730。
视频解码装置1700可以获得作为编码图像的结果而生成的比特流,并且基于比特流中包括的信息来解码运动信息进行帧间预测。
根据实施例的视频解码装置1700可以包括中央处理器(未示出),该中央处理器用于控制帧间预测信息获得器1710、帧间预测执行器1720和重构器1730。替代地,帧间预测信息获得器1710、帧间预测执行器1720和重构器1730可以通过其自己的处理器(未示出)进行操作,并且处理器可以彼此系统地操作以操作视频解码装置1700。替代地,可以根据视频解码装置1700的外部处理器(未示出)的控制来控制帧间预测信息获得器1710、帧间预测执行器1720和重构器1730。
视频解码装置1700可以包括一个或多个数据存储装置(未示出),该数据存储装置存储帧间预测信息获得器1710、帧间预测执行器1720和重构器1730的输入/输出数据。视频解码装置1700可以包括用于控制数据存储装置的数据输入和输出的存储器控制器(未示出)。
视频解码装置1700可以通过与内部视频解码处理器或外部视频解码处理器连接性地进行操作来执行包括预测的图像解码操作,从而通过图像解码来重构图像。根据实施例的视频解码装置1700的内部视频解码处理器可以以不仅由单独的处理器而且由中央处理装置或图形处理装置中包括的图像解码处理模块执行基本图像解码操作的方式来执行基本图像解码操作。
视频解码装置1700可以包括在上述图像解码装置100中。例如,帧间预测信息获得器1710可以包括在图1的图像解码装置100的接收器110中,并且帧间预测执行器1720和重构器1730可以包括在图像解码装置100的解码器120中。
帧间预测信息获得器1710接收作为编码图像的结果而生成的比特流。该比特流可以包括用于确定用于当前块的帧间预测的运动向量的信息。当前块是当根据树结构分割图像时生成的块,并且例如可以与最大编码单元、编码单元或变换单元对应。
帧间预测信息获得器1710可以基于序列参数集、图片参数集、视频参数集、切片头和切片片段头中的至少一个中包括的块形状信息和/或关于分割形状模式的信息来确定当前块。此外,帧间预测信息获得器1710可以根据每个最大编码单元、每个参考编码单元或每个处理块从比特流获得与块形状信息或关于分割形状模式的信息对应的语法元素,并且可以使用获得的语法元素来确定当前块。
比特流可以包括指示当前块的预测模式的信息,并且当前块的预测模式可以包括根据本公开的帧内模式、帧间模式、合并模式、跳过模式和合并运动向量差模式中的至少一种。合并运动向量差模式可以是通过将根据差分距离和差分方向而区分的运动向量差应用于从合并运动向量候选者中确定的一个基本运动向量来确定当前块的预测运动向量的模式。
根据实施例,可以从比特流获得与合并运动向量差模式相关的信息。根据实施例的与合并运动向量差模式相关的信息可以包括以下中的至少一个:指示是否将合并运动向量差模式应用于当前块的信息(以下称为合并差模式信息)、指示当前块的基本运动向量的信息(以下称为合并候选者信息)、指示从基本运动向量到运动向量候选者的差分距离的信息(以下称为差分距离索引)以及指示从基本运动向量到运动向量候选者的差分方向的信息(以下称为差分方向索引)。
帧间预测信息获得器1710可以从与编码单元、变换单元、最大编码单元、切片单元、和图片单元中的至少一个单元对应的级别获得与合并运动向量差模式相关的数据。
帧间预测执行器1720基于比特流中包括的信息来确定当前块的运动向量。
帧间预测执行器1720可以基于比特流中包括的信息来验证是否将合并运动向量差模式应用于当前块。指示是否应用合并运动向量差模式的信息可以包括标志或索引。
根据实施例,帧间预测信息获得器1710可以在将跳过模式或合并模式应用于当前块时,从比特流提取指示是否应用合并运动向量差模式的信息。
当将合并运动向量差模式应用于当前块时,可以根据从基本运动向量起的可变的差分距离和差分方向来设置运动向量候选者。
差分距离是基于基本像素单位(unit)(例如,1/4像素单位)而确定的值,并且可以以基本像素单位指示差。例如,当基本运动向量和运动向量之间的差分距离是1时,运动向量和基本运动向量相差与一个1/4像素单位对应的像素距离。差分距离可以具有与整数、有理数或无理数对应的值。
当能够由当前块的运动向量指示的最小像素单位与基本像素单位相同时,帧间预测执行器1720可以根据预先确定的差分距离来确定运动向量。
然而,当能够由当前块的运动向量指示的最小像素单位与基本像素单位不同时,帧间预测执行器1720可以缩放预先确定的差分距离,并且然后基于缩放的差分距离来确定基本运动向量的运动向量候选者。
当当前块的运动向量能够指示与整数像素单位、1/2像素单位、1/4像素单位和1/8像素单位对应的像素时,能够由当前块的运动向量指示的最小像素单位为1/8像素单位。此外,当基本像素单位是1/4像素单位时,帧间预测执行器1720可以放大用于确定运动向量的差分距离。
根据实施例,帧间预测执行器1720可以根据基本像素单位与能够由当前块的运动向量指示的最小像素单位的比率来缩放差分距离。
根据实施例,当基本像素单位大于能够由当前块的运动向量指示的最小像素单位时,帧间预测执行器1720可以放大差分距离。
根据实施例,可以从在跳过模式和合并模式中使用的合并候选者列表确定当前块的基本运动向量。合并候选者列表可以包括在空间和时间上与当前块相关的相邻块。在空间和时间上与当前块相关的相邻块可以包括在当前块之前解码的块。因此,根据实施例的基本运动向量可以根据从合并候选者列表确定的相邻块的运动向量来确定。
在根据实施例的合并运动向量差模式中,合并候选者列表可以包括多达两个运动向量候选者。
在空间上与当前块相关的相邻块可以包括例如位于当前块的左侧的块和位于当前块的顶部的块,但不限于此。另外,与当前块在时间上相关的相邻块可以包括例如与包括当前块的当前图片不同的参考图片中包括的块中与当前块位于同一点的块以及与位于该同一点的块在空间上相邻的块。
根据实施例,帧间预测执行器1720可以将与当前块相关的相邻块的运动向量确定为基本运动向量。替代地,帧间预测执行器1720可以修改与当前块相关的相邻块的运动向量,并且将修改的运动向量确定为基本运动向量。
根据实施例,帧间预测执行器1720可以以与在高效视频编码(HEVC)标准的高级运动向量预测(AMVP)模式中确定运动向量预测器(predictor)的候选者列表的方法相同的方式来确定基本运动向量。
根据实施例,帧间预测执行器1720可以将具有0作为分量的零运动向量确定为基本运动向量。
根据实施例的当前块的合并候选者信息可以通过固定长度编码(FLC)方法、一元编码方法或截断一元编码方法被编码,然后被包括在比特流中。例如,当通过FLC方法解码合并候选者信息进行时,cMax值可以是1。
当确定当前块的基本运动向量时,帧间预测执行器1720可以通过将基本运动向量应用于合并运动向量差来确定运动向量。
帧间预测信息获得器1710可以从比特流获得指示差分距离索引和差分方向索引中的至少一个的信息,并且帧间预测执行器1720可以基于差分距离索引和差分方向索引中的至少一个来确定合并运动向量差。可以从基本运动向量确定当前块的运动向量。
根据实施例的帧间预测信息获得器1710可以通过截断一元编码方法解码差分距离索引,并且此时,cMax值可以是7并且cRiceParam值可以是0。根据实施例的帧间预测信息获得器1710可以通过FLC方法解码差分方向索引,并且此时,cMax值可以是3,并且cRiceParam值可以是0。
根据实施例的帧间预测执行器1720可以根据基本像素单位与能够由当前块的运动向量指示的最小像素单位的比率来缩放从比特流验证的差分距离。当基本像素单位(例如,1/4像素单位)大于能够由当前块的运动向量表示的最小像素单位(例如,1/8像素单位)时,帧间预测执行器1720可以放大从比特流验证的差分距离。
缩放的差分距离可以以最小像素单位指示差。例如,当能够由当前块的运动向量指示的最小像素单位是1/8像素单位并且缩放的差分距离是2时,帧间预测执行器1720可以确定具有从基本运动向量起相差与两个1/8像素单位对应的像素距离的运动向量。
如上所述,基于基本像素单位预先确定的差分距离用于基于从合并候选者列表确定的基本运动向量来确定当前块的运动向量,并且因为基于基本像素单位指示差分距离的信息通过比特流用用信号通知,因此与基本像素单位的精度不同的能够指示最小像素单位的精度的帧间预测执行器1720可以根据最小像素单位缩放通过比特流用信号通知的差分距离。
基于基本像素单位确定的差分距离和基于最小像素单位缩放的差分距离就像素距离而言可以是相同的。
根据实施例,指示能够由当前块的运动向量指示的最小像素单位的信息可以包括在比特流中。帧间预测信息获得器1710可以从与块、切片和图片中的至少一个级别对应的比特流获得指示最小像素单位的信息。
可以从变换单元级、编码单元级、最大编码单元级、切片级或图片级中的比特流获得用于确定当前块的运动向量的差分距离索引和差分方向索引中的至少一个。
根据实施例的帧间预测信息获得器1710可以通过使用上下文信息(上下文变量)执行熵解码来获得差分距离索引中的一些bin,并且可以通过在旁路模式下执行熵解码来获得其余bin。
通过对比特流以上下文自适应二进制算术编码(CABAC)方式执行熵解码,可以提取语法元素的每个bin,并且可以将上下文信息用于每个bin。在其中不使用上下文信息的熵解码模式被称为旁路模式。对于当前bin的熵解码,确定是否使用上下文信息以及要使用哪种上下文信息。
根据实施例的帧间预测信息获得器1710可以在旁路模式下对比特流执行熵解码,以获得指示差分方向索引的两个比特的bin。
帧间预测信息获得器1710可以从变换单元级,编码单元级,最大编码单元级,切片级或图片级中的比特流获得指示残余运动向量的信息。
下面将参考图21描述根据实施例的可以在合并运动向量差模式下从基本运动向量确定的运动向量候选者。
图21示出了根据实施例的运动向量候选者的位置。
根据实施例的帧间预测执行器1720可以通过将合并运动向量差应用于基本运动向量来确定当前块的运动向量。根据实施例,当当前块的预测方向是双向时,合并运动向量差可以包括在仅用于一个单方向的比特流中。例如,,指示合并运动向量差的信息可以包括在仅用于列表0方向和列表1方向中的任一个的单方向的比特流中。
图21示出了在双向预测中可以在合并运动向量差模式下确定的运动向量。
在合并候选者列表中确定当前图片2100的当前块2110的在L0方向上的基本运动向量2125和在L1方向上的基本运动向量2135。在L0方向上的基本运动向量2125指示在L0参考图片2120中的虚线形状的位置,并且在L1方向上的基本运动向量2135指示在L1参考图片2130中的虚线形状的位置。
然而,在合并运动向量差模式下,可以基于差分方向索引和差分距离索引将运动向量差应用于基本运动向量2125和在L1方向上的基本运动向量2135中的每一个。
例如,可以根据差分距离索引确定基本运动向量与运动向量候选者之间的距离是s、2s还是3s。当差分距离索引指示s时,作为将运动向量差应用于基本运动向量的结果而生成的运动向量候选者可以指示L0参考图片2120和L1参考图片2130中的黑圈的位置。当差分距离索引指示2s,作为将运动向量差应用于基本运动向量的结果而生成的运动向量候选者可以指示L0参考图片2120和L1参考图片2130中的白圈的位置。
例如,可以根据差分方向索引来确定基本运动向量和运动向量候选者之间的方向在x和y轴方向上是+还是-。特别地,差分方向索引可以指示在(x,y)轴方向上的(+,0),(-,0),(0,+)和(0,-)之一。
因此,可以通过组合差分距离索引和差分方向索引来确定指示L0参考图片2120和L1参考图片2130中的一个位置的运动向量。
在下文中,将参考图22至图25描述确定可以从基本运动向量确定的运动向量候选者的方法。
图22至图25是示出显示在坐标平面上的运动向量候选者的图,并且示出了根据基于与1/4像素单位对应的基本像素单位而预先确定的差分距离所确定的运动向量候选者。
参考图22至图25,帧间预测执行器1720可以确定根据关于配置运动向量候选者的特定形状定位的候选者。该特定形状可以类似于诸如菱形或矩形的多边形或圆形。
帧间预测执行器1720可以将在距与基本运动向量对应的点均匀的差分距离的候选者确定为运动向量候选者。帧间预测执行器1720可以确定在距预设点的第一差分距离的运动向量候选者,确定在距预设点的第二差分距离的运动向量候选者,并且确定在距预设点的第n差分距离的运动向量候选者。可以根据用户的定义来确定差分距离。替代地,帧间预测执行器1720可以基于与当前块、时间层或图片组(GOP)相关的信息直接确定差分距离,或者通过比特流获得指示用于确定运动向量候选者的差分距离的信息。
帧间预测执行器1720可以根据在比与当前块对应的级别高的高级别中确定的差分距离来确定用于确定当前块的运动向量候选者的差分距离。
可以针对每个差分距离独立地确定运动向量候选者的数量。帧间预测执行器1720可以根据关于在比与当前块对应的级别高的高级别中确定的数量的信息来确定针对当前块的每个差分距离的运动向量候选者的数量。
图22和23示出了每个差分距离中的运动向量候选者的数量为4的情况。此外,在图22和23中,存在3个差分距离,但是差分距离的数量不限于3。
参考图22,帧间预测执行器1720可以基于基本运动向量(x,y)2201确定具有菱形形状分布的运动向量候选者。
帧间预测执行器1720可以确定从基本运动向量(x,y)2201起1的差分距离的运动向量候选者(x+1,y)2202、(x-1,y)2203、(x,y+1)2204和(x,y-1)2205。
帧间预测执行器1720可以确定从基本运动向量(x,y)2201起2的差分距离的运动向量候选者(x+2,y)2206、(x-2,y)2207、(x,y+2)2208和(x,y-2)2209。
帧间预测执行器1720可以确定从基本运动向量(x,y)2201起4的差分距离的运动向量候选者(x+4,y)2210、(x-4,y)2211、(x,y+4)2212和(x,y-4)2213。
参考图23,帧间预测执行器1720可以基于基本运动向量(x,y)2201确定具有矩形形状分布的运动向量候选者。
帧间预测执行器1720可以确定在基于基本运动向量(x,y)2201的约1的差分距离的运动向量候选者(x+1,y+1)2221、(x+1,y-1)2222、(x-1,y+1)2223和(x-1,y-1)2224。
帧间预测执行器1720可以确定在基于基本运动向量(x,y)2201的约2的差分距离的运动向量候选者(x+2,y+2)2225、(x+2,y-2)2226、(x-2,y+2)2227和(x-2,y-2)2228。
帧间预测执行器1720可以确定在基于基本运动向量(x,y)2201的约4的差分距离的运动向量候选者(x+4,y+4)2229、(x+4,y-4)2230、(x-4,y+4)2231和(x-4,y-4)2232。
参考图24,帧间预测执行器1720可以根据差分距离来不同地确定运动向量候选者的数量。
具体地,帧间预测执行器1720可以确定从基本运动向量(x,y)2201起约1的差分距离的八个运动向量候选者(x+1,y)2202、(x-1,y)2203、(x,y+1)2204、(x,y-1)2205、(x+1,y+1)2221、(x+1,y-1)2222、(x-1,y+1)2223和(x-1,y-1)2224。
此外,帧间预测执行器1720可以确定从基本运动向量(x,y)2201起约2的差分距离的八个运动向量候选者(x+2,y)2206、(x-2,y)2207、(x,y+2)2208、(x,y-2)2209、(x+2,y+2)2225、(x+2,y-2)2226、(x-2,y+2)2227和(x-2,y-2)2228。
帧间预测执行器1720可以确定从基本运动向量(x,y)2201起约4的差分距离的四个运动向量候选者(x+4,y)2210、(x-4,y)2211、(x,y+4)2212和(x,y-4)2213。
参考图25,帧间预测执行器1720可以针对每个差分距离不同地确定运动向量候选者的分布形状。例如,帧间预测执行器1720可以确定基于基本运动向量(x,y)2201具有菱形形状分布的运动向量候选者(x+1,y)2202、(x-1,y)2203、(x,y+1)2204和(x,y-1)2205。
此外,帧间预测执行器1720可以确定基于基本运动向量(x,y)2201具有矩形形状分布的运动向量候选者(x+2,y+2)2225、(x+2,y-2)2226、(x-2,y-2)2228和(x-2,y+2)2227。
此外,帧间预测执行器1720可以确定基于基本运动向量(x,y)2201具有菱形形状分布的运动向量候选者(x+4,y)2210、(x-4,y)2211、(x,y+4)2212和(x,y-4)(2213)。每个候选者组中包括的运动向量候选者的分布形状可以具有各种分布形状以及如图25所示的分布形状。
根据实施例,帧间预测执行器1720可以针对每个基本运动向量确定位于不同的差分距离的运动向量候选者。例如,从多个基本运动向量中,可以针对第一基本运动向量确定具有1的差分距离的运动向量候选者,并且可以针对第二基本运动向量确定具有2的差分距离的运动向量候选者。替代地,例如,可以针对第一基本运动向量确定具有1的差分距离的运动向量候选者和具有2的差分距离的运动向量候选者,并且可以针对第二基本运动向量确定具有4的差分距离的运动向量候选者和具有8的差分距离的运动向量候选者。
当以1:1方式将不同的差分距离映射到基本运动向量时,帧间预测信息获得器1710可以从比特流仅获得指示当前块的基本运动向量的信息或指示差分距离的信息,并确定用于指定当前块的运动向量和当前块的基本运动向量的差分距离。
如上所述,可以基于基本像素单位来确定用于确定运动向量候选者的差分距离,并且当能够由当前块的运动向量指示的最小像素单位不同于基本像素单位时,帧间预测执行器1720可以缩放用于针对每个基本运动向量配置候选者组的预设差分距离。
当当前块的运动向量能够指示与整像素单位、1/2像素单位、1/4像素单位和1/8像素单位对应的像素时,能够由当前块的运动向量指示的最小像素单位为1/8像素单位。另外,当基本像素单位是1/4像素单位时,帧间预测执行器1720可以放大差分距离。根据实施例,帧间预测执行器1720可以根据基本像素单位与能够由当前块的运动向量指示的最小像素单位的比率来放大差分距离。当能够由当前块的运动向量指示的最小像素单位是m像素单位、基本像素单位是n像素单位并且差分距离是k时,帧间预测执行器1720可以将k的差分距离放大k x n/m。
根据实施例的帧间预测信息获得器1710可以将当前块的预测模式确定为跳过模式和合并模式之一。在跳过模式或合并模式中,可以使用合并运动向量差和在当前块的合并候选者列表中确定的运动向量,根据合并运动向量差模式来执行预测。当根据合并运动向量差模式执行预测时,帧间预测信息获得器1710可以通过应用一条上下文信息对比特流执行熵解码来获得指示合并候选者列表中的一个候选者的合并候选者信息。
根据实施例的帧间预测执行器1720可以从合并候选者列表中基于合并候选者信息确定的一个候选者确定基本运动向量。帧间预测执行器1720可以通过使用合并运动向量差的距离索引和当前块的合并运动向量差的方向索引来确定合并运动向量差,并且可以通过使用基本运动向量和合并运动向量差来确定当前块的运动向量。
根据实施例的重构器1730可以通过使用当前块的运动向量来重构当前块。重构器1730可以通过使用当前块的运动向量来确定参考图片中的参考块,并且从参考块中包括的参考样本中确定与当前块对应的预测样本。
当根据实施例的当前块的预测模式是合并模式并且选择了合并运动向量差模式时,帧间预测执行器1720可以从合并候选者列表确定当前块的基本运动向量并通过使用基本运动向量和合并运动向量差确定当前块的运动向量。当当前块的预测模式是合并模式时,视频解码装置1700可以从比特流解析当前块的变换系数,并通过对变换系数执行逆量化和逆变换来获得残余样本。重构器1730可以通过组合当前块的预测样本和当前块的残余样本来确定当前块的重构样本。
当根据实施例的当前块的预测模式是跳过模式并且选择了合并运动向量差模式时,帧间预测执行器1720可以通过使用合并运动向量差和从合并候选者列表确定的基本运动向量来确定当前块的运动向量。然而,因为当前块的预测模式是跳过模式,所以视频解码装置1700不从比特流解析当前块的变换系数,因此不获得残余样本。在跳过模式下,重构器1730可以将当前块的预测样本确定为没有残余样本的当前块的重构样本。
在下文中,将参考图18描述视频解码方法,其中,通过获得预测信息来执行帧间预测以在跳过运动模式或合并模式下执行合并运动向量差模式。
图18是根据实施例的视频解码方法的流程图。
在操作1810中,帧间预测执行器1720可以将当前块的预测模式确定为跳过模式和合并模式之一。
当帧间预测执行器1720在操作1810中将当前块的预测模式确定为跳过模式时,帧间预测信息获得器1710可以获得指示是否要使用合并运动向量差和从当前块的合并候选者列表确定的运动向量的合并差模式信息。换句话说,合并差模式信息指示当当前块处于跳过模式时是否应用合并运动向量差模式。
即使在操作1810中帧间预测执行器1720将当前块的预测模式确定为合并模式时,帧间预测信息获得器1710也可以获得指示是否要使用合并运动向量差和从当前块的合并候选者列表确定的运动向量的合并差模式信息。换句话说,合并差模式信息指示当当前块处于合并模式时是否应用合并运动向量差模式。
帧间预测信息获得器1710可以使用上下文信息执行熵解码,以在跳过模式或合并模式下获得合并差模式信息。用于在跳过模式下获得合并差模式信息的上下文信息和用于在合并模式下获得合并差模式信息的上下文信息可以相同。
根据实施例,可以通过相同的语法元素来获得在跳过模式下获得的合并差模式信息和在合并模式下获得的合并差模式信息。当通过相同的语法元素获得在跳过模式下获得的合并差模式信息和在合并模式下获得的合并差模式信息时,基于一条合并差模式信息确定是否在跳过模式和合并模式下选择了合并运动向量差模式,因此基于一条上下文信息来解析语法元素,并且可以获得用于跳过模式和合并模式的合并差模式信息。
根据另一实施例,即使当通过单独的语法元素获得在跳过模式下获得的合并差模式信息和在合并模式下获得的合并差模式信息时,也可以基于相同的上下文信息来解析语法元素,因此可以通过使用一条上下文信息来获得跳过模式下的合并差模式信息和合并模式下的合并差模式信息。
当获得合并差模式信息时,执行操作1820。
在操作1820中,当要使用合并运动向量差和从当前块的合并候选者列表确定的运动向量时,帧间预测信息获得器1710可通过应用该条上下文信息对比特流执行熵解码来获得合并候选者信息。该合并候选者信息指示合并候选者列表中的一个候选者。
帧间预测执行器1720可以基于在跳过模式或合并模式下获得的合并差模式信息,确定是否针对当前块选择合并运动向量差模式。当针对当前块选择合并运动向量差模式时,即,当要使用合并运动向量差和从当前块的合并候选者列表确定的运动向量时,帧间预测信息获得器1710可以从比特流获得合并候选者信息。合并候选者信息是1比特的信息,因此可以通过使用用于第一bin的一条上下文信息来获得。
帧间预测信息获得器1710可以使用上下文信息执行熵解码,以在跳过模式或合并模式下获得合并候选者信息。用于在跳过模式下获得合并候选者信息的上下文信息和用于在合并模式下获得合并候选者信息的上下文信息可以相同。
根据实施例,当通过相同的语法元素获得在跳过模式下获得的合并候选者信息和在合并模式下获得的合并候选者信息时,基于一条上下文信息来解析语法元素,因此可以获得用于跳过模式的合并候选者信息和用于合并模式的合并候选者信息。
根据另一实施例,即使当通过单独的语法元素获得在跳过模式下获得的合并候选者信息和在合并模式下获得的合并候选者信息时,也基于相同的上下文信息来解析语法元素,因此可以通过使用一条上下文信息来获得用于跳过模式的合并候选者信息和用于合并模式的合并候选者信息。
在操作1830中,帧间预测执行器1720可以从合并候选者列表中基于合并候选者信息确定的一个候选者来确定基本运动向量。当在跳过模式或合并模式下选择合并运动向量差模式时,合并候选者列表可以包括多达两个候选者。在这种情况下,合并候选者信息可以是1比特的标志。
根据实施例,当在合并模式下执行预测时,获得指示合并候选者列表中的一个候选者的一般合并索引所需的上下文信息条数量和获得合并候选者信息所需上下文信息条数量可以相同。
在操作1840中,帧间预测执行器1720可以通过使用当前块的合并运动向量差的距离索引和合并运动向量差的方向索引来确定当前块的合并运动向量差,并通过使用基本运动向量和合并运动向量差来确定当前块的运动向量。
帧间预测信息获得器1710可以通过经由旁路模式对比特流执行熵解码来获得指示合并运动向量差的方向索引的两个bin。帧间预测信息获得器1710可以通过使用上下文信息对比特流执行熵解码来获得指示合并运动向量差的距离索引的第一bin,并通过经由旁路模式执行熵解码来获得指示合并运动向量差的距离索引的其余bin。
在既不是跳过模式也不是合并模式的一般运动向量预测模式(AMVP或高级时间运动向量预测(ATMVP))中,视频解码装置1700获得运动向量预测器索引和运动向量差。视频解码装置1700可以确定由运动向量预测器列表中的运动向量预测器索引指示的运动向量预测器,并且通过组合运动向量预测器和运动向量差信息来确定运动向量。
与一般运动向量预测模式相比,跳过模式和合并模式不使用运动向量差。然而,当在跳过模式或合并模式中选择合并运动向量差模式时,使用合并运动向量差。与一般运动向量预测模式相比,合并运动向量差模式中的合并运动向量差与运动向量差相比具有表达简洁性。
例如,表示在L0预测方向或L1预测方向上的一般运动向量差所需的信息包括:指示运动向量差的绝对值是否大于0的信息abs_mvd_greater0_flag;指示运动向量差的绝对值是否大于1的信息abs_mvd_greater1_flag;指示通过从运动向量差的绝对值减去2获得的值的信息abs_mvd_minus2;和指示运动向量差的符号的信息mvd_sign_flag。
另一方面,表示在L0预测方向或L1预测方向上的合并运动向量差所需的信息仅是差分方向信息和差分距离信息。因此,由于可以仅通过使用差分方向信息和差分距离索引来表示合并运动向量差,所以与用信号通知一般运动向量差所需的比特量相比,用信号通知合并运动向量差所需的比特量可以显著地低。
在下文中,将参考图19描述通过在跳过模式或合并模式下选择合并运动向量差模式来执行帧间预测的视频编码装置。
图19是根据实施例的视频编码装置的框图。
参考图19,根据实施例的视频编码装置1900可以包括帧间预测执行器1910和帧间预测信息生成器1920。
视频编码装置1900可以编码通过执行帧间预测而确定的运动信息,并以比特流的形式输出编码的运动信息。
根据实施例的视频编码装置1900可以包括用于控制帧间预测执行器1910和帧间预测信息生成器1920的中央处理器(未示出)。替代地,帧间预测执行器1910和帧间预测器预测信息生成器1920可以通过其自己的处理器(未示出)进行操作,并且处理器可以彼此系统地操作以操作视频编码装置1900。替代地,帧间预测执行器1910和帧间预测信息生成器1920可以根据视频编码装置1900的外部处理器(未示出)的控制进行控制。
视频编码装置1900可以包括一个或多个数据存储装置(未示出),该数据存储装置存储帧间预测执行器1910和帧间预测信息生成器1920的输入/输出数据。视频编码装置1900可以包括用于控制数据存储装置的数据输入和输出的存储控制器(未示出)。
视频编码装置1900可以通过与内部视频编码处理器或外部视频编码处理器连接性地进行操作来执行包括预测的图像编码操作,以编码图像。根据实施例的视频编码装置1900的内部视频编码处理器可以以不仅由单独的处理器而且由中央处理装置或图形处理装置中包括的图像编码处理模块执行基本图像编码操作的方式来执行基本图像编码操作。
根据实施例的帧间预测执行器1910可以通过对当前块执行帧间预测来确定当前块的运动向量。
当在跳过模式和合并模式之一下对当前块执行帧间预测时,根据实施例的帧间预测信息生成器1920可以确定是否要使用合并运动向量差和从当前块的合并候选者列表确定的基本运动向量。当要使用合并运动向量差时,帧间预测信息生成器1920可以通过应用一条上下文信息对比特流执行熵编码来生成合并候选者信息。该合并候选者信息指示合并候选者列表中的基本运动向量。帧间预测信息生成器1920可以生成与基本运动向量和当前块的运动向量之间的差对应的合并运动向量差的距离索引以及合并运动向量差的方向索引。
在下文中,将参考图20描述视频编码装置1900通过在跳过模式或合并模式下选择合并运动向量差模式来执行帧间预测的过程。
图20是根据实施例的视频编码方法的流程图。
在操作2010中,当在跳过模式和合并模式之一下对当前块执行帧间预测时,帧间预测执行器1910可以确定是否要使用合并运动向量差和从当前块的合并候选者列表确定的基本运动向量。
在操作2020中,当要使用合并运动向量差时,帧间预测信息生成器1920可以通过应用一条上下文信息对比特流执行熵编码来生成指示合并候选者列表中的一个基本运动向量的合并候选者信息。
在操作2030中,帧间预测信息生成器1920可以生成与基本运动向量和当前块的运动向量之间的差对应的合并运动向量差的距离索引以及合并运动向量差的方向索引。
根据实施例的帧间预测执行器1910可以确定当前块的运动向量,该当前块指示参考图片中的参考块。
根据实施例的帧间预测执行器1910可以将当前块的运动向量的预测模式确定为跳过模式和合并模式之一。帧间预测信息生成器1920可以生成指示当前块的预测模式是否为跳过模式的跳过模式信息和指示预测模式是否为合并模式的合并模式信息。
当当前块的预测模式是跳过模式或合并模式时,帧间预测信息生成器1920可以使用合并运动向量差和从当前块的合并候选者列表确定的基本运动向量来确定是否在合并运动向量差模式下预测当前块的运动向量。帧间预测信息生成器1920可以生成指示是否在合并运动向量差模式下预测运动向量的合并差模式信息。
当根据合并运动向量差模式预测运动信息时,根据实施例的帧间预测信息生成器1920可以确定指示合并候选者列表中的基本运动向量的合并候选者信息。帧间预测信息生成器1920可以应用一条上下文信息对合并候选者信息执行熵解码,以编码指示合并候选者列表中的一个候选者的合并候选者信息。
帧间预测信息生成器1920可以确定当前块的运动向量与基本运动向量之间的合并运动向量差,并生成当前块的合并运动向量差的距离索引和合并运动向量差的方向索引。
当根据实施例的当前块的预测模式是合并模式并且选择合并运动向量差模式时,帧间预测信息生成器1920可以生成指示合并候选者列表中当前块的基本运动向量的合并候选者信息,并生成用于指示当前块的运动向量与基本运动向量之间的合并运动向量差的差分距离信息和差分方向信息。
当当前块的预测模式是合并模式时,视频编码装置1900可以将由当前块的运动向量指示的参考块的样本确定为当前块的预测样本。视频编码装置1900可以确定作为原始样本和当前块的预测样本之间的差的残余样本。视频编码装置1900可以编码通过对当前块的残余样本执行变换和量化而生成的变换系数。
根据实施例,当当前块的预测模式是跳过模式时,仅利用当前块的预测样本编码当前块,因此视频编码装置1900不编码当前块的残余样本。即使当根据实施例的当前块的预测模式是跳过模式并且选择合并运动向量差模式时,帧间预测信息生成器1920也可以编码合并差模式信息、合并候选者信息、差分距离信息和差分方向信息而不编码残余样本。
根据实施例,当帧间预测执行器1910将当前块的预测模式确定为跳过模式时,可以通过使用合并运动向量差和从当前块的合并候选者列表确定的基本运动向量确定是否选择编码运动向量的合并运动向量差模式。当选择合并运动向量差模式时,帧间预测信息生成器1920可以生成合并差模式信息。换句话说,合并差模式信息指示当当前块处于跳过模式时是否应用合并运动向量差模式。
根据实施例,当帧间预测执行器1910确定当前块的预测模式为合并模式时,可以确定是否选择合并运动向量差模式。当选择合并运动向量差模式时,帧间预测信息生成器1920可以生成合并差模式信息。
帧间预测信息生成器1920可以使用上下文信息执行熵编码,以在跳过模式或合并模式下编码合并差模式信息。用于在跳过模式下编码合并差模式信息的上下文信息和用于在合并模式下编码合并差模式信息的上下文信息可以相同。
当通过相同的语法元素编码跳过模式下的合并差模式信息和合并模式下的合并差模式信息时,通过一条合并差模式信息表示是否在跳过模式和合并下选择合并运动向量差模式,因此基于一条上下文信息编码语法元素,并且可以编码用于跳过模式和合并模式的合并差模式信息。
根据另一实施例,当通过单独的语法元素编码跳过模式下的合并差模式信息和合并模式下的合并差模式信息时,可以通过使用一条上下文信息编码跳过模式下的合并差模式信息和合并模式下的合并差模式信息。
当在合并运动向量差模式下编码运动向量时,帧间预测信息生成器1920可以通过将一条上下文信息应用于合并候选者信息来执行熵编码。合并候选者信息指示合并候选者列表中的一个候选者。根据实施例的合并候选者信息是1比特的信息,因此可以通过使用用于第一bin的一条上下文信息来获得。
根据实施例,用于在跳过模式下编码合并候选者信息的上下文信息和用于在合并模式下编码合并候选者信息的上下文信息可以相同。
根据实施例,当通过相同的语法元素编码跳过模式下的合并候选者信息和合并模式下的合并候选者信息时,通过使用一条上下文信息编码语法元素,因此可以通过使用一条上下文信息来编码用于跳过模式的合并候选者信息和用于合并模式的合并候选者信息。
根据另一实施例,即使通过单独的语法元素编码跳过模式下的合并候选者信息和合并模式下的合并候选者信息,也可以通过使用相同的上下文信息编码语法元素,因此可以通过使用一条上下文信息编码用于跳过模式的合并候选者信息和用于合并模式的合并候选者信息。
当在跳过模式或合并模式下选择合并运动向量差模式时,合并候选者列表可以包括多达两个候选者。在这种情况下,合并候选者信息可以是1比特的标志。
根据实施例,当在合并模式下执行预测时,获得指示合并候选者列表中的一个候选者的一般合并索引所需的上下文信息条数量和获得合并候选者信息所需上下文信息条数量可以相同。
帧间预测信息生成器1920可以对当前块的合并运动向量差的距离索引和合并运动向量差的方向索引执行熵编码。
根据实施例的帧间预测信息生成器1920可以通过旁路模式分别对指示合并运动向量差的方向索引的两个bin执行熵编码。帧间预测信息生成器1920可以通过使用上下文信息对指示合并运动向量差的距离索引的第一bin执行熵编码,并且在旁路模式下分别对指示合并运动向量差的距离索引的其余bin执行熵编码。
图26示出了根据实施例的合并候选者信息、合并差分距离索引和合并差分方向索引的值和含义。
合并差分距离索引指示合并运动向量差的距离索引。合并差分方向索引指示合并运动向量差的方向索引。
视频解码装置1700可以基于合并候选者信息、合并差分距离索引和合并差分方向索引来确定当前块的运动向量。
图26的表2600示出了根据实施例的合并候选者信息和与其对应的运动向量候选者。根据实施例的合并候选者列表包括四个运动向量候选者(第一、第二、第三和第四运动向量(MV)候选者),并且合并候选者信息可以被显示c成指示它们之一的索引(0、1、2或3)。
在合并运动向量差模式中,可以将合并候选者列表中由合并候选者信息指示的一个运动向量候选者确定为基本运动向量。
在图26的表2610中,根据实施例的合并差分距离索引是0到7之间的整数,并且每个索引可以根据截断一元编码方法被二值化。合并差分距离索引可以指示2N之一,其中,N为0至7。合并差分距离基于基本像素单位确定,并且当基本像素单位是1/4时,与合并差分距离索引0对应的合并运动向量差分距离可以表示1/4像素距离,并且与合并差分距离索引1对应的合并运动向量差分距离可以表示1/2像素距离。与合并差分距离索引7对应的合并运动向量差分距离可以表示32像素距离。
如上所述,当能够由当前块的运动向量指示的最小像素单位小于基本像素单位时,可以根据最小像素单位与基本像素单位的比率来缩放合并运动向量差分距离。例如,当基本像素单位是1/4像素单位而最小像素单位是1/8像素单位时,并且当指示从比特流获得的合并运动向量差分距离的索引是0时,与索引0对应的合并运动向量差分距离1可以放大到2。
此外,在表2620中,二进制字符串00的合并运动向量差分方向索引表示基于基本运动向量沿X轴的+方向改变的运动向量候选者,并且二进制字符串11的合并运动向量差分方向表示基于基本运动向量沿Y轴的-方向改变的运动向量候选者。
图26的合并候选者信息、合并差分距离索引和合并差分方向索引仅是示例,并且在本公开中提出的合并运动向量差模式下可用的索引不限于此。
例如,在合并运动向量差模式下在合并候选者列表中包括的候选者的数量可以被限制为2,并且合并候选者信息可以是1比特的索引。
图27示出了根据实施例的用于通过使用基本运动向量和合并运动向量差来获得运动向量的等式。
mvLX[x][y][n]表示当前块的运动向量。x、y表示当前块的x、y坐标,并且n表示运动向量mvLX的水平方向分量和竖直方向分量之一。mvLX[x][y][0]表示运动向量mvLX的水平方向分量,而mvLX[x][y][1]表示运动向量mvLX的竖直方向分量。
mxLXN[m]表示由合并候选者列表中的合并候选者信息指示的基本运动向量。m表示基本运动向量mvLXN的水平方向分量和竖直方向分量之一。mvLXN[0]表示基本运动向量mvLXN的水平方向分量,而mvLXN[1]表示基本运动向量mvLXN的竖直方向分量。
refineMxLX[1]表示合并运动向量差。l表示合并运动向量差refineMxLX的水平方向分量和竖直方向分量之一。refineMxLX[0]表示合并运动向量差refineMxLX的水平方向分量,而refineMxLX[1]表示合并运动向量差refineMxLX的竖直方向分量。
在mvLX、mxLXN和refineMxLX中,LX表示L0预测方向和L1预测方向之一。因此,mvL0、mxL0N和refineMxL0表示在L0预测方向上的运动向量、基本运动向量和合并运动向量差,而mvL1、mxL1N和refineMxL1表示在L1预测方向上的运动向量、基本运动向量和合并运动向量差。
根据实施例的视频解码装置1700从比特流获得合并候选者信息,并且从合并候选者列表确定由合并候选者信息指示的基本运动向量的水平方向分量mxLXN[0]和基本运动向量的竖直方向分量mxLXN[1]。
根据实施例的视频解码装置1700从比特流获得合并差分方向索引和合并差分距离索引,并通过使用合并差分方向索引和合并差分距离索引确定合并运动向量差的水平方向分量refineMxLX[0]和合并运动向量差的竖直方向分量refineMxLX[1]。
根据实施例的视频解码装置1700可以通过将基本运动向量的水平方向分量mxLXN[0]与合并运动向量差的水平方向分量refineMxLX[0]相加来获得当前块的运动向量的水平方向分量mvLX[0][0][0],并通过将基本运动向量的竖直方向分量mxLXN[1]与合并运动向量差的竖直方向分量refineMxLX[1]相加来获得当前块的运动向量的竖直方向分量mvLX[0][0][1]。
图28示出了根据实施例的用于获得合并差模式信息、合并候选者信息、合并差分距离索引和合并差分方向索引的语法。
根据实施例的视频解码装置1700可以从比特流的coding_unit语法获得指示是否在跳过模式下预测当前块的语法元素cu_skip_flag。当在跳过模式下预测当前块(if(cu_skip_flag))时,视频解码装置1700可以获得指示是否在合并运动向量差模式下预测当前块的语法元素umve_flag。当umve_flag为1时,视频解码装置1700可以调用umve_idx_coding语法。视频解码装置1700可以从比特流的umv_idx_coding语法获得与合并候选者信息对应的语法元素base_mv_idx、与合并运动向量差的距离索引对应的语法元素distance_idx和与合并运动向量差的方向索引对应的语法元素direction_idx。
当不在跳过模式下预测当前块时(当cu_skip_flag不为0时),视频解码装置1700可以获得指示是否在合并模式下预测当前块的语法元素merge_flag。当在合并模式下预测当前块(if(merge_flag))时,可以获得指示是否在合并运动向量差模式下预测当前块的语法元素umve_flag。当umve_flag为1时,视频解码装置1700可以调用umve_idx_coding语法。视频解码装置1700可以从比特流的umv_idx_coding语法获得与合并候选者信息对应的语法元素base_mv_idx、与合并差分距离索引对应的语法元素distance_idx和与合并差分方向索引对应的语法元素direction_idx。
因此,视频解码装置1700可以获得指示在跳过模式和合并模式下是否在合并运动向量差模式下预测当前块的语法元素umve_flag。即使当单独获得跳过模式的umve_flag和合并模式的umve_flag时,也可以通过使用相同上下文信息的熵解码来获得这两个umve_flag。
此外,视频解码装置1700可以在跳过模式和合并模式下获得合并候选者信息base_mv_idx。即使当单独获得跳过模式的base_mv_idx和合并模式的base_mv_idx时,也可以通过使用相同上下文信息的熵解码来获得这两个base_mv_idx。
图29示出了根据另一实施例的用于获得合并差模式信息、合并候选者信息、合并差分距离索引和合并差分方向索引的语法。
根据另一实施例的视频解码装置1700可以从比特流的merge_data语法获得指示是否在合并模式下预测当前块的语法元素regular_merge_flag。当在合并模式下预测当前块(if(regular_merge_flag==1))时,视频解码装置1700可以获得指示是否在合并运动向量差模式下预测当前块的语法元素mmvd_merge_flag。当在合并运动向量差模式下预测当前块(if(mmvd_merge_flag==1))时,视频解码装置1700可以获得与合并候选者信息对应的语法元素mmvd_cand_flag、与合并运动向量差的距离索引对应的语法元素mmvd_distance_idx和与合并运动向量差的方向索引对应的语法元素mmvd_direction_idx。
即使当在跳过模式下预测当前块时,视频解码装置1700也可以隐式地将regular_merge_flag视为1。因此,当在跳过模式下预测当前块时,视频解码装置1700可以获得指示是否在合并运动向量差模式下预测当前块的语法元素mmvd_merge_flag,并且当在合并运动向量差模式下预测当前块(if(mmvd_merge_flag==1))时,视频解码装置1700可以获得与合并候选者信息对应的语法元素mmvd_cand_flag、与合并运动向量差的距离索引对应的语法元素mmvd_distance_idx和与合并运动向量差的方向索引对应的语法元素mmvd_direction_idx。
根据merge_data语法,视频解码装置1700可以在跳过模式和合并模式下通过相同的语法元素mmvd_merge_flag、mmvd_cand_flag、mmvd_distance_idx和mmvd_direction_idx分析与合并运动向量差模式相关的信息(是否在合并运动向量差模式下预测当前块、合并候选者信息、合并运动向量差的距离索引和合并运动向量差的方向索引)。但是,由于当前块的预测模式不能同时为跳过模式和合并模式,因此跳过模式的mmvd_merge_flag、mmvd_cand_flag、mmvd_distance_idx和mmvd_direction_idx不与合并模式的mmvd_merge_flag、mmvd_cand_flag、mmvd_distance_idx和mmvd_direction_idx同时获得,并且可以将与跳过模式下的合并运动向量差模式相关的信息和与合并模式下的合并运动向量差模式相关的信息解释为独立信息。
视频解码装置1700获得指示在跳过模式和合并模式中的每一个下是否在合并运动向量差模式下预测当前块的语法元素mmvd_merge_flag,但是可以使用一条上下文信息通过熵解码获得mmvd_merge_flag。
此外,视频解码装置1700可以在跳过模式和合并模式下获得合并候选者信息mmvd_cand_flag。即使当单独获得跳过模式的mmvd_cand_flag和合并模式的mmvd_cand_flag时,也可以通过使用相同上下文信息的熵解码来获得这两个mmvd_cand_flag。
图30是根据实施例的用于确定合并相关信息的上下文信息的参考表。
图30的参考表示出了对于每个语法元素的每个bin索引执行熵解码所需的上下文信息。
例如,解码指示在合并运动向量差模式下的预测的语法元素mmvd_merge_flag的bin索引0(即,第一bin)所需的上下文信息为0。因为mmvd_merge_flag是1比特的信息,所以对于除了bin索引0以外的bin的上下文信息未定义(na)。因此,对指示视频解码装置1700是否在合并运动向量差模式下执行预测的语法元素mmvd_merge_flag(即,对合并差模式信息)执行熵解码所需的上下文信息条数可以是1。
此外,当在合并模式下执行预测时,视频解码装置1700可以从比特流获得指示来自合并候选者列表的一个运动向量候选者的信息。视频解码装置1700可以通过熵解码获得与指示来自合并候选者列表的运动向量候选者的信息对应的语法元素merge_idx。解码merge_idx的bin索引0(即,第一bin)所需的上下文信息可以是0。可以在旁路模式下解码merge_idx的其余bin。
因此,获得指示视频解码装置1700是否在合并运动向量差模式下执行预测的信息和指示来自合并候选者列表的运动向量候选者的信息所需的上下文信息的数量可以相同,即1。
需要一条上下文信息来获得与合并运动向量差的距离索引对应的语法元素mmvd_distance_idx的第一bin,并且可以在没有上下文信息的情况下在旁路模式下解码其余bin。可以在没有上下文信息的情况下在旁路模式下解码与合并运动向量差的方向索引对应的语法元素mmvd_direction_idx。
在下文中,将描述合并运动向量差模式与其他运动向量预测方法之间的相关性。
首先,将描述合并运动向量差模式与自适应运动向量分辨率(AMVR)模式之间的相关性。
在合并运动向量差模式中,当确定基本运动向量时,可以通过使用指示大小(诸如1/4、1/2、1、4、8、18、32、64或128像素单位)的索引来确定运动向量的分辨率。换句话说,当当前基本运动向量的水平方向分量和竖直方向分量被移动合并差分距离索引2时,可以解释水平方向分量和竖直方向分量基于1/4像素单位在视频解码装置1700中被移动1像素大小。
运动向量的分辨率可以通过在合并运动向量差模式下可用的多条合并候选者信息使用多个多重分辨率。多个分辨率不仅可以应用于这样的分辨率或像素单位的修改,而且还可以应用于基本运动向量本身。例如,可以将1/4、1/2、1、4、8、16、32、64和128像素单位的分辨率应用于基本运动向量本身。可以基于周围的信息(分辨率索引)隐式地确定运动向量的分辨率。替代地,可以在指示是否在合并运动向量差模式下执行预测的语法元素之前用信号通知单独的分辨率信息以确定基本运动向量的分辨率。
这里,运动向量差的大小可以被定义为分辨率距离的值。例如,当分辨率信息是1像素单位时,可以从(+1,0)、(-1,0)、(0,+1)和(0,-1)确定运动向量差的大小而无需单独的合并差分距离索引。作为另一示例,可以用信号通知合并差分距离索引N,并且可以将运动向量差的大小确定为分辨率的N倍。当索引为0时,运动向量差的大小可以是1像素,而当索引为1时,运动向量差的大小可以是2像素。替代地,可以用信号通知合并差分距离索引N,并且可以以对数尺度增加运动向量差的大小。
用信号通知的运动向量的分辨率信息可以在视频解码装置1700中广泛使用。例如,可以通过使用在较高级别(跳过模式或合并模式确定)中编码的分辨率信息四舍五入到最接近的整数来在AMVP模式下使用运动向量预测器。
此外,在自适应运动向量分辨率(AMVR)模式下,可以省略分辨率信息的发送,并且可以通过使用在当前跳过模式或者合并模式确定(较高级别)中编码的分辨率信息来确定要在AMVR模式下应用的分辨率信息。
在使用运动向量的模式预测模式中,可以共享较高级别的分辨率信息以被使用。另外,可以针对每种分辨率执行每种预测模式,并且可以用信号通知用于指示以哪种分辨率执行哪种预测模式的信息。
在AMVR模式下,可以将运动向量的分辨率设置为将运动向量差MVD的大小表示为1。
例如,视频解码装置1700可以通过获得AMVR索引来确定运动向量的分辨率,获得参考图片索引,并获得具有1、0或-1的值的运动向量差MVD的值。
作为另一示例,视频解码装置1700可以通过获得AMVR索引来确定运动向量的分辨率,通过使用相邻块的参考图片索引来确定当前块的参考图片索引,并获得具有1、0或-1的值的运动向量差MVD的值。
当在发送运动向量差的预测方法中运动向量的最大可表示分辨率为1/M像素单位,并且视频解码装置1700中可用的分辨率为1/N像素单位时,合并运动向量差模式的偏移值可以是比1/M更精确的分辨率。例如,当在运动向量差中可发送的运动向量的分辨率为1/4(四分之一)像素单位,并且可表示的分辨率(或运动向量的存储单位)为1/16像素单位时,可以将合并运动向量差模式的偏移值设置为比1/4像素单位更精确。
可以将可以是合并运动向量差模式的基本运动向量的运动向量候选者确定为在ATMVP等中使用的子块运动向量候选者中的代表性候选者。例如,可以将与中心位置对应的子块的运动向量或与子块运动向量候选者的左上位置对应的子块的运动向量确定为代表性候选者。
作为另一示例,可以从运动向量候选者排除可能是合并运动向量差模式的基本运动向量的子块候选者。因此,可以降低操作复杂度。
在下文中,将描述当在合并运动向量差模式下确定基本运动向量时是否使用ATMVP合并候选者。
在根据实施例的合并运动向量差模式下的基本运动向量首先从在合并模式下使用的合并候选者列表中确定。在根据另一实施例的合并运动向量差模式中,不仅可以从合并候选者列表中选择基本运动向量,还可以从ATMVP候选者中选择基本运动向量。可以在切片级别或更高级别(图片、序列、序列参数集(SPS)或图片参数集(PPS))中用信号通知指示是否通过使用合并运动向量差模式下的ATMVP候选者来预测运动向量的信息。
当在合并运动向量差模式下ATMVP候选者也可用时,需要生成合并候选者列表和ATMVP候选者列表的所有候选者。然而,当ATMVP候选者不可用时,视频解码装置1700不需要访问用于ATMVP的存储器并且不需要在时间方向上访问存储器来配置ATMVP候选者列表,在存储器访问方面可以实现高效率。
在下文中,将描述在切片级别中用信号通知用于合并运动向量差模式的信息的方法。
为了应用合并运动向量差模式,可以使用与指示L0、L1或双向预测方向的预测方向索引、合并候选者信息、合并差分距离索引和合并差分方向索引对应的语法元素。
用于语法元素的控制信息可以针对每个切片被发送到视频解码装置1700。
关于合并差分距离索引的数量的信息可以在切片级别中发送。该数量本身可以以FLC方法进行编码并用信号通知。例如,当合并差分距离索引的数量是8时,可以以3比特用信号通知该数量。
替代地,可以发送用于是否用信号通知默认设置或附加信息(使用的数量信息)的1比特。当使用的数量信息是0时,合并差分距离索引的数量是8,即,默认设置,并且当使用的数量信息是1时,关于附加地使用多少合并差分距离索引的信息可以在FLC方法中用信号通知。关于合并差分距离索引的设置的最大数量的信息可以以截断一元二进制(unarybinary)方法从对应的切片用信号通知。
这里,当存在在用信号通知合并差分距离索引的数量时经常出现的最佳数量时,可以将该最佳数量映射到索引。例如,可以确定最佳数量的4、8、2和1的组合,并且当以在合并差分距离索引的最佳数量中的前述顺序的出现频率较高时,可以以截断一元二进制方法进行编码。
可以在切片级别中用信号通知控制比特,该控制比特不仅与合并差分距离索引的最大数量信息的编码相关,而且与合并差分距离索引的顺序重新布置相关。控制比特也可以被确定为1比特,用于指示是使用默认顺序还是用信号通知的顺序。当控制比特为0时,该顺序被解释为1、2、4、8、16、32、64和128的默认顺序。但是,当控制比特为1时,可以附加地用信号通知关于顺序的信息。
根据实施例,当用信号通知关于顺序的信息时,可以就这样解码8个顺序,但是可以仅针对最常选择的前N个来解析关于顺序的信息。例如,当N为4时,仅对前4个数字执行顺序替换。在这种情况下,由于仅需要分析4个中的一个,因此可以通过借助2比特解析数字索引3次来验证前四个顺序。例如,当将10、11和00解析为数字索引时,可以解释2、3、0,并且可以推断剩余为1。然后,整个合并差分距离索引的实际解释的信息可以为2、3、0、1、4、5、6和7。换句话说,当在合并运动向量差模式下合并差分距离索引为1时,实际上解释合并差分距离为3。
N可以从2到8不同地确定,并且可以通过FLC或截断一元二进制方法进行编码。关于N的信息也可以被编码在切片级别中,或者可以被编码在更高级别(图片级别或序列级别)中。
还可以在切片级别或其更高级别中用信号通知关于使用的基本运动向量数量的信息。可以预先确定默认数量,并且可以用信号通知指示使用或更改该默认数量的比特。当该比特为1时,可以以FLC或截断一元二进制方法解码基本运动向量的数量。
还可以在切片级别或其更高级别中用信号通知关于使用的合并差分方向信息条的数量的信息。可以预先确定默认数量,并且可以用信号通知指示是否使用或更改默认数量的比特。当该比特为1时,可以以FLC或截断一元二进制方法解码基本运动向量的数量。当与相同的差分方向对应的默认数量是4时,解码指示基本运动向量的数量是否是默认数量的1比特,并且当基本运动向量的数量不是默认数量时,可以通过FLC或截断一元二进制方法解码关于该数量的信息。
上面的所有信息条可以由视频编码装置1900基于命中率(hit-ratio)信息来确定。可以根据时间层的ID针对每个ID处理合并差相关信息,或者可以与时间层无关地基于命中率信息确定合并差相关信息。
可以针对对其执行预测的当前块的每个大小应用不同最大数量或不同顺序的合并差分距离索引,并且可以在切片级别或其更高级别中确定是否针对当前块的每个大小应用不同最大数量或不同顺序的合并差分距离索引。
以上,已经描述了合并差相关信息的配置在切片级别中是可改变的。但是,可以在切片级别中确定合并运动向量差模式的启用/禁用。另外,还可以通过在切片级别中发送附加信息来用信号通知用于在特定大小或更小的块中不应用合并运动向量差模式的信息。此时,当当前块的宽度和长度小于特定阈值时或者当通过将宽度和长度相乘而计算出的面积小于特定阈值时,视频解码装置1700可以不解析合并差模式信息。
在下文中,将描述简化合并差相关信息的上下文信息的方法。
视频解码装置1700使用上下文信息执行熵解码,以解码与合并运动向量差模式相关的信息。
根据实施例的视频解码装置1700可以使用上下文信息来获得跳过模式下的合并差模式信息和合并模式下的合并差模式信息中的每一个。然而,可以通过使用相同的上下文信息来解码跳过模式下的合并差模式信息和合并模式下的合并差模式信息。
设置用于合并差模式信息的上下文自适应二进制算术编码(CABAC)的上下文的方法可以不同。例如,可以将上下文信息设置为小于一般跳过模式的比率,而不管量化参数(QP)如何。作为另一示例,因为随着QP减小使用合并运动向量差模式的概率增加,所以初始上下文信息可以被设置为小于或类似于跳过模式的比率。然而,当QP减小时,可以将合并运动向量差模式的概率设置为增加。
还可以通过使用跳过模式下的合并运动向量差模式、合并模式下的合并运动向量差模式以及用于在一般跳过模式和一般合并模式中的任一种下解码索引信息的上下文信息来解码合并候选者信息。
例如,用于解码在一般合并模式中使用的一般合并索引(指示合并候选者列表中的一个候选者的信息)的上下文信息和用于解码合并运动向量差信息的上下文信息可以不同。将合并索引设置成使得发生第0个索引的概率高,而合并运动向量差模式的合并候选者信息可以将第0个发生概率设置为小于50%,以提高算术编码的效率。
作为另一示例,可以将用于解码在使用多分辨率的预测模式下使用的分辨率信息的上下文信息应用于关于合并差分距离索引的信息。
可以通过使用关于在诸如AMVP和AMVR的其他帧间预测方法中使用的运动向量差信息的符号的上下文信息来获得合并差分方向索引。关于确定运动向量差的方向的语法元素,因为方向(-1,0)、(0,-1),(1,0)和(0,1)的发生概率具有均匀分布,所以可以在旁路模式下,即,以均匀的概率分布(0.5概率)解码CABAC,从而促进编码效率的提高和编解码器吞吐量的提高。
在下文中,将描述在低延迟B帧条件下应用合并运动向量差模式(LDB模式)的情况。
LDB模式表示其中B帧被限制为参考时间上相同方向的情况。在LDB模式下,即,当参考时间上在相同位置的参考图片时,合并运动向量差模式可以如下进行操作。在双向预测模式中,当两个基本运动向量在时间上都仅指示过去或将来时,合并运动向量差模式被如下应用。
i)尽管基本运动向量是用于双向预测的向量,但是可以忽略一个方向上的信息,并且可以将其余方向上的参考图片列表的运动信息用作基本运动向量。在这种情况下,附加地需要1比特,该1比特指示通过发送1比特来使用运动信息的哪个方向。
ii)使用B方向预测信息,但是一个方向上的基本运动向量被固定,而另一方向上的基本运动向量被更改并使用。
iii)将零运动向量添加到固定方向上运动信息,而其他过程与ii)相同。此时,参考图片索引为0,并且在最接近当前图片的图片处使用零运动向量。
iv)在LDB中,可以根据当前图片和参考图片之间的距离,即POC差,通过缩放来使用与合并差分距离索引对应的距离。换句话说,当POC距离差为4时,合并差分距离索引0(index0)为1(固定距离)。然而,当POC距离差为8时,合并差距离索引0表示2,即,固定距离的两倍。因此,可以基于POC距离差来参考更宽的区域,而不必利用在非常远的参考图片上预先确定的像素单位来确定运动向量差。
v)当在时间上相同方向上的参考图片不仅可以在LDB模式下使用,而且可以在一般B帧中使用时,可以相同地应用上述方法。
同时,上述本公开的实施例可以被编写为可以存储在介质中的计算机可执行程序。
介质可以持续地存储计算机可执行程序,或者临时地存储计算机可执行程序或用于执行或下载的指令。另外,该介质可以是其中组合了单件或多件硬件的各种记录介质或存储介质中的任何一种,并且该介质不限于直接连接到计算机系统的介质,而是可以分布在网络上。介质的示例包括诸如硬盘、软盘和磁带的磁介质;诸如CD-ROM和DVD的光学记录介质;诸如软光盘的磁光介质;以及ROM、RAM、和闪存,其被配置为存储程序指令。介质的其他示例包括记录介质和存储介质,其由分发应用的应用商店或提供或分发其他各种类型的软件的网站、服务器等管理。
尽管已经参考附图描述了本公开的一个或多个实施例,但是本领域普通技术人员将理解,可以在不脱离所附权利要求限定的精神和范围的情况下在其中进行形式和细节上的各种改变。

Claims (14)

1.一种视频解码方法,包括:
将当前块的预测模式确定为跳过模式和合并模式之一;
当要使用从所述当前块的合并候选者列表确定的运动向量和合并运动向量差时,通过应用一条上下文信息对比特流执行熵编码,获得指示所述合并候选者列表中的一个候选者的合并候选者信息;
基于所述合并候选者信息,确定来自从所述合并候选者列表确定的一个候选者的基本运动向量;和
通过使用所述当前块的合并运动向量差的距离索引和所述合并运动向量差的方向索引来确定所述当前块的运动向量,以使用所述基本运动向量和所述合并运动向量差。
2.根据权利要求1所述的视频解码方法,其中,将所述当前块的预测模式确定为所述跳过模式和所述合并模式之一包括:
当所述当前块的预测模式为所述跳过模式时,获得指示是否要使用从所述当前块的所述合并候选者列表确定的所述运动向量和所述合并运动向量差的合并差模式信息;和
当所述当前块的预测模式为所述合并模式时,获得指示是否要使用从所述当前块的所述合并候选者列表确定的所述运动向量和所述合并运动向量差的所述合并差模式信息,
其中,用于在所述跳过模式下获得所述合并差模式信息的上下文信息和用于在所述合并模式下获得所述合并差模式信息的上下文信息相同。
3.根据权利要求1所述的视频解码方法,其中,确定所述当前块的所述运动向量包括:通过经由旁路模式对所述比特流执行所述熵解码来获得指示所述合并运动向量差的所述方向索引的两个bin。
4.根据权利要求1所述的视频解码方法,其中,通过将所述一条上下文信息应用于所述比特流的所述熵解码来获得作为一比特的信息的所述合并候选者信息。
5.根据权利要求1所述的视频解码方法,其中,当在所述合并模式下执行预测时,获得指示所述合并候选者列表中的一个候选者的一般合并索引所需的上下文信息条的数量和获得所述合并候选者信息所需的上下文信息条的数量相同。
6.根据权利要求2所述的视频解码方法,其中,通过相同的语法元素来确定用于确定是否要在所述跳过模式和所述合并模式中使用从所述当前块的所述合并候选者列表确定的所述运动向量和所述合并运动向量差的合并差模式信息条。
7.一种视频解码装置,包括:
帧间预测信息获得器,被配置为将当前块的预测模式确定为跳过模式和合并模式之一,并且当要使用从所述当前块的合并候选者列表确定的运动向量和合并运动向量差时,通过应用一条上下文信息对比特流执行熵解码,获得指示所述合并候选者列表中的一个候选者的合并候选者信息;
帧间预测执行器,被配置为基于所述合并候选者信息从所述合并候选者列表中确定的一个候选者确定基本运动向量,并且通过使用所述当前块的合并运动向量差的距离索引和所述合并运动向量差的方向索引来确定所述当前块的运动向量,以使用所述基本运动向量和所述合并运动向量差;和
重构器,被配置为通过使用所述运动向量来重构所述当前块。
8.根据权利要求7所述的视频解码装置,其中,所述帧间预测信息获得器还被配置为:
当所述当前块的预测模式为所述跳过模式时,获得指示是否要使用从所述当前块的所述合并候选者列表确定的所述运动向量和所述合并运动向量差的合并差模式信息;和
当所述当前块的预测模式为所述合并模式时,获得指示是否要使用从所述当前块的所述合并候选者列表确定的所述运动向量和所述合并运动向量差的所述合并差模式信息,
其中,用于在所述跳过模式下获得所述合并差模式信息的上下文信息和用于在所述合并模式下获得所述合并差模式信息的上下文信息相同。
9.根据权利要求7所述的视频解码装置,其中,所述帧间预测信息获得器还被配置为:通过经由旁路模式对所述比特流执行所述熵解码来获得指示所述合并运动向量差的所述方向索引的两个bin。
10.根据权利要求7所述的视频解码装置,其中,帧间预测信息获得器还被配置为:通过将所述一条上下文信息应用于所述比特流的所述熵解码来获得作为一比特的信息的所述合并候选者信息。
11.根据权利要求7所述的视频解码装置,其中,当在所述合并模式下执行预测时,获得指示所述合并候选者列表中的一个候选者的一般合并索引所需的上下文信息条的数量和获得所述合并候选者信息所需的上下文信息条的数量相同。
12.根据权利要求8所述的视频解码装置,其中,通过相同的语法元素来确定用于确定是否要在所述跳过模式和所述合并模式中使用从所述当前块的所述合并候选者列表确定的所述运动向量和所述合并运动向量差的合并差模式信息条。
13.一种视频编码方法,包括:
当在跳过模式和合并模式之一下对当前块执行帧间预测时,确定是否要使用从所述当前块的合并候选者列表确定的基本运动向量和合并运动向量差;
当要使用所述合并运动向量差时,通过应用一条上下文信息对比特流进行熵编码,生成指示所述合并候选者列表中的一个基本运动向量的合并候选者信息;和
生成与所述基本运动向量和所述当前块的运动向量之间的差对应的所述合并运动向量差的距离索引,以及所述合并运动向量差的方向索引。
14.一种视频编码装置,包括:
帧间预测执行器,被配置为通过对当前块执行帧间预测来确定所述当前块的运动向量;和
帧间预测信息生成器,被配置为:当在跳过模式和合并模式之一下对所述当前块执行帧间预测时,确定是否要使用从所述当前块的合并候选者列表确定的基本运动向量和合并运动向量差,当要使用所述合并运动向量差时,通过应用一条上下文信息对比特流执行熵编码,生成指示所述合并候选者列表中的所述基本运动向量的合并候选者信息,并生成与所述基本运动向量和所述当前块的运动向量之间的差对应的所述合并运动向量差的距离索引,以及所述合并运动向量差的方向索引。
CN201980060787.1A 2018-09-17 2019-09-17 用于编码和解码运动信息的方法及用于编码和解码运动信息的装置 Active CN112889278B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862732224P 2018-09-17 2018-09-17
US62/732,224 2018-09-17
US201862743025P 2018-10-09 2018-10-09
US62/743,025 2018-10-09
PCT/KR2019/012000 WO2020060158A1 (ko) 2018-09-17 2019-09-17 움직임 정보의 부호화 및 복호화 방법, 및 움직임 정보의 부호화 및 복호화 장치

Publications (2)

Publication Number Publication Date
CN112889278A true CN112889278A (zh) 2021-06-01
CN112889278B CN112889278B (zh) 2024-04-05

Family

ID=69887588

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980060787.1A Active CN112889278B (zh) 2018-09-17 2019-09-17 用于编码和解码运动信息的方法及用于编码和解码运动信息的装置

Country Status (8)

Country Link
US (3) US11259044B2 (zh)
EP (1) EP3855738A4 (zh)
KR (2) KR20210106019A (zh)
CN (1) CN112889278B (zh)
BR (3) BR112021003300B1 (zh)
IL (2) IL280611B1 (zh)
MX (1) MX2021003135A (zh)
WO (1) WO2020060158A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023222016A1 (en) * 2022-05-17 2023-11-23 Mediatek Inc. Method and apparatus for complexity reduction of video coding using merge with mvd mode

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180043151A (ko) * 2016-10-19 2018-04-27 에스케이텔레콤 주식회사 영상 부호화 또는 복호화를 위한 장치 및 방법
CN111083491A (zh) 2018-10-22 2020-04-28 北京字节跳动网络技术有限公司 细化运动矢量的利用
WO2020098643A1 (en) 2018-11-12 2020-05-22 Beijing Bytedance Network Technology Co., Ltd. Simplification of combined inter-intra prediction
EP3861742A4 (en) * 2018-11-20 2022-04-13 Beijing Bytedance Network Technology Co., Ltd. DIFFERENCE CALCULATION BASED ON SPATIAL POSITION
CN113170186A (zh) * 2018-12-07 2021-07-23 夏普株式会社 运动图像解码装置
JP6933235B2 (ja) * 2018-12-13 2021-09-08 株式会社Jvcケンウッド 画像復号装置、画像復号方法、及び画像復号プログラム
KR20230156809A (ko) 2018-12-13 2023-11-14 가부시키가이샤 제이브이씨 켄우드 화상 복호 장치, 화상 복호 방법, 화상 복호 프로그램 기록 매체, 화상 부호화 장치, 화상 부호화 방법, 화상 부호화 프로그램 기록 매체, 격납 방법, 및 전송 방법
WO2020177756A1 (en) 2019-03-06 2020-09-10 Beijing Bytedance Network Technology Co., Ltd. Size dependent inter coding
EP3937489A4 (en) * 2019-03-08 2022-08-03 Jvckenwood Corporation MOVING PICTURE CODING DEVICE, MOVING PICTURE CODING METHOD, MOVING PICTURE CODING PROGRAM, MOVING PICTURE DECODING DEVICE, MOVING PICTURE DECODING METHOD, AND MOVING PICTURE DECODING PROGRAM
WO2023055199A1 (ko) * 2021-09-30 2023-04-06 한국전자통신연구원 영상 부호화/복호화를 위한 방법, 장치 및 기록 매체
WO2023132614A1 (ko) * 2022-01-04 2023-07-13 현대자동차주식회사 머지 모드를 개선하는 비디오 부호화/복호화 방법 및 장치
CN115086678B (zh) * 2022-08-22 2022-12-27 北京达佳互联信息技术有限公司 视频编码方法和装置、视频解码方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140023144A1 (en) * 2011-03-21 2014-01-23 Lg Electronics Inc. Method for selecting motion vector predictor and device using same
US20140146876A1 (en) * 2012-11-28 2014-05-29 JVC Kenwood Corporation Moving picture coding apparatus, moving picture coding method, moving picture coding program, and moving picture decoding apparatus
US20140169474A1 (en) * 2012-12-14 2014-06-19 Qualcomm Incorporated Disparity vector derivation
US20150181214A1 (en) * 2012-07-16 2015-06-25 Samsung Electronics Co., Ltd. Video encoding method and video encoding apparatus and video decoding method and video decoding apparatus for signaling sao parameters

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101809879B1 (ko) * 2011-09-28 2017-12-15 가부시키가이샤 제이브이씨 켄우드 동영상 인코딩 장치, 동영상 인코딩 방법 및 동영상 인코딩 프로그램을 저장한 기록매체
RU2710303C2 (ru) 2011-11-08 2019-12-25 Кт Корпорейшен Способ декодирования видеосигнала
KR102226893B1 (ko) * 2012-09-28 2021-03-11 엘지전자 주식회사 영상 복호화 방법 및 이를 이용하는 장치
WO2014107853A1 (en) * 2013-01-09 2014-07-17 Mediatek Singapore Pte. Ltd. Methods for disparity vector derivation
US10531116B2 (en) 2014-01-09 2020-01-07 Qualcomm Incorporated Adaptive motion vector resolution signaling for video coding
KR20170078672A (ko) 2014-10-31 2017-07-07 삼성전자주식회사 고정밀 스킵 부호화를 이용한 비디오 부호화 장치 및 비디오 복호화 장치 및 그 방법
WO2016195453A1 (ko) 2015-06-05 2016-12-08 한양대학교 산학협력단 영상 부호화 및 복호화 방법과 영상 복호화 장치
KR101782154B1 (ko) 2015-06-05 2017-09-26 인텔렉추얼디스커버리 주식회사 움직임 벡터 차분치를 이용하는 영상 부호화 및 복호화 방법과 영상 복호화 장치
WO2020043061A1 (en) * 2018-08-28 2020-03-05 FG Innovation Company Limited Device and method for coding video data

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140023144A1 (en) * 2011-03-21 2014-01-23 Lg Electronics Inc. Method for selecting motion vector predictor and device using same
US20150181214A1 (en) * 2012-07-16 2015-06-25 Samsung Electronics Co., Ltd. Video encoding method and video encoding apparatus and video decoding method and video decoding apparatus for signaling sao parameters
US20140146876A1 (en) * 2012-11-28 2014-05-29 JVC Kenwood Corporation Moving picture coding apparatus, moving picture coding method, moving picture coding program, and moving picture decoding apparatus
US20140169474A1 (en) * 2012-12-14 2014-06-19 Qualcomm Incorporated Disparity vector derivation

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SEMIH ESENLIK, IVAN KRASNOV, ZHIJIE ZHAO, JIANLE CHEN (HUAWEI), YUE LI (USTC): "CE9: DMVR with Motion Vector Difference Mirroring (Test 1.6)", JOINT VIDEO EXPERTS TEAM (JVET)OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 11TH MEETING: LJUBLJANA, SI, 10–18 JULY 2018 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023222016A1 (en) * 2022-05-17 2023-11-23 Mediatek Inc. Method and apparatus for complexity reduction of video coding using merge with mvd mode

Also Published As

Publication number Publication date
EP3855738A1 (en) 2021-07-28
BR112021003300A2 (pt) 2021-05-11
WO2020060158A1 (ko) 2020-03-26
BR112021003300B1 (pt) 2024-02-06
EP3855738A4 (en) 2022-07-20
KR20200134324A (ko) 2020-12-01
KR20210106019A (ko) 2021-08-27
KR102292620B1 (ko) 2021-08-24
US11956468B2 (en) 2024-04-09
BR122022004561B1 (pt) 2024-02-06
US11259044B2 (en) 2022-02-22
IL311160A (en) 2024-04-01
MX2021003135A (es) 2021-05-14
US20210329292A1 (en) 2021-10-21
CN112889278B (zh) 2024-04-05
US20240073446A1 (en) 2024-02-29
IL280611A (en) 2021-03-25
BR122022004567B1 (pt) 2024-02-06
US20220141484A1 (en) 2022-05-05
IL280611B1 (en) 2024-04-01

Similar Documents

Publication Publication Date Title
CN112889278B (zh) 用于编码和解码运动信息的方法及用于编码和解码运动信息的装置
KR102658887B1 (ko) 움직임 벡터 차분값을 이용한 비디오 부호화 및 복호화 방법, 및 움직임 정보의 부호화 및 복호화 장치
KR102408258B1 (ko) 움직임 정보의 부호화 및 복호화 방법, 및 움직임 정보의 부호화 및 복호화 장치
KR102366260B1 (ko) 움직임 정보의 부호화 및 복호화 방법, 및 움직임 정보의 부호화 및 복호화 장치
KR102349457B1 (ko) 움직임 벡터 차분의 부호화 방법 및 부호화 장치, 및 움직임 벡터 차분의 복호화 방법 및 복호화 장치
KR102494697B1 (ko) 삼각 예측 모드를 이용하는 영상 부호화 장치 및 영상 복호화 장치, 및 이에 의한 영상 부호화 방법 및 영상 복호화 방법
KR102657549B1 (ko) 양자화 파라미터를 획득하기 위한 비디오 복호화 방법 및 장치, 양자화 파라미터를 전송하기 위한 비디오 부호화 방법 및 장치
KR20200098520A (ko) 움직임 정보의 부호화 및 복호화 방법, 및 움직임 정보의 부호화 및 복호화 장치
KR20210012038A (ko) 타일 및 타일 그룹을 이용하는 비디오 부호화 및 복호화 방법, 타일 및 타일 그룹을 이용하는 비디오 부호화 및 복호화 장치
KR102332529B1 (ko) 주변 움직임 정보를 이용하여 움직임 정보를 부호화 및 복호화하는 장치, 및 방법
KR102516068B1 (ko) 부호화 순서를 고려하여 어파인 모델 기반의 예측을 수행하는 비디오 부호화 방법 및 그 장치, 복호화 순서를 고려하여 어파인 모델 기반의 예측을 수행하는 비디오 복호화 방법 및 그 장치
KR20210122818A (ko) 영상의 부호화 및 복호화 장치, 및 이에 의한 영상의 부호화 및 복호화 방법
CN114097226A (zh) 基于视频尺寸编码视频的方法和设备,以及基于视频尺寸解码视频的方法和设备
KR102297479B1 (ko) 움직임 벡터의 부호화 장치 및 방법, 및 움직임 벡터의 복호화 장치 및 방법
KR20210042809A (ko) 툴 세트를 이용하는 영상 복호화 장치 및 이에 의한 영상 복호화 방법, 및 영상 부호화 장치 및 이에 의한 영상 부호화 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant