CN109845253B - 一种用于对二维视频进行解码、编码的方法 - Google Patents

一种用于对二维视频进行解码、编码的方法 Download PDF

Info

Publication number
CN109845253B
CN109845253B CN201780061263.5A CN201780061263A CN109845253B CN 109845253 B CN109845253 B CN 109845253B CN 201780061263 A CN201780061263 A CN 201780061263A CN 109845253 B CN109845253 B CN 109845253B
Authority
CN
China
Prior art keywords
block
merge candidate
candidate list
merge
current block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780061263.5A
Other languages
English (en)
Other versions
CN109845253A (zh
Inventor
李培根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KT Corp
Original Assignee
KT Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KT Corp filed Critical KT Corp
Priority to CN202311060087.7A priority Critical patent/CN116866570A/zh
Priority to CN202311055763.1A priority patent/CN116866564A/zh
Priority to CN202311058091.XA priority patent/CN116866567A/zh
Priority to CN202311058472.8A priority patent/CN116866568A/zh
Priority to CN202311059570.3A priority patent/CN116866569A/zh
Priority to CN202311054506.6A priority patent/CN116847068A/zh
Publication of CN109845253A publication Critical patent/CN109845253A/zh
Application granted granted Critical
Publication of CN109845253B publication Critical patent/CN109845253B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Abstract

根据本发明的用于对视频进行解码的方法可以包括以下步骤:根据与当前块相邻的第一空间相邻块和与第一空间相邻块相邻的第二空间相邻块中的至少之一导出当前块的空间合并候选;生成包括空间合并候选的合并候选列表;以及使用合并候选列表执行对当前块的运动补偿。

Description

一种用于对二维视频进行解码、编码的方法
技术领域
本发明涉及用于处理视频信号的方法和装置。
背景技术
近来,在各种应用领域中对高分辨率和高质量图像例如高清晰度(HD)图像和超高清晰度(UHD)图像的需求已经增加了。然而,与常规图像数据相比,更高分辨率和质量的图像数据的数据量增加。因此,在通过使用介质例如常规的有线和无线宽带网络传输图像数据时,或者在通过使用常规的存储介质存储图像数据时,传输和存储的成本增加了。为了解决随着图像数据的分辨率和质量的提高而出现的这些问题,可以利用高效的图像编码/解码技术。
图像压缩技术包括各种技术,包括:根据当前图片的先前图片或后续图片来对包括在当前图片中的像素值进行预测的帧间预测技术;通过使用当前图片中的像素信息对包括在当前图片中的像素值进行预测的帧内预测技术;将短代码分配给出现频率高的值并且将长代码分配给出现频率低的值的熵编码技术等。可以通过使用这样的图像压缩技术来有效地压缩图像数据,并且可以传输或存储图像数据。
同时,随着对高分辨率图像的需求的增加,对作为新的图像服务的立体图像内容的需求也在增加。正在讨论用于有效地提供具有高分辨率和超高分辨率的立体图像内容的视频压缩技术。
发明内容
技术问题
本发明的目的是提供一种用于在对视频信号进行编码/解码时有效地执行编码/解码目标块的帧间预测的方法和装置。
本发明的目的是提供一种用于在对视频信号进行编码/解码时基于具有预定形状或预定大小的块来导出合并候选的方法和装置。
本发明的目的是提供一种用于在对视频信号进行编码/解码时以预定形状或预定大小为单位并行执行合并的方法和装置。
本发明的目的是提供一种用于在对视频信号进行编码/解码时通过不仅使用位于预定位置的块而且使用与该块相邻的块来导出合并候选的方法和装置。
本发明要实现的技术目的不限于上述技术问题。并且,本领域技术人员根据以下描述将明显地理解未提及的其他技术问题。
技术方案
根据本发明的用于对视频信号进行解码的方法和装置可以根据与当前块相邻的第一空间相邻块或与第一空间相邻块相邻的第二空间相邻块中的至少之一导出当前块的空间合并候选,生成包括空间合并候选的合并候选列表,以及通过使用合并候选列表来执行对当前块的运动补偿。
根据本发明的用于对视频信号进行编码的方法和装置可以根据与当前块相邻的第一空间相邻块或与第一空间相邻块相邻的第二空间相邻块中的至少之一导出当前块的空间合并候选,生成包括空间合并候选的合并候选列表,以及通过使用合并候选列表来执行对当前块的运动补偿。
在根据本发明的用于对视频信号进行编码/解码的方法和装置中,第二空间相邻块可以位于相对于第一空间相邻块的预定位置处。
在根据本发明的用于对视频信号进行编码/解码的方法和装置中,可以根据第一空间相邻块的位置而不同地确定预定位置。
在根据本发明的用于对视频信号进行编码/解码的方法和装置中,如果第一空间相邻块不可用,则可以根据第二空间相邻块导出空间合并候选。
在根据本发明的用于对视频信号进行编码/解码的方法和装置中,导出空间合并候选可以包括通过按顺序地搜索第一空间相邻候选块和第二空间相邻候选块来导出至少一个空间合并候选。
在根据本发明的用于对视频信号进行编码/解码的方法和装置中,生成合并候选列表可以包括:生成包括根据第一空间相邻候选块导出的第一空间合并候选的第一合并候选列表;以及生成包括根据第二空间相邻候选块导出的第二空间合并候选的第二合并候选列表。
在根据本发明的用于对视频信号进行编码/解码的方法和装置中,可以通过使用第一合并候选列表和第二合并候选列表中之一来执行对当前块的运动补偿。
在根据本发明的用于对视频信号进行编码/解码的方法和装置中,可以基于通过将第一合并候选列表和第二合并候选列表进行组合而生成的组合合并候选列表来执行对当前块的运动补偿。
以上对本发明简要概述的特征仅是本发明的随后的详细描述的说明性方面,而不限制本发明的范围。
有益效果
根据本发明,可以对编码/解码目标块执行有效的帧间预测。
根据本发明,可以基于具有预定形状或预定大小的块来导出合并候选。
根据本发明,可以以预定形状或预定大小为单位并行执行合并。
根据本发明,可以通过不仅使用预定位置处的块而且使用与该块相邻的块来导出合并候选来增强帧间预测的效率。
能够通过本发明获得的效果不限于上述效果,并且本领域技术人员可以根据以下描述清楚地理解未提及的其他效果。
附图说明
图1是示出根据本发明的实施方式的用于对视频进行编码的装置的框图。
图2是示出根据本发明的实施方式的用于对视频进行解码的装置的框图。
图3是示出根据本发明的实施方式的基于树结构来分层次地分割编码块的示例的图。
图4是示出根据本发明的实施方式的允许基于二叉树的分割的分割类型的图。
图5是示出根据本发明的实施方式的仅允许预定类型的基于二叉树的分割的示例的图。
图6是用于说明根据应用本发明的实施方式的对与可允许的二叉树分割次数有关的信息进行编码/解码的示例的图。
图7是示出根据本发明的实施方式的可应用于编码块的分割模式的图。
图8是示出根据本发明的实施方式的帧间预测方法的流程图。
图9是示出当将合并模式应用于当前块时导出当前块的运动信息的过程的图。
图10示出了当AMVP模式应用于当前块时导出当前块的运动信息的过程。
图11是示出当前块的空间合并候选的图。
图12是示出当前块的共同定位块(co-located block)的图。
图13是用于示出通过对共同定位块的运动矢量进行缩放来获得时间合并候选的运动矢量的示例的图。
图14是示出基于正方形块导出非正方形块的合并候选的示例的图。
图15是用于示出基于上节点块导出二叉树分割块的合并候选的示例的图。
图16是示出根据合并估计区域确定空间合并候选的可用性的示例的图。
图17是示出将与不可用作空间合并候选的相邻块相邻的块用作当前块的空间合并候选的示例的图。
图18至图21是示出合并候选的搜索顺序的图。
图22是示出根据应用本发明的实施方式的获得残差样本的处理的流程图。
具体实施方式
可以对本发明进行各种修改,并且存在本发明的各种实施方式,现在将参照附图提供各种实施方式的示例,并且详细描述各种实施方式的示例。然而,本发明不限于此,并且示例性实施方式可以被解释为包括本发明的技术构思和技术范围内的所有修改、等同物或替代方案。在所描述的附图中,相似的附图标记指代相似的元件。
说明书中使用的术语“第一”、“第二”等可以用于描述各种部件,但是这些部件不被解释为限制于这些术语。这些术语仅用于区分一个部件与其他部件。例如,在不偏离本发明的范围的情况下,“第一”部件可以被称为“第二”部件,并且“第二”部件也可以类似地被称为“第一”部件。术语“和/或”包括多个项的组合或者多个术语中的任何一个术语。
应该理解的是,在本说明书中,在元件被简单地称为“连接至”或“耦接至”另一元件而不是“直接连接至”或“直接耦接至”另一元件时,该元件可以“直接连接至”或“直接耦接至”另一元件,或者该元件可以连接至或耦接至另一元件并且有其他元件介于在它们之间。相反地,应该理解的是,在元件被称为“直接耦接”或“直接连接”至另一元件时,不存在中间元件。
本说明书中使用的术语仅用于描述特定实施方式,而并不意在限制本发明。以单数形式使用的表述包含复数形式的表述,除非其在上下文中具有明显不同的含义。在本说明书中,应当理解的是,诸如“包括”、“具有”等的术语意在指示本说明书中公开的特征、数字、步骤、动作、元件、部分或其组合的存在,并且不意在排除可以存在或可以添加一个或更多个其他特征、数字、步骤、动作、元件、部分或其组合的可能性。
在下文中,将参照附图详细描述本发明的优选实施方式。在下文中,附图中的相同构成元件由相同的附图标记表示,并且将省略对相同元件的重复描述。
图1是示出根据本发明的实施方式的用于对视频进行编码的装置的框图。
参照图1,用于对视频进行编码的装置100可以包括:图片分割模块110、预测模块120和125、变换模块130、量化模块135、重排模块160、熵编码模块165、逆量化模块140、逆变换模块145、滤波器模块150以及存储器155。
图1中所示的构成部分被独立地示出,以表示在用于对视频进行编码的装置中的彼此不同的特征功能。因此,这并不意味着每个构成部分都是由单独的硬件或软件的构成单元构成。换言之,为了方便起见,每个构成部分包括所列举的构成部分中的每一个。因此,可以将每个构成部分的至少两个构成部分进行组合以形成一个构成部分,或者可以将一个构成部分划分成多个构成部分以执行每个功能。在不偏离本发明的实质的情况下,组合每个构成部分的实施方式和划分一个构成部分的实施方式也被包括在本发明的范围内。
此外,构成部分中的一些可能不是执行本发明的基本功能的必不可少的构成部分,而是仅用于改善本发明的性能的可选构成部分。可以通过排除用于改善性能的构成部分而仅包括用于实现本发明的实质的必不可少的构成部分来实现本发明。排除仅用于改善性能的可选构成部分而仅包括必不可少的构成部分的结构也被包括在本发明的范围内。
图片分割模块110可以将输入图片分割成一个或更多个处理单元。此处,处理单元可以是预测单元(PU)、变换单元(TU)或编码单元(CU)。图片分割模块110可以将一个图片分割成多个编码单元、预测单元和变换单元的组合,并且可以通过使用预定准则(例如,成本函数)选择编码单元、预测单元和变换单元的一个组合来对图片进行编码。
例如,一个图片可以被分割成多个编码单元。可以使用递归树结构例如四叉树结构来将图片分割成编码单元。在一个图片或最大编码单元作为根的情况下被分割成其他编码单元的编码单元可以以子节点对应于所分割的编码单元的数目的方式进行分割。通过预定限制不能再分割的编码单元用作叶节点。即,当假设对于一个编码单元仅正方形分割可行时,一个编码单元可以最多被分割成四个其他编码单元。
在下文中,在本发明的实施方式中,编码单元(coding unit)可以意指执行编码的单元或者执行解码的单元。
预测单元可以是被分割成在单个编码单元中具有相同大小的正方形形状或矩形形状的分区中之一,或者预测单元可以是被分割成使得在单个编码单元中具有不同的形状/大小的分区中之一。
当基于编码单元生成经受帧内预测的预测单元并且编码单元不是最小编码单元时,可以在不将编码单元分割成多个预测单元N×N的情况下执行帧内预测。
预测模块120和125可以包括执行帧间预测的帧间预测模块120和执行帧内预测的帧内预测模块125。可以确定对于预测单元是执行帧间预测还是帧内预测,并且可以确定根据每个预测方法的详细信息(例如,帧内预测模式、运动矢量、参考图片等)。此处,经受预测的处理单元可以不同于针对其确定预测方法和详细内容的处理单元。例如,可以由预测单元确定预测方法、预测模式等,并且可以由变换单元执行预测。所生成的预测块与原始块之间的残差值(残差块)可以被输入至变换模块130。此外,用于预测的预测模式信息、运动矢量信息等可以与残差值一起由熵编码模块165进行编码,并且可以被传输至用于对视频进行解码的装置。在使用特定编码模式时,可以通过对原始块按其原样进行编码而不通过预测模块120和125生成预测块来向用于对视频进行解码的装置进行传输。
帧间预测模块120可以基于当前图片的先前图片或后续图片中的至少一个的信息来预测预测单元,或者在一些情况下,可以基于当前图片中的一些编码区域的信息来预测预测单元。帧间预测模块120可以包括参考图片插值模块、运动预测模块以及运动补偿模块。
参考图片插值模块可以从存储器155接收参考图片信息,并且可以根据参考图片来生成整像素(integer pixel)的或小于整像素的像素信息。在亮度像素的情况下,可以使用具有不同滤波器系数的基于DCT的8抽头插值滤波器来以1/4像素为单位生成整像素的或小于整像素的像素信息。在色度信号的情况下,可以使用具有不同滤波器系数的基于DCT的4抽头插值滤波器来以1/8像素为单位生成整像素的或小于整像素的像素信息。
运动预测模块可以基于由参考图片插值模块进行插值的参考图片来执行运动预测。作为用于计算运动矢量的方法,可以使用各种方法,例如,基于全搜索的块匹配算法(FBMA)、三步搜索(TSS)和新三步搜索算法(NTS)等。基于插值像素,运动矢量可以具有以1/2像素或1/4像素为单位的运动矢量值。运动预测模块可以通过改变运动预测方法来预测当前预测单元。作为运动预测方法,可以使用各种方法,例如,跳过方法、合并方法、AMVP(高级运动矢量预测)方法、帧内块复制方法等。
帧内预测模块125可以基于作为当前图片中的像素信息的与当前块相邻的参考像素信息来生成预测单元。在当前预测单元的相邻块是经受帧间预测的块并且因此参考像素是经受帧间预测的像素时,可以使用经受帧内预测的相邻块的参考像素信息来替换包括在经受帧间预测的块中的参考像素。即,在参考像素不可用时,可以使用可用参考像素中的至少一个参考像素来替换不可用的参考像素信息。
帧内预测中的预测模式可以包括依赖于预测方向使用参考像素信息的方向性预测模式和在执行预测时不使用方向信息的非方向性预测模式。用于预测亮度信息的模式可以与用于预测色度信息的模式不同,并且为了预测色度信息,可以利用用于预测亮度信息的帧内预测模式信息或者预测的亮度信号信息。
在执行帧内预测时,在预测单元的大小与变换单元的大小相同时,可以基于位于该预测单元的左侧、左上侧和顶部的像素对预测单元执行帧内预测。然而,在执行帧内预测时,在预测单元的大小与变换单元的大小不同时,可以使用基于变换单元的参考像素来执行帧内预测。此外,使用N×N分割的帧内预测可以仅用于最小编码单元。
在帧内预测方法中,可以在依赖于预测模式将AIS(自适应帧内平滑)滤波器应用于参考像素之后生成预测块。应用于参考像素的AIS滤波器的类型可以变化。为了执行帧内预测方法,可以根据与当前预测单元相邻的预测单元的帧内预测模式来预测当前预测单元的帧内预测模式。在通过使用根据相邻预测单元预测到的模式信息来预测当前预测单元的预测模式中,在当前预测单元的帧内预测模式与相邻预测单元的帧内预测模式相同时,可以使用预定标志信息来传输指示当前预测单元的预测模式与相邻预测单元的预测模式彼此相同的信息。在当前预测单元的预测模式与相邻预测单元的预测模式不同时,可以执行熵编码以对当前块的预测模式信息进行编码。
此外,可以基于由预测模块120和125生成的预测单元来生成包括关于残差值的信息的残差块,残差值是经受预测的预测单元与预测单元的原始块之间的差异。可以将所生成的残差块输入到变换模块130。
变换模块130可以通过使用诸如离散余弦变换(Discrete Cosine Transform,DCT)、离散正弦变换(Discrete Sine Transform,DST)和KLT的变换方法来对残差块进行变换,该残差块包括关于原始块与由预测模块120和125生成的预测单元之间的残差值的信息。可以基于用于生成残差块的预测单元的帧内预测模式信息来确定是应用DCT、DST还是KLT以对残差块进行变换。
量化模块135可以对由变换模块130变换到频域的值进行量化。量化系数可以依赖于块或图片的重要性而变化。可以将由量化模块135计算的值提供至逆量化模块140和重排模块160。
重排模块160可以对量化后的残差值的系数进行重排。
重排模块160可以通过系数扫描方法将二维块形式的系数改变成一维矢量形式的系数。例如,重排模块160可以使用锯齿形扫描方法从DC系数扫描至高频域的系数,以将系数改变成一维矢量形式。依赖于变换单元的大小和帧内预测模式,可以使用沿列方向扫描二维块形式的系数的竖直方向扫描或沿行方向扫描二维块形式的系数的水平方向扫描来代替锯齿形扫描。即,可以依赖于变换单元的大小和帧内预测模式来确定使用锯齿形扫描、竖直方向扫描和水平方向扫描中的哪种扫描方法。
熵编码模块165可以基于由重排模块160计算的值来执行熵编码。熵编码可以使用各种编码方法,例如指数哥伦布(Golomb)编码、上下文自适应变长编码(CAVLC)和上下文自适应二进制算术编码(CABAC)。
熵编码模块165可以对来自重排模块160以及预测模块120和125的各种信息进行编码,各种信息例如编码单元的残差值系数信息和块类型信息、预测模式信息、分割单元信息、预测单元信息、变换单元信息、运动矢量信息、参考帧信息、块插值信息、滤波信息等。
熵编码模块165可以对从重排模块160输入的编码单元的系数进行熵编码。
逆量化模块140可以对由量化模块135量化的值进行逆量化,并且逆变换模块145可以对由变换模块130变换的值进行逆变换。可以将由逆量化模块140和逆变换模块145生成的残差值与由预测模块120和125的运动估计模块、运动补偿模块和帧内预测模块预测的预测单元进行组合,使得可以生成重构块。
滤波器模块150可以包括去块滤波器、偏移校正单元以及自适应环路滤波器(ALF)中的至少一个。
去块滤波器可以移除由于重构图片中的块之间的边界而出现的块失真。为了确定是否执行去块,包括在块的若干行或若干列中的像素可以是确定是否对当前块应用去块滤波器的基础。当去块滤波器被应用于块时,可以依赖于所需的去块滤波强度来应用强滤波器或弱滤波器。此外,在应用去块滤波器时,可以并行地处理水平方向滤波和竖直方向滤波。
偏移校正模块可以在经受去块的图片中以像素为单位来校正与原始图片的偏移。为了对特定图片执行偏移校正,可以使用考虑每个像素的边缘信息来施加偏移的方法,或者可以使用下述方法:将图片的像素分割成预定数量的区域,确定要经受偏移的区域,并且对所确定的区域施加偏移。
可以基于通过将滤波后的重构图片与原始图片进行比较而获得的值来执行自适应环路滤波(ALF)。可以将包括在图片中的像素分成预定组,可以确定要应用于每个组的滤波器,并且可以针对每个组单独执行滤波。可以通过编码单元(CU)传输关于是否应用ALF和亮度信号的信息。用于ALF的滤波器的形状和滤波器系数可以依赖于每个块而变化。此外,无论应用目标块的特征如何,都可以应用用于ALF的相同形状(固定形状)的滤波器。
存储器155可以存储通过滤波器模块150计算的重构块或重构图片。可以在执行帧间预测时将所存储的重构块或重构图片提供至预测模块120和125。
图2是示出根据本发明的实施方式的用于对视频进行解码的装置的框图。
参照图2,用于对视频进行解码的装置200可以包括:熵解码模块210、重排模块215、逆量化模块220、逆变换模块225、预测模块230和235、滤波器模块240以及存储器245。
当从用于对视频进行编码的装置输入视频比特流时,可以根据用于对视频进行编码的装置的逆处理来对输入比特流进行解码。
熵解码模块210可以根据由用于对视频进行编码的装置的熵编码模块进行的熵编码的逆处理来执行熵解码。例如,对应于由用于对视频进行编码的装置执行的方法,可以应用各种方法,例如指数哥伦布编码、上下文自适应变长编码(CAVLC)和上下文自适应二进制算术编码(CABAC)。
熵解码模块210可以对关于由用于对视频进行编码的装置执行的帧内预测和帧间预测的信息进行解码。
重排模块215可以基于在用于对视频进行编码的装置中使用的重排方法对由熵解码模块210进行熵解码的比特流执行重排。重排模块可以将一维矢量形式的系数重构和重排成二维块形式的系数。重排模块215可以接收与在用于对视频进行编码的装置中执行的系数扫描有关的信息,并且可以经由基于在用于对视频进行编码的装置中执行的扫描顺序对系数进行逆扫描的方法来执行重排。
逆量化模块220可以基于从用于对视频进行编码的装置接收的量化参数和重排后的块的系数来执行逆量化。
逆变换模块225可以执行逆变换,即,逆DCT、逆DST和逆KLT,这是由变换模块对用于对视频进行编码的装置的量化结果执行的变换即DCT、DST和KLT的逆过程。可以基于用于对视频进行编码的装置所确定的变换单元来执行逆变换。用于对视频进行解码的装置的逆变换模块225可以依赖于多条信息例如预测方法、当前块的大小、预测方向等来选择性地执行变换方案例如DCT、DST、KLT。
预测模块230和235可以基于从熵解码模块210接收到的关于预测块生成的信息和从存储器245接收到的先前解码的块或图片信息来生成预测块。
如上所述,类似于用于对视频进行编码的装置的操作,在执行帧内预测时,在预测单元的大小与变换单元的大小相同时,可以基于位于预测单元的左侧、左上侧和顶部的像素对预测单元执行帧内预测。在执行帧内预测时,在预测单元的大小与变换单元的大小不同时,可以使用基于变换单元的参考像素来执行帧内预测。此外,使用N×N分割的帧内预测可以仅用于最小编码单元。
预测模块230和235可以包括预测单元确定模块、帧间预测模块以及帧内预测模块。预测单元确定模块可以从熵解码模块210接收各种信息,例如预测单元信息、帧内预测方法的预测模式信息、关于帧间预测方法的运动预测的信息等,可以将当前编码单元分成预测单元,并且可以确定对预测单元执行帧间预测还是帧内预测。通过使用从用于对视频进行编码的装置接收的当前预测单元的帧间预测所需的信息,帧间预测模块230可以基于包括当前预测单元的当前图片的先前图片或后续图片中的至少一个的信息来对当前预测单元执行帧间预测。替选地,可以基于包括当前预测单元的当前图片中的一些预先重构区域的信息来执行帧间预测。
为了执行帧间预测,可以针对编码单元来确定跳过模式、合并模式、AMVP模式和帧间块复制模式中的哪一个模式用作包括在编码单元中的预测单元的运动预测方法。
帧内预测模块235可以基于当前图片中的像素信息来生成预测块。当预测单元是经受帧内预测的预测单元时,可以基于从用于对视频进行编码的装置接收到的预测单元的帧内预测模式信息来执行帧内预测。帧内预测模块235可以包括自适应帧内平滑(AIS)滤波器、参考像素插值模块以及DC滤波器。AIS滤波器对当前块的参考像素执行滤波,并且可以依赖于当前预测单元的预测模式来确定是否应用滤波器。可以通过使用从用于对视频进行编码的装置接收到的预测单元的预测模式和AIS滤波器信息来对当前块的参考像素执行AIS滤波。在当前块的预测模式是不执行AIS滤波的模式时,可以不应用AIS滤波器。
在预测单元的预测模式是基于通过对参考像素进行插值而获得的像素值来执行帧内预测的预测模式时,参考像素插值模块可以对参考像素进行插值以生成整像素的或小于整像素的参考像素。在当前预测单元的预测模式是在不对参考像素进行插值的情况下生成预测块的预测模式时,可以不对参考像素进行插值。在当前块的预测模式是DC模式时,DC滤波器可以通过滤波来生成预测块。
可以将重构块或重构图片提供至滤波器模块240。滤波器模块240可以包括去块滤波器、偏移校正模块以及ALF。
可以从用于对视频进行编码的装置接收关于是否将去块滤波器应用于相应的块或图片的信息以及关于在应用去块滤波器时应用强滤波器和弱滤波器中的哪个滤波器的信息。用于对视频进行解码的装置的去块滤波器可以从用于对视频进行编码的装置接收关于去块滤波器的信息,并且可以对相应的块执行去块滤波。
偏移校正模块可以基于在执行编码时应用于图片的偏移校正的类型和偏移值信息来对重构图片执行偏移校正。
可以基于从用于对视频进行编码的装置接收到的关于是否应用ALF的信息和ALF系数信息等来将AFL应用于编码单元。ALF信息可以被提供为被包括在特定参数集中。
存储器245可以存储重构图片或重构块以用作参考图片或参考块,并且可以将重构图片提供至输出模块。
如上面描述的,在本发明的实施方式中,为了便于说明,编码单元被用作表示用于编码的单元的术语,然而,编码单元可以用作执行解码以及编码的单元。
另外,当前块可以表示要进行编码/解码的目标块。并且,依赖于编码/解码步骤,当前块可以表示编码树块(或编码树单元)、编码块(或编码单元)、变换块(或变换单元)、预测块(或预测单元)等。
可以通过将图片分割成具有正方形或非正方形形状的基本块来对图片进行编码/解码。此时,基本块可以称为编码树单元。编码树单元可以被定义为序列或片(slice)内允许的最大大小的编码单元。可以通过序列参数集、图片参数集或片头(slice header)来用信号通知关于编码树单元是具有正方形形状还是具有非正方形形状的信息或者关于编码树单元的大小的信息。编码树单元可以被分割成更小大小的分区。此时,如果假设通过划分编码树单元而生成的分区深度是1,则通过划分具有深度1的分区而生成的分区深度可以被定义为2。即,通过划分编码树单元中的深度为k的分区而生成的分区可以被定义为具有深度k+1。
通过划分编码树单元而生成的任意大小的分区可以被定义为编码单元。编码单元可以被递归地划分或划分成用于执行预测、量化、变换或环路滤波等的基本单元。例如,通过划分编码单元而生成的任意大小的分区可以被定义为编码单元,或者可以被定义为变换单元或预测单元,该编码单元、变换单元或预测单元是用于执行预测、量化、变换或环路滤波等的基本单元。
可以基于竖直线和水平线中的至少之一来执行编码树单元或编码单元的分割。另外,分割编码树单元或编码单元的竖直线或水平线的数量可以是至少一个或更多个。例如,可以使用一个竖直线或一个水平线将编码树单元或编码单元划分成两个分区,或者可以使用两个竖直线或两个水平线将编码树单元或编码单元划分成三个分区。替选地,可以通过使用一个竖直线和一个水平线将编码树单元或编码单元分割成具有1/2的长度和宽度的四个分区。
在使用至少一个竖直线或至少一个水平线将编码树单元或编码单元分割为多个分区时,分区可具有统一的大小或不同的大小。替选地,任何一个分区可以具有与其余分区不同的大小。
在下面描述的实施方式中,假设编码树单元或编码单元被划分成四叉树结构或二叉树结构。然而,还可以使用更多数量的竖直线或更多数量的水平线来划分编码树单元或编码单元。
图3是示出根据本发明的实施方式的基于树结构来分层次地分割编码块的示例的图。
以预定的块单元对输入的视频信号进行解码。用于对输入的视频信号进行解码的这样的默认单元是编码块(coding block)。编码块可以是执行帧内/帧间预测、变换以及量化的单元。另外,以编码块为单位确定预测模式(例如,帧内预测模式或帧间预测模式),并且包括在编码块中的预测块可以共享所确定的预测模式。编码块可以是具有在8×8至64×64范围内的任意大小的正方形块或非正方形块,或者可以是具有128×128、256×256或更大的大小的正方形块或非正方形块。
具体地,可以基于四叉树和二叉树中的至少一个来分层次地分割编码块。此处,基于四叉树的分割可以意指将2N×2N的编码块分割成四个N×N的编码块,并且基于二叉树的分割可以意指将一个编码块分割成两个编码块。即使执行基于二叉树的分割,也可以在较低深度中存在正方形形状的编码块。
可以对称地或者非对称地执行基于二叉树的分割。此外,基于二叉树分割的编码块可以是正方形块或非正方形块,例如长方形形状。例如,允许基于二叉树的分割的分割类型可以包括2N×N(水平方向非正方形编码单元)或N×2N(竖直方向非正方形编码单元)的对称类型、nL×2N、nR×2N、2N×nU或2N×nD的非对称类型中的至少之一。
可以将基于二叉树的分割限制地允许为对称类型分割或非对称类型分割中的之一。在这种情况下,使用正方形块构造编码树单元可以与四叉树CU分割对应,并且使用对称非正方形块构造编码树单元可以与二叉树分割对应。使用正方形块和对称非正方形块构造编码树单元可以与四叉树CU分割和二叉树CU分割对应。
可以对不再执行基于四叉树的分割的编码块执行基于二叉树的分割。可以不再对基于二叉树分割的编码块执行基于四叉树的分割。
此外,可以依赖于较高深度的分割类型来确定较低深度的分割。例如,如果在两个或更多个深度中允许基于二叉树的分割,则可以在较低深度中仅允许与较高深度的二叉树分割相同的类型。例如,如果使用2N×N类型执行较高深度中的基于二叉树的分割,则也使用2N×N类型执行较低深度中的基于二叉树的分割。替选地,如果使用N×2N类型执行较高深度中的基于二叉树的分割,则也使用N×2N类型执行较低深度中的基于二叉树的分割。
相比之下,也可以在较低深度中仅允许与较高深度的二叉树分割类型不同的类型。
可以限制仅特定类型的基于二叉树的分割被用于序列、片、编码树单元或编码单元。作为示例,对于编码树单元,可以仅允许2N×N类型或N×2N类型的基于二叉树的分割。可以在编码器或解码器中预定义可用分割类型。或者可以对关于可用分割类型的信息或关于不可用分割类型的信息进行编码,并且然后通过比特流用信号通知该信息。
图5是示出仅允许特定类型的基于二叉树的分割的示例的图。图5的(a)示出了仅允许N×2N类型的基于二叉树的分割的示例,并且图5的(b)示出了仅允许2N×N类型的基于二叉树的分割的示例。为了实现基于四叉树或二叉树的自适应分割,可以使用下述信息:指示基于四叉树分割的信息、关于允许基于四叉树的分割的编码块的大小/深度的信息、指示基于二叉树的分割的信息、关于允许基于二叉树的分割的编码块的大小/深度的信息、关于不允许基于二叉树的分割的编码块的大小/深度的信息、关于是沿竖直方向还是沿水平方向执行基于二叉树的分割的信息等。
另外,对于编码树单元或特定的编码单元,可以获得关于允许二叉树分割的次数、允许二叉树分割的深度或者允许二叉树分割的深度的数量的信息。这些信息可以以编码树单元或编码单元为单位进行编码,并且可以通过比特流发送到解码器。
例如,可以通过比特流对指示允许二叉树分割的最大深度的语法“max_binary_depth_idx_minus1”进行编码/解码。在这种情况下,max_binary_depth_idx_minus1+1可以指示允许二叉树分割的最大深度。
参照图6中所示的示例,在图6中,已经针对深度为2的编码单元和深度为3的编码单元执行了二叉树分割。因此,可以通过比特流对指示编码树单元中的二叉树分割已经被执行的次数(即,2次)的信息、指示在编码树单元中已经允许二叉树分割的最大深度(即,深度3)或在编码树单元中已经执行二叉树分割的深度的数量(即,2个(深度2和深度3))的信息中的至少之一进行编码/解码。
作为另一示例,可以针对每个序列或每个片(slice)获得关于允许二叉树分割的次数、允许二叉树分割的深度或允许二叉树分割的深度的数量的信息中的至少之一。例如,该信息可以以序列、图片或片单元为单位进行编码,并且通过比特流进行传输。因此,第一片中的二叉树分割的次数、第一片中允许二叉树分割的最大深度或第一片中执行二叉树分割的深度的数量中的至少之一可以与第二片不同。例如,在第一片中,可以仅针对一个深度允许二叉树分割,而在第二片中,可以针对两个深度允许二叉树分割。
作为另一示例,可以根据片或图片的时间水平标识符(TemporalID)不同地设置允许二叉树分割的次数、允许二叉树分割的深度或允许二叉树分割的深度的数量。此处,时间水平标识符(TemporalID)用于标识具有视图、空间、时间或质量中的至少之一的可伸缩性的多个视频层中的每一个。
如图3中所示,可以基于四叉树将分区深度(拆分深度)为k的第一编码块300分割成多个第二编码块。例如,第二编码块310至340可以是具有第一编码块的一半宽度和一半高度的正方形块,并且第二编码块的分区深度可以增加至k+1。
分区深度为k+1的第二编码块310可以被分割成分区深度为k+2的多个第三编码块。可以通过依赖于分割方法选择性地使用四叉树和二叉树中的之一来执行第二编码块310的分割。此处,可以基于指示基于四叉树分割的信息和指示基于二叉树分割的信息中的至少之一来确定分割方法。
在基于四叉树对第二编码块310进行分割时,可以将第二编码块310分割成具有第二编码块的一半宽度和一半高度的四个第三编码块310a,并且第三编码块310a的分区深度可以增加至k+2。相比之下,在基于二叉树对第二编码块310进行分割时,可以将第二编码块310分割成两个第三编码块。此处,两个第三编码块中的每一个可以是具有第二编码块的一半宽度和一半高度中的一者的非正方形块,并且分区深度可以增加至k+2。可以依赖于分割方向将第二编码块确定为水平方向或竖直方向的非正方形块,并且可以基于关于是沿竖直方向还是沿水平方向执行基于二叉树的分割的信息来确定分割方向。
同时,第二编码块310可以被确定为不再基于四叉树或二叉树进行分割的叶编码块。在这种情况下,叶编码块可以被用作预测块或变换块。
类似于第二编码块310的分割,第三编码块310a可以被确定为叶编码块,或者可以基于四叉树或二叉树被进一步分割。
同时,可以基于二叉树将基于二叉树分割的第三编码块310b进一步分割成竖直方向的编码块310b-2或水平方向的编码块310b-3,相关编码块的分区深度可以增加至k+3。替选地,第三编码块310b可以被确定为不再基于二叉树进行分割的叶编码块310b-1。在这种情况下,编码块310b-1可以被用作预测块或变换块。然而,可以基于以下信息中的至少之一来限制性地执行上述分割处理:关于允许基于四叉树的分割的编码块的大小/深度的信息、关于允许基于二叉树的分割的编码块的大小/深度的信息以及关于不允许基于二叉树的分割的编码块的大小/深度的信息。
表示编码块的大小的候选的数量可以被限制为预定数量,或者预定单元中的编码块的大小可以具有固定值。作为示例,序列或图片中的编码块的大小可以被限制为具有256×256、128×128或32×32。可以通过序列头或图片头来用信号通知指示序列中或图片中的编码块的大小的信息。
作为基于四叉树和二叉树的分割的结果,编码单元可以被表示为任意大小的正方形或矩形形状。
使用跳过模式、帧内预测、帧间预测或跳过方法中的至少之一来对编码块进行编码。一旦确定了编码块,则可以通过编码块的预测分割来确定预测块。可以通过指示编码块的分割类型的分割模式(Part_mode)来执行编码块的预测分割。可以根据编码块的分割模式来确定预测块的大小或形状。例如,根据分割模式确定的预测块的大小可以等于或小于编码块的大小。
图7是示出当通过帧间预测对编码块进行编码时可以应用于编码块的分割模式的图。
当通过帧间预测对编码块进行编码时,8个分割模式中的一个可以应用于编码块,如图4所示的示例。
当通过帧内预测对编码块进行编码时,可以将分割模式PART_2Nx2N或分割模式PART_NxN应用于编码块。
当编码块具有最小尺寸时,可以应用PART_NxN。这里,可以在编码器和解码器中预定义编码块的最小尺寸。或者,可以经由比特流来用信号通知关于编码块的最小尺寸的信息。例如,通过片头(slice header)可以用信号通知编码块的最小尺寸,从而可以经由片(slice)来定义编码块的最小尺寸。
通常,预测块可以具有从64×64到4×4的大小。然而,当通过帧间预测对编码块进行编码时,可以限制预测块不具有4×4大小,以在执行运动补偿时减小存储器带宽。
图8是示出根据本发明的实施方式的帧间预测方法的流程图。
参照图8,确定当前块的运动信息S810。当前块的运动信息可以包括与当前块有关的运动矢量、当前块的参考图片索引或当前块的帧间预测方向中的至少之一。
可以基于通过比特流来用信号通知的信息或与当前块相邻的相邻块的运动信息中的至少之一来获得当前块的运动信息。
图9是示出当将合并模式应用于当前块时导出当前块的运动信息的过程的图。
如果将合并模式应用于当前块,则可以根据当前块的空间相邻块导出空间合并候选S910。空间相邻块可以包括与当前块的顶部、左侧或角(例如,左上角、右上角或左下角中的至少之一)相邻的块中的至少之一。
可以将空间合并候选的运动信息设置为与空间相邻块的运动信息相同。
可以根据当前块的时间相邻块导出时间合并候选S920。时间相邻块可以意味着在并置图片(collocated picture)中包括的共同定位块(co-located block)。并置图片具有与包括当前块的当前图片不同的图片顺序计数(picture order count,POC)。并置图片可以被确定为参考图片列表中的具有预定义索引的图片,或者可以由从比特流用信号通知的索引确定。时间相邻块可以被确定为并置图片中的具有与当前块相同的位置和大小的块或者与具有与当前块相同的位置和大小的块相邻的块。例如,可以将并置图片中的包括具有与当前块相同的位置和大小的块的中心坐标的块或者与块的右下边界相邻的块中的至少之一确定为时间相邻块。
可以基于时间相邻块的运动信息来确定时间合并候选的运动信息。例如,可以基于时间相邻块的运动矢量来确定时间合并候选的运动矢量。另外,时间合并候选的帧间预测方向可以被设置为与时间相邻块的帧间预测方向相同。然而,时间合并候选的参考图片索引可以具有固定值。例如,时间合并候选的参考图片索引可以被设置为“0”。
参照图11至图20,将更详细地描述导出合并候选的示例。
此后,可以生成包括空间合并候选和时间合并候选的合并候选列表S930。如果合并候选列表中包括的合并候选的数量小于合并候选的最大数量,则可以在合并候选列表中包括将两个或更多个合并候选进行组合的组合合并候选或具有零运动矢量(0,0)的合并候选。
当生成合并候选列表时,可以基于合并候选索引来指定合并候选列表中包括的合并候选中的至少之一S940。
当前块的运动信息可以被设置为与由合并候选索引指定的合并候选的运动信息相同S950。例如,当通过合并候选索引选择空间合并候选时,可以将当前块的运动信息设置为与空间相邻块的运动信息相同。替选地,当通过合并候选索引选择时间合并候选时,可以将当前块的运动信息设置为与时间相邻块的运动信息相同。
图10示出了当AMVP模式应用于当前块时导出当前块的运动信息的过程。
当AMVP模式应用于当前块时,可以根据比特流对当前块的帧间预测方向或参考图片索引中的至少之一进行解码S1010。也就是说,当应用AMVP模式时,可以基于通过比特流的编码信息来确定当前块的帧间预测方向或参考图片索引中的至少之一。
可以基于当前块的空间相邻块的运动矢量来确定空间运动矢量候选S1020。空间运动矢量候选可以包括根据当前块的顶部相邻块导出的第一空间运动矢量候选和根据当前块的左相邻块导出的第二空间运动矢量候选中的至少之一。这里,顶部相邻块可以包括与当前块的顶部或右上角相邻的块中的至少之一,并且当前块的左相邻块可以包括与当前块的左侧或左下角相邻的块中的至少之一。与当前块的左上角相邻的块可以被视为顶部相邻块或左相邻块。
当当前块与空间相邻块之间的参考图片不同时,可通过对空间相邻块的运动矢量进行缩放来获得空间运动矢量。
可以基于当前块的时间相邻块的运动矢量来确定时间运动矢量候选S1030。如果当前块与时间相邻块之间的参考图片不同,则可以通过对时间相邻块的运动矢量进行缩放来获得时间运动矢量。
可以生成包括空间运动矢量候选和时间运动矢量候选的运动矢量候选列表S1040。
当生成运动矢量候选列表时,可以基于指定运动矢量候选列表中的至少之一的信息来指定运动矢量候选列表中包括的运动矢量候选中的至少之一S1050。
由信息指定的运动矢量候选被设置为当前块的运动矢量预测值。并且,通过将运动矢量差值与运动矢量预测值相加来获得当前块的运动矢量S1060。此时,可以从比特流中解析运动矢量差值。
当获得当前块的运动信息时,可以基于所获得的运动信息来执行对当前块的运动补偿S820。更具体地,可以基于当前块的帧间预测方向、参考图片索引和运动矢量来执行对当前块的运动补偿。
可以通过比特流来用信号通知在合并候选列表中可以包括的合并候选的最大数量。例如,可以通过序列参数或图片参数来用信号通知指示合并候选的最大数量的信息。
可以根据合并候选的最大数量来确定在合并候选列表中可以包括的空间合并候选和时间合并候选的数量。具体地,可以调整空间合并候选的数量和时间合并候选的数量,使得空间合并候选和时间合并候选的总数量不超过合并候选的最大数量N。例如,当合并候选的最大数量是5时,可以将从当前块的5个空间合并候选中选择的4个添加到合并候选列表,并且可以将从当前块的2个时间合并候选中选择的1个添加到合并候选列表。可以根据添加到合并候选列表的空间合并候选的数量来调整时间合并候选的数量,或者可以根据添加到合并候选列表的时间合并候选的数量来调整空间合并候选的数量。如果添加到合并候选列表的合并候选的数量小于5,则可以将组合了至少两个合并候选的组合合并候选添加到合并候选列表或者将具有(0,0)的运动矢量的合并候选添加到合并候选列表。
可以以预定义的顺序将合并候选添加到合并候选列表。例如,可以按照空间合并候选、时间合并候选、组合合并候选和具有零运动矢量的合并候选的顺序生成合并候选列表。还可以定义与枚举顺序不同的添加合并候选的顺序。
图11是示出当前块的空间合并候选的图。可以根据当前块的空间相邻块导出当前块的空间合并候选。例如,空间合并候选可以包括根据与当前块的左侧相邻的块导出的合并候选A1、根据与当前块的顶部相邻的块导出的合并候选B1、根据与当前块的左下部相邻的块导出的合并候选A0、根据与当前块的右上部相邻的块导出的合并候选B0或根据与当前块的左上部相邻的块导出的合并候选B2。可以以预定顺序搜索空间合并候选。例如,空间合并候选的搜索顺序可以是A1、B1、B0、A0和B2。此时,仅当不存在与A1、B1、B0或A0对应的块时,或者当与A1、B1、B0或A0对应的块不可用时,B2才可以包括在合并候选列表中。例如,如果在帧内预测中对与A1、B1、B0或A0对应的块进行编码,则可以将该块确定为不可用。替选地,如果合并候选列表中包括的空间合并候选和时间合并候选的数量小于或等于合并候选的最大数量,则可以将B2添加到合并候选列表作为时间合并候选的下一个顺序。
为了导出时间合并候选,可以在参考图片列表中选择并置图片(col_pic)。并置图片可以是参考图片列表中的具有与当前图片的最小图片顺序计数(POC)差的图片,或者是由参考图片索引指定的图片。可以基于并置块中的当前块的共同定位块来导出时间合并候选。此时,用于指定共同定位块的参考图片列表信息可以以块、片头或图片为单位进行编码,并且可以通过比特流发送。
图12是示出当前块的共同定位块的图。共同定位块指示并置图片中与当前块的位置对应的块。例如,可以将共同定位块确定为并置图片中的与具有与当前块相同的坐标和大小的块的右下部相邻的块H,或者包括块的中心位置的块C3。此时,当块H的位置不可用时,当块H由帧内预测进行编码时,或者当块H位于包括当前块的LCU之外时,可以将块C3确定为共同定位块。
替选地,可以将并置图片中的与具有与当前块相同的坐标和大小的块的一个角相邻的块确定为共同定位块,或者可以将具有该块内的坐标的块确定为共同定位块。例如,在图12所示的示例中,可以将块TL、BL或C0确定为共同定位块。
还可以根据多个共同定位块导出当前块的多个时间合并候选。
可以通过对并置图片中的共同定位块的运动矢量进行缩放来获得时间合并候选的运动矢量。图13是用于示出通过将共同定位块的运动矢量进行缩放来获得时间合并候选的运动矢量的示例的图。使用当前图片与当前块的参考图片之间的时间距离tb和并置图片与共同定位块的参考图片之间的时间距离td中的至少之一,对共同定位块的运动矢量进行缩放来获得时间合并候选的运动矢量。
可以基于具有预定形状的块或大小等于或大于预定大小的块来导出合并候选。因此,如果当前块不具有预定形状或者如果当前块的大小小于预定大小,则可以基于包括当前块的预定形状的块或者包括当前块的预定大小或更大的块来导出当前块的合并候选。例如,可以基于包括非正方形形状的编码单元的正方形形状的编码单元来导出非正方形形状的编码单元的合并候选。
图14是示出基于正方形块导出非正方形块的合并候选的示例的图。
可以基于包括非正方形块的正方形块来导出非正方形块的合并候选。例如,在图14所示的示例中,可以基于正方形块导出非正方形编码块0和非正方形编码块1的合并候选。因此,编码块0和编码块1可以使用基于正方形块导出的空间合并候选A0、A1、A2、A3和A4中的至少之一。
尽管未在图中示出,但是还可以基于正方形块导出非正方形块的时间合并候选。举例来说,编码块0和编码块1可以使用根据基于正方形块确定的时间相邻块导出的时间合并候选。
替选地,可以基于正方形块来导出空间合并候选和时间合并候选中的至少之一,并且可以基于非正方形块来导出另一个。例如,编码块0和编码块1可以使用基于正方形块导出的相同的空间合并候选,而编码块0和编码块1可以使用不同的时间合并候选,其中所述不同的时间合并候选中的每一个由其位置导出。
在上述示例中,解释了基于正方形块导出合并候选,但是也可以基于预定形状的非正正方形块来导出合并候选。例如,如果当前块是2Nxn形状的非正方形块(其中n是1/2N),则可以基于2N×N形状的非正方形块导出当前块的合并候选,并且如果当前块是nx2N形状的非正方形块,则可以基于Nx2N形状的非正方形块导出当前块的合并候选。
可以通过比特流来用信号通知指示作为导出合并候选的基础的块的形状或块的大小的信息。例如,可以通过比特流来用信号通知指示正方形形状或非正方形形状的块形状信息。替选地,编码器/解码器可以在预定义的规则中导出合并候选,例如具有预定义的形状的块或大小等于或大于预定义大小的块。
在另一示例中,可以基于四叉树分割单元来导出合并候选。这里,四叉树分割单元可以表示由四叉树划分的块单元。例如,如果由二叉树分割当前块,则可以基于由四叉树划分的上节点块来导出当前块的合并候选。如果对于当前块不存在由四叉树划分的上节点,则可以基于包括当前块的LCU或特定大小的块来导出当前块的合并候选。
图15是用于示出基于上节点块导出二叉树分割块的合并候选的示例的图。
非正方形形状的二叉树分割块0和非正方形形状的二叉树分割块1可以使用基于四叉树单元的上部块导出的空间合并候选A0、A1、A2、A3和A4中的至少之一。因此,块0和块1可以使用相同的空间合并候选。
另外,非正方形形状的二叉树分割块2、非正方形形状的二叉树分割块3和非正方形形状的二叉树分割块4可以使用基于四叉树单元的上部块导出的B0、B1、B2、B3和B4中的至少之一。因此,块2、3和4可以使用相同的空间合并候选。
尽管未在图中示出,但是还可以根据基于四叉树的上部块来导出二叉树分割块的时间合并候选。因此,块0和块1可以使用从基于四叉树块单元确定的时间相邻块导出的相同的时间合并候选。块2、块3和块4还可以使用从基于四叉树块单元确定的时间相邻块导出的相同的时间合并候选。
替选地,还可以基于二叉树块单元导出空间合并候选和时间合并候选中的至少一个,并且可以基于四叉树块单元导出另一个。例如,块0和块1可使用基于四叉树块单元而导出的相同的空间合并候选,但可以使用不同的时间合并候选,其中所述不同的时间合并候选中每一个基于其位置导出。
可以通过比特流来用信号通知指示是否基于四叉树分割单元或二叉树分割单元导出合并候选的信息。根据该信息,可以基于四叉树分割的上节点块来确定是否导出二叉树分割块的合并候选。替选地,编码器/解码器可以根据预定义的规则基于四叉树分割单元或二叉树分割单元导出合并候选。
如上所描述,可以以块(例如,以编码块或预测块为单位)或预定义单元为单位来导出当前块的合并候选。此时,如果当前块的任何空间合并候选存在于预定区域中,则可以确定其不可用,然后可以从空间合并候选中排除。例如,如果针对块之间的并行处理定义了并行处理区域,则可以确定当前块的空间合并候选中包括在并行处理区域中的合并候选不可用。并行处理区域可以被称为合并估计区域(MER)。并行处理区域中的块具有能够并行合并的优点。
合并估计区域可以具有正方形形状或非正方形形状。非正方形形状的合并估计区域可以限于预定形状。例如,非正方形形状的合并估计区域可以采用2N×N或N×2N的形状。
可以通过比特流来用信号通知指示合并估计区域的形状的信息或指示合并估计区域的大小的信息中的至少之一。例如,可以通过片头、图片参数或序列参数来用信号通知关于合并估计区域的形状或大小的信息。
指示合并估计区域的形状的信息可以是1比特的标志。例如,可以通过比特流来用信号通知指示合并估计区域具有正方形形状还是非正方形形状的语法“isrectagular_mer_flag”。如果isrectagular_mer_flag的值是1,则表示合并估计区域具有非正方形形状,并且如果isrectagular_mer_flag的值是0,则表示合并估计区域具有正方形形状。
如果合并估计区域具有非正方形形状,则可以通过比特流来用信号通知和宽度、高度或宽度与高度之间的比率有关的信息中的至少之一。基于该信息,可以导出非正方形形状合并估计区域的大小和/或形状。
图16是示出根据合并估计区域确定空间合并候选的可用性的示例的图。
如果合并估计区域具有Nx2N形状,并且合并估计区域具有预定大小,则在与块1相同的合并估计区域中包括的空间合并候选B0和B3不能用作块1的空间合并候选。因此,除了合并候选B0和B3之外,块1的空间合并候选可以由B1、B2和B4中的至少之一组成。
类似地,在与块3相同的合并估计区域中包括的空间合并候选C0不能用作块3的空间合并候选。因此,除了合并候选C0之外,块3的空间合并候选可以由C1、C2、C3和C4中的至少之一组成。
可以根据除了与当前块相邻的预定义的位置处的相邻块之外的块导出当前块的空间合并候选。例如,如果当前块的相邻块中存在不可用作空间合并候选的块,则可以根据与相邻块相邻的块导出当前块的空间合并候选。与相邻块相邻的块可以包括相对于相邻块位于预定方向上的块、与相邻块相邻的块中与当前块具有最小距离的块或与相邻块相邻的块中满足作为空间合并候选的可用性的块中的至少之一。另外,与相邻块相邻的块可以是与当前块相邻的块,或者可以是与当前块不相邻的块。
为了便于解释,在以下实施方式中,与当前块相邻的预定位置处的相邻块将被称为第一空间合并候选块,并且与第一空间合并候选块相邻的块将被称为第二空间合并候选块。
图17是示出将与不可用作空间合并候选的相邻块相邻的块用作当前块的空间合并候选的示例的图。
参照图17,当第一空间合并候选块A(A0、A1、A2、A3或A4)不可用时,可以通过使用第二空间合并候选块B(B0、B1、B2、B3、B4、B5或B6)导出当前块的合并候选。也就是说,可以根据第一空间合并候选块的可用性,用第二空间合并候选块替换第一空间合并候选块。
如果第一空间合并候选块不可用作合并候选,则可以使用与不可用的第一空间合并候选块相邻的第二空间合并候选块来导出当前块的合并候选。
例如,与第一空间合并候选块相邻的空间合并候选块可以表示相对于不可用的空间合并候选块位于特定方向上的合并候选。这里,特定方向可以意味着左/右方向、顶部/底部方向或角方向中的至少之一。另外,可以根据第一空间合并候选块的位置而不同地确定特定方向。例如,当第一空间合并候选块与当前块的左侧相邻时,特定方向可以是第一空间合并候选块的左方向,并且当第一空间合并候选块与当前块的顶部相邻时,特定方向可以是第一空间合并候选块的顶部方向。另外,当第一空间合并候选块与当前块的角相邻时,特定方向可以包括第一空间合并候选块的左方向、顶部方向或角方向中的至少之一。
例如,如果A0不可用,则可以将与A0相邻的B0设置为当前块的空间合并候选块。
例如,如果A1不可用,则可以将与A1相邻的B1设置为当前块的空间合并候选块。
例如,如果A2不可用,则可以将与A2相邻的B2设置为当前块的空间合并候选块。
例如,如果A3不可用,则可以将与A3相邻的B3设置为当前块的空间合并候选块。
例如,如果A4不可用,则可以将与A4相邻的B4至B6中的至少之一设置为当前块的空间合并候选块。
替换空间合并候选块的替换块的位置不限于图17中所示的示例。可以通过使用与图17中所示的位置不同的位置处的块来替换不可用的空间合并候选块。例如,还可以用位于空间合并候选块的顶部或底部的块来替换与当前块的左侧相邻的空间合并候选块,或者用位于空间合并候选块的左侧或右侧的块来替换与当前块的顶部相邻的空间合并候选块。
可以基于与当前块相邻的预定义的位置的相邻块来构造第一合并候选列表,并且可以基于与相邻块相邻的块来构造第二合并候选列表。例如,可以基于第一空间合并候选块(例如,图17中的A0至A4)生成第一合并候选列表,并且可以基于第二空间合并候选块(例如,图17中的B0至B6)生成第二合并候选列表。
可以选择第一合并候选列表和第二合并候选列表中之一,然后基于所选择的合并候选列表对当前块执行帧间预测。指定第一合并候选列表或第二合并候选列表的信息可以通过比特流来用信号通知。解码器可以基于该信息选择第一合并候选列表或第二合并候选列表。
替选地,还可以选择包括大量可用合并候选的一个合并候选列表,然后在第一合并候选列表和第二合并候选列表中选择另一个合并候选列表,或者基于当前块的大小、形状或分割深度自适应地选择合并候选列表。
替选地,还可以通过将合并候选列表中的任何一个添加(附加)到另一个合并候选列表来使用。例如,可以通过使用下述合并候选列表来执行当前块的运动补偿:所述合并候选列表被构造为包括第一合并候选列表中包括的合并候选和第二合并候选列表中包括的合并候选。
可以通过使用第一合并候选列表或第二合并候选列表中之一来执行当前块的帧间预测。如果合并候选列表中包括不可用的合并候选,则可以用在另一个合并候选列表中包括的合并候选替换不可用的合并候选。
例如,如果第一合并候选列表中包括不可用的合并候选,则可以将第二合并候选列表中包括的合并候选中最接近不可用的合并候选的可用合并候选添加到第一合并候选列表。最接近不可用的合并候选块的合并候选可以表示相对于不可用的合并候选块位于特定方向上的合并候选块。这里,特定方向可以意味着左/右方向、顶部/底部方向或角方向中的至少之一。另外,可以根据第一空间合并候选块的位置而不同地确定特定方向。例如,当第一空间合并候选块与当前块的左侧相邻时,特定方向可以是第一空间合并候选块的左方向,并且当第一空间合并候选块与当前块的顶部相邻时,特定方向可以是第一空间合并候选块的顶部方向。另外,当第一空间合并候选块与当前块的角相邻时,特定方向可以包括第一空间合并候选块的左方向、顶部方向或角方向中的至少之一。
在图17所示的示例中,如果第一合并候选列表中包括的A0不可用,则第二合并候选列表中包括的合并候选中最接近A0的B0可以用作当前块的合并候选。
例如,如果第一合并候选列表中包括的A1不可用,则第二合并候选列表中包括的合并候选中最接近A1的B1可以用作当前块的合并候选。
例如,如果第一合并候选列表中包括的A2不可用,则第二合并候选列表中包括的合并候选中最接近A2的B2可以用作当前块的合并候选。
例如,如果第一合并候选列表中包括的A3不可用,则第二合并候选列表中包括的合并候选中最接近A3的B3可以用作当前块的合并候选。
例如,如果第一合并候选列表中包括的A4不可用,则第二合并候选列表中包括的合并候选中最接近A4的B4至B6中的至少之一可以用作当前块的合并候选。
替选地,如果第一合并候选列表中包括不可用的合并候选,则可以基于第二合并候选列表中包括的合并候选的优先级顺序将第二合并候选列表中包括的合并候选添加到第一合并候选列表。
通过将第一合并候选列表和第二合并候选列表进行组合来生成单个合并候选列表,然后,可以基于组合的合并候选列表来执行对当前块的帧间预测。
可以通过按照预定搜索顺序搜索合并候选来生成组合的合并候选列表。例如,图18至图21是示出合并候选的搜索顺序的图。在图18至图21中,合并候选的搜索顺序如下所示。
A0→A1→A2→A3→A4→B0→B1→B2→B3→B4→(B5)→(B6)
这里,仅当B4块不可用时或者当组合的合并候选列表中包括的合并候选的数量等于或小于预定数量时,才可以搜索B5和B6。
在图18至图21中,示出了在搜索第一空间合并候选块之后搜索第二空间合并候选,但是,还可以通过使用与图18至图21中所示的搜索顺序不同的搜索顺序来生成合并候选列表。
还可以通过从第一合并候选列表中选择N个合并候选并从第二合并候选列表中选择M个合并候选来生成合并候选列表。N和M可以相同或可以彼此不同。
这里,可以根据预定义的优先级确定从第一合并候选列表和第二合并候选列表中选择的合并候选。
替选地,可以基于与从另一个合并候选列表中选择的合并候选的相关性来确定要从合并候选列表中选择的合并候选。例如,如果已经从第一合并候选列表中选择了合并候选A0,则可以禁止从第二合并候选列表中选择与A0相邻的合并块。
如果第一合并候选列表中的可用合并候选块的数量小于N,则可以从第二合并候选列表中选择比M更多的合并候选。例如,当N是4并且M是2时,可以通过从第一合并候选列表中选择四个合并候选并从第二合并候选列表中选择两个合并候选来生成当前块的合并候选列表。此时,如果第一合并候选列表中的可用合并候选的数量小于4,则可以从第二合并候选列表中选择两个或更多个合并候选以将它们用作当前块的合并候选。
同样地,如果第二合并候选列表中的可用合并候选块的数量小于M,则可以从第一合并候选列表中选择比N更多的合并候选。也就是说,可以根据每个合并候选列表中包括的可用合并候选块的数量来调整N和M,使得合并候选的总数量可以具有固定值。
如果从第一合并候选列表和第二候选列表中选择的合并候选的总数量小于预定的最大数量,则可以将通过组合两个或更多个合并候选而生成的组合合并候选或零合并候选(即,运动矢量为0的合并候选)添加到合并候选列表。
已经主要在解码过程上描述了上述实施方式,但是编码过程可以以与所描述的相同的顺序或相反的顺序执行。
图22是示出根据应用本发明的实施方式的获得残差样本的处理的流程图。
首先,可以获得当前块的残差系数S2210。解码器可以通过系数扫描方法获得残差系数。例如,解码器可以使用对角线扫描、Z字形(jigzag)扫描、右上扫描、竖直扫描或水平扫描来执行系数扫描,并且可以获得二维块形式的残差系数。
可以对当前块的残差系数执行逆量化S2220。
可以确定是否跳过对当前块的解量化残差系数的逆变换S2230。具体地,解码器可以确定是否跳过在当前块的水平方向或竖直方向中的至少一个方向上的逆变换。在确定在当前块的水平方向或竖直方向中的至少一个方向上应用逆变换时,可以通过对当前块的解量化残差系数进行逆变换来获得当前块的残差样本S2240。此处,可以使用DCT、DST和KLT中的至少之一来执行逆变换。
在当前块的水平方向和竖直方向二者上均跳过逆变换时,不在当前块的水平方向和竖直方向上执行逆变换。在这种情况下,可以通过使用预定值对解量化残差系数进行缩放来获得当前块的残差样本S2250。
跳过在水平方向上的逆变换意味着不在水平方向上执行逆变换,但是在竖直方向上执行逆变换。此时,可以在水平方向上执行缩放。
跳过竖直方向上的逆变换意味着不在竖直方向上执行逆变换,但是在水平方向上执行逆变换。此时,可以在竖直方向上执行缩放。
可以依赖于当前块的分割类型来确定是否可以针对当前块使用逆变换跳过技术。例如,如果通过基于二叉树的分割生成当前块,则可以针对当前块限制逆变换跳过方案。因此,在通过基于二叉树的分割生成当前块时,可以通过对当前块进行逆变换来获得当前块的残差样本。另外,在通过基于二叉树的分割生成当前块时,可以省略对指示是否跳过逆变换的信息(例如,transform_skip_flag(变换跳过标志))进行的编码/解码。
替选地,在通过基于二叉树的分割生成当前块时,可以将逆变换跳过方案限制到水平方向或竖直方向中的至少一个方向。此处,可以基于从比特流解码的信息来确定逆变换跳过方案被限制的方向,或者可以基于当前块的大小、当前块的形状或当前块的帧内预测模式中的至少之一来自适应地确定逆变换跳过方案被限制的方向。
例如,在当前块是宽度大于高度的非正方形块时,可以仅在竖直方向上允许逆变换跳过方案并且在水平方向上限制逆变换跳过方案。即,在当前块是2N×N时,在当前块的水平方向上执行逆变换,并且可以在竖直方向上选择性地执行逆变换。
另一方面,在当前块是高度大于宽度的非正方形块时,可以仅在水平方向上允许逆变换跳过方案并且在竖直方向上限制逆变换跳过方案。即,在当前块是N×2N时,在当前块的竖直方向上执行逆变换,并且可以在水平方向上选择性地执行逆变换。
与上述示例相比,在当前块是宽度大于高度的非正方形块时,可以仅在水平方向上允许逆变换跳过方案,并且在当前块是高度大于宽度的非正方形块时,可以仅在竖直方向上允许逆变换跳过方案。
可以通过比特流来对指示是否针对水平方向跳过逆变换的信息或者指示是否针对竖直方向跳过逆变换的信息进行信号通知。例如,指示是否跳过水平方向上的逆变换的信息是1比特标志“hor_transform_skip_flag”(水平变换跳过标志),并且指示是否跳过竖直方向上的逆变换的信息是1比特标志“ver_transform_skip_flag”(竖直变换跳过标志)。编码器可以根据当前块的形状对“hor_transform_skip_flag”或“ver_transform_skip_flag”中的至少之一进行编码。此外,解码器可以通过使用“hor_transform_skip_flag”或“ver_transform_skip_flag”中的至少之一来确定是否跳过水平方向或竖直方向上的逆变换。
可以设置成:依赖于当前块的分割类型跳过对当前块的任何一个方向的逆变换。例如,如果通过基于二叉树的分割生成当前块,则可以跳过水平方向或竖直方向上的逆变换。即,如果通过基于二叉树的分割生成当前块,则可以在不对指示是否跳过当前块的逆变换的信息(例如,transform_skip_flag(变换跳过标志)、hor_transform_skip_flag、ver_transform_skip_flag)进行编码/解码的情况下,确定在水平方向或竖直方向中的至少一个方向上跳过当前块的逆变换。
尽管已经基于一系列步骤或流程图描述了上述实施方式,但是它们不限制本发明的时序顺序,并且可以根据需要同时或以不同顺序执行。此外,构成上述实施方式中的框图的部件(例如,单元、模块等)中的每一个可以由硬件装置或软件以及多个部件来实现。或者,可以通过单个硬件装置或软件来组合并实现多个部件。上述实施方式可以以程序指令的形式实现,所述程序指令可以通过各种计算机部件执行并被记录在计算机可读记录介质中。计算机可读记录介质可以包括程序命令、数据文件、数据结构等之一或其组合。计算机可读介质的示例包括诸如硬盘、软盘和磁带的磁介质、诸如CD-ROM和DVD的光学记录介质、诸如光磁软盘的磁光介质、介质和专门被配置成存储和执行程序指令的硬件装置例如ROM、RAM、闪存等。硬件装置可以被配置成作为一个或更多个软件模块来进行操作以用于执行根据本发明的处理,反之亦然。
工业应用性
本发明可以应用于能够对视频进行编码/解码的电子装置。

Claims (8)

1.一种用于对二维视频进行解码的方法,所述方法包括:
确定与当前块相邻的相邻块的可用性,所述可用性表示相邻块是否可用作合并候选;
根据至少一个可用的相邻块导出所述当前块的至少一个空间合并候选;
根据所述当前块的共同定位块导出时间合并候选;
通过将所述至少一个空间合并候选与所述时间合并候选相加来构造第一合并候选列表;以及
确定是否利用第二合并候选列表更新所述第一合并候选列表,
其中,所述相邻块包括左上相邻块、顶部相邻块、左相邻块、左下相邻块以及右上相邻块,
其中,仅在所述顶部相邻块、所述左相邻块、所述左下相邻块以及所述右上相邻块中的至少之一不可用的情况下,所述左上相邻块被确定为可用,
其中,在所述顶部相邻块、所述左相邻块、所述左下相邻块以及所述右上相邻块全部可用的情况下,不通过所述第二合并候选列表修改所述第一合并候选列表,以及
其中,在由于所述相邻块中的至少之一被确定为不可用、因此包括在所述第一合并候选列表中的合并候选的数量小于阈值的情况下,通过添加包括在所述第二合并候选列表中的合并候选来更新所述第一合并候选列表,以及
其中,基于所述第二合并候选列表中的合并候选的优先级,确定从所述第二合并候选列表被添加到所述第一合并候选列表的合并候选。
2.根据权利要求1所述的方法,其中,根据与所述顶部相邻块和所述左相邻块不同的块,导出从所述第二合并候选列表被添加到所述第一合并候选列表中的合并候选。
3.根据权利要求1所述的方法,其中,基于所述第一合并候选列表中包括的合并候选的数量,确定从所述第二合并候选列表被添加到所述第一合并候选列表的合并候选的数量。
4.根据权利要求1所述的方法,其中,如果更新后的第一合并候选列表中包括的合并候选的数量小于最大数量,经由添加通过使用所述更新后的第一合并候选列表中包括的两个合并候选而生成的新的合并候选,进一步更新所述更新后的第一合并候选列表。
5.一种用于对二维视频进行编码的方法,所述方法包括:
确定与当前块相邻的相邻块的可用性,所述可用性表示相邻块是否可用作合并候选;
根据至少一个可用的相邻块导出所述当前块的至少一个空间合并候选;
根据所述当前块的共同定位块导出时间合并候选;
通过将所述至少一个空间合并候选与所述时间合并候选相加来构造第一合并候选列表;以及
确定是否利用第二合并候选列表更新所述第一合并候选列表,
其中,所述相邻块包括左上相邻块、顶部相邻块、左相邻块、左下相邻块以及右上相邻块,
其中,仅在所述顶部相邻块、所述左相邻块、所述左下相邻块以及所述右上相邻块中的至少之一不可用的情况下,所述左上相邻块被确定为可用,
其中,在所述顶部相邻块、所述左相邻块、所述左下相邻块以及所述右上相邻块全部可用的情况下,不通过所述第二合并候选列表修改所述第一合并候选列表,以及
其中,在由于所述相邻块中的至少之一被确定为不可用、因此包括在所述第一合并候选列表中的合并候选的数量小于阈值的情况下,通过添加包括在所述第二合并候选列表中的合并候选来更新所述第一合并候选列表,以及
其中,基于所述第二合并候选列表中的合并候选的优先级,确定从所述第二合并候选列表被添加到所述第一合并候选列表的合并候选。
6.根据权利要求5所述的方法,其中,根据与所述顶部相邻块和所述左相邻块不同的块,导出从所述第二合并候选列表被添加到所述第一合并候选列表中的合并候选。
7.根据权利要求5所述的方法,其中,基于所述第一合并候选列表中包括的合并候选的数量,确定从所述第二合并候选列表被添加到所述第一合并候选列表的合并候选的数量。
8.根据权利要求5所述的方法,其中,如果更新后的第一合并候选列表中包括的合并候选的数量小于最大数量,经由添加通过使用所述更新后的第一合并候选列表中包括的两个合并候选而生成的新的合并候选,进一步更新所述更新后的第一合并候选列表。
CN201780061263.5A 2016-10-04 2017-09-29 一种用于对二维视频进行解码、编码的方法 Active CN109845253B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN202311060087.7A CN116866570A (zh) 2016-10-04 2017-09-29 用于处理视频信号的方法和装置
CN202311055763.1A CN116866564A (zh) 2016-10-04 2017-09-29 用于处理视频信号的方法和装置
CN202311058091.XA CN116866567A (zh) 2016-10-04 2017-09-29 用于处理视频信号的方法和装置
CN202311058472.8A CN116866568A (zh) 2016-10-04 2017-09-29 用于处理视频信号的方法和装置
CN202311059570.3A CN116866569A (zh) 2016-10-04 2017-09-29 用于处理视频信号的方法和装置
CN202311054506.6A CN116847068A (zh) 2016-10-04 2017-09-29 用于处理视频信号的方法和装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR10-2016-0127864 2016-10-04
KR20160127864 2016-10-04
PCT/KR2017/011056 WO2018066959A1 (ko) 2016-10-04 2017-09-29 비디오 신호 처리 방법 및 장치

Related Child Applications (6)

Application Number Title Priority Date Filing Date
CN202311055763.1A Division CN116866564A (zh) 2016-10-04 2017-09-29 用于处理视频信号的方法和装置
CN202311059570.3A Division CN116866569A (zh) 2016-10-04 2017-09-29 用于处理视频信号的方法和装置
CN202311058472.8A Division CN116866568A (zh) 2016-10-04 2017-09-29 用于处理视频信号的方法和装置
CN202311054506.6A Division CN116847068A (zh) 2016-10-04 2017-09-29 用于处理视频信号的方法和装置
CN202311058091.XA Division CN116866567A (zh) 2016-10-04 2017-09-29 用于处理视频信号的方法和装置
CN202311060087.7A Division CN116866570A (zh) 2016-10-04 2017-09-29 用于处理视频信号的方法和装置

Publications (2)

Publication Number Publication Date
CN109845253A CN109845253A (zh) 2019-06-04
CN109845253B true CN109845253B (zh) 2023-09-12

Family

ID=61831073

Family Applications (7)

Application Number Title Priority Date Filing Date
CN202311055763.1A Pending CN116866564A (zh) 2016-10-04 2017-09-29 用于处理视频信号的方法和装置
CN202311058091.XA Pending CN116866567A (zh) 2016-10-04 2017-09-29 用于处理视频信号的方法和装置
CN202311059570.3A Pending CN116866569A (zh) 2016-10-04 2017-09-29 用于处理视频信号的方法和装置
CN202311060087.7A Pending CN116866570A (zh) 2016-10-04 2017-09-29 用于处理视频信号的方法和装置
CN202311054506.6A Pending CN116847068A (zh) 2016-10-04 2017-09-29 用于处理视频信号的方法和装置
CN202311058472.8A Pending CN116866568A (zh) 2016-10-04 2017-09-29 用于处理视频信号的方法和装置
CN201780061263.5A Active CN109845253B (zh) 2016-10-04 2017-09-29 一种用于对二维视频进行解码、编码的方法

Family Applications Before (6)

Application Number Title Priority Date Filing Date
CN202311055763.1A Pending CN116866564A (zh) 2016-10-04 2017-09-29 用于处理视频信号的方法和装置
CN202311058091.XA Pending CN116866567A (zh) 2016-10-04 2017-09-29 用于处理视频信号的方法和装置
CN202311059570.3A Pending CN116866569A (zh) 2016-10-04 2017-09-29 用于处理视频信号的方法和装置
CN202311060087.7A Pending CN116866570A (zh) 2016-10-04 2017-09-29 用于处理视频信号的方法和装置
CN202311054506.6A Pending CN116847068A (zh) 2016-10-04 2017-09-29 用于处理视频信号的方法和装置
CN202311058472.8A Pending CN116866568A (zh) 2016-10-04 2017-09-29 用于处理视频信号的方法和装置

Country Status (5)

Country Link
US (2) US11172194B2 (zh)
KR (1) KR102471206B1 (zh)
CN (7) CN116866564A (zh)
CA (2) CA3222158A1 (zh)
WO (1) WO2018066959A1 (zh)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116866564A (zh) 2016-10-04 2023-10-10 株式会社Kt 用于处理视频信号的方法和装置
US10484703B2 (en) * 2017-02-07 2019-11-19 Mediatek Inc. Adapting merge candidate positions and numbers according to size and/or shape of prediction block
KR102427789B1 (ko) * 2017-10-10 2022-08-02 한국전자통신연구원 인터 예측 정보를 사용하는 방법 및 장치
WO2019182295A1 (ko) * 2018-03-19 2019-09-26 주식회사 케이티 비디오 신호 처리 방법 및 장치
WO2019203527A1 (ko) * 2018-04-16 2019-10-24 엘지전자 주식회사 영상 코딩 시스템에서 복수의 주변 블록들을 사용하는 인터 예측에 따른 영상 디코딩 방법 및 장치
WO2019225993A1 (ko) * 2018-05-23 2019-11-28 주식회사 케이티 비디오 신호 처리 방법 및 장치
GB2613272B (en) * 2018-06-08 2023-11-15 Kt Corp Method and apparatus for processing a video signal
CN117834908A (zh) * 2018-07-02 2024-04-05 英迪股份有限公司 对视频进行解码的方法和对视频进行编码的方法
WO2020043145A1 (en) * 2018-08-29 2020-03-05 Huawei Technologies Co., Ltd. Apparatus and method and for boundary partition
WO2020048366A1 (en) * 2018-09-03 2020-03-12 Huawei Technologies Co., Ltd. Coding method, device, system with merge mode
WO2020060177A1 (ko) * 2018-09-18 2020-03-26 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
EP3861737A4 (en) * 2018-10-05 2022-07-13 OP Solutions, LLC METHODS AND SYSTEMS FOR CONSTRUCTING A LIST OF FUSION CANDIDATES INCLUDING ADDING A NON-ADJACENT DIAGONAL SPATIAL FUSION CANDIDATE
CN117082259A (zh) * 2018-10-10 2023-11-17 华为技术有限公司 帧间预测方法及装置
JP7319365B2 (ja) 2018-11-22 2023-08-01 北京字節跳動網絡技術有限公司 サブブロックに基づくインター予測のための調整方法
CN112236996A (zh) * 2018-12-21 2021-01-15 株式会社 Xris 视频信号编码/解码方法及其装置
JP7332721B2 (ja) 2019-05-25 2023-08-23 北京字節跳動網絡技術有限公司 イントラブロックコピー符号化ブロックにおけるブロックベクトルの符号化
JP7481430B2 (ja) 2019-08-13 2024-05-10 北京字節跳動網絡技術有限公司 サブブロックに基づくインター予測における動き精度
CN114762330A (zh) 2019-09-22 2022-07-15 北京字节跳动网络技术有限公司 视频的子图片编码和解码
WO2021155862A1 (en) * 2020-02-07 2021-08-12 Beijing Bytedance Network Technology Co., Ltd. Bv list construction process of ibc blocks under merge estimation region
JP7464742B2 (ja) 2020-03-21 2024-04-09 北京字節跳動網絡技術有限公司 参照ピクチャリサンプリング
WO2021254379A1 (en) 2020-06-20 2021-12-23 Beijing Bytedance Network Technology Co., Ltd. Inter layer prediction with different coding block size
US20230075788A1 (en) * 2021-09-01 2023-03-09 Tencent America LLC Template matching on ibc merge candidates

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103096073A (zh) * 2011-11-07 2013-05-08 吴秀美 构造合并列表的方法
JP2013141078A (ja) * 2011-12-28 2013-07-18 Jvc Kenwood Corp 動画像復号装置、動画像復号方法及び動画像復号プログラム
CN103444172A (zh) * 2011-09-23 2013-12-11 株式会社Kt 用于引导合并候选块的方法和使用该方法的设备
CN104396248A (zh) * 2012-10-12 2015-03-04 韩国电子通信研究院 图像编码/解码方法和使用其的装置
CN104412587A (zh) * 2012-07-02 2015-03-11 联发科技股份有限公司 三维视频编码中视图间候选获取的方法和设备
JP2016066864A (ja) * 2014-09-24 2016-04-28 シャープ株式会社 画像復号装置、画像符号化装置およびマージモードパラメータ導出装置

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130215968A1 (en) * 2010-10-28 2013-08-22 University-Industry Cooperation Group Of Kyung Hee University Video information encoding method and decoding method
ES2884066T3 (es) 2011-10-18 2021-12-10 Lg Electronics Inc Método de intra predicción y dispositivo para lo mismo
RU2632154C1 (ru) 2011-11-08 2017-10-02 Электроникс Энд Телекоммьюникейшнз Рисерч Инститьют Способ и устройство для совместного использования списка кандидатов
KR101934277B1 (ko) 2011-11-28 2019-01-04 에스케이텔레콤 주식회사 개선된 머지를 이용한 영상 부호화/복호화 방법 및 장치
CA2855777C (en) 2011-12-23 2017-10-24 Electronics And Telecommunications Research Institute Method and apparatus for setting reference picture index of temporal merging candidate
TWI559747B (zh) 2011-12-28 2016-11-21 Jvc Kenwood Corp A dynamic image coding apparatus, a motion picture coding method and a motion picture coding program, and a motion picture decoding apparatus, a motion picture decoding method, and a motion picture decoding program
US9686559B2 (en) * 2012-07-03 2017-06-20 Sharp Kabushiki Kaisha Image decoding device, and image encoding device
KR102378459B1 (ko) * 2014-06-30 2022-03-24 한국전자통신연구원 움직임 병합 모드에서 시점 합성 예측 후보의 중복성 제거 장치 및 방법
EP3202143B8 (en) 2014-11-18 2019-09-25 MediaTek Inc. Method of bi-prediction video coding based on motion vectors from uni-prediction and merge candidate
JPWO2017061189A1 (ja) * 2015-10-05 2018-09-13 シャープ株式会社 画像復号装置または画像符号化装置のための画像予測装置
US10560718B2 (en) * 2016-05-13 2020-02-11 Qualcomm Incorporated Merge candidates for motion vector prediction for video coding
CN116567217A (zh) * 2016-08-11 2023-08-08 Lx 半导体科技有限公司 图像编码/解码方法以及图像数据的发送方法
CN116866564A (zh) * 2016-10-04 2023-10-10 株式会社Kt 用于处理视频信号的方法和装置
WO2018123313A1 (ja) * 2016-12-26 2018-07-05 日本電気株式会社 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置及びプログラム
US10812810B2 (en) * 2018-02-06 2020-10-20 Tencent America LLC Method and apparatus for video coding in merge mode
US10397603B1 (en) * 2018-05-08 2019-08-27 Tencent America LLC Method and apparatus for video coding
US10924731B2 (en) * 2018-08-28 2021-02-16 Tencent America LLC Complexity constraints on merge candidates list construction
US10958932B2 (en) * 2018-09-12 2021-03-23 Qualcomm Incorporated Inter-prediction coding of video data using generated motion vector predictor list including non-adjacent blocks

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103444172A (zh) * 2011-09-23 2013-12-11 株式会社Kt 用于引导合并候选块的方法和使用该方法的设备
CN103096073A (zh) * 2011-11-07 2013-05-08 吴秀美 构造合并列表的方法
JP2013141078A (ja) * 2011-12-28 2013-07-18 Jvc Kenwood Corp 動画像復号装置、動画像復号方法及び動画像復号プログラム
CN104412587A (zh) * 2012-07-02 2015-03-11 联发科技股份有限公司 三维视频编码中视图间候选获取的方法和设备
CN104396248A (zh) * 2012-10-12 2015-03-04 韩国电子通信研究院 图像编码/解码方法和使用其的装置
JP2016066864A (ja) * 2014-09-24 2016-04-28 シャープ株式会社 画像復号装置、画像符号化装置およびマージモードパラメータ導出装置

Also Published As

Publication number Publication date
CN116866564A (zh) 2023-10-10
US20220030224A1 (en) 2022-01-27
CN116866568A (zh) 2023-10-10
CN116866569A (zh) 2023-10-10
US20200045306A1 (en) 2020-02-06
CN109845253A (zh) 2019-06-04
KR102471206B1 (ko) 2022-11-25
CN116866570A (zh) 2023-10-10
CA3039155A1 (en) 2018-04-12
US11172194B2 (en) 2021-11-09
KR20180037600A (ko) 2018-04-12
US11930161B2 (en) 2024-03-12
CN116866567A (zh) 2023-10-10
CN116847068A (zh) 2023-10-03
WO2018066959A1 (ko) 2018-04-12
CA3222158A1 (en) 2018-04-12

Similar Documents

Publication Publication Date Title
CN109845253B (zh) 一种用于对二维视频进行解码、编码的方法
CN110651472B (zh) 用于视频信号处理的方法和装置
CN110100440B (zh) 一种用于对视频进行解码、编码的方法
CN110574372B (zh) 视频信号处理方法和计算机可读介质
CN109417641B (zh) 用于处理视频信号的方法和装置
CN109479149B (zh) 视频信号处理方法和设备
CN109644267B (zh) 视频信号处理方法和装置
CN109417640B (zh) 用于处理视频信号的方法和设备
US20230209080A1 (en) Video signal processing method and device
CN109716775B (zh) 用于处理视频信号的方法和装置
CN112166610A (zh) 用于处理视频信号的方法和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant