CN103563382A - 用于对图像进行编码的方法和设备以及用于进行解码的方法和设备 - Google Patents

用于对图像进行编码的方法和设备以及用于进行解码的方法和设备 Download PDF

Info

Publication number
CN103563382A
CN103563382A CN201280022824.8A CN201280022824A CN103563382A CN 103563382 A CN103563382 A CN 103563382A CN 201280022824 A CN201280022824 A CN 201280022824A CN 103563382 A CN103563382 A CN 103563382A
Authority
CN
China
Prior art keywords
reference picture
unit
picture list
list
predicting unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201280022824.8A
Other languages
English (en)
Inventor
李泰美
朴永五
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN103563382A publication Critical patent/CN103563382A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

提供一种用于对被运动预测的当前预测单元的运动信息进行编码和解码的方法和设备。该图像编码方法包括:获得第一参考画面列表、第二参考画面列表和组合参考画面列表,其中,所述组合参考画面列表是包括在第一参考画面列表中的参考画面与包括在第二参考画面列表中的参考画面的组合;基于单向运动感预测模式的情况的数量和双向运动预测模式的情况的数量,来对指示在当前预测单元的编码中使用的运动预测模式和参考画面的参考语法进行编码。

Description

用于对图像进行编码的方法和设备以及用于进行解码的方法和设备
技术领域
本发明涉及用于对静止图像和视频进行编码和解码的方法和设备,更具体地讲,涉及用于对当前预测单元的运动信息进行编码和解码的方法和设备。
背景技术
根据诸如MPEG-4H.264/MPEG-4高级视频编码(AVC)的编解码器,通过使用单独的语法来对指示在运动预测期间的当前块的运动的方向的预测模式信息和在当前块的运动预测中使用的参考画面信息进行编码。
发明内容
技术问题
本发明提供用于通过使用单个语法来对当前预测单元的运动预测模式信息和运动预测中使用的参考画面信息进行编码和解码的方法和设备。
解决方案
根据本发明的实施例,提供用于使用单个参考语法来对运动预测模式信息和参考画面信息进行编码的方法和设备。
有益效果
根据本发明的实施例,通过使用单个参考语法来有效地对预测方向(预测模式)信息和用于当前预测单元的参考画面信息进行编码,从而提高图像的压缩效率。
附图说明
图1是根据本发明的实施例的视频编码设备的框图;
图2是根据本发明的实施例的视频解码设备的框图;
图3是用于描述根据本发明的实施例的编码单元的概念的示图;
图4是根据本发明的实施例的基于具有分层结构的编码单元的视频编码器的框图;
图5是根据本发明的实施例的基于具有分层结构的编码单元的视频解码器的框图;
图6是示出根据本发明的实施例的根据深度的较深层编码单元和分区(partition)的示图;
图7是用于描述根据本发明的实施例的编码单元和变换单元之间的关系的示图;
图8是用于描述根据本发明的实施例的与编码深度相应的编码单元的编码信息的示图;
图9是根据本发明的实施例的根据深度的较深层编码单元的示图;
图10至图12是用于描述根据本发明的实施例的编码单元、预测单元和频率变换单元之间的关系的示图;
图13是用于描述根据表1的编码模式信息的编码单元、预测单元和变换单元之间的关系的示图;
图14是示出根据本发明的实施例的由B画面中的预测单元参考的参考画面的示例的示图;
图15A至图15C示出根据本发明的实施例的分配到参考画面的参考画面索引的示例;
图16A和图16B示出根据本发明的实施例的在单向预测中使用的组合参考画面列表;
图17示出根据本发明的实施例的示出基于单向运动预测模式的情况的数量和双向运动预测模式的情况的数量而分配的参考语法值的表,其中,所述参考语法值指示单向运动预测模式和双向运动预测模式以及参考画面;
图18示出根据本发明的实施例的将参考语法信息二值化的处理的示例;
图19是示出根据本发明的实施例的图像编码方法的流程图;
图20是示出根据本发明的实施例的图像解码方法的流程图。
最佳模式
根据本发明的一方面,提供一种图像编码方法,包括:获得第一参考画面列表、第二参考画面列表和组合参考画面列表,其中,所述组合参考画面列表是包括在第一参考画面列表中的参考画面与包括在第二参考画面列表中的参考画面的组合;通过使用单向运动预测模式和双向预测模式之一来对当前预测单元进行编码,其中,在单向运动预测模式中,通过使用包括在组合参考画面列表中的参考画面来对当前预测单元执行单向运动预测,在双向预测模式中,通过使用第一参考画面列表和第二参考画面列表来对当前预测单元执行双向运动预测;基于单向运动感预测模式的情况的数量和双向运动预测模式的情况的数量,来对指示在当前预测单元的编码中使用的运动预测模式和参考画面的参考语法进行编码。
根据本发明的另一方面,提供一种图像编码设备,包括:运动预测单元,用于通过使用单向运动预测模式和双向预测模式之一来对当前预测单元进行进行预测,其中,在单向运动预测模式中,通过使用包括在组合参考画面列表中的参考画面来对当前预测单元执行单向运动预测,在双向预测模式中,通过使用第一参考画面列表和第二参考画面列表来对当前预测单元执行双向运动预测;熵编码器,用于基于单向运动感预测模式的情况的数量和双向运动预测模式的情况的数量,来对指示在当前预测单元的编码中使用的运动预测模式和参考画面的参考语法进行编码。
根据本发明的另一方面,提供一种图像解码方法,包括:获得第一参考画面列表、第二参考画面列表和组合参考画面列表,其中,组合参考画面列表是包括在第一参考画面列表中的参考画面与包括在第二参考画面列表中的参考画面的组合;基于单向运动预测模式的情况的数量和双向运动预测模式的情况的数量,根据当前预测单元的编码中使用的运动预测模式和参考画面确定参考语法的值,其中,在单向运动预测模式中,包括在组合参考列表中的参考画面被使用,在双向运动预测模式中,第一参考画面列表和第二参考画面列表被使用;从比特流获得当前预测单元的参考语法:通过使用获得的参考语法的值来确定当前预测单元的运动预测模式和参考画面:通过使用确定的运动预测模式和确定的参考画面来对当前预测单元执行运动补偿。
根据本发明的另一方面,提供一种图像解码器,包括:熵解码器,用于获得第一参考画面列表、第二参考画面列表和组合参考画面列表,其中,组合参考画面列表是包括在第一参考画面列表中的参考画面与包括在第二参考画面列表中的参考画面的组合,基于单向运动预测模式的情况的数量和双向运动预测模式的情况的数量,根据当前预测单元的编码中使用的运动预测模式和参考画面确定参考语法的值,其中,在单向运动预测模式中,包括在组合参考列表中的参考画面被使用,在双向运动预测模式中,第一参考画面列表和第二参考画面列表被使用,通过使用从比特流获得的当前预测单元的参考语法来确定当前预测单元的运动预测模式和参考画面;运动补偿单元,用于通过使用确定的运动预测模式和确定的参考画面来对当前预测单元执行运动补偿。
具体实施方式
以下,将参照附图来详细描述本发明的实施例。
图1是根据本发明的实施例的视频编码设备100的框图。
视频编码设备100包括最大编码单元划分器110、编码单元确定器120和输出单元130。
最大编码单元划分器110可基于作为最大尺寸的编码单元的最大编码单元来划分图像的当前画面。如果当前画面大于最大编码单元,则当前画面的图像数据可被划分为至少一个最大编码单元。根据本发明的实施例的最大编码单元可以是尺寸为32×32、64×64、128×128、256×256等的数据单元,其中,数据单元的形状是具有2的若干次方的宽度和长度并大于8的正方形。图像数据可以以至少一个最大编码单元为单位被输出到编码单元确定器120。
根据本发明的实施例的编码单元可由最大尺寸和深度来表征。深度表示从最大编码单元空间划分编码单元的次数,并且随着深度加深,可将较深层编码单元从最大编码单元划分为最小编码单元。最大编码单元的深度是最高深度,最小编码单元的深度是最低深度。由于随着最大编码单元的深度加深,与每个深度相应的编码单元的尺寸减小,因此,与更高深度相应的编码单元可包括多个与更低深度相应的编码单元。
如上所述,当前画面的图像数据根据编码单元的最大尺寸被划分为最大编码单元,并且每个最大编码单元可包括根据深度被划分的较深层编码单元。由于根据本发明的实施例的最大编码单元根据深度被划分,因此包括在最大编码单元中的空间域的图像数据可根据深度被分层地分类。
可预先确定编码单元的最大深度和最大尺寸,其中,编码单元的最大深度和最大尺寸限制最大编码单元的高度和宽度被分层地划分的总次数。
编码单元确定器120对通过根据深度划分最大编码单元的区域而获得的至少一个划分区域进行编码,并根据所述至少一个划分区域确定用于输出最终编码的图像数据的深度。换句话说,编码单元确定器120通过根据当前画面的最大编码单元对根据深度的较深层编码单元中的图像数据进行编码并选择具有最小编码误差的深度,来确定编码深度。根据最大编码器的确定的编码深度和编码图像数据被输出到输出单元130。
基于与等于或低于最大深度的至少一个深度相应的较深层编码单元对最大编码单元中的图像数据进行编码,并且基于每个较深层编码单元比较对图像数据进行编码的结果。在对较深层编码单元的编码误差进行比较之后,可选择具有最小编码误差的深度。可针对每个最大编码单元选择至少一个编码深度。
随着编码单元根据深度被分层地划分,并且随着编码单元的数量增加,最大编码单元的尺寸被划分。另外,即使在一个最大编码单元中多个编码单元相应于相同深度,也通过分别测量每个编码单元的图像数据的编码误差来确定是否将与相同深度相应的编码单元中的每个编码单元划分至更低深度。因此,即使当图像数据被包括在一个最大编码单元中时,图像数据也根据多个深度被划分为多个区域,在一个最大编码单元中编码误差可根据区域而不同,因此编码深度可根据图像数据中的区域而不同。因此,在一个最大编码单元中可确定一个或多个编码深度,并且可根据至少一个编码深度的编码单元来划分最大编码单元的图像数据。
因此,编码单元确定器120可确定包括在当前最大编码单元中的具有树结构的编码单元。根据本发明的实施例的“具有树结构的编码单元”包括最大编码单元中所包括的所有较深层编码单元中的与确定为编码深度的深度相应的编码单元。在最大编码单元的相同区域中,具有编码深度的编码单元可根据深度被分层地确定,在不同的区域中,具有该编码深度的编码单元可被独立地确定。类似地,当前区域中的编码深度可独立于另一区域中的编码深度被确定。
根据本发明的实施例的最大深度是与从最大编码单元到最小编码单元的被执行的划分次数相关的索引。根据本发明的实施例的第一最大深度可表示从最大编码单元到最小编码单元的被执行的总划分次数。根据本发明的实施例的第二最大深度可表示从最大编码单元到最小编码单元的深度级的总数。例如,当最大编码单元的深度是0时,最大编码单元被划分一次的编码单元的深度可被设置为1,并且最大编码单元被划分两次的编码单元的深度可被设置为2。这里,如果最小编码单元是最大编码单元被划分四次的编码单元,则存在深度为0、1、2、3和4的5个深度级,因此,第一最大深度可被设置为4,第二最大深度可被设置为5。
可根据最大编码单元执行预测编码和变换。还可根据最大编码单元,基于根据等于最大深度的深度或小于最大深度的多个深度的较深层编码单元来执行预测编码和变换。
由于每当最大编码单元根据深度被划分时,较深层编码单元的数量增加,因此对随着深度的加深而产生的所有的较深层编码单元执行包括预测编码和变换的编码。为了便于描述,现将基于在至少一个最大编码单元中的当前深度的编码单元来描述预测编码和变换。
视频编码设备100可不同地选择用于对图像数据进行编码的数据单元的尺寸或形状。为了对图像数据进行编码,执行多个操作(诸如,预测编码、变换和熵编码),此时,可针对所有操作使用相同的数据单元,或者可针对每个操作使用不同的数据单元。
例如,视频编码设备100不仅可选择用于对图像数据进行编码的编码单元,还可选择与该编码单元不同的数据单元,以便对编码单元中的图像数据执行预测编码。
为了在最大编码单元中执行预测编码,可基于与编码深度相应的编码单元(即,基于不再被划分为与更低深度相应的多个编码单元的编码单元)执行预测编码。以下,不再被划分并且变为用于预测编码的基本单元的编码单元现在将被称为“预测单元”。通过划分预测单元而获得的分区可包括:通过划分预测单元的高度和宽度中的至少一个而获得的预测单元或数据单元。
例如,当2N×2N(其中,N是正整数)的编码单元不再被划分并且变为2N×2N的预测单元时,分区的尺寸可以是2N×2N、2N×N、N×2N或N×N。分区类型的示例包括通过对预测单元的高度或宽度进行对称划分而获得的对称分区、通过对预测单元的高度或宽度进行不对称划分(诸如,1:n或n:1)而获得的分区、通过对预测单元进行几何划分而获得的分区以及具有任意形状的分区。
预测单元的预测模式可以是帧内模式、帧间模式和跳过模式中的至少一个。例如,可对2N×2N、2N×N、N×2N或N×N的分区执行帧内模式或帧间模式。另外,可仅对2N×2N的分区执行跳过模式。对编码单元中的一个预测单元独立地执行编码,从而选择具有最小编码误差的预测模式。
视频编码设备100不仅可基于用于对图像数据进行编码的编码单元还可基于与该编码单元不同的数据单元,对编码单元中的图像数据执行变换。
为了在编码单元中执行变换,可基于具有小于或等于编码单元的尺寸的数据单元来执行变换。例如,用于变换的数据单元可包括用于帧内模式的数据单元以及用于帧间模式的数据单元。
用作变换的基础的数据单元现将被称为“变换单元”。与编码单元类似,编码单元中的变换单元可被递归地划分为更小尺寸的区域,从而变换单元可以以区域为单位被独立地确定。因此,编码单元中的残差数据可根据具有根据变换深度的树结构的变换单元被划分。
还可在变换单元中设置指示通过对编码单元的高度和宽度进行划分以达到变换单元而执行的划分次数的变换深度。例如,在2N×2N的当前编码单元中,当变换单元的尺寸是2N×2N时,变换深度可以是0,当变换单元的尺寸是N×N时,变换深度可以是1,当变换单元的尺寸是N/2×N/2时,变换深度可以是2。也就是说,也可根据变换深度设置具有树结构的变换单元。
根据与编码深度相应的编码单元的编码信息不仅需要关于编码深度的信息,还需要与预测编码和变换相关的信息。因此,编码单元确定器120不仅确定具有最小编码误差的编码深度,还确定预测单元中的分区类型、根据预测单元的预测模式以及用于变换的变换单元的尺寸。
稍后将参照图3至图12来详细地描述根据本发明的实施例的最大编码单元中的根据树结构的编码单元以及确定分区的方法。
编码单元确定器120可通过使用基于拉格朗日乘子(Lagrangian multiplier)的率失真优化来测量根据深度的较深层编码单元的编码误差。
输出单元130在比特流中输出最大编码单元的图像数据以及关于根据编码深度的编码模式的信息,其中,所述图像数据基于由编码单元确定器120确定的至少一个编码深度被编码。
编码的图像数据可以是图像的残差数据的编码结果。
关于根据编码深度的编码模式的信息可包括关于编码深度的信息、关于预测单元中的分区类型的信息、预测模式信息以及变换单元的尺寸信息。
可通过使用根据深度的划分信息来定义关于编码深度的信息,划分信息指示是否针对更低深度而非当前深度的编码单元来执行编码。如果当前编码单元的当前深度是编码深度,则当前编码单元中的图像数据被编码和输出,因此划分信息可被定义为不将当前编码单元划分为更低深度。可选择地,如果当前编码单元的当前深度不是编码深度,则对更低深度的编码单元执行编码,因此划分信息可被定义为划分当前编码单元以获得更低深度的编码单元。
如果当前深度不是编码深度,则对被划分为更低深度的编码单元的编码单元执行编码。由于更低深度的至少一个编码单元存在于当前深度的一个编码单元中,对更低深度的每个编码单元重复地执行编码,因此可对具有相同深度的编码单元递归地执行编码。
由于对一个最大编码单元确定具有树结构的编码单元,并且对编码深度的编码单元确定关于至少一个编码模式的信息,因此可对一个最大编码单元确定关于至少一个编码模式的信息。另外,由于图像数据根据深度被分层地划分,最大编码单元的图像数据的编码深度可根据位置而不同,因此可对图像数据设置关于编码深度以及编码模式的信息。
因此,输出单元130可将关于相应编码深度和编码模式的编码信息分配给包括在最大编码单元中的编码单元、预测单元和最小单元中的至少一个。
根据本发明的实施例的最小单元是通过对组成最低深度的最小编码单元进行划分4次而获得的矩形数据单元。可选择地,最小单元可以是最大矩形数据单元,最大矩形数据单元可被包括在最大编码单元中所包括的所有编码单元、预测单元、分区单元和变换单元中。
例如,通过输出单元130输出的编码信息可被分类为根据编码单元的编码信息以及根据预测单元的编码信息。根据编码单元的编码信息可包括关于预测模式的信息以及关于分区的尺寸的信息。根据预测单元的编码信息可包括关于以下内容的信息:帧间模式的估计方向、帧间模式的参考图像索引、运动矢量、帧内模式的色度分量以及帧内模式的插值方法。此外,关于根据画面、条带或GOP定义的编码单元的最大尺寸的信息以及关于最大深度的信息可被插入到比特流的头。
在视频编码设备100中,较深层编码单元可以是通过将作为上一层的更高深度的编码单元的高度或宽度除以二而获得的编码单元。换句话说,在当前深度的编码单元的尺寸是2N×2N时,更低深度的编码单元的尺寸是N×N。另外,尺寸为2N×2N的当前深度的编码单元可包括最多4个更低深度的编码单元。
因此,视频编码设备100可通过基于考虑当前画面的特性所确定的最大编码单元的尺寸和最大深度,针对每个最大编码单元确定具有最佳形状和最佳尺寸的编码单元,来形成具有树结构的编码单元。另外,由于通过使用各种预测模式和变换中的任何一个对每个最大编码单元执行编码,因此可考虑各种图像尺寸的编码单元的特性来确定最佳编码模式。
因此,如果在传统的宏块中对具有高分辨率或大数据量的图像进行编码,则每个画面的宏块的数量过度增加。因此,针对每个宏块产生的压缩信息的条数增加,因此难以发送压缩信息并且数据压缩效率降低。然而,通过使用视频编码设备100,由于在考虑图像的尺寸的同时增加编码单元的最大尺寸,同时在考虑图像的特征的同时调整编码单元,因此图像压缩效率会增加。
图2是根据本发明的实施例的视频解码设备200的框图。
视频解码设备200包括接收器210、图像数据和编码信息提取器220以及图像数据解码器230。用于视频解码设备200的各种操作的各种术语(诸如,编码单元、深度、预测单元、变换单元和关于各种编码模式的信息)的定义与以上参照图1和视频编码设备100描述的那些定义一致。
接收器210接收编码视频的比特流以对语法元素进行解析。图像数据和编码信息提取器220通过对解析的语法元素执行熵解码来基于具有树结构的编码单元提取指示编码图像数据的语法元素,并且将提取的语法元素输出到图像数据解码器230。也就是说,图像数据和编码信息提取器220对以0和1的比特串的形式接收的语法元素执行熵解码,从而恢复语法元素。
另外,图像数据和编码信息提取器220从解析的比特流针对根据每个最大编码单元的具有树结构的编码单元提取关于编码深度的信息、编码模式、颜色分量信息、预测模式信息等。提取的关于编码深度和编码模式的信息被输出到图像数据解码器230。比特流中的图像数据被划分为最大编码单元,从而图像数据解码器230针对每个最大编码单元对图像数据进行解码。
可针对关于与编码深度相应的至少一个编码单元的信息来设置关于根据最大编码单元的编码深度和编码模式的信息,并且关于编码模式的信息可包括关于以下内容的信息:与编码深度相应的相应编码单元的分区类型、预测模式以及变换单元的尺寸。另外,根据深度的划分信息可被提取为关于编码深度的信息。
由图像数据和编码信息提取器220提取的关于根据每个最大编码单元的编码深度和编码模式的信息是关于这样的编码深度和编码模式的信息:所述编码深度和编码模式被确定用于当编码器(诸如,视频编码设备100)根据每个最大编码单元针对根据深度的每个较深层编码单元重复执行编码时产生最小编码误差。因此,视频解码设备200可通过根据产生最小编码误差的编码深度和编码模式对图像数据进行解码来恢复图像。
由于关于编码深度和编码模式的编码信息可被分配给相应编码单元、预测单元以及最小单元中的预定数据单元,因此,图像数据和编码信息提取器220可根据预定数据单元提取关于编码深度和编码模式的信息。当关于相应的最大编码单元的编码深度和编码模式的信息被分配到每个预定数据单元时,被分配相同的关于编码深度和编码模式的信息的预定数据单元可被推断为包括在相同的最大编码单元中的数据单元。
图像数据解码器230可通过基于关于根据最大编码单元的编码深度和编码模式的信息对每个最大编码单元中的图像数据进行解码来恢复当前画面。换句话说,图像数据解码器230可基于提取的关于包括在每个最大编码单元中的具有树结构的编码单元的每个编码单元的分区类型、预测模式和变换单元的信息来对编码图像数据进行解码。解码处理可包括预测(所述预测包括帧内预测和运动补偿)和反变换。
图像数据解码器230可基于关于根据编码深度的编码单元的预测单元的分区类型以及预测模式的信息,根据每个编码单元的分区和预测模式来执行帧内预测或运动补偿。
另外,图像数据解码器230可基于关于根据编码深度的编码单元的变换单元的尺寸的信息,根据编码单元中的每个变换单元执行反变换,以便根据最大编码单元执行反变换。
图像数据解码器230可通过使用根据深度的划分信息来确定当前最大编码单元的至少一个编码深度。如果划分信息指示图像数据在当前深度中不再被划分,则当前深度是编码深度。因此,图像数据解码器230可通过使用关于预测单元的分区类型、预测模式以及变换单元的尺寸的信息,来针对当前最大编码单元的图像数据的当前深度的编码单元进行解码。
换句话说,可通过观察针对编码单元、预测单元和最小单元之中的预定数据单元分配的编码信息集,来聚集包括包含相同划分信息的编码信息的数据单元,收集的数据单元可被认为是将由图像数据解码器230以相同的编码模式进行解码的一个数据单元。
视频解码设备200可获得关于当针对每个最大编码单元递归执行编码时产生最小编码误差的至少一个编码单元的信息,并可使用所述信息来对当前画面进行解码。换句话说,可对每个最大编码单元中被确定为最佳编码单元的具有树结构的编码单元的编码图像数据进行解码。
因此,即使图像数据具有高分辨率和大数据量,也可通过使用从编码器接收的关于最佳编码模式的信息,通过使用根据图像数据的特性自适应地确定的编码单元的尺寸和编码模式来有效地对图像数据进行解码和恢复。
现将参照图3至图13描述根据本发明的实施例的确定具有树结构的编码单元、预测单元和变换单元的方法。
图3是用于描述根据本发明的实施例的分层编码单元的概念的示图。
编码单元的尺寸可按照宽度×高度来表示,并可以是64×64、32×32、16×16和8×8。64×64的编码单元可被划分为64×64、64×32、32×64或32×32的分区,32×32的编码单元可被划分为32×32、32×16、16×32或16×16的分区,16×16的编码单元可被划分为16×16、16×8、8×16或8×8的分区,8×8的编码单元可被划分为8×8、8×4、4×8或4×4的分区。
关于视频数据310,设置分辨率是1920×1080,编码单元的最大尺寸是64,并且最大深度是2。关于视频数据320,设置分辨率是1920×1080,编码单元的最大尺寸是64,并且最大深度是3。关于视频数据330,设置分辨率是352×288,编码单元的最大尺寸是16,并且最大深度是1。图3中示出的最大深度表示从最大编码单元到最小编码单元的划分总数。
如果分辨率高或者数据量大,则编码单元的最大尺寸可以较大以便不仅提高编码效率还准确地反映图像的特性。因此,分辨率比视频数据330更高的视频数据310和视频数据320的编码单元的最大尺寸可以是64。
由于视频数据310的最大深度是2而由于通过划分最大编码单元两次深度被加深到两层,因此视频数据310的编码单元315可包括长轴尺寸为64的最大编码单元以及长轴尺寸为32和16的编码单元。同时,由于视频数据330的最大深度是1而由于通过划分最大编码单元一次深度被加深到一层,因此视频数据330的编码单元335可包括长轴尺寸为16的最大编码单元以及长轴尺寸为8的编码单元。
由于视频数据320的最大深度是3而由于通过划分最大编码单元三次深度被加深到3层,因此视频数据320的编码单元325可包括长轴尺寸为64的最大编码单元以及长轴尺寸为32、16和8的编码单元。随着深度的加深,可精确地表示详细的信息。
图4是根据本发明的实施例的基于编码单元的图像编码器400的框图。
图像编码器400包括在视频编码设备100的编码单元确定器120中执行的操作以对图像数据进行编码。也就是说,帧内预测器410在帧内模式下对当前帧405中的编码单元执行帧内预测,运动估计器420和运动补偿器425在帧间模式下通过使用当前帧405和参考帧495对编码单元分别执行帧间估计和运动补偿。
从帧内预测器410、运动估计器420和运动补偿器425输出的数据通过变换器430和量化器440被输出为量化的变换系数。量化的变换系数通过反量化器460和反变换器470被恢复为空间域中的数据,并且恢复的空间域中的数据在通过去块单元480和环路滤波单元490后处理之后被输出为参考帧495。量化的变换系数可通过熵编码器450被输出为比特流455。
为了使图像编码器400被应用到视频编码设备100中,图像编码器400的所有元件(即,帧内预测器410、运动估计器420、运动补偿器425、变换器430、量化器440、熵编码器450、反量化器460、反变换器470、去块单元480和环路滤波单元490)在考虑每个最大编码单元的最大深度的同时,基于具有树结构的多个编码单元中的每个编码单元执行操作。
具体地讲,帧内预测器410、运动估计器420和运动补偿器425在考虑当前最大编码单元的最大尺寸和最大深度的同时,确定具有树结构的多个编码单元中的每个编码单元的分区和预测模式,并且变换器430确定具有树结构的多个编码单元的每个编码单元中的变换单元的尺寸。
图5是根据本发明的实施例的基于编码单元的视频解码器500的框图。
解析器510从比特流505解析将被解码的编码图像数据以及解码所需的关于编码的信息。编码的图像数据通过解码器520和反量化器530被输出为反量化的数据。反变换器540将反量化的数据恢复为空间域中的图像数据。帧内预测器550针对空间域中的图像数据对帧内模式的编码单元执行帧内预测,运动补偿器560通过使用参考帧585对帧间模式下的编码单元执行运动补偿。
经过帧内预测器550和运动补偿器560的空间域中的图像数据可在通过去块单元570和环路滤波单元580后处理之后被输出为重构的帧595。另外,经过去块单元570和环路滤波单元580后处理的图像数据可被输出为参考帧585。
为了使视频解码器500被应用到视频解码设备200中,图像解码器500的所有元件(即,解析器510、熵解码器520、反量化器530、反变换器540、帧内预测器550、运动补偿器560、去块单元570和环路滤波单元580)基于每个最大编码单元的具有树结构的编码单元执行操作。
帧内预测器550和运动补偿器560针对每个具有树结构的编码单元确定分区和预测模式,并且反变换器540必须针对每个编码单元确定变换单元的尺寸。
图6是示出根据本发明的实施例的根据深度的较深层编码单元和分区的示图。
视频编码设备100和视频解码设备200使用分层的编码单元以考虑图像的特性。编码单元的最大高度、最大宽度和最大深度可根据图像的特性被自适应地确定,或者可由用户不同地设置。根据深度的较深层编码单元的尺寸可根据编码单元的预定最大尺寸被确定。
在根据本发明的实施例的编码单元的分层结构600中,编码单元的最大高度和最大宽度都是64,并且最大深度是4。由于深度沿着分层结构600的纵轴加深,因此较深层编码单元的高度和宽度都被划分。另外,作为用于每个较深层编码单元的预测编码的基础的预测单元和分区沿分层结构600的横轴被显示。
换句话说,编码单元610是分层结构600中的最大编码单元,其中,深度是0,尺寸(即,高度乘宽度)是64×64。深度沿纵轴加深,并且存在尺寸为32×32和深度为1的编码单元620、尺寸为16×16和深度为2的编码单元630、尺寸为8×8和深度为3的编码单元640以及尺寸为4×4和深度为4的编码单元650。尺寸为4×4和深度为4的编码单元650是最小编码单元。
编码单元的预测单元和分区根据每个深度沿横轴排列。换句话说,如果尺寸为64×64和深度为0的编码单元610是预测单元,则该预测单元可被划分为包括在编码单元610中的分区(即,尺寸为64×64的分区610、尺寸为64×32的分区612、尺寸为32×64的分区614、或者尺寸为32×32的分区616)。
类似地,尺寸为32×32和深度为1的编码单元620的预测单元可被划分为包括在编码单元620中的分区(即,尺寸为32×32的分区620、尺寸为32×16的分区622、尺寸为16×32的分区624以及尺寸为16×16的分区626)。
类似地,尺寸为16×16和深度为2的编码单元630的预测单元可被划分为包括在编码单元630中的分区(即,包括在编码单元630中的尺寸为16×16的分区、尺寸为16×8的分区632、尺寸为8×16的分区634以及尺寸为8×8的分区636)。
类似地,尺寸为8×8和深度为3的编码单元640的预测单元可被划分为包括在编码单元640中的分区(即,包括在编码单元640中的尺寸为8×8的分区、尺寸为8×4的分区642、尺寸为4×8的分区644以及尺寸为4×4的分区646)。
尺寸为4×4和深度为4的编码单元650是最小编码单元以及最低深度的编码单元。编码单元650的预测单元仅被分配给尺寸为4×4的分区。
为了确定构成最大编码单元610的编码单元的至少一个编码深度,视频编码设备100的编码单元确定器120对包括在最大编码单元610中的与每个深度相应的编码单元执行编码。
随着深度加深,包括相同范围和相同尺寸的数据的根据深度的较深层编码单元的数量增加。例如,需要四个与深度2相应的编码单元以覆盖包括在一个与深度1相应的编码单元中的数据。因此,为了根据深度对相同数据的多个编码结果进行比较,与深度1相应的编码单元以及与深度2相应的四个编码单元都被编码。
为了针对多个深度中的当前深度执行编码,通过沿分层结构600的横轴,对与当前深度相应的多个编码单元中的每个预测单元执行编码来针对当前深度选择最小编码误差。可选择地,可通过随着深度沿分层结构600的纵轴加深,针对每个深度执行编码,来根据深度比较最小编码误差,从而搜索最小编码误差。在最大编码单元610中的具有最小编码误差的深度和分区可被选为最大编码单元610的编码深度和分区类型。
图7是用于描述根据本发明的实施例的编码单元710和变换单元720之间的关系的示图。
视频编码设备100或视频解码设备200针对每个最大编码单元根据尺寸小于或等于最大编码单元的编码单元来对图像进行编码或解码。可基于不大于相应编码单元的数据单元来选择在编码期间用于变换的变换单元的尺寸。
例如,在视频编码设备100或视频解码设备200中,如果编码单元710的尺寸是64×64,则可通过使用尺寸为32×32的变换单元720来执行变换。
另外,可通过对小于64×64的尺寸为32×32、16×16、8×8和4×4的每个变换单元执行变换,来对尺寸为64×64的编码单元710的数据进行编码,并且随后可选择具有最小编码误差的变换单元。
图8是用于描述根据本发明的实施例的与编码深度相应的编码单元的编码信息的示图。
视频编码设备100的输出单元130可对关于分区类型的信息800、关于预测模式的信息810以及关于与编码深度相应的每个编码单元的变换单元的尺寸的信息820进行编码和发送,作为关于编码模式的信息。
信息800指示关于通过划分当前编码单元的预测单元而获得的分区的形状的信息,其中,所述分区是用于对当前编码单元进行预测编码的数据单元。例如,尺寸为2N×2N的当前编码单元CU_0可被划分为如下分区中的任何一个:尺寸为2N×2N的分区802、尺寸为2N×N的分区804、尺寸为N×2N的分区806以及尺寸为N×N的分区808。这里,关于分区类型的信息800被设置为指示尺寸为尺寸为2N×2N的分区802、2N×N的分区804、尺寸为N×2N的分区806以及尺寸为N×N的分区808中的一个。
信息810指示每个分区的预测模式。例如,信息810可指示对由信息800指示的分区执行的预测编码的模式(即,帧内模式812、帧间模式814或跳过模式816)。
信息820指示当对当前编码单元执行变换时所基于的变换单元。例如,变换单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826或第二帧间变换单元828。
视频解码设备200的图像数据和编码信息提取器210可根据每个较深层编码单元来提取并使用用于解码的关于编码单元的信息800、关于预测模式的信息810和关于变换单元的尺寸的信息820。
图9是根据本发明的实施例的根据深度的较深层编码单元的示图。
划分信息可用于指示深度的改变。划分信息指示当前深度的编码单元是否被划分为更低深度的编码单元。
用于对深度为0和尺寸为2N_0×2N_0的编码单元900进行预测编码的预测单元910可包括如下分区类型的分区:尺寸为2N_0×2N_0的分区类型912、尺寸为2N_0×N_0的分区类型914、尺寸为N_0×2N_0的分区类型916以及尺寸为N_0×N_0的分区类型918。尽管图9仅示出通过对预测单元910对称划分而获得的分区类型912至918,但是分区类型不限于此,并且预测单元910的分区可包括不对称分区、具有预定形状的分区以及具有几何形状的分区。
根据每个分区类型对如下分区重复地执行预测编码:尺寸为2N_0×2N_0的一个分区、尺寸为2N_0×N_0的两个分区、尺寸为N_0×2N_0的两个分区以及尺寸为N_0×N_0的四个分区。可对尺寸为2N_0×2N_0、N_0×2N_0、2N_0×N_0以及N_0×N_0的分区执行帧内模式和帧间模式的预测编码。仅对尺寸为2N_0×2N_0的分区执行跳过模式的预测编码。
如果在尺寸为2N_0×2N_0、2N_0×N_0和N_0×2N_0的分区类型912至916之一中的编码误差最小,则预测单元910可不被划分为更低深度。
如果在尺寸为N_0×N_0的分区类型918中的编码误差最小,则在操作920,深度从0改变为1以划分分区类型918,并且对深度为2和尺寸为N_0×N_0的分区类型的编码单元重复地执行编码以搜索最小编码误差。
用于对深度为1和尺寸为2N_1×2N_1(=N_0×N_0)的(分区类型的)编码单元930进行预测编码的预测单元940可包括如下分区类型的分区:尺寸为2N_1×2N_1的分区类型942、尺寸为2N_1×N_1的分区类型944、尺寸为N_1×2N_1的分区类型946以及尺寸为N_1×N_1的分区类型948。
如果在尺寸为N_1×N_1的分区类型948中编码误差最小,则在操作950,深度从1改变为2以划分分区类型948,并且对深度为2和尺寸为N_2×N_2的编码单元960重复地执行编码以搜索最小编码误差。
当最大深度是d时,根据深度的划分操作可被执行直到深度变为d-1,并且划分信息可被编码直到深度是0至d-2之一。换句话说,当执行编码直到在操作970与深度d-2相应的编码单元被划分之后深度是d-1时,用于对深度为d-1和尺寸为2N_(d-1)×2N_(d-1)的编码单元980进行预测编码的预测单元990可包括如下分区类型的分区:尺寸为2N_(d-1)×2N_(d-1)的分区类型992、尺寸为2N_(d-1)×N_(d-1)的分区类型994、尺寸为N_(d-1)×2N_(d-1)的分区类型996以及尺寸为N_(d-1)×N_(d-1)的分区类型998。
可对分区类型992至998中的如下分区重复地执行预测编码以搜索具有最小编码误差的分区类型:尺寸为2N_(d-1)×2N_(d-1)的一个分区、尺寸为2N_(d-1)×N_(d-1)的两个分区、尺寸为N_(d-1)×2N_(d-1)的两个分区、尺寸为N_(d-1)×N_(d-1)的四个分区。
即使在尺寸为N_(d-1)×N_(d-1)的分区类型998具有最小编码误差时,由于最大深度是d,因此深度为d-1的编码单元CU_(d-1)不再被划分到更低深度,并且构成当前最大编码单元900的编码单元的编码深度被确定为d-1并且当前最大编码单元900的分区类型可被确定为N_(d-1)×N_(d-1)。另外,由于最大深度是d,因此最小编码单元980的划分信息不被设置。
数据单元999可以是当前最大编码单元的“最小单元”。根据本发明的实施例的最小单元可以是通过对最小编码单元980划分4次而获得的矩形数据单元。通过重复地执行编码,视频编码设备100可通过比较根据编码单元900的多个深度的多个编码误差来选择具有最小编码误差的深度以确定编码深度,并且将相应分区类型以及预测模式设置为编码深度的编码模式。
这样,根据深度的最小编码误差在所有的深度1至d中被比较,并且具有最小编码误差的深度可被确定为编码深度。编码深度、预测单元的分区类型以及预测模式可被编码并作为关于编码模式的信息被发送。另外,由于编码单元从深度0被划分到编码深度,因此仅该编码深度的划分信息被设置0,除了编码深度之外的深度的划分信息被设置为1。
视频解码设备200的图像数据和编码信息提取器220可提取并使用关于编码单元900的编码深度以及预测单元的信息以对分区912进行解码。视频解码设备200可通过使用根据深度的划分信息来将划分信息是0的深度确定为编码深度,并且使用关于相应深度的编码模式的信息用于解码。
图10至图12是用于描述根据本发明的实施例的编码单元1010、预测单元1060和变换单元1070之间的关系的示图。
编码单元1010是最大编码单元中的与由视频编码设备100确定的编码深度相应的具有树结构的编码单元。预测单元1060是每个编码单元1010的预测单元的分区,变换单元1070是每个编码单元1010的变换单元。
当在编码单元1010中最大编码单元的深度是0时,编码单元1012和1054的深度是1,编码单元1014、1016、1018、1028、1050和1052的深度是2,编码单元1020、1022、1024、1026、1030、1032和1048的深度是3,编码单元1040、1042、1044和1046的深度是4。
在预测单元1060中,一些编码单元1014、1016、1022、1032、1048、1050、1052和1054通过划分编码单元而获得。换句话说,编码单元1014、1022、1050和1054中的分区类型的尺寸为2N×N,编码单元1016、1048和1052中的分区类型尺寸的N×2N,编码单元1032的分区类型的尺寸为N×N。编码单元1010的预测单元和分区小于或等于每个编码单元。
以小于编码单元1052的数据单元对变换单元1070中的编码单元1052的图像数据执行变换或反变换。另外,变换单元1070中的编码单元1014、1016、1022、1032、1048、1050和1052在尺寸和形状上与预测单元1060的编码单元1014、1016、1022、1032、1048、1050和1052不同。换句话说,视频编码设备100和视频解码设备200可对相同编码单元中的数据单元独立地执行帧内预测、运动估计、运动补偿、变换和反变换。
因此,对最大编码单元的每个区域中的具有分层结构的每个编码单元递归地执行编码,以确定最佳编码单元,因此可获得具有递归树结构的编码单元。编码信息可包括关于编码单元的划分信息、关于分区类型的信息、关于预测模式的信息以及关于变换单元的尺寸的信息。
表1显示可由视频编码设备100和视频解码设备200设置的编码信息。
表1
Figure BDA0000411975630000181
视频编码设备100的输出单元130可输出关于具有树结构的编码单元的编码信息,并且视频解码设备200的图像数据和编码信息提取器220可从接收的比特流提取关于具有树结构的编码单元的编码信息。
划分信息指示当前编码单元是否被划分为更低深度的编码单元。如果当前深度d的划分信息是0,则当前编码单元不再被划分为更低深度的深度是编码深度,因此可针对编码深度定义关于分区类型、预测模式以及变换单元的尺寸的信息。如果当前编码单元根据划分信息被进一步划分,则对更低深度的四个划分编码单元独立地执行编码。
预测模式可以是帧内模式、帧间模式和跳过模式中的一个。可在所有分区类型中定义帧内模式和帧间模式,并且可仅在尺寸为2N×2N的分区类型中定义跳过模式。
关于分区类型的信息可指示通过对称地划分预测单元的高度或宽度而获得的尺寸为2N×2N、2N×N、N×2N和N×N的对称分区类型、以及通过不对称地划分预测单元的高度或宽度而获得的尺寸为2N×nU、2N×nD、nL×2N和nR×2N的不对称分区类型。可通过以1:n和n:1(其中,n是大于1的整数)划分预测单元的高度来分别地获得尺寸为2N×nU和2N×nD的不对称分区类型,可通过以1:n和n:1划分预测单元的宽度来分别地获得尺寸为nL×2N和nR×2N的不对称分区类型。
变换单元的尺寸可被设置为帧内模式中的两种类型以及帧间模式中的两种类型。换句话说,如果变换单元的划分信息是0,则变换单元的尺寸可以是作为当前编码单元的尺寸的2N×2N。如果变换单元的划分信息是1,则可通过划分当前编码单元来获得变换单元。另外,如果尺寸为2N×2N的当前编码单元的分区类型是对称分区类型,则变换单元的尺寸可以是N×N,如果当前编码单元的分区类型是不对称分区类型,则变换单元的尺寸可以是N/2×N/2。
关于具有树结构的编码单元的编码信息可包括与编码深度相应的编码单元、预测单元以及最小单元中的至少一个。与编码深度相应的编码单元可包括:包含相同编码信息的预测单元和最小单元中的至少一个。
因此,通过对邻近数据单元的编码信息进行比较,来确定邻近数据单元是否被包括在与编码深度相应的相同编码单元中。另外,通过使用数据单元的编码信息来确定与编码深度相应的相应编码单元,因此最大编码单元中的编码深度的分布可被确定。
因此,如果基于邻近数据单元的编码信息预测当前编码单元,则与当前编码单元邻近的较深层编码单元中的数据单元的编码信息可被直接参考和使用。
可选择地,如果基于邻近数据单元的编码信息来预测当前编码单元,则使用数据单元的编码信息来搜索与当前编码单元邻近的数据单元,并且搜索到的邻近编码单元可被参考以用于预测当前编码单元。
图13是用于描述根据表1的编码模式信息的编码单元、预测单元和变换单元之间的关系的示图。
最大编码单元1300包括多个编码深度的编码单元1302、1304、1306、1312、1314、1316和1318。这里,由于编码单元1318是编码深度的编码单元,因此划分信息可被设置为0。关于尺寸为2N×2N的编码单元1318的分区类型的信息可被设置为以下分区类型之一:尺寸为2N×2N的分区类型1322、尺寸为2N×N的分区类型1324、尺寸为N×2N的分区类型1326、尺寸为N×N的分区类型1328、尺寸为2N×nU的分区类型1332、尺寸为2N×nD的分区类型1334、尺寸为nL×2N的分区类型1336和尺寸为nR×2N的分区类型1338。
当分区类型被设置为对称(即,分区类型1322、1324、1326或1328)时,如果变换单元的划分信息(TU尺寸标志)为0,则设置尺寸为2N×2N的变换单元1342,如果TU尺寸标志为1,则设置尺寸为N×N的变换单元1344。
当分区类型被设置为不对称(即,分区类型1332、1334、1336或1338)时,如果TU尺寸标志为0,则设置尺寸为2N×2N的变换单元1352,如果TU尺寸标志为1,则设置尺寸为N/2×N/2的变换单元1354。
以下,将详细描述图4的图像编码设备100的运动预测单元420和运动补偿单元425以及图5的图像解码设备的运动补偿单元550中执行的运动预测和补偿、以及图4的熵编码器和图5的熵解码器520中执行的运动预测信息的编码和解码。在以下描述中,上述预测单元可被称为块。
运动预测单元420通过对包括在P条带中的预测单元执行单向预测来产生预测值。此外,运动预测单元420通过使用两个列表(List0和List1)来对包括在B条带中的预测单元执行单向预测或双向预测来产生预测值。虽然在根据传统技术的MPEG-2中执行的双向预测中,参考画面限于紧在当前画面之前的一幅参考画面和紧在当前画面之后的一幅参考画面,但任何两张参考画面可被使用,而不限于当前画面的在前参考画面和在后参考画面,并且这样的模式被称为双向预测模式。
在当前预测单元的运动预测模式中,可对通过对当前预测单元执行单向预测而获得的预测值进行编码的结果的代价与对通过对当前预测单元执行双向运动预测而获得的预测值进行编码的结果的代价进行比较,并且具有较小代价的预测模式可被确定为当前预测单元的最终预测模式,其中,通过参考包括在组合参考列表中的参考画面来对当前预测单元执行单向预测,通过使用包括在第一参考画面列表List0中的第一参考画面(L0画面)和包括在第二参考画面列表List1中的第二参考画面(L1画面)来对当前预测单元执行双向运动预测。当对代价进行比较时,可基于率失真确定具有较高效率的预测模式。
图14是示出根据本发明的实施例的由B画面中的预测单元参考的参考画面的示例的示图。
参照图14,参考画面A1430和参考画面B1420是画面顺序计数(POC)在当前画面1410的POC之前的在前画面,而参考画面C1440和参考画面D1450是POC在当前画面1410的POC之后的在后画面。
当当前画面1410是B画面时,基于帧内预测模式、单向预测模式、双向预测模式和直接预测模式中的一种预测模式对当前画面1410中的预测单元进行编码。在帧内预测模式下,通过使用邻近像素的值来对当前预测单元进行预测。在单向预测模式下,通过使用组合参考画面列表中的参考画面来对当前预测单元进行预测,其中,组合参考画面列表是第一参考画面列表List0和第二参考画面列表List1的组合。在双向预测模式下,通过使用一共两个参考画面(即,第一参考画面列表(List0)的第一参考画面和第二参考画面列表(List1)的第二参考画面)来对当前预测单元进行预测。在直接预测模式下,通过使用当前预测单元的邻近预测单元的运动矢量而产生的预测运动矢量用作当前预测单元的运动矢量,并且在该模式下,仅预测模式信息和残差信息用作用于编码的编码信息。
被单向地或双向地预测的B画面中的预测单元可被分类为:i)通过参考相同方向上的两个不同的参考画面而预测的预测单元;ii)通过参考不同方向上的两个不同参考画面而预测的预测单元;iii)通过参考单个参考画面两次而预测的预测单元;iv)通过参考任何单个参考画面一次而预测的预测单元。i)至iii)的预测单元与通过参考两个参考画面而双向地预测的预测单元相应,iv)的预测单元与通过使用单个参考画面而单向地预测的预测单元相应。
作为i)的示例,通过使用在当前画面1410之前的参考画面A1430的相应块1431与也在当前画面1410之前的参考画面B1420的相应块1421的均值,来对预测单元1411进行预测。作为ii)的示例,通过使用参考画面B1420的相应块1423与参考画面C1440的相应块1441的均值,来对预测单元1413进行预测。作为iii)的示例,通过使用参考画面A1430的相应块1432与1433的均值,来对预测单元1414进行预测。作为iv)的示例,通过使用参考画面D1450的相应块来对预测单元1415进行要预测。
如上所述,运动预测单元420通过针对每个预测单元使用多个参考画面来执行帧间预测,来产生预测单元的预测值。为了使解码器端能够产生预测单元的预测值,参考画面信息和预测方向信息(即,预测模式信息)必须被发送,其中参考画面信息和预测方向信息指示每个预测单元参考哪个画面。
图15A至图15C示出根据本发明的实施例的分配到参考画面的参考画面索引的示例。
运动预测单元420将两个参考画面用作被双向地预测的预测单元的参考画面,所述两个参考画面是第一参考画面列表(List0)的第一参考画面和第二参考画面列表(List1)的第二参考画面。为了分配指示第一参考画面列表(List0)中的每个参考画面的参考画面索引,如图15A所示,在前画面1520距离当前画面1510越近,被分配给在前画面1520的参考画面索引越小,并且随后,在后画面1530距离当前画面1510越近,被分配给在后画面1530的参考画面索引越小。为了分配指示第二参考列表(List1)中的每个参考画面的参考画面索引(L1_idx),如图15A所示,在后画面1530距离当前画面1510越近,被分配给在后画面1530的参考画面索引越小,并且随后,在前画面1520距离当前画面1510越近,被分配给在前画面1520的参考画面索引越小。
参照图15B,在第一参考画面列表(List0)中,以从最近的过去画面到在其之前的画面的顺序、以及从最近的未来画面到在其之后的最近的画面的顺序,分配参考画面索引。参照图15C,在第二参考画面列表(List1)0中,与第一参考画面列表(List0)相反,以从最近的未来画面到在其之后的最近的画面的顺序、并且随后以从最近的过去画面到在其之前的画面的顺序,分配参考画面索引。
如稍后将描述,代替在不进行任何改变的情况下对第一参考画面索引(L0_idx)和第二参考画面索引(L1_idx)进行编码,熵编码器450基于单向运动预测模式的情况的数量以及双向运动预测模式的情况的数量,对指示在当前预测单元的编码中使用的运动预测模式和参考画面的单个参考语法(Ref Syntax)进行编码,其中,第一参考画面索引(L0_idx)指示第一参考列表(List0)中的第一参考画面,第二参考画面索引(L1_idx)指示第二参考画面列表(List1)中的第二参考画面。
由运动预测单元420单向地预测的预测单元的参考画面信息也必须被发送到解码器端。可通过使用分配到组合参考画面列表(即,第一参考画面列表和第二参考画面列表的组合)中的参考画面的参考语法来发送指示单向预测中使用的参考画面的参考画面信息。
图16A和图16B示出根据本发明的实施例的在单向预测中使用的组合参考画面列表。
熵编码器450可产生组合参考画面列表(即,双向预测中使用的第一参考画面列表List0和第二参考画面列表List1的组合),将参考语法(RefSyntax)分配到包括在组合参考画面列表中的参考画面中的每个,并随后通过使用所分配的参考语法(Ref Syntax)对单向预测模式中使用的单向预测模式信息和参考画面信息进行编码。
例如,参照图16A,熵编码器450可沿箭头方向顺序地扫描第一参考画面列表List01610和第二参考画面列表List11620的参考画面,并可将重新扫描的参考画面包括在组合参考画面列表中,并从组合参考画面列表排除先前扫描的参考画面,从而产生组合参考画面列表1630。在组合参考画面列表中,第一参考画面列表List01610中的先前扫描的参考画面Ref41611、以及第二参考画面列表List11620中的先前扫描的参考画面Ref21621对于先前扫描的参考画面是重复的,因此不被重新添加到组合参考画面列表1630中。当通过使用组合参考画面列表上的参考画面来对当前预测单元进行单向运动预测时,熵编码器450将分配到单向预测中使用的参考画面的参考语法信息编码为当前预测单元的运动预测信息。例如,当通过使用参考画面Ref4对当前预测单元进行单向预测时,熵编码器450对关于当前预测单元的预测模式和参考画面信息的值为1的参考语法(Ref Syntax)进行编码。当在解码器端接收到值为1的参考语法(Ref Syntax)时,可确定当前预测单元通过参考参考画面Ref4被单向预测。
除上述图16A示出的方法之外,还可使用仅包括除第一参考画面列表和第二参考画面列表的重复的参考画面以外的不同的参考画面的各种方法,来产生组合参考画面列表。例如,参照图16B,熵编码器450可通过移除参考画面列表1640中的重复的参考画面1641和1642来产生组合参考列表1650,其中,通过顺序地扫描第一参考画面列表List0和第二参考列表List1中的参考画面来产生参考画面列表1640。在编码器端和解码器端,产生组合参考画面列表的方法可优选地设置为相同。如果通过使用各种方法来产生多个组合参考画面列表,则可将预定索引分配到产生组合参考画面列表的每个方法,并且可将在编码器端产生组合参考列表时使用的产生方法的索引另外发送到解码器端。如果在编码器端和解码器端预设了产生组合参考画面列表的方法,则不必发送上述的关于产生组合参考画面列表的方法的索引。
熵编码器450通过使用单个参考语法(Ref Syntax)来对关于单向预测模式、双向预测模式和根据每个预测模式的参考画面的信息进行编码。
如上所述,当通过使用组合参考画面列表上的参考画面来对当前预测单元进行单向预测时,熵编码器450将分配到在单向预测中使用的参考画面的参考语法信息编码为当前预测单元的运动预测信息。也就是说,在上述图16A的实施例中,当参考语法(Ref Syntax)的值为0时,它指示通过参考参考画面Ref2来对当前预测单元进行单向预测;当参考语法(Ref Syntax)的值为1时,它指示通过参考参考画面Ref4来单向地对当前预测单元进行预测;当参考语法的值为2时,它指示通过参考参考画面Ref1来对当前预测单元进行单向预测;当参考语法(Ref Syntax)的值为3时,它指示通过参考参考画面Ref5来对当前预测单元进行单向预测。
为了以与单向预测模式不同的方式对双向预测模式以及关于在双向预测模式中使用的两个参考画面(L0画面和L1画面)的信息进行编码,熵编码器450基于单向运动预测模式的情况的数量以及双向运动预测模式的情况的数量,将参考语法分配到双向预测模式中可用的参考画面的每个组合,并将分配到在当前预测单元的双向预测中使用的参考画面的组合的参考索引语法值编码为运动预测信息。
图17示出根据本发明的实施例的示出基于单向运动预测模式的情况的数量和双向运动预测模式的情况的数量而分配的指示单向运动预测模式和双向运动预测模式以及参考画面的参考语法值(Value)的表。
参考图17,MaxVal表示基于单向运动预测模式的情况的数量与双向运动预测模式的情况的数量的总和(Max Value)确定的值。MaxVal表示参考语法值(Value)的最大值,并且MaxVal=MaxValue-1。
如上所述,在单向运动预测模式下,情况的数量根据参考组合参考画面列表中的哪个参考画面而被分类,因此,单向运动预测模式的情况的数量由组合参考画面列表中的参考画面(NumOfRec_LC)的数量来确定。
当包括在第一参考画面列表中的参考画面的数量是NumOfRef_L0,包括在第二参考画面列表中的参考画面的数量是NumOfRef_L1,并且重复包括在第一参考画面列表和第二参考画面列表中的参考画面的数量是NumOfRedundancy时,包括在组合参考画面列表中的参考画面的数量(NumOfRec_LC)可以是指示未重复的参考画面的数量的NumOfRef_L0+NumOfRef_L1-NumOfRedundancy。
代替设置对于单向运动预测模式的每个可能的情况设置参考索引,可将图17中所示的参考语法分配多达MaxCombinedRefNum的数量,如果可能的情况的数量超过MaxCombinedRefNum,则可执行另外的处理。例如,当MaxCombinedRefNum是4时,熵编码器450可将参考语法分配到仅包括在组合参考画面列表中的第一参考画面至第四参考画面,并且当单向预测的当前预测单元的参考画面包括在组合参考画面列表上的参考画面中时,熵编码器450确定指示当前预测单元的单向预测模式和在其中使用的参考画面的单个参考语法,并对所述参考语法进行编码。如果由当前预测单元参考的参考画面没有在参考语法分配表中被预定义,则参考语法值可被编码为MaxValue。换句话说,如果参考语法的值为MaxValue,则这是除根据图17的预测模式和参考画面的情况以外的特殊情况,这里,另外的特殊的处理被执行。对于特殊的处理的当前预测单元,可对预测模式和参考画面信息另外进行编码。
当通过参考语法分配表预设的组合参考画面列表上的参考画面的最大数量限制为小于或等于MaxCombineRefNum时,包括在组合参考画面列表中的参考画面的数量(NumOfRec_LC)是min(MaxCombinedRefNum,NumOfRef_L0+NumOfRef_L1-NumOfRedundancy)。如果通过参考语法分配表预设的包括在第一参考画面列表和第二参考列表中的参考画面的数量限制为预定数量n(其中,n是整数),则NumOfRef_L0被控制为min(n,NumOfRef_L0),NumOfRef_L1被控制为min(n,NumOfRef_L1)。
双向运动预测模式的情况的数量根据第一参考画面列表List0中的哪个参考画面用作第一参考画面并且第二参考画面列表List1中的哪个参考画面用作第二参考画面来分类。因此,双向运动预测模式的情况的数量的值为NumOfRef_L0×NumOfRef_L1。例如,当两个参考画面包括在第一参考画面列表List0中,两个参考画面包括在第二参考画面列表List1中时,双向运动预测模式的情况的数量是2×2,即,总共四种情况。
因此,单向运动预测模式的情况的数量与双向运动要蹙额模式的情况的数量的总和(Max Value)具有根据以下等式的值:MaxValue=NumOfRef_LC+NumOfRef_L0×NumOfRef_L1。
因此,熵编码器450将从0到(Max Value-1)的值分配到单向运动预测模式中使用的参考画面以及双向运动预测模式中使用的参考画面的组合,并将所分配的值编码为参考语法(Value)的值,从而通过使用单个语法对关于运动预测模式的信息以及运动预测中使用的参考画面信息进行编码。
以下,将参照图17详细描述根据包括在第一参考画面列表(List0)和第二参考画面列表(List1)中的参考画面的数量以及包括在组合参考画面列表中的情况的数量自适应地确定参考语法的操作。将包括在第一参考列表(List0)和第二参考画面列表(List1)中的每个中的参考画面的最大数量假设为两个。此外,图17中的运动预测模式(InterDir)表示运动预测方向,LC表示使用组合参考画面列表的单向运动预测模式,BI表示双向运动预测模式,其中,在双向运动预测模式中使用第一参考画面列表(List0)的第一参考画面(L0画面)和第二参考画面列表(List1)的第二参考画面(L1画面)。另外,图17中的参考画面索引(Refldx)指示单向运动预测模式或双向运动预测模式中的使用的参考画面,单向运动预测模式(LC)中的Refldx是如同以上参照图16A描述的参考语法(Ref Syntax)的指示组合参考画面列表上的参考画面的值。关于作为双向运动预测模式BI中的Refldx的(x,y)(x和y是0或1),x值指示第一参考画面列表(List0)的第一参考画面(L0画面)的参考画面索引,y值指示第二参考画面列表(List1)的第二参考画面(L1画面)的参考画面索引。例如,如果(Refldx)=(0,0),则这指示这样的双向运动预测模式:使用第一参考画面列表(List0)的具有值Refldx=0的第一参考画面(L0画面)以及第二参考画面列表(List1)的具有值Refldx=0的第二参考画面(L1画面)。
a)如果MaxVal=1(标号1710)
如果第一参考画面列表(List0)和第二参考画面列表(List1)均仅包括一幅参考画面(L0=1,L1=1),则L0画面和L1画面相同,由于L0画面和L1画面相同,因此仅一幅参考画面包括在组合参考画面列表中。因此,仅存在一种仅通过使用一幅参考画面来执行的单向运动预测的情况,并且仅存在一种通过使用一幅参考画面(L0,L1)两次来执行的双向运动预测的情况。
因此,当单向运动预测被执行时,熵编码器1410将0分配为参考语法(RefSyntax)的值;并且当双向运动预测被执行时,熵编码器1410将1分配为参考语法(Ref Syntax)的值,根据应用到当前预测单元的预测模式将0或1编码为当前预测单元的运动信息。
在解码器端,如果第一参考画面列表(List0)和第二参考画面列表(List1)均仅包括一幅参考画面(L0=1,L1=1),并且L0画面和L1画面相同,并且0被接收为参考语法(Ref Syntax),则单向运动预测使用L0画面(或L1画面)来执行,当1被接收时,双向运动预测通过参考L0画面(或L1画面)两次来执行。
b)如果MaxVal=2(标号1720)
如果第一参考画面列表(List0)和第二参考画面列表(List1)均仅包括一幅参考画面,并且L0画面和L1画面不相同(L0=1,L1=1),则由于总共两张参考画面包括在组合参考列表中,因此存在两种使用两张参考画面的单向运动预测的情况。另外,仅存在一种通过参考第一参考列表(List0)和第二参考画面列表(List1)中的每个参考画面(L0画面和L1画面)来执行的双向运动预测的情况。
因此,熵编码器1410根据在当前画面的预测单元的单向运动预测期间哪个参考画面被使用而将0或1分配为参考语法(Ref Syntax)的值,当双向运动预测被执行时,将2分配为参考语法(Ref Syntax)的值,并且根据应用到当前预测单元的预测模式和参考画面来将0至2中的一个编码为运动信息。
在解码器端,如果第一参考列表(List0)和第二参考画面列表(List1)均仅包括一幅参考画面(L0=1,L1=1),并且L0画面和L1画面不相同,并且0被接收为参考语法(Ref Syntax),则使用包括在组合参考画面列表中的两个参考画面中的第一参考画面来执行单向运动预测,当1被接收为参考语法(RefSyntax)时,使用包括在组合参考画面列表中的两个参考画面中的第二参考画面来执行单向运动预测。此外,在解码器端,当2被接收为参考语法(RefSyntax)时,通过参考L0画面和L1画面来执行双向运动预测。
c)如果MaxVal=3(标号1730)
如果第一参考列表(List0)包括两个参考画面并且第二参考画面列表(List1)仅包括一幅参考画面(L0=2,L1=1),并且L0画面和L1画面中的一个重复,则总共两张参考画面包括在组合参考画面列表中。因此,存在两种使用两张参考画面的单向运动预测的情况。另外,存在通过参考第一参考列表(List0)和第二参考画面列表(List1)中的每个参考画面(L0画面和L1画面)来执行的两种双向运动预测的情况((0,0),(1,0))。
因此,熵编码器1410根据在当前画面的预测单元的单向运动预测期间哪个参考画面被使用来将0或1分配为参考语法(Ref Syntax)的值,当双向运动预测被执行时,将2或3分配为参考语法(Ref Syntax)的值,并且根据应用到当前预测单元的预测模式和参考画面来将0至3中的一个编码为运动信息。
在解码器端,如果第一参考列表(List0)包括两张参考画面,并且第二参考画面列表(List1)仅包括一幅参考画面(L0=2,L1=1),L0画面和L1画面中的一个重复,并且0被接收为参考语法(Ref Syntax),则使用包括在组合参考画面列表中的两个参考画面中的第一参考画面来执行单向运动预测,当1被接收为参考语法(Ref Syntax)时,使用包括在组合参考画面列表中的两个参考画面中的第二参考画面来执行单向运动预测。此外,在解码器端,当2被接收为参考语法(Ref Syntax)时,第一参考画面列表(List0)中的第一参考索引的参考画面被确定为L0画面,第二参考画面列表(List1)中的参考画面被确定为L1画面,并且随后双向运动预测被执行。在解码器端,当3被接收为参考语法(Ref Syntax)时,第二参考索引的参考画面被确定为第一参考画面列表(List0)中的L0画面,第二参考画面列表(List1)中的参考画面被确定为L1画面,并且随后双向运动预测被执行。
d)如果MaxVal=3(标号1740)
如果第一参考画面列表(List0)仅包括一幅参考画面,第二参考画面列表(List1)包括两张参考画面(L0=1,L1=2),并且L0画面和L1画面中的一个重复,则总共两张参考画面包括在组合参考画面列表中。因此,存在两种使用两张参考画面的单向运动预测的情况。另外,存在两种通过参考第一参考列表(List0)和第二参考画面列表(List1)中的每个参考画面(L0画面和L1画面)来执行的双向运动预测的情况((0,0),(1,0))。
因此,熵编码器1410根据在当前画面的预测单元的单向运动预测期间哪个参考画面被使用来将0或1分配为参考语法(Ref Syntax),当双向预测被执行时,将2或3分配为参考语法(Ref Syntax)的值,并且根据应用到当前预测单元的预测模式和参考画面来将0至3中的一个编码为运动信息。
在解码器端,如果第一参考画面列表(List0)包括一幅参考画面,第二参考画面列表(List1)包括两张参考画面(L0=1,L1=2),并且L0画面和L1画面中的一个重复,并且0被接收为参考语法(Ref Syntax),则使用包括在组合参考画面列表中的两个参考画面中的第一参考画面来执行单向运动预测,当1被接收为参考语法(Ref Syntax)时,使用包括在组合参考画面列表中的两个参考画面中的第二参考画面来执行单向运动预测。此外,在解码器端,当2被接收为参考语法(Ref Syntax)时,第一参考画面列表(List0)中的一幅参考画面被确定为L0画面,第二参考画面列表(List1)中的第一参考画面被确定为L1画面,并且随后双向运动预测被执行。在解码器端,当3被接收为参考语法(Ref Syntax)时,第一参考画面列表(List0)中的一幅参考画面被确定为L0画面,第二参考画面列表(List1)中的第二参考画面被确定为L1画面,随后双向运动预测被执行。
e)如果MaxVal=5(标号1750)
如果第一参考画面列表(List0)包括两个参考画面,第二参考画面列表(List1)仅包括一幅参考画面(L0=2,L1=1),并且L0画面和L1画面中不存在重复的画面,则总共三张参考画面包括在组合参考画面列表中。因此,存在三种使用三张参考画面的单向运动预测的情况。另外,存在两种通过参考第一参考列表(List0)和第二参考画面列表(List1)中的每个参考画面(L0画面和L1画面)来执行的双向运动预测的情况((0,0),(1,0))。
因此,熵编码器1410根据在当前画面的预测单元的单向运动预测期间哪个参考画面被使用来将0至2中的一个分配为参考语法(Ref Syntax),当双向预测被执行时,将3或4分配为参考语法(Ref Syntax)的值,并且根据应用到当前预测单元的预测模式和参考画面来将0至4中的一个编码为运动信息。
在解码器端,如果第一参考列表(List0)包括两张参考画面,并且第二参考画面列表(List1)仅包括一幅参考画面(L0=2,L1=1),并且L0画面和L1画面中不存在重复画面,并且0被接收为参考语法(Ref Syntax),则使用包括在组合参考画面列表中的三个参考画面中的第一参考画面来执行单向运动预测,当1被接收为参考语法(Ref Syntax)时,使用包括在组合参考画面列表中的三个参考画面中的第二参考画面来执行单向运动预测,当2被接收为参考语法(Ref Syntax)时,使用包括在组合参考画面列表中的三个参考画面中的第三参考画面来执行单向运动预测。
此外,在解码器端,当3被接收为参考语法(Ref Syntax)时,第一参考画面列表(List0)中的第一参考索引的参考画面被确定为L0画面,第二参考画面列表(List1)中的一幅参考画面被确定为L1画面,并且随后双向运动预测被执行。在解码器端,当4被接收为参考语法(Ref Syntax)时,第一参考画面列表(List0)中的第二参考索引的参考画面被确定为L0画面,第二参考画面列表(List1)中的一幅参考画面被确定为L1画面,并且随后双向运动预测被执行。
f)如果MaxVal=4(标号1760)
如果第一参考画面列表(List0)仅包括一幅参考画面,第二参考画面列表(List1)包括两张参考画面(L0=1,L1=2),并且L0画面和L1画面中不存在重复,则总共三张参考画面包括在组合参考画面列表中。因此,存在三种使用三张参考画面的单向运动预测的情况。另外,存在两种通过参考第一参考列表(List0)和第二参考画面列表(List1)中的每个参考画面(L0画面和L1画面)来执行的双向运动预测的情况((0,0),(1,0))。
因此,熵编码器1410根据在当前画面的预测单元的单向运动预测期间哪个参考画面被使用来将0至2中的一个分配为参考语法(Ref Syntax),当双向预测被执行时,将3或4分配为参考语法(Ref Syntax)的值,并且根据应用到当前预测单元的预测模式和参考画面来将0至4中的一个编码为运动信息。
在解码器端,如果第一参考列表(List0)包括两张参考画面,并且第二参考画面列表(List1)仅包括一幅参考画面(L0=2,L1=1),并且L0画面和L1画面中不存在重复画面,并且0被接收为参考语法(Ref Syntax),则使用包括在组合参考画面列表中的三个参考画面中的第一参考画面来执行单向运动预测,当1被接收为参考语法(Ref Syntax)时,使用包括在组合参考画面列表中的三个参考画面中的第二参考画面来执行单向运动预测,当2被接收为参考语法(Ref Syntax)时,使用包括在组合参考画面列表中的三个参考画面中的第三参考画面来执行单向运动预测。
此外,在解码器端,当3被接收为参考语法(Ref Syntax)时,第一参考画面列表(List0)中的一幅参考画面被确定为L0画面,第二参考画面列表(List1)中的第一参考画面被确定为L1画面,并且随后双向运动预测被执行。在解码器端,当4被接收为参考语法(Ref Syntax)时,第一参考画面列表(List0)中的一幅参考画面被确定为L0画面,第二参考画面列表(List1)中的第二参考画面被确定为L1画面,并且随后双向运动预测被执行。
g)如果MaxVal=5(标号1770)
如果第一参考画面列表(List0)和第二参考画面列表(List1)均包括两张参考画面(L0=2,L1=2),并且L0画面和L1画面的两个参考画面重复,则总共两张参考画面包括在组合参考画面列表中。因此,存在两种使用两张参考画面来执行的单向运动预测的情况。另外,存在四种使用第一参考画面列表(List0)和第二参考画面列表(List1)中的每个参考画面(L0画面和L1画面)来执行的双向运动预测的情况((0,0),(0,1),(1,0),(1,1))。
因此,熵编码器1410根据在当前画面的预测单元的单向运动预测期间哪个参考画面被使用来将0或1分配为参考语法(Ref Syntax)的值,当双向预测被执行时,将2至5中的一个分配为参考语法(Ref Syntax)的值,并且根据应用到当前预测单元的预测模式和参考画面来将0至5中的一个编码为运动信息。
在解码器端,如果第一参考列表(List0)和第二参考画面列表(List1)均包括两张参考画面(L0=2,L1=2),并且L0画面和L1画面中的两张参考画面重复,并且0被接收为参考语法(Ref Syntax),则使用包括在组合参考画面列表中的两个参考画面的第一参考画面来执行单向运动预测,当1被接收为参考语法(Ref Syntax)时,使用包括在组合参考画面列表中的两个参考画面的第二参考画面来执行单向运动预测。
此外,在解码器端,当2被接收为参考语法(Ref Syntax)时,第一参考画面列表(List0)中的第一参考画面被确定为L0画面,第二参考画面列表(List1)中的第一参考画面被确定为L1画面,并且随后双向运动预测被执行。在解码器端,当3被接收为参考语法(Ref Syntax)时,第一参考画面列表(List0)中的第一参考画面被确定为L0画面,第二参考画面列表(List1)中的第二参考画面被确定为L1画面,并且随后双向运动预测被执行。在解码器端,当4被接收为参考语法(Ref Syntax)时,第一参考画面列表(List0)中的第二参考画面被确定为L0画面,第二参考画面列表(List1)中的第一参考画面被确定为L1画面,并且随后双向运动预测被执行。在解码器端,当5被接收为参考语法(Ref Syntax)时,第一参考画面列表(List0)中的第二参考画面被确定为L0画面,第二参考画面列表(List1)中的第二参考画面被确定为L1画面,并且随后双向运动预测被执行。
h)如果MaxVal=6(标号1780)
如果第一参考画面列表(List0)和第二参考画面列表(List1)均包括两张参考画面(L0=2,L1=2),并且L0画面和L1画面的一个参考画面重复,则总共三张参考画面包括在组合参考画面列表中。因此,存在三种使用三张参考画面来执行的单向运动预测的情况。另外,存在四种使用第一参考画面列表(List0)和第二参考画面列表(List1)中的每个参考画面(L0画面和L1画面)来执行的双向运动预测的情况((0,0),(0,1),(1,0),(1,1))。
因此,熵编码器1410根据在当前画面的预测单元的单向运动预测期间哪个参考画面被使用来将0至2中的一个分配为参考语法(Ref Syntax)的值,当双向预测被执行时,将3至6中的一个分配为参考语法(Ref Syntax)的值,并且根据应用到当前预测单元的预测模式和参考画面来将0至6中的一个编码为运动信息。
在解码器端,如果第一参考列表(List0)和第二参考画面列表(List1)均包括两张参考画面(L0=2,L1=2),并且L0画面和L1画面中的一幅参考画面重复,则当0被接收为参考语法(Ref Syntax)时,使用包括在组合参考画面列表中的三个参考画面的第一参考画面来执行单向运动预测,当1被接收为参考语法(Ref Syntax)时,使用包括在组合参考画面列表中的三个参考画面的第二参考画面来执行单向运动预测,当2被接收为参考语法(Ref Syntax)时,使用包括在组合参考画面列表中的三个参考画面的第三参考画面来执行单向运动预测。
在解码器端,当3被接收为参考语法(Ref Syntax)时,第一参考画面列表(List0)中的第一参考画面被确定为L0画面,第二参考画面列表(List1)中的第一参考画面被确定为L1画面,并且随后双向运动预测被执行。在解码器端,当4被接收为参考语法(Ref Syntax)时,第一参考画面列表(List0)中的第一参考画面被确定为L0画面,第二参考画面列表(List1)中的第二参考画面被确定为L1画面,并且随后双向运动预测被执行。在解码器端,当5被接收为参考语法(Ref Syntax)时,第一参考画面列表(List0)中的第二参考画面被确定为L0画面,第二参考画面列表(List1)中的第一参考画面被确定为L1画面,并且随后双向运动预测被执行。在解码器端,当6被接收为参考语法(Ref Syntax)时,第一参考画面列表(List0)中的第二参考画面被确定为L0画面,第二参考画面列表(List1)中的第二参考画面被确定为L1画面,并且随后双向运动预测被执行。
i)如果MaxVal=7(标号1790)
如果第一参考画面列表(List0)和第二参考画面列表(List1)均包括两张参考画面(L0=2,L1=2),并且L0画面和L1画面中不存在重复的画面,则总共四张参考画面包括在组合参考画面列表中。因此,存在四种使用四张参考画面来执行的单向运动预测的情况。另外,存在四种使用第一参考画面列表(List0)和第二参考画面列表(List1)中的每个参考画面(L0画面和L1画面)来执行的双向运动预测的情况((0,0),(0,1),(1,0),(1,1))。
因此,熵编码器1410根据在当前画面的预测单元的单向运动预测期间哪个参考画面被使用来将0至3中的一个分配为参考语法(Ref Syntax)的值,当双向预测被执行时,将4至7中的一个分配为参考语法(Ref Syntax)的值,并且根据应用到当前预测单元的预测模式和参考画面来将0至7中的一个编码为运动信息。
在解码器端,如果第一参考列表(List0)和第二参考画面列表(List1)均包括两张参考画面(L0=2,L1=2),并且L0画面和L1画面中不存在重复的画面,并且0被接收为参考语法(Ref Syntax),则使用包括在组合参考画面列表中的四个参考画面的第一参考画面来执行单向运动预测;当1被接收为参考语法(Ref Syntax)时,使用包括在组合参考画面列表中的四个参考画面的第二参考画面来执行单向运动预测;当2被接收为参考语法(Ref Syntax)时,使用包括在组合参考画面列表中的四个参考画面的第三参考画面来执行单向运动预测;当3被接收为参考语法(Ref Syntax)时,使用包括在组合参考画面列表中的四个参考画面的第四参考画面来执行单向运动预测。
在解码器端,当4被接收为参考语法(Ref Syntax)时,第一参考画面列表(List0)中的第一参考画面被确定为L0画面,第二参考画面列表(List1)中的第一参考画面被确定为L1画面,并且随后双向运动预测被执行。在解码器端,当5被接收为参考语法(Ref Syntax)时,第一参考画面列表(List0)中的第一参考画面被确定为L0画面,第二参考画面列表(List1)中的第二参考画面被确定为L1画面,并且随后双向运动预测被执行。在解码器端,当6被接收为参考语法(Ref Syntax)时,第一参考画面列表(List0)中的第二参考画面被确定为L0画面,第二参考画面列表(List1)中的第一参考画面被确定为L1画面,并且随后双向运动预测被执行。在解码器端,当7被接收为参考语法(Ref Syntax)时,第一参考画面列表(List0)中的第二参考画面被确定为L0画面,第二参考画面列表(List1)中的第二参考画面被确定为L1画面,并且随后双向运动预测被执行。
如上所述,熵编码器450针对可用于单向运动预测模式的参考画面与可用于双向运动预测模式的参考画面的每个组合分配0至(MaxValue-1)中的一个,对与应用于当前预测单元的相关运动预测模式和参考画面相应的参考语法的值进行编码,从而通过使用单个参考语法对当前预测单元的运动预测模式和参考画面信息进行编码。
也就是说,熵编码器450可基于组合参考画面列表中的参考画面的数量NumOfRef_LC,根据组合参考画面列表中的用作被单向运动预测的当前预测单元的预测模式信息和参考画面信息的参考画面索引,分配从0到(NumOfRef_LC-1)的值,从而对当前预测单元的运动信息进行编码。此外,熵编码器450可根据第一参考画面列表(List0)和第二参考画面列表(List1)中的第一参考画面和第二参考画面中的哪一个被使用,来分配从NumOfRef_LC至(MaxValue-1)的值并将当前预测单元的运动信息编码为被双向运动预测的当前预测单元的预测模式信息和参考画面信息。
此外,如果参考语法(Ref Syntax)的值为MaxValue,则熵编码器450可设置不是通过使用预设参考语法来指示运动预测模式和参考画面的情况的特殊情况。
熵编码器450可通过使用截断一元二值化方法来对参考语法(RefSyntax)进行二值化以产生比特流。
图18示出根据本发明的实施例的对参考语法信息进行二值化的处理的示例。
参照图18,当熵编码器450对参考语法(Ref Syntax)进行编码时,熵编码器450可通过使用截断一元二值化方法对参考语法的值进行二值化。也就是说,熵编码器450可输出与如图17所示的参考语法值(Value)相应的1以及随后的0,从而对参考语法进行二值化。如果参考语法没有通过如图17所示的参考语法分配表被预先定义,则熵编码器450可通过输出由(MaxValue-1)个1组成的二值化比特串,来指示没有预先定义的该特殊情况。例如,如果通过使用参考语法预设的单向运动预测模式和双向运动预测模式的情况的总数量(MaxValue)是7,并且当前预测单元通过语法参考索引来设置,则熵编码器450根据与当前预测单元相应的参考语法的值来输出如图18所示的由连续的1和在连续的1之后的单个0组成的二值化比特串。熵编码器450将参考语法(Ref Syntax)的值为7的情况设置为没有使用单向预测模式和双向预测模式的预设组合的特殊情况,并输出指示该特殊处理的信息的“1111111”。
图19是示出根据本发明的实施例的图像编码方法的流程图。
参照图19,在操作1910,熵编码器450获得第一参考画面列表,第二参考画面列表和组合参考画面列表,其中,组合参考画面列表是包括在第一参考画面列表中的参考画面与包括在第二参考画面列表中的参考画面的组合。如上所述,当包括在第一参考画面列表中的参考画面的数量是NumOfRef_L0,并且包括在第二参考画面列表中的参考画面的数量是NumOfRef_L1,并且重复地包括在第一参考画面列表和第二参考画面列表中的参考画面的数量是NumOfRedundancy时,组合参考画面列表可包括NumOfRef_L0+NumOfRef_L1-NumOfRedundancy个没有重复的参考画面。
在操作1920,运动预测单元420通过使用包括在组合参考画面列表中的参考画面来执行关于当前预测单元的单向运动预测,并通过使用第一参考画面列表和第二参考画面列表来执行关于当前预测单元的双向运动预测,并将具有较低代价(cost)的运动预测模式确定为当前预测单元的预测模式。
在操作1930,熵编码器450基于单向运动预测模式的情况的数量和双向运动预测模式的情况的数量,对指示在当前预测单元的编码中使用的运动预测模式和参考画面的参考语法进行编码。熵编码器450可根据用作被单向运动预测的当前预测单元的预测运动信息和参考画面信息的组合参考画面列表的参考画面索引,来分配从0到(NumOfRef_LC-1)的值,从而对当前预测单元的运动信息进行编码。此外,熵编码器450可根据第一参考画面列表(List0)和第二参考画面列表(List1)中的第一参考画面和第二参考画面中的哪一个用作被双向运动预测的当前预测单元的预测模式信息和参考画面信息,来分配从NumOfRef_LC到(MaxValue-1)的值,从而对当前预测单元的运动信息进行编码。此外,当参考语法(Ref Syntax)的值为MaxValue时,熵编码器450可通过设置不相应于预设单向预测模式或预设双向运动预测模式的特殊情况,来对当前预测单元的运动信息进行编码。
在解码期间,图5的熵解码器520获得第一参考画面列表,第二参考画面列表和组合参考画面列表,其中,组合参考画面列表是包括在第一参考画面列表中的参考画面与包括在第二参考画面列表中的参考画面的组合;基于单向运动预测模式的情况的数量和双向运动预测模式的情况的数量,根据当前预测单元的编码中使用的运动预测模式和参考画面,确定参考语法的值,其中,在单向运动预测模式中包括在组合参考列表中的参考画面被使用,在双向运动预测模式中,第一参考画面列表和第二参考画面列表被使用。
详细地,以与上述的熵编码器450相同的方式,熵解码器520根据以下等式计算单向运动预测模式的情况的数量与双向运动预测模式的情况的数量的总和MaxValue:MaxValue=NumOfRef_LC+NumOfRef_L0×NumOfRef_L1,并且随后如果参考语法(Ref Syntax)是从0到(NumOfRef_LC-1)的值,则通过参考NumOfRef_LC个组合参考画面列表中的参考画面来指示单向运动预测,当参考语法具有从NumOfRef_LC到(MaxValue-1)的值时,将双向运动预测模式确定为运动预测模式,其中,在双向运动预测模式中根据第一参考列表的第一参考画面和第二参考画面列表的第二参考画面的组合的两个参考画面被使用。如上所述,可基于参考语法本身确定关于单向预测模式和双向运动预测模式中的哪个预测模式应用于当前预测单元的预测的信息以及当前单元的预测中使用的关于参考画面的信息。
运动补偿单元560可预测模式信息和参考画面来对当前预测单元执行单向运动补偿和双向运动补偿,从而产生当前预测单元的预测值,其中,基于通过使用熵解码器520而获得的当前预测单元的参考语法来确定所述预测模式信息和参考画面。
图20是示出根据本发明的实施例的图像解码方法的流程图。
参照图20,在操作2010,熵解码器520获得第一参考画面列表,第二参考画面列表和组合参考画面列表,其中,组合参考画面列表是包括在第一参考画面列表中的参考画面与包括在第二参考画面列表中的参考画面的组合。在操作2020,熵解码器520基于单向运动预测模式的情况的数量和双向运动预测模式的情况的数量,根据当前预测单元的编码中使用的运动预测模式和参考画面,确定参考语法的值,其中,在单向运动预测模式中包括在组合参考列表中的参考画面被使用,在双向运动预测模式中,第一参考画面列表和第二参考画面列表被使用。
在操作2030,熵解码器520从比特流获得当前预测单元的参考语法。如上所述,通过截断一元二值化方法来对参考语法进行编码,并且可基于预测模式的情况的总数量(MaxValue)确定当前参考语法指示图17中示出的预测模式的多种情况中的哪个情况。
在操作2040,熵解码器520可通过使用参考语法的值来确定当前预测单元的运动预测模式和参考画面,并且在操作2050,运动补偿单元560可通过使用确定的运动预测模式和确定的参考画面来对当前预测单元执行运动补偿,以产生当前预测单元的预测值。
本发明还可被实施为计算机可读记录介质上的计算机可读代码。计算机可读记录介质是可存储其后可由计算机系统读取的数据的任何数据存储装置。计算机可读记录介质的示例包括只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘、光学数据存储装置等。计算机可读记录介质还可分布于联网的计算机系统,从而以分布的方式存储和执行计算机可读代码。
虽然已参照本发明的示例性实施例具体地示出和描述了本发明,本领域的普通技术人员将理解,在不脱离由权利要求限定的本发明的精神和范围的情况下,可在形式和细节上进行各种改变。因此,本发明的范围不由本发明的详细描述而由权利要求来限定,并且在所述范围之内的所有不同将被解释为包括在本发明中。

Claims (15)

1.一种图像编码方法,包括:
获得第一参考画面列表、第二参考画面列表和组合参考画面列表,其中,所述组合参考画面列表是包括在第一参考画面列表中的参考画面与包括在第二参考画面列表中的参考画面的组合;
通过使用单向运动预测模式和双向预测模式之一来对当前预测单元进行编码,其中,在单向运动预测模式中通过使用包括在组合参考画面列表中的参考画面来对当前预测单元执行单向运动预测,在双向预测模式中通过使用第一参考画面列表和第二参考画面列表来对当前预测单元执行双向运动预测;
基于单向运动感预测模式的情况的数量和双向运动预测模式的情况的数量,来对指示在当前预测单元的编码中使用的运动预测模式和参考画面的参考语法进行编码。
2.如权利要求1所述的图像编码方法,其中,在参考语法的编码中,不同值的参考语法被分配用于单向运动预测模式中可用的参考画面中的每个以及双向运动预测模式中可用的参考画面的组合,并且对与当前预测单元的运动预测模式以及当前预测单元的运动预测中使用的参考画面相应的参考语法的值进行编码。
3.如权利要求2所述的图像编码方法,其中,当包括在组合参考列表中的参考画面的数量是NumOfRef_LC,包括在第一参考列表中的参考画面的数量是NumOFRef_L0,包括在第二参考画面列表中的参考画面的数量是NumOfRef_L1,并且当前预测单元的单向运动预测和双向运动预测的所有情况的数量是MaxValue时,MaxValue具有根据以下等式确定的值;MaxValue=NumOfRef_LC+NumOfRef_L0×NumOfRef_L1,
其中,将从0到(MaxValue-1)的值中的一个分配为用于单向运动预测模式中可用的参考画面中的每个以及双向运动预测模式中可用的参考画面的组合的参考语法。
4.如权利要求3所述的图像编码方法,其中,当重复地包括在第一参考画面列表和第二参考画面列表中的参考画面的数量是NumOfRedundancy时,NumOfRef_L0+Numofref_l1-NumOfRedundancy个未重复的参考画面包括在组合参考画面列表中。
5.如权利要求3所述的图像编码方法,其中,当单向地运动预测当前预测单元时,根据当前预测单元参考的组合参考画面列表的参考画面将从0到(NumOfRef_LC-1)的值编码为当前预测单元的参考语法。
6.如权利要求3所述的图像编码方法,其中,当对当前预测单元进行双向运动预测时,根据由当前预测单元参考的第一参考画面列表的第一参考画面以及第二参考画面列表的第二参考画面的组合,将从(NumOfRef_LC)到(MaxValue-1)的值编码为当前预测单元的参考语法。
7.如权利要求3所述的图像编码方法,其中,当参考语法的值为MaxValue时,指示特殊情况,其中,在特殊情况中没有使用单向运动预测模式的参考画面和双向运动预测模式的参考画面的组合。
8.一种图像解码方法,包括:
获得第一参考画面列表、第二参考画面列表和组合参考画面列表,其中,组合参考画面列表是包括在第一参考画面列表中的参考画面与包括在第二参考画面列表中的参考画面的组合;
基于单向运动预测模式的情况的数量和双向运动预测模式的情况的数量,根据当前预测单元的编码中使用的运动预测模式和参考画面,确定参考语法的值,其中,在单向运动预测模式中,包括在组合参考列表中的参考画面被使用,在双向运动预测模式中,第一参考画面列表和第二参考画面列表被使用;
从比特流获得当前预测单元的参考语法;
通过使用参考语法的值来确定当前预测单元的运动预测模式和参考画面:
通过使用确定的运动预测模式和确定的参考画面来对当前预测单元执行运动补偿。
9.如权利要求8所述的图像解码方法,其中,在第一参考画面列表中,以从距离当前画面最近的在前参考画面到在所述在后参考画面之前的参考画面的顺序分配参考画面索引,在第二参考画面列表中,以从距离当前画面最近的在后参考画面到在所述在后参考画面之后的参考画面的顺序分配参考画面索引。
10.如权利要求8所述的图像解码方法,其中,参考语法具有分配给单向运动预测模式中可用的参考画面中的每个以及双向运动预测模式中可用的参考画面的组合的值。
11.如权利要求10所述的图像解码方法,其中,当包括在组合参考列表中的参考画面的数量是NumOfRef_LC,包括在第一参考列表中的参考画面的数量是NumOFRef_L0,包括在第二参考画面列表中的参考画面的数量是NumOfRef_L1,并且当前预测单元的单向运动预测和双向运动预测的所有情况的数量是MaxValue时,MaxValue具有根据以下等式确定的值;MaxValue=NumOfRef_LC+NumOfRef_L0×NumOfRef_L1,
其中,将从0到(MaxValue-1)的值中的一个分配为用于单向运动预测模式中可用的参考画面中的每个以及双向运动预测模式中可用的参考画面的组合的参考语法。
12.如权利要求11所述的图像解码方法,其中,当重复地包括在第一参考画面列表和第二参考画面列表中的参考画面的数量是NumOfRedundancy时,NumOfRef_L0+Numofref_l1-NumOfRedundancy个未重复的参考画面包括在组合参考画面列表中。
13.如权利要求11所述的图像解码方法,其中,当对当前预测单元进行单向运动预测时,根据当前预测单元参考的组合参考画面列表的参考画面将从0到(NumOfRef_LC-1)的值编码为当前预测单元的参考语法。
14.如权利要求11所述的图像解码方法,其中,当当前预测单元进行双向运动预测时,根据由当前预测单元参考的第一参考画面列表的第一参考画面以及第二参考画面列表的第二参考画面的组合,将从(NumOfRef_LC)到(MaxValue-1)的值编码为当前预测单元的参考语法。
15.如权利要求11所述的图像解码方法,其中,当参考语法的值为MaxValue时,指示特殊情况,其中,在特殊情况中没有使用单向运动预测模式的参考画面和双向运动预测模式的参考画面的组合。
CN201280022824.8A 2011-03-11 2012-03-12 用于对图像进行编码的方法和设备以及用于进行解码的方法和设备 Pending CN103563382A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161451789P 2011-03-11 2011-03-11
US61/451,789 2011-03-11
PCT/KR2012/001793 WO2012124961A2 (ko) 2011-03-11 2012-03-12 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치

Publications (1)

Publication Number Publication Date
CN103563382A true CN103563382A (zh) 2014-02-05

Family

ID=46831195

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280022824.8A Pending CN103563382A (zh) 2011-03-11 2012-03-12 用于对图像进行编码的方法和设备以及用于进行解码的方法和设备

Country Status (6)

Country Link
US (1) US20140003521A1 (zh)
EP (1) EP2685722A4 (zh)
JP (1) JP5801908B2 (zh)
KR (2) KR20120104128A (zh)
CN (1) CN103563382A (zh)
WO (1) WO2012124961A2 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105578180A (zh) * 2014-10-16 2016-05-11 联想(北京)有限公司 一种编码方法及装置
CN109417641A (zh) * 2016-07-05 2019-03-01 株式会社Kt 用于处理视频信号的方法和装置
CN109479149A (zh) * 2016-07-05 2019-03-15 株式会社Kt 视频信号处理方法和设备
WO2020187222A1 (zh) * 2019-03-18 2020-09-24 杭州海康威视数字技术股份有限公司 一种编解码方法、装置及其设备
CN115134595A (zh) * 2015-06-05 2022-09-30 杜比实验室特许公司 用于执行帧间预测的图像编解码方法、比特流存储方法

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL2658263T3 (pl) * 2010-12-22 2023-03-13 Lg Electronics Inc. Sposób predykcji wewnątrzramkowej i urządzenie wykorzystujące ten sposób
US8934552B2 (en) 2011-03-31 2015-01-13 Qualcomm Incorporated Combined reference picture list construction and mapping
WO2012177052A2 (ko) 2011-06-21 2012-12-27 한국전자통신연구원 인터 예측 방법 및 그 장치
KR20120140592A (ko) 2011-06-21 2012-12-31 한국전자통신연구원 움직임 보상의 계산 복잡도 감소 및 부호화 효율을 증가시키는 방법 및 장치
US20130114710A1 (en) * 2011-11-08 2013-05-09 Samsung Electronics Co., Ltd. Method and apparatus for encoding video by prediction using reference picture list, and method and apparatus for decoding video by performing compensation using reference picture list
US20130121417A1 (en) * 2011-11-16 2013-05-16 Qualcomm Incorporated Constrained reference picture sets in wave front parallel processing of video data
KR102460288B1 (ko) * 2012-01-19 2022-10-27 브이아이디 스케일, 인크. 비디오 코딩 기준 화상 목록들을 시그널링하고 구성하는 방법 및 장치
KR102137149B1 (ko) 2012-03-02 2020-07-23 선 페이턴트 트러스트 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치, 화상 복호 장치 및 화상 부호화 복호 장치
US9560369B2 (en) * 2012-09-28 2017-01-31 Lg Electronics Inc. Video decoding method and apparatus using the same
CN105075269B (zh) * 2013-04-04 2018-07-03 夏普株式会社 图像解码装置、图像编码装置及计算机可读取的记录介质
CN112188206B (zh) * 2014-10-31 2023-10-20 三星电子株式会社 使用高精度跳过编码的视频编码设备和视频解码设备及其方法
CN113473122A (zh) 2016-07-05 2021-10-01 株式会社Kt 对视频进行解码或编码的方法和计算机可读介质
JP2018007278A (ja) * 2017-10-11 2018-01-11 株式会社東芝 復号方法及び復号装置
JP2018007279A (ja) * 2017-10-11 2018-01-11 株式会社東芝 復号方法及び復号装置
WO2019083120A1 (ko) * 2017-10-23 2019-05-02 엘지전자 주식회사 360도 비디오에 대한 영상 코딩 시스템에서 회전된 360도 비디오를 프로젝션하여 도출된 참조 픽처를 사용한 영상 디코딩 방법 및 장치
WO2019216736A1 (ko) * 2018-05-11 2019-11-14 엘지전자 주식회사 인터 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
US11196988B2 (en) 2018-12-17 2021-12-07 Apple Inc. Reference picture management and list construction

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1665304A (zh) * 2002-05-03 2005-09-07 Lg电子株式会社 运动图像编码方法
US20070019731A1 (en) * 2005-07-20 2007-01-25 Tsung-Chieh Huang Method for calculating a direct mode motion vector for a bi-directionally predictive-picture
CN101637028A (zh) * 2007-02-28 2010-01-27 索尼株式会社 图像信息编码设备和编码方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003026315A1 (en) * 2001-09-14 2003-03-27 Ntt Docomo, Inc. Coding method, decoding method, coding apparatus, decoding apparatus, image processing system, coding program, and decoding program
WO2005022923A2 (en) * 2003-08-26 2005-03-10 Thomson Licensing S.A. Method and apparatus for minimizing number of reference pictures used for inter-coding
EP2041982A2 (en) * 2006-07-11 2009-04-01 Thomson Licensing Methods and apparatus using virtual reference pictures
KR100985268B1 (ko) * 2008-07-18 2010-10-04 엘지전자 주식회사 모션벡터 결정방법
CA2784517A1 (en) * 2009-12-17 2011-06-23 Telefonaktiebolaget L M Ericsson (Publ) Method and arrangement for video coding
US9008176B2 (en) * 2011-01-22 2015-04-14 Qualcomm Incorporated Combined reference picture list construction for video coding
US9008181B2 (en) * 2011-01-24 2015-04-14 Qualcomm Incorporated Single reference picture list utilization for interprediction video coding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1665304A (zh) * 2002-05-03 2005-09-07 Lg电子株式会社 运动图像编码方法
US20070019731A1 (en) * 2005-07-20 2007-01-25 Tsung-Chieh Huang Method for calculating a direct mode motion vector for a bi-directionally predictive-picture
CN101637028A (zh) * 2007-02-28 2010-01-27 索尼株式会社 图像信息编码设备和编码方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105578180A (zh) * 2014-10-16 2016-05-11 联想(北京)有限公司 一种编码方法及装置
CN105578180B (zh) * 2014-10-16 2019-01-15 联想(北京)有限公司 一种编码方法及装置
CN115134595A (zh) * 2015-06-05 2022-09-30 杜比实验室特许公司 用于执行帧间预测的图像编解码方法、比特流存储方法
CN109417641A (zh) * 2016-07-05 2019-03-01 株式会社Kt 用于处理视频信号的方法和装置
CN109479149A (zh) * 2016-07-05 2019-03-15 株式会社Kt 视频信号处理方法和设备
US11190770B2 (en) 2016-07-05 2021-11-30 Kt Corporation Method and apparatus for processing video signal
CN109479149B (zh) * 2016-07-05 2022-04-15 株式会社Kt 视频信号处理方法和设备
CN114401402A (zh) * 2016-07-05 2022-04-26 株式会社Kt 用于处理视频信号的方法和装置
US11805255B2 (en) 2016-07-05 2023-10-31 Kt Corporation Method and apparatus for processing video signal
US11876999B2 (en) 2016-07-05 2024-01-16 Kt Corporation Method and apparatus for processing video signal
CN114401402B (zh) * 2016-07-05 2024-06-14 株式会社Kt 用于处理视频信号的方法和装置
WO2020187222A1 (zh) * 2019-03-18 2020-09-24 杭州海康威视数字技术股份有限公司 一种编解码方法、装置及其设备

Also Published As

Publication number Publication date
JP5801908B2 (ja) 2015-10-28
WO2012124961A3 (ko) 2012-12-27
KR20140085392A (ko) 2014-07-07
KR20120104128A (ko) 2012-09-20
US20140003521A1 (en) 2014-01-02
EP2685722A4 (en) 2014-09-03
JP2014511645A (ja) 2014-05-15
WO2012124961A2 (ko) 2012-09-20
KR101635112B1 (ko) 2016-06-30
EP2685722A2 (en) 2014-01-15

Similar Documents

Publication Publication Date Title
CN103563382A (zh) 用于对图像进行编码的方法和设备以及用于进行解码的方法和设备
CN102474614B (zh) 基于分层编码块样式信息的视频编码方法和设备以及视频解码方法和设备
CN102474612B (zh) 用于对视频进行编码的方法和设备以及用于对视频进行解码的方法和设备
CN103733625A (zh) 用于对运动信息进行编码的方法和设备以及用于对运动信息进行解码的方法和设备
CN102804777A (zh) 通过考虑跳过和划分顺序来对视频进行编码的方法和设备,对视频进行解码的方法和设备
CN102474613A (zh) 考虑具有分层结构的编码单元的扫描顺序来对视频进行编码的方法和设备以及考虑具有分层结构的编码单元的扫描顺序来对视频进行解码的方法和设备
CN103765887A (zh) 用于使用分层数据单元进行熵编码的方法和设备、以及用于解码的方法和设备
CN104094600A (zh) 用于包括量化参数预测的基于分层数据单元的视频编码和解码的方法和设备
CN102939752A (zh) 通过基于树结构的数据单元执行环路滤波来对视频进行编码的方法和设备,以及通过基于树结构的数据单元执行环路滤波来对视频进行解码的方法和设备
CN103098467A (zh) 用于对运动矢量进行编码和解码的方法和设备
CN102792692A (zh) 通过使用去块滤波对视频进行编码的方法和设备以及通过使用去块滤波对视频进行解码的方法和设备
CN103155563A (zh) 通过使用块合并对视频进行编码的方法和设备以及通过使用块合并对视频进行解码的方法和设备
CN104811703A (zh) 视频的编码方法和装置及视频的解码方法和装置
CN104883575A (zh) 对视频进行编码和解码的方法和设备
CN103782595A (zh) 通过使用用于统一参考可能性的检查处理的帧内预测的视频编码方法、视频解码方法及其装置
CN103416062A (zh) 能够执行双向预测和单向预测的视频预测方法及其装置、视频编码方法及其装置以及视频解码方法及其装置
CN104620587A (zh) 用于对多层视频进行编码的方法和设备以及用于对多层视频进行解码的方法和设备
CN105284115A (zh) 用于对多层视频进行解码的方法和设备以及用于对多层视频进行编码的方法和设备
CN105191314A (zh) 用于对多层视频进行编码的方法和设备、用于对多层视频进行解码的方法和设备
CN105308963A (zh) 用于对多层视频进行解码的方法和设备以及用于对多层视频进行编码的方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140205

WD01 Invention patent application deemed withdrawn after publication