CN105103552B - 用于补偿亮度差的对层间视频进行编码的方法及其装置以及用于对视频进行解码的方法及其装置 - Google Patents

用于补偿亮度差的对层间视频进行编码的方法及其装置以及用于对视频进行解码的方法及其装置 Download PDF

Info

Publication number
CN105103552B
CN105103552B CN201480013688.5A CN201480013688A CN105103552B CN 105103552 B CN105103552 B CN 105103552B CN 201480013688 A CN201480013688 A CN 201480013688A CN 105103552 B CN105103552 B CN 105103552B
Authority
CN
China
Prior art keywords
layer
block
coding
information
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201480013688.5A
Other languages
English (en)
Other versions
CN105103552A (zh
Inventor
朴慜佑
尹载元
崔秉斗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN105103552A publication Critical patent/CN105103552A/zh
Application granted granted Critical
Publication of CN105103552B publication Critical patent/CN105103552B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness

Abstract

提供一种根据其它层图像的块的图像特征来执行照度补偿的层间视频编码方法及其设备以及层间视频解码方法及其设备。一种层间视频解码方法涉及:基于从第一层比特流获得的编码信息重构第一层图像;为了重构被确定为预定分区类型并被确定为处于预测模式的第二层块,针对通过使用第一层参考块而确定的重构的第二层块确定是否执行照度补偿,其中,第一层参考块位于重构的第一层图像中并且与第二层块相应;通过使用从第二层比特流获得的层间预测信息和第一层参考块来产生重构的第二层块,并产生包括重构的第二层块的第二层图像,其中,重构的第二层块的照度是根据照度补偿是否被执行而确定的。

Description

用于补偿亮度差的对层间视频进行编码的方法及其装置以及 用于对视频进行解码的方法及其装置
技术领域
本公开涉及层间视频编码和解码方法。更详细地,本公开涉及一种对层间图像之间的照度(illumination)差进行补偿的方法。
背景技术
随着用于再现和存储高分辨率或高质量视频内容的硬件的开发和提供,对于用于有效地对高分辨率或高质量视频内容进行编码或解码的视频编解码器的需求正在增加。根据现有技术的视频编解码器,基于具有预定尺寸的宏块,根据受限的编码方法来对视频进行编码。
空间域的图像数据经由频率变换被变换为频域的系数。根据视频编解码器,将图像划分为预定尺寸的块,对每个块执行离散余弦变换(DCT),并以块为单位对频率系数进行编码,以进行频率变换的快速计算。与空间域的图像数据相比,频域的系数容易被压缩。具体地,由于根据经由视频编解码器的帧间预测或帧内预测的预测误差来表示空间域的图像像素值,因此当对预测误差执行频率变换时,大量数据可被变换为0。根据视频编解码器,可通过使用小量数据来代替连续并重复产生的数据,来减少数据量。
多层视频编解码器对第一层视频和一个或更多个第二层视频进行编码和解码。通过去除第一层视频和第二层视频的时间/空间冗余以及层之间的冗余,可减少第一层视频和第二层视频的数据量。
发明内容
技术问题
本公开提供层间视频编码方法及其设备以及层间视频解码方法及其设备的一个或更多个示例性实施例,其中,层间视频编码方法根据一个或更多个层对图像序列进行编码,根据其它层图像的块的图像特征来确定是否执行照度补偿,并对照度差进行补偿。
解决方案
根据本公开的一方面,提供一种层间视频解码方法,包括以下操作:基于从第一层比特流获得的编码信息来重构第一层图像;为了重构被确定为预定分区类型并处于预测模式的第二层块,针对通过使用第一层参考块而确定的重构的第二层块确定是否执行照度补偿,其中,第一层参考块位于重构的第一层图像中并且与第二层块相应;通过使用从第二层比特流获得的层间预测信息和第一层参考块来产生重构的第二层块,并产生包括重构的第二层块的第二层图像,其中,重构的第二层块的照度是根据照度补偿是否被执行而确定的。
有益效果
根据一个或更多个示例性实施例,仅对更需要照度补偿的块确定是否执行照度补偿,并且不对其它块执行照度补偿。因此,可减少计算负荷的增加,并且由于照度补偿而可提高编码效率。
附图说明
图1a示出根据示例性实施例的层间视频编码设备的框图。
图1b示出根据示例性实施例的层间视频编码方法的流程图。
图2a示出根据示例性实施例的层间视频解码设备的框图。
图2b示出根据示例性实施例的层间视频解码方法的流程图。
图3示出根据示例性实施例的层间预测结构。
图4a示出根据示例性实施例的由层间视频编码设备执行的照度补偿方法的流程图。
图4b示出根据示例性实施例的由层间视频解码设备执行的照度补偿方法的流程图。
图5示出根据示例性实施例的用于根据当前块的分区类型和预测模式执行照度补偿的语法。
图6a示出根据另一示例性实施例的由层间视频编码设备执行的照度补偿方法的流程图。
图6b示出根据另一示例性实施例的由层间视频解码设备执行的照度补偿方法的流程图。
图6c示出根据另一示例性实施例的用于根据颜色分量执行照度补偿的语法。
图7a和图7b示出用于确定是否对每个块执行照度补偿和残差预测的语法。
图8是根据示例性实施例的基于树结构的编码单元的视频编码设备的框图。
图9是根据示例性实施例的基于树结构的编码单元的视频解码设备的框图。
图10是用于描述根据示例性实施例的编码单元的构思的示图。
图11是根据示例性实施例的基于编码单元的图像编码器的框图。
图12是根据示例性实施例的基于编码单元的图像解码器的框图。
图13是示出根据示例性实施例的根据深度的较深层编码单元以及分区的示图。
图14是用于描述根据示例性实施例的编码单元和变换单元之间的关系的示图。
图15示出根据示例性实施例的根据深度的多条编码信息。
图16是根据示例性实施例的根据深度的较深层编码单元的示图。
图17、图18和图19是用于描述根据示例性实施例的编码单元、预测单元和变换单元之间的关系的示图。
图20是用于描述根据表1的编码模式信息的编码单元、预测单元和变换单元之间的关系的示图。
图21是根据示例性实施例的存储程序的盘的物理结构的示图。
图22是用于通过使用盘来记录和读取程序的盘驱动器的示图。
图23是用于提供内容分配服务的内容供应系统的整体结构的示图。
图24和图25示出根据示例性实施例的应用了视频编码方法和视频解码方法的移动电话的外部结构和内部结构。
图26是根据示例性实施例的应用通信系统的数字广播系统的示图。
图27是示出根据示例性实施例的使用视频编码设备和视频解码设备的云计算系统的网络结构的示图。
最佳实施方式
根据本公开的一方面,提供一种层间视频解码方法,包括以下操作:基于从第一层比特流获得的编码信息来重构第一层图像;为了重构被确定为预定分区类型并被确定为处于预测模式的第二层块,针对通过使用第一层参考块而确定的重构的第二层块确定是否执行照度补偿,其中,第一层参考块位于重构的第一层图像中并且与第二层块相应;通过使用从第二层比特流获得的层间预测信息和第一层参考块来产生重构的第二层块,并产生包括重构的第二层块的第二层图像,其中,重构的第二层块的照度是根据照度补偿是否被执行而确定的。
确定是否执行照度补偿的操作可包括以下操作:从第二层比特流获得第二层块的分区类型信息和预测模式信息;如果分区类型信息指示所述预定分区类型并且预测模式信息不指示帧内预测模式,则从第二层比特流获得用于第二层块的照度补偿信息;基于用于第二层块的照度补偿信息来确定是否对重构的第二层块执行照度补偿。
确定是否执行照度补偿的操作可包括以下操作:获得用于以下块的照度补偿信息,其中,所述块的分区类型信息指示2N×2N类型并且所述块的预测模式信息不指示帧内预测模式。
确定是否执行照度补偿的操作可包括以下操作:基于分区类型信息和预测模式信息获得用于被确定为处于跳过模式或2N×2N融合模式的块的照度补偿信息。
确定是否执行照度补偿的操作还可包括以下操作:根据重构的第二层块的当前分区的尺寸来确定是否对将进行照度补偿的重构的第二层块的亮度(luma)分量和色度(chroma)分量执行照度补偿。例如,确定操作可包括以下操作:确定对分区尺寸为8×8的块的亮度分量执行照度补偿,并确定不对分区尺寸为8×8的块的色度分量执行照度补偿。
确定是否执行照度补偿的操作可包括以下操作:根据重构的第二层块的尺寸,针对确定是否对重构的第二层块的亮度分量和色度分量执行照度补偿进行不同的操作。例如,确定操作可包括以下操作:当分区的尺寸(关于块的亮度分量)等于或大于8×8时,确定对该块的亮度分量执行照度补偿。确定操作可包括以下操作:当块的亮度分量的分区的尺寸大于8×8时,确定对该块的色度分量执行照度补偿。
可针对除了被确定为所述预定分区类型并处于所述预测模式的第二层块以外的其它第二层块跳过确定是否执行照度补偿的操作。此外,可不对所述其它第二层块执行照度补偿。
当照度补偿被确定为对第二层块执行时,可不对第二层块执行残差预测来通过使用时间方向参考块和层间方向参考块中的至少一个参考块的残差信息对第二层块的残差信息进行预测。
当残差预测被确定为对第二层块执行以通过使用时间方向参考块和层间方向参考块中的至少一个参考块的残差信息对第二层块的残差信息进行预测时,可不对第二层块执行照度补偿。
根据本公开的另一方面,提供一种层间视频编码方法,包括以下操作:产生包括通过对第一层图像进行编码而产生的编码信息的第一层比特流;为了重构被确定为预定分区类型并被确定为处于预测模式的第二层块,针对通过使用第一层参考块而确定的重构的第二层块确定是否执行照度补偿,其中,第一层参考块位于重构的第一层图像中并且与第二层块相应;产生第二层比特流,其中,第二层比特流包括通过执行第二层块与相应于第二层块的第一层参考块之间的层间预测而产生的层间预测信息,并且第二层比特流包括第一层参考块与根据照度补偿是否被执行而确定照度的第二层块之间的层间预测信息。
确定是否执行照度补偿的步骤可包括以下操作:确定第二层块的分区类型信息和预测模式信息;如果分区类型信息指示所述预定分区类型并且预测模式信息不指示帧内预测模式,则确定指示是否对重构的第二层块执行照度补偿的照度补偿信息。产生第二层比特流的步骤可包括以下操作:产生包括用于不指示帧内模式但是是所述预定分区类型的第二层块的以下信息的第二层比特流:分区类型信息、预测模式信息和照度补偿信息。
确定是否执行照度补偿的操作还可包括以下操作:根据重构的第二层块的当前分区的尺寸来确定是否对将进行照度补偿的重构的第二层块的亮度分量和色度分量执行照度补偿。例如,确定操作可包括以下操作:当分区尺寸为8×8时,确定对亮度分量执行照度补偿;当分区尺寸为8×8时,确定不对色度分量执行照度补偿。
确定是否执行照度补偿的操作可包括以下操作:根据重构的第二层块的尺寸,针对确定是否对重构的第二层块的亮度分量和色度分量执行照度补偿进行不同的操作。例如,确定操作可包括以下操作:如果分区的尺寸(关于块的亮度分量)等于或大于8×8,则确定对该块的亮度分量执行照度补偿。确定操作可包括以下操作:如果块的亮度分量的尺寸大于8×8,则确定对该块的色度分量执行照度补偿。
可针对除了被确定为所述预定分区类型并处于所述预测模式的第二层块以外的其它第二层块跳过确定是否执行照度补偿的操作,并且,不对所述其它第二层块执行照度补偿。当照度补偿被确定为对第二层块执行时,可不对第二层块执行残差预测来通过使用时间方向参考块和层间方向参考块中的至少一个参考块的残差信息对第二层块的残差信息进行预测.
当残差预测被确定为对第二层块执行以通过使用时间方向参考块和层间方向参考块中的至少一个参考块的残差信息对第二层块的残差信息进行预测时,可不对第二层块执行照度补偿。
根据本公开的另一方面,提供一种层间视频解码设备,包括:第一层解码器,基于从第一层比特流获得的编码信息来重构第一层图像;照度补偿确定器,为了重构被确定为预定分区类型并被确定为处于预测模式的第二层块,针对通过使用第一层参考块而确定的重构的第二层块确定是否执行照度补偿,其中,第一层参考块位于重构的第一层图像中并且与第二层块相应;第二层解码器,通过使用从第二层比特流获得的层间预测信息和第一层参考块来产生重构的第二层块,并产生包括重构的第二层块的第二层图像,其中,重构的第二层块的照度是根据照度补偿是否被执行而确定的。
根据本公开的另一方面,提供一种层间视频编码设备,包括:第一层编码器,产生包括通过对第一层图像进行编码而产生的编码信息的第一层流;照度补偿确定器,为了重构被确定为预定分区类型并被确定为处于预测模式的第二层块,针对通过使用第一层参考块而确定的重构的第二层块确定是否执行照度补偿,其中,第一层参考块位于重构的第一层图像中并且与第二层块相应;第二层编码器,产生第二层比特流,其中,第二层比特流包括通过执行第二层块与相应于第二层块的第一层参考块之间的层间预测而产生的层间预测信息,并且第二层比特流包括第一层参考块与根据照度补偿是否已被执行而确定照度的第二层块之间的层间预测信息。
根据本公开的另一方面,提供一种记录有用于执行层间视频解码方法的程序的计算机可读记录介质。根据本公开的另一方面,提供一种记录有用于执行层间视频编码方法的程序的计算机可读记录介质。
具体实施方式
在下文中,将参照图1a至图7b来提供根据示例性实施例的根据块特征来确定是否执行照度补偿的层间视频编码技术和层间视频解码技术。此外,参照图8至图20来提供根据示例性实施例的基于树结构的编码单元的视频编码技术和视频解码技术,其中,所述视频编码技术和视频解码技术可被应用于层间视频编码技术和层间视频解码技术。此外,参照图21至图27来提供应用视频编码技术和视频解码技术的各种实施例。
在下文中,“图像”可指示静止图像或视频的运动图像,或者视频本身。
在下文中,“样点”表示被分配给图像的采样位置并作为处理目标的数据。例如,空间域中的图像的像素可以是样点。
首先,参照图1a至图7b,提供根据示例性实施例的层间视频编码设备和层间视频编码方法以及层间视频解码设备和层间视频解码方法。
图1a示出根据示例性实施例的层间视频编码设备10的框图。图1b示出根据示例性实施例的层间视频编码方法的流程图。
根据本示例性实施例的层间视频编码设备10包括第一层编码器12、照度补偿确定器14和第二层编码器16。照度补偿确定器14可形成在第二层编码器16外部。
根据本示例性实施例的层间视频编码设备10可通过使用可伸缩视频编码方法根据层对多个图像序列中的每个图像序列进行编码,并可输出包括每个层的编码数据的单独的流。层间视频编码设备10可将第一层图像序列和第二层图像序列编码至不同的层。
第一层编码器12可对第一层图像进行编码,并可输出包括第一层图像的编码数据的第一层流。
第二层编码器16可对第二层图像进行编码,并可输出包括第二层图像的编码数据的第二层流。
例如,根据基于空间伸缩性的可伸缩视频编码方法,低分辨率图像可被编码为第一层图像,高分辨率图像可被编码为第二层图像。第一层图像的编码结果可被输出为第一层流,第二层图像的编码结果可被输出为第二层流。
作为另一示例,可根据可伸缩视频编码方法对多视点视频进行编码。左视点图像可被编码为第一层图像,右视点图像可被编码为第二层图像。可选地,中心视点图像、左视点图像和右视点图像中的每个图像可被编码,并且在这些图像中,中心视点图像可被编码为第一层图像,左视点图像可被编码为第一第二层图像,右视点图像可被编码为第二第二层图像。
作为另一示例,可根据基于时间伸缩性的时间分层预测来执行可伸缩视频编码方法。包括编码信息的第一层流可被输出,其中,所述编码信息是通过对具有基本帧率的图像进行编码而产生的。时间级别可根据帧率被分类,并且可被分别编码至层。通过参考基本帧率的图像进一步对具有高速帧率的图像进行编码,可输出包括关于高速帧率的编码信息的第二层流。
此外,可对第一层和多个第二层执行可伸缩视频编码。在第二层的数量等于或大于3的情况下,第一层图像、第一第二层图像、第二第二层图像…和第K第二层图像可被编码。因此,第一层图像的编码结果可被输出为第一层流,第一第二层图像的编码结果、第二第二层图像的编码结果、…和第K第二层图像的编码结果可分别被输出为第一第二层流、第二第二层流、…和第K第二层流。
根据本示例性实施例的层间视频编码设备10可执行帧间预测,其中,当前图像通过帧间预测经由参考单个层的图像而被预测。经由帧间预测,可产生指示当前图像与参考图像之间的运动信息的运动矢量,以及当前图像与参考图像之间的残差分量。
此外,层间视频编码设备10可执行层间预测,其中,第二层图像通过层间预测经由参考第一层图像而被预测。
此外,当根据本示例性实施例的层间视频编码设备10允许第一层、第二层、第三层等中的至少三个层时,层间视频编码设备10根据多层预测结构可执行第一层图像与第三层图像之间的层间预测,并且可执行第二层图像与第三层图像之间的层间预测。
经由层间预测,可产生另一层的参考图像与当前图像之间的位置差分量以及所述另一层的参考图像与当前图像之间的残差分量。
将参照图3详细地描述层间预测结构。
根据本示例性实施例的层间视频编码设备10根据层对视频的每个图像的每个块进行编码。块的类型可以是方形、矩形或任意几何形状。块不限于固定尺寸的数据单元。块可以是树结构的编码单元之中的最大编码单元、编码单元、预测单元、变换单元等。包括树结构的编码单元的最大编码单元可被不同地称为编码块树、块树、根块树、编码树、编码根或树干。将参照图8至图20描述使用树结构的编码单元的视频编码方法和视频解码方法。
可通过使用编码单元、预测单元或变换单元的数据单元来执行帧间预测和层间预测。
根据本示例性实施例的第一层编码器12可通过对第一层图像执行包括帧间预测或帧内预测的源编码操作来产生符号数据。符号数据指示每个编码参数的样点值和残差分量的样点值。
首先,第一层编码器12可通过对第一层图像的数据单元的样点执行帧间预测或帧内预测、变换和量化来产生符号数据,并可通过对符号数据执行熵编码来产生第一层流。
第二层编码器16可基于树结构的编码单元对第二层图像进行编码。第二层编码器16可通过对第二层图像的编码单元的样点执行帧间预测或帧内预测、变换和量化来产生符号数据,并可通过对符号数据执行熵编码来产生第二层流。
根据本示例性实施例的第二层编码器16可通过使用第一层图像的重构样点来执行层间预测以预测第二层图像。为了经由层间预测结构对第二层图像序列之中的第二层原始图像进行编码,第二层编码器16可通过使用重构的第一层图像来产生第二层预测图像,并可对第二层原始图像与第二层预测图像之间的预测误差进行编码。
第二层编码器16可根据块(诸如编码单元或预测单元)对第二层图像执行层间预测。可确定第一层图像的将被第二层图像的块参考的块。例如,可确定第一层图像的与第二层图像中的当前块的位置相应时被定位的重构块。第二层编码器16可通过使用与第二层块相应的重构的第一层块来确定第二层预测块。
第二层编码器16可将第二层预测块用作对第二层原始块进行层间预测的参考图像,其中,第二层预测块是根据层间预测结构通过使用重构的第一层块来确定的。第二层编码器16可通过使用重构的第一层图像根据层间预测来对残差分量(即,第二层预测块的样点值与第二层原始块的样点值之间的差)进行熵编码。
如上所述,第二层编码器16可通过层间预测结构参考重构的第一层图像对当前层图像序列进行编码。然而,根据本示例性实施例的第二层编码器16可在不参考其它层样点的情况下根据单层预测结构对第二层图像序列进行编码。因此,不应狭隘地理解为,第二层编码器16仅执行层间预测以对第二层图像序列进行编码。
如上所述,当层间视频编码设备10对多视点视频进行编码时,第一层编码器12可对第一视点视频进行编码,第二层编码器16可对第二视点视频进行编码。可通过使用不同的相机来拍摄具有不同视点的视频,或者可经由不同的镜头来获得不同视点的视频。由于拍摄角度、灯光或图像捕捉设备(例如,相机、镜头等)的特性可根据不同视点而变化,因此照度会在经由不同视点获得的视频中变化。这种照度失配可与具有不同视点的视频的样点值的差异相关。
如果照度在具有不同视点的视频中变化,则层间预测误差增加,使得编码效率会降低。因此,考虑到不同视点中的照度失配,层间视频编码设备10的照度补偿确定器14可通过对具有不同视点的视频中的照度差进行补偿来对多视点视频进行编码。例如,可对由第一层编码器12编码的第一视点图像与由第二层编码器16编码的第二视点图像之间的照度差进行编码。由于第一视点图像与第二视点图像之间的照度差被编码,因此当第二层编码器16对第二视点图像进行编码时,照度补偿可被执行。
根据示例性实施例,为了通过将第一层块与第二层块进行比较来对照度差进行补偿,可将第一层块的样点平均值与第二层块的样点平均值之间的差确定为补偿值。
然而,由于残差数据以层间预测结构在层之间被预测,因此对层之间的照度差进行预测的编码操作会增加计算负荷。因此,根据本示例性实施例的照度补偿确定器14可通过参考预定数据单元(诸如当前图像的条带或块)的特征来确定是否执行照度补偿。
在下文中,参考图1b详细地描述考虑照度补偿的层间视频编码设备10的操作。
图1b示出根据示例性实施例的层间视频编码方法的流程图。
在操作11,第一层编码器12可对第一层图像进行编码,并可产生第一层比特流,其中,第一层比特流包括产生的编码信息的样点值。照度补偿确定器14可对第二层图像进行编码,并可产生第二层比特流,其中,第二层比特流包括产生的编码信息的样点值。如果层间视频编码设备10对多视点视频进行编码,则第一层图像可与第一视点图像相应,第二层图像可与第二视点图像相应。第一层编码器12和第二层编码器16中的每一个可将图像划分为块,并可对每个块进行编码。
在操作13,照度补偿确定器14可基于重构的第一层块来确定是否对第二层图像的每个块执行照度补偿。
在操作15,第二层编码器16可执行层间预测以对第一层图像与第二层图像之间的误差进行编码,使得第二层图像的块(第二层块)和与其相应的第一层图像的参考块(第一层参考块)之间的残差分量可被编码。因此,第二层比特流可包括指示层间编码方法的各种类型的层间预测信息以及层间残差分量。
更详细地,针对操作13,为了重构第二层块,照度补偿确定器14可针对通过使用与第二层块相应并且属于重构的第一层图像的第一层参考块而确定的第二层块确定是否执行照度补偿。照度补偿确定器14可确定是否对被确定为预定分区类型并处于预测模式的第二层块执行照度补偿。
第二层编码器16可确定指示第二层块的分区类型的分区类型信息,并可确定第二层块的指示预测模式的预测模式信息。在分区类型信息指示预定分区类型并且预测模式信息不是帧内预测模式的情况下,照度补偿确定器14可确定指示是否对第二层块执行照度补偿的照度补偿信息。
第二层编码器16可产生第二层比特流,其中,第二层比特流包括用于是预定分区类型并且不指示帧内预测模式的第二层块的分区类型信息、预测模式信息和照度补偿信息。
例如,照度补偿确定器14可确定用于其分区类型信息指示2N×2N类型的块的照度补偿信息。
例如,照度补偿确定器14可确定用于以下块的照度补偿信息,其中,所述块的分区类型信息指示2N×2N类型并且所述块的预测模式信息不指示帧内预测模式。
此外,照度补偿确定器14可基于分区类型信息和预测模式信息来确定用于指示跳过模式或被确定为处于2N×2N融合模式的块的照度补偿信息。
此外,照度补偿确定器14可根据当前分区的尺寸来确定是否对将被照度补偿的块的亮度分量和色度分量执行照度补偿。例如,可确定对分区尺寸为8×8的块的亮度分量执行照度补偿,并且可确定不对分区尺寸为8×8的块的色度分量执行照度补偿。
此外,照度补偿确定器14可根据块的尺寸针对确定是否对块的亮度分量和色度分量执行照度补偿的过程进行不同的操作。例如,如果块的亮度分量的分区尺寸等于或大于8×8,则照度补偿确定器14可确定对块的亮度分量执行照度补偿。如果块的亮度分量的分区尺寸大于8×8,则可仅对块的色度分量执行照度补偿。如果块的亮度分量的分区尺寸是8×8,则块的色度分量的分区尺寸可以是4×4。如果对具有4×4尺寸的块执行照度补偿,则计算负荷增加,使得如果块的亮度分量的分区尺寸是8×8,则不对块的色度分量执行照度补偿,并且如果块的亮度分量的分区尺寸大于8×8,则可对块的色度分量执行照度补偿。
照度补偿确定器14可跳过确定是否对除了被确定为预定分区类型并处于预测模式的块之外的其它第二层块执行照度补偿的操作。
然而,根据层间编码方法,第二层块的分区类型或预测模式可被确定为等同于与第二层块相应的第一层块的分区类型和预测模式。在此情况下,即使照度补偿确定器14被形成在第二层编码器16外部,照度补偿确定器14仍可通过使用第一层块的分区类型信息和预测模式信息的样点值来预测第二层块的分区类型和预测模式。因此,照度补偿确定器14可基于第二层块的预测的分区类型和预测的预测模式来确定是否对第二层块执行照度补偿。
此外,第二层编码器16可不对被确定为进行照度补偿的第二层块执行残差预测,其中,残差预测将通过使用时间方向参考块和层间方向参考块中的至少一个参考块的残差信息对第二层块的残差信息进行预测。因此,可仅针对被确定为不进行照度补偿的块(条带或画面)确定指示是否执行残差预测的信息。
第二层编码器16可不对这样的第二层块执行用于对第一层参考块的照度与第二层参考块的照度之间的差进行补偿的操作,其中,所述第二层块被确定为进行残差预测,以便通过使用时间方向参考块和层间方向参考块中的至少一个参考块的残差信息来预测第二层块的参考信息。因此,可仅针对被确定为不进行残差预测的块(条带或画面)确定照度补偿信息。
此外,根据由照度补偿确定器14进行的确定,可经由照度补偿来确定第二层参考块的照度,或者,可在不进行照度补偿的情况下确定第二层参考块的照度。因此,在操作15,第二层编码器16可产生包括与第一层参考块和第二层块之间的层间预测有关的层间预测信息的第二层比特流,其中,第二层块的照度是根据照度补偿是否已被执行而确定的。
当考虑第一层图像来调整第二层图像的照度时,第二层图像与第一层图像之间的差异被进一步减小,使得层间预测的编码效率可被提高。此外,可根据块的编码模式,在特定编码模式下优先考虑照度补偿。
根据本示例性实施例的层间视频编码设备10可包括总体控制第一层编码器12、照度补偿确定器14和第二层编码器16的中央处理器(未示出)。可选地,第一层编码器12、照度补偿确定器14和第二层编码器16中的每一个可由其拥有的处理器(未示出)来驱动,并且处理器可互相操作,使得层间视频编码设备10可进行操作。可选地,根据层间视频编码设备10的外部处理器(未示出)的控制,第一层编码器12、照度补偿确定器14和第二层编码器16可被控制。
层间视频编码设备10可包括一个或更多个数据存储单元(未示出),其中,所述一个或更多个数据存储单元用于存储第一层编码器12、照度补偿确定器14和第二层编码器16的输入和输出数据。层间视频编码设备10可包括存储器控制器(未示出),其中,存储器控制器对所述一个或更多个数据存储单元的数据的输入和输出进行管理。
层间视频编码设备10与内部嵌入的内部视频编码处理器或外部视频编码处理器进行互操作以输出视频编码结果,使得层间视频编码设备10可执行包括变换操作的视频编码操作。层间视频编码设备10的内部视频编码处理器不仅可与单独的处理器相应,还可与层间视频编码设备10的中央处理器(CPU)或图形化操作单元包括视频编码处理模块并因此执行基本视频编码操作的情况相应。
图2a示出根据示例性实施例的层间视频解码设备20的框图。
根据本示例性实施例的层间视频解码设备20包括第一层解码器22、照度补偿确定器24和第二层解码器26。照度补偿确定器24可被包括在第二层解码器26中。根据另一示例性实施例的照度补偿确定器24可形成在第二层解码器26外部。
根据本示例性实施例的层间视频解码设备20可基于可伸缩编码方法接收根据层的比特流。层间视频解码设备20接收的比特流的层的数量不被限制。然而,为了便于描述,在下文中,在示例性实施例中,层间视频解码设备20的第一层解码器22接收第一层流并对第一层流进行解码,第二层解码器26接收第二层流并对第二层流进行解码。
例如,基于空间伸缩性的层间视频解码设备20可接收流,其中,在所述流中,具有不同分辨率的图像序列被编码到不同层。可通过对第一层流进行解码来重构低分辨率图像序列,并且可通过对第二层流进行解码来重构高分辨率图像序列。
作为另一示例,可通过使用可伸缩视频编码方法对多视点视频进行解码。当具有多个层的立体视频流被接收时,可通过对第一层流进行解码来重构左视点图像。通过对除了第一层流之外的第二层流进行进一步解码,可恢复右视点图像。
可选地,当具有多个层的多视点视频流被接收时,可通过对第一层流进行解码来重构中心视点图像。通过对除了第一层流之外的第二层流进行进一步解码,可重构左视点图像。通过对除了第一层流之外的第三层流进行进一步解码,可重构右视点图像。
作为另一示例,可执行基于时间伸缩性的可伸缩视频编码方法。通过对第一层流进行解码,可重构具有基本帧率的图像。通过对除了第一层流之外的第二层流进行进一步解码,可重构具有高速帧率的图像。
在第二层的数量等于或大于3的情况下,可从第一层流重构第一层图像,还可通过参照重构的第一层图像对第二层进行进一步解码来重构第二层图像。如果还可通过参照重构的第二层图像对第K层流进行解码,则还可重构第K层图像。
层间视频解码设备20可从第一层流和第二层流获得第一层图像和第二层图像的编码数据,并且还可获得通过帧间预测而产生的运动矢量以及通过层间预测而产生的预测信息。
例如,层间视频解码设备20可对每个层的帧间预测的数据进行解码,并且可对在多个层之间被层间预测的数据进行解码。可基于编码单元或预测单元,通过使用运动补偿和层间解码来执行重构。
可通过参考针对同一的层经由帧间预测被预测的重构图像对当前图像执行运动补偿来重构每个层流的图像。运动补偿表示通过将参考图像与当前图像的残差分量进行合成来重构当前图像的重构图像的操作,其中,参考图像是通过使用当前图像的运动矢量来确定的。
此外,层间视频解码设备20可通过参考第一层图像来执行层间解码,以便重构经由层间预测被预测的第二层图像。层间解码表示通过将另一层的参考图像与当前图像的残差分量进行合成来重构当前图像的重构图像的操作,其中,参考图像被确定用于对当前图像进行预测。
根据本示例性实施例的层间视频解码设备20可执行层间解码以便重构通过参考第二层图像被预测的第三层图像。将参照图3详细地描述层间预测结构。
然而,根据本示例性实施例的第二层解码器26可在不参考第一层图像序列的情况下对第二层流进行解码。因此,不应狭隘地解释为:第二层解码器26仅执行层间预测以便对第二层图像流进行解码。
层间视频解码设备20对视频的每个图像的每个块进行解码。块可以是树结构的编码单元之中的最大编码单元、编码单元、预测单元、变换单元等。
第一层解码器22可通过使用解析的第一层图像的编码符号来对第一层图像进行解码。如果层间视频解码设备20接收到基于树结构的编码单元被编码的流,则第一层解码器22可基于树结构的编码单元对第一层流的每个最大编码单元执行解码。
第一层解码器22可对每个最大编码单元执行熵解码,并因此可获得编码信息和编码数据。第一层解码器22可对从流获得的编码数据执行反量化和逆变换,并因此可重构残差分量。根据另一示例性实施例的第一层解码器22可直接接收量化后的变换系数的比特流。作为对量化后的变换系数执行的反量化和逆变换的结果,图像的残差分量可被重构。
第一层解码器22可通过经由相同层图像之间的运动补偿将预测图像与残差分量进行组合来重构第一层图像。
根据层间预测结构,第二层解码器26可通过使用重构的第一层图像的样点来产生第二层预测图像。第二层解码器26可对第二层流进行解码,并可获得由于层间预测而产生的预测误差。第二层解码器26可通过将第二层预测图像与预测误差进行组合来产生重构的第二层图像。
第二层解码器26可通过使用由第一层解码器22解码的重构的第一层图像来确定第二层预测图像。根据层间预测结构,第二层解码器26可确定第一层图像的将被第二层图像的块(诸如编码单元或预测单元)参考的块。例如,可确定第一层图像的在与第二层图像中的当前块的位置相应的同时被定位的重构块。第二层解码器26可通过使用与第二层块相应的重构的第一层块来确定第二层预测块。
第二层解码器26可将第二层预测块用作对第二层原始块进行层间预测的参考图像,其中,第二层预测块是根据层间预测结构通过使用重构的第一层块来确定的。在此情况下,第二层解码器26可通过将经由层间预测获得的残差分量与第二层预测块的样点值进行合成来重构第二层块,其中,第二层预测块是通过使用重构的第一层图像来确定的。
根据空间可伸缩视频编码方法,当第一层解码器22重构具有与第二层图像的分辨率不同的分辨率的第一层图像时,第二层解码器26可对重构的第一层图像进行插值以便将重构的第一层图像的尺寸调整为第二层原始图像的分辨率。插值后的重构的第一层图像可被确定为用于层间预测的第二层预测图像。
因此,层间视频解码设备20的第一层解码器22可对第一层流进行解码,并因此可重构第一层图像序列,第二层解码器26可对第二层流进行解码,并因此可重构第二层图像序列。
此外,考虑到不同视点中的照度失配,层间视频解码设备20的照度补偿确定器24可对具有不同视点的视频之间的照度差进行补偿,并可重构具有不同视点的视频。例如,可从比特流获得由第一层解码器22解码的第一视点图像与由第二层解码器26解码的第二视点图像之间的照度差。由于第二视点图像针对第一视点图像的照度差被获得,因此当第二层解码器26对第二视点视频进行解码时,可确定是否执行照度补偿操作。
根据本示例性实施例的照度补偿确定器24可考虑当前画面的预定数据单元(诸如条带或块)的特征来确定是否执行照度补偿。
在下文中,将参照图2b详细地描述考虑照度补偿的层间视频解码设备20的操作。
图2b示出根据示例性实施例的层间视频解码方法的流程图。
在操作21,第一层解码器22可基于从第一层比特流获得的编码信息来重构第一层图像。
在操作23,照度补偿确定器24可确定是否对被确定为预定分区类型并处于预测模式的第二层块执行照度补偿。
在操作25,第二层解码器26可根据层间预测结构通过使用重构的第一层图像的与第二层块相应的第一层参考块来确定重构的第二层块。可通过对第一层参考块与从第二层比特流获得的层间预测信息的残差分量进行合成来确定重构的第二层块。
为了重构由照度补偿确定器24确定为进行照度补偿的第二层块,第二层解码器26可对第一层参考块与第二层块之间的照度差进行补偿。
可从比特流获得关于层之间的照度差的信息。可选地,第二层块的照度值可被补偿多达预设照度值。
根据本示例性实施例,可一起执行照度补偿和层间补偿。可根据层间预测结构,按照对第二层块的样点另外地执行照度补偿的方式来确定第二层块的重构的样点,其中,第二层块的样点是通过对第一层块的重构的样点执行关于残差分量的补偿而确定的。
根据另一示例性实施例,可不同时执行照度补偿和层间补偿。由于照度差分量可根据层间预测结构被包括在层之间的残差分量中,因此可不根据层间预测结构对第二层块的样点执行照度补偿,其中,第二层块的样点是通过对第一层块的重构的样点执行关于残差分量的补偿而确定的。然而,可对未针对层之间的残差分量进行补偿的第二层块执行照度补偿。
因此,第二层解码器26可产生由基于层间预测和照度补偿中的至少一个而被重构的第二层块组成的重构的第二层图像。
照度补偿确定器24可从第二层比特流获得第二层块的分区类型信息和预测模式信息。当分区类型信息指示预定分区类型,并且预测模式信息不指示帧内预测模式时,可从第二层比特流获得用于第二层块的照度补偿信息。照度补偿确定器24可基于用于第二层块的照度补偿信息来确定是否对重构的第二层块执行照度补偿。
照度补偿确定器24可获得用于以下块的照度补偿信息,其中,所述块的分区类型信息指示2N×2N类型并且所述块的预测模式信息不指示帧内预测模式。
照度补偿确定器24可获得用于以下块的照度补偿信息,其中,所述块的分区类型信息指示2N×2N类型并且所述块的预测模式信息不指示帧内预测模式。
作为另一示例,照度补偿确定器24可基于分区类型信息和预测模式信息来获得用于指示跳过模式或被确定为处于2N×2N融合模式的块的照度补偿信息。
照度补偿确定器24可根据当前分区的尺寸来确定是否对将被照度补偿的块的亮度分量和色度分量执行照度补偿。例如,可确定对分区尺寸为8×8的块的亮度分量执行照度补偿,并可确定不对分区尺寸为8×8的块的色度分量执行照度补偿。
此外,照度补偿确定器24可根据块的尺寸针对确定是否对亮度分量和色度分量执行照度补偿的过程进行不同的操作。例如,照度补偿确定器24可确定对块的亮度分量执行照度补偿,其中,亮度分量的分区尺寸等于或大于8×8。可仅对块的色度分量执行照度补偿,其中,块的亮度分量的分区尺寸大于8×8。
照度补偿确定器24可跳过确定是否对除了被确定为预定分区类型并处于预测模式的块之外的其它第二层块执行照度补偿的操作。
此外,根据本示例性实施例的照度补偿确定器24可不对被确定为进行照度补偿的第二层块执行残差预测,其中,残差预测将用于通过使用时间方向参考块和层间方向参考块中的至少一个参考块的残差信息来对第二层块的残差信息进行预测。因此,可仅针对被确定为不进行照度补偿的块(条带或画面)确定指示是否执行残差预测的信息。
根据另一示例性实施例的照度补偿确定器24可不执行用于通过将第一层参考块的样点值补偿照度差来确定第二层块的样点值的照度补偿,其中,第二层块被确定为进行残差预测以便通过使用时间方向参考块和层间方向参考块中的至少一个参考块的残差信息对第二层块的残差信息进行预测。因此,可仅针对被确定为不进行残差预测的块(条带或画面)获得指示是否执行照度补偿的信息。
然而,根据层间编码方法,第二层块的分区类型或预测模式可被确定为等同于与第二层块相应的第一层块的分区类型和预测模式。在此情况下,即使照度补偿确定器24形成在第二层编码器26外部,照度补偿器24仍可通过使用第一层块的分区类型信息和预测模式信息的样点值来预测第二层块的分区类型和预测模式。因此,照度补偿确定器24可基于第二层块的预测的分区类型和预测的预测模式来确定是否对第二层块执行照度补偿。
根据本示例性实施例的层间视频解码设备20可包括总体控制第一层解码器22、照度补偿确定器24和第二层解码器26的中央处理器(未示出)。可选地,第一层解码器22、照度补偿确定器24和第二层解码器26中的每一个可由其拥有的处理器(未示出)来驱动,并且处理器可互相操作,使得层间视频解码设备20可进行操作。可选地,基于根据本示例性实施例的层间视频解码设备20的外部处理器(未示出)的控制,第一层解码器22、照度补偿确定器24和第二层解码器26可被控制。
根据本示例性实施例的层间视频解码设备20可包括一个或更多个数据存储单元(未示出),其中,所述一个或更多个数据存储单元用于存储第一层解码器22、照度补偿确定器24和第二层解码器26的输入和输出数据。层间视频解码设备20可包括存储器控制器(未示出),其中,存储器控制器对所述一个或更多个数据存储单元的数据的输入和输出进行管理。
根据本示例性实施例的层间视频解码设备20与内部嵌入的内部视频解码处理器或外部视频解码处理器进行互操作以经由视频解码重构视频,使得层间视频解码设备20可执行包括逆变换的视频解码操作。根据本示例性实施例的层间视频解码设备20的内部视频解码处理器不仅可与单独的处理器相应,还可与层间视频解码设备20的CPU或图形化操作单元包括视频解码模块并因此执行基本视频解码操作的情况相应。
参照图2a和图2b,当层间视频解码设备20对第二层图像进行解码时,层间视频解码设备20对特定类型的块或条带执行关于不同层图像之间的照度差的补偿或者执行关于视点之间的照度差的补偿,使得重构的第一层图像与重构的第二层图像之间的照度可变得一致。参照图1a和图1b,层间视频编码设备10对特定类型的块或条带中的不同层图像执行照度补偿,使得预测图像与原始图像之间的残差分量可减小。因此,解码效率可被提高。
图3示出根据示例性实施例的层间预测结构。
根据本示例性实施例的层间视频编码设备10可根据图3中示出的多视点视频预测结构50的再现顺序对基本视点图像、左视点图像和右视点图像进行预测编码。
根据多视点视频预测结构50的再现顺序,相同视点的图像沿水平方向排列。因此,被标记“左”的左视点图像被水平排列在一行,被标记“中心”的基本视点图像被水平排列在一行,被标记“右”的右视点图像被水平排列在一行。与左视点图像/右视点图像相比,基本视点图像可以是中心视点图像。
此外,具有相同画面顺序计数(POC)顺序的图像沿垂直方向排列。图像的POC顺序指示形成视频的图像的再现顺序。在多视点视频预测结构50中被标记的“POC X”指示位于相应列中的图像的相对再现顺序,随着X的数目减小,图像的再现顺序被提前,随着X的数目增大,图像的再现顺序被推后。
因此,根据多视点视频预测结构50的再现顺序,被标记“左”的左视点图像根据POC顺序(再现顺序)沿水平方向被排列,被标记“中心”的基本视点图像根据POC顺序(再现顺序)沿水平方向被排列,并且被标记“右”的右视点图像根据POC顺序(再现顺序)沿水平方向被排列。此外,与基本视点图像位于相同列的左视点图像和右视点图像是具有不同视点但具有相同POC顺序(再现顺序)的图像。
对于每个视点,四个连续图像形成一个画面组(GOP)。每个GOP包括连续的锚(anchor)画面之间的画面以及一个锚画面(关键画面)。
锚画面指示随机访问点,并且当视频被再现时,如果再现位置是从根据图像的再现顺序(即,POC顺序)被排列的图像中任意选择的,则再现其POC顺序接近于再现位置的锚画面。基本视点图像包括基本视点锚画面51、52、53、54和55,左视点图像包括左视点锚画面151、152、153、154和155,右视点图像包括右视点锚画面251、252、253、254和255。
多视点图像根据GOP顺序被再现和预测(重构)。首先,根据多视点视频预测结构50的再现顺序,根据视点,GOP 0中包括的图像可被再现,然后GOP 1中包括的图像可被再现。也就是说,每个GOP中包括的图像可按照GOP 0、GOP 1、GOP 2和GOP 3的顺序被再现。此外,根据多视点视频预测结构的编码顺序,根据视点,GOP 0中包括的图像可被预测(重构),然后GOP 1中包括的图像可被预测(重构)。也就是说,按照GOP 0、GOP 1、GOP 2和GOP 3的顺序,每个GOP中包括的图像可被预测(重构)。
根据多视点视频预测结构50的再现顺序,对图像执行视点间预测(层间预测)和帧间预测两者。在多视点视频预测结构中,箭头开始的图像是参考图像,箭头结束的图像是通过使用参考图像而被预测的图像。
基本视点图像的预测结果可被编码并可被输出为基本视点图像流,附加视点图像的预测结果可被编码并可被输出为层比特流。此外,左视点图像的预测结果可被输出为第一层比特流,右视点图像的预测结果可被输出为第二层比特流。
对基本视点图像仅执行帧间预测。也就是说,作为I画面类型的锚画面51、52、53、54和55不参考其它图像,但是作为B画面类型和b画面类型的其它图像通过参考其它基本视点图像而被预测。通过参考按POC顺序位于前面的I画面类型锚画面以及按POC顺序位于后面的I画面类型锚画面来预测B画面类型图像。通过参考按POC顺序位于前面的I画面类型画面以及按POC顺序位于后面的B画面类型图像来预测b画面类型图像,或者通过参考按POC顺序位于前面的B画面类型图像以及按POC顺序位于后面的I画面类型锚画面来预测b画面类型图像。
对于左视点图像和右视点图像,执行参考不同视点的图像的视点间预测(层间预测)以及参考相同视点的图像的帧间预测。
可通过参考POC顺序分别相同的基本视点锚画面51、52、53、54和55来对左视点锚画面151、152、153、154和155执行视点间预测(层间预测)。可通过参考分别位于相同POC顺序的基本锚画面51、52、53、54和55或者左视点锚画面151、152、153、154和155,对右视点锚画面251、252、253、254和255执行视点间预测。此外,可对左视点图像和右视点图像中的不是锚画面151、152、153、154、155、251、252、253、254和255的其它图像执行参考具有不同视点但具有相同POC顺序的图像的视点间预测(层间预测)。
通过参考相同视点的图像对左视点图像和右视点图像中的不是锚画面151、152、153、154、155、251、252、253、254和255的其它图像进行预测。
然而,可能无法通过参考在具有相同视点的附加视点图像之中的按再现顺序在前的锚画面来对左视点图像和右视点图像中的每一个图像进行预测。也就是说,对于当前左视点图像的帧间预测,可参考除了左视点锚画面之外的再现顺序在当前左视点图像之前的左视点图像。类似地,对于当前右视点图像的帧间预测,可参考除了右视点锚画面之外的再现顺序在当前右视点图像之前的右视点图像。
此外,对于当前左视点图像的帧间预测,优选的是:预测操作不参考在包括当前左视点图像的当前GOP之前的先前GOP中所包括的左视点图像,并且所述预测操作是通过参考当前GOP中所包括的将在当前左视点图像之前被重构的左视点图像来执行的。此操作也被应用于右视点图像。
根据本示例性实施例的层间视频解码设备20可根据图3中示出的多视点视频预测结构50的再现顺序来重构基本视点图像、左视点图像和右视点图像。
可经由参考基本视点图像的视点间视差补偿以及参考左视点图像的图像间运动补偿来重构左视点图像。可经由参考基本视点图像和左视点图像的视点间视差补偿以及参考右视点图像的图像间运动补偿来重构右视点图像。对于左视点图像和右视点图像的视差补偿和运动补偿,必需首先重构参考图像。
对于左视点图像的图像间运动补偿,可经由参考重构的左视点参考图像的图像间运动补偿来重构左视点图像。对于右视点图像的图像间运动补偿,可经由参考重构的右视点参考图像的图像间运动补偿来重构右视点图像。
对于当前左视点图像的图像间运动补偿,优选的是:不参考在包括当前左视点图像的当前GOP之前的先前GOP中所包括的左视点图像,而仅参考当前GOP中所包括的将在当前左视点图像之前被重构的左视点图像。此操作也被应用于右视点图像。
如上所述,层间视频编码设备10和层间视频解码设备20可根据图像的特征来确定是否执行照度补偿。此外,层间视频编码设备10和层间视频解码设备20可确定是否对每个条带或每个块执行照度补偿。
例如,可仅对跳过模式块确定是否执行照度补偿。由于在非跳过模式块中,通过使用作为层间预测或帧间预测的结果而产生的残差分量来对原始块与预测块之间的预测误差进行补偿,因此可不对非跳过模式块执行照度补偿。另一方面,由于跳过模式块的残差数据不被编码,因此可对跳过模式块确定是否执行照度补偿。
对于预测编码,2N×2N尺寸的编码单元可被划分为2N×2N尺寸、N×2N尺寸、2N×N尺寸或N×N尺寸的预测单元。这里,指示预测单元的形状的分区类型信息的样点值可被确定为2N×2N、N×2N、2N×N和N×N。例如,可仅对融合模式下的2N×2N块(在下文中,称为2N×2N融合块)确定是否执行照度补偿。
此外,可对亮度块和色度块中的每一个确定是否执行照度补偿。例如,当亮度块是跳过模式下的块(跳过块)或融合模式下的2N×2N块(2N×2N融合块)时,可确定是否执行照度补偿。然而,只有当色度块是跳过模式时,才会确定是否执行照度补偿。
作为另一示例,可对分区尺寸为2N×2N的所有亮度块和色度块确定是否执行照度补偿。
作为另一示例,即使确定对分区尺寸为2N×2N的块执行照度补偿,仍可根据当前分区的尺寸不同地确定是否对亮度分量和色度分量执行照度补偿。例如,可确定对分区尺寸为8×8的块的亮度分量执行照度补偿,并且可确定不对分区尺寸为8×8的块的色度分量执行照度补偿。
此外,将进行照度补偿的块的尺寸可根据亮度块和色度块而变化。例如,可确定对分区尺寸等于或大于8×8的块的亮度分量执行照度补偿。可针对确定是否对相同块的色度分量执行照度补偿的过程进行不同的操作。在亮度分量的分区尺寸为8×8的块中,该块的色度分量的分区尺寸可以是4×4。因此,如果块的亮度分量的分区尺寸为8×8,则不对该块的色度分量执行照度补偿,如果块的亮度分量的分区尺寸大于8×8,则可对该块的色度分量执行照度补偿。
此外,当当前画面不是随机访问点时,可不对当前画面中的块执行照度补偿。也就是说,可仅对随机访问点的块确定是否执行照度补偿。
作为另一示例,可不对不是随机访问点的画面的色度块执行照度补偿。因此,可对作为随机访问点的画面的亮度块/色度块以及不是随机访问点的画面的亮度块确定是否执行照度补偿。
作为另一示例,可基于编码特征(诸如包括块的画面的画面类型、时间级别、网络抽象层(NAL)单元类型或在时间预测期间的当前图像与参考图像之间的距离)来确定是否对当前块执行照度补偿。能够根据编码特征来预先设置进行照度补偿的可能性高的编码模式。可对具有预设编码模式的块确定是否执行照度补偿。
作为另一示例,可根据针对每个块确定的编码模式来确定是否执行照度补偿。例如,对于每个条带,照度补偿信息可被发送为条带数据或条带头,或者可作为条带数据或条带头被接收,其中,照度补偿信息指示当相应条带的块指示预定编码模式时是否执行照度补偿。可选地,对于每个画面,照度补偿信息可被发送为PPS或画面相关数据,或者可作为PPS或画面相关数据被接收,其中,照度补偿信息指示当相应画面的块指示预定编码模式时是否执行照度补偿。
例如,可根据基于率失真(RD)优化而确定的块的编码模式、块的预测方向以及编码类型来确定是否对块执行照度补偿。
在下文中,参照图4a至图7b提供根据示例性实施例的确定是否执行照度补偿的方法。
参照图4a、图4b和图5来描述确定是否对跳过模式或2N×2N融合块执行照度补偿的示例性实施例,参照图6a、图6b和图6c来描述确定是否对亮度块和色度块中的每一个执行照度补偿的示例性实施例,并参照图7a和图7b来描述选择性地执行照度补偿和残差预测的示例性实施例。
图4a示出根据示例性实施例的由层间视频编码设备10执行的照度补偿方法的流程图。
在操作41,如果当前块的块类型既不是跳过块也不是2N×2N融合块,则层间视频编码设备10的照度补偿确定器14可不确定是否执行照度补偿,并可结束处理(40)。
然而,在操作41,如果当前块的块类型是跳过块或2N×2N融合块,则在操作42,照度补偿确定器14可确定是否对当前块执行照度补偿。根据所述确定,照度补偿确定器14可将照度补偿信息“ic_flag”设置给当前块。被设置给当前块的照度补偿信息“ic_flag”可被编码并且可被包括在传输流中。
在操作43,确定照度补偿信息“ic_flag”是否指示1,在操作44,可对被确定为进行照度补偿的块执行照度补偿。
图4b示出根据示例性实施例的由层间视频解码设备20执行的照度补偿方法的流程图。
在操作46,层间视频解码设备20的照度补偿确定器24可获得当前块的块类型信息,并且可确定当前块是否是跳过块或2N×2N融合块。如果当前块既不是跳过块也不是2N×2N融合块,则照度补偿确定器24可不确定是否执行照度补偿并且可结束处理(45)。
然而,在操作46,如果确定当前块的块类型是跳过块或2N×2N融合块,则在操作47,照度补偿确定器24可获得当前块的照度补偿信息“ic_flag”,并可通过参考照度补偿信息“ic_flag”来确定是否执行照度补偿。可从接收流获得当前块的照度补偿信息“ic_flag”,或者可根据作为当前块的编码模式的编码类型或预测方向来确定当前块的照度补偿信息“ic_flag”。
在操作48,确定照度补偿信息“ic_flag”是否指示1,在操作49,可对被确定为进行照度补偿的块执行照度补偿。
图5示出根据示例性实施例的用于根据当前块的分区类型和预测模式执行照度补偿的语法。
用于当前块的语法coding_unit()55可包括用于确定是否对当前块执行照度补偿的条件56。
也就是说,当照度补偿针对条带中的块被启用(icEnableFlag=1),并且块的预测类型是2N×2N融合块(PartMode==PART_2Nx2N&&merge_flag[x0][y0])或跳过模式(skip_flag[x0][y0])时,照度补偿信息“ic_flag”可被使用,以便指示是否对当前块执行照度补偿。
图6a至图6c示出确定是否对亮度块和色度块中的每一个执行照度补偿的示例。
图6a示出根据另一示例性实施例的由层间视频编码设备10执行的照度补偿方法的流程图。
首先,在操作61,层间视频编码设备10的照度补偿确定器14可确定是否能够对当前画面或条带中的色度块执行照度补偿,并且可设置用于色度块的照度补偿信息“chroma_ic_flag”。
如上所述,可通过使用编码模式(诸如包括当前块的画面类型)、NAL单元类型、原始图像与时间参考图像之间的距离等来确定用于色度块的照度补偿信息。用于色度块的照度补偿信息“chroma_ic_flag”可被包括在传输流中。
在操作61,确定是否在画面或条带级别执行照度补偿,在操作62至66,可确定是否在块级别执行照度补偿。
如果在先前操作确定了是否对当前画面或条带中的色度块执行照度补偿,则在操作62,照度补偿确定器14可确定是否对亮度块和色度块中的每一个执行照度补偿。可设置指示是否能够对亮度块执行照度补偿的亮度照度补偿信息“ic_flag”,并可设置指示是否能够对色度块执行照度补偿的色度照度补偿信息“chroma_ic_flag”。
在操作63,照度补偿确定器14可确定亮度照度补偿信息“ic_flag”是否指示对当前亮度块执行照度补偿。如果亮度照度补偿信息“ic_flag”指示0值,则照度补偿确定器14可不确定是否执行照度补偿并且可结束处理(60)。
然而,在操作63,如果亮度照度补偿信息“ic_flag”指示1,则在操作64,照度补偿确定器14可对当前亮度块执行照度补偿。
在操作65,如果确定色度照度补偿信息“chroma_ic_flag”指示1,则在操作66,照度补偿确定器14可对当前色度块执行照度补偿。
图6b示出根据另一示例性实施例的由层间视频解码设备20执行的照度补偿方法的流程图。
首先,在操作611,层间视频解码设备20的照度补偿确定器24可获得用于色度块的照度补偿信息“chroma_ic_flag”。可从传输流获得用于色度块的照度补偿信息“chroma_ic_flag”。如上所述,可通过使用编码模式(诸如包括当前块的画面类型)、NAL单元类型、原始图像与时间参考图像之间的距离等来确定用于色度块的照度补偿信息。
在操作611,确定是否在画面或条带级别执行照度补偿,在操作621至671,可确定是否在块级别执行照度补偿。
如果在先前操作确定是否对当前画面或条带中的色度块执行照度补偿,则在操作621,照度补偿确定器24可确定是否对亮度块和色度块中的每一个执行照度补偿。可获得指示是否能够对亮度块执行照度补偿的亮度照度补偿信息“ic_flag”,并且可获得指示是否能够对色度块执行照度补偿的色度照度补偿信息“chroma_ic_flag”。
在操作631,照度补偿确定器24可确定亮度照度补偿信息“ic_flag”是否指示对当前亮度块执行照度补偿。如果亮度照度补偿信息“ic_flag”指示值0,则照度补偿确定器24不会执行确定是否执行照度补偿的操作,并且可结束处理(601)。
然而,在操作631,如果亮度照度补偿信息“ic_flag”指示1,则在操作641,照度补偿确定器24可对当前亮度块执行照度补偿。
在操作651,如果确定色度照度补偿信息“chroma_ic_flag”指示1,则在操作661,照度补偿确定器24可对当前色度块执行照度补偿。
图6c示出根据另一示例性实施例的用于根据颜色分量执行照度补偿的语法。
当前条带的头slice_header 68可包括指示照度补偿在条带中是否被启用的“slice_ic_enable_flag”。当包括当前块的条带是非独立条带(dependent_slice_flag)时,条带的头slice_header 68可包括指示照度补偿在当前条带中是否被启用的“slice_ic_enable_flag”。
此外,根据指示照度补偿在当前条带中是否被启用的“slice_ic_enable_flag”,可确定是否对色度块执行照度补偿。也就是说,如果照度补偿在当前条带中被启用,则色度照度补偿信息“slice_chroma_ic_flag”可被使用,以便指示是否能够对当前条带中的色度块执行照度补偿。
如果当前条带的头slice_header 68不包括色度照度补偿信息“slice_chroma_ic_flag”,则色度照度补偿信息可被视为0。
虽然图6c提供了仅对色度块确定是否执行照度补偿的本示例性实施例,但是在另一示例性实施例中,可选择性地对亮度块确定是否执行照度补偿。
在下文中,参照图7a和图7b详细地描述选择性地执行照度补偿和残差预测的示例性实施例。
图7a和图7b示出用于确定是否对每个块执行照度补偿和残差预测的语法。
根据示例性实施例的层间视频编码设备10和层间视频解码设备20可执行残差预测,以在经由帧间预测在第一层中产生的残差分量与经由帧间预测在第二层中产生的残差分量之间执行预测。也就是说,根据残差预测,在经由帧间预测在层中产生的残差之间执行层间预测,并因此可执行总共两个预测操作。虽然编码效率由于残差预测而被提高,但是由于必需执行两个预测操作,因此计算负荷也很高。
当根据示例性实施例的层间视频编码设备10和层间视频编解码设备20执行时间方向预测(帧间预测)和视点方向预测(层间预测)时,可对当前块同时执行照度补偿和残差预测。
然而,为了减少计算,当能够对当前块执行照度补偿和残差预测两者时,可能不允许进行照度补偿和残差预测中的一个的操作。
根据示例性实施例的层间视频编码设备10和层间视频解码设备20可不对照度补偿被启用的块执行残差预测。
根据其它示例性实施例的层间视频编码设备10和层间视频解码设备20可不对残差预测被启用的块执行照度补偿。
根据本示例性实施例的块语法coding_unit(70)包括用于确定是否对当前块执行照度补偿的条件71以及用于确定是否执行残差预测的条件72。
因此,当基于“icEnableFlag”确定照度补偿在当前条带中被启用时,可基于“ic_flag”(条件71)来确定是否对当前块执行照度补偿。当基于“resPredEnableFlag”确定残差预测在当前条带中被启用,并且基于“!ic_flag”确定照度补偿不被执行时,可基于“res_pred_flag”(条件72)来确定是否对当前块执行残差预测。
根据本示例性实施例的块语法coding_unit(75)包括用于确定是否对当前块执行残差预测的条件76以及用于确定是否对当前块执行照度补偿的条件77。
因此,当基于“resPredEnableFlag”确定残差预测在当前条带中被启用时,可基于“res_pred_flag”(条件76)来确定对当前块执行残差预测。此外,当基于“icEnableFlag”确定照度补偿在当前条带中被启用,并且基于“!res_pred_flag”确定残差预测不被执行时,可基于“ic_flag”(条件77)来确定是否对当前块执行照度补偿。
参照图1a至图7b,已描述了用于根据图像的特征来确定是否对块执行照度补偿的层间视频编码设备10和层间视频解码设备20。如果对所有块执行照度补偿,则计算负荷会增加,从而仅对满足预定条件的块确定是否执行照度补偿,并且,不对未满足预定条件的块确定是否执行照度补偿,且不对该块执行照度补偿。
因此,可针对通过使用预设编码模式而被编码的块确定是否执行照度补偿。此外,可将针对具有所述编码模式的块所确定的指示是否执行照度补偿的照度补偿信息包括在传输流中,或者可从接收流获得所述照度补偿信息。
因此,基于根据示例性实施例的层间视频编码设备10和层间视频解码设备20,仅对更需要照度补偿的块确定是否执行照度补偿,并且不对其它块执行照度补偿,使得可减小由于照度补偿而导致的计算负荷的增加,并且可提高由于照度补偿而导致的编码效率。
如上所述,根据示例性实施例的层间视频编码设备10和层间视频解码设备20将划分后的视频数据的块划分为树结构的编码单元,并且编码单元、预测单元和变换单元被用于编码单元的层间预测或帧间预测。在下文中,参照图8至图20,描述基于树结构的编码单元和变换单元的视频编码方法及其设备以及视频解码方法及其设备。
总而言之,在对多层视频的编码/解码过程中,单独地执行用于第一层图像的编码/解码过程以及用于第二层图像的编码/解码过程。也就是说,当在多层视频中发生层间预测时,可相互地参考单层视频的编码/解码结果,但针对多个单层视频中的每个单层视频执行编码/解码过程。
因此,为了便于描述,参照图8至图20描述的基于树结构的编码单元的视频编码过程和视频解码过程是用于单层视频的视频编码过程和视频解码过程,因此,帧间预测和运动补偿被详细描述。然而,如以上参照图1a至图7b所描述的,为了对视频流进行编码/解码,基本视点图像与第二层图像之间的层间预测和补偿被执行。
因此,为了使层间视频编码设备10的第一层编码器12基于树结构的编码单元对多层视频进行编码,第一层编码器12可包括与多层视频的层数相应的图8的视频编码设备以便对多个单层视频中的每个单层视频执行视频编码,并且可控制视频编码设备100分别对多个单层视频进行编码。此外,层间视频编码设备10可通过使用关于由视频编码设备100获得的分离的单视点的编码结果来执行视点间预测。因此,层间视频编码设备10的第一层编码器12可产生包括每个层的编码结果的基本视点视频流和第二层视频流。
类似地,为了使层间视频解码设备20的第二层解码器26基于树结构的编码单元对多层视频进行解码,第二层解码器26可包括与多层视频的层数相应的图9的视频解码设备200以便对接收到的第一层视频流和接收到的第二层视频流的层中的每一个层执行视频解码,并且可控制视频解码设备200分别对多个单层视频进行解码。然后,层间视频解码设备20可通过使用关于由视频解码设备200获得的分离的单个层的解码结果来执行层间补偿。因此,层间视频解码设备20的第二层解码器26可产生针对每个层重构的第一层图像和第二层图像。
图8是根据示例性实施例的基于树结构的编码单元的视频编码设备100的框图。
涉及基于树结构的编码单元的视频预测的视频编码设备100包括编码单元确定器120和输出单元130。以下,为便于描述,涉及基于树结构的编码单元的视频预测的视频编码设备100被称为“视频编码设备100”。
编码单元确定器120可基于图像的当前画面的最大编码单元来划分当前画面,其中,最大编码单元是具有最大尺寸的编码单元。如果当前画面大于最大编码单元,则可将当前画面的图像数据划分为至少一个最大编码单元。根据示例性实施例的最大编码单元可以是尺寸为32×32、64×64、128×128、256×256等的数据单元,其中,数据单元的形状是宽度和长度为2的若干次方的正方形。
根据实施例的编码单元可由最大尺寸和深度表征。深度表示编码单元从最大编码单元被空间划分的次数,并且随着深度加深,根据深度的较深层编码单元可从最大编码单元被划分到最小编码单元。最大编码单元的深度为最高深度,最小编码单元的深度为最低深度。由于随着最大编码单元的深度加深,与每个深度相应的编码单元的尺寸减小,因此与更高深度相应的编码单元可包括多个与更低深度相应的编码单元。
如上所述,当前画面的图像数据根据编码单元的最大尺寸被划分为最大编码单元,并且每个最大编码单元可包括根据深度被划分的较深层编码单元。由于根据深度对根据示例性实施例的最大编码单元进行划分,因此可根据深度分层地对包括在最大编码单元中的空间域的图像数据进行分类。
可预先确定编码单元的最大深度和最大尺寸,其中,所述最大深度和最大尺寸限制最大编码单元的高度和宽度被分层划分的总次数。
编码单元确定器120对通过根据深度对最大编码单元的区域进行划分而获得的至少一个划分区域进行编码,并且根据所述至少一个划分区域来确定用于输出最终编码的图像数据的深度。换言之,编码单元确定器120通过根据当前画面的最大编码单元以根据深度的较深层编码单元对图像数据进行编码,并选择具有最小编码误差的深度,来确定编码深度。将确定的编码深度和根据确定的编码深度的编码的图像数据输出到输出单元130。
基于与等于或低于最大深度的至少一个深度相应的较深层编码单元,对最大编码单元中的图像数据进行编码,并且基于每个较深层编码单元比较对图像数据进行编码的结果。在对较深层编码单元的编码误差进行比较之后,可选择具有最小编码误差的深度。可针对每个最大编码单元选择至少一个编码深度。
随着编码单元根据深度而被分层地划分以及随着编码单元的数量增加,最大编码单元的尺寸被划分。另外,即使在一个最大编码单元中编码单元与同一深度相应,仍通过分别测量每个编码单元的图像数据的编码误差来确定是否将与同一深度相应的每个编码单元划分到更低深度。因此,即使图像数据被包括在一个最大编码单元中,编码误差可根据所述一个最大编码单元中的区域而不同,因此编码深度可根据图像数据中的区域而不同。因此,可在一个最大编码单元中确定一个或更多个编码深度,并且可根据至少一个编码深度的编码单元来对最大编码单元的图像数据进行划分。
因此,编码单元确定器120可确定包括在最大编码单元中的具有树结构的编码单元。根据示例性实施例的“具有树结构的编码单元”包括最大编码单元中包括的所有较深层编码单元中的与确定为编码深度的深度相应的编码单元。可根据最大编码单元的同一区域中的深度来分层地确定编码深度的编码单元,并可在不同区域中独立地确定编码深度的编码单元。类似地,可从另一区域的编码深度独立地确定当前区域中的编码深度。
根据示例性实施例的最大深度是与从最大编码单元到最小编码单元的划分次数相关的索引。根据示例性实施例的第一最大深度可表示从最大编码单元到最小编码单元的总划分次数。根据示例性实施例的第二最大深度可表示从最大编码单元到最小编码单元的深度等级的总数。例如,当最大编码单元的深度是0时,对最大编码单元划分一次的编码单元的深度可被设置为1,对最大编码单元划分两次的编码单元的深度可被设置为2。这里,如果最小编码单元是最大编码单元被划分四次后的编码单元,则存在深度0、1、2、3和4的5个深度等级,并因此第一最大深度可被设置为4,第二最大深度可被设置为5。
可根据最大编码单元执行预测编码和变换。还根据最大编码单元,基于根据等于或小于最大深度的深度的较深层编码单元来执行预测编码和变换。
由于每当根据深度对最大编码单元进行划分时,较深层编码单元的数量增加,因此将对随着深度加深而产生的所有较深层编码单元执行包括预测编码和变换的编码。为了便于解释,在最大编码单元中,现在将基于当前深度的编码单元来描述预测编码和变换。
视频编码设备100可不同地选择用于对图像数据进行编码的数据单元的尺寸或形状。为了对图像数据进行编码,执行诸如预测编码、变换和熵编码的操作,此时,可针对所有操作使用相同的数据单元,或者可针对每个操作使用不同的数据单元。
例如,视频编码设备100不仅可选择用于对图像数据进行编码的编码单元,还可选择不同于编码单元的数据单元,以便对编码单元中的图像数据执行预测编码。
为了在最大编码单元中执行预测编码,可基于与编码深度相应的编码单元(即,基于不再被划分为与更低深度相应的编码单元的编码单元)来执行预测编码。以下,不再被划分且成为用于预测编码的基本单元的编码单元现在将被称为“预测单元”。通过划分预测单元获得的分区可包括预测单元或通过对从预测单元的高度和宽度中选择的至少一个进行划分而获得的数据单元。分区是编码单元的预测单元被划分的数据单元,并且预测单元可以是具有与编码单元相同的尺寸的分区。
例如,当2N×2N(其中,N是正整数)的编码单元不再被划分时,2N×2N的编码单元成为尺寸为2N×2N的预测单元时,并且分区的尺寸可以是2N×2N、2N×N、N×2N或N×N。分区类型的示例包括通过对预测单元的高度或宽度进行对称地划分而获得的对称分区、通过对预测单元的高度或宽度进行非对称地划分(诸如,1:n或n:1)而获得的分区、通过对预测单元进行几何地划分而获得的分区、以及具有任意形状的分区。
预测单元的预测模式可以是从帧内模式、帧间模式和跳过模式中选择的至少一个。例如,可对2N×2N、2N×N、N×2N或N×N的分区执行帧内模式或帧间模式。另外,可仅对2N×2N的分区执行跳过模式。可对编码单元中的一个预测单元独立地执行编码,从而选择具有最小编码误差的预测模式。
视频编码设备100不仅可基于用于对图像数据进行编码的编码单元还可基于与编码单元不同的数据单元,来对编码单元中的图像数据执行变换。为了在编码单元中执行变换,可基于具有小于或等于编码单元的尺寸的数据单元来执行变换。例如,用于变换的数据单元可包括帧内模式的数据单元和帧间模式的数据单元。
以与根据树结构的编码单元类似的方式,编码单元中的变换单元可被递归地划分为更小尺寸的区域。因此,可基于根据变换深度的具有树结构的变换单元,对编码单元中的残差数据进行划分。
还可在变换单元中设置变换深度,其中,变换深度指示通过对编码单元的高度和宽度进行划分而达到变换单元的划分次数。例如,在2N×2N的当前编码单元中,当变换单元的尺寸是2N×2N时,变换深度可以是0,当变换单元的尺寸是N×N时,变换深度可以是1,当变换单元的尺寸是N/2×N/2时,变换深度可以是2。换句话说,还可根据变换深度设置具有树结构的变换单元。
根据与编码深度相应的编码单元的编码信息不仅要求关于编码深度的信息,还要求关于与预测编码和变换相关的信息的信息。因此,编码单元确定器120不仅确定具有最小编码误差的编码深度,还确定预测单元中的分区类型、根据预测单元的预测模式以及用于变换的变换单元的尺寸。
随后将参照图10至图20详细描述根据示例性实施例的最大编码单元中的根据树结构的编码单元以及确定预测单元/分区和变换单元的方法。
编码单元确定器120可通过使用基于拉格朗日乘数的率失真优化来测量根据深度的较深层编码单元的编码误差。
输出单元130在比特流中输出最大编码单元的图像数据和关于根据编码深度的编码模式的信息,其中,所述最大编码单元的图像数据基于由编码单元确定器120确定的至少一个编码深度被编码。
可通过对图像的残差数据进行编码来获得编码图像数据。
关于根据编码深度的编码模式的信息可包括关于编码深度的信息、关于预测单元中的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。
可通过使用根据深度的划分信息来定义关于编码深度的信息,其中,根据深度的划分信息指示是否对更低深度而不是当前深度的编码单元执行编码。如果当前编码单元的当前深度是编码深度,则对当前编码单元中的图像数据进行编码并输出,因此可将划分信息定义为不将当前编码单元划分到更低深度。可选地,如果当前编码单元的当前深度不是编码深度,则对更低深度的编码单元执行编码,并因此可将划分信息定义为对当前编码单元进行划分来获得更低深度的编码单元。
如果当前深度不是编码深度,则对被划分到更低深度的编码单元的编码单元执行编码。由于更低深度的至少一个编码单元存在于当前深度的一个编码单元中,因此对更低深度的每个编码单元重复执行编码,并因此可对具有相同深度的编码单元递归地执行编码。
由于针对一个最大编码单元确定具有树结构的编码单元,并且针对编码深度的编码单元确定关于至少一个编码模式的信息,所以可针对一个最大编码单元确定关于至少一个编码模式的信息。另外,由于根据深度对图像数据进行分层划分,因此最大编码单元的图像数据的编码深度可根据位置而不同,因此可针对图像数据设置关于编码深度和编码模式的信息。
因此,输出单元130可将关于相应的编码深度和编码模式的编码信息分配给包括在最大编码单元中的编码单元、预测单元和最小单元中的至少一个。
根据示例性实施例的最小单元是通过将构成最低深度的最小编码单元划分为4份而获得的正方形数据单元。可选择地,根据实施例的最小单元可以是可包括在最大编码单元中所包括的所有编码单元、预测单元、分区单元和变换单元中的最大正方形数据单元。
例如,通过输出单元130输出的编码信息可被分类为根据较深层编码单元的编码信息和根据预测单元的编码信息。根据较深层编码单元的编码信息可包括关于预测模式的信息和关于分区尺寸的信息。根据预测单元的编码信息可包括关于帧间模式的估计方向的信息、关于帧间模式的参考图像索引的信息、关于运动矢量的信息、关于帧内模式的色度分量的信息、以及关于帧内模式的插值方法的信息。
根据画面、条带或GOP定义的关于编码单元的最大尺寸的信息和关于最大深度的信息可被插入到比特流的头、序列参数集或画面参数集中。
还可通过比特流的头、序列参数集或画面参数集来输出关于针对当前视频允许的变换单元的最大尺寸的信息、以及关于变换单元的最小尺寸的信息。输出单元130可对与预测相关的参考信息、预测信息和条带类型信息进行编码并输出。
根据用于视频编码设备100的最简单实施例,较深层编码单元可以是通过将更高深度(更高一层)的编码单元的高度或宽度划分成两份而获得的编码单元。换言之,当当前深度的编码单元的尺寸是2N×2N时,更低深度的编码单元的尺寸是N×N。另外,尺寸为2N×2N的具有当前深度的编码单元可包括最多4个具有所述更低深度的编码单元。
因此,视频编码设备100可基于考虑当前画面的特征而确定的最大编码单元的尺寸和最大深度,通过针对每个最大编码单元确定具有最优形状和最优尺寸的编码单元来形成具有树结构的编码单元。另外,由于可通过使用各种预测模式和变换中的任意一个对每个最大编码单元执行编码,因此可考虑各种图像尺寸的编码单元的特征来确定最优编码模式。
因此,如果以传统宏块对具有高的分辨率或大数据量的图像进行编码,则每个画面的宏块的数量极度增加。因此,针对每个宏块产生的压缩信息的条数增加,因此难以发送压缩的信息,并且数据压缩效率降低。然而,通过使用视频编码设备100,由于在考虑图像的尺寸的同时增加编码单元的最大尺寸,并同时在考虑图像的特征的同时调整编码单元,因此可提高图像压缩效率。
以上参照图1a描述的层间视频编码设备10可包括与层数相应的视频编码设备100,以便对多层视频的每个层中的单层图像进行编码。例如,第一层编码器12可包括一个视频编码设备100,第二层编码器16可包括与第二层的数量相应的视频编码设备100。
当视频编码设备100对第一层图像进行编码时,编码单元确定器120可根据每个最大编码单元确定用于对树结构的编码单元中的每一个编码单元进行图像间预测的预测单元,并可对每个预测单元执行图像间预测。
当视频编码设备100对第二层图像进行编码时,编码单元确定器120可根据每个最大编码单元确定树结构的预测单元和编码单元,并可对每个预测单元执行帧间预测。
视频编码设备100可对照度差进行编码,以便对第一层图像与第二层图像之间的照度差进行补偿。然而,可根据编码单元的编码模式来确定是否执行照度补偿。例如可仅对尺寸为2N×2N的预测单元执行照度补偿。
图9是根据示例性实施例的基于树结构的编码单元的视频解码设备200的框图。
涉及基于树结构的编码单元的视频预测的视频解码设备200包括接收器210、图像数据和编码信息提取器220和图像数据解码器230。在下文中,为了便于描述,涉及基于树结构的编码单元的视频预测的视频解码设备200被称为“视频解码设备200”。
用于视频解码设备200的解码操作的各种术语(诸如编码单元、深度、预测单元、变换单元和关于各种编码模式的信息)的定义与参照图8和视频编码设备100描述的定义相同。
接收器210接收和解析编码视频的比特流。图像数据和编码信息提取器220从解析的比特流,针对每个编码单元提取编码图像数据,并将提取的图像数据输出到图像数据解码器230,其中,编码单元具有根据每个最大编码单元的树结构。图像数据和编码信息提取器220可从关于当前画面的头、序列参数集或画面参数集提取关于当前画面的编码单元的最大尺寸的信息。
另外,图像数据和编码信息提取器220从解析的比特流,根据每个最大编码单元,提取关于具有树结构的编码单元的编码深度和编码模式的信息。提取的关于编码深度和编码模式的信息被输出到图像数据解码器230。换言之,比特流中的图像数据被划分为最大编码单元,使得图像数据解码器230针对每个最大编码单元对图像数据进行解码。
可针对关于与编码深度相应的至少一个编码单元的信息设置关于根据最大编码单元的编码深度和编码模式的信息,关于编码模式的信息可包括关于与编码深度相应的相应编码单元的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。另外,根据深度的划分信息可被提取为关于编码深度的信息。
由图像数据和编码信息提取器220提取的关于根据每个最大编码单元的编码深度和编码模式的信息是关于这样的编码深度和编码模式的信息:该编码深度和编码模式被确定为在编码器(诸如,视频编码设备100)根据每个最大编码单元对根据深度的每个较深层编码单元重复地执行编码时产生最小编码误差。因此,视频解码设备200可通过根据产生最小编码误差的编码深度和编码模式对图像数据进行解码来重构图像。
由于关于编码深度和编码模式的编码信息可被分配给相应的编码单元、预测单元和最小单元中的预定数据单元,因此图像数据和编码信息提取器220可根据预定数据单元,提取关于编码深度和编码模式的信息。如果关于相应最大编码单元的编码深度和编码模式的信息根据预定数据单元被记录,则可将被分配相同的关于编码深度和编码模式的信息的预定数据单元推断为是包括在同一最大编码单元中的数据单元。
图像数据解码器230基于关于根据最大编码单元的编码深度和编码模式的信息,通过对每个最大编码单元中的图像数据进行解码,来重构当前画面。换言之,图像数据解码器230可基于提取出的关于包括在每个最大编码单元中的具有树结构的编码单元之中的每个编码单元的分区类型、预测模式和变换单元的信息,对编码的图像数据进行解码。解码处理可包括预测(包含帧内预测和运动补偿)和逆变换。
图像数据解码器230可基于关于根据编码深度的编码单元的预测单元的分区类型和预测模式的信息,根据每个编码单元的分区和预测模式,执行帧内预测或运动补偿。
此外,针对每个最大编码单元的逆变换,图像数据解码器230可针对每个编码单元读取关于根据树结构的变换单元的信息,以基于每个编码单元的变换单元来执行逆变换。经由逆变换,可重构编码单元的空间域的像素值。
图像数据解码器230可通过使用根据深度的划分信息来确定当前最大编码单元的编码深度。如果划分信息指示图像数据在当前深度中不再被划分,则当前深度是编码深度。因此,图像数据解码器230可通过使用关于用于与编码深度相应的每个编码单元的预测单元的分区类型、预测模式和变换单元的尺寸的信息,对当前最大编码单元中的编码数据进行解码。
换言之,可通过观察被分配给编码单元、预测单元和最小单元中的预定数据单元的编码信息集来收集包含包括相同划分信息的编码信息的数据单元,并且收集的数据单元可被认为是将由图像数据解码器230以相同编码模式进行解码的一个数据单元。因此,可通过获得关于每个编码单元的编码模式的信息来对当前编码单元进行解码。
以上参照图2a描述的层间视频解码设备20可包括与视点数相应的视频解码设备200,以便对接收到的第一层图像流和接收到的第二层图像流进行解码并重构第一层图像和第二层图像。
当第一层图像流被接收时,视频解码设备200的图像数据解码器230可将由提取器220从第一层图像流提取的第一层图像的样点划分为根据最大编码单元的树结构的编码单元。图像数据解码器230可基于用于图像间预测的预测单元对根据第一层图像的样点的树结构的编码单元中的每个编码单元执行运动补偿,并可重构第一层图像。
当第二层图像流被接收时,视频解码设备200的图像数据解码器230可将由提取器220从第二层图像流提取的第二层图像的样点划分为根据最大编码单元的树结构的编码单元。图像数据解码器230可基于用于图像间预测的预测单元对第二层图像的样点的编码单元中的每个编码单元执行运动补偿,并可重构第二层图像。
提取器220可从比特流获得与照度差相关的信息,以便对第一层图像与第二层图像之间的照度差进行补偿。然而,可根据编码单元的编码模式来确定是否执行照度补偿。例如,可仅对尺寸为2N×2N的预测单元执行照度补偿。
因此,视频解码设备200可获得关于当对每个最大编码单元递归地执行编码时产生最小编码误差的至少一个编码单元的信息,并可使用所述信息来对当前画面进行解码。换句话说,可对每个最大编码单元中被确定为最优编码单元的具有树结构的编码单元进行解码。
因此,即使图像具有高分辨率或具有大数据量,也可通过使用编码单元的尺寸和编码模式,有效地对图像数据进行解码和重建,其中,所述编码单元的尺寸和编码模式是通过使用从编码器接收到的关于最优编码模式的信息,根据图像的特征而被自适应地确定的。
图10是用于描述根据示例性实施例的编码单元的构思的示图。
编码单元的尺寸可被表示为宽度×高度,并且可以是64×64、32×32、16×16和8×8。64×64的编码单元可被划分为64×64、64×32、32×64或32×32的分区,32×32的编码单元可被划分为32×32、32×16、16×32或16×16的分区,16×16的编码单元可被划分为16×16、16×8、8×16或8×8的分区,8×8的编码单元可被划分为8×8、8×4、4×8或4×4的分区。
在视频数据310中,分辨率为1920×1080,编码单元的最大尺寸为64,最大深度为2。在视频数据320中,分辨率为1920×1080,编码单元的最大尺寸为64,最大深度为3。在视频数据330中,分辨率为352×288,编码单元的最大尺寸为16,最大深度为1。图10中示出的最大深度表示从最大编码单元到最小解码单元的划分总次数。
如果分辨率高或数据量大,则编码单元的最大尺寸可能较大,从而不仅提高编码效率,而且准确地反映图像的特征。因此,具有比视频数据330更高分辨率的视频数据310和320的编码单元的最大尺寸可以是64。
由于视频数据310的最大深度是2,因此由于通过对最大编码单元划分两次,深度加深至两层,因此视频数据310的编码单元315可包括长轴尺寸为64的最大编码单元和长轴尺寸为32和16的编码单元。另一方面,由于视频数据330的最大深度是1,因此由于通过对最大编码单元划分一次,深度加深至一层,因此视频数据330的编码单元335可包括长轴尺寸为16的最大编码单元和长轴尺寸为8的编码单元。
由于视频数据320的最大深度是3,因此由于通过对最大编码单元划分三次,深度加深至3层,因此视频数据320的编码单元325可包括长轴尺寸为64的最大编码单元和长轴尺寸为32、16和8的编码单元。随着深度加深,详细信息可被精确地表示。
图11是根据示例性实施例的基于编码单元的图像编码器400的框图。
图像编码器400执行视频编码设备100的编码单元确定器120的操作来对图像数据进行编码。换言之,帧内预测器410对当前帧405中的帧内模式下的编码单元执行帧内预测,运动估计器420和运动补偿器425通过使用当前帧405和参考帧495,对当前帧405中的帧间模式下的编码单元分别执行帧间估计和运动补偿。
从帧内预测器410、运动估计器420和运动补偿器425输出的数据通过变换器430和量化器440被输出为量化后的变换系数。量化后的变换系数通过反量化器460和逆变换器470被重构为空间域中的数据,重构的空间域中的数据在通过去块单元480和偏移补偿单元490后处理之后被输出为参考帧495。量化后的变换系数可通过熵编码器450被输出为比特流455。
为了在视频编码设备100中应用图像编码器400,图像编码器400的所有元件(即,帧内预测器410、运动估计器420、运动补偿器425、变换器430、量化器440、熵编码器450、反量化器460、逆变换器470、去块单元480和偏移补偿单元490)在考虑每个最大编码单元的最大深度的同时,基于具有树结构的编码单元中的每个编码单元执行操作。
具体地,帧内预测器410、运动估计器420和运动补偿器425在考虑当前最大编码单元的最大尺寸和最大深度的同时确定具有树结构的编码单元中的每个编码单元的分区和预测模式,变换器430确定具有树结构的编码单元中的每个编码单元中的变换单元的尺寸。
图12是根据示例性实施例的基于编码单元的图像解码器500的框图。
解析器510从比特流505解析将被解码的编码图像数据和解码所需的关于编码的信息。编码图像数据通过熵解码器520和反量化器530被输出为反量化的数据,反量化的数据通过逆变换器540被重建为空间域中的图像数据。
针对空间域中的图像数据,帧内预测器550对帧内模式下的编码单元执行帧内预测,运动补偿器560通过使用参考帧585对帧间模式下的编码单元执行运动补偿。
通过帧内预测器550和运动补偿器560的空间域中的图像数据可在通过去块单元570和偏移补偿单元580后处理之后被输出为重构帧595。另外,通过去块单元570和偏移补偿单元580后处理的图像数据可被输出为参考帧585。
为了在视频解码设备200的图像数据解码器230中对图像数据进行解码,图像解码器500可执行在解析器510之后执行的操作。
为了在视频解码设备200中应用图像解码器500,图像解码器500的所有元件(即,解析器510、熵解码器520、反量化器530、逆变换器540、帧内预测器550、运动补偿器560、去块单元570和偏移补偿单元580)针对每个最大编码单元基于具有树结构的编码单元执行操作。
具体地,帧内预测器550和运动补偿器560必需针对具有树结构的每个编码单元确定分区和预测模式,逆变换器540必需针对每个编码单元确定变换单元的尺寸。
图11的编码操作和图12的解码操作分别被描述为单层中的视频流编码操作和视频流解码操作。因此,如果图1a的第一层编码器12对具有至少两个层的视频流进行编码,则第一层编码器12可包括用于每个层的图像编码器400。类似地,如果图2a的第二层解码器26对具有至少两个层的视频流进行解码,则第二层解码器26可包括用于每个层的图像解码器500。
图13是示出根据示例性实施例的根据深度的较深层编码单元以及分区的示图。
视频编码设备100和视频解码设备200使用分层编码单元以考虑图像的特征。可根据图像的特征自适应地确定编码单元的最大高度、最大宽度和最大深度,或可由用户不同地设置编码单元的最大高度、最大宽度和最大深度。可根据编码单元的预定最大尺寸来确定根据深度的较深层编码单元的尺寸。
根据示例性实施例,在编码单元的分层结构600中,编码单元的最大高度和最大宽度均是64,最大深度是3。在此情况下,最大深度是指编码单元从最大编码单元到最小编码单元被划分的总次数。由于深度沿着分层结构600的垂直轴加深,因此较深层编码单元的高度和宽度均被划分。另外,预测单元和分区沿着分层结构600的水平轴被示出,其中,所述预测单元和分区是对每个较深层编码单元进行预测编码的基础。
换言之,在分层结构600中,编码单元610是最大编码单元,其中,深度为0,尺寸(即,高度乘宽度)为64×64。深度沿着垂直轴加深,存在尺寸为32×32和深度为1的编码单元620、尺寸为16×16和深度为2的编码单元630、尺寸为8×8和深度为3的编码单元640。尺寸为8×8和深度为3的编码单元640是最小编码单元。
编码单元的预测单元和分区根据每个深度沿着水平轴被排列。换言之,如果尺寸为64×64和深度为0的编码单元610是预测单元,则可将预测单元划分成包括在编码单元610中的分区,即,尺寸为64×64的分区610、尺寸为64×32的分区612、尺寸为32×64的分区614或尺寸为32×32的分区616。
类似地,可将尺寸为32×32和深度为1的编码单元620的预测单元划分成包括在编码单元620中的分区,即,尺寸为32×32的分区620、尺寸为32×16的分区622、尺寸为16×32的分区624和尺寸为16×16的分区626。
类似地,可将尺寸为16×16和深度为2的编码单元630的预测单元划分成包括在编码单元630中的分区,即,包括在编码度单元630中的尺寸为16×16的分区、尺寸为16×8的分区632、尺寸为8×16的分区634和尺寸为8×8的分区636。
类似地,可将尺寸为8×8和深度为3的编码单元640的预测单元划分成包括在编码单元640中的分区,即,包括在编码单元640中的尺寸为8×8的分区、尺寸为8×4的分区642、尺寸为4×8的分区644和尺寸为4×4的分区646。
为了确定构成最大编码单元610的编码单元的至少一个编码深度,视频编码设备100的编码单元确定器120对包括在最大编码单元610中的与每个深度相应的编码单元执行编码。
随着深度加深,包括具有相同范围和相同尺寸的数据的根据深度的较深层编码单元的数量增加。例如,需要四个与深度2相应的编码单元来覆盖包括在与深度1相应的一个编码单元中的数据。因此,为了根据深度比较对相同数据进行编码的结果,与深度1相应的编码单元和四个与深度2相应的编码单元均被编码。
为了针对多个深度之中的当前深度执行编码,可沿着分层结构600的水平轴,通过对与当前深度相应的编码单元中的每个预测单元执行编码,来针对当前深度,选择作为代表性编码误差的最小编码误差。可选地,随着深度沿着分层结构600的垂直轴加深,可通过针对每个深度执行编码来比较根据深度的代表性编码误差,以搜索最小编码误差。在编码单元610中的具有最小编码误差的深度和分区可被选为编码单元610的编码深度和分区类型。
图14是用于描述根据示例性实施例的编码单元710和变换单元720之间的关系的示图。
视频编码设备100或视频解码设备200针对每个最大编码单元,根据具有小于或等于最大编码单元的尺寸的编码单元,对图像进行编码或解码。可基于不大于相应编码单元的数据单元,来选择用于在编码期间进行变换的变换单元的尺寸。
例如,在视频编码设备100或视频解码设备200中,如果编码单元710的尺寸是64×64,则可通过使用尺寸为32×32的变换单元720来执行变换。
此外,可通过对小于64×64的尺寸为32×32、16×16、8×8和4×4的每个变换单元执行变换,来对尺寸为64×64的编码单元710的数据进行编码,然后可选择具有最小编码误差的变换单元。
图15示出根据示例性实施例的根据深度的多条编码信息。
视频编码设备100的输出单元130可对与编码深度相应的每个编码单元的关于分区类型的信息800、关于预测模式的信息810以及关于变换单元的尺寸的信息820进行编码,并将信息800、信息810和信息820作为关于编码模式的信息来发送。
信息800指示关于通过划分当前编码单元的预测单元而获得的分区的形状的信息,其中,所述分区是用于对当前编码单元进行预测编码的数据单元。例如,可将尺寸为2N×2N的当前编码单元CU_0划分成以下分区中的任意一个:尺寸为2N×2N的分区802、尺寸为2N×N的分区804、尺寸为N×2N的分区806以及尺寸为N×N的分区808。这里,关于分区类型的信息800被设置来指示尺寸为2N×2N的分区802、尺寸为2N×N的分区804、尺寸为N×2N的分区806以及尺寸为N×N的分区808中的一个。
信息810指示每个分区的预测模式。例如,信息810可指示对由信息800指示的分区执行的预测编码的模式,即,帧内模式812、帧间模式814或跳过模式816。
信息820指示当对当前编码单元执行变换时所基于的变换单元。例如,变换单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826或第二帧间变换单元828。
视频解码设备200的图像数据和编码信息提取器220可根据每个较深层编码单元,提取并使用用于解码的信息800、810和820。
图16是根据示例性实施例的根据深度的较深层编码单元的示图。
划分信息可用来指示深度的改变。划分信息指示当前深度的编码单元是否被划分成更低深度的编码单元。
用于对深度为0和尺寸为2N_0×2N_0的编码单元900进行预测编码的预测单元910可包括以下分区类型的分区:尺寸为2N_0×2N_0的分区类型912、尺寸为2N_0×N_0的分区类型914、尺寸为N_0×2N_0的分区类型916和尺寸为N_0×N_0的分区类型918。示图仅示出了通过对称地划分预测单元910而获得的分区类型912至918,但是分区类型不限于此,并且预测单元910的分区可包括非对称分区、具有预定形状的分区和具有几何形状的分区。
根据每种分区类型,对尺寸为2N_0×2N_0的一个分区、尺寸为2N_0×N_0的两个分区、尺寸为N_0×2N_0的两个分区和尺寸为N_0×N_0的四个分区重复地执行预测编码。可对尺寸为2N_0×2N_0、N_0×2N_0、2N_0×N_0和N_0×N_0的分区执行帧内模式和帧间模式下的预测编码。仅对尺寸为2N_0×2N_0的分区执行跳过模式下的预测编码。
如果在尺寸为2N_0×2N_0、2N_0×N_0和N_0×2N_0的分区类型912至916中的一个分区类型中编码误差最小,则可不将预测单元910划分到更低深度。
如果在尺寸为N_0×N_0的分区类型918中编码误差最小,则深度从0改变到1以在操作920中划分分区类型918,并对深度为2和尺寸为N_0×N_0的编码单元930重复地执行编码来搜索最小编码误差。
用于对深度为1和尺寸为2N_1×2N_1(=N_0×N_0)的编码单元930进行预测编码的预测单元940可包括以下分区类型的分区:尺寸为2N_1×2N_1的分区类型942、尺寸为2N_1×N_1的分区类型944、尺寸为N_1×2N_1的分区类型946以及尺寸为N_1×N_1的分区类型948。
如果在尺寸为N_1×N_1的分区类型948中编码误差最小,则深度从1改变到2以在操作950中划分分区类型948,并对深度为2和尺寸为N_2×N_2的编码单元960重复执行编码来搜索最小编码误差。
当最大深度是d时,根据每个深度的划分操作可被执行直到深度变成d-1,并且划分信息可被编码直到深度是0到d-2之一。换句话说,当编码被执行直到在与d-2的深度相应的编码单元在操作970中被划分之后深度是d-1时,用于对深度为d-1和尺寸为2N_(d-1)×2N_(d-1)的编码单元980进行预测编码的预测单元990可包括以下分区类型的分区:尺寸为2N_(d-1)×2N_(d-1)的分区类型992、尺寸为2N_(d-1)×N_(d-1)的分区类型994、尺寸为N_(d-1)×2N_(d-1)的分区类型996和尺寸为N_(d-1)×N_(d-1)的分区类型998。
可对分区类型992至998中的尺寸为2N_(d-1)×2N_(d-1)的一个分区、尺寸为2N_(d-1)×N_(d-1)的两个分区、尺寸为N_(d-1)×2N_(d-1)的两个分区、尺寸为N_(d-1)×N_(d-1)的四个分区重复地执行预测编码,以搜索具有最小编码误差的分区类型。
即使当尺寸为N_(d-1)×N_(d-1)的分区类型998具有最小编码误差时,由于最大深度是d,因此深度为d-1的编码单元CU_(d-1)也不再被划分到更低深度,用于构成当前最大编码单元900的编码单元的编码深度被确定为d-1,并且当前最大编码单元900的分区类型可被确定为N_(d-1)×N_(d-1)。此外,由于最大深度是d,因此不设置最小编码单元980的划分信息。
数据单元999可以是用于当前最大编码单元的“最小单元”。根据本实施例的最小单元可以是通过将具有最低编码深度的最小编码单元980划分成4份而获得的正方形数据单元。通过重复地执行编码,根据本实施例的视频编码设备100可通过比较根据编码单元900的深度的编码误差来选择具有最小编码误差的深度以确定编码深度,并将相应分区类型和预测模式设置为编码深度的编码模式。
这样,在所有深度0、1、…d-1中对根据深度的最小编码误差进行比较,并且具有最小编码误差的深度可被确定为编码深度。编码深度、预测单元的分区类型和预测模式可作为关于编码模式的信息被编码并发送。另外,由于编码单元从0的深度被划分到编码深度,因此仅将编码深度的划分信息设置为0,并且将除了编码深度以外的深度的划分信息设置为1。
根据本实施例的视频解码设备200的图像数据和编码信息提取器220可提取并使用关于编码单元900的编码深度和预测单元的信息,来对分区912进行解码。根据本实施例的视频解码设备200可通过使用根据深度的划分信息,将划分信息为0的深度确定为编码深度,并且使用关于相应深度的编码模式的信息来进行解码。
图17、图18和图19是用于描述根据示例性实施例的在编码单元1010、预测单元1060和变换单元1070之间的关系的示图。
编码单元1010是最大编码单元中的根据由视频编码设备100确定的深度的较深层编码单元。预测单元1060是每个编码单元1010中的预测单元的分区,变换单元1070是每个编码单元1010的变换单元。
当在编码单元1010中最大编码单元的深度是0时,编码单元1012和1054的深度是1,编码单元1014、1016、1018、1028、1050和1052的深度是2,编码单元1020、1022、1024、1026、1030、1032和1048的深度是3,编码单元1040、1042、1044和1046的深度是4。
在预测单元1060中,通过划分编码单元1010中的编码单元来获得一些编码单元1014、1016、1022、1032、1048、1050、1052和1054。换句话说,编码单元1014、1022、1050和1054中的分区类型的尺寸是2N×N,编码单元1016、1048和1052中的分区类型的尺寸是N×2N,编码单元1032的分区类型的尺寸为N×N。编码单元1010的预测单元和分区小于或等于每个编码单元。
在小于编码单元1052的数据单元中的变换单元1070中,对编码单元1052的图像数据执行变换或逆变换。另外,在尺寸和形状方面,变换单元1070中的编码单元1014、1016、1022、1032、1048、1050和1052不同于预测单元1060中的编码单元1014、1016、1022、1032、1048、1050和1052。换句话说,根据实施例的视频编码设备100和根据实施例的视频解码设备200可对同一编码单元中的数据单元独立地执行帧内预测/运动估计/运动补偿/变换/逆变换。
因此,对最大编码单元的每个区域中的具有分层结构的每个编码单元递归地执行编码来确定最优编码单元,从而可获得具有递归树结构的编码单元。编码信息可包括关于编码单元的划分信息、关于分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。表1示出可由根据实施例的视频编码设备100和根据实施例的视频解码设备200设置的编码信息。
[表1]
根据实施例的视频编码设备100的输出单元130可输出关于具有树结构的编码单元的编码信息,根据实施例的视频解码设备200的图像数据和编码信息提取器220可从接收到的比特流提取关于具有树结构的编码单元的编码信息。
划分信息指示是否将当前编码单元划分成更低深度的编码单元。如果当前深度d的划分信息是0,则当前编码单元不再被划分成更低深度的深度是编码深度,从而可针对所述编码深度来定义关于分区类型、预测模式和变换单元的尺寸的信息。如果当前编码单元根据划分信息被进一步划分,则对更低深度的四个划分编码单元独立地执行编码。
预测模式可以是帧内模式、帧间模式和跳过模式中的一种。可在所有分区类型中定义帧内模式和帧间模式,仅在尺寸为2N×2N的分区类型中定义跳过模式。
关于分区类型的信息可指示通过对称地划分预测单元的高度或宽度而获得的尺寸为2N×2N、2N×N、N×2N和N×N的对称分区类型,以及通过非对称地划分预测单元的高度或宽度而获得的尺寸为2N×nU、2N×nD、nL×2N和nR×2N的非对称分区类型。可通过按1:3和3:1来划分预测单元的高度来分别获得尺寸为2N×nU和2N×nD的非对称分区类型,可通过按1:3和3:1来划分预测单元的宽度来分别获得尺寸为nL×2N和nR×2N的非对称分区类型。
可将变换单元的尺寸设置成帧内模式下的两种类型和帧间模式下的两种类型。换句话说,如果变换单元的划分信息是0,则变换单元的尺寸可以是2N×2N,即当前编码单元的尺寸。如果变换单元的划分信息是1,则可通过对当前编码单元进行划分来获得变换单元。另外,如果尺寸为2N×2N的当前编码单元的分区类型是对称分区类型时,则变换单元的尺寸可以是N×N,如果当前编码单元的分区类型是非对称分区类型,则变换单元的尺寸可以是N/2×N/2。
根据实施例的关于具有树结构的编码单元的编码信息可被分配给与编码深度相应的编码单元、预测单元和最小单元中的至少一个。与编码深度相应的编码单元可包括包含相同编码信息的预测单元和最小单元中的至少一个。
因此,通过比较邻近数据单元的编码信息来确定邻近数据单元是否被包括在与编码深度相应的同一编码单元中。另外,通过使用数据单元的编码信息来确定与编码深度相应的相应编码单元,并因此可确定最大编码单元中的编码深度的分布。
因此,如果基于邻近数据单元的编码信息来对当前编码单元进行预测,则可直接参考并使用与当前编码单元邻近的较深层编码单元中的数据单元的编码信息。
可选地,如果基于邻近数据单元的编码信息来对当前编码单元进行预测,则使用数据单元的编码信息来搜索与当前编码单元邻近的数据单元,并可参考搜索到的邻近编码单元以对当前编码单元进行预测。
图20是用于描述根据表1的编码模式信息的编码单元、预测单元和变换单元之间的关系的示图。
最大编码单元1300包括多个编码深度的编码单元1302、1304、1306、1312、1314、1316和1318。这里,由于编码单元1318是一个编码深度的编码单元,因此划分信息可被设置成0。可将关于尺寸为2N×2N的编码单元1318的分区类型的信息设置成包括2N×2N 1322、2N×N 1324、N×2N 1326、N×N 1328、2N×nU 1332、2N×nD 1334、nL×2N 1336和nR×2N1338的分区类型中的一种。
变换单元划分信息(TU尺寸标记)是一种类型的变换索引。与变换索引相应的变换单元的尺寸可根据编码单元的预测单元类型或分区类型而改变。
例如,当关于分区类型的信息被设置成对称分区类型2N×2N 1322、2N×N 1324、N×2N 1326和N×N 1328中的一种时,如果变换单元划分信息是0,则设置尺寸为2N×2N的变换单元1342,如果变换单元划分信息是1,则设置尺寸为N×N的变换单元1344。
当关于分区类型的信息被设置成非对称分区类型2N×nU 1332、2N×nD 1334、nL×2N 1336和nR×2N 1338中的一种时,如果变换单元划分信息是0,则设置尺寸为2N×2N的变换单元1352,如果变换单元划分信息是1,则设置尺寸为N/2×N/2的变换单元1354。
如以上参照图20所描述的,变换单元划分信息(TU尺寸标记)是具有值0或1的标记,但是变换单元划分信息不限于1比特的标记,并且变换单元可在变换单元划分信息从0开始增加时被分层划分。变换单元划分信息可以是变换索引的示例。
在这种情况下,根据实施例,可通过使用变换单元划分信息以及变换单元的最大尺寸和变换单元的最小尺寸来表示实际上已使用的变换单元的尺寸。根据实施例的视频编码设备100能够对最大变换单元尺寸信息、最小变换单元尺寸信息和最大变换单元划分信息进行编码。对最大变换单元尺寸信息、最小变换单元尺寸信息和最大变换单元划分信息进行编码的结果可被插入SPS。根据实施例的视频解码设备200可通过使用最大变换单元尺寸信息、最小变换单元尺寸信息和最大变换单元划分信息来对视频进行解码。
例如,(a)如果当前编码单元的尺寸是64×64并且最大变换单元尺寸是32×32,则(a-1)当TU尺寸标记为0时,变换单元的尺寸可以是32×32,(a-2)当TU尺寸标记为1时,变换单元的尺寸可以是16×16,(a-3)当TU尺寸标记为2时,变换单元的尺寸可以是8×8。
作为另一示例,(b)如果当前编码单元的尺寸是32×32并且最小变换单元尺寸是32×32,则(b-1)当TU尺寸标记为0时,变换单元的尺寸可以是32×32。这里,由于变换单元的尺寸不能够小于32×32,因此TU尺寸标记不能够被设置为除了0以外的值。
作为另一示例,(c)如果当前编码单元的尺寸是64×64并且最大TU尺寸标记为1,则TU尺寸标记可以是0或1。这里,TU尺寸标记不能够被设置为除了0或1以外的值。
因此,当TU尺寸标记为0时,如果定义最大TU尺寸标记为“MaxTransformSizeIndex”,最小变换单元尺寸为“MinTransformSize”,变换单元尺寸为“RootTuSize”,则可通过等式(1)来定义可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”:
等式(1):
CurrMinTuSize=max(MinTransformSize,RootTuSize/(2^MaxTransformSizeIndex))…(1)
与可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”相比,当TU尺寸标记为0的变换单元尺寸“RootTuSize”可指示可在系统中选择的最大变换单元尺寸。在等式(1)中,“RootTuSize/(2^MaxTransformSizeIndex)”指示当TU尺寸标记为0时,变换单元尺寸“RootTuSize”被划分了与最大TU尺寸标记相应的次数时的变换单元尺寸,“MinTransformSize”指示最小变换尺寸。因此,“RootTuSize/(2^MaxTransformSizeIndex)”和“MinTransformSize”中较小的值可以是可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”。
根据示例性实施例,最大变换单元尺寸RootTuSize可根据预测模式的类型而改变。
例如,如果当前预测模式是帧间模式,则可通过使用以下的等式(2)来确定“RootTuSize”。在等式(2)中,“MaxTransformSize”指示最大变换单元尺寸,“PUSize”指示当前预测单元尺寸:
RootTuSize=min(MaxTransformSize,PUSize)……(2)
也就是说,如果当前预测模式是帧间模式,则当TU尺寸标记为0时的变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前预测单元尺寸中较小的值。
如果当前分区单元的预测模式是帧内模式,则可通过使用以下的等式(3)来确定“RootTuSize”。在等式(3)中,“PartitionSize”指示当前分区单元的尺寸:
RootTuSize=min(MaxTransformSize,PartitionSize)……(3)
也就是说,如果当前预测模式是帧内模式,则当TU尺寸标记为0时的变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前分区单元的尺寸之中较小的值。
然而,根据分区单元中的预测模式的类型而改变的当前最大变换单元尺寸“RootTuSize”仅是示例性实施例,并且实施例不限于此。
根据以上参照图8至图20描述的基于树结构的编码单元的视频编码方法,可在树结构的编码单元中的每个编码单元中对空间域中的图像数据进行编码,并且按照根据基于树结构的编码单元的视频解码方法对每个最大编码单元执行解码的方式来重构空间域中的图像数据,使得由画面和图像序列构成的视频可被重构。重构的视频可由再现设备来再现,可存储在存储介质中,或可通过网络来发送。
一个或更多个示例性实施例可被编写为计算机程序,并可以以使用计算机可读记录介质执行程序的通用数字计算机来实现。计算机可读记录介质的示例包括磁存储介质(例如,ROM、软盘、硬盘等)和光学记录介质(例如,CD-ROM或DVD)等。
为了便于描述,以上参照图1a至图20描述的层间视频编码方法和/或视频编码方法将被统称为“视频编码方法”。此外,以上参照图1a至图20描述的层间视频解码方法和/或视频解码方法将被统称为“视频解码方法”。
另外,以上参照图1a至图20描述的包括层间视频编码设备10、视频编码设备100或图像编码器400的视频编码设备将被统称为“视频编码设备”。另外,以上参照图1a至图20描述的包括层间视频解码设备20、视频解码设备200或图像解码器500的视频解码设备将被统称为“视频解码设备”。
现在将详细描述根据示例性实施例的存储程序的计算机可读记录介质(例如,盘26000)。
图21是根据示例性实施例的存储程序的盘26000的物理结构的示图。作为存储介质的盘26000可以是硬盘驱动器、致密盘只读存储器(CD-ROM)盘、蓝光盘或数字多功能盘(DVD)。盘26000包括多个同心磁道Tr,每个同心磁道Tr沿盘26000的圆周方向被划分成特定数量的扇区Se。在盘26000的特定区域中,可分配并存储执行以上所描述的量化参数确定方法、视频编码方法和视频解码方法的程序。
现在将参照图22来描述使用存储用于执行如上所述的视频编码方法和视频解码方法的程序的存储介质来实现的计算机系统。
图22是通过使用盘26000来记录并读取程序的盘驱动器26800的示图。计算机系统26700可经由盘驱动器26800将执行根据示例性实施例的视频编码方法和视频解码方法中的至少一个的程序存储在盘26000中。为了在计算机系统26700中运行存储在盘26000中的程序,可通过使用盘驱动器26800从盘26000读取程序并将程序发送到计算机系统26700。
执行根据示例性实施例的视频编码方法和视频解码方法中的至少一个的程序不仅可被存储在图21和图22中示出的盘26000中,还可被存储在存储卡、ROM卡带或固态驱动器(SSD)中。
以下将描述应用以上所描述的视频编码方法和视频解码方法的系统。
图23是用于提供内容分布服务的内容供应系统11000的整体结构的示图。将通信系统的服务区域划分成预定尺寸的小区,并将无线基站11700、11800、11900和12000分别安装在这些小区中。
内容供应系统11000包括多个独立装置。例如,诸如计算机12100、个人数字助理(PDA)12200、视频相机12300和移动电话12500的多个独立装置经由互联网服务提供商11200、通信网络11400和无线基站11700、11800、11900和12000连接到互联网11100。
然而,内容供应系统11000不限于如图23中所示,并且装置可选择性地被连接到内容供应系统11000。多个独立装置可不经由无线基站11700、11800、11900和12000而直接连接到通信网络11400。
视频相机12300是能够捕捉视频图像的成像装置,例如,数字视频相机。移动电话12500可利用各种协议(例如,个人数字通信(PDC)、码分多址(CDMA)、宽带码分多址(W-CDMA)、全球移动通信系统(GSM)和个人手持电话系统(PHS))中的至少一种通信方法。
视频相机12300可经由无线基站11900和通信网络11400连接到流服务器11300。流服务器11300允许经由视频相机12300从用户接收到的内容经由实时广播被流传输。可使用视频相机12300或流服务器11300来对从视频相机12300接收到的内容进行编码。通过视频相机12300捕捉到的视频数据可经由计算机12100被发送到流服务器11300。
通过相机12600捕捉到的视频数据也可经由计算机12100被发送到流服务器11300。与数码相机类似,相机12600是能够捕捉静止图像和视频图像两者的成像装置。可使用相机12600或计算机12100对通过相机12600捕捉到的视频数据进行编码。可将对视频执行编码和解码的软件存储在可由计算机12100访问的计算机可读记录介质(例如,CD-ROM盘、软盘、硬盘驱动器、SSD或存储卡)中。
如果视频数据通过内置在移动电话12500中的相机被捕捉到,则可从移动电话12500接收视频数据。
还可通过安装在视频相机12300、移动电话12500或相机12600中的大规模集成电路(LSI)系统来对视频数据进行编码。
内容供应系统1100可对由用户使用视频相机12300、相机12600、移动电话12500或另一成像装置所记录的内容数据(例如,在音乐会期间记录的内容)进行编码,并将编码后的内容数据发送到流服务器11300。流服务器11300可将编码后的内容数据以流传输内容的类型发送到请求内容数据的其它客户端。
客户端是能够对编码后的内容数据进行解码的装置,例如,计算机12100、PDA12200、视频相机12300或移动电话12500。因此,内容供应系统11000允许客户端接收并再现编码后的内容数据。此外,内容供应系统11000允许客户端实时接收编码后的内容数据并对编码后的内容数据进行解码和再现,从而能够进行个人广播。
包括在内容供应系统11000中的多个独立装置的编码和解码操作可类似于根据示例性实施例的视频编码设备和视频解码设备的编码和解码操作。
现在将参照图24和图25更加详细地描述包括在根据示例性实施例的内容供应系统11000中的移动电话12500。
图24示出根据示例性实施例的应用视频编码方法和视频解码方法的移动电话12500的外部结构。移动电话12500可以是智能电话,所述智能电话的功能不受限,并且所述智能电话的大多数功能可被改变或扩展。
移动电话12500包括可与无线基站12000交换射频(RF)信号的内部天线12510,并包括用于显示由相机12530捕捉到的图像或经由天线12510接收到的并被解码的图像的显示屏12520(例如,液晶显示器(LCD)或有机发光二极管(OLED)屏幕)。移动电话12500包括包含有控制按钮和触摸面板的操作面板12540。如果显示屏12520是触摸屏,则操作面板12540还包括显示屏12520的触摸感测面板。移动电话12500包括用于输出语音和声音的扬声器12580或另一类型声音输出单元、以及用于输入语音和声音的麦克风12550或另一类型声音输入单元。移动电话12500还包括用于捕捉视频和静止图像的相机12530,诸如电荷耦合器件(CCD)相机。移动电话12500还可包括:存储介质12570,用于存储通过相机12530捕捉到的、经由电子邮件接收到的、或根据各种方式获得的编码/解码数据(例如,视频或静止图像);插槽12560,存储介质12570经由插槽12560被装入移动电话12500中。存储介质12570可以是闪存,例如,包括在塑料壳中的安全数字(SD)卡或电可擦和可编程只读存储器(EEPROM)。
图25示出移动电话12500的内部结构。为了系统地控制包括显示屏12520和操作面板12540的移动电话12500的部件,供电电路12700、操作输入控制器12640、图像编码器12720、相机接口12630、LCD控制器12620、图像解码器12690、复用器/解复用器12680、记录/读取单元12670、调制/解调单元12660以及声音处理器12650经由同步总线12730被连接到中央控制器12710。
如果用户操作电源按钮,并从“电源关闭”状态设置为“电源开启”状态,则供电电路12700从电池组向移动电话12500的所有部件供电,从而在操作模式期间设置移动电话12500。
中央控制器12710包括中央处理器(CPU)、ROM和RAM。
在移动电话12500将通信数据发送到外部的同时,在中央控制器12710的控制下,由移动电话12500产生数字信号。例如,声音处理器12650可产生数字声音信号,图像编码器12720可产生数字图像信号,并且消息的文本数据可经由操作面板12540和操作输入控制器12640被产生。当在中央控制器12710的控制下数字信号被发送到调制/解调单元12660时,调制/解调单元12660对数字信号的频带进行调制,并且通信电路12610对频带调制后的数字声音信号执行数模转换(DAC)和频率转换。从通信电路12610输出的发送信号可经由天线12510被发送到语音通信基站或无线基站12000。
例如,当移动电话12500处于通话模式时,在中央控制器12710的控制下,经由麦克风12550获得的声音信号通过声音处理器12650被变换成数字声音信号。数字声音信号可经由调制/解调单元12660和通信电路12610被变换成变换信号,并可经由天线12510被发送。
当文本消息(例如,电子邮件)在数据通信模式期间被发送时,文本消息的文本数据经由操作面板12540被输入,并经由操作输入控制器12640被发送到中央控制器12610。在中央控制器12610的控制下,文本数据经由调制/解调单元12660和通信电路12610被变换成发送信号,并经由天线12510被发送到无线基站12000。
为了在数据通信模式期间发送图像数据,由相机12530捕捉到的图像数据经由相机接口12630被提供给图像编码器12720。捕捉到的图像数据可经由相机接口12630和LCD控制器12620被直接显示在显示屏12520上。
图像编码器12720的结构可与以上描述的视频编码设备100的结构相应。图像编码器12720可基于上述根据本实施例的视频编码方法,将从相机12530接收到的图像数据变换为压缩和编码后的图像数据,并然后将编码后的图像数据输出到复用器/解复用器12680。在相机12530的记录操作期间,由移动电话12500的麦克风12550获得的声音信号可经由声音处理器12650被变换成数字声音数据,并且数字声音数据可被发送到复用器/解复用器12680。
复用器/解复用器12680对从图像编码器12720接收到的编码后的图像数据与从声音处理器12650接收到的声音数据一起进行复用。对数据进行复用的结果可经由调制/解调单元12660和通信电路12610被变换成发送信号,然后可经由天线12510被发送。
当移动电话12500从外部接收通信数据时,可对经由天线12510接收到的信号执行频率恢复和ADC以将信号变换成数字信号。调制/解调单元12660对数字信号的频带进行调制。根据频带调制后的数字信号的类型将所述数字信号发送到视频解码器12690、声音处理器12650或LCD控制器12620。
在通话模式期间,移动电话12500对经由天线12510接收到的信号进行放大,并通过对放大后的信号执行频率转换和ADC来获得数字声音信号。在中央控制器12710的控制下,接收到的数字声音信号经由调制/解调单元12660和声音处理器12650被变换成模拟声音信号,并且模拟声音信号经由扬声器12580被输出。
当在数据通信模式期间时,接收在互联网网站上访问的视频文件的数据,经由调制/解调单元12660将经由天线12510从无线基站12000接收到的信号输出为复用数据,并将复用数据发送到复用器/解复用器12680。
为了对经由天线12510接收到的复用数据进行解码,复用器/解复用器12680将复用数据解复用成编码后的视频数据流和编码后的音频数据流。经由同步总线12730,编码后的视频数据流和编码后的音频数据流分别被提供给视频解码器12690和声音处理器12650。
图像解码器12690的结构可与以上描述的视频解码设备的结构相应。图像解码器12690可通过使用上述的根据本实施例的视频解码方法,对编码后的视频数据进行解码来获得重构的视频数据,并经由LCD控制器12620将重构的视频数据提供给显示屏12520。
因此,可将在互联网网站上访问的视频文件的数据显示在显示屏12520上。同时,声音处理器12650可将音频数据变换成模拟声音信号,并将模拟声音信号提供给扬声器12580。因此,也可经由扬声器12580再现在互联网网站上访问的视频文件中包含的音频数据。
移动电话12500或另一类型的通信终端可以是包括根据示例性实施例的视频编码设备和视频解码设备两者的收发终端,可以是仅包括视频编码设备的收发终端,或者可以是仅包括视频解码设备的收发终端。
根据示例性实施例的通信系统不限于以上参照图24描述的通信系统。例如,图26示出根据示例性实施例的采用通信系统的数字广播系统。图26的数字广播系统可通过使用根据示例性实施例的视频编码设备和视频解码设备来接收经由卫星或地面网络发送的数字广播。
更详细地,广播站12890通过使用无线电波将视频数据流发送到通信卫星或广播卫星12900。广播卫星12900发送广播信号,广播信号经由家用天线12860被发送到卫星广播接收器。在每个房屋中,可通过TV接收器12810、机顶盒12870或另一装置对编码后的视频流进行解码并再现。
当根据示例性实施例的视频解码设备被实现在再现设备12830中时,再现设备12830可对记录在存储介质12820(诸如盘或存储卡)上的编码后的视频流进行解析和解码,以重构数字信号。因此,可在例如监视器12840上再现重构的视频信号。
在被连接到用于卫星/地面广播的天线12860或用于接收有线电视(TV)广播的线缆天线12850的机顶盒12870中,可安装根据示例性实施例的视频解码设备。从机顶盒12870输出的数据也可被再现在TV监视器12880上。
作为另一示例,可将根据示例性实施例的视频解码设备安装在TV接收器12810中,而不是机顶盒12870中。
具有适当天线12910的汽车12920可接收从图21的卫星12900或无线基站11700发送的信号。可在安装在汽车12920中的汽车导航系统12930的显示屏上再现解码后的视频。
视频信号可由根据示例性实施例的视频编码设备来编码,然后可被存储在存储介质中。具体地,可由DVD记录器将图像信号存储在DVD盘12960中,或可由硬盘记录器12950将图像信号存储在硬盘中。作为另一示例,可将视频信号存储在SD卡12970中。如果硬盘记录器12950包括根据示例性实施例的视频解码设备,则记录在DVD盘12960、SD卡12970或另一存储介质上的视频信号可在TV监视器12880上被再现。
汽车导航系统12930可不包括图26的相机12530、相机接口12630和图像编码器12720。例如,计算机12100和TV接收器12810可不包括在图26的相机12530、相机接口12630和图像编码器12720中。
图27是示出根据示例性实施例的使用视频编码设备和视频解码设备的云计算系统的网络结构的示图。
云计算系统可包括云计算服务器14000、用户数据库(DB)14100、多个计算资源14200和用户终端。
响应于来自用户终端的请求,云计算系统经由数据通信网络(例如,互联网)提供多个计算资源14200的点播外包服务。在云计算环境下,服务提供商通过使用虚拟技术组合位于不同的物理位置的数据中心处的计算资源,来为用户提供想要的服务。服务用户不必将计算资源(例如,应用、存储器、操作系统(OS)和安全软件)安装在他/她拥有的终端中以使用它们,但可在想要的时间点在通过虚拟技术产生的虚拟空间中从服务中选择和使用想要的服务。
被指定的服务用户的用户终端经由包括互联网和移动通信网络的数据通信网络被连接到云计算服务器14000。可从云计算服务器14100向用户终端提供云计算服务,特别是视频再现服务。用户终端可以是能够被连接到互联网的各种类型的电子装置,例如,桌上型PC 14300、智能TV 14400、智能电话14500、笔记本计算机14600、便携式多媒体播放器(PMP)14700、平板PC 14800等。
云计算服务器14000可组合分布在云网络中的多个计算资源14200,并向用户终端提供组合的结果。所述多个计算资源14200可包括各种数据服务,并可包括从用户终端上载的数据。如上所描述的,云计算服务器14000可通过根据虚拟技术组合分布在不同区域中的视频数据库来向用户终端提供想要的服务。
将关于已经订购云计算服务的用户的用户信息存储在用户DB 14100中。用户信息可包括用户的注册信息、地址、姓名和个人信用信息。用户信息还可包括视频的索引。这里,所述索引可包括已经被再现的视频的列表、正在被再现的视频的列表、之前正在被再现的视频的暂停点等。
可在用户装置之间共享存储在用户DB 14100中的关于视频的信息。例如,当响应于来自笔记本计算机14600的请求将视频服务提供给笔记本计算机14600时,视频服务的再现历史被存储在用户DB 14100中。当从智能电话14500接收到用于再现此视频服务的请求时,云计算服务器14000基于用户DB 14100搜索并再现此视频服务。当智能电话14500从云计算服务器14000接收到视频数据流时,通过对视频数据流进行解码来再现视频的处理与以上参照图24描述的移动电话12500的操作类似。
云计算服务器14000可参考存储在用户DB 14100中的想要的视频服务的再现历史。例如,云计算服务器14000从用户终端接收用于再现存储在用户DB 14100中的视频的请求。如果此视频被再现过,则由云计算服务器14000执行的对此视频进行流传输的方法可根据来自用户终端的请求(即,根据是将从视频的起点还是视频的暂停点开始再现视频)而不同。例如,如果用户终端请求从视频的起点开始再现视频,则云计算服务器14000将从视频的第一帧开始的视频的流数据发送到用户终端。如果用户终端请求从视频的暂停点开始再现视频,则云计算服务器14000将从与暂停点相应的帧开始的视频的流数据发送到用户终端。
在此情况下,用户终端可包括如以上参照图1a至图20描述的视频解码设备。在另一示例中,用户终端可包括如以上参照图1a至图20描述的视频编码设备。可选地,用户终端可包括如以上参照图1a至图20描述的视频解码设备和视频编码设备两者。
以上参照图21至图27描述了以上参照图1a至图20描述的根据实施例的视频编码方法、视频解码方法、视频编码设备和视频解码设备的各种应用。然而,根据各种实施例的将视频编码方法和视频解码方法存储在存储介质中的方法或者将视频编码设备和视频解码设备实现在以上参照图1a至图20描述的装置中的方法不限于以上参照图21至图27描述的实施例。
虽然已经参照本公开的示例性实施例具体示出并描述了本公开,但是本领域的普通技术人员将理解,在不脱离权利要求的精神和范围的情况下,可在示例性实施例中做出形式和细节上的各种改变。示例性实施例应仅被考虑为描述意义,且不用于限制的目的。因此,本公开的范围不由本公开的详细描述来限定,而由权利要求来限定,并且在该范围内的所有差异都将被认为包括在本公开中。

Claims (11)

1.一种层间视频解码方法,包括:
基于从第一层比特流获得的编码信息来重构第一层图像;
响应于确定第二层块的预定分区类型是预定的类型并且第二层块的预测模式不是帧内预测模式,从第二层比特流获得用于第二层块的照度补偿信息;
通过使用从第二层比特流获得的层间预测信息,基于位于重构的第一层图像中并且与第二层块相应的第一层参考块对第二层块进行解码;
响应于确定照度补偿信息指示针对第二层块执行照度补偿,通过对第二层块的照度进行补偿来产生重构的第二层块。
2.如权利要求1所述的层间视频解码方法,其中,获得照度补偿信息的步骤包括:
从第二层比特流获得第二层块的分区类型信息和预测模式信息;
如果分区类型信息指示2N×2N分区类型并且预测模式信息不指示帧内预测模式,则从第二层比特流获得用于第二层块的照度补偿信息。
3.如权利要求2所述的层间视频解码方法,其中,获得照度补偿信息的步骤包括:基于分区类型信息和预测模式信息获得用于被确定为处于跳过模式或2N×2N融合模式的块的照度补偿信息。
4.如权利要求1所述的层间视频解码方法,其中,产生重构的第二层块的步骤包括:根据重构的第二层块的当前分区的尺寸来确定是否对将被照度补偿的第二层块的亮度分量和色度分量执行照度补偿。
5.如权利要求4所述的层间视频解码方法,其中,确定是否对将被照度补偿的第二层块的亮度分量和色度分量执行照度补偿的步骤包括:确定对分区尺寸为8×8的块的亮度分量执行照度补偿,并确定不对分区尺寸为8×8的块的色度分量执行照度补偿。
6.如权利要求1所述的层间视频解码方法,其中,产生重构的第二层块的步骤包括:根据重构的第二层块的尺寸,针对确定是否对重构的第二层块的亮度分量和色度分量执行照度补偿的过程进行不同的操作。
7.如权利要求6所述的层间视频解码方法,其中,产生重构的第二层块的步骤包括:当块的亮度分区的尺寸等于或大于8×8时,确定对该块的亮度分量执行照度补偿,如果块的亮度分区的尺寸大于8×8,则确定对该块的色度分量执行照度补偿。
8.如权利要求1所述的层间视频解码方法,其中,针对除了被确定为所述预定分区类型并被确定为处于所述预测模式的第二层块以外的其它第二层块跳过产生重构的第二层块的步骤,并且,不对所述其它第二层块执行照度补偿。
9.如权利要求1所述的层间视频解码方法,其中,当确定了对第二层块执行照度补偿时,不对第二层块执行用于通过使用时间方向参考块和层间方向参考块中的至少一个参考块的残差信息对第二层块的残差信息进行预测的残差预测。
10.如权利要求1所述的层间视频解码方法,其中,当确定了对第二层块执行残差预测以通过使用时间方向参考块和层间方向参考块中的至少一个参考块的残差信息对第二层块的残差信息进行预测时,不对第二层块执行照度补偿。
11.一种层间视频解码设备,包括:
第一层解码器,基于从第一层比特流获得的编码信息来重构第一层图像;
照度补偿确定器,响应于确定第二层块的预定分区类型是预定的类型并且第二层块的预测模式不是帧内预测模式,从第二层比特流获得用于第二层块的照度补偿信息;
第二层解码器,通过使用从第二层比特流获得的层间预测信息,基于位于重构的第一层图像中并且与第二层块相应的第一层参考块对第二层块进行解码,并响应于确定照度补偿信息指示针对第二层块执行照度补偿,通过对第二层块的照度进行补偿来产生重构的第二层块。
CN201480013688.5A 2013-01-10 2014-01-10 用于补偿亮度差的对层间视频进行编码的方法及其装置以及用于对视频进行解码的方法及其装置 Active CN105103552B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361750966P 2013-01-10 2013-01-10
US61/750,966 2013-01-10
PCT/KR2014/000314 WO2014109594A1 (ko) 2013-01-10 2014-01-10 휘도차를 보상하기 위한 인터 레이어 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치

Publications (2)

Publication Number Publication Date
CN105103552A CN105103552A (zh) 2015-11-25
CN105103552B true CN105103552B (zh) 2019-04-05

Family

ID=51167175

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480013688.5A Active CN105103552B (zh) 2013-01-10 2014-01-10 用于补偿亮度差的对层间视频进行编码的方法及其装置以及用于对视频进行解码的方法及其装置

Country Status (4)

Country Link
US (1) US9877020B2 (zh)
KR (1) KR102270787B1 (zh)
CN (1) CN105103552B (zh)
WO (1) WO2014109594A1 (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6278900B2 (ja) * 2012-12-26 2018-02-14 シャープ株式会社 画像復号装置
KR20140121315A (ko) * 2013-04-04 2014-10-15 한국전자통신연구원 참조 픽처 리스트를 이용한 다 계층 기반의 영상 부호화/복호화 방법 및 그 장치
WO2014166104A1 (en) * 2013-04-12 2014-10-16 Mediatek Singapore Pte. Ltd. Removal of parsing dependency for illumination compensation
US10554967B2 (en) * 2014-03-21 2020-02-04 Futurewei Technologies, Inc. Illumination compensation (IC) refinement based on positional pairings among pixels
EP3484159A4 (en) 2016-07-05 2019-12-04 KT Corporation METHOD AND APPARATUS FOR PROCESSING VIDEO SIGNAL
US10631002B2 (en) * 2016-09-30 2020-04-21 Qualcomm Incorporated Frame rate up-conversion coding mode
US10880570B2 (en) 2016-10-05 2020-12-29 Qualcomm Incorporated Systems and methods of adaptively determining template size for illumination compensation
KR20180074000A (ko) * 2016-12-23 2018-07-03 삼성전자주식회사 비디오 디코딩 방법, 이를 수행하는 비디오 디코더, 비디오 인코딩 방법, 및 이를 수행하는 비디오 인코더
WO2019021803A1 (ja) * 2017-07-24 2019-01-31 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
US10652571B2 (en) * 2018-01-25 2020-05-12 Qualcomm Incorporated Advanced motion vector prediction speedups for video coding
KR101956756B1 (ko) 2018-06-12 2019-03-11 광운대학교 산학협력단 성분 간 참조 기반의 비디오 신호 처리 방법 및 장치
JP7202394B2 (ja) * 2018-10-22 2023-01-11 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
WO2020149630A1 (ko) * 2019-01-15 2020-07-23 엘지전자 주식회사 영상 코딩 시스템에서 cclm 예측 기반 영상 디코딩 방법 및 그 장치
US11206396B2 (en) * 2019-01-16 2021-12-21 Qualcomm Incorporated Local illumination compensation in video coding
CN110166783B (zh) * 2019-06-03 2021-03-23 Tcl华星光电技术有限公司 补偿表压缩方法、显示器制造设备和具有存储功能的装置
CN112203085B (zh) * 2020-09-30 2023-10-17 字节跳动(香港)有限公司 图像处理方法、装置、终端和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101176348A (zh) * 2005-04-01 2008-05-07 Lg电子株式会社 可对视频信号缩放地进行编码和解码的方法
CN101836457A (zh) * 2007-10-25 2010-09-15 日本电信电话株式会社 活动图像可分级编码方法及解码方法、其装置、其程序以及记录有程序的记录介质

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1032824A (ja) * 1996-07-16 1998-02-03 Nippon Telegr & Teleph Corp <Ntt> 動画像の輝度変化検出方法、動画像の輝度変化補償方法、動画像の位置検出方法および動画像符号化・復号装置
US7289154B2 (en) * 2000-05-10 2007-10-30 Eastman Kodak Company Digital image processing method and apparatus for brightness adjustment of digital images
US8761252B2 (en) 2003-03-27 2014-06-24 Lg Electronics Inc. Method and apparatus for scalably encoding and decoding video signal
KR20060105408A (ko) 2005-04-01 2006-10-11 엘지전자 주식회사 영상 신호의 스케일러블 인코딩 및 디코딩 방법
KR20070012201A (ko) 2005-07-21 2007-01-25 엘지전자 주식회사 영상 신호의 인코딩 및 디코딩 방법
KR20070014956A (ko) 2005-07-29 2007-02-01 엘지전자 주식회사 영상 신호의 인코딩 및 디코딩 방법
JP2007329678A (ja) 2006-06-07 2007-12-20 Matsushita Electric Ind Co Ltd 輝度マスキング及び輝度補償を用いた超解像処理方法及び装置
KR101244917B1 (ko) 2007-06-11 2013-03-18 삼성전자주식회사 조도 보상 방법 및 장치, 이를 이용한 영상의 부호화,복호화 방법 및 장치
US8705624B2 (en) * 2009-11-24 2014-04-22 STMicroelectronics International N. V. Parallel decoding for scalable video coding
WO2012044093A2 (ko) 2010-09-29 2012-04-05 한국전자통신연구원 필터 정보 예측을 이용한 영상 부호화/복호화 방법 및 장치
US9363533B2 (en) 2010-09-29 2016-06-07 Electronics And Telecommunications Research Institute Method and apparatus for video-encoding/decoding using filter information prediction
GB2486733A (en) * 2010-12-24 2012-06-27 Canon Kk Video encoding using multiple inverse quantizations of the same reference image with different quantization offsets
WO2013033596A1 (en) * 2011-08-31 2013-03-07 Dolby Laboratories Licensing Corporation Multiview and bitdepth scalable video delivery

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101176348A (zh) * 2005-04-01 2008-05-07 Lg电子株式会社 可对视频信号缩放地进行编码和解码的方法
CN101836457A (zh) * 2007-10-25 2010-09-15 日本电信电话株式会社 活动图像可分级编码方法及解码方法、其装置、其程序以及记录有程序的记录介质

Also Published As

Publication number Publication date
CN105103552A (zh) 2015-11-25
US9877020B2 (en) 2018-01-23
KR102270787B1 (ko) 2021-06-29
WO2014109594A1 (ko) 2014-07-17
US20150350642A1 (en) 2015-12-03
KR20140091493A (ko) 2014-07-21

Similar Documents

Publication Publication Date Title
CN105103552B (zh) 用于补偿亮度差的对层间视频进行编码的方法及其装置以及用于对视频进行解码的方法及其装置
CN104471938B (zh) 根据彩色分量共享sao参数的对视频进行编码的方法和设备
CN105144713B (zh) 用于解码器设置的对视频进行编码的方法及其装置以及基于解码器设置对视频进行解码的方法及其装置
CN105308966B (zh) 视频编码方法及其设备以及视频解码方法及其设备
CN104365101B (zh) 用于确定用于帧间预测的参考图像的方法及设备
CN106063271B (zh) 用于执行基于子块的预测的层间视频解码方法及其设备以及用于执行基于子块的预测的层间视频编码方法及其设备
CN105027568B (zh) 用于对条带段进行熵编码的方法及其设备以及用于对条带段进行熵解码的方法及其设备
CN105340271B (zh) 用于随机访问的多层视频编码方法及其装置以及用于随机访问的多层视频解码方法及其装置
CN105532001B (zh) 用于使用基于深度的视差矢量对视频进行层间编码方法以及解码方法和设备
CN104396252B (zh) 使用用于多视点视频预测的参考画面集的多视点视频编解码方法及其装置
CN104811727B (zh) 用于在视频编码或解码中的运动矢量确定的方法和设备
CN104620578B (zh) 用于随机访问的多层视频编码的方法和设备以及用于随机访问的多层视频解码的方法和设备
CN104365104B (zh) 用于多视点视频编码和解码的方法和设备
CN105594212B (zh) 用于确定运动矢量的方法及其设备
CN105556972B (zh) 用于层间视频解码和编码设备和方法的对深度图像的场景内预测方法
CN108235030A (zh) Sao编码方法和设备以及sao解码方法和设备
CN105532004B (zh) 层间视频解码方法及设备
CN106031175B (zh) 使用亮度补偿的层间视频编码方法及其装置、以及视频解码方法及其装置
CN106105210B (zh) 管理用于对多层视频进行编码和解码的缓冲器的方法和设备
CN107409214A (zh) 用于对层间视频进行解码的方法和设备以及用于对层间视频进行编码的方法和设备
CN106416256B (zh) 用于对深度图像进行编码或解码的方法和设备
CN105165011A (zh) 用于考虑存储器带宽和计算量的可伸缩视频编码的装置和方法以及用于可伸缩视频解码的装置和方法
CN105264890B (zh) 用于补偿亮度差的层间视频编码方法和设备以及层间视频解码方法和设备
CN105308958A (zh) 用于使用视点合成预测的层间视频编码方法和设备以及用于使用视点合成预测的层间视频解码方法和设备
CN105308961B (zh) 用于补偿亮度差的层间视频编码方法和设备以及层间视频解码方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant