CN105191313A - 使用考虑相移的上采样的可伸缩视频编码方法和设备以及可伸缩视频解码方法和设备 - Google Patents

使用考虑相移的上采样的可伸缩视频编码方法和设备以及可伸缩视频解码方法和设备 Download PDF

Info

Publication number
CN105191313A
CN105191313A CN201480012095.7A CN201480012095A CN105191313A CN 105191313 A CN105191313 A CN 105191313A CN 201480012095 A CN201480012095 A CN 201480012095A CN 105191313 A CN105191313 A CN 105191313A
Authority
CN
China
Prior art keywords
phase shift
sampling
filter coefficient
unit
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201480012095.7A
Other languages
English (en)
Inventor
艾琳娜·阿尔辛娜
亚历山大·阿尔辛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN105191313A publication Critical patent/CN105191313A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

提供了一种确定用于根据上采样率精确地对每个采样位置的样值进行插值的上采样滤波器以用于可伸缩视频编码和解码的方法。用于可伸缩视频编码的上采样方法包括:基于高分辨率图像和低分辨率图像之间的缩放因子,确定低分辨率图像的像素和高分辨率图像的像素之间的相移;从包括与相移相应的滤波器系数集的滤波器系数数据选择与确定的相移相应的至少一个滤波器系数集;通过使用选择的至少一个滤波器系数集对低分辨率图像执行滤波,产生高分辨率图像;产生增强层比特流,其中,增强层比特流包括通过对高分辨率图像执行编码而产生的高分辨率编码信息以及指示确定的相移的上采样滤波器信息。

Description

使用考虑相移的上采样的可伸缩视频编码方法和设备以及可伸缩视频解码方法和设备
技术领域
本公开涉及使用图像上采样的视频编码和解码方法和设备。
背景技术
传统的图像编码和解码方法将一个画面划分为宏块以对图像进行编码。随后,帧间预测或帧内预测被用于对每个宏块进行预测编码。
帧间预测是通过去除画面之间的时间冗余来压缩图像的方法,具有作为代表性示例的运动估计编码。运动估计编码通过使用至少一个参考画面来对当前画面的每个块进行预测。预定的估计函数被用于在预定的搜索范围内搜索与当前块最相似的参考块。
基于参考块对当前块进行预测,并对通过从当前块减去作为预测结果产生的预测块而产生的残差块进行编码。在这点上,为了更精确地执行预测,对参考画面的搜索范围执行插值,产生比整数单位更小的像素单位的子像素,并基于产生的子像素执行帧间预测。
发明内容
技术问题
本发明提供了一种确定用于根据上采样率精确地对每个采样位置的样值进行插值的上采样滤波器的方法。本发明还提供了一种通过使用根据可伸缩缩放因子选择的精确的上采样滤波器从低分辨率图像产生高分辨率预测图像来执行层间预测的可伸缩视频编码方法和可伸缩视频解码方法。
技术方案
根据本发明的一方面,提供了一种用于可伸缩视频编码的上采样方法,所述上采样方法包括:基于高分辨率图像和低分辨率图像之间的缩放因子,确定低分辨率图像的像素和高分辨率图像的像素之间的相移;从包括与相移相应的滤波器系数集的滤波器系数数据选择与确定的相移相应的至少一个滤波器系数集;通过使用选择的至少一个滤波器系数集对低分辨率图像执行滤波,产生高分辨率图像;产生增强层比特流,其中,增强层比特流包括通过对高分辨率图像执行编码而产生的高分辨率编码信息以及指示确定的相移的上采样滤波器信息。
有益效果
如果与根据上采样率的采样位置相应的相移被指定,并且用于确定位于与该相移相应的位置处的采样位置的样值的滤波器系数被精确地确定,则也可通过使用该滤波器系数进行滤波来精确地确定精确的采样位置的样值。
附图说明
图1是根据各种实施例的图像上采样设备的框图。
图2示出像素的采样位置。
图3示出原始像素和采样位置的相移。
图4a和图4b示出用于上采样滤波的参考像素的位置。
图5示出彩色格式为4:2:0的低分辨率图像的亮度像素和色度像素的分布。
图6示出当彩色格式为4:2:0的低分辨率图像和高分辨率图像之间的缩放因子是2时低分辨率亮度像素和高分辨率亮度像素以及低分辨率色度像素和高分辨率亮度像素的分布。
图7示出当彩色格式为4:2:0的低分辨率图像和高分辨率图像之间的缩放因子是1.5时低分辨率亮度像素和高分辨率亮度像素以及低分辨率色度像素和高分辨率亮度像素的分布。
图8和图9是用于选择滤波器系数的频率响应曲线的曲线图。
图10是根据各种实施例的与1/16单位的相移间隔相应的上采样率的表。
图11是根据各种实施例的具有1/16的相移间隔的8抽头上采样滤波器系数的表。
图12a是根据各种实施例的可伸缩视频编码设备的框图。
图12b是根据各种实施例的可伸缩视频解码设备的框图。
图13a是根据各种实施例的可伸缩视频编码方法的流程图。
图13b是根据各种实施例的可伸缩视频解码方法的流程图。
图14是根据各种实施例的可伸缩视频编码系统的框图。
图15a是根据各种实施例的基于具有树结构的编码单元的视频编码设备的框图。
图15b是根据各种实施例的基于具有树结构的编码单元的视频解码设备的框图。
图16是用于描述根据各种实施例的编码单元的概念的示图。
图17a是根据各种实施例的基于编码单元的图像编码器的框图。
图17b是根据各种实施例的基于编码单元的图像解码器的框图。
图18是示出根据各种实施例的根据深度的较深层编码单元以及分区的示图。
图19是用于描述根据各种实施例的编码单元和变换单元之间的关系的示图。
图20是用于描述根据各种实施例的与编码深度相应的编码单元的编码信息的示图。
图21是根据各种实施例的根据深度的较深层编码单元的示图。
图22至图24是用于描述根据各种实施例的编码单元、预测单元和变换单元之间的关系的示图。
图25是用于描述根据表2的编码模式信息的编码单元、预测单元或分区和变换单元之间的关系的示图。
图26示出根据各种实施例的存储程序的盘的物理结构。
图27示出通过使用盘来记录和读取程序的盘驱动器。
图28示出提供内容分配服务的内容供应系统的整体结构。
图29和图30示出根据各种实施例的应用了视频编码方法和视频解码方法的移动电话的外部结构和内部结构。
图31示出根据各种实施例的应用通信系统的数字广播系统。
图32示出根据各种实施例的使用视频编码设备和视频解码设备的云计算系统的网络结构。
最佳实施方式
根据本公开的一方面,提供了一种用于可伸缩视频编码的上采样方法,所述方法包括:基于高分辨率图像和低分辨率图像之间的缩放因子,确定低分辨率图像的像素和高分辨率图像的像素之间的相移;从包括与相移相应的滤波器系数集的滤波器系数数据选择与确定的相移相应的至少一个滤波器系数集;通过使用选择的至少一个滤波器系数集对低分辨率图像执行滤波,产生高分辨率图像;产生增强层比特流,其中,增强层比特流包括通过对高分辨率图像执行编码而产生的高分辨率编码信息以及指示确定的相移的上采样滤波器信息。
产生高分辨率图像的步骤可包括:当滤波器系数数据包括与根据相移间隔1/16的相移相应的滤波器系数集时,通过使用i)滤波器系数数据中与相移5/16相应的滤波器系数集以及ii)滤波器系数数据中与相移11/16相应的滤波器系数集来执行滤波,其中,与相移5/16相应的滤波器系数集用于在比率为2:3时对确定的相移为1/3的采样位置进行上采样,与相移11/16相应的滤波器系数集用于在比率为2:3时对确定的相移为2/3的采样位置进行上采样。
产生高分辨率图像的步骤可包括:当滤波器系数数据包括与根据相移间隔1/8的相移相应的滤波器系数集时,通过使用i)滤波器系数数据中与相移3/8相应的滤波器系数集以及ii)滤波器系数数据中与相移5/8相应的滤波器系数集来执行滤波,其中,与相移3/8相应的滤波器系数集用于在比率为2:3时对确定的相移为1/3的采样位置进行上采样,与相移5/8相应的滤波器系数集用于在比率为2:3时对确定的相移为2/3的采样位置进行上采样。
确定低分辨率图像的像素和高分辨率图像的像素之间的相移的步骤可包括:基于所述缩放因子,确定低分辨率图像的亮度像素和高分辨率图像的亮度像素之间的相移;基于彩色格式确定高分辨率图像的色度像素相对于高分辨率图像的亮度像素的位置的位置,并确定低分辨率图像的色度分量像素和高分辨率图像的位置被确定的色度像素之间的相移。
产生增强层比特流的步骤可包括:将上采样滤波器信息记录在序列参数集(SPS)、画面参数集(PPS)和条带片段头中的至少一个中。
根据本公开的另一方面,提供了一种用于可伸缩视频解码的上采样方法,所述上采样方法包括:从增强层比特流获得上采样滤波器信息,其中,上采样滤波器信息指示基于高分辨率图像和低分辨率图像之间的缩放因子而确定的低分辨率图像的像素和高分辨率图像的像素之间的相移;选择滤波器系数数据中所包括的与来自上采样滤波器信息的确定的相移相应的至少一个滤波器系数集,其中,滤波器系数数据包括针对相移的相应滤波器系数集;通过使用选择的至少一个滤波器系数集对低分辨率图像执行滤波,产生高分辨率图像。
选择所述至少一个滤波器系数集的步骤可包括:从上采样滤波器信息获得低分辨率图像的亮度像素和高分辨率图像的亮度像素之间的相移;从上采样滤波器信息获得低分辨率图像的色度分量像素和高分辨率图像的色度分量像素之间的相移;其中,当高分辨率图像的色度像素相对于高分辨率图像的亮度像素的位置的位置基于彩色格式被确定时,获得的色度分量像素之间的相移是低分辨率图像的色度分量像素和高分辨率图像的色度像素之间的相移。
获得上采样滤波器信息的步骤可包括:从包括在增强层比特流中的序列参数集(SPS)、画面参数集(PPS)和条带片段头中的至少一个获得上采样滤波器信息。
根据本公开的另一方面,提供了一种可伸缩视频编码设备,包括:滤波器系数数据存储单元,记录针对相移的相应滤波器系数集;滤波器选择器,基于与低分辨率图像相应的高分辨率图像和低分辨率图像之间的缩放因子,确定低分辨率图像的像素和高分辨率图像的像素之间的相移,并从滤波器系数数据选择与确定的相移相应的至少一个滤波器系数集;上采样单元,通过使用选择的至少一个滤波器系数集对低分辨率图像执行滤波,产生高分辨率图像;基本层编码器,产生基本层比特流,其中,基本层比特流包括通过对低分辨率图像执行编码而产生的低分辨率编码信息;增强层编码器,产生增强层比特流,其中,增强层比特流包括通过对高分辨率图像执行编码而产生的高分辨率编码信息以及指示确定的相移的上采样滤波器信息。
根据本公开的另一方面,提供了一种可伸缩视频解码设备,包括:滤波器系数数据存储单元,记录针对相移的相应滤波器系数集;增强层接收器,从增强层比特流获得上采样滤波器信息和高分辨率编码信息,其中,上采样滤波器信息指示基于高分辨率图像和低分辨率图像之间的缩放因子确定的低分辨率图像的像素和高分辨率图像的像素之间的相移;滤波器选择器,选择滤波器系数数据中所包括的与来自上采样滤波器信息的确定的相移相应的至少一个滤波器系数集;增强层解码器,通过使用选择的至少一个滤波器系数集对低分辨率图像执行滤波,产生高分辨率图像,并通过使用产生的高分辨率图像和获得的高分辨率编码信息对高分辨率图像进行解码;基本层解码器,通过使用从基本层比特流获得的低分辨率编码信息对低分辨率图像进行解码。
根据本公开的另一方面,提供了一种计算机可读记录介质,其中,在所述计算机可读记录介质上记录用于执行所述上采样方法的程序。根据本公开的另一方面,提供了一种计算机可读记录介质,其中,在所述计算机可读记录介质上记录用于执行所述视频编码方法的程序。根据本公开的另一方面,提供了一种计算机可读记录介质,其中,在所述计算机可读记录介质上记录用于执行所述视频解码方法的程序。
具体实施方式
在下文中,在本公开的各种实施例中,术语“图像”不仅可表示静止图像还可表示运动画面(诸如视频)。
在下文中,将参照图1至图11详细描述根据各种实施例的使用考虑相移的上采样滤波器对图像的上采样。在下文中,将参照图12a至图14描述根据各种实施例的使用上采样滤波器的可伸缩视频编码和解码。在下文中,将参照图15至图25描述将基于具有树结构的编码单元对可伸缩视频系统中的每一层执行的视频编码和解码。
现在,将参照图1至图11详细描述根据各种实施例的使用考虑相移的上采样滤波器对图像的上采样。
图1是根据各种实施例的图像上采样设备10的框图。
根据各种实施例的使用对称上采样滤波器和不对称上采样滤波器的图像上采样设备10包括滤波器选择器12、上采样单元14和滤波器数据存储单元16。
图像的插值可被用于将低分辨率图像转换为高分辨率图像。图像的插值被用于将隔行图像转为逐行图像,并通过对低质量图像进行上采样来将低质量图像转换为高质量图像。
当视频编码设备对图像进行编码时,运动估计和运动补偿单元可通过使用插值后的参考帧来执行帧间预测。运动估计和运动补偿单元可通过以下操作来提高帧间预测的精确性:对参考帧进行插值,产生高质量图像并基于高质量图像执行运动估计和补偿。同样,当图像解码设备对图像进行解码时,运动补偿单元可通过使用插值后的参考帧来执行运动补偿,以提高帧间预测的精确性。
可伸缩编码设备可将通过对基本层图像进行插值而上采样的图像用作增强层的预测图像或参考图像,以在基本层和增强层之间执行层间预测。
根据各种实施例的图像上采样设备10可接收低分辨率图像,对低分辨率图像的像素单位像素进行插值,并产生子像素单位像素。接收到的图像可以是低分辨率视频的序列、画面、帧和块。低分辨率图像的子像素单位可相应于高分辨率图像的像素单位。
例如,当低分辨率图像与高分辨率图像的缩放因子被定义为高分辨率图像的宽度比低分辨率图像的宽度时,如果低分辨率图像与高分辨率图像的缩放因子为1:2,则位于低分辨率图像的像素单位像素之间的1/2像素单位像素可相应于高分辨率图像的像素单位像素。
因此,通过对低分辨率图像的像素单位像素进行插值而产生的子像素单位像素可相应于高分辨率图像的像素单位像素。
根据各种实施例的图像上采样设备10可通过滤波对低分辨率图像执行上采样,来产生高分辨图像。具体地,可通过对低分辨率图像进行插值滤波来产生子像素单位像素,并且低分辨率图像的原始像素单位像素与通过插值滤波产生的子像素单位像素之间的间隔可被扩大至像素单位。因此,低分辨率图像的原始像素单位像素以及子像素单位像素可被确定为与高分辨率图像的像素单位像素的位置相应。因此,可通过对低分辨率图像的插值滤波来确定高分辨率图像的像素单位像素,并且插值滤波操作在本说明书中可被理解为用于上采样的滤波操作。
通过插值滤波,子像素单位像素被新采样,因此,通过插值滤波而确定的子像素单位像素位置可以是通过上采样而产生的采样位置。
采样位置可根据将通过对低分辨率图像进行上采样而产生的高分辨率图像的缩放因子而不同。例如,当低分辨率图像与高分辨率图像的缩放因子为1:2时,可在低分辨率图像的两个相邻像素之间的1/2像素位置处确定一个采样位置,从而三个像素可被映射在相等的间隔处。作为另一示例,当低分辨率图像与高分辨率图像的缩放因子为2:3时,四个像素可被映射在低分辨率图像的三个相邻像素之间的1/3像素单位和2/3像素单位中的每个像素单位的相等的间隔处。
在低分辨率图像的像素单位像素位置和高分辨率图像的像素位置(采样位置)之间可能存在相移。低分辨率图像的像素单位像素位置是固定的,因此,如果根据低分辨率图像与高分辨率图像的缩放因子确定采样位置,则可确定像素单位像素和高分辨率图像的像素之间的相移。
因此,可根据低分辨率图像和高分辨率图像的缩放因子来确定低分辨率图像的像素和高分辨率图像的像素之间的相移。也就是说,如果低分辨率图像和高分辨率图像之间的缩放因子是不同的,则相移也可能被改变。
滤波器系数集根据采样位置被确定,因此,可根据相移来确定滤波器系数集。因此,滤波器数据存储单元16可存储针对低分辨率图像的像素和高分辨率图像的像素之间的相移而映射的滤波器系数集。例如,滤波器数据存储单元16可存储针对1/16、1/8、1/5、1/4、1/3、3/8、2/5和1/2的相移中的每个相移而单独设置的滤波器系数集。
根据各种实施例的滤波器选择器12可基于低分辨率图像与高分辨率图像的缩放因子来确定低分辨率图像的像素和高分辨率图像的像素之间的相移。然而,针对一个比率的至少一个采样位置被确定,因此,可针对一个缩放因子映射至少一个相移。因此,虽然低分辨率图像根据一个缩放因子被上采样到高分辨率图像,但是可通过针对相移而选择不同的滤波器来执行上采样滤波。因此,滤波器选择器12可在上采样滤波器之中,基于相移来选择不同的上采样滤波器,以产生位于低分辨率图像的像素单位像素之间的采样位置的像素值。
如上所述,可根据低分辨率图像与高分辨率图像的缩放因子来确定上采样位置。通过使用上采样滤波器对低分辨率图像执行滤波而获得的输出值可被确定为与采样位置相应的像素值。
根据各种实施例的上采样单元14可通过使用由滤波器选择器12选择的上采样滤波器对与采样位置邻近的像素单位像素进行插值,来产生采样位置的像素值。像素单位像素的上采样滤波可包括对包括了与采样位置邻近的像素单位像素的像素单位参数像素执行上采样滤波的操作。
根据各种实施例的上采样滤波器14可以是1维滤波器。因此,可通过使用选择的上采样滤波器对在水平方向上与低分辨率图像邻近的像素单位像素执行滤波,因此,可执行水平方向上的上采样。可通过使用选择的上采样滤波器对在垂直方向上与低分辨率图像邻近的像素单位像素执行滤波,因此,可执行垂直方向上的上采样。因此,在水平方向上和在垂直方向上对低分辨率图像连续执行上采样滤波,从而可确定高分辨率图像的像素值。
根据各种实施例的滤波器选择器12可在上采样滤波器之中,根据采样位置单独地确定上采样滤波器。根据各种实施例的上采样滤波器可包括对称上采样滤波器和不对称上采样滤波器,其中,对称上采样滤波器被配置为关于采样位置的相同数量的滤波器系数,不对称上采样滤波器被配置为关于采样位置的不同数量的滤波器系数。滤波器选择器12可根据采样位置单独地选择对称上采样滤波器和不对称上采样滤波器。
例如,7抽头上采样滤波器可被配置为关于采样位置的三个滤波器系数和四个滤波器系数。在这种情况下,7抽头上采样滤波器可被视为不对称上采样滤波器。
例如,8抽头上采样滤波器可被配置为关于采样位置的四个滤波器系数和四个滤波器系数。在这种情况下,8抽头上采样滤波器可被视为对称上采样滤波器。
当滤波器选择器12选择不对称上采样滤波器时,上采样单元14可通过参考位于关于采样位置不对称的位置的像素单位像素来执行滤波。当滤波器选择器12选择对称上采样滤波器时,上采样单元14可通过参考位置关于采样位置对称的位置的像素单位像素来执行滤波。
根据各种实施例的滤波器数据存储单元16可存储这样的上采样滤波器的滤波器系数集:所述上采样滤波器的滤波器系数集被归一化为使得由于在上采样滤波器之中使用上采样滤波器进行插值而产生的频率响应误差最小化。例如,比率为2:3的上采样需要将分辨率为720p的低分辨率视频上采样为分辨率为1080p的高分辨率视频或者将高清晰度(HD)视频上采样到全HD视频。滤波器数据存储单元16可将针对1/3或2/3的相移的8抽头滤波器系数{-1,4,-11,52,26,-8,3,-1}存储为针对2:3的比率的滤波器系数集。
根据各种实施例的滤波器数据存储单元16可存储当滤波器系数被放大为整数时的滤波器系数。例如,上述的针对1/3或2/3的相移的8抽头滤波器系数{-1,4,-11,52,26,-8,3,-1}是放大64倍的滤波器系数。在这种情况下,上采样单元14可仅通过将滤波输出值缩小64倍来确定采样位置的像素值。
根据各种实施例的滤波器数据存储单元16可包括与根据1/16的相移间隔的相移相应的滤波器系数集。当比率为2:3时,为了针对具有1/3的相移的上采样位置进行上采样,上采样单元14可在存储在滤波器数据存储单元16中的滤波器系数数据之中选择与5/16的相移相应的滤波器系数集。当比率为2:3时,为了针对具有2/3的相移的上采样位置进行上采样,上采样单元14可在存储在滤波器数据存储单元16中的滤波器系数数据之中选择与11/16的相移相应的滤波器系数集。
作为另一示例,滤波器数据存储单元16可包括与根据1/8的相移间隔的相移相应的滤波器系数集。当比率为2:3时,为了针对具有1/3的相移的上采样位置进行上采样,上采样单元14可在存储在滤波器数据存储单元16中的滤波器系数数据之中选择与3/8的相移相应的滤波器系数集。当比率为2:3时,为了针对具有2/3的相移的上采样位置进行上采样,上采样单元14可在存储在滤波器数据存储单元16中的滤波器系数数据之中选择与5/8的相移相应的滤波器系数集。
图像上采样设备10可通过针对每个彩色分量使用不同的上采样滤波器来执行图像插值。滤波器选择器12可基于采样位置和当前像素的彩色分量来在上采样滤波器之中选择不同的上采样滤波器。因此,上采样单元14通过使用针对每个彩色分量单独选择的上采样滤波器对像素单位像素进行插值来产生上采样位置的像素值。
例如,滤波器选择器12可不同地确定亮度分量的上采样滤波器和色度分量的上采样滤波器。低分辨率图像的亮度像素和高分辨率图像的亮度像素之间的相移可不同于低分辨率图像的色度像素和高分辨率图像的色度像素之间的相移。因此,可根据亮度分量的相移和色度分量的相移来单独地确定亮度分量的上采样滤波器和色度分量的上采样滤波器。
例如,可基于诸如4:2:0或4:1:1的彩色格式来确定亮度像素和色度像素的位置。具体地,可根据亮度像素的位置来确定色度像素的位置。因此,可根据低分辨率图像和高分辨率图像之间的缩放因子来确定高分辨率图像的亮度像素的位置,而可根据高分辨率图像的亮度像素的位置来确定高分辨率图像的色度像素的位置。因此,低分辨率图像的色度像素和高分辨率图像的色度像素之间的相移可不同于低分辨率图像的亮度像素和高分辨率图像的亮度像素之间的相移。
因此,滤波器选择器12可基于低分辨率图像和高分辨率图像之间的缩放因子来确定低分辨率图像的亮度像素和高分辨率图像的亮度像素之间的相移。然后,滤波器选择器12可确定高分辨率图像的色度像素相对于高分辨率图像的亮度像素的位置的位置,并确定低分辨率图像的色度像素与高分辨率图像的色度像素的相移。
因此,滤波器选择器12可单独地确定亮度像素的相移和色度像素的相移,从而根据它们的相移来单独地确定用于亮度像素的上采样滤波器和用于色度像素的上采样滤波器。
根据各种实施例的图像上采样设备10可包括中央处理器(未示出),其中,中央处理器总体上控制滤波器选择器12、上采样单元14和滤波器数据存储单元16。可选地,滤波器选择器12、上采样单元14和滤波器数据存储单元16由它们各自的处理器(未示出)操作,这些处理器有机地操作,因此,图像上采样设备10可总体上进行操作。可选地,滤波器选择器12、上采样单元14和滤波器数据存储单元16可基于根据各种实施例的图像上采样设备10的外部处理器(未示出)的控制而被控制。
根据各种实施例的图像上采样设备10可包括一个或更多个数据存储单元(未示出),其中,所述一个或更多个数据存储单元存储滤波器选择器12、上采样单元14和滤波器数据存储单元16的输入数据和输出数据。图像上采样设备10可包括存储控制单元(未示出),其中,所述存储控制单元控制所述一个或更多个数据存储单元(未示出)的数据输入和数据输出。
根据各种实施例的图像上采样设备10可包括单独的处理器,其中,所述单独的处理器包括执行图像上采样操作的电路。图像上采样设备10可包括存储图像插值模块的存储介质。中央处理器可调用并驱动图像插值模块,因此根据各种实施例的图像上采样操作可被实现。
如果与根据当前上采样率的采样位置相应的相移被指定,并且用于确定位于相应相移处的采样位置的样值的滤波器系数被精确地确定,则可通过使用该滤波器系数进行滤波来精确地确定精确采样位置的样值。
根据各种实施例的图像上采样设备10可预先存储关于这样的滤波器系数集的滤波器数据:该滤波器系数集用于确定针对低分辨率图像和高分辨率图像之间的上采样率所必需的相移的精确样值。图像上采样设备10可在上采样被执行时基于当前低分辨率图像和当前高分辨率图像之间的缩放因子来指定相移,并可从滤波器数据之中选择性地使用与指定的相移相应的上采样滤波器。
图像上采样设备10可仅存储用于与根据经常使用的上采样率的特定相移相应的上采样滤波器的滤波器系数集,从而有效地执行上采样滤波。如果p是正整数,并且相移间隔为2^(-p),则每个相移可以是i×2^(-p)(而其中i是小于2^p的整数)。仅针对根据经常使用的上采样率的相移间隔i×2^(-p)的滤波器系数集可被用于选择作为近似值的相移,并可按照每个采样单位执行上采样滤波。
现在将在下面参照图2至图4b详细地描述用于图像上采样的插值滤波。
图2示出像素的采样位置。
参照图2,图像上采样设备10通过对预定块20的位置“○”的像素值(即,空间域的像素单位像素值)进行插值来产生作为采样位置的位置“×”的像素值。位置“×”的像素值是具有根据αx和αy确定的采样位置的子像素单位像素值。通过图2中的示例的方式来描述预定块20是4×4的情况,而块的尺寸不限于4×4。本领域的普通技术人员将理解,可通过对更大尺寸的块或更小尺寸的块进行上采样滤波来产生子像素单位像素值。
在视频处理领域,运动矢量用于当前图像的运动补偿和预测。根据预测编码,先前编码的图像被参考以对当前图像进行预测。运动矢量指示参考图像的预定点。因此,运动矢量指示参考图像的像素单位像素。
然而,将被当前图像参考的像素的位置可以是位于参考图像的像素单位像素之间的点。这样的点作为子像素单位的位置而被参考。在子像素单位的位置不存在像素,因此,子像素单位的像素值可仅通过使用像素单位像素的像素值被预测。也就是说,子像素单位的像素值通过对像素单位像素进行插值而被估计。
当通过插值滤波来执行上采样时,像素单位和子像素单位可以是采样位置。
现在将参照图3、图4a、图4b和图4c来描述对像素单位的像素进行插值的方法。
图3示出原始像素与采样位置的相移。
参照图3,图像上采样设备10通过在空间域中对低分辨率图像的像素单位的像素值31和33进行插值来产生采样位置的像素值35。像素值35是根据相移α确定的采样位置的值。
如果通过对低分辨率图像进行插值来执行上采样,则产生的采样位置可以是高分辨率图像的像素单位像素,并且采样位置的像素值可以是高分辨率图像的像素值。
图4a和图4b示出用于上采样滤波的参考像素的位置。
参照图4a,为了通过对低分辨率图像的像素值31和33进行插值来产生采样位置的像素值35,包括像素值31和33的多个邻近像素单位像素的像素值37和39被使用。换句话说,可通过对从第-(M-1)像素值到第M像素值的2M个像素值执行上采样滤波来对第0像素和第1像素进行插值。
虽然通过图4a中的示例的方式来描述对水平方向上的像素值进行插值的情况,但是可通过使用垂直方向上的像素值来进行1D上采样滤波。
参照图4b,可通过对在垂直方向上相邻的P041和P143进行插值来产生垂直方向上的采样位置α的像素值P(α)。比较图4a和图4b,上采样滤波方法可以是相似的,除了在垂直方向上排列的像素值47和47被用于执行插值而不是在水平方向上的像素值37和39被用于执行插值。
不仅可在如图4a和图4b所示的方向上进行1D上采样滤波,还可产生在更多的各种方向上的采样位置的像素值。
现在将在下面参照图5至图7来描述上采样的采样位置和相移。
图5示出彩色格式为4:2:0的低分辨率图像50的亮度像素和色度像素的分布。
在彩色格式为4:2:0的低分辨率图像50中,一个色度像素55被映射到四个亮度像素51、52、53和54。
当高分辨率图像的宽度和高度分别是iEWidth和iEHeight,低分辨率图像的宽度和高度分别是iBWidth和iBHeight时,上采样率dsFactor可被确定为高分辨率图像的宽度相对于低分辨率图像的宽度的比率iEWidth/iBWidth。
低分辨率图像的像素之间的水平距离(水平相移)由iPhaseX表示,垂直距离(垂直相移)由iPhaseY表示。
在低分辨率图像的亮度像素51、52、53和54之间进行水平插值或垂直插值的距离displacement是0。色度像素55的水平插值的垂直距离displacement为0。垂直插值的垂直距离displacement是1/2。
通常,低分辨率图像和高分辨率图像之间的像素位置之间的相移Phase可根据下面的等式被确定:
Phase=(i+displacement/2)/dsFactor–displacement/2
因此,如果上采样率是2,并且低分辨率图像的像素之间的距离是0,则低分辨率图像和高分辨率图像之间的相移Phase可以是0和1/2。如果上采样率是2,并且低分辨率图像的像素之间的距离是1,则低分辨率图像和高分辨率图像之间的相移Phase可以是3/8和7/8。
然而,当上采样率是2时,相移Phase0、3/8、7/8和1可被表示为1/16采样单位。因此,可根据以下的指示1/16采样单位的上采样的等式来确定高分辨率图像的像素位置。
低分辨率图像的亮度像素51、52、53和54之间的水平相移iPhaseX和垂直相移iPhaseY分别为0和0。色度像素55的水平相移iPhaseX和垂直相移iPhaseY分别为0和1。
在等式aa中,iRefPos16XX和iRefPos16YY表示低分辨率图像上的1/16采样单位的采样位置。
[等式aa]
iRefPos16XX=((i*iScaleX+iAddX)>>iShiftXM4)iDeltaX;
iRefPos16YY=((j*iScaleY+iAddY)>>iShiftYM4)iDeltaY;
其中,i是等于或大于0并且小于高分辨率图像的宽度iEWidth的数,j是等于或大小0并且小于高分辨率图像的高度iEHight的数。
用于确定iRefPos16XX和iRefPos16YY的变量iScaleX、iAddX、iShiftXM4、iDeltaX、iScaleY、iAddY、iShiftYM4和iDeltaY可根据下面的等量被分别确定:
iShiftX=16;
iShiftY=16;
iAddX=(((iBWidth*iPhaseX)<<(iShiftX-2))+(iEWidth>>1))/iEWidth+(1<<(iShiftX-5));
iAddY=(((iBHeight*iPhaseY)<<(iShiftY-2))+(iEHeight>>1))/iEHeight+(1<<(iShiftY-5));
iDeltaX=4*iPhaseX;
iDeltaY=4*iPhaseY;
iShiftXM4=iShiftX4;
iShiftYM4=iShiftY4;
iScaleX=((iBWidth<<iShiftX)+(iEWidth>>1))/iEWidth;
iScaleY=((iBHeight<<iShiftY)+(iEHeight>>1))/iEHeight;
iPhaseX和iPhaseY根据亮度像素或色度像素而不同,因此,iRefPos16XX和iRefPos16YY的采样位置可不同。
如果用于对低分辨率图像执行上采样滤波的采样位置被扩大,则采样位置iRefPos16XX和iRefPos16YY指示高分辨率图像的每个像素位置的相应的采样位置。
因此,高分辨率图像的水平方向上的相移iPhaseXX、水平方向上的像素位置iRefPosXX、垂直方向上的相移iPhaseYY和垂直方向上的像素位置iRefPosYY可通过使用下面的等式iRefPos16XX和iRefPos16YY被分别确定:
iPhaseXX=iRefPos16XX&15;
iRefPosXX=iRefPos16XX>>4;
iPhaseYY=iRefPos16YY&15;
iRefPosYY=iRefPos16YY>>4;
因此,可根据上面的等式aa而不进行除法运算来确定高分辨率图像的采样位置(即,像素位置)。
现在将参照图6和图7详细描述根据上采样比率的相移。大圆形像素61是低分辨率图像50的亮度像素。大三角形像素62是低分辨率图像50的色度像素。小圆形像素63是高分辨率图像的亮度像素。小三角形像素64是高分辨率图像的色度像素。
图6示出当彩色格式为4:2:0的低分辨率图像50和高分辨率图像之间的缩放因子是2时低分辨率亮度像素和高分辨率亮度像素以及低分辨率色度像素和高分辨率亮度像素的分布。
低分辨率亮度像素51、52、53、54、56和57以及低分辨率色度像素55、58根据4:2:0的彩色格式被布置。
根据上采样率2,基于低分辨率亮度像素51、52、53、54、56和57的位置来布置高分辨率亮度像素611、613、615、617、619、621、623、625和627。根据4:2:0的彩色格式,基于高分辨率亮度像素611、613、615、617、619、621、623、625和627的位置来布置高分辨率色度像素651、653、655、657、659和661。
在亮度像素中,低分辨率图像50和高分辨率图像之间的相移是0和1/2。例如,低分辨率亮度像素51和高分辨率亮度像素611之间的水平相移为0,低分辨率亮度像素51和高分辨率亮度像素613之间的水平相移为1/2。低分辨率亮度像素51和高分辨率亮度像素611之间的垂直相移为0,低分辨率亮度像素51和高分辨率亮度像素613之间的垂直相移为1/2。
在色度像素中,低分辨率图像50和高分辨率图像之间的相移是0、1/2、3/8和7/8。例如,低分辨率色度像素55和高分辨率色度像素651之间的水平相移是0,低分辨率色度像素55和高分辨率色度像素653之间的水平相移是1/2。低分辨率色度像素55和高分辨率色度像素655之间的垂直相移是3/8,低分辨率色度像素55和高分辨率色度像素659之间的垂直相移是7/8。
图7示出当彩色格式为4:2:0的低分辨率图像50和高分辨率图像之间的缩放因子是1.5时低分辨率亮度像素和高分辨率亮度像素以及低分辨率色度像素和高分辨率亮度像素的分布。
低分辨率亮度像素51、52、53、54、56、57、59、60和61以及低分辨率色度像素55、58和65根据4:2:0的彩色格式被布置。
根据上采样率1.5,基于低分辨率亮度像素51、52、53、54、56、57、59、60和61的位置来布置高分辨率亮度像素711、713、715、717、719、721、723、725、727、729、731、733、735、737和739。根据4:2:0的彩色格式,基于高分辨率亮度像素711、713、715、717、719、721、723、725、727、729、731、733、735、737和739的位置来布置高分辨率色度像素751、753、755、757和759。
在亮度像素中,低分辨率图像50和高分辨率图像之间的相移是0、1/3和2/3。例如,低分辨率亮度像素51和高分辨率亮度像素711之间的水平相移为0,低分辨率亮度像素51和高分辨率亮度像素713之间的水平相移为1/3,低分辨率亮度像素51和高分辨率亮度像素715之间的水平相移为2/3。低分辨率亮度像素51和高分辨率亮度像素711之间的垂直相移为0,低分辨率亮度像素51和高分辨率亮度像素719之间的垂直相移为1/3,低分辨率亮度像素51和高分辨率亮度像素727之间的垂直相移为2/3。
在色度像素中,低分辨率图像50和高分辨率图像之间的相移是0、1/3、2/3、1/4、7/12和11/12。例如,低分辨率色度像素55和高分辨率色度像素751之间的水平相移是0,低分辨率色度像素55和高分辨率色度像素753之间的水平相移是2/3,低分辨率色度像素55和高分辨率色度像素755之间的水平相移是1/3。低分辨率色度像素55和高分辨率色度像素751之间的垂直相移是11/12,低分辨率色度像素55和高分辨率色度像素757之间的垂直相移是7/12,低分辨率色度像素55和高分辨率色度像素759之间的垂直相移是1/4。
根据各种实施例的图像上采样设备10可通过根据低分辨率图像和高分辨率图像之间的相移确定滤波器来执行图像上采样。图像上采样设备10可存储针对相移所映射的滤波器系数集,并在存储的滤波器系数集中选择与当前相移相应的滤波器系数。
相移需要这样的滤波器:该滤波器被配置为滤波器系数被用于确定相应相位中的精确的插值值以确定采样位置并精确地确定采样位置中的采样值。因此,需要预先将具有高性能的滤波器系数集存储在图像上采样设备10中。现在将在下面详细描述确定用于输出针对相移的精确的插值值的滤波器系数集的操作。
<用于确定上采样滤波器系数的基础>
可通过上采样滤波来实现用于产生采样位置的像素值的对像素单位像素的插值。根据下面的表达式来表示上采样滤波:
p ( &alpha; ) = f ( &alpha; ) &times; p = &Sigma; - M + 1 M f m &CenterDot; p m
根据2M个像素单位参考像素的矢量p{pm}={p-M+1,p-M+2,...,p0,p1,...,pM}和滤波器系数的矢量f(x){fm}={f-M+1,f-M+2,...,f0,f1,...,fM}的点积来得到作为插值的结果而产生的像素值p(x)。滤波器系数f(α)根据采样位置α而改变,其中,滤波器系数f(α)确定插值结果像素值p(α),因此,选择哪个上采样滤波器(即,如何确定滤波器系数f(x))会大大影响上采样滤波的性能。
根据各种实施例的产生各种上采样滤波器的方法是基于用于产生浮点数而不是整数的运算等式的,并使用通常不大于1的滤波器系数的绝对值。具体地说,可在采样位置α产生实数的运算结果而不是整数的运算结果。
基于整数的运算效率高于基于浮点数的运算效率。因此,根据各种实施例的图像上采样设备10通过使用上采样率将滤波器系数放大到整数,从而提高上采样滤波的运算效率。随着像素值的比特深度增加,上采样的精确度可提高。
根据各种实施例的图像上采样设备10可通过将预定值与滤波器系数fm(α)相乘并使用具有较大值的滤波器系数Fm(α)来对图像进行插值。例如,滤波器系数Fm(α)可根据下面的等式i从滤波器系数fm(α)被放大:
[等式i]
Fm(α)=int(fm(α)·2n)
用于运算效率的缩放率可以是2n的形式。n可以是0和正整数。与使用原始滤波器系数的滤波结果比较,使用放大2n倍的滤波器系数的上采样滤波结果可被放大比特深度的n比特。
使用放大的滤波器系数Fm(α)的整数运算上采样滤波可采用下面的等式ii。也就是说,在通过使用放大的滤波器系数Fm(α)执行上采样滤波之后,放大的比特深度需要被重建为原始比特深度。
[等式ii]
p ( &alpha; ) = ( &Sigma; - M + 1 M - F m ( &alpha; ) &CenterDot; p m + o f f s e t ) > > n
在这点上,offset可以是2n-1
也就是说,通过使用根据各种实施例的放大的上采样滤波器而放大的滤波结果需要被缩小2n缩放率,以将放大的比特深度重建为原始比特深度,并因此放大的滤波结果的比特深度可被减小n比特。
如果连续通过水平方向上的1D上采样滤波和垂直方向上的1D上采样滤波来执行2步上采样滤波,则比特深度可被减小2n比特。因此,当第一1D上采样滤波器被扩大n1比特,第二1D上采样滤波器被扩大n2比特时,在通过第一1D上采样滤波和第二1D上采样滤波执行2步上采样滤波之后,比特深度可被减小2n(即,n1与n2的和)。第一1D上采样滤波器可以是非扩大的上采样滤波器。
上采样滤波器系数fm(α)的和为1,如下面的等式iii所示。
[等式iii]
&Sigma; - M + 1 M f m ( &alpha; ) = 1
扩大的上采样滤波器的滤波器系数Fm(α)的归一化条件需要采用下面的等式iv:
[等式iv]
&Sigma; - M + 1 M F m ( &alpha; ) = 2 n
然而,采用上面的等式iv的归一化条件可由于舍入误差而引起误差。根据各种实施例的图像上采样设备10可基于采用以下的等式iv的归一化条件对扩大的滤波器系数Fm(α)进行舍入。用于归一化的一些扩大的滤波器系数Fm(α)可在相对于原始值的预定范围内被调整。例如,扩大的滤波器系数Fm(α)可在±1的范围内被调整以对舍入误差进行插值。
图8和图9分别是用于选择滤波器系数的频率响应曲线的曲线图80和90。
可通过分析上采样滤波器的频率响应曲线来确定最适合用于上采样滤波器的滤波器系数集。为了确定上采样滤波器的频率响应曲线,针对上采样滤波器系数fk的频谱分析是必要的,并采样等式v:
[等式5]
&Sigma; - M + 1 M f k ( &alpha; ) i &omega; k , e i &omega; k
幅度域的频率响应ρ(ω)和相位域的频率响应α(ω)可根据fk(α)的输入信号频率ω而改变。
图8是幅度域的频率响应曲线的曲线图80。在曲线图80中,横轴指示频率ω,纵轴指示频率响应ρ(ω)。频率响应ρ(ω)的理想幅度85是1。
图9是相位域的频率响应曲线的曲线图90。在曲线图90中,横轴指示频率ω,纵轴指示频率响应α(ω)。频率响应α(ω)的理想幅度85是θ。
在图8和图9中,如黑方块指示的幅度频率响应81和相位频率响应91是如滤波器系数集{-1,5,-12,52,26,-9,4,-1}/64构成的上采样滤波器的频率响应曲线。如白方块指示的幅度频率响应82和相位频率响应92是如滤波器系数集{-1,4,-11,53,25,-8,3,-1}/64构成的上采样滤波器的频率响应曲线。如白三角形指示的幅度频率响应83和相位频率响应93是如滤波器系数集{-5,11,-24,107,53,-18,8,-4}/128构成的上采样滤波器的频率响应曲线。如黑三角形指示的幅度频率响应84和相位频率响应94是如滤波器系数集{-1,4,-11,52,26,-8,3,-1}/64构成的上采样滤波器的频率响应曲线。
为了在滤波器系数集中确定最精确的上采样滤波器,可确定具有更接近于1的理想幅度85的上采样滤波器的频率响应ρ(ω)并具有更接近于θ的理想幅度95的频率响应α(ω)的滤波器。
例如,在如滤波器系数集构成的上采样滤波器的频率响应曲线中,可选择频率响应ρ(ω)和1的理想幅度85之间的误差宽度∫|ρ(ω)-1|dω最小且频率响应α(ω)和θ的理想幅度95之间的误差宽度∫|α(ω)-θ|dω最小的滤波器系数集。
在频率ω中,频率响应ρ(ω)可被确定为等式ii的输出结果值的绝对值,即,上采样滤波的结果值的绝对值,频率响应α(ω)可被确定为将上采样滤波的结果值的相位归一化为频率的值。
为了频率响应ρ(ω)和频率响应α(ω)选择最小滤波器系数集,可通过比较使用每个滤波器系数集执行上采样滤波的结果的频率响应曲线的总误差宽度∫|ρ(ω)-1|dω+∫|α(ω)-θ|,将产生最小误差宽度的滤波品系数集确定为最精确的上采样滤波器。
在图8和图9中,目标相移是1/3。在四个滤波器系数集中,由于最终的滤波器系数集的幅度频率响应84和相位频率响应94的总误差宽度最小,因此,针对目标相移1/3设置的滤波器系数可被确定为最终的滤波器系数集{-1,4,-11,52,26,-8,3,-1}/64。
可根据低分辨率图像和高分辨率图像确定低分辨率图像像素和高分辨率图像像素之间的理论相移。
以下的表1示出在每个比率的上采样处理期间可发生的相移。在这点上,比率“×A/B”指示“高分辨率图像的宽度A/低分辨率图像的宽度B”。
[表1]
图10是根据各种实施例的与1/16的相移间隔相应的上采样率的表。
如上所述,可在不进行除法运算的情况下确定通过根据等式aa对低分辨率图像进行上采样而产生的高分辨率图像的像素位置以及相移。根据等式aa,当根据频繁使用的缩放因子执行上采样时,可确定可在每个采样位置发生的相移。相反,如果相移被确定,则可在从低分辨率图像的像素单位像素估计用于高分辨率图像的采样位置来确定该采样位置。
图10是当相移间隔是1/16时可能发生的相移的上采样率的关系的表。
如果相移间隔是1/16,则由于可选择的相移是16个,因此,相移可被映射到不同的相移索引。因此,相移索引信息可被用信号发送以发送和接收指示哪个与滤波器系数集相应的相移被用于执行上采样滤波的信息。
当理论上执行所有缩放因子的上采样时,相移0发生。
相移1/16可精确地确定比率为×16/15的上采样所需的采样位置。
相移1/8(=2/16)可精确地确定比率为×8/7的上采样所需的采样位置。虽然与比率为×7/6的上采样所需的采样位置相比,比率为×8/7的上采样所需的采样位置具有大约0.02的误差,但是由于该误差是可忽略的值,因此可在比率为×7/6的上采样中使用相移1/8。
相移1/5(=3/15≒3/16)可精确地确定比率为×5/3的上采样所需的采样位置。虽然与比率为×6/5的上采样所需的采样位置相比,比率为×5/3的上采样所需的采样位置具有大约-0.03的误差,但是由于该误差是可忽略的值,因此可在比率为×6/5的上采样中使用相移1/5。
相移1/4(=4/16)可精确地确定缩放因子为×4/3和×8/7的上采样所需的采样位置。虽然与比率为×7/6的上采样所需的采样位置相比,缩放因子为×4/3和×8/7的上采样所需的采样位置具有大约0.04的误差,但是由于该误差是可忽略的值,因此可在比率为×7/6的上采样中使用相移1/4。
当上采样率为2:3时,需要具有相移1/3的采样位置。然而,当相移为1/16时,没有与相移1/3精确匹配的位移索引。因此,对于相移为1/3的采样位置,可分配相移索引中的相移5/16(≒5/15=1/3)的索引。也就是说,相移1/3(≒5/16)可精确地确定缩放因子为×3/2和×6/5的上采样所需的采样位置。
相移3/8(=6/16)可精确地确定比率为×8/7的上采样所需的采样位置。相移2/5(=6/15≒7/16)可精确地确定比率为×5/3的上采样所需的采样位置。
相移1/2(=8/16)可精确地确定缩放因子为×2、×4/3、×6/5和×8/7的上采样所需的采样位置。
当相移索引i大于8时,由于由相移索引i指示的相移θ1和由相移索引16-i指示的相移θ2的和为1,因此,在相同的上采样率中可同时产生相移索引i和相移索引16-i。因此,在使用相移索引i的上采样率中可使用相移θ2。因此,可在相同的上采样率中使用相移索引i和相移索引16-i。
因此,在比率为×5/3的上采样中,可像使用相移2/5一样使用相移3/5。在比率为×8/7的上采样中,可像使用相移3/8一样使用相移5/8。在缩放因子为×3/2和×6/5的上采样中,可像使用相移1/3一样使用相移2/3。在缩放因子为×4/3和×8/7的上采样中,可像使用相移1/4一样使用相移3/4。在缩放因子为×5/3和×6/5的上采样中,可像使用相移1/5一样使用相移4/5。在缩放因子为×8/7和×7/6的上采样中,可像使用相移1/8一样使用相移7/8。
根据图10的表,如果在每个上采样率中需要特定相移,则需要用于确定指示相应相移的采样位置的上采样滤波器。以下在图11中示出用于确定由相移指示的采样位置的8抽头上采样滤波器系数。
图11是根据各种实施例的相移间隔为1/16的8抽头上采样滤波器系数的表。
相移索引i和由每个索引指示的目标相移与图10中示出的相同。图11的滤波器系数是扩大了64倍的值。
针对相移0的滤波器系数集为{0,0,0,64,0,0,0,0}。
针对相移1/16的滤波器系数集为{0,1,-3,63,4,-2,1,0}。
针对相移1/8的滤波器系数集为{-1,3,-7,63,8,-2,0,0}或者实质上7抽头滤波器系数{-1,2,-5,62,8,-3,1,0}。
针对相移1/5的滤波器系数集为{-1,4,-9,59,15,-6,3,-1}或者实质上7抽头滤波器系数{-2,5,-10,60,15,-6,2,0}。
针对相移3/16的滤波器系数集为{-1,3,-8,60,13,-4,1,0}。
针对相移1/4的滤波器系数集为{-1,4,-10,58,17,-5,1,0}。
针对相移1/3的滤波器系数集为{-1,4,-11,52,26,-8,3,-1}。
针对相移3/8的滤波器系数集为{-2,5,-12,50,30,-10,5,-2}或者实质上7抽头滤波器系数{-1,3,-9,47,31,-10,4,-1}。
针对相移2/5的滤波器系数集为{-1,5,-12,47,32,-10,4,-1}。
针对相移7/16的滤波器系数集为{-1,4,-11,45,34,-10,4,-1}。
针对相移1/2的滤波器系数集为{-1,4,-11,40,40,-11,4,-1}。
如上面参照图10所述,在相同的缩放因子的上采样中可同时产生相移索引i和相移索引16-i,针对相移索引i的滤波器系数和针对相移索引16-i的滤波器系数具有反向顺序关系。例如,针对相移索引i的滤波器系数可以是{-1,5,-12,47,32,-10,4,-1},针对相移索引16-i的滤波器系数可以是{-1,4,-10,32,47,-12,5,-1}。
因此,根据各种实施例的图像上采样设备10可将上面参照图11所述的相移索引(或相移)和滤波器系数集的查找表存储在滤波器数据存储单元16中。
如上面参照图8和图9所述,可以按照这样的方式来确定滤波器系数集:可使滤波响应的幅度域的频率响应与理想幅度1的误差宽度最小化,并且可使滤波响应的相位域的频率响应与目标相移θ的误差宽度最小化。
滤波器数据存储单元16可存储根据除了1/16之外的相移间隔的相移和滤波器系数集的查找表或者滤波器抽头数量不为8且相位移动的滤波器系数集的查找表。
相移间隔可以是除了1/16之外的2^(-p)(其中,p是正整数),诸如1/8或者1/32。对于小存储容量来说优选为相移间隔1/8。对于精确度提高来说优选为位移间隔1/32。
因此,滤波器选择器14可基于当前的上采样率(缩放因子或可伸缩因子)来确定需要的相移,滤波器数据存储单元16可选择与相移相应的滤波器系数集,并对每个由相移指示的采样位置执行上采样滤波。
可伸缩视频系统可将低分辨率图像编码为基本层图像序列,并将高分辨率图像编码为增强层图像序列。
图12a是根据各种实施例的可伸缩视频编码设备1200的框图。
根据各种示例性实施例的可伸缩视频编码设备1200包括基本层编码器1210、增强层编码器1220、滤波器选择器12、上采样单元14和滤波器数据存储单元16。
根据各种示例性实施例的可伸缩视频编码设备1200可根据可伸缩视频编码针对每个层对多个图像流进行分类和编码,并可将针对每个层编码的数据输出为单独的流。可伸缩视频编码设备1200可根据不同的层对基本层图像序列和增强层图像序列进行编码。
基本层编码器1210可对基本层图像进行编码,并可输出包括基本层图像的编码数据的基本层流。
增强层编码器1220可对增强层图像进行编码,并可输出包括增强层图像的编码数据的增强层流。
例如,根据基于空间可伸缩性的可伸缩视频编码,低分辨率图像可被编码为基本层图像,高分辨率图像可被编码为增强层图像。基本层图像的编码结果可在基本层流中被输出,增强层图像的编码结果可在增强层流中被输出。
可对基本层和多个增强层执行可伸缩视频编码。在存在三个或更多个增强层时,基本层图像、第一增强层图像、第二增强层图像至第K增强层图像可被编码。因此,基本层图像的编码结果可在基本层流中被输出,第一增强层图像的编码结果、第二增强层图像的编码结果至第K增强层图像的编码结果可分别在第一增强层流、第二增强层流至第K增强层流中被输出。
根据各种实施例的可伸缩视频编码设备1200可执行用于通过参考单个层的图像来对当前图像进行预测的帧间预测。通过帧间预测,可产生指示当前图像和参考图像之间的运动信息的运动矢量以及当前图像和参考图像之间的残差。
根据各种实施例的可伸缩视频编码设备1200可执行用于通过参考基本层图像来对增强层图像进行预测的层间预测。可伸缩视频编码设备1200可执行通过参考第一增强层图像来对第二增强层图像进行预测的层间预测。通过层间预测,可产生当前图像和不同层的参考图像之间的位置差分量以及当前图像和不同层的参考图像之间的残差。
当根据各种实施例的可伸缩视频编码设备1200允许两个或更多个增强层时,视频流编码设备10可根据多层预测结构执行一个基本层图像和两个或更多个增强层图像之间的层间预测。
稍后将参照图14来更详细地描述基本层序列和增强层序列之间的层间预测结构。
根据各种实施例的可伸缩视频编码设备1200根据每个层,针对每个单独的块对每个视频图像进行编码。块可具有正方形、矩形或任何几何形状,并不限于具有预定尺寸的数据单元。根据各种实施例,块可以是根据树结构的编码单元之中的最大编码单元、编码单元、预测单元、变换单元等。包括具有树结构的编码单元的最大编码单元被不同地称为编码块单元、块树、根块树、编码树、编码根或树干。现在将参照图15至图25来描述基于具有树结构的编码单元的视频编码和解码方法。
可基于编码单元、预测单元或变换单元的数据单元来执行帧间预测和层间预测。
根据各种示例性实施例的基本层编码器1210可对基本层图像执行包括帧间预测或帧内预测的源编码操作以产生符号数据。例如,基本层编码器1210可对基本层图像的数据单元中的样点执行帧间预测或帧内预测、变换和量化,产生符号数据,对符号数据执行熵编码,并产生基本层流。
增强层编码器1220可基于具有树结构的编码单元对增强层图像进行编码。增强层编码器1220可对增强层图像的数据单元中的样点执行帧间/帧内预测、变换和量化,产生符号数据,对符号数据执行熵编码,并产生增强层流。
根据各种实施例的增强层编码器1220可执行通过使用基本层图像的重建样点对增强层图像进行预测的层间预测。增强层编码器1220可通过使用基本层重建图像来产生增强层预测图像,以对增强层原始图像和增强层预测图像之间的预测误差进行编码,从而通过层间预测结构对增强层图像序列中的增强层原始图像进行编码。
增强层编码器1220可针对每个块(诸如编码单元或预测单元)来对增强层图像执行层间预测。可确定基本层图像中的将被增强层图像的块参考的块。例如,可确定基本层图像中的位于与增强层图像中的当前块图像的位置相应的位置处的重建块。增强层编码器1220可通过使用与增强层块相应的基本层重建块来确定增强层预测块。
增强层编码器1220可使用根据层间预测结构通过使用基本层重建块而确定的增强层预测块作为用于对增强层原始块进行层间预测的参考图像。
为了按照上述的方式通过使用基本层重建图像(块)来确定增强层预测图像(块),需要用于将基本层重建图像扩展为增强层图像的尺寸的上采样操作。
根据各种实施例的可伸缩视频编码设备1200可包括图像上采样设备10的滤波器选择器12、上采样单元14和滤波器数据存储单元16。下面将参照图13a来详细地描述可伸缩视频编码设备1200中包括的滤波器选择器12、上采样单元14和滤波器数据存储单元16的操作。
图13a是根据各种实施例的可伸缩视频编码方法的流程图。
基本层编码器1210可在基本层序列的低分辨率图像上确定具有树结果的编码单元。基本层编码器1210可针对具有树结构的每个编码单元对预测单元执行帧内预测或帧间预测,并可对每个变换单元执行变换和量化,以对编码单元的样点进行编码。可输出包括通过对低分辨率图像进行编码而产生的低分辨率编码信息的基本层流。
基本层编码器1210可再次基于变换单元对针对每个编码单元而编码的样点执行反量化和逆变换,并可基于预测单元执行逆变换和帧内预测或运动补偿,以重建每个样点。因此,基本层编码器1210可产生低分辨率重建图像。
在操作S1310,滤波器选择器12可基于由基本层编码器1210处理的低分辨率图像和由增强层编码器1220处理的高分辨率图像之间的缩放因子,确定上采样滤波所需的相移。
在操作S1320,滤波器选择器12可通过使用存储在滤波器数据存储单元16中的查找表来确定与相移相应的滤波器系数集。也就是说,滤波器选择器12可选择当前上采样率所需的滤波器。
在操作S1330,上采样单元16可通过使用由滤波器选择器12选择的上采样滤波器来对由基本层编码器1210产生的低分辨率重建图像执行滤波,以产生高分辨率预测图像。
在操作S1340,增强层编码器1220可将由上采样单元16产生的高分辨率预测图像与高分辨率原始图像之间的预测误差编码为高分辨率编码信息。上采样滤波器信息可与高分辨率编码信息一起被编码,其中,上采样滤波器信息包括关于被用于从低分辨率图像对高分辨率预测图像进行上采样的相移的信息。因此,增强层编码器1220可输出包括高分辨率编码信息和上采样滤波器信息的增强层流。
上采样滤波器信息可被记录在序列参数集(SPS)、画面参数集(PPS)和条带片段头。
根据各种实施例的可伸缩视频编码设备1200可包括中央处理器(未示出),其中,中央处理器总体上控制基本层编码器1210、增强层编码器1220、滤波器选择器12、上采样单元14和滤波器数据存储单元16。可选地,基本层编码器1210、增强层编码器1220、滤波器选择器12、上采样单元14和滤波器数据存储单元16可由它们各自的处理器(未示出)来操作,可伸缩视频编码设备1200可根据这些处理器(未示出)的交互来进行总体操作。可选地,基本层编码器1210、增强层编码器1220、滤波器选择器12、上采样单元14和滤波器数据存储单元16可根据可伸缩视频编码设备1200的外部处理器(未示出)的控制而被控制。
根据各种实施例的可伸缩视频编码设备1200可包括一个或更多个数据存储单元(未示出),其中,在所述一个或更多个数据存储单元中存储基本层编码器1210、增强层编码器1220、滤波器选择器12、上采样单元14和滤波器数据存储单元16的输入数据和输出数据。可伸缩视频编码设备1200可包括控制数据存储单元(未示出)的数据输入和数据输出的存储器控制单元(未示出)。
根据各种实施例的可伸缩视频编码设备1200可与内部视频编码处理器或外部视频编码处理器关联地操作,以输出视频编码结果,从而执行包括变换的视频编码操作。根据实施例的可伸缩视频编码设备1200的内部视频编码处理器可由中央处理器或图形处理器以及单独的处理器来实现。
图12b是根据各种实施例的可伸缩视频解码设备1250的框图。
根据各种实施例的可伸缩视频解码设备1250包括层间SAO参数获得器22、层间偏移确定器24、增强层解码器1270和基本层解码器1260。
根据各种实施例的可伸缩视频解码设备1250可接收根据可伸缩编码的每个层的比特流。由可伸缩视频解码设备1250接收的比特流的层数不受限制。然而,为了便于描述,将详细描述伸缩视频解码设备1250的基本层解码器1260接收并解码基本层流,增强层解码器1270接收并解码增强层流的实施例。
例如,基于空间可伸缩性的可伸缩视频解码设备1250可接收不同分辨率的图像序列根据不同的层而被编码的流。可通过对基本层流进行解码来重建低分辨率图像序列,可通过对增强层流进行解码来重建高分辨率图像序列。
在存在三个或更多个增强层时,第一增强层上的第一增强层图像可从第一增强层流被重建,如果第二增强层流被进一步解码,则第二增强层图像可被进一步重建。如果第K增强层流从第一增强层流被进一步解码,则第K增强层图像可被进一步重建。
可伸缩视频解码设备1250可从基本层流和增强层流获得基本层图像和增强层图像的编码数据,并还可获得通过帧间预测而产生的运动矢量和通过层间预测而产生的预测信息。
例如,可伸缩视频解码设备1250可对每个层的帧间预测的数据进行解码,并可对多个层之间的层间预测的数据进行解码。根据实施例,可通过过基于编码单元或预测单元的运动补偿和层间解码来执行重建。
通过参考通过同一层的帧间预测而预测出的重建图像,对每个层流执行对当前图像的运动补偿。运动补偿是指合成通过使用当前图像的运动矢量确定的参考图像和当前图像的残差并重构当前图像的重建图像的操作。
根据示例性实施例的可伸缩视频解码设备1250可参考基本层图像执行层间解码来重建通过层间预测而预测出的增强层图像。层间解码是指合成通过使用当前图像的视差(disparity)信息确定的不同层的参考图像和当前图像的残差并重构当前图像的重建图像的操作。
根据示例性实施例的可伸缩视频解码设备1250可执行用于对参考增强层图像而预测出的第二增强层图像进行重建的层间解码。稍后将参照图14来详细描述层间预测结构。
可伸缩视频解码设备1250针对每个块对视频的每个图像进行解码。根据示例性实施例的块可包括根据树结构的编码单元中的最大编码单元、编码单元、预测单元、变换单元等。
基本层解码器1260可通过使用解析的基本层图像的编码符号来对基本层图像进行解码。如果可伸缩视频解码设备1250接收基于具有树结构的编码单元的编码流,则基本层解码器1260可针对基本层流的每个最大编码单元,基于具有树结构的编码单元执行解码。
基本层解码器1260可针对每个最大编码单元执行熵编码,并可获得编码信息和被编码的数据。基本层解码器1260可对从流获得的被编码的数据执行反量化和逆变换以重建残差。根据另一示例性实施例的基本层解码器1260可直接接收量化的变换系数的比特流。作为对量化的变换系数执行反量化和逆变换的结果,图像的残差可被重建。
基本层解码器1260可通过相同层的图像之间的运动补偿将预测图像和残差合并来重建基本层图像。
增强层解码器1270可根据层间预测结构通过使用基本层重建图像的样点来产生增强层预测图像。增强层解码器1270可根据层间预测对增强层流进行解码以获得预测误差。增强层解码器1270可将增强层预测图像和预测误差合并,从而产生增强层重建图像。
根据各种实施例的基本层解码器1260可从基本层流获得SAO参数以补偿基本层原始图像和基本层重建图像之间的编码误差。
更具体地说,增强层解码器1260可针对基本层图像的具有树结构的编码单元,对编码的样点执行基于变换单元的反量化和逆变换,并可通过执行基于预测单元的帧内预测或运动补偿的解码来重建样点。基本层解码器1260可重建每个最大编码单元的样点,从而产生重建图像。先前条带片段的重建图像可被参考以用于对当前条带片段进行帧间预测。因此,先前条带片段的重建图像可被用作当前条带片段的预测图像。
增强层解码器1270可从增强层比特流获得高分辨率编码信息。可从高分辨率编码信息获得根据层间预测结构的增强层预测块和增强层原始块之间的预测误差(即,残差)。
根据各种实施例的增强层解码器1270可执行通过使用基本层图像的重建的样点来重建增强层图像的层间预测。增强层解码器1270可将通过使用基本层重建图像而产生的增强层预测图像作为层间预测的参考图像,来通过层间预测结构重建增强层图像序列中的增强层原始图像。
增强层解码器1270可针对每个块(诸如编码单元或预测单元)对增强层图像执行层间预测。可确定基本层图像中的将被增强层图像的块参考的块。例如,可确定基本层图像中的位于与增强层图像中的当前块图像的位置相应的位置处的重建块。增强层解码器1270可通过使用与增强层块相应的基本层重建块来确定增强层预测块。
增强层解码器1270可将通过根据层间预测结构使用基本层重建块确定的增强层预测块用作对增强层原始块进行层间预测的参考图像。
为了按照上述方式通过使用基本层重建图像(块)来确定增强层预测图像(块),需要进行用于将基本层重建图像扩展到增强层图像的尺寸的上采样操作。
根据各种实施例的可伸缩视频解码设备1250可包括图像上采样设备10的滤波器选择器12、上采样单元14和滤波器数据存储单元16。下面将参照图13b来详细描述可伸缩视频解码设备1250中包括的滤波器选择器12、上采样单元14和滤波器数据存储单元16的操作。
图13b是根据各种实施例的可伸缩视频解码方法的流程图。
基本层解码器1260可从基本层流获得低分辨率编码信息以在基本层序列的低分辨率图像上确定具有树结构的编码单元。
基本层解码器1260可针对每个编码单元从编码信息解析符号,可基于变换单元对符号执行逆变换和反量化,并可基于预测单元执行帧间预测或运动补偿,来重建每个样点。因此,基本层解码器1260可产生低分辨率重建图像。
在操作S1360,增强层解码器1270可解析增强层比特流以获得高分辨率编码信息,其中,高分辨率编码信息包括高分辨率预测图像和高分辨率原始图像之间的预测误差。
增强层解码器1270可解析增强层比特流以获得上采样滤波器信息。上采样滤波器信息可被传送到滤波器选择器12,其中,上采样滤波器信息包括关于被用于从低分辨率图像对高分辨率图像进行上采样的滤波器的信息。上采样滤波器信息可从SPS、PPS和条带段头被获得。
在操作S1370,滤波器选择器12可基于上采样滤波器信息确定上采样滤波所需的相移。相移可相应于由基本层解码器1260重建的低分辨率图像和由增强层解码器1270重建的高分辨率图像之间的上采样率所需的采样位置。滤波器选择器12可通过使用存储在滤波器数据存储单元16中的查找表来确定与相移相应的滤波器系数集,从而选择当前上采样率所需的滤波器。
在操作S1380,上采样单元16可通过使用由滤波器选择器12选择的上采样滤波器来对由基本层解码器1260产生的低分辨率重建图像执行滤波,以产生高分辨率预测图像。增强层解码器1270可将从增强层比特流获得的层间预测误差和高分辨率预测图像合并,从而产生高分辨率重建图像。
根据各种实施例的可伸缩视频解码设备1250可包括中央处理器(未示出),其中,中央处理器总体控制基本层解码器1260、增强层解码器1270、滤波器选择器12、上采样单元14和滤波器数据存储单元16。可选地,基本层解码器1260、增强层解码器1270、滤波器选择器12、上采样单元14和滤波器数据存储单元16可由它们各自的处理器(未示出)来操作,可伸缩视频解码设备1250可根据这些处理器(未示出)的交互来总体操作。可选地,基本层解码器1260、增强层解码器1270、滤波器选择器12、上采样单元14和滤波器数据存储单元16可根据可伸缩视频解码设备1250的外部处理器(未示出)的控制而被控制。
根据各种实施例的可伸缩解码设备1250可包括一个或更多个数据存储单元(未示出),其中,在所述一个或更多个数据存储单元中存储基本层解码器1260、增强层解码器1270、滤波器选择器12、上采样单元14和滤波器数据存储单元16的输入数据和输出数据。可伸缩解码设备1250可包括控制数据存储单元(未示出)的数据输入和数据输出的存储器控制单元(未示出)。
根据各种实施例的可伸缩视频解码设备1250可与内部视频编码处理器或外部视频编码处理器关联地操作,以输出视频编码结果,从而执行包括变换的视频编码操作。根据各种实施例的可伸缩视频解码设备1250的内部视频编码处理器可作为单独的处理器执行视频编码操作。可伸缩视频解码设备1250、中央处理器或图形处理器可包括视频编码处理模块,从而执行基本视频恢复操作。
参照图12a和图13a描述的根据各种实施例的可伸缩视频编码设备1200和参照图12b和图13b描述的根据各种实施例的可伸缩视频解码设备1250可选择用于层间预测的精确的上采样滤波器。
为了精确地对基本层的分辨率图像进行上采样以产生增强层的高分辨率图像的预测图像,根据可伸缩性比率(即,上采样率)的采样位置可不同,采样位置和原始像素位置之间的相移可不同。用于对预定相移的采样位置进行采样的滤波器系数可被指定。
因此,可伸缩视频编码设备1200和可伸缩视频解码设备1250存储针对相移的相应滤波器系数集,并在对基本层重建图像进行上采样时选择针对当前可伸缩比率所需的相移的滤波器系数集来执行滤波,从而确定精确的采样位置的滤波器值。因此,可根据可伸缩比率从基本层重建图像精确地产生增强层预测图像。因此,精确预测出的增强层图像可被用于更精确地执行层间预测。
现在将在下面参照图14详细地描述根据各种实施例的可伸缩视频编码设备1200的基本层编码器1210和增强层编码器1220可实现的层间预测结构。
图14是根据各种实施例的可伸缩视频编码系统1600的框图。
可伸缩视频编码系数1600可包括基本层编码端1610、增强层编码端1660以及在基本层编码端1610和增强层编码端1660之间的层间预测端1650。基本层编码端1610和增强层编码端1660可分别作为基本层编码器1210和增强层编码器1220的详细结构而被分析。
基本层编码端1610接收基本层图像序列的输入,并对基本层图像序列的每个图像进行编码。增强层编码端1660接收增强层图像序列的输入,并对增强层图像序列的每个图像进行编码。稍后将同时描述由基本层编码端1610和增强层编码端1660两者执行的冗余操作。
块划分器1618和1668将输入图像(低分辨率图像和高分辨率图像)划分为最大编码单元、编码单元、预测单元和变换单元。为了对从块划分器1618和1668输出的编码单元进行编码,可对编码单元的每个预测单元执行帧内预测或帧间预测。预测形状1648和1698可根据每个预测单元的预测模式是帧内预测模式还是帧间预测模式,通过参考从运动补偿器1640和1690输出的先前重建的图像来执行帧间预测,或者可通过使用从帧内预测器1645和1695输出的当前输入图像内的当前预测单元的邻近预测单元来执行帧内预测。可通过帧间预测针对每个预测单元产生残差信息。
针对编码单元的每个预测单元,预测单元和外围图像之间的残差信息被输入到变换器/量化器1620和1670。变换器/量化器1620和1670可针对每个变换单元执行变换和量化,并基于编码单元的变换单元输出量化后的变换系数。
缩放器/逆变换器1625和1675可再次针对编码单元的每个变换单元对量化后的系数执行缩放和逆变换,并产生空间域的残差信息。在预测开关1648和1698被控制为帧间模式的情况下,可将残差信息与先前重建的图像或邻近预测单元合并,使得可产生包括当前预测单元的重建图像,可将当前重建的图像存储在存储单元1630和1680中。根据接下来将被编码的预测单元的预测模式,当前重建图像可被再次传送到帧内预测器1645和1695以及运动补偿器1640和1690。
具体地,在帧间模式下,环路滤波器1635和1685可针对每个编码单元,对存储在存储单元1630和1680中的当前重建图像执行去块滤波和样点自适应偏移(SAO)操作中的至少一个,其中,SAO操作用于补偿原始图像和重建图像之间的编码误差。可对编码单元、包括在编码单元中的预测单元、和变换单元中的至少一个执行去块滤波和SAO操作中的至少一个。
去块滤波是用于减少数据单元的块效应的滤波。SAO操作是用于补偿通过数据编码和解码而修改的像素值的滤波。针对每个预测单元,由环路滤波器1635和1685滤波的数据可被传送到运动补偿器1640和1690。为了对从块划分器1618和1668再次输出的具有下一序列的编码单元进行编码,可产生从运动补偿器1618和1668以及块划分器1618和1668输出的当前重建图像和下一编码单元之间的残差信息。
可按照上述的相同方式重复地执行对输入图像的每个编码单元的上述编码操作。
增强层编码端1660可参考存储在基本层编码端1610的存储单元1630中的用于层间预测的重建图像。基本层编码端1610的编码控制单元1615可控制基本层编码端1610的存储单元1630,并将基本层编码端1610的重建图像传送给增强层编码端1660。传送的基本层重建图像可被用作增强层预测图像。
在基本层图像和增强层图像具有不同的分辨率的情况下,图像上采样设备1655可对基本层重建图像进行上采样并将其传送给增强层编码端1660。因此,上采样后的基本层重建图像可被用作增强层预测图像。图像上采样设备1655可与参照图1至图13b描述的图像上采样设备10相应。
在增强层编码端1660的编码控制单元1665通过控制开关1698执行层间预测的情况下,可通过参考通过层间预测端1650传送的基本层重建图像来预测层图像。
对于图像编码,可针对编码单元、预测单元和变换单元设置不同的编码模式。例如,深度或划分标记可被设置为编码单元的编码模式。预测模式、分区类型、帧内方向标记、参考列表标记可被设置为预测单元的编码模式。变换深度或划分标记可被设置为变换单元的编码模式。
基本层编码端1610可根据通过对编码单元应用不同深度,对预测单元应用不同预测模式、不同分区类型、不同帧内方向、不同参考列表,对变换单元应用不同变换深度执行编码而获得的结果,确定具有最高编码效率的编码深度、预测模式、分区类型、帧内方向、参考列表以及变换深度。然而,示例性实施例不限于由基本层编码端1610确定的上述编码模式。
基本层编码端1610的编码控制单元1615可控制不同的编码模式适当地应用到元件的操作。为了增强层编码端1660的层间编码,编码控制单元1615可控制增强层编码端1660通过参考基本层编码端1610的编码结果来确定编码模式或残差信息。
例如,增强层编码端1660可将基本层编码端1610的编码模式用作增强层图像的编码模式,或可通过参考基本层编码端1610的编码模式来确定增强层图像的编码模式。基本层编码端1610的编码控制单元1615可控制基本层编码端1610的编码控制单元1615的控制信号,为了确定增强层编码端1660的当前编码模式,可使用基于基本层编码端1610的编码模式的当前编码模式。
具体地,根据实施例的增强层编码端1660可通过使用SAO参数对层间预测误差进行编码。因此,从基本层重建图像确定的增强层预测图像和增强层重建图像之间的预测误差可被确定为SAO参数的偏移。
与根据图14的层间预测方法的可伸缩视频编码系统1600相似,根据层间预测方法的可伸缩视频解码系统也可被实现。也就是说,可伸缩视频解码系统可接收基本层比特流和增强层比特流。可伸缩视频解码系统的基本层解码端可对基本层比特流进行解码以产生基本层重建图像。可伸缩视频解码系统的增强层解码端可通过使用基本层重建图像和解析的编码信息对增强层比特流进行解码,以产生增强层重建图像。
如果根据各种实施例的可伸缩视频解码设备1200的编码器12执行层间预测,则可伸缩视频解码设备1250的解码器26还可根据上述可伸缩视频解码系统重建多层图像。
如上所述,在根据实施例的可伸缩视频编码设备1200和根据实施例的可伸缩视频解码设备1250中,通过对视频数据进行划分而获得的块被划分为根据树结构的编码单元,并且编码单元、预测单元和变换单元被用于对编码单元进行层间预测或帧间预测。下面,参考图15a至图25,将描述基于根据树结构的编码单元和变换单元对视频进行编码的方法和设备以及对视频进行解码的方法和设备。
原则上,在对多层视频进行编码/解码期间,单独地执行对基本层图像的编码/解码处理和对增强层图像的编码/解码处理。也就是说,当对多层视频执行层间预测时,单层视频的编码/解码结果被彼此参考,而对各个单层视频执行单独的编码/解码处理。
为了便于描述,由于将参照图15a至图25描述的基于根据树结构的编码单元的视频编码处理和视频解码处理是对单层视频执行的,因此将仅描述帧间预测和运动补偿。然而,如参照图12至图14描述的,基本层图像和增强层图像之间的层间预测和补偿被执行以对视频流进行编码/解码。
当可伸缩视频编码设备1200的编码器12基于根据树结构的编码单元对多层视频进行编码时,为了对每个各单视点视频的视频进行编码,可伸缩视频编码设备1200包括与多层视频的层数一样多的图8的视频编码设备100来对视频进行编码,从而每个视频编码设备100可被控制为对分配的单层视频进行编码。另外,可伸缩视频编码设备1200可通过使用每个视频编码设备100的各单视点的编码结果来执行视点间预测。因此,可伸缩视频编码设备1200的编码器12可针对每个各层产生记录了各个层的编码结果的基本层视频流和增强层视频。
类似地,当根据实施例的可伸缩视频解码设备1250的解码器26基于根据树结构的编码单元对多层视频进行解码,以针对每个各层对接收到的基本层视频流和增强层视频流进行解码,可伸缩视频解码设备1250可包括与多视点视频的层数一样多的图9的视频解码设备200,并且视频解码设备200可被控制为对分别分配给视频解码设备200的单层视频执行解码。另外,可伸缩视频解码设备1250可通过使用每个视频解码设备200的各单层的解码结果来执行视点间补偿。因此,可伸缩视频解码设备1250的解码器26可产生针对各层恢复的基本层图像和增强层图像。
图15a是根据各种实施例的基于具有树结构的编码单元的视频编码设备100的框图。
通过基于根据树结构的编码单元执行视频预测的视频编码设备100包括编码确定器120和输出单元130。在下文中,为了方便描述,将使用基于根据树结构的编码单元的视频预测的视频编码设备100称为“视频编码设备100”。
编码确定器120可基于当前画面的最大编码单元来对当前画面进行划分。如果当前画面大于最大编码单元,则可将当前画面的图像数据划分为至少一个最大编码单元。根据示例性实施例的最大编码单元可以是尺寸为32×32、64×64、128×128、256×256等的数据单元,其中,数据单元的形状是宽度和长度为2的若干次方的正方形。
根据示例性实施例的编码单元可由最大尺寸和深度表征。深度表示编码单元从最大编码单元空间被划分的次数,并且随着深度加深,根据深度的较深层编码单元可从最大编码单元被划分到最小编码单元。最大编码单元的深度为最高深度,最小编码单元的深度为最低深度。由于随着最大编码单元的深度加深,与每个深度相应的编码单元的尺寸减小,因此与更高深度相应的编码单元可包括多个与更低深度相应的编码单元。
如上所述,当前画面的图像数据根据编码单元的最大尺寸被划分为最大编码单元,并且每个最大编码单元可包括根据深度被划分的较深层编码单元。由于根据深度对根据示例性实施例的最大编码单元进行划分,因此可根据深度对包括在最大编码单元中的空间域的图像数据进行分层地分类。
可预先确定编码单元的最大深度和最大尺寸,所述最大深度和最大尺寸限制对最大编码单元的高度和宽度进行分层划分的总次数。
编码单元确定器120对通过根据深度对最大编码单元的区域进行划分而获得的至少一个划分区域进行编码,并且根据所述至少一个划分区域来确定用于输出最终编码的图像数据的深度。换句话说,编码单元确定器120通过根据当前画面的最大编码单元以根据深度的较深层编码单元对图像数据进行编码,选择具有最小编码误差的深度,来确定编码深度。因此,最终输出与确定的编码深度相应的编码单元的编码图像数据。此外,与编码深度相应的编码单元可被视为被编码的编码单元。确定的编码深度和根据确定的编码深度的被编码的图像数据被输出到输出单元130。
基于与等于或低于最大深度的至少一个深度相应的较深层编码单元,对最大编码单元中的图像数据进行编码,并且基于每个较深层编码单元比较对图像数据进行编码的结果。在对与较深层编码单元的编码误差进行比较之后,可选择具有最小编码误差的深度。可针对每个最大编码单元选择至少一个编码深度。
随着编码单元根据深度而被分层地划分并且编码单元的数量增加,最大编码单元的尺寸被划分。另外,即使在一个最大编码单元中编码单元与同一深度相应,也通过分别测量每个编码单元的图像数据的编码误差来确定是否将与同一深度相应的每个编码单元划分为更低深度。因此,即使图像数据被包括在一个最大编码单元中,在一个最大编码单元中图像数据被划分为根据深度的区域,并且编码误差根据区域而不同,因此在图像数据中编码深度可根据区域而不同。因此,可在一个最大编码单元中确定一个或更多个编码深度,并且可根据至少一个编码深度的编码单元来对最大编码单元的图像数据进行划分。
因此,编码单元确定器120可确定包括在最大编码单元中的具有树结构的编码单元。根据示例性实施例的“具有树结构的编码单元”包括在最大编码单元中包括的所有较深层编码单元中的与确定为编码深度的深度相应的编码单元。可根据最大编码单元的相同区域中的深度来分层地确定编码深度的编码单元,并可在不同区域中独立地确定编码深度的编码单元。类似地,可从另一区域的编码深度独立地确定当前区域中的编码深度。
根据示例性实施例的最大深度是与从最大编码单元到最小编码单元执行划分的次数有关的索引。根据示例性实施例的最大深度可表示从最大编码单元到最小编码单元的总划分次数。例如,当最大编码单元的深度是0时,对最大编码单元划分一次的编码单元的深度可被设置为1,对最大编码单元划分两次的编码单元的深度可被设置为2。这里,如果最小编码单元是对最大编码单元划分四次的编码单元,则存在深度0、1、2、3和4的5个深度等级,并因此最大深度可被设置为4。
可根据最大编码单元执行预测编码和变换。还根据最大编码单元,基于根据等于或小于最大深度的深度的较深层编码单元来执行预测编码和变换。可根据正交变换或整数变换的方法来执行变换。
由于每当根据深度对最大编码单元进行划分时,较深层编码单元的数量增加,因此对随着深度加深而产生的所有较深层编码单元执行包括预测编码和变换的编码。为了便于描述,在最大编码单元中,现在将基于当前深度的编码单元来描述预测编码和变换。
视频编码设备100可不同地选择用于对图像数据进行编码的数据单元的尺寸或形状。为了对图像数据进行编码,执行诸如预测编码、变换和熵编码的操作,此时,可针对所有操作使用相同的数据单元,或者可针对每个操作使用不同的数据单元。
例如,视频编码设备100不仅可选择用于对图像数据进行编码的编码单元,还可选择不同于编码单元的数据单元,以便对编码单元中的图像数据执行预测编码。
为了对最大编码单元执行预测编码,可基于与编码深度相应的编码单元(即,基于不再被划分成与更低深度相应的编码单元的编码单元)来执行预测编码。以下,不再被划分且成为用于预测编码的基本单元的编码单元现在将被称为“预测单元”。通过划分预测单元获得的分区可包括预测单元或通过对预测单元的高度和宽度中的至少一个进行划分而获得的数据单元。分区是通过对编码单元的预测单元进行划分而获得的数据单元,预测单元可以是具有与编码单元相同的尺寸的分区。
例如,当2N×2N(其中,N是正整数)的编码单元不再被划分,并且成为2N×2N的预测单元时,分区的尺寸可以是2N×2N、2N×N、N×2N或N×N。分区类型的示例包括通过对预测单元的高度或宽度进行对称地划分而获得的对称分区、通过对预测单元的高度或宽度进行非对称地划分(诸如,1:n或n:1)而获得的分区、通过对预测单元进行几何地划分而获得的分区、以及具有任意形状的分区。
预测单元的预测模式可以是帧内模式、帧间模式和跳过模式中的至少一个。例如,可对2N×2N、2N×N、N×2N或N×N的分区执行帧内模式或帧间模式。另外,可仅对2N×2N的分区执行跳过模式。可对编码单元中的一个预测单元独立地执行编码,从而选择具有最小编码误差的预测模式。
视频编码设备100不仅可基于用于对图像数据进行编码的编码单元还可基于与编码单元不同的变换单元,来对编码单元中的图像数据执行变换。为了对编码单元执行变换,可基于具有小于或等于编码单元的尺寸的数据单元,来执行变换。例如,用于变换的变换单元可包括帧内模式的变换单元和帧间模式的数据单元。
与根据本实施例的根据树结构的编码单元类似,编码单元中的变换单元可被递归地划分为更小尺寸的区域,可基于根据变换深度的具有树结构的变换,对编码单元中的残差数据进行划分。
根据示例性实施例,通过对编码单元的高度和宽度进行划分来获得编码单元的变换单元,并且还可在变换单元中设置指示划分次数的变换深度。例如,当当前编码单元的变换单元的尺寸是2N×2N时,变换深度可被设置为0。当变换单元的尺寸是N×N时,变换深度可被设置为1。另外,当变换单元的尺寸是N/2×N/2时,变换深度可被设置为2。也就是说,还可根据变换深度设置根据树结构的变换单元。
根据与编码深度相应的编码单元的编码信息不仅需要关于编码深度的信息,还需要关于与预测编码和变换相关的信息的信息。因此,编码单元确定器120不仅确定具有最小编码误差的编码深度,还确定预测单元中的分区类型、根据预测单元的预测模式和用于变换的变换单元的尺寸。
稍后将参照图10至图25详细描述根据示例性实施例的最大编码单元中的根据树结构的编码单元和预测单元/分区,以及确定变换单元的方法。
编码单元确定器120可通过使用基于拉格朗日乘数的率失真优化,来测量根据深度的较深层编码单元的编码误差。
输出单元130在比特流中输出最大编码单元的图像数据和关于根据编码深度的编码模式的信息,其中,所述最大编码单元的图像数据基于由编码单元确定器120确定的至少一个编码深度被编码。
可通过对图像的残差数据进行编码来获得编码图像数据。
关于根据编码深度的编码模式的信息可包括关于编码深度的信息、关于在预测单元中的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。
可通过使用根据深度的划分信息来定义关于编码深度的信息,其中,根据深度的划分信息指示是否对更低深度而不是当前深度的编码单元执行编码。如果当前编码单元的当前深度是编码深度,则对当前编码单元中的图像数据进行编码并输出,因此可定义划分信息以不将当前编码单元划分到更低深度。可选地,如果当前编码单元的当前深度不是编码深度,则对更低深度的编码单元执行编码,并因此可定义划分信息以对当前编码单元进行划分来获得更低深度的编码单元。
如果当前深度不是编码深度,则对被划分到更低深度的编码单元的编码单元执行编码。由于更低深度的至少一个编码单元存在于当前深度的一个编码单元中,因此对更低深度的每个编码单元重复执行编码,并因此可对具有相同深度的编码单元递归地执行编码。
由于针对一个最大编码单元确定具有树结构的编码单元,并且针对编码深度的编码单元确定关于至少一个编码模式的信息,所以可针对一个最大编码单元确定关于至少一个编码模式的信息。另外,由于根据深度对图像数据进行分层划分,因此最大编码单元的图像数据的编码深度可根据位置而不同,因此可针对图像数据设置关于编码深度和编码模式的信息。
因此,输出单元130可将关于相应的编码深度和编码模式的编码信息分配给包括在最大编码单元中的编码单元、预测单元和最小单元中的至少一个。
根据示例性实施例的最小单元是通过将构成最低深度的最小编码单元划分为4份而获得的矩形数据单元。可选择地,最小单元可以是包括在最大编码单元中所包括的所有编码单元、预测单元、分区单元和变换单元中的具有最大尺寸的最大矩形数据单元。
例如,通过输出单元130输出的编码信息可被分类为根据编码单元的编码信息和根据预测单元的编码信息。根据编码单元的编码信息可包括关于预测模式的信息和关于分区尺寸的信息。根据预测单元的编码信息可包括关于帧间模式的估计方向的信息、关于帧间模式的参考图像索引的信息、关于运动矢量的信息、关于帧内模式的色度分量的信息、以及关于帧内模式的插值方法的信息。
此外,根据画面、条带或GOP定义的关于编码单元的最大尺寸的信息和关于最大深度的信息可被插入到比特流的头、序列参数集(SPS)或画面参数集(PPS)。
另外,还可经由比特流的头、SPS或PPS输出当前视频中可用的关于变换单元的最大尺寸的信息和关于变换的最小尺寸的信息。输出单元130可对与预测有关的参考信息、预测信息、关于条带类型的信息进行编码,并输出这些信息。
在视频编码设备100中,较深层编码单元可以是通过将更高深度的编码单元(比当前深度高高一层)的高度或宽度划分成两份而获得的编码单元。换言之,当当前深度的编码单元的尺寸是2N×2N时,更低深度的编码单元的尺寸是N×N。另外,尺寸为2N×2N的当前深度的编码单元可包括最多4个更低深度的编码单元。
因此,视频编码设备100可基于考虑当前画面的特征而确定的最大编码单元的尺寸和最大深度,通过针对每个最大编码单元确定具有最优形状和最优尺寸的编码单元来形成具有树结构的编码单元。另外,由于可通过使用各种预测模式和变换中的任意一个对每个最大编码单元执行编码,因此可考虑各种图像尺寸的编码单元的特征来确定最优编码模式。
因此,如果以传统宏块对具有高分辨率或大数据量的图像进行编码,则每个画面的宏块的数量极度增加。因此,针对每个宏块产生的压缩信息的条数增加,因此难以发送压缩的信息,并且数据压缩效率降低。然而,通过使用视频编码设备100,由于考虑图像的尺寸,在增加编码单元的最大尺寸的同时,基于图像的特征来调整编码单元,因此可增加图像压缩效率。
参照图12a描述的可伸缩视频编码设备1200可包括与层数一样多的视频编码设备100,以对多层视频的各层的单层图像进行编码。例如,基本层编码器12可包括单个视频编码设备100,增强层编码器14可包括与附加视点的数量一样多的视频编码设备100。
当视频编码设备100对基本层图像进行编码时,编码确定器120可针对每个最大编码单元确定用于对每个各根据树结构的编码单元进行帧间预测的预测单元,并可对每个各预测单元执行帧间预测。
当视频编码设备100对增强层图像进行编码时,编码确定器120还可针对每个最大编码单元确定预测单元和根据树结构的编码单元,并可对每个各预测单元执行帧间预测。
视频编码设备100可对用于通过使用SAO对增强层图像进行预测的层间预测误差进行编码。因此,可基于预测误差的样值分布,通过使用关于SAO类型和偏移的信息对增强层图像的预测误差进行编码,而不必对每个像素位置的预测误差进行编码。
图15b是根据各种实施例的基于根据树结构的编码单元的视频解码设备200的框图。
基于根据树结构的编码单元的视频解码设备200包括接收器210、接收提取器220和解码器230。在下文中,为了便于描述,使用基于根据树结构的编码单元的视频预测的视频解码设备200将被称为“视频解码设备200”。
用于视频解码设备200的解码操作的各种术语(诸如编码单元、深度、预测单元、变换单元和关于各种编码模式的信息)的定义与参照图8和视频编码设备100描述的定义相同。
接收器210接收和解析编码视频的比特流。图像数据和编码信息提取器220从解析的比特流,针对每个编码单元提取编码图像数据,并将提取的图像数据输出到图像数据解码器230,其中,编码单元具有根据每个最大编码单元的树结构。图像数据和编码信息提取器220可从关于当前画面的头、SPS或PPS提取关于当前画面的编码单元的最大尺寸的信息。
另外,图像数据和编码信息提取器220从解析的比特流,根据每个最大编码单元,提取关于具有树结构的编码单元的编码深度和编码模式的信息。提取的关于编码深度和编码模式的信息被输出到图像数据解码器230。换言之,比特流中的图像数据被划分为最大编码单元,使得图像数据解码器230针对每个最大编码单元对图像数据进行解码。
可针对关于与编码深度相应的至少一个编码深度的信息设置关于根据最大编码单元的编码深度和编码模式的信息,关于编码模式的信息可包括关于与编码深度相应的相应编码单元的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。另外,根据深度的划分信息可被提取为关于编码深度的信息。
关于由图像数据和编码信息提取器220提取的根据每个最大编码单元的编码深度和编码模式的信息是关于这样的编码深度和编码模式的信息:该编码深度和编码模式在编码器(诸如,视频编码设备100)根据每个最大编码单元对根据深度的每个较深层编码单元重复地执行编码时被确定为产生最小编码误差。因此,视频解码设备200可通过根据产生最小编码误差的编码深度和编码模式对图像数据进行解码来恢复图像。
由于关于编码深度和编码模式的编码信息可被分配给相应的编码单元、预测单元和最小单元中的预定数据单元,因此图像数据和编码信息提取器220可根据预定数据单元,提取关于编码深度和编码模式的信息。可将被分配了相同的关于编码深度和编码模式的信息的预定数据单元推断为是包括在同一最大编码单元中的数据单元。
图像数据解码器230基于关于根据最大编码单元的编码深度和编码模式的信息,通过对每个最大编码单元中的图像数据进行解码,来恢复当前画面。换言之,图像数据解码器230可基于提取出的关于包括在每个最大编码单元中的具有树结构的编码单元之中的每个编码单元的分区类型、预测模式和变换单元的信息,对编码的图像数据进行解码。解码处理可包括预测(包含帧内预测和运动补偿)和逆变换。可根据逆正交变换或逆整数变换的方法来执行逆变换。
图像数据解码器230可基于关于根据编码深度的编码单元的预测单元的分区类型和预测模式的信息,根据每个编码单元的分区和预测模式,执行帧内预测或运动补偿。
另外,针对每个最大编码单元,图像数据解码器230可读取每个编码单元的根据树结构的变换单元信息,从而确定每个编码单元的变换单元,并基于每个编码单元的变换单元执行逆变换。通过逆变换,可恢复编码单元的空间域的像素值。
图像数据解码器230可通过使用根据深度的划分信息来确定当前最大编码单元的至少一个编码深度。如果划分信息指示图像数据在当前深度中不再被划分,则当前深度是编码深度。因此,图像数据解码器230可通过使用关于与编码深度相应的每个编码单元的预测单元的分区类型、预测模式和变换单元的尺寸的信息,对当前最大编码单元中的与每个编码深度相应的至少一个编码单元的编码数据进行解码,并输出当前最大编码单元的图像数据。
换言之,可通过观察分配给编码单元、预测单元和最小单元中的预定数据单元的编码信息集来收集包含包括相同划分信息的编码信息的数据单元,并且收集的数据单元可被认为是将由图像数据解码器230以相同编码模式进行解码的一个数据单元。针对如上所述确定的每个编码单元,可获得关于编码模式的信息以对当前编码单元进行解码。
参照图12b描述的可伸缩视频解码设备1250可包括与视点数量一样多的视频解码设备200,以对接收到的基本层图像流和增强层图像流进行解码以恢复基本层图像和增强层图像。
当基本层图像流被接收到时,视频解码设备200的图像数据解码器230可将由提取器220从基本视点图像流提取的基本视点图像的样点划分为最大编码单元的根据树结构的编码单元。图像数据解码器230可对各预测单元执行运动补偿,以对基本视点图像的样点的每个各根据树结构的编码单元进行帧间预测,从而恢复基本视点图像。
当增强层图像流被接收到时,视频解码设备200的图像数据解码器230将由提取器从附加层图像流提取的附加视点图像的样点划分为最大编码单元的根据树结构的编码单元。图像数据解码器230可对各预测单元执行运动补偿,以对附加视点图像的样点进行帧间预测,从而恢复附加视点图像。
接收提取器220可从接收到的增强层比特流获得SAO类型(type)和偏移,并根据增强层预测图像的每个像素的样值的分布来确定SAO种类(category),从而通过使用SAO类型和偏移来获得针对每个SAO种类的偏移。因此,解码器230可在不需要接收每个像素的预测误差的情况下来对增强层预测图像的每个像素补偿相应种类的偏移,并可通过参考补偿后的增强层预测图像来确定增强层重建图像。
视频解码设备200可获得关于当针对每个最大编码单元递归地执行编码时产生最小编码误差的至少一个编码单元的信息,并且可使用所述信息来对当前画面进行解码。换言之,被确定为最大编码单元中的最优编码单元的具有树结构的编码单元可被解码。此外,考虑图像数据的分辨率和图像数据量来确定编码单元的最大尺寸。
因此,即使图像数据具有高分辨率和大数据量,也可通过使用编码单元的尺寸和编码模式,对图像数据进行有效地解码和恢复,其中,通过使用从编码器接收到的关于最优编码模式的信息,根据图像数据的特征自适应地确定所述编码单元的尺寸和编码模式。
图16是用于描述根据示例性实施例的编码单元的概念的示图。
编码单元的尺寸可被表示为宽度×高度,并可以是64×64、32×32、16×16和8×8。64×64的编码单元可被划分为64×64、64×32、32×64或32×32的分区,32×32的编码单元可被划分为32×32、32×16、16×32或16×16的分区,16×16的编码单元可被划分为16×16、16×8、8×16或8×8的分区,8×8的编码单元可被划分为8×8、8×4、4×8或4×4的分区。
在视频数据310中,分辨率是1920×1080,编码单元的最大尺寸是64,最大深度是2。在视频数据320中,分辨率是1920×1080,编码单元的最大尺寸是64,最大深度是3。在视频数据330中,分辨率是352×288,编码单元的最大尺寸是16,最大深度是1。图16中示出的最大深度表示从最大编码单元到最小编码单元的划分总次数。
如果分辨率高或数据量大,则编码单元的最大尺寸可能较大,从而不仅提高编码效率,而且准确地反映图像的特征。因此,具有比视频数据330更高分辨率的视频数据310和320的编码单元的最大尺寸可以是64。
由于视频数据310的最大深度是2,因此由于通过对最大编码单元划分两次,深度加深至两层,因此视频数据310的编码单元315可包括长轴尺寸为64的最大编码单元和长轴尺寸为32和16的编码单元。同时,由于视频数据330的最大深度是1,因此由于通过对最大编码单元划分一次,深度加深至一层,因此视频数据330的编码单元335可包括长轴尺寸为16的最大编码单元和长轴尺寸为8的编码单元。
由于视频数据320的最大深度是3,因此由于通过对最大编码单元划分三次,深度加深至3层,因此视频数据320的编码单元325可包括长轴尺寸为64的最大编码单元和长轴尺寸为32、16和8的编码单元。随着深度加深,详细信息可被精确地表示。
图17a是根据示例性实施例的基于编码单元的图像编码器400的框图。
图像编码器400执行视频编码设备100的编码单元确定器120的操作来对图像数据进行编码。换言之,帧内预测器410对当前帧405中的帧内模式下的编码单元执行帧内预测,运动估计器420和运动补偿器425通过使用当前帧405和参考帧495,对当前帧405中的帧间模式下的编码单元执行帧间预测和运动补偿。
从帧内预测器410、运动估计器420和运动补偿器425输出的数据通过变换器430和量化器440被输出为量化后的变换系数。量化后的变换系数通过反量化器460和逆变换器470被恢复为空间域中的数据,恢复的空间域中的数据在通过去块单元480和偏移补偿单元490后处理之后被输出为参考帧495。量化后的变换系数可通过熵编码器450被输出为比特流455。
为了将图像编码器400应用到视频编码设备100中,图像编码器400的所有元件(即,帧内预测器410、运动估计器420、运动补偿器425、变换器430、量化器440、熵编码器450、反量化器460、逆变换器470、去块单元480和偏移补偿单元490)在考虑每个最大编码单元的最大深度的同时,基于具有树结构的编码单元中的每个编码单元执行操作。
具体地,帧内预测器410、运动估计器420和运动补偿器425在考虑当前最大编码单元的最大尺寸和最大深度的同时,确定具有树结构的编码单元中的每个编码单元的分区和预测模式,变换器430确定具有树结构的编码单元中的每个编码单元中的变换单元的尺寸。
图17b是根据示例性实施例的基于编码单元的图像解码器500的框图。
解析器510从比特流505解析将被解码的编码图像数据和解码所需的关于编码的信息。编码图像数据通过熵解码器520和反量化器530被输出为反量化的数据,反量化的数据通过逆变换器540被恢复为空间域中的图像数据。
针对空间域中的图像数据,帧内预测器550对帧内模式下的编码单元执行帧内预测,运动补偿器560通过使用参考帧585对帧间模式下的编码单元执行运动补偿。
通过帧内预测器550和运动补偿器560的空间域中的图像数据可在通过去块单元570和偏移补偿单元580后处理之后被输出为恢复帧595。另外,通过去块单元570和偏移补偿单元580后处理的图像数据可被输出为参考帧585。
为了在视频解码设备200的图像数据解码器230中对图像数据进行解码,图像解码器500可执行在解析器510执行操作之后执行的操作。
为了将图像解码器500应用到视频解码设备200中,图像解码器500的所有元件(即,解析器510、熵解码器520、反量化器530、逆变换器540、帧内预测器550、运动补偿器560、去块单元570和偏移补偿单元580)针对每个最大编码单元,基于具有树结构的编码单元执行操作。
具体地,帧内预测器550和运动补偿器560基于具有树结构的每个编码单元的分区和预测模式来执行操作,逆变换器540基于每个编码单元的变换单元的尺寸来执行操作。
图17a的编码操作和图17b的解码操作分别详细地描述了单层的视频流编码操作和视频流解码操作。因此,如果图12a的可伸缩视频编码设备1200对两层或更多层的视频流进行编码,则图像编码器400可针对每层被设置。类似地,如果图12b的可伸缩视频解码设备1250对两层或更多层的视频流进行解码,则图像解码器500可针对每层被设置。
图18是示出根据示例性实施例的根据深度的较深层编码单元以及分区的示图。
视频编码设备100和视频解码设备200使用分层编码单元以考虑图像的特征。可根据图像的特征自适应地确定编码单元的最大高度、最大宽度和最大深度,或可由用户不同地设置编码单元的最大高度、最大宽度和最大深度。可根据编码单元的预定最大尺寸来确定根据深度的较深层编码单元的尺寸。
在根据实施例的编码单元的分层结构600中,编码单元的最大高度和最大宽度均是64,最大深度是4。在这种情况下,最大深度表示编码单元从最大编码单元被划分到最小编码单元的总次数。由于沿着分层结构600的垂直轴深度加深,因此较深层编码单元的高度和宽度均被划分。另外,预测单元和分区沿着分层结构600的水平轴被示出,其中,所述预测单元和分区是对每个较深层编码单元进行预测编码的基础。
换言之,在分层结构600中,编码单元610是最大编码单元,其中,深度为0,尺寸(即,高度乘宽度)为64×64。随着深度沿着垂直轴加深,存在尺寸为32×32和深度为1的编码单元620、尺寸为16×16和深度为2的编码单元630、尺寸为8×8和深度为3的编码单元640。尺寸为8×8和深度为3的编码单元640是最小编码单元。
编码单元的预测单元和分区根据每个深度沿着水平轴被排列。换言之,如果尺寸为64×64和深度为0的编码单元610是预测单元,则可将预测单元划分成包括在编码单元610中的分区,即,尺寸为64×64的分区610、尺寸为64×32的分区612、尺寸为32×64的分区614或尺寸为32×32的分区616。
类似地,可将尺寸为32×32和深度为1的编码单元620的预测单元划分成包括在编码单元620中的分区,即,尺寸为32×32的分区620、尺寸为32×16的分区622、尺寸为16×32的分区624和尺寸为16×16的分区626。
类似地,可将尺寸为16×16和深度为2的编码单元630的预测单元划分成包括在编码单元630中的分区,即,包括在编码度单元630中的尺寸为16×16的分区630、尺寸为16×8的分区632、尺寸为8×16的分区634和尺寸为8×8的分区636。
类似地,可将尺寸为8×8和深度为3的编码单元640的预测单元划分成包括在编码单元640中的分区,即,包括在编码单元640中的尺寸为8×8的分区、尺寸为8×4的分区642、尺寸为4×8的分区644和尺寸为4×4的分区646。
为了确定构成最大编码单元610的编码单元的至少一个编码深度,视频编码设备100的编码单元确定器120对包括在最大编码单元610中的与每个深度相应的编码单元执行编码。
随着深度加深,包括具有相同范围和相同尺寸的数据的根据深度的较深层编码单元的数量增加。例如,需要四个与深度2相应的编码单元来覆盖包括在与深度1相应的一个编码单元中的数据。因此,为了根据深度比较对相同数据进行编码的结果,与深度1相应的编码单元和四个与深度2相应的编码单元均被编码。
为了针对深度之中的当前深度执行编码,可沿着分层结构600的水平轴,通过对与当前深度相应的编码单元中的每个预测单元执行编码,来将针对当前深度选择最小编码误差。可选地,随着深度沿着分层结构600的垂直轴加深,可通过针对每个深度执行编码,比较根据深度的最小编码误差,来搜索最小编码误差。在编码单元610中的具有最小编码误差的深度和分区可被选为编码单元610的编码深度和分区类型。
图19是用于描述根据示例性实施例的在编码单元710和变换单元720之间的关系的示图。
视频编码设备100或视频解码设备200针对每个最大编码单元,根据具有小于或等于最大编码单元的尺寸的编码单元,对图像进行编码或解码。可基于不大于相应的编码单元的数据单元,来选择用于在编码期间进行变换的变换单元的尺寸。
例如,在视频编码设备100或视频解码设备200中,如果编码单元710的尺寸是64×64,则可通过使用尺寸为32×32的变换单元720来执行变换。
此外,可通过对小于64×64的尺寸为32×32、16×16、8×8和4×4的每个变换单元执行变换,来对尺寸为64×64的编码单元710的数据进行编码,然后可选择具有最小编码误差的变换单元。
图20是用于描述根据示例性实施例的与编码深度相应的编码单元的编码信息的示图。
视频编码设备100的输出单元130可对与编码深度相应的每个编码单元的关于分区类型的信息800、关于预测模式的信息810以及关于变换单元尺寸的信息820进行编码,并将信息800、信息810和信息820作为关于编码模式的信息来发送。
信息800指示关于通过划分当前编码单元的预测单元而获得的分区的形状的信息,其中,所述分区是用于对当前编码单元进行预测编码的数据单元。例如,可将尺寸为2N×2N的当前编码单元CU_0划分成以下分区中的任意一个:尺寸为2N×2N的分区802、尺寸为2N×N的分区804、尺寸为N×2N的分区806以及尺寸为N×N的分区808。这里,关于分区类型的信息800被设置来指示尺寸为2N×N的分区804、尺寸为N×2N的分区806以及尺寸为N×N的分区808中的一个。
信息810指示每个分区的预测模式。例如,信息810可指示对由信息800指示的分区执行的预测编码的模式,即,帧内模式812、帧间模式814或跳过模式816。
信息820指示当对当前编码单元执行变换时所基于的变换单元。例如,变换单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826或第二帧内变换单元828。
视频解码设备200的图像数据和编码信息提取器220可根据每个较深层编码单元,提取并使用用于解码的信息800、810和820。
图21是根据示例性实施例的根据深度的较深层编码单元的示图。
划分信息可用来指示深度的改变。划分信息指示当前深度的编码单元是否被划分成更低深度的编码单元。
用于对深度为0和尺寸为2N_0×2N_0的编码单元900进行预测编码的预测单元910可包括以下分区类型的分区:尺寸为2N_0×2N_0的分区类型912、尺寸为2N_0×N_0的分区类型914、尺寸为N_0×2N_0的分区类型916和尺寸为N_0×N_0的分区类型918。图9仅示出了通过对称地划分预测单元910而获得的分区类型912至918,但是分区类型不限于此,并且预测单元910的分区可包括非对称分区、具有预定形状的分区和具有几何形状的分区。
根据每种分区类型,对尺寸为2N_0×2N_0的一个分区、尺寸为2N_0×N_0的两个分区、尺寸为N_0×2N_0的两个分区和尺寸为N_0×N_0的四个分区重复地执行预测编码。可对尺寸为2N_0×2N_0、N_0×2N_0、2N_0×N_0和N_0×N_0的分区执行帧内模式和帧间模式下的预测编码。可仅对尺寸为2N_0×2N_0的分区执行跳过模式下的预测编码。
对在分区类型912至918中进行包括预测编码的编码的误差进行比较,并从分区类型中确定最小编码误差。如果在分区类型912至916中的一个分区类型中编码误差最小,则可不将预测单元910划分到更低深度。
如果在分区类型918中编码误差最小,则深度从0改变到1以在操作920中划分分区类型918,并对深度为2和尺寸为N_0×N_0的编码单元930重复地执行编码来搜索最小编码误差。
用于对深度为1和尺寸为2N_1×2N_1(=N_0×N_0)的编码单元930进行预测编码的预测单元940可包括以下分区类型的分区:尺寸为2N_1×2N_1的分区类型942、尺寸为2N_1×N_1的分区类型944、尺寸为N_1×2N_1的分区类型946以及尺寸为N_1×N_1的分区类型948。
如果在分区类型948中编码误差最小,则深度从1改变到2以在操作950中划分分区类型948,并对深度为2和尺寸为N_2×N_2的编码单元960重复执行编码来搜索最小编码误差。
当最大深度是d时,根据每个深度的划分操作可被执行直到深度变成d-1,并且划分信息可被编码直到深度是0到d-2中的一个。换句话说,当编码被执行直到在与d-2的深度相应的编码单元在操作970中被划分之后深度是d-1时,用于对深度为d-1和尺寸为2N_(d-1)×2N_(d-1)的编码单元980进行预测编码的预测单元990可包括以下分区类型的分区:尺寸为2N_(d-1)×2N(d-1)的分区类型992、尺寸为2N_(d-1)×N(d-1)的分区类型994、尺寸为N_(d-1)×2N(d-1)的分区类型996和尺寸为N_(d-1)×N(d-1)的分区类型998。
可对分区类型992至998中的尺寸为2N_(d-1)×2N_(d-1)的一个分区、尺寸为2N_(d-1)×N_(d-1)的两个分区、尺寸为N_(d-1)×2N_(d-1)的两个分区、尺寸为N_(d-1)×N_(d-1)的四个分区重复地执行预测编码,以搜索具有最小编码误差的分区类型。
即使当分区类型998具有最小编码误差时,由于最大深度是d,因此深度为d-1的编码单元CU_(d-1)也不再被划分到更低深度,构成当前最大编码单元900的编码单元的编码深度被确定为d-1,并且当前最大编码单元900的分区类型可被确定为N_(d-1)×N(d-1)。此外,由于最大深度是d,并且具有最低深度d-1的最小编码单元980不再被划分到更低深度,因此不设置最小编码单元980的划分信息。
数据单元999可以是用于当前最大编码单元的“最小单元”。根据示例性实施例的最小单元可以是通过将最小编码单元980划分成4份而获得的矩形数据单元。通过重复地执行编码,视频编码设备100可通过比较根据编码单元900的深度的编码误差来选择具有最小编码误差的深度以确定编码深度,并将相应分区类型和预测模式设置为编码深度的编码模式。
这样,在所有深度1至d中对根据深度的最小编码误差进行比较,并且具有最小编码误差的深度可被确定为编码深度。编码深度、预测单元的分区类型和预测模式可作为关于编码模式的信息被编码并发送。另外,由于编码单元从0的深度被划分到编码深度,因此仅编码深度的划分信息被设置为0,并且除了编码深度以外的深度的划分信息被设置为1。
视频解码设备200的接收提取器220可提取并使用关于编码单元900的编码深度和预测单元的信息,来对分区912进行解码。视频解码设备200可通过使用根据深度的划分信息,将划分信息为0的深度确定为编码深度,并且使用关于相应深度的编码模式的信息来进行解码。
图22至图24是用于描述根据示例性实施例的编码单元1010、预测单元1060和变换单元1070之间的关系的示图。
编码单元1010是最大编码单元中的与由视频编码设备100确定的编码深度相应的具有树结构的编码单元。预测单元1060是每个编码单元1010中的预测单元的分区,变换单元1070是每个编码单元1010的变换单元。
当在编码单元1010中最大编码单元的深度是0时,编码单元1012和编码单元1054的深度是1,编码单元1014、1016、1018、1028、1050和1052的深度是2,编码单元1020、1022、1024、1026、1030、1032和1048的深度是3,编码单元1040、1042、1044和1046的深度是4。
在预测单元1060中,通过划分编码单元1010中的编码单元来获得一些编码单元1014、1016、1022、1032、1048、1050、1052和1054。换句话说,编码单元1014、1022、1050和1054中的分区类型的尺寸是2N×N,编码单元1016、1048和1052中的分区类型的尺寸是N×2N,编码单元1032的分区类型的尺寸为N×N。编码单元1010的预测单元和分区小于或等于每个编码单元。
在小于编码单元1052的数据单元中的变换单元1070中,对编码单元1052的图像数据执行变换或逆变换。另外,在尺寸和形状方面,变换单元1070中的编码单元1014、1016、1022、1032、1048、1050和1052不同于预测单元1060中的编码单元1014、1016、1022、1032、1048、1050和1052。换句话说,视频编码设备100和视频解码设备200可对同一编码单元中的数据单元独立地执行帧内预测、运动估计、运动补偿、变换和逆变换。
因此,对最大编码单元的每个区域中的具有分层结构的每个编码单元递归地执行编码来确定最优编码单元,从而可获得具有递归树结构的编码单元。编码信息可包括关于编码单元的划分信息、关于分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。表2示出可由视频编码设备100和视频解码设备200设置的编码信息。
[表2]
视频编码设备100的输出单元130可输出关于具有树结构的编码单元的编码信息,视频解码设备200的图像数据和编码信息提取器220可从接收到的比特流提取关于具有树结构的编码单元的编码信息。
划分信息指示是否将当前编码单元划分成更低深度的编码单元。如果当前深度d的划分信息是0,则当前编码单元不再被划分成更低深度的的深度是编码深度,从而可针对所述编码深度来定义关于分区类型、预测模式和变换单元的尺寸的信息。如果当前编码单元根据划分信息被进一步划分,则对更低深度的四个划分编码单元独立地执行编码。
预测模式可以是帧内模式、帧间模式和跳过模式中的一种。可针对所有分区类型定义帧内模式和帧间模式,仅针对尺寸为2N×2N的分区类型定义跳过模式。
关于分区类型的信息可指示通过对称地划分预测单元的高度或宽度而获得的尺寸为2N×2N、2N×N、N×2N和N×N的对称分区类型,以及通过非对称地划分预测单元的高度或宽度而获得的尺寸为2N×nU、2N×nD、nL×2N和nR×2N的非对称分区类型。可通过按1:3和3:1来划分预测单元的高度来分别获得尺寸为2N×nU和2N×nD的非对称分区类型,可通过按1:3和3:1来划分预测单元的宽度来分别获得尺寸为nL×2N和nR×2N的非对称分区类型。
可将变换单元的尺寸设置成帧内模式下的两种类型和帧间模式下的两种类型。换句话说,如果变换单元的划分信息是0,则变换单元的尺寸可以是2N×2N,即当前编码单元的尺寸。如果变换单元的划分信息是1,则可通过对当前编码单元进行划分来获得变换单元。另外,如果尺寸为2N×2N的当前编码单元的分区类型是对称分区类型时,则变换单元的尺寸可以是N×N,如果当前编码单元的分区类型是非对称分区类型,则变换单元的尺寸可以是N/2×N/2。
关于具有树结构的编码单元的编码信息可包括与编码深度相应的编码单元、预测单元和最小单元中的至少一个。与编码深度相应的编码单元可包括包含相同编码信息的预测单元和最小单元中的至少一个。
因此,通过比较邻近数据单元的编码信息来确定邻近数据单元是否被包括在与编码深度相应的同一编码单元中。另外,通过使用数据单元的编码信息来确定与编码深度相应的相应编码单元,并因此可确定最大编码单元中的编码深度的分布。
因此,如果基于邻近数据单元的编码信息来对当前编码单元进行预测,则可直接参考并使用与当前编码单元邻近的较深层编码单元中的数据单元的编码信息。
可选地,如果基于邻近数据单元的编码信息来对当前编码单元进行预测,则使用数据单元的编码信息来搜索与当前编码单元邻近的数据单元,并可参考搜索到的邻近编码单元以对当前编码单元进行预测。
图25是用于描述根据表2的编码模式信息的编码单元、预测单元或分区和变换单元之间的关系的示图。
最大编码单元1300包括编码深度的编码单元1302、1304、1306、1312、1314、1316和1318。这里,由于编码单元1318是编码深度的编码单元,因此划分信息可以被设置成0。可将关于尺寸为2N×2N的编码单元1318的分区类型的信息设置成以下分区类型中的一种:尺寸为2N×2N的分区类型1322、尺寸为2N×N的分区类型1324、尺寸为N×2N的分区类型1326、尺寸为N×N的分区类型1328、尺寸为2N×nU的分区类型1332、尺寸为2N×nD的分区类型1334、尺寸为nL×2N的分区类型1336以及尺寸为nR×2N的分区类型1338。
变换单元的划分信息(TU(变换单元)尺寸标记)是一类变换索引。与变换索引相应的变换单元的尺寸可根据编码单元的预测单元类型或分区类型而改变。
例如,当分区类型被设置成对称(即,分区类型1322、1324、1326或1328)时,如果变换单元的划分信息(TU尺寸标记)是0,则设置尺寸为2N×2N的变换单元1342,如果TU尺寸标记是1,则设置尺寸为N×N的变换单元1344。
当分区类型被设置成非对称(例如,分区类型1332、1334、1336或1338)时,如果TU尺寸标记是0,则设置尺寸为2N×2N的变换单元1352,如果TU尺寸标记是1,则设置尺寸为N/2×N/2的变换单元1354。
参照图20,TU尺寸标记是具有值0或1的标记,但是TU尺寸标记不限于1比特,在TU尺寸标记从0增加的同时,变换单元可被分层划分以具有树结构。变换单元的划分信息(TU尺寸标记)可以是变换索引的示例。
在这种情况下,根据本发明的实施例,可通过使用变换单元的TU尺寸标记以及变换单元的最大尺寸和最小尺寸来表示实际上已使用的变换单元的尺寸。根据本发明的实施例,视频编码设备100能够对最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标记进行编码。对最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标记进行编码的结果可被插入SPS。根据本发明的实施例,视频解码设备200可通过使用最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标记来对视频进行解码。
例如,(a)如果当前编码单元的尺寸是64×64并且最大变换单元尺寸是32×32,则(a-1)当TU尺寸标记为0时,变换单元的尺寸可以是32×32,(a-2)当TU尺寸标记为1时,变换单元的尺寸可以是16×16,(a-3)当TU尺寸标记为2时,变换单元的尺寸可以是8×8。
作为另一示例,(b)如果当前编码单元的尺寸是32×32并且最小变换单元尺寸是32×32,则(b-1)当TU尺寸标记为0时,变换单元的尺寸可以是32×32。这里,由于变换单元的尺寸不能够小于32×32,因此TU尺寸标记不能够被设置为除了0以外的值。
作为另一示例,(c)如果当前编码单元的尺寸是64×64并且最大TU尺寸标记为1,则TU尺寸标记可以是0或1。这里,TU尺寸标记不能够被设置为除了0或1以外的值。
因此,当TU尺寸标记为0时,如果定义最大TU尺寸标记为“MaxTransformSizeIndex”,最小变换单元尺寸为“MinTransformSize”,变换单元尺寸为“RootTuSize”,则可通过等式(1)来定义可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”:
CurrMinTuSize=max(MinTransformSize,RootTuSize/(2^MaxTransformSizeIndex))…(1)
与可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”相比,当TU尺寸标记为0时,变换单元尺寸“RootTuSize”可指示可在系统中选择的最大变换单元尺寸。在等式(1)中,“RootTuSize/(2^MaxTransformSizeIndex)”指示当TU尺寸标记为0时,变换单元尺寸“RootTuSize”被划分了与最大TU尺寸标记相应的次数时的变换单元尺寸,“MinTransformSize”指示最小变换尺寸。因此,“RootTuSize/(2^MaxTransformSizeIndex)”和“MinTransformSize”中较小的值可以是可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”。
根据示例性实施例,最大变换单元尺寸RootTuSize可根据预测模式的类型而改变。
例如,如果当前预测模式是帧间模式,则可通过使用以下的等式(2)来确定“RootTuSize”。在等式(2)中,“MaxTransformSize”指示最大变换单元尺寸,“PUSize”指示当前预测单元尺寸。
RootTuSize=min(MaxTransformSize,PUSize)……(2)
也就是说,如果当前预测模式是帧间模式,则当TU尺寸标记为0时的变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前预测单元尺寸中较小的值。
如果当前分区单元的预测模式是帧内模式,则可通过使用以下的等式(3)来确定“RootTuSize”。在等式(3)中,“PartitionSize”指示当前分区单元的尺寸:
RootTuSize=min(MaxTransformSize,PartitionSize)……(3)
也就是说,如果当前预测模式是帧内模式,则当TU尺寸标记为0时的变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前分区单元的尺寸之中较小的值。
然而,根据分区单元中的预测模式的类型而改变的当前最大变换单元尺寸“RootTuSize”仅是示例,示例性实施例不限于此。
根据如参照图15a至图25描述的基于具有树结构的编码单元的视频编码方法,针对树结构的每个编码单元对空间域的图像数据进行编码。根据基于具有树结构的编码单元的视频解码方法,针对每个最大编码单元执行解码以恢复空间域的图像数据。因此,可恢复画面和视频(即,画面序列)。恢复后的视频可通过再现设备被再现,可被存储在存储介质中,或者可通过网络被发送。
实施例可被编写为计算机程序,并可在使用计算机可读记录介质执行程序的通用数字计算机中被实现。计算机可读记录介质的示例包括磁存储介质(例如,ROM、软盘、硬盘等)和光记录介质(例如,CD-ROM或DVD)。
为了便于解释,已参照图12a至图25描述的可伸缩视频编码方法和/或视频编码方法将被统称为“视频编码方法”。另外,已参照图12a至图25描述的可伸缩视频解码方法和/或视频解码方法将被称为“视频解码方法”。
已参照图12a至图25描述的视频编码设备(包括可伸缩视频编码设备1200、视频编码设备100或图像编码器400)将被称为“视频编码设备”。另外,已参照图12a至图25描述的视频解码设备(包括可伸缩视频解码设备1250、视频解码设备200或图像解码器500)将被称为“视频解码设备”。
现在将详细描述根据示例性实施例的存储程序的计算机可读记录介质(例如,盘26000)。
图26示出根据示例性实施例的存储程序的盘26000的物理结构。作为存储介质的盘26000可以是硬盘驱动器、致密盘只读存储器(CD-ROM)盘、蓝光盘或数字多功能盘(DVD)。盘26000包括多个同心磁道Tr,每个同心磁道Tr沿盘26000的圆周方向被划分成特定数量的扇区Se。在盘26000的特定区域中,可分配并存储执行以上所描述的确定量化参数的方法、视频编码方法和视频解码方法的程序。
现在将参照图22来描述使用存储用于执行如上所述的视频编码方法和视频解码方法的程序的存储介质来实现的计算机系统。
图27示出通过使用盘26000来记录并读取程序的盘驱动器26800。计算机系统26700可经由盘驱动器26800将执行根据示例性实施例的视频编码方法和视频解码方法中的至少一个的程序存储在盘26000中。为了在计算机系统26700中运行存储在盘26000中的程序,可通过使用盘驱动器26800从盘26000读取程序并将程序发送到计算机系统26700。
执行根据示例性实施例的视频编码方法和视频解码方法中的至少一个的程序不仅可被存储在图26或图27中示出的盘26000中,还可被存储在存储卡、ROM卡带或固态驱动器(SSD)中。
以下将描述应用以上所描述的视频编码方法和视频解码方法的系统。
图28示出用于提供内容分布服务的内容供应系统11000的整体结构。将通信系统的服务区域划分成预定尺寸的小区,并将无线基站11700、11800、11900和12000分别安装在这些小区中。
内容供应系统11000包括多个独立装置。例如,诸如计算机12100、个人数字助理(PDA)12200、视频相机12300和移动电话12500的多个独立装置经由互联网服务提供商11200、通信网络11400和无线基站11700、11800、11900和12000连接到互联网11100。
然而,内容供应系统11000不限于如图24中所示,并且装置可选择性地被连接到内容供应系统11000。多个独立装置可不经由无线基站11700、11800、11900和12000而直接连接到通信网络11400。
视频相机12300是能够捕捉视频图像的成像装置,例如,数字视频相机。移动电话12500可利用各种协议(例如,个人数字通信(PDC)、码分多址(CDMA)、宽带码分多址(W-CDMA)、全球移动通信系统(GSM)和个人手持电话系统(PHS))中的至少一种通信方法。
视频相机12300可经由无线基站11900和通信网络11400连接到流服务器11300。流服务器11300允许经由视频相机12300从用户接收到的内容经由实时广播被流传输。可使用视频相机12300或流服务器11300来对从视频相机12300接收到的内容进行编码。通过视频相机12300捕捉到的视频数据可经由计算机12100被发送到流服务器11300。
通过相机12600捕捉到的视频数据也可经由计算机12100被发送到流服务器11300。与数码相机类似,相机12600是能够捕捉静止图像和视频图像两者的成像装置。可使用相机12600或计算机12100对通过相机12600捕捉到的视频数据进行编码。可将对视频执行编码和解码的软件存储在可由计算机12100访问的计算机可读记录介质(例如,CD-ROM盘、软盘、硬盘驱动器、SSD或存储卡)中。
如果视频数据通过内置在移动电话12500中的相机被捕捉到,则可从移动电话12500接收视频数据。
还可通过安装在视频相机12300、移动电话12500或相机12600中的大规模集成电路(LSI)系统来对视频数据进行编码。
根据示例性实施例,内容供应系统11000可对由用户使用视频相机12300、相机12600、移动电话12500或另一成像装置所记录的内容数据(例如,在音乐会期间记录的内容)进行编码,并将编码后的内容数据发送到流服务器11300。流服务器11300可将编码后的内容数据以流传输内容的类型发送到请求内容数据的其它客户端。
客户端是能够对编码后的内容数据进行解码的装置,例如,计算机12100、PDA12200、视频相机12300或移动电话12500。因此,内容供应系统11000允许客户端接收并再现编码后的内容数据。此外,内容供应系统11000允许客户端实时接收编码后的内容数据并对编码后的内容数据进行解码和再现,从而能够进行个人广播。
包括在内容供应系统11000中的多个独立装置的编码和解码操作可类似于根据示例性实施例的视频编码设备和视频解码设备的编码和解码操作。
现在将参照图29和图30更加详细地描述包括在根据示例性实施例的内容供应系统11000中的移动电话12500。
图29示出根据示例性实施例的应用视频编码方法和视频解码方法的移动电话12500的外部结构。移动电话12500可以是智能电话,所述智能电话的功能不受限,并且所述智能电话的大多数功能可被改变或扩展。
移动电话12500包括可与图24的无线基站12000交换射频(RF)信号的内部天线12510,并包括用于显示由相机12530捕捉到的图像或经由天线12510接收到的并被解码的图像的显示屏12520(例如,液晶显示器(LCD)或有机发光二极管(OLED)屏幕)。智能手机12500包括包含有控制按钮和触摸面板的操作面板12540。如果显示屏12520是触摸屏,则操作面板12540还包括显示屏12520的触摸感测面板。移动电话12500包括用于输出语音和声音的扬声器12580或另一类型声音输出单元、以及用于输入语音和声音的麦克风12550或另一类型声音输入单元。移动电话12500还包括用于捕捉视频和静止图像的相机12530,诸如电荷耦合器件(CCD)相机。移动电话12500还可包括:存储介质12570,用于存储通过相机12530捕捉到的、经由电子邮件接收到的、或根据各种方式获得的编码/解码数据(例如,视频或静止图像);插槽12560,存储介质12570经由插槽12560被装入移动电话12500中。存储介质12570可以是闪存,例如,包括在塑料壳中的安全数字(SD)卡或电可擦和可编程只读存储器(EEPROM)。
图30示出根据示例性实施例的移动电话12500的内部结构。为了系统地控制包括显示屏12520和操作面板12540的移动电话12500的部件,供电电路12700、操作输入控制器12640、图像编码单元12720、相机接口12630、LCD控制器12620、图像解码单元12690、复用器/解复用器12680、记录/读取单元12670、调制/解调单元12660以及声音处理器12650经由同步总线12730被连接到中央控制器12710。
如果用户操作电源按钮,并从“电源关闭”状态设置为“电源开启”状态,则供电电路12700从电池组向移动电话12500的所有部件供电,从而将移动电话12500设置为操作模式。
中央控制器12710包括中央处理器(CPU)、ROM和随机存取存储器(RAM)。
在移动电话12500将通信数据发送到外部的同时,在中央控制器的控制下,移动电话12500中产生数字信号。例如,声音处理器12650可产生数字声音信号,图像编码单元12720可产生数字图像信号,并且消息的文本数据可经由操作面板12540和操作输入控制器12640被产生。当在中央控制器12710的控制下数字信号被传送到调制/解调单元12660时,调制/解调单元12660对数字信号的频带进行调制,并且通信电路12610对频带调制后的数字声音信号执行数模转换(DAC)和频率转换。从通信电路12610输出的发送信号可经由天线12510被发送到语音通信基站或无线基站12000。
例如,当移动电话12500处于通话模式时,在中央控制器12710的控制下,经由麦克风12550获得的声音信号通过声音处理器12650被变换成数字声音信号。数字声音信号可经由调制/解调单元12660和通信电路12610被变换成发送信号,并可经由天线12510被发送。
当文本消息(例如,电子邮件)在数据通信模式下被发送时,文本消息的文本数据经由操作面板12540被输入,并经由操作输入控制器12640被发送到中央控制器12610。在中央控制器12610的控制下,文本数据经由调制/解调单元12660和通信电路12610被变换成发送信号,并经由天线12510被发送到无线基站12000。
为了在数据通信模式下发送图像数据,由相机12530捕捉到的图像数据经由相机接口12630被提供给图像编码单元12720。捕捉到的图像数据可经由相机接口12630和LCD控制器12620被直接显示在显示屏12520上。
图像编码单元12720的结构可与上述视频编码设备100的结构相应。图像编码单元12720可基于上述视频编码方法,将从相机12530接收到的图像数据变换为压缩和编码后的图像数据,并然后将编码后的图像数据输出到复用器/解复用器12680。在相机12530的记录操作期间,由移动电话12500的麦克风12550获得的声音信号可经由声音处理器12650被变换成数字声音数据,并且数字声音数据可被传送到复用器/解复用器12680。
复用器/解复用器12680对从图像编码单元12720接收到的编码后的图像数据与从声音处理器12650接收到的声音数据一起进行复用。对数据进行复用的结果可经由调制/解调单元12660和通信电路12610被变换成发送信号,然后可经由天线12510被发送。
当移动电话12500从外部接收通信数据时,可对经由天线12510接收到的信号执行频率恢复和ADC以将信号变换成数字信号。调制/解调单元12660对数字信号的频带进行调制。根据频带调制后的数字信号的类型将所述数字信号发送到视频解码单元12690、声音处理器12650或LCD控制器12620。
在通话模式下,移动电话12500对经由天线12510接收到的信号进行放大,并通过对放大后的信号执行频率转换和ADC来获得数字声音信号。在中央控制器12710的控制下,接收到的数字声音信号经由调制/解调单元12660和声音处理器12650被变换成模拟声音信号,并且模拟声音信号经由扬声器12580被输出。
当在数据通信模式下时,接收在互联网网站上访问的视频文件的数据,经由调制/解调单元12660将经由天线12510从无线基站12000接收到的信号输出为复用数据,并将复用数据发送到复用器/解复用器12680。
为了对经由天线12510接收到的复用数据进行解码,复用器/解复用器12680将复用数据解复用成编码后的视频数据流和编码后的音频数据流。经由同步总线12730,编码后的视频数据流和编码后的音频数据流分别被提供给视频解码单元12690和声音处理器12650。
图像解码单元12690的结构可与上述视频解码设备200的结构相应。图像解码单元12690可根据上述上述视频解码方法,对编码后的视频数据进行解码来获得恢复的视频数据,并经由LCD控制器12602将恢复的视频数据提供给显示屏12520。
因此,可将在互联网网站上访问的视频文件的数据显示在显示屏12520上。同时,声音处理器12650可将音频数据变换成模拟声音信号,并将模拟声音信号提供给扬声器12580。因此,也可经由扬声器12580再现在互联网网站上访问的视频文件中包含的音频数据。
移动电话12500或另一类型的通信终端可以是包括根据示例性实施例的视频编码设备和视频解码设备两者的收发终端,可以是仅包括视频编码设备的收发终端,或者可以是仅包括视频解码设备的收发终端。
根据示例性实施例的通信系统不限于以上参照图29描述的通信系统。例如,图31示出根据示例性实施例的采用通信系统的数字广播系统。图31的数字广播系统可通过使用根据示例性实施例的视频编码设备和视频解码设备来接收经由卫星或地面网络发送的数字广播。
具体地,广播站12890通过使用无线电波将视频数据流发送到通信卫星或广播卫星12900。广播卫星12900发送广播信号,广播信号经由家用天线12860被发送到卫星广播接收器。在每个房屋中,可通过TV接收器12810、机顶盒12870或另一装置对编码后的视频流进行解码并再现。
当根据示例性实施例的视频解码设备被实现在再现设备12830中时,再现设备12830可对记录在存储介质12820(诸如用于恢复数字信号的盘或存储卡)上的编码后的视频流进行解析和解码。因此,可在例如监视器12840上再现恢复的视频信号。
在被连接到用于卫星/地面广播的天线12860或用于接收有线电视(TV)广播的线缆天线12850的机顶盒12870中,可安装根据示例性实施例的视频解码设备。从机顶盒12870输出的数据也可被再现在TV监视器12880上。
作为另一示例,可将根据示例性实施例的视频解码设备安装在TV接收器12810中,而不是机顶盒12870中。
具有适当天线12910的汽车12920可接收从卫星12900或无线基站11700发送的信号。可在安装在汽车12920中的汽车导航系统12930的显示屏上再现解码后的视频。
视频信号可由根据示例性实施例的视频编码设备来编码,然后可被存储在存储介质中。具体地,可由DVD记录器将图像信号存储在DVD盘12960中,或可由硬盘记录器12950将图像信号存储在硬盘中。作为另一示例,可将视频信号存储在SD卡12970中。如果硬盘记录器12950包括根据示例性实施例的视频解码设备,则记录在DVD盘12960、SD卡12970或另一存储介质上的视频信号可在TV监视器12880上被再现。
汽车导航系统12930可不包括图31的相机12530、相机接口12630和图像编码单元12720。例如,计算机12100和TV接收器12810可不包括在图31的相机12530、相机接口12630或图像编码单元12720中。
图32示出根据示例性实施例的使用视频编码设备和视频解码设备的云计算系统的网络结构。
云计算系统可包括云计算服务器14000、用户数据库(DB)14100、多个计算资源14200和用户终端。
响应于来自用户终端的请求,云计算系统经由数据通信网络(例如,互联网)提供多个计算资源14200的点播外包服务。在云计算环境下,服务提供商通过使用虚拟技术组合位于不同的物理位置的数据中心处的计算资源,来为用户提供想要的服务。服务用户不必将计算资源(例如,应用、存储器、操作系统(OS)和安全软件)安装在他/她拥有的终端中以使用它们,但可在想要的时间点在通过虚拟技术产生的虚拟空间中从服务中选择和使用想要的服务。
被指定的服务用户的用户终端经由包括互联网和移动通信网络的数据通信网络被连接到云计算服务器14000。可从云计算服务器14000向用户终端提供云计算服务,特别是视频再现服务。用户终端可以是能够被连接到互联网的各种类型的电子装置,例如,桌上型PC14300、智能TV14400、智能电话14500、笔记本计算机14600、便携式多媒体播放器(PMP)14700、平板PC14800等。
云计算服务器14000可组合分布在云网络中的多个计算资源14200,并向用户终端提供组合的结果。所述多个计算资源14200可包括各种数据服务,并可包括从用户终端上载的数据。如上所描述的,云计算服务器14000可通过根据虚拟技术组合分布在不同区域中的视频数据库来向用户终端提供想要的服务。
将关于已经订购云计算服务的用户的用户信息存储在用户DB14100中。用户信息可包括用户的注册信息、地址、姓名和个人信用信息。用户信息还可包括视频的索引。这里,所述索引可包括已经被再现的视频的列表、正在被再现的视频的列表、之前正在被再现的视频的暂停点等。
可在用户装置之间共享关于存储在用户DB14100中的视频的信息。例如,当响应于来自笔记本计算机14600的请求将视频服务提供给笔记本计算机14600时,视频服务的再现历史被存储在用户DB14100中。当从智能电话14500接收到用于再现此视频服务的请求时,云计算服务器14000基于用户DB14100搜索并再现此视频服务。当智能电话14500从云计算服务器14000接收到视频数据流时,通过对视频数据流进行解码来再现视频的处理与以上参照图28描述的移动电话12500的操作类似。
云计算服务器14000可参考存储在用户DB14100中的想要的视频服务的再现历史。例如,云计算服务器14000从用户终端接收用于再现存储在用户DB14100中的视频的请求。如果此视频被再现过,则由云计算服务器14000执行的对此视频进行流传输的方法可根据来自用户终端的请求(即,根据是将从视频的起点还是视频的暂停点开始再现视频)而不同。例如,如果用户终端请求从视频的起点开始再现视频,则云计算服务器14000将从视频的第一帧开始的视频的流数据发送到用户终端。如果用户终端请求从视频的暂停点开始再现视频,则云计算服务器14000将从与暂停点相应的帧开始的视频的流数据发送到用户终端。
在此情况下,用户终端可包括如以上参照图12a至图25描述的视频解码设备。作为另一示例,用户终端可包括如以上参照图12a至图25描述的视频编码设备。可选地,用户终端可包括如以上参照图12a至图25描述的视频解码设备和视频编码设备两者。
以上参照图26至图32描述了以上参照图12a至图25描述的根据示例性实施例的视频编码方法、视频解码方法、视频编码设备和视频解码设备的各种应用。然而,根据各种示例性实施例的将视频编码方法和视频解码方法存储在存储介质中的方法或者将视频编码设备和视频解码设备实现在装置中的方法不限于以上参照图26至图32描述的实施例。
虽然已参照本公开的示例性实施例具体示出和描述了本公开,但是本领域的普通技术人员将理解,在不脱离由权利要求限定的根据公开的精神和范围的情况下,可在其中进行形式和细节上的各种改变。

Claims (14)

1.一种用于可伸缩视频编码的上采样方法,所述方法包括:
基于高分辨率图像和低分辨率图像之间的缩放因子,确定低分辨率图像的像素和高分辨率图像的像素之间的相移;
从包括与相移相应的滤波器系数集的滤波器系数数据选择与确定的相移相应的至少一个滤波器系数集;
通过使用选择的至少一个滤波器系数集对低分辨率图像执行滤波,产生高分辨率图像;
产生增强层比特流,其中,增强层比特流包括通过对高分辨率图像执行编码而产生的高分辨率编码信息以及指示确定的相移的上采样滤波器信息。
2.如权利要求1所述的上采样方法,其中,产生高分辨率图像的步骤包括:当滤波器系数数据包括与根据相移间隔1/16的相移相应的滤波器系数集时,通过使用i)滤波器系数数据中与相移5/16相应的滤波器系数集以及ii)滤波器系数数据中与相移11/16相应的滤波器系数集来执行滤波,其中,与相移5/16相应的滤波器系数集用于在比率为2:3时对确定的相移为1/3的采样位置进行上采样,与相移11/16相应的滤波器系数集用于在比率为2:3时对确定的相移为2/3的采样位置进行上采样。
3.如权利要求1所述的上采样方法,其中,产生高分辨率图像的步骤包括:当滤波器系数数据包括与根据相移间隔1/8的相移相应的滤波器系数集时,通过使用i)滤波器系数数据中与相移3/8相应的滤波器系数集以及ii)滤波器系数数据中与相移5/8相应的滤波器系数集来执行滤波,其中,与相移3/8相应的滤波器系数集用于在比率为2:3时对确定的相移为1/3的采样位置进行上采样,与相移5/8相应的滤波器系数集用于在比率为2:3时对确定的相移为2/3的采样位置进行上采样。
4.如权利要求1所述的上采样方法,其中,确定低分辨率图像的像素和高分辨率图像的像素之间的相移的步骤包括:
基于所述缩放因子,确定低分辨率图像的亮度像素和高分辨率图像的亮度像素之间的相移;
基于彩色格式确定高分辨率图像的色度像素相对于高分辨率图像的亮度像素的位置的位置,并确定低分辨率图像的色度分量像素和高分辨率图像的位置被确定的色度像素之间的相移。
5.如权利要求1所述的上采样方法,其中,产生增强层比特流的步骤包括:将上采样滤波器信息记录在序列参数集(SPS)、画面参数集(PPS)和条带片段头中的至少一个中。
6.一种用于可伸缩视频解码的上采样方法,所述上采样方法包括:
从增强层比特流获取上采样滤波器信息,其中,上采样滤波器信息指示基于高分辨率图像和低分辨率图像之间的缩放因子而确定的低分辨率图像的像素和高分辨率图像的像素之间的相移;
选择滤波器系数数据中所包括的与来自上采样滤波器信息的确定的相移相应的至少一个滤波器系数集,其中,滤波器系数数据包括针对相移的相应滤波器系数集;
通过使用选择的至少一个滤波器系数集对低分辨率图像执行滤波,产生高分辨率图像。
7.如权利要求6所述的上采样方法,其中,产生高分辨率图像的步骤包括:当滤波器系数数据包括与根据相移间隔1/16的相移相应的滤波器系数集时,通过使用i)滤波器系数数据中与相移5/16相应的滤波器系数集以及ii)滤波器系数数据中与相移11/16相应的滤波器系数集来执行滤波,其中,与相移5/16相应的滤波器系数集用于在比率为2:3时对确定的相移为1/3的采样位置进行上采样,与相移11/16相应的滤波器系数集用于在比率为2:3时对确定的相移为2/3的采样位置进行上采样。
8.如权利要求6所述的上采样方法,其中,产生高分辨率图像的步骤包括:当滤波器系数数据包括与根据相移间隔1/8的相移相应的滤波器系数集时,通过使用i)滤波器系数数据中与相移3/8相应的滤波器系数集以及ii)滤波器系数数据中与相移5/8相应的滤波器系数集来执行滤波,其中,与相移3/8相应的滤波器系数集用于在比率为2:3时对确定的相移为1/3的采样位置进行上采样,与相移5/8相应的滤波器系数集用于在比率为2:3时对确定的相移为2/3的采样位置进行上采样。
9.如权利要求6所述的上采样方法,其中,选择所述至少一个滤波器系数集的步骤包括:
从上采样滤波器信息获取低分辨率图像的亮度像素和高分辨率图像的亮度像素之间的相移;
从上采样滤波器信息获取低分辨率图像的色度分量像素和高分辨率图像的色度分量像素之间的相移;
其中,当高分辨率图像的色度像素相对于高分辨率图像的亮度像素的位置的位置基于彩色格式被确定时,获取的色度分量像素之间的相移是低分辨率图像的色度分量像素和高分辨率图像的色度像素之间的相移。
10.如权利要求6所述的上采样方法,其中,获取上采样滤波器信息的步骤包括:从包括在增强层比特流中的序列参数集(SPS)、画面参数集(PPS)和条带片段头中的至少一个获取上采样滤波器信息。
11.一种可伸缩视频编码设备,包括:
滤波器系数数据存储单元,记录针对相移的相应滤波器系数集;
滤波器选择器,基于与低分辨率图像相应的高分辨率图像和低分辨率图像之间的缩放因子,确定低分辨率图像的像素和高分辨率图像的像素之间的相移,并且从滤波器系数数据选择与确定的相移相应的至少一个滤波器系数集;
上采样单元,通过使用选择的至少一个滤波器系数集对低分辨率图像执行滤波,产生高分辨率图像;
基本层编码器,产生基本层比特流,其中,基本层比特流包括通过对低分辨率图像执行编码而产生的低分辨率编码信息;
增强层编码器,产生增强层比特流,其中,增强层比特流包括通过对高分辨率图像执行编码而产生的高分辨率编码信息以及指示确定的相移的上采样滤波器信息。
12.一种可伸缩视频解码设备,包括:
滤波器系数数据存储单元,记录针对相移的相应滤波器系数集;
增强层接收器,从增强层比特流获取上采样滤波器信息和高分辨率编码信息,其中,上采样滤波器信息指示基于高分辨率图像和低分辨率图像之间的缩放因子而确定的低分辨率图像的像素和高分辨率图像的像素之间的相移;
滤波器选择器,选择滤波器系数数据中所包括的与来自上采样滤波器信息的确定的相移相应的至少一个滤波器系数集;
增强层解码器,通过使用选择的至少一个滤波器系数集对低分辨率图像执行滤波,产生高分辨率图像,并通过使用产生的高分辨率图像和获取的高分辨率编码信息对高分辨率图像进行解码;
基本层解码器,通过使用从基本层比特流获取的低分辨率编码信息对低分辨率图像进行解码。
13.一种计算机可读记录介质,其中,在所述计算机可读记录介质上记录用于执行如权利要求1所述的用于可伸缩视频编码的上采样方法的程序。
14.一种计算机可读记录介质,其中,在所述计算机可读记录介质上记录用于执行如权利要求6所述的用于可伸缩视频解码的上采样方法的程序。
CN201480012095.7A 2013-01-04 2014-01-06 使用考虑相移的上采样的可伸缩视频编码方法和设备以及可伸缩视频解码方法和设备 Pending CN105191313A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361748919P 2013-01-04 2013-01-04
US61/748,919 2013-01-04
PCT/KR2014/000094 WO2014107066A1 (ko) 2013-01-04 2014-01-06 위상차를 고려한 영상 업샘플링을 이용하는 스케일러블 비디오 부호화 방법 및 장치, 스케일러블 비디오 복호화 방법 및 장치

Publications (1)

Publication Number Publication Date
CN105191313A true CN105191313A (zh) 2015-12-23

Family

ID=51062341

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480012095.7A Pending CN105191313A (zh) 2013-01-04 2014-01-06 使用考虑相移的上采样的可伸缩视频编码方法和设备以及可伸缩视频解码方法和设备

Country Status (6)

Country Link
US (1) US9961365B2 (zh)
EP (1) EP2942963A4 (zh)
JP (1) JP2016502379A (zh)
KR (1) KR20140089487A (zh)
CN (1) CN105191313A (zh)
WO (1) WO2014107066A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106407153A (zh) * 2016-11-23 2017-02-15 诺仪器(中国)有限公司 一种高分辨率数据采集方法及装置
CN109257605A (zh) * 2017-07-13 2019-01-22 华为技术有限公司 图像处理方法、设备及系统
US20220198614A1 (en) * 2019-05-31 2022-06-23 Nippon Telegraph And Telephone Corporation Image processing apparatus, image processing method, and program
CN114978262A (zh) * 2022-05-17 2022-08-30 东南大学 一种基于低分辨率相移器的多波束卫星通信鲁棒混合预编码方法

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9596465B2 (en) * 2013-01-04 2017-03-14 Intel Corporation Refining filter for inter layer prediction of scalable video coding
WO2014144559A1 (en) * 2013-03-15 2014-09-18 General Instrument Corporation Adaptive sampling filter process for scalable video coding
US9503732B2 (en) * 2013-04-10 2016-11-22 Arris Enterprises, Inc. Re-sampling with phase offset adjustment for luma and chroma to select filters in scalable video coding
MX369507B (es) * 2013-06-14 2019-11-11 Arris Tech Inc Filtros de remuestreo para codificación de video escalable.
US20160156913A1 (en) * 2013-07-15 2016-06-02 Kt Corporation Method and apparatus for encoding/decoding scalable video signal
US10218970B2 (en) * 2013-07-16 2019-02-26 Arris Enterprises Llc Resampling filters for scalable video coding with phase offset adjustment and signaling of same
MX360947B (es) 2014-01-03 2018-10-29 Arris Entpr Llc Sintaxis de extensión condicionalmente analizada para procesamiento de extensión hevc.
EP3094093A4 (en) 2014-01-09 2017-08-16 Samsung Electronics Co., Ltd. Scalable video encoding/decoding method and apparatus
CA2943121C (en) 2014-03-18 2020-09-08 Arris Enterprises Llc Scalable video coding using reference and scaled reference layer offsets
MX2016012130A (es) 2014-03-19 2017-04-27 Arris Entpr Inc Codificacion escalable de secuencias de video utilizando mapeo de tonos y diferentes gamas de colores.
WO2015168581A1 (en) 2014-05-01 2015-11-05 Arris Enterprises, Inc. Reference layer and scaled reference layer offsets for scalable video coding
CA2950749C (en) 2014-05-30 2019-02-19 Arris Enterprises Llc Reference layer offset parameters for inter-layer prediction in scalable video coding
EP3577899A4 (en) 2017-01-31 2020-06-17 Sharp Kabushiki Kaisha SYSTEMS AND METHODS FOR SCALING TRANSFORM COEFFICIENT LEVEL VALUES
BR122021006807B1 (pt) 2017-04-11 2022-08-30 Dolby Laboratories Licensing Corporation Método para experiências de entretenimento aumentadas em camadas
EP3682639A1 (en) * 2017-10-02 2020-07-22 ARRIS Enterprises LLC System and method for reducing blocking artifacts and providing improved coding efficiency
CN111107354A (zh) 2018-10-29 2020-05-05 华为技术有限公司 一种视频图像预测方法及装置
KR102013777B1 (ko) * 2018-12-12 2019-10-21 한국과학기술정보연구원 동영상 왜곡 복원 방법 및 이를 적용한 장치
US11303909B2 (en) * 2019-09-18 2022-04-12 Qualcomm Incorporated Scaling ratio and output full resolution picture in video coding
WO2023200135A1 (ko) * 2022-04-15 2023-10-19 현대자동차주식회사 크로마 성분에 대한 개선된 인루프필터를 이용하는 비디오 코딩을 위한 방법 및 장치

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070116131A1 (en) * 2005-11-18 2007-05-24 Sharp Laboratories Of America, Inc. Methods and systems for picture resampling
CN101395921A (zh) * 2006-11-17 2009-03-25 Lg电子株式会社 用于解码/编码视频信号的方法及装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8638862B2 (en) 2005-03-18 2014-01-28 Sharp Laboratories Of America, Inc. Methods and systems for upsampling filter design
US8175168B2 (en) * 2005-03-18 2012-05-08 Sharp Laboratories Of America, Inc. Methods and systems for picture up-sampling
WO2006104366A1 (en) * 2005-04-01 2006-10-05 Lg Electronics Inc. Method for scalably encoding and decoding video signal
US8660180B2 (en) 2005-04-01 2014-02-25 Lg Electronics Inc. Method and apparatus for scalably encoding and decoding video signal
US8208564B2 (en) * 2005-06-24 2012-06-26 Ntt Docomo, Inc. Method and apparatus for video encoding and decoding using adaptive interpolation
US7956930B2 (en) * 2006-01-06 2011-06-07 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
JP5143829B2 (ja) 2006-09-07 2013-02-13 エルジー エレクトロニクス インコーポレイティド スケーラブルビデオコーディングされたビットストリームのデコーディング方法及び装置
US8107571B2 (en) * 2007-03-20 2012-01-31 Microsoft Corporation Parameterized filters and signaling techniques
US8126054B2 (en) * 2008-01-09 2012-02-28 Motorola Mobility, Inc. Method and apparatus for highly scalable intraframe video coding
HUE037725T2 (hu) * 2010-09-30 2018-09-28 Samsung Electronics Co Ltd Berendezés képek interpolálására simító interpolációs filtert felhasználva
CA2976108C (en) 2011-06-28 2020-06-30 Samsung Electronics Co., Ltd. Method for image interpolation using asymmetric interpolation filter and apparatus therefor
US20140098883A1 (en) * 2012-10-09 2014-04-10 Nokia Corporation Method and apparatus for video coding

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070116131A1 (en) * 2005-11-18 2007-05-24 Sharp Laboratories Of America, Inc. Methods and systems for picture resampling
CN101395921A (zh) * 2006-11-17 2009-03-25 Lg电子株式会社 用于解码/编码视频信号的方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ELENA ALSHINA: "TEA1: Fixed up-sampling filter tests by Samsung", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC)》 *
JIANLE CHEN: "Description of scalable video coding technology proposal by Qualcomm", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC)》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106407153A (zh) * 2016-11-23 2017-02-15 诺仪器(中国)有限公司 一种高分辨率数据采集方法及装置
CN106407153B (zh) * 2016-11-23 2019-08-23 一诺仪器(中国)有限公司 一种高分辨率数据采集方法及装置
CN109257605A (zh) * 2017-07-13 2019-01-22 华为技术有限公司 图像处理方法、设备及系统
CN109257605B (zh) * 2017-07-13 2021-11-19 华为技术有限公司 图像处理方法、设备及系统
US20220198614A1 (en) * 2019-05-31 2022-06-23 Nippon Telegraph And Telephone Corporation Image processing apparatus, image processing method, and program
US11983855B2 (en) * 2019-05-31 2024-05-14 Nippon Telegraph And Telephone Corporation Image processing apparatus, image processing method, and program
CN114978262A (zh) * 2022-05-17 2022-08-30 东南大学 一种基于低分辨率相移器的多波束卫星通信鲁棒混合预编码方法
CN114978262B (zh) * 2022-05-17 2024-01-26 东南大学 一种基于低分辨率相移器的多波束卫星通信鲁棒混合预编码方法

Also Published As

Publication number Publication date
JP2016502379A (ja) 2016-01-21
US20150341661A1 (en) 2015-11-26
US9961365B2 (en) 2018-05-01
WO2014107066A1 (ko) 2014-07-10
EP2942963A1 (en) 2015-11-11
KR20140089487A (ko) 2014-07-15
EP2942963A4 (en) 2016-08-17

Similar Documents

Publication Publication Date Title
CN105191313A (zh) 使用考虑相移的上采样的可伸缩视频编码方法和设备以及可伸缩视频解码方法和设备
CN103918255B (zh) 对多视点视频数据的深度图进行编码的方法和装置以及对编码的深度图进行解码的方法和装置
CN103931192B (zh) 用于在视频编码或解码中的运动矢量确定的方法和设备
CN105144713B (zh) 用于解码器设置的对视频进行编码的方法及其装置以及基于解码器设置对视频进行解码的方法及其装置
CN104620578B (zh) 用于随机访问的多层视频编码的方法和设备以及用于随机访问的多层视频解码的方法和设备
CN105308966A (zh) 视频编码方法及其设备以及视频解码方法及其设备
CN104813665A (zh) 用于对层间预测误差进行编码的sao补偿的方法和设备
CN105532001A (zh) 用于使用基于深度的视差矢量对视频进行层间解码的方法和设备以及用于使用基于深度的视差矢量对视频进行层间编码的方法和设备
CN104488272A (zh) 用于预测用于对视频进行编码或用于对视频进行解码的运动矢量的方法和设备
CN105103552A (zh) 用于补偿亮度差的对层间视频进行编码的方法及其装置以及用于对视频进行解码的方法及其装置
CN104396252A (zh) 使用用于多视点视频预测的参考画面集的多视点视频编码方法及其装置、使用用于多视点视频预测的参考画面集的多视点视频解码方法及其装置
CN105264894A (zh) 针对层间解码和编码方法以及设备的确定帧间预测候选的方法
CN104365104A (zh) 用于基于树结构编码单元进行多视点视频编码的方法和设备以及用于基于树结构编码单元进行多视点视频解码的方法和设备
CN105532004B (zh) 层间视频解码方法及设备
CN104365101A (zh) 用于确定用于帧间预测的参考图像的方法及设备
CN105340271A (zh) 用于随机访问的多层视频编码方法及其装置以及用于随机访问的多层视频解码方法及其装置
CN104869413A (zh) 视频解码设备
CN105027568A (zh) 用于对条带段进行熵编码的方法及其设备以及用于对条带段进行熵解码的方法及其设备
CN105165011A (zh) 用于考虑存储器带宽和计算量的可伸缩视频编码的装置和方法以及用于可伸缩视频解码的装置和方法
CN104604237A (zh) 依据块尺寸来确定帧间预测参考画面列表的用于对视频进行编码的方法和设备以及用于对视频进行解码的方法和设备
CN106464890A (zh) 可伸缩视频编码/解码方法和设备
CN104541510A (zh) 参考画面列表能够被改变的帧间预测方法及其设备
CN106031175B (zh) 使用亮度补偿的层间视频编码方法及其装置、以及视频解码方法及其装置
CN105325002A (zh) 使用视点合成预测的多视点视频编码方法及其设备以及多视点视频解码方法及其设备
CN105340275A (zh) 使用视点合成预测的多视点视频编码方法及其设备以及多视点视频解码方法及其设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20151223