CN105340271A - 用于随机访问的多层视频编码方法及其装置以及用于随机访问的多层视频解码方法及其装置 - Google Patents

用于随机访问的多层视频编码方法及其装置以及用于随机访问的多层视频解码方法及其装置 Download PDF

Info

Publication number
CN105340271A
CN105340271A CN201480032604.2A CN201480032604A CN105340271A CN 105340271 A CN105340271 A CN 105340271A CN 201480032604 A CN201480032604 A CN 201480032604A CN 105340271 A CN105340271 A CN 105340271A
Authority
CN
China
Prior art keywords
layer
picture
image
coding
rap
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201480032604.2A
Other languages
English (en)
Other versions
CN105340271B (zh
Inventor
崔秉斗
朴慜祐
魏浩千
尹载元
李振荣
曺容振
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN105340271A publication Critical patent/CN105340271A/zh
Application granted granted Critical
Publication of CN105340271B publication Critical patent/CN105340271B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Abstract

本发明提供了一种恢复多层图像的方法,所述方法包括从比特流获得关于包括基本层和增强层的多个层的RAP画面的信息,通过使用关于RAP画面的信息独立地对基本层的RAP画面进行解码;通过使用关于RAP画面的信息独立地对增强层的RAP画面进行解码。

Description

用于随机访问的多层视频编码方法及其装置以及用于随机访问的多层视频解码方法及其装置
技术领域
本发明构思涉及对视频的编码和解码,在所述编码和解码中,使用了基于帧间预测、帧内预测和层间预测的多层预测结构。
背景技术
随着用于再现和存储高分辨率或高质量视频内容的硬件正被开发和提供,对于用于有效地对高分辨率或高质量视频内容进行编码或解码的视频编解码器的需求正在增加。根据传统的视频编解码器,基于具有预定尺寸的宏块,根据受限的编码方法来对视频进行编码。
空间域的图像数据经过频率变换被变换为频域的系数。根据视频编解码器,将图像划分为具有预定尺寸的块,对每个块执行离散余弦变换(DCT),以块为单位对频率系数进行编码,以用于频率变换的快速计算。与空间域的图像数据相比,更容易对频域的系数进行压缩。具体地讲,由于根据经由视频编解码器的帧间预测或帧内预测的预测误差来表达空间域的图像像素值,因此当对预测误差执行了频率变换时,可将大量的数据变换为0。根据视频编解码器,可通过使用少量的数据代替连续且重复地产生的数据来减少数据量。
多层视频编解码器对基本层视频和至少一个增强层视频进行编码和解码。可通过去除基本层视频和增强层视频的时间/空间冗余和层冗余来减少基本层视频和增强层视频的数据量。
发明内容
技术问题
需要一种高效率的视频压缩方法。
技术方案
根据本发明构思的一方面,提供了一种由视频解码设备执行的视频解码方法,所述方法包括:从比特流获得包括基本层和增强层的多个层的RAP画面信息;通过使用RAP画面信息,独立地对基本层的RAP画面进行解码;通过使用RAP画面信息,独立地对增强层的RAP画面进行解码,其中,独立的解码通过仅针对在随机访问点具有RAP画面的层对RAP画面进行解码来执行。
有益效果
根据本发明构思的实施例的编码方法和解码方法,可提高视频压缩效率。
附图说明
图1a是根据本发明构思的实施例的多层视频编码设备的框图。
图1b是图1a的多层视频编码设备的多层视频编码方法的流程图。
图2a是根据本发明构思的实施例的多层视频解码设备的框图。
图2b是图2a的层间视频解码设备的层间视频解码方法的流程图。
图2c和图2d示出根据输出时间点的包括在访问单元中的多个层的画面的类型。
图3是根据实施例的层间预测结构的示图。
图4a是多层图像的多层预测结构的示图。
图4b是根据时间分层编码和解码方法的多层预测结构的示图。
图5a和图5b示出根据两个实施例的瞬时解码刷新(IDR)图像的再现顺序和解码顺序。
图6a和图6b示出根据两个实施例的纯净随机访问(CRA)图像的再现顺序和解码顺序。
图7a和图7b示出根据两个实施例的断链访问(BLA)图像的再现顺序和解码顺序。
图8是根据实施例的基于根据树结构的编码单元的视频编码设备的框图。
图9是根据实施例的基于根据树结构的编码单元的视频解码设备的框图。
图10是用于描述根据本发明构思的实施例的编码单元的概念的示图。
图11是根据本发明构思的实施例的基于编码单元的图像编码器的框图。
图12是根据本发明构思的实施例的基于编码单元的图像解码器的框图。
图13是示出根据本发明构思的实施例的根据深度的较深层编码单元以及分区的示图。
图14是用于描述根据本发明构思的实施例的编码单元与变换单元之间的关系的示图。
图15是用于描述根据本发明构思的实施例的根据深度的编码信息的示图。
图16是根据本发明构思的实施例的根据深度的较深层编码单元的示图。
图17至图19是用于描述根据本发明构思的实施例的编码单元、预测单元和变换单元之间的关系的示图。
图20是用于描述根据表8的编码模式信息的编码单元、预测单元和变换单元之间的关系的示图。
图21是根据实施例的存储有程序的盘的物理结构的示图。
图22是用于通过使用盘来记录和读取程序的盘驱动器的示图。
图23是用于提供内容分发服务的内容供应系统的整体结构的示图。
图24和图25分别示出应用了根据实施例的视频编码方法和视频解码方法的移动电话的外部结构和内部结构。
图26是根据本发明构思的应用了通信系统的数字广播系统的示图。
图27是示出使用根据本发明构思的实施例的视频编码设备和视频解码设备的云计算系统的网络结构的示图。
最佳模式
根据本发明构思的一方面,提供了一种由视频解码设备执行的视频解码方法,所述方法包括:从比特流获得包括基本层和增强层的多个层的RAP画面信息;通过使用RAP画面信息独立地对基本层的RAP画面进行解码;通过使用RAP画面信息独立地对增强层的RAP画面进行解码,其中,独立的解码通过仅针对在随机访问点具有RAP画面的层对RAP画面进行解码来执行。
通过使用RAP画面信息独立地对增强层的RAP画面进行解码的步骤可包括:当在作为随机访问点的POC的增强层的画面是非RAP画面时,对按POC顺序在非RAP画面之后出现的RAP画面进行解码。
从比特流获得包括基本层和增强层的多个层的RAP画面信息的步骤可包括:获得指示RAP画面是否位于所述多个层的同一画面顺序计数(POC)的指示符。
从比特流获得包括基本层和增强层的多个层的RAP画面信息的步骤还可包括:获得指示存在于所述多个层的同一POC的RAP画面的类型的标识符。
RAP画面信息可被包括在参数集、访问单元定界符(AUD)和补充增强信息(SEI)中的一个中。
通过使用RAP画面信息独立地对增强层的RAP画面进行解码的步骤可包括:当参考层的随机访问跳过领导(RASL)画面未被解码时,不对参考所述RASL画面的画面进行解码。
包括在增强层中的画面的时间标识符(temporal_id)可具有大于或等于包括在基本层中的参考画面的时间标识符(temporal_id)的值。
基本层的瞬时解码刷新(IDR)画面、纯净随机访问(CRA)画面和断链访问(BLA)画面中的至少一个画面可被用作RAP画面。
增强层的IDR画面、CRA画面和BLA画面中的至少一个画面可被用作比特流提取点画面和层切换点画面中的至少一个。
所述方法还可包括与其它层独立地对多个层中的一个层进行拼接。
根据本发明构思的另一方面,提供了一种视频编码方法,包括:将构成图像序列的画面编码到包括基本层和增强层的多个层,以产生关于所述多个层的随机访问点(RAP)画面信息;通过使用RAP画面信息来产生比特流,其中,所述多个层均包括RAP画面,从而RAP画面通过仅针对在随机访问点具有RAP画面的层对RAP画面进行解码来被独立地解码。
RAP画面信息可包括指示RAP画面是否位于所述多个层的同一画面顺序计数(POC)的指示符。
RAP画面信息可包括指示存在于多个层的同一POC的RAP画面的类型的标识符。
通过使用RAP画面信息来产生比特流的步骤可包括:通过使用RAP画面信息产生数据单元;通过使用所述数据单元产生比特流,其中数据单元可以是参数集、访问单元定界符(AUD)和补充增强信息(SEI)中的一个。
包括在增强层中的画面的时间标识符(temporal_id)可具有大于或等于包括在基本层中的参考画面的时间标识符(temporal_id)的值。
根据本发明构思的另一方面,提供了一种视频解码设备,包括:接收器,被配置为接收比特流;解码器,被配置为通过使用从比特流获得的包括基本层和增强层的多个层的RAP画面信息独立地对基本层的RAP画面进行解码,并通过使用RAP画面信息独立地对增强层的RAP画面进行解码,其中,独立的解码通过仅针对在随机访问点具有RAP画面的层对RAP画面进行解码来执行。
根据本发明构思的另一方面,提供了一种视频编码设备,包括:编码器,被配置为将构成图像序列的画面编码到包括基本层和增强层的多个层,以产生关于所述多个层的随机访问点(RAP)画面信息;输出单元,被配置为通过使用RAP画面信息来产生比特流,其中,所述多个层均包括RAP画面,从而RAP画面通过仅针对在随机访问点具有RAP画面的层对RAP画面进行解码来被独立地解码。
根据本发明构思的另一方面,提供了一种记录有用于实现根据实施例的视频编码方法的程序的计算机可读记录介质。根据本发明构思的另一方面,提供了一种记录有用于实现根据实施例的视频解码方法的程序的计算机可读记录介质。
具体实施方式
以下,将参照图1a至图7b来描述多层视频编码设备、多层视频解码设备、多层视频编码方法和多层视频解码方法。此外,将参照图8至图20描述根据实施例的基于根据树结构的编码单元的根据实施例的多层视频编码设备、多层视频解码设备、多层视频编码方法和多层视频解码方法。此外,将参照图21至图27来描述可应用根据实施例的多层视频编码设备、多层视频解码设备、多层视频编码方法和多层视频解码方法的各个实施例。以下,“图像”可表示视频的静止图像或运动图像、或视频本身。
首先,将参照图1a至图7b描述根据实施例的多层视频编码设备和多层编码方法、多层视频解码设备和多层视频解码方法。
图1a是根据本发明构思的实施例的多层视频编码设备10的框图。图1b是图1a的多层视频编码设备10的多层视频编码方法11的流程图。
根据实施例的多层视频编码设备10包括层间编码器12和输出单元14。
根据实施例的多层视频编码设备10可根据层对多个视频流进行分类,并根据可伸缩视频编码方法对每个视频流进行编码。根据实施例的多层视频编码设备10对基本层图像和增强层图像进行编码。
例如,可根据可伸缩视频编码方法对多视点视频进行编码。中心视点图像、左视点图像和右视点图像均被编码,其中,中心视点图像可被编码为基本层图像,左视点图像可被编码为第一增强层图像,右视点图像可被编码为第二增强层图像。通过使用输出单元14,基本层图像的编码结果可被输出为基本层流,第一增强层图像和第二增强层图像的编码结果可分别被输出为第一增强层流和第二增强层流。
可选择地,可根据时间分层预测执行可伸缩视频编码方法。可输出通过对基本帧率图像进行编码而产生的包括编码信息的基本层流。还可通过参考基本帧率图像对高帧率图像进行编码,来输出高速帧率的包括编码信息的增强层流。稍后将参照图4b对根据时间分层预测的可伸缩视频编码方法进行描述。
此外,可对基本层和多个增强层执行可伸缩视频编码。当存在至少三个增强层时,可对基本层图像和第一增强层图像至第K增强层图像进行编码。相应地,可将基本层图像的编码结果输出作为基本层流,将第一强层图像至第K增强层图像的编码结果分别输出作为第一增强层流至第K增强层流。
根据实施例的多层视频编码设备10可根据层、基于视频的每个图像的块执行编码。块可具有正方形形状、矩形形状或任意的几何形状,不限于具有预定尺寸的数据单元。根据实施例的块可以是根据树结构的编码单元中的最大编码单元、编码单元、预测单元或变换单元。稍后将参照图8至图20描述基于根据树结构的编码单元的视频编码方法和视频解码方法。
根据实施例的多层视频编码设备10可执行帧间预测以对图像进行预测,在帧间预测中,同一层的图像被相互参考。通过执行帧间预测,可产生指示当前图像和参考图像之间的运动信息的运动矢量以及当前图像和参考图像之间的残差。
此外,根据实施例的多层视频编码设备10可执行用于通过参考基本层图像来对增强层图像进行预测的层间预测。根据实施例的多层视频编码设备10可执行用于通过参考第一增强层图像对第二增强层图像进行预测的层间预测。通过执行层间预测,可产生当前图像与和当前图像的层不同的层的参考图像之间的位置差分量以及不同层的当前图像和参考图像之间的残差。
当根据实施例的多层视频编码设备10允许至少两个增强层时,可根据多层预测结构在一个基本层图像和至少两个增强层图像之间执行层间预测。
可基于数据单元(诸如,编码单元、预测单元或变换单元)执行帧间预测和层间预测。
根据实施例的层间编码器12通过对基本层图像进行编码来产生基本层流。基本层编码器12可在基本层图像之间执行帧间预测。根据实施例的基本层编码器12可对基本层图像之中的能够随机访问的随机访问点(RAP)图像进行编码,而根本不必参考其他图像。
I类型RAP图像可以是瞬时解码刷新(IDR)图像、纯净随机访问(CRA)图像、断链访问(BLA)图像、时间子层访问(TSA)图像和步进式时间子层访问(STSA)图像中的任意一个。
画面顺序计数(POC)是与每个编码的画面相关联的值,并指示编码视频序列(CVS)中的相应画面。通过基于同一CVS中存在的画面的POC的画面之间的相对时间距离来表示POC。输出特定画面的时刻的POC指示该画面相对于同一VCS中的其他画面的相对输出顺序。
纯净随机访问(CRA)画面是仅包括I条带的画面,每个条带是nal_unit_type为4的编码的画面。关于解码顺序和输出顺序两者均在CRA画面之后的所有的编码的画面,可不从解码顺序和输出顺序之一在CRA画面之前的任意画面执行帧间预测。此外,解码顺序在CRA画面之前的至少一个画面在输出顺序方面也在CRA画面之前。
瞬时解码刷新(IDR)画面是IdrPicFlag为1的编码的画面,解码设备在IDR画面的解码处理中将所有参考画面标记为“不被参考”。可对解码顺序在IDR画面之后的所有编码的画面进行编码,而不需从在IDR画面之前的任意一个画面进行帧间预测。解码顺序中的每个编码的视频序列的第一画面是IDR画面。
断链意味着包括在比特流中的两个帧之间的错误链接,错误链接会导致严重的视觉缺陷。断链可能是通过在编码处理期间执行的未指定的操作而产生的。
断链访问(BLA)单元是访问单元的编码的画面是BLA画面的访问单元。断链访问(BLA)画面是nal_unit_type为6或7的随机访问点画面。BLA画面是具有断链的CRA画面。
时间子层访问(TSA)画面用于执行时间层上行链路切换(uplinkswitching)。TSA的VCLNAL单元具有诸如TSA_R或TSA_N的nal_unit_type。步进式时间子层访问(STSA)画面是用于平缓的时间上行链路切换(gradualtemporaluplinkswitching)的画面,并且是每个VCLNAL单元的nal_unit_type为STSA_R或STSA_N的编码的画面。
另外,RAP图像可被领导画面(leadingpicture)和拖尾画面(trailingpicture)参考。领导画面和拖尾画面在解码顺序方面在RAP图像之后,但领导画面在再现顺序方面在RAP图像之前,拖尾画面在解码顺序方面也在RAP图像之后。拖尾画面还可被称为普通画面(normalpicture)。
领导画面可被分类为随机访问可解码领导(RADL)图像和随机访问被跳过领导(RASL)图像。当针对再现顺序在领导画面之后的RAP图像发生随机访问时,RADL图像是可解码的图像,但RASL图像不可解码。
根据实施例的层间编码器12可对基本层图像之中的除基本层RAP图像之外的非RAP图像执行帧间预测。可对基本层RAP图像执行图像中的周围像素被参考的帧内预测。根据实施例的层间编码器12可通过对通过执行帧间预测或帧内预测而产生的结果数据进行编码来产生编码数据。例如,可对包括通过执行帧间预测或帧内预测而产生的结果数据的图像块执行变换、量化、熵编码等。
根据实施例的层间编码器12可产生包括基本层RAP图像的编码数据和剩余的基本层图像的编码数据的基本层流。层间编码器12也可通过使用输出单元14连同基本层流输出经由对基本层图像执行的帧间预测而产生的运动矢量。
此外,根据实施例的层间编码器12可通过对增强层图像进行编码来产生增强层流。当根据实施例的层间编码器12对多个增强层图像进行编码时,根据实施例的层间编码器12通过根据层对增强层图像进行编码来产生增强层流。以下,为便于描述,由根据实施例的层间编码器12执行的用于对增强层进行编码的编码操作将被描述为对一层的增强层图像执行的操作。然而,不仅对一层的增强层图像执行层间编码器12的操作,还对其他层的增强层图像中的每个执行层间编码器12的操作。
根据实施例的层间编码器12可执行基本层图像被参考的层间预测以及同一层的图像被参考的帧间预测,以便对增强层图像进行编码。
仅在参考的图像被预重建时,执行帧间预测或层间预测。因此,当当前层的第一图像将通过参考当前层的另一图像被首先解码时,无法对第一图像进行解码。因此,需要在不参考同一层的另一图像的情况下对可随机访问的RAP图像进行编码。根据实施例,当在RAP图像中发生随机访问时,即使没有同一层的预重建的图像,也可立即对RAP图像进行解码和输出。
基于根据实施例的多层视频编码设备10的多层预测结构,可对第一层图像进行解码,同时根据层切换对第二层图像进行解码。例如,当在多视点图像结构中发生视点转换或在时间分层预测结构中发生时间分层变化时,可在多层预测结构中执行层切换。此时,由于在层切换点不存在同一层的预重建的图像,因此无法执行帧间预测。
根据实施例的层间编码器12可将根据图像的编码数据包括到NAL单元。NAL单元类型信息可指示当前图像是拖尾画面、TSA图像、STSA图像、RADL图像、RASL图像、BLA图像、IDR图像、CRA图像还是VLA图像。
根据本发明构思的实施例的层间编码器12可对多层视频进行编码,从而可对每个层独立地执行随机访问。以下,将描述通过使用根据本发明构思的实施例的层间编码器12对多层视频进行编码的方法。
层间编码器12可针对包括基本层和增强层的多个层独立地对RAP画面进行编码。RAP画面包括IDR画面、CRA画面和BLA画面。层间编码器12可对IDR画面进行编码,使得IDR画面针对所有层被对齐。以下,对齐表示在预定时间点在所有层中出现相同类型的画面。例如,当在多个层中的一个层中在预定时间点的POC将对IDR画面进行编码时,层间编码器12可将相应POC的针对所有层的画面编码为IDR画面。为此,层间编码器12可针对增强层图像对IDR画面进行编码。例如,层间编码器12可产生标识符(nuh_layer_id)大于0的IDR画面。即使不允许帧间预测,层间编码器12也可通过执行层间预测来产生IDR画面。
层间编码器12可产生针对没有层的图像的访问单元或针对所有层的访问单元的IDR画面。例如,IDR类型的NAL单元可以是可开始所有层的解码的IDR访问单元。
层间编码器12可对CRA画面进行编码,而不需在所有层中对CRA画面进行对齐。例如,不需要进行编码使得在所有层中在预定时间点的POC出现CRA画面。层间编码器12可针对增强层产生CRANAL单元。例如,当nul_layer_id大于0时,层间编码器12可使用CRANAL单元类型。即使不允许帧间预测,层间编码器12也可执行层间预测来产生CRA画面。例如,层间编码器12在对CRA画面进行编码时可不使用帧间预测,而是可针对nul_layer_id大于0的CRANAL单元使用层间预测。
层间编码器12不必将画面对齐,使得在产生CRANAL单元时,层之间的CRANAL单元在同一时间点出现。一种CRANAL单元类型可用于具有预定nul_layer_id值的所有VCLNAL单元。例如,一种CRANAL单元类型可仅用于与预定分层标识符相应的NAL单元。另一方面,其他NAL单元类型可用于针对同一访问单元具有不同的预定nul_layer_id值的所有VCLNAL单元。同时,当比特流被拼接(spliced)时,访问单元中的所有CRA画面可被修改为BLA。
基本层的CRA画面可用作比特流的随机访问点,增强层的CRA可用作层切换或比特流提取的点。
层间编码器12可在所有层中不将BLA画面对齐的情况下,对BLA画面进行编码。例如,不需要进行编码使得在所有层中在预定时间点的POC出现BLA画面。层间编码器12可在nuh_layer_id大于0时使用BLANAL单元类型,因此,可在对增强层图像进行编码时对BLA画面进行编码。同时,当在解码期间比特流被拼接时,访问单元中的所有CRA画面可被修改为BLA。当在解码期间层被切换时,相关层的CRA可被修改为BLA。BLA不仅可用于比特流的拼接,还可用于层切换的通知。
如上所述,通过针对每个层独立地对IDR、CRA和BLA进行解码,编码设备可根据层独立地处理随机访问、拼接、比特流提取和层切换。例如,每个层的IDR画面或BLA画面可独立地激活SPS。编码设备可对基本层的IDR画面、CRA画面和BLA画面进行编码使得基本层的IDR画面、CRA画面和BLA画面用作随机访问点,并可对增强层的IDR画面、CRA画面和BLA画面进行编码使得增强层的IDR画面、CRA画面和BLA画面用作比特提取点和层切换点之一。
如果参考层的RASL画面未被编码,则根据本发明构思的实施例的层间编码器12可不对参考RASL画面的画面进行编码。例如,当被参考的层的RASL画面被丢弃时,层间编码器12也可丢弃参考RASL画面的画面。
层间编码器12可通过使用TSANAL单元类型或STSANAL单元类型来对增强层图像进行编码。例如,当nuh_layer_id大于0时,可使用TSANAL单元类型或STSANAL单元类型。层间编码器12可通过将增强层中的画面的temporal_id设置为大于或等于基本层中的参考画面的temporal_id,来对图像进行编码。
层间编码器12可针对各个层允许不同的时间率(temporalrate(temporal_rate)),并允许非对齐时间层切换点。此外,层间编码器12可通过使用诸如VPS、SPS或PPS的参数集或SEI图像来用信号传输指示TSA/STSA是否通过层被对齐以及时间率的标志(temporal_rate_synchronized_flag)。下面的表示出VPS扩展中用信号传输temporal_rate_synchronized_flag的语法。
[表1]
层间编码器12可将temporal_rate_synchronize_all_layers_flag设置为1,以便指示所有层的时间率与基本层的时间率相同。
层间编码器12可将temporal_rate_synchronized_flag[i]设置为1,以便指示第i层的时间率与基本层的时间率相同。
根据本发明构思的实施例的层间编码器12可用信号向解码设备通知RAP画面在预定时间点是否位于访问单元中的所有层中。以下,当RAP画面在预定时间点位于访问单元中的所有层中时,描述为在预定时间点RAP被对齐。
例如,层间编码器12可产生指示RAP画面在预定时间点是否被对齐的标志Irap_present_flag。层间编码器12可通过使用Irap_present_flag产生访问单元定界符(AUD)、补充增强信息(SEI)和参数集之一来以访问单元为单位用信号传输Irap_present_flag。
当在预定时间点RAP画面被对齐时,根据本发明构思的实施例的层间编码器12可用信号向解码设备通知关于在预定时间点被对齐的RAP的类型的信息。
例如,当前访问单元的RAP画面的类型信息可包括在访问单元定界符(AUD)、补充增强信息(SEI)和参数集之一中,并被传输到解码设备。参数集包括视频参数集、序列参数集和画面参数集。
下表示出用信号通知RAP画面在访问单元中是否被对齐和对齐的RAP画面的类型的AUD的语法。Irap_present_flag可被用作指示在当前流中是否提供irap_type的标志。
[表2]
irap_type可具有如下表所示的值。irap_type指示访问单元中的IRAP画面的所有NAL单元的IRAP类型。例如,层间编码器12可将Pic_type的值设置为0,以便指示IDR画面位于相应访问单元中的所有层中。类似地,层间编码器12可将Pic_type的值设置为5,以便指示BLA画面位于相应访问单元的基本层中。
[表3]
irap_type 访问单元中的NAL单元的IRAP画面类型
0 所有层中的IDR类型
1 所有层中的CRA类型
2 基本层中的CRA类型
3 增强层中的CRA类型
4 所有层中的BLA类型
5 基本层中的BLA类型
6 增强层中的BLA类型
解码设备可基于以上信息在不确定所有层的NAL单元类型的情况下,确定预定时间点的所有层中的随机访问点类型是否相同。
层间编码器12可通过使用AUD的pic_type语法来用信号传输IRAP画面类型信息。下表示出指示AUD中的pic_type的语法。
[表4]
由于在当前AUD中pic_type被标记为3比特,因此pic_type总共可表示八种类型。在当前pic_type中,如下表所示,仅三个值用于标记。pic_type是用于根据表5确定针对编码的画面的所有条带的slice_type的标识符。
[表5]
pic_type 编码的画面中可用的SLICE_TYPE
0 I
1 P,I
2 B,P,I
因此,根据本发明构思的实施例的层间编码器12可通过使用作为pic_type中剩余的值的与3至7相应的五个值,来发送当前访问单元的RAP画面的配置信息。
[表6]
如果访问单元是IRAP访问单元或NAL_unit_type包括从16到23的范围内的至少一个NAL单元,则pic_type可指示包括在访问单元中的IRAP画面的类型。
根据另一实施例,根据本发明构思的实施例的层间编码器12可通过使用如下表所示的视频参数集(VPS)的视频可用性信息(VUI)来用信号通知IRAP画面是否被对齐和IRAP画面的类型信息。
[表7]
cross_layer_pic_type_aligned_flag指示属于一个访问单元的所有VCLNAL单元是否具有相同的NAL单元类型。如果cross_layer_pic_type_aligned_flag为1,则属于一个访问单元的所有VCLNAL单元被确定为具有相同的NAL单元类型。cross_layer_pic_type_aligned_flag为0指示属于一个访问单元的所有VCLNAL单元可不具有相同的NAL单元类型。
cross_layer_irap_aligned_flag指示IRAP画面是否通过层被对齐。cross_layer_irap_aligned_flag为1指示当层A的画面A是一个访问单元中的IRAP画面时,属于层A的直接参考层或具有层A作为直接参考层的层的同一访问单元中的每个画面是IRAP画面,并且画面B的VCLNAL单元具有与画面A的NAL单元类型的值相同的值。cross_layer_irap_aligned_flag为0指示不应用以上限制。如果不提供cross_layer_irap_aligned_flag,则可将cross_layer_irap_aligned_flag的值设置为与vps_vui_present_flag的值相同的值。
all_layers_idr_aligned_flag为1指示当针对参考VPS的VCLNAL单元的每个访问单元中的画面是IRAP画面时,同一访问单元中的所有画面是IDR画面并具有相同的NAL单元类型。all_layers_idr_aligned_flag为0指示可不应用这样的限制。如果all_layers_idr_aligned_flag不被提供,则all_layers_idr_aligned_flag的值被设置为0。
图1b是根据本发明构思的实施例的多层视频编码方法的流程图。根据本发明构思的实施例的多层视频编码设备首先将组成图像序列的画面编码为包括基本层和增强层的多个层,以便产生关于多个层的随机访问点(RAP)画面信息(S110)。
接下来,编码设备通过使用RAP画面信息产生比特流(S120)。编码设备可独立地对多个层进行编码,使得多个层均包括RAP画面,从而通过仅在针对在随机访问点具有RAP画面的层对RAP画面进行解码,来独立地对RAP画面进行解码。
编码设备可产生RAP画面信息,使得RAP画面信息包括指示RAP画面在同一画面顺序计数(POC)位于多个层中的指示符。例如,RAP画面信息可包括Irap_present_flag,Irap_present_flag是指示RAP画面在预定时间点是否位于访问单元中的所有层中的标志。
编码设备可产生RAP画面信息,使得RAP画面信息包括指示在多个层的相同POC存在的RAP画面的类型。例如,RAP画面信息可包括Irap_type指示符,Irap_type指示符指示访问单元中的IRAP画面的所有NAL单元的IRAP类型。
编码设备可通过使用RAP画面信息产生参数集、访问单元定界符(AUD)和补充增强信息(SEI)之一的数据单元,并通过使用产生的数据单元来产生比特流。
编码设备可将包括在增强层中画面的时间标识符(temporal_id)设置为大于或等于包括在基本层中的参考画面的时间标识符(temporal_id)的值。
图2a是根据本发明构思的实施例的多层视频解码设备的框图。根据实施例的多层视频解码设备20包括接收器22和层间解码器24。
根据实施例的多层视频解码设备20接收基本层流和增强层流。多层视频解码设备20可根据可伸缩视频编码方法接收包括基本层图像的编码数据的基本层流作为基本层流,并接收包括增强层图像的编码数据的增强层流作为增强层流。
根据实施例的多层视频解码设备20可根据可伸缩视频编码方法对多个层流进行解码。根据实施例的多层视频解码设备20可通过对基本层流进行解码来重建基本层图像,并可通过对增强层流进行解码来重建增强层图像。
例如,可根据可伸缩视频编码方法对多视点视频进行编码。例如,可通过对基本层流进行解码来重建中心视点图像。还可通过对除基本层流以外的第一增强层流进行解码,来重建左视点图像。还可通过对除基本层流之外的第二增强层流进行解码,来重建右视点图像。
可选择地,可根据时间分层预测来执行可伸缩视频编码方法。可通过对基本层流进行解码,来重建基础帧率的图像。还可通过对除基本层流以外的增强层流进行解码,来重建高速帧率的图像。
此外,如果包括三个或更多个增强层,则可从第一增强层流重建针对第一增强层的第一增强层图像,当还对第二增强层流进行解码时,还可重建第二增强层图像。还可通过对除第一增强层流以外的第K增强层流进行解码,来进一步重建第K增强层图像。
根据实施例的多层视频解码设备20根据视频的各个图像的块进行解码。根据实施例的块可以是根据树结构的编码单元之中的,例如,最大编码单元、编码单元、预测单元或变换单元。
根据实施例的多层视频解码设备20可从基本层流和增强层流获得基本层图像和增强层图像的编码的数据,并还可获得通过帧间预测产生的运动矢量和通过层间预测产生的视差信息。
例如,根据实施例的多层视频解码设备20可根据层对帧间预测的数据进行解码,并可在多层之间对层间预测的数据进行解码。还可以根据实施例的编码单元或预测单元为单位执行基于运动补偿和层间解码的重建。
可通过针对每个层流执行运动补偿来重建图像,在运动补偿中通过同一层的帧间预测而预测的图像被相互参考。运动补偿表示通过对通过使用当前图像的运动矢量而确定的参考图像和当前图像的残差进行合成来对当前图像的重建图像进行重建的操作。
此外,根据实施例的多层视频解码设备20可通过参考基本层图像来执行层间解码,以便对通过层间预测而预测的增强层图像进行重建。层间解码是指通过对通过使用当前图像的视差信息而确定的不同层的参考图像和当前图像的残差进行合成来对当前图像的重建图像进行重建的操作。
根据实施例的多层视频解码设备20可执行用于对通过参考第一增强层图像而预测的第二增强层图像进行重建的层间解码。
根据实施例,基本层图像和增强层图像可包括作为可随机访问的点的RAP图像。
层间解码器24通过对接收到的基本层流进行解码来重建基本层图像。详细地,可通过对通过对基本层流进行解析而提取出的符号执行熵解码、反量化、逆变换来对基本层图像的残差进行重建。
层间解码器24可经由接收器22接收基本层图像的量化后的变换系数的比特流。作为对量化后的变换系数执行反量化和逆变换的结果,可重建基本层图像的残差。层间解码器24可通过基本层图像被相互参考的运动补偿来重建基本层图像。
层间编码器24可通过对I类型的基本层RAP图像的量化后的变换系数进行解码来从基本层流重建基本层RAP图像。根据实施例的层间解码器24可在不参考其它基本层图像的情况下对基本层图像之中的作为I类型的基本层RAP图像进行重建。根据实施例的层间解码器24可经由帧内预测来重建I类型的基本层RAP图像的块的像素,在帧内预测中,在同一画面内的当前块的周围像素被使用。
另外,层间解码器24可针对基本层图像之中的除基本层RAP图像之外的基本层图像经由其他基本层图像被参考的运动补偿,来重建基本层图像。层间解码器24可对除基本层RAP图像之外的基本层图像的残差进行重建,并确定基本层图像之中的参考图像以将参考图像补偿所述残差,进而对基本层图像进行重建。
根据实施例的层间解码器24通过对增强层流进行解码来重建增强层图像。详细地,可通过对通过对增强层流进行解析而提取的符号执行熵编码、反量化和逆变换来对各个块的残差进行重建。层间解码器24可直接接收残差的量化的变换系数的比特流,并可通过对该比特流执行反量化和逆变换来重建残差。
为了重建增强层流,根据实施例的层间解码器24可经由从基本层流重建的基本层图像被参考的运动补偿以及同一层的图像被参考的层间解码,来重建增强层图像。
根据实施例的层间解码器24可经由通过使用层间解码器24重建的基本层图像被参考的层间解码,来重建增强层图像。针对预定的增强层,可经由不仅基本层图像被参考而且不是当前增强层的另一增强层的图像也被参考的层间解码,来对当前增强层图像进行重建。
仅在参考的图像被预重建时,执行运动补偿或层间解码。然而,可随机访问的RAP图像不参考同一层的其他图像。因此,当在根据实施例的RAP图像中出现随机访问时,即使在同一层中预重建的图像不可用,RAP图像也可立即被解码。在根据实施例的多层预测结构中,当在基本层图像之中存在RAP图像时,可重建增强层图像之中的与基本层RAP图像相应的增强层RAP图像。
另外,层间解码器24可通过执行同一层的增强层图像被参考的运动补偿,来重建增强层图像。具体地讲,根据实施例的层间解码器24可经由同一层的增强层RAP图像被参考的运动补偿,来重建增强层图像。
对于不是RAP图像的增强层图像,层间解码器24可经由参考同一层参考图像被参考的运动补偿和其它层图像被参考的层间解码来重建增强层图像。
详细地,层间解码器24可通过对增强层流进行解码,来获得除增强层RAP图像之外的增强层图像的运动矢量和残差。层间解码器24可通过使用运动矢量从同一层图像之中确定参考图像,并通过对该参考图像补偿残差来重建增强层图像。可通过使用当前图像的当前块的运动矢量,来从参考图像之中确定参考块。
详细地,层间解码器24可通过对增强层流进行解码,来获得除增强层RAP图像以外的增强层图像的视差信息和残差。层间解码器24可通过使用视差信息从其他层图像之中确定参考图像,并可通过对该参考图像补偿残差来重建增强层图像。
当根据实施例的层间解码器24对多个增强层流进行解码时,根据实施例的层间解码器24可通过根据层对增强层流进行解码来根据层对增强层图像进行重建。以下,为便于描述,将由根据实施例的层间解码器24执行的对增强层流的解码操作描述为对一层的增强层流执行的操作。然而,不仅对一层的增强层流执行层间解码器24的操作,还可对其它层流中的每个执行相同的操作。
为了重建增强层图像,根据实施例的层间解码器24可执行基本层图像被参考的层间解码和同一层的重建的图像被参考的运动补偿。
当第一层流基于根据实施例的多层视频解码设备20的多层预测结构正被解码时,可根据层切换对第二层流进行解码。例如,当在多视点图像结构中出现视点改变或在时间分层预测结构中出现时间层的改变时,可在多层预测结构中执行层切换。此外,在这种情况下,由于不存在在层切换点的同一层的预重建的图像,因此帧间预测不可行。
层间解码器24可针对每个NAL单元获得每个图像的编码数据。可通过对NAL单元类型信息进行解析来确定当前图像是拖尾画面、TSA图像、STSA图像、RADL图像、RASL图像、BLA图像、IDR图像、CRA图像还是VLA图像。
根据本发明构思的实施例的层间解码器24可根据各个层独立地执行随机访问。以下,将描述由层间解码器24执行的根据各个层独立地执行随机访问的方法。
层间解码器24可针对包括基本层和增强层的多个层的编码图像独立地对RAP图像进行编码。RAP画面包括IDR画面、CRA画面和BLA画面。在多层编码图像中,IDR画面被对齐。对齐是指在所有层中在预定时间点的POC出现的画面的类型相同。IDR画面可具有大于0的nuh_layer_id,因此在增强层编码图像中会出现IDR画面,并且IDR画面可被层间预测。可在不包括层的访问单元或针对所有层的访问单元中出现IDR画面。例如,IDR类型NAL单元可指示可开始所有层的解码的完整的IDR访问单元。
在多层编码图像中,CRA画面可不在所有层中被对齐。当nuh_layer_id大于0时,CRANAL单元类型可被使用,因此,在增强层中会出现CRANAL单元。可不对CRA画面进行帧间预测,但可对nuh_layer_id大于0的增强层的CRANAL单元执行层间预测。
不需要在层之间将CRANAL单元对齐。例如,可针对具有预定nuh_layer_id值的所有VCLNAL单元使用一个CRANAL单元类型。当比特流被拼接时,访问单元中的所有CRA画面被修改为BLA。基本层的RA画面可被用作比特流的随机访问点,增强层的CRA画面可用作层切换或比特流提取的点。
在多层编码图像中,BLA画面可不在所有层中被对齐。当nuh_layer_id值大于0时,BLANAL单元类型可被使用,因此,在增强层中会出现BLANAL单元。当比特流被拼接时,访问单元中的所有CRA画面被修改为BLA,当层被切换时,相关层的CRA被修改为BLA。BLA画面不仅可用于比特流的拼接,还可用于层切换的通知。
层间解码器24可通过接收IDR画面在所有层中被对齐的多层编码图像来执行解码。对齐意味着同一类型的画面在所有层中位于预定时间点的POC。例如,如果IDR画面在多个层中的一个层中位于预定时间点的POC,层间解码器24可确定针对所有层的在POC的画面全部是IDR画面,并执行解码。即使不允许帧间预测,层间解码器24可通过执行层间预测来对IDR画面进行解码。
层间解码器24可通过使用增强层中的CRANAL单元独立地对增强层编码图像进行解码。可不对CRA画面执行帧间预测,但可对增强层的CRA画面进行层间预测。
层间解码器24可针对具有预定nuh_layer_id值的所有VCLNAL单元使用一个CRANAL单元类型。当比特流被拼接时,层间解码器24将访问单元中的所有CRA画面修改为BLA。层间解码器24可使用基本层的CRA画面作为比特流的随机访问点。层间解码器24可使用增强层的CRA画面作为层切换或比特流提取的点。
BLANAL单元可出现在增强层中。当比特流被拼接时,层间解码器24将访问单元中的所有CRA画面修改为BLA,当层被切换时,层间解码器24将相关层的CRA修改为BLA。BLA不仅可用于比特流的拼接,还可用于层切换的通知。
如上所述,层间解码器24可通过使用独立地包括在每个层中的IDR、CRA和BLA,根据层独立地处理随机访问,拼接、比特流提取和层切换。例如,层间解码器24可通过使用每个层的IDR画面或BLA画面独立地激活序列参数集(SPS)来执行解码。解码设备可使用基本层的IDR画面、CRA画面或BLA画面作为随机访问点,并使用增强层的IDR画面、CRA画面或BLA画面作为比特流提取和层切换的点之一。
层间解码器24将包括在已发生随机访问或拼接的点的访问单元中的所有CRA画面转换为BLA。在已发生比特流提取和层切换的点,层间解码器24将在已发生比特流提取和层切换之后最近发送的层的CRA画面转换为BLA。层间解码器24可独立地对每个层进行拼接。
图2c和图2d示出根据输出时间点的包括在访问单元中的多个层的画面的类型。图2c示出所有层的CRA画面761、762和763在POC1被对齐的访问单元。如图2c所示,当在拼接点或在随机访问点,包括在一个访问单元中的所有层的画面类型是CRA时,层间解码器24将所有CRA转换为BLA。当层间解码器24对图2c的示例中的POC1执行随机访问时,层间解码器24将与POC1相应的所有层的CRA画面761、762和763转换为BLA并执行随机访问。
图2d示出所有层的CRA画面未被对齐的访问单元。如果访问单元中的一些增强层的画面类型不是CRA画面,则层间解码器24将CRA画面转换为BLA,并在不对非CRA层的所有画面进行编码的情况下跳过非CRA层直到下一RAP出现。在图2d的示例中,POC1的第一增强层的画面不是CRA画面。当在图2d的示例中层间解码器24在POC1的点执行随机访问时,层间解码器24将基本层和第二增强层的CRA画面771和773修改为BLA,从而独立地执行随机访问,但跳过第一增强层的所有画面直到下一CRA画面774出现,通过对下一CRA画面774进行解码独立地执行随机访问。
根据本发明构思的实施例的层间解码器24可从编码设备接收关于如图2c中示出的示例的RAP画面是否在预定时间点位于访问单元中的所有层中的信令。以下,当RAP画面在预定时间点位于访问单元中的所有层中时,描述为RAP在预定时间点被对齐。
例如,层间解码器24可从编码设备接收Irap_present_flag,Irap_present_flag是指示RAP画面在预定时间点是否被对齐的标志。层间解码器24可基于包括在从编码设备接收的访问单元定界符(AUD)、补充增强信息(SEI)消息和参数集之一中的Irap_present_flag的值,确定RAP画面在预定时间点是否被对齐。层间解码器24可不必通过接收如上所述的关于RAP画面是否被对齐的信号,来逐一检查每个层中的画面是不是RAP画面。
当RAP画面在预定时间点被对齐时,层间解码器24可从编码设备接收关于在预定时间点被对齐的RAP的类型的信息。例如,可从访问单元定界符(AUD)、补充增强信息(SEI)消息和参数集之一接收当前访问单元的RAP画面的类型信息。参数集包括视频参数集、序列参数集和画面参数集。
将参照上述的表2来描述该处理。表2示出用于信号通知RAP画面在访问单元中是否被对齐以及对齐的RAP画面的类型的AUD的语法。Irap_present_flag可用作指示irap_type是否被提供的标志。通过如上所述接收关于哪种RAP画面类型被对齐的信号,层间解码器24不必逐一检查每个层的画面是哪种RAP画面类型。
irap_type可具有如上述表3所示的语法。Irap_type指示访问单元中的IRAP画面的所有NAL单元的IRAP类型。例如,如果Pic_type为0,则层间解码器24可确定在相应访问单元中IDR画面位于所有层中。如果Pic_type为5,则层间解码器24可确定在相应访问单元中BLA画面位于基本层中。
解码设备可基于如上所述的Irap_present_flag和irap_type信息检查在预定时间点在所有层中的随机访问点类型是否相同,而不需检查所有层的NAL单元类型。
层间解码器24可通过使用AUD的pic_type语法来确定IRAP画面类型信息。上述表4是指示AUD中的pic_type的语法。
由于在当前AUD中pic_type被标记为3比特,因此pic_type总共可表示八种类型。在当前pic_type中,仅三个值用于信令,如表5所述。
因此,根据本发明构思的实施例的层间解码器24可通过使用与作为pic_type中剩余的值的3至7相应的五个值,来确定当前访问单元的RAP画面的配置信息。
Pic_type基于上述的表5中示出的pic_type的给定的值指示针对编码的画面的所有条带的slice_type值。如果访问单元是IRAP访问单元或Nal_unit_type包括从16到23的范围内的至少一个NAL单元,pic_type可指示包括在访问单元中的IRAP画面的类型。
当参考层的RASL画面未被解码时,根据本发明构思的实施例的层间解码器24还可对参考RASL画面的画面进行解码。例如,当参考的层的RASL画面被丢弃时,层间解码器24还可丢弃参考RASL画面的画面。
根据另一实施例,根据本发明构思的实施例的层间解码器24可通过使用如在上述表7中的视频参数集(VPS)的视频可用性信息(VUI),从编码设备接收关于IRAP画面是否被对齐的信息和IRAP画面的类型信息。参考编码设备对关于与表7相关的语法元素的语义进行描述。
层间解码器24可通过按照与TSA和STSA在基本层中被使用的方式相同的方式在增强层中使用TSA和STSA来执行时间上升链路切换,从而对图像进行解码。层间解码器24可通过使用TSANAL单元类型或STSANAL单元类型对增强层中的图像进行解码。例如,当nuh_layer_id大于0时,TSANAL单元类型或STSANAL单元类型可被使用。层间解码器24可通过将增强层中的画面的temporal_id设置为等于或大于基本层中的参考画面的temporal_id的值,来对图像进行解码。
层间解码器24可针对各个层允许不同的时间率(temporal_rate),并允许非对齐时间层切换点。此外,层间解码器24可从诸如VPS、SPS或PPS或SEI消息获得标志(temporal_rate_synchronized_flag),标志(temporal_rate_synchronized_flag)指示时间率和TSA/STSA是否通过层被对齐。上述的表1表示在VPS扩展中标记temporal_rate_synchronized_flag的语法。
当temporal_rate_synchronize_all_layers_flag的值为1时,层间解码器24可确定所有层的时间率与基本层的时间率相同。当temporal_rate_synchronized_flag[i]为1时,层间解码器24可确定第i层的时间率与基本层的时间率相同。
图2b是根据本发明构思的实施例的由多层视频解码设备执行的多层视频解码方法的流程图。首先,解码设备从比特流获得包括基本层和增强层的多个层的RAP画面信息(S210)。
解码设备可获得指示在所有层中RAP画面是否位于同一画面顺序计数(POC)的指示符,作为RAP画面信息。
解码设备可获取指示所有层的存在于同一POC的RAP画面的类型的标识符,作为RAP画面信息。
解码设备可从参数集、访问单元定界符(AUD)和补充增强信息(SEI)之一获取RAP画面信息。
接下来,解码设备通过使用RAP画面信息独立地对基本层的RAP画面进行解码(S220)。接下来,解码设备通过使用RAP画面信息独立地对增强层的RAP画面进行解码(S230)。
解码设备可通过在随机访问点仅针对具有RAP画面的层对RAP画面进行解码,来执行独立的解码。例如,如果在随机访问点仅基本层具有RAP画面,则解码设备可通过在相应的随机访问点仅对基本层的RAP画面进行解码来执行独立的解码。类似地,如果在随机访问点仅一个增强层具有RAP画面,则解码设备可通过仅在相应随机访问点对相应层的RAP画面进行解码来执行独立的解码。
如果增强层的在作为随机访问点的POC的画面是非RAP画面,则解码设备可以以POC顺序对在非RAP画面之后出现的RAP画面进行解码。例如,解码设备通过针对在作为随机访问点的POCi具有RAP画面的增强层对RAP画面进行解码,来独立地执行随机访问,如果第j增强层的画面不是RAP画面,则跳过不是RAP画面的画面直到按照POC顺序出现RAP画面。当出现RAP画面时,解码设备通过对第j增强层的RAP画面进行解码来独立地针对第j增强层执行随机访问。
如果参考层的随机访问跳过领导(RASL)画面没有被解码,则解码设备也可不对参考RASL画面的画面进行解码。
包括在增强层中的画面的时间标识符(temporal_id)可具有大于或等于包括在基本层中的参考画面的时间标识符(temporal_id)的值。
解码设备可使用瞬时解码刷新(IDR)画面、纯净随机访问(CRA)画面、断链访问(BLA)画面作为RAP画面。解码设备可使用IDR画面、CRA画面和BLA画面中的至少一个作为比特流提取点画面和层切换点画面中的至少一个。解码设备可与其它层独立地对多个层中的任意一层进行拼接。
图3是根据实施例的层间预测结构的示图。
层间编码系统1600包括基本层编码器1610、增强层编码器1660以及基本层编码器1610和增强层编码器1660之间的层间预测器1650。基本层编码器1610和增强层编码器1660可分别示出基本层编码器1410和增强层编码器1420的详细结构。
基本层编码器1610对根据图像的基本层图像序列进行接收和编码。增强层编码器1660对根据图像的增强层图像序列进行接收和编码。稍后将同时描述基本层编码器1610和增强层编码器1660的重叠操作。
输入图像(低分辨率图像或高分辨率图像)通过块划分器1618或1668被划分为最大编码单元、编码单元、预测单元或变换单元。为了对从块划分器1618或1668输出的编码单元进行编码,可根据编码单元的预测单元执行帧内预测或帧间预测。预测切换器1648或1698可基于预测单元的预测模式是帧内预测模式还是帧间预测模式,来使得帧间预测能够通过参考从运动补偿器1640或1690输出的预重建的图像而被执行,或使得帧内预测能够通过使用从帧内预测器1645或1695输出的当前输入图像中的当前预测单元的邻近预测单元而被执行。可经由帧间预测根据预测单元来产生残差信息。
预测单元与相邻图像之间的残差信息根据编码单元的预测单元被输入到变换/量化单元1620或1670。变换/量化单元1620或1670可通过基于编码单元的变换单元执行根据编码单元的变换和量化来输出量化后的变换系数。
缩放/逆变换单元1625或1675可通过根据编码单元的变换单元再次对量化后的变换系数执行缩放和逆变换来产生空间域的残差信息。当预测切换器1648或1698被控制为指向帧间模式时,包括当前预测单元的重建的图像可由于残差信息与预重建的图像或邻近预测单元结合而被产生,重建的图像可被存储在存储单元1630或1680中。可根据接下来被编码的预测单元的预测模式将重建的图像发送到帧内预测器1645或1695或运动补偿器1640或1690。
详细地,在帧间模式下,环路滤波单元1635或1685可根据编码单元对存储在存储单元1630或1680中的重建的图像执行去块滤波和样点自适应偏移(SAO)滤波中的至少一个。可对编码单元和包括在编码单元中的预测单元和变换单元中的至少一个执行去块滤波和SAO滤波中的至少一个。
去块滤波是用于减轻数据单元的块现象的滤波,SAO滤波是用于补偿根据数据编码和解码被变换的像素值的滤波。可根据预测单元将由环路滤波单元1635或1685滤波的数据发送到运动补偿器1640或1690。随后,为了对从块划分器1618或1668输出的后来的编码单元进行编码,可产生从运动补偿器1640或1690和块划分器1618或1668输出的当前重建的图像与后来的编码单元之间的残差信息。
这样,可根据输入图像的编码单元重复以上编码操作。
此外,对于层间预测,增强层编码器1660可参考存储在基本层编码器1610的存储单元1630中的重建的图像。基本层编码器1610的编码控制器1615可控制基本层编码器1610的存储单元1630,以将基本层编码器1610的重建的图像发送到增强层编码器1660。在层间预测器1650中,环路滤波单元1655可对从基本层编码器1610的存储单元1630输出的基本层重建的图像执行去块滤波、SAO滤波和ALF滤波中至少一个。当基本层图像的分辨率和增强层图像的分辨率彼此不同时,层间预测器1650可对基本层重建图像进行上采样(up-sample),随后将基本层重建图像发送到增强层编码器1660。当根据增强层编码器1660的切换器1698的控制执行层间预测时,可通过参考通过层间预测器1650发送的基本层重建图像来对增强层图像执行层间预测。
为了对图像进行编码,可针对编码单元、预测单元和变换单元设置各种编码模式。例如,可将深度或划分信息(划分标志)设置为编码单元的编码模式。可将预测模式、预测类型、帧内方向信息或参考列表信息设置为预测单元的编码模式。可将变换深度或划分信息设置为变换单元的编码模式。
基本层编码器1610可基于通过应用用于编码单元的各种深度、各种预测模式、各种分区类型、各种帧内方向和用于预测单元的各种参考列表以及用于变换单元的各种变换深度执行编码的结果,确定具有最高编码效率的编码深度、预测模式、分区类型、帧内方向/参考列表和变换深度。由基本层编码器1610确定的编码模式不限于此。
基本层编码器1610的编码控制器1615可控制每个组件,使得各种编码模式之一适当地应用于所述每个组件。此外,编码控制器1615可控制增强层编码器1660以通过参考基本层编码器1610的编码结果确定编码模式或残差信息,以进行增强层编码器1660的层间编码。
例如,增强层编码器1660可使用基本层编码器1610的编码模式作为用于增强层图像的编码模式,或可通过参考基本层编码器1610的编码模式来确定增强层图像的编码模式。基本层编码器1610的编码控制器1615可对基本层编码器1610的增强层编码器1660的编码控制器1665的控制信号进行控制以使用基本层编码器1610的当前编码模式,以便确定增强层编码器1660的当前编码模式。
可与根据层间预测方法的图3的层间编码系统1600类似地,实现根据层间预测方法的层间解码系统。换句话说,多层视频的层间解码系统可接收基本层比特流和增强层比特流。层间解码系统的基本层解码器可通过对基本层比特流进行解码来重建基本层图像。层间解码系统的增强层解码器可通过使用基本层重建图像和解析出的编码信息对增强层比特流进行解码,来重建增强层图像。
图4a是多层图像的多层预测结构40的示图。
在图4a的多层预测结构40,按照再现顺序POC布置图像。根据多层预测结构40的再现顺序和解码顺序,沿水平方向布置同一层的图像。
此外,垂直地布置具有相同的POC值的图像。图像的POC值指示组成视频的图像的再现顺序。在多层预测结构40中标记的“POCX”指示位于相应列的图像的再现顺序,X越小,再现顺序越早,X越大,再现顺序越晚。
因此,根据多层预测结构40的再现顺序,根据POC值(再现顺序)沿水平方向布置每个层的图像。此外,位于与基本层图像相同的列上的第一增强层图像和第二增强层图像具有相同的POC值(再现顺序)。
针对每个层,四个连续的图像组成单个画面组(GOP)。每个GOP包括连续的锚画面之间的图像和单个锚画面。
锚画面是随机访问点,对于此,当从根据视频的再现顺序(即,根据POC)被布置的图像选择了预定再现位置时,POC最接近于该再现位置的锚画面被再现。基本层图像包括基本层锚画面41、42、43、44和45,第一增强层图像包括第一增强层锚画面141、142、143、144和145,第二增强层图像包括第二增强层锚画面241、242、243、244和245。
可按照GOP顺序对多层图像进行再现和预测(重建)。首先,根据图4a的多层预测结构40的再现顺序和解码顺序,针对每个层,包括在GOP0中的图像可被重建和再现,随后包括在GOP1中的图像可被重建和再现。也就是说,包括在各个GOP中的图像可按照GOP0、GOP1、GOP2和GOP3的顺序被重建和再现。
根据多层预测结构40的再现顺序和解码顺序,对图像执行层间预测和帧间预测。在多层预测结构40中,箭头从其开始的图像是参考图像,箭头结束的图像是通过使用参考图像预测的图像。
具体地讲,在多层预测结构40的解码顺序中,图像根据每个图像的预测(重建)顺序水平地被布置。也就是说,相对早地对相对位于左侧的图像进行预测(重建),相对晚地对相对位于右侧的图像进行预测(重建)。随着通过参考相对早地被重建的图像来对随后的图像进行预测(重建),指示沿多层预测结构40的解码顺序的同一层的图像之间的预测方法的箭头均沿从相对左侧的图像到相对右侧的图像的方向。
可对基本层图像的预测结果进行编码并随后输出为基本层图像流。此外,可将第一增强层图像的预测编码结果输出为第一增强层流,并可将第二增强层图像的预测编码结果输出为第二增强层流。
仅对基本层图像执行帧间预测。换句话说,没有通过参考其他图像来对I类型的锚画面41至45进行预测,但通过参考其他基本层图像来对B类型和b类型的图像进行预测。通过参考根据POC值在B类型的图像之前的I类型的锚画面和后来的I类型的锚画面对B类型的图像进行预测。通过参考根据POC值在b画面类型的图像之前的I类型的锚画面和后来的B类型的图像或通过参考根据POC值在b画面类型的图像之前的B类型的图像和后来的I类型的锚画面,对b类型的图像进行预测。
对第一增强层图像和第二增强层图像执行参考基本层图像的层间预测以及参考同一视点的图像的帧间预测。
与基本层图像相同,对第一增强层图像执行帧间预测,对第二增强层图像执行帧间预测。第一增强层图像和第二增强层图像的第一增强层锚画面141至145和第二增强层锚画面241至245不参考同一层的图像,但剩余的图像通过参考同一层的图像被预测。
然而,第一增强层图像和第二增强层图像的第一增强层锚画面141至145和第二增强层锚画面241至245也是参考具有相同的POC值的基本层锚画面41至45的P类型的图像。
由于对排除第一增强层锚画面141至145和第二增强层锚画面241至245的第一增强层图像和第二增强层图像不仅执行帧间预测,还执行参考具有相同的POC的基本层图像的层间预测,因此排除第一增强层锚画面141至145和第二增强层锚画面241至245的第一增强层图像和第二增强层图像是B类型的图像或b类型的图像。
用于对图像进行再现的重建处理与预测处理类似。然而,仅在每个图像的参考图像被重建之后,通过使用重建的参考图像对每个图像进行重建。
首先,可经由帧间运动补偿来重建基本层图像。当I类型的基本层锚画面41至45被重建时,B类型的基本层图像可经由参考基本层锚画面41至45的帧间运动补偿被重建。此外,b类型的基本层图像可经由参考I类型或B类型的基本层重建图像的帧间运动补偿被重建。
可经由参考基本层图像的层间预测和参考同一层的图像的帧间预测分别对第一增强层图像和第二增强层图像进行编码。
换句话说,对于第一增强层图像的重建处理,在基本视点的参考图像被重建之后,可经由参考基本层图像的层间视差补偿对第一增强层图像进行重建。此外,在第一增强层的参考图像被重建之后,第一增强层图像可经由参考第一增强层的重建的参考图像的运动补偿被重建。
此外,在基础视点的参考图像被重建之后,第二增强层图像可经由参考基本视点的参考图像的层间视差补偿被重建。在第二增强层的参考图像被重建之后,第二增强层图像可经由参考第二增强层的重建的参考图像的运动补偿被重建。
图4b是根据时间分层编码方法和时间分层解码方法的多层预测结构的示图。
可根据时间分层预测结构40执行可伸缩视频编码方法。时间分层预测结构40包括分层B类型图像55、56、57、58、59、60、61、62和63的预测结构。在等级0的预测结构中,执行I类型图像51和54的帧间预测以及P类型图像52和53的帧间预测。在等级1的预测结构,执行参考I类型图像51和54以及P类型图像52和53的B类型图像55、56和57的帧间预测。在等级2的预测结构中,执行参考I类型图像51和54、P类型图像52和53以及B类型图像55、56和57的帧间预测。
“temporal_id”是用于识别预测等级的数字,随着各个图像被输出,帧率会增加。例如,可对等级0的图像51、52、53和54进行解码并以15Hz的帧率进行输出,还对等级1的图像55、56和57进行解码和输出,帧率增加到30Hz,还对等级2的图像58、59、60、61、62和63进一步进行解码和输出,帧率可增加到60Hz。
根据实施例,当使用SVC方法实现时间分层预测结构50时,等级0的图像被编码为基本层图像,等级1的图像可被编码为第一增强层图像,等级2的图像可被编码为第二增强层图像。
在图4a和图4b的多层预测结构的解码处理期间,为了经由运动补偿或层间解码对图像进行重建,可使用预重建的基本层图像或者可使用预重建的增强层图像。然而,当发生层切换或随机访问请求被产生时,在解码顺序方面在当前RAP图像之前的图像可不被预重建。在这种情况下,通过参考在解码顺序方面在当前RAP图像之前的图像而预测的图像不能被重建。
以下,将参照图5a至图7b描述在随机访问请求根据Rap图像的类型被产生时执行的解码操作。
图5a和图5b示出根据两个实施例的IDR图像的再现顺序和解码顺序。
在图5a中,GOP505、515和525中的每个的大小是8。B0至B6指示同一GOP中的根据再现顺序布置的B类型图像的标识号。
IDR图像是被独立地编码的图像。当对IDR图像进行解码时,重建的图像可都被显示为“无法用于参考”。在解码顺序方面在IDR图像之后的图像可被重建,而不需执行使用重建顺序在IDR图像之前的图像的帧间预测。根据解码顺序的编码的视频序列的第一图像的画面类型是IDR画面。
例如,GOP515的B类型图像可在再现顺序方面在IDR图像之前,但在解码顺序方面在IDR图像之后。此外,GOP515的B类型图像不参考在解码顺序方面在IDR图像之前的其他图像。GOP525的B类型图像在解码顺序和再现顺序方面在IDR图像之后,并且不参考在解码顺序方面在IDR图像之前的其它图像。
当发生随机访问时,在解码顺序方面在随机访问点之前的图像不能够被重建。在图5a中,GOP515的B类型的图像在解码顺序方面在IDR图像之前,但可通过参考预重建的IDR图像来重建。在这种情况下,由于GOP515的B类型图像都可被解码和输出,因此GOP515的B类型图像可以是RADL图像。因此,GOP515的B类型图像都可被再现,因此,随机访问点和随机访问再现开始的点可相互匹配。
在图5b中,由于GOP515的B类型图像不需要从随机访问点基于再现顺序被解码,因此随着随机访问从IDR图像开始,GOP525的B类型图像被再现。
当IDR图像被使用时,根据再现顺序的所有图像可从随机访问点开始被自然地重建,而不存在丢失的图像,但编码效率会减小。
图6a和图6b示出根据两个实施例的CRA图像的再现顺序和解码顺序。
CRA图像是仅包括I类型条带的图像。当对CRA图像进行解码时,存储在解码画面缓存器(DPB)中的重建的图像可被显示为“无法用于参考”。在解码顺序和再现顺序方面在CRA图像之后的图像可被重建,而不需执行使用在解码顺序和再现顺序方面在IDR图像之前的图像的帧间预测。在解码顺序方面在CRA图像之前的图像在再现顺序方面也在CRA图像之前。
在解码顺序和再现顺序方面在CRA图像之后的图像可以是普通画面。因此,普通画面可使用与CRA图像相同的GOP中的其他普通画面之中的至少一个图像。
CRA画面可以是根据解码顺序的编码视频序列的第一个图像。然而,CRA画面可根据不发生随机访问的一般再现而位于比特流的中间。
例如,在图6a中,GOP615的B类型图像在再现顺序方面在CRA图像之前,但在解码顺序方面在CRA图像之后。GOP625的B类型图像是在解码顺序和再现顺序方面在CRA图像之后的普通画面,但不参考在解码顺序方面在IDR图像之前的其他图像。然而,GOP615的一些B类型图像可参考在解码顺序方面在CRA图像之前的其他图像。
在图6b的随机访问点,由于GOP615的B类型图像参考在随机访问点之前的图像,因此GOP615的B类型图像无法被重建。GOP615的B类型图像是在重建处理期间被跳过的RASL图像。因此,随着随机访问再现从CRA图像开始,GOP625的B类型图像可被立即重建和再现。
图7a和图7b示出根据两个实施例的BLA图像的再现顺序和解码顺序。
比特流切片是将另一比特流连接到当前比特流的RAP图像的位置的操作。其他比特流被连接的点被称为“断链”。能够进行比特流切片的位置处的RAP的NAL单元类型被指示为BLA图像。
例如,参照图7a,BLA图像具有与CRA图像的再现顺序和解码顺序类似的再现顺序和解码顺序。BLA图像在解码顺序方面在GOP716的作为领导画面的B类型图像之后。BLA图像在再现顺序方面在GOP726的作为普通画面的B类型图像之前。领导画面和普通画面在解码顺序方面在BLA图像之后。
领导画面之中的B3至B6是参考GOP716的BLA图像和其它图像的RASL图像。然而,领导画面之中的B0至B2是参考在解码顺序方面在BLA图像之前的GOP706的图像的RADL图像。
因此,当在图7b中的BLA图像中发生随机访问时,可跳过作为RASL图像的B0至B2的重建,并可对作为RADL图像的B3至B6进行重建。因此,可根据再现顺序从B3输出RADL图像。
由于在以上参照图4b描述的分层预测结构中发生时间分层改变或层切换,因此可将TSA图像用作层切换可行的位置。TSA图像与CRA图像类似。在对较低层图像进行重建的同时从TSA图像对较高层图像进行重建的层切换是可行的。例如,具有较低的“temporal_id”值的层是较低层。同一层上的在解码顺序方面在TLA图像之后的图像或TLA图像的较高层图像无法参考在解码顺序方面在TLA图像之前的先前TLA图像的同一层或较高层的图像。由于TLA图像不是最低层图像,因此TLA图像的“temporal_id”不为0。
在上文中,参照图4b至图7b,描述了用于随机访问的RAP类型。当在对单个层中的视频流进行重建时产生了随机访问请求或发生层切换时,可从RAP图像对图像进行重建。然而,当在多层中的特定层发生随机访问并且特定层的图像被重建时,与特定层的图像相应的其他层的图像需要被精确地重建。此外,当在特定层中发生层切换或随机访问请求被产生时,在DPB中不存在将被参考的图像,因此,RASL图像的重建被跳过,与RASL图像相应的其他层的图像的重建也可被跳过。
因此,根据实施例的多层视频编码设备10可根据层在随机访问点或层切换点对同一NAL单元类型的RAP图像进行布置,并也可根据层对同一位置上的RASL图像或RSDL图像进行布置。此外,多层视频解码设备20可根据层在随机访问点或层切换点对同一NAL单元类型的RPA图像进行重建。此外,多层视频解码设备20可根据层对同一位置处的RSDL图像进行重建,并对RASL图像进行重建。当在特定层中发生随机访问时,可根据层对同一位置处的RPA图像和RSDL图像进行重建,并可跳过同一位置处的RASL图像的重建。
例如,可对与基本层IDR图像相应的位置处的增强层IDR图像进行重建。也可对在与基本层CRA图像相应的位置处的增强层CRA图像进行重建。也可对在与基本层BLA图像相应的位置处的增强层BLA图像进行重建。
可选择地,多层视频编码设备10可对与基本层普通画面相应的增强层的CRA图像、RSDL/RASL图像或普通画面进行布置。根据实施例的多层视频解码设备20可对与基本层普通画面相应的增强层的CRA图像、RSDL/RASL图像或普通画面进行重建。
此外,增强层图像的时间分层编号大于基本层图像的时间分层号,即,“temporal_id”。
基于根据实施例的多层视频编码设备10和多层视频解码设备20,即使在多层预测结构中发生随机访问或层切换时,也可根据层对同一位置处的图像进行重建或忽略。因此,可获得用于层间预测的参考图像,并可精确地对齐每个层的输出图像。
图1a的多层视频编码设备10可通过根据图像块执行帧内预测、帧间预测、层间预测、变换和量化来产生采样点,并通过对采样点执行熵编码来输出比特流。为了输出视频编码结果(即,基本层图像流和增强层图像流),根据实施例的多层视频编码设备10可与安装在其中的内部视频编码处理器或外部的视频编码处理器协同地进行操作,以便执行包括变换和量化的视频编码操作。根据实施例的多层视频编码设备10的内部视频编码处理器可以是单独的处理器,或可选择地,视频编码设备、中央处理设备或图形处理设备可包括视频编码处理模块以执行视频编码操作。
此外,图2a的多层视频解码设备20对接收到的基本层图像流和接收到的增强层图像流进行解码。换句话说,根据针对基本层图像流和增强层图像流的图像块执行反量化、逆变换、帧内预测和运动补偿(帧间运动补偿和层间视差补偿),以从基本层图像流对基本层图像的采样点进行重建,并从增强层图像流对增强层图像的采样点进行重建。为了输出被产生为解码结果的重建的图像,根据实施例的多层视频解码设备20可与安装在其中的内部视频解码处理器或外部视频解码处理器协同地进行操作,以便执行包括反量化、逆变换和预测/补偿的视频重建操作。根据实施例的多层视频解码设备20的内部视频解码处理器可以是单独的处理器,或可选择地,视频解码设备、中央处理设备或图形处理设备可包括视频解码处理模块以执行视频重建操作。
如上所述,根据实施例的多层编码设备10和根据实施例的多层视频解码设备20可根据树结构将视频数据的块划分为编码单元,并且编码单元、预测单元和变换单元可用于编码单元的层间预测或帧间预测。以下,将参照图8至图20描述基于根据树结构的编码单元和变换单元的视频编码方法、视频编码设备、视频解码方法和视频解码设备。
原理上讲,在针对多层视频的编码处理和解码处理期间,可单独地执行针对基本层图像的编码处理和解码处理以及针对增强层图像的编码处理和解码处理。换句话说,当对多层视频执行层间预测时,可相互参考单层视频的编码结果和解码结果,但根据单层视频执行单独的编码处理和解码处理。
因此,由于如以下参照图8至图20描述的基于根据树结构的编码单元的视频编码处理和视频解码处理是用于对单层视频进行处理的视频编码处理和视频解码处理,因此仅执行帧间预测和运动补偿。然而,如以上参照图1a至图7b所述,为了对多层视频进行编码和解码,对基本层图像和增强层图像执行层间预测和层间补偿。
因此,为了使根据实施例的多层视频编码设备10基于根据树结构的编码单元对多层视频进行编码,根据实施例的多层视频编码设备10可包括与多层视频的层数一样多的图8的视频编码设备100,以便根据每个单层视频执行视频编码,从而控制每个视频编码设备100对分配的单层视频进行编码。此外,多层视频编码设备10可通过使用每个视频编码设备100的各个单一视点的编码结果,来执行视点间预测。因此,多层视频编码设备10可产生包括根据层的编码结果的基本层图像流和增强层图像流。
类似地,为了使根据实施例的多层视频解码设备20基于根据树结构的编码单元对多层视频进行解码,多层视频解码设备10可包括与多层视频的层数一样多的图9的视频解码设备200,以针对接收到的基本层图像流和接收到的增强层图像流根据层执行视频解码,从而控制每个视频解码设备200对分配的单层视频进行解码。此外,多层视频解码设备200可通过使用每个视频解码设备200的各个单层视频的解码结果,来执行层间补偿。因此,多层视频解码设备20可产生根据层重建的基本层图像和增强层图像。
图8是根据本发明构思的实施例的基于根据树结构的编码单元的视频编码设备100的框图。
涉及基于根据树结构的编码单元的视频预测的根据实施例的视频编码设备100包括编码单元确定器120和输出单元130。以下,为便于描述,涉及基于根据树结构的编码单元的视频预测的根据实施例的视频编码设备100将被简称为“视频编码设备100”。
编码单元确定器120可基于图像的当前画面的最大编码单元来划分当前画面,其中,最大编码单元是具有最大尺寸的编码单元。如果当前画面大于最大编码单元,则可将当前画面的图像数据划分为至少一个最大编码单元。根据实施例的最大编码单元可以是尺寸为32×32、64×64、128×128或256×256等的数据单元,其中,数据单元的形状是宽度和长度为2的若干次方的正方形。
根据实施例的编码单元可由最大尺寸和深度表征。深度表示编码单元从最大编码单元被空间划分的次数,并且随着深度加深,根据深度的较深层编码单元可从最大编码单元被划分到最小编码单元。最大编码单元的深度为最高深度,最小编码单元的深度为最低深度。由于随着最大编码单元的深度加深,与每个深度相应的编码单元的尺寸减小,因此与更高深度相应的编码单元可包括多个与更低深度相应的编码单元。
如上所述,当前画面的图像数据根据编码单元的最大尺寸被划分为最大编码单元,并且每个最大编码单元可包括根据深度被划分的较深层编码单元。由于根据深度对根据实施例的最大编码单元进行划分,因此可根据深度对包括在最大编码单元中的空间域的图像数据进行分层分类。
可预先确定编码单元的最大深度和最大尺寸,其中,所述最大深度和最大尺寸限制最大编码单元的高度和宽度被分层划分的总次数。
编码单元确定器120对通过根据深度对最大编码单元的区域进行划分而获取的至少一个划分区域进行编码,并且根据所述至少一个划分区域来确定用于输出最终编码的图像数据的深度。换言之,编码单元确定器120通过根据当前画面的最大编码单元以根据深度的较深层编码单元对图像数据进行编码,并选择具有最小编码误差的深度,来确定深度。将确定的编码深度和根据确定的编码深度的编码的图像数据输出到输出单元130。
基于与等于或低于最大深度的至少一个深度相应的较深层编码单元,对最大编码单元中的图像数据进行编码,并且基于每个较深层编码单元比较对图像数据进行编码的结果。在对较深层编码单元的编码误差进行比较之后,可选择具有最小编码误差的深度。可针对每个最大编码单元选择至少一个编码深度。
随着编码单元根据深度而被分层地划分以及随着编码单元的数量增加,最大编码单元的尺寸被划分。另外,即使在一个最大编码单元中编码单元与同一深度相应,仍通过分别测量每个编码单元的图像数据的编码误差来确定是否将与同一深度相应的每个编码单元划分到更低深度。因此,即使当图像数据被包括在一个最大编码单元中时,编码误差仍可根据所述一个最大编码单元中的区域而不同,因此编码深度可根据图像数据中的区域而不同。因此,可在一个最大编码单元中确定一个或更多个编码深度,并且可根据至少一个深度的编码单元来对最大编码单元的图像数据进行划分。
因此,根据实施例的编码单元确定器120可确定包括在最大编码单元中的根据树结构的编码单元。根据实施例的“根据树结构的编码单元”包括最大编码单元中包括的所有较深层编码单元中的与确定为编码深度的深度相应的编码单元。可根据最大编码单元的同一区域中的深度来分层地确定编码深度的编码单元,并可在不同区域中独立地确定编码深度的编码单元。类似地,可与另一区域中的编码深度独立地确定当前区域中的编码深度。
根据实施例的最大深度是与从最大编码单元到最小编码单元的划分次数相关的索引。根据实施例的第一最大深度可表示从最大编码单元到最小编码单元的总划分次数。根据实施例的第二最大深度可表示从最大编码单元到最小编码单元的深度等级的总数。例如,当最大编码单元的深度是0时,对最大编码单元划分一次的编码单元的深度可被设置为1,对最大编码单元划分两次的编码单元的深度可被设置为2。这里,如果最小编码单元是最大编码单元被划分四次的编码单元,则存在深度0、1、2、3和4的深度等级,并因此第一最大深度可被设置为4,第二最大深度可被设置为5。
可根据最大编码单元执行预测编码和变换。根据最大编码单元,基于根据等于或小于最大深度的深度的较深层编码单元来执行预测编码和变换。
由于每当根据深度对最大编码单元进行划分时,较深层编码单元的数量增加,因此对随着深度加深而产生的所有较深层编码单元执行包括预测编码和变换的编码。为了便于描述,在最大编码单元中,现在将基于当前深度的编码单元来描述预测编码和变换。
根据实施例的视频编码设备100可不同地选择用于对图像数据进行编码的数据单元的尺寸或形状。为了对图像数据进行编码,执行诸如预测编码、变换和熵编码的操作,此时,可针对所有操作使用相同的数据单元,或者可针对每个操作使用不同的数据单元。
例如,视频编码设备100不仅可选择用于对图像数据进行编码的编码单元,还可选择不同于编码单元的数据单元,以便对编码单元中的图像数据执行预测编码。
为了在最大编码单元中执行预测编码,可基于根据实施例的与编码深度相应的编码单元(即,基于不再被划分为与更低深度相应的编码单元的编码单元)来执行预测编码。以下,不再被划分且成为用于预测编码的基本单元的编码单元现在将被称为“预测单元”。通过划分预测单元而获取的分区可包括预测单元或通过对预测单元的高度和宽度中的至少一个进行划分而获取的数据单元。分区是编码单元的预测单元被划分的数据单元,并且预测单元可以是具有与编码单元相同的尺寸的分区。
例如,当2N×2N(其中,N是正整数)的编码单元不再被划分并且编码单元成为2N×2N的预测单元时,分区的尺寸可以是2N×2N、2N×N、N×2N或N×N。根据实施例的分区类型的示例包括通过对预测单元的高度或宽度进行对称地划分而获取的对称分区、通过对预测单元的高度或宽度进行非对称地划分(诸如,1:n或n:1)而获取的分区、通过对预测单元进行几何地划分而获取的分区、以及具有任意形状的分区。
预测单元的预测模式可以是帧内模式、帧间模式和跳过模式中的至少一个。例如,可对2N×2N、2N×N、N×2N或N×N的分区执行帧内模式或帧间模式。另外,可仅对2N×2N的分区执行跳过模式。可对编码单元中的一个预测单元独立地执行编码,从而选择具有最小编码误差的预测模式。
根据实施例的视频编码设备100不仅可基于用于对图像数据进行编码的编码单元还可基于与编码单元不同的数据单元,来对编码单元中的图像数据执行变换。为了在编码单元中执行变换,可基于具有小于或等于编码单元的尺寸的变换单元来执行变换。例如,变换单元可包括帧内模式的数据单元和帧间模式的变换单元。
以与根据树结构的编码单元类似的方式,编码单元中的变换单元可被递归地划分为更小尺寸的区域。因此,可基于根据变换深度的具有树结构的变换单元,对编码单元中的残差数据进行划分。
还可在根据实施例的变换单元中设置变换深度,其中,变换深度指示通过对编码单元的高度和宽度进行划分而达到变换单元的划分次数。例如,在2N×2N的当前编码单元中,当变换单元的尺寸是2N×2N时,变换深度可以是0,当变换单元的尺寸是N×N时,变换深度可以是1,当变换单元的尺寸是N/2×N/2时,变换深度可以是2。换句话说,还可根据变换深度设置具有树结构的变换单元。
根据与编码深度相应的编码单元的编码信息不仅需要关于编码深度的信息,还需要关于与预测和变换相关的信息。因此,编码单元确定器120不仅确定具有最小编码误差的编码深度,还确定预测单元中的分区类型、根据预测单元的预测模式以及用于变换的变换单元的尺寸。
下面将参照图10至图20详细描述根据实施例的最大编码单元中的根据树结构的编码单元以及确定预测单元/分区和变换单元的方法。
编码单元确定器120可通过使用基于拉格朗日乘数的率失真优化来测量根据深度的较深层编码单元的编码误差。
输出单元130在比特流中输出最大编码单元的图像数据和关于根据编码深度的编码模式的信息,其中,所述最大编码单元的图像数据基于由编码单元确定器120确定的至少一个编码深度而被编码。
可通过对图像的残差数据进行编码来获取编码的图像数据。
关于根据深度的编码模式的信息可包括关于编码深度的信息、关于预测单元中的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。
可通过使用根据深度的划分信息来定义关于编码深度的信息,其中,根据深度的划分信息指示是否对更低深度而不是当前深度的编码单元执行编码。如果当前编码单元的当前深度是编码深度,则对当前编码单元中的图像数据进行编码并输出,因此可将划分信息定义为不将当前编码单元划分到更低深度。相反,如果当前编码单元的当前深度不是编码深度,则对更低深度的编码单元执行编码,并因此可将当前深度的划分信息定义为将当前编码单元划分为更低深度的编码单元。
如果当前深度不是编码深度,则对被划分到更低深度的编码单元的编码单元执行编码。由于更低深度的至少一个编码单元存在于当前深度的一个编码单元中,因此对更低深度的每个编码单元重复执行编码,并因此可对具有相同深度的编码单元递归地执行编码。
由于针对一个最大编码单元确定根据树结构的编码单元,并且针对编码深度的编码单元确定关于至少一个编码模式的信息,因此可针对一个最大编码单元确定关于至少一个编码模式的信息。另外,由于根据深度对最大编码单元的数据进行分层划分,因此最大编码单元的数据的编码深度可根据位置而不同,因此可针对最大编码单元的数据设置关于编码深度和编码模式的信息。
因此,根据实施例的输出器130可将关于相应编码深度和相应编码模式的编码信息分配给包括在最大编码单元中的编码单元、预测单元和最小单元中的至少一个。
根据实施例的最小单元是通过将构成最低深度的最小编码单元划分为4份而获取的正方形数据单元。根据实施例的最小单元可以是可包括在最大编码单元中所包括的所有编码单元、预测单元、分区单元和变换单元中的最大正方形数据单元。
例如,通过输出器130输出的编码信息可被分类为根据较深层编码单元的编码信息和根据预测单元的编码信息。根据较深层编码单元的编码信息可包括关于预测模式的信息和关于分区尺寸的信息。根据预测单元的编码信息可包括关于帧间模式的估计方向的信息、关于帧间模式的参考图像索引的信息、关于运动矢量的信息、关于帧内模式的色度分量的信息、以及关于帧内模式的插值方法的信息。
根据画面、条带或GOP定义的关于编码单元的最大尺寸的信息和关于最大深度的信息可被插入到比特流的头、序列参数集或画面参数集中。
还可通过比特流的头、序列参数集或画面参数集来输出关于针对当前视频允许的变换单元的最大尺寸的信息、以及关于变换单元的最小尺寸的信息。输出器130可对与预测相关的参考信息、预测信息、条带类型信息等进行编码并输出。
在根据实施例的视频编码设备100中,较深层编码单元可以是通过将更高深度(更高一层)的编码单元的高度或宽度划分成两份而获取的编码单元。换言之,当当前深度的编码单元的尺寸是2N×2N时,更低深度的编码单元的尺寸是N×N。另外,尺寸为2N×2N的具有当前深度的编码单元可包括最多4个具有更低深度的编码单元。
因此,视频编码设备100可基于考虑当前画面的特征而确定的最大编码单元的尺寸和最大深度,通过针对每个最大编码单元确定具有最优形状和最优尺寸的编码单元来形成具有树结构的编码单元。另外,由于可通过使用各种预测模式和变换方法中的任意一个对每个最大编码单元执行编码,因此可考虑各种图像尺寸的编码单元的特征来确定最优编码模式。
因此,如果以传统宏块对具有高分辨率或大数据量的图像进行编码,则每个画面的宏块的数量极度增加。因此,针对每个宏块产生的压缩信息的条数增加,因此难以发送压缩的信息,并且数据压缩效率降低。然而,通过使用根据实施例的视频编码设备,由于在考虑图像的尺寸的同时增加编码单元的最大尺寸,并同时在考虑图像的特征的同时调整编码单元,因此可提高图像压缩效率。
以上参照图1a描述的多层视频编码设备10可包括与层数一样多的视频编码设备100,以便根据多层视频中的层对单层图像进行编码。例如,基本层编码器12可包括一个视频编码设备100,增强层编码器14可包括与增强层的数量一样多的视频编码设备100。
当视频编码设备100对基本层图像进行编码时,编码单元确定器120可针对每个最大编码单元基于根据树结构的每个编码单元确定用于帧间预测的预测单元,并可根据预测单元执行帧间预测。
即使在视频编码设备100对增强层图像进行编码时,编码单元确定器120可针对每个最大编码单元确定根据树结构的编码单元和预测单元,并可根据每个预测单元执行帧间预测。
当编码单元确定器120对基本层图像进行编码时,可分配能够随机访问的RPA图像,并可对基本层RA图像执行帧内预测。当发生随机访问或层切换时,即使不存在预重建的图像,也可重建RPA图像。
当编码单元确定器120对增强层流进行编码时,可对在与基本层流的RPA图像相应的位置处的与基本层RAP图像相同的RPA类型的RPA图像进行编码。编码单元确定器120对增强层RPA图像执行帧内预测。
编码单元确定器120可通过参考RPA图像和另一非RPA图像中的至少一个对非RPA图像执行帧间预测。在与基本层RASL图像相应的位置处的增强层图像也是RASL图像,并可参考在后的RPA图像和在前的RPA图像。在与基本层流的RADL图像相应的位置处的增强层图像也是RADL图像,并可仅参考在后的RPA图像。与基本层普通画面相应的增强层图像可被编码为CRA图像、RADL/RASL图像或普通画面。
图9是根据本发明构思的实施例的基于根据树结构的编码单元的视频解码设备200的框图。
涉及基于根据树结构的编码单元的视频预测的根据实施例的视频解码设备200包括接收器210、图像数据和编码信息提取器220和图像数据解码器230。为了便于描述,涉及基于根据树结构的编码单元的视频预测的根据实施例的视频解码设备200将被简称为“视频编码设备200”。
用于根据实施例的视频解码设备200的解码操作的各种术语(诸如编码单元、深度、预测单元、变换单元和关于各种编码模式的信息)的定义与参照图8和视频编码设备100描述的定义相同。
接收器210接收和解析编码视频的比特流。图像数据和编码信息提取器220从解析的比特流,针对每个编码单元提取编码的图像数据,并将提取的图像数据输出到图像数据解码器230,其中,编码单元具有根据每个最大编码单元的树结构。图像数据和编码信息提取器220可从关于当前画面的头、序列参数集或画面参数集提取关于当前画面的编码单元的最大尺寸的信息。
另外,图像数据和编码信息提取器220从解析的比特流,根据每个最大编码单元,提取根据树结构的编码单元的关于编码深度和编码模式的信息。提取的关于编码深度和编码模式的信息被输出到图像数据解码器230。换句话说,比特流中的图像数据被划分为最大编码单元,使得图像数据解码器230针对每个最大编码单元对图像数据进行解码。
可针对关于与编码深度相应的至少一个编码单元的信息设置根据最大编码单元的关于编码深度和编码模式的信息,与编码深度相应的关于编码模式的信息可包括关于相应编码单元的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。另外,根据深度的划分信息可被提取为关于编码深度的信息。
由图像数据和编码信息提取器220提取的根据每个最大编码单元的关于编码深度和编码模式的信息是关于这样的编码深度和编码模式的信息:所述编码深度和编码模式被确定为在编码器(诸如,根据实施例的视频编码设备100)根据每个最大编码单元对根据深度的每个较深层编码单元重复地执行编码时产生最小编码误差。因此,视频解码设备200可通过根据产生最小编码误差的编码模式对数据进行解码来重建图像。
由于根据实施例的关于编码深度和编码模式的编码信息可被分配给相应的编码单元、预测单元和最小单元中的预定数据单元,因此图像数据和编码信息提取器220可根据预定数据单元,提取关于编码深度和编码模式的信息。如果相应最大编码单元的关于编码深度和编码模式的信息根据预定数据单元被记录,则可将被分配相同的关于编码深度和编码模式的信息的预定数据单元推断为是包括在同一最大编码单元中的数据单元。
图像数据解码器230可基于根据最大编码单元的关于编码深度和编码模式的信息,通过对每个最大编码单元中的图像数据进行解码来重建当前画面。换言之,图像数据解码器230可基于提取出的关于包括在每个最大编码单元中的具有树结构的编码单元之中的每个编码单元的分区类型、预测模式和变换单元的信息,对编码的图像数据进行解码。解码处理可包括预测(包含帧内预测和运动补偿)和逆变换。
图像数据解码器230可基于关于根据编码深度的编码单元的预测单元的分区类型和预测模式的信息,根据每个编码单元的分区和预测模式,执行帧内预测或运动补偿。
此外,图像数据解码器230可针对每个编码单元读取关于根据树结构的变换单元的信息,以便基于每个编码单元的变换单元执行逆变换,以针对每个最大编码单元来执行逆变换。经过逆变换,可重建编码单元的空间域的像素值。
图像数据解码器230可通过使用根据深度的划分信息来确定当前最大编码单元的编码深度。如果划分信息指示图像数据在当前深度中不再被划分,则当前深度是编码深度。因此,图像数据解码器230可通过使用用于与当前深度相应的每个编码单元的关于预测单元的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息,对当前最大编码单元中的图像数据进行解码。
换言之,可通过观察被设置用于编码单元、预测单元和最小单元中的预定数据单元的编码信息来收集包含包括相同划分信息的编码信息的数据单元,并且收集的数据单元可被认为是将由图像数据解码器230以相同编码模式进行解码的一个数据单元。因此,可通过获取关于每个编码单元的编码模式的信息来对当前编码单元进行解码。
以上参照图1a描述的多层视频编码设备10可包括与视频解码设备200中的层数一样多的图像数据解码器230,以便产生用于根据多层视频的层进行帧间预测的参考图像。例如,基本层编码器12可包括一个图像数据解码器230,增强层编码器14可包括与增强层的数量一样多的视频解码设备200。
此外,以上参照图2a和图3a描述的多层视频解码设备20可包括与视点数量一样多的多个视频解码设备200,以便通过对接收到的基本层图像流和接收到的增强层图像流进行解码来重建基本层图像和增强层图像。例如,基本层图像解码器22可包括一个视频解码设备200,增强层解码器24可包括与增强层的数量一样多的视频解码设备200。
当基本层图像流被接收到时,视频解码设备200的图像数据解码器230可将由图像数据和编码信息提取器220从基本层图像流提取的基本层图像的采样点划分为最大编码单元的根据树结构的编码单元。图像数据解码器230可通过对基本层图像的采样点的具有树结构的编码单元执行根据用于帧间预测的预测单元的运动补偿,来重建基本层图像。
当增强层图像流被接收到时,视频解码设备200的图像数据解码器230可将由提取器220从增强层图像流提取的增强层图像的采样点划分为根据树结构的编码单元。图像数据解码器230可通过对增强层图像的采样点的编码单元执行根据用于帧间预测的预测单元的运动补偿,来对增强层图像进行重建。
当图像数据解码器230对基本层流进行解码时,可基于NAL单元类型对RPA图像进行重建。当发生随机访问或层切换时,即使在不存在预重建的图像时,也可对RPA图像进行重建。
当图像数据解码器230对增强层流进行解码时,可对在与基本层流的RPA图像相应的位置处的与基本层RAP图像相同的RPA类型的RPA图像进行重建。图像数据解码器230可对增强层RPA图像执行帧内预测。
图像数据解码器230可通过参考RPA图像和另一非RPA图像中的至少一个来对非RPA图像执行运动补偿。在与基本层RASL图像相应的位置处的增强层图像也是RASL图像,并可参考在后的RPA图像和在前的RPA图像。在与基本层流的RADL图像相应的位置处的增强层图像也是RADL图像,并仅可参考在后的RPA图像。与基本层普通画面相应的增强层图像可被重建为CRA图像、RADL/RASL图像或普通画面。
因此,视频解码设备200可获取与在对每个最大编码单元递归地执行编码时产生最小编码误差的至少一个编码单元有关的信息,并可使用所述信息来对当前画面进行解码。换句话说,可对每个最大编码单元中的被确定为最优编码单元的具有树结构的编码单元的图像数据进行解码。
因此,即使图像数据具有高分辨率或具有大数据量,也可通过使用编码单元的尺寸和编码模式来有效地对图像数据进行解码和重建,其中,所述编码单元的尺寸和编码模式是通过使用从编码器接收的关于最优编码模式的信息,根据图像数据的特性而被自适应地确定的。
图10是用于描述根据本发明构思的实施例的编码单元的构思的示图。
编码单元的尺寸可被表示为宽度×高度,并且可以是64×64、32×32、16×16和8×8。64×64的编码单元可被划分为64×64、64×32、32×64或32×32的分区,32×32的编码单元可被划分为32×32、32×16、16×32或16×16的分区,16×16的编码单元可被划分为16×16、16×8、8×16或8×8的分区,8×8的编码单元可被划分为8×8、8×4、4×8或4×4的分区。
在视频数据310中,分辨率为1920×1080,编码单元的最大尺寸为64,最大深度为2。在视频数据320中,分辨率为1920×1080,编码单元的最大尺寸为64,最大深度为3。在视频数据330中,分辨率为352×288,编码单元的最大尺寸为16,最大深度为1。图10中示出的最大深度表示从最大编码单元到最小解码单元的划分总次数。
如果分辨率高或数据量大,则编码单元的最大尺寸可能较大,从而不仅提高编码效率,而且准确地反映图像的特征。因此,具有比视频数据330更高分辨率的视频数据310和320的编码单元的最大尺寸可以是64。
由于视频数据310的最大深度是2,因此由于通过对最大编码单元划分两次,深度加深至两层,因此视频数据310的编码单元315可包括长轴尺寸为64的最大编码单元和长轴尺寸为32和16的编码单元。由于视频数据330的最大深度是1,因此由于通过对最大编码单元划分一次,深度加深至一层,因此视频数据330的编码单元335可包括长轴尺寸为16的最大编码单元和长轴尺寸为8的编码单元。
由于视频数据320的最大深度是3,因此由于通过对最大编码单元划分三次,深度加深至3层,因此视频数据320的编码单元325可包括长轴尺寸为64的最大编码单元和长轴尺寸为32、16和8的编码单元。随着深度加深,可准确地表达详细信息。
图11是根据实施例的基于编码单元的图像编码器400的框图。
图像编码器400执行视频编码设备100的编码单元确定器120中对图像数据进行编码所需的操作。换言之,帧内预测器420在当前帧405中根据预测单元对帧内模式下的编码单元执行帧内预测,帧间预测器415根据预测单元通过使用当前图像405和从重建画面缓存器410获取的参考图像对帧间模式下的编码单元执行帧间预测。当前图像405可被划分为最大编码单元,然后最大编码单元可被顺序编码。在这方面,可对将被划分为根据树结构的编码单元的最大编码单元进行编码。
通过从与当前图像405的编码的编码单元有关的数据去除从帧内预测器420或帧间预测器415输出的与每个模式的编码单元有关的预测数据来产生残差数据,并且所述残差数据根据变换单元通过变换器425和量化器430被输出为量化后的变换系数。量化后的变换系数通过反量化器445和逆变换器450被重建为空间域中的残差数据。重建的空间域中的残差数据被添加到从帧间预测器420或帧间预测器输出的每个模式的编码单元的预测数据,并因此被重建为当前图像405的编码单元的空间域的数据。重建的空间域中的数据与从帧内预测器420或帧间预测器输出的用于每个模式的编码单元的预测数据相加,因此被重建为用于当前图像405的编码单元的空间域中的数据。空间域中的重建的数据通过去块滤波器455和SAO执行器460被产生为重建的图像。产生的重建的图像被存储在重建画面缓存器410中。重建画面缓存器410中存储的重建图像可被用作用于另一图像的帧间预测的参考图像。被变换器425和量化器430量化的变换系数可通过熵编码器435被输出为比特流440。
为了将图像编码器400应用于视频编码设备100,图像编码器400的所有元件(即,帧间预测器410、帧内预测器420、变换器425、量化器430、熵编码器435、反量化器445、逆变换器450、去块器455和SAO执行器460)根据每个最大编码单元基于根据树结构的编码单元中的每个编码单元执行操作。
具体地,帧内预测器420和帧间预测器415可在考虑当前最大编码单元的最大尺寸和最大深度的情况下确定具有树结构的编码单元中的每个编码单元的分区类型和预测模式,变换器425可确定是否在具有树结构的编码单元中的每个编码单元中划分具有四叉树结构的变换单元。
图12是根据实施例的基于编码单元的图像解码器500的框图。
熵解码器515从比特流505解析将被解码的编码图像数据和解码所需的关于编码的信息。编码图像数据是量化后的变换系数,其中,残差数据是通过反量化器520和逆变换器525从所述量化后的变换系数重建的。
帧内预测器540根据每个预测单元对帧内模式下的编码单元执行帧内预测。帧间预测器535通过使用从重建画面缓存器530获取的参考图像,针对每个预测单元对当前图像405中的帧间模式下的编码单元执行帧间预测。
经过帧内预测器540和帧间预测器535的关于每个模式的编码单元的预测数据和残差数据被求和,并因此关于当前图像405的编码单元的空间域中的数据可被重建,重建的空间域中的数据可通过去块器545和SAO执行器550被输出为重建图像560。重建画面缓存器530中存储的重建图像可被输出为参考图像。
为了在视频解码设备200的图像数据解码器230中对图像数据进行解码,可执行根据实施例的图像解码器500的熵解码器515之后的操作。
为了将图像解码器500应用于根据实施例的视频解码设备200中,图像解码器500的所有元件(即,熵解码器515、量化器520、逆变换器525、帧间预测器535、去块器545和SAO执行器550)可针对每个最大编码单元基于根据树结构的每个编码单元执行操作。
具体地,帧内预测器540和帧间预测器535可针对根据树结构的编码单元中的每个编码单元确定分区类型和预测模式,逆变换器525可针对每个编码单元确定是否划分具有四叉树结构的变换单元。
图11的编码操作和图12的解码操作分别描述为对单层中的视频流的编码操作和解码操作。因此,如果图1a的编码器12对两个或更多个层的视频流进行编码,可针对每个层包括图像编码器400。类似地,如果图2a的解码器26对两个或更多个层的视频流进行解码,则可针对每个层包括图像解码器500。
图13是示出根据本发明构思的实施例的根据深度的较深层编码单元以及分区的示图。
视频编码设备100和视频解码设备200使用分层编码单元以考虑图像的特征。可根据图像的特征自适应地确定编码单元的最大高度、最大宽度和最大深度,或可由用户不同地设置编码单元的最大高度、最大宽度和最大深度。可根据编码单元的预定最大尺寸来确定根据深度的较深层编码单元的尺寸。
根据实施例,在编码单元的分层结构600中,编码单元的最大高度和最大宽度均是64,最大深度是3。在此情况下,最大深度是指编码单元从最大编码单元到最小编码单元被划分的总次数。由于深度沿着分层结构600的垂直轴加深,因此较深层编码单元的高度和宽度均被划分。另外,预测单元和分区沿着分层结构600的水平轴被示出,其中,所述预测单元和分区是对每个较深层编码单元进行预测编码的基础。
换言之,编码单元610是在分层结构600中的最大编码单元,其中,深度为0,尺寸(即,高度乘宽度)为64×64。深度沿着垂直轴加深,存在尺寸为32×32和深度为1的编码单元620、尺寸为16×16和深度为2的编码单元630、尺寸为8×8和深度为3的编码单元640。尺寸为8×8和深度为3的编码单元640是最小编码单元。
编码单元的预测单元和分区根据每个深度沿着水平轴被排列。换言之,如果尺寸为64×64和深度为0的编码单元610是预测单元,则可将预测单元划分成包括在编码单元610中的分区,即,尺寸为64×64的分区610、尺寸为64×32的分区612、尺寸为32×64的分区614或尺寸为32×32的分区616。
类似地,可将尺寸为32×32和深度为1的编码单元620的预测单元划分成包括在编码单元620中的分区,即,尺寸为32×32的分区620、尺寸为32×16的分区622、尺寸为16×32的分区624和尺寸为16×16的分区626。
类似地,可将尺寸为16×16和深度为2的编码单元630的预测单元划分成包括在编码单元630中的分区,即,包括在编码度单元630中的尺寸为16×16的分区、尺寸为16×8的分区632、尺寸为8×16的分区634和尺寸为8×8的分区636。
类似地,可将尺寸为8×8和深度为3的编码单元640的预测单元划分成包括在编码单元640中的分区,即,包括在编码单元640中的尺寸为8×8的分区、尺寸为8×4的分区642、尺寸为4×8的分区644和尺寸为4×4的分区646。
为了确定最大编码单元610的编码深度,根据实施例的视频编码设备100的编码单元确定器120对包括在最大编码单元610中的与每个深度相应的每个编码单元执行编码。
随着深度加深,包括具有相同范围和相同尺寸的数据的根据深度的较深层编码单元的数量增加。例如,需要四个与深度2相应的编码单元来覆盖包括在与深度1相应的一个编码单元中的数据。因此,为了根据深度比较对相同数据进行编码的结果,与深度1相应的编码单元和四个与深度2相应的编码单元均被编码。
为了针对多个深度之中的当前深度执行编码,可沿着分层结构600的水平轴,通过对与当前深度相应的编码单元中的每个预测单元执行编码,来针对当前深度,选择最小编码误差。可选地,随着深度沿着分层结构600的垂直轴加深,可通过针对每个深度执行编码来比较根据深度的最小编码误差,以搜索最小编码误差。在编码单元610中的具有最小编码误差的深度和分区可被选为编码单元610的编码深度和分区类型。
图14是用于描述根据本发明构思的实施例的编码单元710和变换单元之间的关系的示图。
根据实施例的视频编码设备100或根据实施例的视频解码设备200针对每个最大编码单元,根据具有小于或等于最大编码单元的尺寸的编码单元,对图像进行编码或解码。可基于不大于相应编码单元的数据单元,来选择用于在编码期间进行变换的变换单元的尺寸。
例如,在根据实施例的视频编码设备100或根据实施例的视频解码设备200中,如果当前编码单元710的尺寸是64×64,则可通过使用尺寸为32×32的变换单元720来执行变换。
此外,可通过对小于64×64的尺寸为32×32、16×16、8×8和4×4的变换单元中的每一个执行变换,来对尺寸为64×64的编码单元710的数据进行编码,然后可选择针对原始数据具有最小编码误差的变换单元。
图15是用于描述根据本发明构思的实施例的根据深度的编码单元的编码信息的示图。
根据实施例的视频编码设备100的输出器130可对与编码深度相应的每个编码单元的关于分区类型的信息800、关于预测模式的信息810以及关于变换单元的尺寸的信息820进行编码,并将信息800、信息810以及信息820作为关于编码模式的信息来发送。
信息800指示关于通过划分当前编码单元的预测单元而获取的分区的类型的信息,其中,分区是用于对当前编码单元进行预测编码的数据单元。例如,可将尺寸为2N×2N的当前编码单元CU_0划分成以下分区中的任意一个:尺寸为2N×2N的分区802、尺寸为2N×N的分区804、尺寸为N×2N的分区806和尺寸为N×N的分区808。这里,关于分区类型的信息800被设置为指示以下分区之一:尺寸为2N×N的分区804、尺寸为N×2N的分区806和尺寸为N×N的分区808。
信息810指示每个分区的预测模式。例如,信息810可指示对由信息800指示的分区执行的预测编码的模式,即,帧内模式812、帧间模式814或跳过模式816。
信息820指示当对当前编码单元执行变换时所基于的变换单元。例如,变换单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826或第二帧间变换单元828。
根据实施例的视频解码设备200的图像数据和编码信息提取器210可根据每个较深层编码单元,提取并使用用于解码的信息800、信息810和信息820。
图16是根据本发明构思的实施例的根据深度的较深层编码单元的示图。
划分信息可用来指示深度的改变。划分信息指示当前深度的编码单元是否被划分成更低深度的编码单元。
用于对深度为0和尺寸为2N_0×2N_0的编码单元900进行预测编码的预测单元910可包括以下分区类型的分区:尺寸为2N_0×2N_0的分区类型912、尺寸为2N_0×N_0的分区类型914、尺寸为N_0×2N_0的分区类型916和尺寸为N_0×N_0的分区类型918。图16仅示出了通过对称地划分预测单元而获取的分区类型912至918,但是分区类型不限于此,并且预测单元的分区可包括非对称分区、具有预定形状的分区和具有几何形状的分区。
根据每种分区类型,对尺寸为2N_0×2N_0的一个分区、尺寸为2N_0×N_0的两个分区、尺寸为N_0×2N_0的两个分区和尺寸为N_0×N_0的四个分区重复地执行预测编码。可对尺寸为2N_0×2N_0、N_0×2N_0、2N_0×N_0和N_0×N_0的分区执行帧内模式和帧间模式下的预测编码。仅对尺寸为2N_0×2N_0的分区执行跳过模式下的预测编码。
如果在尺寸为2N_0×2N_0、N_0×2N_0和2N_0×N_0的分区类型912至916中的一个分区类型中编码误差最小,则可不将预测单元910划分到更低深度。
如果在分区类型918中编码误差最小,则深度从0改变到1以在操作920中对分区类型918进行划分,并对深度为2和尺寸为N_0×N_0的编码单元930重复地执行编码来搜索最小编码误差。
用于对深度为1和尺寸为2N_1×2N_1(=N_0×N_0)的编码单元930进行预测编码的预测单元940可包括以下分区类型的分区:尺寸为2N_1×2N_1的分区类型942、尺寸为2N_1×N_1的分区类型944、尺寸为N_1×2N_1的分区类型946以及尺寸为N_1×N_1的分区类型948。
如果在尺寸为N_1×N_1的分区类型948中编码误差最小,则深度从1改变到2以在操作950中对分区类型948进行划分,并对深度为2和尺寸为N_2×N_2的编码单元960重复执行编码来搜索最小编码误差。
当最大深度是d时,根据每个深度的划分操作可被执行直到深度变成d-1时,并且划分信息可被编码直到深度是0到d-2之一时。换句话说,当编码被执行直到在与d-2的深度相应的编码单元在操作970中被划分之后深度是d-1时,用于对深度为d-1和尺寸为2N_(d-1)×2N_(d-1)的编码单元980进行预测编码的预测单元990可包括以下分区类型的分区:尺寸为2N_(d-1)×2N_(d-1)的分区类型992、尺寸为2N_(d-1)×N_(d-1)的分区类型994、尺寸为N_(d-1)×2N_(d-1)的分区类型996和尺寸为N_(d-1)×N_(d-1)的分区类型998。
可对多个分区类型中的尺寸为2N_(d-1)×2N_(d-1)的一个分区、尺寸为2N_(d-1)×N_(d-1)的两个分区、尺寸为N_(d-1)×2N_(d-1)的两个分区、尺寸为N_(d-1)×N_(d-1)的四个分区重复地执行预测编码,以搜索具有最小编码误差的分区类型。
即使当分区类型998具有最小编码误差时,由于最大深度是d,因此深度为d-1的编码单元CU_(d-1)也不再被划分到更低深度,用于构成当前最大编码单元900的编码单元的编码深度被确定为d-1,并且当前最大编码单元900的分区类型可被确定为N_(d-1)×N_(d-1)。此外,由于最大深度是d,因此不针对深度为d-1的编码单元952设置划分信息。
数据单元999可以是用于当前最大编码单元的“最小单元”。根据实施例的最小单元可以是通过将最低编码深度的最小编码单元划分成4份而获取的正方形数据单元。通过重复地执行编码,根据实施例的视频编码设备100可通过比较根据编码单元900的深度的编码误差来选择具有最小编码误差的编码深度以确定深度,并将相应分区类型和预测模式设置为编码深度的编码模式。
这样,在所有深度1至d中对根据深度的最小编码误差进行比较,并且具有最小编码误差的深度可被确定为编码深度。编码深度、预测单元的分区类型和预测模式可作为关于编码模式的信息被编码并发送。另外,由于编码单元从0的深度被划分到编码深度,因此仅将编码深度的划分信息设置为0,并且将除了编码深度以外的深度的划分信息设置为1。
根据实施例的视频解码设备200的图像数据和编码信息提取器220可提取并使用关于编码单元900的编码深度和预测单元的信息,来对分区912进行解码。根据实施例的视频解码设备200可通过使用根据深度的划分信息,将划分信息为0的深度确定为编码深度,并且使用关于相应深度的编码模式的信息来进行解码。
图17至图19是用于描述根据本发明构思的实施例的在编码单元、预测单元和变换单元之间的关系的示图。
编码单元1010是最大编码单元中的与由根据实施例的视频编码设备100确定的编码深度相应的编码单元。预测单元1060是每个与编码深度相应的每个编码单元1010的预测单元的分区,变换单元1070是与编码深度相应的每个编码单元的变换单元。
当在编码单元1010中最大编码单元的深度是0时,编码单元1012和1054的深度是1,编码单元1014、1016、1018、1028、1050和1052的深度是2,编码单元1020、1022、1024、1026、1030、1032和1048的深度是3,编码单元1040、1042、1044和1046的深度是4。
在预测单元1060中,通过划分编码单元来获取一些分区1014、1016、1022、1032、1048、1050、1052和1054。换句话说,分区1014、1022、1050和1054中的分区类型的尺寸是2N×N,分区1016、1048和1052中的分区类型的尺寸是N×2N,分区1032的分区类型的尺寸为N×N。编码单元1010的预测单元和分区小于或等于每个编码单元。
在小于变换单元1052的数据单元中的变换单元1070中,对变换单元1052的图像数据执行频率变换或逆频率变换。另外,在尺寸和形状方面,变换单元1014、1016、1022、1032、1048、1050、1052和1054不同于预测单元1060中的编码单元1014、1016、1022、1032、1048、1050、1052和1054。换句话说,根据实施例的视频编码设备100和根据实施例的视频解码设备200也可对同一编码单元中的数据单元独立地执行帧内预测、运动估计、运动补偿、频率变换和逆频率变换。
因此,对最大编码单元的每个区域中的具有分层结构的每个编码单元递归地执行编码来确定最优编码单元,从而可获取具有递归树结构的编码单元。编码信息可包括关于编码单元的划分信息、关于分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。表8示出可由根据实施例的视频编码设备100和根据实施例的视频解码设备200设置的编码信息。
[表8]
根据实施例的视频编码设备100的输出单元130可输出关于具有树结构的编码单元的编码信息,根据实施例的视频解码设备200的编码信息提取器220可从接收到的比特流提取关于具有树结构的编码单元的编码信息。
划分信息指示是否将当前编码单元划分成更低深度的编码单元。如果当前深度d的划分信息是0,则当前编码单元不再被划分成更低深度的深度是编码深度,从而可针对编码深度来定义关于分区类型、预测模式和变换单元的尺寸的信息。如果当前编码单元根据划分信息被进一步划分,则对更低深度的四个划分编码单元独立地执行编码。
预测模式可以是帧内模式、帧间模式和跳过模式中的一种。可在所有分区类型中定义帧内模式和帧间模式,可仅在尺寸为2N×2N的分区类型中定义跳过模式。
关于分区类型的信息可指示通过对称地划分预测单元的高度或宽度而获取的尺寸为2N×2N、2N×N、N×2N和N×N的对称分区类型,以及通过非对称地划分预测单元的高度或宽度而获取的尺寸为2N×nU、2N×nD、nL×2N和nR×2N的非对称分区类型。可通过按1:3和3:1来划分预测单元的高度来分别获取尺寸为2N×nU和2N×nD的非对称分区类型,可通过按1:3和3:1来划分预测单元的宽度来分别获取尺寸为nL×2N和nR×2N的非对称分区类型。
可将变换单元的尺寸设置成帧内模式下的两种类型和帧间模式下的两种类型。换句话说,如果变换单元的划分信息是0,则变换单元的尺寸被设置为2N×2N,即当前编码单元的尺寸。如果变换单元的划分信息是1,则可通过对当前编码单元进行划分来获取变换单元。另外,如果尺寸为2N×2N的当前编码单元的分区类型是对称分区类型,则变换单元的尺寸可被设置为N×N,如果当前编码单元的分区类型是非对称分区类型,则变换单元的尺寸可被设置为N/2×N/2。
根据实施例,关于根据树结构的编码单元的编码信息可被指定给与编码深度相应的编码单元、预测单元和最小单元中的至少一个。与编码深度相应的编码单元可包括包含相同编码信息的预测单元和最小单元中的至少一个。
因此,通过比较邻近数据单元的编码信息来确定邻近数据单元是否被包括在与编码深度相应的同一编码单元中。另外,通过使用数据单元的编码信息来确定与编码深度相应的相应编码单元,并因此可确定最大编码单元中的编码深度的分布。
因此,如果基于邻近数据单元的编码信息来对当前编码单元进行预测,则可直接参考并使用与当前编码单元邻近的较深层编码单元中的数据单元的编码信息。
可选地,如果基于邻近数据单元的编码信息来对当前编码单元进行预测,则使用数据单元的编码信息来搜索与当前编码单元邻近的数据单元,并可参考搜索到的邻近编码单元以对当前编码单元进行预测。
图20是用于描述根据表8的编码模式信息的编码单元、预测单元和变换单元之间的关系的示图。
最大编码单元1300包括多个深度的编码单元1302、1304、1306、1312、1314、1316和1318。这里,由于编码单元1318是一个编码深度的编码单元,因此划分信息可被设置成0。可将关于尺寸为2N×2N的编码单元1318的分区类型的信息设置成以下分区类型中的一种:尺寸为2N×2N的分区类型1322、尺寸为2N×N的分区类型1324、尺寸为N×2N的分区类型1326、尺寸为N×N的分区类型1328、尺寸为2N×nU的分区类型1332、尺寸为2N×nD的分区类型1334、尺寸为nL×2N的分区类型1336和尺寸为nR×2N的分区类型1338。
变换单元的划分信息(TU尺寸标志)是一种类型的变换索引。与变换索引相应的变换单元的尺寸可根据编码单元的预测单元类型或分区类型而改变。
例如,当分区类型被设置为对称(即,分区类型1322、1324、1326或1328)时,如果变换单元的划分信息(TU尺寸标志)是0,则设置尺寸为2N×2N的变换单元1342,如果TU尺寸标志是1,则设置尺寸为N×N的变换单元1344。
当分区类型被设置成非对称(即分区类型1332、1334、1336或1338)时,如果TU尺寸标志是0,则设置尺寸为2N×2N的变换单元1352,如果TU尺寸标志是1,则设置尺寸为N/2×N/2的变换单元1354。
参照图20,TU尺寸标志是具有值0或1的标志,但是TU尺寸标志不限于1比特,并且变换单元可在TU尺寸标志从0增加时根据树结构被分层划分。变换单元的划分信息(TU尺寸标志)可以是变换索引的示例。
在这种情况下,可通过使用根据实施例的变换单元的TU尺寸标志以及变换单元的最大尺寸和最小尺寸来表示实际上已使用的变换单元的尺寸。视频编码设备100能够对最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标志进行编码。对最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标志进行编码的结果可被插入SPS。视频解码设备200可通过使用最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸来对视频进行解码。
例如,(a)如果当前编码单元的尺寸是64×64并且最大变换单元尺寸是32×32,则(a-1)当TU尺寸标志为0时,变换单元的尺寸可以是32×32,(a-2)当TU尺寸标志为1时,变换单元的尺寸可以是16×16,(a-3)当TU尺寸标志为2时,变换单元的尺寸可以是8×8。
作为另一示例,(b)如果当前编码单元的尺寸是32×32并且最小变换单元尺寸是32×32,则(b-1)当TU尺寸标志为0时,变换单元的尺寸可以是32×32。这里,由于变换单元的尺寸不能够小于32×32,因此TU尺寸标志不能够被设置为除了0以外的值。
作为另一示例,(c)如果当前编码单元的尺寸是64×64并且最大TU尺寸标志为1,则TU尺寸标志可以是0或1。这里,TU尺寸标志不能够被设置为除了0或1以外的值。
因此,如果定义最大TU尺寸标志为“MaxTransformSizeIndex”,最小变换单元尺寸为“MinTransformSize”,当TU尺寸标志为0时的变换单元尺寸为“RootTuSize”,则可通过等式(1)来定义可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”:
CurrMinTuSize=max(MinTransformSize,RootTuSize/(2^MaxTransformSizeIndex))…(1)
与可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”相比,当TU尺寸标志为0时的变换单元尺寸“RootTuSize”可指示可在系统中选择的最大变换单元尺寸。在等式(1)中,“RootTuSize/(2^MaxTransformSizeIndex)”指示当TU尺寸标志为0时,变换单元尺寸“RootTuSize”被划分了与最大TU尺寸标志相应的次数时的变换单元尺寸,“MinTransformSize”指示最小变换尺寸。因此,“RootTuSize/(2^MaxTransformSizeIndex)”和“MinTransformSize”中较小的值可以是可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”。
根据实施例,最大变换单元尺寸RootTuSize可根据预测模式的类型而改变。
例如,如果当前预测模式是帧间模式,则可通过使用以下的等式(2)来确定“RootTuSize”。在等式(2)中,“MaxTransformSize”指示最大变换单元尺寸,“PUSize”指示当前预测单元尺寸。
RootTuSize=min(MaxTransformSize,PUSize)……(2)
也就是说,如果当前预测模式是帧间模式,则当TU尺寸标志为0时的变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前预测单元尺寸中较小的值。
如果当前分区单元的预测模式是帧内模式,则可通过使用以下的等式(3)来确定“RootTuSize”。在等式(3)中,“PartitionSize”指示当前分区单元的尺寸:
RootTuSize=min(MaxTransformSize,PartitionSize)……(3)
也就是说,如果当前预测模式是帧内模式,则当TU尺寸标志为0时的变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前分区单元的尺寸之中较小的值。
然而,根据分区单元中的预测模式的类型而改变的当前最大变换单元尺寸“RootTuSize”仅是示例,并且实施例不限于此。
根据以上参照图8至图20描述的基于根据树结构的编码单元的视频编码方法,可针对树结构的每个编码单元对空间域的图像数据进行编码。根据基于根据树结构的编码单元的视频解码方法,对每个最大编码单元执行解码来重建空间域的图像数据。因此,画面和作为画面序列的视频可被重建。重建的视频可由再现设备来再现,可存储在存储介质中,或可通过网络来发送。
本发明构思的实施例可被编写为计算机程序,并可实现在使用计算机可读记录介质执行程序的通用数字计算机中。计算机可读记录介质的示例包括磁存储介质(例如,ROM、软盘、硬盘等)或光学记录介质(例如,CD-ROM或DVD)等。
为了便于描述,以上参照图1a至图20描述的根据多层视频预测方法和多层视频解码方法的视频编码方法将被称为“根据实施例的视频编码方法”。另外,以上参照图1a至图20描述的根据采样点偏移的调整的视频解码方法将被称为“根据实施例的视频解码方法”。
此外,以上参照图1a至图20描述的包括多层视频编码设备10、多层视频解码设备20、视频编码设备100或图像编码器400的视频编码设备将被称为“根据实施例的视频编码设备”。另外,以上参照图1a至图20描述的包括多层视频解码设备20、视频解码设备200或图像解码器500的视频解码设备将被称为“根据实施例的视频解码设备”。
现在将详细描述根据实施例的存储程序的计算机可读记录介质(例如,盘26000)。
图21是根据实施例的存储程序的盘26000的物理结构的示图。作为存储介质的盘26000可以是硬盘驱动器、致密盘只读存储器(CD-ROM)盘、蓝光盘或数字多功能盘(DVD)。盘26000包括多个同心磁道Tr,每个同心磁道Tr沿盘26000的圆周方向被划分成特定数量的扇区Se。在盘26000的特定区域中,可分配并存储执行以上所描述的量化参数确定方法、视频编码方法和视频解码方法的程序。
现在将参照图22来描述使用存储用于执行如上所述的视频编码方法和视频解码方法的程序的存储介质来实现的计算机系统。
图22是通过使用盘26000来记录并读取程序的盘驱动器26800的示图。计算机系统26700可经由盘驱动器26800将执行根据实施例的视频编码方法和视频解码方法中的至少一个的程序存储在盘26000中。为了在计算机系统26700中运行存储在盘26000中的程序,可通过使用盘驱动器26800从盘26000读取程序并将程序发送到计算机系统26700。
执行根据实施例的视频编码方法和视频解码方法中的至少一个的程序不仅可被存储在图21或图22中示出的盘26000中,还可被存储在存储卡、ROM卡带或固态驱动器(SSD)中。
以下将描述应用以上所描述的视频编码方法和视频解码方法的系统。
图23是用于提供内容分布服务的内容供应系统11000的整体结构的示图。将通信系统的服务区域划分成预定尺寸的小区,并将无线基站11700、11800、11900和12000分别安装在这些小区中。
内容供应系统11000包括多个独立装置。例如,诸如计算机12100、个人数字助理(PDA)12200、视频相机12300和移动电话12500的多个独立装置经由互联网服务提供器11200、通信网络11400和无线基站11700、11800、11900和12000连接到互联网11100。
然而,内容供应系统11000不限于如图23中所示,并且装置可选择性地被连接到内容供应系统11000。多个独立装置可不经由无线基站11700、11800、11900和12000而直接连接到通信网络11400。
视频相机12300是能够捕捉视频图像的成像装置,例如,数字视频相机。移动电话12500可利用各种协议(例如,个人数字通信(PDC)、码分多址(CDMA)、宽带码分多址(W-CDMA)、全球移动通信系统(GSM)和个人手持电话系统(PHS))中的至少一种通信方法。
视频相机12300可经由无线基站11900和通信网络11400连接到流服务器11300。流服务器11300允许经由视频相机12300从用户接收到的内容经由实时广播被流传输。可使用视频相机12300或流服务器11300来对从视频相机12300接收到的内容进行编码。通过视频相机12300捕捉到的视频数据可经由计算机12100被发送到流服务器11300。
通过相机12600捕捉到的视频数据也可经由计算机12100被发送到流服务器11300。与数字相机类似,相机12600是能够捕捉静止图像和视频图像两者的成像装置。可使用相机12600或计算机12100对通过相机12600捕捉到的视频数据进行编码。可将对视频执行编码和解码的软件存储在可由计算机12100访问的计算机可读记录介质(例如,CD-ROM盘、软盘、硬盘驱动器、SSD或存储卡)中。
如果视频数据通过内置在移动电话12500中的相机被捕捉到,则可从移动电话12500接收视频数据。
还可通过安装在视频相机12300、移动电话12500或相机12600中的大规模集成电路(LSI)系统来对视频数据进行编码。
内容供应系统11000可对由用户使用视频相机12300、相机12600、移动电话12500或另一成像装置所记录的内容数据(例如,在音乐会期间记录的内容)进行编码,并将编码后的内容数据发送到流服务器11300。流服务器11300可将编码后的内容数据以流传输内容的类型发送到请求内容数据的其它客户端。
客户端是能够对编码后的内容数据进行解码的装置,例如,计算机12100、PDA12200、视频相机12300或移动电话12500。因此,内容供应系统11000允许客户端接收并再现编码后的内容数据。此外,内容供应系统11000允许客户端实时接收编码后的内容数据并对编码后的内容数据进行解码和再现,从而能够进行个人广播。
包括在内容供应系统11000中的多个独立装置的编码和解码操作可类似于根据实施例的视频编码设备和视频解码设备的编码和解码操作。
现在将参照图24和图25更加详细地描述包括在根据实施例的内容供应系统11000中的移动电话12500。
图24示出根据本发明构思的实施例的应用视频编码方法和视频解码方法的移动电话12500的外部结构。移动电话12500可以是智能电话,所述智能电话的功能不受限,并且所述智能电话的大多数功能可被改变或扩展。
移动电话12500包括可与图21的无线基站12000交换射频(RF)信号的内部天线12510,并包括用于显示由相机12530捕捉到的图像或经由天线12510接收到的并被解码的图像的显示屏12520(例如,液晶显示器(LCD)或有机发光二极管(OLED)屏幕)。智能电话12510包括包含有控制按钮和触摸面板的操作面板12540。如果显示屏12520是触摸屏,则操作面板12540还包括显示屏12520的触摸感测面板。智能电话12510包括用于输出语音和声音的扬声器12580或另一类型声音输出器、以及用于输入语音和声音的麦克风12550或另一类型声音输入器。智能电话12510还包括用于捕捉视频和静止图像的相机12530,诸如电荷耦合器件(CCD)相机。智能电话12510还可包括:存储介质12570,用于存储通过相机12530捕捉到的、经由电子邮件接收到的、或根据各种方式获取的编码/解码数据(例如,视频或静止图像);插槽12560,存储介质12570经由插槽12560被装入移动电话12500中。存储介质12570可以是另一类型的闪存,例如,包括在塑料壳中的安全数字(SD)卡或电可擦和可编程只读存储器(EEPROM)。
图25示出移动电话12500的内部结构。为了系统地控制包括显示屏12520和操作面板12540的移动电话12500的部件,供电电路12700、操作输入控制器12640、图像编码器12720、相机接口12630、LCD控制器12620、图像解码器12690、复用器/解复用器12680、记录器/读取器12670、调制器/解调器12660和声音处理器12650经由对齐总线12730被连接到中央控制器12710。
如果用户操作电源按钮,并从“电源关闭”状态设置为“电源开启”状态,则供电电路12700从电池组向移动电话12500的所有部件供电,从而将移动电话12500设置为操作模式。
中央控制器12710包括中央处理器(CPU)、ROM和RAM。
在移动电话12500将通信数据发送到外部的同时,在中央控制器12710的控制下,由移动电话12500产生数字信号。例如,声音处理器12650可产生数字声音信号,图像编码器12720可产生数字图像信号,并且消息的文本数据可经由操作面板12540和操作输入控制器12640被产生。当数字信号在中央控制器12710的控制下被传送到调制器/解调器12660时,调制器/解调器12660对数字信号的频带进行调制,并且通信电路12610对频带调制后的数字声音信号执行数模转换(DAC)和频率转换。从通信电路12610输出的发送信号可经由天线12510被发送到语音通信基站或无线基站12000。
例如,当移动电话12500处于通话模式时,在中央控制器12710的控制下,经由麦克风12550获取的声音信号通过声音处理器12650被变换成数字声音信号。数字声音信号可经由调制器/解调器12660和通信电路12610被变换成发送信号,并可经由天线12510被发送。
当文本消息(例如,电子邮件)在数据通信模式下被发送时,文本消息的文本数据经由操作面板12540被输入,并经由操作输入控制器12640被发送到中央控制器12710。在中央控制器12610的控制下,文本数据经由调制器/解调器12660和通信电路12610被变换成发送信号,并经由天线12510被发送到无线基站12000。
为了在数据通信模式下发送图像数据,由相机12530捕捉到的图像数据经由相机接口12630被提供给图像编码器12720。捕捉到的图像数据可经由相机接口12630和LCD控制器12620被直接显示在显示屏12520上。
图像编码器12720的结构可与根据一个或更多个实施例的上述视频编码设备的结构相应。图像编码器12720可基于根据一个或更多个实施例的上述视频编码方法,将从相机12530接收到的图像数据变换为压缩和编码后的图像数据,并随后将编码后的图像数据输出到复用器/解复用器12680。在相机12530的记录操作期间,由移动电话12500的麦克风12550获取的声音信号可经由声音处理器12650被变换成数字声音数据,并且数字声音数据可被发送到复用器/解复用器12680。
复用器/解复用器12680对从图像编码器12720接收到的编码后的图像数据与从声音处理器12650接收到的声音数据一起进行复用。对数据进行复用的结果可经由调制器/解调器12660和通信电路12610被变换成发送信号,然后可经由天线12510被发送。
当移动电话12500从外部接收通信数据时,可对经由天线12510接收到的信号执行频率恢复和ADC以将信号变换成数字信号。调制器/解调器12660对数字信号的频带进行调制。根据频带调制后的数字信号的类型,将所述数字信号发送到视频解码器12690、声音处理器12650或LCD控制器12620。
在通话模式下,移动电话12500对经由天线12510接收到的信号进行放大,并通过对放大后的信号执行频率转换和ADC来获取数字声音信号。在中央控制器12710的控制下,接收到的数字声音信号经由调制器/解调器12660和声音处理器12650被变换成模拟声音信号,并且模拟声音信号经由扬声器12580被输出。
当在数据通信模式下时,接收在互联网网站上访问的视频文件的数据,经由调制器/解调器12660将经由天线12510从无线基站12000接收到的信号输出为复用数据,并将复用数据发送到复用器/解复用器12680。
为了对经由天线12510接收到的复用数据进行解码,复用器/解复用器12680将复用数据解复用成编码后的视频数据流和编码后的音频数据流。经由对齐总线12730,编码后的视频数据流和编码后的音频数据流分别被提供给视频解码器12690和声音处理器12650。
图像解码器12690的结构可与根据一个或更多个实施例的上述视频解码设备的结构相应。图像解码器12690可通过使用根据一个或更多个实施例的上述视频解码方法,对编码后的视频数据进行解码来获取重建的视频数据,并经由LCD控制器12620将重建的视频数据提供给显示屏12520。
因此,可将在互联网网站上访问的视频文件的数据显示在显示屏12520上。同时,声音处理器12650可将音频数据变换成模拟声音信号,并将模拟声音信号提供给扬声器12580。因此,也可经由扬声器12580再现在互联网网站上访问的视频文件中包含的音频数据。
移动电话12500或另一类型的通信终端可以是包括根据实施例的视频编码设备和视频解码设备两者的收发终端,可以是仅包括视频编码设备的收发终端,或者可以是仅包括视频解码设备的收发终端。
根据一个或更多个实施例的通信系统不限于以上参照图24描述的通信系统。例如,图26示出根据本发明构思的采用通信系统的数字广播系统。根据实施例的图26的数字广播系统可通过使用根据实施例的视频编码设备和视频解码设备来接收经由卫星或地面网络发送的数字广播。
具体地,广播站12890通过使用无线电波将视频数据流发送到通信卫星或广播卫星12900。广播卫星12900发送广播信号,广播信号经由家用天线12860被发送到卫星广播接收器。在每个房屋中,可通过TV接收器12810、机顶盒12870或其它装置对编码后的视频流进行解码并再现。
当根据实施例的视频解码设备被实现在再现设备12830中时,再现设备12830可对记录在存储介质12820(诸如盘或存储卡)上的编码后的视频流进行解析和解码,以重建数字信号。因此,可在例如监视器12840上再现重建的视频信号。
在被连接到用于卫星/地面广播的天线12860或用于接收有线电视(TV)广播的线缆天线12850的机顶盒12870中,可安装根据实施例的视频解码设备。从机顶盒12870输出的数据也可被再现在TV监视器12880上。
作为另一示例,可将根据实施例的视频解码设备安装在TV接收器12810中,而不是机顶盒12870中。
具有适当天线12910的汽车12920可接收从图21的卫星12900或无线基站11700发送的信号。可在安装在汽车12920中的汽车导航系统12930的显示屏上再现解码后的视频。
视频信号可由根据实施例的视频编码设备来编码,然后可被存储在存储介质中。具体地,可由DVD记录器将图像信号存储在DVD盘12960中,或可由硬盘记录器12950将图像信号存储在硬盘中。作为另一示例,可将视频信号存储在SD卡12970中。如果硬盘记录器12950包括根据实施例的视频解码设备,则记录在DVD盘12960、SD卡12970或另一存储介质上的视频信号可在TV监视器12880上被再现。
汽车导航系统12930可不包括图32的相机12530以及图32的相机接口12630和图像编码器12720。例如,计算机12100和TV接收器12810可不包括相机12530、相机接口12630和图像编码器12720。
图27是示出根据本发明构思的实施例的使用视频编码设备和视频解码设备的云计算系统的网络结构的示图。
云计算系统可包括云计算服务器14100、用户数据库(DB)14100、多个计算资源14200和用户终端。
响应于来自用户终端的请求,云计算系统经由数据通信网络(例如,互联网)提供多个计算资源的点播外包服务。在云计算环境下,服务提供商通过使用虚拟技术组合位于不同的物理位置的数据中心处的计算资源,来为用户提供想要的服务。服务用户不必将计算资源(例如,应用、存储器、操作系统(OS)和安全软件)安装在他/她自己的终端中以使用它们,但可在想要的时间点在通过虚拟技术产生的虚拟空间中从服务中选择和使用想要的服务。
被指定的服务用户的用户终端经由包括互联网和移动电信网络的数据通信网络被连接到云计算服务器14100。可从云计算服务器14100向用户终端提供云计算服务,特别是视频再现服务。用户终端可以是能够被连接到互联网的各种类型的电子装置,例如,桌上型PC14300、智能TV14400、智能电话14500、笔记本计算机14600、便携式多媒体播放器(PMP)14700、平板PC14800等。
云计算服务器14100可组合分布在云网络中的多个计算资源14200,并向用户终端提供组合的结果。所述多个计算资源14200可包括各种数据服务,并可包括从用户终端上载的数据。如上所描述的,云计算服务器14100可通过根据虚拟技术组合分布在不同区域中的视频数据库来向用户终端提供想要的服务。
将关于已经订购云计算服务的用户的用户信息存储在用户DB14100中。用户信息可包括用户的注册信息、地址、姓名和个人信用信息。用户信息还可包括视频的索引。这里,所述索引可包括已经被再现的视频的列表、正在被再现的视频的列表、之前正在被再现的视频的暂停点等。
可在用户装置之间共享存储在用户DB14100中的关于视频的信息。例如,当响应于来自笔记本计算机14600的请求将视频服务提供给笔记本计算机14600时,视频服务的再现历史被存储在用户DB14100中。当从智能电话14500接收到用于再现此视频服务的请求时,云计算服务器14100基于用户DB14100搜索并再现此视频服务。当智能电话14500从云计算服务器14000接收到视频数据流时,通过对视频数据流进行解码来再现视频的处理与以上参照图24描述的移动电话12500的操作类似。
云计算服务器14100可参考存储在用户DB14100中的想要的视频服务的再现历史。例如,云计算服务器14000从用户终端接收用于再现存储在用户DB14100中的视频的请求。如果此视频被再现过,则由云计算服务器14100执行的对此视频进行流传输的方法可根据来自用户终端的请求(即,根据是将从视频的起点还是视频的暂停点开始再现视频)而不同。例如,如果用户终端请求从视频的起点开始再现视频,则云计算服务器14100将从视频的第一帧开始的视频的流数据发送到用户终端。如果用户终端请求从视频的暂停点开始再现视频,则云计算服务器14100将从与暂停点相应的帧开始的视频的流数据发送到用户终端。
在此情况下,用户终端可包括如以上参照图1a至图20描述的视频解码设备。作为另一示例,用户终端可包括如以上参照图1a至图20描述的视频编码设备。可选地,用户终端可包括如以上参照图1a至图20描述的视频解码设备和视频编码设备两者。
以上参照图21至图27描述了以上参照图1a至图20描述的根据一个或更多个实施例的视频编码方法、视频解码方法、视频编码设备和视频解码设备的各种应用。然而,根据各种实施例的将视频编码方法和视频解码方法存储在存储介质中的方法或者将视频编码设备和视频解码设备实现在装置中的方法不限于以上参照图21至图27描述的实施例。
虽然已经参照本发明构思的实施例具体地示出和描述了本发明构思,但是本领域的普通技术人员将理解,在不脱离由权利要求限定的本发明的精神和范围的情况下,可作出形式和细节上的各种改变。实施例应仅被看作描述性意义,而不是限制的目的。因此,本发明的范围不由本发明的详细描述来限定而由权利要求来限定,在所述范围内的所有不同将被解释为包括在本发明构思中。

Claims (15)

1.一种由视频解码设备执行的视频解码方法,所述方法包括:
从比特流获得包括基本层和增强层的多个层的随机访问点RAP画面信息;
通过使用RAP画面信息独立地对基本层的RAP画面进行解码;
通过使用RAP画面信息独立地对增强层的RAP画面进行解码,
其中,独立的解码通过仅针对在随机访问点具有RAP画面的层对RAP画面进行解码来执行。
2.如权利要求1所述的方法,其中,通过使用RAP画面信息独立地对增强层的RAP画面进行解码的步骤包括:当在作为随机访问点的画面顺序计数POC的增强层的画面为非RAP画面时,对按POC顺序在非RAP画面之后出现的RAP画面进行解码。
3.如权利要求1所述的方法,其中,从比特流获得包括基本层和增强层的多个层的RAP画面信息的步骤包括:获得指示RAP画面是否位于所述多个层的同一POC的指示符。
4.如权利要求1所述的方法,其中,从比特流获得包括基本层和增强层的多个层的RAP画面信息的步骤还包括:获得指示存在于所述多个层的同一POC的RAP画面的类型的标识符。
5.如权利要求1所述的方法,其中,RAP画面信息被包括在参数集、访问单元定界符AUD和补充增强信息SEI中的一个中。
6.如权利要求1所述的方法,其中,通过使用RAP画面信息独立地对增强层的RAP画面进行解码的步骤包括:当参考层的随机访问跳过领导RASL画面未被解码时,不对参考所述RASL画面的画面进行解码。
7.如权利要求1所述的方法,其中,包括在增强层中的画面的时间标识符temporal_id具有大于或等于包括在基本层中的参考画面的时间标识符temporal_id的值。
8.如权利要求1所述的方法,其中,基本层的瞬时解码刷新IDR画面、纯净随机访问CRA画面和断链访问BLA画面中的至少一个画面被用作RAP画面。
9.如权利要求1所述的方法,其中,增强层的IDR画面、CRA画面和BLA画面中的至少一个画面被用作比特流提取点画面和层切换点画面中的至少一个。
10.如权利要求1所述的方法,还包括:将所述多个层中的一个层以独立于其它层的方式进行拼接。
11.一种视频编码方法,包括:
将构成图像序列的画面编码到包括基本层和增强层的多个层,以产生关于所述多个层的随机访问点RAP画面信息;
通过使用RAP画面信息来产生比特流,
其中,所述多个层均包括RAP画面,从而RAP画面通过仅针对在随机访问点具有RAP画面的层对RAP画面进行解码而被独立地解码。
12.如权利要求11所述的方法,其中,RAP画面信息包括指示存在于所述多个层的同一POC的RAP画面的类型的标识符。
13.一种视频解码设备,包括:
接收器,被配置为接收比特流;
解码器,被配置为通过使用从比特流获得的包括基本层和增强层的多个层的RAP画面信息独立地对基本层的随机访问点RAP画面进行解码,并通过使用RAP画面信息独立地对增强层的RAP画面进行解码,
其中,独立的解码通过仅针对在随机访问点具有RAP画面的层对RAP画面进行解码来执行。
14.一种视频编码设备,包括:
编码器,被配置为将构成图像序列的画面编码到包括基本层和增强层的多个层,以产生关于所述多个层的随机访问点RAP画面信息;
输出单元,被配置为通过使用RAP画面信息来产生比特流,
其中,所述多个层均包括RAP画面,从而RAP画面通过仅针对在随机访问点具有RAP画面的层对RAP画面进行解码来被独立地解码。
15.一种记录有用于实现权利要求1所述的方法的程序的计算机可读记录介质。
CN201480032604.2A 2013-04-05 2014-04-07 用于随机访问的多层视频编码方法及其装置以及用于随机访问的多层视频解码方法及其装置 Expired - Fee Related CN105340271B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361808740P 2013-04-05 2013-04-05
US61/808,740 2013-04-05
PCT/KR2014/003012 WO2014163467A1 (ko) 2013-04-05 2014-04-07 랜덤 엑세스를 위한 멀티 레이어 비디오 부호화 방법 및 그 장치, 랜덤 엑세스를 위한 멀티 레이어 비디오 복호화 방법 및 그 장치

Publications (2)

Publication Number Publication Date
CN105340271A true CN105340271A (zh) 2016-02-17
CN105340271B CN105340271B (zh) 2019-03-01

Family

ID=51658681

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480032604.2A Expired - Fee Related CN105340271B (zh) 2013-04-05 2014-04-07 用于随机访问的多层视频编码方法及其装置以及用于随机访问的多层视频解码方法及其装置

Country Status (5)

Country Link
US (1) US10045021B2 (zh)
EP (2) EP2983363A4 (zh)
KR (1) KR102290421B1 (zh)
CN (1) CN105340271B (zh)
WO (1) WO2014163467A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103702139A (zh) * 2013-12-13 2014-04-02 华中科技大学 一种移动环境下基于可扩展编码的视频点播系统
CN106101709A (zh) * 2016-07-08 2016-11-09 上海大学 一种联合增强层的shvc质量可分级的基本层帧间预测方法
CN111183643A (zh) * 2017-10-06 2020-05-19 松下电器(美国)知识产权公司 编码装置、解码装置、编码方法和解码方法
WO2020244022A1 (zh) * 2019-06-03 2020-12-10 Tcl华星光电技术有限公司 补偿表压缩方法、显示器制造设备和存储器
CN114270868A (zh) * 2019-05-16 2022-04-01 诺基亚技术有限公司 用于在视频编码中处理随机访问图片的装置、方法和计算机程序

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150350624A1 (en) * 2012-07-02 2015-12-03 Samsung Electronics Co., Ltd. Method and apparatus for generating 3d image data stream, method and apparatus for playing 3d image data stream
WO2014051410A1 (ko) * 2012-09-28 2014-04-03 삼성전자 주식회사 랜덤 액세스를 위한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
FR3008840A1 (fr) * 2013-07-17 2015-01-23 Thomson Licensing Procede et dispositif de decodage d'un train scalable representatif d'une sequence d'images et procede et dispositif de codage correspondants
KR20150029592A (ko) 2013-09-10 2015-03-18 주식회사 케이티 스케일러블 비디오 신호 인코딩/디코딩 방법 및 장치
WO2015053680A1 (en) * 2013-10-11 2015-04-16 Telefonaktiebolaget L M Ericsson (Publ) Layer switching in video coding
KR20150046742A (ko) 2013-10-22 2015-04-30 주식회사 케이티 멀티 레이어 비디오 신호 인코딩/디코딩 방법 및 장치
WO2015060614A1 (ko) 2013-10-22 2015-04-30 주식회사 케이티 멀티 레이어 비디오 신호 인코딩/디코딩 방법 및 장치
US9648348B2 (en) * 2013-10-23 2017-05-09 Qualcomm Incorporated Multi-layer video file format designs
US9832481B2 (en) * 2014-01-03 2017-11-28 Qualcomm Incorporated Support of base layer of a different codec in multi-layer video coding
JP2017508420A (ja) * 2014-01-13 2017-03-23 サムスン エレクトロニクス カンパニー リミテッド マルチレイヤビデオ符号化方法及びマルチレイヤビデオ復号方法、並びにその装置
WO2016111567A1 (ko) * 2015-01-08 2016-07-14 한국전자통신연구원 레이어드 디비전 멀티플렉싱을 이용한 방송 신호 프레임 생성 장치 및 방송 신호 프레임 생성 방법
US11539957B2 (en) * 2019-06-20 2022-12-27 Tencent America LLC Layered random access with reference picture resampling
US20220360787A1 (en) * 2019-06-21 2022-11-10 Telefonaktiebolaget Lm Ericsson (Publ) Video coding layer up-switching indication
US11825121B2 (en) 2019-09-23 2023-11-21 Tencent America LLC Method for access unit delimiter signaling
CN115299054A (zh) 2020-03-16 2022-11-04 字节跳动有限公司 可缩放视频编解码中的逐步解码刷新访问单元
WO2024049282A1 (ko) * 2022-09-04 2024-03-07 엘지전자 주식회사 영상 부호화/복호화 방법, 비트스트림을 전송하는 방법 및 비트스트림을 저장한 기록 매체

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101326828A (zh) * 2005-10-11 2008-12-17 韩国电子通信研究院 分层视频编码的方法及使用该方法的编解码器
CN101542926A (zh) * 2005-05-03 2009-09-23 高通股份有限公司 使用多个层进行可缩放编码及解码
WO2010014123A1 (en) * 2008-07-26 2010-02-04 Thomson Licensing A real-time transport protocol (rtp) packetization method for fast channel change applications using scalable video coding (svc)
CN101690229A (zh) * 2007-06-26 2010-03-31 诺基亚公司 用于指示时间层切换点的系统和方法
CN102342103A (zh) * 2009-03-02 2012-02-01 汤姆森特许公司 显示画面序列的方法及设备

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7505485B2 (en) 2002-01-22 2009-03-17 Microsoft Corporation Methods and systems for start code emulation prevention and data stuffing
KR20040075956A (ko) 2002-01-22 2004-08-30 마이크로소프트 코포레이션 시작 코드 에뮬레이션 방지 및 데이터 스터핑 방법 및시스템
KR100718351B1 (ko) 2005-09-28 2007-05-14 주식회사 팬택 동영상 파일의 요약 재생 시스템 및 이를 탑재한 이동통신단말기
US8199812B2 (en) * 2007-01-09 2012-06-12 Qualcomm Incorporated Adaptive upsampling for scalable video coding
EP2145270B1 (en) * 2007-05-04 2016-08-17 Nokia Technologies Oy Media stream recording into a reception hint track of a multimedia container file
US8179983B2 (en) * 2008-05-20 2012-05-15 Broadcom Corporation Video processing system with layered video coding for fast channel change and methods for use therewith
KR101019634B1 (ko) 2008-09-04 2011-03-07 에스케이 텔레콤주식회사 미디어 전송 시스템 및 방법
US20110081133A1 (en) * 2009-10-05 2011-04-07 Xuemin Chen Method and system for a fast channel change in 3d video
KR101777347B1 (ko) 2009-11-13 2017-09-11 삼성전자주식회사 부분화에 기초한 적응적인 스트리밍 방법 및 장치
KR101786050B1 (ko) 2009-11-13 2017-10-16 삼성전자 주식회사 데이터 전송 방법 및 장치
US20120233345A1 (en) * 2010-09-10 2012-09-13 Nokia Corporation Method and apparatus for adaptive streaming
EP2868092A4 (en) * 2012-07-02 2016-05-04 Nokia Technologies Oy METHOD AND DEVICE FOR VIDEO CODING
KR101825575B1 (ko) * 2013-01-07 2018-02-05 노키아 테크놀로지스 오와이 비디오 코딩 및 디코딩 방법 및 장치
US20140218473A1 (en) * 2013-01-07 2014-08-07 Nokia Corporation Method and apparatus for video coding and decoding
US9532052B2 (en) * 2013-04-08 2016-12-27 Qualcomm Incorporated Cross-layer POC alignment for multi-layer bitstreams that may include non-aligned IRAP pictures
WO2015052939A1 (en) * 2013-10-10 2015-04-16 Sharp Kabushiki Kaisha Alignment of picture order count
US9832481B2 (en) * 2014-01-03 2017-11-28 Qualcomm Incorporated Support of base layer of a different codec in multi-layer video coding

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101542926A (zh) * 2005-05-03 2009-09-23 高通股份有限公司 使用多个层进行可缩放编码及解码
CN101326828A (zh) * 2005-10-11 2008-12-17 韩国电子通信研究院 分层视频编码的方法及使用该方法的编解码器
CN101690229A (zh) * 2007-06-26 2010-03-31 诺基亚公司 用于指示时间层切换点的系统和方法
WO2010014123A1 (en) * 2008-07-26 2010-02-04 Thomson Licensing A real-time transport protocol (rtp) packetization method for fast channel change applications using scalable video coding (svc)
CN102342103A (zh) * 2009-03-02 2012-02-01 汤姆森特许公司 显示画面序列的方法及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
RICKARD S ET AL: "Overview of HEVC High-Level Syntax and Reference Picture Management", 《IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103702139A (zh) * 2013-12-13 2014-04-02 华中科技大学 一种移动环境下基于可扩展编码的视频点播系统
CN106101709A (zh) * 2016-07-08 2016-11-09 上海大学 一种联合增强层的shvc质量可分级的基本层帧间预测方法
CN106101709B (zh) * 2016-07-08 2019-04-16 上海大学 一种联合增强层的shvc质量可分级的基本层帧间预测方法
CN111183643A (zh) * 2017-10-06 2020-05-19 松下电器(美国)知识产权公司 编码装置、解码装置、编码方法和解码方法
CN111183643B (zh) * 2017-10-06 2023-11-21 松下电器(美国)知识产权公司 编码装置、解码装置、编码方法和解码方法
CN114270868A (zh) * 2019-05-16 2022-04-01 诺基亚技术有限公司 用于在视频编码中处理随机访问图片的装置、方法和计算机程序
WO2020244022A1 (zh) * 2019-06-03 2020-12-10 Tcl华星光电技术有限公司 补偿表压缩方法、显示器制造设备和存储器

Also Published As

Publication number Publication date
KR102290421B1 (ko) 2021-08-17
WO2014163467A1 (ko) 2014-10-09
US10045021B2 (en) 2018-08-07
US20160044309A1 (en) 2016-02-11
CN105340271B (zh) 2019-03-01
EP2983363A4 (en) 2016-10-19
EP3672245A1 (en) 2020-06-24
KR20140122194A (ko) 2014-10-17
EP2983363A1 (en) 2016-02-10

Similar Documents

Publication Publication Date Title
CN105340271A (zh) 用于随机访问的多层视频编码方法及其装置以及用于随机访问的多层视频解码方法及其装置
CN106063271B (zh) 用于执行基于子块的预测的层间视频解码方法及其设备以及用于执行基于子块的预测的层间视频编码方法及其设备
CN104620578B (zh) 用于随机访问的多层视频编码的方法和设备以及用于随机访问的多层视频解码的方法和设备
CN105532001B (zh) 用于使用基于深度的视差矢量对视频进行层间编码方法以及解码方法和设备
CN105308966B (zh) 视频编码方法及其设备以及视频解码方法及其设备
CN105144713B (zh) 用于解码器设置的对视频进行编码的方法及其装置以及基于解码器设置对视频进行解码的方法及其装置
CN104396252B (zh) 使用用于多视点视频预测的参考画面集的多视点视频编解码方法及其装置
CN105103552B (zh) 用于补偿亮度差的对层间视频进行编码的方法及其装置以及用于对视频进行解码的方法及其装置
CN104813665A (zh) 用于对层间预测误差进行编码的sao补偿的方法和设备
CN105264894A (zh) 针对层间解码和编码方法以及设备的确定帧间预测候选的方法
CN104869416A (zh) 视频解码设备
CN105191313A (zh) 使用考虑相移的上采样的可伸缩视频编码方法和设备以及可伸缩视频解码方法和设备
CN104365104A (zh) 用于基于树结构编码单元进行多视点视频编码的方法和设备以及用于基于树结构编码单元进行多视点视频解码的方法和设备
CN105532004B (zh) 层间视频解码方法及设备
CN105308964A (zh) 用于随机访问的多层视频编码方法及其装置以及用于随机访问的多层视频解码方法及其装置
CN107409214A (zh) 用于对层间视频进行解码的方法和设备以及用于对层间视频进行编码的方法和设备
CN106105210B (zh) 管理用于对多层视频进行编码和解码的缓冲器的方法和设备
CN106464889A (zh) 执行基于子块的预测的层间视频解码方法和层间视频编码方法及其设备
CN104396251A (zh) 使用用于多视点视频预测的参考列表对多视点视频进行编码的方法及其装置以及使用用于多视点视频预测的参考列表对多视点视频进行解码的方法及其装置
CN105165011A (zh) 用于考虑存储器带宽和计算量的可伸缩视频编码的装置和方法以及用于可伸缩视频解码的装置和方法
CN105325002A (zh) 使用视点合成预测的多视点视频编码方法及其设备以及多视点视频解码方法及其设备
CN106031175B (zh) 使用亮度补偿的层间视频编码方法及其装置、以及视频解码方法及其装置
CN104541510A (zh) 参考画面列表能够被改变的帧间预测方法及其设备
CN105594212A (zh) 用于确定运动矢量的方法及其设备
CN105340275A (zh) 使用视点合成预测的多视点视频编码方法及其设备以及多视点视频解码方法及其设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190301