CN101828399A - 用于可缩放位深度的可缩放视频译码技术 - Google Patents

用于可缩放位深度的可缩放视频译码技术 Download PDF

Info

Publication number
CN101828399A
CN101828399A CN200880111664A CN200880111664A CN101828399A CN 101828399 A CN101828399 A CN 101828399A CN 200880111664 A CN200880111664 A CN 200880111664A CN 200880111664 A CN200880111664 A CN 200880111664A CN 101828399 A CN101828399 A CN 101828399A
Authority
CN
China
Prior art keywords
layer
video blocks
video
information
reinforced layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200880111664A
Other languages
English (en)
Other versions
CN101828399B (zh
Inventor
叶琰
马尔塔·卡切维奇
钟由俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN101828399A publication Critical patent/CN101828399A/zh
Application granted granted Critical
Publication of CN101828399B publication Critical patent/CN101828399B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/36Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/34Scalability techniques involving progressive bit-plane based encoding of the enhancement layer, e.g. fine granular scalability [FGS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Abstract

本发明描述在基于位深度的可缩放视频译码(SVC)方案中执行的视频译码技术。可以不同位深度界定基础层视频数据和加强层视频数据。本发明的所述技术涉及在确定应使用层间预测之后使用层间预测性译码模式的唯一组合对加强层视频块进行译码。明确地说,两个或两个以上不同层间预测性译码模式可用于对应于基础层间块的块,且这些层间预测性译码模式中的一者还可用于对应于基础层内块的块。可在编码器处产生语法信息,且将其随位流传送,使得解码器在解码中可使用所述适当层间预测性译码模式。

Description

用于可缩放位深度的可缩放视频译码技术
本申请案主张2007年10月15日申请的第60/979,921号美国临时申请案的权益,所述临时申请案的全部内容以引用的方式并入本文中。
技术领域
本发明涉及数字视频译码,且更明确地说涉及其中基础层和加强层界定不同位深度的视频数据的可缩放视频译码(SVC)。
背景技术
数字视频能力可并入于广泛范围的装置中,包括数字电视、数字直播系统、无线通信装置、无线广播系统、个人数字助理(PDA)、膝上型或台式计算机、数码相机、数字记录装置、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电话等。数字视频装置实施例如MPEG-2、MPEG-4或H.264/MPEG-4部分10先进视频译码(AVC)中所界定者的基于块的视频压缩技术,以便以有效方式发射且接收数字视频。
基于块的译码技术通常执行空间预测和/或时间预测以实现视频序列中的数据压缩。层内译码依靠空间预测来减少或移除在给定译码单元内的视频块间之间的空间冗余,所述给定译码单元可包含视频帧、视频帧的切片或另一可独立解码的数据单元。相比之下,层间译码依靠时间预测来减少或移除视频序列的连续译码单元的视频块之间的时间冗余。对于层内译码来说,视频编码器执行空间预测来基于同一译码单元内的其它数据来压缩数据。对于层间译码来说,视频编码器执行运动估计和运动补偿以追踪两个或两个以上相邻译码单元的对应视频块的移动。
经译码的视频块可通过可用以创建或识别预测性块的预测信息和指示正在译码的块与预测性块之间的差的残余数据块来表示。在层间译码状况下,一个或一个以上运动向量用以识别数据的预测性块,而在层内译码状况下,预测模式可用以产生预测性块。层内译码和层间译码两者可界定若干不同预测模式,所述若干不同预测模式可界定在译码中使用的不同块大小和/或预测技术。还可包括额外类型语法元素作为经编码的视频数据的一部分,以便控制或界定在译码过程中使用的译码技术或参数。16乘16像素区域通常通过经子分割的(subpartitioned)亮度(luma)块和两个不同的经降取样的(downsampled)8乘8色度(chroma)块来表示。不同视频块中的每一者可经预测性译码。
在基于块的预测译码之后,视频编码器可应用变换、量化和熵译码过程以进一步减少与残余块的通信相关联的位速率。变换技术可包含离散余弦变换或概念上类似的过程,例如,子波变换、整数变换或其它类型变换。在离散余弦变换(DCT)过程中,作为一实例,变换过程将一组像素值转换为变换系数,所述变换系数可表示像素值在频域中的能量。量化被应用于变换系数,且通常涉及限制与任何给定变换系数相关联的位数目的过程。熵译码包含共同压缩经量化的变换系数序列的一个或一个以上过程,例如,上下文自适应可变长度译码(CAVLC)或上下文自适应二进制算术译码(CABAC)。
某一基于块的视频译码和压缩利用可缩放技术。可缩放视频译码(SVC)指代使用一基础层和一个或一个以上可缩放加强层的视频译码。对于SVC来说,基础层通常携载具有基本质量等级的视频数据。一个或一个以上加强层携载额外视频数据以支持较高空间、时间和/或SNR等级。在一些状况下,可以比加强层的发射更可靠的方式来发射基础层。
一些类型的SVC方案基于像素值的位深度而为可缩放的。在这些状况下,基础层可根据第一位深度界定处于基本质量等级的像素值,且加强层可添加额外数据,使得基础层和加强层(例如)根据大于第一位深度的第二位深度一起界定处于较高质量等级的像素值。位深度可缩放性归因于支持基于高于常规显示器的位深度的像素再现的较高分辨率显示能力的出现而变得越来越合乎需要。
发明内容
一般来说,本发明描述在基于位深度的可缩放视频译码(SVC)方案中执行的视频编码和视频解码技术。术语“译码”在本发明中用以大体上指代编码或解码。根据本发明,以不同位深度界定基础层视频数据和加强层视频数据。基础层视频数据可具有M个位的位深度,且加强层视频数据可提供达N个位的位深度的加强,其中N大于M。作为一实例,基础层位深度可为8个位,且加强层可提供达10个位的加强。
本发明的技术涉及在确定应使用层间预测基于基础层对N位加强层视频块进行译码之后对加强层视频块进行译码。在此状况下,两个或两个以上不同层间预测性译码模式可用于基础层间块,且这些层间预测性译码模式中的一者还可用于层内块。语法信息可产生于编码器处,且随位流传送,使得解码器在解码中可使用层间预测性译码模式。
在一个实例中,本发明描述一种根据基于位深度的SVC方案对视频数据进行编码的方法。所述方法包含产生与视频数据相关联的基础层和加强层,其中基础层界定具有M个位的位深度的视频数据,且加强层界定位深度达N个位的加强,其中N大于M。所述方法还包含对基础层和加强层进行编码。对加强层进行编码包括:确定是否应使用层间预测基于基础层对N位加强层视频块进行译码;以及在确定应使用层间预测基于基础层对N位加强层视频块进行译码后,确定N位加强层视频块对应于基础层内块还是基础层间块。如果N位加强层视频块对应于基础层内块,那么所述方法包括根据第一层间预测性译码技术对N位加强层视频块进行译码,其中第一层间预测性译码技术包括产生残余视频块作为N位加强层视频块与对应经重建的M位基础层视频块的经升取样的(upsampled)N位型式之间的差。如果N位加强层视频块对应于基础层间块,那么所述方法包括在第一层间预测性译码技术与第二层间预测性译码技术之间做出选择,其中第二层间预测性译码技术包括产生残余视频块作为N位加强层视频块与通过与对应M位基础层视频块相关联的运动向量识别的N位预测块之间的差。
在另一实例中,本发明描述一种根据基于位深度的SVC方案对视频数据进行解码的方法。解码方法包含接收与视频数据相关联的基础层和加强层,其中基础层界定具有M个位的位深度的视频数据,且加强层界定位深度达N个位的加强,其中N大于M。所述方法还包含对基础层和加强层进行解码。对加强层进行解码包括:确定是否使用层间预测基于基础层对N位加强层视频块进行了译码;以及在确定使用层间预测基于基础层对N位加强层视频块进行了译码后,确定N位残余加强层视频块对应于基础层内块还是基础层间块。如果N位残余加强层视频块对应于基础层内块,那么所述方法包括根据第一层间预测性译码技术对N位残余加强层视频块进行解码,其中第一层间预测性译码技术包括产生经重建的视频块作为N位残余加强层视频块与对应经重建的M位基础层视频块的经升取样的N位型式的和。如果N位残余加强层视频块对应于基础层间块,那么所述方法包括在第一层间预测性译码技术与第二层间预测性译码技术之间做出选择,其中第二层间预测性译码技术包括产生经重建的视频块作为N位残余加强层视频块与通过与对应M位基础层视频块相关联的运动向量识别的N位预测块的和。
在另一实例中,本发明描述一种根据基于位深度的SVC方案对视频数据进行编码的设备。所述设备包含基于位深度的可缩放视频编码器,其产生与视频数据相关联的基础层和加强层,其中基础层界定具有M个位的位深度的视频数据,且加强层界定位深度达N个位的加强,其中N大于M。视频编码器对基础层和加强层进行编码,其中对于加强层来说,视频编码器确定是否应使用层间预测基于基础层对N位加强层视频块进行译码,且在确定应使用层间预测基于基础层对N位加强层视频块进行译码后,视频编码器确定N位加强层视频块对应于基础层内块还是基础层间块。如果N位加强层视频块对应于基础层内块,那么视频编码器根据第一层间预测性译码技术对N位加强层视频块进行编码,其中第一层间预测性译码技术包括产生残余视频块作为N位加强层视频块与对应经重建的M位基础层视频块的经升取样的N位型式之间的差。如果N位加强层视频块对应于基础层间块,那么视频编码器在第一层间预测性译码技术与第二层间预测性译码技术之间做出选择,其中第二层间预测性译码技术包括产生残余视频块作为N位加强层视频块与通过与对应M位基础层视频块相关联的运动向量识别的N位预测块之间的差。
在另一实例中,本发明描述一种根据基于位深度的SVC方案对视频数据进行解码的设备。在此状况下,所述设备包含基于位深度的可缩放视频解码器,其接收与视频数据相关联的基础层和加强层,其中基础层界定具有M个位的位深度的视频数据,且加强层界定位深度达N个位的加强,其中N大于M。视频解码器对基础层和加强层进行解码,其中对于加强层来说,其中视频解码器确定是否使用层间预测基于基础层对N位加强层视频块进行了译码,且在确定使用层间预测基于基础层对N位加强层视频块进行了译码后,视频解码器确定N位残余加强层视频块对应于基础层内块还是基础层间块。如果N位残余加强层视频块对应于基础层内块,那么视频解码器根据第一层间预测性译码技术对N位残余加强层视频块进行解码,其中第一层间预测性译码技术包括产生经重建的视频块作为N位残余加强层视频块与对应经重建的M位基础层视频块的经升取样的N位型式的和。如果N位残余加强层视频块对应于基础层间块,那么视频解码器在第一层间预测性译码技术与第二层间预测性译码技术之间做出选择,其中第二层间预测性译码技术包括产生经重建的视频块作为N位残余加强层视频块与通过与对应M位基础层视频块相关联的运动向量识别的N位预测块的和。
在另一实例中,本发明描述一种根据基于位深度的SVC方案对视频数据进行编码的装置。所述装置包含用于产生与视频数据相关联的基础层和加强层的装置,其中基础层界定具有M个位的位深度的视频数据,且加强层界定位深度达N个位的加强,其中N大于M。所述装置还包含用于对基础层进行编码的装置和用于对加强层进行编码的装置,其中用于对加强层进行编码的装置包括:用于确定是否应使用层间预测基于基础层对N位加强层视频块进行译码的装置;以及在确定应使用层间预测基于基础层对N位加强层视频块进行译码后用于确定N位加强层视频块对应于基础层内块还是基础层间块的装置。如果N位加强层视频块对应于基础层内块,那么所述装置调用用于根据第一层间预测性译码技术对N位加强层视频块进行编码的装置,其中第一层间预测性译码技术包括产生残余视频块作为N位加强层视频块与对应经重建的M位基础层视频块的经升取样的N位型式之间的差。如果N位加强层视频块对应于基础层间块,那么所述装置调用用于在第一层间预测性译码技术与第二层间预测性译码技术之间做出选择的装置,其中第二层间预测性译码技术包括产生残余视频块作为N位加强层视频块与通过与对应M位基础层视频块相关联的运动向量识别的N位预测块之间的差。
在另一实例中,本发明描述一种根据基于位深度的SVC方案对视频数据进行解码的装置。所述装置包含用于接收与视频数据相关联的基础层和加强层的装置,其中基础层界定具有M个位的位深度的视频数据,且加强层界定位深度达N个位的加强,其中N大于M。所述装置还包含用于对基础层进行解码的装置和用于对加强层进行解码的装置,其中用于对加强层进行解码的装置包括:用于确定是否使用层间预测基于基础层对N位加强层视频块进行了译码的装置;以及在确定使用层间预测基于基础层对N位加强层视频块进行了译码后用于确定N位残余加强层视频块对应于基础层内块还是基础层间块的装置。如果N位残余加强层视频块对应于基础层内块,那么所述装置包含用于根据第一层间预测性译码技术对N位残余加强层视频块进行解码的装置,其中第一层间预测性译码技术包括产生经重建的视频块作为N位残余加强层视频块与对应经重建的M位基础层视频块的经升取样的N位型式的和。如果N位残余加强层视频块对应于基础层间块,那么所述装置包含用于在第一层间预测性译码技术与第二层间预测性译码技术之间做出选择的装置,其中第二层间预测性译码技术包括产生经重建的视频块作为N位残余加强层视频块与通过与对应M位基础层视频块相关联的运动向量识别的N位预测块的和。
在另一实例中,本发明描述一种根据基于位深度的SVC方案对视频数据进行编码的装置。所述装置包含基于位深度的可缩放视频编码器,所述基于位深度的可缩放视频编码器:产生与视频数据相关联的基础层和加强层,其中基础层界定具有M个位的位深度的视频数据,且加强层界定位深度达N个位的加强,其中N大于M;并对基础层和加强层进行编码。对于加强层来说,视频编码器确定是否应使用层间预测基于基础层对N位加强层视频块进行译码,且在确定应使用层间预测基于基础层对N位加强层视频块进行译码后,确定N位加强层视频块对应于基础层内块还是基础层间块。如果N位加强层视频块对应于基础层内块,那么视频编码器根据第一层间预测性译码技术对N位加强层视频块进行编码,其中第一层间预测性译码技术包括产生残余视频块作为N位加强层视频块与对应经重建的M位基础层视频块的经升取样的N位型式之间的差。如果N位加强层视频块对应于基础层间块,那么视频编码器在第一层间预测性译码技术与第二层间预测性译码技术之间做出选择,其中第二层间预测性译码技术包括产生残余视频块作为N位加强层视频块与通过与对应M位基础层视频块相关联的运动向量识别的N位预测块之间的差。在此实例中,所述装置还包括无线发射器,其将基础层和加强层发射到另一装置。
在另一实例中,本发明描述一种根据基于位深度的SVC方案对视频数据进行解码的装置。所述装置包含:无线接收器,其接收视频数据;以及基于位深度的可缩放视频解码器,其接收与视频数据相关联的基础层和加强层,其中基础层界定具有M个位的位深度的视频数据,且加强层界定位深度达N个位的加强,其中N大于M。视频解码器对基础层和加强层进行解码,其中对于加强层来说,视频解码器确定是否使用层间预测基于基础层对N位加强层视频块进行了译码,且在确定使用层间预测基于基础层对N位加强层视频块进行了译码后确定N位残余加强层视频块对应于基础层内块还是基础层间块。如果N位残余加强层视频块对应于基础层内块,那么视频解码器根据第一层间预测性译码技术对N位残余加强层视频块进行解码,其中第一层间预测性译码技术包括产生经重建的视频块作为N位残余加强层视频块与对应经重建的M位基础层视频块的经升取样的N位型式的和。如果N位残余加强层视频块对应于基础层间块,那么视频解码器在第一层间预测性译码技术与第二层间预测性译码技术之间做出选择,其中第二层间预测性译码技术包括产生经重建的视频块作为N位残余加强层视频块与通过与对应M位基础层视频块相关联的运动向量识别的N位预测块的和。
本发明中描述的技术可以硬件、软件、固件或其任一组合来实施。如果以软件来实施,那么可在例如微处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或数字信号处理器(DSP)等一个或一个以上处理器中执行软件。执行所述技术的软件可最初存储于计算机可读媒体中,且被载入到处理器中并在其中加以执行。在一些状况下,所述软件还可以包括计算机可读媒体和计算机可读媒体的封装材料的计算机程序产品形式出售。
因此,在另一实例中,本发明描述一种包含指令的计算机可读媒体,所述指令在执行后促使视频译码装置根据基于位深度的SVC方案对视频数据进行编码,其中所述指令促使所述装置产生与视频数据相关联的基础层和加强层,其中基础层界定具有M个位的位深度的视频数据,且加强层界定位深度达N个位的加强,其中N大于M。所述指令还促使所述装置对基础层和加强层进行编码,其中对于加强层来说,所述指令促使所述装置确定是否应使用层间预测基于基础层对N位加强层视频块进行译码,且在确定应使用层间预测基于基础层对N位加强层视频块进行译码后,确定N位残余加强层视频块对应于基础层内块还是基础层间块。如果N位加强层视频块对应于基础层内块,那么所述指令促使所述装置根据第一层间预测性译码技术对N位加强层视频块进行编码,其中第一层间预测性译码技术包括产生残余视频块作为N位加强层视频块与对应经重建的M位基础层视频块的经升取样的N位型式之间的差。如果N位加强层视频块对应于基础层间块,那么所述指令促使所述装置在第一层间预测性译码技术与第二层间预测性译码技术之间做出选择,其中第二层间预测性译码技术包括产生残余视频块作为N位加强层视频块与通过与对应M位基础层视频块相关联的运动向量识别的N位预测块之间的差。
在又一实例中,本发明描述一种包含指令的计算机可读媒体,所述指令在执行后促使视频译码装置根据基于位深度的SVC方案对视频数据进行解码。在接收到与视频数据相关联的基础层和加强层后,其中基础层界定具有M个位的位深度的视频数据,且加强层界定位深度达N个位的加强,其中N大于M,所述指令促使所述装置对基础层和加强层进行解码,其中对于加强层来说,所述指令促使所述装置确定是否使用层间预测基于基础层对N位加强层视频块进行了译码,且在确定使用层间预测基于基础层对N位加强层视频块进行了译码后确定N位残余加强层视频块对应于基础层内块还是基础层间块。如果N位残余加强层视频块对应于基础层内块,那么所述指令促使所述装置根据第一层间预测性译码技术对N位残余加强层视频块进行解码,其中第一层间预测性译码技术包括产生经重建的视频块作为N位残余加强层视频块与对应经重建的M位基础层视频块的经升取样的N位型式的和。如果N位残余加强层视频块对应于基础层间块,那么所述指令促使所述装置:在第一层间预测性译码技术与第二层间预测性译码技术之间做出选择,其中第二层间预测性译码技术包括产生经重建的视频块作为N位残余加强层视频块与通过与对应M位基础层视频块相关联的运动向量识别的N位预测块的和。
在其它状况下,本发明可针对电路,例如,集成电路、芯片组、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、逻辑,或其经配置以执行本文中所描述的技术中的一者或一者以上的各种组合。
以下在随附图式和描述中阐述本发明的一个或一个以上方面的细节。本发明中描述的技术的其它特征、目的和优点将从描述和图式且从权利要求书变得显而易见。
附图说明
图1是说明可实施本发明的技术中的一者或一者以上的视频编码和解码系统的示范性框图。
图2是说明与本发明一致的示范性视频编码器的框图。
图3是说明与本发明一致的视频编码器的另一框图。
图4是说明与本发明一致的示范性视频解码器的框图。
图5和图6是说明与本发明一致的示范性编码和解码技术的流程图。
具体实施方式
一般来说,本发明描述在基于位深度的可缩放视频译码(SVC)方案中执行的视频编码和视频解码技术。术语“译码”用以大体上指代编码或解码。根据本发明,以不同位深度界定基础层视频数据和加强层视频数据。基础层视频数据可具有M个位的位深度,且加强层视频数据可提供达N个位的加强,其中N大于M。
作为一实例,基础层位深度可为8个位,且加强层可提供达10个位的加强,但本发明的技术可应用于任何位深度(只要加强层对应于大于基础层的位深度)。在此实例中,像素值(例如,像素域中的色度值和亮度值)在加强层中可由10个位来表示,且在基础层中由8个位来表示。8位表示可允许256个不同像素值,而10位可允许1024个不同像素值。并且,N和M的10和8的位深度值仅为实例。通常,N和M表示正整数,其中N大于M。
本发明的技术涉及加强层视频块的译码。明确地说,一旦编码器确定应使用层间预测基于基础层对加强层视频块进行译码,或一旦解码器确定使用层间预测基于基础层对加强层视频块进行了译码,本发明的技术就特定地适用。在这些状况下,两个或两个以上不同层间预测性译码模式可用于预测基础层间块,且这些预测性译码模式中的一者还可用于预测基础层内块。语法信息可产生于编码器处,且随位流来传送,使得解码器在解码中可使用层间预测性译码模式。明确地说,第一语法信息可用以传达是否使用层间预测基于基础层对加强层视频块进行译码,且第二语法信息可用以规定在此状况下使用的层间预测性译码模式。
对于“层内”加强层视频块(例如,针对其基于空间译码技术对对应基础层块进行层内译码的加强层块)来说,本发明使用第一层间预测性译码技术,其中产生残余视频块作为N位加强层视频块与对应经重建M位基础层视频块的经升取样N位型式之间的差。此类型预测对于对应于基础层内块的加强层视频块可为极其有效的。
另一方面,对于对应于基础层间块的加强层视频块(例如,针对其基于例如运动估计和运动补偿等时间译码技术对对应基础层块进行层间译码的加强层块)来说,本发明在两个不同层间预测性译码技术之间做出选择。在此状况下,第一层间预测性译码技术与用于层内块的预测性译码技术相同,即,产生残余视频块作为N位加强层视频块与对应经重建M位基础层视频块的经升取样N位型式之间的差。第二层间预测性译码技术包括产生残余视频块作为N位加强层视频块与通过与对应M位基础层视频块相关联的运动向量识别的N位预测块之间的差。针对对应于基础层间块的加强层视频块在这两种不同预测性译码技术之间做出选择的能力在实现所要压缩和视频质量方面可为极其有效的。
在编码器处,所述技术可应用于不同视频块类型(层内或层间),且针对基础层间块在两种不同预测性译码技术之间的选择可基于提供最佳数据压缩等级和/或最佳视频质量的预测性译码技术而发生。在做出此选择时通常可能要对速率与失真加以权衡。语法信息在位流中译码,以便向解码器适当地告知在编码器处应用的预测性编码技术。接着,在解码器处,可使用视频块类型(层内或层间)和语法信息,使得解码器将应用正确的预测性编码技术。明确地说,在解码器处,针对基础层间块在两种不同层间预测性译码技术之间的选择可基于在位流中发送的语法信息而发生。在解码器处,使用不同预测性译码技术通过向N位加强层预测视频块添加从编码器装置发射到解码器装置的N位加强层残余视频块来重建N位加强层视频块。
如以下更详细概述,根据本发明使用的语法信息可包含第一语法信息和第二语法信息。第一语法信息可用以传达是否使用层间预测基于基础层对加强层视频块进行译码,且可包含每一视频块一个位。在以下程度上来说,此第一语法信息可为本文中描述的技术的基本先决条件:仅当基于基础层对加强层视频块进行译码时才可应用本文中所描述的不同译码模式。
第二语法信息可包含一个位,在第一语法信息识别使用层间预测基于基础层视频块对加强层视频块进行译码时,且当对应基础层视频块为层间块时,发送所述第二语法信息以界定使用第一层间预测性译码技术还是第二层间预测性译码技术对加强层视频块预测性地进行了译码。或者,当第一语法信息识别使用层间预测基于基础层视频块对加强层视频块进行译码时,第二语法信息可包含随基于基础层间块或基础层内块译码的每一视频块发送的语法的一个位。后一状况可添加一额外位(对于其基础层块经层内译码),其对于实现解压缩可能为不必要的。然而,通过针对基于基础层内块译码的块(以及基于基础层间块译码的块)发送此额外位,视频解码器可能能够执行基础层与加强层的并行熵译码,其对于加速解码过程通常为合乎需要的。
图1是说明视频编码和解码系统10的框图。如图1中所示,系统10包括源装置12,其经由通信信道15将经编码的视频发射到目的地装置16。源装置12可实施本发明的技术作为视频编码过程的一部分,而目的地装置16可实施本发明的技术作为视频解码过程的一部分。
源装置12可包括视频源20、视频编码器22和调制器/发射器24。目的地装置16可包括接收器/解调器26、视频解码器28和显示装置30。系统10可经配置以应用基于位深度的可缩放视频译码(SVC)方案。
SVC指代使用一基础层和一个或一个以上可缩放加强层的视频译码。对于SVC来说,基础层通常携载具有基本质量等级的视频数据。一个或一个以上加强层携载额外视频数据以支持较高空间、时间和/或信噪比SNR等级。SVC的一个实例是基于位深度的SVC。在基于位深度的SVC中,基础层可根据第一位深度界定处于基本质量等级的像素值,且加强层可添加额外数据,使得基础层和加强层(例如)根据大于第一位深度的第二位深度一起界定处于较高质量等级的像素值。位深度可缩放性尤其归因于支持基于高于大多数常规显示器的位深度的像素再现的较高分辨率显示能力的出现而变得越来越合乎需要。
根据本发明,装置12和16相对于加强层视频块执行层间预测性译码技术,其中对应于基础层内块的加强层视频块根据第一层间预测性译码技术以特定方式来译码。此外,对应于基础层间块的加强层视频块基于第一层间预测性译码技术或第二层间预测性译码技术来译码。本文中针对对应于基础层内块和层间块的加强层块描述的视频译码技术的唯一组合可提供视频压缩和/或视频质量的改进。并且,一旦已确定基于基础层块对加强层块进行译码,此唯一组合就可特定地适用。
在图1的实例中,通信信道15可包含任何无线或有线通信媒体,例如,射频(RF)频谱或一个或一个以上物理发射线,或无线媒体与有线媒体的任何组合。通信信道15可形成例如局域网、广域网或全球网络(例如,因特网)等基于包的网络的一部分。通信信道15通常表示用于将视频数据从源装置12发射到目的地装置16的任何合适的通信媒体或不同通信媒体的集合。本发明的技术并不限于装置12与16之间的任何类型的通信,且可应用于基于无线的设置或基于有线的设置。然而,可缩放技术通常与无线通信相关联。
源装置12产生经译码的视频数据以用于发射到目的地装置16。然而,在一些状况下,装置12、16可以实质上对称的方式操作。举例来说,装置12、16中的每一者可包括视频编码组件和视频解码组件。因此,系统10可支持视频装置12、16之间的(例如)用于视频串流、视频广播或视频电话的单向或双向视频发射。
源装置12的视频源20可包括视频捕获装置,例如摄影机、含有先前所捕获的视频的视频档案或来自视频内容提供者的视频馈入。作为另一替代实施例,视频源20可产生基于计算机图形的数据作为源视频,或者实况视频和计算机产生的视频的组合。在一些状况下,如果视频源20为摄影机,那么源装置12和目的地装置16可形成所谓的摄影机电话或视频电话。在每一状况下,经捕获、预捕获或计算机产生的视频可由视频编码器22编码从而经由调制器/发射器24、通信信道15和接收器/解调器26从视频源装置12发射到视频目的地装置16的视频解码器28。显示装置30向用户显示经解码视频数据,且可包含多种显示装置中的任一者,例如阴极射线管、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
视频编码器22和视频解码器28可经配置以支持SVC以实现基于位深度的可缩放性。明确地说,编码器22和解码器28可通过支持基础层和一个或一个以上可缩放加强层的编码、发射和解码而支持各种可缩放性程度。并且,对于基于位深度的SVC来说,基础层根据第一位深度M携载具有基本质量等级的视频数据。一个或一个以上加强层携载额外数据以根据第二位深度N支持较高质量等级,其中N大于M。在一些状况下,可以比加强层的发射更可靠的方式来发射基础层。举例来说,可使用经调制信号的最可靠部分来发射基础层,而可使用经调制信号的较不可靠部分来发射加强层。在其它状况下,可以任何方式来发射基础层信息和加强层信息,且接收装置可选择仅对基础层进行解码,或对基础层和加强层进行解码以归因于经重建像素值的增加的位深度而改进质量。
为了支持SVC,视频编码器22可包含经设计以分别执行一基础层和一个或一个以上加强层的编码的可缩放位深度视频译码器。类似地,视频解码器28可包含对与基础层和加强层两者相关联的视频块进行解码的可缩放位深度视频解码器。视频解码器28可对与基础层和加强层两者相关联的视频块进行解码,且组合经解码视频以重建视频序列的帧。显示装置30接收经解码的视频序列,且向用户呈现视频序列。
视频编码器22和视频解码器28可根据例如MPEG-2、MPEG-4、ITU-T H.263或ITU-T H.264/MPEG-4部分10高金视频译码(AVC)等视频压缩标准而操作。尽管图1中未展示,但在一些方面中,视频编码器22和视频解码器28每一者可与音频编码器和解码器集成,且可包括适当的多路复用器-解多路复用器(MUX-DEMUX)单元,或其它硬件和软件以处置共同数据流或单独数据流中的音频和视频两者的编码。如果可适用,MUX-DEMUX单元可符合ITU H.233多路复用器协议,或例如用户数据报协议(UDP)等其它协议。
H.264/MPEG-4部分10AVC标准由ITU-T视频译码专家组(VCEG)与ISO/IEC移动图片专家组(MPEG)共同制订,作为称为联合视频团队(JVT)的集体合作的产物。在一些方面中,本发明中所描述的技术可应用于大体符合H.264标准或其扩展的装置。H.264标准描述于由ITU-T研究组且在2005年3月发表的ITU-T推荐H.264“用于一般视听服务的先进视频译码(Advanced Video Coding for generic audiovisual services)”中,其可在本文中称为H.264标准或H.264规范,或者H.264/AVC标准或规范。
联合视频团队(JVT)继续致力于H.264/MPEG-4AVC的SVC扩展。演进中的SVC扩展的规范通常以联合草案(JD)形式发布。由JVT创建的联合可缩放视频模型(JSVM)实施用于可缩放视频中的工具,其可在系统10内使用用于在本发明中描述的各种译码任务。
在一些方面中,对于视频广播来说,本发明中所描述的技术可应用于经加强的H.264视频译码以用于在使用仅前向链路(FLO)空中接口规范“用于陆地移动多媒体多播的仅前向链路空中接口规范(Forward Link Only Air Interface Specification for TerrestrialMobile Multimedia Multicast)”(将作为技术标准TIA-1099(“FLO规范”)发表)的陆地移动多媒体多播(TM3)系统中递送实时视频服务。也就是说,通信信道15可包含用以根据FLO规范等广播无线视频信息的无线信息信道。FLO规范包括界定位流语法和语义以及适于FLO空中接口的解码过程的实例。或者,可根据例如DVB-H(手持式数字视频广播)、ISDB-T(陆地集成服务数字广播)或DMB(数字媒体广播)等其它标准而广播视频。因此,源装置12可为移动无线终端、视频串流服务器或视频广播服务器。然而,如上所提及,本发明中描述的技术并不限于任何特定类型的广播、多播或点对点系统。在广播的状况下,源装置12可将视频数据的若干信道广播到多个目的地装置,所述目的地装置的每一者可与图1的目的地装置16类似。
视频编码器22和视频解码器28可每一者实施为一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。视频编码器22和视频解码器28中的每一者可包括于一个或一个以上编码器或解码器中,其任一者可在相应移动装置、订户装置、广播装置、服务器等中集成为经组合编码器/解码器(CODEC)的一部分。此外,源装置12和目的地装置16每一者可包括用于发射和接收经编码视频的适当调制、解调制、频率转换、滤波和放大组件(如可适用地),包括足以支持无线通信的射频(RF)无线组件和天线。然而,为了易于说明,此类组件概括为图1中的源装置12的调制器/发射器24和目的地装置16的接收器/解调器26。
视频序列包括一系列视频帧,所述视频帧可被进一步分为切片或其它经译码单元。视频编码器22对个别视频帧内的视频块(或对切片或其它经译码单元内的视频块)进行操作以对视频数据进行编码。视频块可包含亮度和色度块,且可具有(例如)如根据任何译码标准界定的固定或变化的大小。并且,在一些状况下,每一视频帧可包括一系列切片。此外,每一切片可包括一系列宏块,其可布置到子块中。作为一实例,ITU-T H.264标准支持各种块大小的层内预测,例如用于亮度分量的16乘16、8乘8或4乘4块大小,和用于色度分量的8乘8块大小的层内预测,以及支持各种块大小的层间预测,例如用于亮度分量的16乘16、16乘、8乘16、8乘8、8乘4、4乘8和4乘4和用于色度分量的对应块大小。如果视频序列采用YUV 4:2:0格式,那么用于色度分量的对应层间预测块大小是在水平维度和垂直维度的每一者中由因数2进行降取样的对应亮度块大小。视频块可包含像素数据块,或(例如)在例如离散余弦变换(DCT)等变换过程之后的变换系数的块。
较小视频块可提供较好分辨率,且可用于视频帧的包括较高细节等级的位置。一般来说,宏块(MB)和各种子块可视作视频块。此外,切片可视作例如MB和/或子块等一系列视频块。每一切片可为视频帧的可独立解码的单元。在预测之后,可对8x8的残余块或4x4的残余块执行变换,且如果使用intra_16x16预测模式,那么可向用于色度分量或亮度分量的4x4块的DC系数应用额外变换。并且,在变换之后,数据仍可称为视频块,即,变换系数的块。在基于层内或层间的预测性译码和变换技术(例如使用于H.264/AVC中的4x4或8x8类似DCT整数变换,或另一形式的DCT)以及量化技术(例如,标量量化)之后,可执行游程长度译码。
根据本发明的技术,根据一种方法对加强层视频块预测地进行译码,所述方法向对应于基础层内块的视频块应用第一层间预测性译码技术,且对于对应于基础层间块的视频块在第一层间预测性译码技术与第二层间预测性译码技术之间做出选择。一旦已确定基于基础层块对加强层视频块进行译码,这些不同预测路径就特定地适用。值得注意的是,在编码器处,第一层间预测性译码技术涉及基于对应经重建的M位基础层块产生N位预测性块。第二层间预测性译码技术本质上借用基础层块的运动信息,且使用对应于M位域的基础层块的运动信息基于N位域中的视频数据产生预测性加强层块。N值大于M,使得N个位为加强层数据的位深度,且M个位为基础层数据的位深度。在解码器处,类似预测性译码技术用以基于从编码器传送到解码器的N位残余加强层视频块重建原始视频块,且语法信息可有助于解码器识别将哪一预测性译码技术用于不同视频块。
图2是说明与本发明一致的示范性可缩放视频编码器200的另一描绘的框图。可缩放视频编码器200可对应于图1的可缩放位深度视频编码器22。可缩放视频编码器200包含基础层编码器180和加强层编码器150。虽然单独地说明,但在一些实施方案中,可共享或组合基础层编码器180和加强层编码器150的各种单元。基础层编码器180对基础层视频块进行编码,而加强层编码器150对加强层视频块进行编码。在编码侧,本发明的技术大体上涉及由加强层编码器150对加强层视频块进行编码。
加强层编码器150可包含加法器114,其从传入的N位加强层视频块减去预测性视频块以产生残余视频块。如以下更详细概述,开关118界定编码器150内的预测路径。加强层编码器150包括变换单元102和量化单元以变换并量化残余视频块。此外,加强层编码器150可包括单元108,其表示反量化单元和反变换单元两者。熵译码单元106对残余块以及任何语法信息(例如,运动向量、层内预测语法,或本文中界定的用于识别所使用的预测技术的信息)进行熵译码。加法器116基于来自单元108的残余块和用以对此类残余块进行译码的预测性块重建视频块。如本文中所描述,解块滤波器单元112可对经重建的数据进行滤波,所述经重建的数据接着被转发到帧缓冲器111以由预测单元110用于层内或层间预测中。
基础层编码器180可包含包括用于基础层视频块的层内或层间预测中的预测单元120的各种单元。加法器126从传入的M位基础层视频块减去预测性视频块以产生残余视频块。变换单元128执行例如DCT等变换,且量化单元130执行量化。单元134表示反量化单元和反变换单元两者。熵译码单元132对残余块以及任何语法信息(例如,用于基础层视频块的运动向量或层内预测语法)进行熵译码。加法器124基于来自单元134的经重建残余块和用以对此类残余块进行译码的预测性块重建视频块。解块滤波器单元122可对经重建的数据进行滤波,所述经重建的数据接着被转发到帧缓冲器121以由预测单元120用于对基础层数据的后续层内或层间预测中。
可缩放视频编码器200还包含音调映射单元114,其将来自加强层编码器150的N位样本降取样为用于基础层编码器180的M位样本。此外,可缩放视频编码器200包含反音调映射单元116,其将来自基础层编码器180的M位样本升取样为用于加强层编码器150的N位样本。多路复用单元118可组合加强层位流(其携载用于重建来自加强层编码器150的N位输出样本的信息)与基础层位流(其携载用于重建来自基础层编码器180的M位输出样本的信息)以产生经译码数字视频数据的经缩放输出流。
加强层编码器150可执行依赖于对应基础层数据(例如,基础层的相同空间和时间定位的经译码单元)的一种或一种以上预测技术以对加强层视频块进行译码。根据本发明,基于位深度的可缩放视频编码由加强层编码器150和基础层编码器180应用。基础层编码器180产生基础层,而加强层编码器150产生加强层。基础层界定具有M个位的位深度的视频数据,且加强层界定对视频数据达N个位的位深度的加强,其中N大于M。
一旦预测单元110已确定应基于基础层数据对加强层视频块进行译码,本发明的技术就特定地适用于由加强层编码器150执行的加强层编码。然而,更一般来说,预测单元110还可支持广泛种类的其它类型的预测技术,包括基于先前重建的加强层数据的加强层预测。预测单元110(例如)在加强层内可完全支持基于层内的空间预测和基于层间的时间预测。当预测单元110支持层间预测(其中在对加强层数据的预测中使用基础层数据)时,本发明的技术更特定地适用。
一旦预测单元110确定将使用某一类型的层间预测,就可使用本发明的技术。明确地说,通过控制开关118,编码器150向对应于经层内译码基础层块的任何加强层视频块应用第一层间预测性译码技术。第一层间预测性译码技术包括产生残余视频块作为N位加强层视频块与对应经重建M位基础层视频块的经升取样N位型式之间的差。对应经重建M位基础层视频块的经升取样N位型式可由反音调映射单元116提供到加法器114。
对于对应于经层间译码基础层块的任何加强层视频块来说,开关118在两个不同预测路径之间做出选择。开关118可包含控制预测路径(例如,是使用第一层间预测性译码技术还是第二层间预测性译码技术)的控制逻辑(或软件例程)。如果N位加强层视频块对应于层间块,那么开关118促使加法器在两个不同预测路径之间做出选择。第一路径对应于第一层间预测性译码技术,且第二路径对应于第二层间预测性译码技术。如所提及,第二层间预测性译码技术包括产生残余视频块作为N位加强层视频块与通过与对应M位基础层视频块相关联的运动向量识别的N位预测块之间的差。
加强层编码器150可接着对待由解码器使用的信息进行编码,使得解码器可确定如何对经编码的数据进行解码。明确地说,加强层编码器150对待由解码器使用以确定使用了第一层间预测性译码技术还是第二层间预测性译码技术对N位加强层视频块进行编码的经编码加强层位流内的信息进行编码。
此语法可包括指示是否使用层间预测的第一语法信息,其可包含每视频块一个位。此外,所述语法可包括待由解码器使用的第二语法信息,其可包含每其中使用层间预测的视频块另一位信息,所述第二语法信息识别使用了第一层间预测性译码技术还是第二层间预测性译码技术。
或者,如上所论述,待由解码器使用的第二语法信息可包含每对应于基础层间块的视频块一位信息,因为对应于基础层内块的加强层块可始终使用第一层间预测性译码技术来译码,且解码器可经编程以知晓对应于基础层内块的加强层块应使用第一层间预测性译码技术来解码(假设如第一语法信息所指示而支持层间预测)。在此状况下,第二语法信息的一个位与N位加强层视频块对应于基础层内块还是基础层间块的确定的组合识别使用了第一层间预测性译码技术还是第二层间预测性译码技术。换句话说,第二语法信息可包含每针对其使用层间预测且针对其对应基础层视频块经层间译码的视频块一个位。
并且,对于此第二语法信息包括每视频块一个位还是或者仅包括每针对其使用层间预测且针对其对应基础层视频块经层间译码的视频块一个位的实施决策可取决于解码器是否将支持加强层和基础层位流的单独熵解码和解析。如果需要加强层和基础层位流的单独熵解码和解析(例如)以加速解码,那么每视频块(例如,基于对应基础层内块或对应基础层间块而译码)一个位应用于第二语法,而非只是每仅针对基于对应基础层间块而译码的块的视频块一个位。否则,解码器可能需要知晓经解码的基础层视频块的译码类型以针对加强层视频块做出是否对识别第一层间预测性译码技术与第二层间预测性译码技术中的任一者的位进行解码的确定。
经编码的加强层视频块以及待由解码器使用以识别将用于视频块的预测性译码技术的任何预测语法和任何额外位可由单元106进行熵译码。多路复用单元118可接着组合基础层位流与加强层位流以创建输出位流。输出位流可经存储,和/或调制并发射到另一装置。
在一些方面中,本发明的技术,在所述技术提供预测路径的唯一且有用组合的程度上来说,不同于常规技术。基于与对应基础层数据相关联的预测性数据(例如,运动向量)而允许加强层预测。另一方面,还基于对应基础层数据的经升取样型式而允许加强层预测,且此类型的预测允许用于对应于经层间译码基础层块的加强层视频块或对应于经层内译码基础层块的加强层视频块。并且,这些技术在选择某一形式的层间预测(其中某一类型的基础层数据将用于加强层数据的预测中)的条件下适用。
图3是说明可对应于图1的可缩放位深度视频编码器22的示范性可缩放视频编码器35的框图。可缩放视频编码器35包含基础层编码器60和加强层编码器40。虽然单独地说明,但在一些实施方案中,可共享或组合基础层编码器60和加强层编码器40的各种单元。基础层编码器60对基础层视频块进行编码,而加强层编码器40对加强层视频块进行编码。在编码侧,本发明的技术大体上涉及在确定应基于基础层对N位加强层视频块进行译码后由加强层编码器40对加强层视频块进行编码。
加强层编码器40可包含由控制单元42控制的各种编码单元44。类似地,基础层编码器60可包含由控制单元62控制的各种编码单元64。可缩放视频编码器35还包含音调映射单元54,其将来自加强层编码器40的N位样本降取样为用于基础层编码器60的M位样本。此外,可缩放视频编码器35包含反音调映射单元55,其将来自基础层编码器60的M位样本升取样为用于加强层编码器40的N位样本。多路复用单元58可组合加强层位流(其携载用于重建来自加强层编码器40的N位输出样本的信息)与基础层位流(其携载用于重建来自基础层编码器60的M位输出样本的信息)以产生经译码数字视频数据的经缩放输出流。多路复用单元58可根据MPEG-2文件格式组合此数据。
对于基础层编码来说,基础层编码器60包括层内单元66、层间单元68和熵译码单元69。例如量化单元和DCT单元等各种其它单元通常也用于预测性视频译码中,但为了简单和易于说明在图3中并未说明。层内单元66执行层内视频块的基于层内的编码,而层间单元68执行层间视频块的基于层间的编码。熵译码单元69根据熵译码方法进一步压缩经编码的数据和语法信息。
对于基础层视频块的基于层内的编码来说,层内单元66可基于与正在译码的视频块相同的经译码单元(例如,同一帧或切片)内的数据而产生预测性数据。从正在译码的视频块减去预测性数据以产生残余,所述残余可接着经变换和量化。残余数据和预测语法(例如,识别所应用的层内预测的模式或方式)可供应到熵译码单元69以用于熵译码。
对于基础层视频块的基于层间的编码来说,层间单元68可基于不同经译码单元(例如,视频序列的先前或后续帧或切片)内的数据而产生预测性数据。从正在译码的视频块减去预测性数据以产生残余,所述残余数据可接着经变换和量化。残余数据和预测语法(例如,识别来自先前或后续经译码单元的预测性块的一个或一个以上运动向量)可供应到熵译码单元69以用于熵编码。
加强层编码器40可以稍微不同于基础层编码器60的方式执行基于预测的编码。具体来说,加强层编码器40可执行依靠对应基础层数据(例如,基础层的相同空间和时间定位的经译码单元)的一种或一种以上层间预测技术以对加强层视频块进行译码。并且,加强层编码器40还可支持其它类型的预测(例如,仅基于加强层数据的一种或一种以上其它技术),但本发明的技术应用于依靠基础层数据的预测技术。
根据本发明,基于位深度的可缩放视频编码由加强层编码器40和基础层编码器60应用。基础层编码器60产生基础层位流,而加强层编码器40产生加强层位流。基础层位流界定具有M个位的位深度的视频数据,且加强层位流界定达N个位的位深度的视频数据的加强,其中N大于M。
在加强层编码器40确定应基于基础层对N位加强层视频块进行译码时,本发明的技术相对于由加强层编码器40执行的加强层编码特定地适用。加强层编码器40包括各种编码单元44,其包括第一预测单元46、第二预测单元48和熵译码单元52。这些各种编码单元44可经集成,且/或可具有共享逻辑或例程,以便执行本文中所描述的不同类型的译码。此外,与基础层编码器60一样,加强层编码器40可进一步包括量化单元和变换单元(未图示)(例如)以将残余视频块变换为DCT系数且量化DCT系数。并且,这些组件为了简单和易于说明而在图3中并未展示,但可被看作第一预测单元46和第二预测单元48的一部分。还应注意,加强层编码器60还可支持N位域中的层内和层间预测。加强层编码器60的这些层内和层间单元为了简单和易于说明而并未展示。
第一预测单元46可用于对对应于经层内译码基础层视频块的加强层视频块进行编码。第一预测单元46应用第一层间预测性译码技术,所述第一层间预测性译码技术包括产生残余视频块作为N位加强层视频块与对应经重建M位基础层视频块的经升取样N位型式之间的差。对应经重建M位基础层视频块的经升取样N位型式可由反音调映射单元56提供到第一预测单元46。
第二预测单元48应用第二类型的预测性译码技术,所述第二类型的预测性译码技术包括产生残余视频块作为N位加强层视频块与通过与对应M位基础层视频块相关联的运动向量识别的N位预测块之间的差。在此状况下,并非使用对应基础层视频块的经升取样型式,第二预测单元48只是使用对应基础层视频块的预测语法(例如,运动向量)以便执行相对于加强层数据的运动补偿。第二预测单元48可包含存储先前重建的加强层数据(例如,先前编码的帧或切片的经解码型式)的存储器。使用与对应基础层视频块相关联的运动向量(例如,“基础层的运动信息”),第二预测单元48可执行相对于此所存储的加强层数据的运动补偿,以便产生N位域中的预测性块。
因此,根据本发明,控制单元42确定N位加强层视频块对应于基础层内块还是基础层间块。如果N位加强层视频块对应于基础层内块,那么在控制单元42的指导下,第一预测单元46根据第一层间预测性译码技术对N位加强层视频块进行译码,其中第一层间预测性译码技术包括产生残余视频块作为N位加强层视频块与对应经重建的M位基础层视频块的经升取样的N位型式之间的差。如果N位加强层视频块对应于基础层间块,那么控制单元42在第一层间预测性译码技术(其可由第一预测单元46应用)与第二层间预测性译码技术(其可由第二预测单元48应用)之间做出选择。如所提及,第二层间预测性译码技术包括产生残余视频块作为N位加强层视频块与通过与对应M位基础层视频块相关联的运动向量识别的N位预测块之间的差。
控制单元42接着对待由解码器使用的信息进行编码,使得解码器可确定如何对经编码的数据进行解码。明确地说,控制单元42对待由解码器使用以确定使用了第一层间预测性译码技术还是第二层间预测性译码技术对N位加强层视频块进行编码的经编码位流内的信息进行编码。在一个实例中,待由解码器使用的此“第二”语法信息包含每针对其使用层间预测的视频块一位信息,其中所述一位信息与N位加强层视频块对应于层内块还是层间块的确定的组合识别使用了第一层间预测性译码技术还是第二层间预测性译码技术。
或者,待由解码器使用的“第二”语法信息可包含每基于基础层间视频块而译码的视频块一位信息,因为基于基础层内块译码的加强层块可始终使用第一层间预测性译码技术而译码,且解码器可经编程以知晓对应于基础层内块的加强层块应使用第一层间预测性译码技术来解码。在此状况下,所述一位信息与N位加强层视频块对应于层内块还是层间块的确定的组合识别使用了第一层间预测性译码技术还是第二层间预测性译码技术。并且,仅在每视频块一个位的“第一”语法信息识别是否选择任一形式的层间预测的情况下,对“第二”语法信息进行译码。
对于此“第二”语法信息,包括每视频块一个位还是或者仅包括每对应于基础层间视频块的视频块一个位的决策可取决于解码器是否将支持加强层和基础层的单独熵解码和解析。如果需要加强层和基础层的单独熵解码和解析(例如)以加速解码,那么应使用每视频块一个位而非只是每层间块一个位。否则,解码器可能需要知晓对应基础层视频块的译码类型,以针对加强层视频块做出是否对识别第一层间预测性译码技术与第二层间预测性译码技术中的任一者的位进行解码的确定。
经编码的加强层视频块以及待由解码器使用以识别将用于视频块的预测性译码技术的任何预测语法和任何额外位可由单元52进行熵译码。多路复用单元58可接着组合基础层与加强层以创建输出位流。输出位流包括基础层、加强层和相关联语法。输出位流可经存储,和/或调制并发射到另一装置。
图4是说明可对应于图1的可缩放位深度视频解码器28的示范性可缩放视频解码器100的框图。可缩放视频解码器100包含基础层解码器90和加强层解码器70。虽然单独地说明,但在一些实施方案中,可共享或组合基础层解码器90和加强层解码器90的各种单元。此外,可缩放视频解码器100可与可缩放视频编码器35(图2)集成以形成组合的编解码器(编码器-解码器)。在此状况下,可缩放视频解码器100的各种组件可与可缩放视频编码器35的那些组件重叠。
基本上,可缩放视频解码器100的解码功能性可被看作以上相对于可缩放视频编码器35描述的编码功能性的互逆操作基础层解码器90对基础层视频块进行解码,而加强层解码器70对加强层视频块进行解码。解多路复用单元86接收SVC位流,且分离基础层数据与加强层数据。将接收到的基础层数据发送到基础层解码器90,且将加强层数据发送到加强层解码器70。在解码侧,本发明的技术大体上涉及在确定基于基础层对N位加强层视频块进行了译码后由加强层解码器70对加强层视频块进行解码。位流中的包含每视频块一个位的第一语法信息可(例如)通过指示是否针对所述视频块启用层间预测而指示是否基于基础层对N位加强层视频块进行了译码。
如所说明,加强层解码器70可包含由控制单元72控制的各种解码单元74。类似地,基础层解码器90可包含由控制单元92控制的各种解码单元94。可缩放视频解码器100还包含反音调映射单元84,其将来自基础层解码器90的M位样本升取样为用于加强层解码器70的N位样本。解多路复用单元58可将接收到的位流分离为基础层和加强层。单独的熵译码单元82和99可分别包括于加强层解码器70与基础层解码器90中,但组合的熵解码单元可能替代地用于一些实施例。
针对基础层和加强层实施单独的熵译码单元82和99可加速解码过程。在此状况下,经译码位流需要包括每视频块一个位以识别使用了第一层间预测性译码技术还是第二层间预测性译码技术,而不管对应基础层视频块经层内还是层间译码。如果仅针对对应于基础层间块的块发送一个位,那么加强层解码器70的熵译码单元32将需要等待基础层解码器90的熵译码单元99解析基础层位流,使得加强层解码器70可识别基础层块类型。在此状况下,为了避免延迟,可能需要包括每视频块一个位以识别甚至对于对应于基础层内块的加强层块,使用了第一层间预测性译码技术还是第二层间预测性译码技术,所述对应于基础层内块的加强层块可始终根据第一层间预测性译码技术来译码。并且,仅在(已经解码的)第一一位语法信息识别启用层间预测的情况下,对此一位语法信息进行解码。
对于基础层解码来说,基础层解码器90包括层内单元96、层间单元98和熵译码单元99。例如解量化单元和反变换单元等各种其它单元也常用于预测性视频解码中,但为了简单和易于说明在图4中并未说明。层内单元96执行层内视频块的基于层内的解码,而层间单元98执行层间视频块的基于层间的解码。熵解码单元99解析接收到的基础层位流以根据熵解码方法解压缩经译码的数据和语法信息。
对于基础层视频块的基于层内的解码来说,层内单元96可(例如)在解量化和反变换之后接收残余视频块,其为了简单和易于说明在图4中并未展示。层内单元96可基于与正在解码的残余视频块相同的经译码单元(例如,相同的帧或切片)内的数据而产生预测性数据。预测语法(例如,将用以产生预测数据的层内模式)可形成接收到的位流的一部分,且此预测语法可用以产生预测性数据。将预测性数据添加到残余视频块,其形成重建的视频块。
对于基础层视频块的基于层间的解码来说,层间单元98可(例如)在解量化和反变换之后接收残余视频块。在此状况下,层间单元98基于不同经译码单元(例如,视频序列的先前或后续帧或切片)内的数据而产生预测性数据。预测语法(在此状况下,例如,用以产生预测数据的一个或一个以上运动向量)可形成接收到的位流的一部分,且此预测语法可用以产生预测性数据。将预测性数据添加到残余视频块,其形成重建的视频块。
加强层解码器70可以稍微不同于基础层解码器90的方式执行基于预测的解码。具体来说,加强层解码器70可执行依靠对应基础层数据(例如,基础层的相同空间和时间定位的经译码单元)的一种或一种以上层间预测技术以对加强层视频块进行解码。
一旦加强层解码器70确定使用某一类型的层间预测基于基础层数据对给定加强层视频块进行了译码,本发明的技术就可相对于由加强层解码器70执行的加强层解码特定地适用。加强层解码器70可检查语法信息的第一位以做出此初始确定。
加强层解码器70包括各种解码单元74,其包括第一预测单元76、第二预测单元78和熵译码单元82。与编码器一样,加强层解码器70的这些各种解码单元74可经集成,且/或可具有共享逻辑或例程,以便执行本文中所描述的不同类型的译码。此外,与基础层解码器90一样,加强层解码器70可进一步包括解量化单元和反变换单元(未图示)(例如)以将变换系数解量化并将经解量化的系数反变换为像素域中的残余视频块。与图3一样,这些组件为了简单和易于说明在图4中并未展示,但可被看作第一预测译码单元76和第二预测译码单元78的一部分。并且,应注意,加强层解码器70还可支持N位域中的层内和层间预测。为了简单和易于说明,并未展示加强层解码器70的这些层内和层间单元。
第一预测单元76可用于对对应于经层内译码基础层视频块的加强层视频块进行解码。第一预测单元76应用第一层间预测性译码技术,所述第一层间预测性译码技术包括产生重建的视频块作为N位残余加强层视频块与对应经重建M位基础层视频块的经升取样N位型式的和。对应经重建M位基础层视频块的经升取样N位型式可由反音调映射单元84提供到第一预测单元76。
第二预测单元78应用第二类型的预测性译码技术,所述第二类型的预测性译码技术包括产生重建的视频块作为N位残余加强层视频块与通过与对应M位基础层视频块相关联的运动向量识别的N位预测块的和。在此状况下,并非使用对应基础层视频块的经升取样型式,第二预测单元78只是使用对应基础层视频块的例如运动向量(例如,展示于图4中的“基础层的运动信息”)等预测语法,以执行相对于加强层数据的运动补偿,所述加强层数据可为存储于与加强层解码器70相关联的存储器(未图示)中的经重建的加强层视频帧或切片。
根据本发明,控制单元72确定N位加强层视频块对应于基础层中的层内块还是层间块。如果N位残余加强层视频块对应于基础层中的层内块,那么在控制单元72的指导下,第一预测单元76根据第一层间预测性译码技术对N位加强层视频块进行解码,其中第一层间预测性译码技术包括产生经重建的视频块作为N位残余加强层视频块与对应经重建的M位基础层视频块的经升取样的N位型式的和。
如果N位残余加强层视频块对应于基础层间块,那么控制单元72在第一层间预测性译码技术(其可由第一预测单元76应用)与第二层间预测性译码技术(其可由第二预测单元78应用)之间做出选择。如所提及,第二层间预测性译码技术包括产生经重建的视频块作为N位残余加强层视频块与通过与对应M位基础层视频块相关联的运动向量识别的N位预测块的和。
控制单元72还对可有助于加强层解码器70确定如何对经编码数据进行解码的信息进行解码。明确地说,控制单元72对经编码的位流内的信息进行解码以确定使用了第一层间预测性译码技术还是第二层间预测性译码技术对N位加强层视频块进行编码。在一个实例中,待由加强层解码器70使用的此信息包含每经层间译码的视频块一位“第二”语法信息以指示使用了第一层间预测性译码技术还是第二层间预测性译码技术。相比之下,“第一”语法信息规定加强层视频块的预测是否使用了基础层的信息。因而,仅当第一语法信息识别加强层视频块的预测使用了基础层的信息时,才接收到“第二”语法信息。
或者,待由加强层解码器70使用的信息可包含每对应于基础层间块的视频块一位“第二”语法信息,因为对应于基础层内块的加强层块可始终使用第一层间预测性译码技术来译码,且加强层解码器70可经编程以知晓对应于基础层内块的加强层块应使用第一层间预测性译码技术来解码。在此状况下,所述一位信息与N位加强层视频块对应于基础层中的层内块还是层间块的确定的组合识别使用了第一层间预测性译码技术还是第二层间预测性译码技术。
对于“第二”语法信息包括每经层间译码的视频块一个位还是或者仅包括每特定地对应于基础层间块的视频块一个位的实施决策可取决于可缩放位深度视频编码器100是否支持加强层和基础层的单独熵解码和解析。如果如图4中所说明,实施加强层和基础层的单独熵解码和解析(例如)以加速解码,那么应使用每视频块一个位而非只是每对应于基础层间块的视频块一个位。否则,加强层解码器70可能需要知晓经解码的基础层视频块的译码类型,以针对加强层视频块做出是否对识别第一层间预测性译码技术与第二层间预测性译码技术中的任一者的位进行解码的确定。
图5是说明与本发明一致的示范性编码技术的流程图。将从图3的可缩放视频编码器35的观点来描述图5。如图5中所示,可缩放视频编码器35产生基础层和加强层以及加强层视频块,可缩放视频编码器35确定应基于基础层数据对加强层视频块进行译码(501)。举例来说,可缩放视频编码器35可接收N位样本,将N位样本提供到加强层编码器40以界定加强层,且将N位样本降取样为M位样本以界定基础层。可分别由基础层编码器60和加强层编码器40来单独地对基础层和加强层进行译码。在加强层编码器40确定应基于基础层数据对加强层视频块进行译码时,可应用图5的技术。
在此状况下,对加强层编码来说,控制单元42确定N位加强层视频块对应于基础层中的基础层内块还是基础层间块(502)。如果加强层视频块对应于基础层内块(“层内”502),那么第一预测单元46根据第一层间预测性技术对N位加强层视频块进行编码(503)。第一层间预测性译码技术包括产生残余视频块作为N位加强层视频块与对应经重建M位基础层视频块的经升取样N位型式之间的差。另一方面,如果加强层视频块对应于基础层间块(“层间”502),那么控制单元42在第一层间预测性译码技术与第二层间预测性译码技术之间做出选择(504)。单元44中的一者或一者以上根据所选择的预测性译码技术对N位加强层视频块进行编码(505)。明确地说,依据所述选择,第一预测单元46可执行第一层间预测性译码技术,或第二预测单元48可执行第二层间预测性译码技术。
控制单元42可通过应用速率失真算法而执行第一层间预测性译码技术与第二层间预测性译码技术之间的选择(504)。明确地说,控制单元42可考虑通过第一层间预测性译码技术译码的视频块与通过第二层间预测性译码技术译码的视频块之间的视频质量差。此外,如果使用第一层间预测性译码技术或使用第二层间预测性译码技术对视频块进行译码,那么控制单元42可考虑所实现的压缩等级。在一些状况下,加强层编码器40可实际上使用两种层间预测技术对视频块进行编码,且接着基于质量和压缩等级而做出选择(504)。视情境而定,可能更需要实现最佳可能质量(即,最低量的失真)或最佳压缩(例如)以促进实现数据通信的最佳速率。在一些状况下,根据速率失真算法使这些因素平衡从而做出选择。
控制单元42还可产生语法信息以向解码器告知用于N位加强层视频块的预测性译码技术(506)。如上更详细论述,此语法信息可包括:指示基础层数据被用以对加强层视频块进行编码(即,使用层间预测)的第一语法信息,和用以向解码器告知所使用的层间预测技术的类型的第二语法信息。第一语法信息可包含每视频块一个位。第二语法信息可包含每经层间译码的视频块一个位,或每特定地对应于基础层间块的经层间译码的视频块一个位。如上所论述,每对应于基础层间块的视频块一个位具有较高压缩等级的优点,而针对每个经层间译码的视频块一个位具有促进在解码器处对基础层和加强层进行单独熵译码和解析的优点,其可加速解码过程。在任一状况下,熵译码单元52可对数据(包括经译码的视频块和语法信息)进行熵编码以产生经译码位流(507)。可缩放视频编码器35可接着将经译码位流转发到一个或一个以上调制器和发射器以(例如)经由图1的调制器/发射器24而将经译码位流信号调制并发射到另一装置(508)。
图6是说明与本发明一致的示范性解码技术的流程图。将从图3的可缩放视频编码器100的观点来描述图6。如图6中所示,可缩放视频解码器100接收包含基础层视频数据和加强层视频数据以及语法信息的位流(601)。解多路复用单元86分离基础层数据与加强层数据(602),且将数据分别转发到加强层解码器70和基础层解码器90。语法信息可包括:指示基础层数据是否用以对加强层视频块进行了编码(即,是否使用层间预测)的第一语法信息,和用以向解码器告知所使用的层间预测技术的类型的第二语法信息。如果第一语法信息并未指示基础层数据被用以对加强层视频块进行了编码,那么本发明的技术可能不适用。相反,当第一语法信息指示使用层间预测将基础层数据用以对加强层视频块进行了编码时,本发明的技术特定地适用。
在加强层解码器70中,控制单元72确定N位加强层视频块对应于基础层中的层内块还是层间块(603)。如果加强层视频块对应于基础层内块(“层内”503),那么第一预测单元76根据第一层间预测性技术对N位加强层视频块进行解码(604)。明确地说,对于解码来说,第一层间预测性译码技术包括产生重建的视频块作为N位残余加强层视频块与对应经重建M位基础层视频块的经升取样N位型式的和。
另一方面,如果加强层视频块对应于基础层间块(“层间”603),那么控制单元72在第一层间预测性译码技术与第二层间预测性译码技术之间做出选择(605),且根据所选择的预测性技术对N位加强层视频块进行解码(606)。明确地说,依据所述选择,第一预测单元76可执行第一层间预测性译码技术,或第二预测单元78可执行第二层间预测性译码技术。并且,第一层间预测性译码技术包括产生重建的视频块作为N位残余加强层视频块与对应经重建M位基础层视频块的经升取样N位型式的和。相比之下,用于解码的第二层间预测性译码技术包括产生经重建的视频块作为N位残余加强层视频块与通过与对应M位基础层视频块相关联的运动向量识别的N位预测块的和。选择(“605”)可至少部分基于位流中的“第二”语法信息,如上所概述,所述“第二”语法信息可界定于编码器处以确定应使用第一层间预测性译码技术还是第二层间预测性译码技术对N位残余加强层视频块进行解码。
本文中所描述的技术可以硬件、软件、固件或其任一组合来实施。描述为模块或组件的任何特征可共同地实施于集成逻辑装置中或单独地实施为离散但可互操作的逻辑装置。如果以软件来实施,那么所述技术可由包含指令的计算机可读媒体至少部分地实现,所述指令当执行时执行上文所描述的方法中的一者或一者以上。计算机可读数据存储媒体可形成计算机程序产品的一部分,所述计算机程序产品可包括封装材料。计算机可读媒体可包含例如同步动态随机存取存储器(SDRAM)的随机存取存储器(RAM)、只读存储器(ROM)、非易失性随机存取存储器(NVRAM)、电可擦除可编程只读存储器(EEPROM)、快闪存储器、磁性或光学数据存储媒体等。另外或作为替代,所述技术可由携载或传送呈指令或数据结构的形式且可由计算机存取、读取和/或执行的代码的计算机可读通信媒体至少部分地实现。
所述代码可由一个或一个以上处理器执行,所述处理器例如一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路。因此,如本文所使用的术语“处理器”可指代前述结构的任一者或任何其它适于本文所描述的技术的实施的结构。此外,在一些方面中,本文所描述的功能性可提供于经配置以用于编码和解码的专用软件模块或硬件模块内,或并入于经组合的视频编码器-解码器(CODEC)中。
如果以硬件来实施,那么本发明可针对电路,例如集成电路、芯片集专用集成电路(ASIC)、现场可编程门阵列(FPGA)、逻辑或其经配置以执行本文描述的技术中的一者或一者以上的各种组合。
已描述本发明的各种实施例。这些和其它实施例在所附权利要求书的范围内。

Claims (42)

1.一种根据基于位深度的可缩放视频译码(SVC)方案对视频数据进行编码的方法,所述方法包含:
产生与所述视频数据相关联的基础层和加强层,其中所述基础层界定具有M个位的位深度的所述视频数据,且所述加强层界定对所述位深度达N个位的加强,其中N大于M;以及
对所述基础层和所述加强层进行编码,其中对所述加强层进行编码包括:
确定是否应使用层间预测基于所述基础层对N位加强层视频块进行译码,且在确定应使用层间预测基于所述基础层对所述N位加强层视频块进行译码后:
确定所述N位加强层视频块对应于基础层内块还是基础层间块;
如果所述N位加强层视频块对应于基础层内块,那么根据第一层间预测性译码技术对所述N位加强层视频块进行译码,其中所述第一层间预测性译码技术包括产生残余视频块作为所述N位加强层视频块与对应经重建的M位基础层视频块的经升取样的N位型式之间的差;以及
如果所述N位加强层视频块对应于基础层间块,那么在所述第一层间预测性译码技术与第二层间预测性译码技术之间做出选择,其中所述第二层间预测性译码技术包括产生所述残余视频块作为所述N位加强层视频块与通过与对应M位基础层视频块相关联的运动向量识别的N位预测块之间的差。
2.根据权利要求1所述的方法,所述方法进一步包含:
对第一信息进行编码,所述第一信息待由解码器使用以确定使用层间预测基于所述基础层对所述N位加强层视频块进行了译码;以及
对第二信息进行编码,所述第二信息待由解码器使用以确定使用了所述第一层间预测性译码技术还是所述第二层间预测性译码技术对所述N位加强层视频块进行了编码。
3.根据权利要求2所述的方法,其中待由所述解码器使用的所述第一信息包含每视频块一位信息,且待由所述解码器使用的所述第二信息包含每针对其使用层间预测的视频块一位信息。
4.根据权利要求2所述的方法,其中待由所述解码器使用的所述第一信息包含每视频块一位信息,且待由所述解码器使用的所述第二信息包含每针对其使用层间预测且针对其对所述对应基础层视频块进行层间译码的视频块一位信息,其中所述第二信息与对所述N位加强层视频块对应于基础层内块还是基础层间块的确定的组合识别使用了所述第一层间预测性译码技术还是所述第二层间预测性译码技术。
5.一种根据基于位深度的可缩放视频译码(SVC)方案对视频数据进行解码的方法,
所述方法包含:
接收与所述视频数据相关联的基础层和加强层,其中所述基础层界定具有M个位的位深度的所述视频数据,且所述加强层界定对所述位深度达N个位的加强,其中N大于M;以及
对所述基础层和所述加强层进行解码,其中对所述加强层进行解码包括:
确定是否使用层间预测基于所述基础层对N位加强层视频块进行了译码,且在确定使用层间预测基于所述基础层对所述N位加强层视频块进行了译码后:
确定所述N位加强层视频块对应于基础层内块还是基础层间块;
如果所述N位残余加强层视频块对应于基础层内块,那么根据第一层间预测性译码技术对所述N位残余加强层视频块进行解码,其中所述第一层间预测性译码技术包括产生经重建的视频块作为所述N位残余加强层视频块与对应经重建的M位基础层视频块的经升取样的N位型式的和;以及
如果所述N位残余加强层视频块对应于基础层间块,那么在所述第一层间预测性译码技术与第二层间预测性译码技术之间做出选择,其中所述第二层间预测性译码技术包括产生所述经重建的视频块作为所述N位残余加强层视频块与通过与对应M位基础层视频块相关联的运动向量识别的N位预测块的和。
6.根据权利要求5所述的方法,所述方法进一步包含:
接收第一信息,所述第一信息将用以确定是否使用层间预测基于所述基础层对所述N位加强层视频块进行了译码;以及
接收第二信息,所述第二信息将用以确定应使用所述第一层间预测性译码技术还是所述第二层间预测性译码技术对所述N位加强层视频块进行解码。
7.根据权利要求6所述的方法,
其中将用以确定是否使用层间预测基于所述基础层对所述N位加强层视频块进行了译码的所述第一信息包含每视频块一位信息,且
其中将用以确定应使用所述第一层间预测性译码技术还是所述第二层间预测性译码技术的所述第二信息包含每针对其使用层间预测的视频块一位信息。
8.根据权利要求7所述的方法,其进一步包含单独地对所述基础层和所述加强层进行熵解码。
9.根据权利要求6所述的方法,
其中将用以确定是否使用层间预测基于所述基础层对所述N位加强层视频块进行了译码的所述第一信息包含每视频块一位信息,且
其中将用以确定应使用所述第一层间预测性译码技术还是所述第二层间预测性译码技术的所述第二信息包含每针对其使用层间预测且针对其对所述对应基础层视频块进行层间译码的视频块一位信息,其中所述第二信息与对所述N位加强层视频块对应于基础层内块还是基础层间块的确定的组合识别使用了所述第一层间预测性译码技术还是所述第二层间预测性译码技术。
10.一种根据基于位深度的可缩放视频译码(SVC)方案对视频数据进行编码的设备,所述设备包含:
基于位深度的可缩放视频编码器,其:产生与所述视频数据相关联的基础层和加强层,其中所述基础层界定具有M个位的位深度的所述视频数据,且所述加强层界定对所述位深度达N个位的加强,其中N大于M;并对所述基础层和所述加强层进行编码,其中对于所述加强层来说,其中所述视频编码器:
确定是否应使用层间预测基于所述基础层对N位加强层视频块进行译码,且在确定应使用层间预测基于所述基础层对所述N位加强层视频块进行译码后:
确定N位加强层视频块对应于基础层内块还是基础层间块;
如果所述N位加强层视频块对应于层内块,那么根据第一层间预测性译码技术对所述N位加强层视频块进行编码,其中所述第一层间预测性译码技术包括产生残余视频块作为所述N位加强层视频块与对应经重建的M位基础层视频块的经升取样的N位型式之间的差;以及
如果所述N位加强层视频块对应于基础层间块,那么在所述第一层间预测性译码技术与第二层间预测性译码技术之间做出选择,其中所述第二层间预测性译码技术包括产生所述残余视频块作为所述N位加强层视频块与通过与对应M位基础层视频块相关联的运动向量识别的N位预测块之间的差。
11.根据权利要求10所述的设备,其中所述基于位深度的可缩放视频编码器:
对第一信息进行编码,所述第一信息将由解码器使用以确定使用层间预测基于所述基础层对所述N位加强层视频块进行了译码;以及
对第二信息进行编码,所述第二信息将由解码器使用以确定使用所述第一层间预测性译码技术还是所述第二层间预测性译码技术对所述N位加强层视频块进行了编码。
12.根据权利要求11所述的设备,其中将由所述解码器使用的所述第一信息包含每视频块一位信息,且将由所述解码器使用的所述第二信息包含每针对其使用层间预测的视频块一位信息。
13.根据权利要求11所述的设备,其中将由所述解码器使用的所述第一信息包含每视频块一位信息,且将由所述解码器使用的所述第二信息包含每针对其使用层间预测且针对其对所述对应基础层视频块进行层间译码的视频块一位信息,其中所述第二信息与对所述N位加强层视频块对应于基础层内块还是基础层间块的确定的组合识别使用了所述第一层间预测性译码技术还是所述第二层间预测性译码技术。
14.根据权利要求10所述的设备,其中所述设备包含集成电路和微处理器中的一者。
15.一种根据基于位深度的可缩放视频译码(SVC)方案对视频数据进行解码的设备,所述设备包含:
基于位深度的可缩放视频解码器,其:接收与所述视频数据相关联的基础层和加强层,其中所述基础层界定具有M个位的位深度的所述视频数据,且所述加强层界定对所述位深度达N个位的加强,其中N大于M;并对所述基础层和所述加强层进行解码,其中对于所述加强层来说,其中所述视频解码器:
确定是否使用层间预测基于所述基础层对N位加强层视频块进行了译码,且在确定使用层间预测基于所述基础层对所述N位加强层视频块进行了译码后:
确定N位残余加强层视频块对应于基础层内块还是基础层间块;
如果所述N位残余加强层视频块对应于基础层内块,那么根据第一层间预测性译码技术对所述N位残余加强层视频块进行解码,其中所述第一层间预测性译码技术包括产生经重建的视频块作为所述N位残余加强层视频块与对应经重建的M位基础层视频块的经升取样的N位型式的和;以及
如果所述N位残余加强层视频块对应于基础层间块,那么在所述第一层间预测性译码技术与第二层间预测性译码技术之间做出选择,其中所述第二层间预测性译码技术包括产生所述经重建的视频块作为所述N位残余加强层视频块与通过与对应M位基础层视频块相关联的运动向量识别的N位预测块的和。
16.根据权利要求15所述的设备,其中所述解码器:
接收第一信息,所述第一信息将用以确定是否使用层间预测基于所述基础层对所述N位加强层视频块进行了译码;以及
接收第二信息,所述第二信息将用以确定应使用所述第一层间预测性译码技术还是所述第二层间预测性译码技术对所述N位加强层视频块进行解码。
17.根据权利要求16所述的设备,
其中将用以确定是否使用层间预测基于所述基础层对所述N位加强层视频块进行了译码的所述第一信息包含每视频块一位信息,且
其中将用以确定应使用所述第一层间预测性译码技术还是所述第二层间预测性译码技术的所述第二信息包含每针对其使用层间预测的视频块一位信息。
18.根据权利要求17所述的设备,其中所述解码器包含两个单独熵解码单元,所述熵解码单元单独地对所述基础层和所述加强层进行熵解码。
19.根据权利要求16所述的设备,
其中将用以确定是否使用层间预测基于所述基础层对所述N位加强层视频块进行了译码的所述第一信息包含每视频块一位信息,且
其中将用以确定应使用所述第一层间预测性译码技术还是所述第二层间预测性译码技术的所述第二信息包含每针对其使用层间预测且针对其对所述对应基础层视频块进行层间译码的视频块一位信息,其中所述第二信息与对所述N位加强层视频块对应于基础层内块还是基础层间块的确定的组合识别使用了所述第一层间预测性译码技术还是所述第二层间预测性译码技术。
20.根据权利要求15所述的设备,其中所述设备包含集成电路和微处理器中的一者。
21.一种包含指令的计算机可读媒体,所述指令在执行后促使视频译码装置根据基于位深度的可缩放视频译码(SVC)方案对视频数据进行编码,其中所述指令促使所述装置:
产生与所述视频数据相关联的基础层和加强层,其中所述基础层界定具有M个位的位深度的所述视频数据,且所述加强层界定对所述位深度达N个位的加强,其中N大于M;并对所述基础层和所述加强层进行编码,其中对于所述加强层来说,所述指令促使所述装置:
确定是否应使用层间预测基于所述基础层对N位加强层视频块进行译码,且在确定应使用层间预测基于所述基础层对所述N位加强层视频块进行译码后:
确定N位加强层视频块对应于基础层内块还是基础层间块;
如果所述N位加强层视频块对应于基础层内块,那么根据第一层间预测性译码技术对所述N位加强层视频块进行编码,其中所述第一层间预测性译码技术包括产生残余视频块作为所述N位加强层视频块与对应经重建的M位基础层视频块的经升取样的N位型式之间的差;以及
如果所述N位加强层视频块对应于基础层间块,那么在所述第一层间预测性译码技术与第二层间预测性译码技术之间做出选择,其中所述第二层间预测性译码技术包括产生所述残余视频块作为所述N位加强层视频块与通过与对应M位基础层视频块相关联的运动向量识别的N位预测块之间的差。
22.根据权利要求21所述的计算机可读媒体,其中所述指令进一步促使所述装置:对第一信息进行编码,所述第一信息将由解码器使用以确定使用层间预测基于所述基础层对所述N位加强层视频块进行了译码;以及
对第二信息进行编码,所述第二信息将由解码器使用以确定使用所述第一层间预测性译码技术还是所述第二层间预测性译码技术对所述N位加强层视频块进行了编码。
23.根据权利要求22所述的计算机可读媒体,其中将由所述解码器使用的所述第一信息包含每视频块一位信息,且将由所述解码器使用的所述第二信息包含每针对其使用层间预测的视频块一位信息。
24.根据权利要求22所述的计算机可读媒体,其中将由所述解码器使用的所述第一信息包含每视频块一位信息,且将由所述解码器使用的所述第二信息包含每针对其使用层间预测且针对其对所述对应基础层视频块进行层间译码的视频块一位信息,其中所述第二信息与对所述N位加强层视频块对应于基础层内块还是基础层间块的确定的组合识别使用了所述第一层间预测性译码技术还是所述第二层间预测性译码技术。
25.一种包含指令的计算机可读媒体,所述指令在执行后促使视频译码装置根据基于位深度的可缩放视频译码(SVC)方案对视频数据进行解码,其中所述指令促使所述装置:
在接收与所述视频数据相关联的基础层和加强层后,其中所述基础层界定具有M个位的位深度的所述视频数据,且所述加强层界定对所述位深度达N个位的加强,其中N大于M,
对所述基础层和所述加强层进行解码,其中对于所述加强层来说,所述指令促使所述装置:
确定是否使用层间预测基于所述基础层对N位加强层视频块进行了译码,且在确定使用层间预测基于所述基础层对所述N位加强层视频块进行了译码后:
确定N位加强层视频块对应于基础层内块还是基础层间块;
如果所述N位残余加强层视频块对应于基础层内块,那么根据第一层间预测性译码技术对所述N位残余加强层视频块进行解码,其中所述第一层间预测性译码技术包括产生经重建的视频块作为所述N位残余加强层视频块与对应经重建的M位基础层视频块的经升取样的N位型式的和;以及
如果所述N位残余加强层视频块对应于基础层间块,那么在所述第一层间预测性译码技术与第二层间预测性译码技术之间做出选择,其中所述第二层间预测性译码技术包括产生所述经重建的视频块作为所述N位残余加强层视频块与通过与对应M位基础层视频块相关联的运动向量识别的N位预测块的和。
26.根据权利要求25所述的计算机可读媒体,其中所述指令进一步促使所述装置:至少部分基于由编码器界定的接收到的信息而确定使用所述第一层间预测性译码技术还是所述第二层间预测性译码技术对所述N位加强层视频块进行了编码。
27.根据权利要求26所述的计算机可读媒体,其中由编码器界定的所述接收到的信息包含:
将用以确定是否使用层间预测基于所述基础层对所述N位加强层视频块进行了译码的第一信息,其中所述第一信息包含每视频块一位信息,以及
将用以确定应使用所述第一层间预测性译码技术还是所述第二层间预测性译码技术的第二信息,其中所述第二信息包含每针对其使用层间预测的视频块一位信息。
28.根据权利要求27所述的计算机可读媒体,其中所述指令促使所述装置单独地对所述基础层和所述加强层进行解码。
29.根据权利要求26所述的计算机可读媒体,其中由编码器界定的所述接收到的信息包含:
将用以确定是否使用层间预测基于所述基础层对所述N位加强层视频块进行了译码的第一信息,其中所述第一信息包含每视频块一位信息,以及
将用以确定应使用所述第一层间预测性译码技术还是所述第二层间预测性译码技术的第二信息,其中所述第二信息包含每针对其使用层间预测且针对其对所述对应基础层视频块进行层间译码的视频块一位信息,其中所述第二信息与对所述N位加强层视频块对应于基础层内块还是基础层间块的确定的组合识别使用了所述第一层间预测性译码技术还是所述第二层间预测性译码技术。
30.一种根据基于位深度的可缩放视频译码(SVC)方案对视频数据进行编码的装置,所述装置包含:
用于产生与所述视频数据相关联的基础层和加强层的装置,其中所述基础层界定具有M个位的位深度的所述视频数据,且所述加强层界定对所述位深度达N个位的加强,其中N大于M;
用于对所述基础层进行编码的装置;以及
用于对所述加强层进行编码的装置,其中用于对所述加强层进行编码的装置包括:
用于确定是否应使用层间预测基于所述基础层来对N位加强层视频块进行译码的装置,且在确定应使用层间预测基于所述基础层对所述N位加强层视频块进行译码后:
用于确定N位加强层视频块对应于基础层内块还是基础层间块的装置;
在所述N位加强层视频块对应于基础层内块的情况下,用于根据第一层间预测性译码技术对所述N位加强层视频块进行编码的装置,其中所述第一层间预测性译码技术包括产生残余视频块作为所述N位加强层视频块与对应经重建的M位基础层视频块的经升取样的N位型式之间的差;以及
在所述N位加强层视频块对应于基础层间块的情况下,用于在所述第一层间预测性译码技术与第二层间预测性译码技术之间做出选择的装置,其中所述第二层间预测性译码技术包括产生所述残余视频块作为所述N位加强层视频块与通过与对应M位基础层视频块相关联的运动向量识别的N位预测块之间的差。
31.根据权利要求30所述的装置,所述装置进一步包含:
用于对第一信息进行编码的装置,所述第一信息将由解码器使用以确定使用层间预测基于所述基础层对所述N位加强层视频块进行了译码;以及
用于对第二信息进行编码的装置,所述第二信息将由解码器使用以确定使用所述第一层间预测性译码技术还是所述第二层间预测性译码技术对所述N位加强层视频块进行了编码。
32.根据权利要求31所述的装置,其中将由所述解码器使用的所述第一信息包含每视频块一位信息,且将由所述解码器使用的所述第二信息包含每针对其使用层间预测的视频块一位信息。
33.根据权利要求31所述的装置,其中将由所述解码器使用的所述第一信息包含每视频块一位信息,且将由所述解码器使用的所述第二信息包含每针对其使用层间预测且针对其对所述对应基础层视频块进行层间译码的视频块一位信息,其中所述第二信息与对所述N位加强层视频块对应于基础层内块还是基础层间块的确定的组合识别使用了所述第一层间预测性译码技术还是所述第二层间预测性译码技术。
34.一种根据基于位深度的可缩放视频译码(SVC)方案对视频数据进行解码的装置,所述装置包含:
用于接收与所述视频数据相关联的基础层和加强层的装置,其中所述基础层界定具有M个位的位深度的所述视频数据,且所述加强层界定对所述位深度达N个位的加强,其中N大于M;以及
用于对所述基础层进行解码的装置;以及
用于对所述加强层进行解码的装置,其中用于对所述加强层进行解码的装置包括:
用于确定是否使用层间预测基于所述基础层对N位加强层视频块进行了译码的装置,且在确定使用层间预测基于所述基础层对所述N位加强层视频块进行了译码后:
用于确定N位残余加强层视频块对应于基础层内块还是基础层间块的装置;
在所述N位残余加强层视频块对应于基础层内块的情况下,用于根据第一层间预测性译码技术对所述N位残余加强层视频块进行解码的装置,其中所述第一层间预测性译码技术包括产生经重建的视频块作为所述N位残余加强层视频块与对应经重建的M位基础层视频块的经升取样的N位型式的和;以及
在所述N位残余加强层视频块对应于基础层间块的情况下,用于在所述第一层间预测性译码技术与第二层间预测性译码技术之间做出选择的装置,其中所述第二层间预测性译码技术包括产生所述经重建的视频块作为所述N位残余加强层视频块与通过与对应M位基础层视频块相关联的运动向量识别的N位预测块的和。
35.根据权利要求34所述的装置,所述装置进一步包含:
用于接收第一信息的装置,所述第一信息将用以确定是否使用层间预测基于所述基础层对所述N位加强层视频块进行了译码;以及
用于接收第二信息的装置,所述第二信息将用以确定应使用所述第一层间预测性译码技术还是所述第二层间预测性译码技术对所述N位加强层视频块进行解码。
36.根据权利要求35所述的装置,
其中将用以确定是否使用层间预测基于所述基础层对所述N位加强层视频块进行了译码的所述第一信息包含每视频块一位信息,且
其中将用以确定应使用所述第一层间预测性译码技术还是所述第二层间预测性译码技术的所述第二信息包含每针对其使用层间预测的视频块一位信息。
37.根据权利要求36所述的装置,其进一步包含用于单独地对所述基础层和所述加强层进行熵解码的装置。
38.根据权利要求36所述的装置,
其中将用以确定是否使用层间预测基于所述基础层对所述N位加强层视频块进行了译码的所述第一信息包含每视频块一位信息,且
其中将用以确定应使用所述第一层间预测性译码技术还是所述第二层间预测性译码技术的所述第二信息包含每针对其使用层间预测且针对其对所述对应基础层视频进行经层间译码的视频块一位信息,其中所述第二信息与对所述N位加强层视频块对应于基础层内块还是基础层间块的确定的组合识别使用了所述第一层间预测性译码技术还是所述第二层间预测性译码技术。
39.一种根据基于位深度的可缩放视频译码(SVC)方案对视频数据进行编码的装置,所述装置包含:
基于位深度的可缩放视频编码器,其:产生与所述视频数据相关联的基础层和加强层,其中所述基础层界定具有M个位的位深度的所述视频数据,且所述加强层界定对所述位深度达N个位的加强,其中N大于M;并对所述基础层和所述加强层进行编码,其中对于所述加强层来说,所述视频编码器:
确定是否应使用层间预测基于所述基础层对N位加强层视频块进行译码,且在确定应使用层间预测基于所述基础层对所述N位加强层视频块进行译码后:
确定N位加强层视频块对应于基础层内块还是基础层间块;
如果所述N位加强层视频块对应于基础层内块,那么根据第一层间预测性译码技术对所述N位加强层视频块进行编码,其中所述第一层间预测性译码技术包括产生残余视频块作为所述N位加强层视频块与对应经重建的M位基础层视频块的经升取样的N位型式之间的差;以及
如果所述N位加强层视频块对应于基础层间块,那么在所述第一层间预测性译码技术与第二层间预测性译码技术之间做出选择,其中所述第二层间预测性译码技术包括产生所述残余视频块作为所述N位加强层视频块与通过与对应M位基础层视频块相关联的运动向量识别的N位预测块之间的差;以及
无线发射器,其将所述基础层和所述加强层发射到另一装置。
40.根据权利要求39所述的装置,其中所述装置包含无线通信手持机。
41.一种根据基于位深度的可缩放视频译码(SVC)方案对视频数据进行解码的装置,所述装置包含:
无线接收器,其接收所述视频数据;以及
基于位深度的可缩放视频解码器,其:接收与所述视频数据相关联的基础层和加强层,其中所述基础层界定具有M个位的位深度的所述视频数据,且所述加强层界定对所述位深度达N个位的加强,其中N大于M;并对所述基础层和所述加强层进行解码,其中对于所述加强层来说,其中所述视频解码器:
确定是否使用层间预测基于所述基础层对N位加强层视频块进行了译码,且在确定使用层间预测基于所述基础层对所述N位加强层视频块进行了译码后:
确定N位残余加强层视频块对应于基础层内块还是基础层间块;
如果所述N位残余加强层视频块对应于基础层内块,那么根据第一层间预测性译码技术对所述N位残余加强层视频块进行解码,其中所述第一层间预测性译码技术包括产生经重建的视频块作为所述N位残余加强层视频块与对应经重建的M位基础层视频块的经升取样的N位型式的和;以及
如果所述N位残余加强层视频块对应于基础层间块,那么在所述第一层间预测性译码技术与第二层间预测性译码技术之间做出选择,其中所述第二层间预测性译码技术包括产生所述经重建的视频块作为所述N位残余加强层视频块与通过与对应M位基础层视频块相关联的运动向量识别的N位预测块的和。
42.根据权利要求41所述的装置,其中所述装置包含无线通信手持机。
CN2008801116648A 2007-10-15 2008-10-15 用于可缩放位深度的可缩放视频译码方法和设备 Active CN101828399B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US97992107P 2007-10-15 2007-10-15
US60/979,921 2007-10-15
US12/251,174 US8432968B2 (en) 2007-10-15 2008-10-14 Scalable video coding techniques for scalable bitdepths
US12/251,174 2008-10-14
PCT/US2008/080030 WO2009052205A1 (en) 2007-10-15 2008-10-15 Scalable video coding techniques for scalable bitdepths

Publications (2)

Publication Number Publication Date
CN101828399A true CN101828399A (zh) 2010-09-08
CN101828399B CN101828399B (zh) 2013-06-26

Family

ID=40534155

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008801116648A Active CN101828399B (zh) 2007-10-15 2008-10-15 用于可缩放位深度的可缩放视频译码方法和设备

Country Status (7)

Country Link
US (1) US8432968B2 (zh)
EP (1) EP2213100A1 (zh)
JP (2) JP5661465B2 (zh)
KR (2) KR20120060921A (zh)
CN (1) CN101828399B (zh)
TW (1) TW200934252A (zh)
WO (1) WO2009052205A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103905827A (zh) * 2012-12-25 2014-07-02 联发科技股份有限公司 视频处理装置
CN104541506A (zh) * 2012-09-28 2015-04-22 英特尔公司 层间像素样本预测
CN104956675A (zh) * 2014-01-08 2015-09-30 索尼公司 图像处理装置和图像处理方法
CN105900427A (zh) * 2014-01-08 2016-08-24 高通股份有限公司 Hevc多层扩展中的非hevc基础层的支持
CN105900431A (zh) * 2014-01-16 2016-08-24 高通股份有限公司 用于可缩放视频译码的参考层样本位置导出
CN112862073A (zh) * 2021-02-03 2021-05-28 北京大学 一种压缩数据分析方法、装置、存储介质及终端

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2084913B1 (en) * 2006-10-25 2019-02-20 GE Video Compression, LLC Quality scalable coding
US8175158B2 (en) * 2008-01-04 2012-05-08 Sharp Laboratories Of America, Inc. Methods and systems for inter-layer image prediction parameter determination
US8184693B2 (en) * 2008-04-11 2012-05-22 Intel Corporation Adaptive filtering for bit-depth scalable video codec
HUE031487T2 (en) 2008-04-16 2017-07-28 Ge Video Compression Llc Bit depth scalability
JP5564853B2 (ja) * 2009-08-14 2014-08-06 ソニー株式会社 受信装置および方法、プログラム、並びに受信システム
DE102009039095A1 (de) * 2009-08-27 2011-03-10 Siemens Aktiengesellschaft Verfahren und Vorrichtung zum Erzeugen, Decodieren und Transcodieren eines codierten Videodatenstroms
US8885714B2 (en) * 2010-01-14 2014-11-11 Texas Instruments Incorporated Method and system for intracoding in video encoding
US8995527B2 (en) * 2010-02-19 2015-03-31 Qualcomm Incorporated Block type signalling in video coding
US8559512B2 (en) * 2010-05-05 2013-10-15 Ceva D.S.P. Ltd. Device, system, and method for predicting residual data for intra and inter frame encoding of image or video data
US20120014447A1 (en) * 2010-07-16 2012-01-19 Sharp Laboratories Of America, Inc. System for low resolution power reduction with high resolution deblocking
US9313523B2 (en) * 2010-07-16 2016-04-12 Sharp Laboratories Of America, Inc. System for low resolution power reduction using deblocking
US20130194386A1 (en) * 2010-10-12 2013-08-01 Dolby Laboratories Licensing Corporation Joint Layer Optimization for a Frame-Compatible Video Delivery
GB2500835B (en) * 2010-12-10 2014-02-12 Ibm High-dynamic range video tone mapping
US20120257675A1 (en) * 2011-04-11 2012-10-11 Vixs Systems, Inc. Scalable video codec encoder device and methods thereof
WO2012173449A2 (ko) * 2011-06-17 2012-12-20 한국전자통신연구원 비디오 인코딩 및 디코딩 방법과 이를 이용한 장치
US9445093B2 (en) * 2011-06-29 2016-09-13 Qualcomm Incorporated Multiple zone scanning order for video coding
US9736489B2 (en) 2011-09-17 2017-08-15 Qualcomm Incorporated Motion vector determination for video coding
US9503750B2 (en) * 2011-11-04 2016-11-22 Futurewei Technologies, Inc. Binarization of prediction residuals for lossless video coding
JP2013102297A (ja) * 2011-11-07 2013-05-23 Canon Inc 画像符号化方法、画像符号化装置及びプログラム、画像復号方法、画像復号装置及びプログラム
JP5871628B2 (ja) 2011-11-07 2016-03-01 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
EP2777252B1 (en) 2011-11-09 2016-02-10 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Inter-layer prediction between layers of different dynamic sample value range
US9756353B2 (en) 2012-01-09 2017-09-05 Dolby Laboratories Licensing Corporation Hybrid reference picture reconstruction method for single and multiple layered video coding systems
CN104380745B (zh) * 2012-06-22 2018-04-27 联发科技股份有限公司 图层间与视图间自适应帧内预测方法及其装置
US20150208092A1 (en) * 2012-06-29 2015-07-23 Samsung Electronics Co., Ltd. Method and apparatus for encoding scalable video, and method and apparatus for decoding scalable video
US20140003504A1 (en) * 2012-07-02 2014-01-02 Nokia Corporation Apparatus, a Method and a Computer Program for Video Coding and Decoding
RU2616549C2 (ru) * 2012-07-09 2017-04-17 Вид Скейл, Инк. Архитектура кодека для многослойного кодирования видео
WO2014010943A1 (ko) * 2012-07-10 2014-01-16 한국전자통신연구원 영상 부호화/복호화 방법 및 장치
KR20140034053A (ko) * 2012-08-21 2014-03-19 삼성전자주식회사 트리 구조의 부호화 단위에 기초한 예측 정보의 인터-레이어 비디오 부호화 방법 및 그 장치, 트리 구조의 부호화 단위에 기초한 예측 정보의 인터-레이어 비디오 복호화 방법 및 그 장치
EP2898474A1 (en) * 2012-09-12 2015-07-29 Koninklijke Philips N.V. Making hdr viewing a content owner agreed process
GB2506853B (en) * 2012-09-28 2015-03-18 Canon Kk Method and apparatus for encoding an image into a video bitstream and decoding corresponding video bitstream
RU2581014C1 (ru) * 2012-09-28 2016-04-10 Сони Корпорейшн Устройство обработки изображения
US9124899B2 (en) 2012-09-28 2015-09-01 Sharp Laboratories Of America, Inc. Motion derivation and coding for scaling video
US9380307B2 (en) 2012-11-19 2016-06-28 Qualcomm Incorporated Method and system for intra base layer (BL) transform in video coding
US10085017B2 (en) * 2012-11-29 2018-09-25 Advanced Micro Devices, Inc. Bandwidth saving architecture for scalable video coding spatial mode
KR20150094619A (ko) * 2012-12-13 2015-08-19 소니 주식회사 송신 장치, 송신 방법, 수신 장치 및 수신 방법
US20140169467A1 (en) * 2012-12-14 2014-06-19 Ce Wang Video coding including shared motion estimation between multple independent coding streams
US9532057B2 (en) * 2012-12-28 2016-12-27 Qualcomm Incorporated Inter-layer prediction using sample-adaptive adjustments for bit depth scalable video coding
EP2961167A4 (en) * 2013-02-25 2016-08-10 Samsung Electronics Co Ltd DEVICE AND METHOD FOR EVOLVING VIDEO ENCODING USING MEMORY BANDWIDTH AND QUANTITY OF CALCULATION, AND DEVICE AND METHOD FOR EVOLVING VIDEO DECODING
US9578339B2 (en) 2013-03-05 2017-02-21 Qualcomm Incorporated Parallel processing for video coding
US9800884B2 (en) * 2013-03-15 2017-10-24 Qualcomm Incorporated Device and method for scalable coding of video information
US9491460B2 (en) * 2013-03-29 2016-11-08 Qualcomm Incorporated Bandwidth reduction for video coding prediction
KR20140121315A (ko) 2013-04-04 2014-10-15 한국전자통신연구원 참조 픽처 리스트를 이용한 다 계층 기반의 영상 부호화/복호화 방법 및 그 장치
WO2014163418A1 (ko) * 2013-04-04 2014-10-09 한국전자통신연구원 영상 부호화/복호화 방법 및 장치
US10277909B2 (en) * 2013-05-15 2019-04-30 Vid Scale, Inc. Single loop decoding based interlayer prediction
US9432667B2 (en) * 2013-06-11 2016-08-30 Qualcomm Incorporated Processing bitstream constraints relating to inter-layer prediction types in multi-layer video coding
US20150010083A1 (en) * 2013-07-08 2015-01-08 Electronics And Telecommunications Research Institute Video decoding method and apparatus using the same
GB2516424A (en) * 2013-07-15 2015-01-28 Nokia Corp A method, an apparatus and a computer program product for video coding and decoding
CN105850126B (zh) 2013-12-24 2019-03-26 株式会社Kt 用于对多层视频信号进行编码/解码的方法和装置
WO2015147427A1 (ko) * 2014-03-24 2015-10-01 주식회사 케이티 멀티 레이어 비디오 신호 인코딩/디코딩 방법 및 장치
CN110890935B (zh) 2014-05-09 2021-08-17 韩国电子通信研究院 使用分层划分多路复用的信号多路复用设备和方法
EP3010231A1 (en) * 2014-10-17 2016-04-20 Thomson Licensing Method for color mapping a video signal based on color mapping data and method of encoding a video signal and color mapping data and corresponding devices
FR3030975B1 (fr) * 2014-12-19 2018-03-09 Orange Procede de codage d'une image numerique, procede de decodage, dispositifs, terminal d'utilisateur et programmes d'ordinateurs associes
EP3301925A1 (en) * 2016-09-30 2018-04-04 Thomson Licensing Method for local inter-layer prediction intra based
US11496747B2 (en) * 2017-03-22 2022-11-08 Qualcomm Incorporated Intra-prediction mode propagation
CA3152728A1 (en) * 2019-10-03 2021-04-08 Han GAO Coding process for geometric partition mode
US11140445B1 (en) 2020-06-03 2021-10-05 Western Digital Technologies, Inc. Storage system and method for storing scalable video

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7929610B2 (en) * 2001-03-26 2011-04-19 Sharp Kabushiki Kaisha Methods and systems for reducing blocking artifacts with reduced complexity for spatially-scalable video coding
WO2006042611A1 (de) 2004-10-15 2006-04-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und verfahren zum erzeugen einer codierten videosequenz unter verwendung einer zwischen-schicht-bewegungsdaten-prädiktion
KR100763181B1 (ko) 2005-04-19 2007-10-05 삼성전자주식회사 기초계층과 향상계층의 데이터를 바탕으로 예측 정보를코딩하여 코딩율을 향상시키는 방법 및 장치
KR100746007B1 (ko) 2005-04-19 2007-08-06 삼성전자주식회사 엔트로피 코딩의 컨텍스트 모델을 적응적으로 선택하는방법 및 비디오 디코더
AU2006201490B2 (en) 2005-04-19 2008-05-22 Samsung Electronics Co., Ltd. Method and apparatus for adaptively selecting context model for entropy coding
KR101158439B1 (ko) * 2005-07-08 2012-07-13 엘지전자 주식회사 영상 신호의 코딩정보를 압축/해제하기 위해 모델링하는 방법
CN100594735C (zh) * 2006-03-28 2010-03-17 联詠科技股份有限公司 图像处理装置及其选择图像递色的方法
KR100781524B1 (ko) 2006-04-04 2007-12-03 삼성전자주식회사 확장 매크로블록 스킵 모드를 이용한 인코딩/디코딩 방법및 장치
EP1871113A1 (en) 2006-06-20 2007-12-26 THOMSON Licensing Method and apparatus for encoding video enhancement layer with multiresolution color scalability
US7535383B2 (en) * 2006-07-10 2009-05-19 Sharp Laboratories Of America Inc. Methods and systems for signaling multi-layer bitstream data
CN100393099C (zh) * 2006-08-31 2008-06-04 北京北大方正电子有限公司 调频调幅混合网点层次连续调控制方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104541506A (zh) * 2012-09-28 2015-04-22 英特尔公司 层间像素样本预测
CN103905827A (zh) * 2012-12-25 2014-07-02 联发科技股份有限公司 视频处理装置
CN103905827B (zh) * 2012-12-25 2017-11-10 联发科技股份有限公司 视频处理装置
US9888251B2 (en) 2012-12-25 2018-02-06 Mediatek Inc. Video processing apparatus capable of generating output video pictures/sequence with color depth different from color depth of encoded video bitstream
CN104956675A (zh) * 2014-01-08 2015-09-30 索尼公司 图像处理装置和图像处理方法
CN105900427A (zh) * 2014-01-08 2016-08-24 高通股份有限公司 Hevc多层扩展中的非hevc基础层的支持
CN105900427B (zh) * 2014-01-08 2019-07-19 高通股份有限公司 经由h.265/hevc解码器解码视频信息的方法、设备、解码装置及介质
CN104956675B (zh) * 2014-01-08 2019-11-08 索尼公司 图像处理装置和图像处理方法
CN105900431A (zh) * 2014-01-16 2016-08-24 高通股份有限公司 用于可缩放视频译码的参考层样本位置导出
CN105900431B (zh) * 2014-01-16 2019-03-12 高通股份有限公司 一种用于编解码可缩放高效视频信息的方法与设备
CN112862073A (zh) * 2021-02-03 2021-05-28 北京大学 一种压缩数据分析方法、装置、存储介质及终端

Also Published As

Publication number Publication date
TW200934252A (en) 2009-08-01
JP2011501571A (ja) 2011-01-06
CN101828399B (zh) 2013-06-26
JP5661465B2 (ja) 2015-01-28
JP2015039182A (ja) 2015-02-26
KR20120060921A (ko) 2012-06-12
KR20100074283A (ko) 2010-07-01
WO2009052205A1 (en) 2009-04-23
KR101354053B1 (ko) 2014-01-27
EP2213100A1 (en) 2010-08-04
US20090097558A1 (en) 2009-04-16
JP5795416B2 (ja) 2015-10-14
US8432968B2 (en) 2013-04-30

Similar Documents

Publication Publication Date Title
CN101828399B (zh) 用于可缩放位深度的可缩放视频译码方法和设备
CN101637024B (zh) 用于经译码块模式的可变长度译码技术
CN101627636B (zh) 可缩放视频译码增强层中的精细化和有效系数的组合式游程长度译码的方法和装置
CN101578870B (zh) 对可缩放视频译码(svc)方案的增强层进行译码的方法和装置
JP5307017B2 (ja) リファインメント係数符号化のためのビデオブロックに基づいた可変長符号化テーブル選択
CN101529911B (zh) 用于对多层比特流数据进行信号指示的方法和系统
CN101690227B (zh) 用于对子带进行熵译码的子带扫描技术
CN101622880B (zh) 一种视频译码方法及用于视频编码的装置
KR101083051B1 (ko) 비디오 부호화 및 복호화를 위한 시스템 및 방법
CN101578882B (zh) 用于可缩放视频译码的自适应上取样方法及设备
KR101068428B1 (ko) Svc cgs 향상 계층 코딩을 위한 cavlc 향상
CN104221374B (zh) 一种用于编码、解码视频数据的方法和设备
CN102187671B (zh) 基于向量化熵译码的加权预测
CN101822057A (zh) 视频块标头信息的自适应译码
CN101855908B (zh) 用于可缩放视频译码的改进的加强层译码
CN102204251A (zh) 使用大于4×4和8×8的变换的视频译码
CN102007769A (zh) 用于视频编码中的速率控制的死区参数选择
CN101356821A (zh) 用于对图像或图像序列进行编码和解码的方法、对应的设备、计算机程序和信号
CN101523919B (zh) 基于用于精细化系数译码的视频区块类型的可变长度译码表选择
RU2409003C1 (ru) Выбор таблицы кодирования с переменной длиной на основании типа видеоблока для совершенствования кодирования коэффициентов

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant