CN101601299A - 用位深度可分级性的增强层残差预测对视频数据进行编码和/或解码的方法和设备 - Google Patents

用位深度可分级性的增强层残差预测对视频数据进行编码和/或解码的方法和设备 Download PDF

Info

Publication number
CN101601299A
CN101601299A CNA2006800566323A CN200680056632A CN101601299A CN 101601299 A CN101601299 A CN 101601299A CN A2006800566323 A CNA2006800566323 A CN A2006800566323A CN 200680056632 A CN200680056632 A CN 200680056632A CN 101601299 A CN101601299 A CN 101601299A
Authority
CN
China
Prior art keywords
information
layer
rec
sampling
layer information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006800566323A
Other languages
English (en)
Inventor
武宇文
高永英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of CN101601299A publication Critical patent/CN101601299A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/34Scalability techniques involving progressive bit-plane based encoding of the enhancement layer, e.g. fine granular scalability [FGS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一种可分级视频比特流可具有H.264/AVC兼容的基本层(BL)和可分级增强层(EL),其中可分级性涉及色彩位深度。H.264/AVC可分级性扩展SVC也提供其他类型的可分级性,如在BL和EL中像素的数目是不同的空间可分级性。根据本发明,BL信息是在两个逻辑步骤(TUp,BDUp)中增采样的,一个是纹理增采样,另一个是位深度增采样。纹理增采样是增加像素数目的过程,而位深度增采样是增加每个像素可具有的值的数目的过程,每个像素可具有的值的数目对应于像素色彩强度数目。增采样的BL数据被用来预测配置的EL。BL信息是在编码器侧增采样的,并以相同的方式在解码器侧增采样,其中,所述增采样涉及空间和位深度特征。

Description

用位深度可分级性的增强层残差预测对视频数据进行编码和/或解码的方法和设备
技术领域
本发明涉及数字视频编码领域。其为新型可分级性(scalability):位深度可分级性提供编码(coding)解决方案。
背景技术
近年来,在诸如科学成像、数字影院、可放映高质量视频的计算机游戏以及专业工作室和家庭影院的相关应用的许多领域,越来越需要较高的位色彩深度,而非传统的8位色彩深度。因此,现有技术的视频编码标准——H.264/AVC——已经包括保真度范围扩展(Fidelity Range Extensions,FRExt),其支持可达14位的样本和可达4:4:4的色度采样(chroma sampling)。当前的SVC基准软件JSVM不支持高位深度。
然而,现有的高级编码解决方案均不支持色彩位深度可分级性。对于具有两个不同解码器的情景,或对位深度具有不同要求的客户,例如对同一原始视频(raw video)要求8位和12位位深度,现有的H.264/AVC解决方案将对12位的原始视频进行编码以产生第一比特流,然后将12位的原始视频转换为8位的原始视频并对8位的副本(counterpart)进行编码以产生第二比特流。如果我们想将视频传送到要求不同位深度的不同客户,我们必须将其传送两次,或者将2个比特流一起放入一张磁盘。压缩率和运算复杂度两者的效率都很低。
欧洲专利申请EP06291041公开了一种可分级解决方案,该方案一次对整个12位原始视频进行编码从而生成一个比特流,该比特流包含H.264/AVC兼容的基本层(BL)和可分级的增强层(EL)。与附加的第二比特流相比上述第一比特流上的全部可分级比特流的开销小。如果H.264/AVC解码器在接收端可用,则仅对BL子比特流(sub-bitstream)解码,且经解码的8位视频可在传统的8位显示装置上观看;如果位深度可分级解码器在接收端可用,则BL子比特流和EL子比特流都可以被解码,从而获得12位视频,且其可在支持8位以上的色彩深度的高质量显示装置上观看。
发明内容
H.264/AVC可分级性扩展SVC也提供其他类型的可分级性,如空间可分级性。在空间可分级性方面,BL和EL中像素的数目是不同的。因此,出现了如何将位深度可分级性与其他可分级性结合的问题,尤其是与空间可分级性结合。本发明提供了该问题的解决方案。
权利要求1公开了一种编码方法,该方法允许位深度可分级性和其他可分级性结合。权利要求5公开了相应的解码方法。
利用编码方法的设备在权利要求10中公开,利用解码方法的设备在权利要求11中公开。
根据本发明,BL信息在两个逻辑步骤中增采样,一个步骤是纹理增采样,另一个是位深度增采样。纹理增采样是增加像素数目的过程,而位深度增采样是增加每个像素可具有的值的数目的过程。该值对应于像素的色彩强度。增采样的BL单元被用来预测配置(collocated)的EL单元。编码器由EL视频数据生成残差,且该残差可进一步被编码(通常被熵编码)和传输。要被增采样的BL信息可具有任意粒度,如单像素单元、像素块、宏块(MB)或整个图像。进一步,可以在单个步骤中执行两个逻辑增采样步骤。基本层信息在编码器侧被增采样,在解码器侧也以同样方式被增采样,其中,增采样涉及空间和位深度特征。
而且,可以为帧内编码(intra coded)图像和帧间(inter coded)编码图像执行结合的空间和位深度增采样。
具体地,用于对具有基本层和增强层的视频数据进行编码的方法,其中,基本层像素具有比增强层像素低的位深度和空间分辨率,该方法包括以下步骤:
对基本层信息进行增采样,其中,获得增强层信息的预测形式,增强层信息的预测形式具有比基本层高的色彩分辨率和高的空间分辨率;生成增强层残差,改增强层残差为增强层信息和增强层信息的预测形式之间的差;以及对基本层信息和增强层残差进行编码。
根据本发明的一个方面,解码视频数据的方法包括以下步骤:接收经量化和(如DCT-)变换的增强层信息和基本层信息;
对接收的信息执行逆量化和逆变换;
对经逆量化和逆变换的基本层信息进行增采样,其中,像素的数目和每个像素的值深度增加,且其中,获得预测的增强层信息;以及
从预测的增强层信息和经逆量子和逆变换的增强层信息重构重构的增强层视频信息。
在本发明一个实施例中,编码方法包括以下步骤:对BL信息进行帧内编码;重构帧间编码的BL信息,对重构的BL信息执行空间增采样和色彩位深度增采样,以及生成EL残差,EL残差为当前EL信息(即,图像数据)和所述经空间及色彩位深度增采样的BL信息(即,图像数据)之间的差。
在本发明一个实施例中,编码方法包括以下步骤:生成BL残差,BL残差为当前BL图像数据和预测的BL图像数据之间的差(通常用于帧间编码的BL),其中,预测的BL图像数据可由当前或在前的BL图像预测,对所述BL残差进行编码(即变换和量化),对编码的BL残差进行重构(逆变换和逆量化),对重构的BL残差执行残差(空间)增采样和色彩位深度增采样,并生成EL层间残差,EL层间残差为当前EL残差数据和所述空间及色彩位深度增采样重构BL残差之间的差。
有利地,两种提及的编码器实施例可组合到一个组合编码器中,该组合编码器可以自适应地对帧内和帧间编码的视频数据进行编码。
在本发明一个实施例中,解码方法进一步包括以下步骤(隐含地):检测接收的BL信息是帧内编码的;由接收的经逆量化和逆变换的BL信息重构BL视频;对重构的BL视频进行增采样,其中,所述增采样包括纹理(空间)增采样和位深度增采样,且其中,获得预测的EL信息;以及由预测的EL信息和经逆量化和逆变换的接收的EL信息重构重构的EL视频信息。
在本发明一个实施例中,解码方法包括以下步骤(隐含地):检测接收的EL数据是帧间编码的;从接收的BL数据中提取BL残差;对提取的BL残差执行残差(空间)增采样和色彩位深度增采样,从逆量化和逆变换的EL信息中提取EL残差,由EL残差和增采样的BL残差重构重构的EL残差,并由重构的EL残差和在前重构的EL信息重构EL视频信息。
有利地,两个提及的解码器实施例可组合到一个组合解码器中,该组合解码器自适应地对帧内和帧间编码的视频数据进行解码。
根据本发明另一个方面,用于对具有基本层和增强层的视频数据进行编码的设备,其中,基本层具有比增强层低的色彩分辨率和空间分辨率,该设备包括:用于对基本层信息进行增采样的装置,其中,获得增强层信息的预测形式,增强层信息的预测形式具有比基本层高的色彩分辨率和空间分辨率;用于生成增强层残差的装置,该增强层残差为增强层信息和增强层信息的预测形式之间的差;以及用于对基本层信息和增强层残差进行编码的装置。
在本发明一个实施例中,用于对视频数据进行编码或解码的设备包括执行空间(残差或纹理)增采样的装置和执行色彩位深度增采样的装置,其中,用于空间增采样的装置增加BL信息内的值的数目,用于色彩位深度增采样的装置增加这些值的色彩范围,且其中,获得空间和色彩位深度增采样的BL数据。
根据本发明另一个方面,编码的可分级视频信号包括帧内编码的BL数据和帧内编码的EL数据,其中帧内编码的EL数据包括作为增采样BL图像和EL图像间差的残差,其中该残差包括差分纹理信息(differential texture information)和差分位深度信息(differential bit depth information)。
本发明提供的不同实施例的编码解决方案可与H.264/AVC和目前在H.264/AVC可分级扩展(SVC)中定义的所有类型的可分级性兼容。
本发明有利的实施例在所附的权利要求、以下的说明和附图中公开。
附图说明
参考附图说明本发明的示例性实施例,其示出:
图1是色彩位深度可分级编码的框图;
图2是用于空间可分级性到色彩位深度可分级性的帧内纹理层间预测(intra texture inter-layer predication)的扩展的编码器;
图3是用于空间可分级性到色彩位深度可分级性的残差层间预测(residual inter-layer prediction)的扩展的编码器;
图4是用于空间可分级性到色彩位深度可分级性的帧内纹理层间预测的扩展的解码器;
图5是用于空间可分级性到色彩位深度可分级性的残差层间预测的扩展的解码器;以及
图6是空间可分级性到色彩位深度可分级性的残差层间预测的扩展框架的逻辑等效图。
具体实施方式
如图1所示,两个视频用作视频编码器的输入:N位原始视频和M位(M<N,通常M=8)视频。M位视频可由N位原始视频分解获得或由其他方式提供。通过利用BL图像,可分级解决方案可减少两层之间的冗余。一个具有8位色彩,另一个具有N位色彩(N>8)的两个视频流输入到编码器,且输出是可分级的比特流。仅输入一个N位色彩数据流也是可能的,从该N位色彩数据流为BL内部生成M位(M<N)色彩数据流。用所包括的H.264/AVC编码器将M位视频编码为BL。BL的信息可用来改善EL的编码效率。这就是本文中所谓的层间预测。每个画面——一组MB——具有两个接入单元(access unit),一个用于BL,另一个用于EL。经编码的比特流是多路的,以形成可分级的比特流。BL编码器包括例如H.264/AVC编码器,重构用于预测N位色彩视频,该N位色彩视频将用于EL编码。
如图1所示,可分级比特流示例性包含AVC兼容的BL比特流,其可由BL解码器(传统AVC解码器)解码。然后将在解码器侧执行与在编码器中同样的预测(在评估各指令后),从而得到预测的N位视频。借助N位预测的视频,EL解码器将使用该N位预测为高质量显示HQ生成最终的N位视频。
下面,当使用术语色彩位深度时,其意味着位深度,即每个值的比特数。这通常相应于色彩强度(color intensity)。
在一个实施例中,本发明基于SVC空间、时间和质量可分级性的当前结构,并被用于增强的色彩位深度的位深度可分级性增强。因此,该实施例完全兼容当前的SVC标准。然而,本领域技术人员易于使其适应其他标准。位深度可分级性的关键是位深度层间预测。通过利用层间预测,N位视频和M位视频之间的差被作为EL编码。为了方便说明,下文中将使用如下符号:
BLorg:基本层原始MB
BLres:基本层残差MB
BLrec:基本层重构MB
ELorg:增强层原始MB
ELrec:增强层重构MB
EL’res:增强层残差MB
Prec{}:色彩位深度层间预测算符
Pret{}:纹理(空间)层间预测算符
Prer{}:残差(空间)层间预测算符
典型地,SVC兼容的MB级位深度可分级编码解决方案是基于当前的SVC空间可分级性的。下面提供帧内编码和帧间编码的空间可分级性到位深度可分级性的扩展的详细说明。SVC兼容的位深度可分级编码的第一步是如同H.264/AVC FRExt扩展(目前每样点10到14比特)在EL编码和解码中那样支持高比特编码。
帧内编码
图2示出用于从如当前SVC标准中使用的空间可分级性到位深度可分级性的帧内纹理层间预测(intra texture inter-layerprediction)扩展的编码器。位深度增采样块BDUp表示到位深度可分级性的扩展,而其他块表示当前的SVC标准中的空间可分级性。该块BDUp是传统SVC帧内编码器和根据本发明的帧内编码器之间的差别。在图2中,M位基本层MB被输入到BL编码器,而N位增强层MB被输入到EL编码器(N>M)。在当前的SVC标准中,纹理增采样是为空间帧内纹理层间预测设计的。在图2中,纹理增采样TUp的输入是重构的BL宏块BLrec,而输出是EL宏块的空间(纹理)预测形式(prediction version)Pret{BLrec}。位深度可分级性是通过紧随纹理增采样TUp之后的位深度增采样BDUp(在该实例中)的步骤实现的。在实践中,首先应用纹理增采样作为空间层间预测是有利的,然后位深度增采样BDUp作为位深度层间预测执行。通过纹理增采样TUp和位深度增采样BDUp,获取N位EL宏块的预测形式Prec{Pret{BLrec}}。类似的残差可通过预测的逆序步骤获得。
原始N位EL宏块ELorg与其预测形式Prec{Pret{BLrec}}之间的残差EL’res通过差值发生器DEL获得。在本发明一个实施例中,残差进一步被变换T、量化Q和熵编码ECEL从而形成EL子比特流,如在SVC中。在数学表达中,色彩位深度帧内增采样的残差为:
EL′res=ELorg-Prec{Pret{BLrec}}    (等式1)
其中Pret{}表示纹理增采样算符。
不同形式的编码过程都是可能的,并可通过控制参数控制。在图2中示出了示例性标记base_mode_flag,该标记判定EL残差是基于重构的EL信息还是基于增采样的BL信息预测的。
帧间编码
帧间编码的位深度可分级性的实现不同于帧内编码的位深度可分级性。在当前的SVC标准中,为空间帧间纹理层间预测设计有运动增采样(motion upsampling)和残差增采样。
图3示出用于帧间编码的(P和B)宏块的残差层间预测扩展的编码器。位深度可分级性是通过紧随(空间)残差增采样RUp之后的位深度增采样BDUp步骤实现的。残差增采样RUp的输入是重构的BL残差BLres,rec,k,该重构的残差BLres,rec,k是将被传输的BL残差BLres,k的重构形式(如在下面的等式3中所表示的)。在实践中,首先执行运动增采样MUp,然后作为一种空间层间预测执行残差增采样RUp。最终,作为位深度层间预测执行位深度增采样BDUp。通过运动增采样MUp、残差增采样RUp和色彩位深度增采样BDUp,获得N位EL宏块的预测形式Prec{Prer{BLres,rec,k}}。最后得到的增强层残差EL’res,k(如在下面(等式3中)定义的)被进一步变换T、量化Q和熵编码从而形成EL子比特流,如同在SVC中。
不同形式的编码过程都是可能的,并可通过控制参数控制。图3中示出了标记base_mode_flag和residual_pred_flag,标记base_mode_flag控制EL运动补偿是基于从EL获得的运动矢量还是基于从BL增采样的运动矢量,标记residual_pred_flag控制BL残差是否被用于预测EL残差。如图2所示,base_mode_flag也用于控制帧内纹理层间预测。
图4示出帧内编码的BL图像的示例性解码器,其利用层间预测。在接收经解码的BL和EL信息后,如在多路复用的包化比特流(packetized bitstream)中,分离BL信息和EL信息,BL信息和EL信息被熵解码。然后应用逆量化Q-1和逆变换T-1。对于BL,其处理与传统SVC的一样:使用空间帧内预测重构图像,即基于同一图像的先前的重构信息。在去块后,最后生成的BL信号BLrec可显示在如上所述的8位色彩深度的标准SVC显示器上。然而,可替换地,该信号也可用来生成配置的EL图像的预测形式Prec{Pret{BLrec}}:为了该目的,信号BLrec被纹理增采样TUp,其中获得EL图像的纹理预测形式Pret{BLrec},然后被位深度增采样BDUp。然后,纹理和位深度增采样重构的BL图像Prec{Pret{BLrec}}用于更新A2,EL,改善的经逆量化和逆变换的EL残差EL’res,从而获得在去块后可作为由HQ显示的EL视频ELrec输出的信号。
当然以EL模式操作的解码器也内部生成BL视频BLrec,因为EL预测需要BL视频BLrec,但BL视频不必在解码器输出端可用。在一个实施例中,解码器具有两个输出端,一个用于BL视频BLrec,一个用于EL视频ELrec,而在另一个实施例中,其仅具有用于EL视频的输出ELrec
如上对图2中帧内编码器的说明,解码器也可以相应于编码器以不同模式工作。因此,各标记被从比特流中提取并被评估,如决定是否使用层间预测的指示Base_mode_flag。如果不是,则使用去块化、空间预测和空间预测的图像更新A1,EL传统地重构EL图像。
图5示出了帧间编码单元如帧间编码的MB的示例性解码器。在一个实施例中,从可能已经被熵编码并相应解码的BL比特流中检测并提取运动数据,且如果需要可为EL增采样该运动数据。这可由包括在BL或EL比特流中的指示指明。进一步,BL比特流数据被逆量化Q-1和逆变换T-1,从而获得重构的BL残差BLres,k。如果需要BL视频信号BLdec,进一步的BL处理包括包含去块化的传统SVC解码、在帧存储器中存储,运动补偿和以残差BLres,k更新运动补偿的预测图像。如果仅需要EL视频信号,那么这些步骤可以省略。
残差BLres,k用于预测EL数据:残差BLres,k被残差增采样RUp和位深度增采样BDUp增采样以生成预测信号Prec{Prer{BLres,k}},其中,残差增采样RUp是一种空间增采样,即值的数目增加,位深度增采样即位深度及因此每个值的可能范围增加。如果配置的EL单元如由标记residual_pred_flag所指示的已经用残差层间预测进行了编码,则预测的残差Prec{Pret{BLrec}}被用来更新A’1,接收的经逆量化和逆变换的EL残差EL’res,k,从而获得实际EL残差ELres,k。所接收的经逆量化和逆变换的EL残差EL’res,k大体上等于传统空间EL残差Rorg和残差Rrec,k-1(αΔx,αΔy)之间的差,残差Rrec,k-1(αΔx,αΔy)是由前一单元k-1在编码器中重构然后被增采样的。
进一步的EL处理大体上与SVC中的相似(然而使用增强的位深度):重构的残差ELres,k被用来按照如下步骤更新预测的EL图像S_ELrec,k-1=ELrec,k-1(αΔx,αΔy):即去块化DeblkEL、在帧存储器FM中存储和重构图像ELrec,k-1的运动补偿MC。如果接收的增强层数据ELenc含运动信息ELMI,则运动信息被提取并且可被提供给运动补偿单元MC。可替换地,可使用BL的增采样的MUp运动信息。
显然根据本发明的改进的EL残差与SVC空间可分级性中定义的不同。然而,如图6所示,其编码大体上相当于原始EL宏块ELorg,k和纹理(空间地)和位深度增采样的BL宏块Prec{Prer{BLorg,k}}之间的差的帧间编码,下面进行证明。
假定残差增采样算符Prer{}和色彩位深度层间预测算符Prec{}两者都具有可加性(additivity)和稳定性的属性。在实践中,当前SVC空间可分级性采用的残差增采样运算具有添加性和稳定性1。下面证明重新定义的EL残差EL’res,k的编码相当于原始EL MB和重构的EL宏块(经运动增采样、残差增采样、和然后色彩位深度增采样形式的配置的BL宏块)之间的差的帧间编码。EL宏块和经残差增采样并随后位深度增采样形式的配置的BL宏块之间的差被称为层间残差并如下定义:
Rk=ELk-Prec{Prer{BLk}}    (等式2)
其中k表示当前帧的POC(图像序列号)。
                  
1在连续函数的情况下,“稳定性”相当于可导性;在离散函数的情况下,“稳定性”意味着在独立变量的任意可用值处,离散函数的改变的绝对值不大于乘以某个常数的独立变量的变化的绝对值。
不失一般性,我们假定满足下面两个条件:首先,当前MB仅具有一个基准MB,当前MB帧的POC等于k,且基准MB帧的POC等于(k-1);其次,仅有两个空间层。基于这两个假设,等式(2)的证明如下。
EL′res,k
=ELorg,k-ELrec,k-1(αΔx,αΔy)-Prec{Prer{BLres,k}}    (等式3)
=ELorg,k-ELrec,k-1(αΔx,αΔy)-Prec{Prer{BLorg,k-BLrec,k-1(Δx,Δy)}}
其中(Δx,Δy)表示当前第k个宏块的运动矢量,α表示EL的空间分辨率分级因子,BLrec,k-1(Δx,Δy)表示重构的第(k-1)个BL宏块的运动补偿形式,ELrec,k-1(αΔx,αΔy)表示重构的第(k-1)个EL宏块的运动(增采样运动)补偿形式。
根据Prer{}和Prec{}都具有可加性属性的假定,等式(3)等价于:
EL′res,k
=ELorg,k-ELrec,k-1(αΔx,αΔy)-Prec{Prer{BLorg,k}}+Prec{Prer{BLrec,k-1(Δx,Δy)}}
=(ELorg,k-Prec{Prer{BLorg,k}})-(ELrec,k-1(αΔx,αΔy)-Prec{Prer{BLrec,k-1(Δx,Δy)}})
(等式4)
根据Prer{}和Prec{}都具有稳定性属性的假定,将等式(2)替换到等式(4)中:
EL res , k ′ ≅ R org , k - R rec , k - 1 ( αΔx , αΔy ) (等式5)
等式(5)表明重新定义的EL残差EL’res,k等于原始BL宏块BLorg,k和原始EL宏块ELorg,k的层间残差Rorg,k和运动补偿重构基准BL宏块BLrec,k-1和运动(增采样运动)补偿重构基准EL宏块ELrec,k-1的层间残差Rrec,k-1之间的差。这在图6中示出。换句话说,层间残差是帧间编码的。然而,图5中示出的编码是有有利的,因为这样更简单。
本发明提出的空间可分级性到位深度可分级性的扩展的一个优点是实现对色彩位深度可分级性的扩展既不需要新语法元素也不需要新预测模式。另一个优点是,特别对于帧间编码,可获得高编码效率,因为最终编码的EL残差是“残差的残差”,因此相当于如(等式3)中定义的层间残差的帧间编码。在实践中,帧间编码中最终编码的EL残差等于原始EL宏块减去运动(增采样运动)补偿重构基准EL宏块,然后减去经运动补偿、残差增采样、随后经位深度增采样形式的配置的BL重构残差。
进一步的优点是对于帧间编码的情况,不需要重构BL宏块。因此,可省略BL重构从而使得解码器更简单。
有利地,色彩位深度可分级性的帧内编码是通过本发明提出的帧内色彩位深度层间预测实现的,在一个实施例中,帧内色彩位深度层间预测紧随帧内纹理层间预测之后。对于该实施例,在SVC情况下,帧内色彩位深度层间预测既不需要新语法元素也不需要新预测模式。
因此,本发明可用于可分级编码器、可分级解码器和可分级信号,特别可用于视频信号或具有不同质量层和高层间冗余的其他类型信号。
可以理解本发明仅是通过例子说明的,可以在不偏离本发明范围的情况下对细节进行修改。在说明书和(适当处)权利要求及附图中公开的每个特征可以独立地或以任何合适的组合方式提供。这些特征可(适当处)以硬件、软件或这两者的组合实现。权利要求中出现的标识号仅为了说明而不能对权利要求的范围有限制性效果。

Claims (12)

1.一种用于对具有基本层和增强层的视频数据进行编码的方法,其中,所述基本层具有比所述增强层低的色彩分辨率和空间分辨率,所述方法包括以下步骤:
对基本层信息(BLrec)进行增采样(TUp,BDUp),其中,获得增强层信息的预测形式(Prec{Pret{BLrec}}),所述增强层信息的预测形式具有比所述基本层高的位深度分辨率和空间分辨率;
生成增强层残差(EL’res),所述增强层残差为增强层信息(ELorg)和所述增强层信息的预测形式之间的差;以及
对所述基本层信息和增强层残差进行编码(T,Q,ECBL,ECEL)。
2.根据权利要求1所述的方法,其中,所述增采样的步骤包括:在帧内编码的基本层信息的情况下对重构的基本层图像数据(BLrec)进行纹理增采样(TUp)。
3.根据权利要求1或2所述的方法,其中,所述增采样的步骤包括:在帧间编码的基本层信息的情况下对重构的基本层残差数据(BLres,rec,k)进行增采样(RUp)。
4.根据权利要求1-3中任一项所述的方法,其中,所述增采样的步骤包括:在帧间编码的基本层信息的情况下对基本层运动信息数据进行增采样(MUp)。
5.一种用于对具有基本层和增强层的视频数据进行解码的方法,所述方法包括以下步骤:
接收增强层信息(ELenc)和基本层信息(BLenc);
对接收的信息执行逆量化(T-1)和逆变换(Q-1);
对经逆量化和逆变换的基本层信息进行增采样(BDUp,TUp),其中,像素数目和每个像素的值深度增加,其中,获得预测的增强层信息(Prec{Pret{BLrec}});以及
从所述预测的增强层信息(Prec{Pret{BLrec}})和所述经逆量化的和逆变换的增强层信息重构重构的增强层视频信息(ELrec)。
6.根据权利要求5所述的方法,其中,所述经逆量化的和逆变换的增强层信息包括残差信息(EL’res),进一步包括以下步骤:由所述经逆量化和逆变换的基本层信息重构基本层视频(BLrec),以及将所述残差信息(EL’res)加(A2,EL)到所述增强层信息的预测形式(Prec{Pret{BLrec}})。
7.根据权利要求5所述的方法,其中,所述经逆量化和逆变换的增强层信息包括增强层残差信息(EL’res,k),所述经逆量化和逆变换的基本层信息包括基本层残差信息(BLres,k),其中,所述对经逆量化和逆变换的基本层信息进行增采样的步骤包括对所述基本层残差信息(BLres,k)进行增采样(RUp,BDUp),进一步包括对所述增强层残差信息(EL’res,k)和所述增采样的基本层残差信息(Prec{Pret{BLres,k}})相加(A’1,EL)的步骤,其中,获得重构的增强层残差(ELres,k)。
8.根据权利要求5或7所述的方法,其中,获得重构的增强层残差(ELres,k),进一步包括将所述重构的增强层残差加(A’2,EL)到所述重构的运动补偿增强层信息(S_ELrec,k-1)。
9.根据权利要求5、7或8所述的方法,进一步包括以下步骤:从所接收的增强层信息中提取运动信息(ELMI)和重构(DeblkEL,FM,MC,A’2,EL)增强层视频(ELrec)的步骤,其中,使用增强层运动信息。
10.用于对具有基本层和增强层的视频数据进行编码的设备,其中,所述基本层具有比所述增强层低的色彩分辨率和空间分辨率,所述设备包括:
用于对基本层信息(BLrec)进行增采样(TUp,BDup)的装置,其中,生成增强层信息的预测形式(Prec{Pret{BLrec}}),所述增强层信息的预测形式具有比所述基本层信息高的色彩位深度和空间分辨率;
用于生成增强层残差(EL’res)的装置(DEL),所述增强层残差为所述增强层信息(ELorg)和所述增强层信息的预测形式之间的差;以及
用于对所述基本层信息进行编码的装置(T,Q,ECBL)和用于对所述增强层残差进行编码的装置(T,Q,ELEL)。
11.用于对具有基本层和增强层的视频数据进行解码的设备,所述设备包括:
用于接收增强层信息(ELenc)的装置和用于接收基本层信息(BLenc)的装置;
用于对所接收的信息执行逆量化(T-1)和逆变换(Q-1)的装置;
用于对经逆量化和逆变换的基本层信息进行增采样(BDUp,TUp)的装置,其中,所述像素数目和每个像素的值深度增加,且其中,生成预测的增强层信息(Prec{Pret{BLrec}});以及
用于由所述预测的增强层信息(Prec{Pret{BLrec}})和所述经逆量化和逆变换的增强层信息重构重构的增强层视频信息(ELrec)的装置(A2EL,Deblk2)。
12.根据权利要求10或11所述的设备,其中,所述用于增采样的装置包括用于增加像素数目的装置(TUp,RUp)和用于增加每个像素可具有的值的数目的装置(BDUp)。
CNA2006800566323A 2006-12-14 2006-12-14 用位深度可分级性的增强层残差预测对视频数据进行编码和/或解码的方法和设备 Pending CN101601299A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2006/003415 WO2008071037A1 (en) 2006-12-14 2006-12-14 Method and apparatus for encoding and/or decoding video data using enhancement layer residual prediction for bit depth scalability

Publications (1)

Publication Number Publication Date
CN101601299A true CN101601299A (zh) 2009-12-09

Family

ID=39511234

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006800566323A Pending CN101601299A (zh) 2006-12-14 2006-12-14 用位深度可分级性的增强层残差预测对视频数据进行编码和/或解码的方法和设备

Country Status (6)

Country Link
US (1) US8428129B2 (zh)
EP (1) EP2092748A4 (zh)
JP (1) JP5036826B2 (zh)
KR (1) KR101307050B1 (zh)
CN (1) CN101601299A (zh)
WO (1) WO2008071037A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101895748A (zh) * 2010-06-21 2010-11-24 华为终端有限公司 一种编解码方法以及编解码装置
WO2013174254A1 (en) * 2012-05-21 2013-11-28 Mediatek Singapore Pte. Ltd. Method and apparatus of inter-layer filtering for scalable video coding
CN105025997A (zh) * 2012-12-28 2015-11-04 高通股份有限公司 针对位深度可缩放视频译码使用样本自适应调整的层间预测
CN107071469A (zh) * 2010-12-13 2017-08-18 韩国电子通信研究院 基于帧间预测对视频信号进行解码的方法
CN108718411A (zh) * 2012-09-09 2018-10-30 Lg 电子株式会社 图像解码方法和使用其的装置

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8411734B2 (en) 2007-02-06 2013-04-02 Microsoft Corporation Scalable multi-thread video decoding
JP5295233B2 (ja) * 2007-06-29 2013-09-18 フラウンホファー・ゲゼルシャフト・ツール・フォルデルング・デル・アンゲバンテン・フォルシュング・アインゲトラーゲネル・フェライン ビデオエンコーダ、ビデオデコーダ、エンコードするための方法、デコードするための方法、コンピュータプログラム、およびスケーラブルなビットストリーム
US9648325B2 (en) 2007-06-30 2017-05-09 Microsoft Technology Licensing, Llc Video decoding implementations for a graphics processing unit
US8204333B2 (en) 2007-10-15 2012-06-19 Intel Corporation Converting video and image signal bit depths
US8208560B2 (en) * 2007-10-15 2012-06-26 Intel Corporation Bit depth enhancement for scalable video coding
EP2204046B1 (en) * 2007-10-16 2019-12-04 InterDigital Madison Patent Holdings Methods and apparatus for artifact removal for bit depth scalability
WO2010093350A1 (en) * 2009-02-13 2010-08-19 Thomson Licensing Depth map coding using video information
US9148673B2 (en) 2009-06-25 2015-09-29 Thomson Licensing Depth map coding
KR101066117B1 (ko) * 2009-11-12 2011-09-20 전자부품연구원 스케일러블 영상 코딩 방법 및 장치
KR101484280B1 (ko) 2009-12-08 2015-01-20 삼성전자주식회사 임의적인 파티션을 이용한 움직임 예측에 따른 비디오 부호화 방법 및 장치, 임의적인 파티션을 이용한 움직임 보상에 따른 비디오 복호화 방법 및 장치
US8885729B2 (en) 2010-12-13 2014-11-11 Microsoft Corporation Low-latency video decoding
US9706214B2 (en) 2010-12-24 2017-07-11 Microsoft Technology Licensing, Llc Image and video decoding implementations
US8891863B2 (en) * 2011-06-13 2014-11-18 Dolby Laboratories Licensing Corporation High dynamic range, backwards-compatible, digital cinema
MY189650A (en) 2011-06-30 2022-02-23 Microsoft Technology Licensing Llc Reducing latency in video encoding and decoding
US8731067B2 (en) 2011-08-31 2014-05-20 Microsoft Corporation Memory management for video decoding
US9819949B2 (en) 2011-12-16 2017-11-14 Microsoft Technology Licensing, Llc Hardware-accelerated decoding of scalable video bitstreams
EP2859724B1 (en) * 2012-06-22 2019-09-04 MediaTek Inc. Method and apparatus of adaptive intra prediction for inter-layer coding
US9124899B2 (en) * 2012-09-28 2015-09-01 Sharp Laboratories Of America, Inc. Motion derivation and coding for scaling video
US10375405B2 (en) 2012-10-05 2019-08-06 Qualcomm Incorporated Motion field upsampling for scalable coding based on high efficiency video coding
US20140098880A1 (en) 2012-10-05 2014-04-10 Qualcomm Incorporated Prediction mode information upsampling for scalable video coding
US20150326880A1 (en) * 2012-12-14 2015-11-12 Liu He Inside view motion prediction among texture and depth view components with asymmetric spatial resolution
US20140254681A1 (en) * 2013-03-08 2014-09-11 Nokia Corporation Apparatus, a method and a computer program for video coding and decoding
US10194146B2 (en) 2013-03-26 2019-01-29 Qualcomm Incorporated Device and method for scalable coding of video information
KR102301083B1 (ko) * 2013-04-15 2021-09-10 루카 로사토 하이브리드 백워드-호환가능 신호 인코딩 및 디코딩
US9036908B2 (en) * 2013-09-30 2015-05-19 Apple Inc. Backwards compatible extended image format
US10410398B2 (en) * 2015-02-20 2019-09-10 Qualcomm Incorporated Systems and methods for reducing memory bandwidth using low quality tiles
JP2015146599A (ja) * 2015-03-11 2015-08-13 インテル コーポレイション レイヤ間画素サンプル予測
JP6769231B2 (ja) * 2016-10-17 2020-10-14 富士通株式会社 動画像符号化装置、動画像符号化方法、動画像復号装置、動画像復号方法、及び動画像符号化用コンピュータプログラムならびに動画像復号用コンピュータプログラム
CN111491168A (zh) * 2019-01-29 2020-08-04 华为软件技术有限公司 视频编解码方法、解码器、编码器和相关设备

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9206860D0 (en) * 1992-03-27 1992-05-13 British Telecomm Two-layer video coder
JPH07212761A (ja) * 1994-01-17 1995-08-11 Toshiba Corp 階層符号化装置及び階層復号化装置
KR20020064932A (ko) * 2000-10-11 2002-08-10 코닌클리케 필립스 일렉트로닉스 엔.브이. 미세 입상 비디오 인코딩을 위한 공간적 스케일러빌리티
US20020118742A1 (en) * 2001-02-26 2002-08-29 Philips Electronics North America Corporation. Prediction structures for enhancement layer in fine granular scalability video coding
KR20040054746A (ko) * 2001-10-26 2004-06-25 코닌클리케 필립스 일렉트로닉스 엔.브이. 공간 스케일가능 압축 방법 및 장치
US7062096B2 (en) * 2002-07-29 2006-06-13 Matsushita Electric Industrial Co., Ltd. Apparatus and method for performing bitplane coding with reordering in a fine granularity scalability coding system
BRPI0411655A (pt) 2003-06-19 2006-08-08 Thomson Licensing método e aparelho para codificação redimensionável espacial de baixa complexidade
US20060193384A1 (en) * 2003-06-19 2006-08-31 Boyce Jill M Method and apparatus for low-complexity spatial scalable decoding
KR100754388B1 (ko) * 2003-12-27 2007-08-31 삼성전자주식회사 레지듀 영상 다운/업 샘플링 방법 및 장치와 그를 이용한영상 부호화/복호화 방법 및 장치
US8045614B2 (en) * 2005-05-11 2011-10-25 Dolby Laboratories Licensing Corporation Quantization control for variable bit depth
US20050259729A1 (en) * 2004-05-21 2005-11-24 Shijun Sun Video coding with quality scalability
KR101014667B1 (ko) * 2004-05-27 2011-02-16 삼성전자주식회사 스케일러블 동영상 인코딩, 디코딩 장치 및 그 방법
EP1800494A1 (en) * 2004-10-13 2007-06-27 Thomson Licensing Method and apparatus for complexity scalable video encoding and decoding
KR100888963B1 (ko) * 2004-12-06 2009-03-17 엘지전자 주식회사 영상 신호의 스케일러블 인코딩 및 디코딩 방법
US20060153295A1 (en) * 2005-01-12 2006-07-13 Nokia Corporation Method and system for inter-layer prediction mode coding in scalable video coding
KR100732961B1 (ko) * 2005-04-01 2007-06-27 경희대학교 산학협력단 다시점 영상의 스케일러블 부호화, 복호화 방법 및 장치
KR100703774B1 (ko) * 2005-04-13 2007-04-06 삼성전자주식회사 인트라 코딩을 선택적으로 적용하여 인트라 bl 예측모드의 비디오 신호를 인코딩 및 디코딩하는 방법 및 장치
KR100678907B1 (ko) * 2005-07-12 2007-02-06 삼성전자주식회사 하위 계층의 복원 데이터를 사용하여 fgs 계층을 인코딩및 디코딩하는 방법 및 장치

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101895748B (zh) * 2010-06-21 2014-03-26 华为终端有限公司 一种编解码方法以及编解码装置
CN101895748A (zh) * 2010-06-21 2010-11-24 华为终端有限公司 一种编解码方法以及编解码装置
CN107105291B (zh) * 2010-12-13 2020-04-07 韩国电子通信研究院 基于帧间预测对视频信号进行解码的方法
US10425653B2 (en) 2010-12-13 2019-09-24 Electronics And Telecommunications Research Institute Method and device for determining reference unit
CN107071469A (zh) * 2010-12-13 2017-08-18 韩国电子通信研究院 基于帧间预测对视频信号进行解码的方法
CN107105290A (zh) * 2010-12-13 2017-08-29 韩国电子通信研究院 基于帧间预测对视频信号进行解码的方法
CN107105291A (zh) * 2010-12-13 2017-08-29 韩国电子通信研究院 基于帧间预测对视频信号进行解码的方法
CN107105293A (zh) * 2010-12-13 2017-08-29 韩国电子通信研究院 基于帧间预测对视频信号进行解码的方法
CN107105292A (zh) * 2010-12-13 2017-08-29 韩国电子通信研究院 基于帧间预测对视频信号进行解码的方法
CN107454420A (zh) * 2010-12-13 2017-12-08 韩国电子通信研究院 基于帧间预测对视频信号进行解码的方法
US11843795B2 (en) 2010-12-13 2023-12-12 Electronics And Telecommunications Research Institute Method and device for determining reference unit
US11252424B2 (en) 2010-12-13 2022-02-15 Electronics And Telecommunications Research Institute Method and device for determining reference unit
CN107105292B (zh) * 2010-12-13 2020-09-08 韩国电子通信研究院 基于帧间预测对视频信号进行解码的方法
CN107454420B (zh) * 2010-12-13 2020-08-07 韩国电子通信研究院 基于帧间预测对视频信号进行解码的方法
CN107071469B (zh) * 2010-12-13 2020-03-03 韩国电子通信研究院 基于帧间预测对视频信号进行解码的方法
CN107105290B (zh) * 2010-12-13 2020-05-12 韩国电子通信研究院 基于帧间预测对视频信号进行解码的方法
CN107105293B (zh) * 2010-12-13 2020-05-12 韩国电子通信研究院 基于帧间预测对视频信号进行解码的方法
WO2013174254A1 (en) * 2012-05-21 2013-11-28 Mediatek Singapore Pte. Ltd. Method and apparatus of inter-layer filtering for scalable video coding
US10136144B2 (en) 2012-05-21 2018-11-20 Mediatek Singapore Pte. Ltd. Method and apparatus of inter-layer filtering for scalable video coding
CN108718411B (zh) * 2012-09-09 2022-07-15 Lg 电子株式会社 图像解码方法和使用其的装置
CN108718411A (zh) * 2012-09-09 2018-10-30 Lg 电子株式会社 图像解码方法和使用其的装置
CN105025997A (zh) * 2012-12-28 2015-11-04 高通股份有限公司 针对位深度可缩放视频译码使用样本自适应调整的层间预测
CN105025997B (zh) * 2012-12-28 2019-06-21 高通股份有限公司 针对位深度可缩放视频译码使用样本自适应调整的层间预测

Also Published As

Publication number Publication date
KR101307050B1 (ko) 2013-09-11
JP2010512699A (ja) 2010-04-22
KR20090098823A (ko) 2009-09-17
US8428129B2 (en) 2013-04-23
JP5036826B2 (ja) 2012-09-26
US20100008418A1 (en) 2010-01-14
WO2008071037A1 (en) 2008-06-19
EP2092748A4 (en) 2011-01-05
EP2092748A1 (en) 2009-08-26

Similar Documents

Publication Publication Date Title
CN101601299A (zh) 用位深度可分级性的增强层残差预测对视频数据进行编码和/或解码的方法和设备
CN101796841B (zh) 用增强层残差预测对视频数据编码/解码的方法和设备
CN101601300B (zh) 用自适应增强层预测对位深度可分级视频数据进行编码和/或解码的方法和设备
CN101558650B (zh) 编码和/或解码视频数据的方法及设备
CN102144391B (zh) 用于层间残余视频编码和解码的跳过模式
CN101589625B (zh) 质量可缩放编码
EP1933563A1 (en) Method and apparatus for encoding and/or decoding bit depth scalable video data using adaptive enhancement layer residual prediction
KR20090041763A (ko) 영상 부호화장치 및 방법과 그 영상 복호화장치 및 방법
KR20130107861A (ko) 인터 레이어 인트라 예측 방법 및 장치
JP5873395B2 (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム
KR20080002936A (ko) 하나 이상의 디지털 영상을 인코딩하는 방법, 인코더 및컴퓨터 프로그램 생성물
EP1933565A1 (en) Method and apparatus for encoding and/or decoding bit depth scalable video data using adaptive enhancement layer prediction
US20150010083A1 (en) Video decoding method and apparatus using the same
KR102271878B1 (ko) 영상의 부호화/복호화 방법 및 이를 이용하는 장치
McNeely et al. “Voodoo” error prediction for bit-depth scalable video coding
De Wolf et al. Adaptive Residual Interpolation: a Tool for Efficient Spatial Scalability in Digital Video Coding.
JP4403565B2 (ja) 動画像復号装置および動画像復号方法
JP2009065715A (ja) 動画像符号化装置、動画像符号化方法、動画像復号装置、動画像復号方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20091209