CN1457605A - 精细颗粒可伸缩性视频编码技术中增强层的改进预测结构 - Google Patents

精细颗粒可伸缩性视频编码技术中增强层的改进预测结构 Download PDF

Info

Publication number
CN1457605A
CN1457605A CN02800425A CN02800425A CN1457605A CN 1457605 A CN1457605 A CN 1457605A CN 02800425 A CN02800425 A CN 02800425A CN 02800425 A CN02800425 A CN 02800425A CN 1457605 A CN1457605 A CN 1457605A
Authority
CN
China
Prior art keywords
frame
enhancement layer
basic
base layer
frames
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN02800425A
Other languages
English (en)
Other versions
CN1254975C (zh
Inventor
A·普里
Y·陈
H·拉哈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1457605A publication Critical patent/CN1457605A/zh
Application granted granted Critical
Publication of CN1254975C publication Critical patent/CN1254975C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/34Scalability techniques involving progressive bit-plane based encoding of the enhancement layer, e.g. fine granular scalability [FGS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明的目的是提供一种技术,用来灵活、有效地对视频数据进行编码。这种技术要对叫做基层帧的一部分视频数据进行编码,以及对视频数据和预测信号产生的剩余图像进行编码。每个视频帧的预测是利用多个译码后的基层帧产生的,可以利用运动补偿。这些剩余图像叫做增强层帧,随后被编码。在这一技术的基础之上,由于采用了周围的一些基层帧,因此能够获得更好的预测。由于增强层帧中得到的剩余数据很少,因此能够对它们进行有效的编码。对于增强层帧的编码,可以采用精细颗粒可伸缩性技术(比如离散余弦变换编码或者小波编码)。译码过程是编码过程的相反过程。因此,能够灵活同时有效地对视频数据进行编码和译码。

Description

精细颗粒可伸缩性视频编码技术中增强层的改进预测结构
发明背景
总的来说,本发明涉及视频压缩技术,具体而言,本发明涉及采用多个基层帧(base layer frames)来产生每一个增强层帧的一种伸缩结构。
可伸缩视频编码技术是许多多媒体应用和业务所需要的一种功能。例如,视频伸缩性被用于采用具有大范围处理能力的译码器的系统中。在这种情况下,计算能力低的处理器只对可伸缩视频流的一个子集进行译码。
可伸缩视频技术的另一种应用是可变传输带宽环境。在这种情况下,带宽较窄的接收机只对可伸缩视频流的一个子集进行接收和译码,其中这个可伸缩视频流的这个子集的大小正比于可以获得的带宽。
MPEG-2和MPEG-4这样的主流视频压缩标准采用了几种视频可伸缩性方法。在这些标准中规定了时间、空间和质量(SNR)可伸缩性类型。所有这些方法都包括一个基层(BL)和一个增强层(EL)。总的来说,可伸缩视频流的基层部分代表对视频类进行译码所需要的最少的数据。视频流的增强层部分是接收器译码的时候用来增强视频信号的额外信息。
用于对静止图像进行编码的另外一类可伸缩性是精细颗粒可伸缩性(FGS)。用这种可伸缩性技术编码的图像被逐步译码。换句话说,译码器在接收完对这一图像进行编码的所有数据之前就开始对这个图像进行译码和显示。随着收到的数据越来越多,译码后图像的质量逐渐提高,直到用于对这个图像进行编码的所有数据被收到、译码和显示。
在MPEG-4中正在对视频信号精细颗粒可伸缩性进行标准化,MPEG-4就是下一代多媒体国际标准。在这种可伸缩性结构里,在基层中象其它普通视频可伸缩性方法中一样使用运动预测编码技术。对于每一编码基层帧,随后利用精细颗粒可伸缩性方法对一个剩余图像进行计算和编码,产生一个增强层帧。这种结构消除了增强层帧之间的依赖性,因而具有精细颗粒可伸缩性,同时充分利用了基层中进行预测的优点,因而能够提高编码效率。
图1画出了FGS结构的一个实例。如图所示,这个结构还包括一个基层和一个增强层。此外,每一个增强帧都是从同一时刻的原始基层帧产生的。这一点由从每个基层帧向上指向对应的增强层帧的箭头反映出来。
图2画出了FGS编码系统的一个实例。这个系统包括一个网络6,它的带宽在(Bmin=Rmin,Bmax=Rmax)这个范围内可变。还画出了一个计算功能框4,这个功能框用于估计或者测量当前可用带宽(R)。
此外,基层(BL)视频编码器8利用(Rmin,R)范围内的比特率(RBL)对视频源2出来的信号进行压缩。在典型情况下,基层编码器8利用最小比特率(Rmin)对信号进行压缩。当基层在发送视频信号之前就以离线形式进行基层编码的情况下尤其如此。可以看出,图中的单元10用于计算剩余图像12。
增强层(EL)编码器14以比特率RBL对剩余信号12进行压缩,这个比特率可以在RBL到Rmax-RBL的范围之内。注意到视频信号(增强层和基层)的编码既可以实时进行(如同图中所暗示的一样),又可以在传送图像之前以离线方式进行,这一点是非常重要的。在后一种情形中,如图所示,视频信号可以储存起来,然后晚些时候在一个实时速率控制器16的控制下发送(或者传送)。实施控制器16将当前(实时)可用带宽R考虑在内,选择最佳的质量增强层信号。因此,速率控制器16输出的增强层信号的比特率等于R-RBL
发明简述
本发明的目的是对输入的视频数据进行灵活同时高效编码的一种技术。该方法要对叫做基层帧和增强层帧的一部分视频数据进行编码。用MPEG-4或者MPEG-2这种运动补偿DCT编码技术中的任意一种对基层帧进行编码。
剩余图像是通过从输入的视频数据中减去预测信号产生的。根据本发明,预测是从有或者没有运动补偿的多个译码基层帧形成的,在这里的编码流中包括了模式选择判决。由于这种预测非常有效,剩余图像数据相对较少。然后用精细颗粒可伸缩性(比如DCT变换编码或者小波编码)对叫做增强层帧的剩余图像进行编码。这样就能够实现对视频数据的灵活而且高效的编码。
本发明还提供一种方法,它翻转前面对视频数据的编码过程,产生译码后的帧。编码后的数据包括两部分,基层和增强层。该方法包括基层,它的译码方法取决于编码方法(编码器那里选择的MPEG-2或者MPEG-4),从而产生译码后的基层视频帧。还有,要译码的增强层取决于精细颗粒可伸缩性(比如编码器那里选择的离散余弦变换编码或者小波编码),以此来产生增强层帧。对于编码流中的模式判决信息,从多个译码后基层视频帧中选择出来的帧被用来产生预测信号,而不管有还是没有运动补偿。然后在译码基层视频帧中增加预测来产生译码输出视频数据。
附图简述
现在参考附图,其中相似的引用数字表示对应的部件:
图1是一种伸缩性结构的一个示意图;
图2是一个编码系统的一个框图;
图3是本发明中可伸缩性结构一个实例的一个示意图;
图4是本发明中可伸缩性结构另一个实例的一个示意图;
图5是本发明中可伸缩性结构另一个实例的一个示意图;
图6是本发明一个编码器实例的一个框图;
图7是本发明一个译码器实例的一个框图;
图8是本发明一个系统实例的一个框图。
实施例描述
为了产生很容易压缩的增强层帧,需要减少要编码和发送的信息的量。在这个FGS增强方案中,这一点是通过在基层中包括预测信号来实现的。这些预测信号取决于基层压缩量,它包括来自原始图像的变化的信息量。基层信号没有包含的剩余信息随后用增强层编码器进行编码。
由于相邻图片具有很强的时间相关性,除了对应的基层编码帧以外,与某个原始图像有关的信息还驻留在其它帧内,注意到这一点是非常重要的。例如,前面的基层帧的压缩质量可能比当前帧高,并且这两个原始图片之间的时间相关性非常强。在这种情况下,有可能是前面的基层帧比当前基层帧携带了更多的当前原始图片信息。因此,最好是利用前面一个基层帧来计算这个图片的增强层信号。
如同前面参考图1所作的讨论一样,当前FGS结构从对应的当前基层帧产生每一个增强层帧。虽然不是那么复杂,这种结构无法充分利用基层帧附近更大范围内能够获得的信息,而它能够产生更好的增强信号。因此,根据本发明,与当前基层帧相比,利用基层图片周围的信息可以为任意图片产生增强层帧。
通过下面的数学公式来说明当前可伸缩结构和新的可伸缩结构之间的差别。当前的增强结构用以下公式表示:
             E(t)=O(t)-B(t),                     (1)其中E(t)是增强层信号,O(t)是原始图片,B(t)是时刻“t”的基层编码图片。本发明的新的增强结构用以下表达式说明:
             E(t)=O(t)-sum{a(t-i)*M(B(t-i))}      (2)
    i=L1,-L1+1,...,0,1,...,L2-1,L2其中L1和L2是“局部性,”参数,而a(t-i)则是给每个基层图片的加权参数。权值a(t-i)受到如下约束:
         0<=a(t-i)<+1                           (3)
         Sum{a(t-i)}=1
         i=-L1,-L1+1,...,0,1,...,L2-1,L2
此外,选择等式(2)的加权参数a(t-i)的时候最好是使得增强层信号E(t)的尺寸最小。这一计算是在增强层剩余计算单元中进行的。但是,如果无法获得进行这一计算所需要的计算能力,那么这个权参数a(t-i)就可以在0和1之间切换,或者平均成a(t+1)=0.5或者a(t-1)=0.5。
公式(2)中的M运算符表示运动估计运算,因为相邻图片或者帧内的对应部分通常都因为视频图像的运动而不在同一个位置。这样,在相邻基层图片或者帧上进行运动估计运算,为等式2中定义的增强层信号产生运动补偿(MC)信息。一般情况下,MC信息包括运动矢量和相邻图片之间的所有差别信息。
根据本发明,计算方法有几种,为按照公式(2)产生的增强层信号使用,和发送运动补偿(MC)信息。例如,用于M运算符的运动补偿信息可以与基层计算出来的运动补偿信息(例如运动矢量)相同。但是,会出现基层没有所需运动补偿信息的情况。
例如,采用后向预测的时候,如果没有作为基层的一部分计算并且发送出去(例如如果基层只包括I和P图片而不包括B图片),就必须计算并且发送后向运动补偿信息。在基层需要的以外需要计算和发送的运动信息的信息量的基础之上,有三种可能。
在一种可能中,只是为增强层预测计算另外一组运动矢量所增加的复杂性无关紧要。从理论上讲,这一选择应该给随后的压缩提供最好的增强层信号。
在第二种可能中,增强层预测只利用基层中已经计算出来的运动矢量。某个图片的增强层预测的源图片(预测是从这些图片进行的)必定是同一图片基层中使用的那些的一个子集。例如,如果基层是一幅内图片,那么它的增强层只能从同一个内基图片预测。如果这个基层是一个P图片,那么它的增强图片必须从用作基层运动预测的同样的参考图片预测,B图片也是这样。
上面描述的第二种情况可能限制增强层能够使用的预测的类型。但是,它不要求传送额外的运动矢量,也不需要计算任何额外的运动矢量。因此,这样就能够降低编码器的复杂性,而只略微牺牲质量。
第三种可能介于前两种可能之间。在这种可能中,对增强层可以使用的预测的类型没有多少或者根本没有限制。对于刚好拥有所需增强预测类型所需要的基层运动矢量的图片,重复使用基运动矢量。对于其它图片,单独为增强预测计算运动矢量。
上述公式为增强层信号的计算提供了通用框架。但是,在这里值得注意通用框架中的几个特别之处。例如,如果在公式(2)中L1=L2=O,新的FGS增强预测结构就缩减为图1所示的当前FGS增强预测结构。应该指出,这种新结构提供的功能一点也不会被这里建议的改进所削弱,因为增强层图片之间的关系没有改变,因为增强层图片不是互相导出的。
除此以外,如果在公式(2)中L1=0并且L2=1,那么这个通用框架缩减为图3所示的可收缩性结构。在本发明可收缩性结构的这个实例里,当前基层帧和后一个基层帧被用来产生每一个增强层帧。因此,公式(2)中的M运算符将进行前向预测。
类似地,如果公式(2)中L1=1并且L2=0,那么这个通用框架缩减为图4所示的可伸缩结构。在本发明可伸缩结构的这个实例中,当前的基层帧和前一个基层帧被用于产生每一个增强层帧。因此,公式(2)中的M运算符将进行后向预测。
除此以外,如果公式(2)中L1=L2=1,那么这个通用框架就缩减为图5所示的可伸缩结构。在本发明可伸缩结构的这个实例中,当前的、后面的和前面的基层帧被用于产生每一个增强层帧。因此,公式(2)中的M运算符将进行双向预测。
在图6中说明本发明的一个编码器实例。可以看出,这个编码器包括一个基层编码器18和一个增强层译码器36。这个基层编码器18对输入视频O(t)的一部分进行编码,以便产生基层信号。此外,增强层编码器36对输入视频O(t)的其余部分进行编码,产生增强层信号。
可以看出,基层编码器18包括一个运动估计/补偿预测功能块20,一个离散余弦变换(DCT)功能块22,一个量化功能块24,一个可变长度编码(VLC)功能块26和一个基层缓冲器28。在工作的过程中,这个运动估计/补偿预测功能块20对输入的视频信号O(t)进行运动估计,产生运动矢量,以及关于如何对数据进行编码产生模式判决,传递给VLC功能块26。此外,运动估计/补偿预测功能块20还将输入视频信号O(t)的另一部分不加改变地传送给DCT功能块22。这一部分对应于输入的视频信号O(t),它们将被编码成I帧和没有编码进运动矢量的部分B和P帧。
离散余弦变换功能块22对从运动估计/补偿预测功能块20收到的输入视频信号进行离散余弦变换。此外,量化功能块24对离散余弦变换功能块22的输出进行量化。可变长度编码功能块26对运动估计/补偿预测功能块20和量化功能块24的输出进行可变长度编码,产生基层帧。输出进行实时传送或者长时间储存之前,这些基层帧暂时储存在基层比特缓冲器28中。
还可以看到,一个逆量化功能块34和一个逆离散余弦变换功能块32串联在量化功能块24的输出端。在工作的时候,这些功能块32和34提供前面的编码帧的译码后版本,储存在一个帧存储器30中。译码后的这一帧被运动估计/补偿预测功能块20用来为当前帧产生运动矢量。利用前一帧的译码后版本就能够使译码器一侧的运动补偿更加精确,因为在译码器一侧它与收到的相同。
从图6还可以看出,增强层编码器36包括一个增强预测和剩余计算功能块38,一个增强层FGS编码功能块40和一个增强层缓冲器42。在工作的时候,增强预测和剩余计算功能块38通过从输入视频信号O(t)中减去预测信号来产生剩余图像信号。
根据本发明,按照公式(2)从多个基层帧B(t),B(t-1)形成预测信号。如前所述,B(t)代表当前基层帧,B(t-i)代表一个或者多个相邻基层帧,比如前一帧,后一帧或者这两者。因此,利用多个基层帧形成每一个剩余图像。
此外,增强层FGS编码功能块40被用于对增强预测和剩余计算功能块38产生的剩余图像进行编码,产生增强层帧。增强层编码功能块40使用的编码技术可以是任意精细颗粒可伸缩编码技术,比如离散余弦变换或者小波图像编码。输出进行实时传输或者长时间储存之前,增强层帧暂时储存在增强层比特缓冲器42中。
图7说明本发明一个译码器实例。可以看出,译码器包括一个基层译码器44和一个增强层译码器56。基层译码器44对进来的基层帧进行译码,产生基层视频信号B’(t)。此外,增强层译码器56对进来的增强层帧进行译码,将这些帧与适当的译码后基层帧进行组合,产生增强输出视频信号O’(t)。
可以看出,基层译码器44包括可变长度译码(VLD)功能块46,逆量化功能块48和逆离散傅里叶变换功能块50。在工作的过程中,这些功能块46、48、50对进来的基层帧分别进行可变长度译码、逆量化和逆离散余弦变换,产生译码运动矢量、I帧、部分B和P帧。
基层译码器44还包括运动补偿预测功能块52,用于对逆离散余弦变换功能块50的输出进行运动补偿,产生基层视频信号。此外,还有一个帧存储器54,用来储存以前译码的基层帧B’(t-i)。于是就能够在储存在帧存储器54中的译码后运动矢量和基层帧B’(t-i)的基础之上对部分B或者P帧进行运动补偿。
可以看出,增强层译码器56包括一个增强层FGS译码功能块58和一个增强预测和剩余组合功能块60。在工作的时候,增强层FGS译码块58对进来的增强层帧进行译码。这种译码是编码器一侧所进行的操作的逆操作,它可能包括任何精细颗粒可伸缩性技术,比如离散余弦变换或者小波图像译码。
此外,增强预测和剩余合并功能块60将译码后的增强层帧E’(t)与基层视频信号B’(t)、B’(t-i)进行合并,以便产生增强视频信号O’(t)。具体而言,每个译码后的增强层帧E’(t)都与预测信号合并。根据本发明,从当前的基层帧B’(t)和储存在帧存储器54中的至少一个其它基层帧B’(t-i)形成预测信号。根据本发明,另一个基层帧可以是一个相邻帧,比如前一帧,后一帧或者这两者。这些帧按照以下公式合并:
          O’(t)=E’(t)+sum{a(t-i)*M(B’(t-i))}    (4)
    i=-L1,-L1+1,...,0,1,...,L2-1,L2,其中M运算符是运动位移或者补偿运算符,a(t-i)是一个加权参数。公式(4)中进行的运算是公式(2)所示译码器一侧进行的运算的逆运算。可以看出,这些运算包括将每一个译码后的增强层帧E’(t)加到运动补偿后的基层视频帧的加权和上去。
在图8中给出能够采用本发明的一个系统实例。作为一个实例,系统66可以表示电视机、机顶盒、台式计算机、膝上型或者掌上型计算机、个人数字助理(PDA)、盒式磁带录像机(VCR)、数字录像机(DVR)、TiVO装置等等这样的视频/图像存储器以及这些装置和其它装置的部分或者组合。系统66包括一个或者多个视频源68,一个或者多个输入/输出装置76,一个处理器70和一个存储器72。
视频/图像源68可以代表,例如电视接收机,VCR或者其它视频/图像存储器。源68也可以代表一个或者多个网络连接,用于从服务器或者因特网、广域网、城际网、局域网、陆地广播系统、有线网、卫星网、无线网或者电话网这样的全球计算机通信网或者这些网络和其它网络的一部分或者组合上的服务器接收视频信号。
输入/输出装置76、处理器70和存储器72通过通信媒介78进行通信。通信媒介78可以代表例如总线、通信网、一个或者多个内部电路连接、电路卡或者其它装置,以及这些通信媒介和其它通信媒介的一部分和它们的组合。从源68输入的视频数据按照存储器72中储存,处理器70执行的一个或者多个软件程序来进行处理,从而产生视频/图像,在显示器74上显示出来。
在一个实施方案中,采用本发明的新的可伸缩性结构的编码和译码技术是利用计算机能够读,这个系统能够执行的代码来实现的。这些代码可以储存在存储器72中,或者从CD-ROM或者软盘这样的存储媒介读出/下载。在其它实施方案中,可以用硬件电路来代替软件指令,或者与它们结合,来实现本发明。例如,图6~7所示的部件也可以作为离散的硬件实现。
虽然前面用具体实例描述了本发明,但是应该明白,本发明不是只限于这里公开的实例。例如,本发明不限于任何具体的编码帧类型和概率分布。相反,本发明包括包括在权利要求的实质和范围之内的各种结构和改进。

Claims (12)

1.对视频数据进行编码的一种方法,包括以下步骤:
对一部分视频数据进行编码,产生基层帧;
对于每个剩余图像利用多个基层帧从视频数据和基层帧产生剩余图像;和
用精细颗粒可伸缩性技术对剩余图像进行编码,产生增强层帧。
2.权利要求1的方法,其中的多个基层帧包括当前的基层帧和至少一个相邻基层帧。
3.权利要求1的方法,其中的每个剩余图像都是通过从视频数据中减去预测信号产生的,其中的预测信号是由多个基层帧形成的。
4.权利要求3的方法,其中的预测信号是利用以下步骤产生的:
对每个基层帧进行运动估计;
对每个基层帧进行加权;和
将多个基层帧加起来。
5.用于对包括一个基层和一个增强层的视频信号进行译码的一种方法,包括以下步骤:
对基层进行译码以产生基层视频帧;
用精细颗粒可伸缩性技术对增强层进行译码,产生增强层视频帧;和
将每个增强层视频帧和多个基层视频帧结合产生输出视频信号。
6.权利要求5的方法,其中的多个基层视频帧包括当前基层视频帧和至少一个相邻的基层视频帧。
7.权利要求5的方法,其中的结合步骤是通过将每个增强层增加到预测信号中去形成的,其中的预测信号是由多个基层视频帧形成的。
8.权利要求7的方法,其中的预测信号是按照以下步骤产生的:
对每个基层视频帧进行运动补偿;
对每个基层视频帧进行加权;和
将多个基层视频帧加起来。
9.对视频数据进行编码的一种装置,包括:
对一部分视频数据进行编码产生基层帧的第一个编码器;
对于每个剩余帧利用多个基层帧从视频数据和基层帧产生剩余图像的增强预测和剩余计算功能块;和
用精细颗粒可伸缩性技术对剩余帧进行编码产生增强层帧的第二个编码器。
10.对视频信号进行译码的一种装置,包括一个基层和一个增强层,包括以下步骤:
对基层进行译码产生基层视频帧的第一个译码器;
利用精细颗粒可伸缩技术对增强层进行译码产生增强层视频帧的第二个译码器;和
将多个基层视频帧和每个增强层视频帧结合起来的一个增强预测和剩余结合功能块。
11.包括代码用来对视频数据进行编码的一种存储媒介,这些代码包括:
对一部分视频数据进行编码产生基层帧的代码;
对于每个剩余图像利用多个基层帧从视频数据和基层帧产生剩余图像的代码;和
利用精细颗粒可伸缩性技术对剩余图像进行编码产生增强层帧的代码。
12.包括代码对包括基层和增强层的视频信号进行译码的一种存储媒介,这些代码包括:
对基层进行译码产生基层视频帧的代码;
利用精细颗粒可伸缩性技术对增强层进行译码产生增强层视频帧的代码;和
将每一个增强层视频帧与多个基层视频帧结合产生输出视频的代码。
CNB028004256A 2001-02-26 2002-02-14 对视频数据和视频信号进行编码和解码的方法及装置 Expired - Fee Related CN1254975C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/793,035 US20020118742A1 (en) 2001-02-26 2001-02-26 Prediction structures for enhancement layer in fine granular scalability video coding
US09/793,035 2001-02-26

Publications (2)

Publication Number Publication Date
CN1457605A true CN1457605A (zh) 2003-11-19
CN1254975C CN1254975C (zh) 2006-05-03

Family

ID=25158885

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB028004256A Expired - Fee Related CN1254975C (zh) 2001-02-26 2002-02-14 对视频数据和视频信号进行编码和解码的方法及装置

Country Status (6)

Country Link
US (1) US20020118742A1 (zh)
EP (1) EP1364534A2 (zh)
JP (1) JP4446660B2 (zh)
KR (2) KR20090026367A (zh)
CN (1) CN1254975C (zh)
WO (1) WO2002069645A2 (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008071037A1 (en) * 2006-12-14 2008-06-19 Thomson Licensing Method and apparatus for encoding and/or decoding video data using enhancement layer residual prediction for bit depth scalability
CN101223783B (zh) * 2005-07-21 2010-11-17 Lg电子株式会社 对视频信号进行编码和解码的方法
CN101080929B (zh) * 2004-10-18 2011-03-02 索尼株式会社 图像处理装置与图像处理方法
CN101558650B (zh) * 2006-12-14 2011-04-13 汤姆森许可贸易公司 编码和/或解码视频数据的方法及设备
CN101627636B (zh) * 2007-03-07 2011-08-10 高通股份有限公司 可缩放视频译码增强层中的精细化和有效系数的组合式游程长度译码的方法和装置
CN101584217B (zh) * 2007-01-08 2011-12-14 高通股份有限公司 用于空间可缩放性的扩展的层间译码的方法及装置
CN101411197B (zh) * 2006-03-27 2012-09-05 高通股份有限公司 用于在视频压缩中进行精细化系数编码的方法及系统
CN102065295B (zh) * 2005-01-12 2012-09-26 法国电信公司 对表示图像或图像序列的数据流进行解码的方法和设备
CN101931810B (zh) * 2004-10-15 2012-12-19 弗劳恩霍夫应用研究促进协会 用中间层残留值预测产生并解码视频序列的设备和方法
CN101385349B (zh) * 2006-01-09 2013-07-10 Lg电子株式会社 用于视频信号的层间预测方法

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030023982A1 (en) * 2001-05-18 2003-01-30 Tsu-Chang Lee Scalable video encoding/storage/distribution/decoding for symmetrical multiple video processors
FR2825855A1 (fr) * 2001-06-06 2002-12-13 France Telecom Procedes et dispositifs de codage et de decodage d'images mettant en oeuvre des maillages emboites, programme, signal et application correspondantes
US20060012719A1 (en) * 2004-07-12 2006-01-19 Nokia Corporation System and method for motion prediction in scalable video coding
KR100679022B1 (ko) * 2004-10-18 2007-02-05 삼성전자주식회사 계층간 필터링을 이용한 비디오 코딩 및 디코딩방법과,비디오 인코더 및 디코더
KR100664932B1 (ko) * 2004-10-21 2007-01-04 삼성전자주식회사 비디오 코딩 방법 및 장치
KR100888963B1 (ko) * 2004-12-06 2009-03-17 엘지전자 주식회사 영상 신호의 스케일러블 인코딩 및 디코딩 방법
KR100888962B1 (ko) * 2004-12-06 2009-03-17 엘지전자 주식회사 영상 신호의 인코딩 및 디코딩 방법
DE102004061906A1 (de) * 2004-12-22 2006-07-13 Siemens Ag Bildencodierverfahren, sowie dazugehöriges Bilddecodierverfahren, Encodiervorrichtung und Decodiervorrichtung
US20060153295A1 (en) * 2005-01-12 2006-07-13 Nokia Corporation Method and system for inter-layer prediction mode coding in scalable video coding
US20060153300A1 (en) * 2005-01-12 2006-07-13 Nokia Corporation Method and system for motion vector prediction in scalable video coding
WO2006078115A1 (en) * 2005-01-21 2006-07-27 Samsung Electronics Co., Ltd. Video coding method and apparatus for efficiently predicting unsynchronized frame
WO2006107281A1 (en) * 2005-04-08 2006-10-12 Agency For Science, Technology And Research Method for encoding at least one digital picture, encoder, computer program product
KR100746007B1 (ko) 2005-04-19 2007-08-06 삼성전자주식회사 엔트로피 코딩의 컨텍스트 모델을 적응적으로 선택하는방법 및 비디오 디코더
KR100763182B1 (ko) * 2005-05-02 2007-10-05 삼성전자주식회사 다계층 기반의 가중 예측을 이용한 비디오 코딩 방법 및장치
EP1911290A4 (en) * 2005-07-08 2010-04-28 Lg Electronics Inc METHOD FOR MODELING A VIDEO SIGNAL CODE INFORMATION FOR COMPRESSING / DECOMPRIMING CODING INFORMATION
JP2009500941A (ja) * 2005-07-08 2009-01-08 エルジー エレクトロニクス インコーポレイティド 情報を圧縮/圧縮解除するためにビデオ信号のコーディング情報をモデリングする方法
KR100678907B1 (ko) * 2005-07-12 2007-02-06 삼성전자주식회사 하위 계층의 복원 데이터를 사용하여 fgs 계층을 인코딩및 디코딩하는 방법 및 장치
WO2007027001A1 (en) * 2005-07-12 2007-03-08 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding fgs layer using reconstructed data of lower layer
US7894523B2 (en) 2005-09-05 2011-02-22 Lg Electronics Inc. Method for modeling coding information of a video signal for compressing/decompressing coding information
US20070147371A1 (en) * 2005-09-26 2007-06-28 The Board Of Trustees Of Michigan State University Multicast packet video system and hardware
KR100891662B1 (ko) * 2005-10-05 2009-04-02 엘지전자 주식회사 비디오 신호 디코딩 및 인코딩 방법
KR20070038396A (ko) 2005-10-05 2007-04-10 엘지전자 주식회사 영상 신호의 인코딩 및 디코딩 방법
KR100959541B1 (ko) * 2005-10-05 2010-05-27 엘지전자 주식회사 영상 신호의 인코딩/디코딩 방법 및 장치
KR100891663B1 (ko) * 2005-10-05 2009-04-02 엘지전자 주식회사 비디오 신호 디코딩 및 인코딩 방법
KR20070096751A (ko) * 2006-03-24 2007-10-02 엘지전자 주식회사 영상 데이터를 코딩/디코딩하는 방법 및 장치
KR100904442B1 (ko) * 2006-01-09 2009-06-24 엘지전자 주식회사 영상 신호의 레이어 간 예측 방법
KR20070077059A (ko) * 2006-01-19 2007-07-25 삼성전자주식회사 엔트로피 부호화/복호화 방법 및 장치
KR100772878B1 (ko) * 2006-03-27 2007-11-02 삼성전자주식회사 비트스트림의 비트율 조절을 위한 우선권 할당 방법,비트스트림의 비트율 조절 방법, 비디오 디코딩 방법 및 그방법을 이용한 장치
KR100834757B1 (ko) * 2006-03-28 2008-06-05 삼성전자주식회사 엔트로피 부호화 효율을 향상시키는 방법 및 그 방법을이용한 비디오 인코더 및 비디오 디코더
US8687740B2 (en) * 2010-02-11 2014-04-01 Electronics And Telecommunications Research Institute Receiver and reception method for layered modulation
US20110194645A1 (en) * 2010-02-11 2011-08-11 Electronics And Telecommunications Research Institute Layered transmission apparatus and method, reception apparatus, and reception method
US20110195658A1 (en) * 2010-02-11 2011-08-11 Electronics And Telecommunications Research Institute Layered retransmission apparatus and method, reception apparatus and reception method
US8824590B2 (en) * 2010-02-11 2014-09-02 Electronics And Telecommunications Research Institute Layered transmission apparatus and method, reception apparatus and reception method
CN104247423B (zh) * 2012-03-21 2018-08-07 联发科技(新加坡)私人有限公司 可伸缩视频编码系统的帧内模式编码方法和装置
US20130329806A1 (en) * 2012-06-08 2013-12-12 Qualcomm Incorporated Bi-layer texture prediction for video coding
TWI625052B (zh) * 2012-08-16 2018-05-21 Vid衡器股份有限公司 多層視訊編碼以片段為基礎之跨越模式傳訊
CN104937932B (zh) * 2012-09-28 2019-04-19 英特尔公司 可适性视频编码的增强参考区域利用
US20140198846A1 (en) * 2013-01-16 2014-07-17 Qualcomm Incorporated Device and method for scalable coding of video information
JP6523249B2 (ja) * 2013-04-17 2019-05-29 トムソン ライセンシングThomson Licensing パケットヘッダを圧縮する方法及び装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04177992A (ja) * 1990-11-09 1992-06-25 Victor Co Of Japan Ltd 階層性を有する画像符号化装置
FR2697393A1 (fr) * 1992-10-28 1994-04-29 Philips Electronique Lab Dispositif de codage de signaux numériques représentatifs d'images, et dispositif de décodage correspondant.
CA2126467A1 (en) * 1993-07-13 1995-01-14 Barin Geoffry Haskell Scalable encoding and decoding of high-resolution progressive video
US5886736A (en) * 1996-10-24 1999-03-23 General Instrument Corporation Synchronization of a stereoscopic video sequence
US6057884A (en) * 1997-06-05 2000-05-02 General Instrument Corporation Temporal and spatial scaleable coding for video object planes
JP4332246B2 (ja) * 1998-01-14 2009-09-16 キヤノン株式会社 画像処理装置、方法、及び記録媒体
JPH11239351A (ja) * 1998-02-23 1999-08-31 Nippon Telegr & Teleph Corp <Ntt> 動画像符号化方法、復号方法、符号化器、復号器、動画像符号化プログラムおよび動画像復号プログラムを記録した記録媒体
US6292512B1 (en) * 1998-07-06 2001-09-18 U.S. Philips Corporation Scalable video coding system
US6639943B1 (en) * 1999-11-23 2003-10-28 Koninklijke Philips Electronics N.V. Hybrid temporal-SNR fine granular scalability video coding
US6614936B1 (en) * 1999-12-03 2003-09-02 Microsoft Corporation System and method for robust video coding using progressive fine-granularity scalable (PFGS) coding
US6700933B1 (en) * 2000-02-15 2004-03-02 Microsoft Corporation System and method with advance predicted bit-plane coding for progressive fine-granularity scalable (PFGS) video coding
EP1319309B1 (en) * 2000-09-22 2006-11-22 Koninklijke Philips Electronics N.V. Hybrid temporal-snr fine granular scalability video coding
CN1636394A (zh) * 2000-10-11 2005-07-06 皇家菲利浦电子有限公司 细粒视频编码的空间可缩放性

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101931810B (zh) * 2004-10-15 2012-12-19 弗劳恩霍夫应用研究促进协会 用中间层残留值预测产生并解码视频序列的设备和方法
CN101080929B (zh) * 2004-10-18 2011-03-02 索尼株式会社 图像处理装置与图像处理方法
CN102088601B (zh) * 2004-10-18 2013-07-24 索尼株式会社 图像处理装置与图像处理方法
CN102065295B (zh) * 2005-01-12 2012-09-26 法国电信公司 对表示图像或图像序列的数据流进行解码的方法和设备
CN101223783B (zh) * 2005-07-21 2010-11-17 Lg电子株式会社 对视频信号进行编码和解码的方法
CN101385349B (zh) * 2006-01-09 2013-07-10 Lg电子株式会社 用于视频信号的层间预测方法
TWI393446B (zh) * 2006-03-27 2013-04-11 Qualcomm Inc 視訊壓縮中用於精化係數編碼之方法及系統
CN101411197B (zh) * 2006-03-27 2012-09-05 高通股份有限公司 用于在视频压缩中进行精细化系数编码的方法及系统
WO2008071037A1 (en) * 2006-12-14 2008-06-19 Thomson Licensing Method and apparatus for encoding and/or decoding video data using enhancement layer residual prediction for bit depth scalability
US8428129B2 (en) 2006-12-14 2013-04-23 Thomson Licensing Method and apparatus for encoding and/or decoding video data using enhancement layer residual prediction for bit depth scalability
CN101558650B (zh) * 2006-12-14 2011-04-13 汤姆森许可贸易公司 编码和/或解码视频数据的方法及设备
CN101584217B (zh) * 2007-01-08 2011-12-14 高通股份有限公司 用于空间可缩放性的扩展的层间译码的方法及装置
CN101627636B (zh) * 2007-03-07 2011-08-10 高通股份有限公司 可缩放视频译码增强层中的精细化和有效系数的组合式游程长度译码的方法和装置

Also Published As

Publication number Publication date
CN1254975C (zh) 2006-05-03
KR20090026367A (ko) 2009-03-12
WO2002069645A3 (en) 2002-11-28
KR20020090239A (ko) 2002-11-30
WO2002069645A2 (en) 2002-09-06
EP1364534A2 (en) 2003-11-26
JP2004519909A (ja) 2004-07-02
JP4446660B2 (ja) 2010-04-07
US20020118742A1 (en) 2002-08-29

Similar Documents

Publication Publication Date Title
CN1254975C (zh) 对视频数据和视频信号进行编码和解码的方法及装置
US6233017B1 (en) Multimedia compression system with adaptive block sizes
KR100703760B1 (ko) 시간적 레벨간 모션 벡터 예측을 이용한 비디오인코딩/디코딩 방법 및 장치
US9420279B2 (en) Rate control method for multi-layered video coding, and video encoding apparatus and video signal processing apparatus using the rate control method
CN1192629C (zh) 应用基层编码信息改进精确颗粒可定标图像的系统和方法
CN1196340C (zh) 用于数字视频运动补偿的搜索方法和处理器
CN1303817C (zh) 细粒可调节视频残差信号的编码解码系统和方法
US6526099B1 (en) Transcoder
US20030012279A1 (en) Multimedia compression system with additive temporal layers
US7003034B2 (en) Fine granularity scalability encoding/decoding apparatus and method
CN1640145A (zh) 使用高质量参考帧的改进高效快速的结构
CN1636407A (zh) 具有运动补偿的完全嵌入式fgs视频编码
US7088777B2 (en) System and method for low bit rate watercolor video
JP2008541653A (ja) スムージング予測を用いた多階層基盤のビデオエンコーディング方法、デコーディング方法、ビデオエンコーダ及びビデオデコーダ
CN1751519A (zh) 视频编码
WO2003081918A1 (en) Video codec with hierarchical motion estimation in the wavelet domain
WO2005032138A1 (en) System and method for combining advanced data partitioning and fine granularity scalability for efficient spatio-temporal-snr scalability video coding and streaming
KR20070088334A (ko) 비디오 트랜스코딩 방법 및 장치
JPH11122617A (ja) 画像圧縮
US20060133483A1 (en) Method for encoding and decoding video signal
CN1672421A (zh) 采用混合预测码执行多描述运动补偿的方法和装置
CN1656816A (zh) 使用较高质量的参考帧改进效率的fgst结构
CN1633814A (zh) 存储器带宽效率高的精细可分级(fgs)编码器
Shen et al. A control scheme for a data rate scalable video codec
Taieb et al. Spatial correlation-based side information refinement for distributed video coding

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20060503

Termination date: 20110214