CN101002475B - 图像序列的视频数据编码方法 - Google Patents
图像序列的视频数据编码方法 Download PDFInfo
- Publication number
- CN101002475B CN101002475B CN2005800156343A CN200580015634A CN101002475B CN 101002475 B CN101002475 B CN 101002475B CN 2005800156343 A CN2005800156343 A CN 2005800156343A CN 200580015634 A CN200580015634 A CN 200580015634A CN 101002475 B CN101002475 B CN 101002475B
- Authority
- CN
- China
- Prior art keywords
- filtering
- time
- grade
- time grade
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
- H04N19/615—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding using motion compensated temporal filtering [MCTF]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/156—Availability of hardware or computational resources, e.g. encoding based on power-saving criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
一种对图像序列的视频数据进行编码的方法包括实现运动补偿时间滤波的时间分析(1),所述滤波包括:预测步骤,用于实现较低时间等级的图像L(7,8;11,12,13)的高通滤波,以得到时间等级I处的高频带图像H(9,14);以及更新步骤,用于实现相同等级的图像H(9;14,15)和/或较低时间等级的图像L(7,11)的低通滤波,以得到时间等级I处的低频带图像L(10,16),其特征在于,至少对于时间等级,预测步骤执行长滤波,以及更新步骤执行短滤波。应用涉及数据传输或存储的视频压缩。
Description
技术领域
本发明涉及一种方法和设备,用于对图像序列的视频数据进行编码和解码。更具体地,本发明涉及一种实现运动补偿时间滤波的时间分析。
背景技术
在大多数当前的视频编码算法中,如MPEG和/或基于t+2D小波的方案,第一步在于在连续帧之间使用时间相关,之后,可以捕获帧空间相关。使用运动补偿变换减少了时间冗余。这称为运动补偿时间滤波或MCTF。使用如离散余弦变换或离散小波变换之类的空间变换,减少了空间冗余。
图1示出了已知的视频编码方案的结构。在编码之前,通常将连续的视频帧分为帧组,其首字母简称为GOF。编码过程是基于以下结构:
首先,运动补偿时间分析或MCTF电路1实现这样的滤波,以得到不同的时间频带。运动估计电路2接收来自时间分析电路的帧,来计算运动估计(ME)。运动估计生成运动向量(MV),当目标在一个图像中的位置相对于另一图像移动时,使用运动向量(MV),以使传送数据量最小化。运动估计使用前向或后向、或者双向参照。将运动向量传送至执行运动补偿的时间分析电路。在传送之前,还将这些运动向量传送至运动编码电路4进行编码。
来自时间分析电路1的结果“帧”经过实现离散小波变换(DWT)的空间分析电路3。最后,使用熵编码器5,对从完整的时间/空间分析中得出的系数进行编码。最后的合并电路,即分组器6,将结果编码系数和运动向量连接以得到最后的输出流。
运动补偿时间滤波技术分析(即,滤波)n个连续视频帧的集合,并生成时间低频帧和高频帧的子集、以及相关联的运动场,即滤波后的n个帧的集合之间的运动向量集合。
已知的分析技术,离散小波变换(DWT),是通过使用值的平均和差,将信号或一列值分为空间分量的迭代方法。从而,可以以与频率或者频谱的子带相对应的不同的分辨率,来查看该列值。
可以通过经典的卷积法或使用所谓的“提升(lifting)方案”,来实现这样的时间滤波的实施方式。通常,由于其灵活性、可逆性、快速和低内存使用,而使用后一方法。基本的提升步骤是依次的“预测”步骤和“更新”步骤。完整的提升方案由一个或多个基本提升步骤组成。
短时间滤波(即,仅用于一对帧上的2抽头滤波器)广泛地用于视频压缩。但是与较长的滤波器组(如,目前使用的5/3滤波器组)相比,短时间滤波的压缩功率非常有限。然而,这样的时间结构会带来存储器/时延问题。确实,与Harr滤波比较,以下描述的双向预测步骤和更新步骤是造成编码/解码时延和存储器空间增长的原因。例如,为了对16的组帧进行编码/解码,必须在存储器中保存总数为56的帧。由于“未来”帧的缓冲时间,这意味着在30fps(帧每秒)视频材料的情况下,有0.5秒的编码时延。同样地,在解码之前也发生相同的时延。这样的时延不能完成需要短反应时间、或者存储器容量减少的应用需求。最后,这样的时间金字塔(temporal pyramid)的实施方式非常复杂。
已经认识到,更新步骤是造成整体编码/解码等待时间增加的主要原因。在所提出的减小时延的技术中,如由L.Luo和al在“Motioncompensated lifting wavelet and its application in video coding”(IEEE图像处理国际会议会议录,ICIP’01,萨洛尼卡,希腊,2001年10月)中描述的,已经对跳过更新步骤进行了研究。此外,Woods在“Motioncompensated temporal filtering using longer filters”(ISO/IECJTC1/SC29/WG11/M9280,Awaji,日本,2002年12月)中提出了,在最高时间等级上使用Harr滤波器,从而减小时间金字塔的大小。
但是,系统地,跳过更新步骤会破坏沿时间轴的压缩。例如,在没有更新步骤的情况下使用5/3滤波,所谓的“截短的5/3”方案,缩减为使用1/3滤波器组。另一方面,Woods技术仅解决了所描述问题的有限部分。
发明内容
本发明的目的是减少上述缺点。
本发明的主题是对图像序列的视频数据进行编码的方法,包括实现运动补偿时间滤波的时间分析,所述滤波包括:预测步骤,用于实现较低时间等级的图像L的高通滤波,以得到时间等级I处的高频带图像H;以及更新步骤,用于实现相同等级的图像H和/或低时间等级的图像L的低通滤波,以得到时间等级I处的低频带图像L,其特征在于,至少对于时间等级,预测步骤执行长滤波,以及更新步骤执行短滤波。
根据实施方式的模式,对于预测和更新步骤,根据时间等级I,在长滤波和短滤波中做出选择。
根据实施方式的模式,长滤波与双向滤波模式相对应,以及短滤波模式与右侧滤波模式、左侧滤波模式图像、或者无滤波模式相对应。
根据实施方式的模式,对于预测和更新步骤,根据时间位置t,在长滤波和短滤波中做出选择。
根据实施方式的模式,将序列构造成帧组或GOF,以及对于给定的时间等级,对于预测和/或更新步骤以及对于给定的GOF,为所述GOF中的第一帧选择右侧模式,为所述GOF中的最后一帧选择左侧模式,为其它帧选择双向模式。
根据实施方式的模式,系统地,在L个时间等级的n个最低等级上使用双向模式,以及在较高时间等级处做出选择。
本发明还涉及对视频数据进行编码的设备,包括执行图像的MCTF滤波的时间分析电路,其特征在于,所述电路包括装置,用于对于时间等级和对于预测步骤,来执行长滤波,以及对于相同时间等级和对于更新步骤,来执行短滤波。
本发明还涉及对视频数据进行解码的方法,包括时间合成运动补偿时间滤波,其特征在于,对于时间等级和对于更新步骤,所述滤波执行短滤波,以及对于相同等级和对于预测步骤,所述滤波执行长滤波。
根据实施方式的模式,长滤波与双向滤波模式相对应,以及短滤波模式与右侧滤波模式、左侧滤波模式图像、或者无滤波模式相对应。
本发明还涉及对视频数据进行解码的设备,包括用于执行时间合成MCTF滤波的时间合成电路,其特征在于,所述电路包括装置,用于对于时间等级和对于更新步骤,来执行短滤波,以及对于相同的时间等级和对于预测步骤,来执行长滤波。
本发明涉及用于递归MCTF的新颖框架,即,生成时间金字塔,包括多个定制的预测和更新步骤(即,滤波模式)的定义,根据GOF中的时间等级和/或时间位置,来局部地调谐时间分解。可以在每个基本提升步骤中选择可能滤波模式的新扩展集合中的滤波模式。
例如,这样的调谐涉及丢弃更新步骤的一个分支(前向或后向)。另一可选项涉及,依据时间等级使用不同的更新管理。以相同的方式,更新管理可以在给定的时间等级内发生变化。关于更新步骤的所有这些考虑可以用于预测步骤。
该方式的目标是,在编码时延、复杂度和编码效率之间获得更好的折衷。考虑实现成本和/或处理速度来优化压缩率。
附图说明
将通过以下参考附图对非限制性示例的描述,本发明的其它特征和优点变得非常清楚,其中:
图1是视频编码器的整体结构,
图2是Harr滤波的提升方案,
图3是具有16帧的帧组的Harr滤波,
图4是5/3滤波的提升实施方式,
图5是具有16帧的帧组的5/3滤波,
图6是基本提升步骤的treillis结构,
图7是系统的双向预测步骤、左侧更新步骤MCTF方案,
图8是系统的双向预测步骤、右侧更新步骤MCTF方案,
图9是等级自适应MCTF方案,
图10是时间自适应MCTF方案,
图11是时间和等级自适应MCTF方案。
具体实施方式
首先考虑短时间滤波,即,2抽头滤波器,这仅用于一对帧,如所谓的“Harr滤波”。应注意,Harr滤波器可以解释为2/2滤波组。
如果考虑一对图像A和B,该过程涉及,为了获得高频带图像H和低频带图像L,来使用高通滤波器和低通滤波器。这两个步骤在该滤波中与等式(1)相对应,
其中,MCI1←I2(F)与帧F的运动补偿相对应,其中使用在帧I1和I2之间估计的运动场。
在图2中描述了该处理,其中,图像A和B以7和8为标号。为了获得高频带图像H、即高通帧9,需要图像B和图像A之间的运动。该运动与从B开始的后向运动向量相对应,A作为参考图像。
为了获得低频带图像L、即高通帧10,需要图像A和图像B之间的运动。该运动与从A开始的前向运动向量相对应,B作为参考图像。实际上,通常仅估计一个运动场(例如,从B至A的运动场),而推出另一个运动场。
实际上,通常,输入帧聚集成称为GOF的帧组。图3示出了16帧帧组的Hart滤波示例。
在该图中,第一行帧与原始GOF相对应。第二和第三行帧与时间等级1相对应,以下成对的行(4、5)、(6、7)和(8、9)分别与时间等级2、3和4相对应。
在原始GOF中的每对帧上使用“Harr滤波”,以在时间等级1上生成时间高频(H)和低频(L)帧。对于给定的时间等级,该对的第一行表示通过预测步骤获得的帧,第二行表示通过预测步骤之后的更新步骤获得的帧。换言之,第一行表示时间高频帧,以及第二行表示时间低频帧。
通过预测步骤处理等级n-1上的时间低频帧,来获得时间等级n上的高频帧。对于n=1,低频帧是原始帧。
通过更新步骤处理等级n-1上的时间低频帧以及等级n上获得的时间高频帧,来获得时间等级n上的低频帧。对于n=1,低频帧是原始帧。
由时间分析电路1传送的帧是来自最低时间等级的时间低频帧(等级4上的LLLL),以及在每个时间等级上的时间高频帧(等级4上的LLLH、等级3上的LLH1和LLH2、等级2上的LH1至LH4、以及等级1上的H1至H8),总共16帧。
现在考虑较长滤波组,如当前使用的5/3滤波组。
5/3滤波组由与一个3抽头高带滤波器耦合的一个5抽头低带滤波器组成。由于用于较长时间窗上,所以这样的滤波器允许更好地捕获时间轴上的时间冗余。该滤波器的提升实施方式与等式(2)相对应,如图4所示。
用Ak,和Ak+1(标号11和12)来表示视频序列或GOF中的第k和第k+1偶数帧,以及Bk(标号13)来表示视频序列或GOF中的第k奇数帧。
再一次,MCI1←I2(F)与帧F的运动补偿相对应,其中使用在帧I1和I2之间估计的后向运动场,并且MCI1→I2(F)与帧F的运动补偿相对应,其中使用在帧I1和I2之间估计的前向运动场。
如图4所示,预测步骤通过Bk和运动补偿帧Ak和Ak+1,来计算高通帧Hk(标号14)。
更新步骤通过帧Ak(标号11)和运动补偿帧Hk-1和Hk(标号15和14),来计算低通帧Lk。
注意到,预测步骤和更新步骤都具有不同于Harr形式的3抽头。
实际上,通常,输入帧聚集为帧组或GOF,例如,16帧,并递归地使用该滤波过程。图5中示出了相应的时间结构。当前的GOF及其处理过程以粗线表示。如以上所解释,第一行帧表示原始序列、第二行和第三行分别表示与时间等级1相对应的高频帧和低频帧...
本发明涉及新颖的递归MCTF框架,即,生成时间金字塔,包括用于预测和更新步骤的多个定制的滤波模式的定义,例如,根据在GOF中的时间等级和/或时间位置,来局部地调谐时间分解。
符号
为了简单,将省略后来滤波等式中的运动补偿。
在扩展的5/3滤波器中,由给定的系数集合来确定每个基本步骤(更新或预测)。
U和P分别是更新和预测算符:U={αu;βu;γu}P={αp;βp;γp}。
图6表示基本提升步骤的treillis结构。分别将系数α,β,γ分配给后向、当前和前向分支,这与前一帧、当前帧和下一帧相对应。
使用这些符号,可以重写等式(2):
例如,在经典的5/3情况下(其等式已在(2)中示出),系数值如下:
双向预测或BiP模式:
双向更新或BiU模式:
以下,将另外考虑由相应系数集合定义的以下更新和预测模式:
右侧更新或RU模式:
左侧更新或LU模式:
无更新或NU模式:
右侧预测或RP模式:
左侧预测或LP模式:
无预测或NP模式:
这里表示的系数不考虑可以使用的可能的滤波器归一化。
为了更具一般性,双向预测模式或双向更新模式,也称为双向滤波模式或长滤波,与不同于0的α和γ相对应。
右侧预测模式和右侧更新模式,也称为右侧滤波模式,与α=0和不同于0的γ相对应。
左侧预测模式和左侧更新模式,也称为左侧滤波模式,与不同于0的α和γ=0相对应。
无预测模式和无更新模式,也称为无滤波模式,与α=0、γ=0相对应。
将右侧滤波、左侧滤波或无滤波模式认为是短滤波。
假设在MCTF时间金字塔中有L个时间等级。
传统MCTF方案仅实现与双向更新模式BiU[Woods]、或者与无更新模式NU[Luo]相耦合的双向预测模式BiP,作为使用传统MCTF方案的替代,该过程允许通过扩展更新和预测模式的集合,来实现其它模式,其中,在新的扩展集合内作出选择。
因此,首先定义可能的提升模式集合。例如,更新和预测模式集合(分别为Du和Dp)可以是:
DU={NU,LU,RU,BiU}
DP={NP,RP,LP,BiP}.
这些模式由系数α,β,γ来定义,其中,这些系数的指数u或p与更新或预测模式相对应。
然后,在MCTF时间金字塔的不同节点处,从这些可能的模式中间选择模式。
对于每个基本提升步骤,根据与该步骤相对应的等级内的时间等级或时刻t、或者二者的组合,来选择模式。Ut,l and Pt,l分别是与时间等级l和时刻t相对应的更新和预测步骤:
Ut,l=f(t,l)∈DU
Pt,l=g(t,l)∈DP
此外,可以通过基于内容的标准,并行地驱动不同模式之间的选择。
例如,对于具有多个场景截图的序列,可以避免导致长滤波的双向滤波模式。可以禁止GOF中指向截图外的帧的双向滤波模式。
还可以通过应用需求来驱动选择。例如,如果需要低时延,则选择导致短滤波的无滤波模式或左侧滤波模式、右侧滤波模式,而不是双向滤波模式。另一方面,长滤波允许更好的压缩率。
对于每个基本提升步骤,可以根据时间等级来选择模式。
对于开始的等级,由于长滤波给出较好的频谱分离并因此给出更有效的压缩,所以使用双向滤波模式来使滤波更加有效。
例如,对于开始u个最低时间等级,使用双向更新模式,而对于L-u个较高时间等级,使用左侧或右侧更新模式。
作为组合,对于开始p个最低时间等级,使用双向预测模式,而对于L-p个较高时间等级,使用左侧或右侧预测模式。
u和p是低于L的正整数,并可以具有相同的值。
作为另一示例,通过最后等级上的无更新和/或无预测模式来替换左侧或右侧更新和/或预测模式。
通过由左侧、右侧或无滤波模式来替换双向滤波模式,并因此通过减小在时间分解中所需的未来帧数,来减小编码/解码时延,同时最大程度地利用沿时间轴的能量压缩的益处。
图7和以下表示了用于图像序列的不同MCTF框架,通过加粗来强调GOF。
图7示出了与四个时间等级的每个等级上的系统双向预测模式和系统左侧更新模式相对应的框架。
图8示出了具有四个时间等级的每个等级上的系统双向预测模式和系统右侧更新模式的框架。
图9示出了与时间等级1和2的双向预测模式、时间等级3和4的左侧预测模式、时间等级1的双向更新模式、以及时间等级2、3和4的右侧更新模式相对应的框架。
双向滤波使得来自低频等级的H帧“更加等于0”,以及来自低频等级的L帧“更加相关”、更加“可能是自然图像”。这有助于在获得的L帧上的迭代时间变换;运动估计和运动补偿时间滤波更加有效。对于较高等级,由于帧变得越来越远离,所以长滤波将会越来越经常失败,同时时延越来越大。
关于左侧、右侧和无滤波模式之间的选择,如果帧的获得和传送之间的等待时间很关键,例如,在有关实况编码(live encoding)的应用中,则可以先验地选择左侧滤波,以支持对过去帧、而不是未来帧的依赖性,并限制帧的存储。如果该等待持续时间无关紧要,例如,脱机编码,则可以归纳性地做出模式选择,例如在使用基于内容的标准对序列进行预先分析之后。
对于每个基本提升步骤,可以根据时间位置t来选择模式。
例如,预测模式对于开始iP帧是右侧的、对于最后kP帧是左侧的、以及对于其它为双向的。以相同的方式,更新模式对于开始iU帧是右侧的、对于最后kU帧是左侧的、以及对于其它为双向的。
因此,可以通过在所考虑的等级上,仅对于该组中心的帧使用双向模式,以及对于边界上的帧使用右侧和/或左侧模式,来改进与使用双向模式相对应的框架。关于相同的整体时延限制,允许在花费提高的复杂度的情况下,更好地减轻能量压缩。
图10示出了时间自适应MCTF方案的框架。系统上,预测步骤在于双向滤波,除了使用左侧滤波处理GOF的最后一帧之外(iP=0;kP=1)。系统上,更新步骤在于双向滤波,除了使用右侧滤波处理GOF的第一帧之外(iU=0;kU=1)。
由于该实施方式,可以获得独立地可解码时间单元,例如,GOF。
对于每个提升步骤,可以根据时间等级I和时间位置t,来选择模式。
在每个等级内,先前模式的所有种类的组合都是可能的。例如,在时间等级I处,预测/更新模式对于iP,l/iU,l个开始帧是右侧的,对于kP,l/kU,l个最后帧是左侧的,以及对于其它是双向的。
图11示出了时间和等级自适应MCTF方案的框架,其中,对于等级l∈{1;2},iP,l=kP,l=iU,l=kU,l=0,以及对于等级l∈{3;4},iP,l=kU,l=0,以及kP,l=iU,l=1。
当然,对于模式判断,基于内容的任何现有技术都可以用于定义整个MCTF框架。例如,对于时间等级上的当前帧,如果实现关于通过运动向量与前一帧或后一帧连接的象素数目测试,或者对前一帧或后一帧计算相关性,则结果可以用于决定滤波模式,例如,如果当前帧分别具有较多的连接像素,或者与后一帧或前一帧更加相关,则为右侧模式或左侧模式。
以逐行视频的连续帧来描述序列。本发明还用于连续的交织场,在相应的场或在重构的帧上实现滤波。
如前所述,采用5/3滤波器作为示例。考虑了多个前面和后面的帧的较长滤波器(例如,9/7滤波器)的使用,仍在本发明的范围内。在那种情况下,treillis具有多于一个的后向和前向分支,并且由与在后向或前向分支中去除的一个或多个分支相对应的多个模式,来替换右侧模式或左侧模式。
本发明还涉及如在图1中所描述的编码电路,该电路具有时间分析电路1,用于实现执行上述方法的算法。
本发明还涉及解码方法和解码电路。
图12表示解码电路。将与根据先前描述的方法进行编码的视频序列相对应的二进制流连续地传送至熵解码电路17、空间合成电路19、时间合成电路20、以及可能地后滤波电路21,来提供解码的视频。运动解码电路18从熵解码电路中接收运动信息,并将运动向量场传送至时间合成电路。
熵解码电路执行熵编码电路的逆操作。尤其,该电路对由编码器传送的空间时间小波系数和滤波模式进行解码。将提取的运动信息发送至运动解码电路,该电路对运动向量场进行解码。为了从不同的时间频带中执行运动补偿合成,将这些运动场传送至时间合成电路20。
空间合成电路19将与不同的时间子带相对应的时间小波系数传送至空间合成电路。最后的电路通过时间合成滤波器对这些子带进行滤波,来重构图像。其接收有关在编码器侧实现的算法的信息,以对于每个基本提升步骤,来确定滤波模式。
MCTF时间合成滤波实现合成滤波。对中间时间等级的帧L和H进行滤波,以通过更新步骤给出前一等级的帧L,至少对该帧L和帧H进行滤波,以通过预测步骤给出该前一等级的另一帧L。例如,当参照图7时,由于使用一个H帧,更新步骤是短滤波,由于使用两个L帧,预测步骤是长滤波。
例如,后滤波电路允许减少诸如块效应之类的伪像。
Claims (6)
1.一种对图像序列的视频数据进行编码的方法,包括实现运动补偿时间滤波的时间分析(1),
所述滤波包括:
预测步骤,用于实现相对于时间等级I的较低时间等级的低频带图像L(7,8;11,12,13)的高通滤波,以得到时间等级I处的高频带图像H(9,14);以及
更新步骤,用于实现相对于时间等级I的相同等级的高频带图像H(9;14,15)和/或相对于时间等级I的较低时间等级的低频带图像L(7,11)的低通滤波,以得到时间等级I处的低频带图像L(10,16),
其特征在于,若图像被分组,至少针对给定步骤,根据所述时间等级,来选择长滤波或短滤波,通过对最低的一个或多个时间等级使用长滤波并对相对于所述最低的一个或多个时间等级较高的时间等级使用短滤波,以获得除了边界图像之外的低频带图像L和/或高频带图像H。
2.如权利要求1所述的方法,其特征在于,长滤波与双向滤波模式相对应,以及短滤波模式与右侧滤波模式、左侧滤波模式、或者无滤波模式相对应。
3.如权利要求1所述的方法,其特征在于,将所述序列构造成帧组或GOF,并且对于给定的时间等级,对于所述预测和/或更新步骤以及对于给定的GOF,为所述GOF中的第一帧选择右侧模式,为所述GOF中的最后一帧选择左侧模式,为其它帧选择双向模式。
4.如权利要求3所述的方法,其特征在于,系统地,在L个时间等级的n个最低时间等级上使用所述双向模式,并且在相对于所述n个最低时间等级的较高时间等级处做出选择。
5.如权利要求1所述的方法,其特征在于,短滤波使用2抽头滤波器,以及长滤波使用5/3滤波器组。
6.一种编码设备,用于根据权利要求1的方法,对视频数据进行编码,所述设备包括时间分析电路(1),用于执行图像的MCTF滤波,
所述滤波包括:
预测步骤,用于实现相对于时间等级I的较低时间等级的低频带图像L(7,8;11,12,13)的高通滤波,以得到时间等级I处的高频带图像H(9,14);以及
更新步骤,用于实现相对于时间等级I的相同等级的高频带图像H(9;14,15)和/或相对于时间等级I的较低时间等级的低频带图像L(7,11)的低通滤波,以得到时间等级I处的低频带图像L(10,16),
其特征在于,所述电路包括:装置,若图像被分组,用于至少针对给定步骤,根据所述时间等级,来选择长滤波或短滤波,通过对最低的一个或多个时间等级使用长滤波并对相对于所述最低的一个或多个时间等级较高的时间等级使用短滤波,以获得除了边界图像之外的低频带图像L和/或高频带图像H。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP04291291A EP1599046A1 (en) | 2004-05-19 | 2004-05-19 | Method for coding video data of a sequence of pictures |
EP04291291.5 | 2004-05-19 | ||
PCT/EP2005/052003 WO2005112466A1 (en) | 2004-05-19 | 2005-05-02 | Method for coding video data of a sequence of pictures |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101002475A CN101002475A (zh) | 2007-07-18 |
CN101002475B true CN101002475B (zh) | 2011-10-19 |
Family
ID=34931117
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2005800156343A Expired - Fee Related CN101002475B (zh) | 2004-05-19 | 2005-05-02 | 图像序列的视频数据编码方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20070248158A1 (zh) |
EP (2) | EP1599046A1 (zh) |
JP (1) | JP5060947B2 (zh) |
CN (1) | CN101002475B (zh) |
WO (1) | WO2005112466A1 (zh) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8340177B2 (en) | 2004-07-12 | 2012-12-25 | Microsoft Corporation | Embedded base layer codec for 3D sub-band coding |
US8442108B2 (en) | 2004-07-12 | 2013-05-14 | Microsoft Corporation | Adaptive updates in motion-compensated temporal filtering |
US8374238B2 (en) | 2004-07-13 | 2013-02-12 | Microsoft Corporation | Spatial scalability in 3D sub-band decoding of SDMCTF-encoded video |
FR2889017A1 (fr) * | 2005-07-19 | 2007-01-26 | France Telecom | Procedes de filtrage, de transmission et de reception de flux video scalables, signal, programmes, serveur, noeud intermediaire et terminal correspondants |
US7956930B2 (en) | 2006-01-06 | 2011-06-07 | Microsoft Corporation | Resampling and picture resizing operations for multi-resolution video coding and decoding |
EP1978744A1 (en) * | 2007-04-04 | 2008-10-08 | Thomson Licensing | Temporal coding/decoding process and coder and decoder associated |
US8953673B2 (en) | 2008-02-29 | 2015-02-10 | Microsoft Corporation | Scalable video coding and decoding with sample bit depth and chroma high-pass residual layers |
US8711948B2 (en) | 2008-03-21 | 2014-04-29 | Microsoft Corporation | Motion-compensated prediction of inter-layer residuals |
WO2010010942A1 (ja) * | 2008-07-25 | 2010-01-28 | ソニー株式会社 | 画像処理装置および方法 |
US9571856B2 (en) | 2008-08-25 | 2017-02-14 | Microsoft Technology Licensing, Llc | Conversion operations in scalable video encoding and decoding |
CN101662678B (zh) * | 2008-08-29 | 2011-08-24 | 华为技术有限公司 | 一种运动补偿时域滤波的方法和装置 |
US8213503B2 (en) | 2008-09-05 | 2012-07-03 | Microsoft Corporation | Skip modes for inter-layer residual video coding and decoding |
TWI463878B (zh) * | 2009-02-19 | 2014-12-01 | Sony Corp | Image processing apparatus and method |
US9159165B2 (en) | 2010-07-13 | 2015-10-13 | Sony Computer Entertainment Inc. | Position-dependent gaming, 3-D controller, and handheld as a remote |
US9814977B2 (en) | 2010-07-13 | 2017-11-14 | Sony Interactive Entertainment Inc. | Supplemental video content on a mobile device |
US8730354B2 (en) | 2010-07-13 | 2014-05-20 | Sony Computer Entertainment Inc | Overlay video content on a mobile device |
US9832441B2 (en) | 2010-07-13 | 2017-11-28 | Sony Interactive Entertainment Inc. | Supplemental content on a mobile device |
US12113969B2 (en) * | 2019-03-11 | 2024-10-08 | Telefonaktiebolaget Lm Ericsson (Publ) | Video coding involving GOP-based temporal filtering |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2088082C (en) * | 1992-02-07 | 1999-01-19 | John Hartung | Dynamic bit allocation for three-dimensional subband video coding |
TW301098B (zh) * | 1993-03-31 | 1997-03-21 | Sony Co Ltd | |
JPH06343171A (ja) * | 1993-03-31 | 1994-12-13 | Sony Corp | 画像符号化方法及び装置 |
US6546143B1 (en) * | 1999-03-12 | 2003-04-08 | Hewlett-Packard Development Company | Efficient wavelet-based compression of large images |
WO2003061294A2 (en) * | 2001-12-28 | 2003-07-24 | Koninklijke Philips Electronics N.V. | Video encoding method |
US7042946B2 (en) * | 2002-04-29 | 2006-05-09 | Koninklijke Philips Electronics N.V. | Wavelet based coding using motion compensated filtering based on both single and multiple reference frames |
US7526025B2 (en) * | 2003-10-24 | 2009-04-28 | Sony Corporation | Lifting-based implementations of orthonormal spatio-temporal transformations |
-
2004
- 2004-05-19 EP EP04291291A patent/EP1599046A1/en not_active Withdrawn
-
2005
- 2005-05-02 US US11/596,963 patent/US20070248158A1/en not_active Abandoned
- 2005-05-02 EP EP05739766A patent/EP1747675A1/en not_active Withdrawn
- 2005-05-02 JP JP2007517232A patent/JP5060947B2/ja not_active Expired - Fee Related
- 2005-05-02 WO PCT/EP2005/052003 patent/WO2005112466A1/en not_active Application Discontinuation
- 2005-05-02 CN CN2005800156343A patent/CN101002475B/zh not_active Expired - Fee Related
Non-Patent Citations (4)
Title |
---|
Golwelkar等.Motion compensated temporal filtering using longer filters.International Organization for Standardisation.2002,全文. * |
Lin Luo等.《Montion compensated lifting wavelet and Its application Invideo coding》.2001IEEE International Conference on Multimedia and Expo.2001,2001第482页右栏第2段-第483页左栏第2段. * |
Lin Luo等.Advance Lifting-Based Montion-Threading(Mth) Techniquefor the 3D wavelet Vdieo Coding.Visual Communications and Image Processing 2003,Proceedings of the SPIE.2003,全文. * |
Yinwei Zhang等.《Long temporal filters In lifting schemes for scalable videocoding》.International Organization For Standardization.2002,第1,2,8页. * |
Also Published As
Publication number | Publication date |
---|---|
JP5060947B2 (ja) | 2012-10-31 |
EP1747675A1 (en) | 2007-01-31 |
JP2007538439A (ja) | 2007-12-27 |
EP1599046A1 (en) | 2005-11-23 |
US20070248158A1 (en) | 2007-10-25 |
CN101002475A (zh) | 2007-07-18 |
WO2005112466A1 (en) | 2005-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101002475B (zh) | 图像序列的视频数据编码方法 | |
JP4587321B2 (ja) | インタレースデジタルビデオデータのスケーラブル符号化および復号化 | |
CN1722838B (zh) | 使用基础层的可伸缩性视频编码方法和设备 | |
KR100664928B1 (ko) | 비디오 코딩 방법 및 장치 | |
RU2329615C2 (ru) | Способ масштабируемого кодирования и декодирования видеосигнала и устройство для его осуществления | |
US20060039472A1 (en) | Methods and apparatus for coding of motion vectors | |
US20030133500A1 (en) | Method and apparatus for subband encoding and decoding | |
EP1835749A1 (en) | Method for coding video data of a sequence of pictures | |
US20030202599A1 (en) | Scalable wavelet based coding using motion compensated temporal filtering based on multiple reference frames | |
US20050163217A1 (en) | Method and apparatus for coding and decoding video bitstream | |
JP2005533425A (ja) | 単一の基準フレームと複数の基準フレームの両者に基づいた動き補償フィルタリングを使用したウェーブレットベースの符号化 | |
CN1878304B (zh) | 编码和解码图像序列的方法和设备 | |
CN102006483B (zh) | 一种视频编解码方法及装置 | |
US20060012680A1 (en) | Drift-free video encoding and decoding method, and corresponding devices | |
WO2003094526A2 (en) | Motion compensated temporal filtering based on multiple reference frames for wavelet coding | |
CN100466735C (zh) | 视频编码和解码方法以及视频编码器和解码器 | |
KR100664930B1 (ko) | 시간적 스케일러빌리티를 지원하는 비디오 코딩 방법 및장치 | |
Mandal et al. | Adaptive multiresolution motion estimation techniques for wavelet-based video coding | |
Wang | Fully scalable video coding using redundant-wavelet multihypothesis and motion-compensated temporal filtering | |
Jabbari | Wavelet-Decomposed Digital Video | |
Heijmans | Motion Compensation and Scalability in Lifting-Based Video Coding | |
Luo et al. | Image embedded coding with edge preservation based on local variance analysis for mobile applications | |
WO2006080665A1 (en) | Video coding method and apparatus | |
JP2006503475A (ja) | ドリフトのないビデオ符号化及び復号化方法、並びに対応する装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20111019 Termination date: 20130502 |