CN1934867A - 采用分级时间分析的图像序列编码和解码方法 - Google Patents

采用分级时间分析的图像序列编码和解码方法 Download PDF

Info

Publication number
CN1934867A
CN1934867A CN200580006545.2A CN200580006545A CN1934867A CN 1934867 A CN1934867 A CN 1934867A CN 200580006545 A CN200580006545 A CN 200580006545A CN 1934867 A CN1934867 A CN 1934867A
Authority
CN
China
Prior art keywords
image
frequency
low
coding
filtering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200580006545.2A
Other languages
English (en)
Other versions
CN1934867B (zh
Inventor
爱德华·弗朗索瓦
纪尧姆·布瓦松
热罗姆·维耶龙
菲利普·罗伯特
格温埃莱·马康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
International Digital Madison Patent Holding SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of CN1934867A publication Critical patent/CN1934867A/zh
Application granted granted Critical
Publication of CN1934867B publication Critical patent/CN1934867B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • H04N19/615Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding using motion compensated temporal filtering [MCTF]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/1883Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • H04N19/647Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission using significance based coding, e.g. Embedded Zerotrees of Wavelets [EZW] or Set Partitioning in Hierarchical Trees [SPIHT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一种方法,实现运动补偿时间滤波(MCTF),如果当前图像与先前图像的相关等级低于阈值,则由帧内模式编码代替时间滤波,来获得至少一幅低频(L)或高频(H)图像,对获得的低频(L)图像进行伸缩,使其在能量等级上与所述运动补偿时间滤波获得的图像相适应,该方法的特征在于,在分析结束时:采用附加条件,选择通过低分解级上的图像帧内编码获得的图像,对于高频图像,所述附加条件是该图像本身是从帧内编码得到的。通过执行至少一个伸缩步骤的逆步骤,来校准所选图像。本应用涉及采用时间预测的视频压缩。

Description

采用分级时间分析的图像序列编码和解码方法
技术领域
本发明涉及一种图像序列的视频编码和解码方法,通过使用运动补偿时间滤波的分级时间分析,对图像序列进行编码。
该范围涉及基于称作“可伸缩”(“scalables”)的空间和/或时间可伸缩性图的视频压缩。例如,这涉及包括运动补偿时间滤波的2D+t小波编码。
背景技术
在诸如MPEG-1、MPEG-2、MPEG-4和h264的混合编码标准中,正如在诸如MC-EZBC(运动补偿嵌入式零块上下文的首字母缩写)的大多数2D+t子带编码图中一样,编码系统的第一步包括:在利用图像内的空间冗余之前,利用连续图像之间的时间冗余。
图1示出了根据现有技术的视频编码器的图。
将视频信号传输到时间分析电路1。运动估计电路2与该第一电路相连,来估计由编码器接收的两幅图像之间的运动。将运动信息以诸如运动矢量场的形式传输到电路1和编码电路6。将电路1的输出发送到空间分析电路3,空间分析电路3从纹理中提取图像的频率系数。然后由熵编码电路4量化并编码这些系数。将已编码的信息和运动信息发送到分组电路或分组器5,分组电路5以视频分组的形式发送视频数据,以组成视频数据流。
时间分析电路1在混合图的情况下执行运动补偿时间预测,或在子带编码图的情况下执行运动补偿时间滤波。采用时间预测的编码算法包括操作运动补偿来产生随后将用在编码过程中的预测图像。这些算法基于相同的原理。根据称作参考图像的一幅或多幅先前已编码图像,来预测要编码的图像。这是在采用预测图像(P)和双向或双预测图像(B)的视频MPEG标准中的情况。预测包括根据这些参考图像和与当前图像相关联的运动矢量来执行运动补偿操作。然后对预测残差,即当前图像与时间预测图像之差,进行编码。例如,利用像素块和对每一块执行的运动补偿来描述运动。
空间分析电路3实现小波分解或离散余弦变换。电路4的熵编码可以是VLC式编码(可变长度编码的首字母缩写)或算术编码。
分组电路的功能是根据空间和时间频率以及大小(诸如位平面编码方法中的权重),将分别来自熵编码电路和运动场编码电路的纹理和运动信息切割成一致的子集。由此获得的二进制流在分辨率、场频和保真度方面都可独立地伸缩。
估计的运动场与源的分辨率相对应。因此,不论是通过滤波还是预测,都对全部分辨率图像执行编码器的运动补偿步骤,然而在解码器中,可以用重新伸缩的运动场对更低分辨率的图像执行运动补偿步骤。
运动补偿时间滤波(首字母缩写为MCTF)的主要目的是产生需要最少编码比特的高频图像H。另一约束是尽可能减少不相连像素,即没有通过运动矢量相连的像素的数量。这两个方面直接取决于运动场的质量。当用于滤波的运动质量较好时,经滤波的信息就更加相关。
在一些情况下,例如,如果运动太复杂、太显著或如果有场景剪辑,则该运动质量不令人满意。因此,这导致高频图像H中的过度能量,以及低频图像L中大量不相连的像素,最终导致高编码成本,以及已解码图像组内的低劣的视觉质量分布。
使用自适应GOP使这个问题得到了考虑。根据不相连像素的百分比,动态地调整GOP的大小。如果在分解级1执行的运动估计期间,图像中不相连像素的总数大于预定阈值,例如在60到75%的量级,则停止时间子带分解。修改初始GOP的大小,使其成为两个GOP,将第一GOP的大小自动强制为21。但是,这种解决方法要求使用可变大小的GOP,并且这种GOP的管理较复杂。
另一解决方法包括在时间分解期间,利用诸如帧内模式编码的其它编码模式。如果有大量不相连像素,则执行帧内编码。但是,接着必须调整图像的动态(dynamic),使其适应通过MCTF滤波获得的图像的动态,从而带来额外的编码成本。这会损害根据MCTF模式编码的图像,从而损害重构图像序列的整体质量。
发明内容
本发明的目的是克服上述缺点。
本发明的一个目的是一种用于编码图像序列的方法,包括:图像组的分级时间分析,执行连续图像对的运动补偿时间滤波,以提供不同时间分解级上的低时间频率图像和高时间频率图像,对于给定的时间分解级和低时间频率图像对,所述分析实现当前图像B到先前参考图像A的运动估计步骤,来提供运动矢量,然后实现这些图像的运动补偿时间滤波,来提供更高分解级上的低时间频率图像(L)和高时间频率图像(H),如果当前图像与先前图像的相关等级低于阈值,则由帧内模式编码代替所述时间滤波,来获得至少一幅低频(L)或高频(H)图像,对这样获得的低频(L)图像进行伸缩,使其在能量等级上与通过所述运动补偿时间滤波所获得的图像相适应,该方法的特征在于,在分析结束时,从获得的低频图像和最终高频分解图像中:
-采用附加条件,选择通过更低分解级上的图像帧内编码获得的图像,对于高频图像,所述附加条件是所述图像本身是从帧内编码得到的。
-通过执行至少一个伸缩步骤的逆步骤,来校准(calibrate)所选图像。
如果逆步骤涉及高频的所选图像,则逆步骤的执行次数与达到所选图像所需要的低频图像(L)的连续帧内编码操作的次数相对应,如果逆步骤涉及低频的所选图像(L),则将该次数加1。
根据特定实施例,对于低频L或高频H图像的计算,本方法包括:如果当前图像与先前图像之间的相关低于阈值,并且当前图像与随后图像之间的相关大于阈值,则执行当前图像与随后图像对中的随后图像之间的时间滤波,通过帧内编码获得另一幅H或L图像,并且对于选择步骤,该滤波操作与帧内编码相似,而不与时间滤波相似。
根据特定实施例,本方法为图像组的每一幅图像分配图像编号,并在分解期间,通过将每个编号看作计数器,来监控这些已编号的图像,在每一步如下更新计数器,
-每次以帧内模式获得低频图像(L)时,计数器增加,
-每次以帧内模式或在利用随后图像的时间滤波期间获得高频图像(H)时,计数器保持不变,
-每次通过利用先前图像的运动补偿时间滤波获得图像时,计数器复位。
本发明还涉及一种根据上述方法编码的图像序列的解码过程,其特征在于,该解码过程执行要解码的所选图像的逆校准步骤,图像的选择和逆步骤的次数取决于与要解码的图像相关联的信息。例如,该信息是在编码期间分配给图像的计数器的值。
本发明还涉及一种实现所述方法的编码器,包括采用运动补偿时间滤波和帧内编码的时间分析电路,其特征在于,在分析结束时,所述电路采用附加条件,从获得的低频图像和最终高频分解图像中,选择通过更低分解级上的图像帧内编码或通过更低分解级上当前图像与随后图像之间的时间滤波所获得的图像,对于高频图像,所述附加条件是该图像本身是从帧内编码得到的,所述解码器的特征还在于,针对所选图像,执行至少一个伸缩步骤。
本发明还涉及一种用于对根据权利要求1的方法编码的图像序列进行解码的解码器,包括时间合成电路,其特征在于该电路包括用于执行要解码的图像的逆校准的装置,图像的选择和逆校准的次数取决于与要解码的图像相关联的、由解码器接收的信息项。
由于帧内类型图像的逆伸缩操作,根据MCTF模式编码的图像不再处于不利地位。包括以帧内模式或根据MCTF模式编码的帧内图像的整个GOP上的图像质量分布得到了改善。发送给解码器的编码模式信息使得可以重新校准帧内图像,以执行图像的合成。
以有条件的方式执行时间滤波,根据运动质量,可以将时间子带分解执行到最末一级。不管运动质量如何,保持了GOP结构。即使GOP的中间发生场景剪辑,GOP的大小也可以保持恒定,方便了对比特率和处理的管理。如果使用可变大小的GOP,则会改进图像质量。
附图说明
其它特定特征和优点将在以下描述中更加清楚地显现,该描述被提供作为非限制性示例,并参考以下附图:
-图1,根据现有技术的编码图,
-图2,16幅图像的GOP的运动补偿时间滤波,
-图3,编码电路,
-图4,编码流程图,
-图5,解码电路。
具体实施方式
图2概括地示出了针对本示例中包括粗线所示的16幅图像的GOP的4级分解、由时间分析电路4执行的运动补偿时间滤波操作。
所用的滤波模式称作“提升”(“lifting”)。在本示例中,使用较长长度的线性滤波器代替小波编码中的复杂滤波,将对一组16幅图像执行滤波,已知的是,该滤波方法包括,使用有限长度滤波器对该滤波器进行因式分解(factorise),例如,如果决定每两个两个地滤波采样,则使用两个有限长度滤波器,对于每个分解级,更新该滤波操作。因此,考虑在图像对上执行沿运动方向的滤波操作的情况。在第一时间分解级,对每一个GOP对的低频和高频滤波操作分别产生8幅低时间频率图像(t-L)和8幅高时间频率图像(t-H)。
接着,根据相同方法,再次分解低时间频率图像。这些图像的低通滤波提供4幅新的低时间频率图像t-LL,这些相同图像的高通滤波提供4幅新的高时间频率图像t-LH。第三分解级提供2幅低时间频率图像t-LLL和2幅高时间频率图像t-LLH。第四级且是最末一级提供一幅低时间频率图像t-LLLL和一幅高时间频率图像t-LLLH。
该时间分解是5频带时间分解,所以对于每一个16幅图像的GOP,产生1幅t-LLLL图像、1幅t-LLLH图像、2幅t-LLH图像、4幅t-LH图像和8幅t-H图像。因为t-L、t-LL、t-LLL图像和原始图像是用于在每一级提供去相关图像的子带分解的源图像,所以对于下游(downstream)编码,忽略这些图像。因此,该分解通过产生具有低时间频率t-LLLL的有用图像,来获得表示GOP集合的平均的新能量分布,其中集中了低能量高时间频率图像的能量和四个图像等级,即,5个频带。将这些图像发送给空间分析电路,用于空间分解为子带。
为执行滤波,对于每一级,估计要滤波的每一对图像之间的运动场。这是运动估计器7的功能。
在实际中,只计算从A到B或从B到A的运动矢量场。根据第一个运动矢量场推断出另一个运动矢量场,产生不相连像素,即未分配运动矢量的、与逆运动矢量场中的孔洞(hole)相对应的像素。
对每一个原始GOP图像对执行滤波操作,获得第一级时间分辨率。对低时间频带的结果图像重复该过程多次,以获得随后的时间分辨率等级。对于16幅图像的GOP,该过程产生8个时间频带,称作L、H、LL、LH、LLL、LLH、LLLL和LLLH。
如上所示,不相连像素问题导致时间滤波期间更差的去相关,从而导致更差的数据压缩。这会发生在执行运动估计操作的每一个GOP分解级处。
根据本发明的一个实施例,实现模式切换电路来控制时间分析,电路由运动估计的相关性控制。这可以处理在运动估计操作期间得到大量不相连像素的情况。
图4示出了具有这种电路的设备。使用相同参考数字来指定与图1相似的电路,并不再描述这些电路。
将来自运动估计电路(参考数字2)的运动信息发送到模式切换电路(参考数字7)。该电路与时间分析电路1相连,以向其发送运动信息和与要用的编码模式有关的信息。
图4示出了针对切换电路操作而实现的算法的简化流程图。
在参考数字为7的步骤中,给定时间分解级的两幅连续图像A和B可用。例如,从图像B向图像A来估计运动,因此,图像A是参考图像。参考数字为8的步骤估计图像B到图像A的运动。后一步骤9计算参考图像A中,不相连像素,即,未分配运动矢量的像素数目,相对于图像像素数目的百分比P1。参考数字为10的后一步骤比较百分比P1和阈值S1,阈值是预定值,例如,该值是在20到25%量级的百分比。
如果不相连像素数目少于或等于该值,则认为运动矢量场正确,下一步骤是步骤11,步骤11执行标准滤波操作。
因此,如下计算低频和高频图像:
H = B - MC A ← B ( A ) 2 L = 2 . A + MC A ← B - 1 ( H )
该滤波(与所述滤波等效)包括首先计算图像H。从图像B与运动补偿图像A之间的点对点之差获得该图像。因此,从像素B去除(必要时插入)特定值,该特定值是由A中的位移矢量(即在从图像B到图像A的运动估计期间计算的运动矢量)指出。
接着通过将图像A加到逆运动补偿图像H上,根据图像H,而不再是图像B,来推断图像L。MCA←B -1(H)与图像(H)的运动“去补偿”相对应。因此,向A的像素加上(必要时插入)特定值,该特定值位于图像H中,并基于从B到A的、指向A像素的位移矢量。
如果不相连像素的百分比大于阈值S1,则认为运动矢量场不相关,步骤10之后是步骤12。
在所处理的时间级上,如果图像B之后有图像C,并在步骤12经过测试,则该图像C变成可能的新的参考图像,并在步骤13估计从图像B到图像C的运动。
如果在所处理的当前级上,图像B之后没有图像,则步骤12之后是步骤17。该步骤采用针对图像A的合适的伸缩因子,以帧内模式对图像B和A进行编码。
H = B L = 2 . A
步骤13之后的步骤14针对在B和C之间计算的运动矢量场,计算图像C中不相连像素的百分比P2。
随后的步骤15比较百分比P2与阈值S2,该阈值是预定值。例如,该值是在20到25%量级的百分比。
如果不相连像素数少于或等于该值,则认为运动矢量场正确,下一步骤是步骤16,该步骤利用图像C来执行标准滤波操作。这是后向预测模式。因此,如下计算低频和高频图像:
H = B - MC B → C ( C ) 2 L = 2 . A
因此,在图像L中找到图像A的信息,并通过在以后的滤波中参考这一点,而不是简单地选择图像B或从先前不相关图像中滤波得到图像H,来减小图像H的能量。因此,得到了低能量的高频图像。
如果不相连像素的百分比低于阈值S2,则步骤12之后是步骤17。如MCTF模式或先前的后向预测模式一样,步骤17采用针对图像A的合适的伸缩因子,以帧内模式对图像B和A进行编码。
H = B L = 2 . A
这自然是可逆的,可逆操作包括将图像A作为高频图像(H=A),将图像B作为低频图像。例如,可以为L选择具有最小能量的图像。
因此,步骤11、16和17是由模式切换电路确定的编码模式,将该信息发送到时间分析电路。
这里,针对整个图像执行模式选择。正如想得到的一样,针对图像的每一块或宏块来执行模式选择。
由于MC提升滤波,称作伸缩因子的项与例如由MCTF滤波得到的“真实”图像L相关。该伸缩因子也是归属于图像A的帧内模式编码,它使得在图像等级上获得相同的能量值,目的是要使下一时间级的运动估计期间的匹配更方便,因此,图像在能量上都是一致的。
不管运动矢量场的相关性,也不管模式,针对给定时间级的每一个图像对,以及直到GOP的时间金字塔顶端的每一个时间级,实现上述的基本滤波阶段。这意味着可能不会受错误场景剪辑的影响,例如,错误场景剪辑与摄像机的快速运动相对应,暴露了一直隐藏到该剪辑时刻的区域。
在处理的最后,对已经在给定分解级以帧内模式编码、并未在随后时间分解级上用作MCTF模式和后向预测模式的参考图像或预测图像的图像A和B进行重新伸缩,来匹配最末一级,对于最末一级,其像素已用于这些模式:
F i ′ = F i / 2 n ( fi )
Fi是从图像A和B的滤波得到的图像L或H,F’i是重新伸缩的图像。
通过以下公式,根据模式来给定应用于伸缩因子的指数n:
-MCTF模式
n ( L ) = 0 n ( H ) = 0
-预测模式或帧内编码模式:
n ( L ) = n ( A ) + 1 n ( H ) = n ( B )
因此,对于给定分解级上的图像L或H,根据归属于先前分解级上的图像A或图像B的n值,计算n值,并分别用于L或H的计算。
因此,如果根据MCTF模式来处理图A和B,以给出图像L和H,则不论其等级n(A)和n(B),都将归属于图像L和H的等级n强制为零。
如果使用预测或帧内模式来从分配了等级n(A)和n(B)的图像A和B获得图像L和H,则图像L的等级是n(A)加上1,而图像H的等级是图像B的等级,即n(B)。
参考图2,如果考虑在GOP的第四幅图像之后的场景剪辑引起在第三分解级上对两幅图像t-LLL第一次执行帧内编码,则在第四级且是最末一级,对于图像t-LLLL,n(L)值等于2,对于图像t-LLLH,n(H)值等于1。因此,通过将图像t-LLLL除以伸缩因子两次,来找到与最末一级相对应的图像t-LL,在最末一级,该图像用于MCTF模式。
可以给GOP的每一幅原始图像分配编号。接着将编号分配给已分解的图像,用编号为t的图像B对编号为s的图像A进行滤波,得到编号为s的低频图像L以及编号为t的高频图像H,L对应于A,H对应于B。例如,等级图像t-LLLL、t-LLLH和t-LLH获得的编号是1、9、5和13。对于每一个分解级,已编号图像i的n的计算包括,在图像i经过帧内或预测编码以给出低频图像L的情况下,增加分配给前一级图像i的等级n。如果该图像经过帧内或预测编码,给出高频图像H,则计数器保持不变。如果该图像经过MCTF编码,则复位归属于GOP的每一幅原始图像的值n。在每一分解级执行该计算,直到最末一级。
实际上,归属于已分解图像的值n与以下值相对应:
-对于通过MCTF滤波获得的最终图像,与零相对应,
-对于通过帧内编码获得的最终低频图像,与在相同编号的图像上实现的、产生该低频图像的帧内编码操作的次数加上1相对应,
-对于通过帧内编码获得的高频图像,与在相同编号的图像上实现的、产生该高频图像的连续帧内编码操作的次数相对应,
-对于从后一图像的时间滤波获得的高频图像,与在相同编号的图像上实现的、产生该时间滤波的目标图像的连续帧内编码操作的次数加上1相对应。
最后的重新伸缩步骤的目的是通过减小图像的权重来校准已变换图像的动态,该动态不是“真实的”时间子带,即,通过MCTF滤波获得的子带图像。
被校准的子带图像不是用于合成两幅图像A和B的图像,从而减小了其成本。
比特率分配由分组器5实现。时间变换的正交性和归一化是使不同图像之间的比特率分配成为最优的必需点。在实现诸如后向预测模式或帧内编码模式的其它模式时,在标准化MCTF滤波期间自然而然实现的过程可能成为问题。在编码步骤,如果以帧内或预测模式,通过将图像A乘以伸缩因子来达到时间级的动态,而获得低频图像,即,获得与通过MCTF滤波获得的图像相同能量的图像,则在比特分配级,不再需要该加权操作。相反,通过诸如给以帧内或预测模式编码的图像更小的权重,来特别关注通过MCTF滤波获得的“真实的”低频图像,即有关的参考图像。的确,如上所述,在解码器中,根据分级金字塔,使用真实的低频图像来重构较低分解级上的图像A和B,B是A的函数,而对于以帧内或预测模式编码的图像,就不是这种情况了。
本发明还涉及一种使用根据上述方法编码的数据的解码器。图5表示这种编码器。
将与根据这里所述的方法编码的图像相对应的二进制流发送到解码器输入。将其并行地发送到熵解码电路18的输入和运动解码电路19的输入。熵解码电路与空间合成电路20和时间合成电路21依次串连。时间合成电路21从运动解码电路接收运动信息。时间合成电路的输出与后滤波电路22的输入相连,后滤波电路22的输出是解码器的输出。
因此,熵解码电路18处理比特流,执行熵编码电路的逆操作,并解码空间时间小波系数和滤波模式。
运动解码电路19恢复并解码来自比特流的与运动有关的信息,从而向电路21发送时间合成所需的运动场。
空间合成电路20重构与不同时间子带相对应的图像。然后根据合适的伸缩因子伸缩已重构的子带图像,以执行时间合成。根据向编码器发送的、与原始GOP分解期间所用的图像有关的模式信息,来执行该伸缩操作,从而能够向不同图像分配n值。
F i = F i ′ . 2 n ( F i )
接着,时间合成电路21根据图像的模式,对已变换的图像进行重构,直到所需的时间级:
-MCTF模式
A = L - MC A ← B - 1 ( H ) 2 B = 2 . H + MC A ← B ( A )
-后向预测模式
A = L / 2 B = 2 . H + MC B → C ( C )
-帧内编码模式
A = L / 2 B = H
运动补偿所需的运动信息来自运动解码电路。时间合成根据分配给要解码的图像的编码模式信息,执行解码操作。
因此,根据时间小波系数,在电路21输出重构了图像。后滤波电路22实施最终的后处理步骤,即对图像执行滤波,以减少块效应类型的伪象。
在20到25%的量级,选择用于确定切换模式的百分比P1和/或P2。从经验获得该百分比,当然可以将其它值用于切换过程的实现。
可以通过简化或删除(prune)通过运动估计计算的运动矢量场,来获得用于图像对的时间滤波的运动,从而能够限制运动编码成本。
本发明的变体包括将自适应GOP结构与上述方法相组合。GOP的大小是可变的,取决于诸如序列中的运动之类的参数。
本发明还适用于混合类型和子带编码类型的时间分析电路。
本发明的应用涉及采用时间预测的视频压缩。

Claims (12)

1.一种用于编码图像序列的方法,包括:图像组的分级时间分析(1),执行连续图像对的运动补偿时间滤波(11),以提供不同的时间分解级上的低时间频率图像和高时间频率图像,对于给定的时间分解级和低时间频率图像对,所述分析实现当前图像B到先前参考图像A的运动估计步骤(8),来提供运动矢量,然后实现这些图像的运动补偿时间滤波(11),来提供更高分解级上的低时间频率图像(L)和高时间频率图像(H),如果当前图像与先前图像的相关等级低于阈值(10,15),则由帧内模式编码代替所述时间滤波(16,17),来获得至少一幅低频(L)或高频(H)图像,对这样获得的低频(L)图像进行伸缩,使其在能量等级上与所述运动补偿时间滤波获得的图像相适应,该方法的特征在于,在分析结束时,从获得的低频图像和最终高频分解图像中:
-采用附加条件,选择通过更低分解级上的图像帧内编码获得的图像,对于高频图像,所述附加条件是所述图像本身是从帧内编码得到的。
-通过执行至少一个伸缩步骤的逆步骤,来校准所选图像。
2.根据权利要求1所述的方法,其特征在于,如果逆步骤涉及高频的所选图像,则逆步骤的执行次数与达到所选图像所需要的低频图像(L)的连续帧内编码操作的次数相对应,如果逆步骤涉及低频的所选图像(L),则将所述次数加1。
3.根据权利要求2所述的方法,其特征在于,所述方法包括:对于低频L或高频H图像的计算,如果当前图像与先前图像之间的相关低于阈值(10),并且当前图像与随后图像之间的相关大于阈值(15),则执行当前图像与随后图像对中的随后图像之间的时间滤波(16),通过帧内编码获得另一幅H或L图像(16),以及,对于选择步骤,所述滤波操作与帧内编码相似,而不与时间滤波相似。
4.根据权利要求3所述的方法,其特征在于,所述方法为图像组的每一幅图像分配图像编号,并在分解期间,通过将每个编号看作计数器,来监控已编号的图像,在每一步如下更新计数器:
-每次以帧内模式获得低频图像(L)时,计数器增加,
-每次以帧内模式或在利用随后图像的时间滤波期间获得高频图像(H)时,计数器保持不变,
-每次通过利用先前图像的运动补偿时间滤波获得图像时,计数器复位。
5.根据权利要求1所述的方法,其特征在于,在两幅连续图像A和B的运动补偿时间滤波期间,从以下操作来获得高频图像H和低频图像L:
A = L - M C A ← B ( H ) 2 B = 2 . H + MC A ← B - 1 ( A )
MC与图像H的、根据B到A的运动矢量场的运动补偿相对应。
6.根据权利要求5所述的方法,其特征在于,根据以下公式,通过帧内编码获得图像L和H
H = B L = 2 . A
以及,根据以下公式,通过利用随后图像进行滤波来获得图像H,并通过帧内编码获得图像L:
H = B - MC B → C ( C ) 2 L = 2 . A
MC与图像C的、根据B到C的运动矢量场的运动补偿相对应。
7.根据权利要求1所述的方法,其特征在于,采用空间分析(3)来处理通过时间分析(1)获得的被校准的图像。
8.根据权利要求1所述的方法,其特征在于,通过考虑相连像素的数量来计算相关等级,其中相连是指通过运动矢量相连。
9.一种对根据权利要求1所述的过程编码的图像序列进行解码的方法,其特征在于,所述解码方法执行要解码的所选图像的逆校准步骤(21),图像的选择和逆步骤的次数取决于与要解码的图像相关联的信息单元。
10.一种对根据权利要求4所述的过程编码的图像序列进行解码的方法,其特征在于,所述解码方法执行要解码的所选图像的逆校准步骤(21),图像的选择和逆步骤的次数是在编码期间分配给图像的计数器的值的函数。
11.一种用于实现根据权利要求3所述的方法的编码器,包括采用运动补偿时间滤波和帧内编码的时间分析电路(1),其特征在于,在分析结束时,从获得的低频图像和最终高频分解图像中,所述电路采用附加条件,选择通过更低分解级上的图像帧内编码、或在更低分解级上通过图像对的图像与随后图像对的随后图像之间的时间滤波获得的图像,对于高频图像,所述附加条件是所述图像本身是从帧内编码得到的,以及,针对所选图像,执行至少一个伸缩步骤的逆步骤。
12.一种用于对根据权利要求1所述的方法的图像序列进行解码的解码器,包括时间合成电路(21),其特征在于,所述电路包括用于执行要解码的图像的逆校准的装置,图像的选择和逆校准的次数取决于与要解码的图像相关联的、由解码器接收的信息单元。
CN200580006545.2A 2004-03-02 2005-02-21 采用分级时间分析的图像序列编码和解码方法 Active CN1934867B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0450420A FR2867329A1 (fr) 2004-03-02 2004-03-02 Procede de codage d'une sequence d'images par analyse temporelle hierarchique.
FR0450420 2004-03-02
PCT/FR2005/050109 WO2005086489A1 (fr) 2004-03-02 2005-02-21 Procede de codage et de decodage d'une sequence d'images par analyse temporelle hierarchique

Publications (2)

Publication Number Publication Date
CN1934867A true CN1934867A (zh) 2007-03-21
CN1934867B CN1934867B (zh) 2010-10-27

Family

ID=34855194

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200580006545.2A Active CN1934867B (zh) 2004-03-02 2005-02-21 采用分级时间分析的图像序列编码和解码方法

Country Status (6)

Country Link
US (1) US8175153B2 (zh)
EP (1) EP1721470B1 (zh)
JP (1) JP2007526704A (zh)
CN (1) CN1934867B (zh)
FR (1) FR2867329A1 (zh)
WO (1) WO2005086489A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114302137A (zh) * 2021-12-23 2022-04-08 北京达佳互联信息技术有限公司 用于视频的时域滤波方法、装置、存储介质及电子设备
CN115002482A (zh) * 2022-04-27 2022-09-02 电子科技大学 使用结构性保持运动估计的端到端视频压缩方法及系统
WO2022206928A1 (en) * 2021-04-01 2022-10-06 Beijing Bytedance Network Technology Co., Ltd. Method, device, and medium for video processing

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7974342B2 (en) * 2003-07-08 2011-07-05 Trident Microsystems (Far East) Ltd. Motion-compensated image signal interpolation using a weighted median filter
US9872017B2 (en) * 2011-03-09 2018-01-16 Siemens Aktiengesellschaft Method for coding a sequence of digitized images
WO2013049412A2 (en) 2011-09-29 2013-04-04 Dolby Laboratories Licensing Corporation Reduced complexity motion compensated temporal processing
WO2016138265A1 (en) * 2015-02-25 2016-09-01 Global Ionics LLC Ionic devices
US10068138B2 (en) 2015-09-17 2018-09-04 Canon Kabushiki Kaisha Devices, systems, and methods for generating a temporal-adaptive representation for video-event classification
US10319573B2 (en) 2017-01-26 2019-06-11 Protein Metrics Inc. Methods and apparatuses for determining the intact mass of large molecules from mass spectrographic data
US11626274B2 (en) 2017-08-01 2023-04-11 Protein Metrics, Llc Interactive analysis of mass spectrometry data including peak selection and dynamic labeling
US10510521B2 (en) 2017-09-29 2019-12-17 Protein Metrics Inc. Interactive analysis of mass spectrometry data
US11640901B2 (en) 2018-09-05 2023-05-02 Protein Metrics, Llc Methods and apparatuses for deconvolution of mass spectrometry data
US11346844B2 (en) 2019-04-26 2022-05-31 Protein Metrics Inc. Intact mass reconstruction from peptide level data and facilitated comparison with experimental intact observation
EP4204948A1 (en) 2020-08-31 2023-07-05 Protein Metrics, LLC Data compression for multidimensional time series data

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5235420A (en) * 1991-03-22 1993-08-10 Bell Communications Research, Inc. Multilayer universal video coder
US6873734B1 (en) * 1994-09-21 2005-03-29 Ricoh Company Ltd Method and apparatus for compression using reversible wavelet transforms and an embedded codestream
EP1114555A1 (en) * 1999-07-20 2001-07-11 Koninklijke Philips Electronics N.V. Encoding method for the compression of a video sequence
US7042946B2 (en) * 2002-04-29 2006-05-09 Koninklijke Philips Electronics N.V. Wavelet based coding using motion compensated filtering based on both single and multiple reference frames
US20040008785A1 (en) * 2002-07-15 2004-01-15 Koninklijke Philips Electronics N.V. L-frames with both filtered and unfilterd regions for motion comensated temporal filtering in wavelet based coding
US7321625B2 (en) * 2002-12-13 2008-01-22 Ntt Docomo, Inc. Wavelet based multiresolution video representation with spatially scalable motion vectors

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022206928A1 (en) * 2021-04-01 2022-10-06 Beijing Bytedance Network Technology Co., Ltd. Method, device, and medium for video processing
CN114302137A (zh) * 2021-12-23 2022-04-08 北京达佳互联信息技术有限公司 用于视频的时域滤波方法、装置、存储介质及电子设备
CN114302137B (zh) * 2021-12-23 2023-12-19 北京达佳互联信息技术有限公司 用于视频的时域滤波方法、装置、存储介质及电子设备
CN115002482A (zh) * 2022-04-27 2022-09-02 电子科技大学 使用结构性保持运动估计的端到端视频压缩方法及系统
CN115002482B (zh) * 2022-04-27 2024-04-16 电子科技大学 使用结构性保持运动估计的端到端视频压缩方法及系统

Also Published As

Publication number Publication date
US8175153B2 (en) 2012-05-08
US20080025394A1 (en) 2008-01-31
FR2867329A1 (fr) 2005-09-09
JP2007526704A (ja) 2007-09-13
EP1721470A1 (fr) 2006-11-15
WO2005086489A1 (fr) 2005-09-15
EP1721470B1 (fr) 2015-01-14
CN1934867B (zh) 2010-10-27

Similar Documents

Publication Publication Date Title
CN1934867A (zh) 采用分级时间分析的图像序列编码和解码方法
JP5290325B2 (ja) Cabacコーダのためのレート歪みモデリングに基づいた量子化
TWI492634B (zh) 根據內容調適性二進制算數寫碼之寫碼器之二遍量化
CN1189038C (zh) 嵌入的离散余弦变换式静止图像编码算法
CN105491389B (zh) 用于实施用于媒体编码的4x4变换的设备
CN1722836A (zh) 视频编码和解码方法以及视频编码器和解码器
CN101039419A (zh) 用于对图像序列的视频数据进行编码的方法
CN1794815A (zh) 产生对图像或图像序列进行编码的量化矩阵的方法和设备
CN101036388A (zh) 对混合比特流进行预解码的方法和设备
CN1949877A (zh) 自适应量化控制器及其方法
Xing et al. Arbitrarily shaped video-object coding by wavelet
CN1698383A (zh) 用于对细粒度可扩缩编码的视频进行代码转换的方法
CN102625102A (zh) 一种面向h.264/svc mgs编码的率失真模式选择方法
CN102007769A (zh) 用于视频编码中的速率控制的死区参数选择
CN1595986A (zh) 用于三维子带视频编码的方法和设备
CN1878304B (zh) 编码和解码图像序列的方法和设备
Xiong et al. Barbell-lifting based 3-D wavelet coding scheme
CN1211146A (zh) 图象压缩
CN1914926A (zh) 运动图像编码方法和设备以及运动图像解码方法和设备
CN1757238A (zh) 考虑与运动矢量的分量相关的部分来编码视频图像的方法
Taieb et al. Spatial correlation-based side information refinement for distributed video coding
KR101421231B1 (ko) 웨이블릿 변환을 이용한 영상 압축 장치
CN1722839A (zh) 视频编码和解码方法以及视频编码器和解码器
Park et al. A 3D-DCT video encoder using advanced coding techniques for low power mobile device
Liu Research on image compression algorithm based on SPHIT

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: I Si Eli Murli Nor, France

Patentee after: THOMSON LICENSING

Address before: French Boulogne

Patentee before: THOMSON LICENSING

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190130

Address after: Paris France

Patentee after: International Digital Madison Patent Holding Co.

Address before: I Si Eli Murli Nor, France

Patentee before: THOMSON LICENSING

Effective date of registration: 20190130

Address after: I Si Eli Murli Nor, France

Patentee after: THOMSON LICENSING

Address before: I Si Eli Murli Nor, France

Patentee before: THOMSON LICENSING