CN1678073B - 用于可伸缩视频编码的方向自适应可伸缩运动参数编码 - Google Patents

用于可伸缩视频编码的方向自适应可伸缩运动参数编码 Download PDF

Info

Publication number
CN1678073B
CN1678073B CN2005100588974A CN200510058897A CN1678073B CN 1678073 B CN1678073 B CN 1678073B CN 2005100588974 A CN2005100588974 A CN 2005100588974A CN 200510058897 A CN200510058897 A CN 200510058897A CN 1678073 B CN1678073 B CN 1678073B
Authority
CN
China
Prior art keywords
bit
motion
motion vector
component
rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2005100588974A
Other languages
English (en)
Other versions
CN1678073A (zh
Inventor
安德鲁·塞克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of CN1678073A publication Critical patent/CN1678073A/zh
Application granted granted Critical
Publication of CN1678073B publication Critical patent/CN1678073B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/62Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding by frequency transforming in three dimensions

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一种运动图像数据编码方法,特别地,利用运动补偿3-D子带编码的运动图像数据编码方法,其中相对于由运动补偿得到的运动矢量的第二分量单独地或者独立地对该运动矢量的第一分量进行可伸缩编码,包括对于第一和第二运动矢量分量进行单独的比特率分配。

Description

用于可伸缩视频编码的方向自适应可伸缩运动参数编码 
技术领域
本发明涉及用于对图像序列形式的运动图像数据进行编码的方法和装置。本发明特别涉及包括空间和时间滤波以及运动补偿的3D子带编码,以及运动矢量的编码。 
背景技术
在互联网等的异构通信网络中,高效的视频通信必须提供宽范围的传输约束和视频显示参数。在同一网络上的不同用户之间信道带宽经常会变化几个数量级。另外,随着网络互联的快速发展趋势,移动电话、手持个人数字助理和台式工作站等的各具有不同显示分辨率和处理能力的设备可能会访问相同的数字媒体内容。 
可伸缩(scalable)视频编码旨在通过压缩原始视频内容,使得同时支持多种不同比特率和显示分辨率的有效重构,从而应对不同的视频通信网络和终端用户的兴趣。比特率可伸缩性是指在不损失压缩效率的情况下在精细划分的比特率范围上重构压缩视频的能力。这使得多个用户可以访问一个压缩比特流,每个用户利用他/她所有的可用带宽。如果没有比特率可伸缩性,则需要在网络上提供同一视频数据的多个版本,这显著地增加了存储和传输的负担。可伸缩性的其它重要形式包括空间分辨率和帧频(时间分辨率)可伸缩性。这些使得可以在不同的显示分辨率下有效地重构压缩视频,从而适应所有类型的终端用户设备的性能。在D.Taubman,“Successive refinement of video:fundamental issues,past efforts and new directions”,Int.Sym.Visual Comm.ImageProc.July 2003中,介绍了可伸缩视频压缩领域中当前的推动因素,过去的实践以及未来的趋势。 
近年来,随着几个重要的发现,可伸缩视频编码的研究得到了越来 越多的关注。具体而言,一种新的构建高效前馈压缩系统的架构与先前的方案相比具有显著的优势。实际上,可伸缩视频编码器终于开始实现可以与现有的不可伸缩编码方法相比的压缩性能,然而具有所有的上述这些理想的可伸缩特征。这些新的方案称为“运动补偿提升(motion-compensated lifting)”方案,最初是由Secker和Taubman(A.Secker and D.Taubman,“Lifting-based invertable motionadaptive transform (LIMAT) framework for highly scalable videocompression”,IEEE Trans. Image Proc.Dec 2003)和Pesquet-Popescu等(B.  Pesquet-Popescu and V.  Bottreau,“Three-dimensionallifting schemes for motion compensated video compression”,IEEEInt. Conf. Acoustics,Speech Signal Proc.,pp1 793-1796,Dec 2001)同时提出的。 
运动补偿提升方案使得可以对视频数据应用高效的基于小波的时间变换,而不会牺牲压缩系统逆转能力。小波时间变换把原始视频帧变换为时间“子带(subband)”帧的集合。可逆变换特别重要,因为它们使得在有足够带宽的情况下可以完美地重构视频。使用与可伸缩图像压缩中使用的基本上相同的技术对时间子带帧进行处理。这些目前已经基本上成熟的技术(在最近的JPEG2000图像压缩标准中达到顶点)包括J.Shapiro,“Embedded image coding using zerotrees of waveletcoefficients”,IEEE Trans.Signal Proc.,vol 41,pp 3445-3462,Dec.1993,D.Taubman and A.Zakhor,“Multi-rate 3-d subbandcoding of video”,IEEE Trans.Image Proc.,vol.3,pp.572-588,Sept 1994,A.Said and W.Pearlman,“A new,fast and efficientimage codec based on set partitioning in hierarchical trees”,IEEETrans.Circ.Sys.Video Tech.,pp.243-250,June 1996,and D.Taubman,E.Ordentlich,M.Weinberger and G.Seroussi,“EmbeddedBlock Coding in JPEG2000”,Signal Processing-Image Communication,vol.17,No.1,pp.49-72,Jan 2002中所介绍的。还可参照本申请人的未授权申请EP03255624.3(P047),在此以引用的方式并入这些内容。 
运动补偿提升变换的高压缩性能的关键在于其非常有效地开发运动的能力,以及其适应于任何运动模型的能力。在文献中提出了大量的运动模型,任何一种模型都可以引入到提升变换架构中。提出了多种方法以对使用参数化运动模型而得到的边信息(side information)进行表达和编码。但是,通常边信息的量很大,并且通常进行无损的编码,这会显著地降低完全压缩系统的比特率可伸缩性。 
为了在很宽范围的比特率(从几千比特/秒(kbps)到几兆比特/秒(Mbps))上实现比特率可伸缩性,运动信息的表达精度也必须是可伸缩的。如果没有运动可伸缩性,则在低比特率下运动参数的编码成本会消耗过多的可用带宽。相反,在高比特率下无法以足够的精度表达运动从而实现最大的编码增益。还需注意,运动信息处理精度的伸缩能力是时间可伸缩性的一个自然延伸。这是因为细化重构视频序列的时间信息不仅要涉及到细化时间采样率,还要涉及到利用运动自适应时间合成滤波器阵对这些时间采样进行插值的精度。 
Secker和Taubman最近在将于IEEE Trans.Image Proc中发表的A.Secker and D.Taubman,“Highly scalable video compression withscalable motion coding”中讨论了可伸缩运动编码,也在作者的网站www.ee.unsw.edu.au/~taubman/中公布。在这个论文中他们提供了一种用于压缩和联合伸缩运动参数和视频采样的新颖的架构。他们的方法涉及利用与时间子带帧编码中使用的类似的可伸缩图像编码技术对与运动补偿提升变换相关的运动参数进行压缩。 
Secker和Taubman的工作涉及两个主要的贡献。首先,他们描述了运动信息的可伸缩压缩方法,其次,他们提供了一种在视频帧编码花费的比特和运动参数编码花费的比特之间达到最佳平衡的架构。部分地,可伸缩运动编码方法涉及按照与传统的可伸缩图像编码系统中处理标量图像采样的相同方式处理各个运动矢量分量。运动信息通常包括二维矢量的二维数组(对应于视频帧之间的垂直和水平位移)。通过提取垂直和水平运动分量,并将它们排列成二维标量场,可以把它们压缩为标量图像。虽然对标量运动分量场进行空间小波变换,但是把所得到的变换运 动分量重新组合成矢量,并联合地进行嵌入式量化和编码。这使得嵌入式编码级可以利用变换后的运动矢量分量之间的冗余。不光Secker和Taubman的可伸缩运动编码方案受人关注,他们的在运动和视频采样比特率之间达到最佳平衡的方法也受人关注。和现有的可伸缩视频编码方案(会涉及到产生可伸缩视频采样比特流)不一样,除了不可伸缩的运动参数比特流之外,Secker和Taubman的方法产生两个可伸缩比特流;一个对应于视频采样,另一个对应于运动参数,如图1所示。 
使用原始运动参数来生成可伸缩视频采样比特流。压缩之后伸缩运动信息表示使用与压缩时不同的运动参数来进行重构。这个不一致导致了附加的重构视频失真。但是,这个附加失真可以量化,并且可以与由伸缩视频采样比特流导致的失真达到平衡,从而可以求得运动和采样比特率的最优组合。 
在上述A.Secker和D.Taubman的“Highly scalable videocompression with scaiable motion coding”中,作者描述了尽管运动误差和所导致的视频失真之间有着复杂的相互关系,但是也可以利用线性方法对该行为进行近似的建模。这个重要的发现证明了可以独立地构建可伸缩运动和视频比特流,因为可以在压缩视频帧之后确定运动和采样比特流的最优组合。根据Secker和Taubman,由重构视频序列中的运动误差导致的总方差D(M)可以由以下线性模型表示: 
D ( M ) ≈ Ψ R , S D M - - - ( 1 )
其中DM表示运动矢量中由于压缩后伸缩导致的均方差。伸缩系数ΨR,S取决于视频信号重构的空间分辨率S,并取决于精度,或视频采样重构的比特率R。 
运动信息和采样数据之间的最优码率分配需要知道与子带帧的可伸缩编码期间生成的嵌入式表示的前L(S)个比特相关的重构视频采样失真D(S)。另外,码率分配也需要知道由于把运动参数比特流截为长度L(M)而导致的重构视频失真D(M)。根据Lagrange乘子法,对于总长度Lmax,当对于失真-长度斜率λ>0有 且L(S)+L(M)尽可能大但是不超过LMAX时,实现了运动和采样比特之间的最优分配。这里,ΔD(S)/Δ L(S)和ΔD(M)/ΔL(M)是采样和运动比特流截取点处的失真-长度斜率的离散近似。实际上,通常知道D(S)就够了,L(S)、D(M)和L(M)只用于一些有限的可能的比特流截取点,以对于任意Lmax得到近乎最优的码率分配。 
根据公式(1),只要Ψ R,S在L(M)的小幅变化之下相对恒定,可以根据  - ΔD ( S ) ΔL ( S ) ≥ λ Ψ R , S - ΔD M Δ L ( M ) ≥ λ 来等价地执行码率分配。根据上述的Secker和Taubman,通常是这种情况,从而编码运动数据的码率失真最优性基本上与采样数据无关,并且可以与可伸缩采样比特流无关地构建可伸缩运动比特流。可以在压缩之后根据运动敏感系数ΨR,S求得运动和采样数据之间的最优码率分配。 
尽管这个码率失真优化模型可以应用于任何可伸缩视频编码方法,但JPEG2000采用的EBCOT算法提供了用于运动和采样比特流的编码和联合伸缩的优异的构架。在D.Taubman,E.Ordentlich,M.Weinberger andG. Seroussi,“Embedded Block Coding in JPEG2000”,SignalProcessing-Image Communication,vol 17,no 1 pp.49-72,Jan 2002中可以找到EBCOT算法的完整论述。EBCOT算法产生组织为嵌入式“质量层”的比特流。任何层边界处的比特流截取都能产生满足上述码率失真优化目标的重构信号。涉及部分质量层的进一步重构减少重构失真,但不一定是码率失真最优形式。只要使用足够多的质量层,这个次优性通常并不要紧。 
目前的对运动参数和视频数据进行联合伸缩的方法仅考虑运动矢量失真的幅值,而没有考虑其方向。但是,视频序列通常会表现出各向异性功率谱,从而垂直和水平运动误差的效果会显著不同。当发生这种情况时,在现有的方案中垂直和水平运动矢量分量之间的比特分配是次优的。解决这个问题可以带来更大的压缩效率,从而减小与可伸缩运动信息相关的性能损失。 
发明内容
本发明的原理是通过对各个运动矢量分量单独地执行码率分配,从而改善完全视频编码器的码率失真优化。本质上,这涉及对重构视频数 据最为敏感的运动分量花费更多的比特。例如,对于在垂直方向上包含绝对高的频率能量的视频数据,对于垂直运动分量的编码花费更多的比特,而对于水平运动矢量分量花费更少的比特。相反,当视频序列包含绝对多数的水平纹理信息时,把大部分的运动比特花费在水平运动矢量分量的编码上,从而对于水平运动误差更为敏感。 
本发明在于对现有技术的运动诱导视频失真模型的改进。该改进模型引入了各个运动矢量分量MSE的各个项,而不仅仅是对应于各个运动矢量幅值MSE的一个项。该改进模型表达为: 
D x , M ≈ Ψ R , S 1 D M 1 + Ψ R , S 2 D M 2
其中 
Figure S05158897420050407D000062
和 
Figure S05158897420050407D000063
指垂直运动矢量分量, 
Figure S05158897420050407D000064
和 指水平运动矢量分量。对于不相干的运动和采样误差,可以使用下面的添加失真模型来量化总重构视频失真,作为单独的运动分量失真和帧采样失真之和。 
D x ≈ D s + Ψ R , S 1 D M 1 + Ψ R , S 2 D M 2
可以自然地对现有的运动信息编码和码率分配方法进行扩展以便于应用该改进模型。下面对这些扩展进行说明。 
总的来说,本发明的一个方面涉及一种利用运动补偿来编码运动图像数据的方法,该方法包括单独地考虑水平和垂直运动矢量分量(例如在重构/重构误差中)的影响。这可以通过单独地对水平和垂直运动矢量分量进行编码来实现,例如,优先编码对重构图像/帧的质量有更重要贡献的分量。该优先编码可以涉及平移或伸缩,例如比特平面中的比特平面平移或者部分比特平面编码。该优先编码可以基于比特率分配,即对于更重要的运动矢量分量分配更多的比特,例如使用优化技术,例如对于不同的比特率和/或空间分辨率使重构误差最小。在运动矢量的可伸缩编码,特别是与3-D子带编码相关的环境中,本发明特别有用。 
根据本发明的另一个方面,提供了一种运动图像数据编码的方法,特别是运动补偿3-D子带编码的方法,其中单独地,或者与运动矢量的第二分量无关地对由运动补偿得到的运动矢量的第一分量进行可伸缩编码,该方法包括对于运动矢量的第一和第二分量的单独的比特率分配。运动矢量是由运动预测技术得到的。 
在所附的权利要求中阐述了本发明的这些和其它方面。 
附图说明
下面参照附图对本发明的实施例进行说明,其中: 
图1是现有技术的编码系统的框图; 
图2是根据本发明一个实施例的编码系统的框图。 
具体实施方式
本发明和现有技术之间的主要差别在于分别地控制垂直和水平运动矢量分量中的失真。这是这样实现的:首先将运动矢量场分解为与各个图像维相对应的标量场,分别地进行编码,从而生成两个可伸缩运动分量比特流,如图2所示。 
可以采用文献中介绍的任何一种可伸缩图像压缩技术来对各个图像分量比特流进行可伸缩编码。具体而言,最好使用在上述描述的Secker和Taubman的由最近的JPEG2000图像压缩标准导出的方法来有效地对运动数据进行操作。在最简单的形式中,本发明不涉及在嵌入式量化和编码之前对运动矢量分量进行重组。注意,这与现有技术不同,在现有技术中使用JPEG2000的部分比特平面编码技术的变种联合地对各个运动矢量进行嵌入式量化和编码。 
视频的高效重构需要编码采样信息和两个编码运动分量表示之间精确的码率分配。这是由辅助码率分配信息实现的,辅助码率分配信息指定了取决于空间分辨率和比特率等的预期重构参数的运动和采样数据的最优组合。重构所需的辅助率信息(由视频服务器提供或来自压缩文件)包括一组与上述现有技术类似的表。但是,在本发明中,码率表对于各个所需的重构比特率和空间分辨率确定了两个(不是一个)运动比特率,以及视频采样比特率。 
实际上,只需指定与所选择的重构比特率相应的运动分量和采样比特率就够了。或者,码率表可以指定要用于所选择的重构比特率和空间分辨率的运动分量的数目和采样质量层的数目。如果预期重构率落在码率表所指定的总比特率之间,则使用与低一档的总比特率相对应的码率分配,并把剩下的比特分配给采样数据。这个规则具有总是按照与运动分量质量层的总数相应的比特率重构运动比特流的属性,这保证了运动比特流本身是码率失真最优的。另外,这促进了运动信息的保留性分配,意味着运动和采样数据的平衡有利于发送稍多的运动信息,而不是稍少。或者,可以将R-D斜率近似为在质量层之间线性地变化,从而质量层之间的失真-长度曲线成为二次多项式。这个近似提供了利用部分运动和采样质量层分配比特率的手段。
可以对可组合的运动分量和采样比特率的每一种组合重构一次视频,以获得各个重构比特率,从而确定码率表。对于这种方式,需要把搜索限制为仅包含与质量层的总数相应的运动分量和采样率。在特定总比特率的每一次重构之后,测量PSNR并选择具有最高PSNR的组合作为最优码率分配。 
优选地,首先进行粗略搜索(其中把两个运动分量比特率约束为相同)来加速上述方法。这会涉及到按照与上述现有技术中描述的相同方式(上述的Secker和Taubman),对于各个总比特率仅测试比特率对(运动和采样比特率)。这个方法会产生很好的初始猜测结果,因为最优运动分量比特率通常是在同一量级。通过尝试与初始猜测所确定的比特率接近的几个运动分量比特率来细化该初始猜测结果。同样,把搜索限制为与总运动分量层相应的运动比特率。 
为了以更高的运算效率确定码率表,可以利用当对各个数据源进行截取,使得在各个截取点处各个比特流的失真长度斜率相同时,三个数据源的组合最优的事实。即,利用了Lagrangian优化目标涉及截取三个比特流,使得对于一些斜率λ>0, - ΔD ( S ) ΔL ( S ) ≥ λ Ψ R , S 1 - ΔD M 1 Δ L ( M , 1 ) ≥ λ 且  Ψ R , S 1 - ΔD M 2 Δ L ( M , 2 ) ≥ λ ,其中L(S)+L(M,1)+L(M,2)尽可能大,但不超过Lmax。这个问题类似于A.Secker和D.Taubman在“Highly scalable video compressionwith scalable motion coding”中描述的问题,其解决方法称为“基于模型的码率分配”。本发明本质上涉及相同的码率分配过程,只是使用了 两个运动分量比特流,以及两个运动敏感系数。通过计算下面的积分而求得运动敏感系数,其中SR,S(ω1,ω2)是利用恰当的功率谱预测方法确定的。 
Ψ 1 , R , S = 1 ( 2 π ) 2 ∫ ∫ S R , S ( ω 1 , ω 2 ) ω 1 2 d ω 1 dω 2
Ψ 2 , R , S = 1 ( 2 π ) 2 ∫ ∫ S R , S ( ω 1 , ω 2 ) ω 2 2 d ω 1 dω 2
如上述Secker和Taubman所报导并由这些公式所指出的,高效的码率分配通常需要对各个空间分辨率S和对于所选择的重构比特率R使用不同的运动敏感系数对。 
前一实施例的限制在于分别地对运动矢量分量进行编码和传输会降低整个运动矢量集的压缩效率。这有两个原因。第一个是各个运动比特流需要报头信息来表示各种重构参数,如空间维度,以及与比特流的最优截取相关的信息。后者以各种形式存在,包括码块、质量层、时空子带等的识别标记。当本发明中的两个运动分量比特流代替现有技术中的一个运动矢量比特流时,这个开销大约要翻倍。为了减小两个运动分量比特流所需的信令开销,最好将这两个分量比特流折叠成一个比特流,使得在各个运动分量之间共享各种标记。这通常至少会包括时空子带标记、维度信息、时空分解和嵌入式编码参数。 
分别地对运动矢量分量进行编码会降低压缩效率的第二个原因在于这阻止了我们利用这两个运动分量之间的冗余。为了减小这个效应,本发明的另一个实施例涉及到在嵌入式量化和编码之前对两个运动矢量分量进行重组。注意,这意味着我们不能独立地在两个运动分量比特流之间分配比特,从而码率分配是次优的。但是,这可以通过利用两个比特流之间的独立性而实现的更高编码效率而得到补偿。具体而言,我们希望利用这个事实:当一个运动分量为0时,另一个运动分量很可能也为0。这可以利用上下文编码(context coding)法来实现,类似于上述Secker和Taubman所提出的。但是,和现有技术不一样,本发明还涉及到利用两个运动分量对重构视频失真的相对重要性。这可以通过对Secker和Taubman所描述的部分比特平面编码操作进行进一步的改进来实现。例 如,我们可以在比特平面编码之前对一个运动矢量分量进行伸缩操作。实现这个的一个简单的方式是将所有的垂直运动矢量分量采样向左移位多个比特N,其中 
N = log 2 ( Ψ 1 Ψ 2 )
或者,当N为负数时,我们可以把水平运动矢量分量向左移位-N。这个方法有效地改进了两个运动矢量分量之间的比特平面扫描顺序,并且在概念上与MPEG-4 Fine Granularity Scalabi lity编码方案中为实现基于内容的可伸缩性而使用的比特平面移位方法类似,如M.van derSchaar and Y-T Lin,“Content-based selective enhancement forstreaming video”,IEEE Int.Conf.Image Proc.Vol.2,pp.977-980,Sept 2001中所述。注意,把比特移位参数传输给解码器,从而可以在解压缩时恢复正确的幅值,但是发送这些参数所需的比特数很小,对于压缩性能没有多大的影响。 
本发明例如可以在基于计算机的系统中实施,或者利用适当的硬件和/或软件实施,或者在专用设备或专用模块(如芯片)中实施。在图2中示出了编码器以及具有用于执行相反解码操作的相应部件的相应解码器。 

Claims (14)

1.一种利用运动补偿对运动图像数据进行编码的方法,其中相对于运动矢量的水平分量单独地或独立地对运动矢量的垂直分量进行可伸缩编码,并且包括对运动矢量的垂直和水平分量进行单独的比特率分配,并且
其中,所述比特率分配涉及形式的运动诱导视频失真模型,其中
Figure FSB00000222547700012
是指垂直运动矢量分量,
Figure FSB00000222547700014
是指水平运动矢量分量,
或者,所述比特率分配涉及组合了帧采样失真和运动分量失真的形式的总重构视频失真模型。
2.根据权利要求1所述的方法,其中利用运动补偿3-D子带编码对运动图像数据进行编码。
3.根据权利要求1所述的方法,其中运动矢量的编码是可伸缩编码。
4.根据权利要求1所述的方法,其中比特率分配考虑了图像序列中的垂直和水平内容的差异。
5.根据权利要求1所述的方法,其中比特率分配考虑了图像序列对垂直和水平运动的敏感度的差异。
6.根据权利要求1所述的方法,其中比特率分配涉及反应分别由水平和垂直运动误差引起的重构误差的水平和垂直运动敏感度或伸缩系数。
7.根据权利要求1所述的方法,包括对于多个重构比特率和/或空间分辨率确定比特率分配。
8.根据权利要求7所述的方法,包括导出并存储码率表,该码率表包括对于多个重构比特率和/或空间分辨率的运动矢量分量的比特率分配信息。
9.根据权利要求1所述的方法,该方法包括对所述比特率分配使用优化技术。
10.根据权利要求9所述的方法,包括识别分别分配给水平和垂直运动矢量分量的比特,并利用解码的水平和垂直运动矢量分量重构图像序列。
11.一种利用运动补偿对运动图像数据进行编码的装置,该装置包括:
用于相对于运动矢量的水平分量单独地或独立地对运动矢量的垂直分量进行编码的装置;以及
用于对运动矢量的垂直和水平分量进行单独的比特率分配的装置,所述比特率分配涉及形式的运动诱导视频失真模型,其中
Figure FSB00000222547700022
是指垂直运动矢量分量,
Figure FSB00000222547700024
Figure FSB00000222547700025
是指水平运动矢量分量,
或者,所述比特率分配涉及组合了帧采样失真和运动分量失真的
Figure FSB00000222547700026
形式的总重构视频失真模型。
12.根据权利要求11所述的装置,其中,所述用于进行编码的装置包括用于对垂直运动矢量分量进行编码的可伸缩运动编码器,以及用于对水平运动矢量分量进行编码的可伸缩运动编码器。
13.根据权利要求11所述的装置,其中,所述用于进行单独的比特率分配的装置被设置为在编码过程中向垂直和水平运动矢量分量分配比特。
14.根据权利要求13所述的装置,该装置包括用于在编码过程中向垂直和水平运动矢量分量分配比特的码率表。
CN2005100588974A 2004-03-31 2005-03-30 用于可伸缩视频编码的方向自适应可伸缩运动参数编码 Expired - Fee Related CN1678073B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP04251920A EP1583368A1 (en) 2004-03-31 2004-03-31 Direction-adaptive scalable motion parameter coding for scalable video coding
EP04251920.7 2004-03-31

Publications (2)

Publication Number Publication Date
CN1678073A CN1678073A (zh) 2005-10-05
CN1678073B true CN1678073B (zh) 2011-01-19

Family

ID=34878318

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005100588974A Expired - Fee Related CN1678073B (zh) 2004-03-31 2005-03-30 用于可伸缩视频编码的方向自适应可伸缩运动参数编码

Country Status (4)

Country Link
US (1) US20050226323A1 (zh)
EP (1) EP1583368A1 (zh)
JP (1) JP2005295561A (zh)
CN (1) CN1678073B (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7657060B2 (en) * 2004-03-31 2010-02-02 Microsoft Corporation Stylization of video
US20070136372A1 (en) * 2005-12-12 2007-06-14 Proctor Lee M Methods of quality of service management and supporting apparatus and readable medium
US8873932B2 (en) 2007-12-11 2014-10-28 Cisco Technology, Inc. Inferential processing to ascertain plural levels of picture interdependencies
US8416859B2 (en) 2006-11-13 2013-04-09 Cisco Technology, Inc. Signalling and extraction in compressed video of pictures belonging to interdependency tiers
US8155207B2 (en) 2008-01-09 2012-04-10 Cisco Technology, Inc. Processing and managing pictures at the concatenation of two video streams
US8875199B2 (en) 2006-11-13 2014-10-28 Cisco Technology, Inc. Indicating picture usefulness for playback optimization
US8804845B2 (en) 2007-07-31 2014-08-12 Cisco Technology, Inc. Non-enhancing media redundancy coding for mitigating transmission impairments
US8958486B2 (en) 2007-07-31 2015-02-17 Cisco Technology, Inc. Simultaneous processing of media and redundancy streams for mitigating impairments
CN101217654B (zh) * 2008-01-04 2010-04-21 华南理工大学 视频码流可伸缩性组织方法
US8416858B2 (en) 2008-02-29 2013-04-09 Cisco Technology, Inc. Signalling picture encoding schemes and associated picture properties
WO2009152450A1 (en) 2008-06-12 2009-12-17 Cisco Technology, Inc. Picture interdependencies signals in context of mmco to assist stream manipulation
US8705631B2 (en) 2008-06-17 2014-04-22 Cisco Technology, Inc. Time-shifted transport of multi-latticed video for resiliency from burst-error effects
US8699578B2 (en) 2008-06-17 2014-04-15 Cisco Technology, Inc. Methods and systems for processing multi-latticed video streams
US8971402B2 (en) 2008-06-17 2015-03-03 Cisco Technology, Inc. Processing of impaired and incomplete multi-latticed video streams
US8259814B2 (en) 2008-11-12 2012-09-04 Cisco Technology, Inc. Processing of a video program having plural processed representations of a single video signal for reconstruction and output
US8949883B2 (en) 2009-05-12 2015-02-03 Cisco Technology, Inc. Signalling buffer characteristics for splicing operations of video streams
US8279926B2 (en) * 2009-06-18 2012-10-02 Cisco Technology, Inc. Dynamic streaming with latticed representations of video
CN102802138A (zh) * 2011-05-25 2012-11-28 腾讯科技(深圳)有限公司 一种视频文件的处理方法和系统、视频代理系统
US10230957B2 (en) * 2016-03-22 2019-03-12 Cyberlink Corp. Systems and methods for encoding 360 video
CN110113669B (zh) * 2019-06-14 2021-07-16 北京达佳互联信息技术有限公司 获取视频数据的方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1132983A (zh) * 1994-10-10 1996-10-09 汤姆森多媒体公司 编码或解码运动矢量的方法与其实施的编码或解码装置
GB2368220A (en) * 2000-10-09 2002-04-24 Snell & Wilcox Ltd Compression of motion vectors
US6498810B1 (en) * 1997-09-12 2002-12-24 Lg Electronics Inc. Method for motion vector coding of MPEG-4

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7023922B1 (en) * 2000-06-21 2006-04-04 Microsoft Corporation Video coding system and method using 3-D discrete wavelet transform and entropy coding with motion information
CA2424340A1 (en) * 2000-10-09 2002-04-18 Snell & Wilcox Limited Compression of motion vectors
US6845130B1 (en) * 2000-10-12 2005-01-18 Lucent Technologies Inc. Motion estimation and compensation for video compression
CN101448162B (zh) * 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
AU2002951574A0 (en) * 2002-09-20 2002-10-03 Unisearch Limited Method of signalling motion information for efficient scalable video compression
US7580460B2 (en) * 2003-03-28 2009-08-25 Sony Corporation Video encoder with multiple outputs having different attributes

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1132983A (zh) * 1994-10-10 1996-10-09 汤姆森多媒体公司 编码或解码运动矢量的方法与其实施的编码或解码装置
US6498810B1 (en) * 1997-09-12 2002-12-24 Lg Electronics Inc. Method for motion vector coding of MPEG-4
GB2368220A (en) * 2000-10-09 2002-04-24 Snell & Wilcox Ltd Compression of motion vectors

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Taubman D.Highly scalable video compression with scalable motion coding.Image Processing
Taubman, D.Highly scalable video compression with scalable motion coding.Image Processing, 2003. ICIP 2003. Proceedings. 2003 International Conference on2.2003,2III-273-III-276 摘要,3.运动值量化,4.可伸缩运动编码,5.实验结果. *

Also Published As

Publication number Publication date
EP1583368A1 (en) 2005-10-05
CN1678073A (zh) 2005-10-05
JP2005295561A (ja) 2005-10-20
US20050226323A1 (en) 2005-10-13

Similar Documents

Publication Publication Date Title
CN1678073B (zh) 用于可伸缩视频编码的方向自适应可伸缩运动参数编码
US7382926B2 (en) Transcoding a JPEG2000 compressed image
CN1722838B (zh) 使用基础层的可伸缩性视频编码方法和设备
US20020118759A1 (en) Video coding method
JP2000511366A (ja) 4分割ツリーベースの可変ブロックサイズ動き推定装置および方法
CN102006483A (zh) 一种视频编解码方法及装置
Danyali et al. Highly scalable image compression based on SPIHT for network applications
Leung et al. Transform and embedded coding techniques for maximum efficiency and random accessibility in 3-D scalable compression
US20060012680A1 (en) Drift-free video encoding and decoding method, and corresponding devices
CN100466735C (zh) 视频编码和解码方法以及视频编码器和解码器
KR20080021268A (ko) 3차원 웨이블릿 기반 영상 부호화/복호화 방법 및 장치
Ellinas et al. Morphological wavelet-based stereo image coders
Campisi et al. Three dimensional wavelet based approach for a scalable video conference system
Danyali Highly scalable wavelet image and video coding for transmission over heterogeneous networks
Bober et al. Video coding for mobile communications-mpeg4 perspective
Al-Janabi Highly scalable single list set partitioning in hierarchical trees image compression
Verdicchio et al. Scalable multiple description coding of video using motion-compensated temporal filtering and embedded multiple description scalar quantization
Jiang et al. Lifted wavelet-based image dataset compression with column random access for image-based virtual environment navigation
Zandi et al. Compression with reversible embedded wavelets with an enhanced binary mode
Bojkovic et al. Advanced image compression techniques: Comparative functionalities and performances
Rui et al. Feedback-free Wavelet Based Distributed Coding for Video
Cheng et al. A Block-Based SNR Scalable Wavelet Video Codec with Sub-pixel Motion Vectors and RD Optimization
YAN et al. LOW BIT-RATE FAST VQ CODING WITH THE STRUCTURE OF 3D SET PARTITIONING IN HIERARCHICAL TREES (3D SPIHT) FOR VIDEO DATA COMPRESSION
Bukhari Review and implementation of DWT based scalable video coding with scalable motion coding
Ou et al. Layered image transmission with quality pre-specifiable JPEG2000

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110119

Termination date: 20120330