CN101278564A - 在基于块的视频中的运动预测错误隐藏的方法和装置 - Google Patents

在基于块的视频中的运动预测错误隐藏的方法和装置 Download PDF

Info

Publication number
CN101278564A
CN101278564A CN200680036106.0A CN200680036106A CN101278564A CN 101278564 A CN101278564 A CN 101278564A CN 200680036106 A CN200680036106 A CN 200680036106A CN 101278564 A CN101278564 A CN 101278564A
Authority
CN
China
Prior art keywords
piece
picture
receives
motion vector
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200680036106.0A
Other languages
English (en)
Inventor
吴镇宇
吉尔·M·博伊斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of CN101278564A publication Critical patent/CN101278564A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • H04N19/895Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder in combination with error concealment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

提供了一种基于块的错误隐藏的方法和装置。所述装置包括:错误隐藏模块(177),用于通过下列步骤来隐藏视频序列的丢失画面中的当前块:使用所述视频序列的正确接收的画面中的至少一个块的运动矢量,将正确接收的画面中的至少一个块的位置预测为丢失画面中的当前块的位置,以便获得合成的预测,并且基于所述合成的预测中的重叠量来选择正确接收的画面中的至少一个块中的一个块。然后使用正确接收的画面中的至少一个块中的所选一个块的运动矢量来隐藏丢失画面中的当前块。

Description

在基于块的视频中的运动预测错误隐藏的方法和装置
相关申请的交叉引用
本专利申请要求在于2005年9月29日提交的美国临时专利申请序列号60/721892、标题为“METHOD AND APPARATUS FOR MOTIONPROJECTION ERROR CONCEALMENT IN BLOCK BASED VEDIO”的优先权,其全部公开在此并入作为参考。
技术领域
本发明总的涉及视频解码,尤其涉及一种在基于块的视频中的运动预测错误隐藏(motion projection error concealment)的方法和装置。
背景技术
压缩视频内容在发送期间通常经受信道损害。在一些应用中,被破坏的视频位流可以到达视频解码器。当这发生时,如果不采取正确的动作,可能严重地降低所传递的视频的质量。错误隐藏是一种在这种情况下由视频解码器通常使用的技术。错误隐藏通过采用压缩位流内的剩余冗余来恢复丢失的或者损坏的视频信息。
在现有技术中已经意识到并且实现了片段(slice)丢失错误隐藏。然而,对于每个丢失的帧必须接收到至少一个片段,以便应用错误隐藏。因此,当视频帧被完全丢失时,它是不适用的。然而,在许多应用中,尤其以低位速率操作的应用中,例如3G无线网络,通常将编码帧封装到发送单元。当在发送期间丢失了这样的发送单元时,丢失相应的帧。片段丢失错误隐藏在这些应用中失败。
存在一些现有的能够处理整个帧丢失的简单错误隐藏算法。例如,一种技术是“帧复制”(FC),它是根据给定的参考帧来简单执行逐个像素的复制以便重构丢失的帧的方案。帧复制对具有很少运动的静止视频序列有效。然而,对于具有有效运动的那些视频序列,帧复制通常产生低PSNR值以及显而易见的错误传播(error propagation)。
“运动复制”(MC)是能够隐藏丢失的帧的另一种简单错误隐藏。运动复制将给定参数帧的运动场复制到丢失的帧,并且然后执行运动补偿以便重构丢失的帧。运动复制对具有同类的运动场的视频序列、诸如在摄像机遥摄中发生的视频序列有效。然而,当视频序列中存在充足的混乱运动时,运动复制可能产生隐藏假像(artifact)。
已经提出了一些更复杂的错误隐藏算法来隐藏丢失的帧。这些错误隐藏算法通常可被分为块级(block-level)算法和像素级(pixel-level)算法。一种所述像素级错误隐藏算法根据最后接收的帧推断在每个像素处的运动矢量(MV)。然后,对于当前丢失的帧中的每个像素,错误隐藏算法通过平均所有重叠的宏块(MB)的MV或者根据先前帧中的相同位置的MV对其进行复制来估计其MV。
在另一种所述像素级错误隐藏算法中,提出了基于光学流的运动估计。估计的运动矢量(MV)在空间调整之后被预测到丢失帧以便避免额外的间断。丢失的帧中的未填充的像素随后被空间插值。
所有的上面算法在像素级操作,其估计每个像素的MV,然后执行运动补偿。这些算法通常需要改变现有的数据结构并且将功能模块添加到现有的视频解码图表。而且,这些算法需要大量的附加计算。作为比较,有在块级操作的算法,其估计每个块的MV。块级错误隐藏算法通常需要较少的复杂度或开销。
在一种所述块级错误隐藏算法中,对于每个16×16或4×4块,通过计算第一阶和第二阶动差(moment)来检查落入内部的MV的一致性(consistency)。然而,块级错误隐藏算法不提供对检查失败的那些块的解决方案,这就危及了性能。
发明内容
现有技术的这些和其他缺陷和不足将由本发明来解决,本发明致力于一种在基于块的视频中的运动预测错误隐藏的方法和装置。
根据本发明的一方面,提供了一种基于块的错误隐藏的装置。所述装置包括错误隐藏模块,用于通过下列步骤来隐藏视频序列的丢失画面中的当前块:使用所述视频序列的正确接收的画面中的至少一个块的运动矢量,将正确接收的画面中的至少一个块的位置预测为丢失画面中的当前块的位置,以便获得合成的预测(resultant projection),并且基于所述合成的预测中的重叠量来选择正确接收的画面中的至少一个块中的一个块。然后使用正确接收的画面中的至少一个块中的所选一个块的运动矢量来隐藏丢失画面中的当前块。
根据本发明的另一方面,提供了一种用于隐藏视频序列的丢失画面中的当前块的方法。所述方法包括:使用所述视频序列的正确接收的画面中的至少一个块的运动矢量,将正确接收的画面中的至少一个块的位置预测为丢失画面中的当前块的位置,以便获得合成的预测。所述方法还包括:基于所述合成的预测中的重叠量来选择正确接收的画面中的至少一个块中的一个块。所述方法还包括:使用正确接收的画面中的至少一个块中的所选一个块的运动矢量来隐藏丢失画面中的当前块。
本发明的这些和其他方面、特征和优点将从示例性实施例的下列详细描述中变得清楚,所述描述将结合附图来阅读。
附图说明
根据下列示意性附图可以更好地理解本发明,其中:
图1是根据本发明原理实施例的可应用本发明原理的示例性解码器的方框图;
图2是根据本发明原理实施例的用于在视频解码处理中预测块的示例性方法的流程图;
图3是根据本发明原理实施例的图2的方法的示例性实施的图;
图4是根据本发明原理实施例的用于丢失视频帧的未覆盖和冲突区域的中值过滤的示例性方法的流程图;和
图5是根据本发明原理实施例的用于在视频解码器中块级错误隐藏的示例性方法的流程图。
具体实施方式
本发明致力于一种用于在基于块的视频中的运动预测错误隐藏的方法和装置。为了图解目的,这里参考符合国际标准化组织/国际电工委员会(ISO/IEC)运动图像专家组-4(MPEG-4)部分10高级视频编码(AVC)标准/国际电信联盟、电信部门(ITU-T)H.264标准(下文中,“MPEG4/H.264”标准或者简称为“H.264标准”)的位流来描述本发明。然而,令人理解的是,本发明不单单限于符合H.264标准的位流,并且同样适用于其他基于块的位流。而且,尽管此处关于视频帧的图像块来描述本发明,但是应当理解的是,本发明同样可应用于视频场的图像块、画面、片段等,因此,此处所使用的字“帧”应当被理解为是开放性的。而且,短语“图像结构”此处也被用来集中表示视频帧、场、画面、片段等中的任意一个。而且,如此处所使用的,术语“丢失的”和“缺少的”当对于图像结构使用时也往往包括被损害或者否则不能被正常地解码的图像结构。
本描述图解说明了本发明的原理。因此应当理解的是,本领域的普通技术人员能够设计出尽管此处未清晰地描述或示出但是体现了本发明的原理并且包含在其精神和范围之内的各种布置。
此处所记载的所有示例和条件性语言往往用于教学目的,以辅助读者理解本发明的原理和发明人对现有技术贡献的理念,并且应当被理解为不限于所述具体记载的示例和条件。
而且,此处所有陈述记载了本发明的原理、方面和实施例以及本发明的具体示例,往往包含本发明的结构和功能的等效物。另外,所述等效物往往包括当前已知的等效物以及进来研发的等效物,即、不管结构如何都执行相同功能的研发的任何元件。
因此,例如,本领域的普通技术人员应当理解的是,此处呈现的方框图表示体现本发明原理的图解性电路的概念视图。类似地,应当理解,任何流程图、流图表、状态转换图表、伪代码等表示可以基本上由计算机可读媒体表现并且如此由计算机或处理执行的各种处理,无论是否清晰地示出所述计算机或处理器。
附图中所示的各种元件的功能可以通过使用专用硬件或者能够结合适当的软件执行软件的硬件来提供。当被处理器提供时,所述功能可以由单个专用处理器、单个共享处理器或者多个单独的处理器(它们中的一些可被共享)来提供。而且,术语“处理器”或“控制器”的明确使用不应当被曲解为排它地表示能够执行软件的硬件,而是可以含蓄地包括但不限于数字信号处理器(“DSP”)硬件、用于存储软件的只读存储器(“ROM”)、随机存取存储器(“RAM”)、以及非易失性存储器。
也可以包括其他硬件,不论是常规的和/或传统的。类似地,如图中所示的任何开关仅是概念上的。它们的功能可以通过程序逻辑的操作、通过专用逻辑、通过编程控制和专用逻辑的交互作用、或者甚至手工来执行,至于特定的技术,则可由执行人来选择,只要从上下文就可以更明确地理解。
在本权利要求书中,表达为用于执行特定功能的手段的任何元件往往涵盖执行所述功能的任何方式,包括:例如,a)执行所述功能的电路元件的组合或者b)结合执行实现所述功能的软件的适当电路的任何形式的软件,因此包括固件、微码等。由所述权利要求限定的本发明认定的事实是:由各种记载的手段提供的功能以权利要求所要求的方式被组合和集合在一起。因此,应当认为能够提供那些功能的任何手段等效于此处所示出的那些。
转向图1,可应用本发明原理的示例性解码器总的由附图标记100表示。视频解码器100包括熵解码器110。熵解码器110的第一输出与逆量化器/逆变换器120的输入进行信号通信地连接。逆量化器/逆变换器120的输出与求和点140的第一输入进行信号通信地连接。
求和点140的输出与解块滤波器190进行信号通信地连接。解块滤波器190的输出与参考画面存储器150进行信号通信地连接。参考画面存储器150与运动补偿器160的第一输入进行信号通信地连接。运动补偿器160的输出与求和点140的第二输入进行信号通信地连接。
熵解码器110的第二输出与运动矢量(MV)存储器176的输入和运动补偿器160的第二输入进行信号通信地连接。运动矢量存储器176的输出与错误隐藏模块177的输入进行信号通信地连接。错误隐藏模块177的输出与运动补偿器160的第三输入进行信号通信地连接。解块滤波器190的输出提供视频解码器100的输出。
根据本发明原理的实施例,将fc表示为丢失帧,将fr表示为其参考帧。考虑通过首先估计其运动场以及之后进行运动补偿来隐藏fc,所述估计和运动补偿都是基于fc的。fr的运动场可被预测到fc,以便根据下列一般公式来恢复其丢失的运动信息:
MV c x ( i + d x ( i , j ) , j + d y ( i , j ) ) = MV r x ( i , j ) MV c y ( i + d x ( i , j ) , j + d y ( i , j ) ) = MV r y ( i , j ) - - - ( 1 )
其中(i,j)是一帧内一个像素(或块)的坐标,(MVc x(i,j),MVc y(i,j))和(MVr x(i,j),MVr y(i,j))分别是在fc和fr的位置(i,j)处的运动矢量,并且(dx(i,j),dy(i,j))是由预测引起的可能位移(displacement)。
通常,存在各种方式将所述位移定义为具有不同地“运动预测”(MP)算法。一个实施例中,感兴趣的一种预测由下列形式表示:
d x ( i , j ) = - MV r x ( i , j ) d y ( i , j ) = - MV r y ( i , j ) - - - ( 2 )
在这种形式中,运动预测(MP)假设运动沿着运动轨迹保持不变。相反,帧复制(FC)假设静止的运动模型,然而MC假设运动随着帧在任何位置保持不变。明显的是,MP所采取的模型比FC和MC的要现实得多。然而,实际上,由于通过MP的两个运动场之间的可能非一对一映射,可能存在不具有由于预测产生的覆盖范围或具有由于预测产生的多个覆盖范围的区域,这在基于像素的方案中不是问题。而且,有时将要预测的运动不表示运动对象的真正运动。因此,如果直接应用上面参考现有技术的块级错误隐藏算法,则这种应用可能产生具有不期望的不连续性的运动场,这危及了性能。因此,根据本发明原理,描述一种解决现有技术的相关问题的运动预测方案,即基于块的错误隐藏。
本发明原理采用基于块的错误隐藏方案。通常,如上所述,本发明原理可应用于任何基于块的视频压缩标准,尽管此处为了图解目的而参考符合H.264标准的位流进行描述。
为了最佳可能的粒度(granularity),应当采用所使用的视频压缩标准允许的最小运动块大小。由于4×4是H.264标准支持的最小块大小,因此本发明原理的实施例将运动矢量分配给隐藏帧中的每个4×4块(或者,如上所述,也可以使用隐藏场、画面、片段等,同时还保持本发明的范畴)。而且,由于在H.264标准中允许多重参考运动补偿,因此一帧中的运动矢量可以具有不同的参考指标(index)。在实现本发明原理的后一阶段(下文中称作“后处理阶段”)中,为了全面地利用空间相邻信息,期望运动矢量和位移关于一个参考帧。因此,如果必要,运动矢量和位移都被R(fc,fr)重新调节(划分),其中R(fc,fr)是帧fc和fr之间的时间长度。下文中,假设已经采用缩放比例(scaling),并且所有运动矢量和位移关于相同的参考帧。
在实施例中,本发明原理的方案可被分为两个阶段:运动预测;和后处理。Bc指代fc中的4×4块,Br指代从fr中将要预测的块,其中Br可以是H.264标准支持的任何块大小。注意,如果Br在帧内模式中被编码,则用于Br的丢失运动信息可以通过在SKIP_P模式中指定它而从它的相邻物中估计。在预测之前,fc中的所有块{Bc}被初始化为未被任意预测块Br覆盖。考虑所与可能的结果,在预测之后对每个Bc定义以下可能的三种状态:(1)“覆盖状态”,当该块被唯一、明显的预测块覆盖时;(2)“冲突状态”,当该块被多个不具有明显覆盖范围的预测块覆盖时;和(3)“未覆盖状态”,当该块未被任何预测块覆盖时。
取来自fr的块Br,将其预测到fc并且将预测块指代为
Figure A20068003610600111
设置{Bc}为fr中的一组4×4块,其包括具有
Figure A20068003610600112
的非零重叠区域。对于每个Br,一组预测过程被设计用来将Br的MV分配给{Bc}。该组过程如图2所述。
转向图2,用于在视频解码处理中预测块的示例性方法总的用附图标记200来表示。方法200包括循环限制块205,该循环限制块205循环集{Bc}中的块,并且将控制传递到功能块210。功能块210计算Br到Bc的重叠区域,并且将控制传递到决定块215。决定块215确定重叠区域是否大于阈值Th1。如果重叠区域大于阈值Th1,则控制传递到功能块220。否则,控制传递到决定块235。应当理解的是,“是”导致决定块215引起的对应于Bc处于覆盖状态的决定,而“否”导致对应于Bc处于覆盖状态和/或冲突状态的决定。
功能块220将运动矢量分配给Bc,并且将控制传递到功能块225。功能块225将Bc设定为覆盖状态,记录覆盖区域,并且将控制传递到循环限制块230。循环限制块230结束对集{Bc}中的块的循环,并且将控制返回到循环限制块205。
决定块235确定新的(重叠)区域是否大于或等于旧的(重叠)区域。如果新的(重叠)区域大于或等于旧的(重叠)区域,则控制传递到功能块240。否则,控制传递到决定块250。
功能块240将运动矢量分配给fc中的Bc(基于来自fr的与Bc重叠的预测块Br),并且将控制传递到功能块245。功能块245用新的重叠区域代替旧的重叠区域,并且将控制传递到决定块250。
决定块250确定新的区域减去旧的区域是否小于或等于阈值Th2。如果新的区域减去旧的区域小于或等于阈值Th2,则控制传递到功能块255。否则,控制传递到循环限制块230。
功能块255将Bc设定为冲突状态。
显而易见,基于来自fr的与相应4×4块重叠的预测块Br,分配来自对于fc中每个4×4块的MV。对于每个4×4块,其运动矢量的可靠性用预测块Br的覆盖区域来表示。覆盖区域越大,则可靠性变得越高,反之亦然。另一方面,如果存在多个覆盖4×4块的预测块,则所述块被声明处于冲突状态,这必须在第二阶段被重访。这对于那些未被来自fr的任意预测块覆盖的4×4块同样为真。
转向图3,图2的方法的示例性实现总的用附图标记300来表示。例如,4×4块8、11、12被分配块B的MV,因为它们被块B唯一并显著地覆盖。尽管块7被块A和块B两者覆盖,但是块B占据了主要的覆盖范围。因此,块7被分配来自块B的MV。同时,尽管块14被块B和C两者部分地覆盖,但是如果阈值Th1被设定为较高,则块B和C两者都未占据主要覆盖区域。因此,块14可被设定为未覆盖状态。由于没有块预测到块4,则块4也被设定为未覆盖状态。
在上面步骤之后,如果由
Figure A20068003610600121
覆盖的整个区域比其原始大小要小得多,则认为预测不成功。不成功的预测很可能在预测阶段的结束时在fc中产生更多的未覆盖区域或冲突区域。为了解决这一问题,当这发生时,Br用(0,0)位移来预测。这等效于对块应用“运动复制”,并且它确保满覆盖区域。将上面的过程应用于fc中的每个块Br,以便完成运动预测阶段。
在运动预测阶段之后,构造fc的运动场的估计。然而,所述场可以包括具有冲突或未覆盖状态的区域。对于那些区域,或者没有相关的运动矢量或者相关的运动矢量很可能不准确,这两方面都可能损害隐藏性能。因此,根据本发明原理提供后处理阶段来解决这一问题。
在后处理阶段中,首先重新估计在fc中具有冲突或未覆盖状态的那些块的运动矢量。所述重新估计是基于使用中值滤波的它们的空间可靠相邻物的。更具体地,对于具有上述状态的块,应用具有窗口大小3×3(以4×4块为单位)的中间滤波器。仅块的合格的相邻物被选择来过滤。设计一组过程来执行对将要过滤的每个块的选择和过滤,这将参考图4来进行描述。
转向图4,用于对丢失视频帧的非覆盖和冲突区域进行中值滤波的示例性方法通常用附图标记400来表示。方法400包括功能块405,用于重置计数器,并且将控制传递到循环限制块410。循环限制块410循环将要滤波的块的相邻块,并且将控制传递到决定块415。决定块415确定覆盖区域是否小于阈值TH3。如果覆盖区域小于阈值TH3,则控制传递到功能块420。否则,控制传递到循环限制块425。
功能块420递增计数器,并且将控制传递到循环限制块425。循环限制块425结束将要滤波的块的相邻块的循环,并且将控制传递到决定块430。决定块430确定计数器的当前值是否大于阈值TH4。如果计数器的当前值大于阈值TH4,则控制传递到功能块435。否则,控制传递到功能块445。
功能块435减少所述块以及所有其相邻块的运动矢量中的变化(例如,通过对所述块以及所有其相邻块(例如,在3×3块区中)的运动矢量执行中值滤波),并且将控制传递到功能块440。功能块440将小于16但大于TH4的覆盖区域分配给所述块,并且将控制传递到功能块455,功能块455处理下一选择的块。
功能块445用参考帧中的联合定位块的运动矢量代替输入块的运动矢量,并且将控制传递到功能块450。功能块450将小于TH4的覆盖区域分配给所述块,并且将控制传递到功能块455。
在上面处理之后,得到更完整并可靠的运动矢量。然而,该运动矢量场可以包括相当数量的不连续区,如果保持未被处理,则这可能在运动补偿之后导致讨厌的块伪像。为了减轻该问题,对运动矢量场可以应用空间调节处理。为了避免过度混乱运动矢量场,仅处理所选择的区域。具体地,例如,仅过滤不占据满覆盖区的那些4×4块。根据上面的步骤,这些区域大多数对应于重新估计的块和运动对象的边界,这些地方通常发生不连续。中值滤波被选择用于调整,因为它在复杂性和性能之间具有良好的折衷。对于每个所选择的4×4区域,应用具有窗口大小3×3(在4×4块的单元中)的中值滤波。这完成了后处理阶段。
在运动预测和后处理阶段,得到丢失帧的运动场的估计。然后将运动信息反馈到正常的解码处理以便重构丢失帧。
转向图5,用于在视频解码器中的块级错误隐藏的示例性方法总的由附图标记500来表示。应当理解,步骤515到535涉及所述方法500的运动预测阶段588,然而步骤540到555涉及所述方法500的后处理阶段599。
方法500包括开始块505,用于将控制传递到功能块510。功能块510在参考帧中对运动矢量和位移进行重新调节,并且将控制传递到循环限制块515。循环限制块515对正确接收的帧中的块进行循环,并且将控制传递到功能块520。功能块520根据预测过程来预测块,并且将控制传递到决定块525。决定块525确定预测是否成功。如果预测成功,则控制被传递到循环限制块527。否则,控制被传递到功能块530。
循环限制块527获得具有最大覆盖区域的块的运动矢量(MV),并且将控制传递到功能块530。
功能块530用(0,0)位移重新预测所述块,并且将控制传递到循环限制块535。循环限制块535在正确接收的帧内结束块的循环,将控制返回到循环限制块515,并且也将控制传递到循环限制块540。循环限制块540循环具有非覆盖和冲突状态的整个块,并且将控制传递到控制块545。功能块545根据该块的相邻物重新估计该块的运动矢量,并且将控制传递到循环控制块550。循环限制块550结束非覆盖和冲突状态下的整个块,并且将控制传递到功能块555。功能块555对帧中的所选块执行空间调整,并且将控制传递到功能块560。功能块560执行运动补偿,并且将控制传递到功能块565。功能块565执行解块滤波,并且将控制传递到结束块570。
与其他现有的方法不同,根据本发明原理的方法将MV预测和校正明确地分离为两个阶段。在运动预测阶段,仅最可靠的MV被预测并且被分配给隐藏帧中的块。在后处理阶段,基于它们的空间可靠相邻物来重新估计所选块的MV。通过将所述方法分离为两个阶段,对于隐藏帧中的每一块,一次需要维持仅一个MV。与基于块的构架一起,大多数算法可以重新使用解码器中的现有数据结构和功能。因此,本发明原理的实施例可以仅使用最少量的计算和实现开销,这对具有严格的实时限制和复杂度限制的应用是有利的。
如先前所述,帧复制和运动复制分别对具有静态和一致运动场的视频有效。本发明原理的方法假设一种更现实的运动模型,因此在损害一些复杂度开销的情况下,可以为具有有效和混乱的运动提供一种更好的错误隐藏性能。因此,所述方法在实际上可以选择性地调用。例如,在实施例中,可以实现一个过程来根据输入视频的特性调用最好的错误隐藏方案。例如,在错误隐藏之前可以进行参考帧的运动场的分析。如果参考帧几乎不呈现运动,则可以调用最简单的帧复制。而且,对于具有混乱运动场的场景可以调用根据本发明原理的实施例。当然,给出此处所提供的本发明原理的示教,同时维持本发明原理的范畴,本领域和相关领域的普通技术人员能够容易地实现本发明的其他配置和实现。
现在将描述本发明的许多伴随的优点/特征中的一些优点/特征,上面已经提到了一部分。例如,一个优点/特征是用于基于块的错误隐藏的装置。所述装置包括错误隐藏模块,用于通过下列步骤来隐藏视频序列的丢失画面中的当前块:使用所述视频序列的正确接收的画面中的至少一个块的运动矢量,将正确接收的画面中的至少一个块的位置预测为丢失画面中的当前块的位置,以便获得合成的预测,并且基于所述合成的预测中重叠量来选择正确接收的画面中的至少一个块中的一个块。然后使用正确接收的画面中的至少一个块中的所选一个块的运动矢量来隐藏丢失画面中的当前块。
其他优点/特征是具有如上所述的错误隐藏模块的装置,其中正确接收的画面中的至少一个块包括关于丢失画面中的当前块的联合定位块,并且还包括关于该联合定位块的空间可用相邻块,并且所述错误隐藏模块在选择正确接收的画面中的至少一个块之后,在后处理阶段中减少正确接收的画面中的空间可用相邻块的运动矢量中的变化。
另外其他优点/特征是具有如上所述的错误隐藏模块的装置,用于减少空间可用相邻块的运动矢量的变化,其中所述错误隐藏模块对空间可用相邻块的运动矢量应用选择性中值滤波,以便减少运动矢量中的变化。
又其他优点/特征是具有如上所述的错误隐藏模块的装置,其中正确接收的画面中的至少一个块包括关于丢失画面中的当前块的联合定位块,并且还包括关于该联合定位块的空间可用相邻块,并且所述错误隐藏模块在选择正确接收的画面中的至少一个块之后,在后处理阶段中减少正确接收的画面中的空间可用相邻块和该联合定位块的运动矢量中的变化。
而且,其他优点/特征是具有如上所述的错误隐藏模块的装置,用于减少联合定位块和空间可用相邻块的运动矢量,其中所述错误隐藏模块对联合定位块和空间可用相邻块的运动矢量应用选择性中值滤波,以便减少运动矢量中的变化。
另外,其他优点/特征是具有如上所述的错误隐藏模块的装置,其中所述装置用于不可缩放(scalable)的基于块的视频解码器中,并且正确接收的画面中的至少一个块中的所选一个块的运动矢量被所述不可缩放的基于块的视频解码器用于运动补偿操作中。
另外,其他优点/特征是具有如上所述的错误隐藏模块的装置,其中所述错误隐藏模块基于丢失画面与正确接收的画面之间的相对时间长度来缩放(scale)正确接收的画面中的至少一个块中的所选一个块的运动矢量。
而且,其他优点/特征是具有如上所述的错误隐藏模块的装置,其中所述错误隐藏模块基于视频序列中的运动量选择性地执行帧重复操作来代替获取合成的预测的步骤。
相关领域的普通技术人员基于此处的示教可以容易地得知本发明的这些和其他特征和优点。应当理解,本发明的示教能够以硬件、软件、固件、专用处理器或它们的组合的各种形式来实现。
最好是,本发明的示教被实现为硬件和软件的结合。而且,所述软件可被实现为有形体现在程序存储单元上的应用程序。所述应用程序可被下载到包括任何合适构架的机器并且被其执行。优选地,该机器在计算机平台上实现,所述计算机平台具有诸如一个或多个中央处理单元(“CPU”)、随机存取存储器(“RAM”)和输入/输出(“I/O”)接口的硬件。该计算机平台以可以包括操作系统和微指令代码。此处所描述的各种处理和功能或者可以是微指令代码的一部分或者应用程序的一部分,或者可以是它们的组合,它们都可以由CPU执行。另外,各种其他外围单元可以连接到计算机平台,例如另外的数据存储单元和打印单元。
还应当理解的是,因为附图中描绘的一些组成系统组件和方法优选地以软件来实现,系统组件之间的实际连接或者处理功能块根据对本发明编程的方式而有所不同。此处给出了示教,相关领域的普通技术人员能够推断出本发明的这些和类似实施或配置。
尽管这里参考附图描述了图解性的实施例,但是应当理解的是,本发明不限于那些精确的实施例,并且相关领域的普通技术人员可以进行各种变化和修改,而在不背离本发明的范畴或精神。所有那些变化和修改往往都包含在所附权利要求所阐述的本发明的范畴之内。

Claims (17)

1.一种用于基于块的错误隐藏的装置,包括:
错误隐藏模块(177),用于通过下列步骤来隐藏视频序列的丢失画面中的当前块:使用所述视频序列的正确接收的画面中的至少一个块的运动矢量,将正确接收的画面中的至少一个块的位置预测为丢失画面中的当前块的位置,以便获得合成的预测,并且基于所述合成的预测中重叠量来选择正确接收的画面中的至少一个块中的一个块,
其中使用正确接收的画面中的至少一个块中的所选一个块的运动矢量来隐藏丢失画面中的当前块。
2.如权利要求1所述的装置,其中正确接收的画面中的至少一个块包括关于丢失画面中的当前块的联合定位块,并且还包括关于该联合定位块的空间可用相邻块,并且所述错误隐藏模块(177)在选择正确接收的画面中的至少一个块之后,在后处理阶段中减少正确接收的画面中的空间可用相邻块的运动矢量中的变化。
3.如权利要求2所述的装置,其中所述错误隐藏模块(177)对空间可用相邻块的运动矢量应用选择性中值滤波,以便减少运动矢量中的变化。
4.如权利要求1所述的装置,其中正确接收的画面中的至少一个块包括关于丢失画面中的当前块的联合定位块,并且还包括关于该联合定位块的空间可用相邻块,并且所述错误隐藏模块(177)在选择正确接收的画面中的至少一个块之后,在后处理阶段中减少正确接收的画面中的空间可用相邻块和该联合定位块的运动矢量中的变化。
5.如权利要求4所述的装置,其中所述错误隐藏模块(177)对联合定位块和空间可用相邻块的运动矢量应用选择性中值滤波,以便减少运动矢量中的变化。
6.如权利要求1所述的装置,其中所述装置用于不可缩放的基于块的视频解码器中,并且正确接收的画面中的至少一个块中的所选一个块的运动矢量被所述不可缩放的基于块的视频解码器用于运动补偿操作中。
7.如权利要求1所述的装置,其中所述错误隐藏模块(177)基于丢失画面与正确接收的画面之间的相对时间长度来缩放正确接收的画面中的至少一个块中的所选一个块的运动矢量。
8.如权利要求1所述的装置,其中所述错误隐藏模块(177)基于视频序列中的运动量选择性地执行帧重复操作来代替获取合成的预测。
9.一种用于隐藏视频序列的丢失画面中的当前块的方法,包括:
使用所述视频序列的正确接收的画面中的至少一个块的运动矢量,将正确接收的画面中的至少一个块的位置预测(520)为丢失画面中的当前块的位置,以便获得合成的预测;
基于所述合成的预测中的重叠量来选择(527)正确接收的画面中的至少一个块中的一个块;和
使用正确接收的画面中的至少一个块中的所选一个块的运动矢量来隐藏(560)丢失画面中的当前块。
10.如权利要求9所述的方法,其中正确接收的画面中的至少一个块包括关于丢失画面中的当前块的联合定位块,并且还包括关于该联合定位块的空间可用相邻块,并且所述方法还包括:在选择正确接收的画面中的至少一个块之后,在后处理阶段中减少(435)正确接收的画面中的空间可用相邻块的运动矢量中的变化。
11.如权利要求10所述的方法,其中所述减少步骤包括:对空间可用相邻块的运动矢量应用(435)选择性中值滤波。
12.如权利要求9所述的方法,其中正确接收的画面中的至少一个块包括关于丢失画面中的当前块的联合定位块,并且还包括关于该联合定位块的空间可用相邻块,并且所述方法还包括:在选择正确接收的画面中的至少一个块之后,在后处理阶段中减少(435)正确接收的画面中的空间可用相邻块和该联合定位块的运动矢量中的变化。
13.如权利要求10所述的方法,其中所述减少步骤包括:对联合定位块和空间可用相邻块的运动矢量应用(435)选择性中值滤波。
14.如权利要求9所述的方法,其中所述方法用于不可缩放的基于块的视频解码器中,并且正确接收的画面中的至少一个块中的所选一个块的运动矢量被所述不可缩放的基于块的视频解码器用于运动补偿操作中。
15.如权利要求9所述的方法,还包括:基于丢失画面与正确接收的画面之间的相对时间长度来缩放(510)运动矢量。
16.如权利要求9所述的方法,还包括:通过基于视频序列中的运动量选择性地执行(530)帧重复操作来代替所述预测、选择和隐藏步骤,掩藏丢失画面中的当前块。
17.一种用于隐藏视频序列的丢失画面中的当前块的方法,包括:
用于预测的部件,其使用所述视频序列的正确接收的画面中的至少一个块的运动矢量,将正确接收的画面中的至少一个块的位置预测(520)为丢失画面中的当前块的位置,以便获得合成的预测;
用于选择的部件,其基于所述合成的预测中重叠量来选择(527)正确接收的画面中的至少一个块中的一个块;和
用于隐藏的部件,其使用正确接收的画面中的至少一个块中的所选一个块的运动矢量来隐藏(560)丢失画面中的当前块。
CN200680036106.0A 2005-09-29 2006-09-07 在基于块的视频中的运动预测错误隐藏的方法和装置 Pending CN101278564A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US72189205P 2005-09-29 2005-09-29
US60/721,892 2005-09-29

Publications (1)

Publication Number Publication Date
CN101278564A true CN101278564A (zh) 2008-10-01

Family

ID=37846097

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200680036106.0A Pending CN101278564A (zh) 2005-09-29 2006-09-07 在基于块的视频中的运动预测错误隐藏的方法和装置

Country Status (6)

Country Link
US (1) US8391363B2 (zh)
EP (1) EP1946564A2 (zh)
JP (1) JP2009510906A (zh)
KR (1) KR20080049789A (zh)
CN (1) CN101278564A (zh)
WO (1) WO2007040889A2 (zh)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8074248B2 (en) 2005-07-26 2011-12-06 Activevideo Networks, Inc. System and method for providing video content associated with a source image to a television in a communication network
US9826197B2 (en) 2007-01-12 2017-11-21 Activevideo Networks, Inc. Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device
US9042454B2 (en) 2007-01-12 2015-05-26 Activevideo Networks, Inc. Interactive encoded content system including object models for viewing on a remote device
JP5152189B2 (ja) * 2007-09-26 2013-02-27 富士通セミコンダクター株式会社 ビデオデコーダおよびデジタル放送受信装置
TWI353562B (en) * 2008-02-04 2011-12-01 Mstar Semiconductor Inc A video processing apparatus and related method to
FR2936925B1 (fr) * 2008-10-03 2011-08-12 Canon Kk Procede et dispositif de decodage d'images d'une sequence d'images encodee selon un format predictif avec restauration de donnees manquantes
US8411754B2 (en) * 2008-11-10 2013-04-02 Activevideo Networks, Inc. System, method, and computer program product for translating an element of a static encoded image in the encoded domain
KR20130138263A (ko) 2010-10-14 2013-12-18 액티브비디오 네트웍스, 인코포레이티드 케이블 텔레비전 시스템을 이용하는 비디오 장치들 간의 디지털 비디오의 스트리밍
WO2012138660A2 (en) 2011-04-07 2012-10-11 Activevideo Networks, Inc. Reduction of latency in video distribution networks using adaptive bit rates
US8837582B2 (en) 2011-06-22 2014-09-16 Blackberry Limited Compressing image data
US8768082B2 (en) 2011-06-22 2014-07-01 Blackberry Limited Compressing image data
EP2815582B1 (en) 2012-01-09 2019-09-04 ActiveVideo Networks, Inc. Rendering of an interactive lean-backward user interface on a television
US9800945B2 (en) 2012-04-03 2017-10-24 Activevideo Networks, Inc. Class-based intelligent multiplexing over unmanaged networks
US9123084B2 (en) 2012-04-12 2015-09-01 Activevideo Networks, Inc. Graphical application integration with MPEG objects
AU2012385919B2 (en) * 2012-07-17 2016-10-20 Thomson Licensing Video quality assessment at a bitstream level
US10275128B2 (en) 2013-03-15 2019-04-30 Activevideo Networks, Inc. Multiple-mode system and method for providing user selectable video content
WO2014197879A1 (en) 2013-06-06 2014-12-11 Activevideo Networks, Inc. Overlay rendering of user interface onto source video
US9294785B2 (en) 2013-06-06 2016-03-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
US9219922B2 (en) 2013-06-06 2015-12-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
WO2015061419A1 (en) * 2013-10-22 2015-04-30 Vid Scale, Inc. Error concealment mode signaling for a video transmission system
US9788029B2 (en) 2014-04-25 2017-10-10 Activevideo Networks, Inc. Intelligent multiplexing using class-based, multi-dimensioned decision logic for managed networks
US11439014B2 (en) * 2019-07-26 2022-09-06 Eaton Intelligent Power Limited Solid state circuit breaker assembly

Also Published As

Publication number Publication date
US8391363B2 (en) 2013-03-05
WO2007040889A3 (en) 2007-06-21
US20100166071A1 (en) 2010-07-01
JP2009510906A (ja) 2009-03-12
KR20080049789A (ko) 2008-06-04
WO2007040889A2 (en) 2007-04-12
EP1946564A2 (en) 2008-07-23

Similar Documents

Publication Publication Date Title
CN101278564A (zh) 在基于块的视频中的运动预测错误隐藏的方法和装置
CN102687511B (zh) 运动信息的自适应编解码的方法和装置
CN101711481B (zh) 使用预测数据精选进行视频编码的方法和装置
CN102067601B (zh) 视频编码和解码中模板匹配预测(tmp)的方法和装置
CN101371585B (zh) 提供用于多视图视频编码的提供降低分辨率的更新模式的方法和装置
CN101472181B (zh) 用于视频编码的可配置性能运动估计的方法、装置和系统
CN101578874B (zh) 用于减少多视图编码视频中的照度补偿和/或色彩补偿的编码伪像的方法和装置
US9307241B2 (en) Video encoding method and a video encoding apparatus using the same
CN101288315B (zh) 隐藏丢失视频帧的方法和装置
US8428131B2 (en) Video encoder and decoder using region based coding and decoding techniques with sequential refresh
CN102204254A (zh) 使用隐式运动预测进行预测精细化的方法及装置
US20170208223A1 (en) Video encoding and decoding with improved error resilience
CN102893606A (zh) 帧内编码将像素指定给各组的块的方法和装置
US20160073135A1 (en) Method and apparatus for video error concealment using reference frame selection rules
CN101472176A (zh) 基于边界强度因子进行去块效应滤波的解码方法和装置
CN103141092A (zh) 针对视频压缩使用运动补偿的基于示例的超分辨率来编码视频信号的方法和设备
CN111131837A (zh) 运动补偿修正方法、编码方法、编码器及存储介质
CN116320473A (zh) 光流预测细化的方法和装置
CN116233466A (zh) 光流预测细化(prof)的方法和装置
CN117201781A (zh) 编码处理、解码处理方法及装置、存储介质
US9432694B2 (en) Signal shaping techniques for video data that is susceptible to banding artifacts
EP3509303B1 (en) Interframe bi-predictive coding method and device
US20050138532A1 (en) Apparatus and method for concealing errors in a frame
CN101309409A (zh) 一种解码方法和装置
CN115699736A (zh) 具有运动矢量细化的几何分区模式

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20081001