CN1984240A - 运动估计设备和运动估计方法 - Google Patents
运动估计设备和运动估计方法 Download PDFInfo
- Publication number
- CN1984240A CN1984240A CNA2006101670307A CN200610167030A CN1984240A CN 1984240 A CN1984240 A CN 1984240A CN A2006101670307 A CNA2006101670307 A CN A2006101670307A CN 200610167030 A CN200610167030 A CN 200610167030A CN 1984240 A CN1984240 A CN 1984240A
- Authority
- CN
- China
- Prior art keywords
- piece
- motion vector
- motion
- vector
- sad
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/587—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/55—Motion estimation with spatial constraints, e.g. at image or region borders
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/557—Motion estimation characterised by stopping computation or iteration based on certain criteria, e.g. error magnitude being too large or early exit
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/56—Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
Abstract
提供一种估计运动的设备和方法。所述设备包括:背景表示计算器,基于将被内插的帧的运动向量,计算表示将被内插的帧的背景运动的背景表示向量;块运动计算器,基于当前帧和先前帧,计算将被内插的帧的各个块的运动向量,向背景表示计算器提供运动向量,并且基于从背景表示计算器输出的背景表示向量,通过局部搜索计算各个块的背景运动向量;运动误差检测器,基于从块运动计算器输出的背景运动向量和背景运动向量,确定每个块是否处于文本区域中;以及运动校正单元,当每个块处于文本区域时基于每个块的外围块的运动向量,确定文本区域中的每个块是否处于边界区域中,并且当文本区域中的每个块处于边界区域中时校正边界区域中的每个块的运动向量。
Description
本申请要求于2005年12月14日在韩国知识产权局提交的第10-2005-0123392号韩国专利申请的优先级,该申请全部公开于此以资参考。
技术领域
本发明涉及一种运动估计设备和运动估计方法。更具体地说,本发明涉及一种最小化在文本区域中产生的运动误差的运动估计设备和运动估计方法。
背景技术
通常,在显示设备中使用帧速率转换器来转换帧速率对显示面板的时序(timing)调整、灰度表示等是有效的。为此,已经提出在帧速率转换器和/或解交错器中使用各个块的运动向量估计和补偿运动的方法,以显示自然的运动图像。然而,因为很难找到正确的运动向量,所以这种运动估计和补偿方法在实际使用中具有局限性。
例如,由于文本自身具有许多相似的边缘,因此当文本在运动背景中运动时,在运动背景中滚动文本在寻找其运动向量中有很大困难。
具体地说,由于运动估计误差,在文本区域和运动背景之间的边界区域中图像很容易失真。
因此,需要改进的用于估计运动的设备和方法。
发明内容
本发明的示例性实施例在于至少解决上述问题和/或缺点以及至少提供下述优点。因此,本发明的一个目的是提供一种能够减小文本区域的边界上的图像失真的运动估计设备和运动估计方法。
可通过提供运动估计设备实现本发明的上述和/或其它示例性方面,所述运动估计设备包括:背景表示计算器,基于将被内插的帧的运动向量,计算表示将被内插的帧的背景运动的背景表示向量;块运动计算器,基于当前帧和先前帧,计算将被内插的帧的各个块的运动向量,向背景表示计算器提供运动向量,并且基于从背景表示计算器输出的背景表示向量,通过局部搜索计算各个块的背景运动向量;运动误差检测器,基于从块运动计算器输出的背景运动向量和背景运动向量,确定每个块是否处于文本区域中;以及运动校正单元,当每个块处于文本区域时基于每个块的外围块的运动向量,确定文本区域中的每个块是否处于边界区域中,并且当文本区域中的每个块处于边界区域中时校正边界区域中的每个块的运动向量。
根据本发明的示例性实施例,背景表示计算器可包括:离散度计算器,计算从块运动计算器提供的帧的每个块的运动向量和每个块的外围块的运动向量之间的离散度,并且检测具有小于参考值的离散度的运动向量;直方图产生器,将检测的运动向量产生为直方图;以及表示确定单元,将通过直方图显示最频繁的向量确定为背景表示向量。
根据本发明的示例性实施例,块运动计算器可包括:候选向量计算器,基于当前帧和先前帧,计算关于将被内插的帧的每个块的多个候选向量;运动确定单元,根据准则选择所述多个候选向量中的一个,并且将选择的向量确定为每个块的运动向量;以及背景运动计算器,基于从背景表示计算器输出的背景表示向量,通过局部搜索计算每个块的表示运动向量。
根据本发明的示例性实施例,候选向量计算器可包括:平均运动计算器,基于每个块的外围块的运动向量,计算平均运动向量;行运动计算器,基于水平方向上的块的运动向量,产生搜索区域中的行运动向量;零运动计算器,在没有块运动的位置计算零运动向量;以及全运动计算器,通过在搜索区域中进行全搜索计算全运动向量。
根据本发明的示例性实施例,运动确定单元可基于根据平均运动向量的平均预测误差值、根据行运动向量的行预测误差值、根据零运动向量的零预测误差值和根据全运动向量的全预测误差值,选择平均运动向量、行运动向量、零运动向量和全运动向量中的至少一个作为块的最终运动向量,并将其输出。
根据本发明的示例性实施例,运动误差检测器可包括:文本区域检测器,基于零预测误差值、全预测误差值、确定的运动向量、根据所述运动向量的预测误差值、背景运动向量和根据背景运动向量的预测误差值中的至少一个,确定每个块是否为文本块;文本标记产生器,当块为文本块时,产生所述块的文本标记;以及文本模式确定单元,计算每一帧连续存在文本标记的块的数量,并且如果计算的数量超过参考值,则输出文本模式信号。
根据本发明的示例性实施例,如果将被处理的块满足下面的等式,则文本区域检测器确定将被处理的块是文本块:
其中,MVo x和MVo y分别表示运动向量MVox方向上的位移和y方向上的位移。
根据本发明的示例性实施例,如果将被处理的块还满足下面的等式,则文本区域检测器确定将被处理的块是文本块:
SADfx>>THα&SAD0>α×SADfs
其中,SADfs表示通过全搜索的最小SAD值,SAD0表示通过运动向量的最小SAD值,THα表示阈值,α表示权值。
根据本发明的示例性实施例,如果将被处理的块还满足下面的等式,则文本区域检测器确定将被处理的块是文本块:
SADzero>>β×SADfs
其中,SADZERO表示零运动向量的最小SAD值,β表示权值。
根据本发明的示例性实施例,如果将被处理的块还满足下面的等式a和等式b中的一个,则文本区域检测器确定将被处理的块是文本块:
a.SADb>>ω×SADfx&MVb≠MV0&SADb<SAD0 或
b.SAD0≈ρ×SADfx&MVb≈MV0&SADb<SAD0
其中,ω和ρ表示权值。
根据本发明的示例性实施例,当连续存在至少三个文本标记时确定相应块处于文本区域中,并且启动所述块的文本标记。
根据本发明的示例性实施例,运动校正单元可包括:边界区域检测器,在x轴方向上和y轴方向上投影文本区域中的块的外围块的运动向量,计算平均向量的离散度,并且如果平均向量中具有最大离散度的平均向量大于参考值,则确定块是边界块。
根据本发明的示例性实施例,运动校正单元可包括:向量校正单元,将边界块的运动向量校正为在计算的平均向量中与背景运动向量差异最大的平均向量。
根据本发明的示例性实施例,运动估计设备还可包括:帧内插器,基于校正的运动向量产生将被内插的帧。
可通过提供运动估计方法实现本发明的上述和/或其它示例性方面,所述运动估计方法包括:基于当前帧和先前帧,计算将被内插的帧的每个块的运动向量,并将其输出;基于将被内插的帧的运动向量,计算表示将被内插的帧的背景运动的背景表示向量;基于背景表示向量,通过局部搜索计算每个块的背景运动向量;基于运动向量和背景运动向量,确定每个块是否处于文本区域中;以及当每个块处于文本区域中时,基于文本区域中块的外围块的运动向量,确定文本区域中的块是否处于边界区域中,并且当文本区域中的块处于边界区域中时,校正边界区域中的块的运动向量。
根据本发明的示例性实施例,计算背景表示向量可包括:计算每帧的每个块的运动向量和每个块的外围块的运动向量之间的离散度;检测具有小于参考值的离散度的向量,并且产生直方图;以及将通过直方图最频繁出现的向量确定为背景表示向量。
根据本发明的示例性实施例,计算每个块的运动向量可包括:基于当前帧和先前帧,计算将被内插的帧的每个块的多个候选向量;根据准则选择多个候选向量中的一个,并且将选择的候选向量确定为每个块的运动向量;以及基于计算的背景表示向量,通过局部搜索计算每个块的表示运动向量。
根据本发明的示例性实施例,计算多个候选向量可包括:基于每个块的外围块的运动向量,计算平均运动向量;基于水平方向上的块的运动向量,产生搜索区域中的行运动向量;在块没有运动的位置计算零运动向量;以及通过在搜索区域中进行全搜索计算全运动向量。
根据本发明的示例性实施例,选择多个候选向量中的一个,并将选择的候选向量确定为每个块的运动向量可包括:基于根据平均运动向量的平均预测误差值、根据行运动向量的行预测误差值、根据零运动向量的零预测误差值和根据全运动向量的全预测误差值,将平均运动向量、行运动向量、零运动向量和全运动向量中的至少一个选择为每个块的运动向量,并将其输出。
根据本发明的示例性实施例,确定每个块是否处于文本区域中可包括:基于零预测误差值、全预测误差值、确定的运动向量、根据所述运动向量的预测误差值、背景运动向量和根据背景运动向量的预测误差值中的至少一个,检测每个块是否在文本区域中;如果块处于文本区域中,则产生所述块的文本标记;以及计算每一帧连续存在文本标记的块的数量,并且如果计算的数量超过参考值,则输出文本模式信号。
根据本发明的示例性实施例,确定每个块是否处于文本区域中可包括:如果每个块满足下面的等式,则确定每个块处于文本区域中:
或
SADfx>>THα&SAD0>α×SADfs
SADzero>>β×SADfs
a.SAD>>ω×SADfx&MVb≠MV0&SADb<SAD0 或
b.SAD0≈ρ×SADfx&MVb≈MV0&SADb<SAD0
根据本发明的示例性实施例,计算块的数量并输出文本模式信号可包括:确定连续存在至少三个文本标记的块处于文本区域中,并且启动所述块的文本标记。
根据本发明的示例性实施例,校正运动向量可包括:如果块处于文本区域中,则通过在x轴方向上和y轴方向上投影块的外围块的运动向量来计算平均向量;以及计算已计算的平均向量的离散度,并且如果平均向量中具有最大离散度的平均向量大于参考值,则确定文本区域中的块处于边界区域中。
根据本发明的示例性实施例,校正运动向量可包括:当文本区域中的块处于边界区域中时,将边界区域中的块的运动向量校正为在计算的平均向量中与背景运动向量差异最大的平均向量。
根据本发明的示例性实施例,运动估计方法还可包括:基于校正的运动向量,产生将被内插的帧。
附图说明
通过下面结合附图对示例性实施例进行的描述,本发明的上述和/或其它方面和优点将会变得更加清楚,其中:
图1是根据本发明的示例性实施例的运动估计设备的控制框图;
图2是根据本发明的示例性实施例的块运动计算器的详细框图;
图3是根据本发明的示例性实施例的背景表示计算器的详细框图;
图4是根据本发明的示例性实施例的运动误差检测器和运动校正单元的详细框图;
图5是示出根据本发明的示例性实施例的运动误差检测器确定块是否在文本区域和文本模式的方法的流程图;
图6是根据本发明的示例性实施例的解释由运动校正单元执行的运动校正方法的示图;
图7是显示通过运动估计设备根据示例性运动估计方法校正的结果图像和未校正图像的示图。
在整个附图中,相同的附图标号将被理解为表示相同的部件、特点和结构。
具体实施方式
提供例如详细的结构和部件的在说明书中定义的内容以帮助全面理解本发明的实施例,并且这些内容只是示例性的。因此,本领域的普通技术人员将认识到,在不脱离本发明的范围和精神的情况下,可对在此描述的实施例进行各种改变和修改。另外,为了清楚和简明,将省略对已知功能和结构的描述。现将对附图中示出的本发明的示例性实施例进行详细地介绍。
根据本发明的示例性实施例的使因在文本区域中的运动误差而引起的图像失真最小化的运动估计设备和运动估计方法引入下面的假设。
<假设1>文本区域属于能够从背景区域分离的对象区域。
<假设2>在屏幕上滚动的文本具有单一方向性的运动。
<假设3>可将滚动的文本插入到原始图像。
<假设4>滚动的文本在区域中连续运动。
<假设5>文本区域和背景区域在亮度上存在差异。
<假设6>在具有不同运动向量的边界上在文本区域中产生的失真明显。
在上述假设下,根据本发明的示例性实施例,在运动估计设备和运动估计方法中,从背景区域分离对象区域,检测对象区域的文本区域,检测文本区域的具有不同运动的边界区域,并且校正边界区域的运动向量。
图1是根据本发明的示例性实施例的运动估计设备的控制框图。参照图1,运动估计设备可包括:块运动计算器10、背景表示计算器20、运动误差检测器30和运动校正单元40。
块运动计算器10基于当前帧和先前帧,计算与将被内插的帧的块相应的运动向量。将参照图2详细描述块运动计算器10。
参照图2,块运动计算器10包括候选向量计算器60和运动确定单元70。候选向量计算器60基于当前帧和先前帧,计算与每个块相应的多个候选向量。运动确定单元70根据准则将所述多个候选向量中的一个确定为运动向量。
如图2所示,候选向量计算器60可包括:全运动计算器61、平均运动计算器63、行运动计算器65和零运动计算器67。
全运动计算器61将当前帧分成多个块,每个块具有一定大小,并且全运动计算器61将当前帧中将被进行运动估计的块与先前帧的搜索区域进行比较,以估计全运动向量MVf。
全运动计算器61将全搜索块匹配(FSBM)算法应用于计算多个运动预测误差值。全运动计算器61从具有最小运动预测误差值的位置估计各个块的全运动向量MVf。可通过各种方法计算运动预测误差值,诸如绝对差值和(SAD)方法、平均绝对差值(MAD)方法等。
平均运动计算器63基于从全运动计算器61接收的全运动向量MVf,计算与当前块临近的外围块的运动向量的平均向量。也就是说,平均运动计算器63配置包括当前块的具有M×N的大小的窗口,并计算包括在该窗口中的运动向量的平均向量。
例如,窗口可具有3×3的大小。更大的窗口更好的反映整个运动。
为了简化硬件配置并减少计算时间,平均运动计算器63可积累先前帧的块的运动向量,以获得平均运动向量MVmean。也就是说,需要在当前块之后计算运动向量以获得全运动向量MVf,这样增加了时间延迟。由于这个原因,使用先前帧的块的运动向量来获得平均运动向量MVmean。
行运动计算器65使用在水平方向上连续排列的块的运动向量来计算表示当前块的水平运动的度的行运动向量MVline。
可通过下面的等式1和等式2来获得行运动向量MVline。
[等式1]
[等式2]
LineMV(n)=LocalMin(MV_Avg(n),Search_Range)
其中,n表示垂直方向上块的index,i表示水平方向上块的index。
如从等式1中看到的,行运动计算器65基于当前块所属的行上的块的运动向量,计算行平均运动向量MV_Avg(n)。
在示例性实施例中,在假设在表示相同对象的多个块一起运动的全运动中的运动误差具有高斯分布的情况下执行操作。经受全运动的块的运动向量的平均值几乎接近实际全运动。随着获得平均值所使用的块的数量的增加,准确度也变高。
例如,由于在新闻等中的文本滚动占据了屏幕的大部分下部区域,因此如果假设使用480像素的标准清晰度(SD)等级,并且每个块的大小是8×8,则块的数量是480/8,换句话说,就是60。因此,当实际上产生文本滚动时,可通过对相应块的运动向量进行平均来获得与实际正确运动相似的运动向量。
行运动计算器65在以由等式1获得的平均值为中心的搜索区域内获得局部最小值,并且计算该局部最小值作为行运动向量MVline。
在假设在搜索区域中的SAD值中的局部最小值周围存在正确运动向量的情况下执行操作。实际的SAD值指示局部最小值存在于块近似匹配的区域。
如果在用于计算全运动向量MVf的全搜索方法中搜索区域的大小为N×M,则可使用较小的搜索区域,诸如N/2×M/2等来获得行运动向量MVline。
零运动计算器67在以运动向量为零的位置为中心的小搜索区域内寻找局部最小值,并且计算找到的局部最小值作为零运动向量MVzero。在示例性实施例中,零运动计算器67在以特定位置(零运动向量(0,0))为中心的M×M的搜索区域内获得局部最小值,类似于行运动向量MVline。
这是因为从运动向量(0,0)周围的最小值获得SAD值,而不是仅获得运动向量(0,0)SAD值,对使噪声等的影响最小化是有效的。
运动确定单元70接收全运动向量MVf、平均运动向量MVmean、行运动向量MVline和零运动向量MVzero,并且选择这些向量中的一个作为运动向量,并将其输出。更加详细地说,运动确定单元70将根据全运动向量MVf的全SAD值SADfs、根据平均运动向量MVmean的平均SAD值SADmean、根据行运动向量MVline的行SAD值SADline和根据零运动向量MVzero的零SAD值SADzero相互进行比较。基于通过运动确定单元70比较的结果,复用器选择与所述多个SAD值中的最小SAD值相应的运动向量作为最终运动向量,并将其输出。在示例性实施例中,可以通过调整权值给出运动向量的优先级,其中,各个SAD值将与所述权值相乘。
硬件配置需要被简化以获得这种运动向量。这就需要共享运动估计。可在全搜索运动估计器中共享平均运动计算器63、行运动计算器65和零运动计算器67分别获得局部最小值的处理。
平均运动计算器63在具有一定大小(例如3×3)的平均向量MVmean周围获得局部最小值,行运动计算器65在行平均向量MVline周围获得局部最小值,并且零运动计算器67在零向量MVzero周围获得局部最小值。因此,如果全搜索运动估计器设置各个搜索区域,则可计算并存储相应搜索区域中的SAD值。
因此,可仅通过全搜索运动估计器来计算平均运动向量、零运动向量和行运动向量。在示例性实施例中,由于通过全运动计算器61执行通过全搜索的运动估计,因此可通过共享全运动计算器61的硬件来提取各个运动向量。
背景表示计算器20基于从块运动计算器10输出的运动向量,检测在当前运动向量的外围运动向量之间相关性最高且在外围向量中出现最频繁的向量作为相应帧的背景表示向量。更详细地说,如图3所示,背景表示计算器20包括:离散度计算器21、直方图产生器23和表示确定单元25。
在示例性实施例中,离散度计算器21根据下面的等式3计算接收的运动向量和外围运动向量之间的离散度,并检测具有小于参考值的离散度的运动向量MVa。
[等式3]
其中,Dmv表示运动向量的离散度,MVc表示将被处理的当前块的运动向量,MVi表示当前块的外围运动向量。
如果产生通过离散度计算器21检测的运动向量MVa,并通过直方图产生器23将其存储为运动向量直方图,则表示确定单元25将由直方图产生器23产生的运动向量直方图中出现最频繁的运动向量确定为背景表示向量MVback。
在示例性实施例中,如图2所示,块运动计算器10可还包括背景运动计算器80。背景运动计算器80基于从背景表示计算器20输出的背景表示向量MVback,通过在区域中进行局部搜索计算各个块的背景运动向量MV’back。
在示例性实施例中,运动误差检测器30基于从块运动计算器10输出的运动向量MV0、根据运动向量MV0的最小SAD值SAD0、背景运动向量MVback、根据背景运动向量MVback的最小SAD值SADb、根据全运动向量MVf的最小SAD值SADf和零SAD值SADZERO,检测文本区域。
将参照图4和图5更加详细地描述运动误差检测器30。
参照图4,运动误差检测器30包括:文本区域检测器31、文本标记产生器33和文本模式产生器35。
文本区域检测器31确定每个块是否满足特定等式。文本区域检测器31通过图5所示地操作100至操作105确定每个块是否为文本块。所述等式定义如下。
[等式4]
[等式5]
SADfx>>THα&SAD0>α×SADfs
[等式6]
SADzero>>β×SADfs
[等式7]
a.SADb》ω×SADfx&MVb≠MV0&SADb<SAD0 或
b.SAD0≈ρ×SADfx&MVb≈MV0&SADb<SAD0
其中,MVo x和MVo y分别表示运动向量的x方向位移和y方向位移,THα表示阈值,α、β、ω和ρ表示权值。
首先,在操作100,文本区域检测器31确定运动向量MV0是否满足等式4,所述等式4为上述<假设2>建模以表示单一方向特性,所述单一方向特性是表示对象的运动的运动向量MV0仅具有x方向运动或y方向运动。
然后,在操作101,确定是否满足为上述<假设3>建模的等式5。当使用插入到原始场景中的文本区域中的具有相同运动的两个帧数据尝试块匹配时,新创建原始场景中不存在的区域或存在的区域消失,因而增加最小SAD值。其结果是,根据表示对象区域的运动的运动向量MV0的SAD值SAD0变得比根据全搜索的最小SAD值SADfs大。
接下来,在操作102,文本区域检测器31确定是否满足为上述<假设5>建模的等式6。零SAD值SADZERO是对没有运动的块的两帧之间亮度差的和。在亮度高于其外围区域的文本区域中,零SAD值SADZERO将具有较大的值。
接下来,在操作103和操作104,确定是否满足为上述<假设1>建模以检测对象区域的等式7。在这里,考虑背景的运动与对象的运动不同的情况(操作103)和背景的运动与对象的运动相似的情况(操作104)分别定义等式7。
等式7的部分a与背景的运动与对象的运动不同的情况相应,特别是与当表示背景的运动的背景运动向量MVb与表示对象的运动的运动向量MV0不同时相应。另外,由于与所述情况相应的区域属于对象区域,因此通过背景运动向量MVb计算的最小SAD值SADb大于由对象的运动向量MV0计算的最小SAD值SAD0,并根据全搜索在最小SAD值SADb和最小SAD值SADmin之间的差异较大。
另一方面,等式7的部分b与背景的运动与对象的运动相似的情况相应,特别是与当表示背景的运动的背景运动向量MVb与表示对象的运动的运动向量MV0相似时相应,因此,最小SAD值SADb与最小SAD值SAD0相似。然而,由于与所述情况相应的区域属于背景和对象的边界,因此最小SAD值SADb或SAD0与根据全搜索的最小SAD值SADfs具有较大的差异。
如果满足上述的所有等式,则在操作105,文本标记产生器33将相应块的文本标记设置为1。否则,在操作106,文本标记产生器33将相应块的文本标记设置为0。
接下来,在操作200,文本模式产生器35确定在块中是否连续存在至少三个文本标记。如果在所述块中连续存在至少三个文本标记,则文本模式产生器35在操作201将所述块确定为文本区域,并且启动文本标记。否则,文本标记失效,并且在操作202,尽管相应块满足等式4至等式7,但是确定相应块不在文本区域。在操作200用于文本模式产生器35的等式与上述<假设4>相应。
另外,如果在操作203文本区域中的块的数量(即,具有文本标记为1的块的数量)超过每一帧的参考值,则在操作204,文本模式产生器35将文文本模式信号设置为1。否则,在操作205,文本模式产生器35将文文本模式信号设置为0。
在示例性实施例中,运动校正单元40确定文本区域中的块是否属于背景和对象之间的边界区域,并且如果文本区域中的块属于边界区域,则校正块的运动向量。将参照图4和图6更加详细地描述运动校正单元40。
如图4所示,运动校正单元40包括:边界区域检测器41和向量校正单元43。
对于处于设置为1的文本模式中的帧,边界区域检测器41确定具有文本标记为1的块是否处于边界区域。
首先,如图6的(A)中所示,边界区域检测器41以将被处理的块为中心配置具有3×3大小的窗口,并且x方向和y方向上投影运动向量。然后,边界区域检测器41获得投影方向上存在的向量的平均值。然后,边界区域检测器41根据投影方向获得x方向上平均向量b的离散度和y方向上平均向量c的离散度。也就是说,离散度越大,运动向量之间的差异就越大。例如,如果对两个投影方向的离散度为D和E,则选择与值D和E中较大的值相应的方向。如果选择的离散度大于参考值,则确定相应区域处于对象和背景之间的边界区域。在图6中,由于投影在x方向上的运动向量的离散度大于投影在y方向上的运动向量的离散度,因此确定边界存在于x方向上。边界区域检测器41的确定与上述<假设6>相应。
在边界区域中,向量校正单元43将被处理的块的运动向量校正为存在于选择的方向上的平均向量中具有最大值的向量。如图6所示,将中心块的运动向量a校正为投影在x方向上的平均向量中具有最大值的最下端向量a’。既不在文本区域中也不在边界区域中的块的运动向量不受运动校正单元40的校正。
在示例性实施例中,如图1所示,运动估计设备可包括:帧内插器50。帧内插器50基于已校正或未校正的运动向量来校正将被插入到当前帧和先前帧之间的内插帧的数据,并将其输出。
参照图7,没有应用本发明的图像(A)和应用本发明的示例性实施例的图像(B)在文本的边界区域有明显地不同。同样,通过在处理对象区域和背景区域之间的边界区域中最小化运动误差,能够最小化边界区域中的图像失真。
在如上所述的示例性实施例中,候选向量计算器60产生四个候选向量,然而,本发明不限于此。另外,文本模式产生器35当至少3个块的文本标记为1时确定相应块处于文本区域中。然而,本发明也可当不同数量的块的文本标记为1时确定相应块处于文本区域中。
从上述描述中明显看出,本发明提供了一种减小文本区域的边界上的图像失真的运动估计设备和运动估计方法。
尽管已经参照其特定的示例性实施例显示和描述了本发明,但本领域的技术人员应该理解,在不脱离本发明的精神和原理的情况下,可以对这些实施例进行改变,本发明的范围由所附权利要求及其等同物限定。
Claims (25)
1、一种运动估计设备,包括:
背景表示计算器,基于将被内插的帧的运动向量,计算表示将被内插的帧的背景运动的背景表示向量;
块运动计算器,基于当前帧和先前帧,计算将被内插的帧的各个块的运动向量,向背景表示计算器提供运动向量,并且基于从背景表示计算器输出的背景表示向量,通过局部搜索计算各个块的背景运动向量;
运动误差检测器,基于从块运动计算器输出的背景运动向量和背景运动向量,确定每个块是否处于文本区域中;以及
运动校正单元,当每个块处于文本区域时基于每个块的外围块的运动向量,确定文本区域中的每个块是否处于边界区域中,并且当文本区域中的每个块处于边界区域中时校正边界区域中的每个块的运动向量。
2、如权利要求1所述的运动估计设备,其中,背景表示计算器包括:
离散度计算器,计算从块运动计算器提供的帧的每个块的运动向量和每个块的外围块的运动向量之间的离散度,并且检测具有小于参考值的离散度的运动向量;
直方图产生器,将检测的运动向量产生为直方图;以及
表示确定单元,将通过直方图显示最频繁的向量确定为背景表示向量。
3、如权利要求1所述的运动估计设备,其中,块运动计算器可包括:
候选向量计算器,基于当前帧和先前帧,计算关于将被内插的帧的每个块的多个候选向量;
运动确定单元,根据标准选择所述多个候选向量中的一个,并且将选择的向量确定为每个块的运动向量;以及
背景运动计算器,基于从背景表示计算器输出的背景表示向量,通过局部搜索计算每个块的表示运动向量。
4、如权利要求3所述的运动估计设备,其中,候选向量计算器包括:
平均运动计算器,基于每个块的外围块的运动向量,计算平均运动向量;
行运动计算器,基于水平方向上的块的运动向量,产生搜索区域中的行运动向量;
零运动计算器,在没有块运动的位置计算零运动向量;以及
全运动计算器,通过在搜索区域中进行全搜索计算全运动向量。
5、如权利要求4所述的运动估计设备,其中,运动确定单元基于根据平均运动向量的平均预测误差值、根据行运动向量的行预测误差值、根据零运动向量的零预测误差值和根据全运动向量的全预测误差值,选择平均运动向量、行运动向量、零运动向量和全运动向量中的至少一个作为块的最终运动向量,并将其输出。
6、如权利要求5所述的运动估计设备,其中,运动误差检测器包括:
文本区域检测器,基于零预测误差值、全预测误差值、确定的运动向量、根据所述运动向量的预测误差值、背景运动向量和根据背景运动向量的预测误差值中的至少一个,确定每个块是否为文本块;
文本标记产生器,当块为文本块时,产生所述块的文本标记;以及
文本模式确定单元,计算每一帧连续存在文本标记的块的数量,并且如果计算的数量超过参考值,则输出文本模式信号。
8、如权利要求7所述的运动估计设备,其中,如果将被处理的块还满足下面的等式,则文本区域检测器确定将被处理的块是文本块:
SADfx>>THα& SAD0>α×ASDfs
其中,SADfs表示通过全搜索的最小SAD值,SAD0表示通过运动向量的最小SAD值,THα表示阈值,α表示权值。
9、如权利要求8所述的运动估计设备,其中,如果将被处理的块还满足下面的等式,则文本区域检测器确定将被处理的块是文本块:
SADzero>>β×SADfs
其中,SADZERO表示零运动向量的最小SAD值,β表示权值。
10、如权利要求9所述的运动估计设备,其中,如果将被处理的块还满足下面的等式a和等式b中的一个,则文本区域检测器确定将被处理的块是文本块:
a.SADb>>ω×SADfx & MVb≠MV0 & SADb<SAD0或
b.SAD0≈ρ×SADfx & MVb≈MV0 & SADb<SAD0
其中,ω和ρ表示权值。
11、如权利要求10所述的运动估计设备,其中,当连续存在至少三个文本标记时确定相应块处于文本区域中,并且启动所述块的文本标记。
12、如权利要求1或11所述的运动估计设备,其中,运动校正单元包括:边界区域检测器,在x轴方向上和y轴方向上投影文本区域中的块的外围块的运动向量以计算平均向量,计算平均向量的离散度,并且如果平均向量中具有最大离散度的平均向量大于参考值,则确定块是边界块。
13、如权利要求12所述的运动估计设备,其中,运动校正单元包括:向量校正单元,将边界块的运动向量校正为在计算的平均向量中与背景运动向量差异最大的平均向量。
14、如权利要求1所述的运动估计设备,其中,还包括:帧内插器,基于校正的运动向量产生将被内插的帧。
15、一种运动估计方法,包括:
基于当前帧和先前帧,计算将被内插的帧的每个块的运动向量,并将其输出;
基于将被内插的帧的运动向量,计算表示将被内插的帧的背景运动的背景表示向量;
基于背景表示向量,通过局部搜索计算每个块的背景运动向量;
基于运动向量和背景运动向量,确定每个块是否处于文本区域中;以及
当每个块处于文本区域中时,基于文本区域中块的外围块的运动向量,确定文本区域中的块是否处于边界区域中,并且当文本区域中的块处于边界区域中时,校正边界区域中的块的运动向量。
16、如权利要求15所述的运动估计方法,其中,计算背景表示向量包括:
计算每帧的每个块的运动向量和每个块的外围块的运动向量之间的离散度;
检测具有小于参考值的离散度的向量,并且产生直方图;以及
将通过直方图最频繁出现的向量确定为背景表示向量。
17、如权利要求16所述的运动估计方法,其中,计算每个块的运动向量包括:
基于当前帧和先前帧,计算将被内插的帧的每个块的多个候选向量;
根据准则选择多个候选向量中的一个,并且将选择的候选向量确定为每个块的运动向量;以及
基于计算的背景表示向量,通过局部搜索计算每个块的表示运动向量。
18、如权利要求17所述的运动估计方法,其中,计算多个候选向量包括:
基于每个块的外围块的运动向量,计算平均运动向量;
基于水平方向上的块的运动向量,产生搜索区域中的行运动向量;
在块没有运动的位置计算零运动向量;以及
通过在搜索区域中进行全搜索计算全运动向量。
19、如权利要求18所述的运动估计方法,其中,选择多个候选向量中的一个,并将选择的候选向量确定为每个块的运动向量包括:基于根据平均运动向量的平均预测误差值、根据行运动向量的行预测误差值、根据零运动向量的零预测误差值和根据全运动向量的全预测误差值,将平均运动向量、行运动向量、零运动向量和全运动向量中的至少一个选择为每个块的运动向量,并将其输出。
20、如权利要求19所述的运动估计方法,其中,确定每个块是否处于文本区域中可包括:
基于零预测误差值、全预测误差值、确定的运动向量、根据所述运动向量的预测误差值、背景运动向量和根据背景运动向量的预测误差值中的至少一个,检测每个块是否在文本区域中;
如果块处于文本区域中,则产生所述块的文本标记;以及
计算每一帧连续存在文本标记的块的数量,并且如果计算的数量超过参考值,则输出文本模式信号。
21、如权利要求20所述的运动估计方法,其中,确定每个块是否处于文本区域中包括:如果每个块满足下面的等式,则确定每个块处于文本区域中:
或
SADfx>>THα& SAD0>α×SADfs,
SADzero>>β×SADfs,
a.SADb>>ω×SADfx& MVb≠MV0 & SADb<SAD0或
b.SAD0≈ρ×SADfx & MVb≈MV0 & SADb<SAD0。
22、如权利要求21所述的运动估计方法,其中,计算块的数量并输出文本模式信号包括:确定连续存在至少三个文本标记的块处于文本区域中,并且启动所述块的文本标记。
23、如权利要求15或22所述的运动估计方法,其中,校正运动向量包括:
如果块处于文本区域中,则通过在x轴方向上和y轴方向上投影块的外围块的运动向量来计算平均向量;以及
计算已计算的平均向量的离散度,并且如果平均向量中具有最大离散度的平均向量大于参考值,则确定文本区域中的块处于边界区域中。
24、如权利要求23所述的运动估计方法,其中,校正运动向量包括:当文本区域中的块处于边界区域中时,将边界区域中的块的运动向量校正为在计算的平均向量中与背景运动向量差异最大的平均向量。
25、如权利要求15或24所述的运动估计方法,还包括:基于校正的运动向量,产生将被内插的帧。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050123392 | 2005-12-14 | ||
KR1020050123392A KR20070063304A (ko) | 2005-12-14 | 2005-12-14 | 움직임 추정장치 및 움직임 추정방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1984240A true CN1984240A (zh) | 2007-06-20 |
Family
ID=38139322
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2006101670307A Pending CN1984240A (zh) | 2005-12-14 | 2006-12-13 | 运动估计设备和运动估计方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20070133685A1 (zh) |
KR (1) | KR20070063304A (zh) |
CN (1) | CN1984240A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101888473B (zh) * | 2009-05-14 | 2012-05-23 | 联咏科技股份有限公司 | 文字保护装置及动态适应性去交错装置 |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4513819B2 (ja) * | 2007-03-19 | 2010-07-28 | 株式会社日立製作所 | 映像変換装置、映像表示装置、映像変換方法 |
US8300958B2 (en) * | 2007-07-11 | 2012-10-30 | Samsung Electronics Co., Ltd. | System and method for detecting scrolling text in mixed mode film and video |
US8514939B2 (en) * | 2007-10-31 | 2013-08-20 | Broadcom Corporation | Method and system for motion compensated picture rate up-conversion of digital video using picture boundary processing |
WO2009131382A2 (en) * | 2008-04-22 | 2009-10-29 | Core Logic Inc. | Apparatus and method for correcting moving image wavering |
KR100973561B1 (ko) * | 2008-06-25 | 2010-08-03 | 삼성전자주식회사 | 표시장치 |
US9100535B2 (en) * | 2008-10-22 | 2015-08-04 | Entropic Communications, Llc | Device and method for motion estimation and compensation |
US8411738B2 (en) * | 2009-03-12 | 2013-04-02 | Samsung Electronics Co., Ltd. | System and method for identification of vertical scrolling regions in digital video |
CN101931739A (zh) * | 2009-06-23 | 2010-12-29 | 鸿富锦精密工业(深圳)有限公司 | 绝对误差总和值估算系统及方法 |
JP4873765B2 (ja) * | 2009-11-20 | 2012-02-08 | キヤノン株式会社 | 映像信号処理装置及び映像信号処理方法 |
TW201234859A (en) * | 2011-02-01 | 2012-08-16 | Acer Inc | Frame rate up-conversion device and method thereof |
TW201322777A (zh) * | 2011-11-25 | 2013-06-01 | Novatek Microelectronics Corp | 偵測背景移動向量的方法 |
KR102103277B1 (ko) * | 2013-04-12 | 2020-04-22 | 삼성전자주식회사 | 이미지를 관리하는 방법 및 그 전자 장치 |
KR102085035B1 (ko) * | 2014-09-29 | 2020-03-05 | 에스케이 텔레콤주식회사 | 객체 인식을 위한 객체 후보영역 설정방법 및 장치 |
CN106157328B (zh) * | 2015-04-20 | 2019-05-03 | 欧姆龙株式会社 | 运动判定装置、运动判定方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5832234A (en) * | 1995-09-29 | 1998-11-03 | Intel Corporation | Encoding images using block-based macroblock-level statistics |
-
2005
- 2005-12-14 KR KR1020050123392A patent/KR20070063304A/ko not_active Application Discontinuation
-
2006
- 2006-12-13 US US11/637,676 patent/US20070133685A1/en not_active Abandoned
- 2006-12-13 CN CNA2006101670307A patent/CN1984240A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101888473B (zh) * | 2009-05-14 | 2012-05-23 | 联咏科技股份有限公司 | 文字保护装置及动态适应性去交错装置 |
Also Published As
Publication number | Publication date |
---|---|
US20070133685A1 (en) | 2007-06-14 |
KR20070063304A (ko) | 2007-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1984240A (zh) | 运动估计设备和运动估计方法 | |
KR100699261B1 (ko) | 움직임 에러 검출장치와 이를 포함하는 움직임 에러보정장치와 이에 의한 움직임 에러 검출방법 및 움직임에러 보정방법 | |
CN101953167B (zh) | 减少光晕的图像插值 | |
US6219436B1 (en) | Motion vector estimation and detection of covered/uncovered image parts | |
US8340186B2 (en) | Method for interpolating a previous and subsequent image of an input image sequence | |
US8335258B2 (en) | Frame interpolation device and frame interpolation method | |
US20180176574A1 (en) | Method and system for video frame interpolation based on optical flow method | |
US20070009038A1 (en) | Motion estimator and motion estimating method thereof | |
JP2004312680A (ja) | スクロールされるテキストまたはグラフィックデータの検出が可能な動き推定装置および方法 | |
CN103702128B (zh) | 一种应用于视频帧速率上转换的插值帧生成方法 | |
US20080095399A1 (en) | Device and method for detecting occlusion area | |
EP1287492A2 (en) | Motion estimator for reduced halos in motion compensated picture rate up-conversion | |
US20110050993A1 (en) | Motion estimating method and image processing apparatus | |
CN101557516B (zh) | 视频质量评估方法及装置 | |
US8269885B2 (en) | Fade in/fade-out fallback in frame rate conversion and motion judder cancellation | |
US20060188022A1 (en) | Motion estimation apparatus and method | |
EP1039746B1 (en) | Line interpolation method and apparatus | |
US20080239144A1 (en) | Frame rate conversion device and image display apparatus | |
US20130176300A1 (en) | Disparity maps in uniform areas | |
US8817869B2 (en) | Image processing device and method, and image display device and method | |
EP2136548B1 (en) | Image processing apparatus, image processing method, and program | |
US9106926B1 (en) | Using double confirmation of motion vectors to determine occluded regions in images | |
US20090046202A1 (en) | De-interlace method and apparatus | |
JP3175914B2 (ja) | 画像符号化方法および画像符号化装置 | |
US20090046208A1 (en) | Image processing method and apparatus for generating intermediate frame image |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20070620 |
|
C20 | Patent right or utility model deemed to be abandoned or is abandoned |