CN1774933A - 确定视频编码器中的自适应运动矢量的搜索范围的方法及设备 - Google Patents
确定视频编码器中的自适应运动矢量的搜索范围的方法及设备 Download PDFInfo
- Publication number
- CN1774933A CN1774933A CNA2004800100131A CN200480010013A CN1774933A CN 1774933 A CN1774933 A CN 1774933A CN A2004800100131 A CNA2004800100131 A CN A2004800100131A CN 200480010013 A CN200480010013 A CN 200480010013A CN 1774933 A CN1774933 A CN 1774933A
- Authority
- CN
- China
- Prior art keywords
- motion vector
- value
- hunting zone
- adaptive motion
- adaptive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000013598 vector Substances 0.000 title claims abstract description 224
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 79
- 238000000034 method Methods 0.000 title claims abstract description 62
- 230000000052 comparative effect Effects 0.000 claims description 4
- 230000006835 compression Effects 0.000 description 9
- 238000007906 compression Methods 0.000 description 9
- 230000014509 gene expression Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 229910020896 PMVx Inorganic materials 0.000 description 3
- 229910020894 PMVy Inorganic materials 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/57—Motion estimation characterised by a search window with variable size or shape
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/162—User input
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
公开了一种用于视频编码器中的确定自适应运动矢量的搜索范围的方法及设备。确定自适应运动矢量的搜索范围的方法确定邻接视频编码器中当前宏块的相邻块的数量,所述视频编码器接收代表连续图像的输入图像信息,并将所述输入图像信号的图像分为多个宏块(MB),以估计宏块的运动矢量的运动,以便编码图像。根据确定的结果,如果相邻块的数量多于2,则通过得到相邻块的运动矢量的幅度确定具有最大运动的运动矢量。定义当前宏块的自适应运动矢量的搜索范围的最小值,并将具有最大运动的运动矢量的幅度与自适应运动矢量的搜索范围的最小值进行比较,以便将较大的值确定为自适应运动矢量的搜索范围的值。之后,将自适应运动矢量的搜索范围的值与用户所定义的自适应运动矢量的搜索范围的值进行比较,以便将较小的值确定为最终自适应运动矢量的搜索范围的值。
Description
技术领域
本发明涉及一种用于确定视频编码器中的自适应运动矢量的搜索范围的方法及设备,更具体地,涉及一种通过根据视频编码器中相邻宏块的运动矢量估计运动矢量的范围,确定自适应运动矢量的搜索范围的方法及设备,所述视频编码器接收表示图像连续性的输入图像信号,并将输入图像信号的图像分为多个宏块(MB),以搜索宏块的运动矢量的运动,以便编码图像。
背景技术
最近,已经提出了各种用于编码和压缩运动画面或静止图像的技术和标准。提供这些标准以有效、高性能地压缩和编码图像。目前,已经公布或提出了MPEG-1、MPEG-2、MPEG-4、H.261、H.263和JVT方法,作为与运动画面或静止图像的图像编码有关的标准。
这里,JVT方法采用运动估计,与上述各种国际标准类似。另外,为了对作为运动估计的结果而出现的残余信号进行编码,对图像信号在时间和空间上进行转换,使用之字形(zig-zag)扫描进行扫描,然后,利用量化操作进行编码。上述图像编码方法基于块来编码图像。如上所述,当通过基于块的运动估计来压缩和编码运动画面和静止图像时,通过使图像帧中的块彼此组合所获得的宏块具有运动矢量。由于多个宏块中相邻宏块的运动矢量之间存在相关性,因此,将相邻宏块的前一帧的运动矢量用于编码各个宏块的运动矢量。在JVT方法中,在计算出要进行编码的当前宏块的预测矢量之后,对邻接所述当前宏块的相邻宏块的运动矢量与所述预测矢量之间的差值矢量进行编码。因此,当编码基于块的图像时,由于JVT方法的高效率,广泛使用该方法。
然而,虽然估计运动矢量的传统算法理论上是相当简单的,但是找到运动矢量所需的计算进程却十分复杂。因此,在编码进程期间大多数时间可能用于找到运动矢量。全块匹配算法(FBMA)、通用运动估计算法是用于在针对搜索范围内的所有宏块计算失真测量之后找到最小失真的宏块的方法。FBMA是找到运动矢量的最佳方法,因为FBMA搜索所有包括可能被确定为运动矢量的矢量的宏块,以及搜索用于找到当前运动矢量的宏块。但是,由于过度失真计算给视频编码器带来了相当大的负担,因此FBMA在实践中具有限制。例如,如果存在较宽的搜索范围,如高清晰度电视,则不可能实时处理数据,因为要相互进行比较的像素数量极大。为了执行实时数据处理,硬件的尺寸和容量发生较大增加。
图1是示出了在作为编码运动画面的各种传统标准H.261、MPEG-1、MPEG-2等的运动矢量估计方法中,要进行编码的当前运动矢量和邻接所述当前运动矢量的相邻运动矢量的视图。
用于H.261、MPEG-1、MPEG-2等的运动矢量估计方法当估计当前宏块的运动矢量MV时,仅使用紧挨在当前宏块之前的宏块的运动矢量MV1,作为预测体。由于该运动矢量估计方法仅使用紧挨在当前宏块之前的宏块的运动矢量MV1作为预测体,因此难以保证在计算当前宏块的运动矢量时所得到的值的可靠性。
图2是示出了在作为编码运动画面的各种传统标准H.263、MPEG-4等的运动矢量估计方法中,要进行编码的当前运动矢量和邻接所述当前运动矢量的相邻运动矢量的视图。
如图2所示,在用于H.263、MPEG-4等的运动矢量估计方法中,选择了紧密地位于要进行编码的当前运动矢量MV的左侧、上侧和右侧的三个宏块的三个运动矢量MV1、MV2和MV3,作为要用于预测的候选。用于H.263或MPEG-4等的运动矢量估计方法包括中值预测和最小比特率预测。
图3是在作为编码运动画面的各种传统标准H.263、MPEG-4中,使用中值预测找到当前宏块的运动矢量的搜索范围的方法的视图。
预测体301通过从针对如图2所示的位于要进行编码的当前运动矢量MV周围的三个运动矢量MV1、MV2和MV3的x和y方向的值中选择中值,根据x和y分量输出每一个中值。可以将根据x和y的每个分量输出的每一个中值表示为等式1。
等式1
PMVx=求中值(MV1x,MV2x,MV3x),PMVy=求中值(MV1y,MV2y,MV3y)
此外,操作单元302找到要进行编码的当前运动矢量与PMVx和PMVy值之间的差值MVD,以便根据x和y分量将该MVD发送到解码器。可以将与x和y分量相对应的表示的差值MVDx和MVDy表达为等式2。
等式2
MVDx=MVx-PMVx,MVDy=MVy-PMVy
这里,MVx是与要进行编码的当前运动矢量的x分量相对应的值,而MVy是与要进行编码的当前运动矢量的y分量相对应的值。
与图1所示的方法相比,中值预测具有相对更高的可靠性,因为中值预测使用三个相邻宏块的运动矢量。中值预测具有的特征在于:中值预测均等地使用三个相邻宏块的运动矢量。然而,相邻宏块的运动矢量相对于当前块的运动矢量具有彼此不同的相关性。因此,由于相关性的不同并未被考虑,因此中值预测的可靠性实际上较低。
因此,为了解决上述问题,已经提出了通过使用最小比特率预测找到当前宏块的运动矢量的搜索范围的方法。该方法用于找到要进行编码的当前运动矢量的位置与相邻运动矢量的位置之间的预测差错,以便选择具有最小数量的预测差错比特的相邻运动矢量。在选择具有最小数量的预测差错比特的相邻运动矢量之后,对要进行编码的当前运动矢量和所选择的相邻运动矢量的预测差错进行编码,并发送报告用于预测的运动矢量的模式信息。
图4是示出了在作为编码运动画面的各种传统标准H.263和MPEG-4中当使用一维最小比特率预测来编码当前宏块的运动时获得的比特流结构的视图。
如图4所示,利用x分量的预测差错“MODEx”、x模式信息“MODEx”、y分量的预测差错“MVDymbp”、以及y模式信息“MODEy”来二维实现基于一维最小比特率预测的运动矢量的编码处理。
在这样的根据最小比特率预测的编码处理中,相对于x和y分量,作为预测差错信息的模式信息和MVD信息存在于要传送的数据中。预测差错信息具有较小数量的比特,因为使用了最小比特率预测。相反,由于模式信息具有较大数量的比特,针对模式信息的负担相对较重。这种负担可能妨碍实时压缩和编码处理,并增加要传送的数据量,因而不能有效地传送数据。
发明内容
提出了本发明以解决上述问题,因此,本发明的目的是提供一种能够利用当前宏块的运动矢量的运动与已经编码的相邻宏块的运动矢量的运动十分相似的特征,根据相邻宏块的信息自适应地估计运动矢量的搜索范围。为此目的,找到相邻宏块的运动矢量的最大幅度,并定义当前宏块的运动矢量的搜索范围的最小值。然后,针对相邻宏块的运动矢量的最大幅度和当前宏块的运动矢量的范围的最小值,通过执行压缩和转换处理来定义当前宏块的运动矢量的搜索范围,从而减小了编码部分中的计算量。
为了实现上述目的,根据本发明的一个方案,存在一种用于确定视频编码器中的自适应运动矢量的搜索范围的方法,所述视频编码器接收代表连续图像的输入图像信息,并将所述输入图像信号的图像分为多个宏块(MB),以估计宏块的运动矢量的运动,以便编码图像,所述方法包括以下步骤:(a)确定邻接当前宏块的相邻宏块的数量;(b)如果相邻块的数量多于两个,通过找到相邻块的运动矢量的幅度,确定具有最大运动的运动矢量;(c)定义当前宏块的自适应运动矢量的搜索范围的最小值;(d)将步骤(b)处确定的具有最大运动的运动矢量的幅度的两倍与步骤(c)处得到的自适应运动矢量的搜索范围的最小值进行比较,以便将较大的值确定为自适应运动矢量的搜索范围的值;以及(e)将步骤(d)处得到的自适应运动矢量的搜索范围的值与用户所定义的自适应运动矢量的搜索范围的值进行比较,以便将较小的值确定为最终自适应运动矢量的搜索范围的值。
为了实现上述目的,根据本发明的另一方案,提供了一种用于确定视频编码器中的自适应运动矢量的搜索范围的设备,所述视频编码器接收代表连续图像的输入图像信息,并将所述输入图像信号的图像分为多个宏块(MB),以估计宏块的运动矢量的运动,以便编码图像,所述设备包括:确定部分,用于确定邻接当前宏块的相邻宏块的数量;计算部分,用于计算当前宏块的自适应运动矢量的搜索范围的值或宏块的运动矢量的幅度;第一比较部分,用于将在计算部分中计算出的相邻块的运动矢量的幅度中具有最大运动的运动矢量的幅度的两倍与在计算部分中计算出的自适应运动矢量的搜索范围的最小值进行比较;确定部分,根据第一比较部分的比较结果,将较大的值确定为自适应运动矢量的搜索范围的值;第二比较部分,用于将在计算部分中计算出的自适应运动矢量的搜索范围的值与用户所定义的自适应运动矢量的搜索范围的值进行比较;以及最终确定部分,根据第二比较部分的比较结果,将较小的值确定为最终自适应运动矢量的搜索范围的值。
附图说明
根据以下结合附图时的详细描述,本发明的前述和其它目的、特征和优点将变得显而易见,其中:
图1是示出了在用于编码运动画面的各种传统标准H.261、MPEG-1、MPEG-2等的运动矢量估计方法中,要进行编码的当前运动矢量和邻接所述当前运动矢量的运动矢量的视图;
图2是示出了在用于编码运动画面的各种传统标准H.263、MPEG-4等的运动矢量估计方法中,要进行编码的当前运动矢量和在当前运动矢量周围的运动矢量的视图;
图3是在编码运动画面的各种传统标准H.263和MPEG-4中,使用中值预测找到当前宏块的运动矢量的搜索范围的方法的视图;
图4是示出了在编码运动画面的各种传统标准H.263和MPEG-4中当使用一维最小比特率预测来编码当前宏块的运动矢量时所获得的比特流结构的视图;
图5是示出了根据本发明的优选实施例的要进行编码的当前宏块和该当前宏块周围的宏块的范围的视图;以及
图6是示出了根据本发明优选实施例找到要进行编码的当前宏块的运动矢量的搜索范围的过程的流程图。
具体实施方式
现在,将详细描述本发明的优选实施例。
在本发明的以下描述中,当本文中所包含的已知功能和配置的详细描述可能使本发明的主旨反而不清楚时,将省略对其的详细描述。
在用于压缩运动画面的JVT方法中,通过消除编码处理中的时间和空间冗余信息来创建进行了时间和空间压缩的信息,并将解码处理所需的信息添加到已压缩的信息,以便进行传送。以编码处理的相反顺序实现解码处理。根据本发明,提供了能够通过根据相邻宏块的信息自适应地估计运动矢量的搜索范围来减小编码部分的计算量的设备的方法。具体地,通过利用其中当前宏块的运动矢量的运动与已经编码了的相邻宏块的运动矢量的运动相似的特征,可以有效地确定当前宏块的运动矢量的最大搜索范围。
图5是示出了根据本发明的优选实施例的要进行编码的当前宏块和该当前宏块周围的相邻宏块的范围的视图。
假设要进行编码的当前宏块是“E”,而邻接当前宏块的相邻宏块是“A”、“B”和“C”。此外,假设块“A”、“B”和“C”的运动矢量分别是(mv_a_x,mv_a_y)、(mv_b_x,mv_b_y)、以及(mv_c_x,mv_c_y)。这里,注脚“x”和“y”指的是水平和垂直方向上的运动矢量。根据这些假设,根据相邻宏块A、B和C的运动矢量找到要进行编码的当前宏块E的运动矢量的最大搜索范围。
图6是示出了根据本发明优选实施例找到要进行编码的当前宏块的运动矢量的搜索范围的过程的流程图。
首先,确定图5中所示的可用相邻块的数量(步骤600)。
正如参考图1所描述的,如果可用相邻块的数量少于一个,当计算当前宏块的运动矢量时,难以保证所计算的运动矢量的可靠性,因为仅使用了紧挨在当前宏块之前的块的运动矢量作为预测矢量。因此,如果可用相邻块的数量少于1,则将最终的自适应运动矢量的搜索范围设置为开始编码处理时用户所预先确定的缺省值(步骤616)。步骤616可以表示为等式3。
等式3
new_search_range_i=input_search_range
这里,“new_search_range_i”表示要进行编码的当前宏块的最终自适应运动矢量的搜索范围,而“input_search_range”表示当开始编码处理时为了防止差错而由用户预先确定的缺省值。
同时,如果可用相邻块的数量大于两个,则计算可用相邻块的运动块的幅度,以便确定要进行编码的当前宏块E的自适应运动矢量的最大搜索范围(步骤602)。计算作为可用相邻块的运动矢量中具有最大运动的块的运动矢量的幅度的最大值,从而将所述最大值确定为与要进行编码的当前宏块E在水平和垂直方向上的自适应运动矢量的最大搜索范围有关的值(步骤604)。步骤604中的操作可以表示为等式4。
等式4
max_MV_E_i=max[abs(MV_A_i),max{abs(MV_B_i),abs(MV_C_I)}]
这里,“max_MV_E_i”是表示要进行编码的当前宏块E在水平和垂直方向上的自适应运动矢量的最大搜索范围的矢量,并且将其表示为(max_MV_E_x,max_MV_E_y)。“max(u,v)”是表示“u”和“v”的最大值的函数,以及“abs()”是表示绝对值的函数。另外,“MV_A_i”、“MV_B_i”和“MV_C_i”分别表示:(mv_a_x,mv_a_y),其是相邻块A的运动矢量,(mv_b_x,mv_b_y),其是相邻块B的运动矢量,以及(mv_c_x,mv_c_y),其是相邻块C的运动矢量。如上所述,“i”表示水平方向或垂直方向。另外,如果预定的相邻块并不在图像范围内,则将绝对值函数的值视为“0”。
但是,根据通过上述方法所估计出的“max_MV_E_i”,如果要进行编码的当前宏块E的运动矢量的运动极大地不同于相邻块的运动,则所估计出的运动矢量的值具有严重的差错。为了防止上述问题,找到表示运动的统计特征的搜索范围的最小值(步骤606)。搜索范围的最小值可以表示为等式5。
等式5
ai=abs(MV_A_i)+abs(MV_B_i)+abs(MV_C_i)
如果要进行编码的当前宏块E的运动矢量的搜索范围的值大于“input_search_range”的值,则搜索范围的值是错误值。因此,将搜索范围的值设置为“input_search_range”的值,以防止这种错误。这里,“input_search_range”的值由用户根据相邻块的运动矢量的幅度不同地进行定义。另外,“k_j”表示要进行编码的当前宏块E的运动矢量的搜索范围的最小值,且其是用于防止差错的变量,已经利用统计特征和由用户所定义的“input_search_range”的值通过实验而得到。
正如等式5所表示的,“k_j”的值根据“ai”改变。另外,“ai”较大表示相邻块的运动矢量的幅度的和较大。因此,由于“ai”较大,因此用户必须设置较大的“input_search_range”值。因此,“k_j”的值也较大。等式5中示出的常数是根据相邻块的运动的统计特征的实验值,并且是最佳结果。
将在等式4中得到的要进行编码的当前宏块E的自适应运动矢量的搜索范围的最大值与等式5中得到的搜索范围的最小值进行比较(步骤608),从而确定要进行编码的当前宏块E的自适应运动矢量的搜索范围(步骤610和612)。步骤608到612中的操作可以表示为等式6。
等式6
local_search_range_i=max(k_i,2*max_MV_E_i)
这里,“local_search_range_i”表示要进行编码的当前宏块E的自适应运动矢量的搜索范围。使“max_MV_E_i”的值乘2的理由基于通过实验所获得的统计分析,其中,要进行编码的当前宏块E的自适应运动矢量的幅度小于相邻块的运动矢量的幅度的两倍,即使要进行编码的当前宏块E的自适应运动矢量的幅度具有最高值。
等式6用于防止运动矢量的差错,如果“2*max_MV_E_i”的值小于通过等式5所得到的搜索范围的值,通过用通过等式5所得到的搜索范围的最小值替代要进行编码的当前宏块E的运动矢量的搜索范围的值。考虑到“ai”的值替代了具有非常小的值的“max_MV_E_i”的值,通过将要进行编码的当前宏块E的运动矢量的搜索范围的值确定为搜索范围的最小值,这用于防止运动矢量的差错。
然而,通过等式6确定的要进行编码的当前宏块E的运动矢量的搜索范围可以通过使该搜索范围大于用户所定义的范围的方式来建立。这在相邻块的运动矢量的幅度大于用户在开始编码处理时所建立的缺省值时发生。如上所述,如果已经通过等式6确定的要进行编码的当前宏块E的运动矢量的搜索范围的值大于用户所建立的缺省值,则所述确定值是无意义的值。如果使用所述确定值,则发生差错。因此,为了防止这样的差错,为了定义要进行编码的当前宏块E的运动矢量的最大搜索范围,给出了限制条件(步骤614到618)。
步骤614到618可以由等式7表示。
等式7
new_search_range_i=min(input_search_range,local_search_range_i)
上述等式3和7表示确定要进行编码的当前最终自适应运动矢量的搜索范围的模式的结果。即,如果可用相邻块的数量少于一个,则考虑到搜索的可靠性,将最终自适应运动矢量的搜索范围设置为用户在开始编码处理时建立的缺省值。如果可用相邻块的数量多于两个,则根据相邻块的运动矢量估计以及根据用户所设置的缺省值得到最终自适应矢量的搜索范围,以防止差错。
尽管已经结合目前认为是最实际和最优选的实施例描述了本发明,但是应当理解,本发明并不限于所公开的实施例和附图,然而,相反地,本发明用于覆盖所附权利要求的精神和范围内的各种修改和变更。
正如从前述中所了解的那样,根据本发明,能够通过减小FMBA方法所需的计算量执行有效压缩和编码。另外,通过根据相邻块的运动矢量的运动估计当前块的运动矢量的搜索范围,能够提供比传统方法更可靠的结果。此外,根据本发明,仅使用相邻块的运动矢量的幅度而无需额外使用诸如模式信息等其它数据,不存在由于过多数据导致的负担。另外,使采用JVT运动画面压缩方法的编码器能够高速执行编码处理。特别地,当高速执行压缩和编码或针对具有低比特率的数据执行压缩和编码时,可以有效地使用本发明。
Claims (22)
1、一种在视频编码器中确定自适应运动矢量的搜索范围的方法,所述视频编码器接收代表图像连续性的输入图像信息,并将所述输入图像信号的图像分为多个宏块(MB),以估计宏块的运动矢量的运动,从而编码图像,所述方法包括以下步骤:
(a)确定邻接当前宏块的相邻宏块的数量;
(b)如果相邻块的数量多于两个,通过找到相邻块的运动矢量的幅度,确定具有最大运动的运动矢量;
(c)定义当前宏块的自适应运动矢量的搜索范围的最小值;
(d)将步骤(b)处确定的具有最大运动的运动矢量的幅度的两倍与步骤(c)处找到的自适应运动矢量的搜索范围的最小值进行比较,以便将较大的值确定为自适应运动矢量的搜索范围的值;以及
(e)将步骤(d)处找到的自适应运动矢量的搜索范围的值与用户所定义的自适应运动矢量的搜索范围的值进行比较,以便将较小的值确定为最终自适应运动矢量的搜索范围的值。
2、根据权利要求1所述的方法,其特征在于:在步骤(b)中,通过提取相邻块的运动矢量的水平和垂直分量,得到相邻块的运动矢量的幅度。
3、根据权利要求1所述的方法,其特征在于:在步骤(c)中,自适应运动矢量的搜索范围的最小值根据相邻块的运动矢量的幅度的和改变。
4、根据权利要求3所述的方法,其特征在于:当相邻块的运动矢量的幅度的和等于“0”时,将自适应运动矢量的搜索范围的最小值设置为预定值,所述预定值是通过将预定常数与用户所定义的自适应运动矢量的搜索范围的值相加,之后将自适应运动矢量的搜索范围的结果值除以4得到的。
5、根据权利要求4所述的方法,其特征在于所述预定常数是“2”。
6、根据权利要求3所述的方法,其特征在于:将自适应运动矢量的搜索范围的最小值设置为预定值,如果相邻块的运动矢量的幅度的和大于零且等于或小于2,则所述预定值是通过将预定常数与用户所定义的自适应运动矢量的搜索范围的值相加,将自适应运动矢量的搜索范围的值的结果值乘3,之后将自适应运动矢量的搜索范围的结果值除以16得到的。
7、根据权利要求6所述的方法,其特征在于所述预定常数是“8”。
8、根据权利要求3所述的方法,其特征在于:将自适应运动矢量的搜索范围的最小值设置为预定值,如果相邻块的运动矢量的幅度的和大于2,则所述预定值是通过将预定常数与用户所定义的自适应运动矢量的搜索范围的值相加,之后将自适应运动矢量的搜索范围的结果值除以8得到的。
9、根据权利要求8所述的方法,其特征在于所述预定常数是“4”。
10、根据权利要求1所述的方法,其特征在于:用户所定义的自适应运动矢量的搜索范围的值是用户为了防止差错在启动编码处理时所设置的缺省值。
11、根据权利要求1所述的方法,其特征在于:如果相邻块的数量少于一个,则将用户所定义的自适应运动矢量的搜索范围的值确定为最终自适应运动矢量的搜索范围的值。
12、一种用于在视频编码器中确定自适应运动矢量的搜索范围的设备,所述视频编码器接收代表图像连续性的输入图像信息,并将所述输入图像信号的图像分为多个宏块(MB),以估计宏块的运动矢量的运动,从而编码图像,所述设备包括:
确定部分,用于确定邻接当前宏块的相邻宏块的数量;
计算部分,用于计算当前宏块的自适应运动矢量的搜索范围的值或宏块的运动矢量的幅度;
第一比较部分,用于将在计算部分中计算出的相邻块的运动矢量的幅度中具有最大运动的运动矢量的幅度的两倍与在计算部分中计算出的自适应运动矢量的搜索范围的最小值进行比较;
确定部分,根据第一比较部分的比较结果,将较大的值确定为自适应运动矢量的搜索范围的值;
第二比较部分,用于将在计算部分中计算出的自适应运动矢量的搜索范围的值与用户所定义的自适应运动矢量的搜索范围的值进行比较;以及
最终确定部分,根据第二比较部分的比较结果,将较小的值确定为最终自适应运动矢量的搜索范围的值。
13、根据权利要求12所述的设备,其特征在于:通过提取所述运动矢量的水平和垂直分量,得到所述运动矢量的幅度。
14、根据权利要求12所述的设备,其特征在于:所述计算部分根据相邻块的运动矢量的幅度的和,不同地计算自适应运动矢量的搜索范围的最小值。
15、根据权利要求14所述的设备,其特征在于:将自适应运动矢量的搜索范围的最小值设置为预定值,如果相邻块的运动矢量的幅度的和等于“0”,则所述预定值是通过将预定常数与用户所定义的自适应运动矢量的搜索范围的值相加,之后将自适应运动矢量的搜索范围的结果值除以4得到的。
16、根据权利要求15所述的设备,其特征在于所述预定常数是“2”。
17、根据权利要求14所述的设备,其特征在于:将自适应运动矢量的搜索范围的最小值设置为预定值,如果相邻块的运动矢量的幅度的和大于零且小于或等于2,则所述预定值是通过将预定常数与用户所定义的自适应运动矢量的搜索范围的值相加,将自适应运动矢量的搜索范围的值的结果值乘3,之后将自适应运动矢量的搜索范围的结果值除以16得到的。
18、根据权利要求17所述的设备,其特征在于所述预定常数是“8”。
19、根据权利要求14所述的设备,其特征在于:将自适应运动矢量的搜索范围的最小值设置为预定值,如果相邻块的运动矢量的幅度的和大于2,则所述预定值是通过将预定常数与用户所定义的自适应运动矢量的搜索范围的值相加,之后将自适应运动矢量的搜索范围的结果值除以8得到的。
20、根据权利要求19所述的设备,其特征在于所述预定常数是“4”。
21、根据权利要求12所述的设备,其特征在于:用户所定义的自适应运动矢量的搜索范围的值是用户为了防止差错在启动编码处理时所设置的缺省值。
22、根据权利要求12所述的设备,其特征在于:如果根据所述确定部分的结果相邻块的数量少于一个,则所述最终确定部分将用户所定义的自适应运动矢量的搜索范围的值确定为最终自适应运动矢量的搜索范围的值。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20030022784A KR100560843B1 (ko) | 2003-04-10 | 2003-04-10 | 비디오 부호기에서 적응 움직임 벡터의 탐색 영역을결정하는 방법 및 장치 |
KR1020030022784 | 2003-04-10 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1774933A true CN1774933A (zh) | 2006-05-17 |
CN100481952C CN100481952C (zh) | 2009-04-22 |
Family
ID=36760999
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2004800100131A Expired - Fee Related CN100481952C (zh) | 2003-04-10 | 2004-04-08 | 确定视频编码器中的自适应运动矢量的搜索范围的方法及设备 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7961789B2 (zh) |
EP (1) | EP1621022B1 (zh) |
JP (1) | JP4195057B2 (zh) |
KR (1) | KR100560843B1 (zh) |
CN (1) | CN100481952C (zh) |
WO (1) | WO2004091222A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102036067A (zh) * | 2009-09-29 | 2011-04-27 | 佳能株式会社 | 运动图像编码设备及其控制方法 |
CN102362498A (zh) * | 2009-01-23 | 2012-02-22 | Sk电信有限公司 | 用于运动矢量编码/解码的方法和装置、以及用于使用其对图像进行编码/解码的装置和方法 |
CN105072450A (zh) * | 2009-11-18 | 2015-11-18 | Sk电信有限公司 | 对运动向量编码的装置以及对运动向量解码的装置和方法 |
CN110545424A (zh) * | 2019-08-21 | 2019-12-06 | 浙江大华技术股份有限公司 | 基于mmvd模式的帧间预测方法、视频编码方法及相关装置、设备 |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7701884B2 (en) * | 2004-04-19 | 2010-04-20 | Insors Integrated Communications | Network communications bandwidth control |
US7516255B1 (en) | 2005-03-30 | 2009-04-07 | Teradici Corporation | Method and apparatus for providing a low-latency connection between a data processor and a remote graphical user interface over a network |
US8560753B1 (en) | 2005-03-30 | 2013-10-15 | Teradici Corporation | Method and apparatus for remote input/output in a computer system |
US7885330B2 (en) * | 2005-07-12 | 2011-02-08 | Insors Integrated Communications | Methods, program products and systems for compressing streaming video data |
US8005308B2 (en) * | 2005-09-16 | 2011-08-23 | Sony Corporation | Adaptive motion estimation for temporal prediction filter over irregular motion vector samples |
KR100790757B1 (ko) * | 2006-03-10 | 2008-01-03 | (주)씨앤에스 테크놀로지 | H.264 동영상 부호화기의 적응적 고속 움직임 추정 방법 |
US8098898B2 (en) * | 2006-10-27 | 2012-01-17 | Panasonic Corporation | Motion detection device, MOS (metal-oxide semiconductor) integrated circuit, and video system |
KR101087379B1 (ko) * | 2007-02-23 | 2011-11-25 | 노키아 코포레이션 | 패킷화 방법 및 장치, 비트스트림 표현 처리 방법 및 장치와 컴퓨터 판독 가능 매체 |
KR100939917B1 (ko) | 2008-03-07 | 2010-02-03 | 에스케이 텔레콤주식회사 | 움직임 예측을 통한 부호화 시스템 및 움직임 예측을 통한부호화 방법 |
US9317599B2 (en) * | 2008-09-19 | 2016-04-19 | Nokia Technologies Oy | Method, apparatus and computer program product for providing relevance indication |
TWI475890B (zh) * | 2008-10-14 | 2015-03-01 | Univ Nat Taiwan | 用於需要善用電量之多媒體裝置的高效率區塊比對的大型積體電路架構及方法 |
DK3567852T3 (da) | 2009-03-23 | 2023-01-16 | Ntt Docomo Inc | Billedforudsigelsesafkodningsindretning og billedforudsigelsesafkodningsfremgangsmåde |
ES2820437T3 (es) | 2010-07-20 | 2021-04-21 | Ntt Docomo Inc | Método de codificación predictiva de imágenes, dispositivo de decodificación predictiva de imágenes, método de decodificación predictiva de imágenes y programa de decodificación predictiva de imágenes |
KR101443701B1 (ko) | 2010-11-22 | 2014-09-29 | 한국전자통신연구원 | 적응형 움직임 탐색 범위 결정 장치 및 방법 |
KR101347062B1 (ko) * | 2012-06-27 | 2014-01-10 | 숭실대학교산학협력단 | 움직임 벡터의 예측을 위한 탐색영역 설정 장치 및 방법 |
EP2981089B1 (en) * | 2013-03-29 | 2019-07-10 | Fujitsu Limited | Encoding device, computer system, encoding method, encoding program, and recording medium |
US20180367812A1 (en) * | 2016-01-14 | 2018-12-20 | Mitsubishi Electric Corporation | Encoding performance evaluation support apparatus, encoding performance evaluation support method, and computer readable medium |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6081209A (en) * | 1998-11-12 | 2000-06-27 | Hewlett-Packard Company | Search system for use in compression |
WO2001010135A1 (en) * | 1999-07-29 | 2001-02-08 | Mitsubishi Denki Kabushiki Kaisha | Moving vector detecting method |
KR100438572B1 (ko) | 2001-09-28 | 2004-07-02 | 엘지전자 주식회사 | 움직임 벡터 영역의 적응적 결정 방법 |
KR100455119B1 (ko) * | 2002-01-26 | 2004-11-06 | 엘지전자 주식회사 | 움직임 벡터 영역의 적응적 결정 방법 |
-
2003
- 2003-04-10 KR KR20030022784A patent/KR100560843B1/ko active IP Right Grant
-
2004
- 2004-04-08 EP EP04726676.2A patent/EP1621022B1/en not_active Expired - Lifetime
- 2004-04-08 US US10/552,938 patent/US7961789B2/en active Active
- 2004-04-08 WO PCT/KR2004/000821 patent/WO2004091222A1/en active Application Filing
- 2004-04-08 CN CNB2004800100131A patent/CN100481952C/zh not_active Expired - Fee Related
- 2004-04-08 JP JP2006507801A patent/JP4195057B2/ja not_active Expired - Fee Related
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105072448B (zh) * | 2009-01-23 | 2017-09-29 | Sk电信有限公司 | 对图像进行解码的方法 |
CN105072449B (zh) * | 2009-01-23 | 2017-09-29 | Sk电信有限公司 | 对图像进行解码的装置 |
CN104935939B (zh) * | 2009-01-23 | 2018-05-01 | Sk电信有限公司 | 对图像进行编码/解码的装置和方法 |
CN102362498B (zh) * | 2009-01-23 | 2015-07-29 | Sk电信有限公司 | 选择性进行语法元素编码/解码的装置和方法、以及使用其对图像进行编码/解码的装置和方法 |
CN104935939A (zh) * | 2009-01-23 | 2015-09-23 | Sk电信有限公司 | 对图像进行编码/解码的装置和方法 |
CN105072448A (zh) * | 2009-01-23 | 2015-11-18 | Sk电信有限公司 | 对图像进行编码/解码的装置和方法 |
CN102362498A (zh) * | 2009-01-23 | 2012-02-22 | Sk电信有限公司 | 用于运动矢量编码/解码的方法和装置、以及用于使用其对图像进行编码/解码的装置和方法 |
CN105072449A (zh) * | 2009-01-23 | 2015-11-18 | Sk电信有限公司 | 对图像进行编码/解码的装置和方法 |
CN102036067A (zh) * | 2009-09-29 | 2011-04-27 | 佳能株式会社 | 运动图像编码设备及其控制方法 |
CN102036067B (zh) * | 2009-09-29 | 2014-12-10 | 佳能株式会社 | 运动图像编码设备及其控制方法 |
CN105072450A (zh) * | 2009-11-18 | 2015-11-18 | Sk电信有限公司 | 对运动向量编码的装置以及对运动向量解码的装置和方法 |
CN105072450B (zh) * | 2009-11-18 | 2018-06-12 | Sk电信有限公司 | 对运动向量编码的装置以及对运动向量解码的装置和方法 |
CN110545424A (zh) * | 2019-08-21 | 2019-12-06 | 浙江大华技术股份有限公司 | 基于mmvd模式的帧间预测方法、视频编码方法及相关装置、设备 |
CN110545424B (zh) * | 2019-08-21 | 2021-05-11 | 浙江大华技术股份有限公司 | 基于mmvd模式的帧间预测方法、视频编码方法及相关装置、设备 |
US12113983B2 (en) | 2019-08-21 | 2024-10-08 | Zhejiang Dahua Technology Co., Ltd. | Inter-frame prediction method based on merge with motion vector difference (MMVD) mode, video coding method, related device and apparatus |
Also Published As
Publication number | Publication date |
---|---|
EP1621022B1 (en) | 2015-08-19 |
KR100560843B1 (ko) | 2006-03-13 |
EP1621022A1 (en) | 2006-02-01 |
WO2004091222A1 (en) | 2004-10-21 |
US20080170616A1 (en) | 2008-07-17 |
CN100481952C (zh) | 2009-04-22 |
JP2006523069A (ja) | 2006-10-05 |
KR20040089163A (ko) | 2004-10-21 |
EP1621022A4 (en) | 2011-06-22 |
US7961789B2 (en) | 2011-06-14 |
JP4195057B2 (ja) | 2008-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1774933A (zh) | 确定视频编码器中的自适应运动矢量的搜索范围的方法及设备 | |
CN110087087B (zh) | Vvc帧间编码单元预测模式提前决策及块划分提前终止方法 | |
JP5785285B2 (ja) | 動き予測検索範囲及び拡張動きベクトルの範囲の動的選択 | |
CN1130921C (zh) | 对视频信息预测编码的方法和装置 | |
JP4662636B2 (ja) | 動き推定とブロックマッチング・パターンの改良 | |
CN1205818C (zh) | 视频编码和解码方法 | |
EP1628487A2 (en) | Method and apparatus for estimating motion | |
CN1182335A (zh) | 用于符合mpeg2的实时编码的有效灵活的运动估计结构 | |
EP1656791A2 (en) | Video compression method | |
CN1197382C (zh) | 运动矢量搜索范围的自适应确定方法 | |
CN1791224A (zh) | 一种基于h.264的自适应块搜索范围快速运动估计方法 | |
CN1956544A (zh) | 采用连续/交错区域预测的影像数据处理方法及系统 | |
CN111479110B (zh) | 针对h.266/vvc的快速仿射运动估计方法 | |
CN1306725A (zh) | 视频编码方法以及对应的视频编码器 | |
CN1777289A (zh) | 利用选择性预测加快运动估计的方法 | |
CN1976476A (zh) | 融合多参考帧选择和运动估计的快速帧间模式判决方法 | |
CN1232125C (zh) | 通过参考离散余弦变换系数来估计运动的方法及其装置 | |
CN1604650A (zh) | 用于分级运动估计的方法 | |
CN1194544C (zh) | 基于时空域相关性运动矢量预测的视频编码方法 | |
CN1585487A (zh) | 一种运动矢量预测的方法 | |
CN100586185C (zh) | 一种h.264视频降低分辨率转码的模式选择方法 | |
Bachu et al. | Adaptive order search and tangent-weighted trade-off for motion estimation in H. 264 | |
CN1263309C (zh) | 用于视频编码的运动矢量预测方法 | |
KR100987581B1 (ko) | 고속 움직임 추정을 위한 부분 블록정합 방법 | |
US20080043841A1 (en) | Method for video coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
ASS | Succession or assignment of patent right |
Owner name: SK PLANET CO., LTD. Free format text: FORMER OWNER: SK TELECOM CO., LTD. Effective date: 20120510 |
|
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20120510 Address after: Seoul, South Kerean Patentee after: SK PLANET Co.,Ltd. Address before: Seoul, South Kerean Patentee before: SK TELECOM Co.,Ltd. |
|
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20090422 |
|
CF01 | Termination of patent right due to non-payment of annual fee |