CN1913632A - 运动画面编码方法和设备 - Google Patents

运动画面编码方法和设备 Download PDF

Info

Publication number
CN1913632A
CN1913632A CNA2006100917514A CN200610091751A CN1913632A CN 1913632 A CN1913632 A CN 1913632A CN A2006100917514 A CNA2006100917514 A CN A2006100917514A CN 200610091751 A CN200610091751 A CN 200610091751A CN 1913632 A CN1913632 A CN 1913632A
Authority
CN
China
Prior art keywords
predictive mode
characteristic quantity
motion vector
similitude
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006100917514A
Other languages
English (en)
Inventor
浅野涉
古藤晋一郎
伊达直人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Publication of CN1913632A publication Critical patent/CN1913632A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/16Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter for a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/112Selection of coding mode or of prediction mode according to a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation

Abstract

一种运动画面编码方法,包括以下步骤:针对基于帧的预测模式搜索在输入运动画面的对象块与参考图像之间的第一运动矢量;针对基于场的预测模式搜索在所述对象块与所述参考图像之间的第二运动矢量;根据第一运动矢量和第二运动矢量,生成第一预测残差和第二预测残差;提取指示第一和第二预测残差的行之间的第一和第二相似性的第一和第二特征量;基于第一特征量和第二特征量,在第一相似性大于第二相似性的情况下,选择基于帧的预测模式;在第二相似性大于第一相似性的情况下,选择基于场的预测模式;并且按照所选择的预测模式,以块为单位,对输入运动画面进行帧间编码。

Description

运动画面编码方法和设备
技术领域
本发明涉及运动画面编码方法和设备。
背景技术
在如MPEG-2、H.264的运动画面编码的国际标准中,可以将基于帧的预测模式和基于场的预测模式中的任何一种预测模式选择为在对隔行扫描图像(interlace image)进行编码的过程中使用的运动补偿预测模式。在基于帧的预测模式中,帧被用作编码单位(称为MPEG中的一个画面)。在基于场的预测模式中,场被用作编码单位。当帧被用作编码单位时,称为帧结构。当场被用作编码单位时,称为场结构。
在图像几乎没有运动的情况下,场之间有很强的相关性。因此,在运动补偿预测中,使用基于帧的预测模式更有利。另一方面,在图像剧烈运动的情况下,由于场之间的相关性弱,因此,在运动补偿预测中,使用基于场的预测模式更有利。为了进行高效率的编码,需要对运动补偿预测模式进行适当选择。在日本专利申请KOKAI公报No.2004-266489中,公开了一种方法,用于从基于帧的预测模式和基于场的预测模式中,选择图像信号的垂直相关系数较大的模式。在MPEG软件模拟组(MPEG Software Simulation Group),“Test Model5(aka TM5)”<URL:http://www.mpeg.org/MPEG/MSSG/tm5/5>中,公开了一种方法,用于从基于帧的预测模式和基于场的预测模式中,选择预测残差(residual)信号的绝对值之和较小的模式。
在对运动补偿预测模式进行评估的过程中使用图像信号的垂直相关系数的方法对于对图像信号直接进行编码的帧内编码很有效,但是,在对预测残差信号进行编码的帧间编码中,难以准确地选择预测模式。
另一方面,在对运动补偿预测模式进行评估的过程中使用预测残差信号的方法中,即使在帧间编码中,也能够准确地选择预测模式。但是,由于利用预测残差信号的绝对值之和来对模式进行评估,因此不对行之间的任何相似性进行评估。换句话说,不考虑预测残差信号的任何高通分量,而该预测残差信号的高通分量影响了在对预测残差信号进行正交变换编码期间的编码效率。因此,不一定能选择出优选的预测模式。
已知一种称为分层搜索的技术,目的在于减少对运动矢量进行检测所需要的计算量,对运动矢量进行检测占用了在对运动画面进行编码期间的大部分处理。在分层搜索中,首先搜索粗动(coase motion)矢量,随后搜索微动(fine motion)矢量。根据分层搜索,在许多情况下,在搜索粗动矢量时,在帧结构与场结构中的预测残差信号的绝对值之和之间观察不到差异。因此,需要在帧结构和场结构两者中都进行微动矢量搜索,从而增加了计算量。
发明内容
根据本发明的一个方面,提供了一种运动画面编码方法,包括以下步骤:对于基于帧的预测模式搜索在输入运动画面的要被编码的对象块与参考图像之间的第一运动矢量;对于基于场的预测模式搜索在所述对象块与所述参考图像之间的第二运动矢量;根据第一运动矢量,生成第一预测残差;根据第二运动矢量,生成第二预测残差;提取指示所述第一预测残差的行之间的第一相似性的第一特征量;提取指示所述第二预测残差的行之间的第二相似性的第二特征量;基于所述第一特征量和所述第二特征量,在所述第一相似性大于所述第二相似性的情况下,选择所述基于帧的预测模式;在所述第二相似性大于所述第一相似性的情况下,选择所述基于场的预测模式;并且,按照所选择的预测模式,以块为单位,对所述输入运动画面进行帧间编码。
附图说明
图1为本发明实施例中的运动画面编码装置的框图;
图2为示出了图1所示的运动补偿预测器的第一典型示例的框图;
图3为示出了图2的运动补偿预测器的处理过程的流程图;
图4为示出了图1所示的运动补偿预测器的第二典型示例的框图;
图5为示出了图4所示的帧/场选择单元的示例的框图;
图6为示出了图4所示的运动补偿预测器的处理过程的流程图;
图7为示出了图4所示的帧/场选择单元的另一示例的框图;
图8为示出了图1所示的运动补偿预测器的第三典型示例的框图;
图9为示出了图8所示的运动补偿预测器的处理过程的流程图;以及
图10为示出了图1所示的运动补偿预测器的第四典型示例的框图。
具体实施方式
以下将参照附图,对本发明的实施例进行描述。
如图1所示,在本发明的实施例中,运动画面编码设备包括:输入图像存储器101;减法器102;正交变换/量化单元103;熵编码器104;运动补偿预测器105;逆正交变换/逆量化单元106;加法器107以及参考图像存储器108。
输入图像存储器101暂时存储与要被编码的运动画面对应的输入图像信号10。运动补偿预测器105利用存储在参考图像存储器108中的、作为参考图像信号的经局部(local)解码的图像信号,在所确定的搜索范围内搜索最佳运动矢量,并且该预测器利用该最佳运动矢量,对运动补偿进行预测。运动补偿预测器105还获得指示帧结构和场结构中的预测残差信号的行之间的相似性的特征量,并且,预测器105根据来自基于帧的预测模式和基于场的预测模式的特征量,选择用于进行编码的运动补偿预测模式。
接着,运动补偿预测器105从参考图像存储器108中读取搜索到的最佳运动矢量以及由所选择的预测模式指示的区域的经过局部解码的图像信号,由此生成预测图像信号11。运动补偿预测器105还输出运动矢量信息14和表示所选择的预测模式的预测模式信息15。
减法器102在来自输入图像存储器101的输入图像信号与来自参考图像存储器108的预测图像信号11之间进行减法,从而生成这两个信号之间的差,即,预测残差信号12。正交变换/量化单元103对预测残差信号12进行正交变换和量化,从而生成经量化的正交变换系数信息13。熵编码器104对经量化的正交变换系数信息13、运动矢量信息14以及预测模式信息15进行熵编码,并且生成经编码的串16。
逆正交变换/逆量化单元106对来自正交变换/量化单元103的经量化的正交变换系数信息13进行逆量化和逆正交变换,从而再现预测残差信号。加法器107将所再现的预测残差信号与来自参考图像存储器108的预测图像信号相加,从而生成局部解码图像信号。局部解码图像信号被作为用于下一次运动补偿预测的参考图像信号,存储在参考图像存储器108中。
下面将对运动补偿预测器105进行详细描述。图2示出了运动补偿预测器105的第一典型示例。图2所示的运动补偿预测器105包括帧运动矢量搜索单元201、场运动矢量搜索单元202、预测残差帧特征量提取单元203、预测残差场特征量提取单元204以及帧/场选择单元205。
帧运动矢量搜索单元201从输入图像存储器101接收要被编码的对象块的图像信号数据,从参考图像存储器108接收运动矢量搜索范围的图像信号数据,并且进行按照帧结构的运动矢量搜索(即,与基于帧的预测模式对应的运动矢量搜索),由此,获得在按照基于帧的预测模式进行编码时的预测残差信号(以下称为帧预测残差信号)。更具体地说,帧运动矢量搜索单元201生成预测图像信号与对象块的输入图像信号之间的差,作为帧预测残差信号,其中,预测图像信号是通过利用按照帧结构搜索到的最佳运动矢量进行运动补偿而获得的。
预测残差帧特征量提取单元203从帧预测残差信号中提取表示帧预测残差信号的行之间的相似性的特征量(以下称为预测残差帧特征量)。
另一方面,场运动矢量搜索单元202从输入图像存储器101接收对象块的图像信号数据,从参考图像存储器108接收运动矢量搜索范围的图像信号数据,并且进行按照场结构的运动矢量搜索(即,与基于场的预测模式对应的运动矢量搜索),由此,获得在按照基于场的预测模式进行编码时的预测残差信号(以下称为场预测残差信号)。即,场运动矢量搜索单元202生成预测图像信号与对象块的输入图像信号之间的差,作为场预测残差信号,其中,预测图像信号是通过利用按照场结构搜索到的最佳运动矢量进行运动补偿而获得的。
预测残差场特征量提取单元204从场预测残差信号中提取表示场预测残差信号的行之间的相似性的特征量(以下称为预测残差场特征量)。
帧/场选择单元205将预测残差帧特征量与预测残差场特征量进行比较,并且根据比较结果,从基于帧的预测模式或者基于场的预测模式中,选择对象块的运动补偿预测模式。
以下将参照图3的流程图,对图2所示的运动补偿预测器105的处理过程进行描述。
首先,从输入图像存储器101读取输入图像信号的对象块数据(步骤S101)。类似地,从参考图像存储器108读取参考图像信号数据(步骤S102)。接着,按照帧结构对运动矢量进行搜索,从而获得帧预测残差信号(步骤S103)。类似地,按照场结构对运动矢量进行搜索,从而获得场预测残差信号(步骤S104)。步骤S103和S104的处理顺序可以颠倒,或者,步骤S103的处理可以与步骤S104的处理同时进行。
接着,例如,从帧预测残差信号中提取表示帧预测残差信号的行之间的相关性的特征量,作为表示基于帧的预测模式中的行之间的相似性的预测残差帧特征量(步骤S105)。类似地,从场预测残差信号中提取场预测残差信号的行之间的相关性,作为表示基于场的预测模式中的行之间的相似性的特征量(步骤S106)。作为行之间的相关性,例如,使用由以下等式代表的、行之间的差的绝对值之和S:
S = &Sigma; y = 0 v 2 - 1 &Sigma; x = 0 h - 1 [ cbs { L ( x , 2 y ) - L ( x , 2 y + 1 ) } ] - - - ( 1 )
式中,L(x,y)表示在位置(x,y)的像素的值。当如在本例中那样,要对其获得S的对象是预测残差信号时,L(x,y)表示差值。当要对其获得S的对象是输入图像信号时,L(x,y)表示亮度值。此外,h和v分别表示对象块沿着x方向和y方向的像素数。例如,h=16,v=32。此外,abs{}表示用于获得绝对值的函数。
下面,对于分别在步骤S105和S106中获得的帧预测残差信号和场预测残差信号的特征量,例如,对值的大小进行比较,并且,根据比较结果,从基于帧的预测模式或者基于场的预测模式中,选择对象块的运动补偿预测模式(步骤S107)。当对基于帧的预测模式和基于场的预测模式中的预测残差信号,获得表示行之间的相似性的特征量,例如,行之间的相关性时,与使用预测残差信号的绝对值之和的情况不同,预测残差信号的高通分量被很好地反映在特征量中。因此,当在步骤S107中,根据在步骤S105和S106中计算出的特征量,从基于帧的预测模式和基于场的预测模式中,选择行之间的相似性更高的预测模式时,可以进一步提高编码效率。
此外,即使不进行步骤S103和S104中的、高精度的运动矢量搜索,在帧预测残差信号和场预测残差信号的特征量之间也会出现明显的差异。因此,由于运动矢量搜索的精度可能较低,所以减少了运动矢量搜索所需要的计算量。
接着,将参照图4,对运动补偿预测器105的第二典型示例进行描述。在图4所示的运动补偿预测器105中,对于图2所示的第一典型示例的运动补偿预测器增加了输入图像帧特征量提取单元206和输入图像场特征量提取单元207。
输入图像帧特征量提取单元206从输入图像存储器101接收对象块的图像信号数据,并且提取指示按照帧结构的输入图像信号的行之间的相似性的特征量(以下称为输入图像帧特征量)。输入图像场特征量提取单元207从输入图像存储器101接收对象块的图像信号数据,并且提取指示按照场结构的输入图像信号的行之间的相似性的特征量(以下称为输入图像场特征量)。帧/场选择单元208接收输入图像帧特征量、输入图像场特征量、预测残差帧特征量以及预测残差场特征量,并且,对这些量进行比较,从而从基于帧的预测模式或者基于场的预测模式中,选择对象块的运动补偿预测模式。
如图5所示,在帧/场选择单元208中,首先,输入图像帧/场确定单元301对输入图像帧特征量的值与输入图像场特征量的值的大小进行比较,对要选择基于帧的预测模式还是基于场的预测模式进行确定。另一方面,预测残差帧/场确定单元302对预测残差帧特征量的值和预测残差场特征量的值的大小进行比较,对要选择基于帧的预测模式还是基于场的预测模式进行确定。
接着,总体帧/场确定单元303利用输入图像帧/场确定单元301的确定结果和预测残差帧/场确定单元302的确定结果进行最终确定,并且,选择单元304按照这个最终确定结果,选择运动补偿预测模式。例如,在输入图像帧/场确定单元301和预测残差帧/场确定单元302中的一个确定要选择基于场的预测模式的情况下,选择基于场的预测模式。当这两个单元都确定要选择基于帧的预测模式时,选择基于帧的预测模式。后面将对选择方法的示例进行详细描述。
接着,将参照图6的流程图,对图4中所示的运动补偿预测器的处理过程进行描述。
首先,从输入图像存储器101读取输入图像信号的对象块的数据(步骤S101)。类似地,从参考图像存储器108读取参考图像信号数据(步骤S102)。接着,按照帧结构对运动矢量进行搜索,从而获得帧预测残差信号(步骤S103)。类似地,按照场结构对运动矢量进行搜索,从而获得场预测残差信号(步骤S104)。步骤S103和S104的处理顺序可以颠倒,或者,步骤S103的处理可以与步骤S104的处理同时进行。
接着,例如,从帧预测残差信号中提取表示帧预测残差信号的行之间的相关性的特征量,作为表示基于帧的预测模式中的行之间的相似性的预测残差帧特征量(步骤S105)。类似地,从场预测残差信号中提取表示场预测残差信号的行之间的相关性的特征量,作为表示基于场的预测模式中的行之间的相似性的特征量(步骤S106)。使用例如由等式(1)代表的、行之间的差的绝对值之和S,作为表示行之间的相关性的特征量。
接着,提取指示输入图像信号的对象块的按照帧结构的行之间的相关性的输入图像帧特征量(步骤S108)。类似地,提取指示输入图像信号的对象块的按照场结构的行之间的相关性的输入图像场特征量(步骤S109)。步骤S108和S109的处理顺序可以颠倒,或者,可以同时进行步骤S108的处理与步骤S109的处理。步骤S108和S109的处理可以在读取了输入图像信号的对象块之后、并在S110中进行帧/场选择处理之前的任何时候进行。
最后,将在步骤S105和S106中提取的预测残差帧特征量和预测残差场特征量与输入图像帧特征量和输入图像场特征量进行比较,并且,从基于帧的预测模式或者基于场的预测模式中,选择对象块的预测模式(步骤S110)。具体地说,在步骤S110中,基于在步骤S105中提取的预测残差帧特征量和在步骤S106中提取的预测残差场特征量,对于预测残差信号的行之间的相似性较高的基于帧的预测模式或者基于场的预测模式,检查预测模式。此外,基于在步骤S107中提取的输入图像帧特征量和在步骤S108中提取的输入图像场特征量,对于输入图像的行之间的相似性较高的基于帧的预测模式或者基于场的预测模式,检查预测模式。
结果,在预测残差信号的行之间的相似性较高的预测模式以及输入图像的行之间的相似性较高的预测模式中的至少一个预测模式为基于场的预测模式的情况下,选择基于场的预测模式。另一方面,在预测残差信号的行之间的相似性较高的预测模式和输入图像的行之间的相似性较高的预测模式两者都是基于帧的预测模式的情况下,选择基于帧的预测模式。
如上所述,除了利用表示预测残差信号的行之间的相似性的特征量以外,还利用表示输入图像信号的行之间的相似性的特征量,选择基于帧的预测模式或基于场的预测模式。那么,即使当输入图像信号的帧中的场之间的运动与在参考图像信号的帧中的场之间的运动不同的情况下,也能够准确地选择运动补偿预测模式。此外,当输入图像信号与参考图像信号之间的差异很大时,选择帧内编码,而不选择帧间编码。即使在这种情况下,也可以选择编码效率高的预测模式。
图7示出了对图6的帧/场选择单元208的修改。图6中的输入图像帧/场确定单元301和预测残差帧/场确定单元302被加法器401和402取代。在这种情况下,虽然结构简单,但仍然可以获得与图4所示的帧/场选择单元208的效果相似的效果。
下面将参照图8,对运动补偿预测器105的第三典型示例进行描述。在图8的运动补偿预测器105中,对图2所示的第一特定示例的运动补偿预测器105添加了运动矢量重新搜索单元209。在由帧运动矢量搜索单元201和场运动矢量搜索单元202获得的运动矢量当中,运动矢量重新搜索单元209以比前阶段中的运动矢量搜索单元201和202更高的精度,再次主要搜索按照由帧/场选择单元205选择的预测模式的运动矢量。
下面将参照图9的流程图,对图8中示出的运动补偿预测器105的处理过程进行描述。
首先,从输入图像存储器101读取输入图像信号的对象块(步骤S101)。类似地,从参考图像存储器108读取参考图像信号(步骤S102)。接着,按照帧结构对运动矢量进行搜索,从而获得帧预测残差信号(步骤S103)。类似地,按照场结构对运动矢量进行搜索,从而获得场预测残差信号(步骤S104)。步骤S103和S104的处理顺序可以颠倒,或者,可以同时进行步骤S103的处理与步骤S104的处理。
接着,例如,从帧预测残差信号中提取表示行之间的相关性的特征量,作为指示按照基于帧的预测模式的行之间的相似性的预测残差帧特征量(步骤S105)。类似地,从场预测残差信号中提取表示行之间的相关性的特征量,作为指示按照场结构的行之间的相似性的特征量(步骤S106)。例如,使用例如由等式(1)代表的、行之间的差的绝对值之和S,作为表示行间相关性的特征量。
接着,对于按照基于帧的预测模式和基于场的预测模式的预测残差信号的特征量,例如对值的大小进行比较,并且,根据比较结果,从基于帧的预测模式和基于场的预测模式中选择对象块的预测模式(步骤S107)。
最后,在步骤S103中获得的帧运动矢量以及步骤S104中获得的场运动矢量当中,以比步骤S103和S104中的运动矢量搜索的精度更高的精度,再次主要搜索与在步骤S107中选择的预测模式对应的运动矢量(步骤S111)。应当注意,在选择基于帧的预测模式的情况下,与在步骤S107中选择的预测模式对应的运动矢量是按照帧结构的运动矢量。在选择基于场的预测模式的情况下,该运动矢量是按照场结构的运动矢量。
此前,在步骤S107中选择帧或场之前,要求微动矢量。另一方面,根据本发明的实施例,在步骤S107中选择帧或场之前,运动矢量搜索不要求高精度。另一方面,由于对于步骤S107中选择的预测模式要求高精度的运动矢量,因此,在对帧/场进行选择之后,再次对运动矢量进行搜索。利用按照这样的方式再次搜索到的运动矢量,按照所选择的预测模式进行运动补偿预测。在这种情况下,在保持在帧/场选择和运动矢量方面的精度的同时,减少了要搜索的运动矢量,并且有效地减少了计算量。
如上所述,根据本发明的一个实施例,在进行运动补偿预测编码时,可以从基于帧的预测模式和基于场的预测模式中,选择编码效率更高的预测模式。此外,减少了在对预测模式将是基于帧的预测模式还是基于场的预测模式进行确定时的计算量。
如图10所示,作为运动补偿预测器105的第四典型示例,不必说,对图4所示的第二典型示例的运动补偿预测器105可以添加运动矢量重新搜索单元209。
应当注意,可以通过专用硬件电路,执行在上述实施例中进行的运动补偿预测处理,或者可以通过按照程序操作的CPU,执行运动补偿预测处理。可以经由如互联网的通信线路,将用于使计算机执行这种处理的程序提供给用户。此外,可以将该程序记录在如只读光盘(CD-ROM)的记录介质中,并且提供给用户。
对于本领域技术人员来说,另外的优点和修改很容易想到。因此,在其更广的方面,本发明不限于这里所示出和描述的特定细节和典型实施例。因此,在不脱离由所附权利要求以及它们的等同物所限定的总体发明概念的精神或范围的情况下,可以进行各种修改。

Claims (16)

1.一种运动画面编码方法,包括以下步骤:
针对基于帧的预测模式搜索在输入运动画面的要被编码的对象块与参考图像之间的第一运动矢量;
针对基于场的预测模式搜索在所述对象块与所述参考图像之间的第二运动矢量;
根据所述第一运动矢量,生成第一预测残差;
根据所述第二运动矢量,生成第二预测残差;
提取指示所述第一预测残差的行之间的第一相似性的第一特征量;
提取指示所述第二预测残差的行之间的第二相似性的第二特征量;
基于所述第一特征量和所述第二特征量,在所述第一相似性大于所述第二相似性的情况下,选择所述基于帧的预测模式;
在所述第二相似性大于所述第一相似性的情况下,选择所述基于场的预测模式;并且
按照所选择的预测模式,以块为单位,对所述输入运动画面进行帧间编码。
2.如权利要求1所述的运动画面编码方法,还包括以下步骤,即,按照所选择的预测模式,以比搜索所述第一运动矢量的精度和搜索所述第二运动矢量的精度更高的精度,搜索第三运动矢量,其中,所述帧间编码包括利用所述第三运动矢量对所述输入运动画面进行帧间编码。
3.一种运动画面编码方法,包括以下步骤:
针对基于帧的预测模式搜索在输入运动画面的要被编码的对象块与参考图像之间的第一运动矢量;
针对基于场的预测模式搜索在所述对象块与所述参考图像之间的第二运动矢量;
根据所述第一运动矢量,生成第一预测残差;
根据所述第二运动矢量,生成第二预测残差;
从所述第一预测残差中提取指示所述第一预测残差的行之间的第一相似性的第一特征量;
从所述第二预测残差中提取指示所述第二预测残差的行之间的第二相似性的第二特征量;
从输入图像中提取指示对象块的按照帧结构的输入图像的行之间的第三相似性的第三特征量;
从输入图像中提取指示对象块的按照场结构的输入图像的行之间的第四相似性的第四特征量;
基于所述第一特征量、所述第二特征量、所述第三特征量和所述第四特征量,从所述基于帧的预测模式和所述基于场的预测模式中,选择一个预测模式;并且
按照所选择的预测模式,以块为单位,对所述输入运动画面进行帧间编码。
4.如权利要求3所述的运动画面编码方法,其中,所述选择步骤包括以下步骤:
进行第一确定,基于所述第一特征量和所述第二特征量,确定与所述第一相似性和所述第二相似性中较大的相似性对应的预测模式;
进行第二确定,基于所述第三特征量和所述第四特征量,确定与所述第三相似性和所述第四相似性中较大的相似性对应的预测模式;
在所述第一确定和所述第二确定中的至少一个确定表示与所述基于场的预测模式对应的预测模式的情况下,选择所述基于场的预测模式;并且
在所述第一确定和所述第二确定都表示与所述基于帧的预测模式对应的预测模式的情况下,选择所述基于帧的预测模式。
5.如权利要求3所述的运动画面编码方法,还包括以下步骤,即,按照所选择的预测模式,以比搜索所述第一运动矢量的精度和搜索所述第二运动矢量的精度更高的精度,搜索第三运动矢量,其中,所述帧间编码包括利用所述第三运动矢量,对输入的运动画面进行帧间编码。
6.一种运动画面编码设备,包括:
第一搜索单元,被配置为针对基于帧的预测模式搜索在输入运动画面的要被编码的对象块与参考图像之间的第一运动矢量;
第二搜索单元,被配置为针对基于场的预测模式搜索在所述对象块与所述参考图像之间的第二运动矢量;
生成单元,被配置为根据所述第一运动矢量和所述第二运动矢量,生成第一预测残差和第二预测残差;
第一提取单元,被配置为提取指示所述第一预测残差的行之间的第一相似性的第一特征量;
第二提取单元,被配置为提取指示所述第二预测残差的行之间的第二相似性的第二特征量;
选择单元,被配置为基于所述第一特征量和所述第二特征量,在所述第一相似性大于所述第二相似性的情况下,选择所述基于帧的预测模式,而在所述第二相似性大于所述第一相似性的情况下,选择所述基于场的预测模式;以及
编码单元,被配置为按照所选择的预测模式,以块为单位,对所述输入运动画面进行帧间编码。
7.如权利要求6所述的运动画面编码设备,还包括第三搜索单元,被配置为按照所选择的预测模式,以比搜索所述第一运动矢量的精度和搜索所述第二运动矢量的精度更高的精度,搜索第三运动矢量,其中,所述帧间编码包括利用所述第三运动矢量对所述输入运动画面进行帧间编码。
8.如权利要求6所述的运动画面编码设备,其中,所述第一提取单元被配置为,提取所述第一预测残差的行间相关性作为所述第一特征量。
9.如权利要求6所述的运动画面编码设备,其中,所述第二提取单元被配置为,提取所述第二预测残差的行间相关性作为所述第二特征量。
10.一种运动画面编码设备,包括:
第一搜索单元,被配置为针对基于帧的预测模式搜索在输入运动画面的要被编码的对象块与参考图像之间的第一运动矢量;
第二搜索单元,被配置为针对基于场的预测模式搜索在所述对象块与所述参考图像之间的第二运动矢量;
生成单元,被配置为根据所述第一运动矢量和所述第二运动矢量,生成第一预测残差和第二预测残差;
第一提取单元,被配置为提取指示所述第一预测残差的行之间的第一相似性的第一特征量;
第二提取单元,被配置为提取指示所述第二预测残差的行之间的第二相似性的第二特征量;
第三提取单元,被配置为提取指示输入图像的对象块的按照帧结构的行之间的第三相似性的第三特征量;
第四提取单元,被配置为提取指示输入图像的对象块的按照场结构的行之间的第四相似性的第四特征量;
选择单元,被配置为基于所述第一特征量、所述第二特征量、所述第三特征量和所述第四特征量,从所述基于帧的预测模式或所述基于场的预测模式中选择一个预测模式;以及
编码单元,被配置为按照所选择的预测模式,以块为单位,对所述输入运动画面进行帧间编码。
11.如权利要求10所述的运动画面编码设备,其中,
所述选择单元包括:
第一确定单元,被配置为基于所述第一特征量和所述第二特征量,确定与所述第一相似性和所述第二相似性中较大的相似性对应的预测模式;
第二确定单元,被配置为基于所述第三特征量和所述第四特征量,确定与所述第三相似性和所述第四相似性中较大的相似性对应的预测模式;
所述选择单元被配置为在所述第一确定单元和所述第二确定单元中的至少一个确定与所述基于场的预测模式对应的预测模式情况下,选择所述基于场的预测模式,而在所述第一确定单元和第二确定单元两者都确定与所述基于帧的预测模式对应的预测模式情况下,选择所述基于帧的预测模式。
12.如权利要求10所述的运动画面编码设备,其中,还包括第三搜索单元,被配置为按照所选择的预测模式,以比搜索所述第一运动矢量的精度和搜索所述第二运动矢量的精度更高的精度,搜索第三运动矢量,其中,所述帧间编码包括利用所述第三运动矢量对输入的运动画面进行帧间编码。
13.如权利要求10所述的运动画面编码设备,其中,所述第一提取单元被配置为,提取所述第一预测残差的行间相关性作为所述第一特征量。
14.如权利要求10所述的运动画面编码设备,其中,所述第二提取单元被配置为,提取所述第二预测残差的行间相关性作为所述第二特征量。
15.如权利要求10所述的运动画面编码设备,其中,所述第三提取单元被配置为从输入图像中提取对象块的按照帧结构的行间相关性,作为所述第三特征量。
16.如权利要求10所述的运动画面编码设备,其中,所述第四提取单元被配置为从输入图像中提取对象块的按照场结构的行间相关性,作为所述第四特征量。
CNA2006100917514A 2005-08-11 2006-06-12 运动画面编码方法和设备 Pending CN1913632A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2005233448A JP4197695B2 (ja) 2005-08-11 2005-08-11 動画像符号化方法、装置及びプログラム
JP2005233448 2005-08-11

Publications (1)

Publication Number Publication Date
CN1913632A true CN1913632A (zh) 2007-02-14

Family

ID=37722375

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006100917514A Pending CN1913632A (zh) 2005-08-11 2006-06-12 运动画面编码方法和设备

Country Status (3)

Country Link
US (1) US7916788B2 (zh)
JP (1) JP4197695B2 (zh)
CN (1) CN1913632A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101453656B (zh) * 2007-11-29 2011-06-01 华为技术有限公司 视频编码、解码方法及装置和视频编解码系统
CN101998125B (zh) * 2009-08-19 2013-12-25 宏碁股份有限公司 图像文档传输系统及其方法
WO2022257474A1 (zh) * 2021-06-11 2022-12-15 荣耀终端有限公司 图像的预测方法、电子设备和存储介质

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4787100B2 (ja) * 2006-07-27 2011-10-05 パナソニック株式会社 画像符号化装置
JP4993676B2 (ja) * 2006-09-01 2012-08-08 キヤノン株式会社 画像符号化装置及び画像符号化方法
US8295603B2 (en) * 2007-03-28 2012-10-23 Sharp Kabushiki Kaisha Image processing apparatus, image forming apparatus, image processing system, and image processing method
CN101783951B (zh) * 2010-03-02 2012-01-04 西安交通大学 基于人类视觉系统的视频编码帧间预测模式快速确定方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6226327B1 (en) * 1992-06-29 2001-05-01 Sony Corporation Video coding method and apparatus which select between frame-based and field-based predictive modes
JP4622077B2 (ja) * 2000-10-11 2011-02-02 ソニー株式会社 画像処理装置及び画像処理方法
JP2004266489A (ja) 2003-02-28 2004-09-24 Kddi Corp 動画像符号化装置
US7280597B2 (en) * 2003-06-24 2007-10-09 Mitsubishi Electric Research Laboratories, Inc. System and method for determining coding modes, DCT types and quantizers for video coding

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101453656B (zh) * 2007-11-29 2011-06-01 华为技术有限公司 视频编码、解码方法及装置和视频编解码系统
CN101998125B (zh) * 2009-08-19 2013-12-25 宏碁股份有限公司 图像文档传输系统及其方法
WO2022257474A1 (zh) * 2021-06-11 2022-12-15 荣耀终端有限公司 图像的预测方法、电子设备和存储介质

Also Published As

Publication number Publication date
JP4197695B2 (ja) 2008-12-17
US20070036217A1 (en) 2007-02-15
US7916788B2 (en) 2011-03-29
JP2007049553A (ja) 2007-02-22

Similar Documents

Publication Publication Date Title
US11070802B2 (en) Moving image coding device, moving image decoding device, moving image coding/decoding system, moving image coding method and moving image decoding method
US6983018B1 (en) Efficient motion vector coding for video compression
CN102017634B (zh) 重新排序的变换系数的多级表示
US6934334B2 (en) Method of transcoding encoded video data and apparatus which transcodes encoded video data
CN103220528B (zh) 通过使用大型变换单元编码和解码图像的方法和设备
KR100803611B1 (ko) 영상의 부호화, 복호화 방법 및 장치
CN1913632A (zh) 运动画面编码方法和设备
CN1596422A (zh) 用于估算压缩视频数据客观质量的方法和系统
CN105684409A (zh) 在视频和图像编码和解码中使用散列值来表示各块
JP2008035134A (ja) 画像符号化装置
CN103220511A (zh) Hevc视频编码中的逻辑帧内模式命名
CN1262496A (zh) 使用正交变换域中的块匹配进行运动估测的方法和装置
CN1708132A (zh) 用于预测运动的方法和设备
CN1809165A (zh) 预测频率变换系数方法和设备、编码器和解码器及其方法
CN1956547A (zh) 运动矢量检测装置及运动矢量检测方法
CN1320830C (zh) 噪声估计方法和设备、以及利用其编码视频的方法和设备
CN1325220A (zh) 运动向量编码方法
CN1613259A (zh) 用于检测内编码图像和用于从未压缩数字视频中提取内dct精度和宏块级编码参数的方法和系统
CN1604650A (zh) 用于分级运动估计的方法
CN1174555C (zh) 可变长编码方法和装置
CN101742301A (zh) 一种块模式编码方法及装置
CN1194544C (zh) 基于时空域相关性运动矢量预测的视频编码方法
JP2007110568A (ja) 画像符号化装置
CN1941914A (zh) 用于在变换域中预测dc系数的设备及其方法
Mei et al. VLSI design of a high-speed and area-efficient JPEG2000 encoder

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication