CN101584215B - 综合空时预测 - Google Patents

综合空时预测 Download PDF

Info

Publication number
CN101584215B
CN101584215B CN2006800341279A CN200680034127A CN101584215B CN 101584215 B CN101584215 B CN 101584215B CN 2006800341279 A CN2006800341279 A CN 2006800341279A CN 200680034127 A CN200680034127 A CN 200680034127A CN 101584215 B CN101584215 B CN 101584215B
Authority
CN
China
Prior art keywords
piece
quantization
matrix
spatial
georeferencing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2006800341279A
Other languages
English (en)
Other versions
CN101584215A (zh
Inventor
苗周荣
詹姆斯·J·卡里格
马里奥·帕尼科尼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Electronics Inc
Original Assignee
Sony Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Electronics Inc filed Critical Sony Electronics Inc
Publication of CN101584215A publication Critical patent/CN101584215A/zh
Application granted granted Critical
Publication of CN101584215B publication Critical patent/CN101584215B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/162User input
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Abstract

一种用于生成目标图像中的目标像素块的空间预测的方法,该方法包括以下步骤:生成针对目标像素块的空间矢量,利用该空间矢量构建空间参考块,并且利用该空间参考块生成该目标块的空间预测。

Description

综合空时预测
技术领域
本发明涉及视频压缩领域。
背景技术
序列的视频图像一般是按照两种方式中的一种方式通过视频压缩处理来编码的。一种方式是,将通过自身编码的图像序列中的每个图像作为独立或静止图像。此处理被称为帧内编码(intra-encoding)压缩处理,因为该编码算法仅对目标图像内的特征进行操作。执行视频压缩的另一种方式(称为时间预测编码)是,基于先前编码的另一参考图像来预测目标图像的运动,而指定要编码的图像。此处理也被称为帧间编码(inter-encoding),因为,此预测是根据目标图像和参考图像之间的相互关系来生成的。
在时间预测编码处理中,目标图像和参考图像被分割成多个块。如果目标图像中的块与参考图像中的块类似,则该块从其在参考图像中的位置到其在目标图像中的位置的空间位移或运动是确定的。此位移信息存储在关联参考块和目标块的运动矢量中。来自参考块的被编码的图像数据提供对目标块的图像数据的预测。
虽然可以通过时间预测法来预测目标图像中的大多数目标块的图像数据,但是,不能通过该方法来很好地预测某些目标块。例如,目标图像中的块可能不与参考图像中的块类似。在这种情况下,利用帧内编码处理对目标块进行编码,而无需依赖任何参考图像。
图1示出利用时间预测(或帧间编码)和帧内编码两种方法对目标图像进行编码的示例。目标图像120中的目标块125利用运动矢量130与参考图像110中的类似块115匹配。然后,在解码处理中,根据参考块115的图像数据来预测目标块125的图像数据。从而通过时间预测法对目标块125进行有效地编码。
然而,目标块140不能通时间预测法来编码,因为,该目标块在参考图像110中没有类似块。因此,应当通过帧内编码法来对目标块40进行编码。
可利用时间预测法来很好地编码某些块,并且通过帧内编码方法来很好地编码其它块。当利用时间预测和帧内编码两种方法对图像进行编码时,编码器必须确定对每个块是利用时间预测法还是帧内编码法。然而,由于传统的时间预测法和帧内编码法会产生不同结果,因此,当作出该决定时,它们各自的被编码块太不相同,以致于不能进行比较。
例如,当对目标块进行编码时,一般的视频压缩算法利用图2所示的确定系统200来确定对该块应用时间预测法还是帧内编码法。应用时间预测编码法的时间预测逻辑设备220对目标块210编码。逻辑设备220确定运动矢量230,以将被编码的图像数据从参考块映射到目标块210。时间预测逻辑设备220还计算该目标块的预测的图像数据和该目标块的实际图像数据之间的预测误差240。位成本估计逻辑设备250估计运动矢量230的位成本和预测误差240的位成本,以产生对目标块210进行时间编码的位成本。
确定系统200还利用帧内编码处理对目标块210进行编码。帧内编码逻辑设备260对目标块中的原始像素值应用离散余弦变换(DCT),以产生一组DCT系数270。块内位成本估计逻辑设备280估计对DCT系数进行编码的位成本。位成本选择逻辑设备290对由逻辑设备250和280产生的位成本进行比较,并且选择具有较低位成本的编码处理。
如图2所示,时间预测处理产生运动矢量和预测误差,而帧内编码法产生一组DCT系数。为了比较这两种方法,确定系统必须执行两种编码处理,然后估计出根据每种处理的编码结果的位成本,之后识别出产生具有较低位成本的处理。因此,问题是确定系统不能在无需估计两种处理的全部结果的位成本的情况下来确定出哪个特定编码处理能提供较好的成本效益。
发明内容
一种生成对目标图像中的目标像素块的空间预测的方法,该方法包括以下步骤:生成针对目标像素块的空间矢量,利用该空间矢量构建空间参考块,并且,利用该空间参考块来生成该目标块的空间预测。
附图说明
图1示出利用时间预测(或帧间编码)和帧内编码两种方法对目标图像进行编码的示例;
图2示出确定系统的示例,该确定系统用于确定对块应用时间预测法还是帧内编码法;
图3示出综合空时预测编码系统的示例;
图4示出用于执行综合空时预测编码(ISTPE)方法的示例;
图5示出用于执行ISTPE方法的实施例的DCT空时预测处理的示例;
图6示出利用ISTPE方法的系统的示例。
具体实施方式
在下面的描述中,参考了形成本申请的一部分的附图,在附图中显示出了可以实施本发明的具体实施例。应当了解,可以利用其它实施例,并且在不脱离本发明的范围内可以作出各种结构改变。例如,本领域的技术人员将明白,用于描述各个实施例的术语领域、帧、图像或画面通常可以根据所引用的视频数据互换。
空间预测法通过创建空间矢量和空间预测误差来替代传统的帧内编码法。空间矢量具有的结构类似于运动矢量的结构。所以,对空间矢量进行编码的成本类似于对运动矢量进行编码的成本。因此,空间预测法可以与时间预测法结合而产生一种综合空时预测编码(ISTPE)方法。
为了将时间和空间预测法结合在一起,基于误差的选择处理通过比较两种方法的预测误差来选择对特定目标块应用哪种方法。选择处理生成了时间预测法的预测结果,包括运动矢量和时间预测误差。选择处理还生成空间预测法的预测结果,包括空间矢量和空间预测误差。因为对运动矢量进行编码的成本类似于对空间矢量进行编码的成本,所以该选择处理通过比较空间和时间预测误差来确定选择哪种编码方法。利用具有较小预测误差的预测方法来对目标块进行编码。作出该选择无需估计空间和时间预测法的编码结果的位成本。
由于时间和空间预测法具有类似的预测和编码阶段,并且产生类似的输出,因此,执行综合法的编码器在选择适当编码法方面具有较小的复杂性和较好的精确性。图3示出了综合空时预测编码系统300。系统300通过基于误差的选择来确定对目标块应用哪种预测方法。
时间预测逻辑设备320利用时间预测处理对目标块310进行编码。逻辑设备320生成运动矢量330,以指向参考块。逻辑设备320利用来自参考块的被编码的图像数据预测目标块的图像数据。然后,逻辑设备320计算时间预测误差340,该时间预测误差340是对目标块进行预测的图像数据和该目标块的实际图像数据之间的差。
还用空间预测逻辑设备350对目标块310编码,用于创建该目标块的空间矢量360。逻辑设备350利用空间矢量构建空间参考块。逻辑设备350利用空间参考块预测目标块的图像数据。然后,逻辑设备350计算空间预测的图像数据和实际图像数据之间的空间预测误差370。
综合空时选择逻辑设备380对时间预测误差340和空间预测误差370进行比较,选择具有较小误差的编码方法,作为用于目标块310的适当编码法。
如图3所示,空间预测逻辑设备350产生输出,诸如空间矢量360和空间预测误差370,该输出类似于时间预测逻辑设备320的输出。当选择时间或空间预测法对目标块进行编码时,编码器系统300可以通过直接比较时间和空间预测的预测误差来作决定,而无需估计时间和空间预测的位成本。因此,减小了作出决定的复杂性。这使得空间预测法很容易与时间预测法结合,以提供一种执行综合空时预测编码(ISTPE)的系统。
此外,由ISTPE系统生成的预测误差可以利用基于非块处理来进行编码。这与传统的帧间和帧内编码法不同,仅生成经过帧间编码(或者时间预测)的块之间的预测误差。因此,这些传统预测误差必须要逐块(例如,按照基于DCT法的块)进行编码。ISPTE处理生成对目标块进行空间预测和时间预测的预测误差。这样,可以将两种方法产生的预测误差集合在一起,并利用基于非块的变换(例如,微波变换)来对其进行编码。
图4示出了一种用于对目标图像执行ISTPE的方法。在410中,接收目标图像的时间参考图像。经过编码的时间参考图像可以是一个也可以是多个参考图像。
在402中,选择目标块的形态图案(shape pattern)并且将其应用到要被预测的目标图像。形态图案可以是固定的块图案(例如,在MPEG-1/2中使用的图案),也可以是可变的块图案(例如,在MREG-AVC/H.264中使用的图案)。在420中,所选择的图案被应用于目标图像,以生成被称为目标块的一组块(或其它形态)。每个目标块是要根据时间或空间参考块一起预测的目标图像中最小的像素组,例如,一个目标块中的所有像素共享相同的运动矢量或空间矢量。
在425中,选择目标块中的一个进行编码。在430中,时间预测法应用于所选择的目标块,以生成指向参考块的运动矢量。本领域技术人员所知的传统运动估计步骤可以用来识别参考块和确定运动矢量。例如,可以根据目标块和参考块之间的位移(或运动)来计算运动矢量。在435中,参考块中被编码的图像数据用于生成对目标块的图像数据的时间预测。
在440中,空间预测法用于所选择的目标块,以创建该目标块的空间矢量。空间矢量是一组用于创建该目标块的原始方案(coarse version)
(被称为空间参考块)的数据。在450中,利用空间矢量构建空间参考块。可以用不同的方法来创建空间矢量和构建空间参考块。在一个实施例中,使用离散余弦变换空间预测(DCT-SP)处理来创建空间矢量和构建相应的空间参考块。下面描述DCT-SP处理的一个示例。
在455中,空间参考块用于生成对该目标块的图像数据的空间预测。
在460中,选择函数选择用于对该目标块进行编码的预测方法。该选择是通过比较时间和空间预测法的预测误差来完成的。时间预测误差是通过从该块的实际像素值中减去对该块进行时间预测的像素值而得到的。同样,空间预测误差是通过从实际值中减去空间预测的像素值而得到的。通常,选择函数计算出时间预测误差和空间预测误差,比较这两种误差,并选择具有较低预测误差的方法。在一个实施例中,该选择函数确定时间预测和空间预测两种方法对目标块的预测失真(prediction distortion)的值,并且选择具有较低预测失真的编码法。
对块预测失真的示例是:
Figure S2006800341279D00061
其中,x,y∈B表示块(或者形态)B中的所有像素,vx,y是目标图像的原始像素值,以及
Figure S2006800341279D00062
是目标像素的预测值。
根据435,时间预测可以输入公式(1),以产生时间预测失真。根据455,空间预测可以应用到公式(1),以产生空间预测失真。因此,公式(1)可用于生成时间和空间预测的预测失真。然后,很容易地比较两种预测失真,以选择适当的编码法。
预测失真的另一示例是预测误差的绝对值的和:
Figure S2006800341279D00063
为了在460中用来确定对目标块是利用时间预测法还是空间预测法,用户可以选择公式(1)、公式(2)或者其它函数。
在470中,利用适当编码法可以将最后的目标块预测误差(在460中根据空间或时间编码选择的)与该块一起进行编码。替代地,在目标图像中的每个目标块被预测和编码之后,可以对所有目标块的预测误差一起进行编码。
在480中,如果图像中的其它目标块需要被编码,选择处理返回425,否则,处理在490中结束。
更详细地参考图440到450,在图5中示出了创建空间矢量和构建空间参考块的方法的示例。该示例性方法利用DCT(离散余弦变换)生成空间矢量并构建其相应的空间参考块。
在440中,通过执行下面的函数来生成空间矢量。在510中,接收目标图像中的目标块。在515中,生成变换系数。例如,用来表示目标块的矩阵,其中,矩阵中的每个元素是该块的像素值。对矩阵X执行块变换(例如,DCT),以得到变换系数矩阵C。
在517中,用于量子化矩阵C的量子化函数q作为控制参数被输入该方法。量子化函数的值可以由用户定义,或者通过编码器来设定。在520中,矩阵C中的每个元素被量子化,以产生量子化矩阵C′。
在522中,在一些实施例中,要被选择的许多系数Nc和它们相应的矩阵位置由用户输入或者通过编码器设定作为控制参数。通常,选择系数Nc的数量,以使得空间矢量系数元素的数量近似于运动矢量中的元素的数量。因此,可以通过忽略这两种矢量的编码成本的函数来比较这两种方法的编码效率。
在525中,从它们在系数矩阵C′的特定位置选择Nc个系数。在一个实施例中,该处理选择位于系数矩阵C′的左上角的Nc个系数。
在530中,利用Nc个量子化的数字创建对于该目标块的空间矢量S。该空间矢量可用于生成与该目标块对应的空间参考块。
在450中,通过在560中首先接收特定目标块的空间矢量S来构建空间参考块。空间矢量包括Nc个元素。在565中,根据空间矢量构建该目标块的块变换系数矩阵。在一个实施例中,该步骤是通过首先将所有系数设定为0来完成的。然后,来自空间矢量S的系数值被恢复到它们在矩阵中的先前位置。由于Nc个系数被恢复,结果得到矩阵
Figure S2006800341279D00071
在522中,如上所述,可以将系数位置矩阵作为系统参数输入该方法。
在570中,反量子化
Figure S2006800341279D00072
中的每个系数(如上所述,在517中可以将量子化函数作为系统参数输入该方法),以产生系数矩阵
Figure S2006800341279D00073
在575中,对
Figure S2006800341279D00074
执行逆变换。结果得到空间参考块
Figure S2006800341279D00075
空间参考块
Figure S2006800341279D00076
用于鱼的原始的目标块X。
在580中,如果需要对其它目标块执行空间预测法,则处理通过返回510而被重复。否则,处理在590中结束。
在图5中示出的方法产生了具有与时间参考块和运动矢量的结构和功能类似的结构和功能的空间参考块和与其对应的空间矢量。例如,时间参考块通过其运动矢量来识别。例如,时间参考块通过其运动矢量来识别,并且空间参考块是根据其空间矢量来构建的。由图5的方法创建的空间矢量具有与运动矢量的元素数量近似的元素数量。利用近似数量的元素,当确定对目标块应用哪种预测方法时可以忽略对每个矢量的编码成本,所述编码成本是对该矢量进行编码所需的位的数量。因此,通过比较两种预测块的预测误差可以很容易地作出编码决定。
下面描述利用图5的方法执行空间预测的示例。在该示例中,目标块具有4×4的尺寸,例如该矩阵具有4行和4列像素。通常,DCT可应用于任何尺寸的长方形块,例如,8×8或4×8。以X表示目标块的原始像素值(从实际图像得到的数据)矩阵,在该示例中:
X = 197 165 127 105 154 124 98 73 139 117 84 56 123 98 67 35
对矩阵应用二维DCT变换,以生成下面的DCT系数矩阵:
C = DCT ( X ) = 440.500 130 0.500 4.302 96 2.078 7.041 - 1.189 18.000 6.962 1.000 - 0.178 19.546 3.311 - 1.293 - 3.578
对C中的DCT系数应用量子化函数,例如,以值q来除C中的每个元素,然后四舍五入为最近的整数(在该示例中,q=10),
C ′ = Round ( C / q ) = 44 13 0 0 10 0 1 0 2 1 0 0 2 0 0 0
设定Nc=3,从而空间矢量具有3个元素。这3个元素的位置在左上角。然后,选择C′的左上角的3个量子化系数。通常,系数Nc的数量和它们的位置可以由用户定义为自由参数(free parameter)。在该示例中,所选择的C′中的系数为44、13和10。
现在,利用所选择的系数创建该目标块的空间矢量:
S=[44,13,10]。
去掉矩阵C′中的所有其它元素。
为了构建空间参考块,首先根据空间矢量S创建系数矩阵
Figure S2006800341279D00084
。这是通过(i)将
Figure S2006800341279D00085
中所有元素设定成0,并且(ii)根据空间矢量S将所选择的系数恢复到先前它们在矩阵中的位置来完成的:
Figure S2006800341279D00091
然后,对矩阵
Figure S2006800341279D00092
执行反量子化,例如,用q=10乘
Figure S2006800341279D00093
Figure S2006800341279D00094
对矩阵
Figure S2006800341279D00095
应用反DCT,以产生空间参考块的像素值,
Figure S2006800341279D00097
用空间参考块
Figure S2006800341279D00098
中的像素值预测目标块X的像素值。空间预测误差是该目标块的实际像素值减去预测的像素值:
Figure S2006800341279D00099
在该情况中,空间预测误差是:
e = 197 165 127 105 154 124 98 73 139 117 84 56 123 98 67 35 - 185 160 125 100 166 141 106 81 139 114 79 54 120 95 60 35 = 12 5 2 5 - 12 - 17 - 8 - 8 0 3 5 2 3 3 7 0
在视频压缩应用中,空间预测编码法可替代传统帧内编码法。空间预测编码法和时间预测编码法的结合得到综合空时预测编码法,该方法在视频压缩应用(例如,MPEG)中可应用于对全部图像序列进行编码。
图6示出利用ISTPE法的系统的示例。数字视频照相机610以电子形式捕获图像,并且利用压缩设备620处理图像,其中,压缩设备620在压缩和编码处理中执行ISTPE法。经过编码的图像通过电子传输介质630被发送到数字回放设备640。由解码设备650对图像进行解码,其中,在解码处理中,解码设备650利用ISPTE法。照相机610是包括本发明的实施例的多种图像处理装置(例如,其它图像捕获设备、图像编辑器、图像处理器、个人和商用计算机平台等等)中的示例性的一种。同样,解码设备650是对图像数据进行解码的多种设备中的示例性的一种。
虽然依照特定系统环境中的示例性实施例来描述本发明,但是本领域技术人员将会明白,在不脱离所附权利要求的精神和范围内可以在其它和不同硬件和软件环境中按照多种方式来实施本发明。

Claims (4)

1.一种综合空时预测方法,包括:
生成对于目标像素块的像素值矩阵;
将离散余弦变换函数应用于所述矩阵,以产生离散余弦变换系数矩阵;
将使用量子化值的量子化函数应用于所述离散余弦变换系数矩阵;
由数据处理系统通过执行离散余弦变换空间预测法生成针对所述目标像素块的空间矢量,所述离散余弦变换空间预测法包括选择许多量子化的系数作为所述空间矢量的元素;
利用所述空间矢量生成量子化离散余弦变换系数矩阵;
将具有与所述量子化函数的量子化值相对应的量子化值的逆量子化函数应用于所述量子化离散余弦变换系数矩阵,以生成离散余弦变换系数矩阵;
将逆离散余弦变换函数应用于所述离散余弦变换系数矩阵,以生成具有像素值矩阵的空间参考块;
利用所述空间参考块生成对所述目标像素块的空间预测;
生成空间预测误差;
将所述空间预测误差与时间预测误差进行比较;并且
如果所述空间预测误差小于所述时间预测误差,则对所述空间参考块进行编码。
2.如权利要求1所述的方法,其中,利用所述空间参考块生成对所述目标像素块的空间预测包括:
利用来自所述空间参考块的像素值矩阵预测所述目标像素块的值。
3.一种综合空时预测装置,包括:
矩阵生成器,用于生成对于目标像素块的像素值矩阵;
离散余弦变换系数生成器,用于利用所述矩阵产生离散余弦变换系数矩阵;
量子化设备,用于将使用量子化值的量子化函数应用于所述离散余弦变换系数矩阵;
空间矢量生成器,用于生成针对所述目标像素块的空间矢量,其中,所述空间矢量生成器包括离散余弦变换逻辑设备,所述离散余弦变换逻辑设备执行离散余弦变换空间预测功能并且包括用于选择许多量子化的系数作为所述空间矢量的元素的选择设备;
空间矢量解码器,用于利用所述空间矢量生成量子化离散余弦变换系数矩阵;
逆量子化设备,用于将逆量子化函数应用于所述量子化离散余弦变换系数矩阵,以生成离散余弦变换系数矩阵,其中所述逆量子化函数具有与所述量子化函数的量子化值相对应的量子化值;
逆离散余弦变换设备,用于将逆离散余弦变换函数应用于所述离散余弦变换系数矩阵,以生成具有像素值矩阵的空间参考块;
空间预测器,用于利用所述空间参考块生成对所述目标块的空间预测;
预测误差生成器,用于生成空间预测误差;
比较器,用于将所述空间预测误差与时间预测误差进行比较;以及
编码器,如果所述空间预测误差小于所述时间预测误差,则所述编码器对所述空间参考块进行编码。
4.如权利要求3所述的装置,其中,所述空间预测器包括:
参考块解码器,用于利用来自所述空间参考块的所述像素值矩阵来预测所述目标像素块的像素值。
CN2006800341279A 2005-09-16 2006-08-30 综合空时预测 Expired - Fee Related CN101584215B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/228,599 2005-09-16
US11/228,599 US7620108B2 (en) 2005-09-16 2005-09-16 Integrated spatial-temporal prediction
PCT/US2006/034091 WO2007037912A2 (en) 2005-09-16 2006-08-30 Integrated spatial-temporal prediction

Publications (2)

Publication Number Publication Date
CN101584215A CN101584215A (zh) 2009-11-18
CN101584215B true CN101584215B (zh) 2011-09-21

Family

ID=37884043

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800341279A Expired - Fee Related CN101584215B (zh) 2005-09-16 2006-08-30 综合空时预测

Country Status (6)

Country Link
US (1) US7620108B2 (zh)
EP (1) EP1925160A4 (zh)
JP (1) JP5078895B2 (zh)
KR (1) KR101274804B1 (zh)
CN (1) CN101584215B (zh)
WO (1) WO2007037912A2 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8233535B2 (en) * 2005-11-18 2012-07-31 Apple Inc. Region-based processing of predicted pixels
DE102005061690A1 (de) * 2005-12-21 2007-07-05 Solmic Gmbh Verfahren zur Herstellung solartauglichen Siliziums
US8296662B2 (en) * 2007-02-05 2012-10-23 Brother Kogyo Kabushiki Kaisha Image display device
MX2009010921A (es) * 2007-04-12 2009-11-19 Nokia Corp Codificacion por transformacion mejorada espacialmente.
US8458109B2 (en) * 2009-05-27 2013-06-04 Yin Zhang Method and apparatus for spatio-temporal compressive sensing
GB2487200A (en) 2011-01-12 2012-07-18 Canon Kk Video encoding and decoding with improved error resilience
GB2488815C (en) * 2011-03-09 2018-03-28 Canon Kk Video decoding
GB2491589B (en) 2011-06-06 2015-12-16 Canon Kk Method and device for encoding a sequence of images and method and device for decoding a sequence of image
US8670782B2 (en) 2011-06-10 2014-03-11 International Business Machines Corporation Systems and methods for analyzing spatiotemporally ambiguous events
US9571833B2 (en) 2011-11-04 2017-02-14 Nokia Technologies Oy Method for coding and an apparatus
US9020294B2 (en) 2012-01-18 2015-04-28 Dolby Laboratories Licensing Corporation Spatiotemporal metrics for rate distortion optimization
US9621902B2 (en) * 2013-02-28 2017-04-11 Google Inc. Multi-stream optimization
CN107770527B (zh) * 2016-08-21 2021-12-14 上海天荷电子信息有限公司 使用邻近编码参数和最近编码参数的数据压缩方法和装置
US11265553B2 (en) 2017-09-22 2022-03-01 V-Nova International Limited Obtaining a target representation of a time sample of a signal

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5818536A (en) * 1995-09-29 1998-10-06 U.S. Philips Corporation Motion vector selection using a cost function relating accuracy to bit rate
US5872866A (en) * 1995-04-18 1999-02-16 Advanced Micro Devices, Inc. Method and apparatus for improved video decompression by predetermination of IDCT results based on image characteristics
US6466624B1 (en) * 1998-10-28 2002-10-15 Pixonics, Llc Video decoder with bit stream based enhancements
CN1482802A (zh) * 2003-08-18 2004-03-17 北京工业大学 基于时空域相关性快速运动估计的视频编码方法

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0309669B1 (de) 1987-09-30 1992-12-30 Siemens Aktiengesellschaft Verfahren zur szenenmodellgestützten Bilddatenreduktion für digitale Fernsehsignale
US5047850A (en) 1989-03-03 1991-09-10 Matsushita Electric Industrial Co., Ltd. Detector for detecting vector indicating motion of image
US5654771A (en) 1995-05-23 1997-08-05 The University Of Rochester Video compression system using a dense motion vector field and a triangular patch mesh overlay model
ATE223135T1 (de) 1996-04-19 2002-09-15 Nokia Corp Videokodierer und -dekodierer mit bewegungsbasierter bildsegmentierung und bildzusammenfügung
US6101276A (en) 1996-06-21 2000-08-08 Compaq Computer Corporation Method and apparatus for performing two pass quality video compression through pipelining and buffer management
JP3967405B2 (ja) 1996-10-09 2007-08-29 テキサス インスツルメンツ インコーポレイテツド 画像信号の符号化方法
JP4034380B2 (ja) 1996-10-31 2008-01-16 株式会社東芝 画像符号化/復号化方法及び装置
DE19648016A1 (de) 1996-11-20 1998-05-28 Philips Patentverwaltung Verfahren zur fraktalen Bildkodierung und Anordnung zur Durchführung des Verfahrens
CN101005624B (zh) 1997-02-13 2011-11-16 三菱电机株式会社 动态图象译码装置和方法
US6178205B1 (en) 1997-12-12 2001-01-23 Vtel Corporation Video postfiltering with motion-compensated temporal filtering and/or spatial-adaptive filtering
US6208692B1 (en) 1997-12-31 2001-03-27 Sarnoff Corporation Apparatus and method for performing scalable hierarchical motion estimation
US6591015B1 (en) 1998-07-29 2003-07-08 Matsushita Electric Industrial Co., Ltd. Video coding method and apparatus with motion compensation and motion vector estimator
KR100301833B1 (ko) * 1998-08-20 2001-09-06 구자홍 오류은폐방법
US6711278B1 (en) 1998-09-10 2004-03-23 Microsoft Corporation Tracking semantic objects in vector image sequences
JP2000308064A (ja) 1999-04-22 2000-11-02 Mitsubishi Electric Corp 動きベクトル検出装置
US6480615B1 (en) 1999-06-15 2002-11-12 University Of Washington Motion estimation within a sequence of data frames using optical flow with adaptive gradients
JP3753578B2 (ja) 1999-12-07 2006-03-08 Necエレクトロニクス株式会社 動きベクトル探索装置および方法
US6864994B1 (en) 2000-01-19 2005-03-08 Xerox Corporation High-speed, high-quality descreening system and method
WO2001078402A1 (en) 2000-04-11 2001-10-18 Koninklijke Philips Electronics N.V. Video encoding and decoding method
AU2002228884A1 (en) 2000-11-03 2002-05-15 Compression Science Video data compression system
US6782054B2 (en) * 2001-04-20 2004-08-24 Koninklijke Philips Electronics, N.V. Method and apparatus for motion vector estimation
US7474699B2 (en) * 2001-08-28 2009-01-06 Ntt Docomo, Inc. Moving picture encoding/transmission system, moving picture encoding/transmission method, and encoding apparatus, decoding apparatus, encoding method decoding method and program usable for the same
JP3807342B2 (ja) * 2002-04-25 2006-08-09 三菱電機株式会社 デジタル信号符号化装置、デジタル信号復号装置、デジタル信号算術符号化方法、およびデジタル信号算術復号方法
CN100452668C (zh) 2002-07-09 2009-01-14 诺基亚有限公司 用于在视频编码中选择插值滤波器类型的方法和系统
US7068722B2 (en) 2002-09-25 2006-06-27 Lsi Logic Corporation Content adaptive video processor using motion compensation
JP4462823B2 (ja) 2002-11-20 2010-05-12 ソニー株式会社 画像信号の処理装置および処理方法、それに使用される係数データの生成装置および生成方法、並びに各方法を実行するためのプログラム
JP3997171B2 (ja) 2003-03-27 2007-10-24 株式会社エヌ・ティ・ティ・ドコモ 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法、及び動画像復号プログラム
JP2005151017A (ja) * 2003-11-13 2005-06-09 Sharp Corp 画像符号化装置
US7480334B2 (en) 2003-12-23 2009-01-20 Genesis Microchip Inc. Temporal motion vector filtering
KR20050075483A (ko) 2004-01-15 2005-07-21 삼성전자주식회사 비디오 코딩 및 디코딩 방법, 및 이를 위한 장치
JP4257789B2 (ja) * 2004-02-27 2009-04-22 Kddi株式会社 動画像符号化装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5872866A (en) * 1995-04-18 1999-02-16 Advanced Micro Devices, Inc. Method and apparatus for improved video decompression by predetermination of IDCT results based on image characteristics
US5818536A (en) * 1995-09-29 1998-10-06 U.S. Philips Corporation Motion vector selection using a cost function relating accuracy to bit rate
US6466624B1 (en) * 1998-10-28 2002-10-15 Pixonics, Llc Video decoder with bit stream based enhancements
CN1482802A (zh) * 2003-08-18 2004-03-17 北京工业大学 基于时空域相关性快速运动估计的视频编码方法

Also Published As

Publication number Publication date
WO2007037912A2 (en) 2007-04-05
JP5078895B2 (ja) 2012-11-21
JP2009509403A (ja) 2009-03-05
WO2007037912A3 (en) 2009-05-07
KR20080048071A (ko) 2008-05-30
EP1925160A4 (en) 2011-01-26
KR101274804B1 (ko) 2013-06-13
US20070064797A1 (en) 2007-03-22
CN101584215A (zh) 2009-11-18
US7620108B2 (en) 2009-11-17
EP1925160A2 (en) 2008-05-28

Similar Documents

Publication Publication Date Title
CN101584215B (zh) 综合空时预测
US11546627B2 (en) Moving picture decoding method and moving picture encoding method
US8625916B2 (en) Method and apparatus for image encoding and image decoding
CN105681795B (zh) 用于对帧序列进行视频编码的方法和编码器
US9210435B2 (en) Video encoding method and apparatus for estimating a code amount based on bit string length and symbol occurrence frequency
CN104885455A (zh) 用于高效下一代视频编码的通过使用帧层次敏感的量化的内容自适应比特率和质量控制
CN104067619A (zh) 视频解码器、视频编码器、视频解码方法以及视频编码方法
CN101496412A (zh) 具有域变换的基于网络的视频压缩
CN104038763A (zh) 图像编码装置及方法,和图像解码装置及方法
KR100922510B1 (ko) 영상의 부호화 및 복호화 방법, 장치 및 그 애플리케이션
KR20180037042A (ko) 모션 벡터 필드 코딩 방법 및 디코딩 방법, 및 코딩 및 디코딩 장치들
JP5909149B2 (ja) 色変換装置、符号化器および復号器ならびにそれらのプログラム
US10979704B2 (en) Methods and apparatus for optical blur modeling for improved video encoding
US7885335B2 (en) Variable shape motion estimation in video sequence
KR20110134404A (ko) 화상 데이터의 블록을 예측하는 방법, 이 방법을 실행하는 복호 장치 및 부호화 장치
JP6004852B2 (ja) ピクセルブロックを符号化及び再構成する方法と装置
US20160173854A1 (en) Multiview video coding method using non-referenced view video group
JP2008072608A (ja) 画像符号化装置及び画像符号化方法
WO2006084419A1 (en) Method for reducing bit rate requirements for encoding multimedia data
JP2009021786A (ja) 画像符号化装置及び画像符号化方法
JP2005354307A (ja) 逆量子化器及びこれを用いた画像復号化装置
JP2007243859A (ja) 画像符号化装置及び画像符号化プログラム
JP2007529921A (ja) 画像エンコード・システムおよび方法
JPH0846972A (ja) 画像符号化装置及び画像復号装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110921

Termination date: 20150830

EXPY Termination of patent right or utility model