CN1719735A - 编码源图像序列的方法和设备 - Google Patents

编码源图像序列的方法和设备 Download PDF

Info

Publication number
CN1719735A
CN1719735A CNA2005100821894A CN200510082189A CN1719735A CN 1719735 A CN1719735 A CN 1719735A CN A2005100821894 A CNA2005100821894 A CN A2005100821894A CN 200510082189 A CN200510082189 A CN 200510082189A CN 1719735 A CN1719735 A CN 1719735A
Authority
CN
China
Prior art keywords
field
piece
image
preanalysis
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005100821894A
Other languages
English (en)
Inventor
扬妮克·奥利维耶
爱德华·弗朗索瓦
弗兰克·伊龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of CN1719735A publication Critical patent/CN1719735A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/112Selection of coding mode or of prediction mode according to a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • H04N19/194Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive involving only two passes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/53Multi-resolution motion estimation; Hierarchical motion estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression

Abstract

一种编码源图像序列的方法和设备。预分析步骤(6)基于在此步骤计算的运动矢量和对应的块,用当前图像的偶数和奇数场块和参考图像的偶数和奇数场块,实现当前图像的偶数和奇数场块的相关水平计算,在编码模式决定步骤(13)和在中间编码模式中,根据相关水平,实现同样奇偶或相反奇偶的场之间的中间编码或在帧之间的中间编码。

Description

编码源图像序列的方法和设备
技术领域
本发明涉及编码源图像序列的方法或设备。更特别的是方法包括象元-回归的运动估计型预分析步骤和有由块型运动估计配对的特殊编码步骤。
背景技术
域是视频压缩的。我们特别对基于块的压缩方案感兴趣,在图像或块水平实现自适应的帧/场编码,在压缩中编码提供实质性的增益。例如这是MPEG4章节-10(H264)标准。在这些经典的实现的框图中,在编码环中做宏块水平的帧/场编码决定,引入相对于只运行在帧模式或场模式的非自适应编码器的双倍的复杂性。这个功能在实现时是昂贵的。
在其它因素之中编码决定依赖于时序相关,结果由预测编码的编码电路做运动估计,一般有块匹配型和分层型。
例如,在编码器与H264或MPEG4部分10标准兼容的“块匹配”型分层运动估计器的情况中,计算各种块尺寸(4×4,4×8,8×4,8×8,8×16,16×8,16×16)和各个参考图像的运动矢量场。对由宏块对的编码,已知为MBAFF,宏块自适应帧场的英语首字母缩略词,估计器对帧提供每宏块,1个运动矢量场,对场提供2个运动矢量场。因此对16×16尺寸的宏块,对各个参考图像计算41×3个运动矢量,如果使用几个参考图像,如在多参考模式中,乘以此数。以计算的观点,在多种编码可能性中此选择是非常昂贵的。
其次,在H264标准的范例中,对在图像尺寸为16×32的亮度块中,对各个垂直宏块可独立的做关于场或帧的编码的决定。此编码操作称为MBAFF,“宏块自适应帧/场编码”的首字母缩略词。对在帧模式中编码的宏块对,各宏块包含隔行扫描的图像的行。对在场模式中编码的宏块对,上部宏块包含上部场或奇数场的行,下部宏块包含下部场或偶数场的行。
在宏块对水平和不在关于MPEG2标准的宏块水平做编码模式决定,编码模式决定可基于编码成本的测量和与模式关联的失真,因此乘以可能的组合和计算负荷。
减少计算的一个解决方案由在低分辨率图像的场和帧之间的选择组成,以便限制在较高分辨率上的计算。在锥体的上部水平做的这些草率的选择,因此比源图像的分辨率更低的分辨率,不提供好的结果,由于不足的垂直精确度,上部场、下部场选择对应在一条行中移动。
发明内容
本发明的目的是克服上面描述的缺点。
为此,本发明的一方面是编码源图像序列的方法,包括有在当前图像和参考图像之间象元-回归型运动估计的预分析步骤,和有在当前图像和参考图像之间块匹配运动估计步骤的图像块的实际编码步骤,在编码模式决定步骤之后,如内部模式,在同样奇偶或相反奇偶的场之间的或在帧之间的中间模式,特征在于基于在此步骤计算的运动矢量和对应的块,预分析步骤为具有参考图像的偶数或奇数场块的当前图像的偶数或奇数场块执行相关水平计算,根据相关水平,在编码模式决定步骤和在内部编码模式时,利用同样奇偶或相反奇偶的场之间的中间编码或在帧之间的中间编码。
根据特殊的实例,当相反奇偶的场之间的相关水平比同样奇偶的场之间的相关水平低时,利用场之间的中间编码。
根据特殊的实例,预分析步骤也实现具用参考图像的帧块的当前图像的帧块之间的相关计算,并根据相关水平确定场之间或帧之间的编码模式。
根据特殊的实例,相关计算由下面的DFD值的计算组成:
DFD = Σ i , j = 0 i , j = 15 | pi x c ( i , j ) - pi x pred ( i , j ) |
Pixc(i,j)对应于当前块的行i和列j的一个象元的亮度值。
Pixpred(i,j)对应于在参考图像或预测的块中由运动矢量指定的块的行i和列j的象元的亮度值。
根据特殊的实例,图像块分割为上部块和下部块,上部块对应于上部场,下部块对应于下部场,反之亦然。帧之间的中间模式由选择各个上部块和下部块的参考图像的重建的上部或下部场组成,此选择依赖于整个图像块的相关性测量。
根据特殊的实例,预分析步骤包括,基于由象元-回归型运动估计的估计计算的运动,由运动补偿滤波降低噪声的步骤。
根据特殊的实例,块匹配运动估计是分层型的。
根据特殊的实例,在较低分辨率的源图像上实现象元-回归型运动估计。
根据特殊的实例,在预分析步骤计算的运动矢量和相应的块是计算有关块的象元的矢量。
根据特殊的实例,在预分析步骤计算的运动矢量相应的块从有关块的象元计算的运动矢量分量的中值或平均值中获得。
根据特殊的实例,对几个参考图像执行相关计算,预分析步骤根据相关值执行一个或多个参考图像的选择。
本发明也涉及编码设备,包含有象元-回归型运动估计器的预分析电路,和图像块的实际编码电路,包括连接编码模式决定电路的图像块匹配运动估计器,特征在于基于由象元-回归型运动估计器计算的运动矢量,预分析电路用参考图像的偶数或奇数帧块,加于编码模式决定电路和在中间编码模式中,在同样奇偶或相反奇偶的场之间的中间编码,或在帧之间的中间编码中,根据相关水平,执行当前帧的偶数或奇数场块的相关计算。
根据特殊的实例,预分析电路传输编码模式信息到块匹配运动估计电路,以确定有关重建的图像的场和/或帧的运动估计。
使用由运动补偿滤波电路的运动估计器计算的运动矢量场,在编码环前产生场或帧编码模式的预选择,在实际编码前,降低源图像的噪声。
因此,降低了实现宏块水平的帧/场自适应编码的复杂性。简化了编码模块的编码模式决定电路计算。
附图说明
从描述中清楚的显现本发明其它的特征和优点,提供的描述作为非限制的范例和参考附图如下:
图1是本发明的编码器的框图;
图2是在第一解决方案中,由预分析电路的运动估计器计算的运动矢量;
图3在第二解决方案中,由预分析电路的运动估计器计算的运动矢量。
具体实施方式
在被传输到预分析电路6的编码器的输入端接收源图像的数字视频数据。图像被滤波并按图像块传输到减法器1的第一输入端。根据编码模式,内部的或中间的,减法器1传输有关在它的第一输入端接收的当前块的信息,或从后者减去对应于在它的第二输入端得到的预测的块的最新信息。减法器1的输出数据传输到离散余弦和量化变换电路2。此电路的量化的输出系数通过熵编码器3经历熵编码,然后存储在缓冲存储器4中。此存储器的填充水平传输到比特率控制电路5,它也从预分析电路接收数据,它影响量化器2的量化步骤。
重建当前图像提供预测的块。因此,量化的系数通过参考电路7经历逆量化和逆离散余弦变换,给出解码的亮度值。
如果它是中间模式编码的,加法器8使得预测的块加到解码的系数块上。在存储到存储重建的当前图像的图像存储器10之前,由滤波电路9滤波重建的块。
分层的运动估计器11接收有关解码的信息或由图像存储器10存储的重建的图像,和来自预分析电路6的有关源图像的当前宏块的信息。根据已知的原理,实现此当前宏块和重建的图像之间的相关性计算,以便提供运动矢量。这些矢量传输到编码模式决定电路13,此电路实现编码成本计算,以确定编码模式。如果需要,此编码模式和相应的运动矢量传输到运动补偿电路12,它实现重建的图像的运动补偿,从此重建的图像提供预测的图像块。运动矢量也传输到用于编码的熵编码器3,并传输到解码器。
用更详细的方式,在编码器的输入端有包含分辨率降低电路、象元-回归型运动估计电路和滤波电路的预分析电路3。这些电路使得在编码前要处理的图像的噪声降低。在此领域,认识到象元-回归型运动估计比由块的运动估计更适应于噪声降低。那么这是在编码器的预分析步骤实现的算法类型。
根据本发明,预分析电路3执行相关性计算,提供帧/场编码决定信息到编码模式决定电路13。如在后面步骤描述的一样,它实行帧/场模式预选择,以简化由决定模块进行的计算。
在编码器的输入端接收的图像序列的源图像由预分析电路子取样和可能的内插,提供更低空间分辨率的图像。在实际的图像编码前,由此预分析电路估计象元-回归型运动。那么它计算较低分辨率图像的每个象元,在我们的范例中它的尺寸水平的和垂直的划分为两个。此估计也预先对编码模块提供某些有用的信息,如在运动中检测的区域,不可预测的区域,优选的预测方向等。
基于此运动估计,运动补偿滤波实现在全分辨率的图像上;此滤波降低图像的噪声,因此,改善了编码器的效率。
可使用预分析电路定义要编码的序列的GOP结构,即,图像的类型,内部或中间,参考图像,双向等。术语GOP是“图像组”的首字母缩略词,并在MPEG标准中规定。
对预先规定的图像数执行预分析。在预分析和实际图像编码之间的延迟时间段可认为是比特率控制的图象组的量级。例如这对应于MPEG标准的一个或几个GOP。
在我们的例子中,运动估计电路11是根据分层结构和块匹配方法。当前的宏块与解码的图像相比,根据增加分辨率的锥体构造,在锥体的最低分辨率开始到最高的分辨率水平。从最低的分辨率水平到最高的分辨率水平,估计各分辨率水平的运动矢量场,能使用在一个水平做的估计作为更高水平的预测。锥体依赖于编码电路的不同编码模式。因此,对于对帧、场和给定参考图像存在多个锥体。在许多参考方法中,锥体的数量是成倍增加的。
用有关帧的宏块对和有关场的这些宏块对的各宏块计算运动矢量。
在编码环中,滤波电路9实现重建的图像的滤波,以降低块的影响。正好是滤波的图像存储在图像存储器10中。
预分析电路6连接比特率控制电路5,提供GOP结构信息和图像类型的编码成本信息,简化能集成事后可追溯的信息的比特率控制。在内部模式的第一通道期间,预分析电路根据编码确定图像的复杂性,并传输每图像类型的编码成本估计到控制电路,因此控制电路可计算DCT+Q电路的量化步骤。
编码模式决定电路执行编码成本或能量计算,选择编码模式,内部模式,中间模式,双向的,参考图像选择等。在从运动估计器接收的运动矢量中,它消除那些对应于由预分析电路没有选择的模式,在那些遗留下来的中,选择提供最低编码成本的运动矢量。
图2用符号表现由象元-回归型运动估计器实现的不同类型的宏块编码运动估计。
帧分割为不同间隔显示的两个隔行扫描场。第一场在时间上称为上部场或奇数场,出现在帧的各奇数行,同时第二场在时间上称为下部场或偶数场,出现在帧的各偶数行。两个场形成帧。
参考24的16×16宏块属于显示为实行的第一上部场,参考15的16×16宏块属于显示为实行的下一上部场。
参考14的16×16宏块属于显示为虚行的第一下部场,参考16的16×16宏块属于显示为虚行的下一下部场。
由参考21和22的两个16×16宏块组成的宏块对属于隔行扫描的图像或帧,并因此由上部场和下部场的连续的行构成。
如果宏块对用帧模式编码,那么宏块对由连续的偶数和奇数行构成;参考21、运动矢量参考23指向前面的隔行扫描的图像,指定16×32宏块参考22。由使用偶数和奇数行实现运动估计的内插。
如果宏块对用场模式编码,那么它分别由参考15和16指向的奇数行构成的上部宏块,和由偶数行构成的下部宏块构成。上部宏块的运动矢量由矢量参考17指向上部场或前面的奇数场的宏块或由矢量参考18指向下部场或前面的偶数场的宏块。下部宏块的运动矢量由矢量参考20指向前面的偶数场的宏块,或由矢量参考19指向前面的奇数场的宏块。
用作运动估计的图像是比源图像分辨率低的图像。由预分析电路实现子取样和滤波。存储较低分辨率的图像,在此当前图像和前面的存储的参考图像之间实现象元-回归型运动估计和存储。
以匹配每个宏块的运动矢量的方式,处理运动矢量场、象元运动矢量。例如,考虑有关全分辨率图像的宏块的所有的象元运动矢量,这组运动矢量的中值运动矢量分派给此宏块。选择这些运动矢量的平均值也是可能的。也可实现子取样,因此取样的图像的一个象元对应于源图像的宏块,因此,一个运动矢量对应于一个宏块。
图2是对应于预选择编码模式的第一解决方案。
预分析电路6的运动估计器计算各图像的运动矢量场。这些矢量对应于运动:
—在当前帧和前面帧之间
—在当前偶数场和前面偶数场之间
—在当前偶数场和前面奇数场之间
—在当前奇数场和前面偶数场之间
—在当前奇数场和前面奇数场之间。
它对各宏块实现有关这些运动矢量场的相关计算。
因此,对当前图像的各场,它计算同样奇偶的参考场的中问场之差的和。基于帧的双宏块或对应于每一个32行16列的这些场的隔行扫描的图像,下面获得了偶数场的宏块:
DFD even , sameparity = Σ i , j = 0 i , j = 15 | pix c ( 2 i , j ) - pix pred ( 2 i , j ) |
下面获得了奇数场的宏块:
DFD add , sameparity = Σ i , j = 0 i , j = 15 | pix c ( 2 i + 1 , j ) - pix pred ( 2 i + 1 , j ) |
其中pixpred,基于运动矢量的预测值。对帧的双宏块的行的各i值,j列是从0递增到15。2i行对应于从双宏块提取的偶数场的宏块,2i+1行对应于奇数场的宏块。
同样,对当前图像的各帧,它计算相反奇偶的参考场的中间场之差的和。下面获得当前偶数场的宏块:
DFD even , oppose , parity = Σ i , j = 0 i , j = 15 | pix c ( 2 i , j ) - pix pred ( 2 i + 1 , j ) |
对当前奇数场的宏块:
DFD add , oppose , parity = Σ i , j = 0 i , j = 15 | pix c ( 2 i + 1 , j ) - pix pred ( 2 i , j ) |
最后,对帧和双宏块,它计算中间帧差的和:
DFD picture = Σ i , j = 0 i , j = 15 | pix c ( i , j ) - pix pred ( i , j ) | + Σ i , j = 0 i , j = 15 | pix c ( i + 16 , j ) - pix pred ( i + 16 , j ) |
= Σ i , j = 0 i = 31 , j = 15 | pix c ( i , j ) - pix pred ( i , j ) |
其中pixpred是基于运动矢量的预测值。
对图像的各场,计算电路选择产生最低DFD的参考场的奇偶。
DFD even min = DFD even , sameparity < > opp , parity sameparity DFD even , oppos , parity
DFD odd min = DFD odd , sameparity < > oppos , parity sameparity DFD odd , oppos , parity
例如,对第一式子,如果DFDeven,sameparity具有比DFDeven,oppos,parity更低的值,选择的值是DFDeven,sameparity。如果有更高的值,选择DFDeven,oppos,parity
各场的最小DFD值加在一起:
DFD field = DFD even min + DFD odd min
由比较相应的DFD实现在场编码和帧编码之间的选择,DFD相对于场编码由值λ置于不利地位。此λ>0参数使得在场模式中附加编码成本,
考虑传输两个运动矢量:
DFD field + &lambda; < > picture field DFD picture
因此,根据前面的结果,预分析电路选择最有利的编码模式。它传输此信息到编码模式决定电路,它限制它的计算只到选择的编码模式。
根据不管由预分析电路选择的模式是简单的场或帧水平的编码,那么由编码模式决定电路做的编码成本计算限制在场模式或帧模式。
此限制甚至可进一步延伸。因此,当选择场模式时,对编码模式预分析电路可利用偶数场或奇数场,和对组成宏块对的各宏块。
对应于图3的第二个更简单的解决方案。对预分析电路的运动估计器,它由计算有关场的4个矢量场组成,在图上的参考是]17,18,19,20,对当前图像的各场,相同奇偶和相反奇偶的参考场的中间场之差的和:
DFD even , sameparity = &Sigma; i , j = 0 i , j = 15 | pix c ( 2 i , j ) - pix pred ( 2 i , j ) |
DFD add , sameparity = &Sigma; i , j = 0 i , j = 15 | pix c ( 2 i + 1 , j ) - pix pred ( 2 i + 1 , j ) |
DFD even , oppose , parity = &Sigma; i , j = 0 i , j = 15 | pix c ( 2 i , j ) - pix pred ( 2 i + 1 , j ) |
DFD add , oppose , parity = &Sigma; i , j = 0 i , j = 15 | pix c ( 2 i + 1 , j ) - pix pred ( 2 i , j ) |
通常进行帧选择,组成宏块对的两个宏块对同样奇偶的场经受场的同样运动。因此,对当前图像的场之一,如果对应于相反奇偶的场的DFD低于对应于同样奇偶的场的DFD,宏块编码选择是场模式。确实,在此情况中,或许偶数场的宏块和构成宏块对的奇数场的宏块不经受同样的运动,因此帧模式是较少有利的。例如,这是在两个场之间在时空中大的运动的情况,时间是20ms。
另外,即如果相对于同样奇偶的场的运动矢量是邻近的,由预分析电路选择帧模式。
在此解决方案中,预分析电路6在帧水平实现运动估计是不必要的,由编码决定电路13选择试验的编码模式。
另一解决方案是基于预分析电路的运动估计器计算的场矢量来计算帧矢量场。对场计算的运动矢量用于计算相对于帧的双宏块的对应的DFD,选择的矢量是提供最低DFD差,那么最低DFD差是DFDframe。我们回到计算DFD的第一解决方案的情况,但在此情况中,运动估计器不必须估计帧之间的运动。
这些是实例。本发明适用于图像分割为寻求相关性的块或宏块的所有的类型。中间步骤可由分割这些块或宏块和对这些块或宏块的各部分的相关搜索构成。
运动估计器可以是除了本发明的象元-回归或分层型以外的不离开本发明范围的其它类型。
有关传输到编码选择电路13的编码模式选择的信息也能传输到分层的运动估计电路11。因此,此电路只对选择的模式、场或帧限制它的运动估计计算。因此,降低了运动估计器的计算量。
本申请涉及传输或视频信息存储的数字数据的压缩。

Claims (13)

1.一种编码源图像序列的方法,包括具有在当前图像和参考图像之间的象元-回归型运动估计的预分析步骤(6),和图像块的实际编码步骤,有在当前图像和参考图像之间的块匹配运动估计步骤(11),在编码模式决定步骤(13)之后,如内部模式、在同样奇偶或相反奇偶的场之间或在帧之间的中间模式,其特征在于基于在此步骤计算的运动矢量和对应的块,预分析步骤用参考图像的偶数和奇数场块对当前图像的偶数和奇数场块执行相关水平计算,并在编码模式决定步骤和在中间编码模式中,根据相关水平,实现同样奇偶或相反奇偶的场之间的中间编码或帧之间的中间编码。
2.根据权利要求1所述的方法,其特征在于当在相反奇偶的场之间的相关水平低于在同样奇偶的场之间的相关水平时,实现场之间的中间编码。
3.根据权利要求1所述的方法,其特征在于预分析步骤也用参考图像的帧块实现在当前图像的帧块之间的相关计算,根据相关水平确定在场之间或在帧之间的编码模式。
4.根据权利要求1所述的方法,其特征在于相关计算由下面的DFD值的计算构成:
DFD = &Sigma; i , j = 0 i , j = 15 | pi x c ( i , j ) - pi x pred ( i , j ) |
其中,Pixc(i,j)对应于当前块的行i和列j的一个象元的亮度值,
Pixpred(i,j)对应于由在参考图像或预测的块中的运动矢量指定的块的行i和列j的象元的亮度值。
5.根据权利要求1所述的方法,其特征在于图像块分割为上部块和下部块,上部块对应于上部场,下部块对应于下部场,或反之亦然,其中,在场之间的中间模式由为各个下部和上部块的参考图像的上部或下部场重建的选择组成,其中,选择依赖于整个图像块的相关性测量。
6.根据权利要求1所述的方法,其特征在于预分析步骤(6)包括基于由象元-回归型运动估计器计算的运动,由运动补偿滤波的噪声降低步骤。
7.根据权利要求1所述的方法,其特征在于块匹配运动估计器是分层类型。
8.根据权利要求1所述的方法,其特征在于在低分辨率的源图像上实现象元-回归型运动估计。
9.根据权利要求1所述的方法,其特征在于在预分析步骤计算的运动矢量和对应的块是通过有关块的象元计算的。
10.根据权利要求1所述的方法,其特征在于在预分析步骤计算的运动矢量和对应的块是通过计算有关块的象元的运动矢量分量的中值或平均值获得的。
11.根据权利要求1所述的方法,其特征在于对几个参考图像执行相关计算,其中,预分析步骤根据相关值执行一个参考图像或图像的选择。
12.一种实现权利要求1所述的方法的编码设备,包括有象元-回归型运动估计器的预分析电路(6),和图像块的实际编码电路,包括连接编码模式决定电路(13)的块匹配运动估计器(11),其特征在于预分析电路基于由象元-回归型运动估计器计算的运动矢量,用参考图像的偶和奇场块执行当前图像的偶和奇场块的相关性计算,根据相关水平,由编码模式决定电路(13)在中间编码模式中对同样奇偶或相反奇偶的场之间进行中间编码或在帧之间进行中间编码。
13.根据权利要求12所述的设备,其特征在于预分析电路传输编码模式信息到块匹配运动估计电路,以定义有关重建的图像的场和/或帧的运动估计。
CNA2005100821894A 2004-07-06 2005-07-01 编码源图像序列的方法和设备 Pending CN1719735A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0451445 2004-07-06
FR0451445A FR2872973A1 (fr) 2004-07-06 2004-07-06 Procede ou dispositif de codage d'une sequence d'images sources

Publications (1)

Publication Number Publication Date
CN1719735A true CN1719735A (zh) 2006-01-11

Family

ID=34946570

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005100821894A Pending CN1719735A (zh) 2004-07-06 2005-07-01 编码源图像序列的方法和设备

Country Status (7)

Country Link
US (1) US7801218B2 (zh)
EP (1) EP1622388A1 (zh)
JP (1) JP4851741B2 (zh)
KR (1) KR101192026B1 (zh)
CN (1) CN1719735A (zh)
FR (1) FR2872973A1 (zh)
MX (1) MXPA05007297A (zh)

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6983018B1 (en) * 1998-11-30 2006-01-03 Microsoft Corporation Efficient motion vector coding for video compression
US7003035B2 (en) * 2002-01-25 2006-02-21 Microsoft Corporation Video coding methods and apparatuses
US20040001546A1 (en) 2002-06-03 2004-01-01 Alexandros Tourapis Spatiotemporal prediction for bidirectionally predictive (B) pictures and motion vector prediction for multi-picture reference motion compensation
US7280700B2 (en) * 2002-07-05 2007-10-09 Microsoft Corporation Optimization techniques for data compression
US7154952B2 (en) * 2002-07-19 2006-12-26 Microsoft Corporation Timestamp-independent motion vector prediction for predictive (P) and bidirectionally predictive (B) pictures
US7499495B2 (en) * 2003-07-18 2009-03-03 Microsoft Corporation Extended range motion vectors
US7580584B2 (en) * 2003-07-18 2009-08-25 Microsoft Corporation Adaptive multiple quantization
US20050013498A1 (en) 2003-07-18 2005-01-20 Microsoft Corporation Coding of motion vector information
US7426308B2 (en) * 2003-07-18 2008-09-16 Microsoft Corporation Intraframe and interframe interlace coding and decoding
US7602851B2 (en) * 2003-07-18 2009-10-13 Microsoft Corporation Intelligent differential quantization of video coding
US7609763B2 (en) * 2003-07-18 2009-10-27 Microsoft Corporation Advanced bi-directional predictive coding of video frames
US8218624B2 (en) * 2003-07-18 2012-07-10 Microsoft Corporation Fractional quantization step sizes for high bit rates
US10554985B2 (en) 2003-07-18 2020-02-04 Microsoft Technology Licensing, Llc DC coefficient signaling at small quantization step sizes
US7738554B2 (en) 2003-07-18 2010-06-15 Microsoft Corporation DC coefficient signaling at small quantization step sizes
US8064520B2 (en) * 2003-09-07 2011-11-22 Microsoft Corporation Advanced bi-directional predictive coding of interlaced video
US7567617B2 (en) * 2003-09-07 2009-07-28 Microsoft Corporation Predicting motion vectors for fields of forward-predicted interlaced video frames
US7599438B2 (en) * 2003-09-07 2009-10-06 Microsoft Corporation Motion vector block pattern coding and decoding
US7724827B2 (en) * 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
US7317839B2 (en) * 2003-09-07 2008-01-08 Microsoft Corporation Chroma motion vector derivation for interlaced forward-predicted fields
US7253374B2 (en) * 2003-09-15 2007-08-07 General Motors Corporation Sheet-to-tube welded structure and method
US7801383B2 (en) 2004-05-15 2010-09-21 Microsoft Corporation Embedded scalar quantizers with arbitrary dead-zone ratios
US8422546B2 (en) 2005-05-25 2013-04-16 Microsoft Corporation Adaptive video encoding using a perceptual model
US7885341B2 (en) * 2005-10-21 2011-02-08 Cisco Technology, Inc. Spatial filtering for improving compression efficiency of motion compensated interframe coding
FR2897213A1 (fr) * 2006-02-08 2007-08-10 Thomson Licensing Sas Procede de codage par blocs d'images d'une sequence d'images video
US7974340B2 (en) * 2006-04-07 2011-07-05 Microsoft Corporation Adaptive B-picture quantization control
US20070237237A1 (en) * 2006-04-07 2007-10-11 Microsoft Corporation Gradient slope detection for video compression
US8130828B2 (en) * 2006-04-07 2012-03-06 Microsoft Corporation Adjusting quantization to preserve non-zero AC coefficients
US7995649B2 (en) 2006-04-07 2011-08-09 Microsoft Corporation Quantization adjustment based on texture level
US8503536B2 (en) 2006-04-07 2013-08-06 Microsoft Corporation Quantization adjustments for DC shift artifacts
US7889789B2 (en) * 2006-04-07 2011-02-15 Microsoft Corporation Making interlace frame level coding mode decisions
US8059721B2 (en) 2006-04-07 2011-11-15 Microsoft Corporation Estimating sample-domain distortion in the transform domain with rounding compensation
EP1848218A1 (en) * 2006-04-20 2007-10-24 THOMSON Licensing Method for deriving motion data for high resolution pictures from motion data of low resolution pictures and coding and decoding devices implementing said method
US8711925B2 (en) * 2006-05-05 2014-04-29 Microsoft Corporation Flexible quantization
US20080165278A1 (en) * 2007-01-04 2008-07-10 Sony Corporation Human visual system based motion detection/estimation for video deinterlacing
KR100842558B1 (ko) 2007-01-26 2008-07-01 삼성전자주식회사 동영상 부호화를 위한 블록 모드 결정 방법 및 그 장치
US8238424B2 (en) * 2007-02-09 2012-08-07 Microsoft Corporation Complexity-based adaptive preprocessing for multiple-pass video compression
US8553758B2 (en) * 2007-03-02 2013-10-08 Sony Corporation Motion parameter engine for true motion
US20080212687A1 (en) * 2007-03-02 2008-09-04 Sony Corporation And Sony Electronics Inc. High accurate subspace extension of phase correlation for global motion estimation
US8498335B2 (en) * 2007-03-26 2013-07-30 Microsoft Corporation Adaptive deadzone size adjustment in quantization
US8243797B2 (en) * 2007-03-30 2012-08-14 Microsoft Corporation Regions of interest for quality adjustments
US8442337B2 (en) * 2007-04-18 2013-05-14 Microsoft Corporation Encoding adjustments for animation content
US8331438B2 (en) 2007-06-05 2012-12-11 Microsoft Corporation Adaptive selection of picture-level quantization parameters for predicted video pictures
US8254455B2 (en) * 2007-06-30 2012-08-28 Microsoft Corporation Computing collocated macroblock information for direct mode macroblocks
CN101855910B (zh) * 2007-09-28 2014-10-29 杜比实验室特许公司 视频压缩和传送技术
US8189933B2 (en) * 2008-03-31 2012-05-29 Microsoft Corporation Classifying and controlling encoding quality for textured, dark smooth and smooth video content
US8897359B2 (en) 2008-06-03 2014-11-25 Microsoft Corporation Adaptive quantization for enhancement layer video coding
US8559518B2 (en) * 2008-06-30 2013-10-15 Samsung Electronics Co., Ltd. System and method for motion estimation of digital video using multiple recursion rules
US8094714B2 (en) * 2008-07-16 2012-01-10 Sony Corporation Speculative start point selection for motion estimation iterative search
US8144766B2 (en) * 2008-07-16 2012-03-27 Sony Corporation Simple next search position selection for motion estimation iterative search
US8189666B2 (en) 2009-02-02 2012-05-29 Microsoft Corporation Local picture identifier and computation of co-located information
JP5136470B2 (ja) 2009-03-06 2013-02-06 富士通株式会社 動画像符号化装置及び動画像符号化方法
JP5499035B2 (ja) * 2009-07-29 2014-05-21 パナソニック株式会社 画像符号化方法、画像符号化装置、プログラムおよび集積回路
US8724022B2 (en) * 2009-11-09 2014-05-13 Intel Corporation Frame rate conversion using motion estimation and compensation

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE469866B (sv) * 1991-04-12 1993-09-27 Dv Sweden Ab Metod för estimering av rörelseinnehåll i videosignaler
JP3187097B2 (ja) * 1991-10-17 2001-07-11 株式会社東芝 動画像符号化における符号量配分方法とこれを用いた動画像符号化方法及び装置
US6226327B1 (en) * 1992-06-29 2001-05-01 Sony Corporation Video coding method and apparatus which select between frame-based and field-based predictive modes
JP3201344B2 (ja) * 1992-07-03 2001-08-20 ケイディーディーアイ株式会社 インターレース動画像信号の動き補償予測方法及び符号化装置
US6005980A (en) * 1997-03-07 1999-12-21 General Instrument Corporation Motion estimation and compensation of video object planes for interlaced digital video
US6731684B1 (en) * 1998-09-29 2004-05-04 General Instrument Corporation Method and apparatus for detecting scene changes and adjusting picture coding type in a high definition television encoder
US6591398B1 (en) * 1999-02-12 2003-07-08 Sony Corporation Multiple processing system
US6483876B1 (en) * 1999-12-28 2002-11-19 Sony Corporation Methods and apparatus for reduction of prediction modes in motion estimation
US8107535B2 (en) * 2003-06-10 2012-01-31 Rensselaer Polytechnic Institute (Rpi) Method and apparatus for scalable motion vector coding
FR2872974A1 (fr) * 2004-07-06 2006-01-13 Thomson Licensing Sa Procede ou dispositif de codage adaptatif

Also Published As

Publication number Publication date
JP2006025428A (ja) 2006-01-26
KR101192026B1 (ko) 2012-10-16
US7801218B2 (en) 2010-09-21
US20060013307A1 (en) 2006-01-19
EP1622388A1 (en) 2006-02-01
KR20060049850A (ko) 2006-05-19
FR2872973A1 (fr) 2006-01-13
JP4851741B2 (ja) 2012-01-11
MXPA05007297A (es) 2006-01-26

Similar Documents

Publication Publication Date Title
CN1719735A (zh) 编码源图像序列的方法和设备
CN108012157B (zh) 用于视频编码分数像素插值的卷积神经网络的构建方法
CN1719904B (zh) 自适应编码的方法和设备
EP3448038B1 (en) Decoding method for intra predicting a block by first predicting the pixels at the boundary
JP5535618B2 (ja) 動き予測検索範囲及び拡張動きベクトルの範囲の動的選択
RU2544799C2 (ru) Устройство кодирования движущихся изображений, устройство декодирования движущихся изображений, способ кодирования движущихся изображений и способ декодирования движущихся изображений
US20110206118A1 (en) Data Compression for Video
CN1258925C (zh) 多视角视频编解码预测补偿方法及装置
CN1675848A (zh) 用于执行高质量快速预测运动搜索的方法和设备
CN1819658A (zh) 用于以帧间或帧内模式编码视频图像的方法和设备
CN1719901A (zh) 基于运动估计多分辨率方法及存储执行其程序的记录介质
CN1926884A (zh) 视频编码方法和装置
WO2011101453A2 (en) Data compression for video
CN1926876A (zh) 空间和时间可扩展编码的图像序列的编码和解码方法
CN103248895A (zh) 一种用于hevc帧内编码的快速模式估计方法
CN107810632A (zh) 具有降低代价的块分割和细化的帧内模式选择的帧内预测处理器
CN1198465C (zh) 代码转换器和代码转换方法
CN102291582A (zh) 一种基于运动补偿精化的分布式视频编码方法
CN1320830C (zh) 噪声估计方法和设备、以及利用其编码视频的方法和设备
US20070133689A1 (en) Low-cost motion estimation apparatus and method thereof
CN101742301B (zh) 一种块模式编码方法及装置
CN107258081A (zh) 对使用非正方形分割编码视频数据的优化
Cagnazzo et al. A model-based motion compensated video coder with JPEG2000 compatibility
CN1194544C (zh) 基于时空域相关性运动矢量预测的视频编码方法
CN1224270C (zh) 用于宏块组结构的两阶段预测编码的帧内编码帧编码方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20060111