CN101536530A - 基于运动估计进行视频编码和解码的方法和设备 - Google Patents

基于运动估计进行视频编码和解码的方法和设备 Download PDF

Info

Publication number
CN101536530A
CN101536530A CN200780041382.0A CN200780041382A CN101536530A CN 101536530 A CN101536530 A CN 101536530A CN 200780041382 A CN200780041382 A CN 200780041382A CN 101536530 A CN101536530 A CN 101536530A
Authority
CN
China
Prior art keywords
current block
motion vector
motion
motion vectors
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200780041382.0A
Other languages
English (en)
Other versions
CN101536530B (zh
Inventor
韩宇镇
李教爀
李泰美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020070005806A external-priority patent/KR101390193B1/ko
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN101536530A publication Critical patent/CN101536530A/zh
Application granted granted Critical
Publication of CN101536530B publication Critical patent/CN101536530B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

提供一种基于运动估计进行视频编码和解码的方法和设备。所述方法包括:通过使用当前块的像素来搜索参考图像以生成运动矢量,通过使用与当前块相邻的先前编码的像素来搜索参考图像以生成预测运动矢量,所述预测运动矢量是运动矢量的预测值,并基于运动矢量和预测运动矢量来对当前块进行编码。通过精确地预测当前块的运动矢量,可以减少用于对运动矢量进行编码所需要的比特数,从而提高视频数据的压缩率。

Description

基于运动估计进行视频编码和解码的方法和设备
技术领域
与本发明一致的方法和设备通常涉及视频编码和解码,更具体地说,涉及在对当前块的编码中精确地预测当前块的运动矢量。
背景技术
在如运动图像专家组(MPEG)-1、MPEG-2、MPEG-4、H.264/MPEG-4AVC(高级视频编码)标准的视频压缩标准中,图像被划分为宏块以用于视频编码。随后使用帧间预测或帧内预测对每一宏块进行编码。接下来,基于被编码的宏块的数据的尺寸和被编码的宏块与原始宏块之间的失真度来选择最优的编码模式,并以选择的编码模式对所述宏块进行编码。
使用帧间预测的视频编码通过去除图像之间的临时冗余来压缩视频,所述编码的典型的例子是运动估计编码。运动估计编码使用至少一个参考图像逐块估计当前图像的运动,并且补偿估计的运动,从而对视频进行编码。
在运动估计编码中,使用预定的测量函数在参考图像的预定的搜索范围中搜索与当前块最相似的块。一旦找到最相似的块,则只发送当前块和参考图像的最相似的块之间的残余,从而提高视频数据的压缩率。对于编码,可使用各种尺寸(诸如,16 x 16、8 x 16、8 x 8等等)的块。
为了对经过运动估计编码的当前块进行解码,需要关于指示当前块和参考图像的最相似的块之间的位移的运动矢量的信息。因此,在编码期间对关于运动矢量的信息进行编码,并插入比特流中。然而,如果关于运动矢量的信息在不被分开地处理的情况下被编码并插入,则开销增加并因此降低视频数据的压缩率。
为解决所述问题,运动估计编码使用在当前块周围的邻近块来预测当前块的运动矢量,并且仅编码并发送通过预测生成的预测运动矢量和原始运动矢量之间的差值,从而压缩关于运动矢量的信息。将参照图1A到图1D更详细地描述使用邻近块的当前块的运动矢量的估计。
图1A到图1D示出根据现有技术的运动矢量的预测。在图1A到图1D中,根据H.264标准来预测当前块110的运动矢量。
在图1A中,当前块110与它的邻近块121到邻近块123在大小上相同。在这种情况下,根据H.264,通过“预测运动矢量=中间值(mvA,mvB,mvC)”来确定预测运动矢量,该预测运动矢量是当前块110的运动矢量的预测值。相邻块很可能彼此相似,并因此当前块110的运动矢量被确定为在当前块110周围的邻近块121到邻近块123的运动矢量的中间值。
在图1B中,当前块110和它的邻近块131到邻近块133具有不同的大小。在这种情况下,将位于当前块110的左边的邻近块之中的最上边块131的运动矢量、位于当前块110的上面的邻近块之中的最左边块132的运动矢量和位于当前块110的右上方的邻近块之中的最左边块132的运动矢量的中间值确定为当前块110的预测运动矢量。
在图1C中,当前块在形状上不是正方形,而是8 x 16块。
当包括部分111和部分112的正方形块的左边部分111是当前块时,位于当前块111的左边的邻近块141的运动矢量被确定为当前块111的预测运动矢量。另一方面,当正方形块的右边部分112是当前块时,位于当前块112的右上方的邻近块142的运动矢量被确定为当前块112的预测运动矢量。
在图1D中,当前块在形状上不是正方形,而是16 x 8块。
当包括部分113和部分114的正方形块的下边部分113是当前块时,位于当前块113的左边的邻近块151的运动矢量被确定为当前块113的预测运动矢量。当正方形块的上边部分114是当前块时,位于当前块114的上边的邻近块152的运动矢量被确定为当前块114的预测运动矢量。
如图1A到图1D所示,根据H.164标准,基于在当前块周围的邻近块的运动矢量来确定当前块的预测运动矢量。换句话说,使用相邻块之间的相似度来预测当前块的运动矢量。
一旦当前块的预测运动矢量被确定,则将在当前块的预测运动矢量和当前块的真实运动矢量之间的差值进行编码并插入到比特流中。通过仅编码并随后发送差值而不是发送关于运动矢量的信息,可提高视频数据的压缩率。
然而,基于邻近块而得到的预测运动矢量可能不是当前块的运动矢量的适当的预测值。只有当预测运动矢量与真实运动矢量差别不大时,可提高视频数据的压缩率。然而,如果预测运动矢量是错误的预测值并因此差值大,则视频数据的压缩率被降低。
从而,为了降低在预测运动矢量和真实运动矢量之间的差值,需要一种能够精确地生成预测运动矢量的运动矢量预测方法。
发明内容
技术方案
本发明提供一种基于运动估计进行视频编码和解码的方法和设备以及其上记录有用于实现所述方法的程序的计算机可读记录介质,通过使用参考图像来精确地预测运动矢量,视频数据的压缩率被提高。
有益效果
根据本发明,在使用运动矢量的当前块的编码中通过精确地预测当前块的运动矢量,可降低在运动矢量和预测运动矢量之间的差值,从而减少用于编码关于运动矢量的信息需要的比特数。
此外,通过精确地预测当前块的运动矢量,提高以跳跃模式对当前块进行编码的可能性,从而提高视频数据的压缩率。
附图说明
通过参照附图详细地描述本发明的示例性实施例,本发明的上述和其他特征和优点将变得更加清楚,其中:
图1A到图1D示出根据现有技术的运动矢量的预测;
图2是根据本发明示例性实施例的视频编码器的框图;
图3是根据本发明示例性实施例的视频编码器的运动估计单元的详细框图;
图4是用于解释根据本发明示例性实施例的预测运动矢量的方法的示图;
图5是根据本发明示例性实施例的视频编码的方法的流程图;
图6是根据本发明示例性实施例的视频解码器的框图;
图7是根据本发明示例性实施例的视频编码器的运动补偿单元的详细框图;以及
图8是根据本发明示例性实施例的视频解码的方法的流程图。
具体实施方式
根据本发明的一方面,提供一种视频编码的方法。所述方法包括:通过使用当前块的像素来搜索参考图像以生成运动矢量,通过使用与当前块相邻的先前编码的像素来搜索参考图像以生成预测运动矢量,该预测运动矢量是运动矢量的预测值,并基于运动矢量和预测运动矢量来对当前块进行编码。
预测运动矢量的生成的步骤可包括:生成运动矢量和预测运动矢量之间的差值,对当前块进行编码的步骤可包括:对通过使用运动矢量来搜索参考图像而生成的当前块的预测值和当前块之间的残余进行编码,并对运动矢量和预测运动矢量之间的差值进行编码。
对当前块进行编码的步骤可包括基于预测运动矢量以跳跃模式对当前块进行编码。
与当前块相邻的先前编码的像素可包括位于当前块的左边、上边或左上方位置中的至少一个位置的邻近像素。
根据本发明的另一方面,提供一种用于视频编码的设备。所述设备包括:运动矢量生成单元,通过使用当前块的像素来搜索参考图像以生成运动矢量;预测运动矢量生成单元,通过使用与当前块相邻的先前编码的像素来搜索参考图像以生成预测运动矢量,该预测运动矢量是运动矢量的预测值;编码单元,基于运动矢量和预测运动矢量来对当前块进行编码。
所述设备可进一步包括差值生成单元,用于生成运动矢量和预测运动矢量之间的差值。
根据本发明的另一方面,提供一种视频解码的方法。所述方法包括:接收包括关于当前块(基于通过使用当前块的像素来搜索参考图像而生成的运动矢量和通过使用与当前块相邻的先前编码的像素来搜索参考图像而生成的预测运动矢量(运动矢量的预测值)已被编码)的数据的比特流,从接收的比特流提取关于当前块的数据和关于运动矢量的数据,使用提取的关于运动矢量的数据对提取的关于当前块的数据执行运动补偿。
关于运动矢量的数据可以是运动矢量和预测运动矢量之间的差值,运动补偿的执行可包括:通过使用与当前块相邻的先前解码的像素来搜索参考图像以生成预测运动矢量,通过将提取的差值添加到预测运动矢量来生成运动矢量,并使用生成的运动矢量来生成当前块的预测值。
根据本发明的另一方面,提供一种用于视频解码的设备。所述设备包括:解码单元,用于接收包括关于当前块(基于通过使用当前块的像素来搜索参考图像而生成的运动矢量和通过使用与当前块相邻的先前编码的像素来搜索参考图像而生成的预测运动矢量(运动矢量的预测值)已被编码)的数据的比特流并从接收的比特流提取关于当前块的数据和关于运动矢量的数据;运动补偿单元,使用提取的关于运动矢量的数据对提取的关于当前块的数据执行运动补偿。
根据本发明的另一方面,提供一种上面记录有用于实现视频编码的方法和视频解码的方法的程序的计算机可读记录介质。
发明模式
以下,将参照附图详细描述本发明示例性实施例。应注意到,相同的标号指示在一个或多个附图中示出的相同的部件。下面,为了简明和清楚,将省略对已知功能和配置的详细描述。
图2是根据本发明示例性实施例的包括运动估计编码设备的视频编码器的框图。为了便于说明,假设所述视频编码器符合H.264。然而,本领域的普通技术人员应该容易地理解,所述运动估计编码设备也可被应用于使用运动估计来执行视频编码的各种视频压缩方法。
参照图2,视频解码器200包括:运动估计单元210、运动补偿单元220、编码单元230、帧内预测单元240、帧存储器250、滤波器260和重建单元270。运动估计单元210和编码单元230与根据本发明的运动估计编码设备对应。
帧内预测单元240执行帧内预测,即,在当前图像中搜索要被进行帧内预测编码的当前块的预测值。具体地,帧内预测单元240接收当前块并以16 x 16帧内预测模式、4 x 4帧内预测模式或8 x 8帧内预测模式,和帧内色度模式对当前块执行帧内预测。
运动估计单元210和运动补偿单元220执行帧间预测,即,在参考图像中搜索包括在当前图像中的当前块的预测值。
图3是根据本发明示例性实施例的视频编码器200的运动估计单元210的详细框图。
关于参考图像的数据被存储在帧存储器250中,从而可被运动估计单元210和运动补偿单元220参考。根据本发明的运动估计单元210通过参考存储在帧存储器250中的参考图像来生成运动矢量和预测运动矢量。这里,参考图像可包括至少一个图像。例如,根据H.264标准,参考多个参考图像来生成运动矢量,并使用生成的运动矢量来选择最优的块以用于运动补偿。
参照图3,根据本发明的运动估计单元210包括:预测运动矢量生成单元310、运动矢量生成单元320和差值生成单元330。
预测运动矢量生成单元310生成将被用于运动估计编码的预测运动矢量,该预测运动矢量是运动矢量的预测值。通常,参照当前块周围的邻近块的运动矢量生成预测运动矢量。然而,根据本发明的运动估计单元210使用与当前块相邻的先前编码的像素来搜索参考图像,并通过参考存储在帧存储器250中的参考图像来生成预测运动矢量。
图4是用于解释根据本发明示例性实施例的预测运动矢量的方法的示图。
在图4中,为了对当前图像410中包括的当前块411执行运动估计编码,根据本发明的运动估计单元210生成预测运动矢量。
根据本发明的运动估计单元210使用与当前块411相邻的像素412来预测运动矢量。为了这个目的,运动估计单元210使用邻近像素412在参考图像420中搜索最相似像素422,并基于找到的最相似像素422来生成预测运动矢量430。通过使用与当前块411相邻的先前编码的像素412来生成预测运动矢量430,比通过使用在当前块411周围的邻近块的运动矢量来生成预测运动矢量430,可更精确地预测当前块411的运动矢量。
为了生成预测运动矢量,仅使用包括在当前图像410中的先前编码的区域中的像素。因此,当通过根据本发明的编码方法编码的视频被解码时,使用包括在当前图像410的先前解码的区域中的像素来预测运动矢量,并使用预测运动矢量来执行解码。
在图4中,使用位于当前块411的左边、上边和左上边的像素来生成预测运动矢量430。然而,本领域的普通技术人员应该容易地理解,通过使用包括在当前块411周围的先前编码的区域中的像素搜索参考图像来生成预测运动矢量的任何方法也可被应用于本发明。
再参考图3,运动矢量生成单元320使用当前块411的像素来搜索参考图像,从而生成真实运动矢量。如在现有技术中,通过搜索参考图像的预定区域来生成运动矢量。也可通过从由预测运动矢量生成单元310生成的预测运动矢量指示的点仅搜索在预定的像素范围内的区域来生成真实运动矢量。
差值生成单元330生成预测运动矢量生成单元310生成的预测运动矢量和运动矢量生成单元320生成的真实运动矢量之间的差值。如上所述,由于为了提高视频数据的压缩率只有差值被编码,而不编码关于真实运动矢量的信息,所以差值生成单元330生成预测运动矢量和真实运动矢量之间的差值。
由于预测运动矢量生成单元310能够比现有技术更精确地生成预测运动矢量,所以预测运动矢量和真实运动矢量之间的差值比现有技术中的小。生成的差值被发送到编码单元(图2中的230),在编码单元中所述差值被编码并与关于当前块的数据一起被插入比特流中。
再参考图2,运动补偿单元220基于运动估计单元210生成的运动矢量对当前块执行运动补偿。使用当前块的运动矢量来从参考帧生成当前块的预测值,所述当前块的运动矢量已由图3的运动矢量生成单元320参考参考图像来生成。
生成的预测值被从当前块中减去,从而生成残余Dn。编码单元230对生成的残余Dn编码。
编码单元230对残余Dn和运动估计单元210生成的差值进行编码。
换句话说,对从当前块减去通过帧间预测或帧内预测生成的预测值来生成的残余,和预测运动矢量和真实运动矢量之间的差值进行编码。
将生成的残余转换到频域,对其进行量化,并随后进行熵编码,从而生成比特流。此时,预测运动矢量和真实运动矢量之间的差值被插入句法开销。
根据本发明通过使用与当前块411相邻的先前编码的像素412来精确地生成预测运动矢量,预测运动矢量和真实运动矢量之间的差值比现有技术中的小。从而,可减少用于编码差值的比特数,从而提高视频数据的压缩率。
优选的是,根据本发明的编码单元230也可以跳跃模式对当前块411进行编码。根据率失真成本来确定是否以跳跃模式对当前块411进行编码。
因此,在跳跃模式中,如果预测运动矢量430指示的块421与当前块411很相似,则可仅利用预测运动矢量430执行编码。这里,可从当前图像的先前编码的区域来生成预测运动矢量430。因此,可通过编码指示以跳跃模式对当前块进行编码的1比特信息来完成当前块的编码。
根据本发明,可比现有技术更精确地生成预测运动矢量430。结果,预测运动矢量430指示的块421与当前块411很可能相似。因此,以跳跃模式对当前块411的编码的可能性增加,从而提高视频数据的压缩率。
而且,根据本发明,由于使用与当前块相邻的先前编码的区域的像素来生成预测运动矢量430,因此不同于在现有技术,任何尺寸(诸如16 x 16、8 x 8、4 x 4等等)的块能够以跳跃模式被编码。
重建单元270反量化并反变换已被编码和量化的图像,以生成参考图像。重建的图像在通过执行去块滤波的滤波器260后被存储在帧存储器250中。
图5是根据本发明示例性实施例的视频编码的方法的流程图。
在操作510中,根据本发明的视频编码器使用当前块的像素来搜索参考图像,从而生成当前块的真实运动向量。
在操作520中,视频编码器使用与当前块相邻的先前编码的像素来搜索参考图像,从而生成预测运动矢量,该预测运动矢量是当前块的运动矢量的预测值。
使用位于当前块的左边、上边或左上方位置中的至少一个位置的邻近像素来搜索参考图像,从而生成预测运动矢量。在生成预测运动矢量之后,将生成的预测运动矢量从在操作510中生成的当前块的真实运动矢量中减去,从而生成差值。
在操作530中,视频编码器基于真实运动矢量和预测运动矢量来编码当前块。
换句话说,将操作510中生成的真实运动矢量和操作520中生成的预测运动矢量之间的差值,和使用真实运动矢量通过运动补偿来生成的当前块的预测值和当前块之间的残余进行编码。
根据本发明,可基于操作520中生成的预测运动矢量以跳跃模式对当前块进行编码。这里,以跳跃模式被编码的块可具有任意的尺寸,诸如16 x 16、8 x 8、4 x 4等等。
图6是根据本发明示例性实施例的视频解码器的框图。
参照图6,视频解码器600包括:解码单元610、运动补偿单元620、帧内预测单元630,滤波器640和帧存储器650。解码单元610和运动补偿单元620与根据本发明的运动估计解码设备对应。
解码单元610接收包括关于当前块(基于通过使用当前块的像素来搜索参考图像而生成的真实运动矢量和通过使用与当前块相邻的先前编码的像素来搜索参考图像而生成预测运动矢量已被编码)的数据的比特流,并从接收的比特流提取关于当前块的数据和关于预测运动矢量和真实运动矢量之间的差值的数据。
包括关于当前块的残余的数据的比特流被接收,并随后被熵解码,从而生成量化系数。该量化系数被反量化和反变换,从而提取关于当前块的残余的数据D’n。
由于关于预测运动矢量和真实运动矢量之间的差值的数据被包括在比特流的句法开销中,所以从句法开销提取所述差值。提取的关于差值的数据被发送到将其用于运动补偿的运动补偿单元620。
运动补偿单元620通过参考当前图像和存储在帧存储器650中的参考图像使用关于真实运动矢量的数据对关于当前块的数据执行运动补偿。对由视频编码器200的运动估计单元210和运动补偿单元220执行的处理的逆处理被执行。
图7是根据本发明示例性实施例的视频解码器600的运动补偿单元620的详细框图。
参照图7,运动补偿单元620包括:预测运动矢量生成单元710、运动矢量生成单元720和运动补偿执行单元730。
预测运动矢量生成单元710使用存储在帧存储器650中的关于当前图像的数据里的与当前块相邻的先前解码的像素来生成当前块的预测运动矢量。通过使用与当前块相邻的先前解码的像素来搜索参考图像而找到相似的像素,从而生成当前块的预测运动矢量。
运动矢量生成单元720使用由预测运动矢量生成单元710生成的预测运动矢量,和解码单元610提取的运动矢量与生成的预测运动矢量之间的差值来生成当前块的真实运动矢量。关于包括在比特流中的真实运动矢量的数据仅包括真实运动矢量和预测运动矢量之间的差值。因此,通过将从比特流提取的差值添加到预测运动矢量生成单元710生成的预测运动矢量来生成真实运动矢量。
运动补偿执行单元730使用运动矢量生成单元720生成的运动矢量通过参考参考图像对当前块执行运动补偿。真实运动矢量指示的参考图像的块是当前块的预测值。然而,如果已经以跳跃模式对当前块进行编码,则预测运动矢量指示的块是当前块的重建块。
运动补偿执行单元730生成的预测值被添加到解码单元610生成的残余,从而重建当前块。重建的块由滤波器640进行去块滤波,并随后被存储在将其用于下一块的运动补偿的帧存储器650中。
图8是根据本发明示例性实施例的视频解码的方法的流程图。
在操作810中,视频解码器600接收包括关于当前块的数据的比特流,所述当前块基于运动矢量和使用图4中示出的方法来生成的预测运动矢量已被编码。换句话说,接收包括当前块的比特流,所述当前块基于预测运动矢量已被编码,通过使用与当前块相邻的先前编码的像素来搜索参考图像生成所述预测运动矢量。
在操作820中,视频解码器600从在操作810中接收的比特流提取关于当前块的数据和关于真实运动矢量的数据。比特流包括关于当前块的残余的数据,和关于真实运动矢量和预测运动矢量之间的差值的数据。在操作820中,提取关于残余的数据和关于差值的数据。
在操作830中,视频解码器600使用关于运动矢量的数据对在操作820中提取的关于当前块的数据执行运动补偿。
在操作820中提取的关于运动矢量的数据是运动矢量和预测运动矢量之间的差值。因此,使用当前图像的与当前块相邻的先前编码的像素通过搜索参考图像来生成当前块的预测运动矢量,并通过将差值添加到预测运动矢量来生成真实运动矢量。使用生成的运动矢量来搜索当前图像,从而生成当前块的预测值。通过将残余添加到生成的预测值上来重建当前块。
本发明还可被实施为计算机可读记录介质上的计算机可读信息。所述计算机可读记录介质可以是可存储数据的任意数据存储装置,所述数据之后可被计算机系统读取。计算机可读记录介质的例子包括:只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光学数据存储器件。计算机可读记录介质也可分布于联网的计算机系统,从而以分布的方式存储和执行所述计算机可读代码。
虽然参照本发明的示例性实施例具体显示和描述了本发明,但是本领域普通技术人员应该理解,在不脱离由权利要求限定的本发明的精神和范围的情况下,可以对其进行形式和细节的各种变化。

Claims (23)

1、一种视频编码的方法,所述方法包括:
通过使用当前块的像素来搜索参考图像以生成第一运动矢量;
通过使用与当前块相邻的先前编码的像素来搜索参考图像以生成预测运动矢量,该预测运动矢量是第一运动矢量的预测值;以及
基于第一运动矢量和预测运动矢量来对当前块进行编码。
2、如权利要求1所述的方法,其中,生成预测运动矢量的步骤包括生成第一运动矢量和预测运动矢量之间的差值。
3、如权利要求2所述的方法,其中,对当前块进行编码的步骤包括对通过使用第一运动矢量来搜索参考图像而生成的当前块的预测值和当前块之间的残余进行编码,并对第一运动矢量和预测运动矢量之间的差值进行编码。
4、如权利要求1所述的方法,其中,对当前块进行编码的步骤包括基于预测运动矢量以跳跃模式对当前块进行编码。
5、如权利要求4所述的方法,其中,当前块包括16 x 16块、8 x 8块和4 x 4块中的一个。
6、如权利要求1所述的方法,其中,与当前块相邻的先前编码的像素包括位于当前块的左边、上边或左上方位置中的至少一个位置的邻近像素。
7、一种用于视频编码的设备,所述设备包括:
运动矢量生成单元,通过使用当前块的像素来搜索参考图像以生成第一运动矢量;
预测运动矢量生成单元,通过使用与当前块相邻的先前编码的像素来搜索参考图像以生成预测运动矢量,该预测运动矢量是第一运动矢量的预测值;以及
编码单元,基于第一运动矢量和预测运动矢量来对当前块进行编码。
8、如权利要求7所述的设备,还包括差值生成单元,用于生成第一运动矢量和预测运动矢量之间的差值。
9、如权利要求8所述的设备,其中,编码单元对通过使用第一运动矢量来搜索参考图像而生成的当前块的预测值和当前块之间的残余进行编码,并对第一运动矢量和预测运动矢量之间的差值进行编码。
10、如权利要求7所述的设备,其中,编码单元基于预测运动矢量以跳跃模式对当前块进行编码。
11、如权利要求10所述的设备,其中,当前块包括16 x 16块、8 x 8块和4 x 4块中的一个。
12、如权利要求7所述的设备,其中,与当前块相邻的先前编码的像素包括位于当前块的左边、上边或左上方位置中的至少一个位置的邻近像素。
13、一种视频解码的方法,所述方法包括:
接收包括关于当前块的数据的比特流,所述当前块基于通过使用当前块的像素来搜索参考图像而生成的第一运动矢量和通过使用与当前块相邻的先前编码的像素来搜索参考图像而生成的预测运动矢量已被编码,所述预测运动矢量是第一运动矢量的预测值;
提取关于当前块的数据和关于预测运动矢量和第一运动矢量之间的差值的数据;以及
使用所述提取的关于差值运动矢量的数据对提取的关于当前块的数据执行运动补偿。
14、如权利要求13所述的方法,其中,关于差值运动矢量的数据是第一运动矢量和预测运动矢量之间的差值,并且执行运动补偿的步骤包括:
通过使用与当前块相邻的先前解码的像素来搜索参考图像以生成预测运动矢量;
通过将所述提取的差值添加到预测运动矢量来生成第一运动矢量;以及
使用生成的第一运动矢量来生成当前块的预测值。
15、如权利要求14所述的方法,其中,与当前块相邻的先前解码的像素包括位于当前块的左边、上边或左上方位置中的至少一个位置的邻近像素。
16、如权利要求13所述的方法,其中,执行运动补偿的步骤包括基于预测运动矢量以跳跃模式对当前块执行运动补偿。
17、如权利要求16所述的方法,其中,当前块包括16 x 16块、8 x 8块和4 x 4块中的一个。
18、一种用于视频解码的设备,所述设备包括:
解码单元,接收包括关于当前块的数据的比特流,所述当前块基于通过使用当前块的像素来搜索参考图像而生成的第一运动矢量和通过使用与当前块相邻的先前编码的像素来搜索参考图像而生成的预测运动矢量已被编码,所述预测运动矢量是第一运动矢量的预测值,并从接收的比特流提取关于当前块的数据和关于预测运动矢量与第一运动矢量之间的差值的数据;以及
运动补偿单元,使用所述提取的关于差值运动矢量的数据对提取的关于当前块的数据执行运动补偿。
19、如权利要求18所述的设备,其中,提取的关于差值运动矢量的数据是第一运动矢量和预测运动矢量之间的差值,并且运动补偿单元包括:
预测运动矢量生成单元,通过使用与当前块相邻的先前解码的像素来搜索参考图像以生成预测运动矢量;
运动矢量生成单元,通过将所述提取的差值添加到预测运动矢量来生成第一运动矢量;以及
运动补偿执行单元,使用生成的第一运动矢量来生成当前块的预测值。
20、如权利要求19所述的设备,其中,与当前块相邻的先前解码的像素包括位于当前块的左边、上边或左上方位置中的至少一个位置的邻近像素。
21、如权利要求18所述的设备,其中,运动补偿执行单元基于预测运动矢量以跳跃模式对当前块执行运动补偿。
22、如权利要求18所述的设备,其中,当前块包括16 x 16块、8 x 8块和4 x 4块中的一个。
23、一种计算机可读记录介质,所述计算机可读记录介质上面记录有用于实现权利要求1的方法的程序。
CN200780041382.0A 2006-11-07 2007-11-07 基于运动估计进行视频编码和解码的方法和设备 Expired - Fee Related CN101536530B (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US85711906P 2006-11-07 2006-11-07
US60/857,119 2006-11-07
KR10-2007-0005806 2007-01-18
KR1020070005806 2007-01-18
KR1020070005806A KR101390193B1 (ko) 2007-01-18 2007-01-18 움직임 추정을 이용한 영상의 부호화, 복호화 방법 및 장치
PCT/KR2007/005585 WO2008056934A1 (en) 2006-11-07 2007-11-07 Method of and apparatus for video encoding and decoding based on motion estimation

Publications (2)

Publication Number Publication Date
CN101536530A true CN101536530A (zh) 2009-09-16
CN101536530B CN101536530B (zh) 2011-06-08

Family

ID=39364709

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200780041382.0A Expired - Fee Related CN101536530B (zh) 2006-11-07 2007-11-07 基于运动估计进行视频编码和解码的方法和设备

Country Status (4)

Country Link
US (2) US8275039B2 (zh)
EP (1) EP2090113A4 (zh)
CN (1) CN101536530B (zh)
WO (1) WO2008056934A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102265615A (zh) * 2008-12-22 2011-11-30 法国电信公司 使用参考因果区的重新分区的图像预测、以及使用这样的预测的编码和解码
CN102823255A (zh) * 2010-04-06 2012-12-12 索尼公司 图像处理设备和图像处理方法
WO2013064099A1 (en) * 2011-11-04 2013-05-10 LI, Yingjin Method of generating reconstructed block
CN103314589A (zh) * 2011-01-13 2013-09-18 索尼公司 图像处理装置和方法
WO2015070753A1 (en) * 2013-11-12 2015-05-21 Mediatek Inc. Method and apparatus for using small-sized buffer in compression/decompression with block prediction
CN110225357A (zh) * 2011-06-30 2019-09-10 索尼公司 图像处理设备和图像处理方法

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101403343B1 (ko) * 2007-10-04 2014-06-09 삼성전자주식회사 부화소 움직임 추정을 이용한 인터 예측 부호화, 복호화방법 및 장치
JP2011515060A (ja) * 2008-03-09 2011-05-12 エルジー エレクトロニクス インコーポレイティド ビデオ信号のエンコーディングまたはデコーディング方法及び装置
JP5401071B2 (ja) * 2008-10-09 2014-01-29 株式会社Nttドコモ 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、動画像符号化プログラム、動画像復号プログラム、動画像処理システムおよび動画像処理方法
KR101279573B1 (ko) 2008-10-31 2013-06-27 에스케이텔레콤 주식회사 움직임 벡터 부호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
EP2380354A4 (en) * 2008-12-19 2015-12-23 Mediatek Singapore Pte Ltd METHOD AND APPARATUS FOR VIDEO PROCESSING WITH RESIDUAL PREDICTION
KR101522850B1 (ko) 2010-01-14 2015-05-26 삼성전자주식회사 움직임 벡터를 부호화, 복호화하는 방법 및 장치
EP2528332A4 (en) 2010-01-19 2015-08-05 Samsung Electronics Co Ltd METHOD AND DEVICE FOR CODING / DECODING PICTURES USING A MOTION VECTOR OF A PREVIOUS BLOCK AS A MOTION VECTOR OF THE PRESENT BLOCK
US8855205B2 (en) * 2010-05-26 2014-10-07 Newratek Inc. Method of predicting motion vectors in video codec in which multiple references are allowed, and motion vector encoding/decoding apparatus using the same
KR101479130B1 (ko) * 2010-10-18 2015-01-07 에스케이 텔레콤주식회사 차분 움직임벡터 부호화/복호화 장치 및 방법, 및 그것을 이용한 영상 부호화/복호화 장치 및 방법
US11284081B2 (en) 2010-11-25 2022-03-22 Lg Electronics Inc. Method for signaling image information, and method for decoding image information using same
KR101872178B1 (ko) 2010-11-25 2018-06-27 엘지전자 주식회사 영상 정보의 시그널링 방법 및 이를 이용한 영상 정보의 복호화 방법
KR20120095610A (ko) * 2011-02-21 2012-08-29 삼성전자주식회사 다시점 비디오의 부호화 방법 및 장치, 그 복호화 방법 및 장치
US20180184107A1 (en) * 2016-12-28 2018-06-28 Novatek Microelectronics Corp. Motion estimation method and motion estimation apparatus

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6442297A (en) 1987-08-07 1989-02-14 Matsushita Electric Ind Co Ltd Description board
JP2883592B2 (ja) 1991-05-31 1999-04-19 株式会社東芝 動画像復号化装置及び動画像復号化方法
JP3277116B2 (ja) 1996-03-18 2002-04-22 シャープ株式会社 動画像符号化装置および動画像復号化装置
US6195389B1 (en) * 1998-04-16 2001-02-27 Scientific-Atlanta, Inc. Motion estimation system and methods
JP2000308064A (ja) 1999-04-22 2000-11-02 Mitsubishi Electric Corp 動きベクトル検出装置
CN102316320B (zh) * 2001-12-17 2014-07-09 微软公司 处理视频图像的方法
JP4114859B2 (ja) * 2002-01-09 2008-07-09 松下電器産業株式会社 動きベクトル符号化方法および動きベクトル復号化方法
KR100774296B1 (ko) * 2002-07-16 2007-11-08 삼성전자주식회사 움직임 벡터 부호화 방법, 복호화 방법 및 그 장치
JP2007525072A (ja) * 2003-06-25 2007-08-30 トムソン ライセンシング 置換されたフレーム差を使用する重み付き予測推定の方法と装置
US20060181650A1 (en) * 2003-07-16 2006-08-17 Sandra Del Corso Encoding method and device
US20050013498A1 (en) * 2003-07-18 2005-01-20 Microsoft Corporation Coding of motion vector information

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102265615A (zh) * 2008-12-22 2011-11-30 法国电信公司 使用参考因果区的重新分区的图像预测、以及使用这样的预测的编码和解码
CN102823255A (zh) * 2010-04-06 2012-12-12 索尼公司 图像处理设备和图像处理方法
CN103314589A (zh) * 2011-01-13 2013-09-18 索尼公司 图像处理装置和方法
CN110572681B (zh) * 2011-06-30 2023-12-15 索尼公司 图像处理设备和图像处理方法
CN110225357B (zh) * 2011-06-30 2023-09-29 索尼公司 图像处理设备和图像处理方法
CN110572681A (zh) * 2011-06-30 2019-12-13 索尼公司 图像处理设备和图像处理方法
CN110225357A (zh) * 2011-06-30 2019-09-10 索尼公司 图像处理设备和图像处理方法
US9497463B2 (en) 2011-11-04 2016-11-15 Infobridge Pte. Ltd. Method of generating reconstructed block
US10623732B2 (en) 2011-11-04 2020-04-14 Infobridge Pte. Ltd. Method of generating reconstructed block
US9497462B2 (en) 2011-11-04 2016-11-15 Infobridge Pte. Ltd. Method of generating reconstructed block
WO2013064099A1 (en) * 2011-11-04 2013-05-10 LI, Yingjin Method of generating reconstructed block
US9503726B2 (en) 2011-11-04 2016-11-22 Infobridge Pte. Ltd. Method of generating reconstructed block
US10015489B2 (en) 2011-11-04 2018-07-03 Infobridge Pte. Ltd. Method of generating reconstructed block
US9014262B2 (en) 2011-11-04 2015-04-21 Infobridge Pte. Ltd. Method of generating reconstructed block
US10917640B2 (en) 2011-11-04 2021-02-09 Infobridge Pte. Ltd. Method of generating reconstructed block
US9344728B2 (en) 2011-11-04 2016-05-17 Infobridge Pte. Ltd. Method of generating reconstructed block
TWI699992B (zh) * 2011-11-04 2020-07-21 吳秀美 導出當前預測單元的圖框內預測模式的方法
TWI558170B (zh) * 2011-11-04 2016-11-11 吳秀美 產生重構塊的方法
WO2015070753A1 (en) * 2013-11-12 2015-05-21 Mediatek Inc. Method and apparatus for using small-sized buffer in compression/decompression with block prediction
CN105814894B (zh) * 2013-11-12 2019-02-26 联发科技股份有限公司 关于区块预测的压缩/解压缩方法与装置
US10142640B2 (en) 2013-11-12 2018-11-27 Mediatek Inc. Method and apparatus for using small-sized buffer in compression/decompression with block prediction
CN105814894A (zh) * 2013-11-12 2016-07-27 联发科技股份有限公司 使用小尺寸缓冲器的关于区块预测的压缩/解压缩方法与装置

Also Published As

Publication number Publication date
US8275039B2 (en) 2012-09-25
EP2090113A1 (en) 2009-08-19
WO2008056934A1 (en) 2008-05-15
US20130010872A1 (en) 2013-01-10
CN101536530B (zh) 2011-06-08
US20080107181A1 (en) 2008-05-08
EP2090113A4 (en) 2014-08-20

Similar Documents

Publication Publication Date Title
CN101536530B (zh) 基于运动估计进行视频编码和解码的方法和设备
JP5073824B2 (ja) 加重値予測を利用した映像符号化、復号化方法及び装置
US8625670B2 (en) Method and apparatus for encoding and decoding image
US8306120B2 (en) Method and apparatus for predicting motion vector using global motion vector, encoder, decoder, and decoding method
KR101452859B1 (ko) 움직임 벡터를 부호화 및 복호화하는 방법 및 장치
CN106210734B (zh) 将图像序列编码成位流以及对位流进行解码的方法和装置
US8315309B2 (en) Method and apparatus for encoding and decoding an image by using consecutive motion estimation
US20080107180A1 (en) Method and apparatus for video predictive encoding and method and apparatus for video predictive decoding
CN101573985B (zh) 用于视频预测编码的方法和装置以及用于视频预测解码的方法和装置
US20080117977A1 (en) Method and apparatus for encoding/decoding image using motion vector tracking
US20080170618A1 (en) Method and apparatus for encoding and decoding multi-view images
KR20080069069A (ko) 인트라/인터 예측 방법 및 장치
US20080107175A1 (en) Method and apparatus for encoding and decoding based on intra prediction
US8358697B2 (en) Method and apparatus for encoding and decoding an image using a reference picture
EP2252059B1 (en) Image encoding and decoding method and device
KR101363044B1 (ko) 비디오 영상의 부호화 모드 결정 방법 및 장치, 이를이용한 비디오 영상의 부호화/복호화 장치 및 방법 그리고상기 방법을 수행하는 프로그램이 기록된 기록 매체
KR101390193B1 (ko) 움직임 추정을 이용한 영상의 부호화, 복호화 방법 및 장치
KR101390194B1 (ko) 움직임 추정을 이용한 영상의 부호화, 복호화 방법 및 장치
US12003757B2 (en) Video signal processing method and device for processing motion vector difference information for inter prediction in video signal
US20220159291A1 (en) Video signal processing method and device for processing motion vector difference information for inter prediction in video signal
KR20080029788A (ko) 비디오 신호의 디코딩 방법 및 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110608

Termination date: 20191107

CF01 Termination of patent right due to non-payment of annual fee