CN102804768B - 利用在预测器之间的竞争的编码运动矢量 - Google Patents
利用在预测器之间的竞争的编码运动矢量 Download PDFInfo
- Publication number
- CN102804768B CN102804768B CN201080026934.2A CN201080026934A CN102804768B CN 102804768 B CN102804768 B CN 102804768B CN 201080026934 A CN201080026934 A CN 201080026934A CN 102804768 B CN102804768 B CN 102804768B
- Authority
- CN
- China
- Prior art keywords
- vector
- candidate
- candidate vector
- subset
- motion vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000013598 vector Substances 0.000 title claims abstract description 334
- 230000033001 locomotion Effects 0.000 title claims abstract description 169
- 238000000034 method Methods 0.000 claims abstract description 77
- 238000013459 approach Methods 0.000 claims description 19
- 239000012634 fragment Substances 0.000 claims description 8
- 238000001514 detection method Methods 0.000 description 21
- 238000012545 processing Methods 0.000 description 11
- 238000004590 computer program Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 7
- 238000007906 compression Methods 0.000 description 6
- 230000006835 compression Effects 0.000 description 6
- 230000006978 adaptation Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 208000010086 Hypertelorism Diseases 0.000 description 1
- 206010020771 Hypertelorism of orbit Diseases 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
- H04N19/139—Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明涉及一种编码方法,用于对包括运动信息的图像信号编码,具体做法是:针对待编码的当前图像的至少一个当前块,从包括至少三个候选矢量的集合中选择运动矢量。根据本发明,所述方法包括以下步骤:确定最佳选择子集(步骤10),其包括所述候选矢量的一部分;从所述最佳选择子集的矢量中,选择所述运动矢量(步骤21);以及将指明所述运动矢量(p)的信息片段插入所述信号中(步骤22),其中所述运动矢量(p)是从所述最佳选择子集的矢量中选择的。
Description
技术领域
本发明的技术领域在于图像的编码和解码,尤其在于由一系列的连续图像组成的视频流。具体而言,本发明涉及利用不同的编码模式,使用块变换对图像或图像序列进行压缩。
因此,本发明尤其适用于在当前的视频编码器(MPEG,H.264等)或未来的视频编码器(ITU-T/VCEG(H.265)或ISO/MPEG(HVC))中实施的视频编码。
背景技术
目前已存在多种图像编码方案(JPEG、JPEG-XR)或混合视频编码方案(MPEG,H.264),以及视频数据压缩技术。在这些技术中,大量的视频编码技术使用了视频序列的块式图像,例如应用MPEG组织(MPEG-1、MPEG-2、MPEG-4的第二部分等)或l’ITU-T(H.261到H.264/AVC)的视频压缩标准的各种技术。
因此,根据H.264技术以及如图1a所示,每幅图像1可细分为多个切片,这些切片又可以细分为宏块10,而宏块10随后被细分为块11。一个块由一组像素组成。
传统上,可通过以下方式来实现对块的编码:对块进行预测,并对即将添加到预测中的预测残余进行编码。所述预测通过已重建的信息(当前图像中的已编码/解码前块,视频编码环境中已初步编码的图像等)来实现。
在给定的编码方案中,可使用多种不同的编码模式来对各个块进行编码。编码模式通常包括两个阶段,第一阶段是预测待编码的样本,接下来的第二阶段是对预测残余进行编码。通常情况下,可用不同的编码模式,例如帧内编码、帧间编码、跳过编码来对各个块进行编码。
对于这些不同的编码模式,第一样本预测阶段通常对应于:
-时间预测,即相对于属于一幅或多幅图像的参考块;和/或
-空间预测,其随着与当前图像的待编码块相邻的块而变化。
如果是后种情况,所述预测无法进行,除非基于之前已进行编码的块。
称为“帧内”模式的编码模式仅使用图像本身所包含的信息换句话说,在帧内模式中编码的图像块的预测依赖于同一图像的之前已编码的相邻块。例如,当前块通过已编码/解码的相邻块的纹理值来编码。
成为“帧内”编码模式的编码模式通过从已编码图像的运动补偿来使用预测。具体而言,这种编码在于考虑一个(或多个)参考图像。针对当前图像的待编码块来设置参考图像与当前图像之间的移位或运动。用于预测待编码块的块是参考图像的像素块以运动矢量值进行移位后的结果。
称为“跳过”模式的编码模式是“帧间”编码的一种特殊模式,可实现没有任何信息传输到解码器的时间预测。换句话说,如果已确定某一块的基础编码信息,则可能“跳过”该块。在这种编码模式中,预测过程是使用当前块以相邻块的运动矢量进行的运动补偿来实现的,且没有预测残余得到编码或解码,其中所述运动补偿的前提是参考图像中必须存在所述相邻块。
对于给定的编码模式,随后建立预测参数,并对其进行编码。例如,根据H.264技术,可能对每个块的预测参数,例如编码模式(帧内、帧间、跳过)、分块类型、关于预测的信息(定向、参考图像等)、运动信息(运动矢量)、纹理信息(纹理值的外推方向)、已编码系统等进行编码。
根据H.264技术,图像I通过空间预测(帧内预测)来进行编码,图像P和B通过相对于通过运动补偿进行编码/解码的其他图像I、P或B的时间预测来进行编码。
在这些预测参数(例如块的运动矢量)的编码过程中,为了降低它们的编码成本,它们的值是从已编码的相邻块的相同预测参数值来预测的,且具有相同的编码模式(例如相邻块的运动矢量)。
例如,用于在“帧间”模式中编码的块上的运动矢量是通过诸如以下项等预测性编码来进行编码的:
-在第一阶段中,为所考虑的块的运动矢量设置预测矢量。通常情况下,称为中间矢量的此类矢量从已编码的相邻块的运动矢量的各个部分的中间值来定义;
-在第二阶段中,对预测错误,即当前块的运动矢量与之前已建立的预测矢量之间的差异进行编码。
该运动矢量预测技术的延伸由J·荣格(J.Jung)和G·拉罗什(G.Laroche)在2006年7月的视频编码专家组(ITU-TVCEG)AC06的文件《针对运动矢量选择和编码和基于竞争的方案》(Competition-BasedSchemeforMotionVectorSelectionandCoding)中提出。
该技术包括设置正在竞争的多个预测器或预测候选矢量(超出AVC所用的中间预测器),并指出在预测候选矢量组中,哪个矢量被有效使用。
但是,凭借这一通过竞争进行编码的技术,定义该预测器组是十分困难的。实际上,随着这些候选矢量(在更大的组中)的数量的不断增加,尽管能够获得更好的预测效果,但也会带来相应的不利影响,即指出所用的预测器的成本会增加。
因此,需要一种全新的技术,所述技术尤其能够实现更好的给定块的编码效果,同时还能够限制发送信号的成本,从而获得更高的压缩效率。
发明内容
本发明提出了一种克服了现有技术的所有缺点的全新技术,方法是提供一种编码方法,用于对包括运动信息的图像信号编码,具体做法是针对待编码的当前图像的至少一个当前块,从包括至少三个候选矢量的集合中选择运动矢量。
根据本发明,所述编码方法包括以下步骤:确定最佳选择子集,包括所述候选矢量的一部分;以及从所述最佳选择子集的矢量中选择所述运动矢量;以及将指明所述运动矢量的信息片段插入所述信号中,其中所述运动矢量是从所述最佳选择子集的矢量中选择的。
因此,根据在发射器中实施且可由至少一个接收器复制的方法,本发明基于具有新颖性和发明性的图像信号的编码方法,确切地说,基于通过竞争进行的运动矢量的预测性编码,因此通过扩大运动矢量的选择范围,本发明能够获得更好的预测效果,同时还能提高压缩的效率。
实际上,本发明基于一组局部适应的运动矢量,即通过图像块,实现从适应得更好的一组运动矢量中选择运动矢量,同时限制发送关于运动矢量使用的信号的成本,其中所述运动矢量组用最佳选择子集表示。
根据一项特定实施例,所述确定最佳选择子集的步骤包括以下子步骤:
-对至少两个第一候选矢量进行比较,提供关于所述第一候选矢量之间的接近度的信息片段,其中所述信息片段可以取:第一值,所述第一值表示根据预定标准,所述第一候选矢量相同或相近;以及第二值,所述第二值表示根据所述预定标准,所述第一候选矢量不相同或不相近;
-如果所述关于接近度的信息取所述第一值,则用所述第一候选矢量中的一个矢量以及不同于所述第一候选矢量的至少一个第二候选矢量建立所述最佳选择子集;
-如果所述关于接近度的信息取所述第二值,则用所述第一候选矢量建立所述最佳选择子集。
因此,本发明的编码方法可用于为待编码的图像块提出适应得更好的候选运动矢量组,例如当根据第一标准,第一候选运动矢量相近或相同时。
原则上,通过从该最佳选择子集中选择运动矢量,预测得到了优化,从而含有更好的候选矢量。
根据本发明的特定特征,所述第一候选矢量属于与所述当前块的至少一个相邻块关联的候选矢量子集,所述相邻块具有预定的空间和/或时间位置。
因此,例如,第一候选运动矢量可与以下项关联:
-位于当前块左侧的块(用A表示);
-位于当前块上方的块(用B表示);
-位于当前块上方和右侧的块(用C表示);
-位于当前块上方和左侧的块(用D表示);
-在当前图像之前的称为参考图像的图像中,且位于与当前块相同的位置的块(用T表示)。
第一候选运动矢量也可通过与块A、B、C和D关联的某些或所有运动矢量的各分量的中间值(中间运动矢量)来建立。
第一候选运动矢量也可与在当前图像之前的图像的一个块关联,其中所述块位于与所述当前块相同的位置,且移位了运动矢量的值(运动补偿),或者第一候选运动矢量可对应于源自“模板匹配”技术等的矢量。根据本发明的一项特定实施例,所述第一子集包括与位于当前图像中的所述当前块的正左侧的块(A)关联的候选矢量,以及与位于当前图像中的所述当前块的正上方的块(B)关联的候选矢量。
根据本发明的一项特定特征,所述第二候选矢量是与当前图像之前的图像中、位于与所述当前块相同的位置的块关联的矢量。
因此,例如,第二候选运动矢量可与块(T)关联。
该实施例称为“AB+T”,因为它使用的是第一“默认”集合,其包括与块(A)和(B)关联的候选运动矢量,以及在与块(A)和(B)关联的候选运动矢量相同或相近的情况下,与块(T)关联的第二候选运动矢量。
根据本发明的一项特定特征,所述预定标准的实施属于包括以下内容的组:所述第一候选矢量之间的等同性,以及将所述第一候选矢量之间的差异与第一预定阈值进行的比较。
因此,当第一运动矢量相同时,需要提出另一个候选运动矢量,以实现真正的运动矢量选择(在其中一个相同的第一运动矢量与该其他候选矢量之间选择),从而将它们置于竞争中。
同样地,当第一运动矢量相近时,原则上需要提出另一个候选运动矢量,以实现从相距足够远的运动矢量中选择(在其中一个相近的第一运动矢量与该其他候选矢量之间选择),从而优化候选运动矢量在竞争中的位置。
根据本发明的一项特定实施例,对于第二子集,所述比较步骤至少重复一次,所述第二子集包括:所述第一候选矢量中的一个矢量,以及不同于所述第一候选矢量的至少一个第二候选矢量。
因此,本发明实现了在最佳选择子集中提出不同且相距足够远的候选运动矢量。
例如,当第一候选运动矢量相近或相同时,且当第二组合子集的候选运动矢量也同样相同时,则本发明实现建立第三子集,最佳选择子集具有相距足够远的候选运动矢量。
根据本发明的一项实施例,所述确定最佳选择子集的步骤包括以下子步骤:如果一个候选矢量与至少一个其他候选矢量之间的差异大于第二预定阈值,则拒绝该候选矢量。
因此,通过对即将包括在最佳选择子集中的候选运动矢量进行比较,本发明也可使得最佳选择子集中所包括的各个候选运动矢量之间不会相距过远(否则就难以在选择步骤中将此类两个候选矢量置于竞争中)。
本发明的另一个方面涉及一种计算机程序,其包括在由处理器执行时用于实施本文中上述编码方法的指令。
实际上应注意,可以多种方式实施本发明的编码方法,尤其是以有线形式或软件形式。
本发明的另一方面涉及一种编码装置,用于对包括运动信息片段的图像信号编码,具体做法是:针对待编码的图像的至少一个当前块,从包括至少三个候选矢量的集合中选择运动矢量。
根据本发明,所述用于编码的装置包括:确定构件,用于确定最佳选择子集,其包括所述候选矢量的一部分;以及选择构件,用于从所述最佳选择子集的矢量中选择所述运动矢量;以及插入构件,用于将指明所述运动矢量的信息片段插入所述信号中,所述运动矢量是从所述最佳选择子集的矢量中选择的。
这种编码装置尤其适于实施本文中的上述编码方法。例如,MPEG或H.264型视频编码器,或根据未来压缩标准的视频编码器。
当然,此类编码装置可能包括涉及本发明的编码方法的不同特征。
本发明的另一方面还涉及根据本文中上述的编码方法而产生的图像信号。
根据本发明,对于待编码的当前图像的至少一个当前块,此类信号包括指明从最佳选择子集的矢量中选择的运动矢量的信息片段,所述最佳选择子集在编码和解码时确定,且包括候选矢量集合中的一部分。
当然,此类信号可能包括涉及本发明的编码方法的不同特征。
本发明的另一方面涉及一种解码方法,用于对运动信息片段解码,具体做法是:针对待解码的当前图像的至少一个当前块,从包括至少三个候选矢量的集合中选择编码时所选择的运动矢量。
根据本发明,此类解码方法包括以下步骤:确定最佳选择子集,其包括所述候选矢量的一部分,该步骤与编码过程中进行的确定步骤相似;以及读取通过编码提供、且指明所述最佳选择子集的一个矢量的选择信息片段;以及通过所读取的所述选择信息片段,从所述最佳选择子集的矢量中选择所述运动矢量。
根据本发明的一项实施例,所述确定最佳选择子集的步骤包括以下子步骤:
-对至少两个第一候选矢量进行比较,提供关于所述第一候选矢量之间的接近度的信息片段,其中所述信息片段可以取:第一值,所述第一值表示根据预定标准,所述第一候选矢量相同或相近;以及第二值,所述第二值表示根据所述预定标准,所述第一候选矢量不相同或不相近;
-如果所述关于接近度的信息取所述第一值,则用所述第一候选矢量中的一个矢量以及不同于所述第一候选矢量的至少一个第二候选矢量建立所述最佳选择子集;
-如果所述关于接近度的信息取所述第二值,则用所述第一候选矢量建立所述最佳选择子集。
通过这种方式,本发明的解码技术可实现在接收到并读取编码信息片段时,确切地说,在接收到并读取选择信息片段时,通过最佳选择子集来确定对应于待编码的当前块的运动矢量,其中确定所述最佳选择子集时所用的方法与在编码方法中实施的方法相同。
本发明的另一个方面涉及一种计算机程序,其包括在由处理器执行时用于实施本文中上述解码方法的指令。
实际上应注意,可以多种方式实施本发明的解码方法,尤其是以有线形式或软件形式。
当然,此类解码方法可能包括涉及本发明的编码方法的不同特征。
在另一项实施例中,本发明涉及用于一种解码装置,用于对运动信息片段解码,具体做法是:针对待解码的当前图像的至少一个当前块,从包括至少三个候选矢量的集合中选择编码时所选择的运动矢量。
根据本发明,此类解码装置包括:确定构件,用于确定最佳选择子集,其包括所述候选矢量的一部分,该步骤与编码过程中进行的确定步骤相似;以及读取构件,用于读取通过编码提供、且指明所述最佳选择子集的一个矢量的选择信息片段;以及选择构件,用于通过所读取的所述选择信息片段,从所述最佳选择子集的矢量中选择所述运动矢量。
这种解码装置尤其适于实施本文中的上述解码方法。例如,MPEG或H.264型视频解码器,或根据未来视频压缩标准的解码器。
当然,此类解码装置可能包括不同于本发明的解码方法的特征。
附图说明
通过下文对一项特定实施例的描述,并借助于说明性而非限定性的实例和附图,可更加清楚地了解本发明的其他特征及优点,在这些附图中:
-背景技术部分已参阅图1a并进行了评论,图1a所示为图像细分为一组块;
-图1b所示为给定块与相邻块之间关系的实例;
-图2a所示为根据本发明的一项实施例的编码方法的主要步骤;
-图2b所示为根据本发明的该实施例的编码方法的更加详细的步骤;
-图3a所示为根据本发明的一项实施例的解码方法的主要步骤;
-图3b所示为根据本发明的该实施例的解码方法的更加详细的步骤;
-图4和图5所示分别为根据本发明的一项特定实施例的编码装置和解码装置的结构。
具体实施方式
5.1一般原理
本发明的一般原理基于对一组局部适应预测器(也称为候选运动矢量)的使用,以通过运动矢量之间的竞争来选择运动矢量。根据本发明,可对待编码图像的每一块进行适应,所述适应随第一组预测器的候选运动矢量的值而变。
因此,根据本发明,通过运动矢量之间的竞争对运动信息片段的编码基于以下过程:在待编码图像内,即将用于建立竞争的预测器组从一块到其他块的自动适应。
传统上,对于通过竞争进行的运动矢量的预测性编码,从中选择运动矢量并对运动矢量进行编码的一组候选运动矢量被视为待编码图像的一个块。这些候选运动矢量可与所述当前块的至少一个相邻块关联,这些相邻块具有预定的空间和/或时间位置,如图1b所示。
例如,用于对当前图像Ic的块X进行编码的候选运动矢量可与空间位置为(A))、(B)、(C)或(D)的相邻块关联,和/或参考图像Iref的在时间上相邻的块(T)关联。
候选运动矢量也可与在当前图像之前的图像的一个块关联,其中所述块位于与所述当前块相同的位置,且移位了运动矢量的值(运动补偿),或者候选运动矢量可对应于源自“模板匹配”技术等的矢量。
5.2编码方法的各项实施例的具体说明
根据本发明的一项实施例,且如图2a所示,对于待编码图像的当前块,可从一组候选运动矢量E(p1、p2、p3等)中选择相关块的运动矢量。
实施从集合E中确定候选运动矢量的子集的第一步骤20,从而产生最佳检测子集。下文将参阅图2b更加详细地说明确定步骤20。
确定该最佳检测子集后,在步骤21中,所含有的候选运动矢量即根据现有技术(例如,已在背景技术部分中提到的,如J·荣格(J.Jung)和G·拉罗什(G.Laroche)的《针对运动矢量选择和编码和基于竞争的方案》(Competition-BasedSchemeforMotionVectorSelectionandCoding),视频编码专家组(ITU-TVCEG)AC06,2006年7月中所述)置于竞争中,以选择出即将针对相关块进行编码的运动矢量p。
最后,在步骤22中,指明该所选运动矢量p的信息片段被插入信号中,以便让该运动矢量也能够被解码装置选择,从而对相关块进行解码。
现在参阅图2b,更加详细地说明实现建立最佳检测子集的不同子步骤。
该原理基于步骤201中对集合E中至少两个第一运动矢量的比较,例如,所述第一运动矢量用p1和p2表示。应了解,也可对更多的运动矢量进行比较,具体取决于随后将置于竞争中的运动矢量的数量。运动矢量数量的选择可导致发送信号的成本增加或减小,因此所述数量选择被定义为对运动信息进行编码所需的性能值的函数,尤其是,且因此也是所需的压缩效果的函数。
通过该第一比较步骤,可确定为了置于竞争中,这两个第一运动矢量p1和p2是否能够形成最佳运动矢量组。
例如,p1可与当前图像的块(A)关联,且p2可与当前图像的块(B)关联(参阅图1b)。该选择由预先决定的且已传达给解码器,因此解码器可实施与编码方法相同的解码方法。实际上,如上文参阅图3a和图3b所示,解码方法的步骤与编码方法的步骤相同,且解码器了解编码器所用的一定数量的参数,从而对发送信号的成本进行优化。
根据该实施例的第一变体,该比较步骤201包括对两个第一运动矢量p1和p2的等同性进行测试。
实际上,在第一步骤中,如果p1和p2相同,则不需要将这两个矢量置于竞争中的步骤21,且需要将p1=p2指定为相关当前块的待编码的运动矢量。在这种情况下,为了对预测进行优化,需要在步骤203中,通过p1(=p2)和来源于集合E的至少一个其他运动矢量p3,建立不相同的另一组候选运动矢量。
例如,用最佳检测子集表示的该子集包括矢量p1(=p2)和p3,其中p3与参考图像的块(T)关联(参阅图1b)。同样地,正如选择第一运动矢量p1和p2的情况,p3是预先选择的,且已传达给解码器。
之后,在上文参阅图2a所述的步骤21中,将针对相关块从该最佳检测子集中选择待编码的运动矢量。
因此,所选的矢量p为矢量p1或矢量p3。
另一方面,在第二种情况下,如果p1和p2不相同,则建立步骤202将形成包括矢量p1和p2的最佳检测子集。
之后,在上文参阅图2a所示的步骤21中,将针对相关块从该最佳检测子集中选择待编码的运动矢量。因此,所选的矢量p为矢量p1或矢量p2。
在上述两种情况下,执行上述的步骤22,在所述步骤中,如上文参阅图2a所示,将指明该所选运动矢量p的信息片段插入信号中,从而让解码装置也能够选择该运动矢量,以对相关块进行解码。
根据该实施例的第二变体,比较步骤201包括对两个第一运动矢量p1和p2的相近性进行测试。
该相近性测试可包括将第一候选矢量之间的差异与预定阈值进行比较。该阈值由编码器和解码器协定,且可以是图像内的变量。
因此,如果p1和p2相近,则将这两个矢量置于竞争中的步骤21就不能被视为最佳的,因为矢量p1和p2相近。因此,在这种情况下,为了对预测进行优化,需要在步骤203中,通过p1(或p2,或同样是运动矢量p1和p2的幅值的均值)和来源于集合E的至少一个其他运动矢量p3,建立另一组不相近的候选运动矢量。
以下步骤21和22与上文针对第一变体所述的相应步骤相同。
根据第三变体(未图示),在建立最佳检测子集以过滤掉集合E中的某些候选运动矢量之前,需要进行额外的测试,因为这些候选运动矢量具有相对于第一运动矢量p1的额外距离。
因此,如果以两个第一矢量p1和p2相同或相近的情况为例,需要选择第三矢量p3,以根据上述步骤建立最佳检测子集。例如,如上所述,这一选择是预定的,且可包括选择p3作为与参考图像的块(T)关联的运动矢量。
但在某些特定情况下,可能出现这样一种情况,即p3与p1之间的距离过远或过近,以致在置于竞争中时这两个矢量不具代表性。
本发明的编码方法的该替代性实施例实现了通过以下方式对这些特殊情况进行改善:拒绝将矢量p3作为候选运动矢量或使其无效,以及选择性地取另一个矢量p4来与p1一起建立最佳检测子集,其中所述矢量p4也是预先定义的。
因此,例如,该额外测试可包括对p1和p3的值的比较,并且如果比较的结果大于或小于预定阈值,则可以拒绝p3。
该额外测试也可包括将矢量p3的幅值与预定阈值进行比较,且如果矢量p3的幅值大于或小于所述预定阈值,则拒绝p3。
例如,所述预定阈值可用以下项表示:
其中p对应于当将p1和p3置于竞争中时,选择候选运动矢量p3的概率,该概率可以根据学习而变化。
该变体再次实现了预测效率的提高。
根据第四变体,如果p1或p2不可用(例如如果当前块位于图像的左侧边缘,则块(A)不存在,因此没有与该块(A)关联的运动矢量,或者如果块(A)已在“帧内”模式或“帧间”模式中,但使用了不同的参考图像进行编码等),则如果p1不可用,则直接从p2和p3建立最佳检测子集,或者如果p2不可用,则直接从p1和p3建立最佳检测子集。
根据未图示的第二实施例,可能重复对候选运动矢量进行比较的步骤,以最大限度地优化对最佳检测子集的建立。
例如,如果两个第一运动矢量p1和p2被视为相同或相近,则根据上述的实施例,建立包括矢量p1和另一个矢量p3的子集。根据上述的该实施例,针对当前块的待编码运动矢量的选择在这两个矢量p1和p3中进行的。
相反,在该第二实施例中,再次对两个矢量p1和p3进行比较,以便在p1和p3相同或相近时,建立另一个最佳检测子集(根据相关标准)。在这种情况下,可使用运动矢量p4来与p1(=p2=p3)一起建立最佳检测子集。
因此,所述重复比较随集合E中存在的运动矢量的数量而变,其实现了在可能的范围内,对包括两个相同或相近的候选运动矢量的组执行选择步骤21,从而优化将候选运动矢量置于竞争中。
可对重复的数量进行预定义,并由此而传达给解码器,或者,只要两个已选矢量相同或相近,就可以决定所述重复的数量,可实施额外的重复比较,直到E中的候选运动矢量全部用完。
请注意,在需要对待编码图像的一个或多个块而立即指明运动矢量的某些特殊情况下,可以抑制发射指定即将被使用的预测运动矢量的信息片段。例如,这些特殊情况对应于以下情况:E中的候选运动矢量全部相同,或者只有一个运动矢量可用。
上述的这些不同实施例和它们的变体实现了获得可能使用三个候选运动矢量以置于竞争中的编码,同时将编码成本维持在与使用两个候选运动矢量时相同。这是可能的,因为如下所述,解码器将能够重复在编码(尤其是测试201)过程中进行的方法,且无需发射相应的信息片段。
请注意,本发明也可实施包括两个以上的候选运动矢量的最佳检测子集,其中针对当前块的待编码运动矢量是从两个以上的矢量中选择的,以及以信号发送指示所选矢量的信息的成本与候选运动矢量的数量有关。但再次指出,本发明实现了在使用的候选运动矢量的数量可能大于现有技术情况下进行编码,而不增加编码成本。
此外,根据本发明的编码方法实现了用于将候选运动矢量置于竞争中的最佳预测子集的局部适应性,即对图像的每个待编码块的适应性。
5.3解码方法的各项实施例的具体说明
本发明的原理基于在编码和解码中,执行用于选择针对相关块的运动矢量的相同方法。
现在将参阅图3a和3b,针对包括根据上述的本发明的编码方法的一项实施例进行编码的运动信息的信号,说明本发明的解码方法的主要步骤。
如图3a所示,且如上文参阅图2a和2b针对编码方法所述,对于待解码图像的当前块,可使用候选运动矢量(p1、p2、p3等)集合E,以选择针对相关块的待解码运动矢量。
实施从集合E中确定候选运动矢量的子集的第一步骤30,从而产生最佳检测子集。该确定步骤30对应于编码方法中的步骤20,下文将参阅图3b来详细说明该步骤。
读取步骤31获得指明在编码过程中选择的运动矢量p的信息片段,如上所述(编码方法的步骤22),该信息在编码过程中被插入信号中。
该信息片段实现了在步骤32中,解码装置从在解码方法的步骤30中确定的最佳检测子集的候选运动矢量中,选择用于对相关块进行解码的预测运动矢量。
图3b中更加详细地说明了建立最佳检测子集的不同子步骤,且所述不同子步骤已在上文中参阅图2b说明。
实际上,解码方法的步骤301、302和303分别对应于编码方法的步骤201、202和203。
具体而言,可根据本发明对解码方法进行若干种变化,具体取决于比较标准是基于等同性还是接近度,或取决于是否对比较步骤301进行重复等。
因此,由根据本发明的该实施例的解码方法确定的最佳选择子集对应于在编码过程中获得的最佳检测子集。
因此,凭借着该最佳检测子集(例如,包括矢量p1和p2,或p1和p3),以及在步骤31中读取的、指明所选择并因此而使用的运动矢量的信息片段,解码方法可在步骤32中,选择用于对相关块进行解码的正确运动矢量。
5.4编码装置和解码装置的结构
参阅图4和图5,本文最后将介绍根据上述各项实施例的编码装置和解码装置的简化结构。
如图4所示,此类编码装置包括存储器41,所述存储器41包括缓冲存储器;以及例如配备有微处理器μP且受计算机程序43驱动的处理单元42;所述编码装置实施根据本发明的编码方法。
例如,初始化时,计算机程序代码指令43加载到RAM中,并随后由处理单元42的处理器执行。处理单元42输入包括运动信息片段的图像信号,以及包括至少三个候选运动矢量的矢量组。处理单元42的微处理器根据计算机程序43的指令实施上文所述的编码方法的步骤,从而选择运动矢量。为实现该目的,除了缓冲存储器41外,所述编码装置包括:确定构件,用于确定最佳选择子集,其包括候选矢量的一部分;以及选择构件,用于从所述最佳选择子集的矢量中选择运动矢量;以及插入构件,用于将指明所述运动矢量的信息片段插入所述信号中,所述运动矢量是从所述最佳选择子集的矢量中选择的。这些构件由处理单元42的微处理器驱动。因此,处理单元42向至少一个解码装置发送信号,所述信号包括指明所选运动矢量的至少一个信息片段。
如图5所示,此类解码装置包括存储器51,所述存储器51包括缓冲存储器;例如配备有微处理器μP且受计算机程序53驱动的处理单元52;所述解码装置实施根据本发明的解码方法。
例如,初始化时,计算机程序53的代码指令加载到RAM中,并随后由处理单元52的处理器执行。处理单元52输入尤其包括运动信息的信号。处理单元52的微处理器根据计算机程序53的指令实施上文所述的解码方法的步骤,从而选择运动矢量。为实现该目的,除了缓冲存储器51外,所述解码装置包括:确定构件,用于确定最佳选择子集,其包括候选矢量的一部分,该步骤与编码过程中进行的确定步骤相似;以及读取构件,用于通过编码提供、且指明最佳选择子集的一个矢量的选择信息片段;以及选择构件,用于通过所读取的选择信息,从最佳选择子集的矢量中选择运动矢量。这些构件由处理单元52的微处理器驱动。
Claims (10)
1.一种编码方法,用于对包括运动信息的图像信号编码,具体做法是:针对待编码的当前图像的至少一个当前块,从包括至少三个候选矢量的集合中选择运动矢量,
其特征在于,所述方法包括以下步骤:确定最佳选择子集的步骤(20),其包括所述候选矢量的一部分;以及从所述最佳选择子集的矢量中选择所述运动矢量(p)的步骤(21);
以及将指明所述运动矢量的信息片段插入所述信号中的步骤(22),其中所述运动矢量是从所述最佳选择子集的矢量中选择的,
所述确定最佳选择子集的步骤包括以下子步骤:
-对至少两个第一候选矢量进行比较的子步骤(201),提供关于所述第一候选矢量之间的接近度的信息片段,所述信息片段可以取:第一值,所述第一值表示根据预定标准,所述第一候选矢量相同或相近;以及第二值,所述第二值表示根据所述预定标准,所述第一候选矢量不相同或不相近;
-如果所述关于接近度的信息取所述第一值,则用所述第一候选矢量中的一个矢量以及不同于所述第一候选矢量的至少一个第二候选矢量建立所述最佳选择子集的子步骤(203);
-如果所述关于接近度的信息取所述第二值,则用所述第一候选矢量建立所述最佳选择子集的子步骤(202)。
2.根据权利要求1所述的编码方法,其特征在于,所述第一候选矢量属于与所述当前块的至少一个相邻块关联的候选矢量子集,所述相邻块具有预定的空间和/或时间位置。
3.根据权利要求2所述的编码方法,其特征在于,与所述当前块的至少一个相邻块关联的所述候选矢量子集称为第一子集,所述相邻块具有预定的空间和/或时间位置,所述第一子集包括与位于所述当前图像中的所述当前块的正左侧的块(A)关联的候选矢量,以及与位于所述当前图像中的所述当前块的正上方的块(B)关联的候选矢量。
4.根据权利要求3所述的编码方法,所述第二候选矢量是与所述当前图像之前的图像中、位于与所述当前块相同的位置的块关联的矢量。
5.根据权利要求1所述的编码方法,其特征在于,所述预定标准的实施属于包括以下内容的组:所述第一候选矢量之间的等同性,以及将所述第一候选矢量之间的差异与第一预定阈值进行的比较。
6.根据权利要求1所述的编码方法,其特征在于,包括所述第一候选矢量中的一个矢量,以及不同于所述第一候选矢量的至少一个第二候选矢量的子集称为第二子集,对于所述第二子集,所述比较步骤至少重复一次。
7.根据权利要求1所述的编码方法,其特征在于,所述确定最佳选择子集的步骤包括以下子步骤:如果一个候选矢量与至少一个其他候选矢量之间的差异大于第二预定阈值,则拒绝该候选矢量。
8.一种编码装置,用于对包括运动信息的图像信号编码,具体做法是:针对待编码的图像的至少一个当前块,从包括至少三个候选矢量的集合中选择运动矢量,
其特征在于,所述装置包括:确定构件,用于确定最佳选择子集,其包括所述候选矢量的一部分;
选择构件,用于从所述最佳选择子集的矢量中,选择所述运动矢量;
以及插入构件,用于将指明所述运动矢量的信息片段插入所述信号中,其中所述运动矢量是从所述最佳选择子集的矢量中选择的,
所述确定构件包括以下构件:
比较构件,对至少两个第一候选矢量进行比较,提供关于所述第一候选矢量之间的接近度的信息片段,所述信息片段可以取:第一值,所述第一值表示根据预定标准,所述第一候选矢量相同或相近;以及第二值,所述第二值表示根据所述预定标准,所述第一候选矢量不相同或不相近;
如果所述关于接近度的信息取所述第一值,则有建立构件,用所述第一候选矢量中的一个矢量以及不同于所述第一候选矢量的至少一个第二候选矢量建立所述最佳选择子集;
如果所述关于接近度的信息取所述第二值,则有建立构件,用所述第一候选矢量建立所述最佳选择子集。
9.一种解码方法,用于对运动信息片段解码,具体做法是,针对待解码的当前图像的至少一个当前块,选择运动矢量,
其特征在于,所述方法包括以下步骤:确定最佳选择子集的步骤(30),其包括至少三个候选矢量的集合的一部分;
以及读取通过编码提供、且指明所述最佳选择子集的一个矢量的选择信息片段的步骤(31);以及通过所读取的所述选择信息片段,从所述最佳选择子集的矢量中选择所述运动矢量(p)的步骤(32),
所述确定最佳选择子集的步骤包括以下子步骤:
-对至少两个第一候选矢量进行比较的子步骤(301),提供关于所述第一候选矢量之间的接近度的信息片段,所述信息片段可以取:第一值,所述第一值表示根据预定标准,所述第一候选矢量相同或相近;以及第二值,所述第二值表示根据所述预定标准,所述第一候选矢量不相同或不相近;
-如果所述关于接近度的信息取所述第一值,则用所述第一候选矢量中的一个矢量以及不同于所述第一候选矢量的至少一个第二候选矢量建立所述最佳选择子集的子步骤(303);
-如果所述关于接近度的信息取所述第二值,则用所述第一候选矢量建立所述最佳选择子集的子步骤(302)。
10.一种解码装置,用于对运动信息片段解码,具体做法是:针对待解码的当前图像的至少一个当前块,选择运动矢量,
其特征在于,所述装置包括:确定构件,用于确定最佳选择子集,其包括至少三个候选矢量的集合的一部分;
以及读取构件,用于读取通过编码提供、且指明所述最佳选择子集的一个矢量的选择信息片段;以及选择构件,用于通过所读取的所述选择信息片段,从所述最佳选择子集的矢量中选择所述运动矢量,
所述确定构件包括以下构件:
比较构件,对至少两个第一候选矢量进行比较,提供关于所述第一候选矢量之间的接近度的信息片段,所述信息片段可以取:第一值,所述第一值表示根据预定标准,所述第一候选矢量相同或相近;以及第二值,所述第二值表示根据所述预定标准,所述第一候选矢量不相同或不相近;
如果所述关于接近度的信息取所述第一值,则有建立构件,用所述第一候选矢量中的一个矢量以及不同于所述第一候选矢量的至少一个第二候选矢量建立所述最佳选择子集;
如果所述关于接近度的信息取所述第二值,则有建立构件,用所述第一候选矢量建立所述最佳选择子集。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0954194 | 2009-06-19 | ||
FR0954194 | 2009-06-19 | ||
PCT/FR2010/051209 WO2010146314A1 (fr) | 2009-06-19 | 2010-06-17 | Codage de vecteurs mouvement par competition de predicteurs |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102804768A CN102804768A (zh) | 2012-11-28 |
CN102804768B true CN102804768B (zh) | 2015-12-16 |
Family
ID=41698478
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201080026934.2A Active CN102804768B (zh) | 2009-06-19 | 2010-06-17 | 利用在预测器之间的竞争的编码运动矢量 |
Country Status (8)
Country | Link |
---|---|
US (1) | US8891628B2 (zh) |
EP (1) | EP2443835B1 (zh) |
CN (1) | CN102804768B (zh) |
BR (1) | BRPI1011885A2 (zh) |
ES (1) | ES2629027T3 (zh) |
RU (1) | RU2553062C2 (zh) |
WO (1) | WO2010146314A1 (zh) |
ZA (1) | ZA201109188B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011095260A1 (en) * | 2010-02-05 | 2011-08-11 | Telefonaktiebolaget L M Ericsson (Publ) | Managing predicted motion vector candidates |
US20120082228A1 (en) | 2010-10-01 | 2012-04-05 | Yeping Su | Nested entropy encoding |
US10104391B2 (en) * | 2010-10-01 | 2018-10-16 | Dolby International Ab | System for nested entropy encoding |
GB2487200A (en) * | 2011-01-12 | 2012-07-18 | Canon Kk | Video encoding and decoding with improved error resilience |
US9131239B2 (en) | 2011-06-20 | 2015-09-08 | Qualcomm Incorporated | Unified merge mode and adaptive motion vector prediction mode candidates selection |
FR2982983A1 (fr) * | 2011-11-22 | 2013-05-24 | Thomson Licensing | Procede de codage et de reconstruction d'un bloc de pixels et dispositifs correspondants |
CN107809642B (zh) | 2015-02-16 | 2020-06-16 | 华为技术有限公司 | 用于视频图像编码和解码的方法、编码设备和解码设备 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1980394A (zh) * | 2005-12-09 | 2007-06-13 | 松下电器产业株式会社 | 运动矢量估计装置和运动矢量估计方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100865034B1 (ko) * | 2002-07-18 | 2008-10-23 | 엘지전자 주식회사 | 모션 벡터 예측 방법 |
JP4591657B2 (ja) * | 2003-12-22 | 2010-12-01 | キヤノン株式会社 | 動画像符号化装置及びその制御方法、プログラム |
JP2008109632A (ja) * | 2006-09-28 | 2008-05-08 | Toshiba Corp | 動きベクトル検出装置及びその方法 |
US8213509B2 (en) * | 2006-10-06 | 2012-07-03 | Calos Fund Limited Liability Company | Video coding on parallel processing systems |
KR101383540B1 (ko) | 2007-01-03 | 2014-04-09 | 삼성전자주식회사 | 복수의 움직임 벡터 프리딕터들을 사용하여 움직임 벡터를추정하는 방법, 장치, 인코더, 디코더 및 복호화 방법 |
-
2010
- 2010-06-17 BR BRPI1011885A patent/BRPI1011885A2/pt not_active Application Discontinuation
- 2010-06-17 US US13/379,197 patent/US8891628B2/en active Active
- 2010-06-17 EP EP10734256.0A patent/EP2443835B1/fr active Active
- 2010-06-17 CN CN201080026934.2A patent/CN102804768B/zh active Active
- 2010-06-17 ES ES10734256.0T patent/ES2629027T3/es active Active
- 2010-06-17 WO PCT/FR2010/051209 patent/WO2010146314A1/fr active Application Filing
- 2010-06-17 RU RU2012101686/08A patent/RU2553062C2/ru active
-
2011
- 2011-12-13 ZA ZA2011/09188A patent/ZA201109188B/en unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1980394A (zh) * | 2005-12-09 | 2007-06-13 | 松下电器产业株式会社 | 运动矢量估计装置和运动矢量估计方法 |
Non-Patent Citations (1)
Title |
---|
Competition-Based Scheme for Motion Vector Selection and Coding;JOEL JUNG ET AL;《JOINT VIDEO TEAM (JVT) OF ISO/IEC MPEG & ITU-T VCEG(ISO/IEC JTV1/SC29/WG11 AND ITU-T SG16 Q6)》;20060718;正文第3.1.2节,第3.3节,第4节 * |
Also Published As
Publication number | Publication date |
---|---|
RU2012101686A (ru) | 2013-07-27 |
US8891628B2 (en) | 2014-11-18 |
CN102804768A (zh) | 2012-11-28 |
RU2553062C2 (ru) | 2015-06-10 |
EP2443835B1 (fr) | 2017-04-05 |
WO2010146314A1 (fr) | 2010-12-23 |
ZA201109188B (en) | 2012-08-29 |
EP2443835A1 (fr) | 2012-04-25 |
ES2629027T3 (es) | 2017-08-07 |
BRPI1011885A2 (pt) | 2016-04-12 |
US20120134419A1 (en) | 2012-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102804768B (zh) | 利用在预测器之间的竞争的编码运动矢量 | |
US9781443B2 (en) | Motion vector encoding/decoding method and device and image encoding/decoding method and device using same | |
KR101366241B1 (ko) | 영상 부호화, 복호화 방법 및 장치 | |
RU2732512C1 (ru) | Устройство прогнозирующего декодирования изображений, способ прогнозирующего декодирования изображений | |
KR101228020B1 (ko) | 사이드 매칭을 이용한 영상의 부호화 방법 및 장치, 그복호화 방법 및 장치 | |
KR100927510B1 (ko) | 가변 길이 부호화 방법, 가변 길이 부호화 장치 및 기억 매체 | |
US9363530B2 (en) | Method and apparatus for encoding/decoding a motion vector by selecting a set of predicted candidate motion vectors, and method and apparatus for image encoding/decoding using the same | |
CN104539957B (zh) | 用于高分辨率运动图像的编码/解码方法和设备 | |
DK1445960T3 (en) | PROCEDURE FOR ENCODING MOVING IMAGES AND PROCEDURE FOR DECODING MOVING IMAGES | |
CN101283600B (zh) | 参考图像选择方法以及装置 | |
CN1689325B (zh) | 视频编码器中参考图像的隐含加权 | |
JP5396600B2 (ja) | 改善された予測を実施する画像符号化方法および装置と、対応する復号化方法および装置と、信号およびコンピュータ・プログラム | |
US9124901B2 (en) | Method and apparatus for encoding/decoding images considering low frequency components | |
EP2168382B1 (en) | Method for processing images and the corresponding electronic device | |
CN102726043A (zh) | 混合视频编码 | |
CN101573985A (zh) | 用于视频预测编码的方法和装置以及用于视频预测解码的方法和装置 | |
CN102484701A (zh) | 用于空间变化残差编码的方法和设备 | |
CN102484711B (zh) | 指向覆盖多个参考图像分区的参考区域的当前图像分区的移动向量的预测、以及使用一个这种预测的编码和解码 | |
EP2199970B1 (en) | Watermarking compressed video data by changing blocks' prediction mode | |
US12101510B2 (en) | Block-based predictive coding and decoding of a picture | |
CN110024397A (zh) | 用于编码视频的方法和装置 | |
EP2034742A2 (en) | Video coding method and device | |
CN1748427A (zh) | 对包含用于通告存在已编码残余运动向量数据的标志的运动向量的预测编码 | |
US12120321B2 (en) | Refined block-based predictive coding and decoding of a picture | |
US20210084313A1 (en) | Refined block-based predictive coding and decoding of a picture |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |