CN100556149C - 向量预测方法 - Google Patents

向量预测方法 Download PDF

Info

Publication number
CN100556149C
CN100556149C CNB2003801043593A CN200380104359A CN100556149C CN 100556149 C CN100556149 C CN 100556149C CN B2003801043593 A CNB2003801043593 A CN B2003801043593A CN 200380104359 A CN200380104359 A CN 200380104359A CN 100556149 C CN100556149 C CN 100556149C
Authority
CN
China
Prior art keywords
motion vector
vector
block
piece
object block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2003801043593A
Other languages
English (en)
Other versions
CN1729695A (zh
Inventor
G·比约恩特加德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cisco Systems International SARL
Original Assignee
Tandberg Telecom AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tandberg Telecom AS filed Critical Tandberg Telecom AS
Publication of CN1729695A publication Critical patent/CN1729695A/zh
Application granted granted Critical
Publication of CN100556149C publication Critical patent/CN100556149C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/57Motion estimation characterised by a search window with variable size or shape
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/56Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Pretreatment Of Seeds And Plants (AREA)
  • Transition And Organic Metals Composition Catalysts For Addition Polymerization (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种改进对有待编码视频图像中像素块运动向量进行预测的方法。根据本发明的优选实施方案,选择靠近块最左上角的两个相邻块的实际运动向量作为进行该预测的候选向量。选择也与本块相邻的一个附加块来判定哪个运动向量将用作为预测向量。与判定块运动向量的向量差决定了最终选择。

Description

向量预测方法
技术领域
本发明涉及到视频压缩系统,特别是数字视频压缩系统。
背景技术
在若干应用中例如象电视电话会议,网上会议,TV广播和视频电话技术中应用运动图像的实时传输。
不过,由于数字视频图像通常是通过用8个位(1个字节)表示图像中每个像素来描述的,故表示运动图像需要大量信息。这种未压缩的视频数据形成了巨大的比特量,而且由于带宽限制其不能够通过常规通信网络和传输线路进行实时传送。
因此,为了能够进行实时视频传输需要很大程度的数据压缩。不过,数据压缩会牺牲图像质量。因此,已经做出了巨大努力来开发压缩技术使得能够通过有限带宽的数据连接进行高质量影象的实时传送。
在视频压缩系统中,主要目的是以尽可能小的容量来表示视频信息。使用位将容量定义为一个常量或位/时间单位。在这两种情况中,主要目的都是减少位数。
在MPEG*和H.26*标准中说明了最常用的视频编码方法。视频数据在传输之前经历四个主要的处理过程,即预测、转换、量化和熵编码。预测处理过程大大地减少了待传送视频序列中各图像所需要的位数。它利用了序列一部分与该序列其他部分的相似性。由于预测部分对编码器和解码器来说都是已知的,所以只有其差别必须传送。这种差别的表示通常需要的容量小得多。预测主要是依据先前构建图像的图像内容,在先前构建图像中,内容的位置由运动向量限定。预测处理过程通常在如图1块M中所示出的正方形块(例如16×16像素)上进行。但是,块的大小可以改变。图1中用较小的相邻块a,b,c和d示出了这种情况。
在典型的视频序列中,当前块M的内容将会与先前已解码图像中的相应块的内容相似。如果自先前解码图像后没有出现变化,那么M的内容就将会与先前解码图像中具同样位置的块相等。在其他情况下,图像中的对象可能已经移动,所以M的内容就与先前解码图像中位置不同的块相等。这些移动用运动向量(V)来表示。举例来说,运动向量(3;4)表示M的内容自先前解码图像向左移动了3个像素,向上移动了4个像素。为提高准确度,向量还可能包括小数,从而要求在像素间内插。
为减小传输前运动向量的数据长度,假设一块中的移动与相邻块的移动非常相似。因而,V预测(Vpred)是依据相邻块的实际运动向量来建立。由于相邻块的运动向量在接收侧是已知的,故只有实际运动向量与相应预测运动向量之差(Vdiff)必须提供,即Vdiff=V-Vpred。在接收侧,就能够通过V=Vpred-Vdiff来重新建立运动向量。
在ITU标准H.261和H.262以及ISO标准MPEG1和MPEG2中,设定Vpred等于与图1中块a相对应之相邻块的运动向量。即假设块的移动与左手侧相邻块的移动相同。在H.263和MPEG4中,使用三个相邻块来推导出预测运动向量。通过选择三个向量之分量的各自中值来分别推出该向量的各分量(水平分量和垂直分量)。
从公开US 2002/0039386A1了解到利用各种不同大小的匹配块来支持在运动向量预测模式下块匹配移动估算的块匹配处理器及方法。
从US 2001/0031004A1进一步了解到更新运动向量存储器的方未能及设备,其用于视频编码/解码时段内的运动向量预测。本文件中的主要问题是如何以有效的方式来存储运动向量以后用作当前块。运动向量预测是依据中值计算结果;因此该文件并未说明运动向量预测的足够准确的测量方法。
还知道一种运动向量预测依据中值计算结果的解决方法(WO01/99437A2)。不过,该文件中所说明的主要思想是将在靠近预测位置的更小的窗口内进行寻找。
根据如上所述的现有技术所推出的预测向量已经表明其并非足够准确。此外,由于通过逐一按分量来选择预测向量,该向量就可能是由会形成“虚构”运动向量的不同向量的分量构成。
发明内容
本发明的目的是提供方法来避免上述问题。
特别是,本发明提供了视频编码中的一种方法,这种方法用来确定与表示视频图像一定区域的像素的目标块相关联的运动向量预测,其包括的步骤为:计算相邻于所述目标块的候选块集所对应的候选运动向量集中的每个向量与也相邻于所述目标块的判定块集所对应的判定运动向量集中的每个向量之间的向量差异值;在所述候选运动向量集中选择一个运动向量作为所述目标块的所述运动向量预测,被选中的所述一个运动向量与所计算的各向量差异值中最小的一个相对应。其中,两个向量之间的差异值被计算成该两个向量的相应各分量差的平方和的平方根,或该两个向量的相应各分量差的绝对值之和。
附图说明
为了使本发明更易于理解,其后的讨论将参照附图进行。
图1用图说明了具有更小相邻块的一个16×16的块。
具体实施方式
下文中,通过说明一优选实施方案并参照附图将对本发明予以讨论。不过,本领域中的普通技术人员在权利要求书所限定的本发明范围之内将会认识到其他的应用和改进。
现将通过一个实例对本发明予以说明,同时考虑到图1的符号。假定块a、b、和c分别具有运动向量(x1,y1)、(x2,y2)、(x3,y3)和将要确定块M的运动向量预测。因而将说明块M运动向量的判定方法。在这一示例性的实施方案中,选择这三个向量中的两个作为预测的候选向量。候选向量的选择可以是固定的或依据经验、预先确定的判据和/或图像中块的位置加以确定。一般来说,候选向量的数目也可以改变,但在本实例中,只有两个,而且只要M不是图中最上或最左面的块就固定选择a和b。如果是后者这种情况,那么将使用其他选择或预测。注意,a和b可能存在于一先前的图像中,但在本情况下,它们是本图像的一部分。
此外假定a和b的运动向量是已知的,而且在整体上选其中之一作为预测向量,虽然各分量的单独选择也是本发明的一部分。此外,根据本示例性的实施方案,选择块c为a与b之间选择的判定(判定块)。选择c是因为它位于与块M相邻的右上角,而a和b则靠近与其相对的上角。因此,c的运动向量可以给出哪个运动向量是块M运动向量的最好近似的可靠指示。注意,虽然这里只使用了一个判定块,但在一般情况下可以使用几个判定块。
本实例中与判定块运动向量具有最小向量差异值的块a或b最好选作为对M的运动向量预测。
有两种优选的可供选择的办法用来计算这种向量差异值。为M选择最佳运动向量预测的选择方法背后所隐藏的思想就是选择其运动向量与判定块运动向量相比具有最小向量差异值的块。在计算这些选择判据时应用几种方法。其中两种方法示于下述各段,这两种方法返回一个数值。在判定哪个块(a或b)选作为M的运动向量预测时将应用这一数值,较小的数值是最好的选择。返回的数值将只起选择判据的作用,因此数值本身不必储存或传输。两种可供选择方法的第一种方法是计算各分量差的平方和的平方根。因此,向量(x3,y3)与(x1,y1)之间的差异值以及向量(x3,y3)与(x2,y2)之间的差异值分别计算如下:
( x 3 - x 1 ) 2 + ( y 3 - y 1 ) 2 ; ( x 3 - x 2 ) 2 + ( y 3 - y 2 ) 2
由于这只是上述表达式中两个返回数值中的哪一个返回值是最小值的问题,因此可以选择去除其根号。第二种可供选择的办法是计算各分量差的绝对值之和。向量(x3,y3)与(x1,y1)之间的差异值以及向量(x3,y3)与(x2,y2)之间的差异值的相应计算结果如下:
|x3-x1|+|y3-y1|;|x3-x2|+|y3-y2|
在这两种情况下,都选择与c的运动向量相比具有最小向量差异值的运动向量作为对块M运动向量的预测。
在一般情况下,用于预测的候选向量的数目并非局限于上述实例中的两个。实际上,可以使用任意数目的候选向量。另外,判定向量的数目也并不限制在1。因此,可把一组向量定义为候选组,而把另一组向量定义为判定组。

Claims (6)

1.在视频编码中用来确定目标块的运动向量预测的方法,所述目标块表示视频图像一定区域的像素,所述方法的特征在于以下步骤:
计算相邻于所述目标块的候选块集所对应的候选运动向量集中的每个运动向量与也相邻于所述目标块的判定块集所对应的判定运动向量集中的每个运动向量之间的向量差异值,
在所述候选运动向量集中选择一个运动向量作为所述目标块的所述运动向量预测,被选中的所述一个运动向量与所计算的各向量差异值中最小的一个相对应,
其中,两个运动向量之间的向量差异值被计算成该两个运动向量的相应各分量差的平方和的平方根,或该两个运动向量的相应各分量差的绝对值之和。
2.根据权利要求1的方法,其特征在于,所述候选块集中的块靠近目标块的最左上角,而所述判定块集中的块靠近目标块的最右上角。
3.根据权利要求1或2的方法,其特征在于,所述候选块集包括第一块和第二块,而所述判定块集包括第三块。
4.根据权利要求3的方法,其特征在于,所述第一、第二和第三块的运动向量分别是(x1,y1)、(x2,y2)、(x3,y3)。
5.根据权利要求4的方法,其特征在于,计算第一块和第三块的运动向量之间以及第二块和第三块的运动向量之间各向量差异值的步骤包括计算下述算式:
( x 3 - x 1 ) 2 + ( y 3 - y 1 ) 2 ; ( x 3 - x 2 ) 2 + ( y 3 - y 2 ) 2 .
6.根据权利要求4的方法,其特征在于,计算第一块和第三块的运动向量之间以及第二块和第三块的运动向量之间各向量差异值的步骤包括计算下述算式:
|x3-x1|+|y3-y1|;|x3-x2|+|y3-y2|。
CNB2003801043593A 2002-11-27 2003-11-20 向量预测方法 Expired - Fee Related CN100556149C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
NO20025707A NO318167B1 (no) 2002-11-27 2002-11-27 Vektorprediksjon
NO20025707 2002-11-27

Publications (2)

Publication Number Publication Date
CN1729695A CN1729695A (zh) 2006-02-01
CN100556149C true CN100556149C (zh) 2009-10-28

Family

ID=19914225

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2003801043593A Expired - Fee Related CN100556149C (zh) 2002-11-27 2003-11-20 向量预测方法

Country Status (9)

Country Link
US (1) US7280598B2 (zh)
EP (1) EP1570679B1 (zh)
JP (1) JP2006508584A (zh)
CN (1) CN100556149C (zh)
AT (1) ATE484153T1 (zh)
AU (1) AU2003283876A1 (zh)
DE (1) DE60334490D1 (zh)
NO (1) NO318167B1 (zh)
WO (1) WO2004049730A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2392257A3 (en) 2003-03-12 2012-02-29 Yale University Method of assessing blood volume using photoelectric plethysmography
KR101104828B1 (ko) * 2004-12-09 2012-01-16 삼성전자주식회사 움직임 벡터 연산 장치 및 그 방법
JP2008109632A (ja) * 2006-09-28 2008-05-08 Toshiba Corp 動きベクトル検出装置及びその方法
KR101337206B1 (ko) * 2007-10-12 2013-12-06 삼성전자주식회사 블록 샘플링을 이용한 영상의 움직임 추정 시스템 및 방법.
RU2538284C2 (ru) * 2010-04-22 2015-01-10 Медиатэк, Инк. Способ предсказания движения
TWI590083B (zh) * 2010-11-18 2017-07-01 創意電子股份有限公司 一種產生影像位移偵測之快速搜尋視窗的方法
CN106878742B (zh) 2011-01-12 2020-01-07 太阳专利托管公司 动态图像编解码装置
JP6108309B2 (ja) 2011-02-22 2017-04-05 サン パテント トラスト 動画像符号化方法、動画像符号化装置、動画像復号方法、および、動画像復号装置
JP5358746B2 (ja) 2011-03-03 2013-12-04 パナソニック株式会社 動画像符号化方法、動画像符号化装置及びプログラム
US9131239B2 (en) * 2011-06-20 2015-09-08 Qualcomm Incorporated Unified merge mode and adaptive motion vector prediction mode candidates selection

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4034380B2 (ja) * 1996-10-31 2008-01-16 株式会社東芝 画像符号化/復号化方法及び装置
JP3351705B2 (ja) * 1997-04-25 2002-12-03 日本ビクター株式会社 動き補償符号化装置、動き補償符号化方法、及び記録媒体への記録方法
EP1120976A4 (en) * 1999-07-29 2006-03-29 Mitsubishi Electric Corp METHOD FOR DETECTING MOTION VECTOR
KR100739281B1 (ko) * 2000-02-21 2007-07-12 주식회사 팬택앤큐리텔 움직임 추정 방법 및 장치
KR100680452B1 (ko) * 2000-02-22 2007-02-08 주식회사 팬택앤큐리텔 움직임 벡터 메모리의 갱신방법 및 장치
TW550953B (en) * 2000-06-16 2003-09-01 Intel Corp Method of performing motion estimation
US7079579B2 (en) * 2000-07-13 2006-07-18 Samsung Electronics Co., Ltd. Block matching processor and method for block matching motion estimation in video compression

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Estimation and Mode Decision for Spatially Correlated MotionSequences. Deepak S.Turaga ET AL.IEEE Transactions Circuits and Systems for Video Technology,Vol.11 No.10. 2001
Estimation and Mode Decision for Spatially Correlated MotionSequences. Deepak S.Turaga ET AL.IEEE Transactions Circuits and Systems for Video Technology,Vol.11 No.10. 2001 *

Also Published As

Publication number Publication date
DE60334490D1 (de) 2010-11-18
NO20025707D0 (no) 2002-11-27
US7280598B2 (en) 2007-10-09
AU2003283876A1 (en) 2004-06-18
WO2004049730A1 (en) 2004-06-10
ATE484153T1 (de) 2010-10-15
NO318167B1 (no) 2005-02-14
EP1570679A1 (en) 2005-09-07
EP1570679B1 (en) 2010-10-06
JP2006508584A (ja) 2006-03-09
CN1729695A (zh) 2006-02-01
US20040146110A1 (en) 2004-07-29

Similar Documents

Publication Publication Date Title
CN100581266C (zh) 视频信息编码与解码的方法,运动补偿视频编码器与相应的解码器
CN102695054B (zh) 用于时间视频压缩中运动矢量预测的方法和设备
US6381277B1 (en) Shaped information coding device for interlaced scanning video and method therefor
CN1694501B (zh) 用于确定运动矢量的方法和使用该方法的运动估算器
US6078618A (en) Motion vector estimation system
US6931064B2 (en) Motion picture data converter, and computer product
EP1677546A1 (en) Image encoding with buffer underflow prevention
US20090207914A1 (en) Method for direct mode encoding and decoding
CN100556149C (zh) 向量预测方法
CN100589548C (zh) 校正内插像素值的方法
CN100589580C (zh) 改进的内插像素值的计算方法
KR100922510B1 (ko) 영상의 부호화 및 복호화 방법, 장치 및 그 애플리케이션
US6961082B2 (en) Image display control system reducing image transmission delay
JPH05328333A (ja) 動きベクトル検出装置
CN109688407A (zh) 编码单元的参考块选择方法、装置、电子设备及存储介质
EP0529587B1 (en) Image encoding apparatus
US7672371B2 (en) Bit rate allocation in joint bit rate transcoding
JP2002531018A (ja) デジタル画像フレームの高解像化方法
KR20070026360A (ko) 비디오 정보를 압축/압축해제하기 위한 방법
US6611559B1 (en) Apparatus and method of detecting motion vectors by calculating a correlation degree between each candidate block
CN112565768B (zh) 一种帧间预测方法、编解码系统及计算机可读存储介质
JP3950211B2 (ja) 動きベクトル符号化装置
JP4321468B2 (ja) 動画像符号化装置及び動画像復号化装置
CN101919251B (zh) 一种运动编码和解码
JPH0965342A (ja) 映像符号化装置及び映像復号化装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: CISCO SYSTEMS INTERNATIONAL BV

Free format text: FORMER OWNER: TANDBERG TELECOM AS

Effective date: 20120417

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20120417

Address after: Swiss basil

Patentee after: Cisco Systems International Sarl

Address before: Norway Lv Sake

Patentee before: Tandberg Telecom AS

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20091028

Termination date: 20201120