CN1706199A - 视频编码方法 - Google Patents
视频编码方法 Download PDFInfo
- Publication number
- CN1706199A CN1706199A CNA2003801015555A CN200380101555A CN1706199A CN 1706199 A CN1706199 A CN 1706199A CN A2003801015555 A CNA2003801015555 A CN A2003801015555A CN 200380101555 A CN200380101555 A CN 200380101555A CN 1706199 A CN1706199 A CN 1706199A
- Authority
- CN
- China
- Prior art keywords
- vop
- motion
- previous
- current
- estimation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 14
- 230000000052 comparative effect Effects 0.000 claims description 3
- 238000011002 quantification Methods 0.000 claims description 2
- 230000005540 biological transmission Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/114—Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/20—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
- H04N19/29—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding involving scalability at the object level, e.g. video object layer [VOL]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
- H04N19/139—Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明涉及一种编码方法,该方法对I、P或者B类型的视频对象平面(VOP)进行处理且包括对所述VOP的动态分配。根据所述方法,对于每一个输入帧,在当前帧和先前帧之间执行一个初步的前向运动估计。然后使用当前和先前运动场来求取相干系数的值,其表示为与当前和先前运动场中的局部差的总和相关联。根据所述相干系数相对于实验确定的阈值的值,最后判定要被编码的帧的类型。
Description
技术领域
本发明通常涉及基于对象的视频编码领域,且更具体地涉及根据一种处理来编码视频数据序列的方法,在所述处理中几类数据被识别,所述数据由所谓的多个视频对象平面(VOP)所组成,该VOP或者是内部编码的VOP(I-VOP),其仅仅利用从它们自身得到的信息进行编码,或者是预测编码VOP(P-VOP),其利用一个从过去的参考VOP得到的运动补偿预测进行编码,或者是双向预测的VOP(B-VOP),其利用一个从过去和将来的参考VOP得到的运动补偿预测进行编码。
背景技术
MPEG-4视频标准提供了多种技术,其以较大范围的比特率在许多应用领域,例如数字电视、流动视频、移动多媒体、游戏等等之内观看、访问和操作对象(而不是如以前的MPEG标准去操作像素)。所述标准对视频对象(VO)进行操作,所述视频对象由时间和空间信息所限定,所述时间和空间信息以形状、运动和结构信息的形式表现,并分别在位流中被编码(这些VO是用户能够访问和操作的实体)。
MPEG-4方法依赖于一序列连续场景的基于内容的视觉数据显示,每一个场景是VO的复合体,VO带有它自身固有的特性:形状、运动和结构。除了VO的概念之外,MPEG-4标准介绍了其它的一些东西,如视频对象层(依赖于应用,每一个VO或者以一个可缩放,或者以不能缩放的形式被编码,其由视频对象层或者VOL表现)和视频对象平面(VOP)(=在时间上的VO实例)。可以假定:一个输入视频序列的每一帧被分割成许多任意形状的图像区域(VO),且属于同一个VO的VOP的形状、运动和结构信息被编码并且被传送到相应于特定的时间或空间分辨率的分离的VOL中(其允许随后去单独地解码每一个VOP且促成了所需要的对视频序列的灵活操作)。
下面是由这样一个编码结构处理过的帧的三种类型:I-VOP、P-VOP、和B-VOP。I-VOP是一个内部编码的VOP:该编码操作仅仅使用从其自身得到的信息(其是使用了最大数量的位的VOP)。P-VOP是预测编码的VOP,且该编码操作则是使用一个从过去的参考VOP中得到的运动补偿预测,该过去的参考VOP或者可以是一个I-VOP或者可以是另一个P-VOP(与一个I-VOP相反,仅编码当前运动补偿P-VOP与它的参考VOP之间的差:因此,一个P-VOP通常比一个I-VOP使用更少的位)。B-VOP是使用从过去和将来的参考VOP(I-VOP或者P-VOP)的运动补偿预测进行编码得到的VOP,分别基于所谓的向前的和向后的运动估计而被编码的VOP。一个B-VOP不能作参考VOP,且象P-VOP,仅有当前运动补偿B-VOP与它的参考VOP之间的差被编码。
不幸地,这时,使用所述B-VOP预测(也叫做内插或者双向模式)经常得不到压缩方面的效果。如果压缩有时能被改善大约20%,在一些情形下也会急剧地降低。
发明内容
于是本发明的一个目的是提出一种编码方法,其仅仅在B-VOP预测有效时才使用这样的B-VOP预测。
为此,本发明涉及一种在说明书的前序部分中限定的编码方法,所述编码方法包括对每一个VOP的编码步骤和一个在所述编码步骤之前在当前的VOP和先前的一个VOP之间执行的运动估计步骤,所述运动估计步骤本身包括一个关于要被编码的VOP的类型的判定处理且基于下面的子步骤:
-在一个序号为N的VOP(VOP N)和先前的一个VOP(VOP N-1)之间执行一个运动估计;
-以所述运动估计为基础,计算一个所谓的相干系数,提供对序列运动的量化;
-基于所述相干系数与一个预定阈值的比较结果,对当前的VOP的类型作出最终的判定,根据所述相干系数相对于所述阈值的值判定所述当前VOP是一个B-VOP或者不是一个B-VOP。
附图说明
本发明现在参照附图,以示例的方式进行描述,其中图1图示了根据本发明的编码方法的主要步骤。
具体实施方式
一个MPEG-4编码器包括几个功能块,在所述功能块中一个或者几个存储器用于以标准所需要的传输顺序输出VOP。例如,如果输入顺序是IBBPBBP...,那么输出或者传输顺序将会是IPBBPBB...(为了能够向后预测,编码器必须将自然顺序的图像重新排序为所述的传输顺序,以使B-VOP在它们所参考过去和将来的VOP之后被传输)。所述编码器还包括一个运动估计器,用于接收当前的VOP和先前的一个VOP(或者参考VOP),并且判定对于当前VOP将执行哪种预测:对于I-VOP为没有预测,对于P-VOP为向前预测,对于B-VOP为双向预测。
如图1显示了在运动估计器中关于预测的判定过程的步骤,根据本发明,所述判定基于以下步骤的执行过程。首先,捕捉当前的VOP(序号:N)(步骤CAP-VN)。然后在VOP N和先前的VOP(序号:N-1)之间执行运动估计(M-EST),且为了量化序列运动,计算一个命名为“相干系数”的系数(步骤CF-CPT),且将所述相干系数与一个预定的阈值进行比较(步骤CF-TEST)。根据比较结果(Y=低于,或者N=不低于),VOP N被允许(N-AL)或者不被允许(N-NAL)作为一个B-VOP。然后执行关于预测模式的最终判定(步骤V-DEC),并且能够执行对当前VOP(=I-VOP、或者P-VOP、或者B-VOP)的编码步骤(步骤COD)。
对于在比较测试中使用的相干系数可以提出几种表示法,而这并不限制本发明的范围。不过,一个优选的相干系数可以是例如下面所表述的:在同一个VOP中的宏块(以16×16像素模式或者8×8像素模式估计)的运动矢量与它的先前宏块的运动矢量之间的绝对差的总和与前一个VOP的类似总和的比率(在此被重新调用,即对于大小为k×k的宏块,SAD的表示式是:
其中B(i)和A(i)分别表示所考虑的当前宏块和参考VOP中与在所述参考VOP中定义的搜索范围内的最大宏块相匹配的宏块)。
Claims (2)
1.一个根据一种处理来编码一序列视频数据的方法,在所述处理中数据的几种类型被识别,所述数据由所谓的视频对象平面(VOP)组成,VOP或者是内部编码的VOP(I-VOP),其仅仅利用从它们自身得到的信息进行编码,或者是预测编码VOP(P-VOP),其利用一个从过去的参考VOP得到的运动补偿预测进行编码,或者是双向预测的VOP(B-VOP),其利用一个从过去和将来的参考VOP得到的运动补偿预测进行编码,所述编码方法包括对每一个VOP进行编码的步骤,在所述编码步骤之前在当前VOP和先前的一个VOP之间执行一个运动估计步骤,所述运动估计步骤本身包括一个关于要被编码的VOP的类型的判定处理,并且基于以下子步骤:
-在一个序号为N的VOP(VOP N)和先前的一个VOP(VOP N-1)之间执行运动估计;
-以所述运动估计为基础,计算一个所谓的相干系数,提供对序列运动的量化;
-基于所述相干系数与一个预定阈值的比较结果,对当前的VOP的类型作出最终的判定,根据所述相干系数相对于所述阈值的值判定所述当前VOP是一个B-VOP或者不是一个B-VOP。
2.根据权利要求1所述的编码方法,其中所述相干系数被表述为由所述运动估计产生的同一个VOP中的宏块和它先前宏块的运动矢量之间的绝对差的总和(SAD)同先前的VOP的类似总和的比率。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP02292552 | 2002-10-16 | ||
EP02292552.3 | 2002-10-16 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1706199A true CN1706199A (zh) | 2005-12-07 |
Family
ID=32104017
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2003801015555A Pending CN1706199A (zh) | 2002-10-16 | 2003-10-13 | 视频编码方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US7149250B2 (zh) |
EP (1) | EP1554888A1 (zh) |
JP (1) | JP2006503478A (zh) |
KR (1) | KR20050050673A (zh) |
CN (1) | CN1706199A (zh) |
AU (1) | AU2003267755A1 (zh) |
WO (1) | WO2004036920A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7295612B2 (en) | 2003-09-09 | 2007-11-13 | Apple Inc. | Determining the number of unidirectional and bidirectional motion compensated frames to be encoded for a video sequence and detecting scene cuts in the video sequence |
US7889792B2 (en) | 2003-12-24 | 2011-02-15 | Apple Inc. | Method and system for video encoding using a variable number of B frames |
US8218811B2 (en) | 2007-09-28 | 2012-07-10 | Uti Limited Partnership | Method and system for video interaction based on motion swarms |
EP2224745B1 (en) * | 2009-02-27 | 2019-11-06 | STMicroelectronics Srl | Temporal scalability in case of scene changes |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0831658A3 (en) * | 1996-09-24 | 1999-09-15 | Hyundai Electronics Industries Co., Ltd. | Encoder/decoder for coding/decoding gray scale shape data and method thereof |
US6307886B1 (en) * | 1998-01-20 | 2001-10-23 | International Business Machines Corp. | Dynamically determining group of picture size during encoding of video sequence |
JP2002101416A (ja) * | 2000-09-25 | 2002-04-05 | Fujitsu Ltd | 画像制御装置 |
-
2003
- 2003-10-13 WO PCT/IB2003/004522 patent/WO2004036920A1/en active Application Filing
- 2003-10-13 US US10/531,027 patent/US7149250B2/en not_active Expired - Fee Related
- 2003-10-13 CN CNA2003801015555A patent/CN1706199A/zh active Pending
- 2003-10-13 KR KR1020057006442A patent/KR20050050673A/ko not_active Application Discontinuation
- 2003-10-13 AU AU2003267755A patent/AU2003267755A1/en not_active Abandoned
- 2003-10-13 JP JP2004544596A patent/JP2006503478A/ja not_active Withdrawn
- 2003-10-13 EP EP03748450A patent/EP1554888A1/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
US20050259732A1 (en) | 2005-11-24 |
US7149250B2 (en) | 2006-12-12 |
EP1554888A1 (en) | 2005-07-20 |
JP2006503478A (ja) | 2006-01-26 |
WO2004036920A1 (en) | 2004-04-29 |
KR20050050673A (ko) | 2005-05-31 |
AU2003267755A1 (en) | 2004-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4786114B2 (ja) | 映像をコード化するための方法及び装置 | |
US5973743A (en) | Mode coding method and apparatus for use in an interlaced shape coder | |
KR19990067723A (ko) | 비디오 프레임 시퀀스의 인코딩 방법 및 시스템과, 제조 물품 | |
US6351492B1 (en) | Method and apparatus for encoding a video signal | |
KR20060105394A (ko) | 비동기 픽쳐의 모션 벡터를 압축/복원하는 방법 및 그방법을 이용한 장치 | |
JPH09224254A (ja) | 動き推定のための装置および方法 | |
AU748947B2 (en) | Method and apparatus for inverse quantization of MPEG-4 video | |
CN1401189A (zh) | 视频编码方法和相应的编码器 | |
US6069976A (en) | Apparatus and method for adaptively coding an image signal | |
CN1248508C (zh) | 视频解码方法 | |
KR19990066623A (ko) | 이진 형상 신호의 모드 신호 부호화 방법 및 그 복원 방법 | |
EP1064791B1 (en) | Method and apparatus for encoding a video signal | |
CN100566415C (zh) | 视频编码方法以及视频解码方法 | |
CN1706199A (zh) | 视频编码方法 | |
Chung et al. | Rate-distortion-constrained statistical motion estimation for video coding | |
CN1254974C (zh) | 视频编码方法和相应的编码器 | |
US6049567A (en) | Mode coding method in a binary shape encoding | |
US20050259878A1 (en) | Motion estimation algorithm | |
Stefanoski et al. | Spatially and temporally scalable compression of animated 3D meshes with MPEG-4/FAMC | |
JP2004511978A (ja) | 動きベクトルの圧縮 | |
AU2001293994A1 (en) | Compression of motion vectors | |
KR100319916B1 (ko) | 계층구조를갖는스케일러블디지탈화상압축/복원방법및장치 | |
CN1771736A (zh) | 视频编码、解码方法和相应设备 | |
CN1784905A (zh) | 视频编解码方法和相应的编解码设备 | |
Park et al. | Intelligent rate control for MPEG-4 coders |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |