CN1245029C - 视频序列代码转换的运动矢量外推法 - Google Patents
视频序列代码转换的运动矢量外推法 Download PDFInfo
- Publication number
- CN1245029C CN1245029C CNB998041769A CN99804176A CN1245029C CN 1245029 C CN1245029 C CN 1245029C CN B998041769 A CNB998041769 A CN B998041769A CN 99804176 A CN99804176 A CN 99804176A CN 1245029 C CN1245029 C CN 1245029C
- Authority
- CN
- China
- Prior art keywords
- pictures
- bit stream
- bitstream
- represented
- motion vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 239000013598 vector Substances 0.000 title claims description 81
- 238000013213 extrapolation Methods 0.000 title description 11
- 238000000034 method Methods 0.000 claims abstract description 46
- 230000000750 progressive effect Effects 0.000 claims abstract description 14
- 230000002123 temporal effect Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 11
- 238000007906 compression Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000013144 data compression Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- NUHSROFQTUXZQQ-UHFFFAOYSA-N isopentenyl diphosphate Chemical compound CC(=C)CCO[P@](O)(=O)OP(O)(O)=O NUHSROFQTUXZQQ-UHFFFAOYSA-N 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/40—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
一种代码转换方法,通过接收具有可识别编码参数的压缩图像数据的第一位流来执行。这些参数涉及第一位流所表示图像的GOP结构,第一位流所表示图像的尺寸,第一位流所表示的图像是场图像还是帧图像,和/或第一位流所表示的图像定义了一个逐行序列还是一个隔行序列。第一运动信息从第一位流中获得,并用来外推压缩图像数据第二位流的第二运动信息。第二位流,其具有与第一位流不同的一个或多个参数,被用作代码转换后的输出。
Description
政府许可证权利
根据美国国家标准技术研究所获得的70NANB5H1171号合同,美国政府对本发明拥有付讫许可证,和在有限的情况下要求专利拥有者根据该合同所提供的合理条款向其他人发放许可证的权利。
发明领域
本发明通常涉及视频序列代码转换的运动估计,特别是用于代码转换接收的视频序列的技术,其通过利用来自接收的视频序列中的外推的运动信息而减少或消除代码转换过程的运动估计。
发明背景
数据压缩技术能使大量的数据在相对小的频宽上传输。压缩系统中所用算法取决于可能的频宽或存储容量,应用所要求的功能,和实现压缩算法(编码器和译码器)所要求的硬件的花费。特此一并引用的运动图像专家组-2类(“MPEG-2”)压缩标准,是著名的视频数据压缩技术。运动估计,其为用于计算运动矢量的过程视频编码器,通常被认为是编码过程的最昂贵部件。类似地,运动估计有可能是代码转换过程的最昂贵部件,代码转换过程译码视频序列,然后用新参数将之重新编码。随着高清晰度电视(“HDTV”)的出现,由于要求电视演播室能把MPEG-2图像数据位流从一种格式代码转换成另一种,这就更为关注。例如,提供HDTV标准的电视演播室必须能够把MPEG-2位流从一组图像(“GOP”)结构代码转换成另一种,从一种图像尺寸代码转换成另一种,和/或从一种位速率代码转换成另一种。有实例要求演播室能把MPEG-2图像从场图像代码转换成帧图像,或从帧图像代码转换成场图像。也有实例要求演播室能把MPEG-2图像从隔行序列代码转换成逐行序列,或从逐行序列代码转换成隔行序列。代码转换也可用于完成“修剪”功能,其中输入代表主图像,代码转换后的输出代表主图像中的子图像。
发明简述
因此,本发明的目的为提供一种视频序列代码转换技术,其减少或消除了运动估计。
本发明的另一目的为提供一种视频序列代码转换技术,其中来自输入位流中的运动信息被用来为代码转换的输出位流产生运动矢量。
本发明的另一目的为提供一种用于代码转换过程的运动估计技术,其支持MPEG-2所有的预测模式。
通过接收具有可识别编码参数的压缩图像数据的第一位流可完成本发明的代码转换方法,依照其原理,可取得以上这些和其它目的。这些参数可能涉及在第一位流中所表示的图像的GOP结构,在第一位流中所表示的图像的尺寸,在第一位流中所表示的图像是场图像还是帧图像,和/或在第一位流中所表示的图像定义了一个逐行序列还是一个隔行序列。第一运动信息从第一位流中获得,并用来为第二压缩图像数据位流外推第二运动信息。第二位流,其与第一位流有一个或更多的参数不同,被当作代码转换的输出。
附图简述
通过参照附图对下面进行详述,本发明更为完整的理解和其中许多附带优点将逐步明晰化,其中:
图1表示运动矢量外推法的基本原理;
图2表示按照本发明原理构造的代码转换系统;
图3表示按照本发明原理把图像从一种GOP结构代码转换成另一种的过程;和
图4表示运动矢量外推法的一般例,当应用于代码转换时能够用来更好地理解运动矢量外推法。
发明详述
现在转向附图,参考图1,其中表示了运动矢量外推法的基本原理。通常,运动矢量外推法是一种当运动在视频序列的其它处已知时,估计序列中图像运动的技术。在图1中,图像B中的粗体方块代表视频图像中独立的像素(pixel,也叫pels)块。图像中的每一个块假定具有一固定位置。在MPEG-2中,这些块被称为“宏块”,且每个块由16×16的像素块组成。图1中的实线箭头代表粗体块从图像A移到图像B时其已知的运动。实际上,正是块中的成象移动,而不是其位置固定的块本身移动。由运动矢量定义的该已知运动,当从图像B移到图像C时被用来外推块的运动。图1中的虚线箭头代表外推的运动矢量。由于图1(和其它附图)使用更为普通的编码协定,其中与一个块相关的矢量指向那个块在参考图像中的“源处”,所以图1中的箭头实际指向运动的相反方向。实际上,给定的运动矢量被表示为x和y座标的集合,其分别代表两图像之间块的水平和垂直运动。外推法通常假设运动在时间上是一致的,在空间上是“平滑”的。相应地,图像B中的块被期望移动到图像C中所示位置,与之交迭的所有的块被期望具有近似的相同运动。
现在参考图2,其中表示了按照本发明原理构造的代码转换系统。在图2中,代码转换系统200接收MPEG-2压缩图像数据的输入位流201。呈现特殊位速率的输入位流201代表具有给定尺寸和GOP结构的图像。输入位流201的图像数据由场或帧图像组成,也可表示逐行的或隔行的序列。在本技术领域众所周知的MPEG-2译码器202接收输入位流201并将其译码以产生压缩的数字图像数据203的输出。译码器202也从输入位流201提供运动信息(即运动矢量)作为单独的输出204。数字图像数据203输入到中间处理单元205,其在像素域内进行操作,能够以众所周知的方法为数字图像数据203表示的图像重定大小。除为图像重定大小之外,中间处理单元205,通过分离由数字图像数据203表示的主图像中的子图像和提供代表子图像数据的输出,能完成众所周知的修剪功能。中间处理单元205也能够执行众所周知的隔行和去隔行操作,其在把图像的逐行序列代码转换成图像的隔行序列时,和把图像的隔行序列代码转换成图像的逐行序列时是很有必要的。中间处理单元205执行其操作以响应外部输入206,其指示哪一个处理操作(如果有的话)将要完成,并且进一步指出用于这样的处理中的参数。因为中间处理单元205的操作是任选的,如果对于给定的代码转换应用,图像重定大小,修剪,隔行和去隔行勿需执行,中间处理单元205简单地以直通单元的方式进行操作,不经任何像素域处理地输出数字图像数据207。在该情况下,数字图像数据207与数字图像数据203明显相同。或者,如果一个或更多个这些处理操作被用来完成给定的代码转换应用,中间处理单元205进行像素域的处理操作和输出处理的结果数字图像数据207。数字图像数据207,无论是否经由中间处理单元205处理,输入到MPEG-2编码器208,其使用由外部输入209指示的新参数来重编码接收的图像数据207。例如,编码器208可编码数字图像数据207以表示与由输入位流201所表示的不同的GOP结构图像,并且/或者可以调整位速率。编码器208也可把数字图像数据207编码为场或帧图像。为了执行编码处理,编码器208使用译码器202的输出204中的运动信息来外推被重新编码的图像的运动矢量。其后,被重新编码的图像从代码转换系统200作为MPEG-2压缩数字图像数据的输出位流210提供。
如前所示,该输出位流210可表示与输入位流201不同的图像尺寸和GOP结构,并且可控制输出位流210的位速率不同于输入位流201的位速率。而且,输出位流210可表示场图像而输入位流201表示帧图像,或输出位流210表示帧图像而输入位流201表示场图像。类似地,输出位流210可表示隔行序列而输入位流201表示逐行序列,或输出位流210表示逐行序列而输入位流201表示隔行序列。而且,输出位流210可表示输入位流201的“修剪”版本。本质上,代码转换系统200接收具有某些参数的输入位流201,并代码转换输入位流201以产生具有不同于输入位流201的一个或更多参数的输出位流210。该代码转换系统200是独一无二的,因为其使用输入位流201中的运动信息来外推输出位流210的运动信息。
现在转向图3,其中表示了按照本发明原理把图像从一种GOP结构代码转换成另一种的过程。在图3中,输入位流表示具有某种GOP结构的图像,该结构为:内编码图像(“I图像”),双向预测编码图像(“B图像”),B图像,预测编码图像(“P图像”)。即,输入位流代表一个“IBBP”GOP结构。如图3所示,输入位流的两个连续B图像,为清楚起见被标为B1和B2。该输入位流类似于图2中的输入位流201。在代码转换处理期间,具有“IBBP”GOP结构的输入位流被转换成具有“IPPP”GOP结构的输出位流。如图3所示,输出位流的三个连续P图像,为清楚起见被标为P1,P2和P3。该输出位流类似于图2中的输出位流210。为减少混乱性,构成单独图像的宏块未示于图3中。为了完成代码转换处理,输入位流中的I-P和P-B2运动矢量被用来外推输出位流的运动矢量。例如,如图3所示,可利用输入位流中的I-P运动矢量来估计输出位流的P1-P2运动矢量。类似地,可利用输入位流中的P-B2运动矢量来估计输出位流的P2-P3运动矢量。
本发明的运动矢量外推过程的更为详尽的解释将参考图4给出,该图表示了视频序列中的四个图像。从概念上说,这四个图像既存在于输出位流中也存在于输入位流中,并且实际上这就是通常的情形。图4中,在任何情况下,图像T为“目标”图像,其相对图像R的运动将要被确定。这两个图像都将出现于输出位流。图像KR与图像KT为其相对运动在输入位流中已知的图像。按照本发明原理,可利用图像KR与图像KT之间的已知运动来外推输出位流的运动矢量。图像KR与图像KT被称为“基对”,且图像R与图像T被称为“当前对”。几个基对可用于估计当前对的运动。通常,任何时间上接近当前对的基对,对该目的都有潜在的利用价值。
在代码转换过程期间,存在情况其中图像T的某些块不接收运动外推信息。即,存在这样的情况其中图像T的某些块不为附近基对中任何块的运动所交迭。图像T中这样的块可能简单地为内编码的,或其运动可以传统的方式进行计算。或者,可从附近块推断或内插这些块的运动。然而在大多数情况下,基对中的几个块将与图像T中大多数块交迭,则所执行的任务是要从几个候选运动矢量中选出最佳运动矢量。基对中每一个交迭块提供一个候选运动矢量。当在多个候选运动矢量中进行选择时,对每个运动矢量进行加权,并选择具有最大权重的运动矢量是十分有用的。以图4的图像为例,计算出的每个候选运动矢量(MV)的权重如下所示:
总权重(MV)=(交迭权重)×(图像权重)×(舍入权重)………(1)
其中,
交迭权重=(与图像T对应的块中像素交迭的图像KT的块中像素的数目)
………(2)
图像权重=1/〔1+abs(时间权重)〕……………………………(3)
其中,
时间权重(temporal weight)=(tKT-tKR)×(tKR+tKT)-(tT+tR)〕……………(4)
并且,
舍入权重=〔1-(水平舍入误差)〕×〔1-(垂直舍入误差)〕……(5)
在上面的方程(1)到(5)中,tKR,tKT,tR和tT分别代表图像KR,KT,R和T的显示次数。术语×和abs分别代表乘法操作符和取绝对值表达式。水平和垂直舍入误差当外推的矢量舍入到近半个像素时才出现,并且相应地,每个从0到1/2取值。尽管方程(1)到(5)被用于图4的图像中,但把这些通用方程用于其它图像配置是极其自然的。
除简单地挑选具有最大权重的候选运动矢量的技术之外,本发明涵盖其它获得给定块最佳运动矢量的方法。按照可选实施例,可计算加权平均,其中利用方程(1)到(5)计算权重。利用这些权重,在分量的基础上通过把权重乘以对应运动矢量的x或y分量来产生加权分量,对加权分量取和,并把加权分量之和除以权重之和来计算最佳运动矢量。
上面的加权平均技术也可在“簇”的基础上进行。即,如果候选运动矢量的x-y标图显示了多于一个的运动矢量簇(即接近分组),可计算出每个簇的最佳运动矢量。此为质心,或簇的“质量中心”。然后可从单独簇的最佳运动矢量中挑选出最终的最佳运动矢量。
需注意也可完全不使用加权来从多数候选运动矢量中挑选最佳运动矢量。例如,可计算表示块之间像素偏差的均方误差(MSE)或平均绝对偏差
(MAD)来识别最佳运动矢量。当然,MSE和MAD计算是该领域公知的技术。
下面列在表1中的算法表示对目标图像(如图4的图像T)的每个可能预测模式查找最佳运动矢量的步骤。以伪代码表示的这些步骤,可以以该领域公知的任何编程语言来编程。■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
表1:查找最佳运动矢量的伪代码■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
-对于为目标图像(当前对)考虑的每个预测模式
-对于可应用模式(顶场,底场,帧)的每一场或帧
-初始化由目标图像中块索引的表
-对于被认为对当前对有用的每一个基对(例如,一个基对通常被认为是“有用”的,如果其时间上是在预定范围内附近)
-对于基对目标中每个内编码块的每个运动矢量
-确定矢量在目标图像中把块移到何处
-计算矢量的权重,或评估其匹配(例如MSE,MAD)
-在相关目标图像块的表入口中存储信息
-对于目标图像中每一个块
-确定场或帧的最佳运动矢量
-对于目标图像中每一个块
-确定最佳预测模式和相应的运动矢量■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
注意多个运动矢量都与某些预测模式中的给定块相关,诸如帧图像的场预测和P图像的DP(dual prime)预测。而且,对于B图像,编码器必须为每个块决定是使用前向预测,后向预测还是两者都使用。在某些情况下无一预测模式能产生可接受的结果。这种情况出现在没有候选运动矢量时,或按上面技术之一确定的最佳运动矢量对特定应用不够好时。另外,存在情况其中编码器能简单地把输入序列中的运动矢量(未改变的)用于输出序列。
假定在图4中使用不带重定大小的帧图像的帧预测。假设图像KT中的一个块具有相关的矢量vK,则图像T中一个或更多块具有如下定义的相关矢量v:
v=Tv×vK………………………………………………………………(6)
其中,
Tv=(tT-tR)/(tKT-tKR) ………………………………………(7)此处,Tv为矢量的时间比例因子,而tKR,tKT,tR和tT分别表示图像KR,KT,R和T的显示次数。对于其场以不同次数显示的帧图像,存在显示次数的不明确。在这种情况下,次数应为各自场的平均值。为了跟踪一个块从图像KT到图像T的运动,考虑特定块左上角的某一点。在图4中,该点表示为图像KT中的点qK和图像T中的点q。点q的运动由下式给出:
q=qK-(Tb×VK) ……………………………………………………(8)
其中,
Tb=(tT-tKT)/(tKT-tKR) ………………………………………(9)
在含有重定图像大小的代码转换过程中,图像KR和KT与图像R和T具有不同的大小。重定大小如下所示。令Rx和Ry分别代表图像的水平和垂直放大。即:
Rx=(图像T的宽度)/(图像KT的宽度) …………………………(10)和,
Ry=(图像T的高度)/(图像KT的高度) …………………………(11)图像重定尺寸要求修改方程(6)和(8)如下:
v=R(Tv×vK) ………………………………………………………(12)和,
q=R(qK-(Tb×vK)) ………………………………………………(13)
前面的方程引入了符号:
R(V)=(Vx×Rx,Vy×Ry) ………………………………………(14)此处V为一两分量点(像素)或矢量。注意R代表不同的图像尺寸,而不是不同的块尺寸。
重定尺寸不但应用于重定大小的图像,也应用于相关的场和帧图像和相关的场和帧预测。为了完成(场和帧图像两者的)场预测,注意底场比其座标所指示的要低0.5个像素。一个场或帧图像的置换矢量dX如下定义:
dX=(0,0)若X为顶场或顶帧……………………………………(15)和,
dX=(0,0.5)若X为底场…………………………………………(16)
将此应用于方程(12)和(13),v和q的新方程将变为:
v=R(Tv×(vK+dKR-dKT))+dT-dR …………………………(17)和,
q=R(qK+dKT-〔Tb×(vK+dKR-dKT)〕)-dT ……………(18)因此,实际用于本发明的最后方程为方程(7),(9)和(14)到(18)。
最后,假设图2的中间处理单元205修剪图像。可如下应用以上方程。我们考虑图像R和T与原来的尺寸相同,在适当的位置输出图像嵌入其中。该位置定义了影响区域。只有与影响区域交迭的块才用于外推法。则图1到图4,以及从之导出的方程可应用于该情况。
以上所公开的可间接表明同质性;即如果图像T为利用基于场预测的帧图像,则图像KT也为利用基于场预测的帧图像。然而以上所讨论的公式更为通用,如以下例子所示。
假设图像T利用基于帧的预测,而图像KT利用基于场的预测。在本发明中,图像KT为场图像还是为帧图像是无关紧要的。在任一情况下,图像KT的运动矢量为基于场的,所以Ry=2且Rx=1。如果图像KT为帧图像,其块大小为16×8;然而对前面的公式而言,那是显而易见的。如果一个块使用16×8预测,则其两个的半块应对待为两个单独的块。
下一步假设图像T和图像KT皆使用基于场的预测。这里,由于两个图像中的矢量参考同尺寸的图像,不需重定大小并且Rx=Ry=1。即在本发明的实际例中,是存在场和帧图像的混合,还是存在场和帧预测的混合对这些方程而言是不相关的。
如以上公开所隐含的,若图像KT中的一个块使用DP(dual prime),则分别地应用其两个矢量,或许具有不同的权重。而且评估图像T的DP与评估图像T的双向内插十分相似。即分别地评估每一个矢量,然后评估其组合。相应地,本发明支持所有的MPEG-2预测模式:帧图像的帧、场和DP预测;和场图像的场、DP预测和16×8预测。
值得注意的是这里所公开的方程通常是考虑线性运动的,而不是非线性运动的情形。例如非线性运动可能源自照相机的晃动或图像中物体的一致加速。非线性运动这样的例子可按如下的方法处理。对于与照相机晃动相关的非线性运动,可期望在比较块运动之前析出全局运动因子。公知的MSE和MAD计算可用于该目的。对于与物体一致加速相关的非线性运动,可期望利用三个图像,而不是两个来外推该运动。
当已表示和描述了本发明优选实施例后,本领域技术人员应理解在不脱离本发明的真正范围情况下,所作出的各种变化和修改及其等价形式可替代其中的单元。另外,在不脱离本发明的中心范围情况下,可作出许多修改。因此,这不意味着本发明受限于所公开的执行该发明最佳模式的特殊实施例,而意味着本发明包括落入所附权利要求范围内的所有实施例。
Claims (21)
1.一种代码转换方法,包括下列步骤:
接收具有第一组图像(GOP)结构的压缩图像数据的第一位流;
从第一位流获得第一和第二运动信息;
加权第一和第二运动信息;
如果第一运动信息重于第二运动信息,利用第一运动信息来外推第三运动信息用于压缩数据的第二位流,第二位流具有与第一组图像(GOP)结构不同的第二组图像(GOP)结构;和
输出第二位流。
2.如权利要求1所述的方法,进一步包括步骤:控制第二位流的位速率以使第一位流的位速率与第二位流的位速率不同。
3.如权利要求1所述的方法,进一步包括步骤:调整由第一位流表示的图像的尺寸以使第二位流表示的图像呈现的尺寸与第一位流表示的图像的尺寸不同。
4.如权利要求2所述的方法,进一步包括步骤:调整由第一位流表示的图像的尺寸以使第二位流表示的图像呈现的尺寸与第一位流表示的图像的尺寸不同。
5.如权利要求4所述的方法,进一步包括步骤:当第一位流表示的图像被编码为帧图像时,把第二位流表示的图像编码为场图像。
6.如权利要求4所述的方法,进一步包括步骤:当第一位流表示的图像被编码为场图像时,把第二位流表示的图像编码为帧图像。
7.如权利要求4所述的方法,进一步包括步骤:当以逐行序列接收第一位流表示的图像时,隔行第一位流表示的图像,以使第二位流表示的图像以隔行序列输出。
8.如权利要求4所述的方法,进一步包括步骤:当以隔行序列接收第一位流表示的图像时,去隔行第一位流表示的图像,以使第二位流表示的图像以逐行序列输出。
9.如权利要求1所述的方法,进一步包括步骤:当第一位流表示的图像被编码为帧图像时,把第二位流表示的图像编码为场图像。
10.如权利要求1所述的方法,进一步包括步骤:当第一位流表示的图像被编码为场图像时,把第二位流表示的图像编码为帧图像。
11.如权利要求1所述的方法,进一步包括步骤:当以逐行序列接收第一位流表示的图像时,隔行第一位流表示的图像,以使第二位流表示的图像以隔行序列输出。
12.如权利要求1所述的方法,进一步包括步骤:当以隔行序列接收第一位流表示的图像时,去隔行第一位流表示的图像,以使第二位流表示的图像以逐行序列输出。
13.如权利要求1所述的代码转换方法,其中,获得所述第一和第二运动信息的步骤包括下列步骤:
确定一受检查的运动信息是否在预定时间范围之内;和
如果该受检查的运动信息被确定是在预定时间范围之内,获得所述受检查的运动信息。
14.如权利要求1所述的代码转换方法,其中,加权所述第一和第二运动信息的步骤包括下列步骤:
至少计算交迭权重、时间权重和舍入权重中的一个用于所选择的运动信息;和
基于至少一个所述计算的权重得出用于所选择的运动信息的加权值。
15.一种代码转换方法,包括步骤:
接收具有输入编码参数的压缩数据的输入位流;
从输入位流获得第一和第二运动矢量;
加权第一和第二运动矢量;
如果第一运动矢量重于第二运动矢量,利用所述第一运动矢量来外推一第三运动矢量用于压缩图像数据的输出位流,所述输出位流具有不同于输入位流的输入编码参数的输出编码参数;和
输出压缩数据的输出位流。
16.如权利要求15所述的代码转换方法,其中,获得第一和第二运动矢量的步骤包括下列步骤:
确定一受检查的运动矢量是否在预定时间范围之内;和
如果该受检查的运动矢量被确定是在预定时间范围之内,获得所述受检查的运动矢量。
17.如权利要求15所述的代码转换方法,其中,加权所述第一和第二运动矢量的步骤包括下列步骤:
至少计算交迭权重、时间权重和舍入权重中的一个用于所选择的运动矢量;和
基于至少一个所述计算的权重得出用于所选择的运动矢量的加权值。
18.如权利要求15所述的代码转换方法,其中,加权所述第一和第二运动矢量的步骤包括下列步骤:
至少计算交迭权重、时间权重和舍入权重中的一个用于所选择的运动矢量;和
基于至少一个所述计算的权重得出用于所选择的运动矢量的x和y分量的加权值。
19.如权利要求15所述的代码转换方法,其中,所述输入编码参数至少是一组图像(GOP)结构、图像尺寸、位速率、帧图像格式、场图像格式、逐行序列和隔行序列中的一个。
20.如权利要求15所述的代码转换方法,其中,所述输出编码参数至少是一组图像(GOP)结构、图像尺寸、位速率、帧图像格式、场图像格式、逐行序列和隔行序列中的一个。
21.如权利要求15所述的代码转换方法,其中,所述第一和第二运动矢量是第一和第二运动矢量簇。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/027,140 US6058143A (en) | 1998-02-20 | 1998-02-20 | Motion vector extrapolation for transcoding video sequences |
US09/027,140 | 1998-02-20 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1293872A CN1293872A (zh) | 2001-05-02 |
CN1245029C true CN1245029C (zh) | 2006-03-08 |
Family
ID=21835928
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB998041769A Expired - Fee Related CN1245029C (zh) | 1998-02-20 | 1999-02-02 | 视频序列代码转换的运动矢量外推法 |
Country Status (10)
Country | Link |
---|---|
US (1) | US6058143A (zh) |
EP (1) | EP1057341B1 (zh) |
JP (1) | JP4514081B2 (zh) |
KR (1) | KR100515199B1 (zh) |
CN (1) | CN1245029C (zh) |
AU (1) | AU2578799A (zh) |
BR (1) | BR9908063A (zh) |
DE (1) | DE69908562T2 (zh) |
RU (1) | RU2251820C2 (zh) |
WO (1) | WO1999043162A1 (zh) |
Families Citing this family (63)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6339656B1 (en) * | 1997-12-25 | 2002-01-15 | Matsushita Electric Industrial Co., Ltd. | Moving picture encoding decoding processing apparatus |
JPH11275592A (ja) * | 1998-01-22 | 1999-10-08 | Victor Co Of Japan Ltd | 動画像符号列変換装置及びその方法 |
US6466623B1 (en) * | 1998-03-27 | 2002-10-15 | Industrial Technology Research Institute | Method and apparatus for motion estimation for high performance transcoding |
US6477706B1 (en) | 1998-05-01 | 2002-11-05 | Cogent Technology, Inc. | Cable television system using transcoding method |
US6128047A (en) * | 1998-05-20 | 2000-10-03 | Sony Corporation | Motion estimation process and system using sparse search block-matching and integral projection |
GB2339101B (en) * | 1998-06-25 | 2002-09-18 | Sony Uk Ltd | Processing of compressed video signals using picture motion vectors |
CN1157954C (zh) | 1998-09-29 | 2004-07-14 | 皇家菲利浦电子有限公司 | 编码视频数据的转换 |
US6310915B1 (en) * | 1998-11-20 | 2001-10-30 | Harmonic Inc. | Video transcoder with bitstream look ahead for rate control and statistical multiplexing |
US6434197B1 (en) * | 1999-01-07 | 2002-08-13 | General Instrument Corporation | Multi-functional transcoder for compressed bit streams |
JP3855522B2 (ja) * | 1999-02-23 | 2006-12-13 | 松下電器産業株式会社 | 動画変換装置 |
US6567557B1 (en) * | 1999-12-10 | 2003-05-20 | Stmicroelectronics, Inc. | Method for preventing dual-step half-pixel motion compensation accumulation errors in prediction-rich MPEG-2 sequences |
WO2000070879A1 (en) * | 1999-05-13 | 2000-11-23 | Stmicroelectronics Asia Pacific Pte Ltd. | Adaptive motion estimator |
EP1067798A3 (en) * | 1999-06-30 | 2005-11-30 | Media Glue Corporation | Apparatus, method and computer program product for transcoding a coded moving picture sequence |
US6300973B1 (en) * | 2000-01-13 | 2001-10-09 | Meir Feder | Method and system for multimedia communication control |
CN101035277A (zh) * | 2000-03-13 | 2007-09-12 | 索尼公司 | 产生压缩的代码转换提示元数据的方法和设备 |
CN1197386C (zh) * | 2000-04-18 | 2005-04-13 | 皇家菲利浦电子有限公司 | 联合比特率转码中的比特率分配 |
US7168069B1 (en) | 2000-07-12 | 2007-01-23 | Stmicroelectronics, Inc. | Dynamic generation of multimedia code for image processing |
US6754270B1 (en) | 2000-09-29 | 2004-06-22 | Lucent Technologies, Inc. | Encoding high-definition video using overlapping panels |
US6407680B1 (en) * | 2000-12-22 | 2002-06-18 | Generic Media, Inc. | Distributed on-demand media transcoding system and method |
US7266148B2 (en) * | 2001-01-05 | 2007-09-04 | Lg Electronics Inc. | Video transcoding apparatus |
EP1231794A1 (en) * | 2001-02-09 | 2002-08-14 | STMicroelectronics S.r.l. | A process for changing the resolution of MPEG bitstreams, a system and a computer program product therefor |
DE10119214A1 (de) * | 2001-04-19 | 2002-10-24 | Highlight Comm Ag Pfaeffikon | Verfahren zum Komprimieren von Videodaten |
US7266150B2 (en) | 2001-07-11 | 2007-09-04 | Dolby Laboratories, Inc. | Interpolation of video compression frames |
KR100440953B1 (ko) * | 2001-08-18 | 2004-07-21 | 삼성전자주식회사 | 영상 압축 비트 스트림의 트랜스코딩 방법 |
US7236529B2 (en) * | 2001-10-30 | 2007-06-26 | Industrial Technology Research Institute | Methods and systems for video transcoding in DCT domain with low complexity |
KR100460950B1 (ko) * | 2001-12-18 | 2004-12-09 | 삼성전자주식회사 | 트랜스코더 및 트랜스코딩 방법 |
US7216295B2 (en) * | 2001-12-20 | 2007-05-08 | Canon Kabushiki Kaisha | Method of automatic production of image presentations |
US7236521B2 (en) * | 2002-03-27 | 2007-06-26 | Scientific-Atlanta, Inc. | Digital stream transcoder |
US7295610B2 (en) * | 2002-03-27 | 2007-11-13 | Scientific-Atlanta, Inc. | Hybrid rate control in a digital stream transcoder |
US7190723B2 (en) * | 2002-03-27 | 2007-03-13 | Scientific-Atlanta, Inc. | Digital stream transcoder with a hybrid-rate controller |
JP4193406B2 (ja) * | 2002-04-16 | 2008-12-10 | 三菱電機株式会社 | 映像データ変換装置および映像データ変換方法 |
US7362374B2 (en) * | 2002-08-30 | 2008-04-22 | Altera Corporation | Video interlacing using object motion estimation |
US7636481B2 (en) * | 2002-10-09 | 2009-12-22 | Sony Corporation | Image processing apparatus, method, storage medium, and program for compressing an input image using a motion vector that is detected based on stored position information of pixels |
JP4003128B2 (ja) * | 2002-12-24 | 2007-11-07 | ソニー株式会社 | 画像データ処理装置および方法、記録媒体、並びにプログラム |
EP1455534A1 (en) * | 2003-03-03 | 2004-09-08 | Thomson Licensing S.A. | Scalable encoding and decoding of interlaced digital video data |
US6993073B2 (en) * | 2003-03-26 | 2006-01-31 | James Foong | Optimization software module and method for video compression under MPEG |
US7457438B2 (en) * | 2003-12-23 | 2008-11-25 | Genesis Microchip Inc. | Robust camera pan vector estimation using iterative center of mass |
KR101196429B1 (ko) * | 2004-03-12 | 2012-11-01 | 삼성전자주식회사 | 동영상 트랜스코딩 방법 및 그 장치, 이에 사용되는움직임 벡터 보간방법 |
US7965774B2 (en) * | 2006-01-06 | 2011-06-21 | International Business Machines Corporation | Method for visual signal extrapolation or interpolation |
US7916791B2 (en) * | 2006-06-16 | 2011-03-29 | International Business Machines Corporation | Method and system for non-linear motion estimation |
US8250618B2 (en) | 2006-09-18 | 2012-08-21 | Elemental Technologies, Inc. | Real-time network adaptive digital video encoding/decoding |
FR2908585B1 (fr) * | 2006-11-15 | 2008-12-26 | Canon Kk | Procede et dispositif de transmission de donnees video. |
US8494053B2 (en) * | 2007-01-03 | 2013-07-23 | International Business Machines Corporation | Method and apparatus of temporal filtering for side information interpolation and extrapolation in Wyner-Ziv video compression systems |
US8233527B2 (en) | 2007-05-11 | 2012-07-31 | Advanced Micro Devices, Inc. | Software video transcoder with GPU acceleration |
US8861591B2 (en) * | 2007-05-11 | 2014-10-14 | Advanced Micro Devices, Inc. | Software video encoder with GPU acceleration |
US8184715B1 (en) | 2007-08-09 | 2012-05-22 | Elemental Technologies, Inc. | Method for efficiently executing video encoding operations on stream processor architectures |
US8121197B2 (en) | 2007-11-13 | 2012-02-21 | Elemental Technologies, Inc. | Video encoding and decoding using parallel processors |
EP2061248A1 (en) * | 2007-11-13 | 2009-05-20 | IBBT vzw | Motion estimation and compensation process and device |
JP4296218B1 (ja) * | 2008-02-21 | 2009-07-15 | シャープ株式会社 | 映像表示装置 |
JP5306485B2 (ja) * | 2010-02-09 | 2013-10-02 | 日本電信電話株式会社 | 動きベクトル予測符号化方法、動きベクトル予測復号方法、動画像符号化装置、動画像復号装置およびそれらのプログラム |
US9497481B2 (en) | 2010-02-09 | 2016-11-15 | Nippon Telegraph And Telephone Corporation | Motion vector predictive encoding method, motion vector predictive decoding method, moving picture encoding apparatus, moving picture decoding apparatus, and programs thereof |
US9838709B2 (en) | 2010-02-09 | 2017-12-05 | Nippon Telegraph And Telephone Corporation | Motion vector predictive encoding method, motion vector predictive decoding method, moving picture encoding apparatus, moving picture decoding apparatus, and programs thereof |
JP2014523708A (ja) * | 2011-07-01 | 2014-09-11 | モトローラ モビリティ エルエルシー | 動きベクトル予測設計の簡易化 |
US9369723B2 (en) * | 2011-07-14 | 2016-06-14 | Comcast Cable Communications, Llc | Preserving image quality in temporally compressed video streams |
EA201101158A1 (ru) * | 2011-09-01 | 2012-06-29 | Закрытое Акционерное Общество "Импульс" | Способ уменьшения шумов в видеоизображении |
RU2487489C2 (ru) * | 2011-10-18 | 2013-07-10 | Федеральное государственное автономное образовательное учреждение высшего профессионального образования "Национальный исследовательский университет "МИЭТ" | Способ поиска векторов перемещений в динамических изображениях |
KR101616010B1 (ko) | 2011-11-04 | 2016-05-17 | 구글 테크놀로지 홀딩스 엘엘씨 | 비균일 움직임 벡터 그리드에 대한 움직임 벡터 스케일링 |
US8908767B1 (en) * | 2012-02-09 | 2014-12-09 | Google Inc. | Temporal motion vector prediction |
US9172970B1 (en) | 2012-05-29 | 2015-10-27 | Google Inc. | Inter frame candidate selection for a video encoder |
US11317101B2 (en) | 2012-06-12 | 2022-04-26 | Google Inc. | Inter frame candidate selection for a video encoder |
US9485515B2 (en) | 2013-08-23 | 2016-11-01 | Google Inc. | Video coding using reference motion vectors |
US9503746B2 (en) | 2012-10-08 | 2016-11-22 | Google Inc. | Determine reference motion vectors |
US9521176B2 (en) | 2014-05-21 | 2016-12-13 | Sony Corporation | System, method, and computer program product for media publishing request processing |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3930964A1 (de) * | 1989-09-15 | 1991-03-28 | Thomson Brandt Gmbh | Fernsehuebertragungssystem |
EP0581808B1 (de) * | 1991-04-25 | 1997-12-10 | Deutsche Thomson-Brandt Gmbh | Verfahren zur kompatiblen übertragung, decodierung oder aufzeichnung von progressiv abgetasteten bildsignalen im zwischenzeilenformat |
NL9301358A (nl) * | 1993-08-04 | 1995-03-01 | Nederland Ptt | Transcodeerinrichting. |
US5537440A (en) * | 1994-01-07 | 1996-07-16 | Motorola, Inc. | Efficient transcoding device and method |
US5541852A (en) * | 1994-04-14 | 1996-07-30 | Motorola, Inc. | Device, method and system for variable bit-rate packet video communications |
US5512953A (en) * | 1994-08-09 | 1996-04-30 | At&T Corp. | Method and apparatus for conversion of compressed bit stream representation of video signal |
US5708473A (en) * | 1994-08-30 | 1998-01-13 | Hughes Aircraft Company | Two stage video film compression method and system |
JP3293369B2 (ja) * | 1994-10-12 | 2002-06-17 | ケイディーディーアイ株式会社 | 画像情報の再符号化方法及び装置 |
US5600646A (en) * | 1995-01-27 | 1997-02-04 | Videoserver, Inc. | Video teleconferencing system with digital transcoding |
WO1996025823A2 (en) * | 1995-02-15 | 1996-08-22 | Philips Electronics N.V. | Method and device for transcoding video signals |
US5530484A (en) * | 1995-05-19 | 1996-06-25 | Thomson Multimedia S.A | Image scanning format converter suitable for a high definition television system |
SE515535C2 (sv) * | 1996-10-25 | 2001-08-27 | Ericsson Telefon Ab L M | En transkoder |
-
1998
- 1998-02-20 US US09/027,140 patent/US6058143A/en not_active Expired - Lifetime
-
1999
- 1999-02-02 EP EP99905681A patent/EP1057341B1/en not_active Expired - Lifetime
- 1999-02-02 JP JP2000532980A patent/JP4514081B2/ja not_active Expired - Fee Related
- 1999-02-02 RU RU2000124089/09A patent/RU2251820C2/ru not_active IP Right Cessation
- 1999-02-02 WO PCT/US1999/002318 patent/WO1999043162A1/en active IP Right Grant
- 1999-02-02 CN CNB998041769A patent/CN1245029C/zh not_active Expired - Fee Related
- 1999-02-02 KR KR10-2000-7009136A patent/KR100515199B1/ko not_active IP Right Cessation
- 1999-02-02 BR BR9908063-0A patent/BR9908063A/pt not_active IP Right Cessation
- 1999-02-02 AU AU25787/99A patent/AU2578799A/en not_active Abandoned
- 1999-02-02 DE DE69908562T patent/DE69908562T2/de not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
BR9908063A (pt) | 2000-10-31 |
US6058143A (en) | 2000-05-02 |
RU2251820C2 (ru) | 2005-05-10 |
WO1999043162A1 (en) | 1999-08-26 |
JP4514081B2 (ja) | 2010-07-28 |
AU2578799A (en) | 1999-09-06 |
CN1293872A (zh) | 2001-05-02 |
EP1057341A1 (en) | 2000-12-06 |
EP1057341B1 (en) | 2003-06-04 |
DE69908562D1 (de) | 2003-07-10 |
DE69908562T2 (de) | 2004-04-29 |
KR20010041095A (ko) | 2001-05-15 |
JP2002504789A (ja) | 2002-02-12 |
KR100515199B1 (ko) | 2005-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1245029C (zh) | 视频序列代码转换的运动矢量外推法 | |
CN1303818C (zh) | 运动估计和/或补偿 | |
EP3075154B1 (en) | Selection of motion vector precision | |
JP4863333B2 (ja) | 高分解能静止画像を創出するための方法及び装置 | |
CN1179302C (zh) | 使用正交变换域中的块匹配进行运动估测的方法和装置 | |
JP5744168B2 (ja) | 画像復号装置 | |
US8179969B2 (en) | Method and apparatus for encoding or decoding frames of different views in multiview video using global disparity | |
US6108039A (en) | Low bandwidth, two-candidate motion estimation for interlaced video | |
US20070047649A1 (en) | Method for coding with motion compensated prediction | |
EP0863675A2 (en) | Motion estimation and compensation of video object planes for interlaced digital video | |
JP5325638B2 (ja) | 画像復号化方法 | |
KR20200096917A (ko) | 이미지 인코딩 장치, 이미지 디코딩 장치, 이미지 인코딩 방법 및 이미지 디코딩 방법 | |
JP2002543713A (ja) | デジタルビデオ用動き推定 | |
JPH07162869A (ja) | 動画像符号化装置 | |
CN1694499A (zh) | 使用自适应空间更新矢量的运动估算 | |
JP2005318620A (ja) | 適応時間予測を用いた動きベクトル検出 | |
Kim et al. | Zoom motion estimation using block-based fast local area scaling | |
JP2007251497A (ja) | 動画像符号化方法、動画像符号化装置、動画像符号化プログラム | |
US8594192B2 (en) | Image processing apparatus | |
USRE38564E1 (en) | Motion estimation and compensation of video object planes for interlaced digital video | |
JP4622077B2 (ja) | 画像処理装置及び画像処理方法 | |
KR20110134404A (ko) | 화상 데이터의 블록을 예측하는 방법, 이 방법을 실행하는 복호 장치 및 부호화 장치 | |
EP1185107A2 (en) | Process for the colour format conversion of an image sequence | |
EP1630744A1 (en) | Method and apparatus for improved encoding of video signals using additional encoder information items, and corresponding storage medium | |
JP2002199399A (ja) | 動きベクトル変換方法及び変換装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20060308 Termination date: 20170202 |