CN1494804A - 视频图像压缩方法 - Google Patents

视频图像压缩方法 Download PDF

Info

Publication number
CN1494804A
CN1494804A CNA028040589A CN02804058A CN1494804A CN 1494804 A CN1494804 A CN 1494804A CN A028040589 A CNA028040589 A CN A028040589A CN 02804058 A CN02804058 A CN 02804058A CN 1494804 A CN1494804 A CN 1494804A
Authority
CN
China
Prior art keywords
motion vector
image
reference picture
next image
depth map
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA028040589A
Other languages
English (en)
Other versions
CN1270542C (zh
Inventor
��ˡ�˹Ƥ����
埃里克·皮尔
萨米·萨利宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gamecluster Ltd Oy
Original Assignee
Gamecluster Ltd Oy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gamecluster Ltd Oy filed Critical Gamecluster Ltd Oy
Publication of CN1494804A publication Critical patent/CN1494804A/zh
Application granted granted Critical
Publication of CN1270542C publication Critical patent/CN1270542C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/223Analysis of motion using block-matching
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10028Range image; Depth image; 3D point clouds
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • H04N13/239Image signal generators using stereoscopic image cameras using two 2D image sensors having a relative position equal to or related to the interocular distance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/56Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0081Depth or disparity estimation from stereoscopic image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0085Motion estimation from stereoscopic image signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Processing Or Creating Images (AREA)

Abstract

一种压缩视频信息的方法(800,820),装置(900)和程序,所述方法包括步骤:利用摄影机参数和深度图,将下一图像的点投影(803)至三维空间;和从三维空间将投影的点,投影(805)至参考图像表面,从而获得估算下一图像与参考图像之间的变化的运动矢量。

Description

视频图像压缩方法
技术领域
本发明涉及数字视频压缩方法。这种方法特别适用于加速数字视频的压缩和/或提高结果质量。本发明更特别适用于视频材料是从三维模型合成产生的情况。
背景技术
运动视频图像由单个的静止图像组成,向观察者连续显示这些静止图像,其速度之高足以产生运动的感觉。在运动视频图像的有关信息被存储或发送时,视频压缩的目标是减少描述运动视频图像所需求的数据量。
目前,众所周知的基本上实现这个目标的所有已知的视频压缩方法,是从图像中识别和除去重复的信息。实际上这意味着识别图像之间的变化,并告知接收机如何利用先前的图像(或某个别的早先经过压缩的图像),建构下一图像。
基于先前的图像建构新的图像的一种方法,是识别图像的各部分如何在参考图像和下一图像之间运动。寻求运动参数的过程称作运动估算,它通常是基于在参考图像的邻近区域一块一块地进行的。图像一般以某种固定方式分割为若干块,但分割(即块的大小和块的安排)也可换一种方式,例如与运动估算同时进行,因而在分割时考虑所检测的运动情况。然后,使用运动矢量告知解压缩器下一图像中块的运动方向和距离。有关块分割和块的运动矢量的信息,使解压缩器能利用早先重构的参考图像,估算原来的下一图像。解压缩器的这个动作称为运动补偿,在下一图像的运动补偿估算中,模仿原来的下一图像。
运动补偿通常不会产生下一图像的精确复制,所以由图像压缩器建立对运动补偿图像的校正。压缩器一般确定校正图像,作为运动补偿图像和原来的下一图像之间的差。这个校正图像称为差图像。
在压缩器侧的运动估算,要求在二维搜索空间反复搜索。在大多数标准化视频压缩算法中,提取下一图像的块,再将它与参考图像的邻近块比较。然后,将所发现的最相似的块与被搜索的块之间的位置差,作为运动矢量。由于在反复搜索过程中要求大量操作,所以在目前的计算机或硬件视频压缩系统中,对运动矢量作周密的搜索是不切实际的。
普遍采用的视频压缩系统利用若干巧妙的技术并采取某些折衷方法,试图避免沉重的计算带来的负担。一种方法是限制进行搜索的区域,这样也就限制了能表示出来的最大运动矢量长度。另一方法是基于邻近块的运动矢量,估算块的运动矢量。但是,这些方法要在压缩过程的效率和质量方面进行妥协。
本发明的目的是建立一种视频压缩的有效方法。优选的方法能比目前已知的方法明显更有效地压缩视频,而不损害质量。
本发明的这些和其他目的,通过确定由摄影机的移动引起的运动矢量,在视频压缩中利用这些运动矢量,而达到。
根据本发明的一种方法,其特征在针对方法和独立权利要求的特征部分陈述。根据本发明的一种计算机程序,其特征在针对计算机程序的独立权利要求中陈述。根据本发明的一种压缩视频信息的装置,其特征在针对这类装置的独立权利要求的特征部分陈述。
从属权利要求描述本发明的某些优选实施例。
本发明的基本原理是,当要压缩的视频从已知的缩合模型产生时,或者能创建视频场景的深度图模型时,运动估算过程就有新的可能情况发生。
当视频场景的深度图已知时,这意味着(直觉的)有可能在三维空间确定出现在场景中的目标的位置。用更精确的术语说,在图像表面上的点被投影向三维空间。三维空间既可对应于合成的模型,也可对应于真实世界。当摄影机位置和方向的变化已知是介于参考图像与下一图像之间时,就能从摄影机的移动,并利用目标在三维空间(或投影至三维空间)的已知位置,确定下一图像的考虑摄影机的移动后的运动矢量。如果在感觉上除了摄影机的移动以外没有别的变化(即在涉及参考图像和下一图像的时间过程中,目标没有运动),那么,这些运动矢量就能精确描述与参考图像有关的下一图像。
要压缩的图像可以是真实的三维世界的图像。在这种情况下,能确定或估计目标相对于摄影机的位置,因为图像本身揭示了投影至一个平面的目标位置信息,并且,例如利用距离感测器可获得目标对摄影机的距离信息。另一种情况是视频图像可起源于合成模型。在计算机图形中,当确定一个合成模型的视图时,必须找出哪些目标是观察者能看见的,哪些则不是。一般使用z-缓冲器;待显示的每一象素的深度值(z-值)存储至z-缓冲器中,只描绘新的象素,如果它的z-值小于已在同一位置上的象素的话。z-缓冲器是视图的深度图,这种深度图一般是每当在计算机绘图中生成合成模型的视图时产生的。
涉及摄影机的移动的运动矢量可以按块确定,并在视频压缩中直接用作块的运动矢量。换句话说,涉及摄影机的移动的运动矢量可用作初始值,而更精确的块运动矢量,可通过例如搜索邻近摄影机的移动的运动矢量所指区域中的相似块来确定。
除了确定下一图像中的块的运动矢量以外,也能确定下一图像的运动矢量场。运动矢量场一般涉及运动矢量信息,它有比块更精细的尺度。运动矢量场通常在象素尺度上描述运动。运动矢量场可直接在象素水平上确定,类似于对块的处理。这是简单明了的,因为深度图一般确定下一图像的距离信息。另一种方法,能在块水平上确定运动矢量场,利用这些块特定运动矢量场内插象素特定运动矢量场。
运动矢量场可用作参考图像扭曲场。这表示当形成下一图像的运动补偿估算时,除了参考图像部分的平面转换外,也能收缩/扩展和/或旋转参考图像的部分。在运动补偿中利用运动矢量场,要求解压缩器能从它所接收的信息生成运动矢量场,并根据参考图像扭曲参考图像。解压缩器可使用例如内插方法,它是解压缩器在在被压缩的信息流开始时指定的,或者换一种方法,压缩器和解压缩器可协商由它们双方支持的内插方法。在压缩图像序列时,一般不需要改变内插方法,但在解压缩器被告知新的内插方法时,也可以这样做。
为了图像重构的精确度,压缩器一般不用较早的图像作为参考图像。一般来说,压缩器使用对解压缩器有用的相同信息重构参考图像。重构的参考图像以后用于确定运动估算和校正图像。下面详细描述本发明,术语参考图像既可以是较早的原始图像本身,也可以是较早图像的重构,取决于图像压缩的细节。
附图说明
通过附图中的示例,对本发明加以说明,附图中:
图1a示出想像的视频图像;
图1b示出与图1a的图像有关的深度图;
图2a示出同样场景的新图像,其时摄影机已移动;
图2b示出新的视频图像的深度图;
图3示出图1a和2a的视频图像的摄影机位置;
图4示出利用深度图信息,从能反向投影的视频图像中的一个点向三维空间投影时的几何关系;
图5示出在摄影机固定的情况下,应用本发明于已知的计算机游戏的情形;
图6示出摄影机近似直线地向前移动时的情形;
图7示出摄影机从右向左旋转时的情形;
图8a,8b,8c示出根据本发明的一个实施例的方法流程图;和
图9示出根据本发明的又一实施例的视频压缩器。
具体实施方式
下面参考图1-4说明本发明。
根据本发明的方法要求下列数据以便从参考图像和下一压缩图像着手:实际图像和图像的摄影机参数。与下一图像相应的深度图也是需要的。深度图一般是二维阵列数据,它描述实际图像的各象素中的可视目标离摄影机有多远。
图1a和2a表示例如两个视频图像:在图1a中表示的视频图像I0,在图2a中表示的视频图像I1。图像I0和I1涉及同一场景,但对于图I0和I1来说,摄影机观察场景的位置和方向是不同的。
图像的摄影机参数定义摄影机位置、摄影机方向和摄影机观察距离。摄影机位置K一般表示三维空间中的点(或指向这个位置的矢量)。摄影机方向一般以三个摄影机方向矢量Kx、Ky和Kz表示。观察距离Dv是摄影机离图像平面的距离。图4示出这些摄影机参数K、Kx、Ky、Kz和Dv。
图像平面中的点的x和y坐标一般定义为图像平面上的点的距离(在方向矢量Kx和Ky定义的方向上),那里,由矢量Kz定义的方向直交于图像表面;这个交点一般是图象的中心点。图4示出坐标x的上述定义;在图4中坐标以x1标记,图4涉及图像I1。
图1b和2b示出图像I0和I1的深度图:灰色暗影越深,从摄影机至图像的那个点上目标的距离越远。深度图Z确定在矢量Kz方向上从摄影机至目标O的距离。图4表示如何利用x1、y1、Z1(x1、y1)和图像I1的摄影机参数,确定图I1点(x1、y1)上的目标O在三维空间中的位置。换句话说,图4示出图像表面的点(x1、y1)向三维空间P’的点投影。
当图像是从合成模型生成的视图时,深度图Z通常生成作为图像创建过程的副产品,如上面所讨论的。当图像是真实世界的图像时,能用例如距离感测器确立深度图。
下面作为一个例子,我们来考虑一种情况,即图1a中的视频图像I0起图2a所示视频图像I1的参考图像的作用。再有,作为一个例子,我们来考虑图像I0和I1中包括人的头部的图像块。
为了计算研究中的块的运动矢量的有效近似,我们要找出象素p1(图2a)曾在参考图像I0中的什么地方,假定图像I0和I1之间的所有变化都是由摄影机参数的变化引起的。这个先前的位置称为p0(图1a)。为寻求p0(x0和y0)的x和y分量,首先利用图像I1的摄影机参数,将图像点p1反向投影至三维空间P’,然后再利用参考图像的摄影机参数,将三维空间的点投影至参考图像I0的表面。两个图像中的点的位置差(通常定义为带符号的差(p0-p1)是用于视频压缩中的运动矢量。
从图像表面I至三维空间的投影,用下列公式进行:
P ′ = K + x * Z ( x , y ) Dv * K ‾ x + y * Z ( x , y ) Dv * K ‾ y + Z ( x , y ) * K ‾ z
这里,x和y是图像表面上的点的坐标,Z(x,y)是点(x,y)的深度图值。从三维空间至图像表面的投影,可用从上面的公式解x,y和Z(x,y)的所得的公式进行。这两个公式是三维计算机绘图的已知基本公式。坐标、摄影机参数和深度图可用与上述稍有不同的方法定义,但技术人员显然明白,要相应地修改投影公式。
这个计算运动矢量的方法,考虑所有由摄影机参数中的变化引起的视频图像中的变化。不考虑摄影机所看到的场景中的可能变化时,首先可利用下一图像的摄影机参数将下一图像的象素/块投影至三维空间,然后利用参考图像的摄影机参数再投影到参考图像的表面。下面,我们将涉及下一图像中某一目标的点记为p1,而参考图像中的则记为pref。但是,当下一图像被压缩时,pref的值一般是未知的,运动补偿的目标正是要确定pref的估算。
我们把下一图像点p1的一次投影记为p1’(这是三维空间的一个点),再次投影的点记为p1”(这是参考图像表面上的点(x1”,y1”),它有深度值z1”)。如果p1和p1”所在区域中的视频图像的变化只是由摄影机参数中的变化引起的,那么p1”等于或接近于pref。图1-3说明这种情况。估算p”是否等于或接近于pref的一种可能的方法,是将深度值z1与参考图像深度图的值Z0(x1”,y1”)进行比较。如果图像中的变化是由摄影机参数的变化引起的,这些值就能紧密相符合。在这种情况下,一般不需要为p1寻求比p1”-p1更精确的运动矢量。
如果摄影机所看到的场景发生变化,像上述那样再次投影下一图像的点,在图像的那些区域给出的就是不精确的运动矢量。在计算上便宜的、估算是否可能需要确定更精确的运动矢量的方法,是将深度值z1”与深度值Z0(x1”,y1”)比较。如果这个比较不产生紧密相符,那么更精确的运动补偿矢量可用常规搜索方法确定。值p1”-p1可用作这些常规的运动矢量搜索方法的初始值。在标准的视频压缩方法中,运动矢量通常不单独就每一象素来计算,而是以固定尺寸例如8×8或16×16象素的块代替。由于这个原因,本发明的投影方法也更适用于这类块,以节省计算工作量。通过例如对块内的深度值取平均,并用平均深度值和块的中心x和y坐标作为投影的点坐标,就能这样做。
图5,6和7各表示用这种投影方法,就已知的计算机游戏的视频帧计算而得的运动矢量场。在这个计算机游戏中,虚拟的摄影机附接在武器上,并可随游戏者的意愿在周围移动和旋转。在些图表示游戏的视频帧被划分为若干块,并在运动估算过程中使用。图5-7表示游戏的视频帧,视频帧被划分为块。
在图5中,摄影机是稳定的,因而用投影方法计算的运动矢量不出现。图6表示游戏者向前运动的情形,图7表示游戏者从右向左旋转的情形。如从图5-7可看出的,用所述投影方法产生的运动矢量给出更为直觉的运动视图。
代替用作基于块的视频压缩的输入数据。用所述投影方法计算的运动矢量能换个用法:用作参考图像扭曲场。一般来说,参考图像中的每一象素的运动矢量,通过基于块的矢量场的(例如双直线的)内插来计算。另一种方法,通过逐个象素地对象素投影,也能产生运动矢量场。用这种方法,要求连同压缩数据一起,传输/存储描述运动矢量场的信息。如果在图像压缩和图像解压缩两者进行参考图像扭曲,实际图像压缩算法部分应该校正扭曲的参考图像与下一图像之间的差。
使用扭曲方法对压缩比和视图质量是有利的,因为它扩展了能以运动矢量表示的操作形态。当正常的基于块的视频压缩时,仅有的能用来从参考图像建构下一图像的操作是转化的块复制,扭曲方法正确地再现由摄影机的移动引起的图像的定标和旋转。以常用的反复搜索方法寻求旋转和定标参数,会使视频压缩在计算上花费过高,因为它们实际上将两个新维度加到搜索空间。
作为两个例子,图8示出根据本发明两个实施例的视频压缩方法800和820的流程图。在步骤801中,获得下一图像并建立有关下一图像摄影机参数的信息,在步骤802中,建立有关下一图像深度图的信息。在步骤803中,利用摄影机参数和下一图像的深度图将下一图像的块投影至三维空间。在步骤804中,建立有关参考图像摄影机参数的信息,以及在步骤805中,已投影至三维空间的点被投影至参考图像表面。
在步骤806中,如上所述,利用投影结果确定运动矢量。在步骤807中,确定涉及摄影机参数的运动矢量是否足够精确。如上所论,通过将参考图像深度图值Z0(x1”,y1”)与二次投影的图像点p1”的深度值z1进行比较,可实现这一步骤。一般是为差值确定一个阈值,如果深度值彼此充分接近,就不需要更精确的运动矢量。在步骤808中,如果需要,就用涉及摄影机参数的运动矢量作为初始值,搜索更精确的运动矢量;这里,任何搜索运动补偿矢量的方法都是可使用的。搜索最好只在运动矢量不够精确的图像区域中进行。
图8b表示如何继续执行视频压缩方法800。在这种方法中,以图像压缩中的常规途径运用运动矢量。在步骤809中,利用运动矢量进行有关下一图像的运动补偿估算。然后,在步骤810中,利用下一图像和运动补偿估算,确定差图像。在步骤811中,发送和/或存储描述运动矢量的信息,以便进一步应用。在步骤812中,发送和/或存储描述差图像的信息。在步骤813中,利用所发送/存储的信息生成新参考图像;新的参考图像可涉及每一压缩图像而生成,或者,同一参考图像可用于若干压缩图像。此后,方法800从步骤801继续。
图8c表示如何继续执行方法820。在方法820中,步骤821确定运动矢量场。如上论,确定运动矢量场的一种可能途径是从块特定的运动矢量内插象素特定的值。在步骤822中,用运动矢量场作为扭曲场确定下一图像的运动补偿估算。然后类似于方法800,继续执行方法820。
在新的图像材料进入视图的图像边缘,运动补偿估算是不精确的。当按照现在的方法计算的运动矢量指向参考图像外部时,可观察到这种情况。但是,差图像处理运动补偿估算中的不精确性也是这种情况。
作为一个例子,图9简要示出根据本发明一个实施例的视频压缩器900。视频压缩器有存储参考图像的装置901,接收下一图像的装置902,和确定用来估计下一图像和参考图像之间变化的运动矢量的装置903。它还包括建立有关下一图像深度图和摄影机参数的信息的装置904,和存储参考图像的摄影机参数的装置905。装置904可安排例如从距离感测器接收距离信息,或者从三维显示控制器的存储器接收/获取信息。确定运动矢量估算的装置903安排计算下一图像的点向三维空间的投影,和三维空间的点向参考图像的投影。
视频压缩器还可包括存储有关参考图像深度图的信息的装置(可利用与存储摄影机参数用的存储装置905同样的存储装置实现),和估算运动矢量精度的装置906。估算运动矢量精度的装置可安排在需要时以常规搜索方法确定更精确运动矢量。
视频压缩器一般还包括建立下一图像运动补偿估算的装置907,和确定下一图像和运动补偿估算之间的差图像的装置908。建立下一图像运动补偿估算的装置907可安排使用运动矢量,或换一种方式,可安排建构运动矢量场的按照运动矢量场对参考图像进行扭曲。
进一步,它一般还包括发送/存储描述运动矢量和差图像的信息的装置909。利用所发送/存储的信息建构新的参考图像的装置910,一般也是视频压缩器的组成部分。
根据本发明的装置或计算机程序,可安排按照根据本发明的任何方法运作。
所述方法开辟了压缩的视频应用的新的可能性,因为常规的运动补偿视频压缩通常要求的处理器和其他资源限制了实时视频压缩对设备的要求。实时压缩视频流所需要的计算的能力,现在可以用来提高结果的质量,同时压缩多路视频流,或者,在适当的地方与图像压缩同时完成其他任务。
从前面的描述看来,很显然,对技术人员来说,在本发明的范围内可以做出各种修改。尽管本发明的一些优选实施例已详细描述过,但明显的是,对它们的许多修改和变形是可能的,所有这些修改和变形都在所附独立权利要求规定的本发明的范围之内。

Claims (11)

1.一种压缩视频信息的方法(800,820),其特征在于:
所述方法包括步骤:
利用摄影机参数和深度图,将下一图像的点投影(803)至三维空间;和
从三维空间将投影的点,投影(805)至参考图像表面,从而获得估算下一图像与参考图像之间的变化的运动矢量。
2.根据权利要求1所述的方法,其特征在于:
从保存在计算机显示控制器的存储器中的深度图,或通过测量至实际目标的距离,获得深度图。
3.根据权利要求1或2所述的方法,其特征在于:
所述方法进一步包括步骤:
—通过将投影至三维空间的点的深度值与投影至参考图像表面的点的深度图进行比较,估算(807)所得到的运动矢量的精确度。
4.根据前面的任何权利要求之一的方法,其特征在于:
这样得到的运动矢量用作图像压缩运动矢量,或者所得到的运动矢量用作图像压缩运动矢量搜索(808)用的初始值,这取决于所得到的运动矢量的估算精确度。
5.根据前面的任何权利要求之一的方法,其特征在于:
所述方法包括步骤:
利用所得到的和/或所搜索到的运动矢量,确定(821)下一图像的运动矢量场;和
用运动矢量场作为参考图像的扭曲场,确定(822)下一图像的运动补偿估算。
6.根据前面的任何权利要求之一的方法,其特征在于:
确定固定尺寸图像块的运动矢量,并且,对每一块,只确定一个运动矢量。
7.根据权利要求6所述的方法,其特征在于:
利用深度图,对每一图像块确定一个平均深度,并且,块的中心点是投影的点。
8.一种计算机程序,包括计算机程序代码装置,当所述程序在计算机上运行时,所述代码装置适用于执行权利要求1的全部步骤。
9.如权利要求8中所述的计算机程序,配备在计算机可读介质上。
10.一种用于视频信息的运动补偿压缩的设备(900),包括:
—用于存储参考图像的装置(901);
—用于接收下一图像的装置(902);和
—用于确定估算下一图像与参考图像之间的变化的运动矢量的装置(903),
其特征在于:所述设备进一步包括:
—用于建立有关下一图像的深度图和摄影机参数的信息的装置(904);和
—用于存储有关参考图像的摄影机参数的信息的装置(906),
并且,用于确定运动矢量估算的装置(903),被安排利用下一图像的深度图和摄影机参数,计算下一图像的点至三维空间的投影,和利用参考图像的摄影机参数,计算三维空间中的点至参考图像的投影。
11.根据权利要求10所述的设备,其特征在于:
所述设备进一步包括:
—用于存储有关参考图像深度图的信息的装置(906);和
—用于估算运动矢量的精确度的装置(905)。
CNB028040589A 2001-01-24 2002-01-23 视频图像压缩方法 Expired - Lifetime CN1270542C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI20010143 2001-01-24
FI20010143A FI109633B (fi) 2001-01-24 2001-01-24 Menetelmä videokuvan pakkauksen nopeuttamiseksi ja/tai sen laadun parantamiseksi

Publications (2)

Publication Number Publication Date
CN1494804A true CN1494804A (zh) 2004-05-05
CN1270542C CN1270542C (zh) 2006-08-16

Family

ID=8560113

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB028040589A Expired - Lifetime CN1270542C (zh) 2001-01-24 2002-01-23 视频图像压缩方法

Country Status (8)

Country Link
US (1) US7894525B2 (zh)
EP (1) EP1364535B1 (zh)
JP (1) JP4004408B2 (zh)
KR (1) KR100879324B1 (zh)
CN (1) CN1270542C (zh)
ES (1) ES2729193T3 (zh)
FI (1) FI109633B (zh)
WO (1) WO2002060183A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101374242B (zh) * 2008-07-29 2010-06-02 宁波大学 一种应用于3dtv与ftv系统的深度图编码压缩方法
CN101374243B (zh) * 2008-07-29 2010-06-23 宁波大学 一种应用于3dtv与ftv系统的深度图编码压缩方法
CN102263958A (zh) * 2011-07-26 2011-11-30 中兴通讯股份有限公司 基于h264运动估计算法的初始点获取方法及装置
CN102821275A (zh) * 2011-06-08 2012-12-12 中兴通讯股份有限公司 数据压缩方法及装置、数据解压缩方法及装置
CN103108183A (zh) * 2013-02-01 2013-05-15 中国科学技术大学 一种三维视频中Skip和Direct模式运动矢量的预测方法
CN103329526A (zh) * 2011-08-17 2013-09-25 史克威尔·艾尼克斯控股公司 运动图像分配服务器、运动图像再现设备、控制方法、程序和记录介质
WO2014048242A1 (zh) * 2012-09-29 2014-04-03 中兴通讯股份有限公司 预测图像生成方法和装置
CN104410791A (zh) * 2008-03-25 2015-03-11 奥林巴斯映像株式会社 图像数据生成装置、图像数据生成方法
CN106651921A (zh) * 2016-11-23 2017-05-10 中国科学院自动化研究所 运动检测方法及躲避和跟踪运动目标的方法

Families Citing this family (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6075441A (en) 1996-09-05 2000-06-13 Key-Trak, Inc. Inventoriable-object control and tracking system
AU2003208477A1 (en) 2002-03-01 2003-09-16 T5 Labs Ltd Centralised interactive graphical application server
US9314691B2 (en) 2002-12-10 2016-04-19 Sony Computer Entertainment America Llc System and method for compressing video frames or portions thereof based on feedback information from a client device
US9192859B2 (en) 2002-12-10 2015-11-24 Sony Computer Entertainment America Llc System and method for compressing video based on latency measurements and other feedback
US9138644B2 (en) 2002-12-10 2015-09-22 Sony Computer Entertainment America Llc System and method for accelerated machine switching
US9446305B2 (en) 2002-12-10 2016-09-20 Sony Interactive Entertainment America Llc System and method for improving the graphics performance of hosted applications
US20090118019A1 (en) 2002-12-10 2009-05-07 Onlive, Inc. System for streaming databases serving real-time applications used through streaming interactive video
US9077991B2 (en) 2002-12-10 2015-07-07 Sony Computer Entertainment America Llc System and method for utilizing forward error correction with video compression
US8964830B2 (en) 2002-12-10 2015-02-24 Ol2, Inc. System and method for multi-stream video compression using multiple encoding formats
US8711923B2 (en) 2002-12-10 2014-04-29 Ol2, Inc. System and method for selecting a video encoding format based on feedback data
US9061207B2 (en) 2002-12-10 2015-06-23 Sony Computer Entertainment America Llc Temporary decoder apparatus and method
US9108107B2 (en) 2002-12-10 2015-08-18 Sony Computer Entertainment America Llc Hosting and broadcasting virtual events using streaming interactive video
US10201760B2 (en) 2002-12-10 2019-02-12 Sony Interactive Entertainment America Llc System and method for compressing video based on detected intraframe motion
US7148861B2 (en) * 2003-03-01 2006-12-12 The Boeing Company Systems and methods for providing enhanced vision imaging with decreased latency
US7619626B2 (en) * 2003-03-01 2009-11-17 The Boeing Company Mapping images from one or more sources into an image for display
US7983835B2 (en) 2004-11-03 2011-07-19 Lagassey Paul J Modular intelligent transportation system
JP4751893B2 (ja) * 2005-01-27 2011-08-17 トムソン ライセンシング エッジベースの自動cmyピクチャレジストレーション
US7925391B2 (en) * 2005-06-02 2011-04-12 The Boeing Company Systems and methods for remote display of an enhanced image
EP1955553A2 (en) * 2005-11-23 2008-08-13 Koninklijke Philips Electronics N.V. Rendering views for a multi-view display device
US7916141B2 (en) * 2006-04-10 2011-03-29 Choi Kum-Young Image processing system using vector pixel
US8970680B2 (en) 2006-08-01 2015-03-03 Qualcomm Incorporated Real-time capturing and generating stereo images and videos with a monoscopic low power mobile device
US8888592B1 (en) 2009-06-01 2014-11-18 Sony Computer Entertainment America Llc Voice overlay
JP4931223B2 (ja) * 2007-03-30 2012-05-16 株式会社バンダイナムコゲームス 動きベクトル探索プログラム、情報記憶媒体、動きベクトル探索装置、及び、ネットワークシステム
US8049658B1 (en) * 2007-05-25 2011-11-01 Lockheed Martin Corporation Determination of the three-dimensional location of a target viewed by a camera
WO2009011657A1 (en) * 2007-07-18 2009-01-22 Nanyang Technological University Methods of providing graphics data and displaying graphics data
CN101822067B (zh) * 2007-07-26 2013-04-24 皇家飞利浦电子股份有限公司 深度相关信息传播方法和设备
US9168457B2 (en) 2010-09-14 2015-10-27 Sony Computer Entertainment America Llc System and method for retaining system state
US8147339B1 (en) 2007-12-15 2012-04-03 Gaikai Inc. Systems and methods of serving game video
US8968087B1 (en) 2009-06-01 2015-03-03 Sony Computer Entertainment America Llc Video game overlay
US8613673B2 (en) 2008-12-15 2013-12-24 Sony Computer Entertainment America Llc Intelligent game loading
TWI362628B (en) * 2007-12-28 2012-04-21 Ind Tech Res Inst Methof for producing an image with depth by using 2d image
JP5039921B2 (ja) * 2008-01-30 2012-10-03 インターナショナル・ビジネス・マシーンズ・コーポレーション 圧縮システム、プログラムおよび方法
BRPI0911447A2 (pt) * 2008-04-25 2018-03-20 Thomson Licensing codificação de sinal de profundidade
KR20100000671A (ko) * 2008-06-25 2010-01-06 삼성전자주식회사 영상 처리 방법
EP2329653B1 (en) 2008-08-20 2014-10-29 Thomson Licensing Refined depth map
US20100073491A1 (en) * 2008-09-22 2010-03-25 Anthony Huggett Dual buffer system for image processing
US8926435B2 (en) 2008-12-15 2015-01-06 Sony Computer Entertainment America Llc Dual-mode program execution
CN102272778B (zh) 2009-01-07 2015-05-20 汤姆森特许公司 联合深度估计
US9723319B1 (en) 2009-06-01 2017-08-01 Sony Interactive Entertainment America Llc Differentiation for achieving buffered decoding and bufferless decoding
US11013995B2 (en) * 2009-06-01 2021-05-25 Sony Interactive Entertainment LLC Qualified video delivery methods
JP5293463B2 (ja) * 2009-07-09 2013-09-18 ソニー株式会社 画像処理装置、画像処理方法およびプログラム
KR101660312B1 (ko) * 2009-09-22 2016-09-27 삼성전자주식회사 3차원 비디오의 움직임 탐색 장치 및 방법
GB2480422B (en) * 2010-02-25 2014-07-09 Imagination Tech Ltd Object tracking using graphics engine derived vectors in a motion estimation system
US20110242271A1 (en) * 2010-03-31 2011-10-06 Google Inc. Synthesizing Panoramic Three-Dimensional Images
KR20120000485A (ko) * 2010-06-25 2012-01-02 삼성전자주식회사 예측 모드를 이용한 깊이 영상 부호화 장치 및 방법
US8676591B1 (en) 2010-08-02 2014-03-18 Sony Computer Entertainment America Llc Audio deceleration
KR20170129967A (ko) 2010-09-13 2017-11-27 소니 인터랙티브 엔터테인먼트 아메리카 엘엘씨 게임 서버를 포함하는 컴퓨터 게임 시스템에서 통신 네트워크를 통해 클라이언트들 간에 게임 세션을 이송하는 방법
KR102000618B1 (ko) 2010-09-13 2019-10-21 소니 인터랙티브 엔터테인먼트 아메리카 엘엘씨 부가기능의 관리
KR101682137B1 (ko) * 2010-10-25 2016-12-05 삼성전자주식회사 텍스처 및 움직임 감지를 사용한 시간적으로-일관된 변이 추정을 위한 방법 및 장치
CN103907346B (zh) * 2011-10-11 2017-05-24 联发科技股份有限公司 运动矢量预测子及视差矢量导出方法及其装置
JP5307958B1 (ja) 2012-02-23 2013-10-02 株式会社スクウェア・エニックス・ホールディングス 動画配信サーバ、動画再生装置、制御方法、プログラム、及び記録媒体
KR20150003406A (ko) 2012-04-12 2015-01-08 가부시키가이샤 스퀘어.에닉스.홀딩스 동화상 배포 서버, 동화상 재생 장치, 제어 방법, 기록 매체, 및 동화상 배포 시스템
US8948497B2 (en) * 2012-09-04 2015-02-03 Digital Signal Corporation System and method for increasing resolution of images obtained from a three-dimensional measurement system
US9984504B2 (en) * 2012-10-01 2018-05-29 Nvidia Corporation System and method for improving video encoding using content information
US10237563B2 (en) 2012-12-11 2019-03-19 Nvidia Corporation System and method for controlling video encoding using content information
US10242462B2 (en) 2013-04-02 2019-03-26 Nvidia Corporation Rate control bit allocation for video streaming based on an attention area of a gamer
KR101632992B1 (ko) * 2014-07-03 2016-06-30 성균관대학교산학협력단 깊이 와핑에 기반한 폐색 컬링을 위한 방법, 장치 및 컴퓨터 판독 가능한 기록 매체
US9948920B2 (en) 2015-02-27 2018-04-17 Qualcomm Incorporated Systems and methods for error correction in structured light
US10068338B2 (en) 2015-03-12 2018-09-04 Qualcomm Incorporated Active sensing spatial resolution improvement through multiple receivers and code reuse
US9530215B2 (en) 2015-03-20 2016-12-27 Qualcomm Incorporated Systems and methods for enhanced depth map retrieval for moving objects using active sensing technology
US9635339B2 (en) 2015-08-14 2017-04-25 Qualcomm Incorporated Memory-efficient coded light error correction
US9846943B2 (en) 2015-08-31 2017-12-19 Qualcomm Incorporated Code domain power control for structured light
US10764561B1 (en) 2016-04-04 2020-09-01 Compound Eye Inc Passive stereo depth sensing
US10356417B2 (en) * 2016-09-30 2019-07-16 Intel Corporation Method and system of video coding using projected motion vectors
KR101866106B1 (ko) * 2016-12-30 2018-06-08 동의대학교 산학협력단 깊이 영상의 프레임간의 평면 예측 방법 및 평면 예측 장치
US10499054B2 (en) 2017-10-12 2019-12-03 Mitsubishi Electric Research Laboratories, Inc. System and method for inter-frame predictive compression for point clouds
US11030478B1 (en) 2019-11-27 2021-06-08 Compound Eye, Inc. System and method for correspondence map determination
WO2021150779A1 (en) 2020-01-21 2021-07-29 Compound Eye Inc. System and method for egomotion estimation
US11270467B2 (en) 2020-01-21 2022-03-08 Compound Eye, Inc. System and method for camera calibration
US11833419B2 (en) * 2020-03-16 2023-12-05 Tencent America LLC Method and apparatus for cloud gaming
US12063389B2 (en) * 2022-11-10 2024-08-13 Rovi Guides, Inc. 3D prediction method for video coding
WO2024126279A1 (en) * 2022-12-12 2024-06-20 Interdigital Ce Patent Holdings, Sas A coding method or apparatus based on an indication of camera motion information
WO2024200466A1 (en) * 2023-03-28 2024-10-03 Interdigital Ce Patent Holdings, Sas A coding method or apparatus based on camera motion information

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5259040A (en) * 1991-10-04 1993-11-02 David Sarnoff Research Center, Inc. Method for determining sensor motion and scene structure and image processing system therefor
US5511153A (en) * 1994-01-18 1996-04-23 Massachusetts Institute Of Technology Method and apparatus for three-dimensional, textured models from plural video images
JPH07287775A (ja) 1994-04-19 1995-10-31 Nippon Telegr & Teleph Corp <Ntt> 3次元映像表示方法および装置
FR2724033B1 (fr) * 1994-08-30 1997-01-03 Thomson Broadband Systems Procede de generation d'image de synthese
US5617334A (en) * 1995-07-21 1997-04-01 The Trustees Of Columbia University In The City Of New York Multi-viewpoint digital video coder/decoder and method
JP3231618B2 (ja) * 1996-04-23 2001-11-26 日本電気株式会社 3次元画像符号化復号方式
JP3797498B2 (ja) 1996-06-11 2006-07-19 ソニー株式会社 メモリ制御装置およびメモリ制御方法、並びに画像生成装置
US5847776A (en) * 1996-06-24 1998-12-08 Vdonet Corporation Ltd. Method for entropy constrained motion estimation and coding of motion vectors with increased search range
US6055330A (en) * 1996-10-09 2000-04-25 The Trustees Of Columbia University In The City Of New York Methods and apparatus for performing digital image and video segmentation and compression using 3-D depth information
US5784115A (en) * 1996-12-31 1998-07-21 Xerox Corporation System and method for motion compensated de-interlacing of video frames
JP3802653B2 (ja) * 1997-05-21 2006-07-26 オリンパス株式会社 立体画像表示装置
EP0928460B1 (en) * 1997-07-29 2003-01-29 Philips Electronics N.V. Method of reconstruction of tridimensional scenes and corresponding reconstruction device and decoding system
US5986668A (en) * 1997-08-01 1999-11-16 Microsoft Corporation Deghosting method and apparatus for construction of image mosaics
GB9913687D0 (en) * 1999-06-11 1999-08-11 Canon Kk Image processing apparatus
US6556704B1 (en) * 1999-08-25 2003-04-29 Eastman Kodak Company Method for forming a depth image from digital image data
FR2798761B1 (fr) 1999-09-17 2002-03-29 Thomson Multimedia Sa Procede de construction d'un modele de scene 3d par analyse de sequence d'images
US6664962B1 (en) * 2000-08-23 2003-12-16 Nintendo Co., Ltd. Shadow mapping in a low cost graphics system

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104410791A (zh) * 2008-03-25 2015-03-11 奥林巴斯映像株式会社 图像数据生成装置、图像数据生成方法
CN104410791B (zh) * 2008-03-25 2018-08-03 奥林巴斯株式会社 图像数据生成装置、图像数据生成方法
CN101374243B (zh) * 2008-07-29 2010-06-23 宁波大学 一种应用于3dtv与ftv系统的深度图编码压缩方法
CN101374242B (zh) * 2008-07-29 2010-06-02 宁波大学 一种应用于3dtv与ftv系统的深度图编码压缩方法
CN102821275A (zh) * 2011-06-08 2012-12-12 中兴通讯股份有限公司 数据压缩方法及装置、数据解压缩方法及装置
CN102821275B (zh) * 2011-06-08 2017-08-08 南京中兴软件有限责任公司 数据压缩方法及装置、数据解压缩方法及装置
CN102263958A (zh) * 2011-07-26 2011-11-30 中兴通讯股份有限公司 基于h264运动估计算法的初始点获取方法及装置
CN103329526A (zh) * 2011-08-17 2013-09-25 史克威尔·艾尼克斯控股公司 运动图像分配服务器、运动图像再现设备、控制方法、程序和记录介质
WO2014048242A1 (zh) * 2012-09-29 2014-04-03 中兴通讯股份有限公司 预测图像生成方法和装置
CN103716641A (zh) * 2012-09-29 2014-04-09 浙江大学 预测图像生成方法和装置
US10154282B2 (en) 2012-09-29 2018-12-11 Shanghai Zhongxing Software Company Limited Method and device for generating predicted pictures
US10708619B2 (en) 2012-09-29 2020-07-07 Xi'an Zhongxing New Software Co., Ltd. Method and device for generating predicted pictures
CN103108183A (zh) * 2013-02-01 2013-05-15 中国科学技术大学 一种三维视频中Skip和Direct模式运动矢量的预测方法
CN106651921A (zh) * 2016-11-23 2017-05-10 中国科学院自动化研究所 运动检测方法及躲避和跟踪运动目标的方法
CN106651921B (zh) * 2016-11-23 2020-02-04 中国科学院自动化研究所 运动检测方法及躲避和跟踪运动目标的方法

Also Published As

Publication number Publication date
US7894525B2 (en) 2011-02-22
EP1364535A1 (en) 2003-11-26
ES2729193T3 (es) 2019-10-30
KR20040012714A (ko) 2004-02-11
CN1270542C (zh) 2006-08-16
US20040095999A1 (en) 2004-05-20
JP4004408B2 (ja) 2007-11-07
FI109633B (fi) 2002-09-13
WO2002060183A1 (en) 2002-08-01
KR100879324B1 (ko) 2009-01-19
JP2004517590A (ja) 2004-06-10
FI20010143A0 (fi) 2001-01-24
EP1364535B1 (en) 2019-03-06

Similar Documents

Publication Publication Date Title
CN1270542C (zh) 视频图像压缩方法
KR102431117B1 (ko) 포인트 클라우드 맵핑
JP7161150B2 (ja) ジオメトリ情報の動き補償
CN1131439C (zh) 目标跟踪方法及其设备
CN100581250C (zh) 用于三维计算机图形压缩的系统和方法
KR101429349B1 (ko) 중간 시점 영상 합성 장치 및 방법과 이에 관한 기록매체
KR100362038B1 (ko) 화상움직임을추정하는계산상효율적인방법
EP3367334B1 (en) Depth estimation method and depth estimation apparatus of multi-view images
US20190320154A1 (en) Electronic system including image processing unit for reconstructing 3d surfaces and iterative triangulation method
US8077906B2 (en) Apparatus for extracting camera motion, system and method for supporting augmented reality in ocean scene using the same
KR102141319B1 (ko) 다시점 360도 영상의 초해상화 방법 및 영상처리장치
KR102084253B1 (ko) 복원조각과 볼륨형 표면을 이용하는 카메라 트래킹 장치 및 방법
CN111602403B (zh) 用于生成图像数据比特流的装置和方法
CN1150848A (zh) 合成图像的产生方法
CN105681805A (zh) 视频编码、解码方法及其帧间预测方法和装置
Dachsbacher et al. Rendering Procedural Terrain by Geometry Image Warping.
Tomiyama et al. Algorithm for dynamic 3D object generation from multi-viewpoint images
CN1766928A (zh) 一种基于动态背景运动视频的运动对象重心轨迹提取方法
CN113545075A (zh) 点云全局方块打包
JP2002508146A (ja) 直前の原フレームのみに基づく1つ以上の中間フレームを合成することにより原フレームの系列からディスプレイフレームを発生させる方法及びデバイス
Haitz et al. Combining HoloLens with instant-NeRFs: Advanced real-time 3D mobile mapping
KR20060015755A (ko) 3차원 모델을 사용하는 화상 시퀀스를 표현하는 방법 및 그장치와 신호
CN114299132A (zh) 一种采用代价融合与分层匹配策略的半全局立体匹配方法
CN109379577B (zh) 一种虚拟视点的视频生成方法、装置及设备
Kolhatkar et al. Real-time virtual viewpoint generation on the GPU for scene navigation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term

Granted publication date: 20060816

CX01 Expiry of patent term