CN107079142B - 多摄像机网的广义视图变形的系统和方法 - Google Patents

多摄像机网的广义视图变形的系统和方法 Download PDF

Info

Publication number
CN107079142B
CN107079142B CN201580051763.1A CN201580051763A CN107079142B CN 107079142 B CN107079142 B CN 107079142B CN 201580051763 A CN201580051763 A CN 201580051763A CN 107079142 B CN107079142 B CN 107079142B
Authority
CN
China
Prior art keywords
camera
plane
real
virtual
virtual image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580051763.1A
Other languages
English (en)
Other versions
CN107079142A (zh
Inventor
顾金伟
詹姆斯·M.A·贝戈勒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN107079142A publication Critical patent/CN107079142A/zh
Application granted granted Critical
Publication of CN107079142B publication Critical patent/CN107079142B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/10Geometric effects
    • G06T15/20Perspective computation
    • G06T15/205Image-based rendering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/20Editing of 3D images, e.g. changing shapes or colours, aligning objects or positioning parts
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/111Transformation of image signals corresponding to virtual viewpoints, e.g. spatial image interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/128Adjusting depth or disparity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/194Transmission of image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • H04N13/243Image signal generators using stereoscopic image cameras using three or more 2D image sensors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/271Image signal generators wherein the generated image signals comprise depth maps or disparity maps
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/08Indexing scheme for image data processing or generation, in general involving all processing steps from image acquisition to 3D model generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/12Indexing scheme for image data processing or generation, in general involving antialiasing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10028Range image; Depth image; 3D point clouds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20036Morphological image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2210/00Indexing scheme for image generation or computer graphics
    • G06T2210/44Morphing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2219/00Indexing scheme for manipulating 3D models or images for computer graphics
    • G06T2219/20Indexing scheme for editing of 3D models
    • G06T2219/2016Rotation, translation, scaling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/12Acquisition of 3D measurements of objects

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Architecture (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Studio Devices (AREA)
  • Processing Or Creating Images (AREA)

Abstract

一种用于执行广义视图变形方法的装置。所述方法包括:基于与期望虚拟图像关联的虚拟摄像机的预定视点确定摄像机平面,所述摄像机平面包括至少三个真实摄像机;预扭曲至少三个图像平面,使得全部图像平面平行于所述摄像机平面,且每个图像平面与位于所述摄像机平面的真实摄像机之一关联;通过对所述至少三个图像平面进行线性插值变形确定虚拟图像平面;后扭曲所述虚拟图像平面至预定位姿。

Description

多摄像机网的广义视图变形的系统和方法
技术领域
本发明通常涉及视频处理,尤其涉及多摄像机网的广义视图变形系统和方法。
背景技术
摄像机网络如今几乎随处可见,从工厂,停车场,高速公路,银行的视频监控摄像机到智慧家庭中用于安全保障以及看护老人/儿童的摄像机,再到智能会议室中实现智真和增强现实的摄像机。为保证充分的覆盖,每年有数以千万的此类网络化摄像机被安装使用,然而盲点依旧是个问题。
发明内容
根据一实施例,提供了一种广义视图变形方法。所述方法包括:基于与期望虚拟图像关联的虚拟摄像机的预定视点确定摄像机平面,所述摄像机平面包括至少三个真实摄像机;预扭曲至少三个图像平面,使得全部图像平面平行于所述摄像机平面,且每个图像平面与位于所述摄像机平面的真实摄像机之一关联;通过对所述至少三个图像平面进行线性插值变形确定虚拟图像平面;后扭曲所述虚拟图像平面至预定位姿。
根据另一实施例,提供了一种广义视图变形装置。所述装置包括至少一个存储器和耦合至所述至少一个存储器的至少一个处理器。所述至少一个处理器用于:基于与期望虚拟图像关联的虚拟摄像机的预定视点确定摄像机平面,所述摄像机平面包括至少三个真实摄像机;预扭曲至少三个图像平面,使得全部图像平面平行于所述摄像机平面,且每个图像平面与位于所述摄像机平面的真实摄像机之一关联;通过对所述至少三个图像平面进行线性插值变形确定虚拟图像平面;后扭曲所述虚拟图像平面至预定位姿。
根据又一实施例,提供了一种体现为计算机程序的非瞬时性计算机可读介质。所述计算机程序包括计算机可读程序代码,用于:基于与期望虚拟图像关联的虚拟摄像机的预定视点确定摄像机平面,所述摄像机平面包括至少三个真实摄像机;预扭曲至少三个图像平面,使得全部图像平面平行于所述摄像机平面,且每个图像平面与位于所述摄像机平面的真实摄像机之一关联;通过对所述至少三个图像平面进行线性插值变形确定虚拟图像平面;后扭曲所述虚拟图像平面至预定位姿。
在一示例实施例中,使用一种用于广义视图变形的装置。所述装置包括基于与期望虚拟图像关联的虚拟摄像机的预定视点确定摄像机平面的确定元件,其中,所述摄像机平面包括至少三个真实摄像机。所述装置还包括预扭曲至少三个图像平面使得全部图像平面平行于所述摄像机平面的预扭曲元件,其中,每个图像平面与位于所述摄像机平面的真实摄像机之一关联;进一步地,所述确定元件通过对所述至少三个图像平面进行线性插值变形确定虚拟图像平面,所述后扭曲元件后扭曲所述虚拟图像平面至预定位姿。
附图说明
为了更完整地理解本发明及其优点,现在参考下文结合附图进行的描述,相同的数字表示相同的对象,其中:
图1A至1C示出了自由视点变形的各种示例图像;
图2A至2C示出了自由视点变形技术的不同例子;
图3示出了参与变形操作的多个共面真实摄像机和一个虚拟摄像机;
图4示出了本发明提供的多摄像机网的广义视图变形方法;
图5A至5D示出了本发明提供的图4中广义视图变形方法中的操作;
图6示出了本发明提供的用于执行图4中广义视图变形方法的计算设备的例子。
具体实施方式
以下列出的图1A至图6和说明以及该专利文档中的各种实施例仅通过举例说明的方式描述本发明的原理,而不应以任何方式理解为对本发明范围的限制。本领域技术人员可以理解的是,本发明的原理可通过任何一种设置合理的设备和系统实现。
以下文档已并入本发明,如同在这里已充分阐述:(1)Furukawa和Ponce,《准确、密集、稳固的多视点立体影像》,IEEE Trans。PAMI,2010(以下称为“参考1”);(2)M.Levoy,《光场渲染》,SIGGRAPH,1996(以下称为“参考2”);(3)S.Seitz和C.Dyer,《视图变形》,SIGGRAPH,1996(以下称为“参考3”);(4)T.Beier和S.Neely,《基于特征的图像变形》,SIGGRAPH,1992(以下称为“参考4”);(5)S.Lee等人,《蛇模型图像变形和自由变形》,SIGGRAPH,1992(以下称为“参考5”)。
摄像机网络如今几乎随处可见,从工厂,停车场,高速公路,银行的视频监控摄像机到智慧家庭中用于安全保障以及看护老人/儿童的摄像机,再到智能会议室中实现智真和增强现实的摄像机。为保证充分的覆盖,每年有数以千万的此类网络化摄像机被安装使用,然而盲点依旧是个问题。例如,在一天的某些时候(例如中午),通过一些摄像机捕捉的视图因日光太强可能不理想,但在当天的其他时候可能就比较适宜。在其他网络中,摄像机放置若有一个或多个损坏或故障的摄像机,可能导致闭塞情况。
为解决这些问题,在针对摄像机网络的“自由视点”特征上做了大量研究。多个临近的摄像机利用自由视点特征捕捉重叠的视觉信息。然后,重叠的视觉信息用于产生“虚拟图像”,就像在期望位置和朝向上有虚拟摄像机一样。该过程也被称为自由视点变形。许多应用都迫切需要自由视点变形(即通过已有摄像机合成任意虚拟视图)这一特征,例如视频监控,数字取证等。
图1A到1C示出了自由视点变形的各种示例。在图1A中,三维空间100(例如:会议室、停车场、办公室等)配备有一个网络,该网络由围绕在该空间100周围不同位置和不同朝向的摄像机101组成。如图1A所示,摄像机位于该空间100的较高的点,并且一般直接朝下。然而,可以理解的是另外的或可替代的摄像机能位于较低的点(包括与地面平行或地面以下)且朝向其他方向(例如:朝上、一般朝上、或水平)。多个摄像机101可以捕捉对象102的局部,但却没有摄像机101能调整其位置或朝向来捕捉对象102的特定期望特征或角度。“虚拟摄像机”103示出能够捕捉对象102的期望特征或期望角度的摄像机(如果存在的话)的位置和朝向。
例如,在图1B和1C中,第一真实(即现实的、非虚拟的)摄像机101捕捉到图像110a-110b,第二真实摄像机101捕捉到图像112a-112b,摄像机101捕捉的110a-110b、112a-112b中的每张图像都缺失了关键期望特征。例如,室内有两个人,但在图像110a中只能看到一个人的脸;在图像110b中,只能看到一个人的正脸,另一个人则是侧脸;在图像112a中,一只包被挡在门后;在图像112b中,能看见这只包,但只能看见背着包的人的一部分。
由于信息缺失,摄像机101捕捉到的图像110a-110b、112a-112b都不适用于视频监控等应用。自由视点变形的目的是合成多个图像以生成一个包括所有期望特征的合成的“虚拟”图像,就如同有一个虚拟摄像机捕捉到了该图像。例如,使用自由视点变形将图像110a-110b合成为虚拟图像110c,将图像112a-112b合成为虚拟图像112c。从虚拟图像110c和112c上看,就像有一个虚拟摄像机102在最理想视觉位置用最佳朝向进行拍摄而成。此类合成虚拟图像110c和112c可能更适用于特定应用。
图2A至2C示出了自由视点变形技术的不同示例。参考1描述了一种技术,如图2A所示,通过一种或多种多视点立体(multi-view stereo,简称MVS)算法生成目标场景的三维(3D)纹理模型。该3D模型能从任意视图渲染得到。该技术通常带来好的结果。然而,在有挑战性的条件下,例如弱纹理区域、闭塞和反射或透明材质,其效果易受影响。此外,此技术计算成本高昂,且由于依赖硬件,运行较慢。参考2描述了第二种技术,如图2B所示,通过摄像机阵列进行的光场渲染。光场渲染通过二维(2D)摄像机阵列从场景捕捉光线,并通过光线插值来创建合成视图。该技术完全基于图像,但其通常需要密集的摄像机阵列配置以及大宽带来捕捉、传输和存储数据。此外,该技术的特点通常为低空间分辨率。参考3描述了第三种技术,如图2C所示,为视图变形。视图变形在两个摄像机之间的一个或多个中间视图中插入多种用户指定的特征。视图变形技术复杂度低,成本低。视图变形和光场渲染一样,不需要3D建模。然而,视图变形要求对两个摄像机拍到的图像中至少少量的匹配特征进行手动标记。此外,视图变形受针对仅两个摄像机的插值的限制。
为克服这些自由视点变形技术的上述缺点,本发明实施例提供了一种新型系统和方法来合成摄像机网表面的任意虚拟摄像机拍到的虚拟视图。在此类多摄像机网中,每个摄像机被视为一个顶点。公开的实施例显著概括和延伸了其他视图变形技术,从使用仅两个摄像机演变为使用任意多摄像机网。可通过结构地理或几何模式(例如,在矩形房间的八个角上安装八个摄像机来形成一个立方体网),或无结构模式(例如,在不规则形状的停车场随机放置多个摄像机来构成一个普通网)来设置多摄像机网。
此处公开的实施例基于一些关键概念。第一个关键概念为:对于共面摄像机,若所有的图像平面与摄像机平面平行,图像间的线性插值相当于摄像机插值(即该插值为“保形”的(见参考3))。例如,图3所示为多个共面摄像机301-303,每个摄像机301-303在对应图像平面311-313上捕捉图像。由于摄像机301-303朝向同一个方向,图像平面311-313相互平行且平行于摄像机平面(由虚线三角形304表示)。每张图像301-303中都捕捉到了3D物理对象(未示出)的P点的图像。例如,图像平面311中的P点的图像示为u0,图像平面312中的P点的图像示为u1,图像平面313中的P点的图像示为u2。虚拟摄像机305位于摄像机平面304,图像平面311-313能使用线性插值来确定虚拟图像平面315,就好像有虚拟摄像机305来捕捉其中的图像。具体地,如图3所示,P点在虚拟摄像机305的虚拟图像平面315上的投影(示为ust)相当于其在三个真实图像平面311-313上对应的点u0、u1、u2的重心加权插值,由以下公式(1)得出:
ust=KstP=s·u0+t·u1+(1-s-t)·u2 (1)
其中,Kst为虚拟摄像机305的内在矩阵,s和t为重心加权因子。
将以下两条定义(2)和(3)代入上述公式(1)可证实上述结论。
其中,K为给定摄像机的内在矩阵,P为其图像被拍摄的物理点的位置(由坐标{X,Y,Z}得出),fx和fy为摄像机在X和Y方向的焦距值,a为摄像机的宽高比,cx和cy为在X和Y方向时图像平面上的摄像机中心。
其中,Kst为虚拟摄像机305的内在矩阵;K0、K1、K2分别为真实摄像机301、302、303的内在矩阵;f0x、f0y、f1x、f1y、f2x、f2y分别为摄像机301、302、303在X和Y方向的焦距值;a0、a1、a2分别为摄像机301、302、303的宽高比;c0x、c0y、c1x、c1y、c2x、c2y分别为在X和Y方向时图像平面311-313上的摄像机中心。
第二个关键概念概括了通过重心加权进行的从两张图片到多张图片的基于特征的线性图像变形。具体地,为创建具有一组特征的图像,该组特征由多个图像的特征集通过重心加权组合而成,可使用以下公式(4),公式(4)为公式(1)的广义版本。
u=w1*u1+w2*u2+……+wn*un (4)
其中,w1、w2……wn为重心加权因子,其值为w1、w2……wn≥0,且w1+w2+……+wn=1。
插值图像I由以下公式得出:
I=w1*warp(I1,u1,u)+w2*warp(I2,u2,u)+…+wn*warp(In,un,u) (5)
其中,I1、I2……In为真实摄像机捕捉的真实图像,warp(.)为针对任意传统的基于特征的双图扭曲的操作(例如参考4和参考5中描述的操作)。
图4示出了本发明提供的多摄像机网的广义视图变形方法。图4所示的方法400基于上述关键概念。可关联下述图6的计算设备600执行方法400。然而,也可借助其他合适的设备或系统使用方法400。
在方法400中,物理空间中设置了多个真实摄像机。摄像机的不同子集能构成摄像机平面(也被称为“面”),例如图3中的摄像机平面304。作为一个说明性示例,在一个四面是墙,天花板和地板四角均安装了摄像机的矩形房间内,全部的八个摄像机能构成六个不同的摄像机平面或面。即地板上的四个摄像机能构成形状大致为矩形的第一摄像机面,天花板上的四个摄像机能构成大致矩形的第二摄像机面,与每面墙关联的四个摄像机能构成第三至第六摄像机面。当然,摄像机在其他物理空间内可以设置为其他形式。另外,摄像机面除了可以为矩形外,还可以为三角形或其他形状。
最初,在操作401中确定了虚拟摄像机视点C。虚拟摄像机视点C用位置坐标、朝向和内在矩阵K来表示。可以基于用于监控或视频取证的物理对象的期望视点来确定虚拟摄像机视点。例如,在图5A中,确定具有视点C的虚拟摄像机505。
在确定虚拟摄像机视点后,在操作403中确定包含该虚拟摄像机视点的摄像机面。例如,在图5A中,一旦确定了虚拟摄像机505,就确定了摄像机面504(真实摄像机501-503为该面的顶点)包含虚拟摄像机505。
此后,在操作405中,对摄像机面上的每个摄像机顶点进行预扭曲操作,使所有图像平面平行于该摄像机平面。例如,在图5B中,对图像平面511-513进行预扭曲,使得图像平面511-513全部平行于摄像机面504。为进行预扭曲操作,确定每个摄像机的单应性变换,以便旋转图像平面至平行于该摄像机平面。要做到这一点,要确定摄像机面(例如,三角形的,四边形的)上经过摄像机中心的摄像机平面法线。预扭曲单应性变换由以下公式得出:
Hi=KiR(KiRi)-1 (6)
其中,Hi为摄像机面(例如摄像机511-513)上的真实摄像机i的单应性变换矩阵,Ki为真实摄像机i的内在矩阵,Ri为真实摄像机i的旋转矩阵。旋转矩阵R由以下定义确定:
R=[n×y1,(n×y1)×n,n] (7)
其中,n为摄像机平面的法线。
预扭曲操作405之后,在操作407中对虚拟摄像机视点C进行重心插值。该操作可包括使用上述公式(1)和针对每个真实摄像机的摄像机视点C1、C2……Cn进行重心插值。该操作也包括计算每个真实摄像机的重心加权。
此后,在操作409中,基于摄像机的重心加权,对真实图像平面进行基于特征的线性变形来确定虚拟图像平面。例如,在图5C中,对真实图像平面511-513进行基于特征的线性变形来确定虚拟图像平面515。
此后,在操作411中,对虚拟图像平面进行后扭曲操作,使虚拟图像旋转至期望位姿获取虚拟视图。例如,在图5D中,通过后扭曲操作使虚拟图像515旋转至期望位姿。对于后扭曲操作,虚拟视图的期望位姿为内插得到,并进行单应性变换Hst。在一些实施例中,可使用三个四元数的球面线性插值来实现插值,如下所示:
qst=Spherical_Interp(q1,q2,q3,s,t)
Rst=Rotation_Matrix(qst) (8)
Hst=KstR(KstRst)-1
其中,qi为摄像机的对应旋转矩阵的四元数。
在虚拟图像平面被后扭曲至期望位姿后,虚拟视图的合成图像就能被输出至显示设备。
尽管图4示出了多摄像机网的广义视图变形方法400的一个示例,但是图4可以有各种改变。例如,尽管示出了一系列步骤,但是图4中的各个步骤可重叠、可并行发生、可按不同的顺序发生或发生多次。另外,一些步骤可以合并或移除,也可根据特定需要添加额外的步骤。作为一个特定的例子,方法400还可包括预计算的操作,来对多个视图进行特征匹配。该操作可在视图变形前离线完成。作为另一个特定的例子,可以使用GPU(图形处理单元)加速来提高实时性能。
广义视图变形方法400也可扩展至立体应用,用于创建虚拟3D图像。例如,有可能执行方法400两次来确定表示两个物理分开的视点的两个虚拟视图,而不是仅确定一个虚拟视图。然后,可在立体应用中整合或合并这两个虚拟视图来创建虚拟3D图像。
广义视图变形方法400的测试结果是有前景的。在执行该方法400的原型系统中,通过GPU加速已经可以达到大于90帧每秒(90fps)的性能。在一些原型系统中,带有GPU的并行图像扭曲通过统一计算设备架构(Compute United Device Architecture,简称CUDA)平台实现,以达到实时性能。
图6示出了本发明提供的用于执行图4中广义视图变形方法400的计算设备600的例子。如图6所示,计算设备600包括具有处理块605的计算块603和系统存储器607。处理块605可以为执行软件指令的任意类型的可编程电子设备,但传统上为一个或多个微处理器。系统存储器607可包括只读存储器(read-only memory,简称ROM)609和随机存取存储器(random access memory,简称RAM)611。本领域技术人员应理解,只读存储器609和随机存取存储器611可存储处理块605执行的软件指令。
该处理块605和该系统存储器607通过总线613或交替的通信结构直接或间接连接至一个或多个外部设备。例如,该处理块605或该系统存储器607可直接或间接与一个或多个额外的内存存储设备615相连。内存存储设备615可包括,例如,“硬”磁盘驱动器、固态磁盘驱动器、光盘驱动器、可移动磁盘驱动器等。该处理块605或该系统存储器607还可直接或间接与一个或多个输入设备617以及一个或多个输出设备619相连。该输入设备617可包括,例如,键盘、定点设备(例如鼠标、触摸板、触笔、轨迹球、操纵杆等)、触摸屏、扫描器、摄像机、麦克风等。该输出设备619可包括,例如,显示设备、打印机和扬声器等。这类显示设备可以用于显示视频图像。由计算设备601的各个例子可知,外部设备615-619中的一个或多个中可以内置计算块603。或者,外部设备615-619中的一个或多个可以在计算块603的外壳的外部并通过,例如,通用串行总线(universal serial bus,简称USB)连接或数字视频接口(digital visual interface,简称DVI)连接与总线613相连。
通过一些实施方案,计算块603也可以直接或间接连接至一个或多个网络接口卡(network interfaces card,简称NIC)621,从而与组成网络的其他设备通信。根据一个或多个通信协议,如传输控制协议(transmission control protocol,简称TCP)和互联网协议(Internet protocol,简称IP),网络接口卡621将来自计算块603的数据和控制信号转化为网络消息。并且,网络接口卡621可以使用任何合适的连接代理(或代理的组合)连接到网络,包括例如无线收发器、调制解调器或以太网连接。
需要理解的是,计算设备600只是作为一个例子说明,而不是为了限定。可以通过一个或多个计算设备实现本发明各实施例,该一个或多个计算设备包括图6所示的计算设备600的组件,或包括组件的交替组合,包括图6未示出的组件。例如,可以通过多处理器计算机、部署在网络中的多个单和/或多处理器计算机或二者的一些组合实现本发明各实施例。
此处公开的实施例提供了针对任意多摄像机网的广义视图变形方法,只要真实摄像机能覆盖虚拟视场,就可在摄像机网表面任意一点上合成虚拟视图。该公开的方法支持自动检测匹配特征的视图变形或手动标记特征的视图变形。这些方法在不牺牲分辨率和成本的情况下为多个摄像机的虚拟视图合成提供了开放式框架。该公开的方法容纳了许多基于特征的线性变形算法(例如基于点的算法、基于线的算法等等)。在一些实施例中,GPU可用于实现实时广义视图变形(>90fps)。
与图2A所示的多视点立体技术相比,该公开的方法是基于图像的方法且不需要3D重建。因此,该公开的方法足够稳固来应对弱纹理区域、闭塞、有挑战性的材质等情况。此外,该公开的方法比多视点立体技术更快捷且计算成本更低。
与图2B所示的光场技术相比,该公开的方法不需要密集的摄像机阵列设置,只需使用一些摄像机来进行插值。因此,此处描述的方法不需要大带宽和昂贵的硬件设置。该方法也支持高空间分辨率的图像扭曲。与图2C所示的传统双摄像机视图变形相比,该公开的方法能在普通多摄像机网中实现,因此更加灵活。此处描述的方法也不需要用户手动标记不同的特征。
在某些实施例中,一个或多个所述设备的部分或全部功能或流程由计算机可读程序代码构成的且内嵌于计算机可读介质中的计算机程序来实现或提供支持。短语“计算机可读程序代码”包括任意类型的计算机代码,包括源代码、目标代码以及可执行代码。短语“计算机可读介质”包括任何类型的可以被计算机访问的介质,比如,只读存储器(readonly memory,简称ROM)、随机存取存储器(random access memory,简称RAM)、硬盘驱动器、光盘(compact disc,简称CD)、数字化视频光盘(digital video disc,简称DVD)或者任何其他类型的存储器。
为本专利文档中使用的特定术语和短语进行定义是有帮助的。术语“包括”和“包含”以及它们的派生词表示没有限制的包括。术语“或者”是包容性的,意为和/或。短语“与……关联”和“与其关联”以及其派生的短语意味着包括,被包括在内、与……互连、包含、被包含在内、连接到或与……连接、耦合到或与……耦合、可与……通信、与……配合、交织、并列、接近、被绑定到或与……绑定、具有、具有……属性,等等。
虽然本发明就某些实施例和一般相关方法方面进行了描述,但是对本领域技术人员而言,对实施例和方法的各种更改和变更将是显而易见的。因此,示例实施例的上述描述不限定或约束本发明。正如以下权利要求定义,其它修改、替代以及变更也是可能的,而不偏离本发明的精神和范围。

Claims (18)

1.一种广义视图变形方法,其特征在于,所述方法包括:
第一确定操作:基于与期望虚拟图像关联的虚拟摄像机的预定视点确定摄像机平面,所述摄像机平面包括至少三个真实摄像机;
预扭曲操作:预扭曲至少三个图像平面,使得全部图像平面平行于所述摄像机平面,且每个图像平面与位于所述摄像机平面的真实摄像机之一关联;
第二确定操作:通过对所述至少三个图像平面进行线性插值变形确定虚拟图像平面;
后扭曲操作:后扭曲所述虚拟图像平面至预定位姿;
其中,所述至少三个真实摄像机包括三个摄像机,所述线性插值变形根据以下公式进行:
ust=KstP=s·u0+t·u1+(1-s-t)·u2
其中,ust为物理点P在所述虚拟图像平面中的投影,Kst为所述虚拟摄像机的内在矩阵,u0、u1、u2分别为所述物理点P在所述三个图像平面上的投影,s和t为重心加权因子。
2.根据权利要求1所述的方法,其特征在于,还包括:在确定所述摄像机平面之前,基于物理对象的期望视点确定所述虚拟摄像机的所述视点。
3.根据权利要求1所述的方法,其特征在于,所述预扭曲至少三个图像平面包括:对每个所述图像平面进行单应性变换,所述单应性变换根据以下公式进行:
Hi=KiR(KiRi)-1
其中,Hi为针对所述摄像机平面中真实摄像机i的单应性变换矩阵,Ki为所述真实摄像机i的内在矩阵,Ri为所述真实摄像机i的旋转矩阵。
4.根据权利要求1所述的方法,其特征在于,所述至少三个真实摄像机包括四个真实摄像机,所述摄像机平面大体为矩形,且所述四个真实摄像机分别位于所述摄像机平面的四个顶点上。
5.根据权利要求1所述的方法,其特征在于,所述至少三个真实摄像机包括设置在三维空间中的真实摄像机网络的子集。
6.根据权利要求1所述的方法,其特征在于,还包括:
基于第二虚拟摄像机的第二预定视点进行所述第一确定操作、所述预扭曲操作、所述第二确定操作和所述后扭曲操作,以生成第二虚拟图像平面;
将所述虚拟图像平面和所述第二虚拟图像平面组合成三维立体图像。
7.一种广义视图变形装置,其特征在于,所述装置包括:
至少一个存储器;
耦合至所述至少一个存储器的至少一个处理器,其中,所述至少一个处理器用于执行第一确定操作、预扭曲操作、第二确定操作和后扭曲操作,具体为:
所述第一确定操作:基于与期望虚拟图像关联的虚拟摄像机的预定视点确定摄像机平面,所述摄像机平面包括至少三个真实摄像机;
所述预扭曲操作:预扭曲至少三个图像平面,使得全部图像平面平行于所述摄像机平面,且每个图像平面与位于所述摄像机平面的真实摄像机之一关联;
所述第二确定操作:通过对所述至少三个图像平面进行线性插值变形确定虚拟图像平面;
所述后扭曲操作:后扭曲所述虚拟图像平面至预定位姿;
其中,所述至少三个真实摄像机包括三个摄像机,所述线性插值变形根据以下公式进行:
ust=KstP=s·u0+t·u1+(1-s-t)·u2
其中,ust为物理点P在所述虚拟图像平面中的投影,Kst为所述虚拟摄像机的内在矩阵,u0、u1、u2分别为所述物理点P在所述三个图像平面上的投影,s和t为重心加权因子。
8.根据权利要求7所述的装置,其特征在于,所述至少一个处理器还用于:在确定所述摄像机平面之前,基于物理对象的期望视点确定所述虚拟摄像机的所述视点。
9.根据权利要求7所述的装置,其特征在于,为预扭曲所述至少三个图像平面,所述至少一个处理器用于:对每个所述图像平面进行单应性变换,所述单应性变换根据以下公式进行:
Hi=KiR(KiRi)-1
其中,Hi为针对所述摄像机平面中真实摄像机i的单应性变换矩阵,Ki为所述真实摄像机i的内在矩阵,Ri为所述真实摄像机i的旋转矩阵。
10.根据权利要求7所述的装置,其特征在于,所述至少三个真实摄像机包括四个真实摄像机,所述摄像机平面大体为矩形,且所述四个真实摄像机分别位于所述摄像机平面的四个顶点上。
11.根据权利要求7所述的装置,其特征在于,所述至少三个真实摄像机包括设置在三维空间中的真实摄像机网络的子集。
12.根据权利要求7所述的装置,其特征在于,所述至少一个处理器还用于:
基于第二虚拟摄像机的第二预定视点进行所述第一确定操作、所述预扭曲操作、所述第二确定操作和所述后扭曲操作,以生成第二虚拟图像平面;
将所述虚拟图像平面和所述第二虚拟图像平面组合成三维立体图像。
13.一种非瞬时性计算机可读介质,其特征在于,所述非瞬时性计算机可读介质存储计算机程序,当其在计算机或处理器上运行时,使得所述计算机或处理器执行第一确定操作、预扭曲操作、第二确定操作和后扭曲操作,具体为:
所述第一确定操作:基于与期望虚拟图像关联的虚拟摄像机的预定视点确定摄像机平面,所述摄像机平面包括至少三个真实摄像机;
所述预扭曲操作:预扭曲至少三个图像平面,使得全部图像平面平行于所述摄像机平面,且每个图像平面与位于所述摄像机平面的真实摄像机之一关联;
所述第二确定操作:通过对所述至少三个图像平面进行线性插值变形确定虚拟图像平面;
所述后扭曲操作:后扭曲所述虚拟图像平面至预定位姿;
其中,所述至少三个真实摄像机包括三个摄像机,所述线性插值变形根据以下公式进行:
ust=KstP=s·u0+t·u1+(1-s-t)·u2
其中,ust为物理点P在所述虚拟图像平面中的投影,Kst为所述虚拟摄像机的内在矩阵,u0、u1、u2分别为所述物理点P在所述三个图像平面上的投影,s和t为重心加权因子。
14.根据权利要求13所述的非瞬时性计算机可读介质,其特征在于,当其在计算机或处理器上运行时,使得所述计算机或处理器还执行:
在确定所述摄像机平面之前,基于物理对象的期望视点确定所述虚拟摄像机的所述视点。
15.根据权利要求13所述的非瞬时性计算机可读介质,其特征在于,所述预扭曲至少三个图像平面包括:对每个所述图像平面进行单应性变换,所述单应性变换根据以下公式进行:
Hi=KiR(KiRi)-1
其中,Hi为针对所述摄像机平面中真实摄像机i的单应性变换矩阵,Ki为所述真实摄像机i的内在矩阵,Ri为所述真实摄像机i的旋转矩阵。
16.根据权利要求13所述的非瞬时性计算机可读介质,其特征在于,所述至少三个真实摄像机包括四个真实摄像机,所述摄像机平面大体为矩形,且所述四个真实摄像机分别位于所述摄像机平面的四个顶点上。
17.根据权利要求13所述的非瞬时性计算机可读介质,其中,所述至少三个真实摄像机包括设置在三维空间中的真实摄像机网络的子集。
18.根据权利要求13所述的非瞬时性计算机可读介质,其特征在于,当其在计算机或处理器上运行时,使得所述计算机或处理器还执行:
基于第二虚拟摄像机的第二预定视点进行所述第一确定操作、所述预扭曲操作、所述第二确定操作和所述后扭曲操作,以生成第二虚拟图像平面;
将所述虚拟图像平面和所述第二虚拟图像平面组合成三维立体图像。
CN201580051763.1A 2014-12-04 2015-12-03 多摄像机网的广义视图变形的系统和方法 Active CN107079142B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/561,027 US9900583B2 (en) 2014-12-04 2014-12-04 System and method for generalized view morphing over a multi-camera mesh
US14/561,027 2014-12-04
PCT/CN2015/096306 WO2016086878A1 (en) 2014-12-04 2015-12-03 System and method for generalized view morphing over a multi-camera mesh

Publications (2)

Publication Number Publication Date
CN107079142A CN107079142A (zh) 2017-08-18
CN107079142B true CN107079142B (zh) 2019-10-01

Family

ID=56091037

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580051763.1A Active CN107079142B (zh) 2014-12-04 2015-12-03 多摄像机网的广义视图变形的系统和方法

Country Status (4)

Country Link
US (1) US9900583B2 (zh)
EP (1) EP3180912B1 (zh)
CN (1) CN107079142B (zh)
WO (1) WO2016086878A1 (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9332285B1 (en) * 2014-05-28 2016-05-03 Lucasfilm Entertainment Company Ltd. Switching modes of a media content item
JP2016225865A (ja) * 2015-06-01 2016-12-28 東芝アルパイン・オートモティブテクノロジー株式会社 俯瞰画像生成装置
JPWO2017072975A1 (ja) * 2015-10-30 2018-08-30 オリンパス株式会社 撮像システム
US11212437B2 (en) * 2016-06-06 2021-12-28 Bryan COLIN Immersive capture and review
EP3270356A1 (en) * 2016-07-12 2018-01-17 Alcatel Lucent Method and apparatus for displaying an image transition
JP6894687B2 (ja) * 2016-10-11 2021-06-30 キヤノン株式会社 画像処理システム、画像処理装置、制御方法、及び、プログラム
KR102581134B1 (ko) * 2016-12-06 2023-09-21 코닌클리케 필립스 엔.브이. 광 강도 이미지를 생성하기 위한 장치 및 방법
US10009550B1 (en) * 2016-12-22 2018-06-26 X Development Llc Synthetic imaging
US10268201B2 (en) * 2017-02-28 2019-04-23 Mitsubishi Electric Research Laboratories, Inc. Vehicle automated parking system and method
KR102351542B1 (ko) 2017-06-23 2022-01-17 삼성전자주식회사 시차 보상 기능을 갖는 애플리케이션 프로세서, 및 이를 구비하는 디지털 촬영 장치
CA3086592A1 (en) 2017-08-30 2019-03-07 Innovations Mindtrick Inc. Viewer-adjusted stereoscopic image display
US10522113B2 (en) * 2017-12-29 2019-12-31 Intel Corporation Light field displays having synergistic data formatting, re-projection, foveation, tile binning and image warping technology
JP2019185664A (ja) * 2018-04-17 2019-10-24 トヨタ自動車株式会社 制御装置、物体検出システム、物体検出方法及びプログラム
US10771758B2 (en) * 2018-09-24 2020-09-08 Intel Corporation Immersive viewing using a planar array of cameras
GB2582315B (en) * 2019-03-19 2023-05-17 Sony Interactive Entertainment Inc Method and system for generating an image
US10957027B2 (en) * 2019-03-26 2021-03-23 Intel Corporation Virtual view interpolation between camera views for immersive visual experience
US10951877B2 (en) * 2019-07-15 2021-03-16 Msg Entertainment Group, Llc Providing a contiguous virtual space for a plurality of display devices
US11651473B2 (en) * 2020-05-22 2023-05-16 Meta Platforms, Inc. Outputting warped images from captured video data
CN113970990B (zh) * 2021-10-21 2024-02-23 网易(杭州)网络有限公司 悬浮窗的显示方法及装置、存储介质、电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101383051A (zh) * 2008-09-27 2009-03-11 四川虹微技术有限公司 一种基于图像重投影的视图合成方法
CN101799939A (zh) * 2010-04-02 2010-08-11 天津大学 基于左右视点图像的中间视点快速、自适应生成算法
CN101908219B (zh) * 2009-06-02 2013-03-13 索尼公司 图像处理设备,图像处理方法和程序
CN103345736A (zh) * 2013-05-28 2013-10-09 天津大学 一种虚拟视点绘制方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6424351B1 (en) * 1999-04-21 2002-07-23 The University Of North Carolina At Chapel Hill Methods and systems for producing three-dimensional images using relief textures
US6608923B1 (en) * 1999-06-19 2003-08-19 Microsoft Corporation System and method for rectifying images of three dimensional objects
RU2215326C2 (ru) * 2001-06-29 2003-10-27 Самсунг Электроникс Ко., Лтд. Иерархическое основанное на изображениях представление неподвижного и анимированного трехмерного объекта, способ и устройство для использования этого представления для визуализации объекта
CN101375598A (zh) 2004-06-01 2009-02-25 L-3通信公司 视频闪光/视觉警报
MXPA06013936A (es) 2004-06-01 2007-08-16 L 3 Comm Corp Metodo y sistema para monitoreo de seguridad de area extensa, manejo de sensores y conocimiento situacional.
CA2511040A1 (en) 2004-09-23 2006-03-23 The Governors Of The University Of Alberta Method and system for real time image rendering
US8395642B2 (en) * 2009-03-17 2013-03-12 Mitsubishi Electric Research Laboratories, Inc. Method for virtual image synthesis
US8504136B1 (en) 2009-10-06 2013-08-06 University Of South Florida See-through abdomen display for minimally invasive surgery
JP5966256B2 (ja) * 2011-05-23 2016-08-10 ソニー株式会社 画像処理装置および方法、プログラム、並びに記録媒体
EP2615583B1 (en) * 2012-01-12 2016-04-20 Alcatel Lucent Method and arrangement for 3D model morphing
US9462301B2 (en) * 2013-03-15 2016-10-04 Google Inc. Generating videos with multiple viewpoints

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101383051A (zh) * 2008-09-27 2009-03-11 四川虹微技术有限公司 一种基于图像重投影的视图合成方法
CN101383051B (zh) * 2008-09-27 2011-03-23 四川虹微技术有限公司 一种基于图像重投影的视图合成方法
CN101908219B (zh) * 2009-06-02 2013-03-13 索尼公司 图像处理设备,图像处理方法和程序
CN101799939A (zh) * 2010-04-02 2010-08-11 天津大学 基于左右视点图像的中间视点快速、自适应生成算法
CN103345736A (zh) * 2013-05-28 2013-10-09 天津大学 一种虚拟视点绘制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Tri-view morphing;Jiangjian Xiao,Mubarak Shah;《Computer Vision and Image Understanding》;20040729;第96卷;第345-366页 *

Also Published As

Publication number Publication date
CN107079142A (zh) 2017-08-18
EP3180912A1 (en) 2017-06-21
EP3180912A4 (en) 2017-09-06
US20160165215A1 (en) 2016-06-09
WO2016086878A1 (en) 2016-06-09
US9900583B2 (en) 2018-02-20
EP3180912B1 (en) 2021-10-27

Similar Documents

Publication Publication Date Title
CN107079142B (zh) 多摄像机网的广义视图变形的系统和方法
CN109242961B (zh) 一种脸部建模方法、装置、电子设备和计算机可读介质
US10127712B2 (en) Immersive content framing
Matsuyama et al. 3D video and its applications
EP3534336B1 (en) Panoramic image generating method and apparatus
CN103426163B (zh) 用于渲染受影响的像素的系统和方法
WO2019049421A1 (ja) キャリブレーション装置、キャリブレーションシステム、およびキャリブレーション方法
WO2018125369A1 (en) Multi-view scene flow stitching
US20080246757A1 (en) 3D Image Generation and Display System
CN108520232A (zh) 立体环景影片产生方法及装置
CN109791704B (zh) 用于自由运行fvv应用的基于多层uv映射的纹理渲染方法、系统和装置
JP2016537901A (ja) ライトフィールド処理方法
JP2006211291A (ja) 立体視可能な表示装置および方法
JP7479729B2 (ja) 三次元表現方法及び表現装置
Sajadi et al. Scalable Multi‐view Registration for Multi‐Projector Displays on Vertically Extruded Surfaces
US20030146922A1 (en) System and method for diminished reality
CN115187729B (zh) 三维模型生成方法、装置、设备和存储介质
CN110807413B (zh) 目标显示方法以及相关装置
CN106878692B (zh) 一种基于傅里叶谱的被遮挡三维物体显示方法
KR20080034419A (ko) 3d 영상 생성 및 디스플레이 시스템
CN113132708B (zh) 利用鱼眼相机获取三维场景图像的方法和装置、设备和介质
CN109801351B (zh) 动态图像生成方法和处理设备
JP2000329552A (ja) 3次元地図作成方法
JP5565126B2 (ja) 立体印刷物制作支援装置、プラグインプログラム、立体印刷物制作方法および立体印刷物
JP7366563B2 (ja) 画像生成装置、画像生成方法、及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant