WO2020048485A1

WO2020048485A1 - Vr全景摄影系统

Info

Publication number: WO2020048485A1
Application number: PCT/CN2019/104389
Authority: WO
Inventors: 方璐; 戴琼海; 朱天奕
Original assignee: 清华-伯克利深圳学院筹备办公室
Priority date: 2018-09-05
Filing date: 2019-09-04
Publication date: 2020-03-12
Also published as: CN109040601B; CN109040601A

Abstract

本申请实施例公开了一种VR全景摄影系统，包括：宽视场环形相机阵列、窄视场环形相机阵列、图像处理设备、多相机图像拼接设备、VR显示设备；宽视场环形相机阵列采集多个宽视场图像，窄视场环形相机阵列采集多个窄视场图像；图像处理设备基于VR显示设备反馈的预览视角反馈信息对多个宽视场图像和多个窄视场图像进行压缩预处理，对压缩预处理后的图像并行采集后进行解码解压处理；多相机图像拼接设备采用ZNCC算法按照标定参数矩阵将解码减压后的多个宽视场图像和多个窄视场图像进行多尺度融合，生成十亿像素级环形图像。

Description

VR全景摄影系统

本申请要求在2018年09月05日提交中国专利局、申请号为201811032604.9的中国专利申请的优先权，该申请的全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及图像技术领域，例如涉及一种VR全景摄影系统。

背景技术

随着虚拟现实(Virtual Reality，VR)技术的发展和相关相机产业的发展，在计算机和计算机摄像学领域，视频采集与图像捕获无论在规模上还是在性能上都取得了巨大的进步和发展。如今，VR视频仍旧受限于两大方面，在空间尺度上，其可扩展性仍旧大大受限于相关技术中相机的视频成像质量，在时间尺度上，其成像延迟与相应的成像帧率依旧受限于相关技术中的成像系统的帧率与系统的实时性。因此，在高清监控领域或是在VR等环形全景成像摄影等系统中，如何有效的提高实时视频的相应分辨率，提高相应的显示刷新帧率，则成为了当下势必需要解决的主要问题。

在相关技术中的实时视频采集系统中，由于受数据流量、计算复杂度等相关的限制，常常无法实现十亿像素级的并行实时输出与处理，另一方面，超大的视场与重视细节的应用之间也常常有非常大的矛盾，因此当下的实时的视频采集常常难以兼顾宽视场的总体视频流信息与窄视场的视频细节信息。另外，对于此类超宽视场在现场显示方面，传统的显示屏显示方式也有着非常大的局限，其不仅对于用户的体验非常不友好，也常常无法以合理的方式显示360度的全局视频信息。

发明内容

以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。

本申请实施例提供一种基于混合相机阵列的多尺度非结构化的十亿像素VR全景摄影系统，以实现十亿像素VR全景视频的采集与显示。

本申请实施例提供了一种基于混合相机阵列的多尺度非结构化的十亿像素VR全景摄影系统，包括：宽视场环形相机阵列、窄视场环形相机阵列、图像处理设备、多相机图像拼接设备、VR显示设备；宽视场环形相机阵列的输出端与窄视场环形相机阵列的输出端均与图像处理设备的输入端相连，图像处理设备的输出端与多相机图像拼接设备的输入端相连，多相机图像拼接设备的输出端与VR显示设备的输入端相连；VR显示设备的反馈端与图像处理设备的输入端相连；

宽视场环形相机阵列采集多个宽视场图像，窄视场环形相机阵列采集多个窄视场图像；

图像处理设备基于VR显示设备反馈的预览视角反馈信息对多个宽视场图像和多个窄视场图像进行压缩预处理，对压缩预处理后的图像并行采集后进行解码解压处理；

多相机图像拼接设备采用零均值归一化互相关(Zero-mean Normalized Cross-Correlation，ZNCC)算法按照标定参数矩阵将解码减压后的多个宽视场图像和多个窄视场图像进行多尺度融合，生成十亿像素级环形图像；

VR显示设备采用置换贴图的方式对十亿像素级环形图像进行渲染并显示，并根据用户当前的预览视角生成预览视角反馈信息。

在阅读并理解了附图和详细描述后，可以明白其他方面。

附图说明

图1是本申请实施例提供的一种基于混合相机阵列的多尺度非结构化的十亿像素VR全景摄影系统的结构示意图；

图2是本申请实施例提供的一种多层环形阵列相机的结构示意图；

图3是本申请实施例提供的另一种基于混合相机阵列的多尺度非结构化的十亿像素VR全景摄影系统的结构示意图；

图4a是本申请实施例中用户的VR视角左眼映射图；

图4b是本申请实施例中用户的VR视角右眼映射图；

图4c是图4a中A处的局部高分辨的视频截图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本申请，而非对本申请的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本申请相关的部分而非全部结构。

图1为本申请实施例提供的一种基于混合相机阵列的多尺度非结构化的十亿像素VR全景摄影系统的结构示意图，本实施例可适用于VR全景摄影的情况，如图1所示，该系统包括：宽视场环形相机阵列110、窄视场环形相机阵列120、图像处理设备130、多相机图像拼接设备140、VR显示设备150。宽视场环形相机阵列110的输出端与窄视场环形相机阵列120的输出端均与图像处理设备130的输入端相连，图像处理设备130的输出端与多相机图像拼接设备140的输入端相连，多相机图像拼接设备140的输出端与VR显示设备150的输入端相连，VR显示设备150的反馈端与图像处理设备130的输入端相连。

宽视场环形相机阵列110采集多个宽视场图像，窄视场环形相机阵列120采集多个窄视场图像。图像处理设备120基于VR显示设备150反馈的预览视角反馈信息对多个宽视场图像和多个窄视场图像进行压缩预处理，对压缩预处理后的图像并行采集后进行解码解压处理。多相机图像拼接设备140采用ZNCC算法按照标定参数矩阵将解码减压后的多个宽视场图像和多个窄视场图像进行多尺度融合，生成十亿像素级环形图像。VR显示设备150采用置换贴图的方式对十亿像素级环形图像进行渲染并显示，并根据用户当前的预览视角生成预览视角反馈信息。

其中，宽视场环形相机阵列110可以是由多个宽视场相机组成的360度环形相机阵列，宽视场相机可以是宽视场低分辨短焦相机。窄视场环形相机阵列120可以是由多个窄视场相机组成的360度环形相机阵列，窄视场相机可以是窄视场高分辨长焦。本实施例中，多个宽视场相机和多个窄视场相机分别设置于多层环形阵列盘上形成宽视场环形相机阵列110、窄视场环形相机阵列120，多个宽视场相机以均匀排布的方式设置于多层环形阵列盘上，多个窄视场相机以均匀排布或者不均匀排布的方式设置于多层环形阵列盘上。示例性的，图2为本申请实施例提供的一种多层环形阵列相机的结构示意图，如图2所示，有3层环形阵列盘，3层环形阵列盘安装于中心支撑圆柱上，在最下一层环形阵列盘上安装多个宽视场相机，最上一层和中间一层环形阵列盘上分别安装多个窄视场相机。本应用场景下，环形阵列盘应该尽可能的小，以减少相机之间的视角差异。

本申请实施例提供的基于混合相机阵列的多尺度非结构化的十亿像素VR全景摄影系统可以实现十亿像素VR全景视频的采集与显示。

图3为本申请实施例提供的另一种基于混合相机阵列的多尺度非结构化的十亿像素VR全景摄影系统的结构示意图，作为对上述实施例的进一步解释，如图2所示，图像处理设备130包括基于预览视角的压缩预处理模块131、高速并行采集模块132和图像解码解压模块133。多相机图像拼接设备140包括相机建模模块141和图像拼接模块142。VR显示设备150包括VR渲染模块151、VR显示器152、交互模块153和VR预览视角反馈模块154。

其中，宽视场环形相机阵列110的输出端与窄视场环形相机阵列120的输出端均与基于预览视角的压缩预处理模块131的输入端相连，基于预览视角的压缩预处理模块130的输出端与高速并行采集模块132的输入端相连，高速并行采集模块132的输出端与图像解码解压模块133相连。

基于预览视角的压缩预处理模块131接收VR显示设备150发送的预览视角反馈信息，并根据预览视角反馈信息确定多个宽视场图像和多个窄视场图像的压缩率，并根据压缩率对多个宽视场图像和多个窄视场图像进行压缩。高速并行采集模块132对压缩后图像进行多路并行采集。图像解码解压模块133对压缩后的多个宽视场图像和多个窄视场图像进行自适应的解码解压。

基于预览视角的压缩预处理模块131根据预览视角反馈信息获取当前视野内的宽视场图像和/或窄视场图像，对当前视野内的宽视场图像和/或窄视场图像进行低压缩率的压缩，对当前视野外的宽视场图像和窄视场图像进行高压缩率的压缩。具体的，预览视角反馈信息可以包括用户的预览方位，基于预览视角的压缩预处理模块131根据预览视角反馈信息推算出采集的宽视场图像和窄视场图像的不同的压缩率，根据各个宽视场图像和窄视场图像的压缩率进行相应的压缩。示例性的，当VR显示设备150中的预览视角较宽时，视野中的图像以较低的分辨率显示显示，基于预览视角的压缩预处理模块131对压缩区域内的图像进行高压缩率的压缩，在保证视野内图像清晰度的条件下尽可能的节约网络带宽，从而提高传输帧率，减少传输延迟；而当VR显示设备中的预览视角较窄时，仅仅集中在某几个数量较少的图像上时，基于预览视角的压缩预处理模块131对视野内的图像进行低压缩率的压缩，而对于视野外的图像则进行进行高压缩率的压缩，以节约网络带宽。

高速并行采集模块132依赖于前兆或者万兆网络组进行图像数据的汇总与分发。本实施例中，采取“多路采集，一路显示”的星型网络结构，由多个节点采集处理压缩后的图像然后集中到中央节点进行下一步处理和相应显示等流程。

图像解码解压模块133可以是动态自适应的图像解码解压模块，对由基于预览视角的压缩预处理模块131以不同的压缩率压缩后的图像进行解码解压。

在一实施例中，相机建模模块141的输入端分别与宽视场环形相机阵列110的输出端与窄视场环形相机阵列120的输出端相连，图像拼接模块142的输入端与图像解码解压模块133的输出端相连。

相机建模模块141预先获取宽视场环形相机阵列中每个宽视场相机采集的一帧图像作为提前标定帧，根据提前标定帧采用设定标定算法对宽视场图像进行标定及建模，获得每个宽视场相机的标定参数矩阵。图像拼接模块142采用ZNCC算法按照每个宽视场相机的标定参数矩阵将解码减压后的多个宽视场图像和多个窄视场图像进行多尺度融合，生成十亿像素级环形图像。相机建模模块141将每个宽视场相机的标定参数矩阵进行记录，用于后续的图像多尺度融合。

本实施例中，为了最终合成多尺度的十亿像素级的视频流，需要将多个窄视场图像，重新投影至由多个宽视场图像拼接的环形低分辨图像上。采用设定标定，预先从每个相机中采集一帧图像作为提前标定帧，对宽视场图像进行相应的标定及建模，形成相应的标定参数矩阵。然后再通过ZNCC算法按照每个宽视场相机的标定参数矩阵将解码减压后的多个宽视场图像和多个窄视场图像进行多尺度融合，生成十亿像素级环形图像。并记录下计算得到的标定参数矩阵，可用于后续的实时拼接与显示的相应环节。

在一实施例中，VR渲染模块151的输入端与图像拼接模块142的输出端相连，VR渲染模块151的输出端与VR显示器152的输入端相连，VR预览视角反馈模块154的输出端与基于预览视角的压缩预处理模块131输入端相连。

VR渲染模块151基于NVIDIA显卡的统一计算设备架构(Compute Unified Device Architecture，CUDA)计算库与开放图形库(Open Graphics Library，OpenGL)图像渲染库，采用置换贴图的方式对十亿像素级环形图像进行渲染。VR显示器152将渲染后的十亿像素级环形图像进行显示。交互模块153接收用户对VR显示设备的操作，以对十亿像素级环形图像进行操作。VR预览视角反馈模块154获取用户的视线防线，根据用户的视线获得预览视角信息。

本实施例中，交互模块153可以设置于控制器中，为了方便用户与VR显示设备进行交互等环节，用户可通过控制器对全景图进行视角的拉近拉远，轴移动等相应操作。根据用户在VR显示设备中的移动与查看，可以获取到用户观察到的方向，从而计算出用户对于当前渲染球的兴趣区域，该区域包含了用户的缩放程度、涉及到的相机图像等相关的参数。

图4a为本申请实施例提供的用户的VR视角左眼映射图，图4a为本申请实施例提供的用户的VR视角右眼映射图，图4c是图4a中A处的局部高分辨的视频截图。用户可通过VR显示设备放大该区域并查看该区域的高清实时预览图。

Claims

一种虚拟现实VR全景摄影系统，包括：宽视场环形相机阵列、窄视场环形相机阵列、图像处理设备、多相机图像拼接设备、VR显示设备；所述宽视场环形相机阵列的输出端与所述窄视场环形相机阵列的输出端均与所述图像处理设备的输入端相连，所述图像处理设备的输出端与所述多相机图像拼接设备的输入端相连，所述多相机图像拼接设备的输出端与所述VR显示设备的输入端相连；所述VR显示设备的反馈端与所述图像处理设备的输入端相连；

所述宽视场环形相机阵列采集多个宽视场图像，所述窄视场环形相机阵列采集多个窄视场图像；

所述图像处理设备基于所述VR显示设备反馈的预览视角反馈信息对所述多个宽视场图像和所述多个窄视场图像进行压缩预处理，对压缩预处理后的图像并行采集后进行解码解压处理；

所述多相机图像拼接设备采用ZNCC算法按照标定参数矩阵将解码减压后的多个宽视场图像和多个窄视场图像进行多尺度融合，生成十亿像素级环形图像；

所述VR显示设备采用置换贴图的方式对所述十亿像素级环形图像进行渲染并显示，并根据用户当前的预览视角生成预览视角反馈信息。
根据权利要求1所述的系统，其中，多个宽视场相机和多个窄视场相机分别设置于多层环形阵列盘上，形成宽视场环形相机阵列、窄视场环形相机阵列；

所述多个宽视场相机以均匀排布的方式设置于多层环形阵列盘上；所述多个窄视场相机以均匀排布或者不均匀排布的方式设置于多层环形阵列盘上。
根据权利要求1所述的系统，其中，所述图像处理设备包括基于预览视角的压缩预处理模块、高速并行采集模块和图像解码解压模块；所述宽视场环形相机阵列的输出端与所述窄视场环形相机阵列的输出端均与所述基于预览视角的压缩预处理模块的输入端相连，所述基于预览视角的压缩预处理模块的输出端与所述高速并行采集模块的输入端相连，所述高速并行采集模块的输出端与所述图像解码解压模块的输入端相连；

所述基于预览视角的压缩预处理模块接收所述VR显示设备发送的预览视角反馈信息，并根据所述预览视角反馈信息确定所述多个宽视场图像和所述多个窄视场图像的压缩率，并根据所述压缩率对所述多个宽视场图像和所述多个窄视场图像进行压缩；

所述高速并行采集模块对压缩后的图像进行多路并行采集；

所述图像解码解压模块对压缩后的多个宽视场图像和所述多个窄视场图像进行自适应的解码解压。
根据权利要求3所述的系统，其中，所述基于预览视角的压缩预处理模块根据预览视角反馈信息获取当前视野内的宽视场图像和窄视场图像中的至少一种，对当前视野内的宽视场图像和窄视场图像中的至少一种进行低压缩率的压缩，对当前视野外的宽视场图像和窄视场图像进行高压缩率的压缩。
根据权利要求3所述的系统，其中，所述多相机图像拼接设备包括相机建模模块和图像拼接模块；

所述相机建模模块的输入端分别与所述宽视场环形相机阵列的输出端与所述窄视场环形相机阵列的输出端相连，所述图像拼接模块的输入端与所述图像解码解压模块的输出端相连；

所述相机建模模块预先获取宽视场环形相机阵列中每个宽视场相机采集的一帧图像作为提前标定帧，根据所述提前标定帧采用设定标定算法对宽视场图像进行标定及建模，获得每个宽视场相机的标定参数矩阵；

所述图像拼接模块采用ZNCC算法按照每个宽视场相机的标定参数矩阵将解码减压后的多个宽视场图像和多个窄视场图像进行多尺度融合，生成十亿像素级环形图像。
根据权利要求5所述的系统，其中，所述相机建模模块将每个宽视场相机的标定参数矩阵进行记录，用于后续的图像多尺度融合。
根据权利要求5所述的系统，其中，所述VR显示设备包括VR渲染模块、VR显示器、交互模块和VR预览视角反馈模块；所述VR渲染模块的输入端与所述图像拼接模块的输出端相连，所述VR渲染模块的输出端与所述VR显示器的输入端相连，所述VR预览视角反馈模块的输出端与所述基于预览视角的压缩预处理模块输入端相连；

所述VR渲染模块基于NVIDIA显卡的CUDA计算库与OpenGL图像渲染库，采用置换贴图的方式对所述十亿像素级环形图像进行渲染；

所述VR显示器将渲染后的十亿像素级环形图像进行显示；

所述交互模块接收用户对VR显示设备的操作，以对十亿像素级环形图像进行操作；

所述VR预览视角反馈模块获取用户的视线防线，根据用户的视线获得预览视角信息。