CN116193095A

CN116193095A - 一种基于单色图像实现彩色3d显示的方法

Info

Publication number: CN116193095A
Application number: CN202310200786.0A
Authority: CN
Inventors: 李小伟; 郭俊峰; 刘寿鑫; 张重阳; 王慧
Original assignee: Sichuan University
Current assignee: Sichuan University
Priority date: 2023-01-18
Filing date: 2023-01-18
Publication date: 2023-05-30

Abstract

本发明提供了一种基于单色图像实现彩色3D显示的方法，单色图像通过色彩估计网络模型预测出与之对应的彩色RGB图像，彩色RGB图像通过深度估计网络模型预测出对应的深度图，深度图中每一个像素的值表示彩色RGB图像中每一个对应像素的相对空间距离，由深度图和彩色RGB图像可以生成一个彩色三维物体点云，再通过微透镜阵列将彩色三维物体点云的每一个点映射到微图像阵列平面得到彩色的微图像阵列，该微图像阵列通过光学显示系统重建出彩色3D场景。本发明实现了单色场景的彩色3D显示，可以突破单色图像的信息表达界限，增强单色图像的信息显示范围，提升人们对单色图像的观看体验。

Description

一种基于单色图像实现彩色3D显示的方法

技术领域

本发明涉及3D显示技术领域，具体涉及一种基于单色图像实现彩色3D显示的方法。

背景技术

对于人眼来说，分辨彩色图像的能力要比单色图像高很多，而彩色三维(3D)显示因其真实感强，显示效果逼真，一直是人们追求的理想显示方式。然而，在许多情况下，彩色图像并不总是容易获取的，如单光谱成像和医学成像，只能得到单色图像或灰度图像。目前，单色图像的彩色化已有研究，然而，这些研究都是针对单色图像的二维(2D)着色，而对单色图像的彩色三维(3D)显示的研究却很少。使用单色图像实现生动的彩色3D显示效果，可以突破单色图像的信息表达界限，增强单色图像的信息显示范围，提升人们对单色图像的观看体验。

发明内容

本发明提出一种基于单色图像实现彩色3D显示的方法。所述方法首先将单色图像通过色彩估计网络模型预测出与之对应的彩色RGB图像，彩色RGB图像通过深度估计网络模型预测出对应的深度图，深度图中每一个像素的值表示了RGB图像中每一个对应像素的相对空间距离，由深度图和彩色RGB图像可以生成一个彩色三维物体点云，再通过微透镜阵列将彩色三维物体点云的每一个点映射到微图像阵列平面得到彩色的微图像阵列，该微图像阵列通过光学显示系统重建出彩色3D场景。所述方法可使用单色图像实现逼真的彩色3D显示效果。所述方法包括色彩估计、深度估计、像素映射和光学重建四个过程。

所述色彩估计过程，采用基于GAN的深度学习网络模型，其中，生成器使用U-Net网络架构，该网络模型的输入为单色图像，输出为彩色RGB图像。

所述深度估计过程，采用基于CNN的深度学习网络模型，输入为彩色RGB图像，输出为对应的深度图。彩色RGB图像和深度图的像素一一对应。深度图中每一个像素的值表示了RGB图像中每一个对应像素的相对空间距离。

所述像素映射过程基于透镜成像原理，将三维物体图像平面的像素通过微透镜阵列映射到微图像阵列平面，得到微图像阵列图像，如附图3所示。该像素映射系统的中心深度d可以通过高斯成像公式计算出，公式计算如下：

其中，f是微透镜阵列的焦距，g是中心深度平面和微透镜阵列平面之间的距离。L_(i,j)表示坐标为(i,j)的物体与微透镜阵列平面之间的距离。根据附图3中的几何关系，L_(i,j)可由以下公式定义：

/>

其中，Z表示深度图，Z_(i,j)是像素(i,j)处的真实深度。最后，物体像素A(i,j)的光线通过透镜中心后，将位于微图像阵列平面A'(u,v)处。像素坐标(u,v)由以下公式给出：

其中，P_L是元素透镜的间距，P_I是要显示的物体图像的像素大小。

所述光学重建过程，将上述微图像阵列输入到光学显示系统，可显示出具有立体视觉的彩色3D图像。所述光学显示系统包括：

LCD，用于发出不同颜色的光线从而显示出图像；

微透镜阵列，用于使LCD产生的光线发生偏折；

光学扩散屏，用于使经过微透镜阵列的光线分布均匀。

本发明解决的技术问题是单色图像的彩色3D显示技术。提供了一种行之有效的基于单色图像实现彩色3D显示方法，该方法通过结合色彩估计网络和深度估计网络，提取单色图像的彩色3D信息，通过像素映射和光学显示系统，完成彩色3D信息的重建，实现了从单色图像到彩色3D显示的技术突破。

附图说明

图1为本发明的基于单色图像实现彩色3D显示的方法流程示意图。

图2为本发明中色彩估计和深度估计流程图。

图3为从三维物体平面到微图像阵列平面的像素映射示意图。

图4为本发明实施例中采用本发明方法得到的简单场景的彩色3D显示结果。

图5为本发明实施例中采用本发明方法得到的复杂场景的彩色3D显示结果。

具体实施方式

下面结合附图和具体实施例对本发明做进一步说明。

一种单色图像实现彩色3D显示的方法，包括色彩估计、深度估计、像素映射和光场显示四个过程，整体流程如附图1所示。首先单色图像经过色彩估计网络，输出一个彩色RGB图像，彩色RGB图像作为深度估计网络的输入，通过该网络后得到对应的深度图，深度图和彩色RGB图像经过像素映射算法得到用于3D显示的图像源微图像阵列，该微图像阵列通过光场显示器重建有逼真立体效果的彩色3D图像。

所述的色彩估计网络和深度估计网络如附图2所示，其中，色彩估计网络为基于U-net架构的生成式对抗网络，生成器使用一个34层的ResNet，在U-Net的下采样部分作为编码器。具有编码器架构的Fastai，其动态的U-Net学习器将自动建立U-Net架构的解码器端，在这种情况下将ResNet-34编码器转换为具有交叉连接的U-Net。鉴别器是基于VGG-16模型激活的，采用了像素损失和克矩阵损失函数，这可以更快地收敛到给定架构的近似最佳训练模型。为了让模型学会如何提高图像的质量并加快模型的训练时间，使用在ImageNet上预训练的模型和权重作为初始值，最终训练出来的模型可以实现自然场景的真实着色。深度估计网络采用基于卷积神经网络的架构，使用一系列基于ResNet-50的卷积层和池化层来提取输入的特征图，并逐渐降低输入图像的分辨率。ResNet-50直接插入跳连接，跳过两个或更多的卷积层，对其输出进行求和，并引入了四个空洞卷积层，以增加感受野，从而更有效地进行深度估计。

彩色RGB图像和深度图的像素一一对应，深度图中每一个像素的值表示了RGB图像中每一个对应像素的相对空间距离。深度图可以离散化出一个没有颜色信息的三维物体点云，RGB图像中每一个像素值决定了三维物体点云中每一个点的颜色信息，由深度图和彩色RGB图像可以生成一个彩色三维物体点云，再通过微透镜阵列将彩色三维物体点云的每一个点映射到微图像阵列平面得到彩色的微图像阵列，附图3表示了从三维物体平面到微图像阵列平面的像素映射示意图。该像素映射系统的中心深度d可以通过高斯成像公式计算出，公式计算如下：

其中，f是微透镜阵列的焦距，g是中心深度平面和微透镜阵列平面之间的距离。L_(i,j)表示坐标为(i,j)的物体与微透镜阵列平面之间的距离。根据图3中的几何关系，L_(i,j)可由以下公式定义：

其中，Z表示深度图，Z_(i,j)是像素(i,j)处的真实深度。物体像素A(i,j)的光线通过透镜中心后，将位于微图像阵列平面A'(u,v)处。像素坐标(u,v)由以下公式给出：

经过像素映射后的微图像阵列，通过光场显示装置重建出具有立体感的彩色3D图像。所述光场显示装置包括：LCD，用于发出不同颜色的光线从而显示出图像；微透镜阵列，用于使LCD产生的光线发生偏折；光学扩散屏，用于使经过微透镜阵列的光线分布均匀。其中LCD的分辨率为3840×3840pixels，单个像素的尺寸为0.09mm×0.09mm。透镜阵列单个透镜的尺寸为2.54mm×2.54mm，透镜的个数为136(w)×76(h)，光学扩散屏的扩散角度为10°。

为了说明本发明方法的有效性，分别对简单的单色场景图像和复杂的单色场景图像进行了测试，简单场景的彩色3D显示效果如附图4所示，附图4给出了原始单色图像、原始单色图像对应的微图像阵列和五个不同视角拍摄到的彩色3D显示结果。从附图4可以看出，本发明方法可以实现30°视角大的3D显示。附图5展示了复杂场景的彩色3D显示效果，在复杂场景下，本发明方法同样可以实现多视角逼真的彩色3D显示。

Claims

1.一种基于单色图像实现彩色3D显示的方法，其特征在于，单色图像通过色彩估计网络模型预测出与之对应的彩色RGB图像，彩色RGB图像通过深度估计网络模型预测出对应的深度图，深度图中每一个像素的值表示彩色RGB图像中每一个对应像素的相对空间距离，由深度图和彩色RGB图像可以生成一个彩色三维物体点云，再通过微透镜阵列将彩色三维物体点云的每一个点映射到微图像阵列平面得到彩色的微图像阵列，该微图像阵列通过光学显示系统重建出彩色3D场景，具体的包括以下步骤：

步骤1：单色图像通过色彩估计网络得到彩色RGB图像；

步骤2：彩色RGB图像通过深度估计网络得到对应的深度图；

步骤3：基于透镜成像原理，将RGB图像和深度图决定的空间中每一个有颜色信息的点映射到微图像阵列平面得到彩色的微图像阵列；

步骤4：彩色的微图像阵列通过光学显示系统重建出彩色3D场景。

2.根据权利要求1所述的一种基于单色图像实现彩色3D显示的方法，其特征在于，步骤1中的色彩估计网络基于GAN网络框架设计，生成器使用U-Net网络结构，输入为单色图像，输出为彩色RGB图像。

3.根据权利要求1所述的一种基于单色图像实现彩色3D显示的方法，其特征在于，步骤2中的深度估计网络基于CNN网络框架设计，输入为彩色RGB图像，输出为对应的深度图；彩色RGB图像和深度图的像素一一对应，深度图中每一个像素的值表示了RGB图像中每一个对应像素的相对空间距离。

4.根据权利要求1所述的一种基于单色图像实现彩色3D显示的方法，其特征在于，步骤4中的光学显示系统包括：

LCD，用于发出不同颜色的光线从而显示出图像；

微透镜阵列，用于使LCD产生的光线发生偏折；

光学扩散屏，用于使经过微透镜阵列的光线分布均匀。

5.根据权利要求4所述的单色图像的彩色3D显示方法，其特征在于，所述微透镜阵列由两片柱透镜光栅相向堆叠而成。