CN118015179A - 基于相机在环的三维光场显示方法、装置、设备及介质 - Google Patents
基于相机在环的三维光场显示方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN118015179A CN118015179A CN202311841647.2A CN202311841647A CN118015179A CN 118015179 A CN118015179 A CN 118015179A CN 202311841647 A CN202311841647 A CN 202311841647A CN 118015179 A CN118015179 A CN 118015179A
- Authority
- CN
- China
- Prior art keywords
- light field
- dimensional light
- physical model
- field display
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 60
- 230000006870 function Effects 0.000 claims abstract description 52
- 238000003384 imaging method Methods 0.000 claims abstract description 20
- 238000005457 optimization Methods 0.000 claims abstract description 19
- 238000012549 training Methods 0.000 claims abstract description 17
- 230000000007 visual effect Effects 0.000 claims abstract description 17
- 230000000694 effects Effects 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 claims description 14
- 230000004075 alteration Effects 0.000 claims description 11
- 238000013528 artificial neural network Methods 0.000 claims description 11
- 239000011159 matrix material Substances 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 7
- 239000000523 sample Substances 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 8
- 230000007613 environmental effect Effects 0.000 abstract description 8
- 238000004891 communication Methods 0.000 description 8
- 238000004088 simulation Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T17/00—Three dimensional [3D] modelling, e.g. data description of 3D objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/50—Depth or shape recovery
- G06T7/55—Depth or shape recovery from multiple images
- G06T7/557—Depth or shape recovery from multiple images from light fields, e.g. from plenoptic cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20228—Disparity calculation for image-based rendering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30168—Image quality inspection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Image Processing (AREA)
Abstract
本申请涉及计算成像技术领域,特别涉及一种基于相机在环的三维光场显示方法、装置、设备及介质,其中,方法包括:建立三维光场显示系统的三维光场图像数据集;建立三维光场显示可学习的参数化物理模型并搭建初始卷积神经网络;将数据集的部分数据输入至参数化物理模型和初始卷积神经网络并计算相应的基元图像;计算相应的视角误差和损失函数并进行网络训练直至达到迭代停止条件,得到最终的参数化物理模型和卷积神经网络,从而实现高质量三维光场显示。由此,解决了相关技术中,由于实际装配误差或环境因素等影响,容易出现三维图像重构误差,降低图像质量,且由于无法实现基元图像和系统误差参数的联合优化,影响重构三维图像精确度,亟待改进。
Description
技术领域
本申请涉及计算成像技术领域,特别涉及一种基于相机在环的三维光场显示方法、装置、设备及介质。
背景技术
相关技术中,主要通过构建理想物理建模与实际搭建的显示设备,根据仿真和实际参数误差系统参数计算基元图像,从而分别进行预校正,并加载到实际搭建的显示设备上,实现三维光场显示。
然而,相关技术中,由于实际装配误差或者环境因素等影响,理想物理建模中的各项参数与实际搭建的显示设备参数之间存在误差,仿真的光场显示结果与实际显示结果不匹配,根据仿真参数计算的基元图像,加载到实际搭建的显示设备上时,容易出现三维图像重构误差,影响了最终重构三维光场显示的图像质量,且针对系统误差参数和基元图像分别进行优化,无法实现基元图像和系统误差参数的联合优化,影响重构三维图像的精确度,限制了三维光场显示技术的应用及发展。
发明内容
本申请提供一种基于相机在环的三维光场显示方法、装置、电子设备及存储介质,以解决相关技术中,由于实际装配误差或环境因素等影响,容易出现三维图像重构误差,影响最终重构三维光场显示的图像质量,且由于无法实现基元图像和系统误差参数的联合优化,影响重构三维图像精确度等问题。
本申请第一方面实施例提供一种基于相机在环的三维光场显示方法,包括以下步骤:建立三维光场显示系统的三维光场图像数据集;根据所述三维光场显示系统的至少一个成像质量影响参数建立三维光场显示可学习的参数化物理模型,并搭建初始卷积神经网络;将所述三维光场图像数据集的部分数据输入至所述参数化物理模型和初始卷积神经网络,计算相应的基元图像,以采集多个视角下的真实显示的图像;以及根据所述多个视角下的真实显示的图像和对应的理想真值视差图像计算相应的视角误差和损失函数,并根据所述视角误差优化所述参数化物理模型且利用所述损失函数进行网络训练,直至达到对应的预设迭代停止条件,得到最终的参数化物理模型和卷积神经网络,以利用所述最终的参数化物理模型和卷积神经网络生成沉浸式三维光场显示效果。
可选地,在本申请的一个实施例中,所述至少一个成像质量影响参数包括透镜偏移量矩阵、单透镜覆盖像素范围和像差中的一个或多个,且所述三维光场图像数据集包括多个不同场景和每个场景下的多个视角的视差图。
可选地,在本申请的一个实施例中,所述将所述三维光场图像数据集的部分数据输入至所述参数化物理模型和初始卷积神经网络,包括:从所述多个不同场景中选取第一部分不同场景,将所述第一部分不同场景对应的多个视角的视差图输入至所述参数化物理模型,计算第一基元图像;从所述多个不同场景中选取第二部分不同场景,将所述第二部分不同场景对应的多个视角的视差图输入至所述初始卷积神经网络,计算第二基元图像。
可选地,在本申请的一个实施例中,所述参数化物理模型的优化公式为:
其中,θ为各项可学习参数,j为视角坐标,J为视角个数,为损失,/>为各个视角下真实显示的图像,/>为三维光场图像数据集;
所述损失函数为:
其中,为损失函数,loss为损失函数计算过程,/>为各个视角下真实显示的图像,/>为三维光场图像数据集。
本申请第二方面实施例提供一种基于相机在环的三维光场显示装置,包括:第一构建模块,用于建立三维光场显示系统的三维光场图像数据集;第二构建模块,用于根据所述三维光场显示系统的至少一个成像质量影响参数建立三维光场显示可学习的参数化物理模型,并搭建初始卷积神经网络;计算模块,用于将所述三维光场图像数据集的部分数据输入至所述参数化物理模型和初始卷积神经网络,计算相应的基元图像,以采集多个视角下的真实显示的图像;以及生成模块,用于根据所述多个视角下的真实显示的图像和对应的理想真值视差图像计算相应的视角误差和损失函数,并根据所述视角误差优化所述参数化物理模型且利用所述损失函数进行网络训练,直至达到对应的预设迭代停止条件,得到最终的参数化物理模型和卷积神经网络,以利用所述最终的参数化物理模型和卷积神经网络生成沉浸式三维光场显示效果。
可选地,在本申请的一个实施例中,所述至少一个成像质量影响参数包括透镜偏移量矩阵、单透镜覆盖像素范围和像差中的一个或多个,且所述三维光场图像数据集包括多个不同场景和每个场景下的多个视角的视差图。
可选地,在本申请的一个实施例中,所述计算模块包括:第一计算单元,用于从所述多个不同场景中选取第一部分不同场景,将所述第一部分不同场景对应的多个视角的视差图输入至所述参数化物理模型,计算第一基元图像;第二计算单元,用于从所述多个不同场景中选取第二部分不同场景,将所述第二部分不同场景对应的多个视角的视差图输入至所述初始卷积神经网络,计算第二基元图像。
可选地,在本申请的一个实施例中,所述参数化物理模型的优化公式为:
其中,θ为各项可学习参数,j为视角坐标,J为视角个数,为损失,/>为各个视角下真实显示的图像,/>为三维光场图像数据集;
所述损失函数为:
其中,为损失函数,loss为损失函数计算过程,/>为各个视角下真实显示的图像,/>为三维光场图像数据集。
本申请第三方面实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如上述实施例所述的基于相机在环的三维光场显示方法。
本申请第四方面实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机程序,该程序被处理器执行时实现如上的基于相机在环的三维光场显示方法。
本申请实施例可以通过建立三维光场显示系统的三维光场图像数据集,建立三维光场显示可学习的参数化物理模型并搭建初始卷积神经网络,将数据集的部分数据输入至参数化物理模型和初始卷积神经网络并计算相应的基元图像,计算相应的视角误差和损失函数并进行网络训练直至达到迭代停止条件,得到最终的参数化物理模型和卷积神经网络,能够提升仿真参数与实际系统参数的一致性,并改善基元图像重构三维图像的质量,从而实现高质量沉浸式三维光场显示效果。由此,解决了相关技术中,由于实际装配误差或环境因素等影响,容易出现三维图像重构误差,影响最终重构三维光场显示的图像质量,且由于无法实现基元图像和系统误差参数的联合优化,影响重构三维图像精确度等问题。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本申请实施例提供的一种基于相机在环的三维光场显示方法的流程图;
图2为根据本申请实施例提供的基于相机在环的三维光场显示方法的流程图;
图3为根据本申请实施例提供的一种基于相机在环的三维光场显示装置的结构示意图;
图4为根据本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的基于相机在环的三维光场显示方法、装置、电子设备及存储介质。针对上述背景技术中心提到的相关技术中,由于实际装配误差或环境因素等影响,容易出现三维图像重构误差,影响最终重构三维光场显示的图像质量,且由于无法实现基元图像和系统误差参数的联合优化,影响重构三维图像精确度的问题,本申请提供了一种基于相机在环的三维光场显示方法,在该方法中,可以通过建立三维光场显示系统的三维光场图像数据集,建立三维光场显示可学习的参数化物理模型并搭建初始卷积神经网络,将数据集的部分数据输入至参数化物理模型和初始卷积神经网络并计算相应的基元图像,计算相应的视角误差和损失函数并进行网络训练直至达到迭代停止条件,得到最终的参数化物理模型和卷积神经网络,能够提升仿真参数与实际系统参数的一致性,并改善基元图像重构三维图像的质量,从而实现高质量沉浸式三维光场显示效果。由此,解决了相关技术中,由于实际装配误差或环境因素等影响,容易出现三维图像重构误差,影响最终重构三维光场显示的图像质量,且由于无法实现基元图像和系统误差参数的联合优化,影响重构三维图像精确度等问题。
具体而言,图1为本申请实施例所提供的一种基于相机在环的三维光场显示方法的流程示意图。
如图1所示,该基于相机在环的三维光场显示方法包括以下步骤:
在步骤S101中,建立三维光场显示系统的三维光场图像数据集。
可以理解的是,三维光场图像数据集包括多个不同场景和每个场景下的多个视角的视差图。
具体地,本申请实施例可以建立三维光场显示系统的三维光场图像数据集且数据集中共有K个不同场景,每个场景下共有J个视角的视差图。
本申请实施例通过建立三维光场显示系统的三维光场图像数据集,有利于提高光场图像的多样性和真实性,并可以为后续构建提供信息基础。
在步骤S102中,根据三维光场显示系统的至少一个成像质量影响参数建立三维光场显示可学习的参数化物理模型,并搭建初始卷积神经网络。
具体地,本申请实施例可以根据三维光场显示系统中影响最终成像质量的透镜偏移量矩阵、单透镜覆盖像素范围和像差等各项参数θ,建立三维光场显示可学习的参数化物理模型并搭建初始卷积神经网络。
本申请实施例可以根据三维光场显示系统的至少一个成像质量影响参数建立三维光场显示可学习的参数化物理模型,利用优化算法对物理模型中的各项参数进行优化,可以与实际三维光场显示系统参数进行有效匹配,保证实际显示效果与仿真显示效果的一致性,有利于提高成像质量,并搭建初始卷积神经网络,可以提升模型的性能和泛化能力,并有效提高应对复杂问题的能力。
可选地,在本申请的一个实施例中,至少一个成像质量影响参数包括透镜偏移量矩阵、单透镜覆盖像素范围和像差中的一个或多个,且三维光场图像数据集包括多个不同场景和每个场景下的多个视角的视差图。
可以理解的是,透镜偏移量矩阵描述了透镜系统中每个透镜的位置,用于调整光场图像的焦距和聚焦效果,单透镜覆盖像素范围定义了每个透镜覆盖的像素数量,影响分辨率和清晰度,像差指光学系统中的误差,导致图像畸变和模糊。
本申请实施例根据透镜偏移量矩阵、单透镜覆盖像素范围和像差等成像质量影响参数,可以能够调整光场图像的焦距和聚焦效果,提高分辨率并降低畸变,从而提高图像的清晰度和准确度。
在步骤S103中,将三维光场图像数据集的部分数据输入至参数化物理模型和初始卷积神经网络,计算相应的基元图像,以采集多个视角下的真实显示的图像。
具体地,本申请实施例可以将三维光场图像数据集的部分数据输入至参数化物理模型和初始卷积神经网络,计算相应的基元图像,以采集多个视角下的真实显示的图像,例如,选取第k个场景,输入图像至可学习参数化物理模型/>计算相应的基元图像EI,其中,公式可以如下:
进一步地,通过实际设备进行显示,能够采集各个视角下真实显示的图像
本申请实施例可以将三维光场图像数据集的部分数据输入至参数化物理模型和初始卷积神经网络,有利于提高相应的基元图像的计算速度,能够提升重构三维光场图像的精确度,从而改善重构三维图像质量,进而实现真实、自然、身临其境的高质量三维光场显示。
可选地,在本申请的一个实施例中,将三维光场图像数据集的部分数据输入至参数化物理模型和初始卷积神经网络,包括:从多个不同场景中选取第一部分不同场景,将第一部分不同场景对应的多个视角的视差图输入至参数化物理模型,计算第一基元图像;从多个不同场景中选取第二部分不同场景,将第二部分不同场景对应的多个视角的视差图输入至初始卷积神经网络,计算第二基元图像。
本申请实施例通过根据第一部分和第二部分不同场景的视差图像,分别输入参数化物理模型和初始卷积神经网络,计算得到对应的基元图像,可以实现场景特定的优化和适应性,增加数据集的多样性和训练数据的增强,从而能够提高光场显示系统的图像质量和视觉效果。
在步骤S104中,根据多个视角下的真实显示的图像和对应的理想真值视差图像计算相应的视角误差和损失函数,并根据视角误差优化参数化物理模型且利用损失函数进行网络训练,直至达到对应的预设迭代停止条件,得到最终的参数化物理模型和卷积神经网络,以利用最终的参数化物理模型和卷积神经网络生成沉浸式三维光场显示效果。
可以理解的是,预设迭代停止条件指的是预先设定的训练终止条件,包括固定迭代次数等。
具体地,结合图2所示,本申请实施例可以根据多个视角下的真实显示的图像和对应的理想真值视差图像,计算相应的视角误差,并设定适当的损失函数来衡量模型的性能,通过优化参数化物理模型和训练卷积神经网络,可以最小化视角误差并提高光场显示系统的效果,其中,具体步骤如下:
步骤S1:建立三维光场图像数据集。
具体地,建立三维光场图像数据集该数据集中共有K个不同场景,每个场景下共有J个视角的视差图。
步骤S2:建立三维光场显示可学习的参数化物理模型。
具体地,根据三维光场显示系统中影响最终成像质量的透镜偏移量矩阵、单透镜覆盖像素范围和像差等各项参数θ,建立三维光场显示可学习的参数化物理模型
步骤S3:计算相应的基元图像EI。
具体地,选取第k个场景,输入图像至可学习参数化物理模型/>计算相应的基元图像EI,其中,公式可以如下:
进一步地,通过实际设备进行显示,能够采集各个视角下真实显示的图像
步骤S4:计算相应视角下的误差。
具体地,根据实验系统采集的图像和采集的理想真值视差图像 可以计算相应视角下的误差,通过梯度下降等方法进行优化:
其中,θ为各项可学习参数,j为视角坐标,J为视角个数,为损失,/>为各个视角下真实显示的图像,/>为三维光场图像数据集;
步骤S5:获取训练好的物理模型。
具体地,根据三维光场图像数据集设定相应的训练迭代次数,重复步骤S3-S4,可以优化物理模型/>中的各项可学习参数θ,进而得到训练好的物理模型/>
步骤S6:计算相应的基元图像,并得到网络输出基元图像。
具体地,通过搭建卷积神经网络模型CNN,可以选取第k个场景,输入图像 至训练好的物理模型/>可以计算相应的基元图像/>其中,公式可以如下:
进一步地,可以将基元图像输入至卷积神经网络CNN,得到网络输出基元图像其中,公式可以如下:
步骤S7:采集各个视角下真实显示的图像。
具体地,可以将网络输出基元图像加载至实验设备并采集各个视角下真实显示的图像/>
步骤S8:计算相应视角下的损失函数。
具体地,根据实验系统采集的图像和真值图像/>可以计算相应视角下的损失函数,其中,公式可以如下:
其中,为损失函数,loss为损失函数计算过程,/>为各个视角下真实显示的图像,/>为三维光场图像数据集。
步骤S9:基于损失函数对卷积神经网络CNN进行训练。
具体地,针对全部场景,可以重复步骤S6-S8对卷积神经网络进行训练,训练结束后利用物理模型和卷积神经网络CNN可实现高质量沉浸式三维光场显示效果。
本申请实施例可以通过计算视角误差、定义损失函数,并利用最终优化的参数化物理模型和卷积神经网络,可以提高生成基元图像的质量和真实性,从而能够实现更好的沉浸式三维光场显示效果。
可选地,在本申请的一个实施例中,参数化物理模型的优化公式为:
其中,θ为各项可学习参数,j为视角坐标,J为视角个数,为损失,/>为各个视角下真实显示的图像,/>为三维光场图像数据集;
损失函数为:
其中,为损失函数,loss为损失函数计算过程,/>为各个视角下真实显示的图像,/>为三维光场图像数据集。
本申请实施例通过对参数化物理模型进行优化,可以提高模型的准确性和精度,能够图像的清晰度和细节性,并可以降低计算复杂度,提高计算速度和效率,通过损失函数的优化,可以减少误差,改善模型的性能,可以减少优化过程中的震荡和不稳定性,进而提高收敛速度和鲁棒性。
结合图2所示,以一个实施例对本申请实施例的基于相机在环的三维光场显示方法进行详细阐述。
具体地,本申请实施例可以通过建立可学习的参数化物理模型和卷积神经网络模型,提升仿真参数与实际系统参数的一致性,并改善基元图像重构三维图像的质量,从而实现高质量沉浸式三维光场显示效果,其中,具体步骤如下:
步骤S1:建立三维光场图像数据集。
具体地,建立三维光场图像数据集该数据集中共有K个不同场景,每个场景下共有J个视角的视差图。
步骤S2:建立三维光场显示可学习的参数化物理模型。
具体地,根据三维光场显示系统中影响最终成像质量的透镜偏移量矩阵、单透镜覆盖像素范围和像差等各项参数θ,建立三维光场显示可学习的参数化物理模型
步骤S3:计算相应的基元图像EI。
具体地,选取第k个场景,输入图像至可学习参数化物理模型/>计算相应的基元图像EI,其中,公式可以如下:
进一步地,通过实际设备进行显示,能够采集各个视角下真实显示的图像
步骤S4:计算相应视角下的误差。
具体地,根据实验系统采集的图像和采集的理想真值视差图像 可以计算相应视角下的误差,通过梯度下降等方法进行优化:
其中,θ为各项可学习参数,j为视角坐标,J为视角个数,为损失,/>为各个视角下真实显示的图像,/>为三维光场图像数据集;
步骤S5:获取训练好的物理模型。
具体地,根据三维光场图像数据集设定相应的训练迭代次数,重复步骤S3-S4,可以优化物理模型/>中的各项可学习参数θ,进而得到训练好的物理模型/>
步骤S6:计算相应的基元图像,并得到网络输出基元图像。
具体地,通过搭建卷积神经网络模型CNN,并选取第k个场景,输入图像 至训练好的物理模型/>可以计算相应的基元图像/>其中,公式可以如下:
进一步地,可以将基元图像输入至卷积神经网络CNN,得到网络输出基元图像其中,公式可以如下:
步骤S7:采集各个视角下真实显示的图像。
具体地,可以将网络输出基元图像加载至实验设备并采集各个视角下真实显示的图像/>
步骤S8:计算相应视角下的损失函数。
具体地,根据实验系统采集的图像和真值图像/>可以计算相应视角下的损失函数,其中,公式可以如下:
其中,为损失函数,loss为损失函数计算过程,/>为各个视角下真实显示的图像,/>为三维光场图像数据集。
步骤S9:基于损失函数对卷积神经网络CNN进行训练。
具体地,针对全部场景,可以重复步骤S6-S8对卷积神经网络进行训练,训练结束后利用物理模型和卷积神经网络CNN可实现高质量沉浸式三维光场显示效果。
根据本申请实施例提出的基于相机在环的三维光场显示方法,可以通过建立三维光场显示系统的三维光场图像数据集,建立三维光场显示可学习的参数化物理模型并搭建初始卷积神经网络,将数据集的部分数据输入至参数化物理模型和初始卷积神经网络并计算相应的基元图像,计算相应的视角误差和损失函数并进行网络训练直至达到迭代停止条件,得到最终的参数化物理模型和卷积神经网络,能够提升仿真参数与实际系统参数的一致性,并改善基元图像重构三维图像的质量,从而实现高质量沉浸式三维光场显示效果。由此,解决了相关技术中,由于实际装配误差或环境因素等影响,容易出现三维图像重构误差,影响最终重构三维光场显示的图像质量,且由于无法实现基元图像和系统误差参数的联合优化,影响重构三维图像精确度等问题。
其次参照附图描述根据本申请实施例提出的基于相机在环的三维光场显示装置。
图3是本申请实施例的基于相机在环的三维光场显示装置的结构示意图。
如图3所示,该基于相机在环的三维光场显示装置10包括:第一构建模块100、第二构建模块200、计算模块300和生成模块400。
具体地,第一构建模块100,用于建立三维光场显示系统的三维光场图像数据集;
第二构建模块200,用于根据三维光场显示系统的至少一个成像质量影响参数建立三维光场显示可学习的参数化物理模型,并搭建初始卷积神经网络;
计算模块300,用于将三维光场图像数据集的部分数据输入至参数化物理模型和初始卷积神经网络,计算相应的基元图像,以采集多个视角下的真实显示的图像;以及
生成模块400,用于根据多个视角下的真实显示的图像和对应的理想真值视差图像计算相应的视角误差和损失函数,并根据视角误差优化参数化物理模型且利用损失函数进行网络训练,直至达到对应的预设迭代停止条件,得到最终的参数化物理模型和卷积神经网络,以利用最终的参数化物理模型和卷积神经网络生成沉浸式三维光场显示效果。
可选地,在本申请的一个实施例中,至少一个成像质量影响参数包括透镜偏移量矩阵、单透镜覆盖像素范围和像差中的一个或多个,且三维光场图像数据集包括多个不同场景和每个场景下的多个视角的视差图。
可选地,在本申请的一个实施例中,计算模块300包括:第一计算单元和第二计算单元。
其中,第一计算单元,用于从多个不同场景中选取第一部分不同场景,将第一部分不同场景对应的多个视角的视差图输入至参数化物理模型,计算第一基元图像;
第二计算单元,用于从多个不同场景中选取第二部分不同场景,将第二部分不同场景对应的多个视角的视差图输入至初始卷积神经网络,计算第二基元图像。
可选地,在本申请的一个实施例中,参数化物理模型的优化公式为:
其中,θ为各项可学习参数,j为视角坐标,J为视角个数,为损失,/>为各个视角下真实显示的图像,/>为三维光场图像数据集;
损失函数为:
其中,为损失函数,loss为损失函数计算过程,/>为各个视角下真实显示的图像,/>为三维光场图像数据集。
需要说明的是,前述对基于相机在环的三维光场显示方法实施例的解释说明也适用于该实施例的基于相机在环的三维光场显示装置,此处不再赘述。
根据本申请实施例提出的基于相机在环的三维光场显示装置,可以通过建立三维光场显示系统的三维光场图像数据集,建立三维光场显示可学习的参数化物理模型并搭建初始卷积神经网络,将数据集的部分数据输入至参数化物理模型和初始卷积神经网络并计算相应的基元图像,计算相应的视角误差和损失函数并进行网络训练直至达到迭代停止条件,得到最终的参数化物理模型和卷积神经网络,能够提升仿真参数与实际系统参数的一致性,并改善基元图像重构三维图像的质量,从而实现高质量沉浸式三维光场显示效果。由此,解决了相关技术中,由于实际装配误差或环境因素等影响,容易出现三维图像重构误差,影响最终重构三维光场显示的图像质量,且由于无法实现基元图像和系统误差参数的联合优化,影响重构三维图像精确度等问题。
图4为本申请实施例提供的电子设备的结构示意图。该电子设备可以包括:
存储器401、处理器402及存储在存储器401上并可在处理器402上运行的计算机程序。
处理器402执行程序时实现上述实施例中提供的基于相机在环的三维光场显示方法。
进一步地,电子设备还包括:
通信接口403,用于存储器401和处理器402之间的通信。
存储器401,用于存放可在处理器402上运行的计算机程序。
存储器401可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
如果存储器401、处理器402和通信接口403独立实现,则通信接口403、存储器401和处理器402可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(Industry Standard Architecture,简称为ISA)总线、外部设备互连(PeripheralComponent Interconnect,简称为PCI)总线或扩展工业标准体系结构(Extended IndustryStandard Architecture,简称为EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选地,在具体实现上,如果存储器401、处理器402及通信接口403,集成在一块芯片上实现,则存储器401、处理器402及通信接口403可以通过内部接口完成相互间的通信。
处理器402可能是一个中央处理器(Central Processing Unit,简称为CPU),或者是特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上的基于相机在环的三维光场显示方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或N个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“N个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或N个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或N个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,N个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或多项的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种基于相机在环的三维光场显示方法,其特征在于,包括以下步骤:
建立三维光场显示系统的三维光场图像数据集;
根据所述三维光场显示系统的至少一个成像质量影响参数建立三维光场显示可学习的参数化物理模型,并搭建初始卷积神经网络;
将所述三维光场图像数据集的部分数据输入至所述参数化物理模型和初始卷积神经网络,计算相应的基元图像,以采集多个视角下的真实显示的图像;以及
根据所述多个视角下的真实显示的图像和对应的理想真值视差图像计算相应的视角误差和损失函数,并根据所述视角误差优化所述参数化物理模型且利用所述损失函数进行网络训练,直至达到对应的预设迭代停止条件,得到最终的参数化物理模型和卷积神经网络,以利用所述最终的参数化物理模型和卷积神经网络生成沉浸式三维光场显示效果。
2.根据权利要求1所述的方法,其特征在于,所述至少一个成像质量影响参数包括透镜偏移量矩阵、单透镜覆盖像素范围和像差中的一个或多个,且所述三维光场图像数据集包括多个不同场景和每个场景下的多个视角的视差图。
3.根据权利要求2所述的方法,其特征在于,所述将所述三维光场图像数据集的部分数据输入至所述参数化物理模型和初始卷积神经网络,包括:
从所述多个不同场景中选取第一部分不同场景,将所述第一部分不同场景对应的多个视角的视差图输入至所述参数化物理模型,计算第一基元图像;
从所述多个不同场景中选取第二部分不同场景,将所述第二部分不同场景对应的多个视角的视差图输入至所述初始卷积神经网络,计算第二基元图像。
4.根据权利要求1所述的方法,其特征在于,其中,
所述参数化物理模型的优化公式为:
其中,θ为各项可学习参数,j为视角坐标,J为视角个数,为损失,/>为各个视角下真实显示的图像,/>为三维光场图像数据集;
所述损失函数为:
其中,为损失函数,loss为损失函数计算过程,/>为各个视角下真实显示的图像,/>为三维光场图像数据集。
5.一种基于相机在环的三维光场显示装置,其特征在于,包括:
第一构建模块,用于建立三维光场显示系统的三维光场图像数据集;
第二构建模块,用于根据所述三维光场显示系统的至少一个成像质量影响参数建立三维光场显示可学习的参数化物理模型,并搭建初始卷积神经网络;
计算模块,用于将所述三维光场图像数据集的部分数据输入至所述参数化物理模型和初始卷积神经网络,计算相应的基元图像,以采集多个视角下的真实显示的图像;以及
生成模块,用于根据所述多个视角下的真实显示的图像和对应的理想真值视差图像计算相应的视角误差和损失函数,并根据所述视角误差优化所述参数化物理模型且利用所述损失函数进行网络训练,直至达到对应的预设迭代停止条件,得到最终的参数化物理模型和卷积神经网络,以利用所述最终的参数化物理模型和卷积神经网络生成沉浸式三维光场显示效果。
6.根据权利要求5所述的装置,其特征在于,所述至少一个成像质量影响参数包括透镜偏移量矩阵、单透镜覆盖像素范围和像差中的一个或多个,且所述三维光场图像数据集包括多个不同场景和每个场景下的多个视角的视差图。
7.根据权利要求6所述的装置,其特征在于,所述计算模块包括:
第一计算单元,用于从所述多个不同场景中选取第一部分不同场景,将所述第一部分不同场景对应的多个视角的视差图输入至所述参数化物理模型,计算第一基元图像;
第二计算单元,用于从所述多个不同场景中选取第二部分不同场景,将所述第二部分不同场景对应的多个视角的视差图输入至所述初始卷积神经网络,计算第二基元图像。
8.根据权利要求5所述的装置,其特征在于,其中,
所述参数化物理模型的优化公式为:
其中,θ为各项可学习参数,j为视角坐标,J为视角个数,为损失,/>为各个视角下真实显示的图像,/>为三维光场图像数据集;
所述损失函数为:
其中,为损失函数,loss为损失函数计算过程,/>为各个视角下真实显示的图像,/>为三维光场图像数据集。
9.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求1-4任一项所述的基于相机在环的三维光场显示方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以用于实现如权利要求1-4任一项所述的基于相机在环的三维光场显示方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311841647.2A CN118015179A (zh) | 2023-12-28 | 2023-12-28 | 基于相机在环的三维光场显示方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311841647.2A CN118015179A (zh) | 2023-12-28 | 2023-12-28 | 基于相机在环的三维光场显示方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118015179A true CN118015179A (zh) | 2024-05-10 |
Family
ID=90947823
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311841647.2A Pending CN118015179A (zh) | 2023-12-28 | 2023-12-28 | 基于相机在环的三维光场显示方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118015179A (zh) |
-
2023
- 2023-12-28 CN CN202311841647.2A patent/CN118015179A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110349251B (zh) | 一种基于双目相机的三维重建方法及装置 | |
US11861813B2 (en) | Image distortion correction method and apparatus | |
US10726580B2 (en) | Method and device for calibration | |
EP3693768A1 (en) | Dual-core focusing image sensor, focusing control method for the same, and electronic device | |
CN104363986A (zh) | 一种图像处理方法和设备 | |
CN114511605B (zh) | 光场深度估计方法、装置、电子设备及存储介质 | |
CN110619660A (zh) | 一种物体定位方法、装置、计算机可读存储介质及机器人 | |
CN110136048B (zh) | 一种图像配准方法及系统、存储介质及终端 | |
CN109064392A (zh) | 确定单应矩阵的方法及其系统以及图像转换方法及其系统 | |
CN112509106A (zh) | 文档图片展平方法、装置以及设备 | |
CN112991515A (zh) | 一种三维重建方法、装置及相关设备 | |
CN114494258B (zh) | 镜头的像差预测和图像重建方法及装置 | |
CN114885144B (zh) | 基于数据融合的高帧率3d视频生成方法及装置 | |
CN116579962A (zh) | 一种基于鱼眼相机的全景感知方法、装置、设备及介质 | |
CN114972634A (zh) | 基于特征体素融合的多视角三维可变形人脸重建方法 | |
CN113658091A (zh) | 一种图像评价方法、存储介质及终端设备 | |
CN117274514A (zh) | 基于地空视角几何变换的遥感图像生成方法及装置 | |
CN116912391A (zh) | 结合神经辐射场和可导路径跟踪的逆向渲染方法及装置 | |
CN116503553A (zh) | 一种基于双目视觉和扩散模型的三维重建方法及装置 | |
CN116385369A (zh) | 深度图像质量评价方法、装置、电子设备及存储介质 | |
CN118015179A (zh) | 基于相机在环的三维光场显示方法、装置、设备及介质 | |
WO2022247394A1 (zh) | 图像拼接方法及装置、存储介质及电子设备 | |
CN115713678A (zh) | 一种箭头图片数据增广方法、系统、电子设备及存储介质 | |
CN115239559A (zh) | 一种融合视图合成的深度图超分辨率方法及系统 | |
CN114339205A (zh) | 一种测试图生成方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |