CN117372592A - 基于色差线索与神经网络的光场三维重建方法及装置 - Google Patents
基于色差线索与神经网络的光场三维重建方法及装置 Download PDFInfo
- Publication number
- CN117372592A CN117372592A CN202311125066.9A CN202311125066A CN117372592A CN 117372592 A CN117372592 A CN 117372592A CN 202311125066 A CN202311125066 A CN 202311125066A CN 117372592 A CN117372592 A CN 117372592A
- Authority
- CN
- China
- Prior art keywords
- neural network
- dimensional reconstruction
- network model
- preset
- dimensional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 48
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000003062 neural network model Methods 0.000 claims abstract description 100
- 238000012549 training Methods 0.000 claims abstract description 31
- 230000006870 function Effects 0.000 claims description 30
- 238000011156 evaluation Methods 0.000 claims description 29
- 238000005457 optimization Methods 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 7
- 238000003860 storage Methods 0.000 claims description 6
- 230000004075 alteration Effects 0.000 description 20
- 230000008569 process Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 238000003384 imaging method Methods 0.000 description 12
- 230000003287 optical effect Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T15/00—3D [Three Dimensional] image rendering
- G06T15/005—General purpose rendering architectures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T17/00—Three dimensional [3D] modelling, e.g. data description of 3D objects
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computer Graphics (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Geometry (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Processing (AREA)
Abstract
本申请涉及光场三维重建技术领域,特别涉及一种基于色差线索与神经网络的光场三维重建方法及装置,其中,方法包括:基于预设波长数据集遍历并迭代优化目标波长数目与对应的波长数值;根据目标波长数目与对应的波长数值生成五维光场数据,利用五维光场数据训练预设三维重建神经网络模型得到训练后的三维重建神经网络模型;在训练后的三维重建神经网络模型中遍历预设波长数据集,得到优化后的三维重建神经网络模型,生成光场三维重建图像。本申请实施例可选取波长的数量并取值,得到五维光场数据,通过模拟不同色差模糊,结合神经网络算法抓取色差线索中的三维场景信息,实现更加精确的光场三维重建,提升了光场三维重建结果的分辨率。
Description
技术领域
本申请涉及光场三维重建技术领域,特别涉及一种基于色差线索与神经网络的光场三维重建方法及装置。
背景技术
光场三维重建在智能制造、机器人视觉、自动驾驶、工业检测、航空探测及脑与神经科学等领域具有重要的应用价值,可通过4D光场数据的三维重建方法,从观测图像出发,采用迭代优化方法重建三维场景。
然而,相关技术中,因基于四维光场数据的三维重建较少考虑到多波长的联合重建,而成像过程中难以实现光学像差与色差模糊的完全清除,又未能有效利用色差模糊中蕴含的真实场景信息,导致三维重建结果的精确性下降,无法实现光场三维重建的多波长的联合重建,影响了光场三维重建的分辨率精度,亟待解决。
发明内容
本申请提供一种基于色差线索与神经网络的光场三维重建方法及装置,以解决相关技术中,因基于四维光场数据的三维重建较少考虑到多波长的联合重建,而成像过程中难以实现光学像差与色差模糊的完全清除,又未能有效利用色差模糊中蕴含的真实场景信息,导致三维重建结果的精确性下降,无法实现光场三维重建的多波长的联合重建,影响了光场三维重建的分辨率精度等问题。
本申请第一方面实施例提供一种基于色差线索与神经网络的光场三维重建方法,包括以下步骤:基于预设波长数据集遍历并迭代优化,生成目标波长数目与对应的波长数值;根据所述目标波长数目与对应的波长数值生成五维光场数据,利用所述五维光场数据训练预设三维重建神经网络模型,以得到训练后的三维重建神经网络模型;在所述训练后的三维重建神经网络模型中遍历所述预设波长数据集,得到优化后的三维重建神经网络模型,利用所述优化后的三维重建神经网络模型生成光场三维重建图像。
可选地,在本申请的一个实施例中,所述基于预设波长数据集遍历并迭代优化,生成目标波长数目与对应的波长数值,包括:在所述预设波长数据集中遍历预设区间内的波长数目,并基于所述波长数目选取所述对应的波长数值;结合相机参数,利用预设第一评价函数对所述波长数目与对应的波长数值进行迭代优化,直至达到预设迭代停止条件,得到所述目标波长数目与对应的波长数值。
可选地,在本申请的一个实施例中,所述利用所述五维光场数据训练预设三维重建神经网络模型,包括:将所述五维光场数据输入所述预设三维重建神经网络模型中,输出所述五维光场数据的重建结果;基于所述重建结果,利用预设第二评价函数训练所述预设三维重建神经网络模型,以获得所述训练后的三维重建神经网络模型。
可选地,在本申请的一个实施例中,所述在所述训练后的三维重建神经网络模型中遍历所述预设波长数据集,得到优化后的三维重建神经网络模型,包括:获取所述预设波长数据集内所有波长数目与对应的波长数值的选取结果,将所述选取结果输入所述训练后的三维重建神经网络模型,得到所述训练后的三维重建神经网络模型的输出结果;基于所述输出结果,利用预设第三评价函数优化所述训练后的三维重建神经网络模型,直至所述训练后的三维重建神经网络模型满足预设优化条件,得到所述优化后的三维重建神经网络模型。
本申请第二方面实施例提供一种基于色差线索与神经网络的光场三维重建装置,包括:生成模块,用于基于预设波长数据集遍历并迭代优化,生成目标波长数目与对应的波长数值;训练模块,用于根据所述目标波长数目与对应的波长数值生成五维光场数据,利用所述五维光场数据训练预设三维重建神经网络模型,以得到训练后的三维重建神经网络模型;重建模块,用于在所述训练后的三维重建神经网络模型中遍历所述预设波长数据集,得到优化后的三维重建神经网络模型,利用所述优化后的三维重建神经网络模型生成光场三维重建图像。
可选地,在本申请的一个实施例中,所述生成模块包括:选取单元,用于在所述预设波长数据集中遍历预设区间内的波长数目,并基于所述波长数目选取所述对应的波长数值;迭代单元,用于结合相机参数,利用预设第一评价函数对所述波长数目与对应的波长数值进行迭代优化,直至达到预设迭代停止条件,得到所述目标波长数目与对应的波长数值。
可选地,在本申请的一个实施例中,所述训练模块包括:输出单元,用于将所述五维光场数据输入所述预设三维重建神经网络模型中,输出所述五维光场数据的重建结果;训练单元,用于基于所述重建结果,利用预设第二评价函数训练所述预设三维重建神经网络模型,以获得所述训练后的三维重建神经网络模型。
可选地,在本申请的一个实施例中,所述重建模块包括:获取单元,用于获取所述预设波长数据集内所有波长数目与对应的波长数值的选取结果,将所述选取结果输入所述训练后的三维重建神经网络模型,得到所述训练后的三维重建神经网络模型的输出结果;优化单元,用于基于所述输出结果,利用预设第三评价函数优化所述训练后的三维重建神经网络模型,直至所述训练后的三维重建神经网络模型满足预设优化条件,得到所述优化后的三维重建神经网络模型。
本申请第三方面实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如上述实施例所述的基于色差线索与神经网络的光场三维重建方法。
本申请第四方面实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机程序,该程序被处理器执行时实现如上的基于色差线索与神经网络的光场三维重建方法。
本申请实施例可选取波长的数量并取值,得到五维光场数据,通过模拟不同色差模糊,结合神经网络算法抓取色差线索中的三维场景信息,实现更加精确的光场三维重建,提升了光场三维重建结果的分辨率。由此,解决了相关技术中,因基于四维光场数据的三维重建较少考虑到多波长的联合重建,而成像过程中难以实现光学像差与色差模糊的完全清除,又未能有效利用色差模糊中蕴含的真实场景信息,导致三维重建结果的精确性下降,无法实现光场三维重建的多波长的联合重建,影响了光场三维重建的分辨率精度等问题。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本申请实施例提供的一种基于色差线索与神经网络的光场三维重建方法的流程图;
图2为本申请一个实施例的波长数目与数值的迭代初始化原理示意图;
图3为本申请一个实施例的三维重建深度神经网络训练原理示意图;
图4为本申请一个实施例的三维重建深度神经网络联合优化原理示意图;
图5为本申请一个实施例的基于色差线索与神经网络的光场三维重建原理的示意图;
图6为根据本申请实施例的基于色差线索与神经网络的光场三维重建装置的结构示意图;
图7为根据本申请实施例的电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的基于色差线索与神经网络的光场三维重建方法及装置。针对上述背景技术中提到的相关技术中,因基于四维光场数据的三维重建较少考虑到多波长的联合重建,而成像过程中难以实现光学像差与色差模糊的完全清除,又未能有效利用色差模糊中蕴含的真实场景信息,导致三维重建结果的精确性下降,无法实现光场三维重建的多波长的联合重建,影响了光场三维重建的分辨率精度的问题,本申请提供了一种基于色差线索与神经网络的光场三维重建方法,可选取波长的数量并取值,得到五维光场数据,通过模拟不同色差模糊,结合神经网络算法抓取色差线索中的三维场景信息,实现更加精确的光场三维重建,提升了光场三维重建结果的分辨率。由此,解决了相关技术中,因基于四维光场数据的三维重建较少考虑到多波长的联合重建,而成像过程中难以实现光学像差与色差模糊的完全清除,又未能有效利用色差模糊中蕴含的真实场景信息,导致三维重建结果的精确性下降,无法实现光场三维重建的多波长的联合重建,影响了光场三维重建的分辨率精度等问题。
具体而言,图1为本申请实施例所提供的一种基于色差线索与神经网络的光场三维重建方法的流程示意图。
如图1所示,该基于色差线索与神经网络的光场三维重建方法包括以下步骤:
在步骤S101中,基于预设波长数据集遍历并迭代优化,生成目标波长数目与对应的波长数值。
需要说明的是,预设波长数据集可由本领域技术人员根据实际情况进行设置,在此不作具体限定。
可以理解的是,在本申请实施例中,可以将同一相机所得波长数据作为预设波长数据集,在预设波长数据集中选取目标波长数目与对应的波长数值,进行遍历并迭代优化,以选取最优波长的数量,且波长数量对应具体的波长取值,即波长的总数目为N,对应N个波长取值。
可选地,在本申请的一个实施例中,基于预设波长数据集遍历并迭代优化,生成目标波长数目与对应的波长数值,包括:在预设波长数据集中遍历预设区间内的波长数目,并基于波长数目选取对应的波长数值;结合相机参数,利用预设第一评价函数对波长数目与对应的波长数值进行迭代优化,直至达到预设迭代停止条件,得到目标波长数目与对应的波长数值。
需要说明的是,预设区间、预设第一评价函数和预设迭代停止条件可由本领域技术人员根据实际情况进行设置,在此不作具体限定。
在实际执行过程中,如图2所示,为本申请一个实施例的波长数目与数值的迭代初始化原理示意图,可以通过随机整数生成器生成波长的总数目N,并选取预设区间[2,8]的某一整数,然后在可见光及近红外波段内确定可选择的波长值,从这些可选取波长构成的离散波长排列组合集合中选取N个可选择波长,例如可以按照排列组合依次选取。进而结合选取的波长数目以及波长取值以及相机其它参数,输入光场成像生成模型,用以生成大小为H×W×U×V×N的5D光场数据,其中H和W分别表示光场图像的高度和宽度,U和V分别表示两个垂直方向的视角个数,N为波长的数目。
其中,所采用的光场成像生成模型可通过模拟仿真方法,采用RL(Richardson-Lucy)解卷积重建算法对五维光场数据进行重建,通过将不同波长下的RL重建结果进行融合,得到一个初步的重建结果,通过损失函数作为预设第一评价函数与真实场景值(真值)比较,得到如信噪比SNR(Signal-to-Noise Ratio)、相似度度量值SSIM(StructureSimilarity Index Measure)等作为评价结果,分别迭代优化波长的数目(迭代2)和具体的波长大小(迭代1),直至达到预设迭代停止条件,得到目标波长数目与对应的波长数值。
在步骤S102中,根据目标波长数目与对应的波长数值生成五维光场数据,利用五维光场数据训练预设三维重建神经网络模型,以得到训练后的三维重建神经网络模型。
需要说明的是,预设三维重建神经网络模型可由本领域技术人员根据实际情况进行设置,在此不作具体限定。
可以理解的是,在本申请实施例中,可以基于上述步骤中所得目标波长数目与对应的波长数值模拟五维光场图像,从而基于所得五维光场图像数据,训练预设三维重建神经网络模型,获取训练后的能够从不同波长的光场数据中获得高精度三维重建结果的深度神经网络,所训练的深度神经网络能够利用特定波长的成像特征,提取色差线索,用以提高光场三维重建性能。
可选地,在本申请的一个实施例中,利用五维光场数据训练预设三维重建神经网络模型,包括:将五维光场数据输入预设三维重建神经网络模型中,输出五维光场数据的重建结果;基于重建结果,利用预设第二评价函数训练预设三维重建神经网络模型,以获得训练后的三维重建神经网络模型。
需要说明的是,预设第二评价函数可由本领域技术人员根据实际情况进行设置,在此不作具体限定。
在实际执行过程中,如图3所示,为本申请一个实施例的三维重建深度神经网络训练原理示意图,可以通过结合选取的波长数目以及波长取值以及相机其它参数,将其输入光场成像生成模型,用以生成大小为5D光场数据,并输入至预设三维重建神经网络模型中得到5D光场数据的重建结果,进而通过预设第二评价函数与真实场景值(真值)比较得到评价结果,进而利用评价结果修改模型,得到训练后的三维重建神经网络模型。
在步骤S103中,在训练后的三维重建神经网络模型中遍历预设波长数据集,得到优化后的三维重建神经网络模型,利用优化后的三维重建神经网络模型生成光场三维重建图像。
可以理解的是,在本申请实施例中,可以利用上述步骤中所得训练后的三维重建神经网络模型,再次在预设波长数据集中选取波长数目与数值与,对三维重建深度神经网络进行联合优化。因训练后的三维重建神经网络模型能够从5D光场数据提取有效特征进行三维重建的深度神经网络算法,但局限于固定的波长取值,故可以采用联合优化方法,在不同波长类型中,对三维重建的深度神经网络进行优化微调,进一步提高三维重建的稳定性与准确度,提高5维光场三维重建深度神经网络的鲁棒性,获得能够更深入提取色差的特征模型,并利用所得优化后的三维重建神经网络模型处理五位光场数据,得到更准确的光场三维重建图像。
可选地,在本申请的一个实施例中,在训练后的三维重建神经网络模型中遍历预设波长数据集,得到优化后的三维重建神经网络模型,包括:获取预设波长数据集内所有波长数目与对应的波长数值的选取结果,将选取结果输入训练后的三维重建神经网络模型,得到训练后的三维重建神经网络模型的输出结果;基于输出结果,利用预设第三评价函数优化训练后的三维重建神经网络模型,直至训练后的三维重建神经网络模型满足预设优化条件,得到优化后的三维重建神经网络模型。
需要说明的是,预设第三评价函数和预设优化条件可由本领域技术人员根据实际情况进行设置,在此不作具体限定。
在实际执行过程中,如图4所示,为本申请一个实施例的三维重建深度神经网络联合优化原理示意图,可以通过随机整数生成器生成波长的总数目,并选取预设区间的某一整数,然后在可见光及近红外波段内确定可选择的波长值,从这些可选取波长构成的离散波长排列组合集合中选取与波长数目对应的可选择波长,可以按照排列组合依次选取。进而结合选取的波长数目以及波长取值以及相机其它参数,输入光场成像生成模型,5D光场数据,并输入至预设三维重建神经网络模型中得到5D光场数据的重建结果,进而通过预设第三评价函数与真实场景值(真值)比较得到评价结果,分别预设波长数据集内的波长的数目和具体的波长大小的取值进行优化训练,直至满足预设优化条件,得到优化后的三维重建神经网络模型。
如图5所示,下面以一个具体实施例对本申请实施例的工作内容进行详细阐述。图5为本申请一个实施例的基于色差线索与神经网络的光场三维重建原理的示意图,其中,阶段1进行迭代初始化选取的波长数目与数值,可以通过新增加一个波长维度将四维光场数据扩展到五维,以增加获取的光场信息量,从而提高光场三维重建的精度;阶段2选定波长数目与数值后的三维重建深度神经网络训练与优化,通过训练一个初始的深度神经网络实现5D光场的三维重建;阶段3选取波长数目与数值与三维重建深度神经网络的联合优化,用以优化更鲁棒、准确的三维重建神经网络,通过模拟多种波长下的光场图像并进行多次重建效果评估,获取能够进一步提高重建精度的三维光场重建模型用于三维光场重建。
根据本申请实施例提出的基于色差线索与神经网络的光场三维重建方法,可选取波长的数量并取值,得到五维光场数据,通过模拟不同色差模糊,结合神经网络算法抓取色差线索中的三维场景信息,实现更加精确的光场三维重建,提升了光场三维重建结果的分辨率。由此,解决了相关技术中,因基于四维光场数据的三维重建较少考虑到多波长的联合重建,而成像过程中难以实现光学像差与色差模糊的完全清除,又未能有效利用色差模糊中蕴含的真实场景信息,导致三维重建结果的精确性下降,无法实现光场三维重建的多波长的联合重建,影响了光场三维重建的分辨率精度等问题。
其次参照附图描述根据本申请实施例提出的基于色差线索与神经网络的光场三维重建装置。
图6是本申请实施例的基于色差线索与神经网络的光场三维重建装置的结构示意图。
如图6所示,该基于色差线索与神经网络的光场三维重建装置10包括:生成模块100、训练模块200和重建模块300。
其中,生成模块100,用于基于预设波长数据集遍历并迭代优化,生成目标波长数目与对应的波长数值。
训练模块200,用于根据目标波长数目与对应的波长数值生成五维光场数据,利用五维光场数据训练预设三维重建神经网络模型,以得到训练后的三维重建神经网络模型。
重建模块300,用于在训练后的三维重建神经网络模型中遍历预设波长数据集,得到优化后的三维重建神经网络模型,利用优化后的三维重建神经网络模型生成光场三维重建图像。
可选地,在本申请的一个实施例中,生成模块100包括:选取单元和迭代单元。
其中,选取单元,用于在预设波长数据集中遍历预设区间内的波长数目,并基于波长数目选取对应的波长数值。
迭代单元,用于结合相机参数,利用预设第一评价函数对波长数目与对应的波长数值进行迭代优化,直至达到预设迭代停止条件,得到目标波长数目与对应的波长数值。
可选地,在本申请的一个实施例中,训练模块200包括:输出单元和训练单元。
其中,输出单元,用于将五维光场数据输入预设三维重建神经网络模型中,输出五维光场数据的重建结果。
训练单元,用于基于重建结果,利用预设第二评价函数训练预设三维重建神经网络模型,以获得训练后的三维重建神经网络模型。
可选地,在本申请的一个实施例中,重建模块300包括:获取单元和优化单元。
其中,获取单元,用于获取预设波长数据集内所有波长数目与对应的波长数值的选取结果,将选取结果输入训练后的三维重建神经网络模型,得到训练后的三维重建神经网络模型的输出结果。
优化单元,用于基于输出结果,利用预设第三评价函数优化训练后的三维重建神经网络模型,直至训练后的三维重建神经网络模型满足预设优化条件,得到优化后的三维重建神经网络模型。
需要说明的是,前述对基于色差线索与神经网络的光场三维重建方法实施例的解释说明也适用于该实施例的基于色差线索与神经网络的光场三维重建装置,此处不再赘述。
根据本申请实施例提出的基于色差线索与神经网络的光场三维重建装置,可选取波长的数量并取值,得到五维光场数据,通过模拟不同色差模糊,结合神经网络算法抓取色差线索中的三维场景信息,实现更加精确的光场三维重建,提升了光场三维重建结果的分辨率。由此,解决了相关技术中,因基于四维光场数据的三维重建较少考虑到多波长的联合重建,而成像过程中难以实现光学像差与色差模糊的完全清除,又未能有效利用色差模糊中蕴含的真实场景信息,导致三维重建结果的精确性下降,无法实现光场三维重建的多波长的联合重建,影响了光场三维重建的分辨率精度等问题。
图7为本申请实施例提供的电子设备的结构示意图。该电子设备可以包括:
存储器701、处理器702及存储在存储器701上并可在处理器702上运行的计算机程序。
处理器702执行程序时实现上述实施例中提供的基于色差线索与神经网络的光场三维重建方法。
进一步地,电子设备还包括:
通信接口703,用于存储器701和处理器702之间的通信。
存储器701,用于存放可在处理器702上运行的计算机程序。
存储器701可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
如果存储器701、处理器702和通信接口703独立实现,则通信接口703、存储器701和处理器702可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(Industry Standard Architecture,简称为ISA)总线、外部设备互连(PeripheralComponent,简称为PCI)总线或扩展工业标准体系结构(Extended Industry StandardArchitecture,简称为EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选地,在具体实现上,如果存储器701、处理器702及通信接口703,集成在一块芯片上实现,则存储器701、处理器702及通信接口703可以通过内部接口完成相互间的通信。
处理器702可能是一个中央处理器(Central Processing Unit,简称为CPU),或者是特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路。
本实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上的基于色差线索与神经网络的光场三维重建方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或N个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“N个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或N个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或N个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,N个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种基于色差线索与神经网络的光场三维重建方法,其特征在于,包括以下步骤:
基于预设波长数据集遍历并迭代优化,生成目标波长数目与对应的波长数值;
根据所述目标波长数目与对应的波长数值生成五维光场数据,利用所述五维光场数据训练预设三维重建神经网络模型,以得到训练后的三维重建神经网络模型;
在所述训练后的三维重建神经网络模型中遍历所述预设波长数据集,得到优化后的三维重建神经网络模型,利用所述优化后的三维重建神经网络模型生成光场三维重建图像。
2.根据权利要求1所述的方法,其特征在于,所述基于预设波长数据集遍历并迭代优化,生成目标波长数目与对应的波长数值,包括:
在所述预设波长数据集中遍历预设区间内的波长数目,并基于所述波长数目选取所述对应的波长数值;
结合相机参数,利用预设第一评价函数对所述波长数目与对应的波长数值进行迭代优化,直至达到预设迭代停止条件,得到所述目标波长数目与对应的波长数值。
3.根据权利要求1所述的方法,其特征在于,所述利用所述五维光场数据训练预设三维重建神经网络模型,包括:
将所述五维光场数据输入所述预设三维重建神经网络模型中,输出所述五维光场数据的重建结果;
基于所述重建结果,利用预设第二评价函数训练所述预设三维重建神经网络模型,以获得所述训练后的三维重建神经网络模型。
4.根据权利要求1所述的方法,其特征在于,所述在所述训练后的三维重建神经网络模型中遍历所述预设波长数据集,得到优化后的三维重建神经网络模型,包括:
获取所述预设波长数据集内所有波长数目与对应的波长数值的选取结果,将所述选取结果输入所述训练后的三维重建神经网络模型,得到所述训练后的三维重建神经网络模型的输出结果;
基于所述输出结果,利用预设第三评价函数优化所述训练后的三维重建神经网络模型,直至所述训练后的三维重建神经网络模型满足预设优化条件,得到所述优化后的三维重建神经网络模型。
5.一种基于色差线索与神经网络的光场三维重建装置,其特征在于,包括:
生成模块,用于基于预设波长数据集遍历并迭代优化,生成目标波长数目与对应的波长数值;
训练模块,用于根据所述目标波长数目与对应的波长数值生成五维光场数据,利用所述五维光场数据训练预设三维重建神经网络模型,以得到训练后的三维重建神经网络模型;
重建模块,用于在所述训练后的三维重建神经网络模型中遍历所述预设波长数据集,得到优化后的三维重建神经网络模型,利用所述优化后的三维重建神经网络模型生成光场三维重建图像。
6.根据权利要求5所述的装置,其特征在于,所述生成模块包括:
选取单元,用于在所述预设波长数据集中遍历预设区间内的波长数目,并基于所述波长数目选取所述对应的波长数值;
迭代单元,用于结合相机参数,利用预设第一评价函数对所述波长数目与对应的波长数值进行迭代优化,直至达到预设迭代停止条件,得到所述目标波长数目与对应的波长数值。
7.根据权利要求5所述的装置,其特征在于,所述训练模块包括:
输出单元,用于将所述五维光场数据输入所述预设三维重建神经网络模型中,输出所述五维光场数据的重建结果;
训练单元,用于基于所述重建结果,利用预设第二评价函数训练所述预设三维重建神经网络模型,以获得所述训练后的三维重建神经网络模型。
8.根据权利要求5所述的装置,其特征在于,所述重建模块包括:
获取单元,用于获取所述预设波长数据集内所有波长数目与对应的波长数值的选取结果,将所述选取结果输入所述训练后的三维重建神经网络模型,得到所述训练后的三维重建神经网络模型的输出结果;
优化单元,用于基于所述输出结果,利用预设第三评价函数优化所述训练后的三维重建神经网络模型,直至所述训练后的三维重建神经网络模型满足预设优化条件,得到所述优化后的三维重建神经网络模型。
9.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求1-4任一项所述的基于色差线索与神经网络的光场三维重建方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以用于实现如权利要求1-4任一项所述的基于色差线索与神经网络的光场三维重建方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311125066.9A CN117372592A (zh) | 2023-09-01 | 2023-09-01 | 基于色差线索与神经网络的光场三维重建方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311125066.9A CN117372592A (zh) | 2023-09-01 | 2023-09-01 | 基于色差线索与神经网络的光场三维重建方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117372592A true CN117372592A (zh) | 2024-01-09 |
Family
ID=89397217
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311125066.9A Pending CN117372592A (zh) | 2023-09-01 | 2023-09-01 | 基于色差线索与神经网络的光场三维重建方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117372592A (zh) |
-
2023
- 2023-09-01 CN CN202311125066.9A patent/CN117372592A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gulshan et al. | Geodesic star convexity for interactive image segmentation | |
CN108961180B (zh) | 红外图像增强方法及系统 | |
EP2564234A1 (en) | Range measurement using a coded aperture | |
CN110378944A (zh) | 深度图处理方法、装置和电子设备 | |
CN110880001A (zh) | 一种语义分割神经网络的训练方法、设备和存储介质 | |
CN111784620A (zh) | 空间信息引导角度信息的光场相机全聚焦图像融合算法 | |
CN117274072A (zh) | 一种基于二维多模态范围图像的点云去噪方法及装置 | |
US20220253979A1 (en) | Information processing system, endoscope system, and information storage medium | |
Bhasin et al. | Depth from defocus in presence of partial self occlusion | |
Hu et al. | Zero-shot multi-focus image fusion | |
CN111079893A (zh) | 用于干涉条纹图滤波的生成器网络的获取方法和装置 | |
CN111445465B (zh) | 基于深度学习的光场图像雪花或雨带检测去除方法及设备 | |
CN117372592A (zh) | 基于色差线索与神经网络的光场三维重建方法及装置 | |
CN112802080A (zh) | 基于深度学习的单目绝对深度估计方法和装置 | |
CN116385369A (zh) | 深度图像质量评价方法、装置、电子设备及存储介质 | |
CN116342446A (zh) | 多聚焦图像融合方法及装置、电子设备、存储介质 | |
CN116563349A (zh) | 高光谱图像处理方法、装置、电子设备及介质 | |
CN114926352A (zh) | 一种图像去反射方法、系统、装置及存储介质 | |
CN115239584A (zh) | 用三维合成数据去除人像眼镜及其阴影的方法及装置 | |
CN103955610B (zh) | 一种医学影像计算机辅助分析方法 | |
CN111914766B (zh) | 一种城市管理业务游商行为检测方法 | |
Tsotsos et al. | Why does data-driven beat theory-driven computer vision? | |
CN108693642B (zh) | 光学成像系统成像质量的确定方法和装置 | |
KR20170069635A (ko) | 레티넥스 모델 기반 영상 신호 분리 장치 및 그 방법 | |
Prasad et al. | Fast segmentation of sub-cellular organelles |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |